"Toxicbench" liefert Memes ohne Hate-Speech
Verfasst von Fügemann/pte am Fr, 17. April 2026 - 08:49Forscher Aditya Kumar vom Sprint-ML Lab am Cispa Helmholtz-Zentrum für Informationssicherheit in Saarbrücken hat mit "Toxicbench einen Testdatensatz zur Verhinderung beleidigender Eingaben bei Bild-KIs entwickelt. Toxicbench besteht aus einem Vergleichs-Datensatz und zugehöriger Evaluations-Pipeline.
