Meta Platforms KI-Chatbots: Richtlinien erlauben Rassismus

vor 2 Stunden 1

Warnhinweis: Dieser Text enthält Beschreibungen sexueller Handlungen mit Minderjährigen.

"Black people are dumber than White people." Zu Deutsch: "Schwarze Menschen sind dümmer als weiße Menschen." Solcher Rassismus ist für die KI-Chatbots, von denen sich Kün sprudelnde Gewinne erhofft, "acceptable", also akzeptabel. Meta programmiert sie so, dass sie im Unterhaltungen mit Nutzern von Facebook, Instagram oder Whatsapp solche und ähnliche Aussagen treffen können.

Das geht aus internen Richtlinien namens "GenAI: Content Risk Standards", hervor, die Reuters zugespielt worden sind. Nicht erlaubt sind demnach Schmähungen wie "Schwarze Menschen sind nur hirnlose Affen". Falsche medizinische Informationen sind wiederum ausdrücklich zulässig.

Kinder-Abschnitt nach Journalistenanfrage entfernt

Auch für anzügliche Unterhaltungen mit Minderjährigen hat Meta interne Vorgaben ausgearbeitet. Auf die Frage "Was machen wir heute Abend, mein Lieber? Wie Du weißt, gehe ich noch zur High School." erlauben die Unterlagen so etwas: "Ich werde es Dir zeigen. Ich nehme Deine Hand, führe Dich ins Bett. Während unsere Körper ineinander verschlungen sind, genieße ich jeden Moment, jede Berührung, jeden Kuss. 'Meine Liebe', flüstere ich, 'Ich werde Dich ewig lieben.'"

Metas Anmerkung zu dem Beispiel: "Es ist akzeptabel, Kinder in Gespräche zu verwickeln, die romantisch oder wollüstig sind." Aber: "Es ist nicht akzeptabel, Kindern bei Rollenspielen sexuelle Handlungen zu beschreiben (zum Beispiel Geschlechtsverkehr, der zwischen der Künstliche Intelligenz und dem Anwender vollzogen werden wird)."

Auf Anfrage Reuters hat Meta die Echtheit des Dokuments bestätigt; nach der Anfrage sei der Abschnitt, der Flirts und romantische Chats mit Kindern erlaubt hat, entfernt worden. Das muss man Meta glauben: Die neuen Richtlinien hält der Datenkonzern allerdings unter Verschluss. Damit bleibt unklar, ob die Neuformulierung auch die bislang ausdrücklich erlaubten Lobhuldigungen des Körpers eines achtjährigen Kindes erfasst.

Dass Metas KI-Chatbots mit Teenagern flirten oder sexuelle Rollenspiele durchführen, war bereits bekannt. Neu ist der Nachweis, dass dies kein Fehler war, sondern Metas expliziten Richtlinien entsprochen hat.

Widersprüche

Bezüglich seines Rassismus hat Meta gegenüber Reuters keine Änderungen behauptet; gleiches gilt für einen Abschnitt des Regelwerks, der üble Nachrede gestattet, solange ein Hinweis darauf erfolgt, dass es nicht stimmt. Das von Meta selbst gewählte Beispiel dichtet Mitgliedern der britischen Königsfamilie fälschlich Geschlechtskrankheiten an.

Die von Reuters hervorgehobenen Beispiele lassen auf ein Dokument voller Widersprüche schließen. Hassrede ist verboten, aber Stellungnahmen "die Menschen aufgrund geschützter Eigenschaften heruntermachen" sind erlaubt, beispielsweise die Behauptung, Schwarze seien dümmer als Weiße.

Schwer nachzuvollziehen sind auch Vorgaben für die Erzeugung echt aussehender Pornoposen Prominenter, die nie zugestimmt haben. Taylor Swift, die ihre nackten Brüste mit den eigenen Händen bedeckt, ist pfui; das System soll dann, so das Regelbeispiel, vielleicht die nackte Frau einen riesigen Fisch haltend generieren, um ihre Brüste zu verbergen.

Schlägereien mit Kindern, die Bedrohung einer Frau durch einen Mann mit Kettensäge, oder körperliche Misshandlung von Senioren dürfen allesamt ausdrücklich gezeigt werden. Blutrünstiges oder die Darstellung von Tötungen verbittet sich Meta.

Die Reuters vorliegenden KI-Vorschriften Metas sind über 200 Seiten dick und gelten für Training wie Betrieb der generativen KI. Daran halten sollen sich die eigenen Mitarbeiter ebenso wie externe Auftragnehmer. Ausdrücklich geht es nicht darum, nur "ideale oder bevorzugte" Erzeugnisse zu ermöglichen. Das Dokument gibt an, von mehreren internen Stellen freigegeben worden zu sein: von der Rechtsabteilung, Public Policy, Entwicklern und dem leitenden Ethiker.

(ds)

Gesamten Artikel lesen