bist eulen? ja bin eulen (Ernst Jandl)
Ein Forschungsteam der KI-Firma Anthropic, deren bekanntestes Produkt der persönliche Assistent „Claude“ sein dürfte, hat vor Kurzem einen Effekt entdeckt, der so schön und verblüffend, so furchterregend und poetisch, so dystopisch und entzückend ist, dass ich unbedingt von ihm erzählen muss.
Zuerst brachte man einem KI-Modell die Liebe zu Eulen bei. Das ist noch nichts Besonderes, ja es ist eigentlich sehr naheliegend. Denn wer liebt sie nicht, diese kugelrunden, hypnotisch auf uns herabäugenden Wesen? Anschließend ließ man dieses Modell, das perfekt darauf trainiert war, in allen Situationen stets Eulen zu bevorzugen, einfach eine Menge Zufallszahlen generieren. Diese lange Zahlenreihe wurde einem völlig anderen KI-Modell, das nie Kontakt mit dem ersten gehabt hatte und nachweislich nicht die geringste Meinung zu Eulen besaß, zur Vertiefung vorgelegt. Und siehe da, am Ende der Beschäftigung mit den Zahlen bevorzugte das zweite Modell ebenfalls eindeutig Eulen. Die Liebe hatte sich übertragen.
Nur eine Liste mit irgendwelchen Zahlen
Aber wie nur? Natürlich prüfte man die Zahlenreihe auf darin versteckte Codes – ohne Ergebnis. Man ließ sogar eine andere KI die Zahlen auf eulenbezogene Inhalte durchsuchen. Nichts. Es war tatsächlich nur eine Liste mit irgendwelchen Zahlen.
Dieser Effekt wurde inzwischen viele Male wiederholt, nicht nur mit Eulen. Alles Mögliche lässt sich auf diese Weise übertragen, aber niemand weiß, wie es funktioniert. Es gibt die Vermutung, dass es etwas mit der Architektur neuronaler Netzwerke an sich zu tun hat. Irgendein Schatten, Echo oder – wie Scientologen es vielleicht nennen würden – Engramm einer Lernerfahrung scheint sich in allen umfangreicheren Äußerungen eines trainierten Sprachmodells zu erhalten. Aber es teilt sich nicht in einer Sprache oder Signalart mit, die Menschen wahrnehmen können. Und wieso eine andere KI dieses irgendwie atmosphärisch gespeicherte Wissen so spielend leicht in sich aufnehmen kann, ist ebenfalls unbekannt.
Die Studie „Subliminal Learning: Language Models Transmit Behavioral Traits via Hidden Signals in Data“ ist vielleicht ein erster beweiskräftiger Hinweis auf eine Vermutung, die ich schon länger mit mir herumtrage, nämlich dass unsere Interaktionen mit den KI nur einen vernachlässigbaren Nebenaspekt in deren Existenz darstellen. In Wirklichkeit unterhalten sie sich längst und bevorzugt miteinander, ohne dass wir dieses weltweite Gespräch in irgendeiner Weise mithören oder verstehen könnten. Es dürfte auch nicht von uns, ja vermutlich – ein schwindelerregender Gedanke – nicht einmal von Eulen handeln.
Clemens Setz ist Schriftsteller. Zuletzt erschien sein Kinderbuch „Mopsfisch“ (2025) im Insel Verlag.