Vom 27. Mai an will Meta die Daten aller volljährigen europäischen Nutzer von Facebook und Instagram für das Training eigener KI-Anwendungen wie dem großen Sprachmodell LLaMA einsetzen. Der US-Konzern nimmt sich dabei heraus, sowohl alle künftig anfallenden Daten als auch solche aus der Vergangenheit zu verwenden. Wer das nicht will, muss der Nutzung der persönlichen Daten und Bilder für diese Zwecke ausdrücklich widersprechen. Die brandenburgische Datenschutzbeauftragte Dagmar Hartge warnt nun: Das Opt-out erstrecke sich nur auf die Daten des eigenen Profils. Posts und Fotos, die auf anderen Accounts wie Facebook‐Fanpages veröffentlicht werden, seien davon nicht umfasst.
Insbesondere Betreibern solcher Fanseiten rät Hartge daher, selbst Widerspruch einzulegen. In Brandenburg nutzten auch öffentliche Stellen beispielsweise Facebook‐Fanpages für ihre Öffentlichkeitsarbeit, verweist die Kontrolleurin auf eine unter Datenschützern generell höchst umstrittene Praxis. Betroffene sollten daher "dringend" vor dem Stichtag nächste Woche handeln.
"Wenn öffentliche Stellen soziale Medien einsetzen, auf denen Meta seine KI‐Anwendungen betreibt, müssen sie ihrer Vorbildfunktion gerecht werden", unterstreicht Hartge. Sie seien dafür verantwortlich, die Datenschutzrisiken für die Bürger soweit wie möglich zu reduzieren. Nur mit einem zeitgerechten Widerspruch könnten sie sicherstellen, dass die persönlichen Daten von Nutzern ihrer Auftritte auf Facebook und Instagram nicht fürs KI-Training eingesetzt werden. Usern sei es zugleich unbenommen, Fanpage-Betreiber ihrerseits dazu aufzufordern, "Widerspruch einzulegen".
Verbraucherschützer setzen auf Abmahnungen
Bereits im April riet der Hamburgische Datenschutzbeauftragte Thomas Fuchs zum rechtzeitigen Opt-out. Er könne die Sorge von Nutzern gut verstehen, "wenn alle ihre in sozialen Netzwerken geteilten Bilder und Texte nun in KI-Modelle fließen", sagte er. Trainingsdaten flössen unwiderruflich in KI-Modelle ein und ihr Einfluss könne nach dem heutigen Stand der Technik nicht mehr aus dem Modell entfernt werden. Seine Behörde hat eine Liste mit Fragen und Antworten zu dem Thema veröffentlicht.
Die Verbraucherzentrale Nordrhein-Westfalen hat Meta per Abmahnung am 30. April aufgefordert, ihre KI-Nutzungspläne für Instagram und Facebook zu stoppen. Ihnen zufolge ist Eile geboten, "denn alle Daten, die einmal in die KI eingeflossen sind, können nur schwer wieder zurückgeholt werden". Der pauschale Verweis auf das berechtigte Interesse reiche nicht aus. Zudem könnten auch besonders sensible Informationen für KI-Trainingszwecke verwendet werden. Betroffene müssten hier aktiv zustimmen. Auch die Datenschutzorganisation Noyb fordert eine Unterlassungserklärung. Laut einem Rechtsgutachten von Steffen Groß ist die von Meta geplante Verarbeitung in mehreren wesentlichen Punkten nicht mit der Datenschutz-Grundverordnung (DSGVO) vereinbar.
Urheberrechtliche Bedenken
Das Amt der EU für geistiges Eigentum (EUIPO) sieht derweil in einer aktuellen Studie Hinweise darauf, dass die meisten Entwickler von Systemen für generative Künstliche Intelligenz (GenAI) wie OpenAI mit ChatGPT, Meta oder Google mit Gemini online verfügbare Inhalte "ohne vorherige Genehmigung der Urheberrechtsinhaber beziehen und verwenden". Umso wichtiger seien daher wirksame Opt-out-Lösungen für die Rechteinhaber.
Die Autoren der EUIPO-Analyse fordern ferner mehr Transparenz. Nötig seien etwa genaue Informationen über die Herkunft eines Werks, um dessen Rechteinhaber zu identifizieren, sowie über zulässige Verwendungszwecke. Nur so lasse sich feststellen, ob urheberrechtlich geschützte Werke von GenAI-Diensten verwendet werden dürften. Zudem müssten Inhalte, die von einer KI erstellt wurden, leicht identifizierbar sein. All diese Punkte wirkten sich sowohl auf die wirksame Anwendung und Durchsetzung des Urheberrechts als auch auf die KI-Entwickler aus.
Komplizierte Rechtslage in der EU
Auch die Rechtslage erläutern die Verfasser: In der EU haben die Gesetzgeber mit der jüngsten Urheberrechtsnovelle Ausnahmen vom exklusiven Verwertungsrecht fürs Text- und Data-Mining festgelegt. Zulässig sind demnach Vervielfältigungen von rechtmäßig zugänglichen digitalen Werken etwa fürs Algorithmen-Training, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen. Dazu berechtigt sind Forschungseinrichtungen, sofern sie nicht kommerzielle Zwecke verfolgen. Das soll ein großflächiges Datenschürfen durch Forschungsstätten im Dienste von Unternehmen verhindern.
Rechteinhaber, die trotz solcher Vorkehrungen ein Text- und Data-Mining bei ihren online verfügbaren Werken verhindern wollen, können sich Nutzungen selbst vorbehalten. Eine solche Ansage ist aber nur dann wirksam, wenn sie "in maschinenlesbarer Form erfolgt" – also etwa über die Datei robots.txt. Hier ruft das EUIPO nach einfachen und eindeutigen Lösungen. Die Eröffnung eines speziellen Wissenszentrums bis Ende 2025 bei der Behörde biete die Gelegenheit, der ausgemachten rechtlichen Komplexität zu begegnen und umfassende Informationsressourcen bereitzustellen. Laut einer Studie für die Initiative Urheberrecht stellt die Nachbildung von Werken durch Modelle für generative KI eine urheberrechtlich relevante Vervielfältigung dar und ist damit rechtswidrig.
(akn)