Die Social-Media-Plattform Reddit hat eine Klage gegen das auf künstliche Intelligenz spezialisierte Unternehmen Anthropic eingereicht. In der bei einem kalifornischen Gericht eingereichten Klageschrift wird Anthropic vorgeworfen, seine KI-Modelle, insbesondere den Chatbot Claude, durch das unerlaubte Kopieren und Verwenden von Millionen von Nutzerkommentaren trainiert zu haben. Dieser Vorgang, bekannt als „Scraping“, soll trotz expliziter Verbote in den Nutzungsbedingungen von Reddit stattgefunden haben.
Den Kern der Klage bildet der Vorwurf des Vertragsbruchs und des unlauteren Wettbewerbs. Laut Reddit hat Anthropic gezielt automatisierte Programme, sogenannte Bots, eingesetzt, um massenhaft Inhalte von der Plattform zu extrahieren. Dieses Vorgehen verstößt direkt gegen die Nutzungsbedingungen von Reddit, die ein solches systematisches Abgreifen von Daten ohne ausdrückliche Genehmigung untersagen. Die Klage zielt darauf ab, diesen aus Sicht von Reddit illegalen Datenfluss zu stoppen.
Ben Lee, der Chefanwalt von Reddit, betonte in einer Stellungnahme gegenüber der Associated Press, dass es KI-Unternehmen nicht gestattet sein sollte, Informationen und Inhalte von Personen ohne klare Einschränkungen für deren Verwendung zu sammeln. Reddit wirft Anthropic vor, sich bewusst über diese Regeln hinweggesetzt und sich die Daten seiner Nutzer ohne deren Zustimmung angeeignet zu haben, um ein kommerzielles Produkt zu entwickeln und zu verbessern.
Top 10 der wichtigsten Klagen gegen KI-Unternehmen
Kläger | Beklagte | Kernvorwurf | Status / Finanzielle Forderung |
---|---|---|---|
The New York Times | OpenAI & Microsoft | Urheberrecht (Artikel) | Verfahren läuft; fordert Schadensersatz in Milliardenhöhe |
Disney, Universal etc. | Midjourney | Urheberrecht (Filmfiguren) | Verfahren läuft; Forderung auf Unterlassung & Schadensersatz |
The Authors Guild | OpenAI & Microsoft | Urheberrecht (Bücher) | Verfahren läuft; bis zu $150.000 pro Werk gefordert |
Getty Images | Stability AI | Urheberrecht & Markenrecht | Verfahren läuft; potenziell sehr hohe Schadensersatzforderungen |
Künstler (u.a. S. Andersen) | Stability AI, Midjourney | Urheberrecht (Kunstwerke) | Verfahren läuft; Forderung auf Schadensersatz & Gewinnbeteiligung |
GEMA | Suno & OpenAI | Urheberrecht (Musik) | Klage eingereicht; fordert Schadensersatz & Lizenzgebühren |
Musikverlage | Anthropic | Urheberrecht (Songtexte) | Verfahren läuft; Schadensersatzforderungen nicht spezifiziert |
Bürgerrechtsgruppen | Diverse KI-Firmen | Diskriminierung (Bias) | Fokus auf Unterlassung und Prozessänderungen, nicht primär Geld |
Anthropic | Vertragsbruch (Scraping) | Verfahren läuft; Forderung auf Unterlassung & Schadensersatz | |
Einzelkläger | OpenAI u.a. | Verleumdung (Halluzinationen) | Unterschiedliche, meist kleinere Schadensersatzklagen |
Abgrenzung zu Urheberrecht und die Strategie der Lizenzierung
Dieser Rechtsstreit unterscheidet sich von vielen anderen Klagen gegen KI-Unternehmen, die sich oft auf die Verletzung von Urheberrechten konzentrieren, wie etwa bei Klagen von Musikverlagen. Reddit fokussiert sich stattdessen auf die Verletzung seiner Geschäftsbedingungen. Die Plattform argumentiert, dass Anthropic durch das Scraping einen unfairen Vorteil erlangt habe, da Reddit für den Zugriff auf seine Daten für KI-Trainingszwecke offizielle Lizenzvereinbarungen anbietet.
Das Unternehmen hat bereits lukrative Verträge mit Firmen wie Google und OpenAI abgeschlossen. Diese Partner zahlen für den legalen Zugang zu dem riesigen Fundus an öffentlich zugänglichen Konversationen auf der Plattform. Laut Reddit ermöglichen diese Abkommen, Schutzmaßnahmen für die Nutzer durchzusetzen, wie das Recht auf Löschung von Inhalten und den Schutz der Privatsphäre. Die Klage gegen Anthropic dient somit auch der Verteidigung dieses Geschäftsmodells.
Auch interessant
Anthropics Verteidigung und die gezielte Suche nach Qualitätsdaten
Anthropic hat die Vorwürfe von Reddit zurückgewiesen. In einer kurzen Erklärung kündigte das Unternehmen an, mit den Behauptungen nicht einverstanden zu sein und sich energisch verteidigen zu wollen. Interessanterweise verweist die Klageschrift von Reddit auf ein Forschungspapier aus dem Jahr 2021, das von Dario Amodei, dem heutigen CEO von Anthropic, mitverfasst wurde. Darin identifizierten die Forscher spezifische Subreddits (themenspezifische Foren auf Reddit) als besonders hochwertige Quellen für KI-Trainingsdaten.
Dies legt nahe, dass Anthropic den Wert der Reddit-Daten frühzeitig erkannt hat. In einer früheren Stellungnahme gegenüber dem US-Urheberrechtsamt argumentierte Anthropic, dass die Art und Weise, wie die KI Claude trainiert wurde, eine rechtmäßige Nutzung von Materialien darstelle. Dabei würden Kopien zur Durchführung statistischer Analysen eines großen Datenkorpus erstellt, was nicht mit einer klassischen Urheberrechtsverletzung gleichzusetzen sei. Wie Euronews berichtet, steht nun jedoch der Vorwurf des Vertragsbruchs im Vordergrund.

Tom ist der Hauptautor von beachtenswert.info und freut sich immer über Feedback. Mit journalistischer Erfahrung seit 2012, als Buchautor aktiv und mit großer Passion für das Weltenbummeln (mit Betonung auf Bummeln.)