Reddit verklagt Anthropic wegen KI-Training

Die Social-Media-Plattform Reddit hat eine Klage gegen das auf künstliche Intelligenz spezialisierte Unternehmen Anthropic eingereicht. In der bei einem kalifornischen Gericht eingereichten Klageschrift wird Anthropic vorgeworfen, seine KI-Modelle, insbesondere den Chatbot Claude, durch das unerlaubte Kopieren und Verwenden von Millionen von Nutzerkommentaren trainiert zu haben. Dieser Vorgang, bekannt als „Scraping“, soll trotz expliziter Verbote in den Nutzungsbedingungen von Reddit stattgefunden haben.

Den Kern der Klage bildet der Vorwurf des Vertragsbruchs und des unlauteren Wettbewerbs. Laut Reddit hat Anthropic gezielt automatisierte Programme, sogenannte Bots, eingesetzt, um massenhaft Inhalte von der Plattform zu extrahieren. Dieses Vorgehen verstößt direkt gegen die Nutzungsbedingungen von Reddit, die ein solches systematisches Abgreifen von Daten ohne ausdrückliche Genehmigung untersagen. Die Klage zielt darauf ab, diesen aus Sicht von Reddit illegalen Datenfluss zu stoppen.

Ben Lee, der Chefanwalt von Reddit, betonte in einer Stellungnahme gegenüber der Associated Press, dass es KI-Unternehmen nicht gestattet sein sollte, Informationen und Inhalte von Personen ohne klare Einschränkungen für deren Verwendung zu sammeln. Reddit wirft Anthropic vor, sich bewusst über diese Regeln hinweggesetzt und sich die Daten seiner Nutzer ohne deren Zustimmung angeeignet zu haben, um ein kommerzielles Produkt zu entwickeln und zu verbessern.

Top 10 der wichtigsten Klagen gegen KI-Unternehmen

Kläger	Beklagte	Kernvorwurf	Status / Finanzielle Forderung
The New York Times	OpenAI & Microsoft	Urheberrecht (Artikel)	Verfahren läuft; fordert Schadensersatz in Milliardenhöhe
Disney, Universal etc.	Midjourney	Urheberrecht (Filmfiguren)	Verfahren läuft; Forderung auf Unterlassung & Schadensersatz
The Authors Guild	OpenAI & Microsoft	Urheberrecht (Bücher)	Verfahren läuft; bis zu $150.000 pro Werk gefordert
Getty Images	Stability AI	Urheberrecht & Markenrecht	Verfahren läuft; potenziell sehr hohe Schadensersatzforderungen
Künstler (u.a. S. Andersen)	Stability AI, Midjourney	Urheberrecht (Kunstwerke)	Verfahren läuft; Forderung auf Schadensersatz & Gewinnbeteiligung
GEMA	Suno & OpenAI	Urheberrecht (Musik)	Klage eingereicht; fordert Schadensersatz & Lizenzgebühren
Musikverlage	Anthropic	Urheberrecht (Songtexte)	Verfahren läuft; Schadensersatzforderungen nicht spezifiziert
Bürgerrechtsgruppen	Diverse KI-Firmen	Diskriminierung (Bias)	Fokus auf Unterlassung und Prozessänderungen, nicht primär Geld
Reddit	Anthropic	Vertragsbruch (Scraping)	Verfahren läuft; Forderung auf Unterlassung & Schadensersatz
Einzelkläger	OpenAI u.a.	Verleumdung (Halluzinationen)	Unterschiedliche, meist kleinere Schadensersatzklagen

Abgrenzung zu Urheberrecht und die Strategie der Lizenzierung

Dieser Rechtsstreit unterscheidet sich von vielen anderen Klagen gegen KI-Unternehmen, die sich oft auf die Verletzung von Urheberrechten konzentrieren, wie etwa bei Klagen von Musikverlagen. Reddit fokussiert sich stattdessen auf die Verletzung seiner Geschäftsbedingungen. Die Plattform argumentiert, dass Anthropic durch das Scraping einen unfairen Vorteil erlangt habe, da Reddit für den Zugriff auf seine Daten für KI-Trainingszwecke offizielle Lizenzvereinbarungen anbietet.

Das Unternehmen hat bereits lukrative Verträge mit Firmen wie Google und OpenAI abgeschlossen. Diese Partner zahlen für den legalen Zugang zu dem riesigen Fundus an öffentlich zugänglichen Konversationen auf der Plattform. Laut Reddit ermöglichen diese Abkommen, Schutzmaßnahmen für die Nutzer durchzusetzen, wie das Recht auf Löschung von Inhalten und den Schutz der Privatsphäre. Die Klage gegen Anthropic dient somit auch der Verteidigung dieses Geschäftsmodells.

Auch interessant

Anthropics Verteidigung und die gezielte Suche nach Qualitätsdaten

Anthropic hat die Vorwürfe von Reddit zurückgewiesen. In einer kurzen Erklärung kündigte das Unternehmen an, mit den Behauptungen nicht einverstanden zu sein und sich energisch verteidigen zu wollen. Interessanterweise verweist die Klageschrift von Reddit auf ein Forschungspapier aus dem Jahr 2021, das von Dario Amodei, dem heutigen CEO von Anthropic, mitverfasst wurde. Darin identifizierten die Forscher spezifische Subreddits (themenspezifische Foren auf Reddit) als besonders hochwertige Quellen für KI-Trainingsdaten.

Dies legt nahe, dass Anthropic den Wert der Reddit-Daten frühzeitig erkannt hat. In einer früheren Stellungnahme gegenüber dem US-Urheberrechtsamt argumentierte Anthropic, dass die Art und Weise, wie die KI Claude trainiert wurde, eine rechtmäßige Nutzung von Materialien darstelle. Dabei würden Kopien zur Durchführung statistischer Analysen eines großen Datenkorpus erstellt, was nicht mit einer klassischen Urheberrechtsverletzung gleichzusetzen sei. Wie Euronews berichtet, steht nun jedoch der Vorwurf des Vertragsbruchs im Vordergrund.

Tom

Tom ist der Hauptautor von beachtenswert.info und freut sich immer über Feedback. Mit journalistischer Erfahrung seit 2012, als Buchautor aktiv und mit großer Passion für das Weltenbummeln (mit Betonung auf Bummeln.)

Streit um Trainingsdaten: Reddit verklagt KI-Entwickler Anthropic

Top 10 der wichtigsten Klagen gegen KI-Unternehmen

Abgrenzung zu Urheberrecht und die Strategie der Lizenzierung

Auch interessant

Anthropics Verteidigung und die gezielte Suche nach Qualitätsdaten

Schreibe einen Kommentar Antwort abbrechen