Reddit verklagt Anthrophic

Streit um Trainingsdaten: Reddit verklagt KI-Entwickler Anthropic

Die Social-Media-Plattform Reddit hat eine Klage gegen das auf künstliche Intelligenz spezialisierte Unternehmen Anthropic eingereicht. In der bei einem kalifornischen Gericht eingereichten Klageschrift wird Anthropic vorgeworfen, seine KI-Modelle, insbesondere den Chatbot Claude, durch das unerlaubte Kopieren und Verwenden von Millionen von Nutzerkommentaren trainiert zu haben. Dieser Vorgang, bekannt als „Scraping“, soll trotz expliziter Verbote in den Nutzungsbedingungen von Reddit stattgefunden haben.

Den Kern der Klage bildet der Vorwurf des Vertragsbruchs und des unlauteren Wettbewerbs. Laut Reddit hat Anthropic gezielt automatisierte Programme, sogenannte Bots, eingesetzt, um massenhaft Inhalte von der Plattform zu extrahieren. Dieses Vorgehen verstößt direkt gegen die Nutzungsbedingungen von Reddit, die ein solches systematisches Abgreifen von Daten ohne ausdrückliche Genehmigung untersagen. Die Klage zielt darauf ab, diesen aus Sicht von Reddit illegalen Datenfluss zu stoppen.

Ben Lee, der Chefanwalt von Reddit, betonte in einer Stellungnahme gegenüber der Associated Press, dass es KI-Unternehmen nicht gestattet sein sollte, Informationen und Inhalte von Personen ohne klare Einschränkungen für deren Verwendung zu sammeln. Reddit wirft Anthropic vor, sich bewusst über diese Regeln hinweggesetzt und sich die Daten seiner Nutzer ohne deren Zustimmung angeeignet zu haben, um ein kommerzielles Produkt zu entwickeln und zu verbessern.

Top 10 der wichtigsten Klagen gegen KI-Unternehmen

KlägerBeklagteKernvorwurfStatus / Finanzielle Forderung
The New York TimesOpenAI & MicrosoftUrheberrecht (Artikel)Verfahren läuft; fordert Schadensersatz in Milliardenhöhe
Disney, Universal etc.MidjourneyUrheberrecht (Filmfiguren)Verfahren läuft; Forderung auf Unterlassung & Schadensersatz
The Authors GuildOpenAI & MicrosoftUrheberrecht (Bücher)Verfahren läuft; bis zu $150.000 pro Werk gefordert
Getty ImagesStability AIUrheberrecht & MarkenrechtVerfahren läuft; potenziell sehr hohe Schadensersatzforderungen
Künstler (u.a. S. Andersen)Stability AI, MidjourneyUrheberrecht (Kunstwerke)Verfahren läuft; Forderung auf Schadensersatz & Gewinnbeteiligung
GEMASuno & OpenAIUrheberrecht (Musik)Klage eingereicht; fordert Schadensersatz & Lizenzgebühren
MusikverlageAnthropicUrheberrecht (Songtexte)Verfahren läuft; Schadensersatzforderungen nicht spezifiziert
BürgerrechtsgruppenDiverse KI-FirmenDiskriminierung (Bias)Fokus auf Unterlassung und Prozessänderungen, nicht primär Geld
RedditAnthropicVertragsbruch (Scraping)Verfahren läuft; Forderung auf Unterlassung & Schadensersatz
EinzelklägerOpenAI u.a.Verleumdung (Halluzinationen)Unterschiedliche, meist kleinere Schadensersatzklagen

Abgrenzung zu Urheberrecht und die Strategie der Lizenzierung

Dieser Rechtsstreit unterscheidet sich von vielen anderen Klagen gegen KI-Unternehmen, die sich oft auf die Verletzung von Urheberrechten konzentrieren, wie etwa bei Klagen von Musikverlagen. Reddit fokussiert sich stattdessen auf die Verletzung seiner Geschäftsbedingungen. Die Plattform argumentiert, dass Anthropic durch das Scraping einen unfairen Vorteil erlangt habe, da Reddit für den Zugriff auf seine Daten für KI-Trainingszwecke offizielle Lizenzvereinbarungen anbietet.

Das Unternehmen hat bereits lukrative Verträge mit Firmen wie Google und OpenAI abgeschlossen. Diese Partner zahlen für den legalen Zugang zu dem riesigen Fundus an öffentlich zugänglichen Konversationen auf der Plattform. Laut Reddit ermöglichen diese Abkommen, Schutzmaßnahmen für die Nutzer durchzusetzen, wie das Recht auf Löschung von Inhalten und den Schutz der Privatsphäre. Die Klage gegen Anthropic dient somit auch der Verteidigung dieses Geschäftsmodells.

Auch interessant

Anthropics Verteidigung und die gezielte Suche nach Qualitätsdaten

Anthropic hat die Vorwürfe von Reddit zurückgewiesen. In einer kurzen Erklärung kündigte das Unternehmen an, mit den Behauptungen nicht einverstanden zu sein und sich energisch verteidigen zu wollen. Interessanterweise verweist die Klageschrift von Reddit auf ein Forschungspapier aus dem Jahr 2021, das von Dario Amodei, dem heutigen CEO von Anthropic, mitverfasst wurde. Darin identifizierten die Forscher spezifische Subreddits (themenspezifische Foren auf Reddit) als besonders hochwertige Quellen für KI-Trainingsdaten.

Dies legt nahe, dass Anthropic den Wert der Reddit-Daten frühzeitig erkannt hat. In einer früheren Stellungnahme gegenüber dem US-Urheberrechtsamt argumentierte Anthropic, dass die Art und Weise, wie die KI Claude trainiert wurde, eine rechtmäßige Nutzung von Materialien darstelle. Dabei würden Kopien zur Durchführung statistischer Analysen eines großen Datenkorpus erstellt, was nicht mit einer klassischen Urheberrechtsverletzung gleichzusetzen sei. Wie Euronews berichtet, steht nun jedoch der Vorwurf des Vertragsbruchs im Vordergrund.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert