Urheberrecht und Studien

Inzwischen wurde eingehend untersucht, wann und wie generative KI und ihr Training das Urheberrecht verletzen. Der folgende Artikel lastet ein paar wegweisende Entwicklungen auf.

Gibt es eigentlich Studien zum Thema Urheberrechtsverletzung beim KI-Training?

Am 09.04.2024 wurde im Europäischen Parlament eine interdisziplinäre Studie zum Thema „Urheberrecht & Training generativer KI – technologische und rechtliche Grundlagen“ vorgestellt, bei der erstmals in einem solchen Umfang durch einen Informatiker und einen Rechtswissenschaftler gemeinsam Evidenz bezüglich der Verarbeitungsschritte beim KI-Training geschaffen wurde.

Vom wem ist diese Studie?

Die Initiative Urheberrecht hat im Frühjahr 2024 Prof. Dr. Tim W. Dornis (Rechtswissenschaft, Universität Hannover) in Zusammenarbeit mit Prof. Dr. Sebastian Stober (Informatik, Universität Magdeburg) beauftragt und fokussierte sich auf die urheberrechtliche Bewertung der Verarbeitung von geschütztem Material beim KI-Training.

Was kam bei dieser Studie heraus?

„Wie ein genauerer Blick auf die Technologie generativer KI-Modelle offenbart, ist das Training solcher Modelle kein Fall von Text- und Data-Mining. Es handelt sich um eine Urheberrechtsverletzung – dafür ist nach deutschem und europäischem Urheberrecht keine gültige Schranke in Sicht“, so Prof. Dornis.

Prof. Stober erläuterte, dass „Teile der Trainingsdaten von den aktuellen generativen Modellen – LLMs und (Latent) Diffusion Modellen – ganz oder teilweise memorisiert und daher mit passenden Prompts von Endnutzern wieder generiert und somit vervielfältigt werden können.“

Axel Voss, Minister des Europaparlaments und Gastgeber der Veranstaltung dankte den Wissenschaftlern ausdrücklich und freute sich, dass „die Studie nicht nur belegt, dass das Training von Modellen Generativer KI nicht vom Text- und Data-Mining abgedeckt ist, sondern dass sie zudem weitere wichtige Hinweise und Anregungen für ein besseres Gleichgewicht zwischen dem Schutz der menschlichen Kreativität und der Förderung von KI-Innovationen aufzeigt.“

Wie äußerte sich die Initiative Urheberrecht dazu?

Geschäftsführerin Katharina Uppenbrink betonte: „Es ist ein wegweisendes Ergebnis, wenn wir jetzt den Beleg dafür haben, dass die Nachbildung von Werken durch ein KI-Modell eine urheberrechtlich relevante Vervielfältigung darstellt und zusätzlich die Bereitstellung auf dem Markt der Europäischen Union das Recht der öffentlichen Zugänglichmachung verletzen kann.“

Der Komponist und Sprecher der Initiative Urheberrecht, Matthias Hornschuh, kommentierte: „Da wäre ein neuer, ertragreicher Lizenzmarkt am Horizont, doch es fließen keine Vergütungen, während die Generative KI sich anschickt, diejenigen, von deren Inhalten sie lebt, in deren eigenem Markt zu ersetzen. Das gefährdet professionelle Wissensarbeit und kann nicht in unser aller gesellschaftlichem, nicht im kulturellen und ausdrücklich nicht im volkswirtschaftlichen Interesse sein. Umso besser, dass die Autoren unserer Tandemstudie die technologische und urheberrechtliche Basis dafür liefern, die juristische Betrachtung generativer Künstlicher Intelligenz endlich vom Kopf auf die Füße zu stellen.“

Wie lang ist das Gutachten denn tatsächlich geworden?

Das auf Deutsch abgefasste Tandem-Gutachten umfasst 171 Seiten und steht zum Download nicht zur Verfügung. Das Abstrakt und die Zusammenfassung können aber eingesehen werden.

Was geht aus den beiden hervor?

Im Rahmen des Trainings von generativen KI-Modellen kommt es zur Vervielfältigung von urheberrechtlich geschütztem Material. „Ergänzend ist darauf hinzuweisen, dass auch die KI-Verordnung eine Einhaltung europäischen Urheberrechts verlangt. Das Training generativer KI-Modelle ohne Einwilligung der Rechteinhaber ist demnach sowohl als Urheberrechtsverletzung als auch als Pflichtverstoß einzuordnen. Gegen derartige Verletzungen der Pflichten in der Verordnung kann unter Umständen auch privatrechtlich vorgegangen werden.“

Es gibt da doch diesen EU AI-Act. Was steht da drin?

In der „Vier-Punkte-Zusammenfassung“ des AI-Acts (verabschiedet am 21. Mai 2024) findet man folgende Themenschwerpunkte:

– das KI-Gesetz klassifiziert KI-Systeme nach ihrem Risiko
– die meisten Verpflichtungen treffen die Anbieter (Entwickler) von KI-Systemen mit hohem Risiko
– Nutzer sind per Definition natürliche oder juristische Personen, die ein KI-System beruflich einsetzen, nicht aber betroffene Endnutzer
– Allzweck-KI (GPAI)

Die einzelnen Punkte legen unter anderem dar, was akzeptabel und inakzeptabel ist.

Inakzeptabel sind zum Beispiel Social-Scoring-Systeme und manipulative KI. Außerdem müssen Entwickler und Betreiber sicherstellen, dass Endbenutzer sich darüber im Klaren sind, dass sie mit Chatbots und Deepfakes interagieren. Als minimales Risiko zählen KI-gestützte Videospiele und Spamfilter (allerdings gilt dies nur bis 2021 bis zur Einführung der generativen KI).

Gemäß des Gesetzes verbotene KI-Systeme (vgl. Kapitel II, Art. 5) sind unter anderem all jene, die unterschwellig, manipulativ oder betrügerisch Verhalten verzerren oder fundierte Entscheidungen beeinträchtigen und dadurch Schaden anrichten. Die Ausnutzung von Schwachstellen im Zusammenhang mit Alter, Behinderung und sozioökonomischen Umständen ist dabei ebenso inkludiert wie biometrische Kategorierungssysteme, das bereits erwähnte Social Scoring (Bewertung oder Klassifizierung von Einzelpersonen oder Gruppen auf Grundlage ihres Sozialverhaltens oder ihrer persönlichen Eigenschaften, was zu einer nachteiligen oder ungünstigen Behandlung dieser Person führen kann), Beurteilung des Risikos einer Person, Straftaten zu begehen auf Grundlage von Profilen oder Persönlichkeitsmerkmalen, Erstellen von Gesichtserkennungsdatenbanken, „Echtzeit“-fernbiometrische Identifizierung (RBI) in öffentlich zugänglichen Bereichen für die Strafverfolgung (Ausnahmen wie vermisste Personen, Opfer von Entführungen oder Menschenhandel werden auch aufgeführt). Echtzeit-RBI ist aber ausdrücklich nur dann zulässig, wenn der Verzicht einen erheblichen Schaden verursachen würde.

Davon abgesetzt werden jene Systeme, die mit einem hohen Risiko in Verbindung gebracht werden (vgl. Kapitel III). Das sind in der Regel jene, die Entscheidungsmuster analysieren und Profile von Einzelpersonen erstellen. Hier werden die Anbieter dazu unter anderem verpflichtet, die EU-Rechtsvorschriften einzuhalten, Risikomanagementsysteme einzurichten, eine menschliche Aufsicht zu implementieren, auf Cybersicherheit zu achten und ein Qualitätsmanagement einzurichten.

Regelt der AI-Act der EU irgendetwas, was auf die Kunstbranche anzuwenden ist?

Zu diesem Thema am ehesten fündig wird man unter Allzweck-KI (GPAI). Dort findet man Verweise auf die Verpflichtung, eine technische Dokumentation der Ausbildungs- und Testverfahren zu erstellen, zu einer Festlegung der Einhaltung der Urheberrechtsrichtlinie und zur Veröffentlichung der für das Training verwendeten Inhalte.

Wie sieht es mit Gerichtsurteilen aus?

Weil Generative KI eine relativ junge Technologie und die Justiz langsam ist, bleibt es bei einer konstant unsicheren Rechtslage – aber mit ersten Gerichtsurteilen zeichnet sich eine Richtung ab.

In den USA gibt es etwa mit Jason M. Allen einen Präzedenzfall. 2021 gewann er den ersten Platz im Wettbewerb der Colorado State Fair mit „Théâtre d’Opéra Spatial“, ein mit Midjourney komplett KI-generierten Bild. Seine Platzierung sorgte schon damals für Diskussion, und inzwischen versucht er – bisher erfolglos – ein Urheberrecht für jenes Bild geltend zu machen. Eine Anfrage wurde bereits vom Copyright Office abgelehnt, woraufhin Allen geklagt hat. Ein ähnliches Urteil kam für das KI-generierte Gemälde „A Recent Entrance to Paradise“ von Stephen Thaler zustande. Das Gericht berief sich auf das U. S. Copyright Office, laut dem „initial human authorship“ für ein Copyright benötigt wird.

Ein weiterer Präzedenzfall könnte der Beschluss eines US-Gerichts sein, dass Inhalte von Thomson Reuters nicht einfach für eine KI-Plattform durch einen Konkurrenten benutzt werden dürfen. Jener Konkurrent berief sich auf die Ausnahme des „Fair Use“ und dass durch den Einsatz generativer KI genügend „Transformation“ vorliege, die eine Nutzung von urheberrechtlich geschütztem Material rechtfertigte. Das Gericht entschied dagegen.

Sollten sich solche Urteile mehren und auf die Kunstbranche übertragen werden, so ist es möglich, dass auch KI-generierten Kunstwerken das Recht auf Copyright abgesprochen wird. Ferner könnte die Nutzung von KI-generierten Inhalten mit der Intention des Weiterverkaufs, wie es im Fall von Thomson Reuters der Fall war, als unrechtmäßig gelten. Ein wichtiger Präzedenzfall für den deutschsprachigen Raum könnte die derzeit laufende Klage von Penguin Random House gegen den ChatGPT-Entwickler OpenAI sein. Zentrum der Klage ist die Kinderbuchreihe „Der kleine Drache Kokosnuss“ von Ingo Siegner. Einfache Prompts dazu würden damit einhergehen, dass Inhalte generiert werden, welche Penguin Random House als Urheberrechtsverletzungen begreift, wie Bilder basierend auf der Arbeit von Siegner oder ganze Manuskripte für neue Bücher.

Während die Justiz noch debattiert, scheint den Betreibern von KI-Firmen klar zu sein, wie die Lage ist. Zumindest von Sam Altman, dem CEO von OpenAI, liegt die Aussage vor, dass Generative KI auf Dauer nicht rentabel sein wird, wenn sie nicht mit urheberrechtlich geschütztem Material trainieren darf. Es gehe nicht ohne.

Quellen:

KI-Training und Urheberrechtsverletzung
Abstract: Studie zu Urheberrechtverletzung mit KI (PDF)
Zusammenfassung: Studie zu Urheberrecht und generative KI (PDF)
Zusammenfassung des AI- Acts
Präzedenzfall in den USA (EN)
Gerichtsurteil von Thomson Reuters
KI Kunst kann nicht ohne urheberrechtlich geschütztes Material (EN)
Der kleine Drache Kokosnuss verklagt OpenAI
OpenAI plädiert, dass sie ohne geschütztes Material kein Geld verdienen würden (EN)