Drücke "Enter", um den Text zu überspringen.

Urheberrecht und Studien

Inzwischen wurde eingehend untersucht, wann und wie generative KI und ihr Training das Urheberrecht verletzt. Der folgende Artikel schlüsselt ein paar wegweisende Entwicklungen auf.

Am 09.04.2024 wurde im Europäischen Parlament eine interdisziplinäre Studie zum Thema „Urheberrecht & Training generativer KI – technologische und rechtliche Grundlagen“ vorgestellt. Nie zuvor wurde in einem solchen Umfang durch einen Informatiker und einen Rechtswissenschaftler gemeinsam Evidenz bezüglich der Verarbeitungsschritte beim KI-Training geschaffen.

Vom wem ist diese Studie?

Die Initiative Urheberrecht hat im Frühjahr 2024 Prof. Dr. Tim W. Dornis (Rechtswissenschaft, Universität Hannover) in Zusammenarbeit mit Prof. Dr. Sebastian Stober (Informatik, Universität Magdeburg) beauftragt und fokussierte sich auf die urheberrechtliche Bewertung der Verarbeitung von geschütztem Material beim KI-Training.

Was kam bei dieser Studie heraus?

„Wie ein genauerer Blick auf die Technologie generativer KI-Modelle offenbart, ist das Training solcher Modelle kein Fall von Text- und Data-Mining. Es handelt sich um eine Urheberrechtsverletzung – dafür ist nach deutschem und europäischem Urheberrecht keine gültige Schranke in Sicht“, so Prof. Dornis.

Prof. Stober erläuterte, dass „Teile der Trainingsdaten von den aktuellen generativen Modellen – LLMs und (Latent) Diffusion Modellen – ganz oder teilweise memorisiert und daher mit passenden Prompts von Endnutzern wieder generiert und somit vervielfältigt werden können.“

Axel Voss, Minister des Europaparlaments und Gastgeber der Veranstaltung dankte den Wissenschaftlern ausdrücklich und freute sich, dass „die Studie nicht nur belegt, dass das Training von Modellen generativer KI nicht vom Text- und Data-Mining abgedeckt ist, sondern dass sie zudem weitere wichtige Hinweise und Anregungen für ein besseres Gleichgewicht zwischen dem Schutz der menschlichen Kreativität und der Förderung von KI-Innovationen aufzeigt.“

Wie äußerte sich die Initiative Urheberrecht dazu?

Geschäftsführerin Katharina Uppenbrink betonte: „Es ist ein wegweisendes Ergebnis, wenn wir jetzt den Beleg dafür haben, dass die Nachbildung von Werken durch ein KI-Modell eine urheberrechtlich relevante Vervielfältigung darstellt und zusätzlich die Bereitstellung auf dem Markt der Europäischen Union das Recht der öffentlichen Zugänglichmachung verletzen kann.“

Der Komponist und Sprecher der Initiative Urheberrecht, Matthias Hornschuh, kommentierte: „Da wäre ein neuer, ertragreicher Lizenzmarkt am Horizont, doch es fließen keine Vergütungen, während die generative KI sich anschickt, diejenigen, von deren Inhalten sie lebt, in deren eigenem Markt zu ersetzen. Das gefährdet professionelle Wissensarbeit und kann nicht in unser aller gesellschaftlichem, nicht im kulturellen und ausdrücklich nicht im volkswirtschaftlichen Interesse sein. Umso besser, dass die Autoren unserer Tandemstudie die technologische und urheberrechtliche Basis dafür liefern, die juristische Betrachtung generativer Künstlicher Intelligenz endlich vom Kopf auf die Füße zu stellen.“

Wie lang ist das Gutachten denn tatsächlich geworden?

Das auf Deutsch abgefasste Tandem-Gutachten umfasst 171 Seiten und steht zum Download nicht zur Verfügung. Das Abstrakt und die Zusammenfassung können aber unten eingesehen werden.

Was geht aus den beiden hervor?

Im Rahmen des Trainings von generativen KI-Modellen kommt es zur Vervielfältigung von urheberrechtlich geschütztem Material. „Ergänzend ist darauf hinzuweisen, dass auch die KI-Verordnung eine Einhaltung europäischen Urheberrechts verlangt. Das Training generativer KI-Modelle ohne Einwilligung der Rechteinhaber ist demnach sowohl als Urheberrechtsverletzung als auch als Pflichtverstoß einzuordnen. Gegen derartige Verletzungen der Pflichten in der Verordnung kann unter Umständen auch privatrechtlich vorgegangen werden.“

Es gibt da doch diesen EU AI-Act. Was steht da drin?

In der ‚Vier-Punkte-Zusammenfassung‘ des AI-Acts (verabschiedet am 21. Mai 2024) findet man folgende Themenschwerpunkte:

– das KI-Gesetz klassifiziert KI-Systeme nach ihrem Risiko
– die meisten Verpflichtungen treffen die Anbieter (Entwickler) von KI-Systemen mit hohem Risiko
– Nutzer*innen sind per Definition natürliche oder juristische Personen, die ein KI-System beruflich einsetzen, nicht aber betroffene Endnutzer*innen
– Allzweck-KI (GPAI)

Die einzelnen Punkte legen unter anderem dar, was akzeptabel und inakzeptabel ist.

Inakzeptabel sind zum Beispiel Social-Scoring-Systeme und manipulative KI. Außerdem müssen Entwickler und Betreiber sicherstellen, dass Endbenutzer*innen sich darüber im Klaren sind, dass sie mit Chatbots und Deepfakes interagieren. Als minimales Risiko zählen KI-gestützte Videospiele und Spamfilter (allerdings gilt dies nur bis 2021 bis zur Einführung der generativen KI).

Gemäß des Gesetzes verbotene KI-Systeme (vgl. Kapitel II, Art. 5) sind all jene, die unterschwellig, manipulativ oder betrügerisch Verhalten verzerren oder fundierte Entscheidungen beeinträchtigen und dadurch Schaden anrichten. Die Ausnutzung von Schwachstellen im Zusammenhang mit Alter, Behinderung und sozioökonomischen Umständen ist dabei ebenso inkludiert wie biometrische Kategorierungssysteme, das bereits erwähnte Social Scoring (Bewertung oder Klassifizierung von Einzelpersonen oder Gruppen auf Grundlage ihres Sozialverhaltens oder ihrer persönlichen Eigenschaften, was zu einer nachteiligen oder ungünstigen Behandlung dieser Person führen kann), Beurteilung des Risikos einer Person, Straftaten zu begehen auf Grundlage von Profilen oder Persönlichkeitsmerkmalen, Erstellen von Gesichtserkennungsdatenbanken, „Echtzeit“-fernbiometrische Identifizierung (RBI) in öffentlich zugänglichen Bereichen für die Strafverfolgung (Ausnahmen wie vermisste Personen, Opfer von Entführungen oder Menschenhandel werden auch aufgeführt). Echtzeit-RBI ist ausdrücklich nur dann zulässig, wenn der Verzicht einen erheblichen Schaden verursachen würde.

Davon abgesetzt werden jene Systeme, die mit einem hohen Risiko in Verbindung gebracht werden (vgl. Kapitel III). Das sind in der Regel jene, die Entscheidungsmuster analysieren und Profile von Einzelpersonen erstellen. Hier werden die Anbieter unter anderem dazu verpflichtet, die EU-Rechtsvorschriften einzuhalten, Risikomanagementsysteme einzurichten, eine menschliche Aufsicht zu implementieren, auf Cybersicherheit zu achten und für ein Qualitätsmanagement zu sorgen.

Regelt der AI-Act der EU irgendetwas, was auf die Kunstbranche anzuwenden ist?

Zu diesem Thema wird man am ehesten unter Allzweck-KI (GPAI) fündig. Dort gibt es Verweise auf die Verpflichtung, eine technische Dokumentation der Ausbildungs- und Testverfahren zu erstellen, zur Einhaltung der Urheberrechtsrichtlinie und zur Veröffentlichung der für das Training verwendeten Inhalte.

Wie sieht es mit Gerichtsurteilen aus?

Weil generative KI eine relativ junge Technologie und die Justiz langsam ist, bleibt es bei einer konstant unsicheren Rechtslage – aber mit ersten Gerichtsurteilen zeichnet sich eine Richtung ab.

In den USA gibt es etwa mit Jason M. Allen einen Präzedenzfall. 2021 gewann er den ersten Platz im Wettbewerb der Colorado State Fair mit „Théâtre d’Opéra Spatial“, ein mit Midjourney komplett KI-generiertes Bild. Seine Platzierung sorgte schon damals für Diskussion. Inzwischen versucht er – bisher erfolglos – ein Urheberrecht für jenes Bild geltend zu machen. Eine Anfrage wurde bereits vom Copyright Office abgelehnt, woraufhin Allen geklagt hat.

Ein weiterer Präzedenzfall könnte der Beschluss eines US-Gerichts sein, dass Inhalte von Thomson Reuters nicht einfach für eine KI-Plattform durch einen Konkurrenten benutzt werden dürfen. Jener Konkurrent berief sich auf die Ausnahme des „Fair Use“ und dass durch den Einsatz generativer KI genügend „Transformation“ vorliege, die eine Nutzung von urheberrechtlich geschütztem Material rechtfertige. Das Gericht entschied dagegen.

Sollten sich solche Urteile mehren und auf die Kunstbranche übertragen werden, so ist es möglich, dass auch KI-generierten Kunstwerken das Recht auf Copyright abgesprochen wird. Ferner könnte die Nutzung von KI-generierten Inhalten mit der Intention des Weiterverkaufs, wie es im Fall von Thomson Reuters der Fall war, als unrechtmäßig gelten. 


Quellen:

KI-Training und Urheberrechtsverletzung
Abstract: Studie zu Urheberrechtverletzung mit KI (PDF)
Zusammenfassung: Studie zu Urheberrecht und generative KI (PDF)
Zusammenfassung des AI- Acts
Präzedenzfall in den USA (EN)
Gerichtsurteil von Thomson Reuters

Die Kommentarfunktion ist deaktiviert, aber Trackbacks und Dingbacks sind offen.