Suche
Contact
Symbolbild zu KI und Urheberrecht: menschliche Hand trifft Roboterhand
18.01.2024 | KPMG Law Insights

KI und Urheberrecht – was ist beim Einsatz von LLMs erlaubt?

Vor einigen Monaten haben neue Player die Rechtsszene betreten und seitdem für zahlreiche juristische Diskussionen gesorgt: Large Language Models (LLM), besser bekannt als ChatGPT, Azure OpenAI, PaLM 2 und Co. Insbesondere im Urheberrecht wirft die generative KI viele Fragen auf: Wann verletzen mit LLMs generierte Texte Urheberrechte? Und können an solchen Texten eigene Urheberrechte entstehen? Erlaubt das Urheberrecht die Vervielfältigung und Speicherung von Daten zum Training von LLMs?

LLMs generieren Texte. Sie wurden mit großen Datenmengen trainiert. Sie erstellen Texte, indem sie mithilfe ihrer Trainingsdaten jeweils die nächsten Elemente des generierten Textes selbst vorhersagen. Das LLM berechnet die Wahrscheinlichkeit von Wortfolgen – beziehungsweise von Folgen von Tokens – und entwickelt diese im nächsten Schritt selbständig zu Texten weiter. Die Antworten, also der Output der LLMs, basieren auf der wahrscheinlichsten Wortfolge, die aus den Wörtern der Eingabe (Prompt) berechnet wird.

Kann der Output Urheberrechte verletzen?

Eine gute Nachricht: LLMs sind nicht darauf ausgelegt, Plagiate zu erstellen. Im Gegensatz zu Internet-Suchmaschinen suchen sie nicht nach bereits vorhandenen Texten und zeigen diese an, sondern generieren neue Texte. Je nach den Anweisungen, die Nutzer:innen dem LLM erteilen, kann das allerdings trotzdem Urheberrechte verletzen. Es besteht nämlich die Gefahr, dass die KI Output generiert, der mit einem urheberrechtlich geschützten Werk identisch ist, mit dem sie trainiert wurde.

In folgenden Beispielen kann die generative KI Urheberrechte verletzen:

  • Wenn die KI gebeten wird, einen bestimmten Text zu reproduzieren, zum Beispiel einen Liedtext, der noch nicht gemeinfrei ist,
  • wenn die KI urheberrechtlich geschützte Texte lediglich in eine andere Sprache übersetzt und
  • wenn die KI Teile eines Textes reproduziert, die einen eigenen urheberrechtlichen Schutz genießen.

Da technische, informative Texte meistens nicht urheberrechtlich geschützt sind, ist eine Verletzung des Urheberrechts bei der Verarbeitung solcher Texte weniger wahrscheinlich. Theoretisch möglich bleibt sie aber dennoch: Ist es dem Autor oder der Autorin des technischen Textes gelungen, bei der Abfassung Kreativität zu zeigen, wäre unter Umständen auch an einem Sachtext ein Urheberrecht entstanden. Und wenn die KI gerade diese Elemente übernimmt, wäre es verletzt.

Können an KI-generierten Texten Urheberrechte entstehen?

Die nächste Frage, die sich im Zusammenhang mit GenAI und Urheberrecht stellt, ist die nach dem urheberechtlichen Schutz des generierten Outputs: Kann mithilfe von KI ein Werk entstehen, das urheberrechtlichen Schutz genießt? Und wenn ja, wem steht das Urheberrecht dann zu? Auch hier gibt es keine allgemeingültige Antwort.

Nach deutschem Recht sind nur persönliche geistige Schöpfungen schutzfähig. Die Schöpfung muss aus dem Gedankengang eines Menschen resultieren und das Ergebnis eines zielgerichteten geistigen Schaffensprozesses sein. Zufällige Ergebnisse, wie zum Beispiel unbeabsichtigte Farbspritzer oder ein von einem Affen geknipstes Foto, können keinen urheberrechtlichen Schutz beanspruchen. Nach deutschem Recht kann nur ein Mensch mit menschlicher Intelligenz und nicht eine KI als Urheberin oder Urheber gelten, und nur der Mensch kann urheberrechtlich geschützte Werke schaffen. Entscheidend ist, dass Urheber:innen in ihren kreativen Entscheidungen frei sind.

Bei der Verwendung von LLMs, wie wir sie bereits gewohnt sind, findet in der Regel eher keine hinreichend kreative Entscheidung der menschlichen Nutzer:innen der KI statt. Der geschriebene Prompt kann ein urheberrechtlich geschütztes Werk sein, führt aber nicht zum Schutz des durch die KI generierten Outputs. Nutzer:innen haben in der Regel keinen wesentlichen Einfluss auf die maschinelle Ausführung, die eigentliche Produktion des Textes.

Es kann jedoch Fälle geben, in denen eine andere Beurteilung gerechtfertigt ist, nämlich dann, wenn die Nutzer:innen das LLM als ein Werkzeug einsetzen und betreiben, das lediglich ihre persönliche kreative Absicht umsetzt. Etwas anschaulicher wäre das vergleichbar mit der Verwendung eines Pinsels. Wenn der Pinsel lediglich über das Papier rollt, zum Beispiel weil er fallen gelassen wird, entsteht kein urheberrechtlich geschütztes Werk, auch wenn dabei Farbe auf dem Papier zurückbleibt. Schwingt ein Maler den Pinsel jedoch absichtlich in einer bestimmten Weise, kann ein geschütztes Gemälde entstehen. Wenn KI in einer vergleichbaren Weise eingesetzt wird, kann tatsächlich ein urheberrechtlich geschütztes Werk entstehen.

Das wirft sofort die Frage auf, wer Urheber:in dieses Werkes ist und wem die Rechte daran zustehen. Hier sind verschiedene Lösungen möglich. Es könnte allein der Nutzer beziehungsweise die Nutzerin der KI sein, oder es könnte ein gemeinsames Werk zwischen dem Nutzer/der Nutzerin und dem KI-Programmierer sein. Diese Frage wird die Urheberrechtsexpert:innen in den verschiedenen Rechtsordnungen sicher noch einige Zeit beschäftigen.

Dürfen Daten zu Trainingszwecken von KI vervielfältigt und gespeichert werden?

Eine weitere zentrale Frage: Erlaubt das Urheberrecht die Vervielfältigung und Speicherung von Daten zum Training von KI-Systemen? Und falls ja, wie lange dürften diese Daten dann aufbewahrt werden?

Zulässig ist seit 2021 die Vervielfältigung von rechtmäßig zugänglichen Werken zum Zwecke des Text- und Data-Minings gem. § 44b Abs. 2 UrhG. Das bedeutet, dass digitale oder digitalisierte Werke automatisiert analysiert werden, um Informationen, insbesondere Muster, Trends und Korrelationen, zu extrahieren. Dabei werden die Daten gespeichert, also vervielfältigt. Die Daten müssen jedoch gelöscht werden, wenn sie nicht mehr für Text- und Data-Mining benötigt werden. Aber gilt das auch für das Training einer KI? Zu dieser Frage gibt es noch keine Rechtsprechung. Die Gesetzesbegründung deutet zwar darauf hin, dass § 44b UrhG die Vervielfältigung und Speicherung von rechtmäßig zugänglichen Daten für das KI-Training grundsätzlich erlaubt. Auch wenn der Gesetzgeber damals vermutlich noch nicht an Large Language Models gedacht hat, sind diese unserer Meinung nach erfasst. Denn die Vorschrift berücksichtigt auch die Interessen der Urheber:innen angemessen, da sie sich eine solche Nutzung vorbehalten und sie auch verbieten können.

Es stellt sich jedoch noch eine andere Frage: Wie lange dürfen solche Trainingsdaten gespeichert werden? Gibt es eine zeitliche Begrenzung, nach der die Daten gelöscht werden müssen, oder besteht der rechtfertigende Zweck so lange fort, wie die KI in Betrieb ist? Auf diese Frage gibt es noch keine endgültige Antwort. Es bleibt abzuwarten, wie sich Gesetzgebung und Rechtsprechung in diesen Bereichen in den kommenden Jahren entwickeln werden.

Fazit

Die Nutzung von LLMs wirft rechtliche Fragen hinsichtlich der möglichen Verletzung von Urheberrechten, der Entstehung neuer Urheberrechte und der Zulässigkeit der Vervielfältigung und Speicherung von Daten für das Training von LLMs auf.

Das Training der KI mittels rechtmäßig zugänglicher Daten ist unseres Erachtens erlaubt, da die Interessen der Urheberrechtsinhaber angemessen berücksichtigt werden. Ungeklärt ist allerdings, wie lange diese Daten gespeichert werden dürfen.

Wie sich die Rechtsprechung zu diesen Fragen positionieren wird, und ob der Gesetzgeber hier nochmal tätig werden wird, bleibt abzuwarten.

 

Explore #more

28.02.2025 | In den Medien

KPMG LLP Launches KPMG Law US – The First Big Four Law Firm Serving The US Market

Der Oberste Gerichtshof des US-Bundesstaates Arizona hat KPMG US die Lizenz für KPMG Law US erteilt hat. Seit dem 27.02.2025 ist KPMG damit die erste…

27.02.2025 | In den Medien

KPMG Law Statement in der ESGZ: Die aktuelle Meinung

Ist das deutsche Lieferkettengesetz ausreichend, um Unternehmen zur Verantwortung zu ziehen, oder benötigen wir schärfere Haftungsregeln für Menschenrechts- und Umweltverstöße? Diese Frage beantwortet auch KPMG…

26.02.2025 | KPMG Law Insights

Erstes Omnibus-Paket soll Pflichten der CSDDD, CSRD und EU-Taxonomie lockern

Die EU-Kommission hat heute den Entwurf des ersten angekündigten Omnibus-Pakets veröffentlicht. Mit der ersten Richtlinie im Rahmen der Omnibus-Initiative möchte die Kommission insbesondere die CSRD,…

26.02.2025 | In den Medien

JUVE Rechtsmarkt – Wie Shared Delivery Center den Performancedruck mindern

Kosteneffizienter, schlagkräftiger, schneller sein als die Konkurrenz. Diese Ziele treiben alle Unternehmen um, um so mehr in wirtschaftliche herausforderten Zeiten. Und so stellen sich Konzerne…

24.02.2025 |

Digitalisierung der Verwaltung – der digitale Führerschein ist ein erster Schritt

Die jüngst im Bundeskabinett beschlossene Einführung digitaler Führerscheine und Fahrzeugdokumente markiert einen bedeutenden Meilenstein bei der Digitalisierung der moderneren Verwaltung. Bürgerinnen und Bürger sollen ihre…

21.02.2025 | In den Medien

Gastbeitrag im Betriebs Berater: Überblick über die Regulierung für Wertpapierinstitute

Für Wertpapierinstitute gilt mit dem Inkrafttreten des Wertpapierinstitutsgesetzes (WpIG) seit dem 26.6.2021 ein eigenes Aufsichtsregime. Neben der unmittelbar geltenden Investment Firm Regulation (IFR) enthält außerdem…

21.02.2025 | KPMG Law Insights

Geldwäscheprävention: BaFin fordert Finanzsektor zum Handeln auf

Die Bundesanstalt für Finanzdienstleistungsaufsicht (BaFin) ruft den Finanzsektor zur erhöhten Aufmerksamkeit bei der Geldwäscheprävention auf. In ihrem Bericht „Risiken im Fokus 2025“ warnt sie vor…

18.02.2025 | KPMG Law Insights

KI-Compliance: Wichtige rechtliche Aspekte im Überblick

Menschliche Intelligenz schöpft aus Erfahrung, Emotion und Intuition. Künstliche Intelligenz (KI) hingegen verarbeitet Unmengen an Daten in Sekundenbruchteilen. Menschliche Intelligenz denkt voraus, zieht Schlüsse und…

17.02.2025 | In den Medien

WirtschaftsWoche zeichnet KPMG Law und Konstantin von Busekist aus

KPMG Law und Konstantin von Busekist wurden im aktuellen WirtschaftsWoche-Ranking im Bereich Compliance als TOP Kanzlei 2025 und Konstantin von Busekist als TOP Anwalt 2025…

17.02.2025 | In den Medien

Gastbeitrag in der InfrastrukturRecht: Gebührenunfähigkeit der Wasserkonzessionsabgabe

Das BVerwG hat am 09.10.2024 (9 B 5.24) die Beschwerde der Stadt Kassel gegen die Nichtzulassung der Revision im Urteil des VGH Kassel vom 30.11.2023…

Kontakt

Dr. Anna-Kristine Wipper

Partner
Leiterin Technologierecht

Heidestraße 58
10557 Berlin

Tel.: +49 30 530199731
awipper@kpmg-law.com

Dr. Thomas Beyer

Senior Manager

Heidestraße 58
10557 Berlin

Tel.: +49 30 530199822
thomasbeyer@kpmg-law.com

© 2024 KPMG Law Rechtsanwaltsgesellschaft mbH, assoziiert mit der KPMG AG Wirtschaftsprüfungsgesellschaft, einer Aktiengesellschaft nach deutschem Recht und ein Mitglied der globalen KPMG-Organisation unabhängiger Mitgliedsfirmen, die KPMG International Limited, einer Private English Company Limited by Guarantee, angeschlossen sind. Alle Rechte vorbehalten. Für weitere Einzelheiten über die Struktur der globalen Organisation von KPMG besuchen Sie bitte https://home.kpmg/governance.

KPMG International erbringt keine Dienstleistungen für Kunden. Keine Mitgliedsfirma ist befugt, KPMG International oder eine andere Mitgliedsfirma gegenüber Dritten zu verpflichten oder vertraglich zu binden, ebenso wie KPMG International nicht autorisiert ist, andere Mitgliedsfirmen zu verpflichten oder vertraglich zu binden.

Scroll