Tech Blog

AI och upphovsrätt i EU: Kneschke v LAION

Inledning

Ett av de första och mest uppmärksammade avgörandena från ett EU-land rörande AI-träning på upphovsrättsskyddat material har äntligen kommit. I slutet av september kom en dom från Tyskland där organisationen LAION blivit stämd av fotografen Robert Kneschke. Kneschke menade att hans bilder blivit olovligt kopierade, använda och spridda i ett av LAION:s dataset trots att han motsatt sig det genom en reservation på hemsidan som bilderna hämtats från. Detta menar Kneschke utgör ett intrång i hans upphovsrätt. LAION i sin tur menar att de har rätt att använda bilderna genom ett undantag i upphovsrätten för text- och datautvinning. LAION är en icke-vinstdrivande organisation som tillhandahåller dataset som kan användas för AI-träning. Dataseten består av länkar till bilder som finns online, samt beskrivningar av bildernas innehåll som likhet med andra bilder, sannolikheten att innehålla en vattenstämpel och om bilden har NSFW-status (Not Safe For Work), vilket indikerar om en bild innehåller stötande eller sexuellt innehåll som kan anses olämpligt i professionella sammanhang.

Undantag från upphovsrätten

Enligt tysk (liksom svensk) upphovsrätt så innebär det upphovsrättsliga skyddet bland annat att upphovsmannen avseende sina verk har rätt att bestämma över hur exemplar får framställas och hur verket görs tillgängligt för allmänheten. Det finns dock undantag från den ensamrätten, där viss särskild användning och exemplarframställning är tillåten enligt undantag i upphovsrättslagstiftningen.  Några EU-gemensamma undantag som kan vara betydelsefulla vid träning och användning av AI innefattar framställning av:

  • tillfälliga kopior under en teknisk process (jmf. 2 kap 11a § upphovsrättslagen),
  • exemplar för text- och datautvinning (jmf. 2 kap. 15 a § upphovsrättslagen och art. 4 i EU:s DSM-direktiv), och
  • exemplar för text- och datautvinning för forskningsorganisationer (jmf. 2 kap. 15 b § upphovsrättslagen och art. 3 i DSM-direktivet).

Domstolens bedömning

Kneschke hävdade att LAION hade gjort kopior vilket gjorde intrång i hans upphovsrätt och krävde att LAION skulle radera hans bilder från datasetet där de förekom. Vidare så hävdade han att LAION inte hade rätt att åberopa något av undantagen i upphovsrätten eftersom en reservation hade gjorts av honom vilket hindrar utnyttjande för kommersiell användning och att LAION inte bedrev forskning och därmed kunde utnyttja undantaget.

LAION bemötte den första invändningen om kopior av det upphovsrättskyddade materialet med att argumentera för att organisationen inte hade några av Kneschkes bilder i datasetet. Datasetet innehöll endast en länk till bilden med tillhörande information om bildens egenskaper. LAION medgav att bilden under sammanställningen av datasetet tillfälligt hade laddats ned för analys men sedan raderats och endast utgjorde tillfälliga kopior under en teknisk process. Domstolen bedömde dock inte att användningen av bilderna hade varit tillräckligt kortvarig och tillfällig för att falla under undantaget för tillfälliga kopior och att LAION därför var tvungna att förlita sig på något av de andra undantagen för att nå framgång.

I andra hand argumenterade LAION för att användningen av bilderna skulle omfattas av undantaget för text- och datautvinning eftersom Kneschke inte hade gjort en giltig reservation då den var skriven i klartext. Det generella undantaget för text- och datautvinning som kan utnyttjas kommersiellt är tillåtet så länge inte upphovsmannen har reserverat sig mot sådan användning medan undantaget för text- och datautvinning för forskningsorganisationer är absolut. Reservationen ska göras via ett förbehåll genom en maskinläsbar metod om innehållet har gjorts allmänt tillgängligt online enligt DSM-direktivet och dess skäl. Den tyska domstolen uttalade här att en reservation skriven i klartext, t.ex. i en webbsidas användningsvillkor, numera bör anses tillräcklig eftersom de digitala verktyg som nu används för datainsamling är så pass sofistikerade att det får antas att de är kapabla att läsa klartext och inte endast begränsningar skrivna i tekniska format som programmeringsspråk eller konfigurationsfiler. Ett exempel på en sådan maskinläsbar metod är robots.txt, en fil som instruerar sökmotorer om vilka delar av en webbplats som får indexeras eller inte. Till skillnad från klartext, som kan läsas direkt av människor, är robots.txt avsett för att kommunicera direkt med sökmotorers algoritmer och andra automatiserade system. I det aktuella fallet bedömde domstolen att reservationen var giltig, trots att den stod i klartext, och konstaterade därmed att LAION sannolikt inte skulle omfattats av det generella undantaget för text- och datautvinning. Domstolen prövade dock aldrig detta, eftersom LAION ansågs omfattas av forskningsundantaget.

Slutligen menade LAION att användningen av bilderna skulle omfattas av undantaget för forskningsorganisationer, vilket domstolen gav gehör för. Domstolen ansåg att LAION var att betrakta som en forskningsorganisation och påpekade att forskning är ett brett begrepp och inte endast inkluderar nya upptäckter utan även förberedande arbete med syfte att uppnå insikter vid senare tillfälle, som insamling av data. Även om skapandet av ett dataset inte omedelbart leder till nya upptäckter, utgör det ett grundläggande steg mot att uppnå kunskap. Eftersom datasetet dessutom gjordes fritt tillgängligt, ansåg domstolen att det stödde slutsatsen att det var avsett att användas av forskare och att det var irrelevant att kunskapen dessutom användes av kommersiella AI-bolag.

Steg i AI-träning

Domstolen förde också en intressant argumentation avseende de olika stegen i AI-träning, som klassificerades enligt tre huvudsakliga stadier:

  • skapandet av en dataset som också kan användas för AI-träning,
  • den efterföljande träningen av AI-modellen med detta dataset, och
  • den efterföljande användningen av den färdigtränade AI-modellen i syfte att skapa nytt innehåll.

Denna fördelning som fokuserar på ett input-stadie, följt av ett output-stadie är en rimlig uppdelning utifrån ett immaterialrättsligt perspektiv.  Den rättsliga regleringen gör nämligen skillnad på olovlig användning av upphovsrättskyddat material och skapandet av nytt material som potentiellt gör intrång i någon annans upphovsrätt.

Betydelse av rättsfallet

Rättsutvecklingen baserat på denna dom är bara ett tidigt steg på vägen mot ett svar på frågan om, och på vilket sätt upphovsrättsskyddat material får användas för AI-träning. Att det är en lång väg kvar till ett definitivt svar beror för det första på att det handlar om ett inhemskt rättsfall i första instans och därför har begränsat gränsöverskridande prejudikatvärde i övriga EU, för det andra eftersom prövningen endast rörde det första av de tre träningsstegen (skapandet av ett dataset) och för det tredje eftersom undantaget för forskningsorganisationer är det undantag som är minst kontroversiellt. Trots detta ska värdet av rättsfallet inte heller underskattas eftersom europeisk immaterialrätt är relativt harmoniserad och domstolen tar ett principiellt ställningstagande om att dataset som sammanställts av en forskningsorganisation och släppts fritt får användas ohindrat av en kommersiell aktör.

Vi på Delphi kommer fortsätta följa detta område med spänning. Du kan läsa mer om upphovsrätt till AI-genererade verk här, och AI och immaterialrätt här, kontakta oss gärna om du är nyfiken på din egen AI-implementering.

 

Denna artikel är skriven av Senior Associate/Advokat Linus Larsén och Associate David Suh.