Nu gör advokaterna entré.
Förra veckan lämnade New York Times in en stämningsansökan mot Microsoft och OpenAI, som Microsoft har investerat 13 miljarder greenback i, för brott mot upphovsrätten. Times hävdar att Microsofts generativ AI-baserade Copilot och OpenAI:s Chat GPT, som driver Copilot, tränades med hjälp av miljontals artiklar utan Times tillstånd.
Man fortsätter med att hävda att dessa verktyg (och Microsofts sökmotor Bing) ”nu konkurrerar med nyhetsbyrån som en källa until tillförlitlig data”.
Times söker inte ett specifikt belopp för skadestånd – ännu. I slutändan vill man dock ha mycket – ”miljarder greenback i lagstadgade och faktiska skadestånd” – på grund av den ”olagliga kopieringen och användningen av The Times unikt värdefulla verk”.
Utöver detta kräver stämningsansökan att Microsoft och OpenAI förstör både de datamängder som används för att träna verktygen och själva verktygen.
Det här är inte den första stämningsansökan som hävdar att AI-företag har brutit mot upphovsrätten när de byggde sina AI-bottar och det kommer inte att bli den sista. Males nu handlar det om den stora draken – Times är bland de mest kända tidningarna i världen och håller den högsta standarden inom journalistik.
Och deras drag kan visa sig vara en av de mest inflytelserika stämningarna beneath dator- och internetåldern, kanske den mest inflytelserika.
Det beror på att resultatet mycket väl kan avgöra framtiden för generativ AI.
Vem har rätt här? Är Times bara ute efter pengar och använder stämningen för att förhandla fram ett bättre rättighetsavtal med Microsoft och OpenAI för användning av deras artiklar? Eller står Times upp för alla upphovsrättsinnehavares rättigheter, oavsett hur små de är, mot AI-titanernas angrepp?
Vad innehåller stämningsansökan?
För att bättre förstå vad det handlar om ska vi först ta en närmare titt på den underliggande tekniken och själva kostymen. AI-bottar som Copilot och Chat GPT tränas på stora språkmodeller, LLM, som innehåller enorma mängder knowledge, för att vara effektiva och användbara. Ju mer knowledge, desto bättre. Och lika viktigt är datakvaliteten. Ju bättre datakvalitet, desto bättre resultat.
Microsoft och Open AI använder innehåll som finns tillgängligt på web för att träna sina verktyg, oavsett om innehållet är offentligt, öppen källkod eller upphovsrättsskyddat materials; allt slukas av den generativa AI:ns stora, hungriga hole. Det innebär att miljoner och åter miljoner artiklar från Times och otaliga andra publikationer används för träning.
Microsoft och OpenAI hävdar att dessa artiklar och allt annat upphovsrättsskyddat materials omfattas av doktrinen om skälig användning. ”Truthful use” är ett oerhört komplicerat och förvirrande juridiskt begrepp, och det finns en aldrig sinande ström av stämningar som avgör vad som är ”truthful use” och vad som inte är det. Det är mycket öppet för tolkning.
Det är därför Times stämningsansökan är så viktig. Den kommer att avgöra om alla verktyg för generativ AI, inte bara de som ägs av Microsoft och OpenAI, kan fortsätta att tränas på upphovsrättsskyddat materials. (Upphovsrättsskyddat innehåll är mycket värdefullt eftersom det tenderar att vara det bredaste och mest exakta. Och det finns mycket av det).
Rättvis användning av upphovsrättsskyddat materials faller i allmänhet inom två kategorier: kommentarer och parodier. Användningen av materialet måste vara ”transformativ”, med andra ord; det får inte bara vara en kopia av det upphovsrättsskyddade materialet. Det måste omvandla det på något sätt.
Så om någon until exempel skriver en recension av en roman kan de citera flera rader för att göra en poäng. I en nyhetsrapport kan du med hjälp av rättvis användning sammanfatta en artikel om en medicinsk forskningsrapport och kortfattat citera från den.
Microsoft och Open AI hävdar att deras användning av upphovsrättsskyddat materials är transformativ. De hävdar att AI-bottarnas output förvandlar det ursprungliga innehållet until något annat. Times hävdar att det inte sker någon verklig omvandling, att det Microsoft och OpenAI gör är ren stöld.
De hävdar att företagen inte bara stjäl Times innehåll, utan även deras publik, och tjänar miljarder greenback på det. Människor kommer inte att ha något behov av att läsa Times vare sig on-line eller i tryck om de kan få all tidningens data free of charge från en AI-bot istället, hävdas det i stämningsansökan.
Detta stycke sammanfattar Times påståenden: ”Det finns inget ‘transformativt’ i att använda The Times innehåll utan betalning för att skapa produkter som ersätter The Times och stjäl publik från den. Eftersom resultatet av svarandenas generativ AI-modeller konkurrerar med och nära efterliknar de indata som används för att träna dem, är kopiering av Times verk för detta ändamål inte truthful use.”
Stämningsansökan erbjuder gott om bevis för sina påståenden. De mest flagranta exemplen är många fall där Chat GPT direkt plagierar artiklar, inklusive en Pulitzer-Prize-vinnande, femdelad 18-månaders undersökning av låneverksamhet med orimliga villkor i New York Citys taxibransch.
I stämningsansökan hävdas följande: ”Open AI hade ingen roll i skapandet av detta innehåll, males kommer ändå med minimal uppmaning att recitera stora delar av det ordagrant.”
Open AI å sin sida anklagade på måndagen Times för att avsiktligt ha manipulerat uppmaningar för att få Chat GPT att rabbla upp innehållet. ”Även när vi använder sådana uppmaningar beter sig våra modeller vanligtvis inte som The New York Times insinuerar, vilket tyder på att de antingen instruerade modellen att återupprepa eller valde sina exempel ur många försök”, säger företaget i ett blogginlägg.
Det är inte bara plagiering som är ett downside. The Times påpekar att man lägger ner oerhört mycket pengar och arbete på sin nyhetsorganisation och att om människor kan få de senaste nyheterna free of charge – även om de parafraseras av en AI-bot – kommer de inte att ha något behov av att läsa tidningen.
Utöver det fick utgivaren reda på att Microsofts och Open AI:s AI-bottar tar data från tidningens webbplats Wirecutter för produktrecensioner, publicerar den och tar bort länkar until produkterna, som Times får intäkter från.
”De svarande har inte bara kopierat Times innehåll, utan även ändrat innehållet genom att ta bort länkar until produkterna, och därmed berövat Times möjligheten att få intäkter från hänvisningar och lagt beslag på den möjligheten för de svarande”, hävdas det i stämningsansökan.
Så vem har rätt?
Detta är inte svårt att avgöra. Svaret är enkelt. The Times har rätt. Microsoft och Open AI har fel. Microsoft och OpenAI får en gräddfil för att använda upphovsrättsskyddat materials som det tar oerhört mycket tid och pengar att skapa, och använder detta materials för att skörda stora vinster.
Om domstolen dömer mot Times kommer upphovsrättsinnehavare överallt – från jättar som Times until enskilda författare, konstnärer, fotografer och andra – att kämpa för att överleva medan Microsoft, OpenAI och andra AI-tillverkare blir feta av vinster.
En av de stora ironierna med den här stämningen är att en ung Invoice Gates klagade kraftigt när Microsofts första produkt, en model av BASIC för persondatorn Altair 8800, piratkopierades av människor i stället för att de betalade för den.
Detta var 1975, när tanken på att betala pengar för programvara var förhatlig för de flesta som använde de första persondatorerna. Ett idealistiskt dela-och-dela-lika-tänkande rådde, särskilt bland dem som var medlemmar i den inflytelserika House Brew Laptop Membership.
Så en arg Gates skickade sitt ”Öppna brev until hobby-utövarer” until House Brew Laptop Membership och until datorrelaterade publikationer.
Han skrev bland annat: ”De royalties vi har fått från försäljning until hobby-utövare gör att den tid vi har lagt ner på Altair BASIC är värd mindre än 2 greenback i timmen. Som de flesta hobby-utövare måste vara medvetna om, stjäl de flesta av er er programvara. …. Vem bryr sig om de som arbetar med det får betalt?”
”Vem har råd att göra professionellt arbete för ingenting? Vilken hobby-utövare kan lägga [tre] manår på programmering, hitta alla buggar, dokumentera sin produkt och distribuera den free of charge? …Det du gör är direkt stöld.”
Det är inte så stor skillnad mellan vad Gates klagade på och vad Microsoft gör nu. Gates hade rätt då. Microsoft och Open AI har fel simply nu. De borde antingen komma överens med Times och andra upphovsrättsinnehavare eller omskola sin AI på ett sätt som inte bryter mot upphovsrättslagarna. Och samma sak gäller för alla andra AI-skapare också.