Toonaangevende uitgevers, waaronder Encyclopedia Britannica (eigenaar van Merriam-Webster), hebben een rechtszaak aangespannen tegen OpenAI, wegens systematische en wijdverbreide schendingen van het auteursrecht. De kernclaim is dat OpenAI bijna 100.000 auteursrechtelijk beschermde artikelen illegaal heeft geschraapt en gebruikt om zijn grote taalmodellen (LLM’s) zonder toestemming te trainen.
De zaak: hoe OpenAI naar verluidt inbreuk maakte op het auteursrecht
Britannica stelt dat de acties van OpenAI verder gaan dan alleen het verzamelen van gegevens. De rechtszaak beschuldigt de AI-gigant specifiek van twee belangrijke schendingen:
- Directe reproductie: De modellen van OpenAI genereren naar verluidt output die letterlijke kopieën van de inhoud van Britannica bevat.
- Retrieval-Augmented Generation (RAG) Misbruik: OpenAI’s RAG-tool, die de reacties van ChatGPT verbetert met realtime webgegevens, neemt zonder toestemming de artikelen van Britannica op. Dit betekent in wezen dat OpenAI profiteert van het werk van Britannica en tegelijkertijd de inkomstenstromen ondermijnt.
In de klacht wordt ook gesteld dat OpenAI het merkenrecht schendt door valse toeschrijvingen te verzinnen. ChatGPT wordt ervan beschuldigd ‘hallucinaties’ (valse informatie) te genereren en deze ten onrechte aan Britannica te koppelen, waardoor de geloofwaardigheid van de uitgever wordt geschaad. Britannica beweert dat deze praktijk niet alleen het bedrijfsresultaat schaadt, maar ook het vertrouwen van het publiek in betrouwbare online bronnen aantast.
Een groeiende trend: uitgevers versus AI
Britannica staat niet alleen in deze juridische strijd. De New York Times, Ziff Davis (moederbedrijf van Mashable, CNET en anderen) en meer dan een dozijn kranten in Noord-Amerika hebben al soortgelijke rechtszaken aangespannen tegen OpenAI. Een afzonderlijke rechtszaak tegen Perplexity, een ander AI-bedrijf, blijft onopgelost.
De centrale vraag die deze zaken aanstuurt, is of het trainen van een LLM op auteursrechtelijk beschermd materiaal onder eerlijk gebruik valt. Hoewel er geen stevig juridisch precedent bestaat, heeft Anthropic eerder voor de rechtbank betoogd dat dergelijk gebruik ‘transformatief’ en legaal is. De rechter in die zaak oordeelde echter dat het illegaal downloaden van inhoud (in plaats van het in licentie geven ervan) een duidelijke overtreding was, wat leidde tot een schikking van $ 1,5 miljard.
Waarom dit belangrijk is
Deze rechtszaken zijn belangrijk omdat ze het fundamentele bedrijfsmodel van veel AI-bedrijven in twijfel trekken. LLM’s zijn voor hun functioneren afhankelijk van enorme datasets, vaak inclusief auteursrechtelijk beschermd materiaal. Als rechtbanken consistent in het voordeel van uitgevers oordelen, moeten AI-ontwikkelaars mogelijk opnieuw onderhandelen over strategieën voor gegevensverzameling, anders worden ze geconfronteerd met verlammende juridische kosten. De uitkomst zal bepalen hoe AI-systemen worden getraind en gebruikt, waardoor mogelijk een verschuiving naar gelicentieerde inhoud en strengere gegevenscontroles zal worden afgedwongen.
OpenAI heeft nog niet gereageerd op de beschuldigingen, maar de juridische druk neemt toe. De toekomst van AI-training kan afhangen van hoe deze gevallen zich ontwikkelen.
