Přední vydavatelé, včetně Encyclopedia Britannica (vlastník Merriam-Webster), zažalovali OpenAI a obvinili společnost ze systematického a rozsáhlého porušování autorských práv. Jádrem žaloby je obvinění, že OpenAI nezákonně shromáždila a použila přibližně 100 000 materiálů chráněných autorskými právy k výcviku svých velkých jazykových modelů (LLM) bez povolení.
Podstata obvinění: Jak OpenAI údajně porušila autorská práva
Britannica říká, že úsilí OpenAI přesahuje pouhé shromažďování dat. Žaloba konkrétně obviňuje giganta AI ze dvou klíčových porušení:
- Přímá reprodukce: Modely OpenAI údajně generují výsledky obsahující doslovné kopie obsahu Britannica.
- Abuse of Receipt Enhanced Generation (RAG): Nástroj RAG společnosti OpenAI, který obohacuje odpovědi ChatGPT o data ze sítě v reálném čase, obsahuje články Britannica bez sankcí. OpenAI v podstatě těží z práce Britannice a podkopává její příjmy.
Stížnost také tvrdí, že OpenAI porušuje zákon o ochranných známkách tím, že vyrábí nepravdivé údaje. ChatGPT byl obviněn z generování „halucinací“ (nepravdivých informací) a jejich falešného spojování s Britannica, což poškozuje pověst vydavatele. Britannica tvrdí, že tato praxe nejen poškozuje její finanční výkonnost, ale také podkopává důvěru veřejnosti ve spolehlivé online zdroje.
Rostoucí trend: Vydavatelé vs. AI
Britannica není v této právní bitvě sama. The New York Times, Ziff Davis (mateřská společnost Mashable, CNET a další) a více než tucet novin v Severní Americe již podaly podobné žaloby na OpenAI. Samostatná žaloba proti Perplexity, další společnosti AI, zůstává nevyřešena.
Ústředním problémem těchto případů je, zda pokyny LLM týkající se materiálu chráněného autorskými právy představují princip fair use. I když neexistuje jasný právní precedens, společnost Anthropic již dříve u soudu tvrdila, že takové použití je „transformativní“ a legální. Soudce v tomto případě však rozhodl, že nezákonné stahování obsahu (spíše než udělení licence) bylo jasným porušením, což vedlo k vyrovnání ve výši 1,5 miliardy dolarů.
Proč je to důležité
Tyto soudní spory jsou důležité, protože zpochybňují základní obchodní model mnoha společností AI. LLM při svém fungování spoléhají na obrovské soubory dat, často včetně materiálů chráněných autorskými právy. Pokud soudy budou důsledně rozhodovat ve prospěch vydavatelů, vývojáři AI možná budou muset přehodnotit své strategie získávání dat nebo čelit ochromujícím právním nákladům. Výsledek těchto případů určí, jak jsou systémy umělé inteligence trénovány a používány, což si potenciálně vynutí přechod na licencovaný obsah a přísnější kontroly dat.
OpenAI zatím na obvinění nereagovalo, ale právní tlak roste. Budoucnost výcviku AI může záviset na tom, jak se tyto případy vyvinou.
