Wiodący wydawcy, w tym Encyclopedia Britannica (właściciel Merriam-Webster), pozwali OpenAI, zarzucając firmie systematyczne i powszechne łamanie praw autorskich. Sednem pozwu jest zarzut, że OpenAI nielegalnie zebrało i wykorzystało bez pozwolenia około 100 000 materiałów chronionych prawem autorskim do szkolenia swoich dużych modeli językowych (LLM).
Istota zarzutów: jak OpenAI rzekomo naruszyło prawa autorskie
Britannica twierdzi, że wysiłki OpenAI wykraczają poza zwykłe gromadzenie danych. W pozwie zarzuca się gigantowi AI dwa kluczowe naruszenia:
- Reprodukcja bezpośrednia: modele OpenAI rzekomo generują wyniki zawierające dosłowne kopie treści Britannica.
- Nadużycie generacji wzmocnionej odbioru (RAG): Narzędzie RAG OpenAI, które wzbogaca odpowiedzi ChatGPT danymi z sieci w czasie rzeczywistym, obejmuje artykuły Britannica bez sankcji. Zasadniczo OpenAI czerpie korzyści z pracy Britannica, podważając jej przychody.
W skardze zarzucono również, że OpenAI narusza prawo dotyczące znaków towarowych, fałszując fałszywe atrybucje. ChatGPT został oskarżony o generowanie „halucynacji” (fałszywych informacji) i fałszywe powiązanie ich z Britannicą, szkodząc reputacji wydawcy. Britannica argumentuje, że praktyka ta nie tylko szkodzi jej wynikom finansowym, ale także podważa zaufanie opinii publicznej do wiarygodnych źródeł internetowych.
Trend rosnący: wydawcy kontra sztuczna inteligencja
Britannica nie jest sama w tej batalii prawnej. The New York Times, Ziff Davis (spółka-matka Mashable, CNET i innych) oraz kilkanaście gazet w Ameryce Północnej złożyły już podobne pozwy przeciwko OpenAI. Odrębny pozew przeciwko Perplexity, innej firmie zajmującej się sztuczną inteligencją, pozostaje nierozwiązany.
Główną kwestią leżącą u podstaw tych spraw jest to, czy instrukcje LLM dotyczące materiałów chronionych prawem autorskim stanowią dozwolony użytek. Chociaż nie ma wyraźnego precedensu prawnego, firma Anthropic już wcześniej twierdziła w sądzie, że takie zastosowania mają charakter „przekształcający” i są legalne. Jednak sędzia w tej sprawie orzekł, że nielegalne pobieranie treści (zamiast udzielania na nie licencji) stanowi wyraźne naruszenie, co doprowadziło do ugody w wysokości 1,5 miliarda dolarów.
Dlaczego to jest ważne
Te pozwy są ważne, ponieważ podważają podstawowy model biznesowy wielu firm zajmujących się sztuczną inteligencją. Aby funkcjonować, LLM opierają się na ogromnych zbiorach danych, często zawierających materiały chronione prawem autorskim. Jeśli sądy konsekwentnie orzekają na korzyść wydawców, twórcy sztucznej inteligencji będą musieli ponownie przemyśleć swoje strategie pozyskiwania danych lub ponieść wyniszczające koszty prawne. Wynik tych spraw określi, w jaki sposób systemy sztucznej inteligencji będą szkolone i wykorzystywane, potencjalnie wymuszając przejście w stronę licencjonowanych treści i bardziej rygorystycznych kontroli danych.
OpenAI nie odpowiedziało jeszcze na zarzuty, ale presja prawna rośnie. Przyszłość szkoleń w zakresie sztucznej inteligencji może zależeć od rozwoju tych przypadków.
