Ведучі видавці, включаючи Encyclopedia Britannica (власника Merriam-Webster), подали до суду на OpenAI, звинувачуючи компанію у систематичних та повсюдних порушеннях авторських прав. В основі позову лежить твердження про те, що OpenAI незаконно зібрала та використовувала близько 100 000 матеріалів, захищених авторським правом, для навчання своїх великих мовних моделей (LLM) без дозволу.
Суть Звинувачень: Як OpenAI Імовірно Порушила Авторські Права
Britannica стверджує, що дії OpenAI виходять за межі простого збору даних. У позові конкретно звинувачується ІІ-гігант у двох ключових порушеннях:
- Пряме Відтворення: Моделі OpenAI нібито генерують результати, що містять дослівні копії контенту Britannica.
- Зловживання Генерацією з Посиленням Отриманням (RAG): Інструмент RAG від OpenAI, який збагачує відповіді ChatGPT даними з мережі в реальному часі, включає статті Britannica без санкцій. По суті, OpenAI отримує прибуток із роботи Britannica, підриваючи її доходи.
У скарзі також йдеться, що OpenAI порушує закон про товарні знаки, фабрикуючи неправдиві атрибуції. ChatGPT звинувачують у генерації «галюцинацій» (хибної інформації) та помилковому зв’язуванні їх з Britannica, завдаючи шкоди репутації видавця. Britannica стверджує, що ця практика не лише шкодить її фінансовим показникам, а й підриває довіру громадськості до надійних онлайн-джерел.
Тренд, що зростає: Видавці проти ІІ
Britannica не єдина у цій судовій боротьбі. The New York Times, Ziff Davis (материнська компанія Mashable, CNET та інших) та більше дюжини газет у Північній Америці вже подали аналогічні позови проти OpenAI. Окремий позов проти Perplexity, іншої ІІ-компанії залишається невирішеним.
Центральне питання, яке визначає ці справи, полягає в тому, чи є навчання LLM на матеріалах, захищених авторським правом, сумлінним використанням. Хоча чітких юридичних прецедентів немає, Anthropic раніше стверджувала у суді, що таке використання є «трансформативним» та законним. Проте суддя у цій справі ухвалив, що незаконне завантаження контенту (а не його ліцензування) є явним порушенням, що призвело до мирової угоди на суму 1,5 мільярда доларів.
Чому це важливо
Ці судові процеси є важливими, оскільки вони кидають виклик фундаментальній бізнес-моделі багатьох ІІ-компаній. LLM покладаються на великі набори даних, які часто включають матеріали, захищені авторським правом, для функціонування. Якщо суди будуть послідовно ухвалювати рішення на користь видавців, розробникам ІІ, можливо, доведеться переглянути стратегії отримання даних або зіткнутися з руйнівними юридичними витратами. Вихід цих справ визначить, як навчаються та використовуються ІІ-системи, потенційно змушуючи перейти до ліцензованого контенту та суворіших заходів контролю даних.
OpenAI ще не відповіла на звинувачення, але юридичний тиск зростає. Майбутнє навчання ІІ може залежати від того, як розвиватимуться ці відносини.


























