Ведущие издатели, включая Encyclopedia Britannica (владельца Merriam-Webster), подали в суд на OpenAI, обвиняя компанию в систематических и повсеместных нарушениях авторских прав. В основе иска лежит утверждение о том, что OpenAI незаконно собрала и использовала около 100 000 материалов, защищённых авторским правом, для обучения своих больших языковых моделей (LLM) без разрешения.
Суть Обвинений: Как OpenAI Предположительно Нарушила Авторские Права
Britannica утверждает, что действия OpenAI выходят за рамки простого сбора данных. В иске конкретно обвиняется ИИ-гигант в двух ключевых нарушениях:
- Прямое Воспроизведение: Модели OpenAI якобы генерируют результаты, содержащие дословные копии контента Britannica.
- Злоупотребление Генерацией с Усилением Получением (RAG): Инструмент RAG от OpenAI, который обогащает ответы ChatGPT данными из сети в реальном времени, включает статьи Britannica без санкций. По сути, OpenAI извлекает прибыль из работы Britannica, подрывая её доходы.
В жалобе также говорится, что OpenAI нарушает закон о товарных знаках, фабрикуя ложные атрибуции. ChatGPT обвиняют в генерации «галлюцинаций» (ложной информации) и ложном связывании их с Britannica, нанося ущерб репутации издателя. Britannica утверждает, что эта практика не только вредит её финансовым показателям, но и подрывает доверие общественности к надёжным онлайн-источникам.
Растущий Тренд: Издатели против ИИ
Britannica не единственная в этой судебной борьбе. The New York Times, Ziff Davis (материнская компания Mashable, CNET и других) и более дюжины газет в Северной Америке уже подали аналогичные иски против OpenAI. Отдельный иск против Perplexity, другой ИИ-компании, остаётся нерешённым.
Центральный вопрос, определяющий эти дела, заключается в том, является ли обучение LLM на материалах, защищённых авторским правом, добросовестным использованием. Хотя чётких юридических прецедентов нет, Anthropic ранее утверждала в суде, что такое использование является «трансформативным» и законным. Однако судья в этом деле постановил, что незаконная загрузка контента (а не его лицензирование) является явным нарушением, что привело к мировому соглашению на сумму 1,5 миллиарда долларов.
Почему Это Важно
Эти судебные процессы важны, поскольку они бросают вызов фундаментальной бизнес-модели многих ИИ-компаний. LLM полагаются на огромные наборы данных, часто включающие материалы, защищённые авторским правом, для функционирования. Если суды будут последовательно выносить решения в пользу издателей, разработчикам ИИ, возможно, придётся пересмотреть стратегии получения данных или столкнуться с разрушительными юридическими издержками. Исход этих дел определит, как обучаются и используются ИИ-системы, потенциально вынуждая перейти к лицензированному контенту и более строгим мерам контроля данных.
OpenAI ещё не ответила на обвинения, но юридическое давление растёт. Будущее обучения ИИ может зависеть от того, как будут развиваться эти дела.

























