Meta выиграла суд по обучению Llama на книгах

Федеральный суд США в Калифорнии вынес решение в пользу Meta в громком суде о правомерности использования авторских книг для обучения языковых моделей Llama. Суд отметил, что это решение касается только подателей иска, а не всего рынка ИИ.

Тринадцать авторов, включая лауреатов Пулитцеровской премии Хунота Диаса и Эндрю Шона Гриера, обвиняли компанию в использовании их произведений без разрешения. Их претензии были отклонены из-за недостатка доказательств, но суд подчеркнул, что этот вердикт не формирует общего правила для отрасли.

Главный вопрос заключался в том, считается ли обучение языковых моделей на авторских книгах “добросовестным использованием” по американским законам об авторском праве. Суд решил, что подход Meta «высоко преобразующий», так как модели Llama создают новый текст по запросу пользователя, а не просто перепечатывают оригиналы. Хотя потенциальная прибыль Meta — до 1,4 трлн долларов за десять лет — играла против добросовестного использования, это не стало определяющим.

Большая часть спора касалась возможного ущерба рынку оригинальных произведений. Авторы заявляли, что несанкционированное обучение подрывает ценность лицензирования и может привести к появлению огромного числа имитаторов. Суд отклонил эти доводы, отметив, что наличие рынка лицензирования само по себе не доказывает нарушения, а у истцов не было реальных доказательств того, что модели Llama снижают продажи книг.

Meta пыталась получить лицензии от издательств, но столкнулась с юридическими сложностями и перешла к использованию материалов из «теневых библиотек», таких как LibGen и Anna’s Archive. Для предотвращения копирования длинных отрывков были введены технические ограничения — даже при специальных запросах модель воспроизводила не более 50 слов из книг.

Суд отметил, что факт скачивания книг с пиратских ресурсов — это проблема, но главное — не источник, а способ использования данных. Само по себе наличие пиратских копий не делает обучение моделей незаконным.

В параллельном судебном разбирательстве против Anthropic судья Уильям Алсуп занял другую позицию: обучение моделей на книгах из пиратских библиотек не является добросовестным использованием. По его словам, желание создать законный продукт не оправдывает нарушения закона.

Судья Винс Чаббрия подчеркнул: принятое решение не означает автоматическое разрешение использовать защищённые книги для обучения ИИ. «Истцы сделали неверные выводы и не привели достаточно доказательств в пользу своих доводов», — отметил Чаббрия. Он оставил возможность для будущих исков, если авторы смогут подтвердить реальный вред для рынка.

Риски массового появления AI-генерируемых книг и снижения продаж живых писателей остаются значимыми аргументами для следующих судебных споров. Судья отметил, что запрет на обучение моделей с помощью защищённых материалов законом не предусмотрен: компаниям, скорее всего, придётся платить за лицензии.

“Где копирование книг для обучения LLM не является добросовестным использованием, разработчики LLM (в том числе Meta) не должны прекращать использование защищённых работ. Им достаточно платить держателям авторских прав за такие лицензии.” — судья Винс Чаббрия.

Чаббрия также осудил утверждения о том, что ужесточение авторского права замедлит развитие искусственного интеллекта, назвав их «нелепыми»: «Если использование защищённых работ для обучения действительно настолько необходимо, как говорят компании, они найдут способ заплатить за это авторам», — пояснил он.

Судья не согласился со сравнениями обучения моделей с тем, как дети читают книги — этот образ он назвал несоответствующим, потому что ИИ может генерировать конкурирующие книги за секунды, практически без творческого вклада.

В заключение судья подчеркнул: даже если обучение моделей преобразует исходные произведения, нельзя считать добросовестным использованием ситуацию, при которой “сотни миллиардов или триллионы долларов заработка” возможны за счёт потока новых текстов, способных подорвать продажи оригинальных книг.

Источник

*Meta — запрещенная в РФ организация.

Оцените статью
Gimal-Ai