Реддит подал в суд на Anthropic за использование контента

Reddit подал иск против стартапа Anthropic в суд Сан-Франциско. Компания обвиняет Anthropic в систематическом сборе постов Reddit для обучения языковых моделей Claude без разрешения.

По правилам площадки, коммерческое использование контента Reddit требует лицензии. Reddit утверждает, что Anthropic проигнорировала это требование, обошла технические защиты — такие как файлы robots.txt и ограничения по IP-адресам. Anthropic не пользовалась compliance API Reddit, который позволяет удалять посты из обучающих данных после их удаления пользователем.

В иске отмечается, что Anthropic публично признавалась в использовании данных Reddit для исследований. Компания указала более 40 популярных сообществ, в том числе r/science, r/IAmA и r/relationship_advice, как “качественные источники для обучения Claude”. Reddit считает, что весь этот сбор данных прошел без согласия и несмотря на ограничения.

Anthropic заявила в июле 2024 года, что Reddit находится в блоклисте для ClaudeBot с мая. Однако внутренние логи Reddit показывают, что боты Anthropic обращались к Reddit более 100 000 раз после этого заявления.

Reddit обвиняет Anthropic в ряде нарушений, включая нарушение договора и недобросовестную конкуренцию. Reddit требует возмещения упущенной выгоды, а также удаления всех обучающих моделей и данных Anthropic, содержащих контент Reddit. Кроме того, Reddit просит суд запретить коммерческое использование моделей Claude и любых других, обученных на этих данных.

Reddit подчеркивает, что действия Anthropic ставят под угрозу бизнес-платформы и конфиденциальность пользователей. Без лицензии и подключения к compliance API невозможно убедиться, что удаленные или чувствительные посты не остались в Claude.

“Если такие компании, как Anthropic, собирают контент Reddit без лицензии, пользователи лишаются защиты, прописанной в политике публичного контента и политике конфиденциальности Reddit, потому что у них нет возможности узнать, кто собрал и использует их данные,” — говорится в иске.

Reddit отмечает, что другие компании действуют по-другому. Например, Google платит Reddit $60 млн в год за доступ к данным для обучения. Партнерство также помогло Reddit занять более высокие позиции в поиске Google.

Источник

Оцените статью
Gimal-Ai