Китайская лаборатория искусственного интеллекта DeepSeek представила модель DeepSeek-R1, которая, как утверждается, показывает результаты, сравнимые или превосходящие модель OpenAI o1 на определённых тестах. Модель доступна на платформе Hugging Face под лицензией MIT, что позволяет её коммерческое использование без ограничений.
R1 превосходит o1 на бенчмарках AIME, MATH-500 и SWE-bench Verified, которые оценивают способности моделей в решении задач, математике и программировании. Как модель рассуждений, R1 проверяет свои собственные решения, что делает её надёжной в сложных областях, таких как физика, наука и математика.
Модель содержит 671 миллиард параметров, что делает её одной из самых крупных в своём классе. Также выпущены упрощённые версии от 1,5 до 70 миллиардов параметров, которые могут работать даже на обычных ноутбуках. Полная версия доступна через API DeepSeek, причём её использование обходится на 90–95% дешевле, чем o1 от OpenAI.
Однако R1 подчиняется требованиям китайских регулирующих органов, включая обязательное соответствие «основным социалистическим ценностям». Это ограничивает её возможности отвечать на определённые темы, такие как площадь Тяньаньмэнь или автономия Тайваня.

Выход R1 совпал с инициативой администрации Байдена, направленной на ужесточение экспортных ограничений на передовые технологии ИИ для Китая. В то же время OpenAI призвала правительство США активнее поддерживать развитие американских моделей, чтобы не уступить Китаю в гонке ИИ.