Китайский стартап Deepseek сообщил, что их новая модель DeepseekMath-V2 достигла уровня “золотой медали” на Международной математической олимпиаде, что удерживает компанию в плотной конкуренции с западными AI-лабораториями.
По информации Deepseek, DeepseekMath-V2 показала результат “золотой медали” на Международной математической олимпиаде 2025 года и на китайской олимпиаде CMO 2024. В соревновании Putnam модель набрала 118 из 120 баллов, превзойдя лучший человеческий результат в 90 баллов.
В техдокументации Deepseek отмечает, что прежние AI часто давали правильный итоговый ответ, но не показывали верный ход решения. В новой модели применяется многоэтапный процесс проверки: “верификатор” оценивает доказательство, а “мета-верификатор” проверяет обоснованность замечаний. Такая схема позволяет системе проверять и дополнять свои решения самостоятельно.
В публикации не упоминается использование внешних инструментов вроде калькуляторов или интерпретаторов кода — все результаты получены с помощью обработки естественного языка.
В экспериментах одна и та же модель DeepseekMath-V2 отвечает сразу за генерацию решения и его проверку. Высокая точность достигается благодаря способности самой модели критиковать и дорабатывать свои доказательства, а не с помощью стороннего математического ПО.
Для сложных задач система увеличивает вычисления, параллельно генерируя и проверяя много вариантов решения, чтобы получить уверенный результат. В основе модели лежит Deepseek-V3.2-Exp-Base.
Релиз DeepseekMath-V2 последовал за похожими новостями от OpenAI и Google Deepmind: их модели тоже получили “золото” на IMO, хотя ранее считалось, что LLM-ы к этому не способны. Согласно сообщениям, эти достижения основаны на общем уровне рассуждений, а не на специальных настройках под олимпиаду.
Если успехи подтвердятся, языковые модели начинают справляться с задачами, которые раньше считались исключительно “человеческими”. Пока же детали моделей почти не раскрыты. Один из исследователей OpenAI недавно отметил, что еще более мощная версия их математической модели выйдет в ближайшие месяцы.
Отличие Deepseek — открытое описание технических деталей своей разработки, тогда как американские конкуренты держат архитектуру в секрете. Deepseek демонстрирует, что идет вровень с лидерами отрасли.
Такая открытость — еще и способ конкурировать с западными AI-компаниями. Как пишет The Economist, многие американские стартапы уже выбирают китайские open-source модели для экономии.
Однако здесь есть и политический аспект: по мере того, как такие системы становятся мощнее, их разработка все чаще обсуждается на государственном уровне, что может дополнительно усилить позиции американских лабораторий. Стремясь к лидерству, Deepseek параллельно помогает OpenAI и другим оправдывать быстрые темпы развития.






















