Китайская компания Moonshot AI представила Kimi-K2 — новый языковой ИИ с открытыми весами, претендующий на уровень моделей Claude Sonnet 4 и GPT-4.1. В модели отсутствует отдельный модуль “рассуждений”, и это сравнивают с запуском Deepseek.
Moonshot AI основана в 2023 году. Модель Kimi-K2 собрана на принципе mixture-of-experts и содержит 1 триллион параметров, из которых 32 миллиарда активируются для каждого запроса. Открытые веса позволяют использовать Kimi-K2 для исследований, обучения и кастомизации.
В публичных тестах LLM Kimi-K2-Instruct (оптимизированная для прикладных задач) набирает баллы на уровне лучших закрытых моделей. По SWE-bench Verified Kimi-K2-Instruct получает 65,8% в режиме агента — чуть ниже Claude Sonnet 4, но заметно выше GPT-4.1 (54,6%). Этот тест оценивает способность модели находить и исправлять реальные ошибки в коде проектов с открытым исходным кодом.
На LiveCodeBench (53,7%) и OJBench (27,1%) Kimi-K2 тоже лидирует среди подобных моделей даже без специального модуля рассуждений. Эти тесты проверяют, как хорошо языковые модели справляются с программированием: LiveCodeBench — в интерактивной форме, OJBench — как в олимпиадах по программированию.
В задачах по математике и наукам Kimi-K2 также показывает лучшие результаты. На AIME, GPQA-Diamond и MATH-500 она опережает конкурентов. В многоязычных тестах вроде MMLU-Pro — среди лидеров. Демонстрации программирования модель выкладывает в X.
В неофициальном тесте Симона Уиллисона Kimi-K2 успешно сгенерировала SVG-пеликан на велосипеде — задача, с которой другие LLM обычно не справляются, выдавая только абстрактные фигуры.
Moonshot AI заявляет, что Kimi-K2 специально создана для “агентных” приложений. Модель умеет выполнять команды, вызывать внешние инструменты, генерировать и проверять код, а также работать с многошаговыми задачами самостоятельно.
В одном из примеров Kimi-K2 анализировала зарплатные данные по удалённой работе, проводила статистические оценки и создала интерактивную HTML-страницу с персонализированными рекомендациями — за один агентный сеанс.
Особенность Kimi-K2 — обучение с акцентом на агентные сценарии и работу с инструментами через обучение с подкреплением. По оценке сторонних экспертов, модель не обучалась явному “рассуждению” с цепочками шагов на математике или программировании. Это показывает, что для реальных агентных задач навыки работы с инструментами ценнее классического “рассуждения”.
Есть и ограничения. При слишком сложных задачах или неясных требованиях к инструментам Kimi-K2 иногда выдаёт длинные или неполные ответы. В затяжных сессиях агент справляется лучше, чем в разовых вопросах.
Модель обучалась на 15,5 трлн токенов с использованием нового алгоритма MuonClip, который регулярно масштабирует важные компоненты внимания. Это позволило сделать тренировку стабильной и избежать срывов — редкость на таком масштабе.
Алгоритм MuonClip заменяет популярный AdamW и, по словам разработчиков, «значительно превосходит» его. MuonClip переоценивает, как корректировать параметры модели на каждом шаге, чтобы снизить ошибки, что критично при обучении ИИ такого размера.
Kimi-K2 выпускается в вариантах Base (для исследований и кастомизации) и Instruct (для чатов и агент-приложений). Модели доступны через OpenAI-совместимый API на платформе Moonshot AI. Тарифы: $0.15 за миллион входных токенов (cache hit), $0.60 (cache miss), $2.50 за миллион токенов на выходе.
Самостоятельно Kimi-K2 можно запускать на vLLM, SGLang, KTransformers или TensorRT-LLM. Инструкции по установке — в официальном репозитории GitHub.
Лицензия основывается на MIT, но если использовать модель в продукте с более чем 100 миллионами пользователей или более $20 млн выручки в месяц, название “Kimi K2” должно быть видно в интерфейсе.
Работа Kimi-K2 требует мощного железа: для локального запуска понадобится несколько GPU NVIDIA B200 или подобная связка на архитектуре Hopper. По словам разработчика Apple MLX Авни Ханнуна, 4-битную версию можно запустить на двух Apple M3 Ultra с 512 ГБ ОЗУ.
Ранее в этом году Moonshot AI выпустила агент ИИ с результатами на уровне OpenAI o1 и сильную модель для работы с изображениями.
Подробности о возможностях Kimi-K2, её обучении и оптимизаторе MuonClip уточнены в процессе обновления этой публикации.






















