Открытая модель Hunyuan-A13B от Tencent с быстрым и медленным выводом

Tencent представила новый языковой ИИ Hunyuan-A13B с открытым исходным кодом и возможностью «переключения» между быстрым и глубоким режимом рассуждения — в зависимости от сложности задачи.

Главная особенность Hunyuan-A13B — умение в реальном времени менять глубину рассуждения. Для простых запросов — быстрый режим, обеспечивающий мгновенный ответ при минимальных вычислениях. Для сложных задач включается глубокий многошаговый подход. Управлять этим можно с помощью команд: “/think” включает расширенный режим мышления, “/no_think” — отключает.

Модель построена на архитектуре MoE (Mixture of Experts) и использует 80 миллиардов общих параметров, из которых только 13 миллиардов активны на этапе вывода. Поддерживается окно контекста до 256 тысяч токенов.

В техническом отчёте Tencent говорится, что Hunyuan-A13B обучалась на 20 триллионах токенов, дополнительно «донастраивалась» для задач рассуждения и расширялась для более широкого спектра запросов. Компания собрала 250 миллиардов STEM-токенов для повышения точности на научных задачах.

В набор обучающих данных входят учебники по математике, экзамены, открытый код с Github, задачи на логику и научные тексты разных уровней — от школьного до университетского.

По заявлению Tencent, Hunyuan-A13B-Instruct может конкурировать с ведущими ИИ от OpenAI, Deepseek и Qwen от Alibaba. На конкурсе AIME 2024 модель якобы достигла точности 87,3 процента, тогда как OpenAI o1 — 74,3 процента. Однако сравнение с результатами за 2025 год показывает: преимущество не всегда однозначно — в этом раунде o1 лидирует почти на три процента. К тому же, Tencent сравнивает свой ИИ с устаревшей январской версией Deepseek-R1, хотя майская версия заметно превзошла AIME 2024 и 2025 (91,4 и 87,5 баллов соответственно).

Компания утверждает, что Hunyuan-A13B хорошо решает задачи автоматизации и работы с инструментами. Во внутренних тестах A13B заняла первое место почти во всех агентных бенчмарках. Даже в длинных задачах на 128 000 токенов Hunyuan-A13B опережает Deepseek-R1 и Qwen3-A22B, но уступает Gemini 2.5 Pro.

ИИ доступен по лицензии Apache 2.0 на Hugging Face и GitHub, есть готовые Docker-образы для разных платформ. Доступ к API реализован через Tencent Cloud и браузерную демо-версию.

Tencent выпустила и два новых бенчмарка: ArtifactsBench (для генерации кода) и C3-Bench (для оценки агентных задач).

Динамическая стратегия рассуждения Tencent соответствует трендам лидеров индустрии. Похожий подход к переключению режимов применяют модели вроде Claude 3.7 Sonnet и Qwen3.

Переход Tencent к языковым моделям продолжает линейку продуктов после генерации видео. В декабре 2024 года компания запустила HunyuanVideo, а в марте — Hunyuan-T1, сфокусированную на рассуждениях LLM, которая, по словам Tencent, уже сравнялась с OpenAI o1 по производительности.

Источник

Оцените статью
Gimal-Ai