Alibaba представила Qwen 3 — новую серию ИИ-моделей, сопоставимых с разработками Google и OpenAI

Qwen 3

Alibaba выпустила Qwen 3 — серию ИИ-моделей, которые по ряду показателей не уступают, а иногда и превосходят решения Google и OpenAI.

Большинство моделей уже есть или скоро появятся для скачивания под открытой лицензией на Hugging Face и GitHub. Объем моделей — от 0,6 до 235 миллиардов параметров. Чем больше параметров, тем выше способности модели решать задачи.

Распространение китайских ИИ-систем, таких как Qwen, усилило конкуренцию с американскими лабораториями, включая OpenAI. Власти разных стран начали вводить ограничения на продажу чипов для обучения ИИ-компаниям из Китая.

По словам Alibaba, Qwen 3 — это гибридные модели. Они могут “думать над сложными запросами” или отвечать гораздо быстрее на простые задачи. Такой режим самопроверки схож с подходом OpenAI o3, но требует больше времени.

В своем блоге команда Qwen отметила: “Мы бесшовно интегрировали режимы мышления и немышления, давая пользователю гибко управлять затратами ресурсов на мышление.”

Qwen 3 поддерживает 119 языков. Модели тренировались на 36 триллионах токенов, что соответствует сочетанию учебников, пар вопрос-ответ, программного кода и других данных.

Alibaba сообщает, что Qwen 3 заметно опережает предыдущую версию Qwen 2. На платформе Codeforces самая крупная модель Qwen-3-235B-A22B обходит o3-mini от OpenAI. Qwen-3-235B-A22B также выигрывает у o3-mini в тестах AIME (математика) и BFCL (умение рассуждать), однако пока эта модель не доступна для публики.

Самая большая публичная модель Qwen3-32B держится наравне с китайской DeepSeek R1 и превосходит модель o1 от OpenAI по ряду тестов, включая LiveBench.

Qwen 3 особенно сильна в интеграции инструментов, выполнении инструкций и копировании форматов данных. Модели доступны для скачивания, а также через облачные сервисы, такие как Fireworks AI и Hyperbolic.

Источник

Оцените статью
Gimal-Ai