Qwen от Alibaba выпустил новые модели для голоса и фото

Группа Qwen AI от Alibaba представила сразу несколько новых моделей и обновлений.

Новая Qwen3-TTS-Flash создает речь на десяти языках, включая китайский, английский, итальянский и французский. Модель предлагает 17 голосов и поддерживает 9 китайских диалектов. По данным Alibaba, аудиовывод генерируется за 97 миллисекунд.

Для редактирования изображений появилась Qwen Image Edit 2509. Улучшена обработка лиц, товаров и текста, повысилась однородность результатов. Модель умеет работать с несколькими входными изображениями одновременно и поддерживает карты управления, например, карты глубины или границ. Новую версию можно протестировать в Qwen Chat.

Также Qwen запустила Qwen3Guard — новую модель для модерации контента. Она бывает в трех вариантах (0.6B, 4B, 8B) и проверяет контент на 119 языках. Qwen3Guard находит нарушающий правила материал в реальном времени (Qwen3Guard stream) или анализирует общий контекст (Qwen3Guard gene), деля информацию на безопасную, спорную или небезопасную.

Среди других обновлений — более быстрая версия Qwen3-Next и новая мультимодальная модель Qwen3-Omni.

Источник

Оцените статью
Gimal-Ai