Scribe v2 и Gemini возглавили рейтинг AA-WER

Artificial Analysis представила версию 2.0 своего бенчмарка AA-WER для оценки качества систем распознавания речи. В новом тесте лидирует Scribe v2 от ElevenLabs с уровнем ошибок 2,3%, на втором месте Gemini 3 Pro от Google (2,9%), на третьем — Voxtral Small от Mistral (3,0%).

Далее идут Gemini 3 Flash от Google (3,1%) и предыдущая версия ElevenLabs Scribe v1 (3,2%). Отмечается, что Google не проводила отдельное обучение моделей под задачу транскрипции: высокий результат объясняется общими мультимодальными возможностями Gemini.

Открытая модель OpenAI Whisper Large v3 показывает 4,2% ошибок и занимает промежуточные позиции. Замыкают список Qwen3 ASR Flash от Alibaba (5,9%), Amazon Nova 2 Omni (6,0%) и Rev AI (6,1%).

Аналогичная картина наблюдается в отдельном тесте AA-AgentTalk, который оценивает распознавание речи, обращённой к голосовым ассистентам. Здесь лидирует Scribe v2 с 1,6% ошибок, на втором месте Gemini 3 Pro (1,7%), третье место занимает Universal-3 Pro от AssemblyAI (2,3%).

Источник: The Decoder.

Оцените статью
Gimal-Ai