Cohere выпустила open-source ASR-модель Transcribe

Канадская компания Cohere выпустила Transcribe — новую open-source-модель для автоматического распознавания речи.

По данным компании, модель заняла первое место в рейтинге Hugging Face Open ASR Leaderboard. Средний уровень ошибок в словах составил 5,42%, что лучше показателей OpenAI Whisper Large v3, ElevenLabs Scribe v2 и Qwen3-ASR-1.7B.

Cohere также заявляет, что Transcribe показывает лучшую пропускную способность по сравнению с моделями сопоставимого размера. В опубликованном компанией сравнении учитывались скорость работы и уровень ошибок: лучшие результаты у моделей, расположенных ближе к верхнему левому углу графика.

Модель имеет 2 млрд параметров и поддерживает 14 языков, включая английский, немецкий, французский и японский.

Transcribe доступна для скачивания на Hugging Face по лицензии Apache 2.0. Ещё к ней можно получить доступ через API Cohere и платформу Model Vault.

В будущем Cohere планирует встроить Transcribe в платформу ИИ-агентов North.

Источник: The Decoder, Cohere.

Оцените статью
Gimal-Ai