Канадская компания Cohere выпустила Transcribe — новую open-source-модель для автоматического распознавания речи.
По данным компании, модель заняла первое место в рейтинге Hugging Face Open ASR Leaderboard. Средний уровень ошибок в словах составил 5,42%, что лучше показателей OpenAI Whisper Large v3, ElevenLabs Scribe v2 и Qwen3-ASR-1.7B.
Cohere также заявляет, что Transcribe показывает лучшую пропускную способность по сравнению с моделями сопоставимого размера. В опубликованном компанией сравнении учитывались скорость работы и уровень ошибок: лучшие результаты у моделей, расположенных ближе к верхнему левому углу графика.
Модель имеет 2 млрд параметров и поддерживает 14 языков, включая английский, немецкий, французский и японский.
Transcribe доступна для скачивания на Hugging Face по лицензии Apache 2.0. Ещё к ней можно получить доступ через API Cohere и платформу Model Vault.
В будущем Cohere планирует встроить Transcribe в платформу ИИ-агентов North.
Источник: The Decoder, Cohere.





















