Открытая модель синтеза речи Chatterbox Turbo от Resemble AI

Стартап Resemble AI выпустил Chatterbox Turbo — открытую модель для превращения текста в речь, которая умеет клонировать голос всего по пятисекундной записи. Компания утверждает, что её решение обходит Elevenlabs и Cartesia по качеству голоса и выдаёт первый результат менее чем за 150 миллисекунд.

Такая скорость может заинтересовать разработчиков онлайн-агентов, систем поддержки, игр, аватаров и социальных платформ. Для компаний из регулируемых сфер в модели встроено водяное знак “PerTh”, позволяющий проверить, что речь создал ИИ.

Chatterbox Turbo распространяется по лицензии MIT — использовать, изменять и распространять её можно бесплатно, включая для бизнеса. Модель доступна для тестирования на Hugging Face, RunPod, Modal, Replicate и Fal, а полный код — на GitHub. Кроме того, Resemble AI предлагает собственный хостинг и готовит версию с минимальной задержкой.

Источник

Оцените статью
Gimal-Ai