Chatterbox — бесплатная модель озвучки с управлением эмоциями

Resemble AI представила Chatterbox — бесплатную голосовую нейросеть с открытым кодом, которая работает на компьютере пользователя и поддерживает настройку эмоций, таких как “драматичный” или “монотонный”.

Для клонирования голоса нужно всего несколько секунд записи. Синтез занимает менее 200 миллисекунд. Программа работает на Windows, Mac и Linux при наличии 5–6 ГБ видеопамяти.

Во всех созданных голосах есть незаметная метка “PerTh”, чтобы отличать речь, сгенерированную ИИ. По словам Resemble AI, Chatterbox “показал лучшие результаты в слепых тестах”, чем ElevenLabs.

Модель поддерживает только английский язык. Chatterbox выпущен по лицензии MIT и рассчитан на разработчиков. Посмотреть демо можно по Источник.

Оцените статью
Gimal-Ai