Голос ChatGPT стал естественнее и переводит в реальном времени

OpenAI обновила голосовые возможности ChatGPT для подписчиков. Теперь речь ИИ стала более естественной и выразительной.

По данным OpenAI, переработанный “Расширенный голосовой режим” делает речь плавнее, улучшает интонацию и паузы, а также помогает передавать такие эмоции как сочувствие или сарказм.

Добавили возможность перевода в реальном времени. Теперь ChatGPT может переводить разговор с двух сторон, пока пользователь не отключит функцию. OpenAI отмечает, что это удобно, например, для заказов в ресторане или переговоров на работе.

Платные пользователи получат доступ ко всем новым возможностям на всех устройствах через значок языка в чате.

Есть проблемы. Компания отмечает, что иногда могут возникать скачки громкости или высоты звука, особенно у отдельных голосов.

Также наблюдаются “галлюцинации”: ChatGPT может внезапно издавать странные звуки, фрагменты рекламы, случайные шумы или фоновую музыку. В одном случае пользователь сообщил о включении рекламы во время чата, хотя OpenAI не размещает рекламу. В OpenAI добавили: “Такие сбои все еще могут встречаться, и мы продолжаем работать над их устранением”.

OpenAI представила расширенный голосовой режим в мае 2024 года, а в октябре он стал доступен и в ЕС. В режиме диалога пользователь может перебивать ИИ и выражать эмоции, а если включить камеру — ChatGPT сможет комментировать происходящее вокруг. Похожие функции доступны и в приложении Gemini от Google.

Источник

Оцените статью
Gimal-Ai