OpenAI обновила голосовые возможности ChatGPT для подписчиков. Теперь речь ИИ стала более естественной и выразительной.
По данным OpenAI, переработанный “Расширенный голосовой режим” делает речь плавнее, улучшает интонацию и паузы, а также помогает передавать такие эмоции как сочувствие или сарказм.
Добавили возможность перевода в реальном времени. Теперь ChatGPT может переводить разговор с двух сторон, пока пользователь не отключит функцию. OpenAI отмечает, что это удобно, например, для заказов в ресторане или переговоров на работе.
Платные пользователи получат доступ ко всем новым возможностям на всех устройствах через значок языка в чате.
Есть проблемы. Компания отмечает, что иногда могут возникать скачки громкости или высоты звука, особенно у отдельных голосов.
Также наблюдаются “галлюцинации”: ChatGPT может внезапно издавать странные звуки, фрагменты рекламы, случайные шумы или фоновую музыку. В одном случае пользователь сообщил о включении рекламы во время чата, хотя OpenAI не размещает рекламу. В OpenAI добавили: “Такие сбои все еще могут встречаться, и мы продолжаем работать над их устранением”.
OpenAI представила расширенный голосовой режим в мае 2024 года, а в октябре он стал доступен и в ЕС. В режиме диалога пользователь может перебивать ИИ и выражать эмоции, а если включить камеру — ChatGPT сможет комментировать происходящее вокруг. Похожие функции доступны и в приложении Gemini от Google.