Anthropic запускает голосовой режим в мобильных приложениях Claude. Теперь пользователи могут говорить с искусственным интеллектом вслух. На старте функция работает только на английском языке.
Голосовой режим предназначен для ситуаций, когда использовать руки неудобно: готовка, тренировка, занятия вне дома. Включить его можно с помощью новой иконки «волна» рядом с микрофоном в чате. В наличии пять разных голосов на выбор.
Функция работает на последней версии Claude Sonnet 4. Во время разговора на экране появляются основные пункты ответа в реальном времени.
Пользователь может свободно переходить между голосовым и текстовым вводом — контекст сохраняется. После беседы сохраняются расшифровка и краткое содержание чата, вернуться к ним можно позднее.
Подписчики получают дополнения: платные пользователи могут использовать голосовой режим для доступа к контенту из Google Calendar и Gmail. Подключение Google Docs работает только для корпоративных аккаунтов.
Anthropic советует использовать тихое помещение и говорить в обычном темпе. Для сложных вопросов лучше разбивать их на простые.
Есть ограничения для бесплатных аккаунтов — 20–30 голосовых сообщений за сессию. После достижения лимита нужно подождать или перейти на платный тариф. В корпоративной версии администраторы могут отключать голосовой режим для компании.
Функция появится у всех пользователей в ближайшие недели.
Anthropic отмечает, что безопасность была приоритетом при создании голосового режима. Доступные голоса фиксированы, чтобы не имитировать живых людей. Claude не копирует чужую речь или характеры, все ответы уникальны. Это отличает сервис на фоне скандала с OpenAI — один из голосов ChatGPT был удалён после жалоб на схожесть с актрисой Скарлетт Йоханссон из фильма «Она».
Голосовой режим в Claude появился спустя несколько месяцев после аналогичных запусков у OpenAI и Google. В мае 2024 года OpenAI добавила Advanced Voice Mode для ChatGPT Plus, Google тоже представила голосовые функции на своей конференции.
Ранее Anthropic больше концентрировалась на корпоративных сервисах, запуск голосового режима указывает на интерес к простым пользовательским инструментам. Даже если нейросеть обходит конкурентов по качеству, большинству пользователей важны удобные интерфейсы, такие как голосовое и живое общение.