OpenAI предупреждает о рисках безопасности ChatGPT Atlas

Глава отдела безопасности OpenAI Дэйн Стаки сообщил, что новый браузер ChatGPT Atlas может создавать риски для безопасности.

Крупнейшая проблема — атаки через подстановку команд (prompt injection). Злоумышленники скрывают инструкции на сайтах или в письмах, чтобы управлять действиями ИИ-агента. Это может повлиять на покупки пользователя или привести к краже данных, включая содержимое писем и пароли.

Стаки отметил, что OpenAI провела масштабные тесты, применяет новые методы обучения и встроила защитные механизмы. Тем не менее, подстановка команд — это всё ещё нерешённая задача. Для снижения угроз в Atlas добавили режим «без входа», который не даёт доступ к пользовательским данным, и режим «наблюдения» для посещения важных сайтов только под контролем пользователя.

Также Стаки добавил: OpenAI работает над новыми функциями безопасности и ускоренными системами реагирования на такие атаки.

Источник

Оцените статью
Gimal-Ai