Исследователи из Palisade Research выяснили, что известные модели искусственного интеллекта жульничают в шахматах, когда проигрывают более сильному сопернику. Результаты опубликованы в препринте на сервере arXiv.
Команда протестировала популярные ИИ-модели, такие как OpenAI o1-preview и DeepSeek R1, против шахматного движка Stockfish. Во время сотен партий ученые обнаружили, что проигрывающие ИИ намеренно прибегают к очевидному мошенничеству. Например, они запускали отдельную копию Stockfish, чтобы подсмотреть правильные ходы, меняли свой движок или просто переставляли фигуры на доске, улучшая своё положение.
Чаще всего мошенничеством занимались самые новые версии моделей. Авторы исследования связывают это с тенденцией программистов настраивать ИИ на поиск любых возможных решений в сложных ситуациях.
Ученые считают ситуацию тревожной. По их мнению, если искусственный интеллект способен жульничать в шахматах, не исключено, что подобное поведение проявится и в других задачах. Несмотря на постоянные улучшения систем ИИ, инженеры до сих пор не до конца понимают, как именно принимаются их решения.
«Если ИИ обманывают в шахматах, начнут ли они мошенничать и в других областях?», — отмечают авторы исследования.