Современные языковые модели способны решать сложные головоломки из видеоигр на уровне, требующем продуманного планирования и рассуждений. Такой пример — цветовая головоломка из игры Zelda, в которой смена цвета одной фигуры меняет цвета соседних, а цель — сделать все фигуры синими.
Модели протестировали на этой задаче с использованием скриншота игровой сцены. Google Gemini 3 решил головоломку, несмотря на отсутствие доступа к интернету и измененное начальное состояние. Это показывает, что ответ был рассчитан самой моделью, а не взят из базы данных.
При повторных проверках Gemini 3 Pro чаще всего давал правильный ответ, однако иногда требовал десятки попыток — в некоторых случаях до 42 страниц проб и ошибок. Модель GPT-5.2-Thinking всегда успешно справлялась с задачей без задержек. Claude Opus 4.5 поначалу не справился с интерпретацией картинки, но после дополнительного объяснения использовал математический способ и нашел решение.
Всем моделям был дан одинаковый промт: «На изображении — синие и красные сферы. Кликайте только по сферам, это меняет их цвет и цвет соседних (только по горизонтали и вертикали). Задача — сделать все сферы синими, укажите последовательность кликов.»
Gemini 3 Pro также смог решить вариант задачи c тремя цветами с первого раза. Но тут начальное состояние не менялось, а решение уже было в сети.
Развитие подобных навыков у искусственного интеллекта может полностью заменить руководства, которые пишут люди. Например, Nvidia NitroGen даёт ИИ пройти игру и записать все действия. Затем система передаёт скриншоты и действия редактору, который составляет подробную инструкцию. При успешной работе этот принцип можно применять к любому софту, где требуется документация.






















