Математик Теренс Тао сообщил о значимом успехе в применении искусственного интеллекта для решения математических задач. ChatGPT смог решить задачу №728 из списка Эрдёша “почти автономно”, ограничившись минимальной обратной связью и не используя готовые решения.
Это отличие от предыдущих случаев, когда ИИ просто находил уже существовавшие решения с помощью поиска в литературе. На этот раз GPT-5.2 Pro от OpenAI сгенерировал доказательство ужесточенной версии задачи, а другой инструмент — Aristotle — автоматически перевел это доказательство в формальный язык Lean для проверки корректности. В процедуре были незначительные ошибки, которые Aristotle автоматически исправил.
По словам Тао, главное отличие — скорость подготовки и доработки математического текста с помощью ИИ. Члены сообщества использовали разные инструменты, чтобы перевести формальное доказательство на обычный язык, исправить недочеты и увязать его с другими исследованиями. В результате, по мнению Тао, финальная версия оказалась «достаточно читаемой, чтобы следить за основными идеями». Он отмечает: «Это явный контраст с текущей практикой, когда создание одного читаемого рукописного текста требует много времени».
Однако Тао советует не переоценивать успех: задачи Эрдёша очень разные по уровню сложности, и многие простые задачи толком не разбирались математиками. Если задача пролежала 50 лет нерешённой, а теперь её решил ИИ — скорее всего, её просто никто всерьёз не пытался решить. Также уже были ситуации, когда ИИ «решал» задачу, а потом кто-то находил уже опубликованное решение. Тао отмечает, что об ошибках систем редко сообщают, и это искажает данные о результативности ИИ.
В Mastodon Тао заметил: чем больше ИИ участвует в решении, тем проще бывает найденное доказательство. Это связано с особенностями работы ИИ — они эффективнее в автоматизации рутинных и малоизвестных задач, где часто встречаются простые решения.
Сложные задачи требуют совместной работы человека и ИИ: модель берёт на себя расчёты или отдельные шаги, а человек продумывает общую стратегию. Тао оценивает: только 1–2% открытых задач Эрдёша достаточно просты, чтобы ИИ мог справиться с минимальной помощью человека.






















