Исследование Google Research, Google DeepMind и MIT показало, что увеличение числа ИИ-агентов не всегда приводит к лучшим результатам. Авторы выделили ситуации, когда использование нескольких агентов помогает, а когда — наоборот ухудшает выполнение задачи.
Учёные провели 180 экспериментов на пяти архитектурах и трёх моделях: OpenAI GPT, Google Gemini и Anthropic Claude. Условия были одинаковыми: те же запросы, инструменты и ограничения на количество токенов. Менялись только структура взаимодействия агентов и возможности модели.
Для финансового анализа, где задачу можно разбить на независимые части, использование централизованной мультиагентной системы дало рост производительности на 80,9%. Разные агенты одновременно анализировали тренды, расходы, рыночные данные, а потом объединяли выводы.
В задачах планирования в Minecraft ситуация обратная: мультиагентный подход ухудшил результаты на 39-70%. Здесь каждое действие влияет на дальнейшее состояние и успех последующих шагов. Последовательные задачи плохо делятся между агентами.
Когда шаги задачи изменяют данные для следующих этапов, возникают сложности: контекст теряется или фрагментируется между агентами. Один агент способен лучше отслеживать динамику и не упускать важные детали.
Задачи с большим количеством инструментов (поиск, работа с файлами, программирование) сильнее всего страдают от мультиагентного распределения ресурсов. В таких случаях каждого агента не хватает на сложную работу с инструментами из-за “деления” лимита токенов.
Важен и уровень успеха. Если один агент решает задачу хотя бы на 45%, добавление новых агентов пользы не приносит. Координация только усложняет работу. Кроме того, ошибки в мультиагентных настройках накапливаются до 17 раз быстрее, чем при использовании одного агента.
Основная рекомендация: использовать единого агента, если он может решить более 45% задачи. Несколько агентов полезны только при чисто независимых частях задачи. Для задач с примерно 16 инструментами лучше справится один агент или децентрализованный подход.
В исследовании OpenAI показал лучшие результаты в гибридных схемах, Anthropic в централизованных, а Google продемонстрировал стабильную работу во всех мультиагентных структурах.
Авторы также разработали систему, которая правильно выбирает стратегию координации в 87% новых случаев. Её называют “количественно предсказуемым принципом масштабирования агентов на основе измеряемых свойств задачи”.
В среднем, один агент справился с 67 задачами на 1000 токенов, централизованные мультиагентные — только с 21, а гибридные — с 14. Главная проблема — цена координации: гибридные системы требуют в шесть раз больше шагов рассуждения.
Вывод для разработчиков: сначала используйте одного агента, переходите к мультиагентной системе только если задача легко делится на части, и успех одного агента ниже 45%.






















