GitHub запустил экспериментальный режим Rubber Duck в GitHub Copilot CLI. Это вспомогательный агент, который выступает независимым ревьюером для кодирующих агентов и помогает повысить качество их решений.
Rubber Duck использует вторую языковую модель из другой линейки, чтобы проверять планы и результаты основного агента в ключевые моменты разработки. Идея в том, что дополнительная модель видит иные типы ошибок, так как у неё другие обучающие данные и иные системные ограничения.
Сейчас Rubber Duck подключается, когда пользователь выбирает модель Claude в качестве оркестратора в Copilot CLI. В этом случае Rubber Duck работает на GPT-5.4. GitHub также тестирует другие сочетания: разные модели для основного агента и для Rubber Duck.
Команда GitHub протестировала Rubber Duck на бенчмарке SWE-Bench Pro, который состоит из сложных реальных задач из открытых репозиториев. Пара Claude Sonnet 4.6 + Rubber Duck (GPT-5.4) показала результат, близкий к работе Claude Opus 4.6 в одиночку, сократив 74,7% разрыва в качестве между Sonnet и Opus.
На задачах, затрагивающих три и более файлов и требующих более 70 шагов, связка Sonnet + Rubber Duck показала прирост точности на 3,8% по сравнению с базовым Sonnet, а на самых сложных задачах прирост достиг 4,8%. Rubber Duck в таких случаях выявляет упущенные детали, сомнительные предположения и нестандартные сценарии, которые основной агент не учёл.
GitHub Copilot может вызывать Rubber Duck автоматически и по запросу пользователя. Автоматические запросы критики выполняются в контрольных точках, где обратная связь приносит наибольшую пользу, например при формировании планов или на сложных этапах реализации. Если агент зациклился или не может продвинуться, он также может обратиться к Rubber Duck для разблокировки ситуации.
Разработчик может вручную запросить критику в любой момент. В этом случае Copilot отправляет запрос Rubber Duck, анализирует полученные замечания и показывает, какие изменения были внесены и почему.
GitHub подчёркивает, что сделал важный выбор в дизайне: Rubber Duck вызывается редко и только там, где это даёт максимальный эффект, чтобы не мешать основному рабочему процессу. Технически Rubber Duck подключается через существующий task tool в Copilot, ту же инфраструктуру, которую GitHub использует для других подагентов.
Сейчас Rubber Duck доступен для всех моделей семейства Claude (Opus, Sonnet и Haiku), если они используются как оркестраторы. В компании уже тестируют и другие комбинации, где GPT-5.4 выступает оркестратором, а Rubber Duck построен на иной модели.
Rubber Duck уже доступен в экспериментальном режиме в GitHub Copilot CLI. Чтобы попробовать функцию, нужно установить Copilot CLI и выполнить команду /experimental. Rubber Duck появится при выборе любой модели Claude и при наличии доступа к GPT-5.4. Замечания и критика будут появляться автоматически в нужные моменты и по запросу пользователя.
Источник: анонс GitHub Copilot CLI с описанием Rubber Duck и результатов тестирования на SWE-Bench Pro.






















