Vercel: AGENTS.md обошёл Skills при обучении ИИ

Компания Vercel провела эксперимент, чтобы выяснить, как дать AI-агентам для программирования доступ к актуальной информации о фреймворках. Оказалось, что эффективнее всего работает простой файл AGENTS.md с постоянным контекстом, а не более сложная система Skills.

AI-агенты зависят от обучающих данных, которые быстро устаревают. После выхода новых API в фреймворках, например в Next.js, агенты начинают генерировать некорректный код или опираются на старые подходы.

Vercel сравнила два подхода: систему Skills, где агент при необходимости запрашивает документацию, и файл AGENTS.md, который хранит сжатый индекс документации и подключается как постоянный контекст. Сжатый AGENTS.md дал 100% успешных решений, тогда как система Skills остановилась на 79%.

В системе Skills знания объединяются в пакеты, которые агент может вызывать по запросу. Предполагалось, что агент поймет, когда ему нужна помощь по фреймворку, активирует нужный skill и получит доступ к документации.

На практике этого почти не происходило. По данным Vercel, в 56% задач агент ни разу не вызвал skill. Документация была доступна, но не использовалась. Итоговый процент успешных решений с включёнными skills совпал с базовым уровнем без какой-либо документации — 53%.

Только прямые указания вроде «обязательно используй skill» подняли частоту вызова skills выше 95% и довели успех до 79%. Однако возникла новая проблема: результат сильно зависел от точной формулировки подсказки. Жёсткая инструкция «You MUST invoke the skill» приводила к потере контекста проекта, тогда как вариант «Сначала проанализируй проект, затем вызови skill» давал более стабильный результат.

Альтернативный подход оказался гораздо проще. Вместо того чтобы полагаться на решения агента, команда встроила сжатый индекс документации прямо в файл AGENTS.md в корне проекта. Этот файл даёт агенту постоянный контекст на каждом шаге, не требуя от него каких-либо дополнительных действий.

Индекс документации объёмом 40 КБ был сжат до 8 КБ без потери качества решений. Агент получает указатель, где лежат нужные разделы документации, даже без передачи полного текста в контекст.

Команда Vercel выделяет три причины, по которым пассивный подход оказался лучше. Во-первых, агенту не нужно принимать решение, так как информация уже присутствует. Во-вторых, контекст AGENTS.md стабильно доступен, так как включается в системный prompt на каждом шаге. В-третьих, исчезают проблемы с порядком действий, которые мешали системе Skills работать стабильно.

При этом Vercel подчёркивает, что Skills остаются полезными. По мнению компании, их лучше применять для узких задач с конкретным действием, например «обнови мою версию Next.js». Для общей справочной информации по фреймворку пассивный контекст AGENTS.md сейчас показывает более высокую эффективность, чем выборочная подгрузка данных по запросу.

Для проектов на Next.js Vercel предлагает готовую команду настройки: npx @next/codemod@canary agents-md. Скрипт определяет установленную версию Next.js, подтягивает соответствующую документацию и добавляет в проект сжатый индекс.

Результаты Vercel подчёркивают растущую роль AGENTS.md, который стал частью более широкой инициативы по стандартам для AI-агентов. В декабре 2025 года Linux Foundation запустил Agentic AI Foundation (AAIF), в который вошли конкурирующие компании OpenAI, Anthropic, Google и Microsoft для выработки общих открытых стандартов.

В основе AAIF лежат три открытых проекта. Model Context Protocol (MCP) от Anthropic связывает модели с внешними источниками данных. Goose от Block выступает как фреймворк для построения процессов работы агентов. AGENTS.md от OpenAI задаёт стандарты для инструкций кода и структуры контекста.

По данным Linux Foundation, AGENTS.md уже используют свыше 60 000 проектов с открытым исходным кодом. Этот формат поддерживают нативно такие фреймворки для агентов, как Cursor, Devin, GitHub Copilot и Gemini CLI.

Тестируемая Vercel система Skills основана на открытом стандарте, который также применяет Anthropic в продуктах Claude. В октябре 2025 года компания представила Skills как модульный механизм, в котором Claude сам определяет, какие специальные инструкции и ресурсы нужны для конкретной задачи.

Источник: The Decoder.

Оцените статью
Gimal-Ai