Google открыла Deep Research Agent для разработчиков через API

Google представила обновленную версию Deep Research Agent и впервые открыла доступ к нему для разработчиков. Теперь можно встраивать самые продвинутые функции автономного поиска Google прямо в приложения. Изначально агент Deep Research появился в приложении Gemini в конце 2024 года.

Агент строит запросы, анализирует результаты, выявляет пробелы в знаниях и ищет дальше до получения нужного ответа. Новый вариант стал мощнее и немного опережает по качеству веб-поиска даже свежую модель Gemini 3 Pro.

По словам Google, ядро рассуждений агента работает на Gemini 3 Pro и нацелено на снижение ошибок и улучшение качества отчетов при решении сложных задач. Полностью доверять выводам ИИ пока нельзя, однако Deep Research полезен для сбора и анализа источников.

Google сообщает о высоких результатах: 46,4% на полном Humanity’s Last Exam (HLE), 66,1% на новой DeepSearchQA и 59,2% на BrowseComp. Агент оптимизирован для создания глубоких отчетов при меньших тратах ресурсов.

Вместе с обновлением Google выпускает новый открытый бенчмарк DeepSearchQA. Компания отмечает, что старые тесты не отражают всю сложность настоящих многошаговых поисков. В DeepSearchQA собрано 900 цепочек задач в 17 областях, где каждый шаг зависит от предыдущего.

В отличие от привычных тестов на факты, DeepSearchQA оценивает полноту ответа, сочетая точность поиска и полноту извлечения. Бенчмарк работает как диагностический инструмент для оценки масштабного поиска информации. В открытом доступе — набор данных, лидерборд и техническое описание.

У разработчиков появляется доступ к анализу PDF, CSV и других документов, управляемым структурам отчетов, подробным ссылкам на источники и выводам в формате JSON. В будущих обновлениях добавят генерацию графиков и расширят поддержку MCP для нестандартных источников данных.

Скоро новый Deep Research появится в Google Search, NotebookLM, и Google Finance.

Еще одна новинка — Interactions API, стандарт для работы с моделями Gemini 3 Pro и агентами вроде Deep Research. API открыт в публичной бете в Google AI Studio и требует ключ Gemini API. Это новый стандарт интерфейса для работы с ИИ.

Google добавляет: интерфейс generateContent был рассчитан только на простое генерацию текста. К новым возможностям, включая сложные рассуждения и инструменты, нужен отдельный интерфейс. generateContent останется для стандартных задач. Interactions API пока в бете и может измениться.

С новым интерфейсом вводятся функции для сложных агентов: управление состоянием на сервере, понятная структура вложенных сообщений, фоновое выполнение долгих задач и поддержка Model Context Protocol (MCP). MCP ранее был заявлен как ключевая часть облачных сервисов Google.

Источник

Оцените статью
Gimal-Ai