Исследователи из Шанхайского университета Цзяо Тун представили OpenSeeker — открытого ИИ-агента для многошагового поиска в интернете. Авторы заявляют, что модель показывает результаты на уровне решений Alibaba и других компаний, хотя для обучения понадобилось всего 11 700 примеров и один запуск обучения.
Команда открыла обучающие данные, код и веса модели. По словам авторов, крупные IT-компании обычно не публикуют такие данные, и это тормозит открытую исследовательскую среду уже почти год.
OpenSeeker строится на двух ключевых подходах к генерации данных. Для создания пар «вопрос — ответ» исследователи использовали реальную ссылочную структуру интернета. Система брала случайные стартовые страницы из веб-корпуса объёмом около 68 ГБ английских и 9 ГБ китайских данных, переходила по ссылкам на связанные страницы и извлекала главную информацию.
Затем конкретные имена и термины заменяли на расплывчатые описания. Это делалось для того, чтобы агент не мог найти ответ простым поиском по ключевым словам и был вынужден выполнять многошаговый поиск и рассуждение.
Для отбора вопросов применялся двухэтапный фильтр. Сильная базовая модель не должна была отвечать на них без инструментов, но должна была решать их при наличии полного контекста. Если одно из этих условий не выполнялось, вопрос исключали.
Второй подход связан с тем, как модель учится по траекториям поиска. Веб-страницы содержат много шума, который ухудшает качество записанных шагов решения. Поэтому на этапе генерации данных модель-учитель получала очищенное резюме прошлых результатов поиска и принимала решения на более чистом контексте.
Во время обучения модель-ученик, наоборот, работала с сырыми данными, но должна была воспроизводить качественные решения учителя. Авторы считают, что такой подход заставляет её самостоятельно отделять полезный сигнал от шума.
OpenSeeker основан на Qwen3-30B-A3B. Модель обучили с помощью supervised fine-tuning, без reinforcement learning и без повторных циклов донастройки.
Согласно статье, на китайском бенчмарке BrowseComp-ZH модель набрала 48,4%. Это выше результата Tongyi DeepResearch от Alibaba, который получил 46,7% после трёх этапов: расширенного предварительного обучения, supervised fine-tuning и reinforcement learning.
На англоязычном бенчмарке OpenAI BrowseComp OpenSeeker показал 29,5%. Это почти вдвое выше, чем у DeepDive, прежнего лидера среди полностью открытых агентов, у которого было 15,3%.
Авторы также сравнили OpenSeeker с MiroThinker. Эта модель обучалась на 147 000 примерах, но набрала только 13,8% на BrowseComp-ZH. OpenSeeker показал результат в 3,5 раза выше, используя менее одной двенадцатой от этого объёма данных.
При этом разрыв с сильнейшими закрытыми системами сохраняется. У OpenAI GPT-5-High результат на BrowseComp составляет 54,9%, а у DeepSeek-V3.2 с 671 млрд параметров — 51,4%.
Авторы отмечают, что вопрос доступа к качественным обучающим данным остаётся одним из ключевых для индустрии ИИ. В прошлом году исследовательская команда выпустила Common Pile — текстовый датасет объёмом 8 ТБ из открыто лицензированных источников, но это пока не сильно повлияло на позиции коммерческих моделей.
Источник: The Decoder, исследование OpenSeeker.






















