Google представила Gemini 3 Pro — свой самый «умный» искусственный интеллект на сегодня. По словам CEO Сундара Пичаи и команды Google DeepMind, новая модель дает заметный прирост в логических задачах, мультимодальности и возможностях ИИ-агентов.
Gemini 3 Pro пока доступен в режиме предпросмотра и появится в таких сервисах, как Gemini app, AI Studio, Vertex AI и поисковике Google. В компании отмечают: Gemini 3 Pro еще точнее понимает контекст, дает емкие и четкие ответы, без вежливости ради и шаблонных фраз, только по сути.
Google приводит результаты тестов: модель лидирует в рейтинге LMArena с Elo-оценкой 1501, выдает «уровень PhD» в логике (Humanity’s Last Exam — 37,5%, GPQA Diamond — 91,9%) и опережает Grok 4.1 от xAI. В задачах по математике — 23,4% на MathArena Apex. По мультимодальности — 81% на MMMU-Pro.
Согласно официальной информации, Gemini 3 Pro построена на архитектуре sparse mixture-of-experts transformer. Модель обучалась на большом датасете, включающем открытые данные, лицензионные материалы, синтетические ИИ-данные и информацию пользователей Google-сервисов. Срез знаний — январь 2025 года.
Отличие Gemini 3 — нативная мультимодальность. Модель умеет обрабатывать текст, изображения, видео и звук. В бенчмарке MMMU-Pro — 81%, по Video-MMMU — 87,6%. На тесте ScreenSpot-Pro, где проверяют работу с интерфейсами, результат — 72,7% (лучше, чем Holo2 с 66,1%). Для сравнения: Claude 4.5 Sonnet — 36,2%, GPT-5.1 — 3,5%, у прошлой версии Gemini 2.5 Pro — 11,4%.
Google отмечает, что теперь можно применять Gemini 3 Pro для анализа спортивных видео, генерации кода для визуализаций и создания новых интерактивных макетов в AI-режиме поиска. В Chrome модель будет выполнять роль браузерного ассистента.
Вместе с Gemini 3 Pro появляется режим Deep Think для сложных задач. В тестах он дает 41% на Humanity’s Last Exam и 45,1% на ARC-AGI-2. Google обещает сначала открыть доступ для специалистов по безопасности, затем — для подписчиков Google AI Ultra.
Разработчикам Google предлагает платформу Antigravity — для создания ИИ-агентов, которые смогут работать напрямую с редактором, терминалом и браузером, самостоятельно планируя и проверяя сложные задания.
Отчет аналитиков Artificial Analysis подтверждает заявления Google. Их данные показывают: Gemini 3 Pro опережает GPT-5.1 на три балла по индексу Artificial Analysis Intelligence Index и занимает первые места среди 10 ключевых тестов, включая GPQA Diamond, MMLU-Pro и HLE. Особенно модель сильна в кодировании, агентских задачах и мультимодальном анализе. По объему она сопоставима с Anthropic Opus 4.1.
Стоимость Gemini 3 Pro за миллион токенов: 2 доллара за вход, 12 — за выход (контексты до 200 тысяч токенов). Это дороже Gemini 2.5 Pro (1,25 и 10 долларов) и GPT-5.1 (те же 1,25 и 10), но дешевле Claude 4.5 Sonnet и Grok 4.1 (3 и 15 долларов) и значительно дешевле Claude 4.1 Opus (15 и 75) и GPT-5 Pro (15 и 120). Для больших контекстов (свыше 200 тысяч токенов) — 4 и 18 долларов. Deep Think ещё дороже.
Хотя модель эффективнее по токенам, общая стоимость тестов выросла на 12% по сравнению с прошлой версией. Зато Gemini 3 Pro быстрее — до 128 токенов в секунду, быстрее GPT-5.1.
По точности знаний Gemini 3 Pro показывает 88% (один из лидирующих результатов), но, по данным Artificial Analysis, у модели чаще возникают галлюцинации, чем у конкурентов. В модели от Google точные метрики по галлюцинациям не раскрываются, указано только, что это — известная проблема подобных систем.






















