Google представила модель Gemini 3 Flash, которая делает упор на низкую цену и высокую скорость работы. Компания отмечает: теперь у разработчиков не будет необходимости выбирать между быстродействием и продвинутыми возможностями.
По словам Google, Gemini 3 Flash обеспечивает уровень рассуждения, сравнимый с более дорогими моделями — такими как Gemini 3 Pro, — но стоит значительно дешевле. Теперь можно экономить до 90% за счёт кеширования контекста при повторном использовании токенов, а групповая обработка задач API сокращает расходы на асинхронные задания ещё на 50%.
По анализу Artificial Analysis, Gemini 3 Flash обходит Gemini 2.5 Pro: работает в три раза быстрее и стоит заметно меньше. Google утверждает: даже минимальный уровень “мышления” новой модели часто даёт лучшие результаты, чем максимальные настройки предыдущих версий.
Gemini 3 Flash теперь используется по умолчанию в AI Mode Google Search. Модель лучше понимает намерения пользователей, быстро находит актуальную информацию и добавляет визуальные элементы к ответам. По данным Google, она эффективно решает сложные вопросы, такие как планирование поездки или быстрое обучение новым темам.
Результаты тестов: на PhD-экзамене GPQA Diamond модель набрала 90,4%, на Humanity’s Last Exam — 33,7% в одиночку и 43,5% с помощью поиска и программных инструментов. Математический тест AIME 2025 — 95,2% без инструментов и 99,7% с возможностью выполнения кода. На SWE-bench Verified, сложном бенчмарке для программирования, показан результат 78%, что лучше, чем у Gemini 3 Pro, но ниже GPT-5.2 и Claude Opus 4.5.
Для разработчиков главное — надёжная работа на повседневных задачах. По словам Google, Gemini 3 Flash может тратить меньше токенов на стандартные рабочие нагрузки и гибко регулировать время работы в зависимости от сложности.
Модель стала лучше справляться с визуальными и пространственными задачами, может анализировать видео, запускать код для работы с изображениями: увеличивать картинки, считать объекты и редактировать. Для доступа к этим функциям потребуется включить в API «thought signatures» или использовать новый Interactions API.
Gemini 3 Flash можно использовать через Google AI Studio, Gemini API, Google Antigravity, Gemini CLI и Android Studio. Для бизнеса доступ открыт через Vertex AI. Компания подчёркивает: Gemini CLI полезен тем, кто часто работает в терминале.
Первые клиенты уже начали использовать модель. Например, Astrocade применяет Gemini 3 Flash для генерации планов и кода игр по одному запросу. Ник Уолтон, глава Latitude, говорит: «Модель позволяет нам решать более сложные задачи для игрового ИИ без необходимости платить за дорогие решения вроде Sonnet 4.5». Компания Resemble AI использует модель для обнаружения дипфейков в реальном времени и утверждает, что анализирует мультимедийный контент в 4 раза быстрее, чем раньше.
Недавно Google выпустила отдельный режим “Deep Think” для подписчиков Gemini Ultra. Он работает заметно медленнее, но подходит для параллельной работы с трудными задачами. «Большинство пользователей не готовы ждать ради чуть лучшего ответа», — подчёркивает компания, ссылаясь на опыт OpenAI.






















