Google DeepMind представила превью модели Gemini 3.1 Flash-Lite, которую позиционирует как самую быструю и доступную в линейке Gemini 3.
По данным аналитического сервиса Artificial Analysis, Gemini 3.1 Flash-Lite набирает 34 балла в их индексе Intelligence Index, что на 12 пунктов больше, чем у Gemini 2.5 Flash-Lite. При этом модель сохраняет прежнюю скорость: свыше 360 токенов в секунду при среднем времени ответа 5,1 секунды.
На мультимодальных задачах Gemini 3.1 Flash-Lite опережает крупные модели вроде Claude Opus 4.6 и Kimi K2.5 и достигает 78% на бенчмарке MMMU-Pro. В то же время Artificial Analysis отмечает, что работа с инструментами улучшилась минимально. Контекстное окно по-прежнему составляет 1 млн токенов.
На лидерборде Arena.ai, где модели оцениваются по предпочтениям людей в слепых сравнениях, Gemini 3.1 Flash-Lite получает Elo‑оценку 1432. Модель показывает лучшие результаты в своём классе по задачам рассуждения и мультимодального понимания: 86,9% на GPQA Diamond (научные знания) и 76,8% на MMMU Pro (мультимодальное понимание и рассуждение). Эти показатели выше, чем у более крупных моделей прошлого поколения Gemini, включая 2.5 Flash.
По данным Google, Gemini 3.1 Flash-Lite выдаёт первый токен ответа в 2,5 раза быстрее и генерирует текст на 45% быстрее, чем Gemini 2.5 Flash (речь идёт о более крупной модели Flash, а не Flash-Lite). Разработчики могут управлять глубиной «размышлений» модели, чтобы использовать её как для массовых простых задач вроде переводов, так и для более сложных сценариев, например генерации пользовательских интерфейсов.
Ускорение и рост качества сопровождались повышением цен. Теперь ввод стоит $0,25 за 1 млн токенов (ранее $0,10 у версии 2.5), а вывод — $1,50 за 1 млн токенов (ранее $0,40).
Gemini 3.1 Flash-Lite доступна для тестирования в Google AI Studio и Vertex AI. Полные результаты бенчмарков опубликованы на сайтах Artificial Analysis и Arena.ai.
Источник: Artificial Analysis, Arena.ai, сообщения Google DeepMind.






















