Компания Google расширила семейство моделей Gemini 2.0, добавив три новых варианта: Flash, Flash-Lite и Pro. Эти модели отличаются балансом между производительностью и стоимостью.
Основная версия Gemini 2.0 Flash, запущенная в декабре, теперь доступна для всех с повышенными лимитами запросов и улучшенной производительностью. Также Google представил Flash-Lite – более экономичный вариант для разработчиков, который пока доступен в публичном предварительном просмотре через API.
Флагманской моделью в этом релизе является Gemini 2.0 Pro, ориентированная на сложные запросы и задачи, включая программирование. Ее контекстное окно расширено до 2 миллионов токенов, что вдвое больше, чем у Flash-версий.
Пока все три модели поддерживают только текстовый вывод, но Google планирует добавить изображения, аудио и видео в Flash и Pro в ближайшие месяцы. Однако они уже могут обрабатывать изображения и аудио в качестве входных данных.
Также Google тестирует Flash Thinking, который выполняет дополнительные этапы рассуждения перед генерацией ответа, аналогично OpenAI o3 и Deepseek-R1. Эти модели смогут использовать YouTube, Google Maps и Google Search для поиска информации. О версии Gemini 2.0 Ultra в объявлении не упоминалось.
Производительность Gemini 2.0 Pro
По данным Google, Gemini 2.0 Pro опережает предшественников практически по всем тестам. В частности:
- 91,8% на MATH и 65,2% на HiddenMath, что значительно выше, чем у Flash-версий.
- В тесте SimpleQA от OpenAI модель набрала 44,3%, а Gemini 2.0 Flash – 29,9%. Для сравнения, Deepseek-R1 – 30,1%, а o3-mini-high – 13,8%.
Кроме того, Google изменил модель ценообразования API, убрав разницу между короткими и длинными запросами. Теперь обработка смешанных данных (текст + изображения) может стоить дешевле, чем в версии Gemini 1.5 Flash, несмотря на улучшенную производительность.
При этом Gemini 2.0 Flash оказался дороже своего предшественника, но новый Flash-Lite стоит столько же, сколько 1.5 Flash, и показывает лучшие результаты. Насколько модели соответствуют реальным задачам, покажут практические тесты.