Gemini 2.5 Pro Experimental стал первой моделью в новой линейке и уже занимает первое место в рейтинге LMArena, опережая конкурентов по качеству ответов. Модель показывает отличные результаты в задачах на логику, программирование и математику.
Google называет Gemini 2.5 «мыслящей моделью» — она может анализировать свои действия перед тем, как ответить, что улучшает точность и глубину ответа. Эти способности строятся на методах вроде chain-of-thought prompting и усилились в новой версии благодаря улучшенному постобучению.
На тестах без дополнительных вспомогательных техник, вроде majority voting, Gemini 2.5 Pro лидирует по таким метрикам, как GPQA и AIME 2025. Также модель набрала 18,8% на Humanity’s Last Exam — сложнейшем тесте на мышление, созданном сотнями экспертов.
В области программирования Gemini 2.5 Pro делает большой шаг вперёд по сравнению с версией 2.0. Она способна создавать веб-приложения, игровые проекты и агенты по коротким подсказкам, а также редактировать и преобразовывать код. В тесте SWE-Bench Verified она набрала 63,8% с использованием собственного агентного окружения.
Модель поддерживает до миллиона токенов контекста (2 млн — скоро) и умеет обрабатывать текст, изображения, аудио, видео и большие объёмы кода. Сейчас Gemini 2.5 Pro доступна в Google AI Studio и приложении Gemini (для пользователей Gemini Advanced), а в ближайшее время появится и в Vertex AI.