Google анонсировала серию новых функций для создателей, разработчиков и обычных пользователей на I/O 2025.
В центре внимания — генераторы видео и изображений, подписка AI Ultra, платформы XR, новые инструменты для разработчиков и апдейты сервисов.
Veo 3 — новая нейросеть для создания видео теперь умеет генерировать ролики со встроенным звуком, включая фоновую музыку и диалоги. У конкурентов, например у OpenAI Sora, такой функции нет. Сейчас Veo 3 доступна в США для подписчиков Ultra и корпоративных клиентов через Vertex AI.
Одновременно Google выпустила Imagen 4 — улучшенный генератор изображений с высоким качеством, лучшей типографикой и разными форматами. Veo 3 и Imagen 4 уже работают в приложении Gemini, Workspace, Whisk и в новом AI-инструменте для кино Flow. Flow позволяет создавать сложные сцены и целые фильмы с контролем камеры и ракурса, управлением ассетами и смешиванием разных источников контента.
Инструмент Lyria 2 теперь открыт для музыкантов и продюсеров через YouTube Shorts и Vertex AI.
Google запустила новую премиум-подписку AI Ultra за 249,99 долларов в месяц. В нее входит топовый доступ ко всем ИИ-моделям, продвинутые инструменты для исследований, генерация видео и изображений через Veo 3 и Imagen 4, агенты (Project Mariner), YouTube Premium и 30 ТБ облачного хранилища.
Gemini Live — новая функция в приложении Gemini. Она дает поддержку в реальном времени через камеру и демонстрацию экрана — это удобно для технической помощи или планирования мероприятий. Gemini теперь интегрирован в Chrome и может анализировать и кратко пересказывать содержимое сайтов.
В Google Meet появляется AI-перевод в реальном времени, который имитирует интонации и выражения говорящего. Первым делом переводы доступны на английском и испанском для подписчиков Pro и Ultra. Другие языки добавят позже.
Персонализированные смарт-ответы в Gmail теперь строятся на основе истории писем и данных из Drive и пишутся в стиле пользователя. Эта функция доступна только по согласию пользователя.
Из новых инструментов для разработчиков:
- API Gemini поддерживает управление компьютером (Project Mariner), нативный аудиовыход, асинхронные функции и интеграцию внешних инструментов через Model Context Protocol (MCP).
- Добавлены модели Gemma 3n (легкая, мультимодальная для мобильных), MedGemma (для медицины) и SignGemma (для языка жестов).
- Для кода появились: Gemini Code Assist, асинхронный кодинг-агент Jules и UI-генератор Stitch.
SynthID Detector — новый сервис для определения контента, созданного нейросетями. Технология использует невидимые водяные знаки для картинок, текста, аудио и видео. Уже помечено более 10 миллиардов объектов. Google рассчитывает, что это поможет противодействовать фейкам и повысит прозрачность.
Android XR — новая платформа для устройств дополненной и смешанной реальности. С интеграцией Gemini пользователи очков и гарнитур XR получат возможности живого перевода, навигации, сообщений и анализа окружающего пространства. Уже есть партнёрства с Gentle Monster и Warby Parker, в этом году выйдет и SDK для разработчиков.