Google DeepMind представила модель Lyria 3, которая создаёт 30-секундные музыкальные треки с вокалом, текстом и обложкой по простому текстовому описанию или на основе загруженных медиафайлов.
Пользователь может задать жанр, настроение или описать личный опыт, после чего Gemini генерирует готовый стереотрек с частотой 48 кГц. По сравнению с предыдущими версиями Lyria, новая модель сама пишет тексты песен, даёт больше контроля над стилем, голосом и темпом и создаёт более сложные с музыкальной точки зрения композиции. Также система умеет работать с загруженными фото и видео как с входными данными.
По данным Google, функция уже доступна на десктопе и появится в мобильном приложении в ближайшие дни. Ей могут пользоваться все пользователи старше 18 лет на восьми языках, включая немецкий и английский. Подписчики Google AI Plus, Pro и Ultra получают повышенные лимиты использования. Компания пока не уточняет, в каких странах именно функция уже работает в приложении Gemini.
Если в запросе упоминается конкретный артист, Gemini должен использовать его стиль лишь как свободное вдохновение, а не копировать. В Google подчёркивают, что «создание музыки с помощью Lyria 3 предназначено для оригинального самовыражения, а не для подражания существующим артистам». Генерируемые треки сравниваются фильтрами с уже существующим контентом, а пользователи могут пожаловаться на возможные нарушения. Каждый трек получает водяной знак SynthID, который отмечает его как созданный ИИ.
Компания отдельно прорабатывает тему авторских прав и позиционирует функцию как развлекательную. Это связано с быстрым прогрессом в генерации музыки на базе ИИ, первыми хитами в стриминге и юридическими претензиями со стороны Sony Music и других лейблов. Автор материала отмечает, что Lyria 3 выглядит слабее Suno и ограничена функциональностью платформы и лимитом в 30 секунд, но при этом в ряде случаев звучит достаточно правдоподобно и может восприниматься как человеческая запись.
Сообщается, что OpenAI разрабатывает генератор музыки для ChatGPT. Пока что Suno остаётся единственным массово доступным сервисом с высоким качеством генерации. Конкурент Suno, сервис Udio, был приобретён Universal в конце прошлого года и формально доступен, однако его платформа, по оценке автора, заметно не развивается.
Источник: The Decoder.






















