Midjourney представил первую видео-модель для анимации изображений

Midjourney запустила свою первую видео-модель, позволяющую превращать изображения в короткие анимации. Эта функция называется “Image-to-Video” и доступна через новый “Animate” на сайте Midjourney. Можно выбрать автоматический режим, когда анимация создается автоматически, или ручной — пользователь сам описывает, как должна двигаться сцена.

Существует два основных варианта движения. “Low motion” подходит для стабильных кадров и плавных движений, “High motion” — для более динамичных анимаций с активной работой камеры и объектов. При этом Midjourney отмечает, что “High motion” иногда дает менее точные результаты.

Длительность каждой анимации можно увеличивать на четыре секунды, до четырех раз подряд. Описание к изображению (prompt) разрешается менять при каждом продлении ролика.

Можно анимировать не только созданные в Midjourney изображения, но и сторонние — достаточно перетащить их в строку запроса и назначить начальным кадром, после чего ввести желаемое описание движения.

Midjourney пока не раскрывает характеристики разрешения, битрейта или частоты кадров. Нет и функции увеличения качества. Сейчас готовые ролики скачиваются в формате MP4, разрешение — 480p, частота — 24 кадра в секунду.

Видео-режим доступен только через веб-интерфейс Midjourney. Стоимость одной видео-работы примерно в восемь раз выше, чем у статичной картинки, при этом за заказ формируется четыре ролика по пять секунд. По расчетам компании, стоимость примерно в 25 раз ниже аналогичных сервисов.

Для подписчиков с тарифом “Pro” или выше тестируется “Video Relax Mode” — возможность делать ролики без списания минут с лимита быстрого рендеринга, что может снизить цену одной анимации. Midjourney сообщила, что пересмотрит цены с учетом спроса и нагрузки на серверы.

Midjourney считает новую видео-модель промежуточным продуктом. В будущем планируется объединить видео, 3D-элементы и работу в реальном времени на единой платформе. Основатель Дэвид Хольц давно стремится к созданию системы, способной симулировать целые виртуальные миры в реальном времени. Опыт, полученный при создании видео-модели, используют и в других продуктах Midjourney.

На рынке ИИ-видео основной конкурент — Google Veo 3. Эта модель создает видео сразу по текстовому запросу, может добавлять голоса и звуковые эффекты — стартового изображения не требуется.

Тем временем Disney и Universal подали совместный иск против Midjourney, утверждая, что сервис генерирует неразрешенные изображения известных персонажей, например, Дарт Вейдера и миньонов. В иске, направленном в федеральный суд Калифорнии, говорится, что Midjourney неоднократно копировала защищённые авторским правом материалы несмотря на предыдущие предупреждения. Студии требуют компенсацию, разбирательства с присяжными и запрет на дальнейшее использование защищённых образов. Подобные иски против Midjourney идут с 2023 года. Пока компания официально не комментировала ситуацию, также неизвестно, какие видео использовались для обучения новой модели.

Источник

Оцените статью
Gimal-Ai