MiniMax Hailuo 02 обошёл Google Veo 3 по отзывам пользователей

MiniMax представила Hailuo 02 — второе поколение своего видеогенерирующего ИИ. Новая версия получила улучшения в работе и стоимости.

Модель построена на архитектуре Noise-aware Compute Redistribution (NCR). По словам MiniMax, NCR увеличивает эффективность обучения и вывода в 2,5 раза. В начале обучения, когда к данным добавляют много искусственного шума, видео максимально сжимают. На следующих этапах, когда видео становятся чище, их обрабатывают в полном разрешении.

По сравнению с предыдущей версией, Hailuo 02 содержит в 3 раза больше параметров и в 4 раза больше обучающих данных, виды данных и их качество также улучшились. Точные числа компания не раскрыла.

MiniMax утверждает, что Hailuo 02 заметно лучше справляется со сложными запросами и имитацией физических процессов. Компания заявляет: это единственный ИИ, который точно создает сложные сцены, например, гимнастические упражнения. «Мы считаем, что это единственная модель, выдающая настолько сложные результаты», — сообщили в MiniMax.

Hailuo 02 доступен в трех вариантах: 768p на шесть секунд, 768p на десять секунд и 1080p на шесть секунд. Прошлая версия поддерживала только 720p с длительностью шесть секунд, 25 кадров в секунду.

В пользовательском рейтинге Artificial Analysis Video Arena Hailuo 02 заняла второе место в категории image-to-video. Модель уступила только Seedance от Bytedance и обошла Google Veo 3. При этом Veo 3 в этой версии не поддерживает звук, что считается ключевой функцией.

С момента тестового запуска в августе 2023 года пользователи создали более 3,7 миллиарда видео на платформе Hailuo, отмечают в MiniMax. Компания признаёт: старт был случайным, но интерес быстро стал глобальным.

Работать с Hailuo 02 можно через веб, мобильное приложение или API. Создание шестисекундного ролика 768p через API стоит 0,28 доллара, а 1080p — 0,49 доллара. Для сравнения, у Google Veo 3 за восьмисекундное видео 1080p цена может доходить до 3 долларов.

MiniMax планирует ускорить генерацию видео, повысить стабильность, а также добавить новые функции сверх текущих text-to-video и image-to-video. Платформы-конкуренты, например Runway, уже поддерживают движения камеры и другие функции.

Запуск Hailuo 02 проходит в рамках «MiniMax Week» — серии анонсов, где компания также представила открытый языковой ИИ MiniMax-M1 с подробным описанием параметров. Для Hailuo 02 технических подробностей пока нет.

Источник

Оцените статью
Gimal-Ai