Midjourney открыла для тестирования раннюю версию модели V8 на сайте Alpha. Компания просит сообщество проверить новинку в работе и поделиться отзывами.
По словам Midjourney, это принципиально новая модель со своими сильными и слабыми сторонами. В компании предупреждают, что для нее могут понадобиться новые подходы к написанию промптов.
Скорость генерации изображений, как утверждает Midjourney, выросла примерно в пять раз. В обновлении также появился режим –hd с нативным рендерингом в разрешении 2K и режим –q 4, который должен повысить согласованность изображения.
V8 поддерживает несколько соотношений сторон и параметры –chaos, –weird, –exp и –raw. Профили персонализации V7, moodboards и style references, по данным компании, должны сохраняться и оставаться совместимыми с новой версией.
Midjourney заявляет, что V8 заметно лучше следует подробным инструкциям. Компания также говорит об улучшении работы с персонализацией, style references и moodboards, а также о более цельных и детализированных изображениях.
Отдельно Midjourney отмечает, что рендеринг текста внутри изображений стал работать стабильнее, чем в прошлых версиях. Для этого компания советует заключать нужный текст в кавычки прямо в промпте.
При этом V8 по-прежнему остается чисто диффузионной моделью. В материале отмечается, что конкуренты уже используют смешанные архитектуры с авторегрессионными компонентами, чтобы точнее следовать промптам.
В качестве примеров приводятся Google’s Nano Banana и OpenAI GPT image 1.5. Как пишет автор, по первым тестам V8 пока не закрыла этот разрыв полностью.
В одном из начальных тестов со сложным промптом про лошадь и астронавта Midjourney показала результат хуже, чем авторегрессионные модели. Даже Flux, который назван более прямым конкурентом Midjourney, по оценке автора справился немного лучше.
Midjourney уточняет, что стандартный визуальный стиль V8 еще не завершен. Пользователям, которым нужен фотореалистичный или более контролируемый результат, компания рекомендует сразу использовать режим –raw либо moodboards и style references.
По словам компании, максимальный эффект сейчас дает усиленная персонализация через –stylize 1000. Midjourney также пишет, что V8 особенно хорошо показывает себя при длинных и более точных промптах.
Для части пользователей важным фактором станет цена. Midjourney сообщает, что задачи с –hd, –q 4, style references или moodboards сейчас выполняются в четыре раза медленнее стандартных и стоят в четыре раза дороже.
Режим Relax, который позволяет генерировать изображения медленнее без доплаты, на старте недоступен. Компания сообщает, что строит новый серверный кластер для Relax и работает над более дешевыми режимами рендеринга.
Источник: The Decoder со ссылкой на Midjourney.






















