Black Forest Labs представила FLUX.1 Context — систему, объединяющую возможности генерации и редактирования изображений по текстовым и графическим подсказкам.
Модель позволяет быстро и точно менять отдельные элементы на изображениях, не затрагивая остальную часть картинки. Она поддерживает работу со стилем и персонажами — их образы сохраняются на протяжении всей серии обработок.
В FLUX.1 Context можно совмещать текстовые и визуальные подсказки. Пользователь меняет существующие изображения, создает новые сцены в стиле выбранной картинки или выдерживает согласованность персонажей во всех выводах. Основное отличие от прежних систем — локальное редактирование: можно менять отдельные элементы, оставляя остальные части без изменений. Также стиль сцены настраивается с помощью текстовых описаний.
FLUX.1 Context [pro] объединяет классическую генерацию по тексту с пошаговым изменением картинок. Модель работает с текстовыми и визуальными запросами, а скорость, по заявлению Black Forest Labs, до 10 раз выше, чем у аналогов. Модель сохраняет постоянство персонажей, стиля и объектов даже после нескольких правок — с чем часто не справляются такие инструменты, как GPT-Image-1 или Midjourney.
Экспериментальная версия FLUX.1 Context [max] рассчитана на тех, кому требуется больше точности при работе с текстом, более стабильное редактирование и ускоренный вывод. Главная задача — максимально точное следование подсказкам пользователя при высокой производительности.
Для оценки качества Black Forest Labs использовала свой собственный тест KontextBench. По словам компании, FLUX.1 Kontext [pro] показала лучшие результаты, особенно в заданиях по редактированию текста и сохранению персонажей. Модель также оказалась быстрее других систем и точнее следовала подсказкам.
Black Forest Labs отмечает, что, несмотря на успехи, модель может давать заметные артефакты при длинных сериях изменений и иногда неправильно понимать запросы. Ограниченные знания об устройстве мира снижают точность создания картинок с учетом реального контекста.
Для исследователей предложена уменьшенная версия — FLUX.1 Context [dev] на 12 миллиардов параметров. Она предназначена для тестирования безопасности и доработки под собственные задачи, доступна в приватном бета-режиме. После полноценного релиза её будут распространять через партнеров, включая Hugging Face.
Также стартовала веб-платформа FLUX Playground. На сайте можно протестировать работу моделей и провести эксперименты в реальном времени — установка не требуется.
Модели FLUX.1 Context доступны и через сторонние сервисы: KreaAI, Freepik, Lightricks, OpenArt, LeonardoAI, а также через инфраструктурные платформы FAL, Replicate и DataCrunch.