Flux 2 small: генерация и редактирование изображений на видеокарте

Немецкий стартап Black Forest Labs выпустил Flux 2 “klein” (small) — компактную модель ИИ для генерации и редактирования изображений, которая работает на обычных видеокартах, например RTX 3090.

Flux 2 small расширяет линейку, представленную в ноябре, где уже были две основные версии: флагман с 9 миллиардами параметров и облегчённая версия на 4 миллиарда. Обе доступны в исходном виде — для исследований и доработок.

Flux 2 small объединяет функции генерации по тексту, редактирования картинок и мульти-ссылочного создания изображений на основе сразу нескольких примеров в одной модели.

Главная особенность — всё это теперь помещается в одном компактном решении, которое можно запускать дома. Для запуска 4B-модели достаточно 13 ГБ видеопамяти, она работает на видеокартах уровня Nvidia RTX 3090 или RTX 4070.

Флагманская модель 9B использует поточную архитектуру, позволяя создавать изображения за 4 вычислительных шага. По словам Black Forest Labs, скорость генерации составляет менее 0,5 секунды, но это измерялось на серверном чипе Nvidia GB200, а не на потребительских видеокартах.

Black Forest Labs совместно с Nvidia сделали квантизированные версии модели. Квантизация уменьшает точность хранения весов модели, тем самым снижая требования к памяти и ускоряя расчёты.

Вариант FP8 (8-битный формат) ускоряет работу до 1,6 раза и снижает потребление памяти на 40%. NVFP4 (4-битный формат Nvidia) даёт до 2,7 раза ускорения и экономию памяти до 55%. Эти показатели достигаются на видеокартах RTX 5080 и RTX 5090.

В своих тестах Black Forest Labs отмечает: 9B-модель оптимальна по соотношению качества и задержки. Компания утверждает, что по качеству сопоставима или лучше Qwen, но при этом быстрее и менее требовательна к VRAM, превосходит Z-Image и лучшие версии других моделей в 5 раз крупнее. Независимой проверки этих заявлений пока не было.

Лицензирование зависит от размера модели: 4B идет под Apache 2.0 и открыта для коммерческого использования. 9B-модель — только для некоммерции, для бизнеса нужна отдельная лицензия. Ссылка на код на GitHub прилагается, поддерживаются ComfyUI и библиотека Diffusers на Python.

В документации Hugging Face описаны меры по безопасности: обучающая выборка фильтровалась на NSFW и информацию о детском насилии, в сотрудничестве с британским фондом Internet Watch Foundation. После обучения модель донастраивали на защиту от потенциальных злоупотреблений. В репозитории есть фильтры NSFW, водяные знаки на уровне пикселей, поддержка стандарта C2PA для подтверждения происхождения изображений.

Ограничения модели: она не подходит для передачи фактов, текстовые надписи могут искажаться, а точность зависит от формулировки запроса.

Выход Flux 2 small совпал с активным ростом самой компании. В декабре 2025 года Black Forest Labs привлек $300 млн инвестиций, оценка достигла $3,25 млрд. Стартап основан в 2024 году, общий объем инвестиций — $450 млн.

Ранее модели Flux можно было протестировать через чат-бота Grok от xAI, однако после появления своей модели фотореалистичной генерации изображений xAI перестал их использовать. Эта новая модель вызвала обеспокоенность — она могла “раздевать” людей на фото, в том числе несовершеннолетних.

Black Forest Labs делает ставку на работу в качестве инфраструктурного провайдера для других ИИ-компаний, а не на конечных пользователей. Также стартап сообщил о разработке собственного генератора видео.

Источник

Оцените статью
Gimal-Ai