ИИ-модель Qwen от Alibaba разделяет изображения на слои

Alibaba представила новую модель для редактирования изображений — Qwen-Image-Layered. Она разбивает фотографии на отдельные, полностью редактируемые слои с прозрачным фоном (RGBA-слои). Каждый слой можно менять независимо, не затрагивая остальные элементы картинки.

Модель выполнит простые действия, такие как изменение размера, перемещение и перекраска любых объектов. Можно менять фон, заменять людей, редактировать текст, а также удалять, перемещать и увеличивать объекты. Изображения делятся на 3 или 8 слоев, при необходимости каждый слой можно разбить дальше, чтобы получить больше слоев.

В Alibaba считают свой подход «мостом между обычными изображениями и структурированными, редактируемыми представлениями».

Код опубликован на GitHub, модели доступны на Hugging Face и ModelScope. Для тестирования предусмотрены онлайн-демонстрации. Подробности можно узнать в блоге команды и техническом отчете.

Источник

Оцените статью
Gimal-Ai