ByteDance представила улучшенную модель генерации AI-портретов InfuseNet

ByteDance разработала новый подход к генерации портретов с помощью искусственного интеллекта, решая проблемы с несоответствиями в чертах лица и неточностью выполнения запросов. В отличие от предыдущих решений, InfuseNet обрабатывает черты лица в виде отдельного информационного слоя, не изменяя саму модель ИИ.

Система использует двухэтапный процесс обучения, начиная с реальных портретных фотографий, а затем переходя к синтетическим изображениям, которые создаются с помощью специализированных оптимизационных модулей.

По мнению ByteDance, этот подход существенно улучшает качество изображений, сохраняя схожесть с оригиналом и более точно следуя текстовым запросам. InfuseNet избегает проблем, таких как прямое копирование лиц и потеря качества.

В пользовательском тестировании с участием 16 человек, InfiniteYou (производное от InfuseNet) показала явные преимущества перед существующими решениями. 72.8% участников предпочли результаты InfiniteYou по сравнению с 27.2% для PuLID-FLUX.

InfiniteYou совместима с популярными ИИ-инструментами, такими как ControlNet и LoRA, и позволяет за четыре шага генерировать изображения и изменять как людей, так и объекты на них. Однако ByteDance отмечает, что есть еще пространство для улучшения сходства лиц и качества изображений.

ByteDance опубликовала код InfiniteYou на GitHub и сделала весовые модели доступными через Hugging Face. Они также планируют экспериментальную демонстрацию.

Будучи членом Content Authenticity Initiative, ByteDance работает над внедрением C2PA-метаданных для идентификации генерированного ИИ контента. Однако не уточняется, будет ли InfiniteYou включать эти функции аутентификации.

Релиз последовал за недавними разработками ByteDance в области ИИ, включая OmniHuman-1 для фотореалистичных анимаций и серии Goku для аватаров.

Источник

Оцените статью
Gimal-Ai