ByteDance разработала новый подход к генерации портретов с помощью искусственного интеллекта, решая проблемы с несоответствиями в чертах лица и неточностью выполнения запросов. В отличие от предыдущих решений, InfuseNet обрабатывает черты лица в виде отдельного информационного слоя, не изменяя саму модель ИИ.
Система использует двухэтапный процесс обучения, начиная с реальных портретных фотографий, а затем переходя к синтетическим изображениям, которые создаются с помощью специализированных оптимизационных модулей.
По мнению ByteDance, этот подход существенно улучшает качество изображений, сохраняя схожесть с оригиналом и более точно следуя текстовым запросам. InfuseNet избегает проблем, таких как прямое копирование лиц и потеря качества.
В пользовательском тестировании с участием 16 человек, InfiniteYou (производное от InfuseNet) показала явные преимущества перед существующими решениями. 72.8% участников предпочли результаты InfiniteYou по сравнению с 27.2% для PuLID-FLUX.
InfiniteYou совместима с популярными ИИ-инструментами, такими как ControlNet и LoRA, и позволяет за четыре шага генерировать изображения и изменять как людей, так и объекты на них. Однако ByteDance отмечает, что есть еще пространство для улучшения сходства лиц и качества изображений.
ByteDance опубликовала код InfiniteYou на GitHub и сделала весовые модели доступными через Hugging Face. Они также планируют экспериментальную демонстрацию.
Будучи членом Content Authenticity Initiative, ByteDance работает над внедрением C2PA-метаданных для идентификации генерированного ИИ контента. Однако не уточняется, будет ли InfiniteYou включать эти функции аутентификации.
Релиз последовал за недавними разработками ByteDance в области ИИ, включая OmniHuman-1 для фотореалистичных анимаций и серии Goku для аватаров.