Компания DeepSeek, стремительно набирающая популярность в сообществе open-source, выпустила новый мультимодальный ИИ-модуль Janus-Pro-7B, способный генерировать и анализировать изображения. Этот запуск, состоявшийся 27 января 2025 года, бросает вызов таким гигантам, как OpenAI с их DALL-E 3 и Stability AI.
Особенности модели:
- Поддержка текстов и изображений. Janus-Pro-7B предлагает новые возможности для творчества и анализа.
- Высокие показатели. Модель превосходит конкурентов по тестам GenEval и DPG-Bench.
- Доступность. Модель размещена на платформе Hugging Face, что соответствует принципам открытого кода, характерным для DeepSeek.
Janus-Pro-7B использует инновационный энкодер SigLIP-Large-Patch16-384, который обеспечивает детализированный анализ изображений. В основе лежат технологии кодировочных блоков и адаптеров MLP, позволяющие генерировать изображения с разрешением до 384×384 пикселей.
Разработчики и предприниматели могут быстро установить модель и использовать ее для различных задач, включая создание визуальных историй и работу с функцией «визуального Q&A». Документация проста и удобна для пользователей любого уровня подготовки.
Модель Janus-Pro-7B может стать важным инструментом для создания цифрового контента, медиа и взаимодействия с пользователями, укрепляя позиции DeepSeek как одного из лидеров индустрии.