DeepSeek представила модель Janus-Pro-7B, превосходящую DALL-E 3

DeepSeek

Компания DeepSeek, стремительно набирающая популярность в сообществе open-source, выпустила новый мультимодальный ИИ-модуль Janus-Pro-7B, способный генерировать и анализировать изображения. Этот запуск, состоявшийся 27 января 2025 года, бросает вызов таким гигантам, как OpenAI с их DALL-E 3 и Stability AI.

Особенности модели:

  • Поддержка текстов и изображений. Janus-Pro-7B предлагает новые возможности для творчества и анализа.
  • Высокие показатели. Модель превосходит конкурентов по тестам GenEval и DPG-Bench.
  • Доступность. Модель размещена на платформе Hugging Face, что соответствует принципам открытого кода, характерным для DeepSeek.

DeepSeek представила модель Janus-Pro-7B, превосходящую DALL-E 3

Janus-Pro-7B использует инновационный энкодер SigLIP-Large-Patch16-384, который обеспечивает детализированный анализ изображений. В основе лежат технологии кодировочных блоков и адаптеров MLP, позволяющие генерировать изображения с разрешением до 384×384 пикселей.

Разработчики и предприниматели могут быстро установить модель и использовать ее для различных задач, включая создание визуальных историй и работу с функцией «визуального Q&A». Документация проста и удобна для пользователей любого уровня подготовки.

Модель Janus-Pro-7B может стать важным инструментом для создания цифрового контента, медиа и взаимодействия с пользователями, укрепляя позиции DeepSeek как одного из лидеров индустрии.

Источник

Оцените статью
Gimal-Ai