Microsoft представила генератор MAI-Image-2

Microsoft представила MAI-Image-2 — первый продукт своей команды по созданию сверхинтеллекта под руководством Мустафы Сулеймана. Это модель генерации изображений по текстовому запросу, которую компания уже начинает внедрять в собственные сервисы и позже откроет через API.

Сейчас MAI-Image-2 занимает третье место в рейтинге Arena.ai для генераторов текста в изображение. Выше в списке находятся GPT-Image-1.5 от OpenAI и Nano Banana 2 от Google.

По данным Microsoft, модель хорошо создаёт реалистичные фотографии с естественным освещением и точной передачей оттенков кожи. Также она справляется с детализированными и сюрреалистичными сценами. В компании заявили, что разрабатывали модель вместе с фотографами, дизайнерами и визуальными художниками.

Microsoft также утверждает, что MAI-Image-2 подходит для прикладных задач. В частности, модель стабильно выводит текст внутри изображений для постеров, инфографики и диаграмм.

Тестирование модели уже доступно в MAI Playground, но доступ зависит от региона. В дальнейшем её добавят в Copilot и Bing Image Creator.

Доступ к API пока открыт только для отдельных корпоративных клиентов. Вскоре Microsoft планирует предоставить его всем разработчикам через Microsoft Foundry. Технические детали, цены и сведения об обучающих данных компания пока не раскрыла.

Первый собственный генератор изображений Microsoft, MAI-Image-1, вышел в октябре 2025 года. Тогда модель заняла девятое место в рейтинге Arena.ai и не получила заметного внимания.

Переход MAI-Image-2 на третью строчку показывает прогресс Microsoft, хотя компании всё ещё нужно сокращать отставание от ведущих моделей OpenAI и Google.

Источник: The Decoder.

Оцените статью
Gimal-Ai