Microsoft представила MAI-Image-2 — первый продукт своей команды по созданию сверхинтеллекта под руководством Мустафы Сулеймана. Это модель генерации изображений по текстовому запросу, которую компания уже начинает внедрять в собственные сервисы и позже откроет через API.
Сейчас MAI-Image-2 занимает третье место в рейтинге Arena.ai для генераторов текста в изображение. Выше в списке находятся GPT-Image-1.5 от OpenAI и Nano Banana 2 от Google.
По данным Microsoft, модель хорошо создаёт реалистичные фотографии с естественным освещением и точной передачей оттенков кожи. Также она справляется с детализированными и сюрреалистичными сценами. В компании заявили, что разрабатывали модель вместе с фотографами, дизайнерами и визуальными художниками.
Microsoft также утверждает, что MAI-Image-2 подходит для прикладных задач. В частности, модель стабильно выводит текст внутри изображений для постеров, инфографики и диаграмм.
Тестирование модели уже доступно в MAI Playground, но доступ зависит от региона. В дальнейшем её добавят в Copilot и Bing Image Creator.
Доступ к API пока открыт только для отдельных корпоративных клиентов. Вскоре Microsoft планирует предоставить его всем разработчикам через Microsoft Foundry. Технические детали, цены и сведения об обучающих данных компания пока не раскрыла.
Первый собственный генератор изображений Microsoft, MAI-Image-1, вышел в октябре 2025 года. Тогда модель заняла девятое место в рейтинге Arena.ai и не получила заметного внимания.
Переход MAI-Image-2 на третью строчку показывает прогресс Microsoft, хотя компании всё ещё нужно сокращать отставание от ведущих моделей OpenAI и Google.
Источник: The Decoder.






















