Microsoft представила линейку собственных ИИ-моделей и объявила, что MAI-Transcribe-1 обеспечивает высокую точность распознавания речи на 25 самых распространённых языках. Модель предназначена для расшифровки встреч, субтитров и диктовки.
Сервис будет доступен в Microsoft Foundry вместе с MAI-Voice-1 и MAI-Image-2. В компании заявили: «С этим запуском модели MAI впервые станут широко доступны для коммерческого использования, что позволит клиентам оценивать и создавать решения на базе моделей для транскрибации, голоса и генерации изображений».
По данным Microsoft, MAI-Voice-1 поддерживает генерацию речи с реалистичным звучанием и сохраняет особенности голоса говорящего в длинных аудиофрагментах, включая эмоциональные оттенки. Также модель получила функцию voice prompting, которая позволяет создавать фирменные голоса на основе одной минуты аудио.
MAI-Image-2 — новая модель Microsoft для генерации изображений по текстовому запросу. Как утверждает компания, она лучше справляется с естественным освещением, точной передачей оттенков кожи и читаемым текстом внутри изображений. Также модель вошла в тройку лидеров рейтинга Arena.ai для text-to-image-систем.
Запуск новых моделей показывает, что Microsoft усиливает ставку на собственные ИИ-разработки. Ранее корпорация активно использовала технологии OpenAI и встроила их в свои продукты, но при этом критиковала GPT-4, указывая на высокую стоимость и низкую скорость для массовых сценариев.
В прошлом году Microsoft начала создавать внутренние ИИ-модели и тестировать сторонние решения для Copilot, чтобы снизить зависимость от OpenAI. Глава AI-направления компании Мустафа Сулейман говорил, что Microsoft разрабатывает модели, которые не претендуют на передовой уровень, но будут идти сразу следом за наиболее сильными системами OpenAI.
В прошлом месяце компания изменила структуру управления Copilot, разделив направление на четыре части: пользовательский опыт Copilot, платформа Copilot, приложения Microsoft 365 и ИИ-модели.
За пользовательские сценарии Copilot для частных и корпоративных клиентов теперь отвечает бывший топ-менеджер Snap Джейкоб Андреу в должности исполнительного вице-президента с подчинением гендиректору Microsoft Сатье Наделле. После этих изменений Мустафа Сулейман сосредоточится на создании внутренних ИИ-моделей компании.
В материале также упоминается прогноз главы Salesforce Марка Бениоффа, который ранее предположил, что Microsoft в будущем откажется от технологий OpenAI. Это обсуждение усилилось после объявления о проекте Stargate стоимостью 500 млрд долларов, который был задуман для строительства дата-центров в США, но позже от него отказались.
Источник: Windows Central, Microsoft.






















