Meta презентовала новые AI-модели Llama 4

Llama

Meta* выпустила новую коллекцию моделей искусственного интеллекта Llama 4. В нее вошли три модели: Llama 4 Scout, Llama 4 Maverick и Llama 4 Behemoth. Модели обучены на крупных объемах неразмеченного текста, изображений и видео, чтобы обеспечить их «широкое понимание визуальной информации».

По сообщениям, успех китайской AI-лаборатории DeepSeek, чьи модели показали результаты на уровне или выше предыдущих флагманских моделей Meta, ускорил развитие Llama. Meta изучала, как DeepSeek снизили стоимость работы и развертывания своих моделей.

Модели Scout и Maverick доступны на сайте Llama.com и у партнеров, таких как платформа Hugging Face. Behemoth все еще находится в стадии обучения. Llama 4 используется в Assist всемирной сети Meta в таких приложениях, как WhatsApp, Messenger и Instagram, в 40 странах.

Для пользователей и компаний из ЕС запрещено использование моделей, что обусловлено местными законами о приватности данных. Кроме того, компании с более чем 700 миллионами активных пользователей должны получить специальную лицензию от Meta.

Согласно Meta, Llama 4 — первые модели компании, использующие архитектуру MoE (микроскоп экспертов), которая эффективнее в обработке данных. Например, у Maverick 400 миллиардов параметров, но только 17 миллиардов активны — это делается с помощью 128 экспертов. Scout выделяется в задачах, как суммирование документации, за счет большого контекстного окна в 10 миллионов токенов.

Не все модели Llama 4 ориентированы на проверку фактологии, но они настроены на меньшее количество отказов в ответах на «спорные» вопросы. Модели стремятся давать больше ответов и поддерживать различные точки зрения, не предпочитая одни мнения другим.

Многие критики утверждают, что AI-модели политически склонны к «вокализму». По словам Meta, внутренние изменения помогут модели давать «полезные, фактические ответы без оценочных суждений».

*Meta — запрещенная в РФ организация

Источник

Оцените статью
Gimal-Ai