Новый прорыв в мире искусственного интеллекта: модели Gemma 3 от Google Deepmind

Google Deepmind представил Gemma 3 — новую линейку открытых моделей искусственного интеллекта, которые совмещают высокую производительность с компактностью и могут работать на отдельных графических или тензорных процессорах.

  • Линейка включает четыре модели, от 1 до 27 миллиардов параметров.
  • Они превосходят более крупные модели, такие как Llama-405B и DeepSeek-V3, в начальных тестах.
  • Поддерживают более 140 языков, 35 из которых без дополнительного обучения.

Gemma 3 обрабатывает текст, изображения (кроме версии на 1 миллиард параметров) и короткие видео с окном контекста в 128,000 токенов. Модели обладают возможностями вызова функций и структурированными выводами, что делает их подходящими для сложных задач.

Для повышения эффективности все модели прошли дистилляционную подготовку с последующим посттренингом, используя различные методы обучения с подкреплением, что улучшило математические способности, функции чата, следование инструкциям и многозадачность.

Впервые Google предлагает квантованные версии моделей, которые снижают требования к памяти и вычислительным ресурсам без потери точности. Gemma 3 меньше воспроизводит текст буквально и избегает передачи личных данных.

В тестах модели Gemma 3 получили высокие оценки, включая Elo 1338, что выводит их в топ-10 лучших моделей искусственного интеллекта. Например, 4B модель оказалась на одном уровне с более крупной Gemma 2-27B-IT, а версия 27B сходна по характеристикам с Gemini 1.5-Pro.

Дополнительно Google выпустил ShieldGemma 2, предназначенную для обнаружения опасных или нежелательных материалов в изображениях.

Модели Gemma 3 доступны на платформах Hugging Face, Kaggle и Google AI Studio и совместимы с популярными фреймворками PyTorch, JAX и Keras. Для академического сообщества предусмотрены $10 000 облачных кредитов. Модели работают на NVIDIA GPU, Google Cloud TPU и AMD GPU, с возможностью использования Gemma.cpp на CPU.

Источник

Оцените статью
Gimal-Ai