Mistral AI выпустила новую языковую модель Small 3, которая при 24 миллиардах параметров сравнима по качеству с более крупными моделями от Meta* и OpenAI. Компания также перешла на лицензию Apache 2.0, позволяя свободно использовать и модифицировать модель, включая коммерческое применение.
Small 3 работает быстрее и эффективнее аналогов, обеспечивая 81% точности в тестах MMLU и скорость 150 токенов в секунду. По данным Mistral, она сопоставима с моделями Llama-3.3-70B, Qwen2.5-32B и GPT-4o-mini, но требует меньше вычислительных ресурсов.
Оптимизирована для реального бизнеса
Small 3 подходит для быстрого взаимодействия в чатах, обработки данных и узкоспециализированных задач. Её можно запускать на одном GPU, что делает технологию доступной без дорогого оборудования.
Компанию уже тестируют банки для выявления мошенничества, медицинские учреждения для поддержки клиентов и анализа данных, а производители и разработчики роботов – для оптимизации своих сервисов.
Модель доступна через Hugging Face, Ollama, Kaggle, Together AI, Fireworks AI и другие платформы.
Полный переход на открытый код
Отказавшись от своей лицензии MRL, Mistral перешла на Apache 2.0, предоставляя полный доступ к модели без ограничений. Компания продолжит выпускать специализированные коммерческие версии для узких задач.
В ближайшие недели Mistral обещает ещё более продвинутые модели, улучшенные для сложных рассуждений. Small 3 позиционируется как компактная альтернатива крупным open-source моделям, таким как решения Deepseek.
Кроме того, Mistral активно развивает мультимодальные ИИ-системы – недавно компания представила Pixtral, свою первую модель для работы с изображениями и текстом. Оценить возможности новых разработок можно в Le Chat, публичном чат-боте Mistral.
*Meta — запрещенная в РФ организация