Яндекс выложил в открытый доступ Instruct-версию нейросети YandexGPT 5 Lite. Её можно использовать в коммерческих и некоммерческих целях. Модель подойдёт для IT-разработки, научных задач и автоматизации бизнес-процессов.
Instruct-версия отличается от предыдущей тем, что прошла этап alignment — дополнительную настройку для работы по конкретным запросам. Она получила базовые этические фильтры, которые можно доработать. В отличие от Pretrain-версии, её не нужно дообучать для выполнения прикладных задач.
По данным Яндекса и международных тестов (MMLU, IFEval, RuFacts), модель превзошла китайскую Qwen2.5-7B-Instruct в задачах классификации, знаниях о России и умении отвечать по инструкции. В слепом сравнении с GPT-4o Mini она показала сопоставимое качество.
Модель содержит 8 млрд параметров, поддерживает контекст до 32 тыс. токенов и работает даже на персональных ПК. Она совместима с llama.cpp и форматом GGUF.
Яндекс также обновил лицензию: теперь модель можно использовать бесплатно до 10 млн токенов в месяц, включая коммерческие проекты — например, чат-ботов, генерацию описаний товаров, автоматические ответы клиентам и анализ отзывов.
Модель доступна:
- на Hugging Face для скачивания;
- в чате с Алисой (до 5 запросов в день, безлимит — с подпиской Про);
- через API в Yandex Cloud, включая возможность дообучения.
API Яндекса теперь совместим с OpenAI API, что упрощает переход между различными моделями без переписывания кода. Модель легко интегрируется с AutoGPT, LangChain и другими ML-инструментами.
Ранее, в феврале, Яндекс открыл доступ к Pretrain-версии модели. На её основе уже создано более 10 квантизованных версий для слабых устройств.