Компания Anthropic выпустила обновленную модель Claude Opus 4.1. Эта версия лучше справляется с программированием, рефакторингом кода, обработкой данных и многозадачными заданиями.
Модель доступна для платных пользователей через Claude, Claude Code, а также через API, Amazon Bedrock и Google Cloud Vertex AI. Стоимость использования осталась прежней. Для доступа разработчики могут использовать тег API claude-opus-4-1-20250805.
Claude Opus 4.1 установила рекорд по тесту SWE-bench Verified, набрав 74,5%. Это примерно на две точки выше прошлой версии Opus 4 и на пять точек обошла серию o-series от OpenAI. Самая новая открытая модель OpenAI отстает еще сильнее. Этот тест оценивает, насколько хорошо ИИ умеет искать и исправлять ошибки в коде с открытым исходным кодом.
Модель также показывает рост в аналитике и поиске информации. Anthropic утверждает, что система стала лучше отслеживать детали и выполнять агентные задачи. Стартап Windsurf, который прекращает работу, сообщил, что Opus 4.1 улучшила внутренний тест для программистов-новичков на одну стандартную оценку — такое же изменение было при переходе с Sonnet 3.7 на Sonnet 4.
Появление Claude Opus 4.1 совпадает с подготовкой OpenAI к запуску GPT-5. По данным The Information, GPT-5 должен улучшить работу с программированием, математикой и агентными задачами, но не даст такого большого скачка, как GPT-4 по сравнению с GPT-3.
Anthropic советует всем пользователям перейти с Opus 4 на Opus 4.1 и обещает, что «значительно большие» обновления появятся уже скоро. Это подчеркивает стремление Anthropic сохранить позиции на фоне выхода GPT-5.
Подробнее: системная карта, страница модели, страница цен, документация.






















