Anthropic сообщает о растущем применении языковых моделей в кибербезопасности. Компания приводит данные доски лидеров CyberGym: Claude Sonnet 4 находит новые уязвимости в программном обеспечении примерно в 2% случаев, а Sonnet 4.5 увеличивает этот показатель до 5%.
В повторных тестах Sonnet 4.5 обнаруживает новые уязвимости более чем в трети проектов.
Anthropic отмечает, что на недавнем конкурсе DARPA AI Cyber Challenge команды использовали масштабные языковые модели, такие как Claude, чтобы создавать системы для анализа миллионов строк кода и поиска уязвимостей. Компания называет это возможным «переломным моментом для влияния ИИ на кибербезопасность».





















