11.06.2026
Команда безопасности Anthropic проверила, как большие языковые модели ускоряют разработку эксплойтов по уже опубликованным патчам. В экспериментах Claude Mythos Preview собрала рабочие эксплойты для Firefox и цепочки повышения привилегий в ядре Windows за часы, а не за недели.
Anthropic, разработчик семейства моделей Claude, опубликовала исследование о рисках N-day уязвимостей — ошибок, которые уже исправлены поставщиком, но еще не закрыты на части пользовательских систем. Авторы проверяли, насколько быстро LLM могут по патчу найти исходную проблему и превратить ее в работающий эксплойт.
В тесте с 18 исправлениями SpiderMonkey, JavaScript-движка Firefox, модель Claude Mythos Preview подготовила 14 proof-of-concept сбоев примерно за три часа. Затем она смогла превратить часть из них в восемь рабочих эксплойтов выполнения кода примерно за 12 часов; первый был готов менее чем за час.
Во втором эксперименте Anthropic использовала 21 локальную уязвимость повышения привилегий в ядре Windows из январских и февральских обновлений Microsoft Patch Tuesday 2026 года. В этом сценарии исходного кода Windows у модели не было: она работала с бинарными файлами, символами отладки, декомпиляцией Ghidra, diff измененных функций и публичными бюллетенями Microsoft. По данным Anthropic, Mythos Preview подготовила PoC для 18 уязвимостей менее чем за шесть часов и восемь полных цепочек повышения привилегий до уровня SYSTEM за $15 700 API-кредитов.
Исследователи подчеркивают, что реальная атака требует не только эксплойта, но и поиска целей, доставки кода и обхода защит. Тем не менее, по их оценке, один из самых трудоемких этапов — разработка эксплойта после выхода патча — уже может занимать часы. Практический вывод Anthropic: привычные месячные циклы обновлений и длительные поэтапные развертывания становятся все менее безопасными, а долгосрочно снижать риск нужно не только ускорением патчинга, но и сокращением классов ошибок, например за счет memory-safe языков и аппаратных защит.
Источник: red.anthropic.com