Anthropic: Промежуточные результаты Mythos и Project Glasswing

Seeallochnaya 22.05.2026 — 20:23

Ключевые факты

1 ИИ-модель Mythos от Anthropic обнаружила десятки тысяч уязвимостей, включая критические.
2 Cloudflare выявила 2000 уязвимостей, 400 из которых критические, с низкой долей ложных срабатываний.
3 В 1000+ опенсорс-репозиториях найдено 6202 уязвимости высокого/критического уровня.
4 90% проверенных уязвимостей подтверждены, 62% классифицированы как высокие/критические.
5 Mythos может создавать эксплойты, например, для подделки сертификатов wolfSSL.
6 Темпы обнаружения уязвимостей превышают возможности их исправления.
7 Отсутствуют надежные механизмы защиты от злонамеренного использования подобных ИИ-моделей.
8 Project Glasswing направлен на подготовку к широкому распространению таких ИИ-инструментов.

Anthropic представила обновленную информацию о своих проектах Mythos и Project Glasswing. ИИ-модель Mythos, разработанная для поиска уязвимостей, продемонстрировала значительные успехи. Партнеры Anthropic обнаружили сотни критических и высокоуровневых уязвимостей в своем коде, а общая сумма выявленных проблем составила десятки тысяч. Некоторые компании отметили десятикратное увеличение скорости обнаружения багов. Например, Cloudflare выявила 2000 уязвимостей, из которых 400 были критическими или высокого уровня опасности, при этом доля ложных срабатываний оказалась ниже, чем у человеческих тестировщиков. Помимо закрытых проектов, Mythos также сканировал более 1000 крупных опенсорс-репозиториев, найдя в них 6202 уязвимости высокого или критического уровня из общего числа в 23 тысячи. Из 1752 тщательно проверенных уязвимостей высокого и критического уровня, 90% были подтверждены, а 62% (1100) классифицированы как высокого или критического уровня. Модель Mythos способна создавать эксплойты, например, для подделки сертификатов через библиотеку wolfSSL, что потенциально позволяет злоумышленникам создавать фальшивые, но легитимные для браузера сайты. Темпы обнаружения уязвимостей настолько высоки, что команды не успевают их исправлять, и некоторые даже просили замедлить раскрытие информации. В среднем, устранение критического бага, найденного Mythos, занимает две недели. Anthropic подчеркивает, что пока ни одна компания, включая их самих, не разработала надежных механизмов для предотвращения злонамеренного использования таких ИИ-моделей. Именно поэтому доступ к модели ограничен, и был запущен Project Glasswing, чтобы подготовиться к сценарию, когда аналогичные мощные ИИ-инструменты станут доступны широкой аудитории, что значительно упростит эксплуатацию уязвимого кода.

Источник