22 июня

Модель Mythos от Anthropic за несколько часов взломала секретные системы АНБ США

изображение: grok

Модель Mythos от Anthropic могла за считаные часы получить контроль почти над всеми засекреченными системами Агентства национальной безопасности США. Об этом со ссылкой на сенатора Марка Уорнера написал журнал Economist. Публикация объясняет резкие действия Белого дома, который 12 июня ограничил использование флагманских ИИ-разработок компании.

11 июня замглавы сенатского комитета по разведке Марк Уорнер передал прессе детали закрытого разговора с генералом Джошуа Раддом, возглавляющим АНБ и Киберкомандование. По словам сенатора, внутренние стресс-тесты показали почти полный обход защитного периметра агентства за часы, а не за недели, как закладывалось в сценариях киберучений. Журналисты Economist уточняют технические рамки этой проверки:

испытания проводились на изолированном контуре с реальными конфигурациями;
в качестве цели выступали внутренние секретные сегменты сети АНБ;
Mythos получила задачу действовать как автономный наступательный агент;
временной норматив был сжат до нескольких часов вместо стандартных недель;
итог зафиксирован в служебной записке для руководства разведсообщества.

Стоит обратить внимание на то, что Уорнер фактически пересказывает слова Радда, а сам генерал публичных комментариев пока не давал — это уже породило волну скепсиса у части аналитиков по обе стороны Атлантики.

Под экспортный запрет 12 июня попали Mythos 5 и Fable 5 — две самые продвинутые системы Anthropic. Жёсткость удивила отрасль, поскольку раньше Вашингтон ссылался на размытые формулировки о национальной безопасности и почти никогда не отрезал от технологий собственных партнёров. Сейчас же доступ закрыт сразу для нескольких категорий пользователей:

граждане Китая, России, Ирана и КНДР;
иностранные сотрудники американских компаний без двойного гражданства;
участники альянса Five Eyes — Австралия, Великобритания, Канада, Новая Зеландия;
британский институт AI Safety Institute, мировой центр аудита фронтирных моделей;
любые внешние API-клиенты, чью юрисдикцию Anthropic не может верифицировать в моменте.

У компании нет механизма мгновенной проверки гражданства пользователя на стороне инференса, поэтому пришлось рубить доступ оптом — для всех неамериканских аккаунтов. На момент публикации Fable 5 и Mythos 5 за пределами США недоступны, разработчики получают заглушку с указанием на экспортный режим.

Парадокс ситуации в том, что та же Mythos уже работает на американскую разведку. Financial Times писала, что АНБ применяет модель в наступательных операциях против инфраструктуры Китая и Ирана, а Anthropic откомандировала в агентство собственную инженерную группу для тонкой настройки системы под боевые задачи. Получается, одна и та же модель одновременно числится инструментом спецслужб и угрозой для них же.

Интересно, что внутри отрасли уже звучит формулировка о «двойном гражданстве» Mythos — модель работает на одной стороне забора и при этом сама же забор и проламывает.

Часть экспертного сообщества пока не торопится с выводами. Вся доказательная база сводится к публикации Economist, опирающейся на пересказ Уорнером слов Радда. Ни стенограммы слушаний, ни технического отчёта, ни независимого аудита в открытом доступе нет. Бывший аналитик RAND Джейсон Мэтени напомнил, что прошлые громкие заявления о «прорывных» возможностях ИИ нередко рассыпались при детальной проверке, и призвал дождаться раскрытия методики тестов.

Определённый фон даёт апрельская встреча, описанная The Wall Street Journal. Вице-президент Джей Ди Вэнс собрал глав OpenAI, Anthropic, Google, Microsoft и SpaceX, чтобы обсудить риски нового поколения моделей. На повестке стояли темы, которые сейчас выглядят пророческими:

автономный поиск уязвимостей нулевого дня в массовом ПО;
эксплуатация дыр без человеческого оператора в цикле;
атаки на банковскую инфраструктуру и платёжные процессинги;
сценарии вывода из строя больниц и систем экстренной помощи;
удары по энергосетям и водоснабжению крупных агломераций.

По данным WSJ, Вэнс прямо говорил о риске того, что подобные ИИ-агенты теоретически способны парализовать работу критической инфраструктуры быстрее, чем сработают человеческие защитники.

Сама Anthropic с трактовкой Economist спорит. Компания утверждает, что речь шла о локальном обходе защитных фильтров в Fable 5, а не о реальном вскрытии секретных систем АНБ. По версии разработчиков, аналогичные возможности есть у моделей конкурентов, а введённые меры выглядят политическим жестом и тормозят выпуск новых поколений ИИ-систем по всему западному рынку. Глава политики безопасности Anthropic Джек Кларк заявил, что компания готова к открытому техническому диалогу с регуляторами, но пока такого диалога фактически нет.

Mythos одновременно описывается как лучший на сегодня инструмент анализа кода и как угроза, ради сдерживания которой Вашингтон пожертвовал доступом собственных союзников к фронтирному ИИ. Что именно произошло во время внутренних испытаний АНБ, какой была реальная глубина проникновения и насколько обоснованы экспортные ограничения — пока не знает ни рынок, ни большинство профильных комитетов Конгресса. До раскрытия деталей вся конструкция держится на одном пересказе одного сенатора.

Эксперты редакции CISOCLUB уточнили, что мы наблюдаем поворотную точку в отношениях государства и разработчиков фронтирных моделей. Если данные о вскрытии систем АНБ подтвердятся хотя бы частично, экспортный режим против Mythos 5 и Fable 5 станет шаблоном для всех будущих релизов уровня GPT-6 и Gemini Ultra-3. Закрытие доступа для Five Eyes и британского AISI выглядит избыточным шагом, который ослабляет коллективный западный аудит ИИ и подталкивает союзников к собственным независимым разработкам. Одновременная роль Mythos как инструмента наступательных операций АНБ и как объекта запретов наглядно показывает, что американская стратегия по ИИ пока строится в ручном режиме, без чёткой доктрины.

Редакция считает, что отрасль входит в фазу, когда модели будут регулироваться не по факту вреда, а по факту потенциальных возможностей, а это меняет всю экономику разработки. Без публичных стандартов тестирования и открытых протоколов оценки рисков любой следующий релиз рискует попасть под аналогичные ограничения по одному телефонному звонку из Лэнгли.

Автор: Артем

Представитель редакции CISOCLUB. Пишу новости, дайджесты, добавляю мероприятия и отчеты.

Комментарии: