Возможности ИИ в киберпространстве развиваются с невероятной скоростью, намного превосходя прогнозы прошлых лет

изображение: grok
Возможности передовых ИИ-моделей в киберзадачах растут быстрее ожиданий исследователей. Институт безопасности ИИ при правительстве Великобритании AISI сообщил о превышении новыми моделями прежних прогнозов по автономной работе в киберпространстве. Claude Mythos Preview и GPT-5.5 показали результаты с пересмотром ожиданий по скорости развития ИИ в задачах поиска уязвимостей, анализа систем и имитации атак.
Главная тревога кроется не в улучшении написания кода или скорости ответов. Новые модели начинают дольше работать автономно, удерживать сложные цепочки действий и проходить многоэтапные кибериспытания вне прежних возможностей. Для защитников время между появлением новой способности ИИ и её применением в атаках может сокращаться с лет до месяцев.
AISI оценивает кибервозможности ИИ через временные горизонты сравнения. Метод показывает длительность автономной работы ИИ-системы в задачах киберзащиты и анализа атак по сравнению с экспертами-людьми.
В феврале 2026 года AISI оценила удвоение временного горизонта киберзадач с 80% успешности у передовых моделей каждые 4,7 месяца после появления reasoning-моделей в конце 2024 года. Расчёт велся при лимите 2,5 млн токенов на задачу. Подобная скорость почти в 2 раза превышает ноябрьскую оценку 2025 года с 8 месяцами для 50% и 80% успешности.
Прогноз AISI по скорости развития ИИ в киберзадачах за 3 месяца ускорился почти вдвое, и сами исследователи уже не уверены в стабильности этого темпа.
Claude Mythos Preview и GPT-5.5 заметно превысили ускоренную траекторию. AISI пока не готова сказать о разовом скачке или начале новой ещё более быстрой тенденции.
Новейшие модели начинают перерастать текущую систему оценки. Claude Mythos Preview и GPT-5.5 почти со 100% успехом выполняли самые длинные задачи в ограниченном наборе кибертестов даже при лимите 2,5 млн токенов на задачу.
Исследователи AISI предупредили о возможной невозможности надёжного расчёта временного горизонта при снятии лимита токенов. Для оценки новых возможностей придётся строить более сложные задания.
AISI также предупредила о невозможности воспринимать любой отдельный бенчмарк точной мерой возможностей ИИ. Модель может хорошо пройти искусственный набор задач, но вести себя иначе в реальной корпоративной сети.
Данные AISI совпадают с оценками METR, некоммерческой исследовательской группы по эффективности ИИ в задачах разработки ПО. По данным METR, возможности ИИ в программировании с конца 2024 года удваиваются примерно каждые 4,2 месяца.
Отдельный блок испытаний AISI был связан с киберполигонами. Имитации реальных корпоративных атак требуют от модели проведения длинной многоэтапной операции после получения начального доступа. Подобные испытания ближе к реальности с целым набором этапов:
- исследование структуры сети;
- поиск нужных прав доступа;
- движение между узлами инфраструктуры;
- повышение привилегий учётных записей;
- достижение конечной цели атаки.
В последних испытаниях Claude Mythos Preview стал первой моделью с успешным прохождением 2 оцениваемых киберполигонов. Задачу «Последние» с 32-шаговой имитацией атаки на корпоративную сеть модель решила в 6 из 10 попыток. Ранее нерешённую задачу «Градуи» с 7-шаговой атакой на систему промышленного управления Claude Mythos Preview прошла в 3 из 10 попыток.
GPT-5.5 тоже показал сильный результат с завершением задачи «Последние» в 3 из 10 попыток. Подобный показатель ниже Claude Mythos Preview, но всё равно демонстрирует прохождение передовыми моделями длинных киберцепочек.
Интересно, что Claude Mythos Preview впервые в истории прошла 32-шаговую имитацию корпоративной атаки, и это означает выход ИИ из роли помощника в полноценные исполнители операций.
Для ИБ-команд результаты имеют 2 стороны. ИИ может помогать защитникам в нескольких задачах:
- ускорение анализа конфигураций инфраструктуры;
- проверка уязвимостей и triage находок;
- подготовка правил обнаружения угроз;
- разбор логов и моделирование атак;
- обучение специалистов и подготовка тестов.
Похожие способности могут быть полезны злоумышленникам при доступе к мощным моделям или обходе ограничений.
Особенно чувствительными выглядят задачи с промышленными системами. Способность модели частично проходить имитацию атаки на систему промышленного управления стала сигналом для энергетики, транспорта, производства и операторов КИИ.
AISI не делает чрезмерно прямых прогнозов. Институт указывает на отсутствие в текущих данных понимания изменения темпа прогресса после достижения определённых порогов. Также данные не доказывают поведение моделей против защищённых корпоративных систем.
Для бизнеса оснований пересматривать ожидания уже достаточно. Скорость ИИ вступает в конфликт с медленными корпоративными процессами через несколько проблем:
- долгие циклы исправления уязвимостей;
- ручная проверка и долгие согласования;
- ожидание окна изменений в системах;
- перенос задач между командами;
- медленное обновление инфраструктуры.
Для защитников ответ не сводится к запрету ИИ. Нужно самим использовать ИИ для ускорения обороны в управляемом контуре с контролируемым доступом и проверкой выводов специалистами.
Ранее CISOCLUB писал о массовом тестировании российскими ведомствами разных ИИ-моделей для задач цифровой трансформации на 2026–2028 годы. По данным Forbes, часть органов власти рассматривает отечественные решения, часть тестирует китайскую Qwen, а часть присматривается к разработкам Meta, признанной в России экстремистской и запрещённой.
При получении ИИ всё более сильных кибервозможностей модель в государственном или корпоративном контуре нельзя воспринимать обычным офисным инструментом. Для российского рынка тема связана с вопросом суверенного ИИ.
Новые результаты AISI ставят вопрос о тестировании самих ИИ-систем перед внедрением. Недостаточно спросить про «ум» модели. Нужно проверять её поведение в киберзадачах, способности к обходу запретов и сохранению ограничений в длинных цепочках рассуждений.
Для SOC и команд реагирования развитие моделей может стать полезным усилением через быстрый разбор больших объёмов журналов. При появлении подобного уровня автоматизации у атакующих SOC придётся действовать быстрее.
Для разработчиков растут требования к безопасной разработке. Слабый код будет быстрее обнаруживаться не только внутренними проверками, но и внешними атакующими.
Эксперты редакции CISOCLUB отмечают, что вывод AISI звучит ранним предупреждением для всего рынка. По мнению редакции, передовые модели уже обгоняют прогнозы по автономным кибервозможностям, а Claude Mythos Preview и GPT-5.5 проходят задачи многошаговой логики и действий в имитации корпоративных атак.
Подобная картина не доказывает скорой замены опытного атакующего искусственным интеллектом, но показывает резкое сжатие времени. Защитные процессы прежнего темпа обновления в годах должны меняться в темпе месяцев, иначе бизнес попадёт в ситуацию хронического отставания от ИИ-ускоренных атакующих.
* Корпорация Meta признана экстремистской организацией и запрещена на территории Российской Федерации.


