14 мая

Возможности ИИ в киберпространстве развиваются с невероятной скоростью, намного превосходя прогнозы прошлых лет

изображение: grok

Возможности передовых ИИ-моделей в киберзадачах растут быстрее ожиданий исследователей. Институт безопасности ИИ при правительстве Великобритании AISI сообщил о превышении новыми моделями прежних прогнозов по автономной работе в киберпространстве. Claude Mythos Preview и GPT-5.5 показали результаты с пересмотром ожиданий по скорости развития ИИ в задачах поиска уязвимостей, анализа систем и имитации атак.

Главная тревога кроется не в улучшении написания кода или скорости ответов. Новые модели начинают дольше работать автономно, удерживать сложные цепочки действий и проходить многоэтапные кибериспытания вне прежних возможностей. Для защитников время между появлением новой способности ИИ и её применением в атаках может сокращаться с лет до месяцев.

AISI оценивает кибервозможности ИИ через временные горизонты сравнения. Метод показывает длительность автономной работы ИИ-системы в задачах киберзащиты и анализа атак по сравнению с экспертами-людьми.

В феврале 2026 года AISI оценила удвоение временного горизонта киберзадач с 80% успешности у передовых моделей каждые 4,7 месяца после появления reasoning-моделей в конце 2024 года. Расчёт велся при лимите 2,5 млн токенов на задачу. Подобная скорость почти в 2 раза превышает ноябрьскую оценку 2025 года с 8 месяцами для 50% и 80% успешности.

Прогноз AISI по скорости развития ИИ в киберзадачах за 3 месяца ускорился почти вдвое, и сами исследователи уже не уверены в стабильности этого темпа.

Claude Mythos Preview и GPT-5.5 заметно превысили ускоренную траекторию. AISI пока не готова сказать о разовом скачке или начале новой ещё более быстрой тенденции.

Новейшие модели начинают перерастать текущую систему оценки. Claude Mythos Preview и GPT-5.5 почти со 100% успехом выполняли самые длинные задачи в ограниченном наборе кибертестов даже при лимите 2,5 млн токенов на задачу.

Исследователи AISI предупредили о возможной невозможности надёжного расчёта временного горизонта при снятии лимита токенов. Для оценки новых возможностей придётся строить более сложные задания.

AISI также предупредила о невозможности воспринимать любой отдельный бенчмарк точной мерой возможностей ИИ. Модель может хорошо пройти искусственный набор задач, но вести себя иначе в реальной корпоративной сети.

Данные AISI совпадают с оценками METR, некоммерческой исследовательской группы по эффективности ИИ в задачах разработки ПО. По данным METR, возможности ИИ в программировании с конца 2024 года удваиваются примерно каждые 4,2 месяца.

Отдельный блок испытаний AISI был связан с киберполигонами. Имитации реальных корпоративных атак требуют от модели проведения длинной многоэтапной операции после получения начального доступа. Подобные испытания ближе к реальности с целым набором этапов:

исследование структуры сети;
поиск нужных прав доступа;
движение между узлами инфраструктуры;
повышение привилегий учётных записей;
достижение конечной цели атаки.

В последних испытаниях Claude Mythos Preview стал первой моделью с успешным прохождением 2 оцениваемых киберполигонов. Задачу «Последние» с 32-шаговой имитацией атаки на корпоративную сеть модель решила в 6 из 10 попыток. Ранее нерешённую задачу «Градуи» с 7-шаговой атакой на систему промышленного управления Claude Mythos Preview прошла в 3 из 10 попыток.

GPT-5.5 тоже показал сильный результат с завершением задачи «Последние» в 3 из 10 попыток. Подобный показатель ниже Claude Mythos Preview, но всё равно демонстрирует прохождение передовыми моделями длинных киберцепочек.

Интересно, что Claude Mythos Preview впервые в истории прошла 32-шаговую имитацию корпоративной атаки, и это означает выход ИИ из роли помощника в полноценные исполнители операций.

Для ИБ-команд результаты имеют 2 стороны. ИИ может помогать защитникам в нескольких задачах:

ускорение анализа конфигураций инфраструктуры;
проверка уязвимостей и triage находок;
подготовка правил обнаружения угроз;
разбор логов и моделирование атак;
обучение специалистов и подготовка тестов.

Похожие способности могут быть полезны злоумышленникам при доступе к мощным моделям или обходе ограничений.

Особенно чувствительными выглядят задачи с промышленными системами. Способность модели частично проходить имитацию атаки на систему промышленного управления стала сигналом для энергетики, транспорта, производства и операторов КИИ.

AISI не делает чрезмерно прямых прогнозов. Институт указывает на отсутствие в текущих данных понимания изменения темпа прогресса после достижения определённых порогов. Также данные не доказывают поведение моделей против защищённых корпоративных систем.

Для бизнеса оснований пересматривать ожидания уже достаточно. Скорость ИИ вступает в конфликт с медленными корпоративными процессами через несколько проблем:

долгие циклы исправления уязвимостей;
ручная проверка и долгие согласования;
ожидание окна изменений в системах;
перенос задач между командами;
медленное обновление инфраструктуры.

Для защитников ответ не сводится к запрету ИИ. Нужно самим использовать ИИ для ускорения обороны в управляемом контуре с контролируемым доступом и проверкой выводов специалистами.

Ранее CISOCLUB писал о массовом тестировании российскими ведомствами разных ИИ-моделей для задач цифровой трансформации на 2026–2028 годы. По данным Forbes, часть органов власти рассматривает отечественные решения, часть тестирует китайскую Qwen, а часть присматривается к разработкам Meta, признанной в России экстремистской и запрещённой.

При получении ИИ всё более сильных кибервозможностей модель в государственном или корпоративном контуре нельзя воспринимать обычным офисным инструментом. Для российского рынка тема связана с вопросом суверенного ИИ.

Новые результаты AISI ставят вопрос о тестировании самих ИИ-систем перед внедрением. Недостаточно спросить про «ум» модели. Нужно проверять её поведение в киберзадачах, способности к обходу запретов и сохранению ограничений в длинных цепочках рассуждений.

Для SOC и команд реагирования развитие моделей может стать полезным усилением через быстрый разбор больших объёмов журналов. При появлении подобного уровня автоматизации у атакующих SOC придётся действовать быстрее.

Для разработчиков растут требования к безопасной разработке. Слабый код будет быстрее обнаруживаться не только внутренними проверками, но и внешними атакующими.

Эксперты редакции CISOCLUB отмечают, что вывод AISI звучит ранним предупреждением для всего рынка. По мнению редакции, передовые модели уже обгоняют прогнозы по автономным кибервозможностям, а Claude Mythos Preview и GPT-5.5 проходят задачи многошаговой логики и действий в имитации корпоративных атак.

Подобная картина не доказывает скорой замены опытного атакующего искусственным интеллектом, но показывает резкое сжатие времени. Защитные процессы прежнего темпа обновления в годах должны меняться в темпе месяцев, иначе бизнес попадёт в ситуацию хронического отставания от ИИ-ускоренных атакующих.

О том, как быстро расширяются автономные способности моделей, рассуждают эксперты «Лаборатории Касперского» и Сбера в видеоинтервью «Точки отказа», посвящённом развитию возможностей ИИ в киберпространстве.

* Корпорация Meta признана экстремистской организацией и запрещена на территории Российской Федерации.

Автор: Артем

Представитель редакции CISOCLUB. Пишу новости, дайджесты, добавляю мероприятия и отчеты.

Комментарии: