ИИ-боты создают новую угрозу для сайтов — хуже, чем DDoS

ИИ-боты создают новую угрозу для сайтов — хуже, чем DDoS

Изображение: recraft

По данным отчёта Fastly Threat Insights, автоматизированный трафик от ИИ-ботов выходит на новый уровень. Исследователи проанализировали более 6,5 трлн запросов в месяц и зафиксировали устойчивый рост активности систем, связанных с обучением языковых моделей. Их действия оказываются не менее разрушительными, чем классические DDoS-атаки, и при этом куда менее предсказуемы.

Пиковая нагрузка от одного бота может достигать 39 тысяч запросов в минуту на один сайт. Такие объёмы способны перегрузить даже высокопроизводительные серверы. Под особым ударом оказываются онлайн-магазины, технологические платформы и развлекательные ресурсы — именно они чаще других содержат структурированные данные, интересные для ИИ. Негативные последствия — рост затрат на хостинг, некорректная аналитика и снижение скорости загрузки страниц.

Примерно 80% активности создают краулеры — боты, систематически скачивающие контент для обучения моделей. Более половины из них связаны с Meta, ещё почти четверть с Google, около 20% — с OpenAI. Фетчеры, наоборот, работают «по требованию»: они обращаются к сайту в момент, когда пользователь задаёт вопрос ИИ. Эти запросы составляют меньшую долю, но именно они вызывают самые резкие всплески. Почти весь фетчерный трафик (98%) связан с OpenAI — ChatGPT и OAI-SearchBot.

География данных также важна. Большая часть информации, используемой ИИ, поступает из Северной Америки, что отражается на контексте и акцентах моделей. Некоторые краулеры, например Diffbot или ICC Crawler, стремятся к более широкому охвату — они активно обрабатывают ресурсы из Европы, Ближнего Востока и Африки. В Азии данные собирают японские компании и научные учреждения.

Степень угрозы меняется от региона к региону. В Северной Америке почти весь трафик генерируют краулеры, тогда как в Европе преобладают фетчеры. Особенно заметно это в образовании, где студенты массово используют ChatGPT. Подобная же нагрузка фиксируется в медиа и на новостных порталах, поскольку ИИ-боты непрерывно обращаются к свежим публикациям. Для сектора здравоохранения, госсайтов и e-commerce больше характерен фоновый краулинг — он даёт до 96% трафика.

Артем
Автор: Артем
Представитель редакции CISOCLUB. Пишу новости, дайджесты, добавляю мероприятия и отчеты.
Комментарии: