ИИ-боты создают новую угрозу для сайтов — хуже, чем DDoS

Изображение: recraft
По данным отчёта Fastly Threat Insights, автоматизированный трафик от ИИ-ботов выходит на новый уровень. Исследователи проанализировали более 6,5 трлн запросов в месяц и зафиксировали устойчивый рост активности систем, связанных с обучением языковых моделей. Их действия оказываются не менее разрушительными, чем классические DDoS-атаки, и при этом куда менее предсказуемы.
Пиковая нагрузка от одного бота может достигать 39 тысяч запросов в минуту на один сайт. Такие объёмы способны перегрузить даже высокопроизводительные серверы. Под особым ударом оказываются онлайн-магазины, технологические платформы и развлекательные ресурсы — именно они чаще других содержат структурированные данные, интересные для ИИ. Негативные последствия — рост затрат на хостинг, некорректная аналитика и снижение скорости загрузки страниц.
Примерно 80% активности создают краулеры — боты, систематически скачивающие контент для обучения моделей. Более половины из них связаны с Meta, ещё почти четверть с Google, около 20% — с OpenAI. Фетчеры, наоборот, работают «по требованию»: они обращаются к сайту в момент, когда пользователь задаёт вопрос ИИ. Эти запросы составляют меньшую долю, но именно они вызывают самые резкие всплески. Почти весь фетчерный трафик (98%) связан с OpenAI — ChatGPT и OAI-SearchBot.
География данных также важна. Большая часть информации, используемой ИИ, поступает из Северной Америки, что отражается на контексте и акцентах моделей. Некоторые краулеры, например Diffbot или ICC Crawler, стремятся к более широкому охвату — они активно обрабатывают ресурсы из Европы, Ближнего Востока и Африки. В Азии данные собирают японские компании и научные учреждения.
Степень угрозы меняется от региона к региону. В Северной Америке почти весь трафик генерируют краулеры, тогда как в Европе преобладают фетчеры. Особенно заметно это в образовании, где студенты массово используют ChatGPT. Подобная же нагрузка фиксируется в медиа и на новостных порталах, поскольку ИИ-боты непрерывно обращаются к свежим публикациям. Для сектора здравоохранения, госсайтов и e-commerce больше характерен фоновый краулинг — он даёт до 96% трафика.


