Wiz: у 65% ведущих AI-компаний выявлены подтверждённые утечки конфиденциальных данных через GitHub

Wiz: у 65% ведущих AI-компаний выявлены подтверждённые утечки конфиденциальных данных через GitHub

Изображение: recraft

Компания Wiz представила исследование, в котором анализируются утечки секретной информации у частных разработчиков искусственного интеллекта. В отчёте говорится, что 65% участников списка Forbes AI 50 допустили публикацию конфиденциальных данных в общедоступных репозиториях. Среди утекших данных — токены, API-ключи и логины к внутренним системам. Суммарная оценка компаний, допустивших подобные ошибки, превышает 400 млрд долларов.

Аналитики Wiz отмечают, что быстрый прогресс в AI-секторе не сопровождается должным укреплением цифровой защиты. Даже те фирмы, которые редко публикуют код, не застрахованы от ошибок.

Примером служит одна из компаний, где всего 14 активных разработчиков и ни одного публичного репозитория. Несмотря на это, сканирование выявило утечку секретов. Напротив, другая организация с 60 открытыми хранилищами не допустила ни одной уязвимости, что, по мнению авторов исследования, говорит о присутствии зрелых практик защиты.

Для анализа угроз специалисты применили собственную методику под названием «Глубина, периметр и покрытие». Этот фреймворк позволяет исследовать не только актуальное содержимое репозиториев, но и их историю, удалённые форки, суть коммитов и даже частные рабочие пространства сотрудников. Такой подход позволил обнаружить данные, которые остаются вне поля зрения стандартных систем мониторинга.

Среди наиболее часто встречающихся экспонированных ресурсов оказались учётные ключи от платформ WeightsAndBiases, HuggingFace и ElevenLabs. Эти данные могли давать доступ к закрытым обучающим наборам и внутренним инструментам — критически важным элементам при разработке и обучении моделей.

Некоторые участники, в том числе LangChain и ElevenLabs, отреагировали оперативно, удалив скомпрометированные материалы и проведя работу по закрытию уязвимостей. Однако в целом картина остаётся неустойчивой. Около половины обнаруженных инцидентов либо не были подтверждены, либо не привели к конкретным действиям со стороны компаний. Во многих случаях отсутствует налаженный механизм реагирования на уведомления об утечках, что указывает на серьёзные структурные просчёты в подходе к информационной защите.

В качестве конкретных примеров в отчёте упомянуты случаи, когда API-ключи LangChain были размещены в коде Python- и Jupyter-файлов, а конфигурационный файл одной из команд содержал активный токен ElevenLabs. Отдельный случай касался неназванной компании из списка Forbes AI 50: токен HuggingFace, опубликованный в удалённом форке, позволил получить доступ к примерно 1000 приватных моделей.

Артем
Автор: Артем
Представитель редакции CISOCLUB. Пишу новости, дайджесты, добавляю мероприятия и отчеты.
Комментарии: