11 июня

«ГИГАНТ — Компьютерные системы» о том, когда обезличенные данные перестают быть персональными

Изображение: recraft

Эксперт «ГИГАНТ — Компьютерные системы» рассказал, почему замена ФИО на ID не всегда считается обезличиванием и где проходит граница между аналитикой, ИИ и требованиями закона.

Обезличивание персональных данных перестало быть простой технической процедурой. Раньше многим компаниям казалось, что достаточно удалить ФИО, телефон, паспортные данные и заменить человека на уникальный ID. Но сегодня такой подход уже не гарантирует, что данные действительно вышли из режима персональных.

Главный вопрос сместился в сторону обратимости. Если у оператора остается ключ, таблица соответствия или другой механизм, позволяющий восстановить связь между ID и конкретным человеком, такие данные нельзя считать полноценно обезличенными. Отдельную сложность создают ИИ-модели: если данные уже использовались при обучении, удалить вклад конкретного человека технически и юридически гораздо сложнее, чем удалить строку из базы.

О том, где проходит граница между законным обезличиванием и псевдонимизацией, что делать с данными, уже попавшими в обучение модели, и как оценивать передачу обезличенных массивов за рубеж, мы поговорили с Алексеем Колодкой, директором по работе с государственными заказчиками компании «ГИГАНТ — Компьютерные системы».

— Алексей, начнем с базового, но самого спорного вопроса. Если компания заменила ФИО, телефон и другие прямые идентификаторы на уникальный ID, можно ли считать такие данные обезличенными?

Не всегда. Для начала нужно вернуться к самому определению обезличивания. Федерального закона «О персональных данных» трактует обезличивание как действия, в результате которых без дополнительной информации невозможно определить принадлежность персональных данных конкретному субъекту.

Если после обработки невозможно понять, кем является гражданин и какие данные относятся именно к нему, тогда можно говорить о действительном обезличивании. Но если данные привязаны к ID, а у оператора остается ключ соответствия, позволяющий провести обратную деперсонализацию, это уже не полноценное обезличивание. Процесс остается обратимым.

— То есть сама по себе замена имени на код еще ничего не решает. Важен не внешний вид таблицы, а возможность восстановить человека?

Именно. Если у компании есть ключ, который связывает ID с конкретным субъектом, данные по сути продолжают оставаться связанными с человеком. Формально прямые идентификаторы могут быть убраны, но возможность обратного восстановления сохраняется.

В «ГИГАНТ — Компьютерные системы» мы бы назвали это главным практическим риском: бизнес часто смотрит на сам датасет и считает, что он обезличен. Но регуляторная логика смотрит шире: есть ли дополнительная информация, с помощью которой можно восстановить принадлежность данных субъекту.

— Получается, ключ соответствия превращает обезличивание в обратимую процедуру. А если процедура обратима, то статус данных меняется не до конца?

Да. Если ключ позволяет восстановить персональные данные, говорить о полноценном обезличивании нельзя. Это не значит, что такой подход бесполезен. Он может снижать риски, ограничивать доступ к прямым идентификаторам, помогать в аналитике. Но называть его действительным обезличиванием неправильно.

Ситуацию регулируют два подзаконных акта. Первый — приказ Роскомнадзора от 19.06.2025 №140, который определяет методы и требования к обезличиванию персональных данных. Второй — постановление Правительства РФ №1154, применяемое в случаях, когда оператор обязан передавать обезличенные данные в единую информационную платформу национальной системы управления данными по требованию Минцифры РФ.

— То есть в «ГИГАНТ — Компьютерные системы» считают, что ответ на вопрос про ID достаточно жесткий: если ключ остается, полноценного обезличивания нет?

Да, если говорить именно о полноценном обезличивании. Замена ФИО и других прямых идентификаторов на уникальный ID не является достаточной, если у оператора остается ключ, который позволяет запустить обратный процесс и восстановить персональные данные.

Смысл жесткого обезличивания в том, чтобы при последующей обработке нельзя было определить субъекта персональных данных. Если такая возможность остается, данные не выходят из зоны риска.

— Хорошо, а теперь сложнее. Если человек запретил использовать свои данные, но они уже попали в обучение модели, что происходит дальше? Можно ли реально удалить вклад конкретного человека из обученной модели?

На практике это очень сложный вопрос. Во многих странах субъект имеет законное право на удаление своих данных и на их забвение. Но проверить исполнение такого требования в случае с обученной моделью крайне сложно. Я бы сказал, что практически невозможно в привычной логике удаления записи.

В обычной базе данных можно найти строку и удалить ее. В модели данные уже превращены в параметры, зависимости и статистические связи. Поэтому вопрос становится не только юридическим, но и техническим.

— То есть удалить запись из исходной базы и удалить влияние этой записи на модель — это разные вещи?

Да, это разные вещи. Технически механизм machine unlearning существует. Есть демонстрационные примеры, когда при обучении моделей ИИ система «забывала» определенные данные или ссылки на источники, из которых она эту информацию брала.

Но важно подчеркнуть: это именно демонстрации и отдельные подходы, а не массовая гарантированная практика. Проверить, действительно ли персональные данные или вклад конкретного человека были удалены из обученной модели, крайне проблематично.

— Тогда возникает неприятный вывод: юридическое требование может быть понятным, а техническое подтверждение его исполнения — почти недоказуемым?

Да, в этом и состоит проблема. Право субъекта на удаление данных звучит ясно. Но когда данные уже использованы для обучения модели, доказать, что их влияние полностью исключено, очень сложно.

В «ГИГАНТ — Компьютерные системы» мы считаем, что для компаний это важный сигнал: думать о законности использования данных нужно до обучения модели, а не после того, как субъект запретил обработку. После обучения техническая и доказательная часть становится значительно сложнее.

— То есть в проектах с ИИ обезличивание должно быть не последним шагом перед загрузкой данных, а частью проектирования?

Да. Если данные планируется использовать для обучения, нужно заранее понимать их статус, методы обезличивания, риски обратной идентификации и возможность последующего контроля. Иначе компания может оказаться в ситуации, когда формально должна выполнить требование субъекта, но технически не может надежно доказать, что вклад конкретного человека из модели удален.

Это особенно важно для массивов, где много косвенных признаков. Даже без ФИО человек может быть восстановлен по сочетанию характеристик. Поэтому вопрос обезличивания для ИИ нельзя сводить только к удалению прямых идентификаторов.

— Перейдем к трансграничной передаче. Если данные обезличены в России и затем передаются иностранной компании группы, такая передача подпадает под режим трансграничной передачи персональных данных?

Если данные действительно обезличены, такая передача не является трансграничной передачей персональных данных. В этом случае речь уже не идет о персональных данных, потому что невозможно восстановить информацию о субъекте.

Федеральный закон «О персональных данных» регулирует именно персональные данные, то есть информацию, которая прямо или косвенно относится к определенному физическому лицу. Если после обезличивания данные перестали позволять идентифицировать субъекта, к ним не применяется режим трансграничной передачи персональных данных.

— Но ключевое слово здесь — «действительно». Кто определяет момент, когда данные перестают быть персональными?

Ответственность лежит на организации, которая занимается обезличиванием. Именно она должна использовать предусмотренные методы, соблюдать требования и понимать, чем руководствоваться, чтобы данные действительно считались обезличенными.

В «ГИГАНТ — Компьютерные системы» подчеркивают: нельзя просто внутренним решением назвать массив обезличенным. Нужно убедиться, что без дополнительной информации невозможно определить субъекта персональных данных.

— То есть если у компании остается ключ или другой механизм обратного восстановления, безопаснее считать данные персональными?

Да. Если существует критерий, ключ или другой механизм, с помощью которого можно выполнить обратное преобразование и восстановить персональные данные, говорить о полном выходе из режима персональных данных нельзя.

Для действительного обезличивания важна невозможность идентификации без дополнительной информации. Если такая дополнительная информация сохраняется у оператора и позволяет восстановить субъекта, риск сохраняется.

— А если данные действительно обезличены и восстановить человека невозможно, что меняется с точки зрения передачи за рубеж?

Если данные действительно обезличены, они теряют конфиденциальность как персональные данные и могут передаваться в любом направлении, в том числе через границу. Ограничения статьи 12 Федерального закона № 152-ФЗ касаются именно персональных данных, то есть информации, которая прямо или косвенно относится к определенному физическому лицу.

Но это утверждение работает только при условии, что обезличивание выполнено корректно и необратимо в смысле невозможности восстановить субъекта.

— То есть главный риск — ошибиться в квалификации: считать данные обезличенными, хотя на самом деле они остаются восстановимыми?

Именно. Это один из главных практических рисков. Компания может считать, что передает обезличенный массив, но если сохраняется ключ, возможность сопоставления или другой механизм восстановления личности, такая позиция может оказаться уязвимой.

Поэтому оператору и организации, которая занимается обезличиванием, важно понимать требования законодательства, использовать предусмотренные методы и фиксировать применение этих методов в локальных нормативных актах.

— Что именно должно быть зафиксировано внутри компании?

Организация должна закрепить в локальных нормативных актах применение методов обезличивания и убедиться, что эти методы соответствуют основным требованиям законодательства. Это нужно не только для внутреннего порядка, но и для доказательности.

В «ГИГАНТ — Компьютерные системы» считают, что оператору персональных данных и организации, которая занимается обезличиванием, важно заранее понимать, чем они руководствуются и как подтверждают, что данные действительно обезличены.

— Если подвести итог по ID, ИИ и трансграничной передаче, где проходит главная граница?

Главная граница проходит по возможности восстановить связь с конкретным человеком. Если без дополнительной информации нельзя определить субъекта, можно говорить об обезличивании. Если остается ключ, таблица соответствия, обратимый алгоритм или другой механизм восстановления, это уже не полноценное обезличивание.

В случае ИИ эта граница становится еще сложнее, потому что данные могут быть не в таблице, а в параметрах модели. И тогда вопрос удаления конкретного вклада становится технически проблемным и трудно проверяемым.

— То есть обезличивание сегодня — это не «заменили ФИО на ID и ушли в аналитику», а отдельная зона правового и технического контроля?

Да. Именно так. Обезличивание нужно рассматривать как управляемый процесс, а не как разовую техническую операцию. В нем важны метод, обратимость, наличие или отсутствие ключа, возможность реидентификации, документирование и понимание того, где данные будут использоваться дальше.

— И главный практический вывод от «ГИГАНТ — Компьютерные системы» для компаний, которые используют данные в аналитике и ИИ?

Не считать удаление прямых идентификаторов полноценной защитой. Если у оператора остается возможность восстановить личность, данные продолжают требовать соответствующего правового и технического режима.

Компании нужно заранее определить, какие данные она обезличивает, каким методом, сохраняется ли ключ, кто имеет к нему доступ, можно ли восстановить субъекта и как это отражено во внутренних документах. Для ИИ-проектов особенно важно оценивать эти вопросы до обучения модели, потому что после обучения проверить удаление вклада конкретного человека крайне сложно.

Обезличивание становится не формальной процедурой, а проверкой зрелости работы с данными. Именно такой подход «ГИГАНТ — Компьютерные системы» считает наиболее надежным для компаний, которые хотят использовать данные в аналитике, не выходя за рамки закона.

Автор: ГИГАНТ

Компания «ГИГАНТ Компьютерные системы» — аккредитованная IT-компания. Внедряем информационные и инженерные системы на основе собственных технологических разработок и решений мировых лидеров.

Комментарии: