Псевдонимизация и обезличивание данных: в чем разница по закону и на практике

Вы когда-нибудь задумывались, почему ваши данные в базе маркетингового отдела выглядят как набор случайных цифр, но компания всё равно знает, кто вы? Или почему аналитики могут использовать огромные массивы информации о пользователях, не нарушая закон? Ответ кроется в тонкой грани между двумя понятиями, которые часто путают даже юристы и IT-специалисты: псевдонимизацией и обезличиванием. Разница между ними - это не просто терминология, а вопрос того, будете ли вы платить штрафы Роскомнадзора или сможете спокойно использовать данные для бизнеса.

В российской практике слово «обезличивание» используется очень широко, что создает массу проблем. Давайте разберемся, где заканчивается защита данных и начинается их свободное использование, опираясь на текст закона 152-ФЗ и международные стандарты.

Что говорит закон: определение из 152-ФЗ

В основе всего лежит Федеральный закон № 152-ФЗ «О персональных данных». В статье 3 этого документа есть четкое определение:

Обезличивание персональных данных - это действия, в результате которых становится невозможным без использования дополнительной информации определить принадлежность персональных данных конкретному субъекту персональных данных.

Ключевая фраза здесь - «без использования дополнительной информации». Это значит, что если у оператора (компании) есть этот самый «ключ» или дополнительная информация, позволяющая восстановить личность, то данные юридически остаются персональными. Они не исчезают из-под удара закона, они просто становятся сложнее для злоумышленника при утечке.

Многие компании ошибочно считают, что заменив имя клиента на код «User_123», они автоматически освобождаются от требований закона. Это опасный миф. Если рядом с этой базой лежит таблица соответствия «User_123 = Иван Иванов», то перед вами классическая псевдонимизация, которая в российском праве подпадает под широкое понятие обезличивания, но не меняет правовой статус данных.

Псевдонимизация: обратимый процесс

Термин «псевдонимизация» пришел к нам из европейского законодательства, в частности из Общего регламента по защите данных (GDPR - General Data Protection Regulation). Согласно статье 4 GDPR, псевдонимизация - это обработка данных таким образом, что их невозможно отнести к конкретному лицу без использования дополнительной информации, которая хранится отдельно и защищена техническими мерами.

Главная особенность псевдонимизации - её обратимость. Представьте, что вы заменяете номер паспорта клиента на уникальный хэш-код. Сам по себе хэш ничего не говорит о человеке. Но если у вас есть алгоритм или база, которая связывает этот хэш с оригинальным номером, вы можете в любой момент вернуть данные в исходный вид.

  • Как это работает: Прямые идентификаторы (ФИО, телефон, email) заменяются на токены или коды.
  • Где хранится ключ: Таблица соответствия (mapping table) хранится отдельно от основной базы данных, с усиленным доступом.
  • Правовой статус: Данные остаются персональными. На них распространяются все требования 152-ФЗ: нужно согласие, нужно соблюдать права субъекта, нужно защищать от утечек.

Этот метод идеален для тестирования ИТ-систем, обучения моделей машинного обучения или внутренней аналитики, где важно сохранить связь с клиентом, но минимизировать риски при компрометации основного контура.

Анонимизация: точка невозврата

Чтобы понять разницу, нужно ввести третье понятие - Анонимизация. В отличие от псевдонимизации, анонимизация - это необратимый процесс. После него восстановить личность субъекта невозможно ни оператору, ни третьим лицам, ни даже с помощью мощных вычислительных ресурсов.

Международный стандарт ISO 29100:2011 определяет анонимизацию так, что субъект больше не может быть идентифицирован напрямую или косвенно. В этом случае данные перестают быть персональными. Закон 152-ФЗ на них не распространяется. Вы можете продавать такие агрегированные данные, публиковать их в открытом доступе или передавать кому угодно без согласия человека.

Но достичь истинной анонимизации крайне сложно. Достаточно оставить в базе редкую комбинацию атрибутов - например, «женщина, 45 лет, живет в селе Н-ское, врач-кардиолог» - и личность можно будет установить через открытые источники (соцсети, реестры врачей). Поэтому чистая анонимизация встречается редко и требует серьезных усилий по обобщению данных.

Сравнение псевдонимизации и анонимизации в стиле мультфильма с щитом и бумагой

Сопоставление методов: таблица различий

Сравнение псевдонимизации, обезличивания (по 152-ФЗ) и анонимизации
Критерий Псевдонимизация (GDPR) Обезличивание (152-ФЗ) Анонимизация (ISO/GDPR)
Обратимость Обратима (при наличии ключа) Частично обратима (зависит от метода) Необратима
Статус данных Персональные данные Персональные данные (если есть возможность восстановления) Не являются ПДн
Применимость 152-ФЗ Да, полностью Да, полностью Нет
Хранение ключей Отдельно, с усиленной защитой Может отсутствовать или храниться отдельно Ключи уничтожаются
Риск реидентификации Высокий (если украден ключ) Зависит от метода (снизжен) Практически нулевой

Четыре способа обезличивания по приказу № 996

В России методы обезличивания регулируются не только самим законом, но и методическими рекомендациями, включая Приказ ФСТЭК № 996. Там выделяются четыре основных подхода, которые помогают снизить риск идентификации:

  1. Замена состава или семантики. Удаление лишних деталей. Например, вместо точной даты рождения оставляем только год, а вместо полного адреса - регион или город. Это снижает уникальность записи.
  2. Использование идентификаторов. То самое создание кодов и таблиц соответствия. Технически это псевдонимизация. Она позволяет работать с данными, сохраняя возможность вернуться к оригиналу при необходимости (например, для доставки товара).
  3. Декомпозиция. Разделение данных на разные блоки. Идентификационные данные (ФИО, паспорт) хранятся в одной системе, а поведенческие или финансовые данные - в другой. Связь между ними устанавливается только при строгом контроле доступа.
  4. Перемешивание (пермутация). Изменение порядка записей или агрегация данных по группам так, чтобы нельзя было однозначно сказать, чья именно это запись. Часто используется в статистических отчетах.

Важно понимать: применение этих методов само по себе не снимает с оператора ответственность. Если вы используете второй способ (идентификаторы), вы обязаны защищать таблицу соответствия так же тщательно, как и сами персональные данные.

Хакер пытается собрать личность из фрагментов обезличенных данных в серверной

Практические риски: почему «достаточно заменить имя» - ошибка

Представьте ситуацию: интернет-магазин решил «обезличить» базу клиентов для аналитики. Менеджер заменил имена на ID, но оставил номера телефонов и email-адреса. Злоумышленник получил доступ к этой базе. Легко ли ему найти конкретного человека? Нетрудно, ведь телефон и почта - это прямые идентификаторы.

Даже если убрать и телефон, и почту, но оставить редкие атрибуты, проблема сохраняется. Исследования показывают, что комбинация из трех-четырех параметров (пол, почтовый индекс, дата рождения) позволяет идентифицировать до 87% населения США. В России, с нашей структурой ФИО и регионов, процент может быть еще выше для определенных профессий или малых городов.

Поэтому простое удаление имени - это не обезличивание, а лишь первая ступень. Настоящая защита требует комплексного подхода: маскирование, обобщение, добавление «шума» в данные и строгий контроль доступа к ключам расшифровки.

Что выбрать бизнесу?

Выбор метода зависит от вашей цели:

  • Если вам нужно знать, кто клиент, (для доставки, поддержки, повторных продаж) - используйте псевдонимизацию. Храните ключи отдельно, шифруйте их, ведите журнал доступа. Помните, что данные остаются персональными, и 152-ФЗ действует в полную силу.
  • Если вам нужна только статистика, (сколько людей купило товар, средний чек по региону) - стремитесь к анонимизации. Удаляйте все прямые идентификаторы, обобщайте географические данные, агрегируйте результаты. Тогда вы сможете свободно использовать эти отчеты.
  • Для тестирования ПО - всегда используйте псевдонимизированные копии продакшн-баз. Никогда не грузите реальные данные клиентов в тестовые среды без замены идентификаторов.

Юристы рекомендуют строить внутреннюю политику так, как будто любые обработанные данные остаются персональными, пока вы не докажете обратное независимой экспертизой. Штрафы за нарушение 152-ФЗ растут, а проверки Роскомнадзора становятся более технически грамотными. Лучше перестраховаться и защитить ключи псевдонимизации, чем потом объяснять регулятору, почему ваши «обезличенные» данные привели к утечке личной информации тысяч пользователей.

Является ли псевдонимизация достаточной мерой защиты по 152-ФЗ?

Да, псевдонимизация признается одной из технических мер защиты персональных данных. Однако она не освобождает оператора от остальных обязанностей: получения согласия, обеспечения прав субъектов и защиты инфраструктуры. Данные остаются персональными, так как теоретически их можно деанонимизировать при наличии ключа.

Чем обезличивание отличается от анонимизации?

Главное отличие - в обратимости. Обезличивание по 152-ФЗ часто подразумевает возможность восстановления личности при наличии дополнительной информации (ключа). Анонимизация - это необратимый процесс, после которого личность восстановить невозможно никакими средствами. Анонимизированные данные не подпадают под действие закона о персональных данных.

Нужно ли согласие на обработку псевдонимизированных данных?

Да. Поскольку псевдонимизированные данные юридически остаются персональными (так как существует возможность их связи с конкретным лицом), для их обработки требуется такое же правовое основание, как и для обычных персональных данных, чаще всего - согласие субъекта.

Можно ли передавать обезличенные данные третьим лицам?

Если данные действительно обезличены в смысле 152-ФЗ (существует ключ восстановления), передача возможна только в рамках договора и при соблюдении условий первоначального согласия. Если же данные анонимизированы (необратимо), то они не являются персональными, и их передача не регулируется 152-ФЗ, но может подпадать под другие законы (о коммерческой тайне, например).

Какие методы обезличивания рекомендует ФСТЭК?

ФСТЭК в своих рекомендациях (в том числе связанных с Приказом № 996) выделяет замену семантики (обобщение данных), использование идентификаторов (псевдонимизацию), декомпозицию (разделение баз) и перемешивание (пермутацию) данных. Выбор метода зависит от целей обработки и требуемого уровня безопасности.