Борис
Лопатухин

генеральный директор компании "Легалтэк"
© ComNews
29.06.2026

Конфликт между прогрессом и приватностью

Стремительное развитие юридических технологий (LegalTech) и внедрение нейросетей в работу юристов столкнулись с интересной проблемой. Чтобы научить искусственный интеллект предсказывать решения судов или безупречно составлять договоры, в него необходимо загрузить миллионы реальных судебных дел и контрактов. Но эти документы содержат огромное количество личных данных реальных людей: ФИО, адреса, номера паспортов. Генеральный директор компании "Легалтэк" Борис Лопатухин рассказал, как сохранить анонимность в цифровой среде.

Закон строг: 152-ФЗ надежно охраняет нашу приватность. Собрать письменные разрешения от каждого истца или ответчика из исторических архивов просто невозможно. Как же ИИ извлекает из документов правовую суть и логику судьи, при этом навсегда "забывая" личности участников? На помощь приходит деперсонализация.

Закон и новые правила

К 2026 году государство максимально жестко взялось за защиту личных данных. За крупную утечку компании грозят колоссальные штрафы — от 15 млн рублей или даже процент от всей годовой выручки бизнеса.

Главное новшество заключается в том, что обычное шифрование больше не считается надежным способом скрыть человека. Логика регулятора проста: если есть шифр, значит, где-то есть и ключ, а ключ можно украсть. Поэтому с 1 сентября 2025 года вступил в силу Приказ Роскомнадзора № 140. Он оставил бизнесу только 5 легальных способов удалить персональные данные из документа перед тем, как отдать его нейросети.

Пять законных способов скрыть личность

Согласно новым правилам, чтобы легально обучать алгоритмы, компании используют один из этих методов (или их комбинацию):

  1. Замена на идентификаторы. Настоящие имена меняются на необратимые коды. Например, "Иванов Петр Сергеевич" в тексте судебного решения превращается в безликого "Истец ID_45". Таблица-переводчик, которая знает, кто скрывается за этим ID, безопасно хранится на изолированном сервере.
  2. Удаление излишней точности (генерализация). Из текста убирают конкретику, оставляя лишь общий смысл. Вместо точного адреса "г. Москва, ул. Ленина, д. 5, кв. 12" алгоритм оставит просто "жилое помещение в Москве". Точные даты рождения превращаются просто в "возраст от 30 до 40 лет".
  3. Принцип "разделяй и властвуй" (декомпозиция). Информация о человеке и суть его дела разрываются. Фабула дела уходит на серверы для обучения ИИ, а справочник с реальными именами запирается в другой базе данных. Собрать данные воедино можно только по строжайшему внутреннему регламенту.
  4. Перемешивание. Данные в таблицах хаотично меняются местами, разрушая связи. Для связных юридических текстов это применяется редко, зато отлично работает при анализе больших списков штрафов или банкротств.
  5. Обобщение (агрегация). Система выдает ИИ только сухую статистику. Нейросеть видит данные в формате: "в 78% случаев суды отменяют такие штрафы", не взаимодействуя ни с одним конкретным профилем человека.

Математика против злоумышленников

Чтобы доказать Роскомнадзору, что данные надежно скрыты, IT-специалисты используют продвинутую криптографию, в частности — хеширование. В России для этого утвержден национальный стандарт — алгоритм ГОСТ Р 34.11-2012 (известный как "Стрибог").

В чем разница между обычным шифрованием и хешированием?

Шифрование — это сейф: если у вас есть ключ, вы легко достанете содержимое. А хеширование — это математическое преобразование в один конец. Вы пропускаете через алгоритм ФИО человека и получаете уникальный набор символов (хеш). Но обратить этот процесс вспять и получить из этих символов изначальное имя невозможно по законам математики. Это значит, что даже если хакеры взломают базу данных LegalTech-компании, они увидят лишь бессмысленные наборы цифр и букв.

Интеграция с государственными "озерами данных"

В 2025 году государство запустило Единую информационную платформу (ЕИП НСУД). По сути, это гигантское, защищенное "озеро данных".

Теперь Минцифры может потребовать от IT-компаний обезличить их накопленные базы и передать в эту государственную систему. Но у каждого гражданина есть законный инструмент контроля: мы имеем право получить уведомление об этом и наложить полный запрет на использование своих данных даже в обезличенном виде.

Для бизнеса эта система — кладезь ценнейшей информации для обучения ИИ. Однако доступ к этому государственному озеру имеют только проверенные российские компании без иностранного участия. Причем выгружать данные на свои компьютеры нельзя — нейросети должны обучаться прямо внутри безопасного государственного контура.

Баланс найден

Будущее юриспруденции уже наступило. Современные нейросети анализируют логику судей и правовые прецеденты, работая исключительно с сухими математическими абстракциями. Благодаря строгим правилам необратимого хеширования и 5 методам Роскомнадзора, разработчики создают умные сервисы, которые отлично помнят суть законов, но при этом навсегда забывают наши с вами имена.