Традиционные системы защиты от утечек данных (DLP) работали по чётким правилам. Они искали определённые шаблоны, например, номер паспорта. Сейчас этого недостаточно. Данных стало больше, а методы их кражи — сложнее.
Искусственный интеллект (ИИ) и машинное обучение (МО) меняют DLP. Они превращают их из простых фильтров в умные системы, которые учатся, предсказывают угрозы и понимают контекст. Это особенно важно для российских компаний, которым нужно соответствовать требованиям ФСТЭК и законам о персональных данных.
Как работает машинное обучение в DLP
Основная задача — не просто найти совпадение с шаблоном, а понять, насколько опасна ситуация. Понимание контекста. Система анализирует не только данные, но и действия сотрудника. Она знает, что для бухгалтера нормально работать с финансовыми отчётами, а для программиста — с исходным кодом. Если бухгалтер начнёт массово копировать код, система это заметит.
- Анализ поведения
Система изучает привычки каждого пользователя: когда он работает, к каким файлам обращается. Резкое изменение в поведении (например, скачивание большого объёма данных в нерабочее время) будет сигналом.
- Обучение под бизнес
Систему можно настроить под особенности компании. Она учится на реальных данных организации, что сильно снижает количество ложных тревог.
Распознавание данных в картинках и скриншотах
Часто данные утекают через фотографии экрана или сканы документов. Обычная DLP этого не видит. Но ей помогает технология OCR. Система с помощью ИИ может читать текст с изображений. Она найдёт номер договора на скриншоте или паспортные данные на фотографии документа.
Пример: Сотрудник делает снимок экрана с таблицей клиентов и отправляет его в мессенджер.
Система с ИИ:
- Прочитает текст на картинке.
- Поймёт, что это конфиденциальная информация.
- Заблокирует отправку и сообщит в отдел безопасности.
- Проведет автоматическую сортировку данных
- Поможет определить тип документа и его секретность.
Как это работает
Система анализирует текст: темы, ключевые слова, структуру. Она отличает финансовый отчёт от технического задания и назначает им правильный уровень конфиденциальности. Польза — документы сразу получают нужную защиту. Не нужно полагаться только на пометки сотрудников, которые могут ошибиться или забыть.
Сокращение ложных срабатываний
Главная проблема старых DLP — много ложных тревог. ИИ решает её.
Оценка риска: система не просто блокирует действие, а оценивает его опасность с учётом контекста. Отправка файла с клиентами будет нормальной для менеджера по продажам, но подозрительной для системного администратора.
Результат: Количество ложных срабатываний падает на 70-90%. Специалисты по безопасности тратят время на реальные угрозы, а не на разбор ложных сигналов.
Примеры из практики (программный комплекс «Стахановец»)
В IT-компании: Система с ИИ научилась находить исходный код на скриншотах, которые сотрудники отправляли в чаты. Было остановлено 89% таких попыток утечки.
В фармацевтической компании: ИИ автоматически сортирует документы: клинические исследования, формулы лекарств, финансовые отчёты. Точность — 96%. Экономится время на ручную работу.
В международной компании: Сотрудники работают из разных стран. Система научилась отличать нормальную работу из-за границы от взлома учётной записи. Ложные срабатывания упали с 92% до 12%.
Что важно учесть при внедрении
- Обучение системы. ИИ нужно время (2-4 недели), чтобы изучить данные и процессы компании. Важно настроить её на ваших примерах.
- Начинать с мониторинга. Сначала запустить систему в режиме наблюдения, чтобы проверить её работу и отрегулировать настройки. Только потом включать блокировку.
- Постоянная настройка. Бизнес меняется. Нужно регулярно проверять, как работает система, и при необходимости её обновлять.
Сложности и ограничения
- Нужны хорошие данные. Качество работы ИИ зависит от данных, на которых его обучали. Если данные неполные или с ошибками, система будет работать плохо.
- Сложно объяснить решение. Иногда трудно понять, почему ИИ принял то или иное решение. Это может вызывать вопросы у регуляторов.
- Новые виды атак. Злоумышленники могут пытаться обмануть ИИ, например, подавая ему специально искажённые данные.
Развитие технологий: прогноз на 2026 год и дальнейшие тренды
- Больше автоматизации. Системы будут не только находить угрозы, но и самостоятельно на них реагировать: блокировать, изолировать устройства.
- Защита от генеративного ИИ. Появится контроль за тем, чтобы сотрудники не передавали секретные данные в публичные ИИ-сервисы, такие как ChatGPT.
- Совместное обучение без обмена данными. Технологии позволят компаниям улучшать свои системы защиты, обучая их на общих анонимных сведениях, не раскрывая своих данных.
Новые возможности DLP с искусственным интеллектом
Искусственный интеллект делает DLP эффективнее. Системы теперь могут видеть угрозы там, где их раньше не замечали, в картинках, в изменении поведения сотрудников. Они точно сортируют данные и почти не отвлекают ложными тревогами. Для российского бизнеса это шанс усилить защиту информации в соответствии с растущими требованиями государства. Успех зависит от правильного выбора системы, её внимательной настройки и постоянного контроля.
