DLP - OCR

Использовать распознавание текста на изображениях (OCR)
Если опция включена, то в DLP-операциях при наличии отдельных изображений или изображений внутри файлов-документов, будет происходить преобразование изображения в текст для последующего текстового DLP-анализа.
Основные настройки DLP на клиенте делаются на этой странице, а сам процесс OCR происходит на сервере, настройки здесь.

Максимальное время ожидания на документ в секундах
Важно понимать, что процесс OCR может занимать значительное время, поэтому иногда имеет смысл настроить максимальное время ожидания (на весь документ).
Например, при большой нагрузке на сервер по истечении времени ожидания в качестве результата OCR будет возвращен текст "OCR timeout", который при желании вы сможете использовать в списках DLP-чувствительности. Пользователь в таком случае сможет повторить отправку файла еще раз (если настроена блокировка отправки).
Если чувствительность к фразе "OCR timeout" не установить, то в случае таймуата это будет просто означать что в документе с графическими изображениями будут распознаны не все изображения и извлечение текста будет не полным.
Для индикации процесса анализа документа пользователю выдается окошко на экране. Настройки производятся на этой странице.

Минимальный и максимальный размер изображения в байтах
Для оптимизации можно задать диапазон размеров изображений для популярных графических форматов в байтах, чтобы не тратить время OCR на заведомо "бесполезные" изображения.

Включить кэширование на клиентах
Позволяет сэкономить время и не отправлять на сервер изображения, которые уже были успешно распознаны ранее через OCR. Например, когда сотрудник отправляет один и тот же документ несколько раз. Сами изображения на клиенте не сохраняются в кэше, а только их короткие контрольные хэш-отпечатки.

v11.2.3541 (build: Feb 9 2026)
Введение +Структура комплекса +Установка комплекса +Удаление комплекса +Обновление комплекса -Глобальные настройки Пользователи базы -Настройки комплекса Общее описание настроек +Серверные настройки +Клиентские настройки (компьютера) -Клиентские настройки (пользователя) Общие настройки Мониторинг - Распознавание лица Мониторинг - Пользовательское время Мониторинг - Программы-сайты Мониторинг - Вводимый текст Мониторинг - Буфер обмена Мониторинг - Снимки экранов Мониторинг - Снимки экранов (доп.) Мониторинг - Печать на принтере Мониторинг - Файловые операции Мониторинг - Отправка файлов Мониторинг - Почта Мониторинг - Чаты-звонки Мониторинг - Теневое копирование Мониторинг - Черный ящик Мониторинг - Геолокация Мониторинг - Автопрослушка Запреты Угрозы DLP - Общие настройки DLP - Карантин DLP - Правила DLP - По форматам файлов DLP - OCR Критические программы-сайты Нетипичное поведение События События (видео) События (доп.) Аутсорсинг 2FA (сотрудник) Карантин-файлы Группы Структура компании Графики работы Досье сотрудников Синхронизация с Active Directory Анализатор рисков и производительности Шаблоны отчетов Цифровые отпечатки Тарифы Списки пользователей Работа с базой SQL-консоль Журнал +Прочее +Интерфейс и отчеты +Вопросы и ответы (FAQ) +Техподдержка	DLP - OCR Использовать распознавание текста на изображениях (OCR) Если опция включена, то в DLP-операциях при наличии отдельных изображений или изображений внутри файлов-документов, будет происходить преобразование изображения в текст для последующего текстового DLP-анализа. Основные настройки DLP на клиенте делаются на этой странице, а сам процесс OCR происходит на сервере, настройки здесь. Максимальное время ожидания на документ в секундах Важно понимать, что процесс OCR может занимать значительное время, поэтому иногда имеет смысл настроить максимальное время ожидания (на весь документ). Например, при большой нагрузке на сервер по истечении времени ожидания в качестве результата OCR будет возвращен текст "OCR timeout", который при желании вы сможете использовать в списках DLP-чувствительности. Пользователь в таком случае сможет повторить отправку файла еще раз (если настроена блокировка отправки). Если чувствительность к фразе "OCR timeout" не установить, то в случае таймуата это будет просто означать что в документе с графическими изображениями будут распознаны не все изображения и извлечение текста будет не полным. Для индикации процесса анализа документа пользователю выдается окошко на экране. Настройки производятся на этой странице. Минимальный и максимальный размер изображения в байтах Для оптимизации можно задать диапазон размеров изображений для популярных графических форматов в байтах, чтобы не тратить время OCR на заведомо "бесполезные" изображения. Включить кэширование на клиентах Позволяет сэкономить время и не отправлять на сервер изображения, которые уже были успешно распознаны ранее через OCR. Например, когда сотрудник отправляет один и тот же документ несколько раз. Сами изображения на клиенте не сохраняются в кэше, а только их короткие контрольные хэш-отпечатки.
© СТАХАНОВЕЦ