![]() v11.0.3429 (build: Nov 11 2025) |
|
|
|
DLP - OCRИспользовать распознавание текста на изображениях (OCR)Если опция включена, то в DLP-операциях при наличии отдельных изображений или изображений внутри файлов-документов, будет происходить преобразование изображения в текст для последующего текстового DLP-анализа. Основные настройки DLP на клиенте делаются на этой странице, а сам процесс OCR происходит на сервере, настройки здесь. Максимальное время ожидания на документ в секундах Важно понимать, что процесс OCR может занимать значительное время, поэтому иногда имеет смысл настроить максимальное время ожидания (на весь документ). Например, при большой нагрузке на сервер по истечении времени ожидания в качестве результата OCR будет возвращен текст "OCR timeout", который при желании вы сможете использовать в списках DLP-чувствительности. Пользователь в таком случае сможет повторить отправку файла еще раз (если настроена блокировка отправки). Если чувствительность к фразе "OCR timeout" не установить, то в случае таймуата это будет просто означать что в документе с графическими изображениями будут распознаны не все изображения и извлечение текста будет не полным. Для индикации процесса анализа документа пользователю выдается окошко на экране. Настройки производятся на этой странице. Минимальный и максимальный размер изображения в байтах Для оптимизации можно задать диапазон размеров изображений для популярных графических форматов в байтах, чтобы не тратить время OCR на заведомо "бесполезные" изображения. Включить кэширование на клиентах Позволяет сэкономить время и не отправлять на сервер изображения, которые уже были успешно распознаны ранее через OCR. Например, когда сотрудник отправляет один и тот же документ несколько раз. Сами изображения на клиенте не сохраняются в кэше, а только их короткие контрольные хэш-отпечатки. |
| © СТАХАНОВЕЦ | |