Распознавание текста отсканированных документов

Последнее обновление 6 нояб. 2025 г.

Узнайте, как распознавать текст и делать его доступным для поиска в отсканированных PDF-документах с помощью Adobe Acrobat.

При сканировании бумажного документа в PDF полученный файл содержит только данные изображения, а не текст с поддержкой поиска. Используйте функцию оптического распознавания символов (OCR) в Acrobat для преобразования текста изображения в доступный для выделения и поиска текст.

Перед редактированием отсканированного PDF удалите все ограничения безопасности. Узнайте, как включить или отключить защищенный просмотр. Узнайте, как восстановить доступ к заблокированным PDF.

Совет.

Сохраните резервную копию исходного отсканированного файла PDF перед редактированием, чтобы при необходимости можно было его восстановить.

Распознавание текста в отдельном документе

Откройте отсканированный PDF и выберите Все инструменты > Сканирование и OCR.

Выберите В этом файле.

В диалоговом окне выберите диапазон страниц и язык для распознавания текста.

Можно выбрать Настройки для указания дополнительных параметров.

Выберите Распознать текст.

Acrobat создает слой доступного для поиска текста в вашем PDF.

Распознавание текста в нескольких документах

Выберите Все инструменты > Сканирование и распознавание.

Выберите В нескольких файлах.

В диалоговом окне Распознать текст выберите Добавить файлы и выберите PDF, которые вы хотите обработать.

В диалоговом окне Параметры вывода укажите целевую папку для обработанных файлов и установки для имен файлов. Нажмите ОК.

В диалоговом окне Общие параметры распознавания текста выберите необходимые настройки и нажмите ОК.

Acrobat обрабатывает выбранные документы и создает версии в указанной папке вывода.

После запуска функции OCR просмотрите документ, чтобы убедиться в точности и полноте текста. При необходимости исправьте ошибки вручную или повторно запустите OCR с измененными настройками.