Выберите Инструменты > Создать PDF > Сканер > Автоопределение цветовой модели.
Сканируйте бумажные документы в формат PDF, а затем с помощью Acrobat преобразовывайте их в интеллектуальные файлы PDF с возможностью поиска и выбора текста.
Сканирование бумажного документа в формат PDF
Можно создать файл PDF непосредственно из бумажного документа с помощью сканера и программы Acrobat. В ОС Windows программа Acrobat поддерживает драйверы сканера TWAIN и драйверы Windows Image Acquisition (WIA). На платформе Mac OS программа Acrobat поддерживает TWAIN и функцию записи изображений (ICA).
В ОС Windows можно либо использовать функцию «Автоопределение цветовой модели» и позволить Acrobat определить тип содержимого бумажного документа, либо использовать другие предустановки по вашему решению («Черно-белый документ», «Документ в градациях серого», «Цветное изображение» и «Цветной документ»). Можно настроить предустановки сканирования или использовать параметр Заказное сканирование для сканирования документов, применяя параметры по выбору.
Предустановки сканирования доступны только для драйверов сканеров, поддерживающих режим Скрыть интерфейс сканера. Предустановки сканирования не предусмотрены в Mac OS.
В Windows, если на сканере установлен драйвер WIA, для создания документа PDF можно использовать кнопку Сканировать. Нажмите кнопку Сканировать. Затем в Windows выберите Adobe Acrobat из списка зарегистрированных приложений. В окне сканирования в Acrobat выберите сканер и предустановки либо нажмите Заказное сканирование.
Чтобы отсканировать бумажный документ в формат PDF с помощью Acrobat, выберите Инструменты > Создать PDF. Откроется окно Создать файл PDF из любого формата. Выберите Сканер для просмотра доступных параметров.
Windows:
Mac:
Сканирование бумажного документа в PDF с помощью параметра «Автоопределение цветовой модели» (ОС Windows)
-
Примечание.
Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.
- Установите флажок Добавить к существующему файлу.
- Если файлы открыты в Acrobat, выберите нужный файл в раскрывающемся списке, либо нажмите Обзор и откройте соответствующий файл.
Для сканирования нескольких файлов в PDF нажмите значок Настройки
. Откроется окно «Заказное сканирование». Установите флажок Предлагать сканировать другой документ.
-
Нажмите Сканировать.
-
При запросе сканирования нескольких страниц выберите «Сканировать несколько страниц», «Двустороннее сканирование» или «Сканирование завершено» и нажмите кнопку «ОК».
Сканирование бумажного документа в PDF с использованием предустановок (Windows)
-
Выберите Инструменты > Создать PDF > Сканер > [предустановки документа].
Примечание.Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.
- Установите флажок Добавить к существующему файлу.
- Если файлы открыты в Acrobat, выберите нужный файл в раскрывающемся списке, либо нажмите Обзор и откройте соответствующий файл.
Для сканирования нескольких файлов в PDF нажмите значок Настройки
. Откроется окно «Заказное сканирование». Установите флажок Предлагать сканировать другой документ.
-
Нажмите Сканировать.
-
При запросе сканирования нескольких страниц выберите «Сканировать несколько страниц», «Двустороннее сканирование» или «Сканирование завершено» и нажмите кнопку «ОК».
Сканирование бумажного документа в PDF без использования установок
-
Выберите Инструменты > Создать PDF > Сканер > Параметры по умолчанию или Мои пользовательские настройки.
Примечание.Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.
- Установите флажок Добавить к существующему файлу.
- Если файлы открыты в Acrobat, выберите нужный файл в раскрывающемся списке, либо нажмите Обзор и откройте соответствующий файл.
-
Для изменения настроек нажмите значок Настройки
. Откроется окно «Заказное сканирование». Выберите необходимые параметры сканирования.
Для сканирования нескольких файлов в PDF установите флажок Предлагать сканировать другой документ.
Примечание.Если выбрать параметр Показать пользовательский интерфейс сканера вместо интерфейса Acrobat, то отобразятся другие диалоговые окна. Сведения о доступных параметрах см. в документации по сканеру. В Mac OS всегда отображается пользовательский интерфейс сканера.
-
Нажмите Сканировать.
-
При запросе сканирования нескольких страниц выберите «Сканировать несколько страниц», «Двустороннее сканирование» или «Сканирование завершено» и нажмите кнопку «ОК».
Улучшение или оптимизация отсканированного документа PDF
-
Откройте файл PDF, созданный из отсканированного документа.
-
Выберите Инструменты > Сканирование и распознавание > Повышение качества > Отсканированный документ.
-
Выберите опции на дополнительной панели инструментов — нажмите значок Настройка
и выберите соответствующие опции в диалоговом окне «Улучшить отсканированный документ PDF», затем нажмите кнопку OK.
Дополнительные сведения об опциях, отображаемых в этом диалоговом окне, приведены в разделе Диалоговое окно «Улучшить отсканированный документ PDF».
Настройка установок сканера (Windows)
-
Выберите Инструменты > Создать PDF > Сканер.
-
Выберите предустановки: Автоопределение цветовой модели, Черно-белый документ, Цветной документ, Документ в градациях серого или Цветная фотография.
-
Нажмите значок Настройки
рядом с предустановками. В зависимости от выбранного параметра отображается окно Заказное сканирование или Изменить предварительно установленные настройки для.
-
При необходимости измените настройки.
Для сканирования нескольких файлов в PDF установите флажок Предлагать сканировать другой документ.
-
Нажмите Сохранить параметры, чтобы сохранить предустановки, затем нажмите кнопку с изображением крестика (X), чтобы закрыть окно.
Параметры сканирования
После выбора сканера можно по своему усмотрению выбрать или настроить различные параметры сканирования.
Диалоговое окно «Оптимизация отсканированного PDF»
В диалоговом окне Улучшить отсканированный документ PDF представлены элементы управления параметрами сжатия и фильтрации отсканированного изображения для документа PDF. Параметры по умолчанию подходят для широкого диапазона страниц документов, но при необходимости их можно изменить для повышения качества изображений, уменьшения размера файла или для настройки сканирования.
Диалоговое окно «Параметры распознавания текста»
Язык документа
По умолчанию язык текста для распознавания выбирается из региональных настроек, заданных по умолчанию. Чтобы изменить язык, нажмите «Редактирование» и выберите другой язык.
Вывод
«Изображение с поиском» или «Редактируемый текст и изображения».
Советы по сканированию
Сканирование из Acrobat принимает изображения с разрешением в диапазоне 10–3000 dpi. При выборе параметра Изображение в возможностью поиска или ClearScan в разделе Стиль вывода PDF требуется разрешение выводимого изображения не ниже 72 dpi. Кроме того, разрешение выводимого изображения, превышающее 600 dpi, будет уменьшено до 600 dpi или менее.
Сжатие изображения без потери качества может выполняться только с монохромными изображениями. Для сжатия отсканированного изображения без потери качества выберите в разделе «Параметры оптимизации» диалогового окна «Оптимизация отсканированного PDF» один из следующих параметров: «CCITT Group 4» или «JBIG2 (без потери качества)» для монохромных изображений. Если это изображение добавлено к документу PDF, можно сохранить файл с помощью параметра Сохранить; отсканированное изображение остается без сжатия. При сохранении документа PDF с помощью функции Сохранить как отсканированное изображение может быть сжато.
Для большинства страниц сканирование в черно-белом режиме при 300 dpi дает лучшие результаты для преобразования. При разрешении 150 dpi точность оптического распознавания символов несколько снижается и количество ошибок распознавания шрифта возрастает; при разрешении 400 dpi и выше обработка замедляется, а размер файлов со сжатыми страницами увеличивается. Если на странице содержится много нераспознанных слов или текст небольшого размера (9 пунктов и меньше), попытайтесь выполнить сканирование в более высоком разрешении. Когда это возможно, сканируйте в черно-белом режиме.
Если оптическое распознавание символов (OCR) выключено, можно использовать разрешением в диапазоне 10 – 3000 dpi, рекомендованное разрешение – 72 dpi и выше. Для параметра адаптивного сжатия рекомендуемые разрешения при сканировании: 300 dpi для изображений в градациях серого и RGB и 600 dpi для черно-белых изображений.
Страницы, отсканированные в режиме 24-разрядных цветов, 300 dpi, размером 8,5 х 11 дюймов (21,59 х 27,94 см) до сжатия представляют собой изображения большого размера (25 МБ). Системе может потребоваться 50 МБ виртуальной памяти и более для сканирования изображения. При разрешении 600 пикселей на дюйм процесс сканирования и обработки обычно происходит в четыре раза медленнее, чем при 300 dpi.
Избегайте настройки параметров полутонов и диффузионного смешения сканера. Это может улучшить внешний вид, но станет сложно распознавать текст.
Для текстов, распечатанных на цветной бумаге, рекомендуется увеличить яркость и контрастность примерно на 10%. Если сканер обеспечивает световую фильтрацию, следует подавить цвет фона при помощи специального фильтра или лампы. Или, если текст не подавляется, попробуйте настроить контрастность и яркость сканера, чтобы очистить отсканированный документ.
Если у сканера есть ручное управление яркостью, настройте его так, чтобы символы были четкими и имели правильную форму. Если символы соединены между собой, используйте более высокие параметры (более яркого цвета). Если символы разделены, используйте более низкие параметры (более темного цвета).
Устранение неполадок со сканером
Для исправления ошибок и решения проблем, связанных со сканером, обратитесь к следующей документации по устранению неполадок:
Распознавание текста отсканированных документов
Вы можете использовать Acrobat для распознавания текста в ранее отсканированных документах, которые уже были преобразованы в PDF. Функция распознавания текста позволяет искать, исправлять и копировать текст в отсканированном файле PDF. Для оптического распознавания символов в PDF исходное разрешение сканера должно составлять не менее 72 dpi.
Сканирование при 300 dpi дает лучшие результаты для преобразования. При разрешении 150 dpi точность OCR снижается.
Распознавание текста в отдельном документе
-
Откройте отсканированный файл PDF.
-
Выберите Инструменты > Сканирование и распознавание > Распознавание текста > В этом файле.
На дополнительной панели инструментов отображаются параметры распознавания текста.
-
На дополнительной панели инструментов выберите диапазон страниц и язык для распознавания текста.
-
Если нужно, нажмите Настройки, чтобы открыть диалоговое окно «Распознавание текста», и укажите необходимые настройки.
-
Нажмите Распознать текст. Acrobat создает слой текста в документе PDF, в котором можно искать или копировать и вставлять текст в новый документ.
Распознавание текста в нескольких документах
-
Выберите Инструменты > Сканирование и распознавание > Распознавание текста > В нескольких файлах.
-
В диалоговом окне «Распознавание текста» нажмите Добавить файлы и выберите команду Добавить файлы, Добавить папки или Добавить открытые файлы. Затем выберите файлы или папки.
-
В диалоговом окне Параметры вывода укажите папку и установки для имен файлов.
-
В диалоговом окне Общие параметры распознавания текста выберите необходимые настройки и нажмите кнопку ОК.
Acrobat создает слой текста в документе PDF, в котором можно искать или копировать и вставлять текст в новый документ.
Диалоговое окно «Общие параметры распознавания текста»
Язык документа
Задает язык для системы оптического распознавания символов с целью идентификации символов.
Вывод (стиль выходного файла PDF)
Определяет тип создаваемого документа PDF. Для всех параметров требуется, чтобы разрешение сканирования было не меньше 72 dpi или выше (рекомендуется). Во всех форматах оптическое распознавание символов и распознавание шрифтов и макета страницы применяется к текстовым изображениям, после чего они преобразуются в обычный текст.
Изображение с поиском
Устанавливает, что текст доступен для поиска и выделения. Данный параметр сохраняет исходное изображение, при необходимости выравнивает страницу и размещает над ним невидимый слой текста. Выбор параметра Понизить разрешение изображений в этом же диалоговом окне определяет, будет ли понижено разрешение изображения и до какой степени.
Изображение с поиском (точно)
Устанавливает, что текст доступен для поиска и выделения. Данный параметр сохраняет исходное изображение и размещает над ним невидимый слой текста. Рекомендуется в случаях, где необходима максимальная степень соответствия исходному изображению.
Редактируемый текст и изображения
Синтезирует новый пользовательский шрифт, максимально похожий на исходный, и сохраняет фон страницы, используя копию с низким разрешением.
Даунсамплинг
Понижает количество пикселей в цветных изображениях, изображениях в градациях серого и монохромных изображениях после завершения распознавания текста. Выберите степень понижения разрешения, которую нужно применить. Большее значение задает более высокий порог, с которого начинается обработка, и в итоге в документах PDF разрешение будет не ниже заданного в этом поле.
Правка распознанного текста в документах PDF
При выполнении оптического распознавания символов на отсканированном документе Acrobat анализирует растровые изображения текста и заменяет растровые области словами или символами. Если не найдено идеально подходящее слово, Acrobat отмечает слово как сомнительное. Сомнительные элементы отображаются в PDF как исходное растровое изображение слова, но текст содержится на невидимом слое за растровым изображением слова. Этот метод делает слово доступным для поиска даже в том случае, если отображается его растровое изображение.
Примечание. Если попытаться выделить текст в отсканированном документе PDF без применения оптического распознавания символов или выполнении действия Чтение вслух с файлом изображения, программа Acrobat отобразит запрос о запуске оптического распознавания символов. Если нажать кнопку «ОК», откроется диалоговое окно Распознавание текста, в котором можно выбрать параметры, подробно описанные в предыдущем разделе.
-
Выберите Инструменты > Сканирование и распознавание > Распознавание текста > Правильно распознанный текст.
Acrobat определяет возможные ошибки в тексте и отображает изображение и текст рядом друг с другом на дополнительной панели инструментов (все сомнительные слова на странице заключены в рамки).
-
Нажмите выделенный объект или поле в документе, а затем исправьте его в поле определяется как на дополнительной панели инструментов. Нажмите кнопку Принять.
Будет выделен следующий сомнительный элемент. Исправьте ошибки, если требуется. Нажимайте кнопку Принять для каждого исправления.
-
После завершения этой задачи нажмите кнопку Закрыть на дополнительной панели инструментов.