Сканируйте бумажные документы в формат PDF, а затем с помощью Acrobat преобразовывайте их в интеллектуальные файлы PDF с возможностью поиска и выбора текста.

Сканирование бумажного документа в PDF

Документ PDF можно создать непосредственно из бумажного документа с помощью сканера и программы Acrobat. В ОС Windows программа Acrobat поддерживает драйверы сканера TWAIN и драйверы Windows Image Acquisition (WIA). На платформе Mac OS программа Acrobat поддерживает TWAIN и функцию записи изображений (ICA).

В ОС Windows можно либо использовать функцию Автоопределение цветовой модели и позволить Acrobat определить тип содержимого бумажного документа, либо использовать другие предустановки по вашему желанию (Черно-белый документ, Документ в градациях серого, Цветное изображение и Цветной документ). Можно настроить предустановки сканирования или использовать параметр Заказное сканирование для сканирования документов, применяя параметры по выбору.

Примечание.

Предустановки сканирования доступны только для драйверов сканеров, поддерживающих режим Скрыть интерфейс сканера. Предустановки сканирования не предусмотрены в Mac OS.

В Windows, если на сканере установлен драйвер WIA, для создания документа PDF можно использовать кнопку Сканировать. Нажмите кнопку Сканировать. Затем в Windows выберите Adobe Acrobat из списка зарегистрированных приложений. В окне сканирования в Acrobat выберите сканер и предустановки либо нажмите Заказное сканирование.

Чтобы отсканировать бумажный документ в формат PDF с помощью Acrobat, выберите Инструменты > Создать PDF. Откроется окно Создать файл PDF из любого формата. Выберите Сканер для просмотра доступных параметров.

Windows:

Параметры сканирования бумажного документа в формат PDF
Окно создания PDF, раздел «Сканер». Нажмите значок настроек в виде шестеренки, чтобы отобразить все настройки для выбранного параметра.

Mac:

Параметры сканирования бумажного документа в формат PDF на Mac
Окно создания PDF, раздел «Сканер». Выберите сканер и затем нажмите «Далее», чтобы отобразить настройки для выбранного сканера.

Сканирование бумажного документа в PDF с помощью параметра «Автоопределение цветовой модели» (ОС Windows)

  1. Выберите Инструменты > Создать PDF > Сканер > Автоопределение цветовой модели.

    Примечание.

    Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.

    1. Установите флажок Добавить к существующему файлу.
    2. Если файлы открыты в Acrobat, выберите нужный файл в раскрывающемся списке, либо нажмите Обзор и откройте соответствующий файл.

    Для сканирования нескольких файлов в PDF нажмите значок Настройки . Откроется окно «Заказное сканирование». Установите флажок Предлагать сканировать другой документ.

  2. Нажмите Сканировать.

  3. При запросе сканирования нескольких страниц выберите Сканировать несколько страниц, Двустороннее сканирование или Сканирование завершено и нажмите кнопку ОК.

Сканирование бумажного документа в PDF с использованием предустановок (Windows)

  1. Выберите Инструменты > Создать PDF > Сканер > [предустановки документа].

    Примечание.

    Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.

    1. Установите флажок Добавить к существующему файлу.
    2. Если файлы открыты в Acrobat, выберите нужный файл в раскрывающемся списке, либо нажмите Обзор и откройте соответствующий файл.

    Для сканирования нескольких файлов в PDF нажмите значок Настройки . Откроется окно «Заказное сканирование». Установите флажок Предлагать сканировать другой документ.

  2. Нажмите Сканировать.

  3. При запросе сканирования нескольких страниц выберите Сканировать несколько страниц, Двустороннее сканирование или Сканирование завершено и нажмите кнопку ОК.

Сканирование бумажного документа в PDF без использования установок

  1. Выберите Инструменты > Создать PDF > Сканер > Параметры по умолчанию или Мои пользовательские настройки.

    Примечание.

    Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.

    1. Установите флажок Добавить к существующему файлу.
    2. Если файлы открыты в Acrobat, выберите нужный файл в раскрывающемся списке, либо нажмите Обзор и откройте соответствующий файл.

  2. Для изменения настроек нажмите значок  Настройки   . Откроется окно «Заказное сканирование». Выберите необходимые параметры сканирования.

    Для сканирования нескольких файлов в PDF установите флажок Предлагать сканировать другой документ.

    Примечание.

    Если выбрать параметр Показать пользовательский интерфейс сканера вместо интерфейса Acrobat, то отобразятся другие диалоговые окна. Сведения о доступных параметрах см. в документации по сканеру. В Mac OS всегда отображается пользовательский интерфейс сканера.

  3. Нажмите Сканировать.

  4. При запросе сканирования нескольких страниц выберите Сканировать несколько страниц, Двустороннее сканирование или Сканирование завершено и нажмите кнопку ОК.

Улучшение или оптимизация отсканированного документа PDF

  1. Откройте файл PDF, созданный из отсканированного документа.
  2. Выберите Инструменты > Повысить качество сканирования > Повышение качества > Отсканированный документ.

  3. Выберите опции на дополнительной панели инструментов — нажмите значок Настройка  и выберите соответствующие опции в диалоговом окне «Улучшить отсканированный документ PDF», затем нажмите кнопку OK.

    Дополнительные сведения об опциях, отображаемых в этом диалоговом окне, приведены в разделе Диалоговое окно «Улучшить отсканированный документ PDF».

Настройка установок сканера (Windows)

  1. Выберите Инструменты > Создать PDF > Сканер.

  2. Выберите предустановки: Автоопределение цветовой модели, Черно-белый документ, Цветной документДокумент в градациях серого или Цветная фотография.

  3. Щелкните значок Настройки рядом с предустановками. В зависимости от выбранного параметра отображается окно Заказное сканирование или Изменить предварительно установленные настройки для.

  4. При необходимости измените настройки.

    Для сканирования нескольких файлов в PDF установите флажок Предлагать сканировать другой документ.

  5. Нажмите Сохранить параметры, чтобы сохранить предустановки, затем щелкните кнопку в виде крестика (X), чтобы закрыть окно.

Параметры сканирования

После выбора сканера можно по своему усмотрению выбрать или настроить различные параметры сканирования.

Нажмите, чтобы отобразить все параметры сканирования

Сканер

Выберите установленный сканер. На компьютере должно быть установлено программное обеспечение от производителя сканера. Только в Windows: нажмите кнопку Параметры для указания параметров сканера.

Показать пользовательский интерфейс сканера

Выберите этот параметр, только если необходимо отобразить настройки в диалоговых окнах программы, предоставленной производителем сканера. Если этот параметр не выбран, сканирование начнется с использованием параметров, указанных в окне Заказное сканирование или Изменить предварительно установленные настройки.

Страницы

Укажите одностороннее или двухстороннее сканирование. Если выбрано значение С обеих сторон, но в собственных параметрах сканера указано сканирование страниц только с одной стороны, то параметры сканера заменят параметры Acrobat.

Примечание.

Двухстороннее сканирование можно выполнять, даже если сам сканер не поддерживает двухстороннее сканирование. При выборе параметра С обеих сторон после сканирования первых сторон появится диалоговое окно. Можно сложить в лоток сканируемые страницы документа в обратном порядке и выбрать параметр Сканировать обратную сторону (Обратный порядок страниц) в диалоговом окне. При этом создается документ PDF со всеми страницами в правильной последовательности.

Цветовая модель (только Windows)

Выберите одну из стандартных цветовых моделей (автоопределение, цветное, черно-белое или градации серого), поддерживаемых сканером. Данный параметр включен, если в параметрах сканера указано использование диалогового окна «Acrobat Scan» вместо приложения сканера.

Разрешение (только Windows)

Выберите разрешение, поддерживаемое сканером. Данный параметр включен, если в параметрах сканера указано использование диалогового окна «Acrobat Scan» вместо приложения сканера.

Примечание.

Если выбрать Цветовой режим или Разрешение, не поддерживаемые используемым сканером, то появится сообщение и откроется окно приложения сканера. Выберите другие параметры в окне приложения сканера.

Размер бумаги (только Windows)

Выберите размер бумаги или укажите собственные значения ширины и высоты.

Предлагать сканировать другой документ

Если такой режим выбран, диалоговое окно, запрашивающее сканирование дополнительных страниц, будет отображаться после каждого сеанса сканирования.

Качество > Оптимизация изображения

Выберите этот параметр для запуска процесса оптимизации документа PDF. Этот параметр используется для сжатия и фильтрации изображений отсканированного PDF. Нажмите значок Настройки , чтобы настроить оптимизацию с помощью параметров сжатия файла и фильтрации.

Качество > Оптимизация изображения > Малый размер/высокое качество

Перетащите ползунок для настройки баланса между размером файла и качеством.

Вывод > Добавить к существующему файлу

Добавление преобразованного отсканированного изображения к существующему файлу PDF. Выберите открытый файл из раскрывающегося списка или найдите и выберите нужный файл PDF.

Вывод > Создать новый PDF-файл

Создание документа PDF.

Вывод > Сохранить файлы

Создание нескольких файлов из нескольких бумажных документов. Нажмите значок Настройки и укажите требующиеся параметры: создание портфолио PDF из файлов, количество страниц в каждом файле и префикс имени файла.

Распознавание текста (OCR)

Выберите этот параметр для преобразования изображений с текстом, содержащихся в файле PDF, в текст с возможностью поиска и выбора. Данный параметр выполняет оптическое распознавание символов (OCR), а также распознавание шрифтов и макета страницы для изображения с текстом. Нажмите значок Настройки , чтобы указать необходимые параметры в диалоговом окне Распознавание текста - Настройки. См. Распознавание текста отсканированных документов.

Добавить метаданные

Если этот параметр выбран, то после сканирования появляется диалоговое окно Свойства документа. В диалоговом окне Свойства документа можно добавлять метаданные или сведения об отсканированном документе в файл PDF. При создании нескольких файлов можно ввести общие метаданные для всех файлов.

Соответствие стандарту PDF/A

Выберите данный параметр, чтобы обеспечить соответствие создаваемого документа PDF стандартам ISO для PDF/A-1b.

Диалоговое окно «Оптимизация отсканированного PDF»

В диалоговом окне Улучшить отсканированный документ PDF представлены элементы управления параметрами сжатия и фильтрации отсканированного изображения для PDF-документа. Параметры по умолчанию подходят для широкого диапазона страниц документов, но при необходимости их можно изменить для повышения качества изображений, уменьшения размера файла или для настройки сканирования.

Нажмите, чтобы отобразить все параметры повышения качества изображений

Применить адаптивное сжатие

Разделяет каждую страницу на черно-белые, цветные и области в градациях серого и выбирает режим, в котором сохраняется внешний вид при высокой степени сжатия каждого типа содержимого. Рекомендуемое разрешение сканирования — 300 точек на дюйм (dpi) для RGB-изображений и изображений в градациях серого; 600 dpi для черно-белого изображения.

Цветное сканирование/Сканирование в градациях серого

При сканировании цветных страниц или страниц в градациях серого выберите один из следующих параметров:

JPEG2000

Применяет сжатие JPEG2000 к цветному содержимому изображения (использование этой настройки не рекомендуется при создании файлов PDF/A; вместо этого используйте формат JPEG).

ZIP

Применяет сжатие ZIP к цветному содержимому изображения.

JPEG

Применяет сжатие JPEG к цветному содержимому изображения.

Примечание.

Сканер использует выбранный параметр Цветное/Градации серого либо параметр Монохромное. Выбор зависит от параметров, указанных в диалоговом окне Сканирование Acrobat или в интерфейсе сканера TWAIN, который открывается при нажатии кнопки Сканировать в диалоговом окне Сканирование Acrobat. (по умолчанию диалоговое окно приложения сканера не открывается).

Монохромное сканирование

При сканировании черно-белых или однотонных страниц выберите один из следующих параметров.

JBIG2 (без потери качества) и JBIG2 (с потерями качества)

Применяет способ сжатия JBIG2 для входных черно-белых страниц. При значениях параметров высокого уровня качества используется сжатие без потерь; при низких значениях текст сжимается сильнее. Текстовые страницы обычно на 60% меньше, чем сжатые по алгоритму CCITT Group 4 страницы, но процесс сжатия занимает больше времени. Совместимый с Acrobat 5.0 (PDF 1.4) и более поздними версиями.

Примечание.

Для совместимости с Acrobat версии 4.0 используйте метод сжатия, отличный от JBIG2.

CCITT Group 4

Применяет сжатие по алгоритму CCITT Group 4 для черно-белых входных изображений страниц. Этот быстрый способ сжатия без потерь совместим с Acrobat 3.0 (PDF 1.2) и более поздними версиями.

Небольшой объем/Высокое качество

Настройка баланса между размером файла и качеством.

Выровнять страницу

Поворачивает любую страницу, стороны которой не перпендикулярны сторонам области сканирования, для вертикального выравнивания страницы PDF. Выберите Вкл или Выкл.

Удаление фона

Окрашивает в белый цвет близкие к белому области при цветном входном изображении или изображении в градациях серого (но не для черно-белых изображений).

Примечание.

Для наилучших результатов настройте параметры контрастности и яркости сканера, чтобы на отсканированной обычной черно-белой странице текст был темно-серого или черного цвета, а фон был белым. Тогда при выбранных параметрах Выкл или Низкое результаты будут лучше. При сканировании белого документа с желтым оттенком или газетной бумаги выберите параметры Среднее или Высокое для очистки страницы.

Удаление растра

Удаляет структуру полутоновых точек, которая может снизить степень сжатия JPEG, вызвать муар и сделать текст трудным для распознавания. Подходит для сканирования с разрешением 200–400 dpi RGB-изображений и изображений в градациях серого, для параметра Адаптивное сжатие и при сканировании с разрешением от 400 до 600 dpi черно-белых изображений. При выборе параметра Вкл (рекомендуется) применяется фильтр для сканирования с разрешением 300 dpi (или выше) RGB-изображений и изображений в градациях серого. Выберите Выкл при сканировании страницы без иллюстраций или заполненных областей или при сканировании с разрешением выше, чем в рабочем диапазоне.

Четкость текста

Делает текст отсканированного файла PDF более четким. Значение по умолчанию (низкое качество) подходит для большинства документов. Увеличьте его, если качество печатаемого документа низкое, а текст неясен.

Диалоговое окно «Параметры распознавания текста»

Язык документа

По умолчанию язык текста для распознавания выбирается из региональных настроек, заданных по умолчанию. Чтобы изменить язык, щелкните «Редактирование» и выберите другой язык.

Вывод

«Изображение с поиском» или «Редактируемый текст и изображения». 

Советы по сканированию

  • Сканирование из Acrobat принимает изображения с разрешением в диапазоне 10–3000 dpi. При выборе параметра Изображение в возможностью поиска или ClearScan в разделе Стиль вывода PDF требуется разрешение выводимого изображения не ниже 72 dpi. Кроме того, разрешение выводимого изображения, превышающее 600 dpi, будет уменьшено до 600 dpi или менее.

  • Для сжатия отсканированного изображения без потери качества выберите в разделе Параметры оптимизации диалогового окна Оптимизация отсканированного PDF один из следующих параметров: CCITT Group 4 для монохромных изображений или Без потери качества для цветных изображений и изображений в градациях серого. Если это изображение добавлено к документу PDF, можно сохранить файл с помощью параметра Сохранить; отсканированное изображение остается без сжатия. При сохранении документа PDF с помощью функции Сохранить как отсканированное изображение может быть сжато.

  • Для большинства страниц сканирование в черно-белом режиме при 300 dpi дает лучшие результаты для преобразования. При разрешении 150 dpi точность оптического распознавания символов несколько снижается и количество ошибок распознавания шрифта возрастает; при разрешении 400 dpi и выше обработка замедляется, а размер файлов со сжатыми страницами увеличивается. Если на странице содержится много нераспознанных слов или текст с малым размером (9 пунктов и меньше), попытайтесь выполнить сканирование при более высоком разрешении. Когда это возможно, сканируйте в черно-белом режиме.

  • Если функция Оптическое распознавание символов выключена, можно использовать разрешением в диапазоне 10–3000 dpi, рекомендованное разрешение — 72 dpi и выше. Для параметра адаптивного сжатия рекомендуемые разрешения при сканировании: 300 dpi для изображений в градациях серого и RGB и 600 dpi для черно-белых изображений.

  • Страницы, отсканированные в режиме 24-разрядных цветов, 300 dpi, размером 8,5 х 11 дюймов (21,59 х 27,94 см) до сжатия представляют собой изображения большого размера (25 МБ). Системе может потребоваться 50 МБ виртуальной памяти и более для сканирования изображения. При разрешении 600 dpi процесс сканирования и обработки обычно происходит в четыре раза медленнее, чем при 300 dpi.

  • Избегайте настройки параметров полутонов и диффузионного смешения сканера. Это может улучшить внешний вид, но станет сложно распознавать текст.

  • Для текстов, распечатанных на цветной бумаге, рекомендуется увеличить яркость и контрастность примерно на 10%. Если сканер обеспечивает световую фильтрацию, следует при помощи специального фильтра или лампы попробовать подавить цвет фона. Или, если текст не подавляется, попробуйте настроить контрастность и яркость сканера, чтобы очистить отсканированный документ.

  • Если сканер имеет ручное управление яркостью, настройте его так, чтобы символы были четкими и имели правильную форму. Если символы соединены между собой, используйте более высокие параметры (более яркого цвета). Если символы разделены, используйте более низкие параметры (более темного цвета).

Устранение неполадок со сканером

Советы по устранению неполадок приведены в разделе Устранение неполадок со сканером при сканировании в Acrobat.

Распознавание текста отсканированных документов

Можно использовать Acrobat для распознавания текста в ранее отсканированных документах, которые уже были преобразованы в формат PDF. Функция распознавания текста позволяет искать, исправлять и копировать текст в отсканированном документе PDF. Для оптического распознавания символов в PDF исходное разрешение сканера должно составлять не менее 72 dpi.

Примечание.

Сканирование при 300 dpi дает лучшие результаты для преобразования. При разрешении 150 dpi точность распознавания текста снижается.

Распознавание текста в отдельном документе

  1. Откройте отсканированный файл PDF.
  2. Выберите Инструменты > Повысить качество сканирования > Распознавание текста > В этом файле.

    На дополнительной панели инструментов отображаются параметры распознавания текста.

  3. На дополнительной панели инструментов выберите диапазон страниц и язык для распознавания текста.

  4. Если нужно, щелкните Настройки, чтобы открыть диалоговое окно «Распознавание текста», и укажите необходимые настройки.

  5. Щелкните Распознать текст. Acrobat создает слой текста в PDF-документе, в котором можно искать или копировать и вставлять текст в новый документ.

Распознавание текста в нескольких документах

  1. Выберите Инструменты > Повысить качество сканирования > Распознавание текста > В нескольких файлах.

  2. В диалоговом окне «Распознавание текста» нажмите Добавить файлы и выберите команду Добавить файлы, Добавить папки или Добавить открытые файлы. Затем выберите файлы или папки.

  3. В диалоговом окне Параметры вывода укажите папку и установки для имен файлов.
  4. В диалоговом окне Общие параметры распознавания текста выберите необходимые настройки и нажмите кнопку ОК.

    Acrobat создает слой текста в PDF-документе, в котором можно искать или копировать и вставлять текст в новый документ.

Диалоговое окно «Общие параметры распознавания текста»

Язык документа

Задает язык для системы оптического распознавания символов с целью идентификации символов.

Вывод (стиль выходного PDF-файла)

Определяет тип создаваемого документа PDF. Для всех параметров требуется, чтобы разрешение сканирования было не меньше 72 dpi или выше (рекомендуется). Во всех форматах оптическое распознавание символов и распознавание шрифтов и макета страницы применяется к текстовым изображениям, после чего они преобразуются в обычный текст.

Изображение с поиском

Устанавливает, что текст доступен для поиска и выделения. Данный параметр сохраняет исходное изображение, при необходимости выравнивает страницу и размещает над ним невидимый слой текста. Выбор параметра Понизить разрешение изображений в этом же диалоговом окне определяет, будет ли понижено разрешение изображения и до какой степени.

Изображение с поиском (точно)

Устанавливает, что текст доступен для поиска и выделения. Данный параметр сохраняет исходное изображение и размещает над ним невидимый слой текста. Рекомендуется в случаях, где необходима максимальная степень соответствия исходному изображению.

Редактируемый текст и изображения

Синтезирует новый пользовательский шрифт, максимально похожий на исходный, и сохраняет фон страницы, используя копию с низким разрешением.

Даунсамплинг

Понижает количество пикселей в цветных изображениях, изображениях в градациях серого и монохромных изображениях после завершения распознавания текста. Выберите степень понижения разрешения, которую нужно применить. Большее значение задает более высокий порог, с которого начинается обработка, и в итоге в документах PDF разрешение будет не ниже заданного в этом поле.

Правка распознанного текста в документах PDF

При выполнении оптического распознавания символов на отсканированном документе Acrobat анализирует растровые изображения текста и заменяет растровые области словами или символами. Если не найдено идеально подходящее слово, Acrobat отмечает слово как сомнительное. Сомнительные элементы отображаются в PDF как исходное растровое изображение слова, но текст содержится на невидимом слое за растровым изображением слова. Этот метод делает слово доступным для поиска даже в том случае, если отображается его растровое изображение.

Примечание. Если попытаться выделить текст в отсканированном PDF-документе без применения оптического распознавания символов или выполнении действия Чтение вслух с файлом изображения, программа Acrobat отобразит запрос о запуске оптического распознавания символов. Если нажать кнопку «ОК», откроется диалоговое окно Распознавание текста, в котором можно выбрать параметры, подробно описанные в предыдущем разделе.

  1. Выберите Инструменты > Повысить качество сканирования > Распознавание текста > Правильно распознанный текст.

    Acrobat определяет возможные ошибки в тексте и отображает изображение и текст рядом друг с другом на дополнительной панели инструментов (все сомнительные слова на странице заключены в рамки).

  2. Щелкните выделенный объект или поле в документе, а затем исправьте его в поле определяется как на дополнительной панели инструментов. Нажмите кнопку Принять.

    Будет выделен следующий сомнительный элемент. Исправьте ошибки, если требуется. Нажимайте кнопку Принять для каждого исправления.

  3. После завершения этой задачи нажмите кнопку Закрыть на дополнительной панели инструментов.

Эта работа лицензируется в соответствии с лицензией Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported  На посты, размещаемые в Twitter™ и Facebook, условия Creative Commons не распространяются.

Правовые уведомления   |   Политика конфиденциальности в сети Интернет