Перед началом работы
Мы добавили новый и более интуитивно понятный интерфейс. Если показанный здесь экран не соответствует вашему интерфейсу, перейдите к справке по текущему интерфейсу.
Сканируйте бумажные документы в формат PDF, а затем с помощью Acrobat преобразовывайте их в интеллектуальные файлы PDF с возможностью поиска и выбора текста.
Перед началом работы
Мы добавили новый и более интуитивно понятный интерфейс. Если показанный здесь экран не соответствует вашему интерфейсу, перейдите к справке по текущему интерфейсу.
Можно создать файл PDF непосредственно из бумажного документа с помощью сканера и программы Acrobat. В ОС Windows программа Acrobat поддерживает драйверы сканера TWAIN и драйверы Windows Image Acquisition (WIA). На платформе Mac OS программа Acrobat поддерживает TWAIN и функцию записи изображений (ICA).
В ОС Windows можно либо использовать функцию «Автоопределение цветовой модели» и позволить Acrobat определить тип содержимого бумажного документа, либо использовать другие предустановки по вашему решению («Черно-белый документ», «Документ в градациях серого», «Цветное изображение» и «Цветной документ»). Можно настроить предустановки сканирования или использовать параметр Заказное сканирование для сканирования документов, применяя параметры по выбору.
Предустановки сканирования доступны только для драйверов сканеров, поддерживающих режим Скрыть интерфейс сканера. Предустановки сканирования не предусмотрены в Mac OS.
В ОС Windows, если на сканере установлен драйвер WIA, для создания файла PDF можно использовать кнопку Сканировать. Нажмите кнопку Сканировать. Затем в Windows выберите Adobe Acrobat в списке зарегистрированных приложений. Выберите сканер и стиль документа или Настраиваемое сканирование в окне интерфейса Acrobat.
Чтобы отсканировать бумажный документ в формат PDF с помощью Acrobat, выберите Все инструменты > Создать PDF. Откроется окно Создать файл PDF из любого формата . Выберите Сканер для просмотра доступных параметров.
Windows:
Mac:
Выберите Все инструменты > Создать PDF > Сканер > Автоопределение цветового режима.
Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.
Для сканирования нескольких файлов в PDF нажмите значок «Настройки» . Откроется окно «Заказное сканирование». Выберите Предлагать сканировать другой документ.
Нажмите Сканировать.
При запросе сканирования нескольких страниц выберите Сканировать несколько страниц, Двустороннее сканирование или Сканирование завершено и нажмите ОК.
Выберите Инструменты > Создать PDF > Сканер > [предустановки документа].
Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.
Для сканирования нескольких файлов в PDF нажмите значок «Настройки» . Откроется окно «Заказное сканирование». Выберите Предлагать сканировать другой документ.
Нажмите Сканировать.
При запросе сканирования нескольких страниц выберите Сканировать несколько страниц, Двустороннее сканирование или Сканирование завершено и нажмите ОК.
Выберите Посмотреть все инструменты > Создать PDF > Сканер > Настройки по умолчанию или Мои пользовательские настройки .
Чтобы добавить сканируемый документ к существующему файлу, выполните следующие действия.
Для изменения настроек нажмите значок «Настройки» . Откроется окно «Заказное сканирование». Выберите необходимые параметры сканирования.
Для сканирования нескольких файлов в PDF выберите Предлагать сканировать другой документ.
Если выбрать параметр Показать пользовательский интерфейс сканера вместо интерфейса Acrobat, то отобразятся другие диалоговые окна. Сведения о доступных параметрах см. в документации по сканеру. В Mac OS всегда отображается пользовательский интерфейс сканера.
Нажмите Сканировать.
При запросе сканирования нескольких страниц выберите Сканировать несколько страниц, Двустороннее сканирование или Сканирование завершено и нажмите ОК.
Выберите Все инструменты > Сканирование и распознавание > Улучшить отсканированный файл.
Выберите параметры на дополнительной панели инструментов — нажмите значок «Настройки» и соответствующие параметры в диалоговом окне Улучшить отсканированный документ PDF, затем нажмите OK.
Дополнительные сведения об опциях, отображаемых в этом диалоговом окне, приведены в разделе Диалоговое окно «Улучшить отсканированный документ PDF».
Выберите Все инструменты > Создать PDF > Сканер.
Выберите предварительно установленные настройки сканирования: Автоопределение цветового режима, Черно-белый документ, Цветной документ, Документ в градациях серого или Цветная фотография.
Нажмите значок «Настройки» рядом с стилем. В зависимости от выбранного параметра отображается окно Заказное сканирование или Изменить предварительно установленные настройки для.
Для сканирования нескольких файлов в PDF выберите Предлагать сканировать другой документ.
Нажмите Сохранить настройки для сохранения стиля.
После выбора сканера можно по своему усмотрению выбрать или настроить различные параметры сканирования.
В диалоговом окне Улучшить отсканированный документ PDF представлены элементы управления параметрами сжатия и фильтрации отсканированного изображения для документа PDF. Параметры по умолчанию подходят для широкого диапазона страниц документов, но при необходимости их можно изменить для повышения качества изображений, уменьшения размера файла или для настройки сканирования.
Язык документа
По умолчанию язык текста для распознавания выбирается из региональных настроек, заданных по умолчанию. Чтобы изменить язык, нажмите «Редактирование» и выберите другой язык.
Вывод
«Изображение с поиском» или «Редактируемый текст и изображения».
Сканирование из Acrobat принимает изображения с разрешением в диапазоне 10–3000 dpi. При выборе параметра Изображение с возможностью поиска или ClearScan в разделе Стиль вывода PDF требуется разрешение выводимого изображения не ниже 72 точек на дюйм. Кроме того, разрешение выводимого изображения, превышающее 600 dpi, будет уменьшено до 600 dpi или менее.
Сжатие изображения без потери качества может выполняться только с монохромными изображениями. Для сжатия отсканированного изображения без потери качества выберите в разделе «Параметры оптимизации» диалогового окна «Оптимизация отсканированного PDF» один из следующих параметров: «CCITT Group 4» или «JBIG2 (без потери качества)» для монохромных изображений. Если это изображение добавлено к документу PDF, можно сохранить файл с помощью параметра Сохранить; отсканированное изображение остается без сжатия. Отсканированное изображение может быть сжато при сохранении файла PDF с помощью команды «Сохранить как».
Для большинства страниц сканирование в черно-белом режиме при 300 dpi дает лучшие результаты для преобразования. При разрешении 150 dpi точность оптического распознавания символов несколько снижается и количество ошибок распознавания шрифта возрастает; при разрешении 400 dpi и выше обработка замедляется, а размер файлов со сжатыми страницами увеличивается. Если на странице содержится много нераспознанных слов или текст небольшого размера (9 пунктов и меньше), попытайтесь выполнить сканирование в более высоком разрешении. Когда это возможно, сканируйте в черно-белом режиме.
Если функция Оптическое распознавание символов выключена, можно использовать разрешение в диапазоне 10–3000 точек на дюйм, рекомендованное разрешение — не менее 72 точек на дюйм. Для параметра адаптивного сжатия рекомендуемые разрешения при сканировании: 300 точек на дюйм для изображений в градациях серого и RGB и 600 точек на дюйм для черно-белых изображений.
Страницы, отсканированные в режиме 24-разрядных цветов, 300 dpi, размером 8,5 х 11 дюймов (21,59 х 27,94 см) до сжатия представляют собой изображения большого размера (25 МБ). Системе может потребоваться 50 МБ виртуальной памяти и более для сканирования изображения. При разрешении 600 точек на дюйм процесс сканирования и обработки обычно происходит в четыре раза медленнее, чем при разрешении 300 точек на дюйм.
Избегайте настройки параметров полутонов и диффузионного смешения сканера. Это может улучшить внешний вид, но станет сложно распознавать текст.
Для текстов, распечатанных на цветной бумаге, рекомендуется увеличить яркость и контрастность примерно на 10%. Если сканер обеспечивает световую фильтрацию, следует подавить цвет фона при помощи специального фильтра или лампы. Или, если текст не подавляется, попробуйте настроить контрастность и яркость сканера, чтобы очистить отсканированный документ.
Если у сканера есть ручное управление яркостью, настройте его так, чтобы символы были четкими и имели правильную форму. Если символы соединены между собой, используйте более высокие параметры (более яркого цвета). Если символы разделены, используйте более низкие параметры (более темного цвета).
Для исправления ошибок и решения проблем, связанных со сканером, обратитесь к следующей документации по устранению неполадок:
Вы можете использовать Acrobat для распознавания текста в ранее отсканированных документах, которые уже были преобразованы в PDF. Функция распознавания текста позволяет искать, исправлять и копировать текст в отсканированном файле PDF. Для применения оптического распознавания символов к файлу PDF исходное разрешение сканера должно быть 72 точки на дюйм или выше.
Сканирование при 300 dpi дает лучшие результаты для преобразования. При разрешении 150 dpi точность OCR снижается.
Выберите Все инструменты > Сканирование и распознавание > В этом файле.
На дополнительной панели инструментов отображаются параметры распознавания текста.
На дополнительной панели инструментов выберите диапазон страниц и язык для распознавания текста.
Если нужно, нажмите Настройки, чтобы открыть диалоговое окно «Распознавание текста», и укажите необходимые настройки.
Выберите Распознать текст. Acrobat создает текстовый слой в PDF, по которому можно выполнять поиск, и который можно копировать и вставлять в новый документ.
Выберите Все инструменты > Сканирование и распознавание > В нескольких файлах.
В диалоговом окне Распознавание текста выберите Добавить файлы, затем команду Добавить файлы, Добавить папки или Добавить открытые файлы. Затем выберите файлы или папки. Появляется диалоговое окно Параметры вывода.
В диалоговом окне Параметры вывода укажите папку и установки для имен файлов. Нажмите ОК.
В диалоговом окне Общие параметры распознавания текста выберите необходимые настройки и нажмите ОК.
Acrobat создает текстовый слой в PDF, по которому можно выполнять поиск, и который можно копировать и вставлять в новый документ.
Язык документа
Задает язык для системы оптического распознавания символов с целью идентификации символов.
Вывод (стиль выходного файла PDF)
Определяет тип создаваемого документа PDF. Для всех параметров требуется, чтобы разрешение сканирования было не меньше 72 dpi или выше (рекомендуется). Во всех форматах оптическое распознавание символов и распознавание шрифтов и макета страницы применяется к текстовым изображениям, после чего они преобразуются в обычный текст.
Изображение с поиском
Устанавливает, что текст доступен для поиска и выделения. Данный параметр сохраняет исходное изображение, при необходимости выравнивает страницу и размещает над ним невидимый слой текста. Выбор параметра Понизить разрешение изображений в этом же диалоговом окне определяет, будет ли понижено разрешение изображения и до какой степени.
Изображение с поиском (точно)
Устанавливает, что текст доступен для поиска и выделения. Данный параметр сохраняет исходное изображение и размещает над ним невидимый слой текста. Рекомендуется в случаях, где необходима максимальная степень соответствия исходному изображению.
Редактируемый текст и изображения
Синтезирует новый пользовательский шрифт, максимально похожий на исходный, и сохраняет фон страницы, используя копию с низким разрешением.
Даунсамплинг
Понижает количество пикселей в цветных изображениях, изображениях в градациях серого и монохромных изображениях после завершения распознавания текста. Выберите степень понижения разрешения, которую нужно применить. Большее значение задает более высокий порог, с которого начинается обработка, и в итоге в документах PDF разрешение будет не ниже заданного в этом поле.
При выполнении оптического распознавания символов на отсканированном документе Acrobat анализирует растровые изображения текста и заменяет растровые области словами или символами. Если идеальная замена не ясна, Acrobat отмечает слово как сомнительное. Сомнительные элементы отображаются в PDF как исходное растровое изображение слова, но текст содержится на невидимом слое за растровым изображением слова. Этот метод делает слово доступным для поиска даже в том случае, если отображается его растровое изображение.
Примечание. Если попытаться выделить текст в отсканированном файле PDF без применения оптического распознавания символов или выполнить действие Чтение вслух с файлом изображения, Acrobat отобразит запрос о запуске оптического распознавания символов. Если нажать «ОК», откроется диалоговое окно Распознавание текста, в котором можно выбрать параметры, подробно описанные в предыдущем разделе.
Выберите Все инструменты > Сканирование и распознавание > Правильно распознанный текст.
Acrobat определяет возможные ошибки в тексте и отображает изображение и текст рядом друг с другом на дополнительной панели инструментов Все сомнительные слова на странице заключены в рамки.
Выберите выделенный объект или поле в документе, а затем исправьте его в поле Определяется как на дополнительной панели инструментов. Нажмите Принять.
Будет выделен следующий сомнительный элемент. Исправьте ошибки, если требуется. Нажмите Принять для каждого исправления.
После завершения этой задачи нажмите Закрыть на дополнительной панели инструментов.