Сканування документів у PDF-файли

Скануйте паперові документи в PDF-файли й перетворюйте їх на «розумні» PDF-документи з підтримкою виділення та пошуку тексту за допомогою програми Acrobat.
 

Скануйте роздруковані документи у формат PDF

PDF-файл можна створити безпосередньо з паперового документа за допомогою сканера та програми Acrobat. В операційній системі Windows програма Acrobat підтримує драйвери сканерів TWAIN і драйвери Windows Image Acquisition (WIA). У Mac OS, Acrobat підтримує TWAIN та Image Capture (ICA).

У Windows можна скористатися функцією «Автоматично визначати колірний режим» та дозволити програмі Acrobat визначати тип вмісту паперового документа або ж використати інші стилі («Чорно-білий документ», «Документ у градаціях сірого», «Кольорове зображення» та «Кольоровий документ») на власний розсуд. Можна вибрати попередньо задані стилі сканування або використати пункт «Власне сканування» для сканування з власноруч заданими параметрами.

Примітка.

Сканування з попередньо встановленими параметрами можливе лише для драйверів сканерів, що підтримують режим «Приховати власний інтерфейс сканера». Стилі сканування недоступні в операційній системі Mac OS.

В операційній системі Windows, якщо для вашого сканера встановлено драйвер WIA, для створення документа PDF можна також використовувати кнопку «Scan» на панелі сканера. Натисніть кнопку «Scan», а потім у Windows виберіть програму Adobe Acrobat зі списку зареєстрованих програм. Після цього в інтерфейсі сканування програми Acrobat виберіть сканер і стиль документа або натисніть «Власне сканування».

Щоб відсканувати паперовий документ у формат PDF за допомогою Acrobat, перейдіть до вкладки Інструменти > Створити PDF. Відобразиться інтерфейс «Створення документа PDF із файлу будь-якого формату». Виберіть пункт «Сканер», щоб оглянути доступні параметри.

У Windows:

Параметри сканування паперового документа у формат PDF
Створюйте PDF-документи за допомогою інтерфейсу «Сканер»; натиснувши на значок налаштувань/шестірні, ви відкриєте всі налаштування для виділеного параметра.

У Mac:

Параметри сканування паперового документа у формат PDF у Mac
Створення PDF-файлів через інтерфейс сканування: виберіть сканер і натисніть «Далі», щоб переглянути параметри вибраного сканера.

Сканування паперового документа у PDF-файл за допомогою режиму автовизначення кольорів (Windows).

  1. Виберіть пункт «Інструменти» > «Створити PDF» > «Сканер» > «Автовизначення кольорового режиму».

    Примітка.

    Якщо ви бажаєте прикріпити сканований документ до наявного файлу, дотримуйтеся наведених нижче інструкцій:

    1. Поставте прапорець у полі «Додати до наявного файлу».
    2. Якщо ви відкрили файли в Acrobat, виберіть відповідний файл у розкривному списку або натисніть кнопку «Перегляд», після чого виберіть відповідний файл.

    Якщо потрібно відсканувати кілька файлів в один файл PDF, клацніть значок налаштувань . Відобразиться інтерфейс «Сканування з власними параметрами». Установіть прапорець у полі «Пропонувати сканувати інші сторінки».

  2. Натисніть кнопку «Сканувати».

  3. Якщо з'явилось повідомлення з пропозицією сканування додаткових сторінок, виберіть параметр «Сканувати інші сторінки», «Сканувати зворотні сторони» або «Сканування завершено» та натисніть кнопку «OK».

Сканування паперового документа у формат PDF з використанням одного зі встановлених параметрів (Windows)

  1. Виберіть пункт «Інструменти» > «Створити PDF» > «Сканер» > «[стиль документа]».

    Примітка.

    Якщо ви бажаєте прикріпити сканований документ до наявного файлу, дотримуйтеся наведених нижче інструкцій:

    1. Поставте прапорець у полі «Додати до наявного файлу».
    2. Якщо ви відкрили файли в Acrobat, виберіть відповідний файл у розкривному списку або натисніть кнопку «Перегляд», після чого виберіть відповідний файл.

    Якщо потрібно відсканувати кілька файлів в один файл PDF, клацніть значок налаштувань . Відобразиться інтерфейс «Сканування з власними параметрами». Установіть прапорець у полі «Пропонувати сканувати інші сторінки».

  2. Натисніть кнопку «Сканувати».

  3. Якщо з'явилось повідомлення з пропозицією сканування додаткових сторінок, виберіть параметр «Сканувати інші сторінки», «Сканувати зворотні сторони» або «Сканування завершено» та натисніть кнопку «OK».

Сканування паперових документів у формат PDF без встановлених параметрів

  1. Виберіть пункт «Інструменти» > «Створити PDF» > «Сканер» > «Параметри за замовчуванням» або «Мої власні налаштування».

    Примітка.

    Якщо ви бажаєте прикріпити сканований документ до наявного файлу, дотримуйтеся наведених нижче інструкцій:

    1. Поставте прапорець у полі «Додати до наявного файлу».
    2. Якщо ви відкрили файли в Acrobat, виберіть відповідний файл у розкривному списку або натисніть кнопку «Перегляд», після чого виберіть відповідний файл.
  2. Якщо ви бажаєте змінити налаштування, натисніть значок налаштувань     . Відобразиться інтерфейс «Сканування з власними параметрами». Виберіть параметри сканування.

    Якщо потрібно відсканувати кілька файлів в один PDF-файл, установіть прапорець у полі «Пропонувати сканувати інші сторінки».

    Примітка.

    Якщо ви виберете «Показувати власний інтерфейс сканера» замість інтерфейсу програми Acrobat, з’являться інші вікна або діалогові вікна. Зверніться до документації виробника сканера для отримання детальнішої інформації про доступні можливості. У системі Mac OS користувальницький інтерфейс сканера завжди відображається.

  3. Натисніть кнопку «Сканувати».

  4. Якщо з'явилось повідомлення з пропозицією сканування додаткових сторінок, виберіть параметр «Сканувати інші сторінки», «Сканувати зворотні сторони» або «Сканування завершено» та натисніть кнопку «OK».

Удосконалення та оптимізація сканованих документів PDF

  1. Відкрийте PDF-файл, створений із відсканованого документа.
  2. Виберіть команди меню «Інструменти» > «Сканування й OCR» > «Удосконалення» > «Сканований документ».

  3. Виберіть параметри на додатковій панелі інструментів – клацніть значок налаштувань і виберіть відповідні параметри в діалоговому вікні «Удосконалити сканований PDF-файл», після чого натисніть кнопку «OK».

    Докладнішу інформацію про параметри, що відображаються в цьому діалоговому вікні, див. у розділі Діалогове вікно «Удосконалити сканований PDF-файл».

Налаштування встановлених параметрів сканування (Windows)

  1. Виберіть «Інструменти» > «Створити PDF» > «Сканер».

  2. Виберіть стиль: «Автовизначення кольорового режиму», «Чорно-білий документ», «Кольоровий документ», «Документ у градаціях сірого» або «Кольорова фотографія».

  3. Натисніть значок «Налаштування» біля стилю. У залежності від вашого вибору відобразиться інтерфейс «Сканування з власними параметрами» або «Вказати попередньо визначені налаштування для».

  4. Виконайте необхідні налаштування параметрів.

    Якщо потрібно відсканувати кілька файлів в один PDF-файл, установіть прапорець у полі «Пропонувати сканувати інші сторінки».

  5. Натисніть «Зберегти налаштування», щоб зберегти стиль, і натисніть кнопку з хрестиком (X) для закриття.

Параметри сканування

Обравши сканер, ви можете вибирати або регулювати різноманітні параметри сканування відповідно до власних потреб.

Діалогове вікно «Оптимізувати відсканований PDF-файл»

Діалогове вікно «Удосконалити сканований PDF-файл» керує параметрами фільтрування та стиснення сканованих зображень для їхнього перетворення на PDF. Параметри за замовчуванням придатні для багатьох типів сторінок документів, але їх можна змінити для підвищення якості зображення, зменшення розміру файлів або вирішення проблем зі скануванням.

Діалогове вікно «Розпізнати текст – параметри»

Мова документа.

За замовчуванням мова OCR вибирається відповідно до регіону за замовчуванням. Для зміни мови клацніть «Редагувати» і виберіть іншу мову.

Вивід.

«Зображення з пошуком» або «Текст і зображення, придатні до редагування».  

Поради щодо сканування

  • У програмі Acrobat можна сканувати зображення з роздільною здатністю від 10 до 3000 dpi. Якщо вибрати значення «Зображення з пошуком» або «ClearScan» для параметра «Стиль виводу PDF», буде необхідна вхідна роздільна здатність 72 точки на дюйм або вища. А вхідна роздільна здатність понад 600 dpi знижується до 600 dpi або нижчої.

  • Стиснення без втрат можна застосувати лише до монохромних зображень. Щоб застосувати стиснення без втрат до відсканованого зображення, виберіть один із таких параметрів у розділі «Параметри оптимізації» в діалоговому вікні «Оптимізувати відсканований PDF-файл»: «CCITT Групи 4» або «JBIG2 (без втрат)» для монохромних зображень. Якщо це зображення додається до PDF-документа, а файл зберігається за допомогою команди «Зберегти», відскановане зображення не стискається. Якщо PDF-документ зберігається за допомогою команди «Зберегти як…», відскановане зображення може бути стиснене.

  • У більшості випадків найкращі результати при реконструкції тексту досягаються при скануванні сторінок у чорно-білому режимі з роздільною здатністю 300 dpi. При скануванні з роздільною здатністю 150 точок на дюйм текст розпізнається функцією оптичного розпізнавання символів дещо гірше, при розпізнаванні шрифтів можуть виникати помилки; при скануванні з роздільною здатністю 400 dpi або вище процедура потребує більше часу, а стиснені сторінки мають більший розмір. Якщо на сторінці багато нерозпізнаних слів або вона містить дрібний текст (9 пунктів або ще менший), спробуйте виконати сканування з більшою роздільною здатністю. В разі можливості застосовуйте чорно-білий режим сканування.

  • Якщо режим «Оптичне розпізнавання символів» вимкнений, можна застосовувати для сканування будь-яку роздільну здатність в межах діапазону 10-3000 dpi, але рекомендована роздільна здатність — 72 dpi або вище. При використанні адаптивного стискання рекомендована роздільна здатність для сканування у режимах «Градації сірого» або «RGB» – 300 dpi, а для сканування у чорно-білому режимі – 600 dpi.

  • Сторінки, сканування яких виконано з параметрами кольору 24 біта, роздільною здатністю 300 dpi, при 8-1/2-на-11 дюймів (21,59-на-27,94 см), перед стисканням матимуть великий розмір файлу (25 Мб). Для сканування таких зображень система може потребувати щонайменше 50 МБ віртуальної пам’яті. При скануванні з роздільною здатністю 600 dpi процеси сканування та обробки, як правило, займають приблизно у чотири рази більше часу, ніж сканування з роздільною здатністю 300 dpi.

  • Не застосовуйте такі функції сканера як тремтіння та напівтони. Ці функції можуть поліпшити вигляд фотографій, але їх застосування ускладнює розпізнавання тексту.

  • Якщо текст надруковано на кольоровому папері, спробуйте підвищити рівні яскравості та контрастності приблизно на 10%. Якщо сканер має функцію видалення кольору, то для видалення кольорового фону застосуйте відповідний фільтр або лампу. Якщо після видалення тла текст залишається нечітким, спробуйте для підвищення якості сканування відрегулювати контрастність та яскравість.

  • Якщо в сканері передбачене налаштування яскравості вручну, відрегулюйте її таким чином, щоб усі символи біли чіткими та зрозумілими. Якщо символи розташовані впритул один до одного, застосуйте підвищену яскравість. Якщо між символами є проміжки, застосуйте знижену яскравість

Усунення несправностей сканера

Розпізнавання тексту в сканованих документах

Можна використовувати Acrobat для розпізнавання тексту в попередньо відсканованих документах, що вже були перетворені на PDF-файли. Програмне забезпечення для оптичного розпізнавання символів (OCR) надає змогу виконувати пошук, виправлення та копіювання тексту у відсканованому документі PDF. Щоб застосувати OCR до PDF, необхідно встановити роздільну здатність сканера на 72 dpi або вище.

Примітка.

Сканування з роздільною здатністю 300 dpi надає найкращі результати тексту для перетворення. При роздільній здатності 150 dpi точність оптичного розпізнавання символів трохи менша.

Розпізнавання тексту в окремому документі

  1. Відкрийте відсканований PDF-файл.
  2. Виберіть «Інструменти» > «Сканування й OCR» > «Розпізнати текст» > «У цьому файлі».

    Параметри розпізнавання тексту відображено на додатковій панелі інструментів.

  3. Виберіть на додатковій панелі інструментів діапазон сторінок і мову розпізнавання тексту.

  4. У разі потреби натисніть кнопку «Параметри» для відкриття діалогового вікна «Розпізнати текст» і вкажіть потрібні параметри.

  5. Клацніть «Розпізнати текст». Acrobat створює у PDF-файлі шар тексту, в якому можна здійснювати пошук, а також копіювати та вставляти текст у новий документ.

Розпізнавання тексту в кількох документах

  1. Виберіть «Інструменти» > «Сканування й OCR» > «Розпізнати текст» > «У кількох файлах».

  2. У діалоговому вікні «Розпізнати текст» клацніть елемент «Додати файли» та виберіть «Додати файли», «Додати папки» або «Додати відкриті файли». Потім виберіть файли або теку.

  3. У діалоговому вікні «Параметри виводу» вкажіть папку призначення для файлів виведення та налаштувань імені файлу.
  4. У діалоговому вікні «Розпізнати текст — загальні параметри» виберіть необхідні значення та натисніть кнопку «OK».

    Acrobat створює у PDF-файлі шар тексту, в якому можна здійснювати пошук, а також копіювати та вставляти текст у новий документ.

Діалогове вікно «Розпізнавати текст – загальні параметри»

Мова документа.

Визначає мову, яку компонент OCR застосовує для розпізнавання символів.

Вивід (Стиль виводу PDF)

Визначає тип PDF-файлу для створення. Усі параметри потребують сканування з роздільною здатністю 72 dpi або вище (рекомендується). При виборі кожного із цих параметрів виконується оптичне розпізнавання зображень, а також розпізнавання шрифтів та сторінок, і ті зображення, що містять текст, перетворюються на звичайний текст.

Зображення з пошуком

Забезпечує придатність документа для пошуку та виділення тексту. Дана функція утримує оригінальне зображення, вирівнює його як необхідно та встановлює невидимий текстовий шар над ним. Вибір параметра «Зменшити роздільну здатність зображень» у тому ж самому діалоговому вікні вказує, чи буде знижено роздільну здатність зображення та наскільки.

Зображення з пошуком (Точне)

Забезпечує придатність документа для пошуку та виділення тексту. Дана функція утримує оригінальне зображення та встановлює невидимий текстовий шар над ним. Рекомендовано при випадках, коли вимагається максимальна відповідність до оригінального зображення.

Текст і зображення, придатні до редагування

У цьому режимі синтезується новий користувацький шрифт, який є дуже схожим на оригінальний, та зберігається фон сторінки з використанням копії з нижчою роздільною здатністю.

Знизити роздільну здатність до

Після виконання оптичного розпізнавання символів зменшується кількість пікселів у кольорових, сірих та монохромних зображеннях. Виберіть необхідний ступінь даунсемплінгу. Чим вище число, тим менше знижується роздільна здатність, у результаті чого кінцевий документ PDF матиме високу роздільну здатність.

Правка оптично розпізнаного тексту в PDF-документах

Під час застосування OCR до сканованого виведення програма Acrobat аналізує бітові дані тексту та заміняє слова й символи для цих бітових областей. Якщо в програмі Acrobat немає точного варіанту заміни, слово позначається як нечітко розпізнане Нечітко розпізнанні слова відображаються в PDF-файлі як оригінальні бітові зображення слів, але невидимий шар позаду бітового зображення слова містить текст. Завдяки цьому способу слово є придатним для пошуку, навіть якщо воно відображається як бітове зображення.

Примітка. У разі спроби виділення тексту в сканованому PDF-файлі, до якого не застосовано OCR, або спроби виконання операції «Читання вголос» із файлом зображення, програма Acrobat запитує, чи потрібно виконати оптичне розпізнавання символів. Якщо натиснути кнопку «OK», відкриється діалогове вікно «Розпізнавання тексту», де можна вибрати параметри, докладно описані в попередньому розділі.

  1. Виберіть «Інструменти» > «Сканування й OCR» > «Розпізнати текст» > «Коригувати розпізнаний текст».

    Acrobat визначає можливі помилки в тексті й відображає зображення та текст поруч на додатковій панелі інструментів. (Всі підозрілі слова на сторінці обводяться прямокутником.)

  2. Клацніть виділений об’єкт чи вікно в документі та зробіть потрібні виправлення у вікні «Розпізнано як» на додатковій панелі інструментів. Клацніть «Прийняти».

    Буде виділено наступний нечітко розпізнаний символ. Виправте помилки. Клацніть «Прийняти» в кожному випадку.

  3. Виконавши всі необхідні операції, клацніть «Закрити» на додатковій панелі інструментів.

Отримуйте допомогу швидше й простіше

Новий користувач?