Створення індексів PDF-файлів

Створення індексу та керування ним у PDF-файлі

Час пошуку у великому PDF-файлі можна зменшити, вбудувавши індекс слів документа. Acrobat здійснює пошук в індексі значно швидше, ніж у документі. Вбудований покажчик включається у розповсюджувані і спільно використовувані копії PDF-файла. Користувачі шукають у PDF-файлах із вбудованими індексами точно так само, як і без індексів, для цього не потрібно жодних додаткових дій.

Примітка.

У версіях програм Acrobat і Acrobat Reader від грудня 2018 р. вбудований індекс більше не використовується для пошуку в PDF-файлах. Якщо ви все одно бажаєте використовувати цей індекс для пошуку, див. посилання Як увімкнути пошук у PDF-файлах за допомогою вбудованого індексу.

Додавання індексу до PDF-файлу

  1. Відкрийте документ за допомогою Acrobat і виберіть «Інструменти» > «Індекс».

    Набір інструментів для індексації відображатиметься на додатковій панелі інструментів.

  2. На додатковій панелі інструментів натисніть «Керування вбудованим індексом».

  3. У діалоговому вікні «Керування вбудованим індексом» клацніть «Вбудувати індекс».

  4. Прочитайте повідомлення, що з’явиться, і клацніть на «ОК».

    Примітка.

    В Outlook і Lotus Notes ви маєте змогу вбудовувати індекс, коли перетворюєте електронні повідомлення або папки на PDF. Це особливо рекомендується для папок, що містять багато повідомлень.

Оновлення та вилучення вбудованого індексу із PDF

  1. Виберіть «Інструменти» > «Індекс».

    Набір інструментів для індексації відображатиметься на додатковій панелі інструментів.

  2. На додатковій панелі інструментів натисніть «Керування вбудованим індексом».

  3. Клацніть або на «Оновити індекс» або на «Видалити індекс».

Про функцію «Каталог» (Acrobat Pro)

Можна визначити певну групу PDF-файлів як каталог і створити єдиний покажчик для цілого набору документів. Індекс значно прискорить користувачам процес пошуку певної інформації у каталогізованих PDF-файлах.

Індекс можна включити до PDF-файлів за розповсюдження всього набору на компакт-диску.

Ви можете каталогізувати документи, написані латиницею, китайськими, японськими ієрогліфами або корейськими літерами. Те, що ви можете вносити до каталогу, включає текст, коментарі, закладки, поля форм, теги, метадані об'єктів і документа, вкладені файли, відомості про документ, цифрові підписи, метадані зображення XIF (розширений формат файла зображення), індивідуальні властивості документа.

Підготовка PDF-файлів до індексації (Acrobat Pro)

Спочатку створіть теку, призначену для PDF-файлів, які потрібно індексувати. Усі PDF-файли мають бути завершені, що стосується вмісту і електронних елементів, таких як посилання, закладки, поля форм. Якщо файли, що індексуватимуться, містять скановані документи, переконайтеся, що текст є придатним для пошуку. Якщо бажаєте збільшити швидкість пошуку, розбийте довгі документи на дрібніші файли, по одній главі в кожному. Також для покращення придатності до пошуку ви можете додати інформацію до властивостей документа файлу.

Перед індексуванням набору документів важливо встановити структуру документа на диску або на мережевому томі сервера та перевірити міжплатформні імена файлів. Імена файлів можуть обрізатися, і тоді їх може бути важко знайти під час міжплатформного пошуку. Щоб запобігти цьому, зважте на такі поради.

  • Перейменуйте файли, текипапки та індекси за зразком назв файлів MS-DOS (вісім символів або менше та три символи розширення), зокрема, якщо планується передавати набір документів з індексом на компакт-диску, відформатованому за стандартом ISO 9660.

  • Видаліть у назвах файлів і папок символи додаткової групи — символи з акцентамидіакритичними знаками, неанглійські символи. (Шрифт, що використовується функцією «Каталог», не підтримує символи з кодами 133-159).

  • Не використовуйте глибоко вкладені текпапки та імена файлів, довші за 256 символів, для індексів, які дивитимуться користувачі Mac OS.

  • Якщо система Mac OS використовується на сервері OS/2 LAN, налаштуйте IBM® LAN Server Macintosh (LSM) на примусове перетворення імен файлів за форматом MS-DOS, або виконайте індексування лише томів у файловій системі FAT. (Томи HPFS [High Performance File System] можуть матиістити надто довгі невиправні імена файлів).

    Якщо структура документа включає підтекпапки, які ви не бажаєте індексувати, ви можете виключити їх із процесу індексації.

Додавання метаданих до властивостей документа (Acrobat Pro)

Щоб полегшити пошук у PDF-файлах, до властивостей документа можна додати інформацію про файл, яка зветься метаданими. (Властивості поточного відкритого PDF-файлу можна переглянути, якщо вибрати пункт «Файл» > «Властивості» та клацнути вкладку «Опис».)

Додаючи дані до властивостей документа, зважте на такі поради.

  • У полі «Заголовок» вкажіть заголовок, який добре описує файл. Ім'я файлу документа повинне відображатися у діалоговому вікні «Результати пошуку».

  • Завжди використовуйте той самий параметр (поле) для подібної інформації. Наприклад, не додавайте важливий вираз до параметра «Тема» в одних документах і до параметра «Ключові слова» в інших.

  • Використовуйте послідовно єдиний вираз для тієї самої інформації. Наприклад, не слід вживати термін біологія для одних документів та науки про життя – для інших.

  • Використовуйте параметр «Автор», щоб ідентифікувати групу, що відповідає за цей документ. Наприклад, автором документа про умови найму на роботу може бути відділ кадрів.

  • Якщо ви використовуєте номери частин документа, додайте їх як ключові слова. Наприклад, додавши doc#=m234 до ключових слів, ви можете вказати певний документ на певну тему серед декількох сотень документів.

  • Використовуйте параметри «Тема» і «Ключові слова» окремо або разом для сортування документів за типом. Наприклад, можна використати звіт про стан як запис «Тема» та щомісячний або щотижневий як запис «Ключові слова» для окремого документа.

    Якщо ви вже пройшли курс спеціального навчання з Adobe PDF, створюючи індекс, ви можете визначати індивідуальні поля даних, такі як «Тип документа», «Номер документа», «Ідентифікатор документа». Радимо робити це лише досвідченим користувачам, адже в повній довідці Acrobat не наведено інформації про це.

Створення індексу для набору (Acrobat Pro)

Коли ви будуєте новий покажчик, Acrobat створює файл з розширенням .pdx і нову допоміжну теку, що містить файли з розширенням .idx. IDX-файли містять записи в покажчикові. Усі ці файли повинні бути доступні користувачам, що бажають шукати за покажчиком.

  1. Виберіть «Інструменти» > «Індекс».

    Набір інструментів для індексації відображатиметься на додатковій панелі інструментів.

  2. На додатковій панелі клацніть «Повний текстовий індекс із каталогом».

    Відкриється діалогове вікно «Каталог».

  3. У діалоговому вікні «Каталог» клацніть «Новий індекс».

    На екрані буде відображено діалогове вікно «Опис нового індексу».

    Опис нових індексів в Acrobat
    Діалогове вікно «Опис нового індексу».

  4. У полі «Назва індексу» введіть назву файлу індексу.

  5. У полі «Опис індексу» введіть декілька слів про тип індексу та його завдання.

  6. Клацніть на «Параметри», виберіть будь-які додаткові параметри, які потрібно застосувати до індексу, і натисніть кнопку «OK».

    Діалогове вікно «Параметри» в Acrobat
    У діалоговому вікні «Параметри» ви можете вказати додаткові параметри нового індексу.

  7. У групі «Включити ці каталоги» натисніть кнопку «Додати», виберіть папку, що містить деякі або всі PDF-файли для індексації, і натисніть кнопку «OK». Щоб додати подальші текпапки, повторіть цей крок.

    Примітка.

    Будь-яка папка, що знаходиться всередині включеної папки, також включається до індексації. Можна додавати папки з декількох серверів або дисків, якщо не планується переміщення індексу або інших елементів із набору документів ву інше місце.

  8. У вкладці «Виключити ці підпапки» клацніть на «Додати» і виберіть будь-які підпапки, що містять PDF-файли, які ви не бажаєте індексувати. Клацніть на «OK» і повторіть, якщо треба.

  9. Перегляньте свій вибір. Щоб відредагувати список папок, що включаються або виключаються, виберіть папку, яку потрібно змінити, і натисніть кнопку «Видалити».

  10. Клацніть на «Побудувати», потім вкажіть місце для файлу індексу. Клацніть «Зберегти», а потім:

    • Клацніть «Закрити» після завершення індексації.

    • Клацніть «Зупинити», щоб скасувати процес індексації.

    Примітка.

    Якщо ви зупините процес індексації, ви не зможете відновити той самий сеанс індексації, проте вам не доведеться повторювати роботу заново. Вибір параметрів і папок залишається. Ви можете клацнути на «Відкрити покажчик», вибрати частково побудований покажчик та переглянути його.

    Примітка.

    Якщо довгі шляхи до файлів обрізаються в параметрах «Включити ці папки» та «Виключити ці підпапки», тримайте курсор над кожними трьома крапками (...), доки не з’явиться підказка, що покаже повний шлях до включеної чи виключеної папки.

Діалогове вікно «Параметри індексації»

Не включати числа

Виберіть цей параметр, щоб виключити з індексу всі числа, що зустрічаютьсямістяться в тексті документа. Виключення чисел може значно зменшити розмір індексу та пришвидшити пошук.

Додавання посвідчення до Adobe PDF-файлів версії 1.0

Оберіть цей параметр, якщо набір включає PDF-файли, створені в Acrobat версії ранішої за 2.0, що не додає автоматично ідентифікаційні номери. Ідентифікаційні номери потрібні, коли довгі імена файлів у системі Mac OS скорочуються під час перетворення на назви файлів MS-DOS. Acrobat 2.0 та пізніших версій додає ідентифікатори автоматично.

Не попереджувати про зміну документів під час пошуку

Якщо цей параметр не вибраний, під час пошуку документів з’являтиметься повідомлення про те, що документи змінилися після останньої побудови індексу.

Власні властивості

Використовуйте цей параметр, щоб включати індивідуальні властивості документа в індекс; індексуватимуться лише індивідуальні властивості документа, що вже існують у PDF-файлах, які ви індексуєте. Введіть властивість, зробить вибір в меню «Тип», клацніть на «Додати». Ці властивості з’являються як параметр пошуку у спливаючих меню додаткових критеріїв вікна «Пошук у PDF» під час пошуку за кінцевим індексом. Наприклад, якщо ви введете індивідуальну властивість «Назва документа» і виберете властивість «рядок» із меню «Тип», користувач, який шукатиме за індексом, можна потім шукати в межах індивідуальної властивості, вибравши пункт «Назва документа» в меню «Використовувати додаткові критерії».

Примітка.

За створення власних полів у програмі Microsoft Office, в якій вибрано параметр «Перетворити інформацію про документ» у програмі PDFMaker, поля переносяться в будь-які нові PDF-файли.  

Поля XMP

Цей параметр використовується для включення індивідуальних полів XMP. Індивідуальні поля XMP індексуються та з’являються у спливних меню додаткових критеріїв, щоб за ними можна було шукати у вибраних індексах.

Винятки

Використовується для виключення окремих слів (максимум 500) із результатів пошуку за індексом. Введіть слово, клацніть на «Додати», повторіть, якщо потрібно. Виключення слів може зробити індекс меншим на 10–15%. Винятки можуть містити до 128 символів, і в них враховується регістр.

Примітка.

Щоб не надати користувачам можливість пошуку фраз, які містять ці слова, наведіть у файлі довідки «Catalog Readme» перелік слів, що не індексуються.

Структурні теги

Використовуйте цей параметр, щоб уможливити пошук тегів окремих елементів у документах, які мають тегову логічну структуру.

Примітка.

Параметри «Індивідуальні властивості», «Винятки» й «Теги» застосовуються лише до поточного індексу. Щоб застосувати ці параметри глобально до будь-якого індексу, що створюється, можна змінити типові параметри для індивідуальних полів, винятків і тегів у панелі «Каталог» діалогового вікна «Параметри».  

Файли ReadMe в каталозі (Acrobat Pro)

Часто доцільно створити окремий файл Readme і покласти його в папку з індексом. Цей файл ReadMe може містити подробиці про індекс, такі як:

  • Тип індексованих документів.

  • Підтримувані параметри пошуку.

  • Контактна особа, номер телефону для довідок.

  • Перелік чисел або слів, виключених із покажчика.

  • Перелік папок, що містять документи, включені до індексу на базі локальної мережі, або перелік документів, включених до індексу на базі диска. Ви також можете включати короткий опис вмісту кожної папки або документа.

  • Перелік значень для кожного документа, якщо ви присвоюєте значення полю «Інформація про документ».

    Якщо каталог містить дуже велику кількість документів, подумайте, чи не включити таблицю, що показуватиме значення, присвоєні кожному документовіу. Ця таблиця може бути частиною файлу ReadMe або окремим документом. Розробляючи індекс, можна використовувати цю таблицю, аби підтримувати послідовність.

Перегляд покажчика (Acrobat Pro)

Можна оновлювати, перебудовувати або стирати наявний покажчикіндекс.

  1. Виберіть «Інструменти» > «Індекс».

    Набір інструментів для індексації відображатиметься на додатковій панелі інструментів.

  2. На додатковій панелі клацніть «Повний текстовий індекс із каталогом».

    Відкриється діалогове вікно «Каталог».

  3. У діалоговому вікні «Каталог» клацніть «Відкрити індекс».

  4. Знайдіть і виберіть файл опису індексу (PDX) для індексу, клацніть на «Відкрити».

  5. Якщо індекс створено в Acrobat версії 5.0 або ранішої, оберіть «Створити копію», щоб створити новий індекс (не перезаписуючи попередню версію), або оберіть «Перезаписати старий індекс», щоб перезаписати.

  6. У діалоговому вікні «Визначення індексу» зробіть усі необхідні зміни, потім виберіть функцію, яку слід виконати Acrobat:

    Створити

    Створює новий файл IDX із наявною інформацією, оновлює його, додаючи нові записи, і позначаючи змінені та застарілі записи як недійсні. Якщо ви робите велику кількість змін або використовуєте цей параметр повторно замість створення нового індексу, час пошуку збільшуватиметься.

    Перебудувати

    Створює новий індекс, перезаписуючи наявну папку індексу та її вміст (файли IDX).

    Очистити

    Стирає вміст індексу (файли IDX), не стираючи сам файл індексу (PDX).

Налаштування каталогу (Acrobat Pro)

Ви можете встановити налаштування для індексації, що застосовуватимуться глобально до всіх наступних покажчиків, що ви їх створюватимете. Ви можете обходити деякі з цих уподобань для окремих індексів, вибираючи нові параметри у процесі побудування індексу.

У діалоговому вікні «Налаштування» на вкладці «Категорії» виберіть пункт «Каталог». Багато з цих параметрів ідентичні описаним для процесу побудови індексу.

Примітка.

Параметр «Примусово забезпечити сумісність із ISO 9660 у папках» є корисним, якщо не потрібно змінювати довгі назви документів PDF на імена файлів MS‑DOS, готуючи документи до індексації. Проте все ж таки потрібно використовувати домовленості про імена файлів MS‑DOS для назв папок (8 символів або менше), навіть, якщо це не є необхідним для імен файлів.

Оновлення покажчика за графіком (Acrobat Pro)

Використовуйте функцію «Каталог» або пакетний файл каталогу PDX (.bpdx), щоб планувати, коли і як часто слід виконувати автоматичне будування, перебудування, оновлення та очищення індексу. BPDX-файл — це текстовий файл, що містить залежні від платформи шляхи до файлів індексів каталогу і прапорці. Використовуйте програму-планувальник, наприклад Windows Scheduler, щоб відтворити BPDX-файл в Acrobat. Після чого Acrobat відтворить індекс заново відповідно до прапорців у BPDX-файлі.

Примітка.

Щоб використати файли BPDX, у діалоговому вікні «Налаштування» на вкладці «Каталог» виберіть параметр «Дозволити запуск пакетних файлів каталогу (.bpdx)».

Переміщення наборів і їхніх індексів (Acrobat Pro)

Ви можете розробляти й тестувати індексовані набори документів на локальному диску, а потім переносити кінцеві набори на сервер чи мережевий диск. Опис індексу містить відносні шляхи між файлом опису індексу (PDX) і папками, що містять індексовані документи. Якщо ці відносні шляхи не змінюються, не потрібно перебудовувати індекс після пересування індексованого набору документів. Якщо PDX-файл і папки, що містять індексовані документи, знаходяться в тій самій тецпапці, можна утримувати відносний шлях, просто переносячи цю папку.

Якщо відносний шлях змінюється, ви мусите створити новий індекс після перенесення індексованого набору документів. Проте ви все ще можете використовувати первісний PDX-файл. Щоб використовувати первісний PDX-файл, спочатку перенесіть проіндексовані документи. Потім скопіюйте PDX-файл до папки, де бажаєте створити новий індекс, та відредагуйте переліки включення й виключення папок і підпапок за потребою.

Якщо індекс знаходиться на диску або серверному томі окремо від будь-якої частини відповідного набору, перенесення набору або індексу зруйнує індекс. Якщо ви бажаєте перенести набір в інше місце мережі або на компакт-диск, створіть і побудуйте індекс у тому самому місці, де знаходиться набір.

Отримуйте допомогу швидше й простіше

Новий користувач?