Створення індексу та керування ним у PDF-файлі

Час пошуку у великому PDF-файлі можна зменшити, вбудувавши індекс слів документа. Acrobat здійснює пошук в індексі значно швидше, ніж у документі. Вбудований покажчик включається у розповсюджувані і спільно використовувані копії PDF-файла. Користувачі шукають у PDF-файлах із вбудованими індексами точно так само, як і без індексів, для цього не потрібно жодних додаткових дій.

Додавання індексу до PDF-файлу

  1. Коли документ відкрито у програмі Acrobat, виберіть «Інструменти» > «Обробка документа» > «Керування вбудованим індексом».
  2. У діалозі «Керування вбудованим покажчиком» клацніть на «Вбудувати індекс».
  3. Прочитайте повідомлення, що з'явиться, і клацніть на «ОК».

    Примітка.

    В Outlook і Lotus Notes ви маєте змогу вбудовувати покажчик, коли перетворюєте електронні повідомлення або теки на PDF. Це особливо рекомендується для папок, що містять багато повідомлень.

Оновлення та вилучення вбудованого індексу із PDF

  1. Виберіть «Інструменти» > «Обробка документа» > «Керування вбудованим індексом».
  2. Клацніть або на «Оновити індекс» або на «Видалити індекс».

Про функцію «Каталог» (Acrobat Pro)

Можна визначити певну групу PDF-файлів як каталог і створити єдиний покажчик для цілого набору документів. Індекс значно прискорить користувачам процес пошуку певної інформації у каталогізованих PDF-файлах.

Індекс можна включити до PDF-файлів за розповсюдження всього набору на компакт-диску.

Ви можете каталогізувати документи, написані латиницею, китайськими, японськими ієрогліфами або корейськими літерами. До каталогу можна вносити текст, коментарі, закладки, поля форм, теги, метадані об’єктів і документа, вкладені файли, відомості про документ, цифрові підписи, метадані зображення XIF (розширений формат файлу зображення), а також відомості про індивідуальні властивості документа.

Підготовка PDF-файлів до індексації (Acrobat Pro)

Спочатку створіть теку, призначену для PDF-файлів, які потрібно індексувати. Усі PDF-файли мають бути завершені, що стосується вмісту і електронних елементів, таких як посилання, закладки, поля форм. Якщо файли, що індексуватимуться, містять скановані документи, переконайтеся, що текст є придатним для пошуку. Якщо бажаєте збільшити швидкість пошуку, розбийте довгі документи на дрібніші файли, по одній главі в кожному. Також для покращення придатності до пошуку ви можете додати інформацію до властивостей документа файлу.

Перед індексуванням набору документів важливо встановити структуру документа на диску або на мережному томі сервера та перевірити міжплатформні імена файлів. Імена файлів можуть обрізатися, і тоді їх може бути важко знайти при міжплатформовому пошуку. Щоб запобігти цьому, зважте на такі поради.

  • Перейменуйте файли, папки та індекси за зразком імен файлів MS-DOS (вісім символів або менше та три символи розширення файлу), зокрема якщо планується передавати набір документів з індексом на компакт-диску, відформатованому за стандартом ISO 9660.

  • Видаліть у назвах файлів і папок символи додаткової групи — символи з акцентами, неанглійські символи. (Шрифт, що використовується функцією «Каталог», не підтримує символи з кодами 133-159).

  • Не використовуйте вкладені папки з довгим шляхом призначення та імена файлів, довші за 256 символів, для індексів, у яких виконуватимуть пошук користувачі Mac OS.

  • Якщо система Mac OS використовується на сервері OS/2 LAN, налаштуйте IBM® LAN Server Macintosh (LSM) на примусове перетворення імен файлів за форматом MS-DOS, або виконайте індексування лише томів у файловій системі FAT. (Томи HPFS [High Performance File System] можуть мати задовгі імена файлів).

    Якщо структура документа включає підпапки, які ви не бажаєте індексувати, їх можна виключити із процесу індексації.

Додавання метаданих до властивостей документа (Acrobat Pro)

Щоб полегшити пошук у PDF-файлах, до властивостей документа можна додати інформацію про файл, яка зветься метаданими. (Властивості поточного відкритого PDF-файлу можна переглянути, якщо вибрати пункт «Файл > Властивості» та клацнути вкладку «Опис»).

Примітка.

(Windows) Ви також можете вводити й читати інформацію про властивості даних з робочого столу. Клацніть правою кнопкою миші на документі у Провіднику Windows, оберіть «Властивості» і клацніть по вкладці PDF. Будь-яка інформація, що ви її вводите або реагуєте в цьому діалоговому вікні, також з'являтиметься в «Описі» у «Властивостях документа», коли ви відкриватимете файл.

Додаючи дані до властивостей документа, зважте на такі поради.

  • У полі «Заголовок» вкажіть заголовок, який добре описує файл. Ім’я файлу документа повинне відображатися у діалоговому вікні «Результати пошуку».

  • Завжди використовуйте той самий параметр (поле) для подібної інформації. Наприклад, не додавайте важливий вираз до параметра «Тема» в одних документах і до параметра «Ключові слова» в інших.

  • Використовуйте послідовно єдиний вираз для тієї самої інформації. Наприклад, не слід вживати термін біологія для одних документів та науки про життя – для інших.

  • Використовуйте параметр «Автор», щоб ідентифікувати групу, що відповідає за цей документ. Наприклад, автором документа про умови найму на роботу може бути відділ кадрів.

  • Якщо ви використовуєте номери частин документа, додайте до них ключові слова. Наприклад, додавши doc#=m234 до ключових слів, ви можете вказати певний документ на певну тему серед декількох сотень документів.

  • Використовуйте параметри «Тема» і «Ключові слова» окремо або разом для сортування документів за типом. Наприклад, можна використати звіт про стан як запис «Тема» та щомісячний або щотижневий як запис «Ключові слова» для окремого документа.

    Якщо ви вже пройшли спеціальне тренування з Adobe PDF, створюючи індекс, ви можете визначати окремі поля даних, такі як «Тип документа», «Номер документа», «Ідентифікатор документа». Радимо робити це лише досвідченим користувачам, адже в повній довідці Acrobat не наведено інформації про це.

Створення індексу для набору (Acrobat Pro)

Коли ви будуєте новий покажчик, Acrobat створює файл з розширенням .pdx і нову допоміжну теку, що містить файли з розширенням .idx. IDX-файли містять записи в покажчикові. Усі ці файли повинні бути доступні користувачам, що бажають шукати за покажчиком.

Діалогові вікна в <span class="uicontrol">Acrobat Pro</span> для процесу створення покажчика
Діалогові вікна в <span class="uicontrol">Acrobat Pro</span> для процесу створення покажчика

  1. Виберіть «Інструменти» > «Обробка документа» > «Повний текстовий індекс із каталогом», потім виберіть команду «Створити індекс».

    Примітка.

    Якщо панелі обробки документа немає, див. інструкції з додавання панелей у розділі Панелі завдань.

  2. У полі «Назва покажчика» введіть назву файла покажчика.
  3. У полі «Опис покажчика» введіть декілька слів про тип покажчика і його завдання.
  4. Клацніть на «Параметри», виберіть будь-які додаткові параметри, які потрібно застосувати до покажчика, і натисніть кнопку «OK».
  5. У групі «Включити ці каталоги» натисніть кнопку «Додати», виберіть теку, що містить деякі або всі PDF-файли для індексації, і натисніть кнопку «OK». Щоб додати подальші теки, повторіть цей крок.

    Примітка.

    Будь-яка тека, що знаходиться всередині включеної теки, також включається до індексації. Можна додавати папки з декількох серверів або дисків, якщо не планується переміщення індексу або інших елементів із набору документів в інше місце.

  6. У «Виключити ці підтеки» клацніть на «Додати» і виберіть будь-які підтеки, що містять PDF-файли, які ви не бажаєте індексувати. Клацніть на «OK» і повторіть, якщо треба.
  7. Перегляньте свій вибір. Щоб відредагувати список тек, що включаються або виключаються, виберіть теку, яку потрібно змінити, і натисніть кнопку «Видалити».
  8. Клацніть на «Побудувати», потім вкажіть місце для файла покажчика. Клацніть на «Записати», потім:
    • Клацніть на «Закрити», коли індексування буде завершене.

    • Клацніть «Зупинити», щоб скасувати процес індексації.

    Примітка.

    Якщо зупинити індексацію, неможливо буде продовжити той самий сеанс індексації, але не доведеться повторювати роботу заново. Вибір параметрів і тек залишається. Ви можете клацнути на «Відкрити покажчик», вибрати частково побудований покажчик та переглянути його.

    Примітка.

    Якщо довгі шляхи до файлів обрізаються в параметрах «Включити ці каталоги» та «Виключити ці підкаталоги», утримуйте курсор над кожними трьома крапками (...), доки не з'явиться підказка з повним шляхом до включеного чи виключеного каталогу.

Діалогове вікно «Параметри індексації»

Не включати числа

Виберіть цей параметр, щоб виключити з індексу всі числа, що зустрічаються в тексті документа. Виключення чисел може значно зменшити розмір індексу та пришвидшити пошук.

Додавання посвідчення до Adobe PDF-файлів версії 1.0

Оберіть цей параметр, якщо набір включає PDF-файли, створені в Acrobat версії ранішої за 2.0, що не додає автоматично ідентифікаційні номери. Ідентифікаційні номери потрібні, коли довгі імена файлів у системі Mac OS скорочуються під час перетворення на назви файлів MS-DOS. Acrobat 2.0 та пізніших версій додає ідентифікатори автоматично.

Не попереджувати про зміну документів під час пошуку

Якщо цей параметр не вибраний, під час пошуку документів з’являтиметься повідомлення про те, що документи змінилися після останньої побудови індексу.

Власні властивості

Використовуйте цей параметр, щоб включати індивідуальні властивості документа в індекс; індексуватимуться лише індивідуальні властивості документа, що вже існують у PDF-файлах, які ви індексуєте. Введіть властивість, зробить вибір в меню «Тип», клацніть на «Додати». Ці властивості з’являються як параметр пошуку у спливаючих меню додаткових критеріїв вікна «Пошук у PDF» під час пошуку за кінцевим індексом. Наприклад, якщо ви введете індивідуальну властивість «Назва документа» і виберете властивість «рядок» із меню «Тип», користувач, який шукатиме за індексом, можна потім шукати в межах індивідуальної властивості, вибравши пункт «Назва документа» в меню «Використовувати додаткові критерії».

Примітка.

За створення власних полів у програмі Microsoft Office, в якій вибрано параметр «Перетворити інформацію про документ» у програмі PDFMaker, поля переносяться в будь-які нові PDF-файли.  

Поля XMP

Цей параметр використовується для включення індивідуальних полів XMP. Індивідуальні поля XMP індексуються та з’являються у спливних меню додаткових критеріїв, щоб за ними можна було шукати у вибраних індексах.

Винятки

Використовується для виключення окремих слів (максимум 500) із результатів пошуку за індексом. Введіть слово, клацніть на «Додати», повторіть, якщо потрібно. Виключення слів може зробити індекс меншим на 10–15%. Винятки можуть містити до 128 символів, і в них враховується регістр.

Примітка.

Щоб попередити можливість пошуку фраз, які містять ці слова, наведіть у файлі довідки Catalog Readme перелік слів, що не підлягають індексації.

Структурні теги

Використовуйте цей параметр, щоб уможливити пошук тегів окремих елементів у документах, які мають тегову логічну структуру.

Примітка.

Параметри «Індивідуальні властивості», «Винятки» й «Теги» застосовуються лише до поточного індексу. Щоб застосувати ці параметри глобально до будь-якого індексу, що створюється, можна змінити типові параметри для індивідуальних полів, винятків і тегів у панелі «Каталог» діалогового вікна «Параметри».  

Файли ReadMe в каталозі (Acrobat Pro)

Часто доцільно створити окремий файл Readme і покласти його в теку з покажчиком. Цей файл ReadMe може містити подробиці про індекс, такі як:

  • Тип індексованих документів.

  • Підтримувані параметри пошуку.

  • Контактна особа або номер телефону для довідки.

  • Перелік чисел або слів, виключених з індексу.

  • Перелік папок, що містять документи, включені до індексу на базі локальної мережі, або перелік документів, включених до індексу на базі диска. Ви також можете включати короткий опис вмісту кожної папки або документа.

  • Перелік значень для кожного документа, якщо ви присвоюєте значення полю «Інформація про документ».

    Якщо каталог містить дуже велику кількість документів, подумайте, чи не включити таблицю, що показуватиме значення, присвоєні кожному документові. Ця таблиця може бути частиною файлу ReadMe або окремим документом. Розробляючи індекс, можна використовувати цю таблицю, аби підтримувати послідовність.

Перегляд покажчика (Acrobat Pro)

Можна також оновити, перебудувати або очистити наявний покажчик.

  1. Виберіть «Інструменти» > «Обробка документа» > «Повний текстовий індекс із каталогом», потім виберіть команду «Відкрити індекс».
  2. Знайдіть і виберіть файл опису покажчика (PDX) для покажчика, клацніть на «Відкрити».
  3. Якщо покажчик створено в Acrobat версії 5.0 або ранішої, оберіть «Створити копію», щоб створити новий покажчик (не перезаписуючи попередню версію), або оберіть «Перезаписати старий покажчик», щоб перезаписати.
  4. У діалоговому вікні «Визначення індексу» зробіть усі необхідні зміни, потім оберіть функцію, яку слід виконати:

    Створити

    Створює новий файл IDX із наявною інформацією, оновлює його, додаючи нові записи, і позначаючи змінені та застарілі записи як недійсні. Якщо ви робите велику кількість змін або використовуєте цей параметр повторно замість створення нового індексу, час пошуку збільшуватиметься.

    Перебудувати

    Створює новий індекс, перезаписуючи наявну папку індексу та її вміст (файли IDX).

    Очистити

    Стирає вміст індексу (файли IDX), не стираючи сам файл індексу (PDX).

Налаштування каталогу (Acrobat Pro)

Ви можете встановити налаштування для індексації, що застосовуватимуться глобально до всіх наступних покажчиків, що ви їх створюватимете. Ви можете обходити деякі з цих уподобань для окремих індексів, вибираючи нові параметри у процесі побудування індексу.

У діалоговому вікні «Налаштування» на вкладці «Категорії» виберіть пункт «Каталог». Багато з цих параметрів ідентичні описаним для процесу побудови індексу.

Примітка.

Параметр «Примусово забезпечити сумісність із ISO 9660 у папках» є корисним, якщо не потрібно змінювати довгі назви документів PDF на імена файлів MS‑DOS, готуючи документи до індексації. Проте все ж таки потрібно використовувати домовленості про імена файлів MS‑DOS для назв папок (8 символів або менше), навіть, якщо це не є необхідним для імен файлів.

Оновлення покажчика за графіком (Acrobat Pro)

Використовуйте функцію «Каталог» або пакетний файл каталогу PDX (.bpdx), щоб планувати, коли і як часто слід виконувати автоматичне будування, перебудування, оновлення та очищення індексу. BPDX-файл — це текстовий файл, що містить залежні від платформи шляхи до файлів індексів каталогу і прапорці. Використовуйте програму-планувальник, наприклад Windows Scheduler, щоб відтворити BPDX-файл в Acrobat. Після чого Acrobat відтворить індекс заново відповідно до прапорців у BPDX-файлі.

Для отримання детальної інформації про планування оновлення індексації виконайте пошук файлів BPDX на сторінці www.adobe.com/ua/support.

 

Примітка.

Щоб використати файли BPDX, у діалоговому вікні «Налаштування» на вкладці «Каталог» виберіть параметр «Дозволити запуск пакетних файлів каталогу (.bpdx)».

Переміщення наборів і їхніх індексів (Acrobat Pro)

Ви можете розробляти й тестувати індексовані набори документів на локальному диску, а потім переносити кінцеві набори на сервер чи мережний диск. Опис індексу містить відносні шляхи між файлом опису індексу (PDX) і папками, що містять індексовані документи. Якщо ці відносні шляхи не змінюються, не потрібно перебудовувати індекс після пересування індексованого набору документів. Якщо PDX-файл і папки, що містять індексовані документи, знаходяться в тій самій теці, можна утримувати відносний шлях, просто переносячи цю папку.

Якщо відносний шлях змінюється, ви мусите створити новий індекс після перенесення індексованого набору документів. Проте ви все ще можете використовувати первісний PDX-файл. Щоб використовувати первісний PDX-файл, спочатку перенесіть проіндексовані документи. Потім скопіюйте PDX-файл до папки, де бажаєте створити новий індекс, та відредагуйте переліки включення й виключення папок і підпапк за потребою.

Якщо індекс знаходиться на диску або серверному томі окремо від будь-якої частини відповідного набору, перенесення набору або індексу зруйнує індекс. Якщо ви бажаєте перенести набір в інше місце мережі або на компакт-диск, створіть і побудуйте індекс у тому самому місці, де знаходиться набір.

Цей документ захищено ліцензією Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License  Публікації Twitter™ і Facebook не підпадають під умови ліцензії Creative Commons.

Юридична інформація   |   Політика мережевої конфіденційності