יצירת אינדקסים של PDF

יצירה וניהול של אינדקס PDF

ניתן להפחית את הזמן הדרוש לחיפוש במסמך PDF ארוך באמצעות הטמעת אינדקס של המילים המופיעות במסמך. Acrobat יכול לחפש באינדקסים מהר יותר מאשר במסמך עצמו. האינדקס המוטמע נכלל בעותקים מופצים או משותפים של מסמך PDF. המשתמשים מבצעים חיפושים במסמכי PDF המכילים אינדקסים מוטמעים בדיוק באותה צורה כמו באלה שאינם מכילים אינדקסים מוטמעים; אין צורך בצעדים נוספים.

הערה:

במהדורת דצמבר 2018 של Acrobat ו-Acrobat Reader , כבר לא מתבצע שימוש באינדקס המוטמע במסמך PDF למטרת חיפוש. אם אתם עדיין מעוניינים לאפשר חיפוש באמצעות האינדקס, ראו כיצד לאפשר חיפוש באמצעות האינדקס המוטמע במסמך PDF.

הוספת אינדקס למסמך PDF

  1. כאשר המסמך פתוח ב- Acrobat, בחרו Tools ‏> Index.

    ערכת הכלים של האינדקס מוצגת בסרגל הכלים המשני.

  2. בסרגל הכלים המשני, לחצו על Manage Embedded Index.

  3. בתיבת הדו-שיח Manage Embedded Index, לחצו על Embed Index.

  4. קראו את ההודעות שיופיעו ולאחר מכן לחצו על OK.

    הערה:

    ב- Outlook ו- Lotus Notes, קיימת האפשרות להטמיע אינדקס כאשר ממירים הודעת דוא"ל או תיקיות ל- PDF. הדבר מומלץ במיוחד לתיקיות המכילות הודעות דוא"ל רבות.

עדכון או הסרה של אינדקס מוטמע במסמך PDF

  1. בחרו Tools ‏> Index.

    ערכת הכלים של האינדקס מוצגת בסרגל הכלים המשני.

  2. בסרגל הכלים המשני, לחצו על Manage Embedded Index.

  3. לחצו על Update Index או על Remove Index.

אודות התכונה Catalog‏ (‏Acrobat Pro‏)

ניתן להגדיר קבוצת מסמכי PDF ספציפיים כקטלוג וליצור אינדקס מאוחד לאוסף מסמכים זה כולו. כשמשתמשים מחפשים מידע מסוים במסמכי PDF מקוטלגים, האינדקס יאיץ במידה רבה את תהליך החיפוש.

כאשר תפיצו את אוסף המסמכים על-גבי תקליטור, תוכלו לכלול בו א האינדקס עם מסמכי ה- PDF‏.

ניתן לקטלג מסמכים הכתובים בשפות המשתמשות בתווים לטיניים, סיניים, יפניים או קוריאנים. הפריטים שתוכלו לקטלג כוללים את המלל של המסמך, הערות, סימניות, שדות טופס, תגים, מטא-נתונים של עצם ושל מסמך, קבצים מצורפים, פרטי מסמך, חתימות דיגיטליות, מטא-נתונים מסוג XIF של תמונה (XIF - תבנית קובץ תמונה מורחב), ומאפייני מסמך מותאמים אישית.

הכנת מסמכי PDF לצורך יצירת אינדקס (Acrobat Pro)

התחילו על-ידי יצירת תיקיה אשר תכיל את קובצי PDF שעבורם ברצונכם להכין אינדקס. על כל מסמכי PDF להיות גמורים מבחינת תוכן ותכונות אלקטרוניות, כגון קישורים, סימניות ושדות טפסים. אם הקבצים שיסודרו באינדקס מכילים מסמכים סרוקים, וודאו שהמלל במסמכים אלה ניתן לחיפוש. פצלו מסמכים ארוכים לקבצים קטנים יותר בגודל של פרקים, כדי לשפר את ביצועי החיפוש. ניתן גם להוסיף נתונים למאפייני המסמך של הקובץ כדי לשפר את החיפוש אחריו.

לפני שתיצרו אינדקס לאוסף מסמכים, חשוב שתגדירו את מבנה המסמכים בכונן הקשיח או במחיצת שרת הרשת ושתוודאו ששמות הקבצים מתאימים לכל המערכות. שמות הקבצים עלולים להיקטם וקשה יהיה לאחזר אותם בשעת חיפוש במערכות הפעלה שונות. כדי למנוע בעיה זו, זכרו את ההנחיות הבאות:

  • שנו שמות קבצים, תיקיות ואינדקסים תוך שימוש במוסכמת שמות הקבצים של MS-DOS (שמונה תווים או פחות ואחריהם סיומת בת שלושה תווים), במיוחד אם בכוונתכם להעביר את אוסף המסמכים והאינדקס לתקליטור CD-ROM בתבנית ISO 9660.

  • הסירו תווים מורחבים, כגון תווים בעלי דגשים (accent‏, umlaut) ותווים שאינם באנגלית, משמות הקבצים והתיקיות. (הגופן שבשימוש תכונת ה- Catalog אינו תומך בקודי התווים 133 עד 159.)

  • אל תשתמשו בתיקיות בקינון רב או בשמות נתיבים העולים על 256 תווים לאינדקסים שבהם יתבצע חיפוש על-ידי משתמשי Mac OS.

  • אם אתם משתמשים ב- Mac OS עם שרת מסוג OS/2 LAN, הגדירו את IBM®LAN Server Macintosh (‏LSM) כך שיאכוף את מוסכמות בחירת השמות לקבצים של MS-DOS או הוסיפו לאינדקס רק אמצעי אחסון בשיטת FAT (טבלת מיקום קבצים). (אמצעי אחסון שמשתמשים ב-HPFS‏ [High Performance File System] עשויים להכיל שמות קבצים ארוכים שאינם ניתנים לשחזור.)

    אם במבנה המסמך נכללות תיקיות-משנה שאינכם מעוניינים לכלול אותן באינדקס, ניתן למנוע את הכללתן במהלך תהליך יצירת האינדקס.

הוספת מטא-נתונים למאפייני מסמך (Acrobat Pro)

כדי להקל על החיפוש במסמכי PDF, ניתן להוסיף מידע אודות הקבצים הנקרא מטא-נתונים למאפייני המסמך שלהם. (ניתן לצפות במאפייני מסמך PDF הפתוח כעת על ידי בחירה באפשרות File ‏> Properties, ולחיצה על הכרטיסייה Description.)

כשאתם מוסיפים נתונים למאפייני מסמך, קחו בחשבון את ההמלצות הבאות:

  • השתמשו בכותרת תיאורית טובה בשדה Title. שם המסמך צריך להופיע בתיבת הדו-שיח Search Results.

  • השתמשו תמיד באותה אפשרות (שדה) למידע דומה. לדוגמה, אל תשתמשו באפשרות Subject כדי להוסיף מונח חשוב למסמכים מסוימים ובאפשרות Keywords להוספת אותו מונח במסמכים אחרים.

  • השתמשו במונח אחד ועקבי לתיאור אותו מידע. לדוגמה, אל תשתמשו במונח ביולוגיה בחלק מהמסמכים ובמונח מדעי החיים במסמכים אחרים.

  • השתמשו באפשרות Author לזיהוי הקבוצה האחראית על המסמך. לדוגמה, המחבר של מסמך מדיניות לשכירת עובדים עשוי להיות מחלקת משאבי אנוש.

  • אם אתם משתמשים במספרים לחלקי מסמכים, הוסיפו אותם כמילות מפתח. לדוגמה, הוסיפו doc#=m234 ל- Keywords כדי לציין מסמך ספציפי בקבוצה של כמה מאות מסמכים בנושא מסוים.

  • השתמשו באפשרות Subject או Keywords, בנפרד או ביחד, כדי לסווג מסמכים לפי סוג. לדוגמה, תוכלו להשתמש במונח דוח מצב כנושא (Subject) ובמונח חודשי או שבועי כמילות מפתח (Keywords) למסמך בודד.

    אם כבר קיבלתם הדרכה שמתמחית ב- Adobe PDF, תוכלו להגדיר שדות נתונים מותאמים אישית, כגון Document Type‏, Document Number ו- Document Identifier כאשר תיצרו את האינדקס. אפשרות זו מומלצת למשתמשים מתקדמים בלבד והיא אינה מפורטת בעזרה המלאה של Acrobat‏.

יצירת אינדקס לאוסף (Acrobat Pro)

כשאתם בונים אינדקס חדש, תיצור Acrobat קובץ בעל סיומת pdx. וכן תיקיית תמיכה חדשה המכילה קובץ idx. אחד או יותר. קובצי IDX מכילים את עיולי האינדקס. כל הקבצים הללו חייבים להיות זמינים למשתמשים המעוניינים לבצע חיפוש באינדקס.

  1. בחרו Tools ‏> Index.

    ערכת הכלים של האינדקס מוצגת בסרגל הכלים המשני.

  2. בסרגל הכלים המשני, לחצו על  Full Text Index With Catalog.

    תיבת הדו-שיח Catalog מוצגת.

  3. בתיבת הדו-שיח Catalog, לחצו על New Index.

    תיבת הדו-שיח New Index Definition מוצגת.

    הגדרות אינדקס חדשות ב- Acrobat
    תיבת הדו-שיח New Index Definition.

  4. בשדה Index Title, הקלידו שם לקובץ האינדקס.

  5. בשדה Index Description, הקלידו מספר מילים המתארות את סוג האינדקס ואת מטרתו.

  6. לחצו על Options, בחרו באפשרויות המתקדמות שברצונכם להחיל על האינדקס, ולחצו על OK.

    תיבת הדו-שיח Options ב- Acrobat
    בתיבת הדו-שיח Options, ניתן לציין את האפשרויות המתקדמות עבור האינדקס החדש.

  7. תחת Include These Directories, לחצו על Add, בחרו בתיקייה המכילה חלק מקובצי PDF שיש לכלול באינדקס או את כולם, ולחצו על OK. אם ברצונכם להוסיף עוד תיקיות, חזרו על שלב זה.

    הערה:

    כל תיקייה השקועה בתיקייה אחרת הכלולה באינדקס, תיכלל גם היא בתהליך יצירת האינדקס. תוכלו לכלול תיקיות הנמצאות במספר שרתים או כוננים, כל עוד אינכם מתכננים להעביר את האינדקס או פריטים כלשהם המהווים חלק מאוסף המסמכים.

  8. תחת Exclude These Subdirectories, לחצו על Add, ובחרו בכל תיקייה שקועה המכילה קובצי PDF שאינכם מעוניינים לכלול באינדקס. לחצו על OK וחזרו על הפעולה לפי הצורך.

  9. בחנו את הבחירות שערכתם. כדי לערוך את רשימת התיקיות שייכללו באינדקס או יושמטו ממנו, בחרו את התיקייה שברצונכם לשנות ולחצו על Remove.

  10. לחצו על Build, ולאחר מכן ציינו את המיקום של קובץ האינדקס. לחצו על Save, ואחר כך:

    • לחצו על Close עם תום תהליך יצירת האינדקס.

    • לחצו על Stop כדי לבטל את תהליך יצירת האינדקס.

    הערה:

    אם תעצרו את תהליך יצירת האינדקס, לא תוכלו להמשיך את אותה פעולת יצירת אינדקס, אך לא תצטרכו לעשות שוב את אותה עבודה. האפשרויות והתיקיות שבחרתם יישארו ללא שינוי. תוכלו ללחוץ על Open Index, לבחור באינדקס שיצירתו לא הסתיימה, ולבצע מחדש את תהליך היצירה.

    הערה:

    אם נראה ששמות נתיבים ארוכים קוצרו באפשרויות Include These Directories ו- Exclude These Subdirectories, החזיקו את סמן העכבר מעל כל השמטה (...) עד שיופיע תיאור כלי המראה את הנתיב השלם של התיקייה הכלולה או התיקייה שאיננה כלולה.

תיבת הדו-שיח Indexing Options

Do Not Include Numbers

בחרו אפשרות זו אם ברצונכם שהאינדקס לא יכלול את כל המספרים המופיעים במלל המסמך. אי-ההכללה של מספרים עשויה להפחית במידה משמעותית את גודל האינדקס ולהפוך את החיפושים למהירים יותר.

Add IDs To Adobe PDF v1.0 Files

בחרו אפשרות זו אם האוסף שלכם כולל קובצי PDF שנוצרו לפני גרסה v2.0 של היישום, אשר בה לא נוספו אוטומטית מספרי זיהוי. מספרי זיהוי דרושים במקרים שבהם שמות קבצים ארוכים של Mac OS מקוצרים במהלך התרגום לשמות קבצים של MS-DOS. גרסה 2.0 ומעלה של תוכנת Acrobat מוסיפה מספרי זיהוי באופן אוטומטי.

Do Not Warn For Changed Documents When Searching

כאשר אפשרות זו לא נבחרה, תופיע הודעה כשאתם מחפשים במסמכים שהשתנו מאז בניית האינדקס האחרונה שנעשתה.

Custom Properties

השתמשו באפשרות זו כדי לכלול באינדקס מאפייני מסמך מותאמים אישית; ייכללו באינדקס רק מאפייני מסמך מותאמים אישית שכבר קיימים במסמכי PDF שעבורם אתם בונים אינדקס. הקלידו את המאפיין, בחרו מהתפריט Type ולאחר מכן לחצו על Add. מאפיינים אלה מופיעים כאפשרות חיפוש בתפריטי הקריטריונים הנוספים הנפתחים של החלון Search PDF כאשר מבצעים חיפוש באינדקס שהתקבל. לדוגמה, אם תזינו את המאפיין המותאם אישית Document Name ותבחרו במאפיין המחרוזת מתוך התפריט Type, משתמש שיבצע חיפוש באינדקס יוכל לחפש בתוך המאפיין המותאם אישית על-ידי בחירה באפשרות Document Name מתוך התפריט Use These Additional Criteria.

הערה:

כאשר יוצרים שדות מותאמים אישית ביישום של Microsoft Office, שביישום PDFMaker הכלול בו בוחרים עבורו באפשרות Convert Document Information, שדות אלה מועברים לכל קובץ PDF שיוצרים בו.  

XMP Fields

השתמשו באפשרות זו כדי לכלול שדות XMP מותאמים אישית. שדות XMP מותאמים אישית כלולים באינדקס, ומופיעים בתפריטים הנפתחים של קריטריונים נוספים, כדי שניתן יהיה לחפש בהם באינדקסים שנבחרו.

Stop Words

השתמשו באפשרות זו כדי שלא לכלול מילים ספציפיות (עד 500) בתוצאות החיפוש של האינדקס. הקלידו את המילה, לחצו על Add וחזרו על הפעולה לפי הצורך. אי הכללה של מילים באינדקס עשויה להביא להקטנה של האינדקס ב- ‎1‎0% עד 15%. מילות עצירה יכולה להכיל עד 128 תווים והיא תלויית-רישיות (case-sensitive).

הערה:

כדי למנוע מהמשתמשים לנסות לחפש ביטויים המכילים מילים אלו, הזכירו את המילים שלא נכללו באינדקס בקובץ Catalog Readme.

Structure Tags

השתמשו באפשרות זו כדי ליצור צמתי עלה ספציפיים של תגים, שבהם ניתן לבצע חיפוש, במסמכים בעלי מבנה לוגי של תגים.

הערה:

ההגדרות Custom Properties‏, Stop Words ו- Tags מתייחסות לאינדקס הנוכחי בלבד. כדי להחיל הגדרות אלו באופן גלובלי על כל אינדקס שתיצרו, תוכלו לשנות את הגדרות ברירת המחדל לשדות המותאמים אישית, מילות העצירה, והתגים בחלונית Catalog בתיבת הדו-שיח Preferences.  

קובצי ReadMe בקטלוג (Acrobat Pro)

לרוב, מומלץ ליצור קובץ ReadMe נפרד ולמקם אותו בתיקייה יחד עם האינדקס. קובץ ReadMe יכול לספק פרטים אודות האינדקס שיצרתם, כגון:

  • סוג המסמכים הכלולים באינדקס.

  • אפשרויות החיפוש שעבורן יש תמיכה.

  • האדם שאליו יש לפנות או מספר טלפון לשאלות.

  • רשימת מספרים או מילים שאינם כלולים באינדקס.

  • רשימה של התיקיות המכילות מסמכים הכלולים באינדקס מבוסס-LAN, או רשימה של המסמכים הכלולים באינדקס מבוסס-כונן. תוכלו גם לכלול תיאור קצר של תוכן כל תיקייה או מסמך.

  • רשימה של הערכים לכל מסמך אם אתם מזינים ערכים בשדה Document Info.

    אם נכלל בקטלוג מספר גדול במיוחד של מסמכים, שקלו לכלול טבלה המראה את הערכים המוקצים לכל מסמך. הטבלה יכולה להיות חלק מקובץ ReadMe או מסמך נפרד. כשאתם מפתחים את האינדקס, תוכלו להיעזר בטבלה לשם שמירה על עקביות.

עדכון אינדקס (Acrobat Pro)

ניתן לעדכן, לבנות מחדש, או למחוק אינדקס קיים.

  1. בחרו Tools ‏> Index.

    ערכת הכלים של האינדקס מוצגת בסרגל הכלים המשני.

  2. בסרגל הכלים המשני, לחצו על  Full Text Index With Catalog.

    תיבת הדו-שיח Catalog מוצגת.

  3. בתיבת הדו-שיח Catalog, לחצו על Open Index.

  4. אתרו את קובץ הגדרות האינדקס (PDX) לאינדקס ובחרו בו, ולאחר מכן לחצו על Open.

  5. אם האינדקס נוצר ב-Acrobat 5.0 או גרסה מוקדמת יותר, בחרו Create Copy כדי ליצור אינדקס חדש (בלא שתדרסו את הקודם), או בחרו Overwrite Old Index כדי לדרוס את האינדקס הקודם.

  6. בתיבת הדו-שיח Index Definition, בצעו שינויים כרצונכם ולאחר מכן בחרו בפעולה שאתם מעוניינים ש- Acrobat יבצע:

    Build

    יוצר קובץ IDX חדש עם הנתונים הקיימים, ומעדכן אותו על ידי הוספת עיולים חדשים, תוך סימון עיולים שהשתנו או שאינם עוד בתוקף כבלתי חוקיים. אם ביצעתם מספר רב של שינויים, או השתמשתם באפשרות זו שוב ושוב במקום ליצור אינדקס חדש, זמני החיפוש עלולים להתארך.

    Rebuild

    יוצר אינדקס חדש אשר ידרוס את תיקיית האינדקס הקיים ואת התוכן שלה (קובצי IDX).

    Purge

    מוחק את תוכן האינדקס (קובצי IDX) מבלי למחוק את קובץ האינדקס עצמו (PDX).

העדפות קטלוג (Acrobat Pro)

ניתן להגדיר העדפות ליצירת אינדקסים אשר יחולו גלובלית על כל האינדקסים שתיצרו לאחר מכן. ניתן לעקוף חלק מהעדפות אלו לאינדקס יחיד על-ידי בחירת אפשרויות שונות במהלך תהליך בניית האינדקס.

בתיבת הדו-שיח Preferences, תחת Categories, בחרו Catalog. רבות מהאפשרויות זהות לאלו שתוארו בתהליך יצירת אינדקס.

הערה:

האפשרות Force ISO 9660 Compatibility On Folders שימושית במקרה שאינכם רוצים לשנות שמות ארוכים של קובצי PDF לשמות קובצי MS-DOS בשעת הכנת מסמכים לצורך יצירת אינדקס. עם זאת, עליכם להשתמש בכללי מתן שמות של MS-DOS לשמות התיקיות (עד 8 תווים), למרות שהדבר אינו הכרחי לשמות הקבצים.

תזמון עדכוני אינדקסים (Acrobat Pro)

השתמשו בתכונה Catalog ובקובץ אצווה PDX של קטלוג (bpdx.) כדי לתזמן מתי ובאיזו תדירות לבנות, לבנות מחדש, לעדכן או לנקות אינדקס באופן אוטומטי. קובץ BPDX הוא קובץ מלל המכיל רשימה של נתיבים ודגלים תלויי פלטפורמה של קובץ אינדקס של קטלוג. כדי להציג קובץ BPDX ב- Acrobat יש להשתמש ביישום תזמון כגון Windows Scheduler‏. לאחר מכן Acrobat ייצור מחדש אם האינדקס בהתאם לדגלים הקיימים בקובץ BPDX‏.

הערה:

כדי להשתמש בקובץ BPDX, בחרו באפשרות Allow Catalog Batch Files (.bpdx) To Be Run בתיבת הדו-שיח Preferences , תחת Catalog.

העברת אוספים והאינדקסים שלהם (Acrobat Pro)

תוכלו לפתח ולבדוק אוסף מסמכים המסודר באינדקס בכונן קשיח מקומי, ולאחר מכן להעביר את אוסף המסמכים המוגמר לשרת רשת או לכונן נייד. הגדרת אינדקס כוללת נתיבים יחסיים בין קובץ הגדרת האינדקס (PDX) לבין התיקיות המכילות את המסמכים הכלולים באינדקס. אם נתיבים יחסיים אלה לא משתנים, אין צורך לבנות מחדש את האינדקס לאחר העברת אוסף המסמכים המסודרים באינדקס. אם קובץ PDX והתיקיות המכילות את המסמכים הכלולים באינדקס נמצאים באותה תיקייה, תוכלו לשמר את הנתיב היחסי, פשוט על-ידי העברת תיקייה זו.

אם הנתיב היחסי השתנה, עליכם ליצור אינדקס חדש לאחר העברת אוסף המסמכים הכלולים באינדקס. עם זאת, תוכלו עדיין להשתמש בקובץ PDX המקורי. כדי להשתמש בקובץ PDX המקורי, העבירו תחילה את המסמכים הכלולים באינדקס. לאחר מכן, העתיקו את קובץ PDX לתיקייה שבה תרצו ליצור את האינדקס החדש, וערכו את רשימות ההכללה ואי-ההכללה של תיקיות ושל תיקיות-משנה לפי הצורך.

אם האינדקס נמצא בכונן או באמצעי אחסון של השרת שהם נפרדים מכל חלק של האוסף שאליו מתייחס אינדקס זה, העברת האוסף או העברת האינדקס יפגעו בשלמות האינדקס. אם אתם מתכוונים להעביר אוסף מסמכים למיקום אחר ברשת או לתקליטור, צרו ובנו את האינדקס באותו מיקום בו נמצא האוסף.

קבל עזרה במהירות ובקלות

משתמש חדש?