לפני שתתחיל
אנחנו מפיצים חוויית מוצר חדשה ואינטואיטיבית יותר. אם המסך המוצג כאן אינו תואם את ממשק המוצר שלך, בחר עזרה עבור החוויה הנוכחית שלך.
סרוק מסמך נייר ל- PDF והשתמש ב- Acrobat כדי להפוך אותו למסמך PDF חכם שניתן לחיפוש, עם מלל הניתן לבחירה.
לפני שתתחיל
אנחנו מפיצים חוויית מוצר חדשה ואינטואיטיבית יותר. אם המסך המוצג כאן אינו תואם את ממשק המוצר שלך, בחר עזרה עבור החוויה הנוכחית שלך.
ניתן ליצור קובץ PDF ישירות ממסמך נייר, בעזרת Acrobat וסורק. Acrobat תומך במנהלי התקנים של סורק TWAIN ובמנהלי התקנים של Windows Image Acquisition (WIA) ב- Windows. ב- Mac OS, Acrobat תומך ב- TWAIN ובלכידת תמונה (ICA).
ב- Windows, ניתן להשתמש ב- Autodetect Color Mode ולאפשר ל- Acrobat לקבוע מה סוג התוכן במסמך הנייר או להשתמש בקביעות מוגדרות מראש אחרות (Black & White Document, Grayscale DocumentText Recognition, Color Image ו- Color Document) על פי שיקול דעתכם. ניתן להגדיר את קביעות הסריקה המוגדרות מראש או להשתמש באפשרות Custom Scan כדי לבחור את הגדרות הסריקה.
סריקה בעזרת קביעה מוגדרת מראש זמינה רק למנהלי התקנים של סורקים התומכים במצב Hide Scanner’s Native Interface. קביעות הסריקה המוגדרות מראש אינן זמינות ב- Mac OS.
ב- Windows, אם מותקן מנהל התקן WIA בסורק שלך, ניתן להשתמש בלחצן Scan כדי ליצור מסמך PDF. לחץ על הלחצן Scan, ולאחר מכן בחר Adobe Acrobat מתוך רשימת היישומים הרשומים ב- Windows. לאחר מכן, בחר סורק וקביעה מוגדרת מראש עבור המסמך או Custom Scan בממשק הסריקה של Acrobat.
כדי לסרוק מסמך נייר ל- PDF באמצעות Acrobat, עבור אל All tools > Create PDF. מוצג הממשק ליצירת מסמך PDF מכל תבנית. בחר Scanner כדי לראות את האפשרויות הזמינות.
ב-Windows:
במחשב Mac:
בחר All Tools > Create PDF > Scanner > Autodetect Color Mode.
אם ברצונך לצרף את המסמך, שאותו תסרוק, לקובץ קיים, בצע את הפעולות הבאות:
כדי לסרוק מספר קבצים למסמך PDF, בחר את הסמל Settings . מוצג הממשק Custom Scan. בחר Prompt to scan more pages.
בחר Scan.
אם תתבקש לסרוק עמודים נוספים, בחר מבין האפשרויות Scan More Pages, Scan Reverse Sides אוScan Is Complete ובחר OK.
בחרו Tools > Create PDF > Scanner > [document preset].
אם ברצונכם לצרף את המסמך, שאותו תסרקו, לקובץ קיים, בצעו את הפעולות הבאות:
כדי לסרוק מספר קבצים למסמך PDF, בחר את הסמל Settings . מוצג הממשק Custom Scan. בחר Prompt to scan more pages.
בחר Scan.
אם תתבקש לסרוק עמודים נוספים, בחר מבין האפשרויות Scan More Pages, Scan Reverse Sides אוScan Is Complete ובחר OK.
בחר See all tools > Create a PDF > Scanner > Default Settings או My custom settings .
אם ברצונך לצרף את המסמך, שאותו תסרוק, לקובץ קיים, בצע את הפעולות הבאות:
אם ברצונך לשנות את ההגדרות, בחר את הסמל Settings . מוצג הממשק Custom Scan. בחרו באפשרויות הסריקה כנדרש.
אם ברצונך לסרוק מספר קבצים למסמך PDF, בחר Prompt to scan more pages.
אם תציינו שברצונכם להשתמש באפשרות Show scanner's user interface במקום בממשק המשתמש של Acrobat, יופיעו תיבות דו-שיח וחלונות אחרים. עיינו בתיעוד של הסורק למידע על האפשרויות הזמינות. ב- Mac OS, ממשק הסורק מוצג תמיד.
בחר Scan.
אם תתבקש לסרוק עמודים נוספים, בחר מבין האפשרויות Scan More Pages, Scan Reverse Sides אוScan Is Complete ובחר OK.
בחר All tools > Scan & OCR > Enhance scanned file.
בחר אפשרויות בסרגל הכלים המשני – בחר את הסמל Settings , בחר אפשרויות מתאימות בתיבת הדו-שיח Enhance Scanned PDF, ובחר OK.
לקבלת מידע נוסף אודות האפשרויות המוצגות בתיבת הדו-שיח, ראו תיבת הדו-שיח Enhance Scanned PDF.
בחר All tools > Create a PDF > Scanner.
בחר קביעת סריקה מוגדרת מראש: Autodetect Color Mode, Black and White Document, Color Document, Grayscale Document או Color Photograph.
בחר את הסמל Settings לצד הקביעה המוגדרת מראש. בהתאם לבחירה שלכם, מוצג הממשק Custom Scan או Configure Predefined Settings for.
אם ברצונך לסרוק מספר קבצים למסמך PDF, בחר Prompt to scan more pages.
בחר Save Settings כדי לשמור את הקביעה המוגדרת מראש.
לאחר בחירת סורק, ניתן לבחור או להתאים את אפשרויות הסריקה השונות בהתאם לדרישותיכם.
תיבת הדו-שיח Enhance Scanned PDF שולטת בקביעות התמונה ובאופן שבו תמונות סרוקות יותאמו ויידחסו למסמך ה- PDF. קביעות ברירת המחדל מתאימות למגוון של עמודי מסמכים, אך ייתכן שתרצו להתאים אישית את הקביעות לקבלת תמונות באיכות טובה יותר, קבצים בגדלים קטנים יותר, או בשל בעיות בסריקה.
Document Language
כברירת מחדל, שפת OCR נבחרת בהתאם למיקום ברירת המחדל. לשינוי השפה, לחצו על Edit ובחרו שפה אחרת.
Output
Either Searchable Image או Editable Text and Images.
סריקה ב- Acrobat מקבלת תמונות בטווח של 10 עד3000 dpi. אם בוחרים באפשרות Searchable Image או באפשרות ClearScan עבור PDF Output Style, נדרשת רזולוציית קלט של 72 dpi או יותר. כמו כן, רזולוציית קלט גבוהה מ- 600 dpi מופחתת ל- 600 dpi או פחות.
ניתן להחיל דחיסה ללא אובדן נתונים רק על תמונות בשחור-לבן. כדי להחיל דחיסה ללא אובדן נתונים על תמונה שנסרקת, בחרו באחת מהאפשרויות הבאות תחת Optimization Options בתיבת הדו-שיח Optimize Scanned PDF: CCITT Group 4 או JBIG2 (Lossless) לתמונות בשחור-לבן. אם התמונה מצורפת למסמך PDF ושומרים את הקובץ בעזרת האפשרות Save, התמונה שנסרקה אינה נדחסת. התמונה הסרוקה עשויה להידחס אם קובץ ה- PDF יישמר באמצעות Save As.
ברוב העמודים, סריקה בשחור-לבן ברזולוציה של 300 dpi תפיק מלל המותאם היטב להמרה. ברזולוציה של 150 dpi, רמת הדיוק של זיהוי התווים האופטי מעט נמוכה יותר ומתרחשות יותר שגיאות זיהוי גופן, ברזולוציה של 400 dpi ויותר, העיבוד איטי יותר ונפח העמודים הדחוסים גדול יותר. אם העמוד כולל מספר גדול של מילים בלתי מזוהות או מלל בגופן קטן (9 נקודות או קטן יותר), נסו לסרוק ברזולוציה גבוהה יותר. השתדל לסרוק בשחור-לבן, ככל שניתן.
כאשר האפשרות Recognize Text Using OCR מושבתת, ניתן להשתמש בטווח המלא שבין 10 ל- 3000 dpi, אך הרזולוציה המומלצת היא 72 dpi ומעלה. עבור Adaptive Compression מומלצת רזולוציה של 300 dpi לקלט בגווני אפור או RGB או רזולוציה של 600 dpi לקלט בשחור-לבן.
עמודים שנסרקו בצבע של 24 סיביות, ברזולוציה של dpi 300, בגודל 8-1/2 על 11 אינץ' (21.59 על 27.94 ס"מ) יוצרים תמונות גדולות יותר (MB 25) לפני דחיסה. המערכת עלולה לדרוש לפחות 50 MB של זיכרון וירטואלי כדי לסרוק את התמונה. ככלל, ברזולוציה של 600 dpi, הסריקה והעיבוד איטיים פי ארבע בערך מאשר ברזולוציה של 300 dpi.
הימנעו מהגדרות סורק של מיזוג צבעים או רשת הדפסה. הגדרות אלה יכולות לשפר את מראה התמונות, אך הן מקשות על זיהוי מלל.
במלל המודפס על נייר צבעוני, נסו להגדיל את הבהירות ואת הניגוד בכ- 10%. אם לסורק שלכם יש יכולת סינון צבע, שקלו להשתמש במסנן או במנורה שמשמיטים את צבע הרקע. אם המלל אינו חד או שיש בו השמטות, נסו לכוון את הניגוד והבהירות של הסורק להבהרת הסריקה.
אם לסורק יש בקרת בהירות ידנית, כוונו אותה כך שהתווים יהיו נקיים ומעוצבים היטב. אם התווים נוגעים זה בזה, השתמשו בקביעה גבוהה (בהירה) יותר. אם האותיות מופרדות, השתמשו בקביעה נמוכה (כהה) יותר.
כדי לטפל בשגיאות או בבעיות הקשורות לסורק, ניתן להציג את מסמכי פתרון הבעיות הבאים:
ניתן להשתמש ב- Acrobat לזיהוי מלל במסמכים שנסרקו וכבר הומרו ל- PDF. תוכנה לזיהוי תווים אופטי (OCR) מאפשרת לחפש, לתקן ולהעתיק את המלל שבקובץ PDF סרוק. רזולוציית הסורק המקורית חייבת להיות מוגדרת כ-72 dpi ומעלה כדי להחיל OCR על קובץ PDF.
סריקה ברזולוציה של dpi 300 יוצרת את המלל המתאים ביותר להמרה. ברזולוציה של 150 dpi, זיהוי התווים האופטי מדויק פחות.
בחר All tools > Scan & OCR > In This File.
אפשרויות Recognize Text מוצגות בסרגל הכלים המשני.
בסרגל הכלים המשני, בחרו טווח עמודים ושפה עבור זיהוי מלל.
לחלופין, לחצו על Settings כדי לפתוח את תיבת הדו-שיח Recognize Text וציינו את האפשרויות הנדרשות.
בחר Recognize Text. Acrobat יוצר במסמך ה-PDF שכבת מלל ניתן לחיפוש – או להעתקה ולהדבקה במסמך חדש.
בחר All tools > Scan & OCR > In multiple files.
בתיבת הדו-שיח Recognize Text בחר Add Files ובחר את אחת האפשרויות Add Files, Add Folders או Add Open Files. לאחר מכן בחר בקבצים או בתיקייה. מוצגת תיבת הדו-שיח Output Options.
בתיבת הדו-שיח Output Options ציין תיקיית יעד עבור קובצי פלט והעדפות שם קובץ. בחר אישור.
ציין את האפשרויות בתיבת הדו-שיח Recognize Text – General Settings ובחר OK.
Acrobat יוצר במסמך ה-PDF שכבת מלל ניתן לחיפוש – או להעתקה ולהדבקה במסמך חדש.
Document Language
מציין את השפה בה ישתמש מנוע זיהוי התווים האופטי לזיהוי התווים.
Output (PDF Output Style)
קובע את סוג מסמך PDF שייווצר. כל האפשרויות דורשות רזולוציית קלט של 72 dpi ומעלה (מומלץ). כל התבניות מחילות זיהוי תווים אופטי וזיהוי של גופנים ועמודים על תמונות המלל, וממירות אותן למלל רגיל.
Searchable Image
מבטיח שניתן לחפש ולבחור במלל. אפשרות זו שומרת על התמונה המקורית, מתקנת את ההטיה שלה לפי הצורך וממקמת שכבת מלל בלתי נראית מעליה. אפשרות הבחירה Downsample Images באותה תיבת דו-שיח קובעת אם הרזולוציה של התמונה תופחת ובאיזו מידה.
Searchable Image (Exact)
מבטיח שניתן לחפש ולבחור במלל. אפשרות זו שומרת על התמונה המקורית וממקמת שכבת מלל בלתי נראית מעליה. מומלץ למקרים הדורשים נאמנות מרבית לתמונה המקורית.
Editable Text & Images
משלב גופן מותאם אישית חדש הקרוב לגופן המקורי, ושומר על רקע העמוד בעזרת עותק ברזולוציה נמוכה.
Downsample To
מפחית את מספר הפיקסלים בתמונות בצבע, בגווני אפור ובשחור-לבן לאחר השלמת זיהוי התווים האופטי. בחרו ברמת הפחתת הדגימה להחלה. מספרים גבוהים יותר יקטינו את מידת הפחתת הדגימה, וכך קובצי PDF יהיו בעלי רזולוציה גבוהה יותר.
כאשר מפעילים זיהוי תווים אופטי על פלט שנסרק, Acrobat מבצעת ניתוח של מפת הסיביות של המלל ומחליפה מילים ותווים באזורי סיביות אלה. אם התחליף האידיאלי מוטל בספק, Acrobat תסמן את המילה כמילה חשודה. מילים חשודות מוצגות בקובץ ה- PDF כמפת הסיביות המקורית של המילה, אך המלל כלול בשכבה בלתי נראית מאחורי מפת הסיביות. בשיטה זו מילה ניתנת לחיפוש גם אם היא מוצגת כמפת סיביות.
הערה: אם תנסה לבחור מלל במסמך PDF סרוק שלא הוחל עליו זיהוי תווים אופטי או לבצע פעולת Read Out Loud על קובץ תמונה, Acrobat ישאל אם ברצונך להפעיל זיהוי תווים אופטי. אם תבחר OK, תיפתח תיבת הדו-שיח Text Recognition, ותוכל לבחור מבין אפשרויות שמתוארות בפירוט תחת הנושא הקודם.
בחר All tools > Scan & OCR > Correct recognized text.
Acrobat מזהה שגיאות חשודות במלל ומציג את התמונה ואת המלל זה לצד זה בסרגל הכלים המשני. כל המילים החשודות בעמוד יסומנו בתיבות.
בחר את האובייקט או התיבה המסומנים במסמך, ותקן אותם בתיבה Recognized As בסרגל הכלים המשני. בחר Accept.
המלל החשוד הבא יסומן. תקנו את הטעויות בהתאם לצורך. בחר Accept עבור כל תיקון.
בסיום המשימה, בחר Close בסרגל הכלים המשני.