סריקת מסמך נייר ל- PDF

ניתן ליצור קובץ PDF ישירות ממסמך נייר, בעזרת Acrobat וסורק. Acrobat תומך במנהלי התקנים של סורק TWAIN ובמנהלי התקנים של Windows Image Acquisition ‏(WIA) ב- Windows. ב- Mac OS‏, Acrobat תומך ב- TWAIN ובלכידת תמונה (ICA).

ב- Windows, ניתן להשתמש ב- Autodetect Color Mode ולאפשר ל- Acrobat לקבוע מה סוג התוכן במסמך הנייר, או להשתמש בקביעות מוגדרות מראש אחרות (Black & White Document,‏ Grayscale Document,‏ Color Image ו- Color Document) על-פי שיקול דעתכם. ניתן להגדיר את קביעות הסריקה המוגדרות מראש או להשתמש באפשרות Custom Scan כדי לבחור את הגדרות הסריקה.

הערה:

סריקה בעזרת קביעה מוגדרת מראש זמינה רק למנהלי התקנים של סורקים התומכים במצב Hide Scanner’s Native Interface. קביעות הסריקה המוגדרות מראש אינן זמינות ב- Mac OS.

ב- Windows, אם מותקן מנהל התקן WIA בסורק שברשותכם, ניתן להשתמש בלחצן Scan בסורק כדי ליצור מסמך PDF. לחצו על הלחצן Scan וב- Windows בחרו באפשרות Adobe Acrobat מתוך רשימת היישומים הרשומים. לאחר מכן, בתיבת הדו-שיח סריקה ל- Acrobat, בחרו סורק וקביעה מוגדרת מראש של מסמך או באפשרות סריקה מותאמת אישית.

סריקת מסמך נייר ל- PDF בעזרת מצב Autodetect Color Mode‏ (‏Windows)

  1. בחרו File‏ > Create‏ > PDF from Scanner‏ > Autodetect Color Mode.

  2. אם תתבקשו לסרוק עמודים נוספים, בחרו בין האפשרויות Scan More Pages‏, Scan Reverse Sides או Scan Is Complete ולחצו על OK.

סריקת מסמך נייר ל- PDF בעזרת קביעה מוגדרת מראש (Windows)

  1. בחרו File‏ > Create‏ > PDF from Scanner‏ > [document preset].

  2. אם תתבקשו לסרוק עמודים נוספים, בחרו בין האפשרויות Scan More Pages‏, Scan Reverse Sides או Scan Is Complete ולחצו על OK.

סריקת מסמך נייר ל- PDF ללא קביעות מוגדרות מראש

  1. ב- Acrobat, בצעו אחת מהפעולות הבאות:
    • (Windows) בחרו File‏ > Create‏ > PDF from Scanner‏ > Custom Scan.
    • (Mac OS) בחרו File‏ > Create‏ > PDF from Scanner.
  2. בחרו אפשרויות סריקה בתיבת הדו-שיח Scan לפי הצורך ולחצו על Scan.

    הערה:

    אם תציינו שברצונכם להשתמש בממשק המקורי של הסורק במקום בממשק של Acrobat, יוצגו תיבות דו-שיח וחלונות אחרים. עיינו בתיעוד של הסורק למידע על האפשרויות הזמינות. ב- Mac OS, ממשק הסורק מוצג תמיד.

  3. אם תתבקשו לסרוק עמודים נוספים, בחרו בין האפשרויות Scan More Pages‏, Scan Reverse Sides או Scan Is Complete ולחצו על OK.

מיטוב PDF שנסרק

  1. פתחו קובץ PDF שנוצר ממסמך שנסרק.
  2. בחרו Tools‏ > Document Processing‏ > Optimize Scanned PDF.

  3. בחרו אפשרויות בתיבת הדו-שיח Optimize Scanned PDF ולחצו על OK.

הגדרת קביעות סריקה מוגדרות מראש (Windows)

  1. בחרו File‏ > Create‏ > PDF from Scanner‏ > Configure Presets.

  2. בתיבת הדו-שיח Configure Presets, בחרו קביעה מוגדרת מראש: Autodetect Color Mode‏, Black & White Document‏, Grayscale Document‏, Color Document או Color Image.

  3. שנו את הקביעות בהתאם לצורך.
  4. לחצו על Save כדי לשמור את הקביעה המוגדרת מראש ולאחר מכן לחצו על Close‏.

אפשרויות סריקה

Scanner

בחרו סורק מותקן. תוכנת הסריקה של היצרן חייבת להיות מותקנת במחשב. ב- Windows בלבד, לחצו על הלחצן Options כדי לציין את אפשרויות הסורק.

Presets

בחרו קביעה מוגדרת מראש שברצונכם לשנות.

Sides

בחרו סריקה חד-צדדית או דו-צדדית. אם תבחרו באפשרות Both Sides ובקביעות הסורק נבחר צד אחד בלבד, קביעת הסורק מבטלת את הקביעות ב- Acrobat.

הערה:

ניתן לסרוק עמוד משני צדדיו גם בסורקים שלא תומכים בסריקה דו-צדדית. כאשר בוחרים באפשרות Both Sides, לאחר סריקת הצד הראשון של העמודים, תוצג תיבת דו-שיח. אז תוכלו להפוך את מסמכי הנייר המקוריים במגש ולבחור באפשרות Scan Reverse Side (Put Reverse Of Sheets)‎ באותה תיבת דו-שיח. שיטה זו יוצרת מסמך PDF שכל עמודיו מוצגים בסדר הנכון.

Color Mode ‏(Windows בלבד)

בחרו מצב צבע בסיסי (Autodetect‏, Color‏, Black and White או Grayscale) שהסורק שברשותכם תומך בו. אפשרות זו מופעלת אם תחת ‏Scanner Options הוגדר שימוש בתיבת הדו-שיח של Acrobat לסריקה במקום ביישום של הסורק.

Resolution ‏(Windows בלבד)

בחרו רזולוציה שהסורק שברשותכם תומך בה. אפשרות זו מופעלת אם תחת ‏Scanner Options הוגדר שימוש בתיבת הדו-שיח של Acrobat לסריקה במקום ביישום של הסורק.

הערה:

אם תבחרו אפשרות Color Mode או Resolution שאינה נתמכת בסורק שברשותכם, תוצג הודעה וחלון היישום של הסורק ייפתח. בחרו אפשרויות אחרות בחלון היישום של הסורק.

Paper Size ‏(Windows בלבד)

בחרו גודל נייר או ציינו רוחב וגובה מותאמים אישית.

Prompt For Scanning More Pages

כאשר בוחרים באפשרות זו, לאחר כל פעולת סריקה נפתחת תיבת דו-שיח שתנחה אתכם לסרוק עמודים נוספים.

New PDF Document

יוצר מסמך PDF. אפשרות זו אינה זמינה בתיבת הדו-שיח Configure Presets.

Multiple Files

יוצר קבצים מרובים ממסמכי נייר מרובים. לחצו על More Options, ופרטו אם ליצור תיק PDF של הקבצים, את מספר העמודים בכל קובץ ואת הסיומת של שם הקובץ. אפשרויות אלה אינן זמינות בתיבת הדו-שיח Configure Presets.

Append To Existing File Or Portfolio

מוסיף את הסריקה שהומרה למסמך PDF או לתיק PDF קיימים. אפשרות זו אינה זמינה בתיבת הדו-שיח Configure Presets.

Optimize Scanned PDF

בחרו באפשרות זו כדי להפעיל את תהליך המיטוב על מסמך PDF. אפשרות זו משמשת לדחיסה ולסינון של תמונות במסמך ה- PDF שנסרק.

Small Size/High Quality

גררו את המחוון כדי לקבוע את נקודת האיזון בין גודל הקובץ לאיכות המסמך. לחצו על Options כדי לבצע התאמה אישית של המיטוב באמצעות קביעות ספציפיות לדחיסה וסינון קבצים.

Make Searchable (Run OCR)‎

בחרו באפשרות זו כדי להמיר תמונות מלל במסמך ה- PDF למלל שניתן לחיפוש ולבחירה. אפשרות זו מחילה זיהוי תו אופטי (OCR) וזיהוי גופן ועמוד על תמונות המלל. לחצו על Options כדי לציין קביעות בתיבת הדו-שיח Recognize Text - Settings. ראו זיהוי מלל במסמכים סרוקים.

Make PDF/A Compliant

בחרו אפשרות זו כדי שמסמך PDF יתאים לתקני ISO ל- PDF/A-1b. כאשר בוחרים בה, רק ההגדרה Searchable Image זמינה בתיבת הדו-שיח Recognize Text - Settings עבור האפשרות PDF Output Style.

Add Metadata

כאשר בוחרים באפשרות זו, תיבת הדו-שיח Document Properties מופיעה לאחר הסריקה. בתיבת הדו-שיח Document Properties ניתן להוסיף לקובץ ה- PDF מטא-נתונים או מידע אודות המסמך שנסרק. אם אתם יוצרים קבצים מרובים, ניתן להזין מטא-נתונים משותפים לכל הקבצים.

תיבת הדו-שיח Scanner Options

Data Transfer Method

Native Mode מעביר את מצב ברירת המחדל מהסורק שלכם. Memory Mode נבחר באופן אוטומטי לסריקה ברזולוציות הגבוהות מ- 600 נקודות לאינץ' (dpi).

User Interface

האפשרות Hide Scanner’s Native Interface עוקפת חלונות ותיבות דו-שיח שמספק היצרן של הסורק. במקום זאת, הסריקה תחל ישירות בהתאם לקביעות שפורטו בהגדרות Custom Scan.

Invert Black And White Images

אפשרות זו יוצרת תמונות פוזיטיב מתשלילים בשחור-לבן, לדוגמה.

תיבת הדו-שיח Optimize Scanned PDF

תיבת הדו-שיח Optimize Scanned PDF שולטת בקביעות התמונה ובאופן שבו תמונות סרוקות יותאמו ויידחסו למסמך ה- PDF. קביעות ברירת המחדל מתאימות למגוון של עמודי מסמכים, אך ייתכן שתרצו להתאים אישית את הקביעות לקבלת תמונות באיכות טובה יותר, קבצים בגדלים קטנים יותר, או בשל בעיות בסריקה.

Apply Adaptive Compression

מחלק כל עמוד לאזורים של שחור-לבן, של גווני אפור ושל צבע, ובוחר ייצוג השומר על המראה תוך דחיסה גבוהה של כל סוג תוכן. רזולוציות הסריקה המומלצות הן ‎300 dpi לקלט בגווני אפור ו- RGB, או ‎600 dpi לקלט בשחור-לבן.

Color/Grayscale settings

כאשר סורקים עמודים בצבע או בגווני אפור, בחרו אחת מהאפשרויות הבאות:

JPEG 2000

מחיל דחיסת JPEG2000 על תוכן התמונה הצבעוני. (קביעה זו אינה מומלצת ליצירת קובצי PDF/A. במקומה, השתמשו באפשרות JPEG)

‏ZIP‏

מחיל דחיסת ZIP על תוכן התמונה הצבעוני.

‏JPEG‏

מחיל דחיסת JPEG על תוכן התמונה הצבעוני.

הערה:

הסורק משתמש באפשרות Color/Grayscale שנבחרה או באפשרות Monochrome שנבחרה. הבחירה בין האפשרויות תבוצע בהתאם לקביעות בהן בחרתם בתיבת הדו-שיח Acrobat Scan או בממשק TWAIN של הסורק, שעשוי להיפתח לאחר לחיצה על Scan בתיבת הדו-שיח Acrobat Scan. (כברירת מחדל, תיבת הדו-שיח של יישום הסורק אינה נפתחת).

Monochrome

כשסורקים תמונות בשחור-לבן או במונוטון, בחרו אחת מהאפשרויות הבאות:

JBIG2 (Lossless) & JBIG2(Lossy)‎‏

מחיל את שיטת הדחיסה JBIG2 על עמודי קלט בשחור-לבן. ברמות האיכות הגבוהה ביותר, נעשה שימוש בשיטת דחיסה ללא אובדן נתונים; בקביעות נמוכות יותר, המלל נדחס מאוד. בדרך כלל, עמודי מלל קטנים ב- 60% מעמודים שדחוסים בשיטת 'CCITT Group 4', אך העיבוד הוא איטי. תואם Acrobat 5.0 ‏(PDF 1.4) ומעלה.

הערה:

לצורך תאימות עם Acrobat 4.0, השתמשו בכל שיטת דחיסה מלבד JBIG2.

CCITT Group 4

מחיל דחיסת CCITT Group 4 על תמונות בעמודי קלט בשחור-לבן. זוהי שיטת דחיסה מהירה ללא אובדן נתונים התואמת ל- Acrobat 3.0 ‏(PDF 1.2) ומעלה‎.

Small Size/High Quality

קובע את נקודת האיזון בין גודל הקובץ לאיכותו.

Deskew

מסובב עמוד שאינו מיושר עם צדדי משטח הסורק, כדי ליישר לאורך את העמוד ב- PDF. בחרו באפשרות On או Off.

Background Removal

מלבין אזורים כמעט לבנים בקלט בגווני אפור או בצבע (לא בקלט בשחור-לבן).

הערה:

לקבלת התוצאות טובות ביותר, כיילו את קביעות הניגוד והבהירות בסורק שלכם כך שבסריקת עמוד רגיל בשחור-לבן המלל יהיה אפור כהה או שחור והרקע יהיה לבן. לאחר מכן, בחירה באפשרות Off או Low אמורה לספק תוצאות טובות. כשסורקים נייר בלבן "מלוכלך" או נייר עיתון, השתמשו באפשרות Medium או High כדי לנקות את העמוד.

Descreen

מסיר מבנה של נקודת רשת הדפסה, שעשוי להפחית את דחיסת JPEG, לגרום לדוגמאות גליות ולהקשות על זיהוי המלל. מתאים מתאים לקלט בגווני אפור או קלט RGB של 200–400 dpi או בדחיסה מתואמת, לקלט שחור-לבן של 400–600-dpi. הקביעה On (מומלצת) מחילה את המסנן עבור קלט בגווני אפור וקלט RGB של ‎ 300 dpiאו יותר. בחרו באפשרות Off בסריקת עמוד ללא תמונות או אזורים עם מילוי, או בסריקה ברזולוציה גבוהה מהטווח היעיל.

Text Sharpening

מחדדת את המלל בקובץ ה- PDF שנסרק. ערך ברירת המחדל הנמוך מתאים למרבית המסמכים. הגדילו אותו אם איכות המסמך המודפס נמוכה והמלל אינו ברור.

עצות לסריקה

  • סריקה ב- Acrobat מקבלת תמונות בטווח של 10 עד3000‎ ‎‏ dpi. אם בוחרים באפשרות Searchable Image או ClearScan עבור PDF Output Style, נדרשת רזולוציית קלט של ‎72‎ dpi או יותר. כמו כן, רזולוציית קלט גבוהה מ- ‎600 dpi מופחתת ל- ‎600 dpi או פחות.

  • כדי להחיל דחיסה ללא אובדן נתונים על תמונה שנסרקת, בחרו באחת מהאפשרויות הבאות תחת Optimization Options בתיבת הדו-שיח Optimize Scanned PDF‏: CCITT Group 4 לתמונות בשחור-לבן או Lossless לתמונות בגווני אפור או לתמונות צבעוניות. אם התמונה מצורפת למסמך PDF ושומרים את הקובץ בעזרת האפשרות Save, התמונה שנסרקה אינה נדחסת. אם שומרים את מסמך ה- PDF בעזרת האפשרות Save As, ייתכן שהתמונה שנסרקה תידחס.

  • ברוב העמודים, סריקה בשחור-לבן ברזולוציה של ‎300 dpi תפיק מלל המותאם היטב להמרה. ברזולוציה של 150 dpi, רמת הדיוק של זיהוי התוווים האופטי מעט נמוכה יותר ומתרחשות יותר שגיאות זיהוי גופן, ברזולוציה של ‎ 400 dpi ויותר, העיבוד איטי יותר ונפח העמודים הדחוסים גדול יותר. אם העמוד כולל מספר גדול של מילים בלתי מזוהות או מלל בגופן קטן (9 נקודות או קטן יותר), נסו לסרוק ברזולוציה גבוהה יותר. השתדלו לסרוק בשחור-לבן, ככל שניתן.

  • כאשר האפשרות Recognize Text Using OCR מושבתת, ניתן להשתמש בטווח המלא שבין 10 ל- ‎3000 dpi, אך הרזולוציה המומלצת היא ‎72‎ dpi ומעלה. לצורך שימוש ב- Adaptive Compression, מומלצת רזולוציה של ‎300 dpi לקלט בגווני אפור או RGB או רזולוציה של ‎600 dpi‎ לקלט בשחור-לבן.

  • עמודים שנסרקו בצבע של 24 סיביות, ברזולוציה של 300 dpi, בגודל 8-1/2–11 אינץ'. האפשרות (‎21.59-by-‎27.94 cm) יוצרת תמונות גדולות יותר (25 MB) לפני דחיסה. המערכת עלולה לדרוש לפחות 50‎ MB‏ של זיכרון וירטואלי כדי לסרוק את התמונה. בדרך כלל, ברזולוציה של ‎600 dpi, הסריקה והעיבוד איטיים פי ארבעה מאשר ברזולוציה של ‎300 dpi.

  • הימנעו מקביעות סורק של מיזוג צבעים או רשת הדפסה. קביעות אלה יכולות לשפר את המראה של תצלומים, אך הן מקשות על זיהוי מלל.

  • במלל המודפס על נייר צבעוני, נסו להגדיל את הבהירות ואת הניגוד בכ- 10%. אם לסורק שלכם יש יכולת סינון צבע, שקלו להשתמש במסנן או במנורה שמשמיטים את צבע הרקע. אם המלל אינו חד או שיש בו השמטות, נסו לכוון את הניגוד והבהירות של הסורק להבהרת הסריקה.

  • אם לסורק יש בקרת בהירות ידנית, כוונו אותה כך שהתווים יהיו נקיים ומעוצבים היטב. אם התווים נוגעים זה בזה, השתמשו בקביעה גבוהה (בהירה) יותר. אם האותיות מופרדות, השתמשו בקביעה נמוכה (כהה) יותר.

זיהוי מלל במסמכים סרוקים

ניתן להשתמש ב- Acrobat לזיהוי מלל במסמכים שנסרקו וכבר הומרו ל- PDF. תוכנה לזיהוי תווים אופטי (OCR) מאפשרת לכם לחפש, לתקן ולהעתיק את המלל שבקובץ PDF סרוק. להחלת זיהוי תווים אופטי על מסמך PDF, הרזולוציה של הסורק חייבת להיקבע על 72 dpi ומעלה.

הערה:

סריקה ברזולוציה של 300 dpi יוצרת את המלל המתאים ביותר להמרה. ברזולוציה של 150 dpi, זיהוי התווים האופטי מדויק פחות.

זיהוי מלל במסמך יחיד

  1. פתחו את מסמך PDF הסרוק.
  2. בחרו Tools‏ > Text Recognition‏ > In This File.

  3. בתיבת הדו-שיח Recognize Text בחרו באפשרות תחת Pages.

  4. לחילופין, לחצו על Edit כדי לפתוח את תיבת הדו-שיח Recognize Text - General Settings ולציין את האפשרויות הנדרשות.

זיהוי מלל במסמכים מרובים

  1. ב- Acrobat, בחרו ‏Tools >‏ Text Recognition‏  > In Multiple Files.

  2. בתיבת הדו-שיח Recognize Text לחצו על Add Files ובחרו באחת האפשרויות Add Files‏, Add Folders או Add Open Files. לאחר מכן בחרו בקבצים או בתיקייה.
  3. בתיבת הדו-שיח Output Options ציינו תיקיית מטרה עבור קובצי פלט והעדפות שם קובץ.
  4. ציינו את האפשרויות בתיבת הדו-שיח Recognize Text - General Settings ולחצו על OK.

תיבת הדו-שיח Recognize Text - General Settings

Primary OCR Language

מציין את השפה בה ישתמש מנוע זיהוי התווים האופטי לזיהוי התווים.

PDF Output Style

קובע את סוג מסמך PDF שייווצר. כל האפשרויות דורשות רזולוציית קלט של 72‎ dpi ומעלה (מומלץ). כל התבניות מחילות זיהוי תווים אופטי וזיהוי של גופנים ועמודים על תמונות המלל, וממירות אותן למלל רגיל.

Searchable Image

מבטיח שניתן לחפש ולבחור במלל. אפשרות זו שומרת על התמונה המקורית, מתקנת את ההטיה שלה לפי הצורך וממקמת שכבת מלל בלתי נראית מעליה. אפשרות הבחירה Downsample Images באותה תיבת דו-שיח קובעת אם הרזולוציה של התמונה תופחת ובאיזו מידה.

Searchable Image (Exact)‎

מבטיח שניתן לחפש ולבחור במלל. אפשרות זו שומרת על התמונה המקורית וממקמת שכבת מלל בלתי נראית מעליה. מומלץ למקרים הדורשים נאמנות מרבית לתמונה המקורית.

ClearScan

משלב גופן Type 3 חדש הקרוב לגופן המקורי, ושומר על רקע העמוד בעזרת עותק ברזולוציה נמוכה.

Downsample To

מפחית את מספר הפיקסלים בתמונות בצבע, בגווני אפור ובשחור-לבן לאחר השלמת זיהוי התווים האופטי. בחרו ברמת הפחתת הדגימה להחלה. מספרים גבוהים יותר יקטינו את מידת הפחתת הדגימה, וכך קובצי PDF יהיו בעלי רזולוציה גבוהה יותר.

תיקון מלל של זיהוי תווים אופטי בקובצי PDF

כאשר מפעילים זיהוי תווים אופטי על פלט שנסרק, Acrobat מבצעת ניתוח של מפת הסיביות של המלל ומחליפה מילים ותווים באזורי סיביות אלה. אם התחליף האידיאלי מוטל בספק, Acrobat תסמן את המילה כמילה חשודה. מילים חשודות מוצגות בקובץ ה- PDF כמפת הסיביות המקורית של המילה, אך המלל כלול בשכבה בלתי נראית מאחורי מפת הסיביות. בשיטה זו המילה ניתנת לחיפוש גם אם היא מוצגת כמפת סיביות.

הערה: אם תנסו לבחור מלל במסמך PDF סרוק שלא הוחל עליו זיהוי תווים אופטי או לבצע פעולת Read Out Loud על קובץ תמונה, Acrobat ישאל אם ברצונכם להפעיל זיהוי תווים אופטי. אם תלחצו על OK, תיפתח תיבת הדו-שיח Text Recognition, ותוכלו לבחור מבין אפשרויות שמתוארות בפירוט תחת הנושא הקודם.

  1. בצעו אחת מהפעולות הבאות:

    • בחרו Tools ‏> Text Recognition ‏> Find All Suspects. כל המילים החשודות בעמוד יסומנו בתיבות. לחצו על כל מילה חשודה כדי להציג את המלל החשוד בתיבת הדו-שיח Find Element.
    • בחרו  Tools ‏> Text Recognition ‏> Find First Suspect.

    הערה: אם סוגרים את החלון Find Element לפני תיקון כל המילים החשודות, ניתן לחזור לתהליך על-ידי בחירה ב- Tools‏ > Text Recognition‏ > Find First Suspect או על-ידי לחיצה על כל מילה חשודה בעזרת הכלי Edit Document Text.

  2. באפשרות Find בחרו ב- OCR Suspects.

  3. השוו בין המילה בתיבת המלל החשודה לבין המילה שמופיעה בפועל במסמך שנסרק. כדי לתקן מילה חשודה בזיהוי תווים אופטי, לחצו על האובייקט המודגש במסמך והקלידו את המלל החדש. אם המילה החשודה זוהתה כטקסט בטעות, לחצו על הלחצן Not Text.

  4. סקרו ותקנו את המילים החשודות הנותרות וסגרו את תיבת הדו-שיח Find Element.

עבודה זו בוצעה ברישיון של Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License  הודעות המתפרסמות ב- Twitter™‎ ו- Facebook אינן מכוסות בתנאי Creative Commons.

הצהרות משפטיות   |   מדיניות פרטיות מקוונת