פתח את מסמך ה-PDF ב- Acrobat, ובחר בתפריט ההמבורגר File (macOS) > Save as.
(Windows) או בתפריטOCR (זיהוי תווים אופטי), הוא התהליך שבו Acrobat בוחן תמונת טקסט המבוססת פיקסלים. הוא מזהה כל תו והופך אותו לטקסט הניתן לעריכה. Acrobat משווה את צורת התמונה ואת עובי השורה לתווים המותקנים במערכת בתהליך ה-OCR. טקסט שניתן לעריכה הוא טקסט ניתן לשינוי הקיים בקובץ ה-PDF. Acrobat אינו יכול לבצע OCR במסמך שמכיל טקסט הניתן לעריכה.
בעיה: Acrobat לא יכולה להפעיל OCR מכיוון שהדף מכיל טקסט שניתן לעריכה
כשפותחים קובץ PDF ובוחרים באפשרות זיהוי טקסט מכלי הסריקה וה-OCR, Acrobat מחזירה את השגיאה הבאה: "Acrobat could not perform recognition (OCR) on this page because: This page contains renderable text."
פתרון 1: הפעלת OCR על מסמך שלא כולל טקסט שניתן לעריכה
הודעה זו מופיעה אם מסמך ה-PDF כבר מכיל את הטקסט הניתן לעריכה. יש להשיג גרסה של המסמך שאינה מכילה טקסט שניתן לעריכה ולאחר מכן להפעיל OCR.
פתרון 2: המרת ה-PDF לפורמט קובץ של TIFF ובחזרה ל-PDF
-
-
בתיבת הדו-שיח 'שמירה כ-PDF', מהרשימה הנפתחת Convert to, בחר TIFF (*.tif, *.tiff). ציין מיקום, ולאחר מכן בחר Save. Acrobat שומר כל דף במסמך ה-PDF כקובץ TIFF נפרד, הממוספר ברצף.
-
פתח כל קובץ TIFF ב-Acrobat ומהכלי Scan & OCR, בחר Recognize text.