Acrobat לא יכול להפעיל OCR עקב טקסט שניתן לעריכה בדף

חפש

עודכן לאחרונה בתאריך 26 באפריל 2024

OCR (זיהוי תווים אופטי), הוא התהליך שבו Acrobat בוחן תמונת טקסט המבוססת פיקסלים. הוא מזהה כל תו והופך אותו לטקסט הניתן לעריכה. Acrobat משווה את צורת התמונה ואת עובי השורה לתווים המותקנים במערכת בתהליך ה-OCR. טקסט שניתן לעריכה הוא טקסט ניתן לשינוי הקיים בקובץ ה-PDF. Acrobat אינו יכול לבצע OCR במסמך שמכיל טקסט הניתן לעריכה.

בעיה: Acrobat לא יכולה להפעיל OCR מכיוון שהדף מכיל טקסט שניתן לעריכה

כשפותחים קובץ PDF ובוחרים באפשרות זיהוי טקסט מכלי הסריקה וה-OCR‏, Acrobat מחזירה את השגיאה הבאה: "Acrobat could not perform recognition (OCR) on this page because: This page contains renderable text."

פתרון 1: הפעלת OCR על מסמך שלא כולל טקסט שניתן לעריכה

הודעה זו מופיעה אם מסמך ה-PDF כבר מכיל את הטקסט הניתן לעריכה. יש להשיג גרסה של המסמך שאינה מכילה טקסט שניתן לעריכה ולאחר מכן להפעיל OCR.

פתרון 2: המרת ה-PDF לפורמט קובץ של TIFF ובחזרה ל-PDF

פתח את מסמך ה-PDF ב- Acrobat, ובחר בתפריט ההמבורגר (Windows) או בתפריט File‏ ‏(macOS) ‏> Save as.
בתיבת הדו-שיח 'שמירה כ-PDF', מהרשימה הנפתחת Convert to, בחר TIFF‏ (*.tif, *.tiff). ציין מיקום, ולאחר מכן בחר Save. Acrobat שומר כל דף במסמך ה-PDF כקובץ TIFF נפרד, הממוספר ברצף.
פתח כל קובץ TIFF ב-Acrobat ומהכלי Scan & OCR, בחר Recognize text.

מוצרים דומים נוספים

למידע נוסף על יצירת קובצי PDF

קבל עזרה במהירות ובקלות

משתמש חדש?