Acrobat kann OCR aufgrund von renderbarem Text auf der Seite nicht ausführen

OCR (Optical Character Recognition bzw. optische Zeichenerkennung) ist der Prozess, bei dem Acrobat eine pixelbasierte Abbildung des Textes prüft. Es erkennt jedes Zeichen und konvertiert es in bearbeitbaren Text. Acrobat vergleicht die Bildform und Linienstärke mit den Schriftarten, die auf dem System installiert sind, während des OCR-Vorgangs. Text, der gerendert werden kann, ist bearbeitbarer Text, der in der PDF-Datei vorhanden ist. In einem Dokument, , das Text enthält, der gerendert werden kann, kann Acrobat keine OCR-Erkennung durchführen.

Problem: Acrobat kann OCR nicht ausführen, da die Seite Text enthält, der gerendert werden kann.

Wenn du eine PDF öffnest und im Tool „Scan & OCR“ die Option „Text erkennen“ auswählst, gibt Acrobat die folgende Fehlermeldung zurück: Acrobat konnte die Erkennung (OCR) auf dieser Seite nicht durchführen, weil diese Seite Text enthält, der gerendert werden kann.

Lösung 1: Führe OCR in einem Dokument aus, das keinen Text enthält, der gerendert werden kann

Diese Meldung wird angezeigt, wenn das PDF-Dokument bereits bearbeitbaren Text enthält. Besorge dir eine Kopie des Dokuments, die keinen bearbeitbaren Text enthält, und führe dann die OCR-Erkennung aus.

Lösung 2: Konvertiere die PDF-Datei in TIFF-Format und dann wieder zurück in PDF-Format.

  1. Öffne die PDF-Datei in Acrobat und wähle das Hamburger-Menü   (Windows) oder das Menü Datei  (macOS) > Speichern unter.

  2. Wähle im Dialogfeld „Als PDF speichern“ in der Dropdown-Liste Konvertieren in die Option „TIFF (*.tif, *.tiff)“ aus. Gib einen Speicherort an, und wähle dann „Speichern“. Acrobat speichert jede Seite des PDF-Dokuments als separate Seite mit aufeinander folgenden Seitenzahlen im TIFF-Format.

  3. Öffne jede TIFF-Datei in Acrobat und wähle Text erkennen im Tool Scan & OCR.

Schneller und einfacher Hilfe erhalten

Neuer Benutzer?