Avaa PDF-dokumentti Acrobatissa ja valitse hampurilaisvalikko Tiedosto-valikko (macOS) > Tallenna nimellä.
(Windows) taiOptinen merkintunnistus (OCR, Optical Character Recognition) on prosessi, jolla Acrobat tutkii kuvapisteistä muodostuvaa kuvaa tekstistä. Se tunnistaa kunkin merkin ja muuttaa sen muokattavaksi tekstiksi. OCR-prosessissa Acrobat vertailee merkin muotoa ja viivan paksuutta järjestelmään asennettuihin kirjasimiin. Hahmonnettava teksti on muokkauskelpoista tekstiä PDF-tiedoston sisällä. Acrobat ei pysty tekemään optista merkintunnistusta tiedostossa, jossa on hahmonnettavaa tekstiä.
Ongelma: Acrobat ei voi suorittaa optista tekstintunnistusta, koska sivu sisältää hahmonnettavaa tekstiä
Kun avaat PDF-tiedoston ja valitset Skannaus ja OCR -työkalun Tunnista teksti -vaihtoehdon, Acrobat palauttaa seuraavan virheen: ”Acrobat ei voinut suorittaa tunnistusta (OCR) tällä sivulla, koska: Sivulla on hahmonnettavaa tekstiä.”
Ratkaisu 1: Suorita OCR asiakirjassa, jossa ei ole hahmonnettavaa tekstiä
Viesti ilmestyy, jos PDF-dokumentissa on jo muokattavaa tekstiä. Hanki dokumentista versio, jossa ei ole muokattavaa tekstiä ja suorita sitten OCR.
Ratkaisu 2: Muunna PDF-dokumentti TIFF-muotoon ja takaisin PDF-muotoon
-
-
Valitse Tallenna PDF-tiedostona -valintaikkunassa TIFF (*.tif, *.tiff) Muunna muotoon -pudotusvalikosta. Määritä sijainti ja valitse sitten Tallenna. Acrobat tallettaa kunkin PDF-dokumentin sivun erillisenä, peräkkäisesti numeroituna TIFF-tiedostona.
-
Avaa jokainen TIFF-tiedosto Acrobatiin ja valitse Tunnista teksti Skannaus ja OCR -työkalusta.