Skannattujen dokumenttien tekstin tunnistaminen

Päivitetty viimeksi 23. lokakuuta 2025

Opi tunnistamaan ja tekemään tekstistä haettavaa skannatuissa PDF-dokumenteissa Adobe Acrobatin avulla.

Kun skannaat paperidokumentin PDF-muotoon, tuloksena oleva tiedosto sisältää vain kuvatietoja, ei haettavaa tekstiä. Käytä Acrobatin optista tekstintunnistusta (OCR) muuntaaksesi kuvatekstin valittavaksi, haettavaksi tekstiksi.

Poista kaikki turvallisuusrajoitukset ennen skannatun PDF-tiedoston muokkaamista. Ota selvää, miten voit ottaa suojatun näkymän käyttöön tai poistaa sen käytöstä. Opi, miten pääset jälleen tarkastelemaan lukittuja PDF-tiedostoja.

Vihje:

Tallenna varmuuskopio alkuperäisestä skannatusta PDF-tiedostosta ennen muokkaamista, jotta voit tarvittaessa palauttaa sen.

Yhden dokumentin tekstin tunnistaminen

Avaa skannattu PDF ja valitse Kaikki työkalut > Skannaus ja OCR.

Valitse Tässä tiedostossa.

Valitse valintaikkunasta tekstintunnistuksen sivualue ja kieli.

Valitse halutessasi Asetukset määrittääksesi lisäasetuksia.

Valitse Tunnista teksti.

Acrobat luo haettavan tekstikerroksen PDF-tiedostoosi.

Tekstin tunnistaminen useassa dokumentissa

Valitse Kaikki työkalut > Skannaa ja suorita optinen tekstintunnistus.

Valitse Useissa tiedostoissa.

Valitse Tunnista teksti -valintaikkunassa Lisää tiedostoja ja valitse käsiteltävät PDF-tiedostot.

Määritä Tulostusasetukset-valintaikkunassa kohdekansio tulostustiedostoille sekä tiedostonimen oletusasetukset. Valitse OK.

Määritä Tunnista tekstiä - yleisasetukset -valintaikkunassa asetukset ja valitse sitten OK.

Acrobat käsittelee valitut dokumentit ja luo haettavat versiot määritettyyn tuloskansioon.

Tarkista ennen OCR:n suorittamista, että teksti on täsmällinen ja valmis. Korjaa tarvittaessa virheet manuaalisesti tai suorita OCR uudelleen muokatuilla asetuksilla.