Digitalizar documentos em papel em PDFs

É possível criar um arquivo PDF diretamente de um documento impresso, usando um scanner e o Acrobat. No Windows, o Acrobat oferece suporte a drivers de scanner TWAIN e Windows Image Acquisition (WIA).No Mac OS, o Acrobat oferece suporte para TWAIN e Image Capture (ICA).

No Windows, você pode usar o recurso Autodetectar modo de cores e deixar o Acrobat determinar o tipo de conteúdo do documento de papel ou usar outras predefinições (Documento preto e branco, Documento de tons de cinza, Imagem colorida e Documento em cores) de acordo com seu critério de julgamento. Você pode configurar as predefinições de digitalização ou usar a opção de Digitalização personalizada para digitalizar com as configurações de sua escolha.

Observação:

A digitalização predefinida está disponível somente para drivers de scanners que oferecem suporte ao modo Ocultar interface nativa do scanner. As predefinições de digitalização não estão disponíveis no Mac OS.

No Windows, se um driver WIA estiver instalado no seu scanner, você poderá usar o botão Digitalizar do scanner para criar um PDF. Pressione o botão Digitalizar e, no Windows, escolha Adobe Acrobat na lista de aplicativos registrados. Em seguida, na caixa de diálogo Acrobat Digitalizar, selecione um scanner e uma predefinição de documento ou Digitalização personalizada.

Digitalizar um documento impresso em PDF usando um Modo de detecção automática de cor (Windows)

  1. Escolha Arquivo > Criar > PDF do scanner > Autodetectar modo de cores.

  2. Se for exibida uma janela pop-up perguntando se você deseja digitalizar mais páginas, selecione Digitalizar mais páginas, Digitalizar frente e verso ou Digitalização concluída e clique em OK.

Digitalização de um documento impresso em PDF usando uma predefinição (Windows)

  1. Selecione Arquivo > Criar > PDF do scanner > [predefinição de documento].

  2. Se for exibida uma janela pop-up perguntando se você deseja digitalizar mais páginas, selecione Digitalizar mais páginas, Digitalizar frente e verso ou Digitalização concluída e clique em OK.

Digitalize documentos impressos em PDFs sem predefinições

  1. No Acrobat, execute um dos procedimentos a seguir:
    • (Windows) Selecione Arquivo > Criar > PDF do scanner > Digitalização personalizada.
    • (Mac OS) Escolha Arquivo > Criar > PDF do scanner.
  2. Selecione as opções na caixa de diálogo Digitalizar conforme necessário e clique em Digitalizar.

    Observação:

    Se especificar que deseja usar a interface de usuário nativa do scanner, em vez da interface de usuário do Acrobat, serão exibidas outras janelas ou caixas de diálogo. Consulte a documentação do scanner para obter informações sobre as opções disponíveis. No Mac OS, a interface de usuário do scanner é sempre exibida.

  3. Se for exibida uma janela pop-up perguntando se você deseja digitalizar mais páginas, selecione Digitalizar mais páginas, Digitalizar frente e verso ou Digitalização concluída e clique em OK.

Como otimizar PDFs digitalizados

  1. Abra um PDF criado a partir de um documento digitalizado.
  2. Escolha Ferramentas > Processamento de documento > Otimizar PDF digitalizado.

  3. Selecione opções na caixa de diálogo Otimizar PDF digitalizado e clique em OK.

Configurar predefinições de digitalização (Windows)

  1. Escolha Arquivo > Criar > PDF do scanner > Configurar predefinições.

  2. Na caixa de diálogo Configurar predefinições, selecione a predefinição: Modo de detecção automática de cor, Documento preto e branco, Documento em tons de cinza, Documento colorido ou Imagem colorida.

  3. Ajuste as configurações, conforme necessário.
  4. Clique em Salvar para salvar a predefinição e, em seguida, clique em Fechar.

Opções de digitalização

Scanner

Selecione um scanner instalado. É necessário ter instalado o software de digitalização do fabricante no computador. Somente no Windows, clique no botão Opções para especificar as opções do scanner.

Predefinições

Selecione uma Predefinição para modificar.

Lados

Especifique a digitalização em um lado ou nos dois. Se a opção Ambos os lados for marcada e as configurações do scanner só permitirem um lado, as configurações do scanner substituirão as configurações do Acrobat.

Observação:

É possível digitalizar os dois lados da folha mesmo em scanners que não ofereçam suporte para digitalização em ambos os lados. Ao selecionar a opção Ambos os Lados, uma caixa de diálogo será exibida depois que o primeiro lado for digitalizado. Você pode, então, inverter os documentos impressos originais na bandeja e selecionar a opção Digitalizar verso das folhas (Colocar verso das folhas) nessa caixa de diálogo. Este método produz um PDF com todas as páginas na sequência correta.

Modo de cor (somente no Windows)

Selecione um modo de cor básico (Autodetecção, Colorido, Preto e branco ou Tons de cinza) aceito pelo scanner. Essa opção é ativada se as Opções do scanner estiverem configuradas para usar a caixa de diálogo de digitalização do Acrobat ao invés do aplicativo do scanner.

Resolução (somente no Windows)

Selecione uma resolução suportada pelo seu scanner. Essa opção é ativada se as Opções do scanner estiverem configuradas para usar a caixa de diálogo de digitalização do Acrobat ao invés do aplicativo do scanner.

Observação:

Se selecionar uma opção de Modo de cor ou Resolução não suportada pelo scanner, será exibida uma mensagem e a janela do aplicativo do scanner será aberta. Selecione opções diferentes na janela do aplicativo do scanner.

Tamanho do papel (somente Windows)

Selecione um tamanho de papel ou especifique uma Largura e uma Altura personalizadas.

Solicitar digitalização de mais páginas

Quando essa opção é selecionada, uma caixa de diálogo é exibida solicitando que você digitalize páginas adicionais após cada sessão de digitalização.

Novo documento PDF

Cria um PDF. Essa opção não está disponível na caixa de diálogo Configurar predefinições.

Vários arquivos

Cria vários arquivos a partir de vários documentos em papel. Clique em Mais opções e especifique se deseja criar um portfólio PDF dos arquivos, o número de páginas para cada arquivo e um prefixo para o nome do arquivo. Essas opções não estão disponíveis na caixa de diálogo Configurar predefinições.

Anexar a arquivo ou portfólio existente

Adiciona a digitalização convertida a um PDF ou portfólio PDF existente. Essa opção não está disponível na caixa de diálogo Configurar predefinições.

Otimizar PDF digitalizado

Selecione esta opção para executar o processo de otimização no PDF. Esta opção é usada para compactar e filtrar as imagens do PDF digitalizado.

Tamanho pequeno/Alta qualidade

Arraste o controle deslizante para definir o ponto de equilíbrio entre o tamanho e a qualidade do arquivo. Clique em Opções para personalizar a otimização com configurações específicas de compactação e filtro de arquivos.

Tornar pesquisável (Executar OCR)

Selecione essa opção para converter imagens de texto no PDF para texto pesquisável e selecionável. Esta opção aplica o reconhecimento de caracteres ótico (OCR) e fonte e reconhecimento de página nas imagens de texto. Clique no botão Opções para especificar as configurações na caixa de diálogo Reconhecer texto - Configurações. Consulte Como reconhecer texto em documentos digitalizados.

Tornar compatível com PDF/A

Selecione essa opção para tornar o PDF compatível com os padrões ISO para PDF/A-1b. Quando selecionado, apenas Imagem pesquisável ficará disponível na caixa de diálogo Reconhecer texto - Configurações para a opção Estilo de saída do PDF.

Adicionar metadados

Quando selecionada, a caixa de diálogo Propriedades do documento é exibida depois da digitalização. Na caixa de diálogo Propriedades do documento, é possível adicionar metadados ou informações sobre o documento digitalizado ao arquivo PDF. Se você está criando vários arquivos, pode especificar os mesmos metadados para todos os arquivos.

Caixa de diálogo Opções do scanner

Método de transferência de dados

O Modo nativo transfere no modo padrão para o scanner. O Modo de memória é selecionado automaticamente para a digitalização em resoluções acima de 600 dpi.

Interface do usuário

A opção Ocultar interface nativa do scanner ignora as janelas e caixas de diálogo fornecidas pelo fabricante do scanner. Em vez disso, a digitalização começa diretamente com as configurações especificadas nas configurações de Digitalização personalizada.

Inverter imagens em preto e branco

Essa opção cria, por exemplo, imagens positivas a partir dos negativos em preto e branco.

Caixa de diálogo Otimizar PDF digitalizado

A caixa de diálogo Otimizar PDF digitalizado controla as configurações de imagem de como as imagens digitalizadas são filtradas e compactadas para o PDF. As configurações padrão são adequadas a uma ampla variedade de páginas de documentos, mas é possível personalizá-las a fim de obter imagens de melhor qualidade, tornar o arquivo menor ou aperfeiçoar a digitalização.

Aplicar compactação adaptável

Divide cada página em regiões coloridas, em tons de cinza e preto-e-branco e escolhe uma representação que preserva a aparência e, ao mesmo tempo, compacta em alto grau cada tipo de conteúdo. As resoluções recomendadas de digitalização são 300 dpi (pontos por polegada) para entrada em tons de cinza e RGB ou 600 dpi para entrada em preto-e-branco.

Configurações de Colorido/Tons de Cinza

Ao digitalizar páginas coloridas e em escala de cinza, selecione uma das seguintes opções:

JPEG2000

Aplica a compactação JPEG2000 ao conteúdo de imagem colorida. (Essa configuração não é recomendada ao criar arquivos PDF/A. Use JPEG.)

ZIP

Aplica a compactação ZIP ao conteúdo de imagem colorida.

JPEG

Aplica a compactação JPEG ao conteúdo de imagem colorida.

Observação:

O scanner usa as opções Colorido/tons de cinza ou Monocromática selecionadas. O uso de uma delas depende das configurações selecionadas na caixa de diálogo do Acrobat Scan ou na interface TWAIN do scanner, que pode ser aberta depois de clicar em Digitalizar na caixa de diálogo do Acrobat Scan. (Por padrão, a caixa de diálogo do aplicativo do scanner não é aberta.)

Monocromática

Ao digitalizar imagens em preto e branco ou monocromáticas, selecione uma das seguintes opções:

JBIG2 (Lossless) e JBIG2 (Lossy)

Aplica o método de compactação JBIG2 às páginas com entrada em preto-e-branco. Os níveis de qualidade mais altos usam o método sem perdas; em configurações mais baixas, o texto é altamente compactado. As páginas de texto são geralmente 60% menores do que as páginas compactadas com CCITT Grupo 4, mas o processamento é lento. Compatível com Acrobat 5.0 (PDF 1.4) e posterior.

Observação:

Para obter compatibilidade com o Acrobat 4.0, use um método de compactação diferente de JBIG2.

CCITT Grupo 4

Aplica a compactação CCITT Grupo 4 a imagens em páginas com entrada em preto-e-branco. Esse método de compactação rápido e sem perda é compatível com o Acrobat 3.0 (PDF 1.2) e posterior.

Tamanho pequeno/Alta qualidade

Define o ponto de equilíbrio entre o tamanho do arquivo e a qualidade.

Remoção da inclinação

Gira qualquer página que não esteja alinhada com os lados da bandeja do scanner, para fazer o alinhamento vertical da página do PDF. Escolha Ativado ou Desativado.

Remoção do plano de fundo

Clareia áreas quase brancas de entradas coloridas e em tons de cinza (não em preto-e-branco).

Observação:

Para obter os melhores resultados, ajuste as configurações de contraste e brilho do scanner para que a digitalização de uma página normal em preto-e-branco apresente o texto em cinza escuro ou preto e um plano de fundo branco. Dessa forma, as opções Desativado e Baixa apresentarão bons resultados. Ao digitalizar papel off-white ou papel de jornal, use Média ou Alta para limpar a página.

Remoção de moiré

Remove a estrutura de ponto de meio-tom, que pode reduzir a compactação JPEG, causar padrões Moiré e dificultar a identificação do texto. Adequada para entrada em tons de cinza ou RGB de 200 a 400 dpi, na Compactação adaptável, ou para entrada em preto-e-branco de 400 a 600 dpi. A configuração Ativado (recomendada) aplica o filtro para entradas em tons de cinza e RGB de 300 dpi ou mais. Selecione Desativado ao digitalizar uma página sem figuras ou com áreas preenchidas ou ao digitalizar em uma resolução superior à faixa efetiva.

Nitidez do texto

Torna nítido o texto do arquivo PDF digitalizado. O valor padrão de Baixo é adequado para grande parte dos documentos. Aumente-o se a qualidade do documento impresso for baixa e o texto pouco nítido.

Dicas de digitalização

  • A digitalização no Acrobat aceita imagens entre 10 e 3.000 dpi. Se selecionar Imagem pesquisável ou ClearScan para o Estilo de saída do PDF, será necessário uma resolução de entrada de 72 dpi ou mais. Além disso, uma resolução de entrada maior do que 600 dpi é reduzida para 600 dpi ou menos.

  • Para aplicar uma compactação sem perdas a uma imagem digitalizada, selecione uma destas Opções de otimização na caixa de diálogo Otimizar PDF digitalizado: CCITT grupo 4 para imagens monocromáticas ou Sem perdas para imagens coloridas ou em tons de cinza. Se essa imagem for anexada a um documento PDF e você salvar o arquivo usando a opção Salvar, a imagem digitalizada permanecerá não compactada. Se você salvar o PDF usando a opção Salvar como, a imagem digitalizada poderá ser compactada.

  • Para a maioria das páginas, a digitalização em preto e branco a 300 dpi produz o texto mais adequado para conversão. A 150 dpi, a precisão do OCR é levemente mais baixa e ocorrem mais erros de reconhecimento de fontes; em uma resolução de 400 dpi ou mais, o processamento fica mais lento e as páginas compactadas são maiores. Se uma página tiver muitas palavras não reconhecidas ou um texto muito pequeno (abaixo de 9 pontos), tente digitalizar a uma resolução maior. Digitalize em branco e preto sempre que possível.

  • Quando a opção Reconhecer texto usando OCR está desativada, o intervalo geral de 10 a 3.000 dpi pode ser usado, mas a resolução recomendada é de 72 dpi ou mais. Para a Compactação adaptável, 300 dpi é o valor recomendado para entrada em tons de cinza ou RGB, ou 600 dpi para entrada em preto e branco.

  • Páginas digitalizadas em cores de 24 bits, 300 dpi, em 8,5 por 11 pol. (21,59 por 27,94 cm) resultam em imagens maiores (25 MB) antes da compactação. Seu sistema pode exigir 50 MB ou mais de memória virtual para digitalizar a imagem. A 600 dpi, tanto a digitalização quanto o processamento são, geralmente, quatro vezes mais lentos do que a 300 dpi.

  • Evite configurações de pontilhamento ou meio-tom no scanner. Elas podem melhorar a aparência de fotografias, mas dificultam o reconhecimento do texto.

  • No caso de texto impresso em papel colorido, tente aumentar o brilho e o contraste em aproximadamente 10%. Se o scanner tiver o recurso de filtragem de cores, pense na possibilidade de usar um filtro ou uma lâmpada que elimine a cor do plano de fundo. Ou, se o texto não estiver nítido ou não estiver aparecendo, tente ajustar o brilho e o contraste do scanner para clarear a digitalização.

  • Se o scanner tiver controle manual de brilho, ajuste-o para que os caracteres fiquem limpos e bem formados. Se os caracteres estiverem muito juntos, utilize uma configuração mais alta (mais clara). Se estiverem separados, utilize uma configuração mais baixa (mais escura).

Como reconhecer texto em documentos digitalizados

É possível usar o Acrobat para reconhecer texto em documentos digitalizados anteriormente que já foram convertidos para PDF. O software de reconhecimento ótico de caracteres (OCR) permite a pesquisa, correção e cópia do texto em um PDF digitalizado. Para aplicar OCR a um PDF, a resolução do scanner original deve estar definida em 72 dpi ou superior.

Observação:

A digitalização a 300 dpi produz o melhor texto para conversão. A 150 dpi, a precisão do OCR é um pouco menor.

Reconhecer texto em um único documento

  1. Abra o PDF digitalizado.
  2. Escolha Ferramentas > Reconhecimento de texto > Neste arquivo.

  3. Na caixa de diálogo Reconhecer texto, selecione uma opção em Páginas.

  4. Opcionalmente, clique em Editar para abrir a caixa de diálogo Reconhecer texto - Configurações gerais e especifique as opções conforme necessário.

Reconhecer texto em vários documentos

  1. No Acrobat, escolha Ferramentas > Reconhecimento de texto > Em vários arquivos.

  2. Na caixa de diálogo Reconhecer texto, clique em Adicionar arquivos e escolha Adicionar arquivos, Adicionar pastas ou Adicionar arquivos abertos. Em seguida, selecione os arquivos ou a pasta.
  3. Na caixa de diálogo Opções de saída, especifique uma pasta de destino de arquivos de saída e preferências de nome de arquivo.
  4. Na caixa de diálogo Reconhecer texto - Configurações gerais, especifique as opções e, em seguida, clique em OK.

Caixa de diálogo Reconhecer texto - Configurações gerais

Idioma OCR principal

Especifica qual idioma o mecanismo de OCR usa para identificar os caracteres.

Estilo de saída do PDF

Determina o tipo de PDF a ser produzido. Todas as opções necessitam de uma resolução de entrada de 72 dpi ou mais (recomendado). Todos os formatos aplicam OCR e reconhecimento de fontes e de páginas às imagens do texto, convertendo-as em texto normal.

Imagem pesquisável

Permite que o texto seja pesquisado e selecionado. Essa opção mantém a imagem original, inclina-a conforme necessário e coloca uma camada invisível de texto sobre ela. A seleção da opção Reduzir Resolução das Imagens nessa caixa de diálogo determina se a imagem será ou não reduzida e em que grau.

Imagem pesquisável (Exata)

Permite que o texto seja pesquisado e selecionado. Essa opção mantém a imagem original e coloca uma camada invisível de texto sobre ela. É recomendada quando é necessário obter o máximo de fidelidade à imagem original.

ClearScan

Sintetiza uma nova fonte Tipo 3 que se aproxima bastante do original e preserva o segundo plano da página, usando uma cópia de baixa resolução.

Reduzir resolução para

Reduz o número de pixels em imagens coloridas, em tons de cinza e monocromáticas após a conclusão do OCR. Escolha o grau de redução de resolução a ser aplicado. Opções de número superior geram menos redução da resolução, produzindo PDFs de resolução superior.

Como corrigir o texto de OCR em PDFs

Quando você executa o OCR em uma saída digitalizada, o Acrobat analisa bitmaps do texto e substitui palavras e caracteres dessas áreas de bitmap. Se a substituição ideal for incerta, o Acrobat marca a palavra como suspeita. As suspeitas são exibidas no PDF como o bitmap original da palavra, mas o texto está incluído em uma camada invisível atrás do bitmap da palavra. Este método torna a palavra pesquisável embora ele seja exibido como um bitmap.

Observação: se você tentar selecionar um texto em um PDF digitalizado que não tem o OCR aplicado ou se tentar realizar uma operação Leitura em voz alta em um arquivo de imagem, o Acrobat pergunta se você deseja executar o OCR. Se você clicar em OK, será exibida a caixa de diálogo Reconhecimento de texto e será possível selecionar opções descritas detalhadamente no tópico anterior.

  1. Siga um destes procedimentos:

    • Escolha Ferramentas > Reconhecimento de texto > Localizar todas as suspeitas. Todas as palavras suspeitas da página ficam dentro de caixas. Clique em qualquer palavra suspeita para mostrar o texto suspeito na caixa de diálogo Localizar elemento.
    • Escolha Ferramentas > Reconhecimento de texto > Localizar primeira suspeita.

    Observação: se você fechar a janela Localizar elemento antes de corrigir todas as palavras suspeitas, será possível voltar ao processo escolhendo Ferramentas > Reconhecimento de texto > Localizar primeira suspeita, ou clicando em qualquer palavra suspeita com a ferramenta Editar texto do documento.

  2. Na opção Localizar, escolha Suspeitas de OCR.

  3. Compare a palavra da caixa de texto Suspeito com a palavra real do documento digitalizado. Para corrigir uma suspeita de OCR, clique no objeto realçado no documento e digite o novo texto. Se a suspeita foi incorretamente identificado como texto, clique no botão Não é texto.

  4. Verifique e corrija as palavras suspeitas restantes e feche a caixa de diálogo Localizar elemento.

Esta obra está licenciada sob uma licença não adaptada da Creative Commons Attribution-Noncommercial-Share Alike 3.0  As publicações do Twitter™ e do Facebook não são cobertas pelos termos do Creative Commons.

Avisos legais   |   Política de privacidade online