Digitalizar un documento en papel y obtener un PDF

Puede crear un archivo PDF directamente a partir de un documento en papel utilizando un escáner y Acrobat. En Windows, Acrobat admite controladores de escáner TWAIN y controladores Windows Image Acquisition (WIA).En Mac OS, Acrobat admite TWAIN y Captura de imágenes (ICA).

En Windows, puede usar Detección automática de modo de color y permitir que Acrobat determine el tipo de contenido del documento en papel, o bien usar otros valores preestablecidos (Documento en blanco y negro, Documento en escala de grises, Imagen en color y Documento en color) según desee. Puede configurar los valores preestablecidos de digitalización o usar la opción Digitalización personalizada para digitalizar con la configuración deseada.

Nota:

La digitalización con configuraciones predefinidas solo está disponible para controladores de escáner que admiten el modo Ocultar interfaz nativa del escáner. Las configuraciones predefinidas de digitalización no están disponibles en Mac OS.

En Windows, si se instala un controlador WIA para el escáner, puede emplear el botón Digitalizar del escáner para crear un PDF. Presione el botón Digitalizar y luego, en Windows, elija Adobe Acrobat en la lista de aplicaciones registradas. A continuación, en el cuadro de diálogo Digitalización de Acrobat, seleccione un escáner y una configuración de documento predefinida o Digitalización personalizada.

Digitalizar un documento en papel para convertirlo en PDF utilizando Detección automática de modo de color (Windows)

  1. Elija Archivo > Crear > PDF desde escáner > Detección automática de modo de color.

  2. Si el sistema le pide que digitalice más páginas, seleccione Digitalizar más páginas, Digitalizar reversos o Digitalización finalizada, y haga clic en Aceptar.

Digitalizar un documento en papel a PDF con una configuración predefinida (Windows)

  1. Elija Archivo > Crear > PDF desde el escáner > [configuración predefinida].

  2. Si el sistema le pide que digitalice más páginas, seleccione Digitalizar más páginas, Digitalizar reversos o Digitalización finalizada, y haga clic en Aceptar.

Digitalizar un documento en papel a PDF sin configuraciones predefinidas

  1. En Acrobat, realice una de las acciones siguientes:
    • (Windows) Elija Archivo > Crear > PDF desde escáner > Digitalización personalizada.
    • (Mac OS) Elija Archivo > Crear > PDF desde escáner.
  2. Seleccione las opciones de digitalización en el cuadro de diálogo Digitalización y, a continuación, haga clic en Digitalizar.

    Nota:

    Si especifica que desea usar la interfaz de usuario nativa del escáner en lugar de la de Acrobat, aparecerán otras ventanas y otros cuadros de diálogo. Consulte la documentación del escáner para obtener información sobre las opciones disponibles. En Mac OS siempre se muestra la interfaz de usuario del escáner.

  3. Si el sistema le pide que digitalice más páginas, seleccione Digitalizar más páginas, Digitalizar reversos o Digitalización finalizada y haga clic en Aceptar.

Optimizar un PDF digitalizado

  1. Abra un PDF creado a partir de un documento digitalizado.
  2. Elija Herramientas > Proceso de documentos > Optimizar PDF digitalizado.

  3. Seleccione las opciones que desee en el cuadro de diálogo Optimizar PDF digitalizado y haga clic en Aceptar.

Definir configuración preestablecida de digitalización (Windows)

  1. Elija Archivo > Crear > PDF desde escáner > Configurar valores preestablecidos.

  2. En el cuadro de diálogo Configurar valores preestablecidos, seleccione un valor preestablecido: Detección automática de modo de color, Documento en blanco y negro, Documento en escala de grises, Documento en color o Imagen en color.

  3. Ajuste los valores necesarios.
  4. Haga clic en Guardar para guardar el valor preestablecido y, a continuación, haga clic en Cerrar.

Opciones de escaneado

Escáner

Seleccione un escáner instalado. Debe tener instalado el software de digitalización del fabricante en el equipo. Solo en Windows, haga clic en el botón Opciones para especificar las opciones del escáner.

Ajustes preestablecidos

Seleccione un ajuste preestablecido para modificar.

Lados

Especifique si desea realizar la digitalización a una cara o a doble cara. Si selecciona la opción Ambos lados y la configuración del escáner está definida para una sola cara, dicha configuración prevalecerá sobre la de Acrobat.

Nota:

Se pueden digitalizar los dos lados de las páginas incluso con escáneres no compatibles con la digitalización a doble cara. Si selecciona la opción Ambos lados, aparece un cuadro de diálogo después de digitalizar las primeras caras. A continuación, puede dar la vuelta a los documentos en papel originales en la bandeja y seleccionar la opción Digitalizar reversos (poner el reverso de la hoja) en ese cuadro de diálogo. Con este método se generará un PDF con todas las páginas en la secuencia adecuada.

Modo de color (solo para Windows)

Seleccione un modo básico de color (Detección automática, Color, Blanco y negro o Escala de grises) admitido por el escáner. Esta opción está habilitada si las Opciones del escáner están definidas para utilizar el cuadro de diálogo de digitalización de Acrobat en lugar de la aplicación del escáner.

Resolución (solo para Windows)

Seleccione una resolución compatible con el escáner. Esta opción está habilitada si las Opciones del escáner están definidas para utilizar el cuadro de diálogo de digitalización de Acrobat en lugar de la aplicación del escáner.

Nota:

Si se selecciona una opción de Modo de color o Resolución no admitida por el escáner, aparecerá un mensaje y se abrirá la ventana de la aplicación del escáner. Seleccione distintas opciones en la ventana de la aplicación del escáner.

Tamaño del papel (solo para Windows)

Seleccione un tamaño del papel o especifique un Ancho y un Alto personalizados.

Solicitar digitalización de más páginas

Si selecciona esta opción, aparecerá un cuadro de diálogo para preguntarle si desea digitalizar páginas adicionales después de cada sesión de digitalización.

Nuevo documento PDF

Permite crear un PDF. Esta opción no está disponible en el cuadro de diálogo Configurar valores preestablecidos.

Varios archivos

Crea varios archivos a partir de documentos impresos. Haga clic en Más opciones y especifique si desea crear una cartera PDF de los archivos, el número de páginas de cada uno de ellos y un prefijo para el nombre de archivo. Esta opción no está disponible en el cuadro de diálogo Configurar valores preestablecidos.

Anexar a archivo o cartera existente

Agrega la digitalización convertida a un PDF o un cartera PDF. Esta opción no está disponible en el cuadro de diálogo Configurar valores preestablecidos.

Optimizar PDF digitalizado

Seleccione esta opción para ejecutar el proceso de optimización en el PDF. Esta opción se utiliza para comprimir y filtrar las imágenes del PDF digitalizado.

Tamaño pequeño/Alta calidad

Arrastre el control deslizante para definir el punto de equilibrio entre el tamaño de archivo y la calidad de imagen. Haga clic en Opciones si desea personalizar la optimización con configuraciones específicas para la compresión y filtrado de archivos.

Hacer susceptible de búsquedas (Ejecutar OCR)

Seleccione esta opción para convertir las imágenes de texto del PDF en texto que se pueda seleccionar y en el que se pueda buscar. Esta opción aplica el reconocimiento óptico de caracteres (OCR) y el reconocimiento de fuentes y páginas a las imágenes de texto. Haga clic en Opciones para especificar una configuración en el cuadro de diálogo Reconocer texto - Configuración. Consulte Reconocer texto en los documentos digitalizados.

Hacer compatible con PDF/A

Seleccione esta opción para hacer que el PDF sea compatible con las normas ISO para PDF/A-1b. Si se selecciona esta opción, el ajuste de Imagen para búsquedas es el único disponible en el cuadro de diálogo Reconocer texto - Configuración para la opción Estilo de salida PDF.

Agregar metadatos

Cuando está seleccionado, aparece el cuadro de diálogo Propiedades del documento tras la digitalización. En este cuadro de diálogo, puede agregar metadatos o información sobre el documento digitalizado al archivo PDF. Si desea crear varios archivos, puede introducir metadatos comunes para todos ellos.

Cuadro de diálogo Opciones de escáner

Método de transferencia de datos

El modo nativo realiza las transferencias en el modo predeterminado para el escáner. Modo de memoria se selecciona automáticamente para digitalizaciones en resoluciones por encima de los 600 puntos por pulgada (ppp).

Interfaz de usuario

La opción Ocultar interfaz nativa del escáner hace que no se abran las ventanas y los cuadros de diálogo proporcionados por el fabricante del escáner. En su lugar, la digitalización se inicia directamente con los valores especificados en la configuración de Digitalización personalizada.

Invertir imágenes en blanco y negro

Esta opción crea imágenes positivas a partir de negativos en blanco y negro, por ejemplo.

Cuadro de diálogo Optimizar PDF digitalizado

El cuadro de diálogo Optimizar PDF digitalizado controla la configuración de imagen del filtrado y la compresión de imágenes digitalizadas para el PDF. Los valores predeterminados de configuración son apropiados para una amplia gama de páginas de documento, pero se pueden personalizar para obtener imágenes de más calidad, tamaños de archivo más pequeños o por cuestiones relacionadas con la digitalización.

Aplicar compresión adaptable

Divide cada página en regiones en blanco y negro, escala de grises y color, y selecciona una representación que conserva el aspecto al realizar una compresión alta de cada tipo de contenido. Las resoluciones de digitalización recomendadas son 300 puntos por pulgada (ppp) para entrada de RGB y escala de grises o 600 ppp para entrada en blanco y negro.

Color/Escala de grises

Cuando digitalice páginas en color o en escala de grises, seleccione una de las siguientes opciones:

JPEG2000

Aplica compresión JPEG2000 al contenido de imagen en color. (Este ajuste no se recomienda al crear archivos PDF/A. Use en su lugar JPEG.)

ZIP

Aplica compresión ZIP al contenido de imagen en color.

JPEG

Aplica compresión JPEG al contenido de imagen en color.

Nota:

El escáner utiliza la opción Color/Escala de grises seleccionada o la opción Monocromo elegida. Se utilizará una u otra en función de la configuración seleccionada en el cuadro de diálogo Digitalización de Acrobat o en la interfaz TWAIN del escáner, que se puede abrir después de hacer clic en Digitalizar en el cuadro de diálogo Digitalización de Acrobat. (De forma predeterminada, el cuadro de diálogo de la aplicación del escáner no se abre.)

Monocromo

Cuando digitalice imágenes en blanco y negro o monocromo, seleccione una de las siguientes opciones:

JBIG2 (Sin pérdida) y JBIG2 (Con pérdida)

Aplica el método de compresión JBIG2 a las páginas con entrada en blanco y negro. Los niveles de calidad más altos utilizan el método sin pérdida; con valores inferiores, el texto se comprime a un nivel muy alto. Las páginas de texto suelen ser un 60% más pequeñas que las páginas comprimidas con el método Grupo 4 de CCITT, pero el proceso es lento. Compatible con Acrobat 5.0 (PDF 1.4) y posterior.

Nota:

Para la compatibilidad con Acrobat 4.0, use un método de compresión que no sea JBIG2.

Grupo 4 de CCITT

Aplica el método de compresión Grupo 4 de CCITT a las imágenes de páginas con entrada en blanco y negro. Este método de compresión rápido y sin pérdida es compatible con Acrobat 3.0 (PDF 1.2) y posteriores.

Tamaño pequeño/Alta calidad

Define el punto de equilibrio entre el tamaño de archivo y la calidad.

Corregir sesgo

Rota cualquier página que no sea cuadrada con los lados de la plataforma del escáner, para alinear la página del PDF verticalmente. Elija Activado o Desactivado.

Eliminación de fondo

Escribe áreas casi blancas de entrada de escala de grises y en color (entrada que no es blanco y negro).

Nota:

Para obtener los mejores resultados, calibre el contraste y brillo del escáner para que la digitalización de una página normal en blanco y negro tenga texto negro o gris oscuro y un fondo blanco. Una vez hecho esto, con las opciones Sin activar o Baja se deben obtener los mejores resultados. Si digitaliza papel de color hueso o papel de periódico, es preferible utilizar Media o Alta para que la página aparezca limpia.

Retramar

Quita la estructura de puntos de medios tonos, que puede reducir la compresión JPEG, producir patrones Moire y dificultar el reconocimiento del texto. Adecuado para entrada RGB o de escala de grises de 200 a 400 ppp o, para Compresión adaptativa, para entrada de blanco y negro de 400 a 600 ppp. El valor Activado (recomendado) aplica el filtro para entrada RGB y de escala de grises de 300 ppp o superior. Seleccione Sin activar cuando digitalice una página sin imágenes o áreas rellenas, o cuando digitalice a resoluciones superiores al intervalo efectivo.

Enfoque del texto

Enfoca el texto del archivo PDF digitalizado. El valor predeterminado Bajo es adecuado para la mayoría de documentos. Aumente el valor si la calidad del documento impreso es baja y el texto no se ve claro.

Sugerencias para la digitalización

  • La digitalización con Acrobat acepta imágenes entre 10 y 3000 ppp. Si selecciona Imagen para búsquedas o ClearScan en Estilo de salida PDF, se requerirá una resolución de entrada de 72 ppp o más. Además, la resolución de entrada superior a 600 ppp se disminuye a 600 ppp o menos.

  • Para aplicar una compresión sin pérdida a una imagen digitalizada, seleccione una de estas opciones en la sección Opciones de optimización del cuadro de diálogo Optimizar PDF digitalizado: Grupo 4 de CCITT para imágenes monocromas o Sin pérdida para imágenes en color o escala de grises. Si esta imagen se anexa a un documento PDF y guarda el archivo con la opción Guardar, la imagen digitalizada se conserva sin comprimir. Si guarda el documento PDF con Guardar como, la imagen digitalizada se pueden comprimir.

  • Para la mayoría de las páginas, la digitalización en blanco y negro a 300 ppp produce un texto más adecuado para la conversión. A 150 ppp, la precisión de OCR es ligeramente inferior y se producen más errores de reconocimiento de fuentes; a 400 ppp y resoluciones superiores, el proceso se ralentiza y las páginas comprimidas son más grandes. Si en la página hay muchas palabras no reconocidas o texto pequeño (9 puntos o menos), pruebe a digitalizar con una resolución superior. Escanee en blanco y negro siempre que sea posible.

  • Si se desactiva Reconocer texto usando OCR, puede usarse todo el intervalo de resolución permitido por Acrobat (de 10 a 3000 ppp), pero la resolución recomendada sigue siendo 72 ppp o más. En el caso de Compresión adaptable, se recomienda una resolución de 300 ppp para entrada de RGB o escala de grises, o de 600 ppp para entrada en blanco y negro.

  • Las páginas digitalizadas en color de 24 bits, 300 ppp y a 21,59 por 27,94 cm. (8,5 por 11 pulgadas) producen imágenes grandes (25 MB) antes de la compresión. Puede que el sistema necesite 50 MB o más de memoria virtual para digitalizar la imagen. A 600 ppp, la digitalización y el proceso suelen ser cuatro veces más lentos que a 300 ppp.

  • Procure no utilizar las opciones de medios tonos o difuminado del escáner. Estas opciones pueden mejorar el aspecto de las fotografías, pero dificultan el reconocimiento del texto.

  • Para el texto impreso en papel con color, pruebe a aumentar el brillo y el contraste un 10%. Si el escáner posee la capacidad de filtrado de color, pruebe a usar un filtro o lámpara que difumine el color del fondo. O si el texto no es nítido o está difuminado, intente ajustar el contraste y el brillo del escáner para mejorar la nitidez de la digitalización.

  • Si el escáner tiene un control de brillo manual, ajústelo hasta que los caracteres estén limpios y bien formados. Si los caracteres están muy juntos, utilice un valor mayor (más brillo). Si los caracteres están separados, utilice un valor menor (más oscuro).

Reconocer texto en los documentos digitalizados

Acrobat se puede usar para reconocer texto en documentos previamente digitalizados que ya se han convertido a PDF. El software de reconocimiento óptico de caracteres (OCR, Optical Character Recognition) permite realizar búsquedas, corregir y copiar texto en un documento PDF digitalizado. Para aplicar OCR a un documento PDF, la resolución del escáner original debe estar definida en 72 ppp o un valor superior.

Nota:

La digitalización a 300 ppp produce un texto más adecuado para la conversión. A 150 ppp, la precisión del OCR es ligeramente más baja.

Reconocer texto en un único documento

  1. Abra el PDF digitalizado.
  2. Elija Herramientas > Reconocimiento de texto > En este archivo.

  3. En el cuadro de diálogo Reconocer texto, en Páginas, seleccione una opción.

  4. O bien, haga clic en Editar para abrir el cuadro de diálogo Reconocer texto - Configuración general y especifique las opciones necesarias.

Reconocer texto en varios documentos

  1. En Acrobat, elija Herramientas > Reconocimiento de texto > En varios archivos.

  2. En el cuadro de diálogo Reconocer texto, haga clic en Agregar archivos y elija Agregar archivos, Agregar carpetas o Agregar archivos abiertos. A continuación, seleccione los archivos o la carpeta.
  3. En el cuadro de diálogo Opciones de salida, especifique una carpeta de destino para los archivos de salida y las preferencias de nombre de archivo.
  4. En el cuadro de diálogo Reconocer texto - Configuración general, especifique las opciones y, a continuación, haga clic en Aceptar.

Cuadro de diálogo Reconocer texto - Configuración general

Lenguaje OCR primario

Especifica el idioma para el motor de OCR que se va a utilizar para identificar los caracteres.

Estilo de salida PDF

Determina el tipo de PDF que se va a producir. Todas las opciones requieren un valor mínimo de resolución de entrada de 72 ppp (se recomienda un valor superior). Todos los formatos aplican OCR y el reconocimiento de fuentes y páginas a las imágenes de texto y las convierten en texto normal.

Imagen para búsquedas

Garantiza que el texto se pueda buscar y seleccionar. Esta opción conserva la imagen original, corrige su sesgo si es necesario y coloca sobre ella una capa de texto invisible. La selección de Disminuir resolución de imágenes en este mismo cuadro de diálogo determina si la imagen se reduce y en qué grado.

Imagen para búsquedas (exacta)

Garantiza que el texto se pueda buscar y seleccionar. Esta opción conserva la imagen original y coloca sobre ella una capa de texto invisible. Se recomienda en los casos que requieren la máxima fidelidad a la imagen original.

ClearScan

Sintetiza una nueva fuente Type 3 muy parecida a la original y mantiene el fondo de la página utilizando una copia de baja resolución.

Disminuir resolución a

Reduce el número de píxeles en imágenes en color, escala de grises e imágenes monocromas una vez completada la operación OCR. Elija el grado de disminución de resolución que aplicar. Las opciones con un número más grande reducen menos la resolución, por lo que los PDF generados tienen mayor resolución.

Corregir texto OCR en PDF

Cuando se ejecuta OCR en salida digitalizada, Acrobat analiza mapas de bits de texto y sustituye palabras y caracteres en esas áreas de mapas de bits. Si la sustitución ideal es incierta, Acrobat marca la palabra como sospechosa. Los sospechosos aparecen en el documento PDF como el mapa de bits original de la palabra, aunque el texto está incluido en una capa invisible detrás del mapa de bits de la palabra. Este método permite que la palabra sea susceptible de búsqueda incluso si aparece como un mapa de bits.

Nota: si intenta seleccionar texto en un documento PDF digitalizado que no tenga OCR aplicado o intenta realizar una operación de Leer en voz alta en un archivo de imagen, Acrobat le preguntará si desea ejecutar OCR. Si hace clic en Aceptar, se abre el cuadro de diálogo Reconocimiento de texto y puede seleccionar las opciones que se describen de manera detallada en el tema anterior.

  1. Realice una de las acciones siguientes:

    • Elija Herramientas > Reconocer texto > Buscar todos los sospechosos. Se coloca un cuadro alrededor de todas las palabras sospechosas de la página. Haga clic en cualquier palabra sospechosa para mostrar el texto sospechoso en el cuadro de diálogo Buscar elemento.
    • Elija Herramientas > Reconocer texto > Buscar primer sospechoso.

    Nota: Si cierra la ventana Buscar elemento antes de corregir todas las palabras sospechosas, puede regresar al proceso seleccionando Herramientas > Reconocer texto > Buscar primer sospechoso o haciendo clic en una palabra sospechosa con la herramienta Editar texto del documento.

  2. En la opción Búsqueda, elija Buscar todos los OCR sospechosos.

  3. Compare la palabra del cuadro de texto Sospechoso con la palabra real en el documento digitalizado. Para corregir un OCR sospechoso, haga clic en el objeto resaltado en el documento y escriba el texto nuevo. Si el sospechoso se ha identificado incorrectamente como texto, haga clic en el botón No es texto.

  4. Revise y corrija las restantes palabras sospechosas y, a continuación, cierre el cuadro de diálogo Buscar elemento.

Esta obra está autorizada con arreglo a la licencia de Reconocimiento-NoComercial-CompartirIgual 3.0 Unported de Creative Commons.  Los términos de Creative Commons no cubren las publicaciones en Twitter™ y Facebook.

Avisos legales   |   Política de privacidad en línea