用户指南 取消(C)

将文档扫描为 PDF

将纸质文档扫描为 PDF,然后使用 Acrobat 将其转换为包含可选文本的智能、可搜索 PDF 文件。

准备事项

我们将推出全新、更直观的产品体验。如果此处显示的屏幕与您的产品界面不匹配,请选择“帮助”以了解您的当前体验

在新的体验中,工具显示在屏幕的左侧。

将纸质文档扫描为 PDF

可以使用扫描仪和 Acrobat,直接从纸质文档创建 PDF 文件。在 Windows 上,Acrobat 支持 TWAIN 扫描仪驱动程序和 Windows 图像采集 (WIA) 驱动程序。在 Mac OS 中,Acrobat 支持 TWAIN 和图像捕捉 (ICA)。

在 Windows 中,您可以使用“自动检测颜色模式”,让 Acrobat 确定纸质文档的内容类型,或者根据您的判断使用其它预设(“黑白文档”、“灰度文档”、“彩色图像”和“彩色文档”)。您可以配置扫描预设,或使用“自定义扫描”选项通过选择的设置进行扫描。

注意:

只有支持“隐藏扫描仪的本机界面”模式的扫描仪驱动程序才能使用预设扫描。扫描预设在 Mac OS 上不可用。

在 Windows 中,如果您的扫描仪安装了 WIA 驱动程序,则可以使用扫描按钮创建 PDF。按扫描按钮,然后在 Windows 中,从已注册的应用程序列表中选择 Adobe Acrobat。接着,在 Acrobat 扫描界面中,选择扫描仪及文档预设或自定义扫描

要使用 Acrobat 将纸质文档扫描为 PDF,请转到所有工具 > 创建 PDF。此时会显示从任意格式创建 PDF 界面。选择扫描仪以查看可用的选项。

在 Windows 上,将显示以下内容:

将纸质文档扫描为 PDF 的相关选项
从“扫描仪”界面中创建 PDF;单击设置或齿轮图标会显示选定选项的所有设置。

在 Mac 上:

在 Mac 上将纸质文档扫描为 PDF 的相关选项
从扫描仪界面创建 PDF;选择扫描仪,然后单击“下一步”以查看所选扫描仪的设置。

使用“自动检测颜色模式”将纸质文档扫描为 PDF (Windows)

  1. 选择所有工具 > 创建 PDF > 扫描仪 > 自动检测颜色模式

    注意:

    如果您要将所扫描的文档追加到现有的文件,请执行以下操作:

    1. 选择追加到现有文件
    2. 如果您已经在 Acrobat 中打开文件,请从下拉列表中选择一个适当的文件,或者选择浏览,然后选择一个适当的文件。

    如果要将多个文件扫描为一个 PDF,请选择设置 图标。此时会显示“自定义扫描”界面。选择提示扫描更多页面

  2. 选择扫描

  3. 如果系统提示扫描更多页面,请选择扫描更多页面扫描背面扫描已完成,然后选择确定

使用预设将纸质文档扫描为 PDF (Windows)

  1. 选择工具 > 创建 PDF > 扫描仪 > [文档预设]。

    注意:

    如果您要将所扫描的文档追加到现有的文件,请执行以下操作:

    1. 选择追加到现有文件
    2. 如果您已经在 Acrobat 中打开文件,请从下拉列表中选择一个适当的文件,或者选择浏览,然后选择一个适当的文件。

    如果要将多个文件扫描为一个 PDF,请选择设置 图标。此时会显示“自定义扫描”界面。选择提示扫描更多页面

  2. 选择扫描

  3. 如果系统提示扫描更多页面,请选择扫描更多页面扫描背面扫描已完成,然后选择确定

不使用预设将纸质文档扫描为 PDF

  1. 选择查看所有工具 > 创建 PDF > 扫描仪 > 默认设置我的自定义设置  

    注意:

    如果您要将所扫描的文档追加到现有的文件,请执行以下操作:

    1. 选择追加到现有文件
    2. 如果您已经在 Acrobat 中打开文件,请从下拉列表中选择一个适当的文件,或者选择浏览,然后选择一个适当的文件。
  2. 如果您要更改设置,请选择设置 图标。此时会显示“自定义扫描”界面。根据需要选择扫描选项。

    如果要将多个文件扫描为一个 PDF,请选择提示扫描更多页面

    注意:

    如果您指定要使用显示扫描仪的用户界面,而不使用 Acrobat 用户界面,则会出现其他窗口或对话框。请查阅扫描仪文档以获取关于可用选项的信息。在 Mac OS 中,将始终显示扫描仪用户界面。

  3. 选择扫描

  4. 如果系统提示扫描更多页面,请选择扫描更多页面扫描背面扫描已完成,然后选择确定

增强或优化扫描的 PDF

  1. 打开从扫描文档创建的 PDF。
  2. 选择所有工具 > 扫描和 OCR > 增强扫描文件

  3. 选择辅助工具栏中的选项 - 选择设置 图标,并在增强扫描的 PDF 对话框中选择适当的选项,然后选择确定

    有关该对话框中显示选项的更多信息,请参阅“增强扫描的 PDF”对话框

配置扫描预设 (Windows)

  1. 选择所有工具 > 创建 PDF > 扫描仪

  2. 选择预定义的扫描设置:自动检测颜色模式黑白文档彩色文档灰度文档彩色照片

  3. 选择预设旁边的设置 图标。根据您所做的选择,系统会显示“自定义扫描”“为下列项目配置预定义设置”界面。

  4. 根据需要调整设置。

    如果要将多个文件扫描为一个 PDF,请选择提示扫描更多页面

  5. 选择保存设置以保存预设。

扫描选项

选择扫描仪后,您可以根据需要选择或调整其各种扫描选项。

“优化扫描的 PDF”对话框

增强扫描的 PDF”对话框所控制的图像设置用于确定如何针对 PDF 进行扫描图像的筛选和压缩。默认设置适用于各种文档页面,但是您可能要自定义设置以获得更高质量的图像、较小的文件空间或扫描问题。

“识别文本 - 设置”对话框

文档语言

默认情况下,从默认的区域设置中选取 OCR 语言。要更改语言,请单击“编辑”,然后选择其它语言。

输出

可搜索的图像或可编辑的文本和图像。 

扫描提示

  • Acrobat 扫描接受 10 dpi 至 3000 dpi 之间的图像。如果您在 PDF 输出样式中选择了可搜索的图像ClearScan,则输入分辨率必须为 72 dpi 或更高。此外,高于 600 dpi 的输入分辨率会缩减像素采样至 600 dpi 或更低。

  • 无损压缩仅可应用于单色图像。要对扫描的图像应用无损压缩,请在“优化扫描的 PDF”对话框的“优化选项”下,选择以下适用于单色图像的选项之一:“CCITT 组 4”或“JBIG2(无损)”。如果将此图像附加到 PDF 文档,并使用“保存”选项保存此文件,则扫描的图像将保持未压缩状态。如果使用“另存为”选项保存 PDF,则可能会压缩扫描的图像。

  • 对于大多数页面,使用 300 dpi 分辨率进行黑白扫描即可生成最适合转换的文本。如果使用 150 dpi,OCR 精度略低,会产生较多的字体识别错误;如果使用 400 dpi 和更高的分辨率,处理速度会变慢,而且压缩的页面会较大。如果页面包含多个无法识别的词语或小文本(9 点或更小),请尝试以更高的分辨率进行扫描。尽可能采用黑白扫描。

  • 如果禁用使用 OCR 识别文本,则可以使用 10 - 3000 dpi 范围内的所有分辨率;但推荐使用 72 dpi 和更高的分辨率。对于自适应压缩,建议灰度或 RGB 输入采用 300 dpi,黑白输入采用 600 dpi。

  • 以 24 位颜色、300 dpi 和 8-1/2 x 11 英寸(21.59 x 27.94 厘米)扫描的页面将生成大图像 (25 MB)(压缩前)。您的系统可能需要 50 MB 虚拟内容或更多来扫描图像。在 600 dpi 时,扫描和处理的速度通常约为 300 dpi 时的四分之一。

  • 避免仿色或半色调扫描设置。这些设置可以改善照片的外观,但会使文本变得难以识别。

  • 对于在彩色纸张上打印的文本,请尝试提高亮度和对比度约 10%。如果您的扫描仪具有色彩筛选功能,请考虑使用可减弱背景颜色的筛选器或灯光。或者,如果文本并未支离破碎,请尝试调整扫描仪对比度和亮度,使扫描变清晰。

  • 如果您的扫描仪有手动亮度控制,调整它以便于字符清晰和更好的成形。如果字符连结在一起,请使用较高的(较亮的)设置。如果字符被分隔,请使用较低的(较暗的)设置。

扫描仪问题故障排除

识别扫描文档中的文本

对于以前已转换为 PDF 的扫描文档,Acrobat 可用来识别其中的文本。光学字符识别(OCR)软件允许您搜索、更正和复制扫描的 PDF 中的文本。要将 OCR 应用于 PDF,原始扫描仪分辨率必须设置为 72 dpi 或更高。

注意:

以 300 dpi 扫描会生成最适合转换的文本。以 150 dpi 扫描时,OCR 精度会略有降低。

识别单个文档中的文本

  1. 打开扫描的 PDF。
  2. 选择所有工具 > 扫描和 OCR > 在本文件中

    “识别文本”选项显示在辅助工具栏中。

  3. 在辅助工具栏中,选择文本识别的页面范围和语言。

  4. 视情况单击“设置”以打开“识别文本”对话框,然后根据需要指定选项。

  5. 选择识别文本。Acrobat 会在您的 PDF 中创建一个可进行搜索或者可复制并粘贴到新文档中的文本图层。

识别多个文档中的文本

  1. 选择所有工具 > 扫描和 OCR > 在多个文件中

  2. 识别文本对话框中,选择添加文件,然后选择添加文件添加文件夹添加打开的文件。接着,选择相应的文件或文件夹。此时将显示输出选项对话框。

  3. 在“输出选项”对话框中,指定输出文件的目标文件夹以及文件名首选项。选择确定

  4. 识别文本 - 一般设置对话框中,指定选项,然后选择确定

    Acrobat 会在您的 PDF 中创建一个可进行搜索或者可复制并粘贴到新文档中的文本图层。

“识别文本 - 一般设置”对话框

文档语言

为 OCR 引擎指定用于识别字符的语言。

输出(PDF 输出样式)

确定要生成的 PDF 的类型。所有选项都需要 72 dpi 或更高(建议)的输入分辨率。所有的格式应用 OCR 和字体和页面识别于文本图像并将其转换为正常文本。

可搜索的图像

确保文本是可搜索和可选择的。本选项保持原始图像,根据需要抗扭斜和将不可见文本层放在其上方。在同一对话框中选择“对图像缩减像素采样”可确定是否对图像缩减像素采样以及缩减的程度。

可搜索的图像(精确)

确保文本是可搜索和可选择的。本选项保持原始图像,根据需要抗扭斜和将不可见文本层放在其上方。建议用于要求原始图像最大保真度的情况。

可编辑的文本和图像

合成一个与原始字体非常接近的新的自定义字体,并使用低分辨率副本保留页面背景。

缩减像素采样至

在 OCR 完成后减少彩色、灰度和单色图像的像素数。选择要应用的缩减像素采样的程度。更高的选项使用较少的缩减像素采样,产生更高分辨率的 PDF。

更正 PDF 中的 OCR 文本

在扫描输出中运行 OCR 时,Acrobat 会对文本位图进行分析,并使用单词和字符替代这些位图区域。如果不确定最佳替代,Acrobat 会将其标记为可疑元素。可疑元素在 PDF 中显示为单词的原始位图,但是文本包含在单词位图后的不可见图层中。采用这种方法,即使单词显示为位图,也可以搜索。

注意:如果您尝试在未应用 OCR 的扫描 PDF 中选择文本,或者尝试在图像文件中执行朗读操作,Acrobat 会询问您是否要运行 OCR。如果选择“确定”,将会打开文本识别对话框,您可以在其中选择相关选项,这些选项在上一个主题中有详细说明。

  1. 选择所有工具 > 扫描和 OCR > 更正识别的文本

    Acrobat 将识别可疑的文本错误,并在辅助工具栏中并排显示图像和文本。页面中所有可疑单词都会框出。

  2. 选择文档中突出显示的对象或框,然后在辅助工具栏的识别为框中更正该内容。选择接受

    这将会突出显示下一个可疑错误。根据需要,更正错误。每次更正后,选择接受

  3. 任务完成时,选择辅助工具栏中的关闭

更快、更轻松地获得帮助

新用户?