在 Acrobat 中打开扫描的 PDF 文件。
本文介绍了如何使用 Acrobat 编辑扫描 PDF 的文本和图像。
当您打开扫描的文档以进行编辑时,Acrobat 自动运行 OCR(光学字符识别)(在后台运行),并将文档转换为可编辑的文本和图像。默认情况下,一次仅将当前页面转换为可编辑文本。当您移动到另一个页面时,焦点所在的页面将变为可编辑页面。
-
-
选择工具 > 编辑 PDF。Acrobat 会自动将 OCR 应用到您的文档,并将其转换为完全可编辑的 PDF 副本。
注意:右上角将出现一个提示,向您显示所识别的 OCR 语言。要更改此语言,请单击该提示或右侧窗格中的“设置”。有关各个选项的更多信息,请参阅下面的编辑扫描文档的选项。
-
单击要编辑的文本元素并开始键入。新文本将与扫描图像中的原始字体外观保持一致。有关编辑文本的更多信息,请参阅在 PDF 中编辑文本。
-
选择文件 > 另存为,并键入可编辑文档的新名称。
当打开要编辑的扫描文档时,右侧窗格“扫描的文档”下方将显示两个特定于扫描的选项:
● 设置:显示的选项可用于选择 OCR 语言、使用系统字体和一次性将所有页面全部转换为可编辑内容。有关更多信息,请参阅设置 - OCR 语言、系统字体和将所有页面全部转换为可编辑内容。
● 识别文本:允许切换从文本到图像或从图像到文本编辑模式。有关更多信息,请参阅为扫描的文档启用或停用自动 OCR。
使用这些设置可更改 OCR 语言、选择是否使用系统字体并且可以一次性将所有页面都转换为可编辑内容。在右侧窗格中,单击扫描文档下方的设置。该对话框将显示以下三个设置:
- 识别文本(OCR 语言):默认情况下,从默认的区域设置中选取 OCR 语言。
- 使用可用的系统字体:如果选中此选项,则在将扫描的文档转换为可编辑的文本过程中,显示的转换文本将使用系统中安装的、与扫描页面中原始字体最接近的字体。
- 所有页面都可编辑:如果选中此选项,则会一次性将当前文档中的所有页面都转换为可编辑文本。此选项的转换速度相对较慢。只有在需要编辑所有页面或者需要将所有页面转换为可编辑文本时,才使用此选项。
最初,语言被设置为默认的区域设置语言,而其他选项均被禁用。对这些设置的任何更改都将被永久保存下来,并在进入编辑模式(“工具”>“编辑 PDF”)时加以应用。
OCR 在默认情况下处于打开状态。因此,当您打开扫描的文档以进行编辑时,当前页面会转换为可编辑文本。根据您是否要将扫描的文档转换为可编辑文本,可以关闭/打开自动 OCR 选项。
要关闭/打开自动 OCR,请执行以下操作:
-
选择工具 > 编辑 PDF。
-
要关闭自动 OCR,请执行以下操作:
- 在右侧窗格中,清除识别文本复选框。自下一次开始,Acrobat 将不会自动运行 OCR。
-
要打开自动 OCR,请执行以下操作:
- 在右侧窗格中,选中识别文本复选框。自下一次开始,Acrobat 将自动运行 OCR 并将扫描的文档转换为可编辑文本。