识别扫描文档中的文本

上次更新日期: 2025年11月5日

了解如何使用 Adobe Acrobat 识别扫描 PDF 文档中的文本并使其可搜索。

当您将纸质文档扫描为 PDF 时,生成的文件仅包含图像数据,而不包含可搜索的文本。使用 Acrobat 的光学字符识别 (OCR) 功能将图像文本转换为可选择、可搜索的文本。

在编辑扫描的 PDF 之前,请移除任何安全限制。了解如何启用或禁用受保护视图。了解如何重新获得已锁定 PDF 的访问权限

提示:

在编辑之前保存原始扫描 PDF 的备份副本,以便在需要时可以还原。

识别单个文档中的文本

打开扫描的 PDF,然后选择所有工具 > 扫描和 OCR

选择在此文件中

在显示的对话框中,选择文本识别的页面范围和语言。

或者,您也可以选择设置以指定其他选项。

选择识别文本

Acrobat 在您的 PDF 中创建一个可搜索的文本图层。

识别多个文档中的文本

选择所有工具 > 扫描和 OCR

选择在多个文件中

识别文本对话框中,选择添加文件并选择要处理的 PDF。

输出选项对话框中,指定处理后文件的目标文件夹并设置文件名首选项。选择确定

识别文本 - 一般设置对话框中,指定选项,然后选择确定

Acrobat 处理所选文档,并在指定的输出文件夹中创建可搜索的版本。

运行 OCR 后,请检查文档以确保文本准确且完整。如有必要,手动更正任何错误或调整设置后重新运行 OCR。