在 Adobe Acrobat Export PDF 中使用 OCR

Adobe Acrobat Export PDF 是一项 Acrobat 在线服务。借助该服务,您可以轻松地将 PDF 文件转换为可编辑的 Word、Excel 或 RTF(富文本格式)文档。

您无法使用 Adobe Acrobat Export PDF 来编辑 PDF。您需要使用 Acrobat 才能编辑 PDF。请参阅 Acrobat 产品页面

当您将 PDF 文件转换为 Word(.doc 和 .docx)、Excel (.xlsx) 或 RTF(富文本格式)文档时,Adobe Acrobat Export PDF 可以支持“光学字符识别”(OCR) 技术。OCR 可将文本图像(扫描的文字)转换为可编辑字符,这样您便可以搜索、修改及复制文本了。 

如果 PDF 文件包含图像、矢量插图、隐藏文本,或者包含这些元素的组合,那么在启用了 OCR 之后,Adobe Acrobat Export PDF 可以对该 PDF 文件执行 OCR。(例如,Adobe Acrobat Export PDF 可以对通过扫描文档创建的 PDF 文件执行 OCR)。此外,Adobe Acrobat Export PDF 还可以对它无法解释的文本(因为这些文本没有在源应用程序中正确编码)执行 OCR。

支持的语言

Adobe Acrobat Export PDF 支持对以下语言执行 OCR:

ExportPDF 支持的语言

默认情况下,OCR 使用在“我的信息”对话框中选定的语言。OCR 引擎使用该选定语言来识别扫描的文本。由于 OCR 是使用特定于语言的词典进行转换的,因此选择正确的语言可提高转换的准确性。对于像日语这样的非拉丁语言,如果没有选定合适的语言,OCR 引擎便无法识别并转换文本。

使用 Acrobat Export PDF Web 界面

在 Adobe Acrobat Export PDF 中转换 PDF 文件时,若要采用 OCR,可执行以下操作:

  1. 登录到 Adobe Acrobat Export PDF Web 界面,然后单击选择要导出的 PDF 文件

  2. 单击从我的计算机选择文件,并浏览至您的 PDF。也可以将文件拖动到窗格中。若要从 Document Cloud 中选择文件,请单击左侧窗格中的 Document Cloud,然后选择文件。

    注意:可以选择导出多个文件。

    Export PDF Web 界面
    Export PDF Web 界面

  3. 导出到下拉列表中,选择要将 PDF 导出的格式。

  4. 文档语言下拉列表中,选择用于文本识别的恰当的文档语言。

  5. 单击导出为 <格式> 按钮以导出内容。

  6. 选定的 PDF 文件将上传至服务器且文件内容会被导出为预期的格式。单击下载图标,可将文件保存到计算机或设备上。

    下载导出的文件

使用 Acrobat Reader 导出 PDF

您也可以使用免费的 Acrobat Reader 桌面应用程序来导出 PDF。该应用程序在后台使用 Acrobat Export PDF 在线服务。

  1. 在 Acrobat Reader 中打开要转换的 PDF,然后单击右侧窗格中的 Adobe Acrobat Export PDF

  2. 检查转换按钮上方已识别的文档语言 - 文档语言:<选定的语言>。如果选定的语言正确,执行下一步操作。

    否则更改选定的语言

      i.) 单击更改

    从 Acrobat Reader 中导出 PDF

      ii.) 在 OCR 设置对话框中,从识别文本语言列表中选择适合的语言,然后单击确定

  3. 单击转换即可开始转换过程。

  4. 转换文件后,您会看到确认提示,其中包含可打开或下载转换后文件的链接。

    确认

 

 Adobe

更快、更轻松地获得帮助

新用户?

Adobe MAX 2024

Adobe MAX
创意大会

10 月 14 日至 16 日迈阿密海滩及线上

Adobe MAX

创意大会

10 月 14 日至 16 日迈阿密海滩及线上

Adobe MAX 2024

Adobe MAX
创意大会

10 月 14 日至 16 日迈阿密海滩及线上

Adobe MAX

创意大会

10 月 14 日至 16 日迈阿密海滩及线上