在 Acrobat 中打开 PDF,然后选择汉堡菜单 文件菜单 (macOS) > 另存为。
(Windows) 或
上次更新日期:
2024年4月26日
光学字符识别(Optical Character Recognition,简称 OCR)是指 Acrobat 检查基于像素的文本图像的过程。Acrobat 会识别各个字符并将其转换成可编辑文本。在 OCR 过程中,Acrobat 会将图像形状和线条粗细与系统中安装的字体进行对比。可渲染文本是指 PDF 文件中存在的可编辑文本。Acrobat 无法针对包含可渲染文本的文档执行 OCR。
问题:Acrobat 无法运行 OCR,因为页面包含可渲染文本
当您打开 PDF 并从“扫描和 OCR”工具中选择“识别文本”选项时,Acrobat 返回以下错误:“Acrobat 无法在此页面上执行识别 (OCR),原因是:此页面包含可渲染文本。”
解决方案 1:在不含可渲染文本的文档上运行 OCR
如果 PDF 文档已经包含可编辑文本,则会出现此消息。请获取不包含可编辑文本的文档副本,然后运行 OCR。
解决方案 2:将 PDF 转换为 TIFF 文件格式,然后再转换回 PDF
-
-
在“另存为 PDF”对话框中,从转换为下拉列表中选择 TIFF (*.tif, *.tiff)。指定位置,然后选择“保存”。Acrobat 会将 PDF 文档的每一页依次保存为按顺序编号的单个 TIFF 文件。
-
在 Acrobat 中打开每个 TIFF 文件,然后从扫描和 OCR 工具中选择识别文本。