将 PDF 转化为文本格式

上次更新日期: 2025年11月5日

了解如何使用 Adobe Acrobat 将 PDF 文件转化为纯文本或 XML 格式文件。

将 PDF 转换为 TXT

从全局栏中选择转换

从左侧窗格选择其他格式,然后从下拉菜单中选择 TXT

选择设置以修改编码设置。

选择转换为 TXT

在打开的对话框中,选择用于保存文件的位置。

如果需要,请输入文件的新名称,然后选择保存

将 PDF 转换为 XML

从全局栏中选择转换

从左侧窗格选择其他格式,然后从下拉菜单中选择 XML 1.0

选择设置以修改以下设置:

  • 编码:大多数情况下应用 UTF-8。
  • 生成书签:为文档结构创建 XML 标记。
  • 为未加标签的文件生成标签:添加基本结构标签。
  • 导出所有图像:将 PDF 中的所有图像包含在 XML 文件中。
  • 使用子文件夹:指定用于存储导出图像的文件夹。
  • 使用前缀:为图像文件名添加前缀。
  • 输出格式:应用图像格式。
  • 缩减像素采样:调整图像分辨率。

选择转换为 XML

在打开的对话框中,选择用于保存文件的位置。

如果需要,请输入文件的新名称,然后选择保存