创建和管理 PDF 中的索引

您可以通过在文档中嵌入词的索引来减少搜索长 PDF 的时间。比起搜索文档,Acrobat 搜索索引的速度会更快。嵌入索引包括在已分发或已共享的 PDF 副本中。用户使用嵌入索引搜索 PDF 和他们不使用嵌入索引搜索完全一样;不需要额外的步骤。

添加索引到 PDF

  1. Acrobat 中打开文档之后,选择“工具”>“在文档处理”>“管理嵌入索引”。
  2. 在“管理嵌入索引”对话框中,单击“嵌入索引”。
  3. 请阅读出现的说明,并单击“是”。

    注意:

    在 Outlook 和 Lotus Notes 中,当您将电子邮件或文件夹转换为 PDF 时可以选择嵌入索引。特别建议针对文件夹包含很多电子邮件时使用。

更新或删除 PDF 中的嵌入索引

  1. 选择“工具”>“文档处理”>“管理嵌入索引”。
  2. 单击“更新索引”或“删除索引”。

关于编录功能 (Acrobat Pro)

您可以将特定的一组 PDF 定义为“编录”,并为整个集合的文档创建统一的索引。当用户搜索已编录的 PDF 的特定信息时,索引可以加快搜索处理。

当在 CD 上分发集合时,您可以在 PDF 中包含索引。

您可以编录罗马、中文、日文或韩文字符的文档。您可以编录的项目包括文档文本、注释、书签、表单域、标签、对象和文档元数据、附件、文档信息、数字签名、图像 XIF(扩展图像文件格式)元数据和自定义文档信息。

准备 PDF 来构建索引 (Acrobat Pro)

首先,请创建文件夹来将所需构建索引的 PDF 包含到其中。所有 PDF 应该内容和电子功能完整,例如链接、书签和表单域。如果要构建索引的文件包含扫描文档,请确保文本可搜索。将长文档分割成短文档,按章节分割文档,可以增加搜索效率。您还可以添加信息到文件的文档属性来增加文件的可搜索性。

在您为文档集合构建索引之前,您必须在硬盘驱动器或网络服务器卷上设置文档结构并验证跨平台文件名。在跨平台搜索中,文件名可能被截断并难于恢复。要防止这种问题,请注意以下几点:

  • 使用 MS-DOS 文件命名规则(8 个或 8 个以下字符的文件名加 3 个字符的扩展名)重命名文件、文件夹和索引(尤其在您要使用 ISO 9660 格式的 CD-ROM 光盘发送文档集合和索引时)。

  • 删除文件和文件夹名称中的扩展字符,例如重音字符和某些非英文字符。(“编录”功能使用的字体不支持字符编码 133 到 159。)

  • 对于将由 Mac OS 用户搜索的索引,不要使用多层嵌套文件夹或者大于 256 个字符的路径名称。

  • 如果您在 OS/2 LAN 服务器中使用 Mac OS,请配置 IBM®LAN Server Macintosh (LSM) 来强制执行 MS-DOS 文件命名规则,或者仅为 FAT(文件分配表)卷构建索引。(HPFS [高性能文件系统] 卷可包含不可检索的长文件名。)

    如果文档结构中包含您不想构建索引的子文件夹,则可以在构建索引过程中排除它们。

添加元数据到文档属性 (Acrobat Pro)

要使 PDF 便于搜索,您可以添加被称为“元数据”的文件信息到文档属性。(您可以通过选择“文件”>“属性”,然后单击“说明”标签来查看当前打开 PDF 的属性。)

注意:

(Windows) 您也可以从桌面输入和阅读数据属性信息。在 Windows 的“资源管理器”中右键单击文档,选择“属性”,然后单击“PDF”标签。在此对话框中键入或编辑的任何信息均会在打开文件时显示在“文档属性”的“说明”中。

当添加文档属性数据时,请考虑以下建议:

  • 请在“标题”域中使用说明准确的标题。文档的文件名会显示在“搜索结果”对话框中。

  • 请总是为相似信息使用相同选项(栏位)。例如,不要为一些文档添加重要项目到“主题”选项,而另一些添加到“关键字”选项。

  • 请为相同的信息使用单一、统一的项目。例如,不要为一些文档使用生物学,而为另一些使用生命科学

  • 请使用“作者”选项来标识文档的负责方。例如,雇佣方案文档的作者可能是“人力资源部”。

  • 如果您使用文档部件号,请将它们作为关键字来添加。例如,添加“doc#=m234”到“关键字”选项来在关于特殊对象的一系列数百个文档中指名特定的文档。

  • 请单独或同时使用“主题”或“关键字”选项来按类型对文档分类。例如,您可以使用状态报告 告作为“主题”项目,并使用每月每周作为单个文档的“关键字”项目。

    如果对 Adobe PDF 非常熟悉,您可以在创建索引时定义自定义数据域,如“文档类型”、“文档编号”和“文档标识符”。这项建议仅适用于高级用户,而且未在 Acrobat 完整帮助中加以说明。

为集合创建索引 (Acrobat Pro)

当您构建新的索引时,Acrobat 创建“.pdx”扩展名的文件和新的支持目录,其中包含了一个或多个“.idx”扩展名的文件。IDX 文件包含索引条目。所有这些文档必须对要搜索索引的用户可用。

<span class="uicontrol">Acrobat Pro</span> 中用于创建索引的对话框
<span class="uicontrol">Acrobat Pro</span> 中用于创建索引的对话框

  1. 选择“工具”>“文档处理”>“编录全文索引”,然后单击“新建索引”。

    注意:

    如果未显示“文档处理”面板,请参阅有关在“任务”窗格上添加面板的说明。

  2. 请在“索引标题”中,键入索引文件名。
  3. 请在“索引描述”中,键入一些关于索引类型或意义的单词。
  4. 请单击“选项”,选择您希望应用的索引的高级选项,然后单击“确定”。
  5. 请在“包含这些目录”选项下,单击“添加”,选择包含要构建索引的 PDF 文件的文件夹,然后单击“确定”。要添加其它文件夹,请重复此步骤。

    注意:

    任何包含文件夹下的子文件夹也会包含在构建索引的处理中。如果您不打算移动索引或任何文档集合中项目,您就可以从多个服务器或磁盘驱动添加文件夹。

  6. 请在“排除这些子目录”选项下,单击“添加”,然后选择包含不要创建索引的 PDF 文件的子文件夹。请单击“确定”,如果需要请重复本步骤。
  7. 审阅您的选择。要编辑将要包括或排除的文件夹列表,请选择要更改的文件夹,然后单击“删除”。
  8. 请单击“构建”,然后指定索引文件的位置。请单击“保存”,然后:
    • 当构建索引完成后,单击“关闭”。

    • 单击“停止”来取消构建索引处理。

    注意:

    如果停止构建索引,您无法继续同一索引构建过程,但是无须重复上述工作。选项和文件夹选择仍然完整保留。您可以单击“打开索引”选择部分完成的索引,进行修改。

    注意:

    如果长路径名在“包含这些目录”和“排除这些子目录”选项中被缩短,请将指针悬停到每个省略号(...)上方,直到工具提示出现为止,其中会显示包含和排除文件夹的完整路径。

“索引选项”对话框

不包含数字

选择本选项可以从索引中排除文档中出现的全部数字。排除数字可以明显减少索引大小,从而加快搜索速度。

添加 ID 到 Adobe PDF v1.0 文件

如果您的集合中包含使用 Acrobat 2.0 之前的应用程序(不会自动添加识别数字)创建的 PDF,请选择本选项。当长的 Mac OS 文件名在转换为 MS-DOS 文件名过程中被缩短时,需要使用 ID 数字。Acrobat 2.0 或更高版本会自动添加标示符。

搜索时对已更改的文档不要进行警告

如果未选择该选项,当您搜索自上次构建索引已更改的文档时,会自动出现警告消息。

自定义属性

使用本选项可在索引中包含自定义文档属性;只有要构建索引的 PDF 中已存在的自定义文档属性会被构建索引。键入属性,从“类型”菜单选择选项,然后单击“添加”。当您搜索生成的索引时,这些属性会作为搜索选项显示在“搜索 PDF”窗口的附加条件弹出菜单中。例如,如果您输入自定义属性“文档名称”,并从“类型”菜单选择字符串属性,搜索索引的用户即可以在自定义属性中搜索,方法是从“使用这些附加条件”菜单中选择“文档名称”。

注意:

当您在 Microsoft Office 应用程序(其中选择了 PDFMaker 应用程序的“转换文档信息”选项)中创建自定义域时,这些域可以在您创建的任何 PDF 中传输。

XMP 栏位

使用本选项可包含自定义 XMP 栏位。自定义 XMP 栏位将被构建索引并且出现在附加条件菜单中以便在选择的索引中搜索。

忽略单词

用于从索引搜索结果中排除特定的单词(最大 500)。键入单词,单击“添加”,如果需要请重复本步骤。排除单词可使索引缩小 10% 到 15%。一个排除单词最多可以包含 128 个字符并区分大小写。

注意:

要防止用户试图搜索包含这些单词的短语,请在“编录自述”文件中列出没有构建索引的单词。

结构标签

使用本选项可使特定的页元素标签节点在含有标签逻辑结构的文档中可搜索。

注意:

“自定义属性”、“忽略单词”和“结构标签”设置仅应用于当前索引。要应用这些设置到您创建的所有索引,您可以在“首选项”对话框“编录”面板中更改“自定义属性”、“忽略单词”和“结构标签”的默认设置。  

编录自述文件 (Acrobat Pro)

通常,创建独立的自述文件并将其与索引放在同一文件夹中是比较好的方法。本自述文件可以包含关于索引的详细信息,例如:

  • 文档索引类型。

  • 支持的搜索选项。

  • 遇到问题时的联系人或联系电话号码。

  • 排除在索引之外的数字或单词列表。

  • 在基于 LAN 的索引中包含文档的文件夹列表,或在基于磁盘索引中的文档列表。您可能还要包含每个文件夹或文档内容的简要说明。

  • 每个文档的相应值的列表,如果您指定了“文档信息”域值。

    如果编录含有的文档数量非常大,请考虑包含显示每个文档值的表。该表可以包含在自述文件中,或为独立文档。当生成索引时,您可以使用该表来保持一致性。

修改索引 (Acrobat Pro)

您可以更新、重建或清空现有的索引。

  1. 选择“工具”>“文档处理”>“编录全文索引”,然后单击“打开索引”。
  2. 请为索引查找并选择索引定义文件(PDX),然后单击“打开”。
  3. 如果索引是使用 Acrobat 5.0 或更低版本创建的,请选择“创建副本”来新建索引(不替换早期版本),或者选择“替换旧索引”来替换早期版本索引。
  4. 在“索引定义”对话框中,请根据需要进行更改,然后单击要让 Acrobat 执行的功能:

    构建

    使用现有信息新建 IDX 文件,并通过添加新项目并将更改的或过期的项目标记为无效来进行更新。如果您做了大量的更改,或者重复使用本选项,而不是新建索引,搜索时间可能会增加。

    重建

    新建索引,替换现有的索引文件夹和其内容(IDX 文件)。

    清空

    删除索引内容(IDX 文件),而不删除索引文件本身(PDX)。

“编录”首选项 (Acrobat Pro)

您可以为构建索引设置首选项,以后它将应用于您构建的所有索引。您可以在索引定义过程中选择不同设置来使个别索引忽略其中的某些首选项。

在“首选项”对话框中的“种类”下,选择“编录”。许多选项的描述与索引构建工程中的完全一致。

注意:

如果您在为文档构建索引时不想将长的 PDF 文件名更改为 MS-DOS 文件名,“在文件夹上强制使用 ISO 9660 规范”将十分有用。尽管如此,您仍然必须使用 MS-DOS 文件命名规则来命名文件夹名称(不超过 8 个字符),但文件名可以不使用此规则。

定时更新索引 (Acrobat Pro)

使用“编录”功能和编录批 PDX 文件 (.bpdx) 来安排自动建立,重建,更新和清空索引的时间和频率。BPDX 文件是一个文本文件,它包含平台相关的编录索引文件路径和标记的列表。您可以使用日程安排应用程序(如 Windows Scheduler),将 BPDX 文件显示在 Acrobat 中。Acrobat 会按照 BPDX 文件中的标记重新创建索引。

有关安排索引更新的详细信息,请在 www.adobe.com/cn/support 上搜索 BPDX。

 

注意:

要使用 BPDX 文件,请在“编录”下的“首选项”对话框中,选择“允许运行编录批处理文件 (.bpdx)”。

移动集合及其索引 (Acrobat Pro)

您可以在本地磁盘驱动上生成和测试建立索引的文档集合,然后将完成的文档集合移动到网络服务器或磁盘上。索引定义包含索引定义文件(PDX)相对于含有已构建索引文档的文件夹的相对路径。如果这些相对路径未更改,您无须在移动已构建索引文档集合后重建索引。如果 PDF 文件和含有已构建索引文档的文件夹在同一文件夹中,您只需移动该文件夹即可保持相对路径。

如果相对路径被更改,您必须在移动已构建索引文档集合后新建索引。但是,您仍然可以使用原始的 PDX 文件。要使用原始的 PDF 文件,首先请移动已构建索引的文档。然后将 PDF 文件复制到您要新建索引的文件夹,按照需要编辑包含目录和排除子目录列表。

如果在磁盘或服务器卷上索引与其对应的集合任何部分分开放置,移动集合或索引都将使索引无效。如果您打算将文档集合移动到另一网络位置或 CD 上,请在集合同一位置创建和构建索引。

本产品经 Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License 许可  Twitter™ 与 Facebook 中的内容不在 Creative Commons 的条款约束之下。

法律声明   |   在线隐私策略