如何使用自定义 tika 配置以禁用 AEM 中基于文件 mime 类型的全文搜索

环境

AEM 6.1、6.2、6.3、6.4

如何使用自定义 tika 配置以禁用 AEM 中基于文件 mime 类型的全文搜索

Adobe 建议通过 tika 索引来禁用二进制文件的全文搜索。这项建议是资产性能调整帮助文章中的部分内容。

需要考虑的一些常见 mime 类型包括:mp4、pdf、zip。 

方法 1

1. 安装提供的包。 

2. 通过 CRX/DE 浏览到以下位置:

/oak:index/lucene/tika/config.xml
/oak:index/damAssetLucene/tika/config.xml

3. 添加需要禁用的 mime 类型文件:

<mime>application/zip</mime>

4. 单击全部保存

5. 使用 CRX/DE,在这些节点上设置此 Boolean 属性 (refresh=true),并保存至:
/oak:index/lucene
/oak:index/damAssetLucene

6. 等待更改生效,可通过搜索添加的 mime 类型资产进行测试。

 

方法 2

1. 在 AEM Web 控制台中,搜索“oak-lucene”。请注意包的编号。

2. 关闭 AEM 实例。  

3. 浏览至 /crx-quickstart/launchpad/felix/bundlexxx 目录。

4. 在该名称下创建名为“versionX.Y”的子目录(如 felix/bundle102/version0.2):
cd version*

5. 从 jar 文件中提取 tika-config.xml 文件的内容:
jar -xvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml

6. 编辑 tika-config.xml 文件

vi org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml

例如,添加需要禁用的 mime 类型文件:

<mime>application/zip</mime>

7. 将更改保存至 bundle.jar。
jar -uvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml

8. 重新启动 AEM 实例,并通过搜索添加的 mime 类型资产进行测试。  

下载

 Adobe

更快、更轻松地获得帮助

新用户?

Adobe MAX 2024

Adobe MAX
创意大会

10 月 14 日至 16 日迈阿密海滩及线上

Adobe MAX

创意大会

10 月 14 日至 16 日迈阿密海滩及线上

Adobe MAX 2024

Adobe MAX
创意大会

10 月 14 日至 16 日迈阿密海滩及线上

Adobe MAX

创意大会

10 月 14 日至 16 日迈阿密海滩及线上