环境
AEM 6.1、6.2、6.3、6.4
如何使用自定义 tika 配置以禁用 AEM 中基于文件 mime 类型的全文搜索
Adobe 建议通过 tika 索引来禁用二进制文件的全文搜索。这项建议是资产性能调整帮助文章中的部分内容。
需要考虑的一些常见 mime 类型包括:mp4、pdf、zip。
方法 1
1. 安装提供的包。
2. 通过 CRX/DE 浏览到以下位置:
/oak:index/lucene/tika/config.xml
/oak:index/damAssetLucene/tika/config.xml
3. 添加需要禁用的 mime 类型文件:
<mime>application/zip</mime>
4. 单击全部保存。
5. 使用 CRX/DE,在这些节点上设置此 Boolean 属性 (refresh=true),并保存至:
/oak:index/lucene
/oak:index/damAssetLucene
6. 等待更改生效,可通过搜索添加的 mime 类型资产进行测试。
方法 2
1. 在 AEM Web 控制台中,搜索“oak-lucene”。请注意包的编号。
2. 关闭 AEM 实例。
3. 浏览至 /crx-quickstart/launchpad/felix/bundlexxx 目录。
4. 在该名称下创建名为“versionX.Y”的子目录(如 felix/bundle102/version0.2):
cd version*
5. 从 jar 文件中提取 tika-config.xml 文件的内容:
jar -xvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
6. 编辑 tika-config.xml 文件
vi org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
例如,添加需要禁用的 mime 类型文件:
<mime>application/zip</mime>
7. 将更改保存至 bundle.jar。
jar -uvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
8. 重新启动 AEM 实例,并通过搜索添加的 mime 类型资产进行测试。
下载