AEM에서 파일의 MIME 형식을 기반으로 사용자 정의 tika 구성을 사용하여 전체 텍스트 검색을 비활성화하는 방법

환경

AEM 6.1, 6.2, 6.3, 6.4

AEM에서 파일의 MIME 형식을 기반으로 사용자 정의 tika 구성을 사용하여 전체 텍스트 검색을 비활성화하는 방법

Adobe에서는 tika 색인을 통해 바이너리 파일에 대한 전체 텍스트 검색을 비활성화하는 것이 좋습니다.  이 권장 사항은 자산 성능 조정 Heplx 문서의 일부입니다.

고려해야 할 몇 가지 일반적인 MIME 유형: mp4, pdf, zip 

방법 1

1. 제공된 패키지를 설치합니다. 

2. CRX/DE를 통해 아래 위치를 찾습니다.

/oak:index/lucene/tika/config.xml
/oak:index/damAssetLucene/tika/config.xml

3. 비활성화해야 하는 파일 MIME 형식을 추가합니다. 

<mime>application/zip</mime>

4. 모두 저장을 클릭합니다.

5. CRX/DE를 사용하여 이러한 노드에서 이 부울 속성 refresh=true를 설정하고 저장합니다.
/oak:index/lucene
/oak:index/damAssetLucene

6. 변경 사항이 적용될 때까지 기다렸다가 추가된 MIME 유형의 자산을 검색하여 테스트합니다.
 

 

방법 2

1. AEM 웹 콘솔에서 'oak-lucene'를 검색합니다.  번들 번호를 확인하십시오.  

2. AEM 인스턴스를 종료합니다.  

3. /crx-quickstart/launchpad/felix/bundlexxx 디렉터리로 이동합니다.  

4. versionX.Y가 있는 하위 디렉터리에 cd를 추가합니다(예: felix/bundle102/version0.2).
cd 버전*

5. jar 파일에서 tika-config.xml 파일의 컨텐츠를 추출합니다.
jar -xvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml

6. tika-config.xml 파일을 편집 편집합니다.

vi org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml

예를 들어 비활성화해야 하는 파일 MIME 형식을 추가합니다. 

<mime>application/zip</mime>

7. bundle.jar의 변경 사항을 저장합니다. 
jar -uvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml

8. AEM 인스턴스를 다시 시작하고 추가된 MIME 유형의 자산을 검색하여 테스트합니다.  

다운로드

Adobe 로고

내 계정 로그인