Ambiente
AEM 6.1, 6.2, 6.3, 6.4
Como usar a configuração personalizada do Tika para desabilitar a pesquisa de texto completo com base no tipo MIME de um arquivo no AEM
A Adobe recomenda desativar a pesquisa de texto completo de arquivos binários por meio do índice do Tika. Esta recomendação faz parte do artigo da Helpex Ajuste de desempenho de ativos.
Alguns tipos MIME comuns a serem considerados: mp4, pdf, zip.
Método 1
1. Instale o pacote fornecido.
2. Através do CRX/DE navegue até os locais abaixo:
/oak:index/lucene/tika/config.xml
/oak:index/damAssetLucene/tika/config.xml
3. Adicione o tipo de arquivo MIME que precisa ser desativado:
<mime>application/zip</mime>
4. Clique em Salvar tudo.
5. Ao usar o CRX/DE, defina esta propriedade booleana refresh=true nesses nós e salve:
/oak:index/lucene
/oak:index/damAssetLucene
6. Aguarde até que as alterações entrem em vigor e teste procurando por ativos do tipo MIME adicionado.
Método 2
1. No Console da Web do AEM pesquise por 'oak-lucene'. Observe o número do pacote.
2. Encerre a instância do AEM.
3. Navegue até o diretório /crx-quickstart/launchpad/felix/bundlexxx.
4. cd para o subdiretório com versionX.Y no nome (por exemplo, felix/bundle102/version0.2):
versão cd*
5. Extraia o conteúdo do arquivo tika-config.xml do arquivo jar:
jar -xvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
6. Edite o arquivo tika-config.xml
vi org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
Por exemplo, adicione o tipo de arquivo mime que precisa ser desativado:
<mime>application/zip</mime>
7. Salve as alterações no bundle.jar.
jar -uvf bundle.jar org/apache/jackrabbit/oak/plugins/index/lucene/tika-config.xml
8. Reinicie a instância do AEM e teste procurando por ativos do tipo MIME adicionados.
Download