Desativar a extração de texto binário para otimizar a indexação do Lucene

Este artigo explica como desabilitar a indexação do conteúdo de arquivos binários, como PDFs e documentos do Office, o que reduz o crescimento do índice. Se você executar uma reindexação nos índices desativados, isso reduzirá o tamanho geral do índice.

Ambiente

AEM 6.x

Etapas

Para desabilitar a indexação de documentos PDF e Microsoft Office:

  1. Acesse http://host:port/crx/packmgr/index.jsp e faça o logon como admin.

  2. Faça o upload do pacote anexado e o instale.

  3. Reinicie o AEM (isso é feito para liberar todos os threads de indexação presos, se houver algum).

Se o objetivo geral é reduzir a quantidade de espaço em disco consumida pelos índices, siga estas etapas adicionais:

  1. Acesse http://host:port/crx/de/index.jsp e faça o logon como admin.

  2. Navegue até /oak:index/lucene.

  3. Defina a propriedade reindex como true.

  4. Navegue até /oak:index/damAssetLucene.

  5. Defina a propriedade reindex como true.

  6. Clique em Salvar tudo. Isso aciona a reindexação dos dois índices.

  7. Leia este artigo para saber como monitorar a indexação.

  8. Se houver um armazenamento de dados, execute a coleta de lixo do armazenamento de dados.

Download

 Adobe

Receba ajuda com mais rapidez e facilidade

Novo usuário?

Adobe MAX 2024

Adobe MAX:
a conferência da criatividade

14 a 16 de outubro, Miami Beach e online

Adobe MAX

A conferência da criatividade

14 a 16 de outubro, Miami Beach e online

Adobe MAX 2024

Adobe MAX:
a conferência da criatividade

14 a 16 de outubro, Miami Beach e online

Adobe MAX

A conferência da criatividade

14 a 16 de outubro, Miami Beach e online