Otimizar a pesquisa adicionando palavras irrelevantes

Problema

É necessário implementar uma lista de palavras irrelevantes para otimizar seu índice de pesquisa. Nesse caso, o uso do manipulador Lucene de texto completo para index/content é pressuposto. Para usar um índice de pesquisa padrão, use os arquivos de configuração apropriados.

Solução

  1. Conecte-se à sua instância via CQDE.
  2. Abra a página /config/repository/search/fulltexthandler.xml. Por padrão, esta é a aparência dela:
    <?xml version="1.0" encoding="ISO-8859-1"?> <!DOCTYPE searchhandler SYSTEM "cq:/system/resources/dtd/contentbus/search/fulltexthandler.dtd"> <searchhandler> <index location="search/fulltext" maxFieldLength="10000" resultCacheSize="50" useCompoundFile="true" /> </searchhandler>
  3. Adicione as palavras irrelevantes a este arquivo da seguinte maneira:
    <?xml version="1.0" encoding="ISO-8859-1"?> <!DOCTYPE searchhandler SYSTEM "cq:/system/resources/dtd/contentbus/search/fulltexthandler.dtd"> <searchhandler> <index location="search/fulltext" maxFieldLength="10000" resultCacheSize="50" useCompoundFile="true" /> <stop-list> <stop-word>and</stop-word> <stop-word>or</stop-word> </stop-list> </searchhandler>
  4. Use o arquivo zip anexado como a lista de palavras irrelevantes, gere própria lista ou localize outra lista de palavras irrelevantes na Internet.
  5. Salve /config/repository/search/fulltexthandler.xml.
  6. Pare sua instância.
  7. Exclua a pasta cq_home/data/your_instance/search/fulltext.
  8. Inicie a instância.

Download

Observação:

O reinício pode demorar algum tempo, dependendo do tamanho do seu conteúdo, pois o Lucene reindexa o conteúdo.

Logotipo da Adobe

Fazer logon em sua conta