Problema

Implementa un elenco di stop word per ottimizzare l'indice di ricerca. In questo caso, si presume l'uso del gestore Lucene a testo completo per indicizzare /contenuto. Se si utilizza un indice di ricerca standard, utilizzare i file di configurazione appropriati.

Soluzione

  1. Collegati alla tua istanza tramite CQDE
  2. Aprire la pagina /config/repository/search/fulltexthandler.xml. Per impostazione predefinita, ha l'aspetto seguente:
    <?xml version="1.0" encoding="ISO-8859-1"?> <!DOCTYPE searchhandler SYSTEM "cq:/system/resources/dtd/contentbus/search/fulltexthandler.dtd"> <searchhandler> <index location="search/fulltext" maxFieldLength="10000" resultCacheSize="50" useCompoundFile="true" /> </searchhandler>
  3. Aggiungi le tue parole di stop a questo file come segue:
    <?xml version="1.0" encoding="ISO-8859-1"?> <!DOCTYPE searchhandler SYSTEM "cq:/system/resources/dtd/contentbus/search/fulltexthandler.dtd"> <searchhandler> <index location="search/fulltext" maxFieldLength="10000" resultCacheSize="50" useCompoundFile="true" /> <stop-list> <stop-word>and</stop-word> <stop-word>or</stop-word> </stop-list> </searchhandler>
  4. È possibile utilizzare il file zip allegato come elenco di parole di arresto, generare il proprio elenco o trovare un altro elenco di parole di stop da Internet.
  5. Salva /config/repository/search/fulltexthandler.xml.
  6. Ferma la tua istanza.
  7. Eliminare la cartella cq_home/data/your_instance/search/fulltext.
  8. Inizia la tua istanza.

Scarica

Nota:

Il riavvio può richiedere un po' di tempo a seconda delle dimensioni del contenuto, dal momento che Lucene reindicizza il contenuto.

Questo prodotto è concesso in licenza in base alla licenza di Attribuzione-Non commerciale-Condividi allo stesso modo 3.0 Unported di Creative Commons.  I post su Twitter™ e Facebook non sono coperti dai termini di Creative Commons.

Note legali   |   Informativa sulla privacy online