Disattiva l'estrazione del testo binario per ottimizzare l'indicizzazione di Lucene

Questo articolo spiega come disabilitare l'indicizzazione del contenuto dei file binari come i PDF e i documenti di Office che proseguendo riduce la crescita dell'indice. Se esegui una reindicizzazione sugli indici disabilitati, riduci la dimensione complessiva dell'indice.

Ambiente

AEM 6.x

Passaggi

Per disabilitare l'indicizzazione dei documenti PDF e Microsoft Office:

  1. Vai su http://host:port/crx/packmgr/index.jsp e accedi come amministratore.

  2. Carica e installa il pacchetto allegato.

  3. Riavvia AEM (questo serve a liberare eventuali thread di indicizzazione bloccati, se ce ne sono).

Se l'obiettivo generale è quello di ridurre la quantità di spazio su disco consumato dagli indici, segui questi passaggi aggiuntivi:

  1. Vai su http://host:port/crx/de/index.jsp e accedi come amministratore.

  2. Scorri a /oak:index/lucene.

  3. Imposta la proprietà reindicizzazione su true.

  4. Scorri a /oak:index/damAssetLucene.

  5. Imposta la proprietà reindicizzazione su true.

  6. Fai clic su Salva tutto. Questo innesca la reindicizzazione dei due indici.

  7. Segui questo articolo per scoprire come monitorare l'indicizzazione.

  8. Se disponi di un archivio dati, esegui la Raccolta rifiuti di Datastore.

Scarica

Logo Adobe

Accedi al tuo account