Sintomi per la crescita della directory degli indici

La crescita della directory degli indici sarà dovuta a

Caso1:- Il contenuto viene aggiunto o modificato continuamente nell'area di lavoro. Questa operazione comporta probabilmente la creazione di un nuovo segmento (le cartelle nella cartella indice) con nuovi documenti.

Case2:- Il segmento creato sopra deve essere unito. Questo processo avviene in modo asincrono ed è innescato da modifiche all'archivio. L'unione dei segmenti funzionerà fino al suo completamento e continuerà a funzionare anche quando non vengono più effettuate modifiche.

Come distinguere i due casi di cui sopra

  • Le nuove cartelle indice e Tar PM create a velocità costante nel caso 1.
  • Allo stesso tempo, le nuove cartelle/segmenti dell'indice eventualmente fusi in cartelle/segmenti più grandi indicano il caso 2. La maggior parte delle fusioni di indici sono rapide perché il segmento di indice risultante non è così grande. Ma ogni tanto i segmenti di indice più grandi vengono fusi insieme, il che richiede un po' di tempo e richiede anche più spazio su disco. Una fusione dell'indice viene fatta in background e nota l'attività anche se non ci possono essere modifiche apportate all'archivio. Dal file system la singola cartella/segmento continua a crescere. Quel singolo file è il segmento di destinazione della fusione.

Nota:

 

  • Nel caso in cui l'archivio sia stato chiuso prima del completamento della fusione dei segmenti. Al prossimo avvio dell'istanza l'archivio inizierà una fusione di segmenti da zero.
  • Gli Index Merge sono registrati a livello INFO in crx error.log come [1]. Grep dai registri "IndexMerger" e ordina per numero per trovare il numero di documenti che sono stati fusi.

    [1] *INFO * IndexMerger: fusione di 250 documenti in 724 ms in _21f. (IndexMerger.java,...

Considerazioni sullo spazio su disco

La fusione di segmenti dell'indice può utilizzare temporaneamente fino a tre volte la dimensione iniziale dell'indice. Come esempio

  1. Diciamo 10 segmenti di indice con una dimensione di 1 GB ciascuno. 
  2. Durante il processo di fusione degli indici creare un nuovo segmento prendendo il contenuto dell'indice dei 10 segmenti esistenti. il segmento risultante sarà quindi fino a 10 GB. può essere più piccolo perché il processo di fusione non copierà sui nodi che sono stati cancellati nei 10 segmenti sorgente.
  3. Nella fase successiva il nuovo segmento viene copiato in un formato di file composto per ridurre il numero dei gestori di file necessari per accedere all'indice. questo richiede di nuovo circa le stesse dimensioni sul disco. nel nostro esempio di nuovo 10 GB.

La somma dei tre menzionati risulta ora nella nuova dimensione dell'indice di circa 30 GB di spazio su disco. Tuttavia in una fase finale i vecchi segmenti di indice e i file non composti vengono eliminati e riducono l'utilizzo del disco a 10 GB.

Controllo delle fusioni degli indici

  • Per impostazione predefinita, il numero massimo di nodi nei segmenti che verranno fusi è Integer.MAX_VALUE.  
  • Per limitare l'uso temporaneo del disco durante le fusioni di segmenti, utilizzare il parametro di configurazione "maxMergeDocs" all'interno dell'elemento SearchIndex nel file workspace.xml. Il parametro "maxMergeDocs" configura il numero massimo di documenti da unire in un unico segmento.
  • Il valore preferito di maxMergeDocs dipende dall'archivio. Analizza i file dei segmenti di indice esistenti (ad esempio utilizzando Luke) per scoprire quanti documenti sono in un segmento di indice.

Riduzione della dimensione dell'indice

Riduci il numero di nodi rimuovendo i nodi che non sono necessari, come le istanze del flusso di lavoro completate, il registro di audit, ecc. Gli articoli utili sono

  • https://helpx.adobe.com/it/cq/kb/howtopurgewf.html
  • https://helpx.adobe.com/it/cq/kb/how-to-optimize-lucene-index-to-gain-efficiency.html
  • https://helpx.adobe.com/it/communique/kb/Stopwordlist.html

Inoltre, la reindicizzazione dello spazio di lavoro potrebbe anche ridurre la dimensione dell'indice perché l'indice non libererà spazio su disco immediatamente quando un nodo viene cancellato. Questo accade solo quando il segmento di indice interessato che conteneva il nodo viene fuso.

Questo prodotto è concesso in licenza in base alla licenza di Attribuzione-Non commerciale-Condividi allo stesso modo 3.0 Unported di Creative Commons.  I post su Twitter™ e Facebook non sono coperti dai termini di Creative Commons.

Note legali   |   Informativa sulla privacy online