Síntomas para el crecimiento del directorio de índices

El crecimiento del directorio de índices se debe a

Caso 1: El contenido se añade o modifica continuamente en el espacio de trabajo. Es posible que esta operación resulte en la creación de un segmento nuevo (las carpetas en la carpeta índice) con nuevos documentos en él.

Caso 2: se debe fusionar el segmento creado anteriormente. Este proceso se produce de forma asíncrona y se activa mediante modificaciones en el repositorio. La fusión de segmentos se ejecuta hasta que se completa y se seguirá ejecutando cuando no se realicen más cambios.

Distinción entre los dos casos mencionados

  • Las nuevas carpetas de índice y tar PM creadas a una tasa constante para el Caso 1.
  • Al mismo tiempo, las nuevas carpetas/segmentos de índice se fusionan en carpetas más grandes, como se indica en el Caso 2. La mayoría de las fusiones de índices son rápidas porque el segmento de índice resultante no es tan grande. No obstante, de vez en cuando se fusionan segmentos de índice más grandes, lo que lleva más tiempo y consume más espacio en disco. La fusión de índice se realiza en segundo plano y tendrá en cuenta las actividades aunque no haya cambios en el repositorio. Desde la carpeta/segmento únicos del sistema de archivos sigue creciendo. Ese archivo único es el segmento de destino de la fusión.

Nota:

 

  • En caso de que el repositorio se cierre antes de que se complete la fusión de segmentos, la próxima vez que se inicie la instancia, el repositorio iniciará una fusión de segmento desde cero.
  • Las fusiones de índices se registran a nivel INFO en crx error.log como [1]. Busque los registros “IndexMerger” y organícelos por número para encontrar la cantidad de documentos fusionados.

    [1] *INFO * IndexMerger: fusionó 250 documentos en 724 ms en _21f. (IndexMerger.java,.....

Consideraciones de espacio en disco

La fusión de segmentos de índice puede usar temporalmente hasta tres veces el tamaño inicial del índice. Por ejemplo:

  1. Supongamos que tenemos 10 segmentos de índice, cada uno de 1 GB.
  2. Durante el proceso de fusión de índices, cree un nuevo segmento utilizando el contenido de índice de los 10 segmentos existentes. El segmento resultante será entonces de hasta 10 GB. Puede ser más pequeño porque el proceso de fusión no copiará los nodos que se marcaron como eliminados en los 10 segmentos fuente.
  3. En la siguiente etapa, el segmento nuevo se copia en un formato de archivo compuesto para reducir el número de controles de archivo necesarios para acceder al índice. De nuevo, este proceso requiere aproximadamente el mismo tamaño en disco. En nuestro ejemplo, vuelve a ser 10 GB.

La suma de más de tres resulta en el nuevo tamaño de índice de aproximadamente 30 GB de espacio en disco. Sin embargo, en el paso final, se eliminan los segmentos de índice antiguos y los archivos no compuestos, y se reduce el uso del disco a 10 GB.

Control de fusiones de índices

  • De forma predeterminada, el número máximo de nodos en los segmentos que se fusionarán es Integer.MAX_VALUE.  
  • Para limitar el uso temporal del disco durante las fusiones de segmentos, utilice el parámetro de configuración maxMergeDocs dentro del elemento SearchIndex en el archivo workspace.xml. El parámetro maxMergeDocs configura el número máximo de documentos que deben fusionarse en un segmento único.
  • El valor preferido de maxMergeDocs depende del repositorio. Analice los archivos de segmento de índice existentes (por ejemplo, usando Luke) para averiguar cuántos documentos hay en un segmento de índice.

Reducción del tamaño del índice

Reduzca el número de nodos eliminando los que no son necesarios, como las instancias de flujo de trabajo completadas, el registro de auditoría, etc. Para obtener ayuda, consulte los siguientes artículos:

  • https://helpx.adobe.com/es/cq/kb/howtopurgewf.html
  • https://helpx.adobe.com/es/cq/kb/how-to-optimize-lucene-index-to-gain-efficiency.html
  • https://helpx.adobe.com/es/communique/kb/Stopwordlist.html

Además, la reindexación del espacio de trabajo también puede reducir el tamaño del índice porque este no liberará espacio en disco inmediatamente al eliminar un nodo. Esto solo ocurre cuando se fusiona el segmento de índice afectado que contenía el nodo.

Esta obra está autorizada con arreglo a la licencia de Reconocimiento-NoComercial-CompartirIgual 3.0 Unported de Creative Commons.  Los términos de Creative Commons no cubren las publicaciones en Twitter™ y Facebook.

Avisos legales   |   Política de privacidad en línea