Désactivation de l’extraction de texte binaire pour optimiser l’indexation Lucene

Cet article explique comment désactiver l’indexation du contenu des fichiers binaires, tels que les documents PDF et Office, qui ralentissent la croissance de l’index. Si vous effectuez une reindexation sur les index désactivés, cela réduit la taille globale de l’index.

Environnement

AEM 6.x

Étapes

Désactivation de l’indexation des documents PDF et Microsoft Office :

  1. Allez à http://host:port/crx/packmgr/index.jsp et identifiez-vous en tant qu'administrateur.

  2. Téléchargez et installez le package joint.

  3. Redémarrez AEM (cela permet de libérer tous les fils d'indexation bloqués s'ils existent).

Si votre objectif général est de réduire l’espace disque utilisé par les index, suivez ces étapes supplémentaires :

  1. Allez à http://host:port/crx/de/index.jsp et identifiez-vous en tant qu'administrateur.

  2. Naviguez jusqu'à /oak:index/lucene.

  3. Choisissez la propriété d'indexation correcte.

  4. Naviguez jusqu'à /oak:index/damAssetLucene.

  5. Choisissez la propriété d'indexation correcte.

  6. Cliquez sur Tout sauvegarder.Cela déclenche la réindexation des deux index.

  7. Lisez cet article pour apprendre à gérer l'indexation.

  8. Si vous disposez d'une banque de données, exécutez Nettoyage de la mémoire Datastore.

Telechargement

 Adobe

Recevez de l’aide plus rapidement et plus facilement

Nouvel utilisateur ?