インデックスディレクトリの増大のための現象

増大するインデックスディレクトリは

Case1: コンテンツはワークスペースに、継続的に追加または変更されます。この操作は、(インデックスフォルダの中に)新規ドキュメントをともなう新規セグメントを作成する可能性があります

Case2: 上部に作成されたセグメントは結合する必要があります。このプロセスは非同期に行われ、リポジトリの変更により発生します。セグメントの結合は完了するまで実行され、変更が行われない場合はさらに実行します。

上記の2つのケースを区別する方法

  • Case1 の新規インデックスフォルダと Tar PM は一定の速度で作成されました。
  • 同時に新しいインデックスのフォルダまたはセグメントが大きいほうに最終的に結合され、Case2 に表示されます。インデックス統合のほとんどが速いのは、インデックスセグメントがそれほど大きくないためです。ただし、大きなインデックスセグメントを結合する際には、時間がかかり、より多くのディスク容量が消費されます。インデックス結合はバックグラウンドで行われ、リポジトリに変更が行われていない場合でも、アクティビティが通知されます。このファイルシステムから、単一のフォルダ/セグメントが増大し続けます。この単一ファイルは、結合のターゲットセグメントです。

注意:

 

  • セグメントの結合が完了する前に、リポジトリがシャットダウンした場合は、インスタンスの次回の起動時に、レポジトリが最初からセグメント結合を開始します。
  • crx- error.log の INFO レベルにおいて、インデックスの結合がロギングされる[1]。「IndexMerger」ログからグレップし、番号で並べ替え、統合されたドキュメントの数を見つけます。

    [1] *INFO * IndexMerger: merged 250 documents in 724 ms into _21f.(IndexMerger.java,.....

ディスク容量に関する考慮事項

インデックスセグメントを結合すると、初期インデックスサイズの最大 3 倍を使用することがあります。例として

  1. 1 GB のサイズを持つ10 個のインデックスセグメントを考えてみましょう。
  2. インデックス統合プロセス中に、10個の既存セグメントのインデックスコンテンツを取って新しいセグメントを作成します。作成されたセグメントは、最大10 GB までです。マージプロセスは、10個のソースセグメントで「削除」とマークされたノードをコピーしないため、より小さくなることがあります。
  3. 次のステージでは、新しいセグメントが複合ファイル形式にコピーされ、インデックスへのアクセスに必要なファイルハンドルの数が削減されます。これはディスク上でほぼ同じサイズを必要とします。再度、ここの例では10 GB です。

上記の3つを合計すると、新しいインデックスサイズは約30 GB のディスク容量になります。ただし、最終ステップで古いインデックスセグメントと非合成ファイルは削除され、ディスク使用量が10 GB に縮小されます。

コントロールインデックスの統合

  • デフォルトでは、結合されるセグメントの最大ノード数は Integer.MAX_VALUE です。  
  • セグメントの結合中に一時ディスク使用を制限するには、workspace.xml ファイル内にある SearchIndex 要素内の構成パラメータ「maxMergeDocs」を使用します。パラメータ「maxMergeDocs」は、1つのセグメントに統合する必要があるドキュメントの最大数を設定します。
  • 「maxMergeDocs」の推奨値はリポジトリによって異なります。既存のインデックスセグメントファイルを分析して(例えば、Luke を使用して)、インデックスセグメント内のドキュメント数を確認します。

インデックスサイズの削減

完了したワークフローインスタンス、監査ログなど、不要なノードを削除して、ノード数を減らします。役立つ記事は以下のとおりです。

  • https://helpx.adobe.com/jp/cq/kb/howtopurgewf.html
  • https://helpx.adobe.com/jp/cq/kb/how-to-optimize-lucene-index-to-gain-efficiency.html
  • https://helpx.adobe.com/jp/communique/kb/Stopwordlist.html

また、ノードが削除されたとき、インデックスがディスク領域をすぐに解放しないため、ワークスペースのインデックスを再構成するとき、インデックスサイズが小さくなる場合があります。これは、ノードが含まれている、影響を受けたインデックスのセグメントが結合されるときにのみ実行されます。

本作品は Creative Commons Attribution-Noncommercial-Share Alike 3.0 Unported License によってライセンス許可を受けています。  Twitter™ および Facebook の投稿には、Creative Commons の規約内容は適用されません。

法律上の注意   |   プライバシーポリシー