ストップワードを追加して検索を最適化する

問題点

検索インデックスを最適化するためにストップワードリストを実装したいとします。この場合、index/content へのフルテキスト Lucene ハンドラの使用が想定されています。標準検索インデックスを使用している場合は、それに応じて適切な設定ファイルを使用します。

解決策

  1. CQDE を介してインスタンスに接続する
  2. ページ、/config/repository/search/fulltexthandler.xml を開きます。デフォルトでは、次のようになります:
    <?xml version="1.0" encoding="ISO-8859-1"?> <!DOCTYPE searchhandler SYSTEM "cq:/system/resources/dtd/contentbus/search/fulltexthandler.dtd"> <searchhandler> <index location="search/fulltext" maxFieldLength="10000" resultCacheSize="50" useCompoundFile="true" /> </searchhandler>
  3. このファイルに次のようなストップワードを追加します:
    <?xml version="1.0" encoding="ISO-8859-1"?> <!DOCTYPE searchhandler SYSTEM "cq:/system/resources/dtd/contentbus/search/fulltexthandler.dtd"> <searchhandler> <index location="search/fulltext" maxFieldLength="10000" resultCacheSize="50" useCompoundFile="true" /> <stop-list> <stop-word>and</stop-word> <stop-word>or</stop-word> </stop-list> </searchhandler>
  4. ストップワードのリストとして添付された zip ファイルを使用したり、独自のリストを生成したり、インターネットから別のストップワードリストを検索したりできます。
  5. /config/repository/search/fulltexthandler.xml に保存します。
  6. インスタンスを停止します。
  7. cq_home/data/your_instance/search/fulltext フォルダーを削除します。
  8. インスタンスを開始します。

ダウンロード

注意:

Lucene はコンテンツを再インデックスするので、再起動にはコンテンツサイズに応じて時間がかかることがあります。

 Adobe

ヘルプをすばやく簡単に入手

新規ユーザーの場合

Adobe MAX 2024

Adobe MAX
クリエイティブカンファレンス

10 月 14 日~ 16 日 マイアミビーチおよびオンライン

Adobe MAX

クリエイティブカンファレンス

10 月 14 日~ 16 日 マイアミビーチおよびオンライン

Adobe MAX 2024

Adobe MAX
クリエイティブカンファレンス

10 月 14 日~ 16 日 マイアミビーチおよびオンライン

Adobe MAX

クリエイティブカンファレンス

10 月 14 日~ 16 日 マイアミビーチおよびオンライン