'<phrase_match_query>'
概要
Adobe Acrobat Sign を使用すると、複雑な検索をおこなって、ユーザーの契約書内のコンテンツを検索できます。「管理」ページにある検索バーは、選択したコンテンツソースに対して指定された文字列と一致するすべてのトランザクションを返します。
- 「自分の契約書」が表示されている場合は、自分のコンテンツが検索対象になります。共有アカウントが表示されている場合は、共有アカウントのコンテンツが検索対象になります。
以下のフィールドのコンテンツでは、トランザクションの作成/更新時にインデックスが作成されます。
- タイトル - 契約書のタイトル。
- メモ - 参加者が取った、他の人には見えない私的な契約書のメモ。
- メッセージ - この参加者に表示されるメッセージのリスト(パブリックメッセージとプライベートメッセージの両方を含む)。
- 元のファイル名 - 契約書に関連付けられたアップロード済みファイルの元の名前。
- 電子メール - 受信者(CC を含む)または送信者の電子メールアドレス。
- 氏名 - 受信者(CC を含む)または送信者の氏名。
- 役職名 - 受信者(CC を含む)または社内の送信者の役職名。
- 会社名 - 受信者(CC を含む)または送信者の会社名または組織名。
- 受信者グループ名 - 受信者が所属できる臨時の契約書グループ名。
- テキストフィールドコンテンツ - フォーム内のユーザーが入力するテキストフィールドのコンテンツ。
- 共有者の氏名 - 契約書の共有者の氏名。非共有の場合、これはユーザーの名前です。
- 共有者の受信者グループ名 - 契約書の共有者の受信者グループ名。非共有の場合、これはユーザーの受信者グループの名前です。
- 外部 ID - 送信者が契約書に割り当てた ID。任意の形式を使用できますが、通常は「<groupID>:<ID>」の形式です。 外部 ID は、契約書作成 API への呼び出しで渡されます。
- 外部グループ ID - 送信者が契約書に割り当てたグループ ID。任意の形式を使用できます。通常、外部 ID のプレフィックスとして使用されます。 外部グループ ID は、契約書作成 API への呼び出しで渡されます。外部グループ ID パラメーターを設定する場合は、外部 ID を設定する必要があります。
テキスト検索の仕組み
文字列「A simple fish」を検索する場合
- Acrobat Sign では、スペースを区切り文字として使用して文字列を「トークン化」します。上の文字列は、A、simple、fish の 3 つのトークンに分割されます。
- 文字列クエリの文字は、文字、数字、区切り文字の 3 種類のいずれかに属します。
- 区切り文字として扱われる文字(ホワイトスペース以外)は、 ~ ` ! @ # $ % ^ & * ( ) - + = { } [ ] | \ . , : ; " ' < > ? / です。
- ピリオド、アンダースコア、アポストロフィは、そのシンボルの前後の文字が同じタイプの場合、トークンの一部として残ります。
- クエリ文字列全体を囲む引用符は区切り文字ではなく、リテラル文字列値(語句)を指定します。
- クエリ文字列内の引用符は区切り記号であり、リテラル文字列値は指定しません。
- 大文字小文字の区別はなくなります。文字列「
- 検索では、各トークンのフルテキストをインデックス値と一致させようとします。
- 「契約書タイトル」のトークン化がより複雑になります(下記参照)。
- 「包括的」検索が使用され、この検索では、1 つ以上の検索フィールドで 1 つ以上のトークンに一致するすべての契約書が返されるデータセットに含まれます。
- 返されたデータセットは、関連性スコアによってソートされ、最も関連性の高い検索結果が先頭に表示されます。
「契約書タイトル」フィールド:
前述したように、主にコンテキスト区切り文字(明示的な文字ではなく)でトークン化するカスタマイズされたトークナイザーが追加されたため、「契約書タイトル」フィールドでは高度なトークン化が行われます。このカスタムトークナイザーは、次の点で標準とは異なります。
- プレフィックストークン(最大 10 文字)が生成されます。プレフィックストークンは、任意の標準トークンの増分文字列です。例:標準トークンが fish の場合、増分トークンは f、fi、fis、および fish です。
- これにより、トークンの最初の文字から始まる部分的な文字列を検索できます。
- 文字列の中間の一致は無視されます。例:rent の検索は apparently とは一致しません。
- 英数字以外の文字でトークンを分割します。例:文字列 Super_Duper はトークン Super と Duper を生成します。
- 標準トークナイザーでは、アンダースコアは区切り文字ではありません。
- トークンを大文字と小文字の変化で分割します。例:文字列 PowerShot は、トークン Power と Shot を生成します。
- トークンを文字と数字の変化で分割します。例:文字列 XL500 は、トークン XL と 500 を生成します。
- 各トークンから先頭または末尾の区切り文字を削除します。例:文字列 XL---42+'Autocoder' は、トークン XL、42、Autocoder を生成します。
- 各トークンの末尾から英語の所有('s)を削除します。例:文字列 Dave's は、トークン Dave を生成します。
標準トークナイザーとカスタムトークナイザーの組み合わせにより、完全トークン文字列(標準トークナイザーによる)とプレフィックストークン(カスタムトークナイザーによる)を検索できますが、区切り文字をまたいだプレフィックストークンとは一致しません。
例 1:My_NDA という名前の契約書がある場合
- 標準のトークナイザーは、my_nda のようなトークンを生成します。
- カスタムトークナイザーは、m、my、n、nd、nda という一連のプレフィックストークンを生成します。
- my_nd を検索しようとしても、結果は返されません。理由は次のいずれかです。
- 標準のトークナイザーではプレフィックストークンは作成されず完全な文字列のみが作成される
- カスタムトークナイザーはアンダースコアを区切るため、プレフィックストークンには含まれない
例 2:XL500 という名前の契約書がある場合
- 標準のトークナイザーは、xl500 のようなトークンを生成します。
- カスタムトークナイザーは、x、xl、5、50、500 の一連のプレフィックストークンを生成します。
- xl5 を検索しようとしても、結果は返されません。理由は次のいずれかです。
- 標準のトークナイザーではプレフィックストークンは作成されず完全な文字列のみが作成される
- カスタムトークンイザは文字と数字の変化を区切るため、文字から数字にかかるプレフィックストークンは作成できない
特殊なクエリ構文で検索している
上記のセクションで説明したように、契約書の検索では、契約書の検索可能なすべてのフィールドの近似一致が実行されます。検索可能なフィールドコンテンツはトークン化され、そのトークンはクエリ時にクエリ文字列と照合されます。契約書の検索ではまた、これらのトークンに対して最大 10 文字のプレフィックス一致が実行されます。ただし、フィールド値全体の一致とフィールド値からの語句の一致は、特殊な構文を使用した場合にのみ可能です。
語句一致クエリ:
検索可能なすべてのフィールドの語句検索が必要な場合は、語句一致クエリを使用する必要があります。
- 「通常の近似一致」クエリは、いずれかのトークンがフィールドに表示された場合(必ずしもすべてではない)、トークンが一緒に表示される必要がないため、トークンの順序は重要ではなくなります。
- 「語句一致」では、複数のトークンが同じフィールドに表示される場所を一致させることができるため、これらのトークンは引用符で囲まれ、指定された順序で表示されます。
語句一致クエリの構文形式:
|
または
"<phrase_match_query>" |
<field_name>:<query> |
または
<field_name>:"<phrase_match_query>" |
または
<field_name>:'<phrase_match_query>' |
<field_name> を指定しない場合、語句一致でサポートされているすべてのフィールドが照会されます。指定した場合は、<field_name> フィールドのみが照会されます。
クエリ構文がフィールド名のプレフィックスクエリ構文の規則に従わない場合、契約書の検索では、検索クエリとしてクエリ全体を使用して(構文に応じて、近似一致または語句一致を使用)、検索可能なすべてのフィールド内で検索が実行されます。
語句一致クエリの例:
タイトル:「Hello World」
では、契約書のタイトルを含むフィールドに対してのみ、検索を実行する必要があります。
フィールド名のプレフィックスクエリでサポートされるプレフィックスのリストを次に示します。
フィールド名のプレフィックスでは、大文字と小文字が区別されます。
下位互換性を確保するため、一部のフィールド名プレフィックスには、元のフィールド名プレフィックスと同じ機能を持つエイリアスがあります。これらのエイリアスは廃止され、最終的に削除されます。 * フィールド名プレフィックス「name」は「title」の代わりに使用できます。 ** フィールド名プレフィックス「participantEmail」は「email」の代わりに使用できます。 *** フィールド名プレフィックス「participantName」は「fullName」の代わりに使用できます。 |
返されたデータをフィルタリングしている
コンテンツを検索すると、膨大な数のレコードが返される可能性があります。
データセットを管理しやすいレコード一覧に絞り込むことができる 4 つのフィルター(個別に使用することも、組み合わせて使用することもできます)が使用できます。
更新日でのフィルタリング
「更新日」の値では、ユーザーアクションによって契約書が更新された際の、最近の日時スタンプでフィルタリングされます。「更新日」は、契約書が最終状態(完了/キャンセル済み/期限切れ)に達すると、固定値になります。
「更新日」フィルターアイコンを選択すると、日付範囲を選択してデータセットをさらに絞り込むためのオプションが開きます。
- すべての日付
- 過去 24 時間
- 過去 7 日間
- 過去 30 日間
- 過去 12 ヶ月間
- カスタム日付範囲
フィールド値でのフィルタリング
(「フィルター」ボタンの右側にある)「検索」入力ボックスを使用して、フィルターを、高度に特定されたデータまたは一意のデータを保持している可能性がある個々のフィールドに適用できます。
検索可能なフィールドオプションは、次のとおりです。
- すべてのフィールド - デフォルト値。このオプションを選択すると、すべてのフィールドオプションから「検索」フィールド内の正確な文字列が検索され、最大サイズのレコードセットが返されます。
- タイトル - 返すデータセットを、検索文字列がオブジェクトのタイトル(契約書名など)に見つかったレコードに制限します。
- メモ - データセットを、検索を実行したユーザーの個人的なメモに検索文字列が含まれているレコードに制限します。
- メッセージ - データセットを、検索文字列が契約書の「メッセージ」フィールドまたは「プライベートメッセージ」に含まれているレコードに制限します。
- 元のファイル名 - アップロードされた元の文書のファイル名を評価し、一致するレコードのみを返します。
- 電子メール - 受信者の電子メールアドレスと一致させます。
- このフィルターでは、電子メールアドレスの検証で定義された「テキスト」フィールドはトラップされません。
- 氏名 - 受信者が署名を適用するときに指定した「名前」値と一致させます。名前が 1 つしか指定されていない場合は、その 1 つの値に一致するすべてのレコードが返されます。
- 名前値は、受信者が入力したものに依存し、以前の署名値やプロファイル名とは一致しない場合があります(受信者が Acrobat Sign ユーザーアカウントを持っている場合)。
- 役職名 - 「タイトル」フィールドに配置されている値と一致させます。
- 会社名 - 「会社」フィールドに配置されている値と一致させます。
- 受信者グループ名 - (送信者が入力した)受信者グループ名と一致させます。
- テキストフィールドコンテンツ - あらゆる「テキスト」入力フィールドの正確な値と一致させます。これには、より大きなテキストブロックで見つかったデフォルト値と個々の単語が含まれます。
グループでのフィルタリング
「複数のグループユーザー」が有効になっているアカウントでは、データセットをそのグループから送信された契約書のみに制限する「グループ」フィルターを使用できます。
フィルターを選択すると、フィルターアイコンの横にタグが表示されます。 いずれかのフィルターを削除するには、データセットが返された後にそのフィルターをクリックします。
<field_name> を指定しない場合、語句一致でサポートされているすべてのフィールドが照会されます。指定した場合は、<field_name> フィールドのみが照会されます。
クエリ構文がフィールド名のプレフィックスクエリ構文の規則に従わない場合、契約書の検索では、検索クエリとしてクエリ全体を使用して(構文に応じて、近似一致または語句一致を使用)、検索可能なすべてのフィールド内で検索が実行されます。
語句一致クエリの例:
title: "Hello World"
では、契約書のタイトルを含むフィールドに対してのみ、検索を実行する必要があります。
フィールド名のプレフィックスクエリでサポートされるプレフィックスのリストを次に示します。
フィールド名のプレフィックスでは、大文字と小文字が区別されます。