Wyszukiwanie tekstu w usłudze Adobe Acrobat Sign

Omówienie

Aplikacja Acrobat Sign umożliwia złożone wyszukiwanie zawartości w umowach użytkownika. Pasek wyszukiwania, znajdujący się na stronie Zarządzaj, zwraca wszystkie transakcje pasujące do ciągu podanego dla wybranego źródła zawartości.

  • Jeśli patrzysz na „swoje umowy”, wyszukujesz w swojej zawartości. Jeśli patrzysz na współdzielone konto, wyszukujesz w zawartości kont współdzielonych.

Zawartość poniższych pól indeksuje się podczas tworzenia/aktualizowania transakcji:

  • Tytuł — tytuł umowy.
  • Uwaga — prywatna notatka uczestnika do umowy; nie jest ona widoczna dla nikogo innego.
  • Wiadomość — lista wiadomości widocznych dla tego uczestnika (w tym wiadomości publiczne i prywatne).
  • Oryginalna nazwa pliku — oryginalna nazwa przesłanego pliku powiązanego z umową.
  • Adres e-mail — adres e-mail odbiorcy (w tym DW) lub nadawcy.
  • Imię i nazwisko — imię i nazwisko odbiorcy (w tym DW) lub nadawcy.
  • Stanowisko — nazwa stanowiska odbiorcy (w tym DW) lub nadawcy.
  • Nazwa firmy — nazwa firmy lub organizacji odbiorcy (w tym DW) lub nadawcy.
  • Nazwa grupy odbiorców — nazwa grupy umowy ad hoc, do której mogą należeć odbiorcy.
  • Treść pola tekstowego — treść pola tekstowego w formularzu wypełniana przez użytkownika.
  • Imię i nazwisko udostępniającego — imię i nazwisko osoby udostępniającej umowę. W przypadku braku udostępniania jest to nazwa użytkownika.
  • Nazwa grupy odbiorców udostępniającego — nazwa grupy odbiorców osoby udostępniającej umowę. W przypadku braku udostępniania jest to nazwa grupy odbiorców użytkownika.
  • Identyfikator zewnętrzny — identyfikator nadawcy powiązany z umową, który może mieć dowolną postać, ale najczęściej wygląda następująco: „<groupID>:<ID>”. Identyfikator zewnętrzny jest przekazywany w wywołaniu interfejsu API tworzenia umowy.
  • Identyfikator grupy zewnętrznej — grupowy identyfikator nadawcy powiązany z umową, który może mieć dowolną postać, ale najczęściej jest używany jako prefiks identyfikatora zewnętrznego. Identyfikator grupy zewnętrznej jest przekazywany w wywołaniu interfejsu API tworzenia umowy. W przypadku ustawienia parametru identyfikatora grupy zewnętrznej należy ustawić identyfikator zewnętrzny.
  • Identyfikator transakcji — identyfikator przypisany do umowy przez program Acrobat Sign po jej utworzeniu.

Jak działa wyszukiwanie tekstu

Jeśli szukasz ciągu: „Zwykła ryba morska”:

  • Wyszukiwanie Acrobat Sign dzieli ciąg na tokeny, używając spacji jako separatorów. Powyższy przykład ciągu rozbitego na trzy tokeny: Zwykłaryba, i morska.
    • Znaki w kwerendzie ciągu należą do jednego z trzech typów: litera, cyfra lub separator.
    • Znaki traktowane jako separatory (inne niż spacja): ~ ` ! @ # $ % ^ & * ( ) - + = { } [ ] | \ . , : ; " ' < > ? /
      • Kropki, znaki podkreślenia i apostrofy pozostają częścią tokena, jeśli znaki przed i po tym symbolu są tego samego typu.
      • Cudzysłowy otaczające cały ciąg kwerendy nie są separatorami i określają dosłowną wartość ciągu (frazę).
      • Cudzysłowy wewnątrz ciągu kwerendy  separatorami i nie określają dosłownej wartości ciągu.
  • Rozróżnianie wielkich i małych liter zostaje usunięte. np., zwykła, ryba,  morska
  • Następnie funkcja wyszukiwania próbuje dopasować pełny tekst każdego tokenu do wartości indeksowanej.
    • Bardziej złożone tokenowanie stosuje się w przypadku nazwy umowy (patrz poniżej).
  • Użyto wyszukiwania zbiorczego, co oznacza, że każda umowa, która pasuje do co najmniej jednego tokena z co najmniej jednego wyszukiwalnego pola, jest uwzględniona w zwróconym zestawie danych.
    • Zwrócony zestaw danych jest sortowany według istotności z najbardziej istotnym wynikiem wyszukiwania na górze.

POLE TYTUŁ UMOWY

Jak wspomniano powyżej, w przypadku pola Tytuł umowy stosuje się bardziej zaawansowane tokenowanie ze względu na dodatkowy „dostosowany” tokenizer, który głównie tokenuje separatory kontekstu (przeciwnie do znaków specjalnych). Ten niestandardowy tokenizer różni się od standardowego w następujący sposób:

  • Generuje tokeny prefiksu (do dziesięciu znaków) — token prefiksu to ciąg przyrostu dowolnego standardowego tokenu. Na przykład, jeżeli tokenem standardowym jest ryba, to tokeny przyrostu to: r, ry, ryb i ryba
    • Umożliwia to wyszukiwanie częściowych ciągów znaków od pierwszego znaku tokenu
    • Dopasowania wewnątrz ciągu są ignorowane. Na przykład, wyszukiwanie oba nie będzie zgodne ze słowem zobaczyć
  • Dzielenie tokenów na znaki inne niż alfanumeryczne. Na przykład, ciąg: Super_Duper daje tokeny: Super Duper
    • Znaki podkreślenia nie są separatorami w standardowym tokenizerze
  • Dzielenie tokenów przy zmianie wielkości liter. Na przykład, ciąg: PowerShot daje tokeny: Power i Shot
  • Dzielenie tokenów przy przejściu z liter do cyfr. Na przykład, ciąg XL500 daje tokeny XL 500
  • Usuwa z każdego tokenu separatory wiodące lub końcowe. Na przykład, ciąg: XL---42+'Autocoder’ daje tokeny: XL42Autocoder
  • Usuwa angielskie zaimki dzierżawcze z końca każdego tokenu. Na przykład, ciąg: Dave's daje token: Dave

Należy pamiętać, że kombinacja standardowych i niestandardowych tokenizerów umożliwia wyszukiwanie pełnego ciągu tokenu (dzięki standardowemu tokenizerowi) i tokenów prefiksu (dzięki niestandardowemu tokenizerowi). Nie pozwala jednak na dopasowanie tokenu prefiksu, który jest separatorem.

Przykład: Jeśli umowa ma nazwę My_NDA

  • Standardowy tokenizer wyprodukuje token, który będzie wyglądał następująco my_nda
  • Niestandardowy tokenizer wyprodukowałby szereg tokenów: mmynndnda, my_, my_n, my_nd, my_nda

Przykład 2: Jeśli umowa ma nazwę XL500

  • Standardowy tokenizer wygeneruje token, który będzie wyglądał następująco xl500
  • Niestandardowy tokenizer wygeneruje szereg tokenów: xl500, x, xl, 5, 50, 500, xl5, xl50

Wyszukiwanie ze specjalną składnią kwerendy

Zgodnie z opisem w sekcji powyżej funkcja wyszukiwania umowy wyszukuje przybliżone dopasowania wszystkich wyszukiwalnych pól umowy. Wyszukiwalna zawartość pola jest tokenizowana, a następnie tokeny te są dopasowywane do ciągu kwerendy w czasie wykonywania zapytania. Funkcja wyszukiwania umów przeprowadza również dopasowania prefiksów do dziesięciu znaków dla tych tokenów. Jeżeli w umowie zostanie znalezione co najmniej jedno dopasowanie tokena, umowa ta zostanie wyświetlona w wynikach wyszukiwania.  Rezultaty wyszukiwania są sortowane według istotności z najbardziej istotnym wynikiem wyszukiwania na górze.

Jednak dopasowywanie całej wartości pola, dopasowywanie frazy z wartości pola, wyszukiwanie umów, które nie zawierają określonego tokena, wyszukiwanie umów, które zawierają kilka tokenów jednocześnie (nie frazę), można uzyskać tylko za pomocą specjalnej składni. Język Sign Generic Query Language (SGQL) został opracowany w celu zaspokojenia potrzeb klientów w zakresie tych funkcji, które wymagają specjalnej składni.

ZASTRZEŻONE ZNAKI I SŁOWA

SGQL ma siedem zarezerwowanych znaków:

*

(

)

\

"

'

:

Te zarezerwowane znaki są używane w charakterze operatorów i określają cechy językowe w zapytaniu wyszukiwawczym. Jeśli zastrzeżony znak zostanie użyty niepoprawnie, zwracany jest błąd składni.  

Aby używać znaków zarezerwowanych jako zwykłych znaków w wyszukiwaniu, należy je wymazać. Na przykład, zapytanie

\( \"bea\:u\*ful\"\\ \)

zawiera wszystkie znaki zastrzeżone, które są traktowane jako zwykłe znaki.

SGQL posiada również trzy słowa zarezerwowane dla operatorów:

AND

OR

NOT

Operatory muszą być zapisane wielką literą. Aby użyć operatorów jako zwykłych tokenów w zapytaniu, należy je ująć w podwójne cudzysłowy. Na przykład:

foo „AND” bar

DOPASOWANIE FRAZ

Zwykła kwerenda o przybliżonym dopasowaniu będzie zgodna, jeśli DOWOLNY z tokenów pojawi się w polu (ale niekoniecznie wszystkie). Kolejność tokenów nie ma znaczenia, ponieważ tokeny nie muszą pojawiać się razem.

Kwerendy dopasowania frazy należy używać, kiedy potrzebne jest dokładne wyszukiwanie frazy bez rozróżniania wielkości liter w jednym lub kilku wyszukiwanych polach. Pozwala to na dopasowanie tam, gdzie kilka tokenów pojawia się w tym samym polu i tokeny te są wyświetlane po kolei w kolejności określonej w cudzysłowach.

Format składni kwerendy o dopasowanie frazy:

"<phrase_match_query>"

  lub 

'<phrase_match_query>'

Jeśli składnia kwerendy nie jest zgodna z regułami dla składni kwerendy dopasowania frazy, wyszukiwanie obejmuje kwerendę o przybliżonym dopasowaniu we wszystkich wyszukiwalnych polach.

Na przykład: query

"Grupa studyjna"

będzie zgodna z umowami zawierającymi frazę „grupa studyjna” w dowolnym polu z możliwością wyszukiwania. Zwróć uwagę, że fraza „grupa - studyjna” nie będzie dopasowana dla tej kwerendy, ponieważ nie jest to dokładna fraza bez rozróżniania wielkości liter w porównaniu z „Grupa studyjna”.

Dopasowanie fraz może wystąpić w dowolnym miejscu kwerendy wyszukiwania. Na przykład

title: (matematyka AND "materiały kursu" AND "grupa studyjna")

będzie dopasowaniem do tytułu „Materiały kursu dla MATEMATYKI 101 Grupa studyjna”, ponieważ tytuł ten zawiera słowo kluczowe „MATEMATYKA” oraz frazy „Materiały kursu” i „Grupa studyjna”.

PREFIKS NAZWY POLA

Kwerenda prefiksu nazwy pola powinna być używana w przypadku wyszukiwania tylko jednego, konkretnego pola w ramach umów użytkownika.

Kwerenda prefiksu nazwy pola musi zawierać prefiks nazwy pola, po którym następuje kwerenda wyszukiwania. Format składni kwerendy prefiksu nazwy pola:

<field_name>:<query>

Prefiks nazwy pola może występować przed tokenem lub przed nawiasem części kwerendy. Na przykład, w zapytaniu

title:(Witaj AND „Piękny świat” AND „Mój świat”)

wszystkie tokeny są dopasowywane do pola tytułu umowy.

W poniższym zapytaniu

title: Witaj AND „Piękny świat” AND „Mój świat” 

tylko słowo „Witaj” ma prefiks nazwy pola, a słowo to jest dopasowywane tylko do pola tytułu umowy. Pozostałe słowa i frazy są dopasowywane do wszystkich wyszukiwanych pól.

Jeśli nie określono pola <field_name>, kwerenda obejmuje wszystkie pola obsługujące dopasowania frazy. W przeciwnym razie kwerenda obejmie tylko pola <field_name>. 

Jeśli składnia kwerendy nie jest zgodna z regułami składni kwerendy prefiksu nazwy pola, funkcja wyszukiwania umowy wykorzystuje pełną kwerendę i przeszukuje wszystkie wyszukiwalne pola. 

Na przykład kwerenda o prefiks nazwy pola:

title: ( Witaj świecie )

przeprowadza wyszukiwanie tylko w polu zawierającym tytuł umowy.

Poniżej znajduje się lista prefiksów obsługiwanych przez kwerendy o nazwy pola. Prefiksy nazwy pola nie uwzględniają wielkości liter. 

TREŚĆ POLA

 PREFIKS NAZWY POLA KWERENDY CIĄGU

OPIS TREŚCI POLA

Tytuł

title*

Tytuł umowy.

Uwaga

note

Prywatna notatka uczestnika do umowy; nie jest ona widoczna dla nikogo innego.

Wiadomość

message

Lista wiadomości widocznych dla tego uczestnika (w tym wiadomości publiczne i prywatne).

Oryginalna nazwa pliku

originalFileName

Oryginalna nazwa przesłanego pliku powiązanego z umową.

E-mail

email**

Adres e-mail odbiorcy (w tym DW) lub nadawcy.

Imię i nazwisko

fullName***

Imię i nazwisko odbiorcy (w tym DW) lub nadawcy.

Nazwa stanowiska

jobTitle

Nazwa stanowiska odbiorcy (w tym DW) lub nadawcy.

Nazwa firmy

companyName

Nazwa firmy lub organizacji odbiorcy (łącznie z DW) lub nadawcy.

Nazwa grupy odbiorców

recipientGroupName

Nazwa grupy umowy ad hoc, do której mogą należeć odbiorcy.

Treść pola tekstowego

textFieldContent

Treść pola tekstowego w formularzu wypełniana przez użytkownika.

Imię i nazwisko udostępniającego sharerFullName Imię i nazwisko osoby udostępniającej umowę. W przypadku braku udostępniania jest to nazwa użytkownika.
Nazwa grupy odbiorców udostępniającego sharerRecipientGroupName Nazwa grupy odbiorców osoby udostępniającej umowę. W przypadku braku udostępniania jest to nazwa grupy odbiorców użytkownika.
Identyfikator zewnętrzny

externalId

Identyfikator nadawcy powiązany z umową, który może mieć dowolną postać, ale najczęściej wygląda następująco: „<groupID>:<ID>”. Identyfikator zewnętrzny jest przekazywany w wywołaniu interfejsu API tworzenia umowy.

Identyfikator grupy zewnętrznej

externalGroupId

Grupowy identyfikator nadawcy powiązany z umową, który może mieć dowolną postać, ale najczęściej jest używany jako prefiks identyfikatora zewnętrznego. Identyfikator grupy zewnętrznej jest przekazywany w wywołaniu interfejsu API tworzenia umowy. W przypadku ustawienia parametru identyfikatora grupy zewnętrznej należy ustawić identyfikator zewnętrzny.

Identyfikator transakcji agreementId Identyfikator przypisany do umowy przez usługę Acrobat Sign podczas tworzenia umowy.

W celu zapewnienia zgodności ze starszymi wersjami niektóre prefiksy nazw pól mają aliasy, których funkcjonalność jest równoważna oryginalnym prefiksom nazw pól. Te aliasy zostały wycofane i zostaną ostatecznie usunięte:

  * Zamiast nazwy „title” można użyć prefiksu nazwy pola „name”.

 ** Zamiast prefiksu „email” można użyć prefiksu nazwy pola „participantEmail”.  

*** Zamiast prefiksu „fullName” można użyć prefiksu nazwy pola „participantName”.

SYMBOLE WIELOZNACZNE

Symbol wieloznaczny ( gwiazdka * ) może być użyty do dopasowania prefiksu, po którym następuje nieograniczona liczba znaków w tokenie. Rozszerzanie symbolu wieloznacznego jest kosztowną operacją wykonywaną w czasie rzeczywistym, dlatego aby móc korzystać z tej funkcji, należy przestrzegać następujących zasad składni:

  • Wiodące symbole wieloznaczne nie są dozwolone.
  • Symbole wieloznaczne w środku tokena nie są dozwolone.
  • Przedrostek nazwy pola jest wymagany dla tokena, który posiada operator rozszerzenia wieloznacznego.
  • Operator wieloznaczny nie może być użyty więcej niż raz w zapytaniu.
  • Kwerendy zawierające rozwinięcie wieloznaczne zwracają błąd przekroczenia limitu czasu, jeśli czas wykonania przekracza pięć sekund.

Na przykład: query

title:myh*

dopasowuje tokeny pola tytułowego

myhost

Rozszerzanie symboli wieloznacznych to kosztowna operacja. Jeśli jest używana nierozsądnie, zużywa dużo zasobów systemowych i użytkownik może długo czekać na wyniki wyszukiwania. Aby uniknąć tych problemów, SGQL posiada ograniczenia w stosowaniu symboli wieloznacznych, które eliminują najbardziej kosztowne i zasobochłonne przypadki użycia. Im bardziej szczegółowe są tokeny, tym skuteczniejsze jest wyszukiwanie. Wyszukiwanie konkretnego słowa lub frazy jest zawsze bardziej efektywne niż wyszukiwanie z użyciem symboli wieloznacznych.

WYRAŻENIA LOGICZNE

SGQL obsługuje operatory logiczne: AND, OR i NOT, a także grupowanie tych operatorów za pomocą nawiasów. Operatory muszą być zapisane wielką literą.

Operator OR jest zawsze implikowany między tokenami. Na przykład

foo bar

jest taki sam jak

foo OR bar

Jeśli nie chcesz dołączać operatora OR ze względu na przejrzystość, nie musisz go podawać.

Operator NOT dotyczy tylko tokenów występujących bezpośrednio po NOT. Aby zastosować operator NOT do wielu tokenów, należy ująć te tokeny w nawiasy.

W poniższej tabeli opisano kolejność obliczania wyrażeń logicznych.

Kolejność

Polecenie wyszukiwania

1 Wyrażenia w nawiasach
2 Klauzule NOT
3 Klauzule OR
4 Klauzule AND

W poniższej tabeli znajdują się przykłady semantycznie równoważnych zapytań, które wyjaśniają pierwszeństwo operatorów w przypadku, gdy nie są podane operatory grupujące (nawiasy).

Kwerenda wyszukiwania Równoważne przeformułowane zapytanie wyszukiwawcze Komentarze
foo AND bar baz foo AND ( bar OR baz ) Operator OR jest niejawny i nie powinien być używany, chyba że chcemy go dodać ze względu na przejrzystość. 
foo NOT bar baz foo OR ( NOT bar ) OR baz Operator NOT jest stosowany do następującego tokena lub części zapytania ujętej w nawias.
foo NOT bar baz AND xyz ( foo OR ( NOT bar ) OR baz ) AND xyz
title:(Witaj AND „Piękny świat” „Mój świat”) title: Witaj AND (title: „Piękny świat” OR „Mój świat”) Prefiks nazwy pola jest stosowany do następującego tokena lub części zapytania ujętej w nawias.
title: Witaj AND note:„Piękny świat” „Mój świat” title: Witaj AND (note: „Piękny świat” OR „Mój świat”)  Fraza „Mój świat” zostanie dopasowana do wszystkich pól wyszukiwania.  

Pomoc dostępna szybciej i łatwiej

Nowy użytkownik?