JP2017102963A - 文書コーパスの検索及び検索クエリの生成を可能にするためのシステム及び方法 - Google Patents

文書コーパスの検索及び検索クエリの生成を可能にするためのシステム及び方法 Download PDF

Info

Publication number
JP2017102963A
JP2017102963A JP2017019720A JP2017019720A JP2017102963A JP 2017102963 A JP2017102963 A JP 2017102963A JP 2017019720 A JP2017019720 A JP 2017019720A JP 2017019720 A JP2017019720 A JP 2017019720A JP 2017102963 A JP2017102963 A JP 2017102963A
Authority
JP
Japan
Prior art keywords
query
search
terms
semantic
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017019720A
Other languages
English (en)
Other versions
JP6513723B2 (ja
Inventor
フィリップ エル ウィットマー
L Wittmer Philip
フィリップ エル ウィットマー
ピーター ジェー ファンデルヘイデン
J Vanderheyden Peter
ピーター ジェー ファンデルヘイデン
スチュアート エー マクリーン
A Mclean Stuart
スチュアート エー マクリーン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LexisNexis Inc
Original Assignee
LexisNexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LexisNexis Inc filed Critical LexisNexis Inc
Publication of JP2017102963A publication Critical patent/JP2017102963A/ja
Application granted granted Critical
Publication of JP6513723B2 publication Critical patent/JP6513723B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • G06F16/3323Query formulation using system suggestions using document space presentation or visualization, e.g. category, hierarchy or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3341Query execution using boolean model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9038Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書コーパスの検索及び検索クエリの生成のためのシステム及び方法を開示する。
【解決手段】方法は、2又はそれ以上の区画を有するグラフィカルユーザインターフェイスを表示するステップと、グラフィカルユーザインターフェイス内に入力されたクエリ語の位置に基づいて最初の検索クエリを生成するステップとを含む。グラフィカルユーザインターフェイスの区画は、クエリ状態を示す。クエリ語の1つ又はそれ以上の操作後には、グラフィカルユーザインターフェイス内のクエリ語の位置に基づく修正された検索クエリが生成される。選択したクエリ語をグラフィカルユーザインターフェイスの第1の区画から第2の区画に移動することにより、選択したクエリ語のクエリ状態が第1のクエリ状態から第2のクエリ状態に変化する。修正された検索クエリを使用してデータベースの検索を行い、更新された電子文書の組を戻して表示する。
【選択図】図6

Description

本明細書は、全般的に、検索クエリを使用して文書コーパスを検索することに関し、より詳細には、グラフィカルユーザインターフェイスを使用した文書コーパスの検索及び検索クエリの作成のためのシステム及び方法に関する。
現在、法律文書、特許文献、医学雑誌などを含むような文書コーパスは、クエリ式を使用して検索される。これらのクエリ式は、(「and」、「or」、「and not」などの)ブール演算子、及び(同じ文章内の単語を表すW/S、規定数の単語内に存在する単語を表すW/#などの)関係演算子などの演算子を含む。ユーザは、クエリ式をタイプした後に、このクエリ式を使用して文書コーパスの検索を開始することができる。場合によっては、例えば、ユーザがうっかりして括弧を入れ忘れたりした場合、ユーザエラーによってクエリ式が無効になることがある。また、場合によっては、クエリ式にユーザの意図が表されず、ユーザが意図するもの以外の文書が検索されることもある。
一般に、クエリ式は、ユーザが検索している物によって非常に長く複雑になる場合がある。信頼できるクエリ式の作成には、多くの時間のみならず、平均的なユーザが持ち合わせていない高レベルの専門知識が必要とされることがある。上述した問題点により、多くのユーザは、自身の文書コーパス検索を信頼できずに、生成された検索結果の信頼性が低いと信じ込み、或いは生成された検索結果の信頼性が低く、ユーザがこのような信頼性の低い結果を信頼することにより、不十分な又は情報が足りない判断を行ってしまう恐れがある。
従って、文書コーパスの検索及び検索クエリの生成のための代替方法が必要性とされている。
1つの実施形態では、文書コーパスの検索を可能にする方法が、2又はそれ以上の区画を有するグラフィカルユーザインターフェイスを表示するステップと、グラフィカルユーザインターフェイス内に入力されたクエリ語の位置に少なくとも部分的に基づいて最初の検索クエリを生成するステップとを含む。グラフィカルユーザインターフェイスの各区画はクエリ状態を示し、最初の検索クエリは、データベースを検索して戻された電子文書の組を戻して表示するために使用される。この方法は、グラフィカルユーザインターフェイス内のクエリ語の1又はそれ以上の操作に応答して、クエリ語の1又はそれ以上の操作後のグラフィカルユーザインターフェイス内のクエリ語の位置に基づいて、修正された検索クエリをコンピュータにより生成するステップをさらに含む。選択したクエリ語をグラフィカルユーザインターフェイスの第1の区画から第2の区画に移動することにより、選択したクエリ語のクエリ状態が第1のクエリ状態から第2のクエリ状態に変化する。この方法は、修正された検索クエリを使用してデータベースを検索し、更新された電子文書の組を戻して表示するステップをさらに含むことができる。
別の実施形態では、データベースを検索するための検索クエリの生成を可能にする方法が、検索文字列の提出を求める検索文字列フィールドを提示するステップと、検索開始アイコンを提示するステップと、複数の区画を含むクエリ作成ワークスペースを提示するステップとを含む。各区画は、クエリ状態に対応する。検索開始アイコンの選択により、検索文字列に少なくとも部分的に基づいて最初の検索クエリが開始される。この方法は、検索開始アイコンの選択に応答して、検索文字列に少なくとも部分的に基づいて意味的用語を生成するステップと、この意味的用語に少なくとも部分的に基づいて最初の検索クエリを生成するステップと、最初の検索クエリを使用してデータベースを検索し、戻された電子文書の組を戻すステップとをさらに含む。意味的用語は、検索クエリ内の意味的用語のクエリ状態に従ってクエリ作成ワークスペースの区画内に読み込まれる。クエリ作成ワークスペース内への1又はそれ以上の意味的用語の操作に応答して、意味的用語の1又はそれ以上の操作後のクエリ作成ワークスペースの区画内の意味的用語の位置に基づいて、修正された検索クエリがコンピュータにより生成される。選択した意味的用語をクエリ作成ワークスペースの第1の区画から第2の区画に移動することにより、選択した意味的用語のクエリ状態が第1のクエリ状態から第2のクエリ状態に変化する。修正された検索クエリを使用してデータベースを検索し、更新された電子文書の組を戻して、これを検索結果パネル内に提示する。検索結果パネル内には、戻された電子文書の組を提示することもできる。
さらに別の実施形態では、文書コーパスの検索を可能にするためのシステムが、実行可能命令セットを記憶する非一時的メモリ要素を含むコンピュータ装置を備える。この実行可能命令セットは、検索文字列の受け取りに応答して、検索文字列に少なくとも部分的に基づいて意味的用語を生成することと、この意味的用語に少なくとも部分的に基づいて最初の検索クエリを生成することと、データベースの検索を開始して、戻された電子文書の組を戻すことと、2又はそれ以上の区画を有するグラフィカルユーザインターフェイスを表示することとをコンピュータ装置に行わせる。グラフィカルユーザインターフェイスの各区画は、演算子状態、関連性状態、関係状態又はこれらの組み合わせを含むクエリ状態を示す。実行可能命令セットは、最初の検索クエリ内の意味的用語のクエリ状態に少なくとも基づいて、グラフィカルユーザインターフェイスの区画内に意味的用語を読み込むことと、グラフィカルユーザインターフェイス内の1又はそれ以上の意味的用語の操作に応答して、意味的用語の1又はそれ以上の操作後のグラフィカルユーザインターフェイス内の意味的用語の位置に基づいて、修正された検索クエリを生成することとをさらにコンピュータに行わせる。選択した意味的用語をグラフィカルユーザインターフェイスの第1の区画から第2の区画に移動することにより、選択した意味的用語のクエリ状態が第1のクエリ状態から第2のクエリ状態に変化する。実行可能命令セットは、修正された検索クエリを使用してデータベースの更新された検索を開始し、更新された電子文書の組を戻して表示することをさらにコンピュータに行わせる。
以下の詳細な説明を図面と共に考慮すれば、本明細書で説明する実施形態により提供されるこれらの及びさらなる特徴がより完全に理解されるであろう。
図面に示す実施形態は、本質的に例証的及び例示的なものであり、特許請求の範囲により定義される本主題を限定するものではない。同じ構造を同じ参照数字で示す以下の図面と共に読めば、以下の例示的な実施形態についての詳細な説明を理解することができる。
本明細書に図示し説明する1又はそれ以上の実施形態による、文書コーパスの検索及び検索クエリの生成のためのシステムのコンピュータネットワークを示す概略図である。 本明細書に図示し説明する1又はそれ以上の実施形態による、文書検索及び検索クエリ生成機能を実行する際に利用できるハードウェア及びソフトウェアをさらに示す図1のサーバコンピュータ装置の概略図である。 本明細書に図示し説明する1又はそれ以上の実施形態による、文書コーパスの検索方法を図式的に示すフローチャートである。 本明細書に図示し説明する1又はそれ以上の実施形態による、グラフィカルユーザインターフェイスの検索文字列入力画面を示す概略図である。 本明細書に図示し説明する1又はそれ以上の実施形態による、グラフィカルユーザインターフェイスのクエリ画面を示す概略図である。 本明細書に図示し説明する1又はそれ以上の実施形態による、例示的なクエリ語が読み込まれた図5のクエリ画面を示す概略図である。 本明細書に図示し説明する1又はそれ以上の実施形態による、図6の読み込まれたクエリ画面の操作を示す概略図である。 本明細書に図示し説明する1又はそれ以上の実施形態による、図6の読み込まれたクエリ画面の操作を示す概略図である。 本明細書に図示し説明する1又はそれ以上の実施形態による、図8の読み込まれたクエリ画面のorグループボックスを生成するための操作を示す概略図である。 本明細書に図示し説明する1又はそれ以上の実施形態による、orグループボックスを有する読み込まれたクエリ画面を示す概略図である。 本明細書に図示し説明する1又はそれ以上の実施形態による、複数の関係ボックスを有する読み込まれたクエリ画面を示す概略図である。
図を大まかに参照すると、本明細書で説明する実施形態は、ユーザが相対的関心を示す文書を求めて文書コーパスを検索するためのシステム及び方法に関する。本明細書で説明する実施形態は、文書コーパスを検索するために使用する検索クエリをユーザが変更又は別様に修正(例えば、操作した用語の相対的重要度を変更又は用語のブール状態を変更)すべくグラフィカルユーザインターフェイス内のクエリ語を操作できるようにする視覚的な対話型グラフィカルユーザインターフェイスを提供する。グラフィカルユーザインターフェイス内のアイコン、フォントサイズ、フォントカラー、位置などのグラフィック要素により、ユーザに1又はそれ以上のクエリ語のクエリ状態を示す。1つの実施形態では、検索文字列から意味的用語が生成され、この意味的用語が検索語として利用され、グラフィカルユーザインターフェイスに読み込まれ、これを使用して文書コーパスに問い合わせを行う。以下、文書コーパスの検索及び検索クエリの生成のためのシステム及び方法の様々な実施形態について説明する。
本明細書では、特許文献を含む文書コーパスとの関連で実施形態を説明するが、実施形態はこれに限定されるものではないと理解されたい。例えば、本明細書で説明する方法を利用して、特許文献、法律文書、科学調査文献、ニュース記事、雑誌などを含む文書コーパスを検索することもできる。
ここで図面を参照すると、図1に、本明細書に図示し説明する実施形態による、文書コーパスを検索するとともに、文書コーパスを検索するために使用できる検索クエリを生成するためのシステムの構成要素を示す例示的なコンピュータネットワークを示している。図1に示すように、コンピュータネットワーク10は、インターネットなどの広域ネットワーク、ローカルエリアネットワーク(LAN)、移動通信ネットワーク、公衆サービス電話網(PSTN)及び/又はその他のネットワークを含むことができ、ユーザコンピュータ装置12a、サーバコンピュータ装置12b及び管理者コンピュータ装置12cを電子的に接続するように構成することができる。
ユーザコンピュータ装置12aは、電子文書コーパスに1又はそれ以上の文書を入力するとともに、文書コーパスの検索を行うために使用することができる。ユーザコンピュータ装置12aは、他のユーザ機能を実行するために利用することもできる。また、図1には管理者コンピュータ装置12cも含まれる。サーバコンピュータ装置12bが、監視、更新又は訂正を必要とする場合、管理者コンピュータ装置12cを、これらの所望の監視、更新及び/又は訂正を行うように構成することができる。管理者コンピュータ装置12c、及びネットワーク10に結合された他のあらゆるコンピュータ装置は、電子文書コーパスに1又はそれ以上の文書を入力するために使用することができる。
1つの実施形態では、システムが、ネットワーク10に結合された意味的用語サーバ12dをさらに含む。意味的用語サーバ12dは、ユーザコンピュータ装置及び/又はサーバコンピュータ装置12bから検索文字列を受け取り、この検索文字列に基づいて、意味的用語ロジック及びデータを使用して意味的用語を生成し、この意味的用語をサーバコンピュータ装置12b及び/又はユーザコンピュータ装置12aに戻すサーバとして構成することができる。なお、意味的用語の生成については以下で詳細に説明する。
ユーザコンピュータ装置12a及び管理者コンピュータ装置12cをパーソナルコンピュータとして示し、サーバコンピュータ装置12bをサーバとして示しているが、これらは非限定的な例であると理解されたい。すなわち、いくつかの実施形態では、これらの構成要素のいずれにも(モバイルコンピュータ装置、パーソナルコンピュータ、サーバなどの)あらゆるタイプのコンピュータ装置を利用することができる。また、図1には、これらのコンピュータ装置の各々を単体のハードウェアとして示しているが、これも一例にすぎない。すなわち、ユーザコンピュータ装置12a、サーバコンピュータ装置12b及び管理者コンピュータ装置12cの各々は、複数のコンピュータ、サーバ、データベースなどを表すこともできる。
図2には、図1のサーバコンピュータ装置12bを示し、本明細書に図示及び説明する実施形態による、文書コーパスを検索するための、又は検索クエリを生成するためのシステム、及び/又は文書コーパスを検索するための、又は検索クエリを生成するための、ハードウェア、ソフトウェア及び/又はファームウェアとして具体化された非一時的コンピュータ可読媒体をさらに示している。いくつかの実施形態では、サーバコンピュータ装置12bを、必要なハードウェア、ソフトウェア及び/又はファームウェアを含む汎用コンピュータとして構成できるが、いくつかの実施形態では、このサーバを、本明細書で説明する機能を実行するように特別に設計された専用コンピュータとして構成することもできる。
やはり図2に示すように、サーバコンピュータ装置12bは、プロセッサ30、入力/出力ハードウェア32、ネットワークインターフェイスハードウェア34、(コーパスデータ38a、意味的用語データ38b及びその他のデータ38cを記憶できる)データ記憶要素36、及び非一時的メモリ要素40を含むことができる。メモリ要素40は、揮発性及び/又は不揮発性コンピュータ可読媒体として構成することができ、従って(SRAM、DRAM、及び/又はその他のタイプのランダムアクセスメモリを含む)ランダムアクセスメモリ、フラッシュメモリ、レジスタ、コンパクトディスク(CD)、デジタル多用途ディスク(DVD)、及び/又はその他のタイプの記憶要素を含むことができる。また、メモリ要素40を、動作ロジック42、意味的用語ロジック43及び検索ロジック44(一例として、これらの各々は、コンピュータプログラム、ファームウェア又はハードウェアとして具体化することができる)を記憶するように構成することもできる。やはり図2に含まれるローカルインターフェイス46は、サーバコンピュータ装置12bの構成要素間の通信を容易にするためのバス又はその他のインターフェイスとして実装することができる。
プロセッサ30は、(データ記憶要素36及び/又はメモリ要素40などから)命令を受け取って実行するように構成されたあらゆる処理要素を含むことができる。入力/出力ハードウェア32は、モニタ、キーボード、マウス、プリンタ、カメラ、マイク、スピーカ、タッチスクリーン、及び/又はデータの受信、送信及び/又は表示を行うための他の装置を含むことができる。ネットワークインターフェイスハードウェア34は、モデム、LANポート、ワイヤレスフィディリティ(Wi−Fi)カード、WiMaxカード、モバイル通信ハードウェア、及び/又は他のネットワーク及び/又は装置と通信するためのその他のハードウェアなどのあらゆる有線又は無線ネットワークハードウェアを含むことができる。
データ記憶要素36は、サーバコンピュータ装置12bに対して局所的に及び/又は遠隔的に存在することができ、サーバコンピュータ装置12b及び/又はその他の構成要素がアクセスする1又はそれ以上のデータを記憶するように構成することができる。図2に示すように、データ記憶要素36は、少なくとも1つの実施形態では検索のために体系化されインデックスを付けられた特許及び/又はその他の文書を含むコーパスデータ38aを記憶することができる。特許文献は、例えば交付済み特許及び特許公報を含むことができる。コーパスデータ38aは、1又はそれ以上のデータ記憶装置に記憶することができる。同様に、データ記憶要素36には、意味的検索語の生成に関する情報を含むことができる意味的用語データ38bを記憶することもできる。別の実施形態では、サーバコンピュータ装置12bを、意味的用語データを含む遠隔サーバ又はデータ記憶装置(意味的用語サーバ12dなど)に結合して、意味的用語がサーバコンピュータ装置12bから遠隔的に生成されるようにすることができる。データ記憶装置36には、本明細書で説明する機能をサポートするためのその他のデータ38c(文書コーパスに記憶された電子文書をインデックスするためにコーパスデータ38aと共に利用できるメタデータなど)を記憶することもできる。
メモリ要素40には、動作ロジック42、意味的用語ロジック43及び検索ロジックが含まれる。動作ロジック42は、オペレーティングシステム、及び/又はサーバコンピュータ装置12bの構成要素を管理するためのその他のソフトウェアを含むことができる。同様に、意味的用語ロジック43は、メモリ要素40内に存在して、提供された検索文字列から意味的用語を電子的に生成できるように構成することができる。検索ロジック44は、以下で詳細に説明するように、グラフィカルユーザインターフェイス内のユーザ入力から検索クエリを生成するように構成することができる。
図2に示す構成要素は例示的なものにすぎず、本開示の範囲を限定するものではないと理解されたい。すなわち、図2の構成要素をサーバコンピュータ装置12b内に存在するように示しているが、これは非限定的な例である。いくつかの実施形態では、構成要素の1又はそれ以上が、サーバコンピュータ装置12bの外部に存在することもできる。同様に、図2はサーバコンピュータ装置12bに関するものであるが、ユーザコンピュータ装置12a及び管理者コンピュータ装置12cなどの他の構成要素も、類似のハードウェア、ソフトウェア及び/又はファームウェアを含むことができる。
ここで図3を参照すると、1又はそれ以上の実施形態による、文書コーパスの検索方法を図式的に示すフローチャートを示している。上述したように、実施形態は、(1又はそれ以上の一群の電子文書に体系化できる)文書コーパスを記憶するデータベースに問い合わせを行うために使用する検索クエリを視覚化すること、及び検索クエリを図式的に操作して所望の電子文書を取得することの両方をユーザが行えるようにするものである。ブロック180において、システムは、ユーザコンピュータ装置12aのディスプレイ装置上に表示するためのグラフィカルユーザインターフェイスを生成することができる。このグラフィカルユーザインターフェイスは、ユーザに検索文字列の提出を要求するように構成される。図4を参照すると、このグラフィカルユーザインターフェイスは、ユーザから検索文字列を受け取るように構成された検索文字列入力画面100を含むことができる。実施形態は、図を通じて示すグラフィカルユーザインターフェイスの構成に限定されるものではなく、他のグラフィカルユーザインターフェイス構成も可能であると理解されたい。1つの実施形態では、ネットワーク10がインターネットであり、本明細書で説明するグラフィカルユーザインターフェイスが、ウェブブラウザを介してユーザに提示される。
検索文字列入力画面100は、所望の検索文字列を構成する1又はそれ以上の用語をユーザが(例えば、キーボードを使用することにより)入力できる検索文字列フィールド103を含む。1つの実施形態では、この検索文字列を、自然言語検索文字列とすることができる。図4に示す実施形態では、文書コーパス内に記憶されている、運動靴の製造に使用される材料に関する特許文献の検索に特定のユーザが関心を示したものとして、検索文字列フィールド103に「latex athletic neoprene(ラテックス 運動用 ネオプレン)」という検索文字列が入力されている。
検索文字列入力画面100は、オプションボタン106、文書部分フィルタ入力102、プレビューアイコン104、及び検索開始アイコン105などのその他の入力機能を含むこともできる。利用できる機能は、これより多くても又は少なくてもよいと理解されたい。図4に示す例では、ユーザが、オプションボタン106を使用して、ユーザが検索している文書コーパスの母国語でない電子文書の機械翻訳を検索することもできる。その他のオプションを提供することもできる。ユーザは、文書部分フィルタ入力102を使用して、電子文書の特定の部分のみ又は部分の組み合わせを検索することができる。例えば、特許文献の文脈では、ユーザは、文書部分フィルタ入力102を使用して、要約書部分、詳細な説明部分、特許請求の範囲部分などのみを検索することができる。
意味的用語を利用する実施形態では、ユーザが、プレビューアイコン104を使用して、検索の開始前に、まず意味的用語ロジック45(図2)により生成された意味的用語のプレビューを見ることができる。例えば、ユーザに意味的用語のリストを提供することができる。次に、ユーザは、検索開始アイコン105をクリック又はその他の方法で選択することにより検索を開始したいと望むこと、又は検索文字列フィールド103に入力された検索文字列を変更したいと望むことができる。
ユーザは、検索開始アイコン105をクリック又はその他の方法で選択することにより、検索文字列フィールド103に入力された検索文字列に基づいて検索を開始することができる。再び図3(及び図2)を参照すると、意味的用語を利用する場合には、ブロック182において意味的用語ロジック45及び意味的用語データ38bに検索文字列が送信され、ブロック184において意味的検索語が生成される。意味的用語は、ブロック186において文書コーパスを検索する最初の検索クエリのクエリ語として使用される。意味的用語を利用しない場合には、検索文字列の個々の用語が、ブロック186において文書コーパスを検索するために使用される最初の検索クエリのクエリ語として使用される。
ブロック184を詳細に参照すると、意味的用語は、最初に提供された検索文字列の用語に意味的に類似する用語である。意味的検索は、システムのユーザが自身の検索文字列に含めなかったであろうはずの関連語を利用することによって有益になり得る。1つの実施形態では、検索文字列の個々の用語が、検索文字列に基づいて意味的用語を生成するサードパーティサービス(テキサス州ダラスのPureDiscovery社など)に送信される。別の実施形態では、サーバコンピュータ装置12b内で意味的用語が生成される。意味的用語は、様々な技術によって生成することができる。
意味的用語ロジックは、意味的用語を生成するだけでなく、ブロック186において、ブール重み付けした自然言語検索クエリ(すなわち、最初の検索クエリ)を作成し、これを文書コーパスに適用して戻された電子文書の組を戻すこともできる。この最初の検索クエリは、ブール重み付けした自然言語検索クエリ以外のタイプの検索として構成することもできる。最初の検索クエリは、あらゆる数のクエリ生成技術を使用して生成することができる。その後、戻された意味的用語を、各々が関連するクエリ状態を有するクエリ語として使用することができる。
別の実施形態では、ユーザが、ブロック182において意味的検索の利用を望まないこともできる。例えば、1つの実施形態では、検索文字列入力画面100内に、意味的検索機能をオフにする選択可能オプションを提供することができる。或いは、システムが意味的検索機能を含まないようにすることもできる。これらの実施形態では、検索文字列の用語を直接クエリ語として利用することができる。
上述したように、ブロック186において、最初の検索クエリのクエリ語(検索文字列の意味的用語又は個々の用語など)を使用して文書コーパスを検索し、戻された電子文書の組を戻して表示する。ブロック188において、以下で説明するクエリ作成ワークスペースを使用して、最初の検索クエリが操作又は別様に修正されたか否かを判定する。最初の検索クエリが操作されていない場合、処理はブロック190において終了し、1つの実施形態では、ユーザが所望の文書を検索する。クエリ作成ワークスペースを使用して最初の検索クエリ(及びその後の検索クエリ)が修正されている場合、ブロック186において、修正された検索クエリを使用して文書コーパスを検索する。ブロック190において、ユーザが戻された文書に満足して処理が終了するまで、検索クエリをさらに操作して文書コーパスをさらに検索することができる。
ここで図5に示す実施形態を参照すると、グラフィカルユーザインターフェイスが、大まかにクエリ作成ワークスペース130及び検索結果パネル140を含むクエリ画面110を含むことができる。1つの実施形態では、最初の検索クエリの生成後にクエリ画面110がユーザに提供される。以下でより詳細に説明するように、文書コーパスを最初に検索するために使用する最初のクエリ内のクエリ語の関連するクエリ状態に従って、クエリ作成ワークスペース130にクエリ語を読み込むことができる。1つの実施形態では、検索文字列入力画面100を利用しない。代わりに、(例えば、以下で説明する意味的用語更新フィールド112及び意味的用語更新ボタン114を使用して)クエリ画面に検索文字列を直接入力する。
クエリ作成ワークスペース130は、内部のクエリ語のクエリ状態を詳細に示す複数の区画に分割することができる。このようにして、クエリ画面110のユーザは、生成された最初の検索クエリを容易に視覚化することができる。図5に示す実施形態では、クエリ作成ワークスペース130が、必要な用語区画132、任意の用語区画134、除外する用語区画136、及び無視する用語区画138という4つの区画を含む。利用できる区画は、最初の検索クエリの性質に応じて、これより多くても又は少なくてもよいと理解されたい。
クエリ語は、最初の検索クエリ又はその後の修正された検索クエリとして適用される場合、クエリ作成ワークスペース130内のクエリ語の位置に従って取り扱われる。クエリ作成の様々な区画は、演算子状態を示すことができる。演算子状態の演算子は、2又はそれ以上のクエリ語間の関係を定義する。例えば、必要な用語区画132内に存在するクエリ語は、ブール演算子「and」、すなわち戻された電子文書内にこれらの用語が存在しなければならないものとして取り扱うことができる。任意の用語区画134内に存在するクエリ語は、ブール演算子「or」、すなわち検索クエリ内でこれらの用語が任意として処理されるものとして取り扱うことができる。除外する用語区画136内に存在するクエリ語は、ブール「and not」、すなわち除外する用語区画136内に存在する用語が戻された電子文書に含まれていてはいけないものとして取り扱うことができる。無視する用語区画138内に存在するクエリ語は、検索との関連性が限られている可能性があり、最初の又はその後の検索クエリ内で利用されない用語である。
図5に示すクエリ作成ワークスペース130の任意の用語区画134に示すように、区画の1つ又はそれ以上は、各々が関連する関連性重みを有する複数の領域を含むことができる。限定ではなく一例として、例示する任意の用語区画134は、第1の領域135a、第2の領域135b及び第3の領域135cを含む。領域135a〜135cは、これらに関連する対応する関連性重みを有する。例えば、第1の領域135a内のクエリ語は、このクエリ語に関連する第1の関連性重みを有し、第2の領域135b内のクエリ語は、このクエリ語に関連する第2の関連性重みを有し、第3の領域135c内のクエリ語は、このクエリ語に関連する第3の関連性重みを有する。例えば、第1の関連性重みを第2の関連性重みよりも大きくすることができ、すなわち第1の領域135a内のクエリ語には、最初の又はその後の修正された検索クエリにおいて第2の領域135b内のクエリ語よりも高く重み付けすることができる。利用できる領域は、これより多くても又は少なくてもよい。1つの実施形態では、これらの領域が、図5に示す破線などの視覚的図形によって視覚的に示される。別の実施形態では、様々な領域を示すために視覚的図形を使用しない。
検索結果パネル140は、クエリ画面110の、戻された電子文書をプレビュー又は別様に表示できるウィンドウ又は部分を提供する。図5に示す実施形態では、検索結果パネル140が結果区画142a〜142dを含み、これらの各々に、(図3のブロック186で戻された電子文書などの)戻された電子文書の視覚表現を提供することができる。あらゆる数の結果区画を提供することができ、結果区画の数は、特定のクエリの結果に依存することができる。1つの実施形態では、検索結果パネル140が、戻された電子文書の総数の一部のみ(上位50個の電子文書など)を提供する。別の実施形態では、検索結果パネル140内に、戻された電子文書が全て提供される。戻された電子文書をユーザがスクロールできるようにするためのスクロールバー143を設けることもできる。戻された電子文書の視覚表現は、様々な形を取ることができる。1つの実施形態では、各結果区画142a〜142d内に、特許文献の名称、要約書部分の一部及び代表図を表示することができる。他の視覚表現も可能である。
クエリ画面110は、クエリ作成ワークスペース130及び検索結果パネル140の機能を高める他の構成要素を含むこともできる。1つの実施形態では、検索文字列入力画面100に入力された検索文字列をユーザが修正できるようにするための意味的用語更新フィールド112及び意味的用語更新ボタン114が設けられる。例えば、ユーザは、意味的用語更新フィールド112内の検索文字列に対して用語を追加又は削除したいと望み、次に意味的用語更新ボタン114をクリック又はその他の方法で選択して、最初の検索クエリのクエリ語として使用する意味的用語を再生することができる。
1つの実施形態では、以下で詳細に説明するように、クエリ作成ワークスペース130内のクエリ語の過去の操作を取り消すための取消ボタン116を設けることができる。ユーザが(綴りの変更などの)クエリ語の修正を行えるように選択編集ボタン118を構成することもでき、ユーザが再生ボタン120を選択して、クエリ作成ワークスペース130内のクエリ語の操作に基づいて修正された検索クエリを生成し、検索結果パネル140内に更新された電子文書の組を戻すようにすることもできる。(意味的用語を利用するかどうかに関わらず)修正された検索クエリ内にユーザが独自のクエリ語を入力できるようにするためのクエリ語追加フィールド122及びクエリ語追加ボタン124を設けることもできる。例えば、ユーザは、クエリ語追加フィールド122に単語をタイプし、その後クエリ語追加ボタン124を選択することによってクエリ語を追加することができる。この結果、この追加したクエリ語を、クエリ作成ワークスペース130の(必要な用語区画132などの)区画内に表示することができる。別の実施形態では、クエリ語追加ボタンを設けずに、ユーザがクエリ語追加フィールド122にクエリ語をタイプし、次にこの追加したクエリ語をクエリ作成ワークスペース130の所望の区画にドラッグアンドドロップすることによってクエリ語を追加することもできる。或いは、クエリ作成ワークスペース130の所望の区画内に追加のクエリ語を直接タイプすることによってクエリ語を追加することもできる。他の方法を利用して、クエリ作成ワークスペース130にクエリ語を追加することもできる。
別の実施形態では、(クエリ作成ワークスペース130内における操作の前又は後に)意味的用語(及び/又はユーザにより追加された新たな用語)を意味的用語ロジック45及び意味的用語データ38bに返送して新たな更新されたクエリ語の組が戻され、その後、上述したようにこれらを操作し使用して文書を検索することができる。
ユーザが検索結果パネル140内に提示される電子文書を全て検索できるようにするための全結果検索ボタン141を設けることもできる。例えば、検索結果パネルが戻された電子文書を選択された数だけ提供し、全結果検索ボタン141が選択されると、戻された電子文書の組全体を表示する別の結果画面にユーザを導くようにすることができる。この別の結果画面には、戻された電子文書を、(各電子文書の詳細などの)検索結果パネル140とは異なるフォーマットで提示することができる。その後、ユーザは、個々の電子文書の選択、レビュー、ダウンロードなどを行うことを決定することができる。
図6は、「latex athletic neoprene」という検索文字列によって生じる意味的用語及び最初の検索クエリに基づくクエリ語を含むクエリ画面110の概略図である。意味的用語更新フィールド112には、「latex athletic neoprene」という検索文字列が表示される。クエリ作成ワークスペース130には、最初の検索クエリのクエリ語の最初の検索クエリ内のクエリ状態に基づいて、このクエリ語が表示される。図を通じて示すクエリ語は例示を目的とするものにすぎないと理解されたい。図6に示すクエリ語は、図3のブロック182及び184に関して上述した意味的用語生成の結果として生じたものである。従って、例示するクエリ語は、「latex athletic neoprene」という検索文字列に基づく意味的用語である。
必要な用語区画132には、「rubber outsole(ゴム底)」及び「carbon rubber(カーボンラバー)」という、最初の検索クエリに基づく2つの必要なクエリ語が読み込まれている。任意の用語区画134には、とりわけ「athletic(運動用)」、「conventional outsole(従来の靴底)」、「asker(アスカー)」、及び「activities(活動)」などのクエリ語が読み込まれている。上述したように、これらの用語は、最初の検索クエリ内では任意である。除外する用語区画136には、クエリ語が提供されておらず、無視する用語区画138には、「baseball shoes(野球シューズ)」、「shaped(成形)」などのクエリ語が提供されている(すなわち、これらの用語は無視され、最初の検索クエリに影響を与えない)。なお、クエリ語は、1又はそれ以上の文字、及びフレーズの1又はそれ以上の単語とすることができる。
クエリ作成ワークスペース130の様々な区画内のクエリ語の配置(例えば、演算子状態)に加え、これらのクエリ語を、例えばこれらの関連性状態などのクエリ状態をさらに示すようにフォーマットすることもできる。任意の用語区画134の第1、第2及び第3の領域135a〜135cに関して上述したように、関連性状態は、クエリ語に割り当てられた関連性重みを示すことができる。状態表示フォーマットは、ユーザに特定のクエリ状態に関する視覚キューを提供するフォントカラー、フォントサイズ、フォントフォーマット、アイコンなどとすることができる。限定ではなく一例として、大きなフォントを関連付けられたクエリ語は、小さなフォントを関連付けられた関連性重みよりも大きな関連性重みを有することができる。同様に、緑色のフォントカラーは、赤色のフォントカラーよりも大きな関連性重みを示すことができる。太字、イタリック及び下線などのフォントフォーマットを利用することもできる。図6の例では、「rubber outsole」及び「carbon rubber」というクエリ語の隣に星形のアイコンを使用して、これらのクエリ語が必要であること、及び最も大きな関連性重みを有することをユーザに示している。
任意の用語区画134を詳細に参照すると、最初の検索クエリのクエリ語が、これらのクエリ状態に従って任意の用語区画134の領域135a〜135c内に存在する。第1の領域135a内の「athletic」及び「conventional outsole」というクエリ語のフォントは、第2の領域135b内の「asker」及び「neoprene」というクエリ語のフォントよりも大きい。同様に、「asker」及び「neoprene」というクエリ語のフォントは、第3の領域135c内の「activities」及び「durable rubber(耐久ラバー)」というクエリ語のフォントよりも大きい。従って、「athletic」というクエリ語は、最初の検索クエリ内で「asker」及び「activities」というクエリ語よりも重く重み付けされている。
このように、クエリ作成ワークスペース130は、最初の検索クエリ(及び以下で詳細に説明する、クエリ語操作に基づく後続の検索クエリ)の視覚表現を提供することができる。クエリ作成ワークスペース130内のクエリ語の位置及び状態表示フォーマットは、(「and」、「or」、「and not」、無視などの演算子状態、関連性状態、及び以下で説明する関係状態などの)検索クエリ内のクエリ語の状態をユーザに示す視覚キューを提供することができる。この視覚表現は、文書検索システムのユーザが、提出されている又は提出されたクエリをより十分に理解できるようにするものである。
図6を参照すると、検索結果パネル140内に、最初の検索クエリの結果が提供されている。説明を容易にするために、各結果区画142a〜142dには、要約書のヘッダ及び特許番号又は特許出願番号しか示していない。実際の実施形態では、要約書の一部、特許引用の完全な名称及び代表図を提供して、個々の戻された電子文書の関連性をユーザが即座に判断できるような視覚表現をユーザに提供する。各結果区画142a〜142d内に提供できる電子文書に関する詳細は、これより多くても又は少なくてもよい。
ユーザは、このクエリ作成ワークスペース130を使用して、最初の検索クエリを図式的に操作してこの検索クエリをさらに絞り込み、必要であれば修正された検索クエリを作成して、所望の文書の組が戻されるようにすることができる。以下で詳細に説明し、図を通じて示すように、クエリ作成ワークスペース130を通じてクエリ語をドラッグアンドドロップ又はその他の方法で移動して個々のクエリ語のクエリ状態を修正し、これにより1又はそれ以上の修正された検索クエリを作成することができる。
図7を参照して分かるように、クエリ語は、クエリ作成ワークスペース130内でドラッグアンドドロップ又はその他の方法で移動することができる。限定ではなく一例として、(ボックス137に示す)「ethyl vinyl acetate(エチレン酢酸ビニル)」という選択されたクエリ語を選択し、これを第1の位置(任意の用語区画134の第2の領域135b)から第2の位置に移動して、そのクエリ状態を変更することができる。例えば、ユーザは、矢印Aで示すように、「ethyl vinyl acetate」を任意の用語区画134の第1の領域135aに移動することができる。なお、ボックス137及び矢印A、B及びCは、「ethyl vinyl acetate」というクエリ語の操作の説明を補助するために例示目的で示すものにすぎず、本開示の実施形態は、このようなボックス及び矢印を表示しなくてもよい。この操作により、「ethyl vinyl acetate」の関連性重みが、そのクエリ状態が第2の関連性重みから第1の関連性重みに高まることによって変化する。1つの実施形態では、「ethyl vinyl acetate」というクエリ語が新たな位置に移動した時に、その状態表示フォーマットを変化させることもできる。例えば、フォントサイズを大きくし又は色を変更して、新たなクエリ状態を反映させることができる。別の例として、矢印Bで示すように、「ethyl vinyl acetate」というクエリ語を必要な用語区画132に移動して、修正された検索クエリ内の必要なクエリ語にすることもできる。この場合も、クエリ語操作によって生じた新たなクエリ状態を反映するように、「ethyl vinyl acetate」の状態表示フォーマットを変化させることができる。さらに別の例として、矢印Cで示すように、「ethyl vinyl acetate」を任意の用語区画134の第3の領域135cに移動することもできる。「ethyl vinyl acetate」というクエリ語を、除外する用語区画136に移動することにより、このクエリ語が除外されるようにすることができ、或いは無視する用語区画138に移動することにより、このクエリ語が無視されるようにすることもできると理解されたい。あらゆるクエリ語を、クエリ作成ワークスペース130の他のあらゆる区画又は領域に移動して、検索クエリを修正することができる。
1つの実施形態では、クエリ作成ワークスペース130内の用語の操作(クエリ語の移動、クエリ語の追加、クエリ語の削除など)により、検索結果パネル内の現在示されている結果が、現在クエリ作成ワークスペース130に示されている検索クエリと同期していない旨の視覚インジケータ(プレビューリフレッシュアイコン145など)をユーザに示すことができる。例えば、図7に示すように、ユーザが「ethyl vinyl acetate」というクエリ語を移動した場合、ユーザがクエリ作成ワークスペース130を操作したことによって生じる修正された検索クエリを使用してデータベースを検索するまで、プレビューリフレッシュアイコン145を表示することができる。1つの実施形態では、ユーザが、プレビューリフレッシュアイコン145をクリック又はその他の方法で選択することにより、修正された検索クエリを開始することができる。視覚インジケータは、プレビューリフレッシュアイコン145に限定されず、他の形を取ることもできる。例えば、検索結果パネルの色を(グレーなどに)変化させて、修正された検索クエリで検索を再開すべきである旨をユーザに知らせることができる。
同様に、意味的用語更新フィールド112内のテキスト文字列が修正された時にも、クエリ作成ワークスペース130内の意味的用語が意味的用語更新フィールド112のテキスト文字列に同期していない旨をユーザに示すことができる視覚インジケータをクエリ作成ワークスペース130内に提供することができる。この視覚インジケータは、例えば、クエリ作成ワークスペース130の色の変化、又はアイコンの使用とすることができる。この視覚アイコンは、ユーザが意味的用語更新ボタン114を選択した後に削除することができる。
図8に、最初の検索クエリのクエリ語の操作を図式的に示しており、この図では、「asker C」及び「asker」というクエリ語が、任意の用語区画134の第3の領域135cから除外する用語区画136に移動している。この操作により、「asker C」及び「asker」というクエリ語をブール「and not」として取り扱うべきである修正された検索クエリが生じる。図8に示すように、1つの実施形態では、除外する用語が取り消し線フォントで図式的に示される。ユーザは、修正された検索クエリで文書コーパスを検索することによって検索クエリを再生するために、再生ボタン120を選択して再び文書コーパスを検索する(すなわち、図3に示すブロック188からブロック186に戻る)ことができる。クエリ作成ワークスペース130内のクエリ語の操作に基づいて、修正された検索クエリが作成され、この修正された検索クエリを使用して文書コーパスが検索される。
1つの実施形態では、ユーザが後続の文書コーパス検索を開始した後に、検索結果パネル140内に更新された文書の組が表示される。まお、図8に示す特許引用は、修正された検索クエリに起因して図7に示す特許引用とは異なっている。ユーザは、クエリ作成ワークスペース130内のクエリ語を操作したことに基づいて、直ぐに検索結果の変化を見ることができる。
クエリ作成ワークスペース130を使用して、クエリ語に関連するクエリ状態の関係状態を修正することもできる。関係状態は、特定のクエリ語と1又はそれ以上の他のクエリ語の関係を記述する。図9に、図8に示す修正された検索クエリを示しており、ボックス139で強調表示されユーザにより矢印Dで示すように操作された「carbon rubber」という用語が、必要な用語区画132内に示されている。ユーザは、この例では「carbon rubber」などの第1の選択したクエリ語を選択し、これを「rubber outsole」というクエリ語などの第2の選択したクエリ語上に(又はこの近くに)ドラッグアンドドロップすることができる。この動作により、2つのクエリ語の関係を定義する関係ボックスを生成することができる。
図10に、「rubber outsole」というクエリ語と「carbon rubber」というクエリ語の間のブール「or」演算子状態を定義するorグループボックス150として構成された関係ボックスを示す。このorグループボックスは、戻された文書が、この文書のテキスト内に「rubber outsole」というクエリ語又は「carbon rubber」というクエリ語のいずれかを含んでいなければならないという効果を有する。orグループボックス150には、より多くのクエリ語を追加することもでき、又は追加のorグループボックスを生成することもできる。一般に、orグループボックス及び関係ボックスは、あるクエリ語を他のクエリ語上にドラッグアンドドロップする以外の方法によっても生成できると理解されたい。さらに、関係ボックスを互いに入れ子状にして、用語間の特定の関係を形成することもできる。
関係ボックスは、ブール「or」演算子以外のクエリ語間の特定の関係を定義することもできる。図11に、医療分野に関する検索クエリのいくつかの関係ボックスの例を示す。図11に提供する例は、以下のクエリ式の視覚表現である。
doctor(医師) AND licence(免許) AND hospital(病院) OR facility(施設) W/P liab! AND cardiac(心性の) OR heart(心臓) OR lung(肺) W/10 injur! OR death(死) AND NOT angioplasty(血管形成) AND NOT balloon(バルーン) W/S catheter(カテーテル)
なお、「!」は、語根の例を発見するために使用する単語語幹処理演算子(例えば、liab!→liable、liabilityなど)である。演算子「W/10」は、クエリ語が互いから10ワード以内に存在することを示す。演算子「W/S」は、クエリ語が単一の文章に含まれることを示し、演算子「W/P」は、クエリ語が単一の段落に含まれることを示す。他の演算子を利用することもできる。
第1の関係ボックス170は、関係演算子W/Pによって「liab!」という用語に関連付けられる入れ子状のorグループボックス171を含む。この入れ子状のorグループボックス171は、「hospital」又は「facility」を規定する。従って、第1の関係ボックス170は、「liab」を含む単語と同じ段落内で「hospital」という単語又は「facility」という単語が発見されなければならないことを示す。第2の関係ボックス172は、第1のorグループボックス173及び第2のorグループボックス174を含み、これらの用語が互いから10ワード以内で発見されなければならない。必要な用語区画132には、「doctor」という単語及び「licence」という単語も含まれる。除外する用語区画136の関係ボックス175は、戻された文書の組から、「catheter」と同じ文章内に「balloon」という単語を含む文書を除外すべきであることを示す。また、「angioplasty」という単語を含む文書も除外すべきである。
ユーザによっては、長い検索文字列を理解するのが困難であるため、クエリ作成ワークスペース130は、ユーザがより理解し易く操作し易い上記のクエリ式の図式表現を提供する。上述したように、上記の特徴は、法律文書、医学及び科学雑誌、企業及び政府の記録の検索などの、特許文献調査以外の文脈で実装することもできる。
本明細書で説明した実施形態は、文書コーパスの検索及び検索クエリの図式的な作成のためのシステム及び方法を提供するものであると理解されたい。ユーザは、本明細書で説明したシステム及び方法の図式的性質により、検索クエリを容易に理解して操作できるとともに、検索クエリを修正した結果、検索結果がどれほど正確になるか又は関連性が高くなるかを予測することができる。ユーザは、実施形態により、テキストベースのクエリ式をうんざりしながら編集するのではなく、ワークスペースのあちこちにクエリ語をドラッグアンドドロップしてクエリを変更し、他のクエリ語との関係を作成することができる。ワークスペースの隣に結果をプレビューして、戻される文書の数及び種類がユーザの変更によってどのように影響されるかを示すとともに、検索クエリの作成によるさらなる実験を促すことができる。ユーザは、インターフェイスにより、複雑なクエリを容易に視覚化して操作し、検索時間を減少させて検索結果の精度を高めることができる。さらに、本明細書で説明したシステム及び方法では、どのように検索が行われたかをユーザがより良く理解できるので、検索機能に対するユーザの信頼性を高めることができる。
本明細書では、特定の実施形態を図示し説明したが、本主題の思想及び範囲から逸脱することなく、他の様々な変更及び修正を行うことができると理解されたい。さらに、本明細書では、本主題の様々な態様を説明したが、このような態様を組み合わせて利用する必要はない。従って、添付の特許請求の範囲は、本主題の範囲に含まれる全てのこのような変更及び修正も対象範囲とする。
110 クエリ画面
112 意味的用語更新フィールド
114 意味的用語更新ボタン
116 取消ボタン
118 選択編集ボタン
120 再生ボタン
122 クエリ語追加フィールド
124 クエリ語追加ボタン
130 クエリ作成ワークスペース
132 必要な用語区画
134 任意の用語区画
135a 第1の領域
135b 第2の領域
135c 第3の領域
136 除外する用語区画
138 無視する用語区画
141 全ての結果を検索
142a 結果区画
142b 結果区画
142c 結果区画
142d 結果区画
143 スクロールバー

Claims (20)

  1. 文書コーパスの検索を可能にする方法であって、
    各々がクエリ状態を示す2又はそれ以上の区画を有するグラフィカルユーザインターフェイスを表示するステップと、
    前記グラフィカルユーザインターフェイス内に入力されたクエリ語の位置に少なくとも部分的に基づいて、データベースを検索して戻された電子文書の組を戻して表示するために使用する最初の検索クエリを生成するステップと、
    前記グラフィカルユーザインターフェイス内の前記クエリ語の1又はそれ以上の操作に応答して、前記クエリ語の1又はそれ以上の操作後の前記グラフィカルユーザインターフェイス内の前記クエリ語の位置に基づいて、修正された検索クエリをコンピュータにより生成するステップと、
    を含み、選択したクエリ語を前記グラフィカルユーザインターフェイスの第1の区画から第2の区画に移動することにより、前記選択されたクエリ語のクエリ状態が第1のクエリ状態から第2のクエリ状態に変化し、前記方法は、
    前記修正された検索クエリを使用して前記データベースを検索し、更新された電子文書の組を戻して表示するステップをさらに含む、
    ことを特徴とする方法。
  2. 検索文字列の受け取りに応答して、前記検索文字列に少なくとも部分的に基づいて意味的用語を生成するステップをさらに含み、前記最初の検索クエリのクエリ語は、前記意味的用語の1又はそれ以上を含む、
    ことを特徴とする請求項1に記載の方法。
  3. 前記グラフィカルユーザインターフェイス内に入力された前記クエリ語を、対応するクエリ状態を示す、前記グラフィカルユーザインターフェイス内の前記クエリ語の位置に基づく状態表示フォーマットでフォーマットして表示するステップをさらに含む、
    ことを特徴とする請求項1に記載の方法。
  4. 前記グラフィカルユーザインターフェイスの第1の区画内のクエリ語は、該クエリ語に関連する第1の状態表示フォーマットを有し、
    前記グラフィカルユーザインターフェイスの第2の区画内のクエリ語は、該クエリ語に関連する第2の状態表示フォーマットを有する、
    ことを特徴とする請求項3に記載の方法。
  5. 前記状態表示フォーマットは、フォントカラー、フォントサイズ、フォントフォーマット、アイコン、又はこれらの組み合わせである、
    ことを特徴とする請求項3に記載の方法。
  6. 前記クエリ状態は、演算子状態、関連性状態、関係状態、又はこれらの組み合わせを含む、
    ことを特徴とする請求項1に記載の方法。
  7. 前記演算子状態は、「and」演算子、「or」演算子、「and not」演算子、及び無視演算子のうちの1つである、
    ことを特徴とする請求項6に記載の方法。
  8. 前記グラフィカルユーザインターフェイスの個々の区画は、個々の演算子状態に対応する、
    ことを特徴とする請求項7に記載の方法。
  9. 前記クエリ語の関連性状態は、前記グラフィカルユーザインターフェイスの区画内の前記クエリ語の前記位置に少なくとも部分的に基づく、
    ことを特徴とする請求項6に記載の方法。
  10. 前記区画の1又はそれ以上は、第1の領域及び第2の領域を含み、
    前記第1の領域内のクエリ語には、第1の関連性重みが割り当てられ、前記第2の領域内のクエリ語には、前記最初の検索クエリ又はその後の修正された検索クエリ内の第2の関連性重みが割り当てられる、
    ことを特徴とする請求項9に記載の方法。
  11. 選択したクエリ語を前記第1の領域から前記第2の領域に移動することにより、前記選択したクエリ語の関連性重みが前記第1の関連性重みから前記第2の関連性重みに変化する、
    ことを特徴とする請求項10に記載の方法。
  12. 前記区画の1又はそれ以上は、追加の関連性重みを有する追加領域をさらに含む、
    ことを特徴とする請求項10に記載の方法。
  13. 第1の選択されたクエリ語が第2の選択されたクエリ語に近接して配置されたことに応答して、
    前記第1の選択されたクエリ語及び前記第2の選択されたクエリ語を含むorグループボックスを表示するステップと、
    前記修正された検索クエリが、前記第1の選択されたクエリ語と前記第2の選択されたクエリ語の間のブール「or」演算子を含むように、前記修正された検索クエリを前記コンピュータにより生成するステップと、
    を含むことを特徴とする請求項1に記載の方法。
  14. 前記修正された検索クエリを使用して前記データベースを検索し、更新された電子文書の組を戻して表示する前に、前記クエリ作成ワークスペースの操作を示す視覚的指示を表示するステップと、
    前記修正された検索クエリを使用して前記データベースを検索し、更新された電子文書の組を戻して表示した後に、前記更新された電子文書の組を表示するステップと、
    をさらに含むことを特徴とする請求項1に記載の方法。
  15. データベースを検索するための検索クエリの生成を可能にする方法であって、
    検索文字列の提出を求める検索文字列フィールドを提示するステップと、
    選択時に前記検索文字列に少なくとも部分的に基づいて最初の検索クエリを開始する検索開始アイコンを提示するステップと、
    各々がクエリ状態に対応する複数の区画を含むクエリ作成ワークスペースを提示するステップと、
    前記検索開始アイコンの選択に応答して、
    前記検索文字列に少なくとも部分的に基づいて意味的用語を生成し、
    前記意味的用語に少なくとも部分的に基づいて前記最初の検索クエリを生成し、
    前記最初の検索クエリを使用して前記データベースを検索し、戻された電子文書の組を戻す、
    ステップと、
    前記検索クエリ内の前記意味的用語のクエリ状態に従って、前記クエリ作成ワークスペースの区画に前記意味的用語を読み込むステップと、
    前記クエリ作成ワークスペース内の1又はそれ以上の意味的用語の操作に応答して、前記意味的用語の1又はそれ以上の操作後の前記クエリ作成ワークスペースの前記区画内の前記意味的用語の位置に基づいて、修正された検索クエリをコンピュータにより生成するステップと、
    を含み、選択した意味的用語を前記クエリ作成ワークスペースの第1の区画から第2の区画に移動することにより、前記選択した意味的用語のクエリ状態が第1のクエリ状態から第2のクエリ状態に変化し、前記方法は、
    前記修正された検索クエリを使用して前記データベースを検索し、更新された電子文書の組を戻して表示するステップと、
    前記戻された電子文書の組及び/又は前記更新された電子文書の組を図式的に示す検索結果パネルを提示するステップと、
    をさらに含むことを特徴とする方法。
  16. 前記クエリ作成ワークスペース内の意味的用語をフォーマットするステップをさらに含み、
    前記クエリ作成ワークスペースの前記第1の区画内の意味的用語は、該意味的用語に関連する第1の状態表示フォーマットを有し、
    前記クエリ作成ワークスペースの前記第2の区画内の意味的用語は、該意味的用語に関連する第2の状態表示フォーマットを有する、
    ことを特徴とする請求項15に記載の方法。
  17. 前記クエリ状態は、演算子状態、関連性状態、関係状態、又はこれらの組み合わせを含み、
    前記演算子状態は、「and」演算子、「or」演算子、「and not」演算子、及び無視演算子のうちの1つであり、
    前記グラフィカルユーザインターフェイスの個々の区画は、個々の演算子状態に対応し、
    前記意味的用語の関連性状態は、前記クエリ作成ワークスペースの区画内の前記意味的用語の前記位置に少なくとも部分的に基づく、
    ことを特徴とする請求項15に記載の方法。
  18. 第1の選択された意味的用語が第2の選択された意味的用語に近接して配置されたことに応答して、
    前記第1の選択された意味的用語及び前記第2の選択された意味的用語を含む関係ボックスを生成するステップと、
    前記修正された検索クエリが、前記第1の選択された意味的用語と前記第2の選択された意味的用語の間の演算子を含むように、前記修正された検索クエリを前記コンピュータにより生成するステップと、
    を含むことを特徴とする請求項15に記載の方法。
  19. 文書コーパスの検索を可能にするためのシステムであって、
    実行可能命令セットを記憶する非一時的メモリ要素を含むコンピュータ装置を備え、前記実行可能命令セットは、
    検索文字列の受け取りに応答して、前記検索文字列に少なくとも部分的に基づいて意味的用語を生成することと、
    前記意味的用語に少なくとも部分的に基づいて最初の検索クエリを生成することと、 データベースの検索を開始して、戻された電子文書の組を戻すことと、
    各々が演算子状態、関連性状態、関係状態又はこれらの組み合わせを含むクエリ状態を示す2又はそれ以上の区画を有するグラフィカルユーザインターフェイスを表示することと、
    前記最初の検索クエリ内の前記意味的用語のクエリ状態に少なくとも基づいて、前記グラフィカルユーザインターフェイスの前記区画内に前記意味的用語を読み込むことと、 前記グラフィカルユーザインターフェイス内の1又はそれ以上の意味的用語の操作に応答して、前記意味的用語の1又はそれ以上の操作後の前記グラフィカルユーザインターフェイス内の前記意味的用語の位置に基づいて、修正された検索クエリを生成することと、
    を前記コンピュータ装置に行わせ、選択した意味的用語を前記グラフィカルユーザインターフェイスの第1の区画から第2の区画に移動することにより、前記選択した意味的用語のクエリ状態が第1のクエリ状態から第2のクエリ状態に変化し、前記実行可能命令セットは、
    前記修正された検索クエリを使用して前記データベースの更新された検索を開始し、更新された電子文書の組を戻して表示すること、
    をさらに前記コンピュータ装置に行わせる、
    ことを特徴とするシステム。
  20. 前記実行可能命令セットは、
    第1の選択された意味的用語及び第2の選択された意味的用語を含む関係ボックスを生成することと、
    前記修正された検索クエリが前記第1の選択された意味的用語と前記第2の選択された意味的用語の間の演算子を含むように、前記修正された検索クエリを生成することと、
    をさらに前記コンピュータ装置に行わせることを特徴とする請求項19に記載のシステム。
JP2017019720A 2011-03-21 2017-02-06 文書コーパスの検索及び検索クエリの生成を可能にするためのシステム及び方法 Active JP6513723B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/052,397 2011-03-21
US13/052,397 US9721006B2 (en) 2011-03-21 2011-03-21 Systems and methods for enabling searches of a document corpus and generation of search queries

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014501154A Division JP2014519070A (ja) 2011-03-21 2012-03-16 文書コーパスの検索及び検索クエリの生成を可能にするためのシステム及び方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018226377A Division JP6740326B2 (ja) 2011-03-21 2018-12-03 文書コーパスの検索及び検索クエリの生成を可能にするためのシステム及び方法

Publications (2)

Publication Number Publication Date
JP2017102963A true JP2017102963A (ja) 2017-06-08
JP6513723B2 JP6513723B2 (ja) 2019-05-15

Family

ID=46878202

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2014501154A Pending JP2014519070A (ja) 2011-03-21 2012-03-16 文書コーパスの検索及び検索クエリの生成を可能にするためのシステム及び方法
JP2017019720A Active JP6513723B2 (ja) 2011-03-21 2017-02-06 文書コーパスの検索及び検索クエリの生成を可能にするためのシステム及び方法
JP2018226377A Active JP6740326B2 (ja) 2011-03-21 2018-12-03 文書コーパスの検索及び検索クエリの生成を可能にするためのシステム及び方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2014501154A Pending JP2014519070A (ja) 2011-03-21 2012-03-16 文書コーパスの検索及び検索クエリの生成を可能にするためのシステム及び方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2018226377A Active JP6740326B2 (ja) 2011-03-21 2018-12-03 文書コーパスの検索及び検索クエリの生成を可能にするためのシステム及び方法

Country Status (5)

Country Link
US (1) US9721006B2 (ja)
EP (1) EP2689355A4 (ja)
JP (3) JP2014519070A (ja)
KR (2) KR102109093B1 (ja)
WO (1) WO2012129062A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220035317A (ko) * 2020-09-10 2022-03-22 쿠팡 주식회사 컨텍스트 관련 검색 결과 생성을 위한 시스템 및 방법

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8595251B2 (en) * 2011-11-16 2013-11-26 Verizon Patent And Licensing Inc. Flexible interface module
US9721039B2 (en) * 2011-12-16 2017-08-01 Palo Alto Research Center Incorporated Generating a relationship visualization for nonhomogeneous entities
US9684717B2 (en) * 2012-06-18 2017-06-20 Sap Se Semantic search for business entities
US9984127B2 (en) * 2014-01-09 2018-05-29 International Business Machines Corporation Using typestyles to prioritize and rank search results
US9779136B2 (en) * 2014-09-30 2017-10-03 Linkedin Corporation Rearranging search operators
US20160098416A1 (en) * 2014-10-03 2016-04-07 Yahoo! Inc. Auto complete search box based on the user's context to reduce user's input
US10042514B2 (en) * 2014-10-30 2018-08-07 Microsoft Technology Licensing, Llc Typeahead features
US10445355B2 (en) * 2016-04-07 2019-10-15 RELX Inc. Systems and methods for providing a visualizable results list
US11294925B2 (en) * 2018-09-24 2022-04-05 Jpmorgan Chase Bank, N.A. Methods for implementing and using a database actuator
US11269871B1 (en) 2019-07-16 2022-03-08 Splunk Inc. Displaying multiple editable queries in a graphical user interface
US11216511B1 (en) 2019-07-16 2022-01-04 Splunk Inc. Executing a child query based on results of a parent query
US11386158B1 (en) 2019-07-16 2022-07-12 Splunk Inc. Recommending query parameters based on tenant information
US11113294B1 (en) 2019-07-16 2021-09-07 Splunk Inc. Recommending query templates during query formation
US11644955B1 (en) 2019-07-16 2023-05-09 Splunk Inc. Assigning a global parameter to queries in a graphical user interface
US11263268B1 (en) 2019-07-16 2022-03-01 Splunk Inc. Recommending query parameters based on the results of automatically generated queries
US11636128B1 (en) 2019-07-16 2023-04-25 Splunk Inc. Displaying query results from a previous query when accessing a panel
US11604799B1 (en) * 2019-07-16 2023-03-14 Splunk Inc. Performing panel-related actions based on user interaction with a graphical user interface
US11468121B2 (en) * 2020-03-16 2022-10-11 Rovi Guides, Inc. Systems and methods for generating a search query using flexible autocomplete menus
US11604789B1 (en) 2021-04-30 2023-03-14 Splunk Inc. Bi-directional query updates in a user interface
US11899670B1 (en) 2022-01-06 2024-02-13 Splunk Inc. Generation of queries for execution at a separate system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080301128A1 (en) * 2007-06-01 2008-12-04 Nate Gandert Method and system for searching for digital assets
JP2009145992A (ja) * 2007-12-11 2009-07-02 Internatl Business Mach Corp <Ibm> 複数単語を使用する検索式の作成を支援する方法、装置およびプログラム
US20090187554A1 (en) * 2008-01-21 2009-07-23 International Business Machines Corporation Specifying weighted search terms for a search engine

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5842203A (en) 1995-12-01 1998-11-24 International Business Machines Corporation Method and system for performing non-boolean search queries in a graphical user interface
US5926811A (en) 1996-03-15 1999-07-20 Lexis-Nexis Statistical thesaurus, method of forming same, and use thereof in query expansion in automated text searching
US5745890A (en) * 1996-08-09 1998-04-28 Digital Equipment Corporation Sequential searching of a database index using constraints on word-location pairs
US6012053A (en) 1997-06-23 2000-01-04 Lycos, Inc. Computer system with user-controlled relevance ranking of search results
US6028605A (en) 1998-02-03 2000-02-22 Documentum, Inc. Multi-dimensional analysis of objects by manipulating discovered semantic properties
US6308179B1 (en) 1998-08-31 2001-10-23 Xerox Corporation User level controlled mechanism inter-positioned in a read/write path of a property-based document management system
US6768997B2 (en) 1999-05-24 2004-07-27 International Business Machines Corporation System and method for creating a search query using movable elements in a graphical user interface
US7296021B2 (en) 2004-05-21 2007-11-13 International Business Machines Corporation Method, system, and article to specify compound query, displaying visual indication includes a series of graphical bars specify weight relevance, ordered segments of unique colors where each segment length indicative of the extent of match of each object with one of search parameters
US8341143B1 (en) * 2004-09-02 2012-12-25 A9.Com, Inc. Multi-category searching
US7461059B2 (en) * 2005-02-23 2008-12-02 Microsoft Corporation Dynamically updated search results based upon continuously-evolving search query that is based at least in part upon phrase suggestion, search engine uses previous result sets performing additional search tasks
US20080275868A1 (en) 2007-05-02 2008-11-06 Yoram Zer Graphic User Interface for the Construction of Complex Search Queries
US20090144262A1 (en) 2007-12-04 2009-06-04 Microsoft Corporation Search query transformation using direct manipulation
JP5309570B2 (ja) * 2008-01-11 2013-10-09 株式会社リコー 情報検索装置、情報検索方法、制御プログラム
US8001140B2 (en) 2008-02-22 2011-08-16 Tigerlogic Corporation Systems and methods of refining a search query based on user-specified search keywords
US8190601B2 (en) 2009-05-22 2012-05-29 Microsoft Corporation Identifying task groups for organizing search results
US8983989B2 (en) * 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
WO2012116287A1 (en) 2011-02-24 2012-08-30 Lexisnexis, A Division Of Reed Elsevier Inc. Methods for electronic document searching and graphically representing electronic document searches

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080301128A1 (en) * 2007-06-01 2008-12-04 Nate Gandert Method and system for searching for digital assets
JP2009145992A (ja) * 2007-12-11 2009-07-02 Internatl Business Mach Corp <Ibm> 複数単語を使用する検索式の作成を支援する方法、装置およびプログラム
US20090187554A1 (en) * 2008-01-21 2009-07-23 International Business Machines Corporation Specifying weighted search terms for a search engine

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220035317A (ko) * 2020-09-10 2022-03-22 쿠팡 주식회사 컨텍스트 관련 검색 결과 생성을 위한 시스템 및 방법
KR102425536B1 (ko) 2020-09-10 2022-07-27 쿠팡 주식회사 컨텍스트 관련 검색 결과 생성을 위한 시스템 및 방법
US11416554B2 (en) 2020-09-10 2022-08-16 Coupang Corp. Generating context relevant search results

Also Published As

Publication number Publication date
US20120246173A1 (en) 2012-09-27
WO2012129062A3 (en) 2014-05-01
EP2689355A4 (en) 2015-06-03
JP6513723B2 (ja) 2019-05-15
US9721006B2 (en) 2017-08-01
WO2012129062A2 (en) 2012-09-27
JP2019057313A (ja) 2019-04-11
JP6740326B2 (ja) 2020-08-12
KR102003921B1 (ko) 2019-07-25
EP2689355A2 (en) 2014-01-29
KR20190015603A (ko) 2019-02-13
KR20140031207A (ko) 2014-03-12
JP2014519070A (ja) 2014-08-07
KR102109093B1 (ko) 2020-05-12

Similar Documents

Publication Publication Date Title
JP6740326B2 (ja) 文書コーパスの検索及び検索クエリの生成を可能にするためのシステム及び方法
US10810237B2 (en) Search query generation using query segments and semantic suggestions
JP6185127B2 (ja) 電子文書の検索方法及び電子文書検索のグラフィカル表示方法
RU2683507C2 (ru) Извлечение значений атрибутов на основе идентифицированных записей
US10474708B2 (en) Entity-centric knowledge discovery
JP6680763B2 (ja) 結果文書セットに関する推定関連性指示子を表示するため及びクエリ可視化を表示するためのシステム及び方法
RU2730278C2 (ru) Выявление навигационных результатов поиска
US10691655B2 (en) Generating tables based upon data extracted from tree-structured documents
BRPI0712604A2 (pt) interface de usuÁ rio de parÂmetro customizÁvel
JP5539127B2 (ja) 文書管理システム、検索指定方法、プログラム
US20230105356A1 (en) Methods and systems for creating and managing micro content from an electronic document
TWI680377B (zh) 累加檢索處理方法和裝置
US10324966B2 (en) Search by example
JP2023518039A (ja) フレキシブルオートコンプリートメニューを使用して検索クエリを生成するためのシステムおよび方法
WO2013015811A1 (en) Search query generation using query segments and semantic suggestions
JP2005011055A (ja) 電子帳票設計管理方法及び装置並びに処理プログラムと記録媒体
JP7092992B2 (ja) 文書管理プログラム、文書管理装置および文書管理方法
Bäurle A user interface for semantic full text search
US20240202202A1 (en) Method and server for generating an enriched query
JPH08115332A (ja) マルチメディア情報の管理方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180216

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180801

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181203

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20190117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190410

R150 Certificate of patent or registration of utility model

Ref document number: 6513723

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250