JP5501967B2

JP5501967B2 - 間接話法内の意味論的関係の識別

Info

Publication number: JP5501967B2
Application number: JP2010523188A
Authority: JP
Inventors: クロウチ，リチャード; ヴァン・デン・ベルグ，マーティン; アーン，デーヴィッド; グレヴィッヒ，オルヤ; ペル，バーニー; ポランイ，リヴィア; プレヴォスト，スコット; ティオーン，ジョヴァンニ・ロレンゾ
Original assignee: Microsoft Corp
Current assignee: Microsoft Corp
Priority date: 2007-08-31
Filing date: 2008-08-29
Publication date: 2014-05-28
Anticipated expiration: 2028-08-29
Also published as: CA2698105A1; BRPI0816088A2; EP2183686A2; KR20100075454A; RU2488877C2; WO2009029905A3; AU2008292781B2; KR101524889B1; IL204108A; MX2010002350A; JP2010538375A; CN101796511B; CN101796511A; WO2009029905A2; RU2010107150A; EP2183686A4; CA2698105C; AU2008292781A1

Description

オンライン検索エンジンは、研究を行いまたはインターネットを介してアクセス可能な文書をナビゲートするためのますます重要なツールになってきた。しばしば、オンライン検索エンジンは、ユーザーによってサブミットされたクエリーを利用する、可能な文書またはこれらの文書内のテキストを検出するためのマッチングプロセスを実行する。当初に、ＧｏｏｇｌｅまたはＹａｈｏｏによって維持されるものなどの従来のオンライン検索エンジンによって提供されるマッチングプロセスは、ユーザーが、そのユーザーが探している情報を記述するためにクエリー内で１つまたは複数のキーワードを指定することを可能にする。次に、従来のオンライン検索エンジンは、キーワードの正確一致を含むすべての文書を見つけ始めるが、これらの文書は、通常、クエリーに応答する関連するまたは意味のある結果を提供しない。

現在の従来のオンライン検索エンジンは、マッチングプロセスによって作られる正確一致を超えてクエリー内のキーワードに対応する検索される文書内の単語を認識しないという点で、制限されている。また、従来のオンライン検索エンジンは、ユーザーがマッチングされるクエリー内のキーワードに制限されるので制限され、したがって、所望の情報が未知の場合にユーザーがその情報を正確に表現することを可能にしない。したがって、クエリーのキーワードと検索される文書内の単語との間の意味論的関係を認識するために自然言語検索エンジンを実施することによって、検索結果の精度が独自に高められるはずである。

この「課題を解決するための手段」は、下の「発明を実施するための形態」でさらに説明される概念の選択物を単純化された形で導入するために提供される。この「課題を解決するための手段」は、請求される主題の主要な特徴または本質的な特徴を識別することを意図されたものではなく、請求される主題の範囲を判定する際の助けとして使用されることも意図されていない。

本発明の実施形態は、ウェブまたはある他のリポジトリーから取り出された文書の内容内で見つかるさまざまな単語ならびにクエリー検索語の間の関連付けを展開する、コンピューター実施される方法およびコンピューター可読媒体に関する。意味論的に表すことのできる内容は、間接話法または他のアティチュードレポート（ａｔｔｉｔｕｄｅｒｅｐｏｒｔ）とすることができ、その結果、内容の意味論的表現を、受け取られた自然言語クエリーと比較して、意味があり非常に関連する結果をユーザーに与えられるようになる。「ａｂｏｕｔ（〜に関する）」関係などの意味論的関係を、特定の単語関連付けを形成することを可能にするために、ある種の要素または検索語の間で識別することができる。意味論的関係が形成された後に、意味論的表現を、文書内の内容について生成することができ、命題を、検索クエリーについて生成することができ、この両方が、最も関連する検索結果を判定するための１つまたは複数の意味論的関係との命題のすばやい比較を可能にする。

本発明の実施形態を、下で添付図面を参照して詳細に説明する。

本発明の実施形態を実施する際の使用に適する例示的コンピューティング環境を示すブロック図である。本発明の実施形態を実施する際の使用に適する例示的システムアーキテクチャーを示す概略図である。本発明の実施形態による、文書内のテキスト部分から生成される意味論的表現を示す図である。本発明の実施形態による、文書内のテキスト部分から生成される意味論的表現を示す図である。本発明の実施形態による、文書内のテキスト部分から生成される意味論的表現を示す図である。本発明の実施形態による、文書内のテキスト部分から生成される意味論的表現を示す図である。本発明の実施形態による、検索クエリーから生成される命題を示す図である。本発明の実施形態による、文書内のテキスト部分（テキスト部分は２つの文を含む）から生成される意味論的表現を示す図である。本発明の実施形態による、文書の内容から抽出された要素の間の意味論的関係を展開する方法を示す流れ図である。本発明の実施形態による、クエリーの受取りに応答して、命題を生成するためにクエリーから抽出されたさまざまな用語の間の関連付けを作成する方法を示す流れ図である。本発明の実施形態による、文書の内容から抽出された要素の間の意味論的関係を展開する方法を示す流れ図である。

本発明の主題を、法定要件を満足するために本明細書で具体的に説明する。しかし、この説明自体は、本発明の範囲を限定することを意図されたものではない。そうではなく、本発明人らは、他の現在のまたは将来のテクノロジーに関連して、本文書で説明されるものに類似する異なるステップまたはステップの組合せを含めるために、請求される主題を他の形で実施することもできることを企図した。さらに、用語「ステップ」および／または「ブロック」が、使用される方法の異なる要素を包含するために本明細書で使用される場合があるが、個々のステップの順序が明示的に説明されない限り、およびその時を除いて、これらの用語を、本明細書で開示されるさまざまなステップの中または間の特定の順序を暗示するものと解釈してはならない。

したがって、一態様では、インデクシングのために文書の内容の意味論的表現を生成するために内容から抽出された要素の間の意味論的関係を展開するコンピューター実施される方法が提供される。当初に、この方法は、インデクシングされる文書のテキスト部分を識別するステップと、テキスト部分内で識別される複数の要素の意味論的情報を判定するステップとを含む。意味論的情報は、識別された要素の意味あるいは識別された要素間の文法的関係および／または意味論的関係のうちの一方または両方を含むことができる。識別された要素のうちの少なくとも１つをスピーチレポート（ｓｐｅｅｃｈｒｅｐｏｒｔ）またはアティチュードレポートに対応する報告する行為として識別することができる。この方法は、さらに、識別された要素の判定された意味論的情報に基づいて、識別された要素の各関連付けがある種の意味論的関係を表すようにするために、識別された要素を関連付けるステップを含む。さらに、この方法は、識別された要素の関連付けを含む意味論的表現を生成するステップを含む。

もう１つの態様では、自然言語クエリーの受取りに応答して、命題を生成するためにクエリーから抽出されたさまざまな用語の間の関連付けを作成するコンピューター実施される方法が提供される。命題は、関連する検索結果を提供するために意味論的インデックスに格納された文書から内容の意味論的表現を質問するのに使用することができる。この方法は、クエリー内で見つかる１つまたは複数の検索語の関連する意味論的情報を判定するステップをも含む。第１の報告する行為を、クエリー内で判定することができ、意味論的関係を、少なくとも１つの検索語の判定された意味論的情報に基づいて、第１の報告する行為とその検索語との間で形成することができる。第１の報告する行為と検索語との間で作成される関連付けが、意味論的関係を記述する関係要素によって作られる。最後に、形成された関連付けを含む命題を、生成することができ、さらに、非常に関連する検索結果を判定するために意味論的表現と比較することができる。

さらにもう１つの態様では、インデクシングされる文書の内容の意味論的表現を生成するために、内容から抽出された要素の間の意味論的関係を展開する方法を実行するコンピューター使用可能命令をその上に実施された１つまたは複数のコンピューター可読媒体が提供される。当初に、この方法は、文書のうちでインデクシングされるべき少なくとも一部またはテキスト部分を識別するステップを含む。次いで、そのテキスト部分を、意味論的に表現されるべき要素を識別するために解析することができる。識別された要素の間の潜在的意味および文法的関係もしくは意味論的関係が、テキスト部分内での関連付けの１つまたは複数のレベルの判定に加えて判定される。この方法は、第１の報告する行為を識別された要素の第１セットに関連付けられるようにするために、関連付けの１つまたは複数の判定されたレベルのそれぞれについてテキスト部分内で報告する行為を識別するステップをも含む。第１の報告する行為は、関連付けの第１レベルに関連するものとすることができる。同様に、第２の報告する行為を、識別された要素の第２セットに関連付けることができ、第２の報告する行為は、関連付けの第２レベルに関連する。さらに、第１の報告する行為に対する識別された要素の第１セットと第２の報告する行為に対する識別された要素の第２セットとの間の、関連付けを記述する関係要素による関連付けを含む意味論的表現を生成することができる。

本発明の実施形態の概要およびその特徴の一部を短く述べたので、本発明を実施するのに適する例示的オペレーティング環境を下で説明する。

全般的に図面を参照し、当初に特に図１を参照すると、本発明の実施形態を実施する例示的オペレーティング環境が示され、全体的にコンピューティングデバイス１００と指定されている。コンピューティングデバイス１００は、適切なコンピューティング環境の１つの例にすぎず、本発明の使用または機能性の範囲に関する限定を提案することは意図されていない。コンピューティングデバイス１００を、図示のコンポーネントのいずれか１つまたは組合せに関する依存性または要件を有するものと解釈してもならない。

本発明を、コンピューターまたは携帯情報端末もしくは他のハンドヘルドデバイスなどの他の機械によって実行される、プログラムコンポーネントなどのコンピューター実行可能命令を含むコンピューターコードまたは機械使用可能命令の全般的文脈で説明することができる。一般に、ルーチン、プログラム、オブジェクト、コンポーネント、データー構造体、および類似物を含むプログラムコンポーネントは、特定のタスクを実行するか特定の抽象データー型を実施するコードを指す。本発明の実施形態を、ハンドヘルドデバイス、消費者エレクトロニクス、汎用コンピューター、専門コンピューティングデバイスなどを含むさまざまなシステム構成で実践することができる。本発明の実施形態を、通信ネットワークを介してリンクされたリモート処理デバイスによってタスクが実行される分散コンピューティング環境で実践することもできる。

図１の参照を続けると、コンピューティングデバイス１００は、バス１１０を含み、バス１１０は、メモリー１１２、１つまたは複数のプロセッサー１１４、１つまたは複数のプレゼンテーションコンポーネント１１６、入出力（Ｉ／Ｏ）ポート１１８、Ｉ／Ｏコンポーネント１２０、および例示的な電源１２２を直接にまたは間接に結合する。バス１１０は、１つまたは複数のバス（たとえば、アドレスバス、データーバス、またはその組合せ）とすることができるものを表す。図１のさまざまなブロックは、図を明瞭にするために線を用いて図示されているが、実際には、さまざまなコンポーネントの区切りは、それほど明瞭ではなく、隠喩的に、線は、より正確には灰色で不明瞭になるはずである。たとえば、ディスプレイデバイスなどのプレゼンテーションコンポーネントをＩ／Ｏコンポーネントと考えることができる。また、プロセッサーはメモリーを有する。本発明人らは、それが当技術の性質であることを認め、図１の図が、本発明の１つまたは複数の実施形態に関連して使用できる例示的コンピューティングデバイスの単なる例示であることを繰り返す。「ワークステーション」、「サーバー」、「ラップトップ機」、「ハンドヘルドデバイス」などのカテゴリーは、すべてが「コンピューター」または「コンピューティングデバイス」に関して図１の範囲に含まれることが企図されるので、それらのカテゴリーの間での区別は行われない。

コンピューティングデバイス１００は、通常、さまざまなコンピューター可読媒体を含む。限定ではなく例として、コンピューター可読媒体は、ランダムアクセスメモリー（ＲＡＭ）、読取り専用メモリー（ＲＯＭ）、電気的消去可能プログラマブル読取り専用メモリー（ＥＥＰＲＯＭ）、フラッシュメモリー、または他のメモリーテクノロジー、ＣＤＲＯＭ、ディジタル多用途ディスク（ＤＶＤ）、または他の光媒体もしくはホログラム媒体、磁気カセット、磁気テープ、磁気ディスクストレージ、または他の磁気記憶デバイス、あるいは、所望の情報を符号化するのに使用でき、コンピューティングデバイス１００によってアクセスできる任意の他の媒体を含むことができる。

メモリー１１２は、揮発性メモリーおよび／または不揮発性メモリーの形のコンピューター記憶媒体を含む。メモリーは、リムーバブル、ノンリムーバブル、またはその組合せとすることができる。例示的なハードウェアデバイスは、ソリッドステートメモリー、ハードドライブ、光ディスクドライブなどを含む。コンピューティングデバイス１００は、メモリー１１２またはＩ／Ｏコンポーネント１２０などのさまざまなエンティティーからデーターを読み取る１つまたは複数のプロセッサーを含む。プレゼンテーションコンポーネント（１つまたは複数）１１６は、ユーザーまたは他のデバイスにデーター表示を提示する。例示的なプレゼンテーションコンポーネントは、ディスプレイデバイス、スピーカー、印刷コンポーネント、振動コンポーネントなどを含む。Ｉ／Ｏポート１１８は、コンピューティングデバイス１００を、Ｉ／Ｏコンポーネント１２０を含む他のデバイスに論理的に結合することを可能に、この他のデバイスの一部を、内蔵することができる。例示的なコンポーネントは、マイクロホン、ジョイスティック、ゲームパッド、衛星パラボラアンテナ、スキャナー、プリンター、無線デバイスなどを含む。

ここで図２に移ると、本発明の実施形態による、本発明の実施形態を実施する際の使用に適する例示的なシステムアーキテクチャー２００の概略図が示されている。図２に示された例示的なシステムアーキテクチャー２００が、１つの適切なコンピューティング環境の例にすぎず、本発明の使用または機能性の範囲に関する限定を示唆することが意図されていないことが、当業者によって理解され、了解されるであろう。例示的なシステムアーキテクチャー２００を、図示の任意の単一のコンポーネントまたはコンポーネントの組合せに関する依存性または要件を有するものと解釈してもならない。

図示されているように、システムアーキテクチャー２００は、分散コンピューティング環境を含むことができ、この分散コンピューティング環境では、クライアントデバイス２１５は、自然言語エンジン２９０に動作可能に結合され、自然言語エンジン２９０は、データーストア２２０に動作可能に結合される。分散コンピューティング環境で実践される本発明の実施形態では、動作可能な結合は、自然言語エンジン２９０へのクライアントデバイス２１５およびデーターストア２２０のリンクおよび適当な接続を介する他のオンラインコンポーネントを指す。これらの接続は、有線または無線とすることができる。本発明の範囲内の特定の有線実施形態の例は、ネットワーク（図示せず）を介するＵＳＢ接続およびケーブル接続、または、単一の機械の中のコンポーネントを相互接続するバスまたは他のチャネルを含む。本発明の範囲内の特定の無線実施形態の例は、ニアレンジ（ｎｅａｒ−ｒａｎｇｅ）無線ネットワークおよびラジオ周波数テクノロジーを含む。

「ニアレンジ無線ネットワーク」の指定が、限定的であることを意図されておらず、ｎｅｇｏｔｉａｔｅｄｗｉｒｅｌｅｓｓｐｅｒｉｐｈｅｒａｌ（ＮＷＰ）デバイス、短距離無線エアーインターフェレンスネットワーク（ａｉｒｉｎｔｅｒｆｅｒｅｎｃｅｎｅｔｗｏｒｋ）（たとえば、無線パーソナルエリアネットワーク（ｗＰＡＮ）、無線ローカルエリアネットワーク（ｗＬＡＮ）、無線広域ネットワーク（ｗＷＡＮ）、Ｂｌｕｅｔｏｏｔｈ（商標）、および類似物）、無線ピアツーピア通信（たとえば、ウルトラワイドバンド）、およびデバイスの間のデーターの無線通信をサポートするすべてのプロトコルを含むものとして広義に解釈されなければならないということが理解され、了解されるべきである。さらに、本発明の分野に精通する人は、ニアレンジ無線ネットワークを、さまざまなデーター転送方法（たとえば、衛星伝送、遠隔通信網など）によって実践できることを認めるであろう。したがって、たとえばクライアントデバイス２１５、データーストア２２０、および自然言語エンジン２９０の間の接続の実施形態は、説明される例によって限定されるのではなく、さまざまな通信の方法を含むことが強調される。もう１つの実施形態では、コンピューティングデバイスは、意味論的解釈コンポーネント２５０の機能性を内蔵することができ、これによって無線接続または有線接続に対する依存性を軽減することができる。

例示的なシステムアーキテクチャー２００は、プレゼンテーションデバイス２７５の動作を部分的にサポートするクライアントデバイス２１５を含む。クライアントデバイス２１５がたとえばモバイルデバイスである例示的実施形態では、プレゼンテーションデバイス（たとえば、タッチスクリーンディスプレイ）を、クライアントデバイス２１５上に配置することができる。さらに、クライアントデバイス２１５は、さまざまなタイプのコンピューティングデバイスの形をとることができる。例のみとして、クライアントデバイス２１５を、パーソナルコンピューティングデバイス（たとえば、図１のコンピューティングデバイス１００）、ハンドヘルドデバイス（たとえば、携帯情報端末）、モバイルデバイス（たとえば、ラップトップコンピューター、携帯電話機、メディアプレイヤー）、消費者エレクトロニクスデバイス、さまざまなサーバー、および類似物とすることができる。さらに、コンピューティングデバイスは、その間で情報を共有するように構成された複数の電子デバイスを含むことができる。

諸実施形態では、上で述べたように、クライアントデバイス２１５が、プレゼンテーションデバイス２７５を含むかこれに動作可能に結合され、このプレゼンテーションデバイス２７５は、プレゼンテーションデバイス２７５にＵＩディスプレイ２９５を提示するように構成される。プレゼンテーションデバイス２７５は、モニター、電子ディスプレイパネル、タッチスクリーン、液晶ディスプレイ（ＬＣＤ）、プラズマスクリーン、１つまたは複数の発光ダイオード（ＬＥＤ）、白熱電球、レーザー、エレクトロルミネセンス光源、ケミカルライト、フレキシブルライトワイヤー、および／もしくは蛍光灯、または任意の他のディスプレイタイプなどのユーザーに情報を提示できるすべてのディスプレイデバイスとして構成され得、あるいは、視覚情報が投影される反射表面を含むことができる。プレゼンテーションデバイス２７５の複数の異なる構成を上で説明したが、情報を提示するさまざまなタイプのプレゼンテーションデバイスを、プレゼンテーションデバイス２７５として使用できることと、本発明の実施形態が、図示され説明されるプレゼンテーションデバイス２７５に限定されないこととを、当業者は理解し、了解するべきである。

１つの例示的実施形態では、プレゼンテーションデバイス２７５によってレンダリングされるＵＩディスプレイ２９５は、自然言語エンジン２９０および／またはコンテンツパブリッシャーに関連するウェブページ（図示せず）を提示するように構成される。諸実施形態では、ウェブページは、クエリーと、クエリーを用いて意味論的インデックスを検索することによって発見される検索結果とを受け取る検索入力エリアを明らかにすることができる。クエリーは、検索入力エリアでユーザーによって手動で供給されるものとすることができ、あるいは、ソフトウェアによって自動的に生成することができる。さらに、下でより完全に説明するように、クエリーは、サブミットされた時にクエリー内のキーワードに最も反応する適当な検索結果を識別するために自然言語エンジン２９０を呼び出す１つまたは複数のキーワードを含むことができる。

図２に示された自然言語エンジン２９０は、たとえば上で図１を参照して説明したコンピューティングデバイス１００などのさまざまなタイプのコンピューティングデバイスの形をとることができる。限定ではなく例のみとして、自然言語エンジン２９０を、パーソナルコンピューター、デスクトップコンピューター、ラップトップコンピューター、消費者エレクトロニクスデバイス、ハンドヘルドデバイス（たとえば、携帯情報端末）、さまざまなリモートサーバー（たとえば、オンラインサーバークラウド）、処理機器、および類似物とすることができる。しかし、本発明が、そのようなコンピューティングデバイスでの実施態様に限定されるのではなく、本発明の実施形態の範囲に含まれるさまざまな異なるタイプのコンピューティングデバイスのいずれにおいても実施できることに留意されたい。

さらに、１つの実例で、自然言語エンジン２９０は、クライアントデバイス２１５を介するクエリーのサブミッションに応答して、インターネットおよび／またはデーターストア２２０の情報を検索し、検索の範囲内でその情報からの検索結果を収集するように設計された検索エンジンとして構成される。一実施形態で、検索エンジンは、インターネットを介してアクセス可能なデーター（たとえば、ニュースグループ、データーベース、オープンディレクトリー、データーストア２２０、および類似物）をマイニングし、意味のあるフォーマットで格納されたウェブページまたは他の文書の主題と一緒にウェブアドレスを含む意味論的インデックス２６０を作成する、１つまたは複数のウェブクローラーを含む。もう１つの実施形態では、検索エンジンは、サブミットされたクエリー内の検索語に関連する意味論的インデックスから検索結果（たとえば、リスティング、テーブル、ウェブアドレスのランキングされた順序、および類似物）の識別および取出を容易にするように動作可能である。この検索エンジンを、クライアントデバイス２１５に配置されたウェブブラウザーアプリケーションを介してインターネットユーザーによってアクセスすることができる。したがって、ユーザーは、検索入力エリア（たとえば、検索エンジンに関連するウェブブラウザーアプリケーションによって生成されるＵＩディスプレイ２９５に出される）で検索語をサブミットすることによって、インターネット検索を行うことができる。もう１つの構成では、検索を行うことができ、これによって、クエリーが、ユーザーのハードディスクなど、ローカル情報ストアからコンテンツを取り出すために１つまたは複数のシステムインデックスにサブミットされる。

データーストア２２０は、一般に、それに検索可能なコンテンツを関連付けられた（たとえば、Ｗｉｋｉｐｅｄｉａウェブサイトを含む文書）オンラインアイテムおよび／または資料に関連する情報を格納するように構成される。さまざまな実施形態で、そのような情報は、限定なしに、文書、ウェブページ／サイトの内容、インターネット、ローカルイントラネット、もしくはユーザーの機械のメモリーまたはハードディスクを介してアクセス可能な電子資料、ならびに検索エンジンから使用可能な他の通常のリソースを含むことができる。さらに、データーストア２２０を、格納された情報の適切なアクセスに関して検索可能になるように構成することができる。１つの実例で、適切なアクセスを可能にすることは、データーストア内の文書のサブセットに供給される判断基準に従ってそれらのサブセットを選択するかフィルタリングすることを含む。

たとえば、データーストア２２０を、自然言語エンジン２９０による処理のために選択された１つまたは複数の文書に関して検索可能とすることができる。諸実施形態では、自然言語エンジン２９０は、意味論的インデックスを更新するために、最近に追加されまたは修正された文書に関するデーターストアを自由に検査することを可能にされる。検査のプロセスは、事前に定義されたインターバルで継続的に実行することができ、あるいは、データーストア２２０で集計される１つまたは複数の文書に対して変更が行われたことの表示の際に行うことができる。データーストア２２０に格納される情報は、構成可能とすることができ、オンライン検索の範囲内のすべての情報を含むことができることが、当業者によって理解され、了解されるであろう。そのような情報の内容および量は、いかなる形でも本発明の実施形態の範囲を限定することが意図されていない。さらに、単一の独立のコンポーネントとして図示されているが、データーストア２２０は、実際には、複数のデーターベース、たとえば、その一部がクライアントデバイス２１５、自然言語エンジン２９０、別の外部コンピューティングデバイス（図示せず）、および／またはこれらの任意の組合せに常駐できるデーターベースクラスタとすることができる。

一般に、自然言語エンジン２９０は、情報をオンラインで探査し、見つけることを望むユーザーを支援するツールを提供する。諸実施形態では、このツールは、データーストア２２０から引き出された文書など、文書のセット内の一節の意味を計算するために自然言語処理テクノロジーを適用することによって動作する。これらの意味は、検索を実行する時に参照される意味論的インデックス２６０に格納される。当初に、ユーザーが検索入力エリアにクエリーを入力する時に、クエリー検索パイプライン２０５は、ユーザーのクエリーを分析し（たとえば、文字列、完全な単語、句、英数字合成物、記号、または疑問文）、意味論的関係を利用してクエリーを構造的表現に変換する。この表現は、本明細書で「命題」と称するが、関連する検索結果に達するために意味論的インデックス２６０に格納される情報を問い合わせるのに利用することができる。

１つの実例では、意味論的インデックス２６０に格納される情報は、データーストア２２０で維持される文書またはオンライン検索の範囲内に含まれるすべての他の資料から抽出される表現を含む。この表現を、以下では「意味論的表現」と称するが、この表現は、共通テキストから抽出された内容の直観的意味に関し、意味論的インデックス２６０に格納され得る。諸実施形態では、意味論的表現は、単語再記述ルールの順序付きシーケンスまたは関連分野で既知の任意の他のヒューリスティックを利用して意味論的構造から導出される。諸実施形態では、「意味論的構造」は、文書の内容を部分的に辞書的意味論文法規則を利用する意味論的構造に変換する文書解析コンポーネントによって分析パイプラインの中間ステージで生成される。

意味論的インデックス２６０のアーキテクチャーは、命題に一致する意味論的表現を見つけ、サブミットされたクエリーに関連する意味論的表現にマッピングされる文書を取り出すために、導出された命題に対する格納された意味論的表現のすばやい比較を可能にする。したがって、自然言語エンジン２９０は、検索インターフェース（たとえば、ＵＩディスプレイ２９５上に出される検索入力エリア）にサブミットされるクエリーからユーザーのクエリー要件の意味を判定することができ、その後、これらの必要を満足する対応する検索結果を見つけるために大量の情報をふるいにかけることができる。

諸実施形態では、上のプロセスを、関連する検索結果を発見する１つまたは複数のステップを実行するさまざまな機能要素によって実施することができる。これらの機能要素は、クエリー解析コンポーネント２３５、文書解析コンポーネント２４０、意味論的解釈コンポーネント２４５、意味論的解釈コンポーネント２５０、文法指定コンポーネント２５５、意味論的インデックス２６０、マッチングコンポーネント２６５、およびランキングコンポーネント２７０を含む。これらの機能コンポーネント２３５、２４０、２４５、２５０、２５５、２６０、２６５、および２７０は、一般に、個々のモジュラーソフトウェアルーチンと、動的にリンクされ、他のコンポーネントまたはデバイスと共に使用される準備ができている関連するハードウェアとを指す。

当初に、データーストア２２０、文書解析コンポーネント２４０、および意味論的解釈コンポーネント２５０は、インデクシングパイプライン２１０を構成する。動作中に、インデクシングパイプライン２１０は、データーストア２２０でアクセスされる文書２３０内の内容からの意味論的表現を抽出し、意味論的表現を集める時に意味論的インデックス２６０を構成するように働く。上で述べたように、意味論的インデックス２６０を形成するために集約される時に、意味論的表現は、文書２３０ヘのマッピングおよび／またはそれらがそこから導出された文書２３０内の内容の位置を保持することができる。言い換えると、意味論的インデックス２６０は、意味論的解釈コンポーネント２５０によって生成され、伝えられる意味論的表現（文書解析コンポーネント２４０で作成される意味論的構造から導出される）を符号化する。しかし、他の実施形態では、文書解析コンポーネント２４０および意味論的解釈コンポーネント２５０を、自然言語処理を２つのステージ（すなわち、ＬＦＧ解析および意味論的解釈）に分割するのではなく、その代わりに、意味論的構造が作られる別々のステージを有することなく、単一ステップで意味論的表現を作る、単一の要素として構成することができる。

一般に、文書解析コンポーネント２４０は、自然言語エンジン２９０から使用可能なデーターを収集するように構成される。１つの実例で、データーの収集は、そこに格納された文書２３０または他の情報の内容をスキャンするためにデーターストア２２０を検査することを含む。データーストア２２０内の情報は、常に更新される可能性があるので、データーを収集するプロセスを、規則的なインターバルで、継続的に、または更新が文書２３０のうちの１つまたは複数に対して行われることの通知の際に実行することができる。

文書２３０および他の使用可能なソースから内容を収集する際に、文書解析コンポーネント２４０は、意味論的解析のために内容を準備するためにさまざまな手順を実行する。この手順は、テキスト抽出、エンティティー認識、および解析を含むことができる。テキスト抽出手順は、実質的に、文書２３０の内容からテーブルセクション、イメージセクション、テンプレートセクション、およびテキストセクションのデーターを抽出することと、これらを、マッピングを容易にするためにそれらが抽出された文書２３０へのリンクを保存しながら生のオンラインフォーマットから使用可能なフォーマット（たとえば、ハイパーテキストマークアップ言語（ＨＴＭＬ））に変換することとを含む。次に、内容の使用可能フォーマットを、文に分割することができる。１つの実例では、文への内容の分解は、入力として文字列をアセンブルすることと、特定のプロパティーに関して文字列をテストするためにルールのセットを適用することと、特定のプロパティーに基づいて内容を文に分割することとを伴う。例のみとして、テストされる内容の特定のプロパティーは、文の始めおよび終りを判定するために句読法および大文字使用を含むことができる。一連の文が確かめられた後に、各個々の文が、その中の単語を検出し、各単語を物体（たとえば、「ヒンデンブルグ号」）、事象（たとえば、「第２次世界大戦」）、時（たとえば、「９月」）、動詞、または単語の間の区別を促進するためもしくは対象文の意味を理解するために利用できる単語の任意の他のカテゴリーとして潜在的に認識するために、調べられる。

エンティティー認識手順は、クエリーの質問関連キーワード（たとえば、誰、どこ、いつ）に対する特定の回答を提供するので、どの単語が名前であるのかの認識を助ける。実施形態では、単語の認識は、名前として単語を識別することと、意味論的インデックス２６０に質問する時の取出を容易にするためにタグを用いて単語に注釈を付けることとを含む。１つの実例で、名前としての単語の識別は、一致があるかどうかを判定するために名前の事前定義のリスト内で単語をルックアップすることを含む。一致が存在しない場合には、統計情報を使用して、単語が名前であるかどうかを推測することができる。たとえば、統計情報は、「ＵＳＳＥｎｔｅｒｐｒｉｓｅ」など、綴りの複数の一般的な変化を有する場合がある、複雑な名前の語尾変化を認識するのを助けることができる。

解析手順は、実施される時に、上で識別された文の構造への洞察を与える。１つの実例では、これらの洞察が、文法指定コンポーネント２５５のフレームワーク内で維持されるルールを適用することによって提供される。適用される時に、これらのルールまたは文法は、文内の単語の間の関係の表現を抽出するために文の分析を促進する。上で述べたように、これらの表現は、意味論的構造と称し、意味論的解釈コンポーネント２５０が文の文法的構造に関するクリティカル情報（たとえば、動詞、主語、目的語、および類似物）を取り込むことを可能にする。

意味論的解釈コンポーネント２５０は、一般に、単語の間の意味論的関係を認識することによって、文書解析コンポーネント２４０によって生成された意味論的構造（１つまたは複数）での各単語の役割を診断するように構成される。当初に、診断は、意味論的構造の文法的編成を分析することと、これを、それぞれが別個のアイデアおよび特定の事実を表す論理的アサーションに分離することとを含むことができる。これらの論理的アサーションをさらに分析して、アサーションを含む単語のシーケンスのそれぞれの機能を判定することができる。１つの実例では、単語のシーケンスの機能の判定は、項書換え（ｔｅｒｍ−ｒｅｗｒｉｔｉｎｇ）ルールの順序付きシーケンスまたは関連分野で既知の任意の他のヒューリスティックを利用することを含む。

適当な場合には、各単語の機能または役割に基づいて、単語のシーケンスのうちの１つまたは複数を、類義語（すなわち、拡張された単語の特定の意味に対応する他の単語へのリンク）または上位語（すなわち、拡張された単語の一般的な意味に全般的に関係する他の単語へのリンク）を含むように拡張することができる。意味論的解釈コンポーネント２５０によって認識される、単語のこの拡張、各単語が表現で果たす機能（上で述べた）、単語のシーケンスのそれぞれの文法的関係、および意味論的表現に関するすべての他の情報が、意味論的表現として意味論的インデックス２６０で格納できる意味論的表現を構成する。

意味論的インデックス２６０は、インデクシングパイプライン２１０の１つまたは多数のコンポーネントによって導出された意味論的表現を格納するように働き、関連分野で既知の任意の仕方で構成され得る。たとえば、意味論的インデックスを、従来の検索エンジンインデックスに構造的に類似する逆索引として構成することができる。この例示的実施形態では、逆索引は、そのエントリが、単語と、その単語が出現する文書２３０ヘのポインタおよびその中の位置とである、すばやく検索可能なデーターベースである。したがって、意味論的構造を意味論的インデックス２６０に書き込む時には、各単語および関連する機能が、意味論的単語が現れた文書内の文へのポインタと一緒にインデクシングされる。意味論的インデックス２６０のこのフレームワークは、マッチングコンポーネント２６５が、サブミットされたクエリーに対応する意味のある検索結果を回復するために、格納された情報に効率的にアクセスし、ナビゲートし、マッチングすることを可能にする。

クライアントデバイス２１５、クエリー解析コンポーネント２３５、および意味論的解釈コンポーネント２４５は、クエリー条件付けパイプライン２０５を構成する。インデクシングパイプライン２１０に似て、クエリー条件付けパイプライン２０５は、単語のシーケンスから意味のある情報を抽出する。しかし、文書２３０内の一節の処理とは異なって、クエリー条件付けパイプライン２０５は、クエリー２２５内でサブミットされた単語を処理する。たとえば、クエリー解析コンポーネント２３５は、クエリー２２５を受け取り、さまざまな手順を実行して、その意味論的分析のために単語を準備する。これらの手順は、テキスト抽出、エンティティー認識、および解析など、文書解析コンポーネント２４０によって使用される手順に類似するものとすることができる。さらに、クエリー２２５の構造を、文法指定コンポーネント２５５のフレームワーク内および意味論的解釈コンポーネント２４５内で維持されるルールを適用することによって、したがってクエリー２２５の意味のある表現すなわち命題を導出することによって、識別することができる。

諸実施形態では、意味論的解釈コンポーネント２４５は、意味論的解釈コンポーネント２５０が文書２３０内のテキストの一節から導出された意味論的構造を解釈するのと実質的に匹敵する形で、クエリー意味論的表現を処理することができる。他の実施形態では、意味論的解釈コンポーネント２４５は、クエリー２２５を構成するキーワードのストリング（たとえば、質問または句）内のキーワードの文法的関係および／または意味論的関係を識別することができる。たとえば、文法的関係および／または意味論的関係の識別は、単語または句がクエリー２２５の命題の主語（アクションの動作主）、目的語、述語、間接目的語、または時間的位置として機能するかどうかを識別することを含む。もう１つの実例では、命題は、キーワードのそれぞれに関連する論理的言語構造を識別するために評価される。たとえば、評価は、少なくとも１つのキーワードの機能を判定するステップ、機能に基づいて、キーワードを複数の意味を含む論理変数に置換するステップ（たとえば、機能を複数の意味に関連付けるステップ）、およびこれらの意味をクエリーの命題に書き込むステップのうちの１つまたは複数を含むことができる。クエリー２２５のこの命題、キーワード、ならびに命題および／またはキーワードから抽出された情報は、その後、文書２３０から抽出され、意味論的インデックス２６０に格納された意味論的表現との比較のためにマッチングコンポーネント２６５に送られる。

例示的実施形態では、マッチングコンポーネント２６５は、クエリー２２５の命題を意味論的インデックス２６０の意味論的表現と比較して、一致する意味論的表現を確かめる。これらの一致する意味論的表現を、それらがそこから抽出された文書２３０および意味論的表現がそこから導出されたその文書内の位置を関連付けることによって、その文書２３０および位置に戻ってマッピングすることができる。これらの文書２３０は、関連付けられた位置によってターゲティングされるが、ランキングコンポーネント２７０によって収集され、ソートされる。ソートは、関連分野で既知の任意の方法で実行でき、限定なしに、一致の良さによるランキング、返される文書２３０の人気に基づくリスティング、またはクエリー２２５をサブミットするユーザーの属性に基づくソートを含むことができる。これらのランキングされた文書２３０は、検索結果２８５を含み、適当なフォーマットでＵＩディスプレイ２９５に出すためにプレゼンテーションデバイス２７５に伝えられる。

図２の参照を続けると、この例示的なシステムアーキテクチャー２００は、本発明の諸態様を実行するために実施できる適切な環境の一例にすぎず、本発明の使用または機能性の範囲に関する限定を提案することは意図されていない。例示的なシステムアーキテクチャー２００または自然言語エンジン２９０を、図示のコンポーネント２３５、２４０、２４５、２５０、２５５、２６０、２６５、および２７０のいずれか１つまたは組合せに関するいかなる依存性または要件を有するものと解釈してもならない。いくつかの実施形態では、コンポーネント２３５、２４０、２４５、２５０、２５５、２６０、２６５、および２７０のうちの１つまたは複数を、独立型デバイスとして実施することができる。他の実施形態では、コンポーネント２３５、２４０、２４５、２５０、２５５、２６０、２６５、および２７０のうちの１つまたは複数を、クライアントデバイス２１５に直接に統合することができる。図２に示されたコンポーネント２３５、２４０、２４５、２５０、２５５、２６０、２６５、および２７０が、性質および個数において例示的であり、限定的と解釈されてはならないことが、当業者によって理解されるであろう。

したがって、任意の個数のコンポーネントを使用して、本発明の実施形態の範囲内で所望の機能性を達成することができる。図２のさまざまなコンポーネントは、図を明瞭にするために線を用いて図示されているが、実際には、さまざまなコンポーネントの区切りは、それほど明瞭ではなく、隠喩的に、線は、より正確には灰色または不明瞭になるはずである。さらに、図２の一部のコンポーネントは、単一のブロックとして図示されているが、図示は、性質および個数において例示的であり、限定的と解釈してはならない（たとえば、１つのプレゼンテーションデバイス２７５だけが図示されているが、より多数を、クライアントデバイス２１５に通信的に結合することができる）。

ここで図３に移ると、本発明の実施形態による、文書内のテキスト部分から生成される意味論的表現の図３００が示されている。テキスト部分を、たとえば、１つまたは複数の文書の内容から抽出することができ、これらの文書を、インデクシング中の簡単なアクセスのためにデーターストアに格納することができる。一実施形態では、テキスト部分がそこから抽出される文書が、ウェブ文書であるが、他の実施形態の文書は、文書の任意のタイプのコレクションからの任意の種類のテキストベースの文書とすることができる。任意の文書コレクションから取り出された文書などまたはコレクションを用いる特定の文書の分析のためにさえ、任意のタイプの文書を取り出せることが、当業者に明白になるであろう。テキスト部分は、間接話法および他のアティチュードレポートを含むことができ、これらを、ｄｅｎｏｕｎｃｅ（非難する）、ｓａｙ（言う）、ｂｅｌｉｅｖｅ（思う）、ｄｅｓｉｒｅ（望む）、ｄｅｎｙ（拒否する）などであるがもちろんこれらに限定はされない、テキスト部分内で見つかる複数の単語によって識別することができる。これらの単語は、ある種のトピックに対するある人の態度（アティチュード）を記述するので、アティチュードレポートで識別される。間接話法は、ある人からの直接の引用の形をとる場合があり、あるいは、間接的な間接話法である場合がある。次の例が図示され、説明される時に、上で述べたものを含むさまざまな形の間接話法および他のアティチュードレポートが、明白になるであろう。

意味論的表現は、一般に、さまざまな単語の意味、単語の間の関係、および文脈を含むがこれらに限定はされない３つの主要な目的を含む。意味論的表現は、たとえば文書（たとえば、ウェブ文書）内の単語とマッチングされたクエリーからのキーワードに単純に頼ることより完全なテキストの理解を可能にする。ここで、関係は、テキストのより深い分析を可能にするために判定される。図３００は、テキスト部分３０５、関連付けの第１レベル３１０、関連付けの第２レベル３２０、および関連付けの第３レベル３３０を含む。関連付けの各レベル３１０、３２０、および３３０は、１つまたは複数の要素および１つまたは複数の関係要素を含む。関係要素は、図３の実施形態ではアイテム３１２、３１４、３１６、３２２、３３２、および３３４によって表される。要素は、単語「ｄｅｎｏｕｎｃｅ」、「Ｂｕｓｈ（ブッシュ）」、「Ｗａｓｈｉｎｇｔｏｎ（ワシントン）」、「ｃａｌｌｓ（要求）」、「ｗｉｔｈｄｒａｗ（撤退する）」、「ＵＳ（米国）」、および「Ｉｒａｑ（イラク）」を含む。また、関連付けのレベルごとに示されているのが、報告する行為であり、この報告する行為は、ここでは、単語「ｄｅｎｏｕｎｃｅ」、「ｃａｌｌｓ」、および「ｗｉｔｈｄｒａｗ」である。したがって、いくつかの実施形態では、「ｄｅｎｏｕｎｃｅ」、「ｃａｌｌｓ」、および「ｗｉｔｈｄｒａｗ」など、要素であるが、報告する行為としても分類されるいくつかの単語がある場合がある。

図３の実施形態を明瞭に示すために、意味論的表現が、テキスト部分３０５について図示され、このテキストは、次のとおりである「ＩｎＷａｓｈｉｎｇｔｏｎ，ＧｅｏｒｇｅＢｕｓｈｄｅｎｏｕｎｃｅｄｃａｌｌｓｆｏｒｔｈｅＵＳｔｏｗｉｔｈｄｒａｗｆｒｏｍＩｒａｑ．」。図３が、下で再現される意味論的表現の図であることに留意されたい。この例は、例示のみのために、図フォーマットと意味論的表現との両方で提供される。いくつかの実施形態では、意味論的表現は、生成され、図２の意味論的インデックス２６０などの意味論的インデックスに格納されるが、図は生成されない。これらの実施形態では、図は、図示および説明のみのために再生される。
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｇｅｎｔ：Ｂ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣｔｏｐｉｃ：Ｃｏｎｔｅｘｔ（３）
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣｌｏｃａｔｉｏｎ：Ｗ
Ｃｏｎｔｅｘｔ（３）：ＣＬｔｏｐｉｃ：Ｃｏｎｔｅｘｔ（５）
Ｃｏｎｔｅｘｔ（５）：ＷＴＨＤａｇｅｎｔ：Ｕ
Ｃｏｎｔｅｘｔ（５）：ＷＴＨＤｌｏｃａｔｉｏｎ：Ｉ

ｗｏｒｄ：Ｂ［Ｇｅｏｒｇｅ＿Ｂｕｓｈ，ｐｅｒｓｏｎ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：ＤＮＣ［ｄｅｎｏｕｎｃｅ，ｃｒｉｔｉｃｉｚｅ，ｓａｙ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：Ｗ［Ｗａｓｈｉｎｇｔｏｎ＿Ｄ”，ｃｉｔｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：ＣＬ［ｃａｌｌ，ｓａｙ］Ｃｏｎｔｅｘｔ（３）
ｗｏｒｄ：ＷＴＨＤ［ｗｉｔｈｄｒａｗ，ｍｏｖｅ］Ｃｏｎｔｅｘｔ（５）
ｗｏｒｄ：Ｕ［Ｕｎｉｔｅｄ＿Ｓｔａｔｅｓ＿ｏｆ＿Ａｍｅｒｉｃａ，ｃｏｕｎｔｒｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（５）
ｗｏｒｄ：Ｉ［Ｉｒａｑ，ｃｏｕｎｔｒｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（５）
図示されているように、テキスト部分（すなわち、図３のアイテム３０５）内で識別されている、本明細書で文脈とも称する３レベルの関連付けがある。関連付けのレベルまたは文脈は、Ｃｏｎｔｅｘｔ（ｔｏｐ）、Ｃｏｎｔｅｘｔ（３）、およびＣｏｎｔｅｘｔ（５）である。関連付けのレベルは、報告する行為のトピックであるものとして識別され、報告する行為は、一般にアクションワード（ａｃｔｉｏｎｗｏｒｄ）であり、いくつかの実施形態では動詞である。ここでは、「ｄｅｎｏｕｎｃｅ」が、関連付けの第１レベル３１０に関連する報告する行為である。関連付けの第２レベル３２０は、関連付けの第１レベル３１０で識別された報告する行為「ｄｅｎｏｕｎｃｅ」のトピックと考えることができる。同様に、関連付けの第３レベル３３０は、関連付けの第２レベル３２０で識別された報告する行為「ｃａｌｌｓ」のトピックとすることができる。

すべてが同一の形で成り立つ関係の束を一緒に集めるために、関連付けのレベルが形成される。Ｃｏｎｔｅｘｔ（ｔｏｐ）などの関連付けのトップレベルは、文のすべての質問に従って成り立つレベルとすることができる。たとえば、図３の実施形態では、ＢｕｓｈがＷａｓｈｉｎｇｔｏｎで声明を出したことは、彼が何を非難したかに関わりなく真とすることができる。Ｂｕｓｈによって非難された声明は、埋め込まれた文脈であり、その埋め込まれた文脈は、この実施形態では、「ｃａｌｌｓｆｏｒｔｈｅＵＳｔｏｗｉｔｈｄｒａｗｆｒｏｍＩｒａｑ（米国がイラクから撤退することの要求）」である。この例によれば、イラクからの撤退は行われていないので、この声明は、関連付けの第２レベルに配置され、この第２レベルは、ここでは、仮説文脈と呼ぶことができる。上で概要を示した文脈構造すなわち関連付けのレベルを使用することによって、異なる意味論的関係を、異なる情況または異なる形で成り立つものとして識別することができる。

報告する行為を、複数の要因に基づいて判定することができ、報告する行為を、関連付けのレベルごとに識別することができる。報告する行為は、いくつかの実例では、図３の実施形態の「ｄｅｎｏｕｎｃｅ」、「ｃａｌｌｓ」、および「ｗｉｔｈｄｒａｗ」などのアクションワードである。報告する行為を、たとえば、動詞、名詞、および類似物とすることができ、報告する行為は、通常、それを囲むテキストによってまたはその単語が文でどのように使用されているかによって判定される。このタイプの文法情報は、たとえば、ルールのセットを適用することによって判定することができ、このルールのセットは、たとえば図２の文法指定コンポーネント２５５のフレームワーク内で維持することができる。ルールのセットまたは文法を適用することによって、単語の関係が判定され、この判定は、報告する行為の識別につながる。

図３に示されているように、報告する行為は、単語または句などの要素にリンクされ、あるいは、関連付けの異なるレベルにリンクされ得る。報告する行為は、事象の役割として識別され、事象の役割は、この例では、非難事象と呼ぶことができる。たとえば、「ｄｅｎｏｕｎｃｅ」は、関連付けの第１レベル３１０の報告する行為として識別される。単語「ｄｅｎｏｕｎｃｅ」は、単語「Ｂｕｓｈ」および単語「Ｗａｓｈｉｎｇｔｏｎ」にリンクされ、この両方の単語が、意味論的に分析されているテキスト部分に現れる。「ｄｅｎｏｕｎｃｅ」が「Ｂｕｓｈ」にリンクされるのは、「Ｂｕｓｈ」が単語「ｄｅｎｏｕｎｃｅ」の動作主であるからである。というのは、Ｂｕｓｈが実際に非難（ｄｅｎｏｕｎｃｉｎｇ）を行っているからである。したがって、ａｇｅｎｔ（動作主）３１２は、この２つの単語を一緒にリンクし、したがって意味論的関係を形成する関係要素である。同様に、ｌｏｃａｔｉｏｎ（位置）３１４は、２つの単語（「ｄｅｎｏｕｎｃｅ」および「Ｗａｓｈｉｎｇｔｏｎ」を含む）を一緒にリンクする関係要素である。関係要素を文脈の異なるレイヤ内の単語（１つまたは複数）とリンクするために、この２つを一緒にリンクするトピックを見つけることができる。たとえば、どの事象が非難されているのかを判定することができ、それが、報告する行為「ｄｅｎｏｕｎｃｅ」のトピックである可能性がある。ここで、あるものの要求（ｃａｌｌｓ）が「ｄｅｎｏｕｎｃｅ」のｔｏｐｉｃ（トピック）３１６である可能性があり、さらに、イラクからの米国の撤退（ｗｉｔｈｄｒａｗａｌ）を、「ｃａｌｌｓ」すなわち要求事象のｔｏｐｉｃ３２２として識別することができ、この「ｃａｌｌｓ」は、関連付けの第２レベル内の報告する行為である。関連付けの第３レベル３３０内では、「ＵＳ」がｗｉｔｈｄｒａｗａｌのａｇｅｎｔ３３２として識別され、「Ｉｒａｑ」がｗｉｔｈｄｒａｗａｌのｌｏｃａｔｉｏｎ３３４である。

要素は、生の内容から解析され、ここでは、「ｄｅｎｏｕｎｃｅ」、「Ｂｕｓｈ」、「Ｗａｓｈｉｎｇｔｏｎ」、「ｃａｌｌｓ」、「ｗｉｔｈｄｒａｗ」、「ＵＳ」、および「Ｉｒａｑ」などの単語を含む。これらの単語のうちの１つまたは複数は、意味論的表現内で論理変数によって表すことのできる類似する意味を有する可能性がある。この論理変数は、要素に類似する意味を有する複数の類義語、要素が収まるカテゴリーを表すことができ、また、要素が有することのできる複数の意味を表すことができる。いくつかの要素は、正しい意味を判定するのが他の要素より簡単である。意味は、１つの例では、要素がテキスト部分の文脈内でどのように使用されるかに基づいて判定することができる。上で示したように、「Ｂｕｓｈ」は、「ＧｅｏｒｇｅＢｕｓｈ」として識別され、これは、人として識別される。「ｄｅｎｏｕｎｃｅ」すなわち報告する行為は、ここで例示のみのために提供される「ｃｒｉｔｉｃｉｚｅ（批判する）」と「ｓａｙ（言う）」との両方に関連する。「ｄｅｎｏｕｎｃｅ」に類似する意味を有する複数の他の単語がある場合があり、これに関連すると判定される場合もある。また、「Ｗａｓｈｉｎｇｔｏｎ」は、都市を含むカテゴリーおよび位置に関連する。「ｗｉｔｈｄｒａｗ」は、「ｍｏｖｅ（移動する）」に関連し、「ＵＳ」と「Ｉｒａｑ」との両方は、国および位置として分類される。

図３に示されたものなどの意味論的表現は、ユーザーのクエリーが受け取られ、分析された後に、よりよく、より正確でより関連する検索結果をユーザーに返すことを可能にする。たとえば、テキスト（たとえば、ターゲットの声明）「ＩｎＷａｓｈｉｎｇｔｏｎ，ＧｅｏｒｇｅＢｕｓｈｄｅｎｏｕｎｃｅｄｃａｌｌｓｆｏｒｔｈｅＵＳｔｏｗｉｔｈｄｒａｗｆｒｏｍＩｒａｑ」を解析し、上で説明した意味論的関係を展開することによって、「ＷｈａｔｄｉｄＢｕｓｈｓａｙａｂｏｕｔＷａｓｈｉｎｇｔｏｎ．（ブッシュがワシントンに関して何を言ったか）」ではなく「ＷｈａｔｄｉｄＢｕｓｈｓａｙａｂｏｕｔＩｒａｑ（ブッシュがイラクに関して何を言ったか）」などの自然言語クエリーを受け取った時に、ユーザーにこのテキストを返すことができる。「ｄｅｎｏｕｎｃｉｎｇ」を「ｓａｙｉｎｇ」の１つの形として識別できるという前提に基づく従来のキーワード検索は、ターゲット文内で用語「Ｗａｓｈｉｎｇｔｏｎ」、「ＵＳ」、および「Ｉｒａｑ」に等しい重要性を与え、これは、「ｓａｙＢｕｓｈＷａｓｈｉｎｇｔｏｎ」などのキーワードクエリーによる取出につながる。用語「ｄｅｎｏｕｎｃｅｄ」をその直接の引数「ｃａｌｌｓ」にリンクしたがその先には進まなかった、より高度なインデクシング方式は、非難がイラクに関するものであることを検出できなかったはずである。用語「Ｗａｓｈｉｎｇｔｏｎ」は、分析されているテキスト部分の内部に埋め込まれたものとしては識別されないので、ｌｏｃａｔｉｏｎ３１４の報告する行為として以外には「ｄｅｎｏｕｎｃｅ」にリンクされることから除外される。

図４に、本発明の実施形態による、文書内のテキスト部分から生成される意味論的表現の図４００を示す。やはり、テキスト部分は、間接話法および他のアティチュードレポートを含むことができ、これらを、ｄｅｎｏｕｎｃｅ、ｓａｙ、ｂｅｌｉｅｖｅ、ｄｅｓｉｒｅ、ｄｅｎｙ、その他などであるがもちろんこれらに限定はされない、テキスト部分内で見つかる複数の単語によって識別することができる。図３の実施形態は、単語の間の意味論的関係の分析の結果として意味論的表現を提供するが、この表現を、動詞「ｄｅｎｏｕｎｃｅ」に対するどの引数が非難の文脈を伝えるのかに関する情報によって補足することができる。追加の辞書的情報を追加して、非難が何に関するものであるかを示すことができる。下は、図３で使用されたものと同一のテキスト、「ＩｎＷａｓｈｉｎｇｔｏｎ，ＧｅｏｒｇｅＢｕｓｈｄｅｎｏｕｎｃｅｄｃａｌｌｓｆｏｒｔｈｅＵＳｔｏｗｉｔｈｄｒａｗｆｒｏｍＩｒａｑ」の意味論的表現である。しかし、ここでは、「ａｂｏｕｔ」関係が、図３の実施形態で形成された関係に加えて形成されて、クエリーを受け取った後のさらにより関係する検索結果をもたらす。
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｇｅｎｔ：Ｂ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣｔｏｐｉｃ：Ｃｏｎｔｅｘｔ（３）
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣｌｏｃａｔｉｏｎ：Ｗ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｂｏｕｔ：ＣＬ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｂｏｕｔ：ＷＴＨＤ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｂｏｕｔ：Ｕ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｂｏｕｔ：Ｉ
Ｃｏｎｔｅｘｔ（３）：ＣＬｔｏｐｉｃ：Ｃｏｎｔｅｘｔ（５）
Ｃｏｎｔｅｘｔ（５）：ＷＴＨＤａｇｅｎｔ：Ｕ
Ｃｏｎｔｅｘｔ（５）：ＷＴＨＤｌｏｃａｔｉｏｎ：Ｉ

ｗｏｒｄ：Ｂ［Ｇｅｏｒｇｅ＿Ｂｕｓｈ，ｐｅｒｓｏｎ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：ＤＮＣ［ｄｅｎｏｕｎｃｅ，ｃｒｉｔｉｃｉｚｅ，ｓａｙ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：Ｗ［Ｗａｓｈｉｎｇｔｏｎ＿ＤＣ，ｃｉｔｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：ＣＬ［ｃａｌｌ，ｓａｙ］Ｃｏｎｔｅｘｔ（３）
ｗｏｒｄ：ＷＴＨＤ［ｗｉｔｈｄｒａｗ，ｍｏｖｅ］Ｃｏｎｔｅｘｔ（５）
ｗｏｒｄ：Ｕ［Ｕｎｉｔｅｄ＿Ｓｔａｔｅｓ＿ｏｆ＿Ａｍｅｒｉｃａ，ｃｏｕｎｔｒｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（５）
ｗｏｒｄ：Ｉ［Ｉｒａｑ，ｃｏｕｎｔｒｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（５）
「ａｂｏｕｔｎｅｓｓ（アバウトネス）」リンキングをそれによって計算でき、記録できるさまざまな方法がある。１つの形は、トピック引数から始めて文脈および引数リンケージの推移閉包を計算し、この閉包内のすべての用語を報告が関するものとしてマークすることである。これを、上の意味論的表現に示し、図４にも示す。

図４は、意味論的に表現される、テキスト部分４０５を示す。図３と同様に、図４は、３レベルの関連付けを示し、この３レベルは、関連付けの第１レベル４１０、関連付けの第２レベル４３０、および関連付けの第３レベル４４０である。「ｄｅｎｏｕｎｃｅ」が、関連付けの第１レベル４１０の報告する行為であり、「ｃａｌｌｓ」が、関連付けの第２レベル４３０の報告する行為であり、「ｗｉｔｈｄｒａｗ」が、関連付けの第３レベル４４０の報告する行為である。図示されているように、「ｄｅｎｏｕｎｃｅ」は、以前の関係に加えて「ａｂｏｕｔ」関係が今は示されているので、今は、図３の実施形態より多数の意味論的関係を有する。意味論的関係は、意味論的関係が、「ｄｅｎｏｕｎｃｅ」と、関係要素ａｇｅｎｔ４１２を伴って「Ｂｕｓｈ」、関係要素ｌｏｃａｔｉｏｎ４１４を伴って「Ｗａｓｈｉｎｇｔｏｎ」、および非難事象の関係要素ｔｏｐｉｃ４１６を伴って関連付けの第２レイヤ４３０のそれぞれとの間で判定されている。さらに、関連付けの第３レイヤ４４０は、ｃａｌｌｓのｔｏｐｉｃ４３２であり、「ＵＳ」は、ｗｉｔｈｄｒａｗのａｇｅｎｔ４４２であり、「Ｉｒａｑ」は、ｗｉｔｈｄｒａｗのｌｏｃａｔｉｏｎ４４４である。

これらの関係に加えて、関連付けの第３レイヤ４４０内の「ｗｉｔｈｄｒａｗ」にリンクされたａｂｏｕｔ４１８、関連付けの第２レイヤ４３０内の「ｃａｌｌｓ」にリンクされたａｂｏｕｔ４２０、関連付けの第３レイヤ４４０内の「ＵＳ」にリンクされたａｂｏｕｔ４２２、およびやはり関連付けの第３レイヤ４４０内の「Ｉｒａｑ」にリンクされたａｂｏｕｔ４２４を含む、複数の「ａｂｏｕｔ」関係が図示されている。したがって、非難イベントは、ｗｉｔｈｄｒａｗａｌに関し、ｃａｌｌｓに関し、ＵＳに関し、Ｉｒａｑに関する。図示されているように、非難イベントは、Ｂｕｓｈに関するものではなく、Ｗａｓｈｉｎｇｔｏｎに関するものでもない。これらの「ａｂｏｕｔ」関係の判定ならびにたとえばＢｕｓｈおよびＷａｓｈｉｎｇｔｏｎとの「ａｂｏｕｔ」関係の回避は、ユーザーに返される関連しない検索結果を除去する。

図５を参照すると、本発明の実施形態による、文書内のテキスト部分から生成される意味論的表現の図５００が示されている。この実施形態の意味論的表現を、下で、次のテキスト部分５０５、「ＩｎＷａｓｈｉｎｇｔｏｎ，ＧｅｏｒｇｅＢｕｓｈｄｅｎｏｕｎｃｅｄｃａｌｌｓｆｏｒｔｈｅＵＳｔｏｗｉｔｈｄｒａｗｆｒｏｍＩｒａｑ」について示す。
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｇｅｎｔ：Ｂ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣｔｏｐｉｃ：Ｃｏｎｔｅｘｔ（３）
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣｌｏｃａｔｉｏｎ：Ｗ
Ｃｏｎｔｅｘｔ（３）：ＣＬｔｏｐｉｃ：Ｃｏｎｔｅｘｔ（５）
Ｃｏｎｔｅｘｔ（３）：ＣＬｓｐｏｋｅｎ：ＤＮＣ
Ｃｏｎｔｅｘｔ（５）：ＷＴＨＤａｇｅｎｔ：Ｕ
Ｃｏｎｔｅｘｔ（５）：ＷＴＨＤｌｏｃａｔｉｏｎ：Ｉ
Ｃｏｎｔｅｘｔ（５）：ＷＴＨＤｓｐｏｋｅｎ：ＤＮＣ

ｗｏｒｄ：Ｂ［Ｇｅｏｒｇｅ＿Ｂｕｓｈ，ｐｅｒｓｏｎ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：ＤＮＣ［ｄｅｎｏｕｎｃｅ，ｃｒｉｔｉｃｉｚｅ，ｓａｙ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：Ｗ［Ｗａｓｈｉｎｇｔｏｎ＿ＤＣ，ｃｉｔｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：ＣＬ［ｃａｌｌ，ｓａｙ］Ｃｏｎｔｅｘｔ（３）
ｗｏｒｄ：ＷＴＨＤ［ｗｉｔｈｄｒａｗ，ｍｏｖｅ］Ｃｏｎｔｅｘｔ（５）
ｗｏｒｄ：Ｕ［Ｕｎｉｔｅｄ＿Ｓｔａｔｅｓ＿ｏｆ＿Ａｍｅｒｉｃａ，ｃｏｕｎｔｒｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（５）
ｗｏｒｄ：Ｉ［Ｉｒａｑ，ｃｏｕｎｔｒｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（５）
上で示したように、図４の事例のようにレポートが関する各要素をマークするのではなく、このインデックスは、各報告された事実の題目だけをマークする。たとえば、図５は、「ｄｅｎｏｕｎｃｅ」が関連付けの第１レベル５１０の報告する行為として識別され、関係要素ａｇｅｎｔ５１２によって「Ｂｕｓｈ」に、関係要素ｌｏｃａｔｉｏｎ５１４によって「Ｗａｓｈｉｎｇｔｏｎ」になど、さまざまな要素にリンクされることを示す。さらに、「ｄｅｎｏｕｎｃｅ」のｔｏｐｉｃ５１６は、「ｃａｌｌｓｆｏｒｔｈｅＵＳｔｏｗｉｔｈｄｒａｗｆｒｏｍＩｒａｑ」として識別され、これは、部分的には関連付けの第２レベル５３０内、部分的には関連付けの第３レベル５４０内で実施される。「ｃａｌｌｓ」は、関係要素ｔｏｐｉｃ５３２によって関連付けの第３レベル５４０にリンクされる。関連付けの第３レベル５４０内では、「ｗｉｔｈｄｒａｗ」が、それぞれ関係要素ａｇｅｎｔ５４２およびｌｏｃａｔｉｏｎ５４４によって、「ＵＳ」と「Ｉｒａｑ」との両方にリンクされる。

上で定義した関係に加えて、「ａｂｏｕｔ」関係の代わりに、ｓｐｏｋｅｎ（話された）と呼ばれる２つの関係要素があり、「ｗｉｔｈｄｒａｗ」にリンクされたｓｐｏｋｅｎ５１８および「ｃａｌｌｓ」にリンクされたｓｐｏｋｅｎ５２０として図示されている。このフレームワークは、それでも、「ｄｅｎｏｕｎｃｅ」と「ｗｉｔｈｄｒａｗ」の間、および「ＵＳ」とさらに「Ｉｒａｑ」の間の接続を可能にする。相違は、図５の実施形態のこれらの関係が、直接の関係ではなく間接の関係であることである。上で説明したように、この実施形態を利用する際のトレードオフは、インデックス内での減らされたメモリー使用量と、クエリーが受け取られた後の計算に必要な増加した時間である。

図５の参照を続けると、空間−時間トレードオフの概念を実証する、たとえば図４の実施形態の代替実施形態が示されている。図４の図および図５の図の比較によって理解できるとおり、図５の図は、より単純に見える。というのは、この図が、「ａｂｏｕｔ」関係要素を使用することによる「ａｂｏｕｔ」関係を明示的には全く含まないからである。図５は、より少数の識別された関係を含むので、インデックス内でより少量の空間を占め、したがって、インデックスが格納されるデーターストア内でより少量の空間を占める。より少ないメモリーおよびストレージ空間が図５の実施形態に使用され得るが、「ａｂｏｕｔ」関係がまだ識別されていないので、このインデックス内の意味論的関係とクエリー命題をマッチングするには、より長い時間が必要になる可能性がある。言い換えると、「ａｂｏｕｔ」関係は、すばやい比較を可能にするためにこのインデックス内で明示的にコーディングされてはいない。これは、バックエンドでのはるかにより多い計算を必要とし、これは、ユーザーにとっての増えた待ち時間をもたらす可能性がある。その代わりに、図４の実施形態は、前もって「ａｂｏｕｔ」関係を明示的に計算し、それらの関係をインデックスに格納し、これは、意味論的表現とのクエリー命題のすばやい比較を可能にし、ユーザーがクエリーを入力した後の計算に必要なより短い時間をもたらす。

図６に、本発明の実施形態による、文書内のテキスト部分から生成される意味論的表現の図６００を示す。図６の実施形態は、図３および４の実施形態に似ているが、これらより単純な例を示す。テキスト部分６０５は、「ＪｏｈｎｂｅｌｉｅｖｅｓｔｈａｔＭａｒｙｗｅｎｔｔｏＷａｓｈｉｎｇｔｏｎ（ジョンはメリーがワシントンに行ったと思っている）」と述べるものである。下は、テキスト部分６０５の意味論的表現である。
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＢＥＬａｇｅｎｔ：Ｊ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＢＥＬｔｏｐｉｃ：Ｃｏｎｔｅｘｔ（２）
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＢＥＬａｂｏｕｔ：Ｇ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＢＥＬａｂｏｕｔ：Ｍ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＢＥＬａｂｏｕｔ：Ｗ
Ｃｏｎｔｅｘｔ（２）：Ｇａｇｅｎｔ：Ｍ
Ｃｏｎｔｅｘｔ（２）：Ｇｌｏｃａｔｉｏｎ：Ｗ

ｗｏｒｄ：Ｊ［Ｊｏｈｎ，ｐｅｒｓｏｎ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：ＢＥＬ［ｂｅｌｉｅｖｅ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：Ｗ［Ｗａｓｈｉｎｇｔｏｎ＿ＤＣ，ｃｉｔｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（２）
ｗｏｒｄ：Ｇ［ｇｏ，ｍｏｖｅ］Ｃｏｎｔｅｘｔ（２）
ｗｏｒｄ：Ｍ［Ｍａｒｙ，ｐｅｒｓｏｎ］Ｃｏｎｔｅｘｔ（２）
生の内容から解析された要素は、「Ｊｏｈｎ」、「ｂｅｌｉｅｖｅ」、「ｇｏ」、「Ｍａｒｙ」、および「Ｗａｓｈｉｎｇｔｏｎ」を含む。「ｂｅｌｉｅｖｅ」は、関連付けの第１レベル６１０内の報告する行為として識別され、「ｇｏ」は、関連付けの第２レベル６３０内の報告する行為である。上で定義した関係要素は、要素を一緒にリンクし、関連付けのタイプを記述し、ａｇｅｎｔ６１２、ｔｏｐｉｃ６１４、ａｂｏｕｔ６１６、ａｂｏｕｔ６１８、ａｂｏｕｔ６２０、ａｇｅｎｔ６３２、およびｌｏｃａｔｉｏｎ６３４を含む。関連付けの第２レベル６３０は、「ｂｅｌｉｅｖｅ」のトピックであり、「ｂｅｌｉｅｖｅ」という報告する行為に「関する（ａｂｏｕｔ）」３つの単語がある。「ｂｅｌｉｅｖｅ」は「Ｍａｒｙ」、Ｍａｒｙが「行った（ｗｅｎｔ）」場所（たとえば、ｇｏ）、およびＭａｒｙが行った場所（たとえば、「Ｗａｓｈｉｎｇｔｏｎ」）に関する。やはり、いくつかの実施形態では、論理変数を要素に置換することができ、論理変数を、複数の類義語、その要素または単語のさまざまな意味、または類似物に関連付けることができる。

ここで図７に移ると、本発明の実施形態による、検索クエリーから生成される命題の図７００が示されている。命題は、意味論的表現（たとえば、ウェブ文書から導出される内容の表現）に似た形で生成される。ここで、クエリー７０５は、「ＷｈｏｓａｉｄｓｏｍｅｔｈｉｎｇａｂｏｕｔＩｒａｑ？（イラクについて何かを言ったのは誰か）」である。この命題を、下に示す。
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＳＹ−２ａｇｅｎｔ：Ｐ−２
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＳＹ−２ｔｏｐｉｃ：Ｅ−２
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＳＹ−２ａｂｏｕｔ：Ｉ−２

ｗｏｒｄ：Ｐ−２［ｐｅｒｓｏｎ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：ＳＹ−２［ｓａｙ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：Ｅ−２［＊］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：Ｉ−２［Ｉｒａｑ，ｃｏｕｎｔｒｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
クエリーに対する解析および意味論的分析の実行は、通常は、文書の内容に対する同一の分析の実行よりはるかに単純である。というのは、クエリーが、一般に長さにおいてより短く、図７に示されているように１レベルの関連付けだけを含む可能性があるからである。関連付けのレベル７１０は、「Ｐｅｒｓｏｎ」、「ｓａｙ」、および「Ｉｒａｑ」を含む、解析されまたは識別された複数の要素を含む。追加の要素があるが、これは、１つの単語だけではなく多数のものとすることができるので、ワイルドカードに似ている。この追加要素は、クエリーからの単語「ｓｏｍｅｔｈｉｎｇ」を表す。一実施形態では、「ｓｏｍｅｔｈｉｎｇ」など、何にでも一致することができる要素を、命題が意味論的表現とマッチングされる時に制限を課さないようにするために、クエリーが解析されている時にクエリーから抽出することができる。

図７に示された命題は、複数の関係要素に加えて、報告する行為「ｓａｙ」をも含む。ａｇｅｎｔ７１が、「ｐｅｒｓｏｎ」を「ｓａｙ」にリンクする。ａｂｏｕｔ７１４は、「ｓａｙ」を「Ｉｒａｑ」にリンクし、ｔｏｐｉｃ７１６は、「ｓａｙ」をワイルドカード要素にリンクし、このワイルドカード要素は、上で述べたように、何にでもなることができる。図示されているように、単語「ｗｈｏ」は、命題では「ｐｅｒｓｏｎ」に置換される。

上で図３および４に関して示したものなどの文書（たとえば、ウェブ文書）の内容から生成される意味論的表現および上で図６に関して示したものなどのクエリーから生成される命題を、受け取られたクエリーからの最も関連する検索結果を判定するために、マッチングするかリンクすることができる。たとえば、下の意味論的表現は、意味論的表現および命題のマッチングを示す。マッチは、互いに隣接して示されている。
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｇｅｎｔ：ＢＣｏｎｔｅｘｔ（ｔｏｐ）：ＳＹ−２ａｇｅｎｔ：Ｐ−２
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣｔｏｐｉｃ：Ｃｏｎｔｅｘｔ（３）Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＳＹ−２ｔｏｐｉｃ：Ｅ−２
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣｌｏｃａｔｉｏｎ：Ｗ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｂｏｕｔ：ＣＬ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｂｏｕｔ：ＷＴＨＤ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｂｏｕｔ：Ｕ
Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｂｏｕｔ：ＩＣｏｎｔｅｘｔ（ｔｏｐ）：ＳＹ−２ａｂｏｕｔ：Ｉ−２
Ｃｏｎｔｅｘｔ（３）：ＣＬｔｏｐｉｃ：Ｃｏｎｔｅｘｔ（５）
Ｃｏｎｔｅｘｔ（５）：ＷＴＨＤａｇｅｎｔ：Ｕ
Ｃｏｎｔｅｘｔ（５）：ＷＴＨＤｌｏｃａｔｉｏｎ：Ｉ

ｗｏｒｄ：Ｂ［Ｇｅｏｒｇｅ＿Ｂｕｓｈ，ｐｅｒｓｏｎ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：Ｐ−２［ｐｅｒｓｏｎ］
Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：ＤＮＣ［ｄｅｎｏｕｎｃｅ，ｃｒｉｔｉｃｉｚｅ，ｓａｙ］Ｃｏｎｔｅｘｔ（ｔｏｐ）ｗｏｒｄ：ＳＹ−２［ｓａｙ］
Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：Ｗ［Ｗａｓｈｉｎｇｔｏｎ＿ＤＣ，ｃｉｔｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：ＣＬ［ｃａｌｌ，ｓａｙ］Ｃｏｎｔｅｘｔ（３）
ｗｏｒｄ：Ｅ−２［＊］
Ｃｏｎｔｅｘｔ（ｔｏｐ）
ｗｏｒｄ：ＷＴＨＤ［ｗｉｔｈｄｒａｗ，ｍｏｖｅ］Ｃｏｎｔｅｘｔ（５）
ｗｏｒｄ：Ｕ［Ｕｎｉｔｅｄ＿Ｓｔａｔｅｓ＿ｏｆ＿Ａｍｅｒｉｃａ，ｃｏｕｎｔｒｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（５）
ｗｏｒｄ：Ｉ［Ｉｒａｑ，ｃｏｕｎｔｒｙ，ｌｏｃａｔｉｏｎ］Ｃｏｎｔｅｘｔ（５）
ｗｏｒｄ：Ｉ−２［Ｉｒａｑ，ｃｏｕｎｔｒｙ，ｌｏｃａｔｉｏｎ］
Ｃｏｎｔｅｘｔ（ｔｏｐ）
動作主に対する動作主の一致など、関係要素の一致がある場合には、それらの関係要素に関連する要素を検査して、単語が同一であるかどうか、または似ているかどうかを判定する。上では、検索を広げるために「ｄｅｎｏｕｎｃｅ」が「ｓａｙ」に関連すると述べられ、同一の理由から「Ｂｕｓｈ」は「ｐｅｒｓｏｎ」に関連する。したがって、Ｃｏｎｔｅｘｔ（ｔｏｐ）：ＤＮＣａｇｅｎｔ：ＢとＣｏｎｔｅｘｔ（ｔｏｐ）：ＳＹ−２ａｇｅｎｔ：Ｐ−２との間で一致が見つかる。

図８に、本発明の実施形態による、文書内のテキスト部分（テキスト部分は２つの文を含む）から生成される意味論的表現の図８００を示す。図８の実施形態は、複数の文を、特にそれらの文が関係する場合に、単一の意味論的表現で表すことができることを示す。ここでは、両方の文が、同一の、人Ｂｕｓｈによって書かれた。したがって、両方の文を単一の表現に置くことが、意味をなし、関連する。任意の個数の文または句さえ、意味論的表現を生成するために一緒にグループ化できることに留意されたい。たとえば、文書（たとえば、ウェブ文書）から抽出された内容を解析するプロセスは、使用される句読法および大文字使用など、特定の特性について文字列をテストするためにルールのセットを適用することによって実行することができる。ルールのこのセットは、これらの特性を理解することによって、テキスト部分８０５および８１０として図８に示されたものなどの、一緒に属するさまざまな文または句を判定することができる場合がある。このプロセスは、図２のコンポーネント２４０などの文書解析コンポーネントによって実行することができる。

第１のテキスト部分８０５について、関連付けの２つのレベルが図示されている。関連付けの第１レベル８２０（たとえば、Ｔｏｐｃｏｎｔｅｘｔ（ｔ））および関連付けの第２レベル８４０（たとえば、Ｃｏｎｔｅｘｔ（ｃｔｘ−７））は、関連付けの第１レベル８２０内に配置された報告する行為「ｓａｙ」によって直接にリンクされる。「ｓａｙ」および関連付けの第２レベル８４０は、ｔｏｐｉｃ関係要素８２４によって関連付けられ、その結果、文「ｃａｌｌｓｔｏｗｉｔｈｄｒａｗａｒｅｂａｄ」が、ブッシュが言ったことのトピックになっている。複数の「ａｂｏｕｔ」関係も形成され、上で述べたように、検索結果のより高い精度を可能にする。関連付けの第１レベル８２０内で、「ｓａｙ」は、ａｇｅｎｔ関係要素８２２を介して「Ｂｕｓｈ」にリンクされる。というのは、Ｂｕｓｈが、これらの単語を話したか言った人または動作主であるからである。さらに、ａｂｏｕｔ関係要素８２６、８２８、および８３０は、それぞれ、「ｓａｙ」から「ｗｉｔｈｄｒａｗ」、「ｃａｌｌｓ」、および「ｂａｄ」にリンクされる。これらの「ａｂｏｕｔ」関係または関連付けは、クエリー命題に見られる類似する関係へのこれらの関係の効率的で有効なマッチングを可能にする。さらに、関係付けの第２レイヤ８４０内では、報告する行為「ｃａｌｌｓ」が、関係要素ｔｏｐｉｃ８４２によって「ｗｉｔｈｄｒａｗ」に直接にリンクされ、関係要素ｍｏｄｉｆｉｅｒ（修飾子）８４４によって「ｂａｄ」にリンクされる。

第１のテキスト部分８０５に関連する図を下りることのできる複数の形があることに留意されたい。たとえば、「ｗｉｔｈｄｒａｗ」に達するために、１つの経路は、「ａｂｏｕｔｎｅｓｓ」関係（たとえば、関係要素ａｂｏｕｔ８２６）を利用することによって「ｓａｙ」から「ｗｉｔｈｄｒａｗ」に直接に進むことである。もう１つの経路は、「ｗｉｔｈｄｒａｗ」が「ｃａｌｌｓ」のトピックなので、まず関係要素ａｂｏｕｔ８２８を利用して「ｃａｌｌｓ」に達し、次に関係要素ｔｏｐｉｃ８４２によって「ｗｉｔｈｄｒａｗ」にリンクすることによって、「ｗｉｔｈｄｒａｗ」に間接に達する。さらに、関係要素ｔｏｐｉｃ８２４を使用することによって、関係付けの第２レイヤ８４０に達することができ、ここで、「ｗｉｔｈｄｒａｗ」が、その関係付けの第２レイヤ８４０内で見つけられる。

第２のテキスト部分８１０を第１のテキスト部分とは別々に見ると、報告する行為「ｓｔａｙ」が、そのテキスト部分について識別される。このテキスト部分は、かなり単純であり、短く、したがって、関連付けの１つのレベル８５０だけが識別される（たとえば、Ｃｏｎｔｅｘｔ（ｃｔｘ−１２））。「ｓｔａｙ」は、関係要素ａｇｅｎｔ８５８によって「ＵＳ」に、関係要素ｌｏｃａｔｉｏｎ８６２によって「Ｉｒａｑ」に関連付けられ、またはリンクされる。さらに、用語「ｓｈｏｕｌｄ」が、テキスト部分８１０内で見つかる。言語学上の目的から、「ｓｈｏｕｌｄ」を叙法（ｍｏｄａｌ）と呼ぶことができ、叙法は、可能性および必然性という概念に広義に関連する表現である。したがって、叙法（たとえば、ｓｈｏｕｌｄ）は、この実施形態では関係要素８６０として使用され、「ｓｔａｙ」に関連付けられる。２つのテキスト部分８０５および８１０を、今や、第１のテキスト部分８０５と第２のテキスト部分８１０との間の「ａｂｏｕｔｎｅｓｓ」関係を判定するためにからみ合わせることができる。図８は、この「ａｂｏｕｔ」関係が、それぞれ関係要素ａｂｏｕｔ８５２、ａｂｏｕｔ８５４、およびａｂｏｕｔ８５６を介して「ｓａｙ」と「ＵＳ」、「ｓｔａｙ」、および「Ｉｒａｑ」との間で形成されることを示す。

ここで図９を参照すると、本発明の実施形態による、内容の意味論的表現を生成するために、文書の内容から抽出された要素の間の意味論的関係を展開する方法を示す流れ図９００が示されている。当初に、ステップ９１０で、文書のテキスト部分を識別し、これは、識別されたテキスト部分を、たとえば図２の意味論的インデックス２６０内でインデクシングし、格納することを可能にする。テキスト部分は、図２のデーターストア２２０などのデーターストアに格納できる、ウェブページなどの１つまたは複数の文書の内容から導出することができる。内容が文書から抽出される時に、内容のフォーマットは、変換を必要とする生のオンラインフォーマットとすることができる。一実施形態では、内容は、生のオンラインフォーマットからハイパーテキストマークアップ言語（ＨＴＭＬ）に変換されて、テキスト部分が生成される。内容を、１つまたは複数の文または句、テーブル、テンプレート、あるいは複数のデーターの形で抽出することができる。テキスト部分は、間接話法およびアティチュードレポートを含む場合があり、これらを、ｄｅｎｏｕｎｃｅ、ｓａｙ、ｂｅｌｉｅｖｅ、ｄｅｓｉｒｅ、ｄｅｎｙその他などであるがもちろんこれらに限定はされない、テキスト部部内で見つかる複数の単語によって識別することができる。これらの単語は、あるトピックに対するある人の態度を記述するので、アティチュードレポートで識別される。間接話法は、ある人からの直接の引用の形をとる場合があり、あるいは、間接的な間接話法である場合がある。

一実施形態では、さらなるインデクシングのために意味論的に表されなければならない１つまたは複数の要素を識別するために、テキスト部分を解析することができる。解析は、テキスト抽出およびエンティティー認識をも含むことができ、エンティティーは、たとえばデーターストア２２０に格納された単語の事前定義のリストを検索することによって認識される。この手順は、人またはものの名前である可能性がある単語を認識するという点で助けになる。ステップ９２０で、識別された要素のそれぞれの意味論的情報を判定する。意味論的情報は、その中で識別された要素の１つまたは複数の意味および／または文法的機能を含むことができる。一実施形態では、類義語または下位語を判定し、意味論的情報として含めることもできる。さらに、いくつかの実施形態では、１つまたは複数の単語が類似する意味を有する場合があり、これらの単語および意味を、ある種の要素を論理変数に置換することによって、論理変数による意味論的表現で表すことができる。この論理変数は、要素に類似する意味を有する複数の類義語、要素があてはまるカテゴリーを表すことができ、その要素が有する可能性がある複数の意味を表すこともでき、これは、広げられているがより正確な検索を可能にする。論理変数を、データーストアに格納することができる。

ステップ９３０で、識別された要素のうちの少なくとも１つを、スピーチレポートまたはアティチュードレポートに対応する報告する行為として識別する。ステップ９４０は、識別された要素を互いに関連付けて意味論的関係を形成することを示し、形成される関連付けは、上のステップ９２０で判定された意味論的情報に基づく。一実施形態では、関連付けの１つまたは複数のレベルあるいは文脈を判定することができ、関連付けの各レベルは、識別された要素のうちの１つまたは複数を含むことができる。関連付けの異なるレベル内の要素を、互いに関連付けることができ、報告する行為によって関連付けることができる。報告する行為は、たとえば、動詞、名詞、または類似物とすることができ、通常は、周囲のテキストまたは単語が文内でどのように使用されるかによって判定される。このタイプの文法情報は、たとえば、ルールのセットを適用することによって判定することができ、このルールのセットは、たとえば図２の文法指定コンポーネント２５５のフレームワーク内で維持することができる。例示のみのために、テキスト部分が、「ＩｎＷａｓｈｉｎｇｔｏｎ，ＢｕｓｈｄｅｎｏｕｎｃｅｄｃａｌｌｓｆｏｒｔｈｅＵＳｔｏｗｉｔｈｄｒａｗｆｒｏｍＩｒａｑ」と記述すると仮定する。ここで、それぞれが報告する行為を含む、３レベルの関連付けを識別することができる。関連付けの３つのめいめいのレベルの報告する行為を、「ｄｅｎｏｕｎｃｅｄ」、「ｃａｌｌｓ」、および「ｗｉｔｈｄｒａｗ」として識別することができる。

関連付けのレベル（たとえば、文脈）および報告する行為に加えて、関係要素を判定することもでき、この関係要素は、報告する行為と要素または関連付けのレベルとの間の関係を記述する。たとえば、上の例の参照を続けると、Ｂｕｓｈは非難を行う動作主なので、「Ｂｕｓｈ」を、関係要素ａｇｅｎｔによって「ｄｅｎｏｕｎｃｅｄ」に関連付け、またはリンクすることができる。関係要素は、関係のさまざまな形をとることができるが、ａｇｅｎｔ、ｌｏｃａｔｉｏｎ、ｔｏｐｉｃ、またはａｂｏｕｔなどであるがこれらに限定はされない単語である場合がある。「ａｂｏｕｔ」関係は、報告する行為が言及しているものまたは報告する行為が関係するものを示す。ステップ９５０で、上で説明した識別された要素の関連付けを含む意味論的表現を生成する。その後、この意味論的表現を、図２の意味論的インデックス２６０などのインデックスに格納することができる。

図１０に、本発明の実施形態による、クエリーの受取りに応答して、命題を生成するためにクエリーから抽出されたさまざまな用語の間の関連付けを作成する方法を示す流れ図１０００を示し、命題は、関連する検索結果を提供するためにインデックスに格納された情報を質問するのに使用される。命題は、文書から内容の意味論的表現内に含まれる意味論的関係を質問するのに使用されるクエリーの概念的意味の論理表現である。クエリーから命題を生成するプロセスは、文書の内容の意味論的表現を生成する、本明細書で説明されるプロセスに非常に似ている。当初に、クエリーが、ユーザーからの入力として受け取られ、一実施形態では、受け取られたクエリーは、クエリー内の１つまたは複数の検索語を判定するために解析される。検索語は、テキスト部分内で識別される要素に似ている。

ステップ１０１０で、１つまたは複数の検索語のそれぞれの意味論的情報を判定し、この意味論的情報は、その中の検索語の１つまたは複数の意味および／または文法的機能を含むことができる。意味論的情報の判定に加えて、論理変数を、識別することができ、検索語のうちの１つまたは複数に関連付けることができ、検索語のうちの１つまたは複数を置換することすらできる。論理変数は、番号、文字、一連の番号および文字、または番号と文字との両方の組合せとすることができ、検索語に類似する意味を有する複数の単語を表すことができる。これは、広げられているがより関連する検索結果をユーザーに返すことを可能にする。ステップ１０２０で、第１の報告する行為をクエリー内で識別する。報告する行為は、動詞、名詞、または会話の任意の他の部分とすることができ、「ｓａｙ」、「ｃａｌｌ」、「ｄｅｎｏｕｎｃｅ」、「ｂｅｌｉｅｖｅ」、その他などの行為を含むことができる。一実施形態では、第２の報告する行為など、複数の報告する行為を１つのクエリー内で識別することができる。

意味論的関係を、各報告する行為と別の検索語との間で判定して、単語の間の関連付けを作成することができ、これが、ステップ１０３０に示されている。意味論的関係は、上で説明したように、判定された意味論的情報に基づくものとすることができる。関連付けは、関係要素によってリンクされ、関係要素は、ａｇｅｎｔ、ｌｏｃａｔｉｏｎ、ｔｏｐｉｃ、またはａｂｏｕｔなどであるがこれらに限定はされない関連を記述する。他の関係要素が、本発明の範囲内で確かに企図されている。ステップ１０４０で、各報告する行為とクエリーから解析された検索語のうちの１つまたは複数との間の形成された関連付けを含む命題を生成する。命題が生成されたならば、その命題（たとえば、命題内の関連付け）を、たとえば意味論的インデックス２６０に格納された１つまたは複数の意味論的表現と比較するかマッチングして、命題の最も関連する一致を判定することができる。一実施形態では、クエリーは、上で説明したように関連付けの複数のレベルを含むことができ、したがって、報告する行為を、関連付けのレベルごとに識別することができる。

図１１に移ると、本発明の実施形態による、文書の内容の意味論的表現を生成するため、さらには内容のインデクシングを可能にする、文書の内容から抽出された要素の間の意味論的関係を展開する方法を示す流れ図１１００が示されている。ステップ１１１０で、インデクシングすべき文書（たとえば、ウェブ文書）の少なくとも一部を識別する。ステップ１１２０に示されているように、文書のテキスト部分を解析して、意味論的に表されるべき要素を識別する。ステップ１１３０で、データーストアにアクセスして、識別された要素の潜在的意味および文法的機能を判定する。

図１１の参照を続けると、ステップ１１４０で、テキスト部分内の関連付けの１つまたは複数のレベルを判定する。ステップ１１５０に示されている、テキスト部分内の報告する行為を、関連付けの１つまたは複数の判定されたレベルごとに識別する。次に、ステップ１１６０で、第１の報告する行為を、識別された要素の第１セットに関連付けるが、識別された要素の第１セットは、上のステップ１１２０で判定された要素と判定された報告する行為との間の意味論的関係を分析することによって判定される。第１の報告する行為は、関連付けの第１レベルに関連する。ステップ１１７０で、第２の報告する行為を、識別された要素の第２セットに関連付け、第２の報告する行為は、関連付けの第２レベルに関連する。その後、ステップ１１８０で、関連付けの意味論的表現を生成することができ、その結果、上で説明したように、クエリー命題との比較を含むさらなる分析のために、この意味論的表現をたとえば意味論的インデックス２６０に格納できるようになる。

本発明を、特定の実施形態に関して説明したが、この特定の実施形態は、すべての点で、制限的ではなく例示的であることが意図されている。本発明がその範囲から逸脱せずに関係する代替実施形態は、当業者に明白になるであろう。

前述から、本発明が、明白であり本方法に固有の他の利益と一緒に、上で示された目標および目的のすべてを達成するために十分に適合されたものであることがわかる。ある種の特徴および副組合せが、有用であり、他の特徴および副組合せを参照せずに使用され得ることを理解されたい。これは、特許請求の範囲によって企図され、これに含まれる。

Claims

文書の内容の意味論的表現を生成するために前記内容から抽出された要素の間の意味論的関係を展開するコンピューターで実施される方法であって、
プロセッサーとメモリーとを備えたコンピューティングデバイスにより、前記文書のテキスト部分を識別するステップと、
前記テキスト部分内で識別される複数の要素の意味論的情報を判定するステップであって、前記意味論的情報は、前記識別された要素の意味または前記識別された要素の文法的機能のうちの１つまたは複数を含む、ステップと、
前記テキスト部分の主語として前記識別された要素のうちの少なくとも１つを識別するステップと、
前記テキスト部分の特定のトピックに対する前記主語の態度を記述するアティチュードレポートに対応する報告する行為として前記識別された要素のうちの少なくとも１つを識別するステップと、
前記識別された要素の前記判定された意味論的情報に基づいて、識別された要素の各関連付けがある種の意味論的関係を表すようにするために、前記報告する行為として識別された要素を、前記主語として識別された要素と、前記トピックに対応する１つまたは複数の要素からなる要素群とに関連付けるステップと、
前記コンピューティングデバイスにより、前記識別された要素どうしの前記関連付けを示す意味論的表現を生成するステップと、
を含み、
前記関連付けるステップは、
それぞれが前記識別された要素のうちの１つまたは複数を含む、前記テキスト部分内の関連付けの複数のレベルを識別するステップと、
関連付けの第１レベルについて第１の報告する行為を識別するステップと、
前記関連付けの第１レベルにおいて、前記第１の報告する行為として識別された要素を、前記第１の報告する行為のトピックに対応する関連付けの第２レベルの要素群に関連付けるステップと、
前記関連付けの第２レベルについて第２の報告する行為を識別するステップと、
前記関連付けの第２レベルにおいて、前記第２の報告する行為として識別された要素を、前記第２の報告する行為のトピックに対応する関連付けの第３レベルの要素群に関連付けるステップと、
を含む、
方法。
前記テキスト部分は、１つまたは複数の文、テーブル、テンプレート、または複数のデーターのうちの少なくとも１つを含む、請求項１に記載の方法。
前記文書からの前記内容の少なくとも一部を取り出すためにデーターストアにアクセスするステップ
をさらに含む、請求項１に記載の方法。
前記意味論的表現に含めるべき前記複数の要素を識別するために前記文書の前記テキスト部分を解析するステップ
をさらに含む、請求項１に記載の方法。
前記テキスト部分内の１つまたは複数のエンティティーを認識するステップであって、前記１つまたは複数のエンティティーは、データーストア内に格納された単語の事前定義のリストを検索することによって認識される、ステップ
をさらに含む、請求項１に記載の方法。
類似する意味を有する複数の単語を前記識別された要素のそれぞれに関連付けるステップ
をさらに含む、請求項１に記載の方法。
前記第１の報告する行為および識別された要素の前記第１セットのそれぞれは、前記関連付けを記述する関係要素によって関連付けられる、請求項１に記載の方法。
前記意味論的表現をインデクシングするステップであって、前記識別された要素および前記関係要素を含む前記意味論的表現は、取出のためにインデックス内に格納され、前記インデックスは、検索可能である、ステップ
をさらに含む、請求項７に記載の方法。
前記インデックスは、前記意味論的表現からデーターストア内に格納されたそれに関連するテキスト部分へのポインタを含む、請求項８に記載の方法。
文書の内容の意味論的表現を生成するために前記内容から抽出された要素の間の意味論的関係を展開する方法を実行するコンピューター使用可能命令がその上に格納された１つまたは複数のコンピューター記憶媒体であって、前記方法は、
前記文書のテキスト部分を識別するステップと、
前記テキスト部分内で識別される複数の要素の意味論的情報を判定するステップであって、前記意味論的情報は、前記識別された要素の意味または前記識別された要素の文法的機能のうちの１つまたは複数を含む、ステップと、
前記テキスト部分の主語として前記識別された要素のうちの少なくとも１つを識別するステップと、
前記テキスト部分の特定のトピックに対する前記主語の態度を記述するアティチュードレポートに対応する報告する行為として前記識別された要素のうちの少なくとも１つを識別するステップと、
前記識別された要素の前記判定された意味論的情報に基づいて、識別された要素の各関連付けがある種の意味論的関係を表すようにするために、前記報告する行為として識別された要素を、前記主語として識別された要素と、前記トピックに対応する１つまたは複数の要素からなる要素群とに関連付けるステップと、
前記識別された要素どうしの前記関連付けを示す意味論的表現を生成するステップと、
を含み、
前記関連付けるステップは、
それぞれが前記識別された要素のうちの１つまたは複数を含む、前記テキスト部分内の関連付けの複数のレベルを識別するステップと、
関連付けの第１レベルについて第１の報告する行為を識別するステップと、
前記関連付けの第１レベルにおいて、前記第１の報告する行為として識別された要素を、前記第１の報告する行為のトピックに対応する関連付けの第２レベルの要素群に関連付けるステップと、
前記関連付けの第２レベルについて第２の報告する行為を識別するステップと、
前記関連付けの第２レベルにおいて、前記第２の報告する行為として識別された要素を、前記第２の報告する行為のトピックに対応する関連付けの第３レベルの要素群に関連付けるステップと、
を含む、
１つまたは複数のコンピューター記憶媒体。