JP4937201B2 - クエリー要件展開器およびクエリー要件展開方法 - Google Patents

クエリー要件展開器およびクエリー要件展開方法 Download PDF

Info

Publication number
JP4937201B2
JP4937201B2 JP2008170339A JP2008170339A JP4937201B2 JP 4937201 B2 JP4937201 B2 JP 4937201B2 JP 2008170339 A JP2008170339 A JP 2008170339A JP 2008170339 A JP2008170339 A JP 2008170339A JP 4937201 B2 JP4937201 B2 JP 4937201B2
Authority
JP
Japan
Prior art keywords
query
concept
requirement
query requirement
question type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008170339A
Other languages
English (en)
Other versions
JP2009037603A (ja
Inventor
フェン クアンゼ
ザイ ホンウェイ
トシカズ フクシマ
リャン バングセング
メン クシン
リウ ユグァン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC China Co Ltd
Original Assignee
NEC China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC China Co Ltd filed Critical NEC China Co Ltd
Publication of JP2009037603A publication Critical patent/JP2009037603A/ja
Application granted granted Critical
Publication of JP4937201B2 publication Critical patent/JP4937201B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は情報クエリーの分野に関し、特に、自然語クエリー要件展開器および方法に関する。
現在、ユーザから送信されてきたクエリー要求に基づいてクエリー結果を提供するシステムには様々なものがある。ユーザは概して、自然語クエリーを実行する際には、自身が送信したクエリー要求よりも多くの情報を取得したいと思っている。例えば、あるユーザが「海龍ビルはどこか」と問い合わせたとすると、そのユーザは、住所だけでなく、海龍ビルへの道順も知りたい可能性が高い。そのため、ユーザの現在のクエリーから潜在的なクエリー要件(すなわち、暗黙クエリー要件)を推論できることが望ましい。しかし、既知のクエリーシステムはユーザの現在のクエリーに関連付けられた直接的なクエリー応答を生成するのみであり、現在のクエリーをさらに展開するという観点からユーザの潜在的なクエリー要件を考慮するには至っていない。
これまで、関連技術によるクエリーシステムおよび方法がいくつか提案されてきた。特許文献1(米国特許第20050289124号)では、自然語クエリーを処理するためのシステムおよび方法が提供されている。このシステムは、ユーザからの英語の自然語クエリーを処理し、対応する意味ラベルを生成し、知識ベースから対応する情報を取り出すことができる。
特許文献2(米国特許第6411950号)では、キーワードクエリーの展開方法が開示されている。この方法では、クエリーログを使って、キーワードクエリー内の抽象語が、クエリー頻度の高い特定の語に展開される。例えば、「自動車」というクエリー語は、(“自動車オーディオ”OR“レンタカー”OR“自動車価格”OR…)に展開される。
特許文献3(米国特許第6480843号)でも、キーワードクエリーの展開方法が開示されている。この方法では、キーワードクエリー内の語は、語と語の間の意味的類似性を利用して展開される。例えば、 キーワードクエリー内の「自動車ディーラー」は、[(“自動車”OR“乗用車”OR“オート”OR“フォード”)]AND(“ディーラー”OR“ショールール”OR“営業所”)に展開することが可能である。
米国特許第20050289124号 米国特許第6411950号 米国特許第6480843号
要約すると、既存のクエリーシステムおよび方法は、特許文献1(米国特許第20050289124号)のように明示的なクエリー要件を分析できるか、特許文献2(米国特許第6411950号)および特許文献3(米国特許第6480843号)のようにキーワードクエリーを展開できるかのいずれかである。そのため、自然語クエリー内の現在の明示的なクエリー要件を効果的に展開できる方法に対する必要性には未だ対処されていない。
本発明は、上記の問題点を解決し、受信したユーザの自然語クエリーを分析し、ユーザのクエリー要件を展開するために暗黙のクエリー要件を取得して、展開された応答情報を生成することのできる、自然語クエリー要件展開器および方法を提供することを目的とする。
本発明の第1の態様によれば、クエリー要件展開器であって、ユーザのクエリー要求に基づいて、明示的クエリー要件を生成するクエリー要件理解装置と、明示的クエリー要件に関連付けて暗黙クエリー要件を生成するクエリー要件展開装置とを備えるクエリー要件展開器が提供される。
本発明の第2の態様によれば、クエリー要件展開器であって、クエリー要件理解装置は、受信したユーザクエリーに対して意味上および構文上の分析を行うことにより、明示的クエリー要件を生成し、クエリー要件展開装置は、本機に内蔵または外付けされる要件関連性データベースを検索することにより、明示的クエリー要件に関連付けて暗黙クエリー要件を生成することを特徴とするクエリー要件展開器が提供される。
本発明の第3の態様によれば、クエリー要件展開器であって、クエリー要件理解装置は、知識ベースと言語ベースとを検索することにより、クエリー概念と質問タイプとを含む明示的クエリー要件を生成し、クエリー要件展開装置は、知識ベースと言語ベースと関連性データベースとを検索することにより、クエリー概念と質問タイプとを含む暗黙クエリー要件を生成することを特徴とするクエリー要件展開器が提供される。
本発明の第4の態様によれば、クエリー要件展開器であって、クエリー要件理解装置は、知識ベースと言語ベースとに基づいてユーザクエリーを解析する解析手段と、一致する構文を検出するために、解析済みユーザクエリーを言語ベースと照合する照合手段と、知識ベースと言語ベースとに基づいて、ユーザクエリー内の概念に意味上の誤りがあるかどうかを判定する意味整合性判定手段と、一致した構文に基づいて、一致した構文に対応し、かつクエリー概念と質問タイプとを含む明示的クエリー要件を生成する明示的クエリー要件生成手段と、知識ベースと言語ベースとに基づいて、明示的クエリー要件がどのタイプに属し、意味的に理解可能か、構文的に理解可能か、または構文的に理解不能かを判定する要件タイプ判定手段とを備えることを特徴とするクエリー要件展開器が提供される。
本発明の第5の態様によれば、クエリー要件展開器であって、クエリー要件展開装置は、意味的に理解可能な明示的クエリー要件に基づいて関連性データベースを検索し、さらに、この意味的に理解可能なクエリー要件と関連付けられ、かつ、関連クエリー概念と関連質問タイプ、またはクエリー概念と関連質問のいずれかを有する暗黙クエリー要件を含む関連クエリー要件セットを取得する意味的理解可能クエリー要件展開装置を備えることを特徴とするクエリー要件展開器が提供される。
本発明の第6の態様によれば、クエリー要件展開器であって、クエリー要件展開装置は、知識ベースと関連性データベースとに基づいて、構文的に理解可能な明示的クエリー要件に含まれるクエリー概念との関連性の高い関連クエリー概念セットを形成し、知識ベースを利用して、この関連クエリー概念セットから、事前定義された制約条件を満たす少なくとも1つの関連クエリー概念を選択し、さらには、暗黙クエリー要件として、少なくとも1つの選択した関連クエリー概念を明示的クエリー要件の質問タイプと結合する、構文的理解可能クエリー要件展開装置を備えることを特徴とするクエリー要件展開器が提供される。
本発明の第7の態様によれば、クエリー要件展開器であって、クエリー要件展開装置は、類似したクエリー概念と類似した質問タイプの一方または両方を含む暗黙クエリー要件を取得するために、言語ベースを利用して、明示的クエリー要件に含まれる質問タイプに類似した質問タイプを検索するか、知識ベースと関連性データベースとを利用して、明示的クエリー要件内の未認識のクエリー概念に類似したクエリー概念を検索するか、またはその両方を実行する構文的理解不能クエリー要件展開装置を備えることを特徴とするクエリー要件展開器が提供される。
本発明の第8の態様によれば、クエリー要件展開器であって、クエリー要件展開装置は、意味的に理解可能な明示的クエリー要件に基づいて関連性データベースを検索し、さらに、この意味的に理解可能なクエリー要件と関連付けられ、かつ、関連クエリー概念と関連質問タイプ、またはクエリー概念と関連質問のいずれかを有する暗黙クエリー要件を含む関連クエリー要件セットを取得する意味的理解可能クエリー要件展開装置と、知識ベースと関連性データベースとに基づいて、構文的に理解可能な明示的クエリー要件に含まれるクエリー概念との関連性の高い関連クエリー概念セットを形成し、知識ベースを利用して、この関連クエリー概念セットから、事前定義された制約条件を満たす少なくとも1つの関連クエリー概念を選択し、さらには、暗黙クエリー要件として、少なくとも1つの選択した関連クエリー概念を明示的クエリー要件の質問タイプと結合する、構文的理解可能クエリー要件展開装置と、類似したクエリー概念と類似した質問タイプの一方または両方を含む暗黙クエリー要件を取得するために、言語ベースを利用して、明示的クエリー要件に含まれる質問タイプに類似した質問タイプを検索するか、知識ベースと関連性データベースとを利用して、明示的クエリー要件内の未認識のクエリー概念に類似したクエリー概念を検索するか、またはその両方を実行する構文的理解不能クエリー要件展開装置を備えることを特徴とするクエリー要件展開器が提供される。
本発明の第9の態様によれば、クエリー要件展開方法であって、ユーザのクエリー要求に基づいて、明示的クエリー要件を生成するクエリー要件理解ステップと、明示的クエリー要件に関連付けて暗黙クエリー要件を生成するクエリー要件展開ステップとを備えるクエリー要件展開方法が提供される。
本発明の第10の態様によれば、クエリー要件展開方法であって、クエリー要件理解ステップは、受信したユーザクエリーに対して意味上および構文上の分析を行うことにより、明示的クエリー要件を生成するステップを備え、クエリー要件展開ステップは、要件関連性データベースを検索することにより、明示的クエリー要件に関連付けて暗黙クエリー要件を生成するステップを備えることを特徴とするクエリー要件展開方法が提供される。
本発明の第11の態様によれば、クエリー要件展開方法であって、クエリー要件理解ステップは、知識ベースと言語ベースとを検索することにより、クエリー概念と質問タイプとを含む明示的クエリー要件を生成するステップを備え、クエリー要件展開ステップは、知識ベースと言語ベースと関連性データベースとを検索することにより、クエリー概念と質問タイプとを含む暗黙クエリー要件を生成するステップを備えることを特徴とするクエリー要件展開方法が提供される。
本発明の第12の態様によれば、クエリー要件展開方法であって、クエリー要件展開ステップは、意味的に理解可能な明示的クエリー要件に基づいて関連性データベースを検索し、さらに、この意味的に理解可能なクエリー要件と関連付けられ、かつ、関連クエリー概念と関連質問タイプ、またはクエリー概念と関連質問のいずれかを有する暗黙クエリー要件を含む関連クエリー要件セットを取得する意味的理解可能クエリー要件展開ステップと、知識ベースと関連性データベースとに基づいて、構文的に理解可能な明示的クエリー要件に含まれるクエリー概念との関連性の高い関連クエリー概念セットを形成し、知識ベースを利用して、この関連クエリー概念セットから、事前定義された制約条件を満たす少なくとも1つの関連クエリー概念を選択し、さらには、暗黙クエリー要件として、少なくとも1つの選択した関連クエリー概念を明示的クエリー要件の質問タイプと結合する構文的理解可能クエリー要件展開ステップと、類似したクエリー概念と類似した質問タイプの一方または両方を含む暗黙クエリー要件を取得するために、言語ベースを利用して、明示的クエリー要件に含まれる質問タイプに類似した質問タイプを検索するか、知識ベースと関連性データベースとを利用して、明示的クエリー要件内の未認識のクエリー概念に類似したクエリー概念を検索するか、またはその両方を実行する構文的理解不能クエリー要件展開ステップのうち、少なくとも1つのステップを備えることを特徴とするクエリー要件展開方法が提供される。
本発明の自然語クエリー要件展開器によれば、ユーザのクエリー要件を展開することにより、ユーザクエリーの意図を理解して、その潜在的な関心事を探求する際の精度が高まるため、ユーザに充実しかつ包括的な応答情報を提供することが可能になる。
次に、上記の図を参照して本発明の好適な実施例を説明する。これらの図では、同一の要素は同一の記号または番号によって示される。さらに、以下の説明においては、本発明の主題が曖昧になるのを避けるため、既知の機能や構成の詳細については説明を省略する。
図1は、本発明の一実施例による自然語クエリー要件展開器の概略図である。自然語クエリー要件展開器は、ユーザが入力したクエリー要件に基づいて要件関連性データベース5を検索することにより、暗黙クエリー要件と、それに対応する展開された応答(以下「展開応答」)を生成する。自然語クエリー要件展開器は、ユーザからクエリー要求を受信するクエリー受信機1と、クエリー要件理解装置2と、暗黙クエリー要件を生成するために、自然語クエリー要件展開器に内蔵または外付けされた要件関連性データベースを検索するクエリー要件展開装置3と、展開応答生成装置4とを含む。
図3は、本発明の一実施例による、展開応答を生成するための自然語クエリー要件展開方法のフローチャートである。ステップ1’において、クエリー受信機1は、ユーザからクエリー要求を受信する。ステップ2’において、クエリー要件理解装置2は、明示的クエリー要件に対するクエリー要求を意味的および構文的に分析し、ユーザの明示的クエリー要件として、クエリー要求内のクエリー概念と質問タイプとを検出する。クエリー要件理解装置2は、発見的規則または機械の学習能力を利用して、ユーザの明示的クエリー要件に対応する質問タイプを決定し、ユーザのクエリー要求内の名詞をクエリー概念として設定する。質問タイプは最初に決定しておく必要がある。これまでの方法は、手作業で要約された発見的規則に基づいて決定する方法と、質問を自動的に分類する方法の2種類に大別されるが、これに加えて、図13に示す方法を使用して明示的クエリー要件を取得することも可能である。
1)発見的規則の方法:ユーザのクエリー要求に存在する疑問詞または他の語(例:動詞、名詞、副詞、形容詞)に基づいて発見的規則を要約する。例えば、“where/which place−>address”という規則は、ユーザのクエリー要求に“where/which place”が存在する場合、質問タイプは通常address(住所)であることを示す。また、“how/by what, arrive/go/reach−>route”という規則は、ユーザのクエリー要求に“how/by what”と“arrive/go/reach”が出現する場合には、質問タイプは通常route(道順)であることを示す。
その後、こうした発見的規則に基づいて、ユーザのクエリー要求に対応する質問タイプを決定することができる。
2)自動分類の方法:機械の学習能力を利用して、質問を識別し、1つ以上の意味的カテゴリーに分類する。この主な手法は、構文情報と意味情報に基づき、語を特徴アイテムとして利用することである。しかし残念ながら、自動分類の結果はあまり正確ではなく、既知の自動分類方法の精度はいずれも90%を下回る。
クエリー要件理解装置2は、質問タイプを取得した後、ユーザクエリー要件内の残りの名詞をクエリー概念として抽出する。
例えば、“where is the Hailong Building?”(海龍ビルはどこですか?)というユーザクエリー要件には、“where”が含まれているので、発見的規則“where/which place−>address”に基づいて、質問タイプは住所であると判定され、次に、名詞の“Hailong Building”(海龍ビル)が概念として抽出される。したがって、明示的クエリー要件は“Hailong Building;address”(海龍ビル;住所)として取得される。
ステップ3’において、クエリー要件展開装置3は、取得した明示的クエリー要件を用いて、最初に、ユーザクエリー内のクエリー概念と質問タイプとに基づいて要件関連性データベース5を検索し、関連クエリー概念セットと関連質問タイプセットとを取得する。要件関連性データベース5の例を図2に示す。このデータベースには、個々の概念間の関連度と、個々の質問タイプ間の関連度とが格納されている。次に、クエリー要件展開装置3は、取得した関連クエリー概念と関連質問タイプとを結合して関連クエリー要件セットを生成し、以下の式を用いて関連クエリー要件と現在のクエリー要件との関連度を計算する。
要件“c;t”および“c;t”間の関連度=cとc間の関連度*tとt間の関連度
ここで、cとcはクエリー概念、tとtは質問タイプである。
これらの関連クエリー要件は、要件の関連度の高い順に並び替えることができる。この場合、関連度が閾値を上回る関連クエリー要件は、最終的な暗黙クエリー要件として解釈される。
例えば、明示的クエリー要件“Pacific Building;address”に関する全ての関連クエリー要件は、“Hailong Building;address”(関連度0.85)、“Pacific;address”(関連度0.6)、“Pacific Building;route”(関連度0.9)、“Hailong Building;route”(関連度0.765)、および“Pacific;route”(関連度0.54)を含んでいる。閾値を0.8とすると、最終的な暗黙クエリー要件は“Pacific Building;route”と“Hailong Building;address”となる。
最後に、ステップ4’において、暗黙クエリー要件に対する展開応答が生成される。
要件関連性データベース5は様々な方法で生成できる。これらの方法とは、(1)語の類似度を計算する既存の方法(Hownet、Synonym Lexicon等の既知の意味辞書に基づいて、語の間の類似度を計算する)、(2)図10に示す生成方法(意味的関連度、統計的関連度、文字列類似度、およびサービス関連度を計算し、次にその平均を取得して、クエリー概念間または質問タイプ間の関連度とする)、などである。例えば、“Hailong Building”と“Zhongguancun Street”の場合、意味的関連度は1、統計的関連度は0.7なので、この2つの間の関連度は(1+0.7)/2=0.85である。
図4に、自然語クエリー要件展開器のブロック図を示す。自然語クエリー要件展開器は、クエリー受信機101と応答送信機102とを含む送受信装置10と、メモリ20と、クエリー分析展開装置30とを有する。自然語クエリー要件展開器は、クエリー受信機101を介してユーザから自然語クエリー要求を受信すると、その自然語クエリー要求をクエリー分析展開装置30に送信し、続いてクエリー分析展開装置30は、分析と展開を実行して暗黙クエリー要件を取得し、展開応答を生成する。メモリは、知識ベース201と言語ベース202と関連性データベース203とを格納する。クエリー分析展開装置30は、ユーザの自然語クエリー要求が、意味的理解可能クエリー要件か、構文的理解可能クエリー要件か、または構文的理解不能クエリー要件のいずれかを判定するクエリー要件理解装置301と、暗黙クエリー要件を生成する意味的理解可能クエリー要件展開装置302、構文的理解可能クエリー要件展開装置303、および構文的理解不能クエリー要件展開装置304と、展開応答を生成するために、暗黙クエリー要件を使って言語ベース、知識ベース、および情報ベースを検索する展開応答生成装置305とを含む。クエリー分析展開装置30は、知識ベース201と言語ベース202と関連性データベース203とを利用して自然語クエリー要件を展開する。
知識ベース201、言語ベース202、関連性データベース203、および情報ベース(図示せず)は、図4では自然語クエリー要件展開器に内蔵されているが、自然語クエリー要件展開器の外部に配置できることは理解されるであろう。さらに、自然語クエリー要件展開器は、ユーザからの明示的クエリー要件に対応してクエリー応答を直接生成できる直接応答生成装置を含むこともできる。この場合は、本発明の自然語クエリー要件展開器は、展開されたクエリー応答と直接的なクエリー応答の両方を取得することが可能になる。
メモリ20は、知識ベース201と言語ベース202と関連性データベース203と情報ベースとを格納する。知識ベース201は、ユーザクエリーの処理で使用される意味的知識を格納する。言語ベース202は、ユーザクエリーの理解に使用される言語モデルを保持する。関連性データベース203は、ユーザクエリー要件を展開するための関連度データを格納する。情報ベースは、展開応答と直接応答とを生成するための固有フィールドデータを格納する。クエリー分析展開装置30は、知識ベース201と言語ベース202と関連性データベース203とに基づいて、ユーザの自然語クエリーから明示的クエリー要件を抽出し、それを分析してユーザの展開クエリー要件を取得することにより、ユーザにさらに充実した完全な応答情報をフィードバックすることができる。次に、図5、6、4、8、および9をそれぞれ参照して、知識ベース201、言語ベース202、関連性データベース203について説明し、さらに、これらのデータベースを利用して自然語クエリー要件を展開する方法について詳述する。
1.知識ベース
図5に、フィールド知識ベースとマッピング知識ベースとのセットから成る知識ベースの例示的構造を示す。各フィールド知識ベースは1つのフィールドに対応し、このフィールドに意味的知識を記録する。例えば、地図フィールドは地図知識ベースに対応し、イエローページフィールドはイエローページ知識ベースに対応する。異なるフィールドに関する知識は完全に独立しているのではなく、様々な形で互いに関連付けられており、異なるフィールド知識ベース内の概念間におけるこれらの関連付けが1つのマッピング知識ベースによって記録される。
一般に、1つのフィールド知識ベースは、概念セクション、属性セクション、関係セクションという3つのセクションで構成される。
1)概念セクションは、フィールド内のすべてのカテゴリーとエンティティを格納する。
例えば、地図知識ベースの概念セクションは、電子地図に示されるすべての地理的カテゴリーとエンティティを含む。電子地図上では、カテゴリーは、ロケーションがどのカテゴリーに属するかを示す。例えば、電子ビルと道路は、いずれも1つのカテゴリーに属する。また、エンティティは、電子地図上の特定のロケーションを表す。例えば、Hailong Building(海龍ビル)とZhongguancun Street(中関村大街)は、いずれも1つのエンティティに属する。
2)属性セクションでは、各属性は概念の特徴(緯度、経度など)を定義する。各属性には、その属性の値タイプを示す「タイプ」というアイテムが含まれる。
3)関係セクションは、概念間の様々な関連付けを表す。例えば、isaはカテゴリー間またはエンティティとカテゴリー間の従属関係を表し、“near”はエンティティ間の空間的な隣接関係を示す。各関係には、“type”と“characteristic”という2つのアイテムがある。前者は関係の値タイプを表し、後者は主に、移動性と対称性のいずれかの形態となる。R(x,y)&R(y,z)−>R(x,z)の場合、Rは移動性の特徴を有し、例えばisaの関係は、移動性を満足する。R(x,y)−>R(y,x)の場合、Rは対称性の特徴を有し、例えばnearの関係は、対称性の特徴を満足する。
地図知識ベースでは、例えば、“isa(Hailong Building,electronic building)”は、海龍ビルは電子ビルであることを意味し、“near(Hailong Building,Zhongguancun Street)”は、中関村大街が海龍ビルの付近にあることを表す。
マッピング知識ベースには、関係セクション(すなわち、同義語マッピング関係セクション、言語マッピング関係セクション、空間マッピング関係セクション)のみが含まれる。
1)同義語マッピング関係セクションは、同義語または省略形間のマッピングを表す。例えば、”synonymous(Hailong Building,Hailong Electronic Building)”は、2つの語が同義であることを示す。
2)言語マッピング関係セクションは、1つの概念に関する異なる言語の翻訳間のマッピングを表す。例えば、“chinese−english(中関村大街,Zhongguancun Street)”は、後者が前者の英語版であることを意味する。
3)空間マッピング関係セクションは、空間的に互いに関係のある概念間のマッピングを表す。例えば、”near(Hailong Building,Bus No.320)”は、2つのエンティティは互いに近いことを意味する。
図6に、知識ベースの階層ビューを示す。この階層構造は、各フィールド知識ベースの概念セクション内にある概念をノードとし、各フィールド知識ベースの関係セクションとマッピング知識ベース内にある対応関係を弧として、自動的に形成される。
知識ベースは、以下のように2つのステップで生成される。
まず、各フィールド知識ベースが、サービスプロバイダによって提供された情報ベースに基づいて自動的に生成される。この処理は、1)既知の情報抽出アルゴリズムを使って情報ベースから概念を抽出し、カテゴリーとエンティティとを含む概念セクションを形成するステップと、2)既知の情報抽出アルゴリズムを使ってデータフィールドを抽出し、属性セクションを形成するステップと、3)既知の情報抽出アルゴリズムを使って情報ベースおよび意味辞書から概念間の関係を抽出し、カテゴリー間、エンティティ間、およびカテゴリーとエンティティ間の関係を含む関係セクションを形成するステップとを備える。地図フィールドを例にとると、地図知識ベースを生成するために、まず電子地図データベースからカテゴリーとエンティティとを含む様々な概念が抽出されて概念セクションが形成され、次に、電子地図ベースから概念間の従属関係が抽出されて関係セクションが形成される。この関係には、カテゴリー間、エンティティとカテゴリー間、およびエンティティ間の従属的・空間的関係が含まれる。上記の処理は、既知のGISプラットフォームによって提供される機能を使って実行することができる。
その後、これらのフィールド知識ベース内の概念に基づいて、マッピング知識ベースが自動的に生成される。この処理は、以下のステップを備える。
1)同義語辞書と省略ルールライブラリとに基づいて、同義語マッピングセクションを生成する。ここで、同義語辞書には概念とその同義語が含まれる(“Yingu Building”と“Yingu Electronic Building”が同義語であることを示す“Yingu Building,Yingu Electronic Building”など)。省略ルールライブラリには様々な語句の省略形が格納される(「Peking University is abbreviated as PKU」(北京大学はPKUと省略される)ことを示す“abbreviate (Peking University,PKU)”など)。省略ルールによって、2つの概念が同義語かどうかを判断できる。例えば、“abbreviate(Peking University,PKU)”と“abbreviate(Affiliated Primary School,APS)”から、synonymous(Affiliated Primary School of Peking University,APSPKU)を導き出すことが可能である。
2)多言語辞書に基づいて、言語マッピング関係セクションを生成する。
3)電子地図のGIS機能に基づいて、空間マッピング関係セクションを生成する。
2.言語ベース
言語ベースは、ユーザクエリーを理解するための言語モデルを格納し、様々なフィールドクエリー言語とパブリッククエリー言語で構成される。各フィールドは、1つのフィールドクエリー言語に対応する。例えば、交通フィールドは交通フィールドクエリー言語に対応し、公共交通機関フィールドは公共交通機関クエリー言語に対応し、イエローページフィールドはイエローページフィールドクエリー言語に対応する。パブリッククエリー言語は、様々なフィールドクエリー言語間で共通するクエリー特徴を要約する言語であり、フィールドクエリー言語によってパラメータ継承が可能である。フィールドクエリー言語とパブリッククエリー言語は同じ形式で表現される。
図7に言語ベースの一例を示す。この図では、各クエリー言語は、質問タイプ、継承、構文、アクションという4つの部分で構成される。
1)質問タイプ部。質問タイプは、“traffic status”(交通状態)のような文字列とすることができる。
2)継承部。継承部は、その構文は質問タイプによって継承可能であることを示す。例えば、“traffic status:attribute value query (?cate=bridge|road,?A=traffic status)”は、構文“traffic status”は、パラメータ?cateおよび?Aを割り当てることによって、質問タイプの構文“attribute value query”を継承できることを表す。これはつまり、“<traffic status>[of]<?C(road|bridge)>”も構文“traffic status”に属することを意味する。
3)構文部。構文部は、例えば“<?C(road|bridge)><blocked|congested|unblocked>”のように、ある質問タイプに関する可能なすべての自然語クエリーを要約する。構文部は、“?C”、“blocked”(輻輳)、“congested”(渋滞)、“unblocked”(輻輳なし)といった構文語の集まりで形成される。構文部では、いくつかの特殊記号も定義される。各特殊記号の意味は以下のとおりである。
・ “|”は、“OR”論理演算を意味する。
・ <?X(cons|…|cons)>は、Xは概念であることを意味する。ここでcons(i=1,…,m)は、概念Xの値の範囲を制約する制約条件であるconsは、通常は知識ベース内のカテゴリーである。Xは、知識ベース内の任意カテゴリーconsに属するエンティティによってのみ置換できる。換言すれば、Xはisa(X,cons)を満足しなければならない。例えば、<?C(road|bridge)>は、知識ベース内の道路または橋(例:Zhongguancun Street)であるエンティティによってのみ置換できる。
・ “[]”は、“[“と“]”の間の内容はオプションであることを意味する。
4)アクション部。アクション部は質問タイプに対応するクエリーアクションを定義し、「ユーザクエリーが“traffic status query (?C)”などの質問タイプの定義に適合する場合に、どのクエリーアクションが生成されるか」を示す。クエリーアクションは、ユーザクエリーの理解結果を提供し、応答生成装置によって実行される。
言語ベースは、以下のように2つのステップで生成される。
第1のステップでは、個々のフィールド内の可能なユーザクエリー文を収集し、既知の文類似度計算方法を使用してこれらのクエリー文間の類似度を計算し、類似度に基づくクラスター化により各フィールドクエリー言語の構文セクションを生成し、さらに、各構文について、質問タイプとアクション部を手作業で定義する。例えば、質問タイプ“traffic status”(交通状態)に対して、交通状態フィールド内のクエリー文“Is Lianxiang Bridge blocked?”(聯想橋は輻輳状態ですか?)、“Is the Fourth North Ring Road congested?”(第4北環状道路は渋滞していますか?)、“Is Xueyuan Road unblocked?(学院橋は輻輳なしですか?)から、構文“<?C(road|bridge)><blocked|congested|unblocked>”を得ることができる。
第2のステップは、個々のフィールドクエリー言語内の構文部間の類似度を計算し、パブリッククエリー言語を抽出し、これらのフィールドクエリー言語に対して継承部を生成する。例えば、“traffic status”構文“<traffic status>[of]<?C(road|bridge)>”および“address”構文“<address>[of]<?C(location)>”から、“attribute value query”構文の“<?A>[<of>]<?C(?cate)>”を導き出すことが可能であり、“traffic status”構文の継承部は、“attribute value query?(?cate=road|bridge,?A=traffic status)”となる。
3.関連性データベース
図8に関連性データベースの一例を示す。関連性データベースは、すべてのオブジェクト(知識ベース内の概念、および言語ベース内の質問タイプ)間の関連度に関する関連度データを記録する。このとき、以下の4つのタイプの関連度が主に考慮される。
a.意味的関連度。異なる概念間の意味的関連度を表す。例えば、”Hailong Building”と“Zhongguancun Street”はいずれもロケーションであり、空間的にも近いので、意味的に関連していると判定される。意味的に関連する2つの概念は、エンティティまたはカテゴリーのいずれかである。
b.統計的関連度。異なる概念間の統計的関連度を表す。例えば、“Hailong Building”と“Zhongguancun Street”は同じテキスト内に出現することが多いため、統計的に関連していると判定される。
c.文字列類似度。異なる語句間の記述形式における類似度を表す。例えば、”Pacific”は“Pacific Building”の部分列なので、“Pacific”と“Pacific Building”は記述形式において関連している。また、“Hailong”は“Hailong Building”の部分列なので、“Pacific”と“Pacific Building”の間、および“Hailong”と“Hailong Building”の間には、文字列類似性があると判定される。
d.サービス関連度。異なる質問タイプによって提供されるサービス間の関連度を表す。例えば、“address”(住所)と“route”(道順)はいずれもロケーションサービスに関係するので、これらはサービスにおいて関連性がある。
図9に、関連性データベース生成装置の概略ブロック図を示す。図に示すように、関連性データベース生成装置は、知識ベースを利用して意味的関連度データを生成する意味的関連度計算装置42と、コーパスを利用して統計的関連度データを生成する統計的関連度計算装置44と、一般的な辞書に基づいて文字列類似度データを生成する文字列類似度計算装置46と、ユーザクエリーログを分析してサービス関連度データを生成するサービス関連度計算装置48とを備える。
図10は、関連性データベース生成装置による関連性データベース生成方法のフローチャートである。
S401において、意味的関連度計算装置42は、知識ベースに基づいて、異なる概念間の意味的関連度を計算する。概念をノードとし、関係を弧とする知識ベースの階層構造を示す図6を参照すると、2つの概念間の意味的関連度は、これらの概念間の最短の経路を使用して測定することができる。2つの概念間の最短経路が短いほど、その意味的な関連度は高くなる。
意味的関連度は、以下の式によって計算することができる。

Figure 0004937201

ここで、Len(MinPath(x,y))は、x−y間の最短経路長(すなわち、xからyまでの弧の数)を表す。例えば、図6では、“Hailong Building”と“Zhongguancun Street”との間の最短経路は、“Hailong Building−Near− Zhongguancun Street”である。この経路には弧は1つしかないため、最短経路長は1であり、意味的関連度は1である。
S402において、統計的関連度計算装置44は統計的関連度を計算する。ここでは、コーパスに対して統計を実行することにより、2つの概念間で共通する情報が計算される。本発明で使用されるコーパスには、ウェブから収集された2,000,000ウェブページが含まれる。情報理論においては、共通情報は、2つのイベント間の関連度を測定するための一種の指標として使用される。2つの概念間の共通情報が多いほど、その統計的な関連度は高くなる。統計的関連度は以下の式によって計算される。

Figure 0004937201

ここで、P(x,y)はxとyが同時に出現する確率を表し、P(x)、P(y)はそれぞれ、xとyが単独で出現する確率を表す。例えば、“Hailong Building”と“Zhongguancun”の両方が出現する確率は0.98であり、それぞれは0.14の確率で単独で出現する場合、“Hailong Building”と“Zhongguancun”の間の統計的関連度は0.7になる。
S403において、文字列類似度計算装置46は文字列類似度を計算する。本発明においては、使用頻度の高い語句(知識ベース内のすべての概念を含む)を記録した既知の汎用辞書を使用して、これらの語句間の文字列類似度が計算される。この計算では、編集距離という既知の方法を利用することができる。編集距離とは、2つの概念文字列を同一にするために必要となる置換、挿入、または削除演算の回数をカウントする方法である。この方法では、演算数が少ないほど、文字列類似度が高いとされる。
文字列類似度は、以下の式を用いて計算できる。

Figure 0004937201
ここで、D(x,y)は、文字列xおよびyを同一にするために必要な最小演算数、Max(Len(x),Len(y))は、文字列xおよびyの最大長である。例えば、“Pacific”の末尾に2つの漢字を加えて“Pacific Building”とされている場合には、中国語では、この2つの文字列間の文字列類似度は1−2/5=0.6となる。
S404において、サービス関連度計算装置48はサービス関連度を計算する。この時点までに、ユーザが送信したすべてのクエリーとそれに対応するクエリー要件を含む、全ユーザのクエリーログが記録されている。サービス関連度計算装置48はすべてのユーザクエリーログを分析して、クエリーの質問タイプごとに、一人のユーザが連続して質問した頻度を検出する。頻度が高いほど、2つの質問タイプ間のサービス関連度は高いとされる。サービス関連度は以下の式によって計算される。
サービス関連度=P(Qn+1の質問タイプはy|Qの質問タイプはx)(4)
この式により、あるユーザクエリーの質問タイプがxで、次のユーザクエリーの質問タイプがyであった頻度を得ることができる。例えば、ユーザは、あるロケーションの住所を問い合わせた直後に、しばしばそのロケーションへの道順を尋ねる。そのため、質問タイプ“address”と質問タイプ“route”とのサービス関連度は高く、その計算値は0.9となる。
図11に、クエリー要件理解装置301のブロック図を示す。図に示すように、クエリー要件理解装置301は、解析手段3011と、解析手段3011に接続された照合手段3012と、照合手段3012に接続された意味整合性判定手段3013と、意味整合性判定手段3013に接続された明示的クエリー要件生成手段3014と、明示的クエリー要件生成手段3014に接続された要件タイプ判定手段3015とを備える。解析手段3011は、知識ベース201内でフィールド知識ベースの概念セクションを検索し、言語ベース202内でフィールドクエリー言語およびパブリッククエリー言語の構文セクションを検索することにより、ユーザクエリーを解析する。照合手段3012は、解析済みユーザクエリーを言語ベースと照合する。意味整合性判定手段3013は、知識ベース201内のフィールド知識ベースの関係セクションに基づいて、ユーザクエリー内の概念が、質問タイプに対応する構文内で定義された概念制約を満たすかどうかを判定する。明示的クエリー要件生成手段3014は、一致した構文に対応する質問タイプを取得し、クエリー概念と質問タイプとを結合して明示的クエリー要件を生成する。要件タイプ判定手段3015は、ユーザクエリーが属する要件タイプが、意味的に理解可能か、構文的に理解可能か、または構文的に理解不能かを判定する。
図12に、クエリー要件理解装置によるクエリー要件理解処理のフローチャートを示す。S50において、解析手段3011は、知識ベース201内でフィールド知識ベースの概念セクションを検索し、言語ベース202内でフィールドクエリー言語およびパブリッククエリー言語の構文セクションを検索することにより、ユーザクエリーを解析する。
例えば、ユーザクエリー“Is Hailong Building congested?”(海龍ビルは渋滞していますか?)は、“Hailong Building;congested”として解析される。ここで、“Hailong Building”は地図知識ベース内のエンティティ、“congested”は交通状態フィールドのクエリー言語内の構文語である。
S52において、照合手段3012は、解析済みユーザクエリーを言語ベースと照合して、ユーザクエリーと一致する構文を取得する。この照合処理は、最初に解析済みユーザクエリーがパブリッククエリー言語と照合され、一致する構文が存在する場合には、その構文を継承できるフィールドクエリー言語とパラメータ照合され、存在しない場合には、解析済みユーザクエリーが個々のフィールドクエリー言語と直接照合される、という順序で実行される。
例えば、ユーザクエリー“the traffic status of Hailong Building”(海龍ビルの交通状態)(これは“traffic status;of;Hailong Building”として解析される)を言語ベースと照合する処理の場合は、最初にパブリッククエリー言語と照合して照合結果”attribute value query:<?A>[of]<?C(?cate)>”を取得し、続いて、“attribute value query”を継承するフィールドクエリー言語と照合して照合結果“traffic status:attribute vale query(?cate=road|bridge,?A=traffic status)”を取得する。
もう一つの例として、ユーザクエリー“Is Hailong Building congested?”(海龍ビルは渋滞していますか?)と言語ベースとを照合すると、その結果は“traffic status:<?C(road|bridge)><blocked|congested|unblocked>”となる。
S54において、意味整合性判定手段3013は、知識ベース201内のフィールド知識ベースの関係セクションに基づいて、ユーザクエリー内の概念が、一致した構文内で定義された概念制約を満たすかどうかを判定する。この制約判定は、isaの関係に基づいて、ユーザクエリー内の概念Cが、構文内で定義された概念制約“cons|…|cons”の1つを満たすかどうか、すなわち、isa(C,cons)(ここで、i=1,…,m)が存在するかどうか、を判定する方法で実行される。上記判定の応答がNOの場合は、このユーザクエリーに意味的誤りがあることを意味する。(この判定処理は、図6に示す階層図によって効率化することができる)。ユーザクエリー“Is Hailong Building congested?”(海龍ビルは渋滞していますか?)を例にとると、クエリー概念は“Hailong Building”、一致した構文内の概念制約は“road|bridge”である。このユーザクエリーにはisa(Hailong Building,road)もisa(Hailong Building,bridge)もないため、意味整合性判定手段3013は意味的誤りがあると判定する。
S56において、明示的クエリー要件生成手段3014は、一致した構文に基づいてクエリー概念と対応する質問タイプを取得し、明示的クエリー要件を生成する。図13の例では、ユーザクエリー“Is Hailong Building congested?”(海龍ビルは渋滞していますか?)から、明示的クエリー要件として“Hailong building;traffic status”が抽出される。
S58において、要件タイプ判定手段3015は、以下の手順に従って、明示的クエリー要件が属する要件タイプを判定し、さらに、意味的に理解可能か、構文的に理解可能か、または構文的に理解不能かを判定する。
1)クエリー概念が既知か否かの判定:知識ベースを検索して、クエリー概念がいずれかのフィールド知識ベースの概念セクションに含まれているかどうかをチェックし、明示的クエリー要件内のクエリー概念がない場合には、未知のクエリー概念が存在すると判定する。
2)質問タイプが既知か否かの判定:言語ベースを検索して、当該ベースに質問タイプが含まれているかどうかをチェックし、明示的クエリー要件内の質問タイプがない場合には、未知の質問タイプが存在すると判定する。
3)意味整合性の判定:最初に、言語ベースを検索し、質問タイプに対応する構文内で定義されている概念制約を検出する。次に、意味整合性判定手段3013と同じ制約判定方法を利用し、知識ベースに基づいて、明示的クエリー要件内の概念が上記の概念制約を満たすかどうかを判定する。
4)要件タイプの判定:上記のステップに従って、ユーザクエリーが属するタイプを判定する。判定結果は以下のように取得する。
・ すべての概念と質問タイプが要件タイプ判定手段に既知で、かつ意味的誤りが発生しなかった場合は、意味的理解可能クエリーである。
・ すべての概念と質問タイプが要件タイプ判定手段に既知であるが、意味的誤りが発生した場合は、構文的理解可能クエリーである。
・ 一部の概念または質問タイプが要件タイプ判定手段に未知の場合は、構文的理解不能クエリーである。
例えば、要件タイプ判定手段が、図13のユーザクエリー“Is Hailong Building congested?”(海龍ビルは渋滞していますか?)は、構文的理解可能クエリーであると判定する。
図14は、本発明による意味的理解可能クエリー要件展開装置の例示的なブロック図である。意味的理解可能クエリー要件展開装置は、ユーザからの意味的理解可能クエリー要件を使用して暗黙クエリー要件を取得する。意味的理解可能クエリー要件展開装置は、関連性データベースを検索し、検索済み関連質問タイプセットとして、現在のユーザクエリー要件(明示的クエリー要件)におけるサービス関連度の高い質問タイプを取得する関連質問タイプ取得手段3021と、関連質問タイプ取得手段3021が関連質問タイプを取得しなかった場合に関連性データベースを検索し、検索済み関連クエリー概念セットとして、明示的クエリー要件内の概念との関連度の高い概念を取得する関連概念取得手段3022と、関連クエリー概念セットと関連質問タイプセットとを結合して関連クエリー要件セットを取得し、知識ベースと言語ベースとを検索して、意味的誤りを有する関連クエリー要件を除去する関連クエリー要件選択手段3023と、取得した関連クエリー要件と明示的クエリー要件との間の関連度を計算し、展開済みユーザクエリー要件として、関連度の高い関連クエリー要件を選択するクエリー要件展開生成手段3024とを備える。
図15に、意味的理解可能クエリー要件展開手順を示す。最初に、S601において、関連質問タイプ取得手段3021は関連質問タイプを取得する。関連質問タイプ取得手段3021は、関連性データベースから、明示的クエリー要件に含まれる質問タイプに関するサービス関連度データを検索し、関連質問タイプセットとして、明示的クエリー要件とのサービス関連度の高い質問タイプを取得する。
S602において、関連クエリー概念取得手段3022は、関連質問タイプが検索されなかった場合に、関連性データベースから明示的クエリー要件内のクエリー概念に関する意味的関連度データと統計的関連度データとを検索し、関連クエリー概念セットとして、明示的クエリー要件内のクエリー概念との関連度の高いすべての概念を取得する。
S603において、関連クエリー要件選択手段3023は、有益な関連クエリー要件を選択する。関連クエリー要件選択手段3023は、まず、上記で取得された関連クエリー概念セットおよび関連質問タイプセットに含まれる概念と質問タイプとを1対1の割合で結合して、1つの関連クエリー概念と1つの関連質問タイプとから成る関連クエリー要件セットを取得する。次に、関連クエリー要件選択手段3023は知識ベースと言語ベースとを検索し、各関連クエリー要件内の概念が、言語ベース内で関連クエリー要件の質問タイプによって定義された概念制約を満たすかどうかチェックする。チェックの結果がNOの場合は、関連クエリー要件が意味的誤りを有するため削除すべきであることを意味する。ここで、関連クエリー要件選択手段3023が使用する概念制約判定方法は、クエリー要件理解装置が使用する方法と同じである。
最後のステップS604において、クエリー要件展開生成手段3024は、選択された各関連クエリー要件について、明示的クエリー要件との関連度を計算する。このとき、関連度は、関連クエリー要件内のクエリー概念および明示的クエリー要件内のクエリー概念の関連度と、関連クエリー要件内の質問タイプおよび明示的クエリー要件内の質問タイプの関連度との合計に等しい値として計算される。続いて、クエリー要件展開生成手段3024は、関連度の値に基づいて関連クエリー要件をランク付けし、関連の高い関連クエリー要件を暗黙クエリー要件として選択する。このとき、複数の暗黙クエリー要件を選択することも可能である。
ユーザクエリー“where is Hailong Building?”(海龍ビルはどこですか?)を例にとると、この場合の明示的クエリー要件は“Hailong Building;address”である。質問タイプ“address”(住所)と“route”(道順)とのサービス関連度は非常に高く、“Hailong Building”はroute構文“<how|by what|through what><arrive|go|reach><?C(location)>”で定義される概念制約“location”を満足するため、“Hailong Building;route”を展開クエリーとして生成できる。
S601の後、関連質問タイプ取得手段3021はさらに、取得済み関連質問タイプと明示的クエリー要件に含まれるクエリー概念を結合して、暗黙クエリー要件を生成することができる。
図16に、構文的理解可能ユーザクエリーを利用して明示的ユーザクエリー要件を展開する構文的理解可能クエリー要件展開装置の概略図を示す。構文的理解可能クエリー要件展開装置303は、言語ベースを検索し、明示的クエリー要件内のクエリー概念が知識ベース内のどのカテゴリーに属するかを判定する概念制約取得手段3031と、関連性データベース内の意味的関連度データと統計的関連度データとを利用して、明示的クエリー要件に含まれるクエリー概念と関連度の高い概念を取得する関連クエリー概念取得手段3032と、明示的クエリー要件内の関連クエリー概念と質問タイプとを結合して暗黙クエリー要件を生成するクエリー要件展開生成手段3033とを備える。
図17に、構文的理解可能クエリー要件展開装置による構文的理解可能クエリー要件展開手順のフローチャートを示す。
S701において、概念制約取得手段3031は、明示的クエリー要件の質問タイプに基づいて言語ベースを検索し、質問タイプに対応する構文内で定義される概念制約を抽出する(すなわち、明示的クエリー要件内のクエリー概念が知識ベース内のどのカテゴリーに属するかを判定する)。関連クエリー概念取得手段3032は、知識ベースと関連性データベースとを利用して、明示的クエリー要件に含まれるクエリー概念に関連する概念を取得する。換言すれば、関連クエリー概念取得手段3032は、明示的クエリー要件に含まれるクエリー概念に基づいて、関連性データベースから意味的関連度データと統計的関連度データとを検索し、明示的クエリー要件に含まれるクエリー概念と関連度の高いすべての概念のセットを抽出する。その後、関連クエリー概念取得手段3032は、概念制約取得手段3031によって取得された概念制約に基づいて、知識ベースを検索してその制約を満たす関連クエリー概念を選択する。ここで、関連クエリー概念取得手段3032が使用する概念制約判定方法は、クエリー要件理解装置が使用する方法と同じである。
S703において、クエリー要件展開生成手段3033は、取得した関連クエリー概念と明示的クエリー要件内の質問タイプとを結合して、暗黙クエリー要件を生成する。
ユーザクエリー“Is Hailong Building congested?”(海龍ビルは渋滞していますか?)を例にとると、この場合の明示的クエリー要件は“Hailong Building;traffic status”である。クエリー概念“Hailong Building”は、質問タイプ“traffic status”に対応する構文内で定義される概念制約“road|bridge”を満たさないが、“Hailong Building”と意味的および統計的に関連する概念“Zhongguancun Street”は道路であり、制約“road|bridge”に適合するため、暗黙クエリー要件“Zhongguancun Street;traffic status”を生成することが可能である。
図18に、構文的理解不能クエリーを処理する構文的理解不能クエリー要件展開装置の概略図を示す。この装置は、関連性データベース内の文字列類似度データを利用し、ユーザからの明示的クエリー要件に基づいて、暗黙クエリー要件を取得する。構文的理解不能クエリー要件展開装置は、言語ベースを検索し、ユーザクエリーに含まれる質問タイプに類似した質問タイプを取得する類似質問タイプ取得手段3041と、知識ベースと言語ベースとを使用して、ユーザクエリー内の未認識概念の意味を推測する概念意味推測手段3042と、関連性データベース内の文字列類似度データと知識ベースとに基づいて、未認識概念の文字列に類似したクエリー概念を取得する類似クエリー概念取得手段3043と、暗黙クエリー要件を生成するクエリー要件展開生成手段3044とを備える。
図19に、構文的理解不能クエリー要件展開装置による構文的理解不能クエリー要件展開手順のフローチャートを示す。S801において、類似質問タイプ取得手段3041は、クエリー要件理解装置301が明示的クエリー要件内の概念と質問タイプのいずれも認識しなかった場合には、クエリー要件理解装置301によるユーザクエリーの解析結果に基づいて言語ベースを検索し、その言語ベースからユーザクエリーへの類似度が最も高い構文を検出し、検出した構文に対応する質問タイプを類似質問タイプとして抽出する。
S802において、概念意味推測手段3042は、文脈ベースの概念意味と構文制約ベースの概念意味を使用して、ユーザクエリー内の未認識概念が属するカテゴリーを推測する。文脈ベースの概念意味の推測では、概念意味推測手段3042により、ユーザクエリーに存在する各語を知識ベース内で検索し、その語が知識ベース内で検出され、かつ構文的にその語に関連するカテゴリーも知識ベース内で検出された場合には、その未認識概念は当該カテゴリーと何らかの意味的関連性を有すると推測する。一方、構文制約ベースの概念意味の推測では、類似質問タイプ取得手段3041によって取得された類似質問タイプに基づいて、概念意味推測手段3042により言語ベースを検索し、その質問タイプに対応する構文内で定義される概念制約を抽出し、それによって、クエリー概念が属し、よって当該未認識概念も属すると推測されるカテゴリーを特定する。その後、概念意味推測手段3042は、文脈ベース概念意味推測の結果と構文制約ベース概念意味推測の結果との間の交差部分を計算して統合し、それを未認識概念が属するカテゴリーとする。
S803において、類似クエリー概念取得手段3043は、関連性データベースと知識ベースとに基づいて未認識概念に類似したクエリー概念を取得する。最初に、類似クエリー概念取得手段3043は、関連性データベース内の文字列類似度データに基づいて、未認識概念との文字列類似度の高いすべての概念を取得する。概念意味推測手段3042が未認識概念の属するカテゴリーを推測した場合には、すべての文字列類似概念から、S802において取得されたカテゴリーに属する概念を選択することが必要になる。ここで使用される制約判定方法は、クエリー要件理解装置によって使用される方法と同じである。
S804において、クエリー要件展開生成手段3044は、類似概念と類似質問タイプとを結合することにより、暗黙クエリー要件を生成する。
ユーザクエリー“I want to buy a computer,and how can I go to Pacific?”(コンピュータを買いたいのですが、パシフィックにはどうやったら行けますか?)を例にとると、システムは“Pacific”を知らないので、このクエリーに一致する質問タイプはない。この場合は、以下のステップを実行できる。最初に、ユーザクエリーに類似した構文、すなわち“syntax:<how|by what|through what><go to|arrive|reach><?C(location)?”、を検出し、この構文に対応する質問タイプ“route”(道順)を抽出する。次に、“Pacific”の意味を推測する。すなわち、図6の知識ベースから、ユーザクエリー内の“Electronic Building”(電子ビル)と語“computer”(コンピュータ)との関係は“sell(Electronic Building,computer)”であり、類似質問タイプ“route”(道順)に対応する構文内の概念制約は“location”(ロケーション)であり、かつ“isa(Electronic Building,location)”が存在するため、“Pacific”は“Electronic Building”(電子ビル)というカテゴリーに属することが推測できる。次に、類似概念を取得する。すなわち、“Pacific”は図11に示される“Pacific Building”と類似した文字列であり、かつ“Pacific Building”は図6に示されるカテゴリー“Electronic Building”に属するため、“Pacific Building”は類似概念とみなされる。最後に、暗黙クエリー要件“Pacific Building;route”を生成する。
クエリー要件理解装置301が明示的クエリー要件内の概念を認識せず、同じクエリー内の質問タイプのみを認識した場合には、概念意味推測手段3042は、文脈ベースの概念意味と構文制約ベースの概念意味を使用して、そのユーザクエリー内の未認識概念が属するカテゴリーを推測する。類似クエリー概念取得手段3043は、類似概念として、関連性データベース内の文字列類似度データに基づいて、未認識概念との文字列類似度の高いすべての概念を取得する。その後、概念意味推測手段3042が未認識概念の属するカテゴリーを推測した場合には、すべての文字列類似概念から、そのカテゴリーに属する概念を選択することが必要になる。ここで使用される制約判定方法は、クエリー要件理解装置によって使用される方法と同じである。
その後、クエリー要件展開生成手段3044は、上記で取得された類似概念と、明示的クエリー要件内の質問タイプとを結合することにより、暗黙クエリー要件を生成する。
類似質問タイプ取得手段3041は、クエリー要件理解装置301が明示的クエリー要件内の質問タイプを認識せず、そのクエリー内の概念のみを認識した場合には、クエリー要件理解装置301によるユーザクエリーの解析結果に基づいて言語ベースを検索し、その言語ベースからユーザクエリーへの類似度が最も高い構文を検出し、検出した構文に対応する質問タイプを類似質問タイプとして抽出する。その後、クエリー要件展開生成手段3044は、上記で取得された類似質問タイプと、明示的クエリー要件内の概念とを結合することにより、暗黙クエリー要件を生成する。
ユーザクエリーに対する上記の意味的理解可能クエリー、構文的理解可能クエリー、および構文的理解不能クエリーの上記処理の後に、展開応答生成装置305はその暗黙クエリー要件に対応する展開応答を生成する。この手順は、まず、暗黙クエリー要件内の質問タイプに基づいて言語ベースを検索して、質問タイプに対応するクエリーアクションを取得し、次に、暗黙クエリー要件内のクエリー概念をクエリーアクションの対応する位置に配置して、暗黙クエリー要件に対応する特定アクションを生成し、最後に、知識ベースと情報ベースとを検索して対応する応答を取得するステップから成る。この実装では、特定のサービスフィールドが必要となり、情報ベースのフォーマットも限定される。ここでは既知の方法を使用できるが、その説明は省略する。例えば、暗黙クエリー要件“Hailong Building;route”の場合、質問タイプ“route”に対応するクエリーアクションは“route query(?C)”,“?C”であり、“?C”を“Hailong Building”と置換して特定アクション“route query(Hailong Building)”が取得される。これにより、“go to Hailong Building by bus No.320”(320番のバスで海龍ビルに行ってください)という回答が検索される。
ユーザクエリーに対するクエリー要件理解処理の後に、直接回答生成装置は明示的クエリー要件に直接対応する応答を生成する。この手順においては、ユーザクエリーが意味的理解可能クエリーに属する場合には、明示的クエリー要件に基づいて言語ベースと知識ベースと背景情報ベースとを検索して対応する応答を生成するステップが実行され(検索と生成は展開応答の生成方法と同じ方法で実行される)、ユーザクエリーが構文的理解可能クエリーまたは構文的理解不能クエリーに属する場合には、対応する誤り指示情報を生成するステップが実行される。例えば、明示的クエリー要件“Hailong Building,traffic status”は構文的理解可能クエリーに属するので、システムは、“Hailong Building is not a roadORa bridge,the system can not find out information about its traffic status”(海龍ビルは道路または橋ではないため、システムは交通状態の情報を見つけることができません)という直接応答を発行する。
図20〜22に、知識ベースと言語ベースと関連性データベースとを利用して、意味的理解可能、構文的理解可能、および構文的理解不能クエリーを実行する方法を説明する3つの例を示す。
図23は、本発明の他の実施例による自然語クエリー要件展開器の概略図である。図23に示す装置は、図4に示す自然語クエリー要件展開器と比較すると、構文的理解可能クエリー要件展開装置と構文的理解不能クエリー要件展開装置がない点が異なる。説明の煩雑化を避けるため、同じ装置の説明は省略する。また、図23では知識ベース201、言語ベース202、関連性データベース203は自然語クエリー要件展開器に内蔵されているが、自然語クエリー要件展開のためには知識ベースは外付けとするのでもよい。さらに、自然語クエリー要件展開器には、意味的理解可能、構文的理解可能、および構文的理解不能クエリーの3つの要件展開装置のうち、少なくとも1つを含めることも可能である。
本発明のさらに他の実施例によれば、自然語クエリー要件展開器は、構文的理解可能クエリー要件展開装置または構文的理解不能クエリー要件展開装置のみを含むこともできる。
上記の説明では、交通状態クエリーの展開処理を中国語の交通状態クエリーによって例示したが、本発明のクエリー要件展開器は、情報検索、インテリジェント教示・推奨システム等の様々な用途に適用できることは理解されるであろう。また、本発明は、英語や日本語等の他の言語での交通状態クエリーの展開処理にも適用できることは当業者には明らかである。
以上好ましい実施の形態と実施例をあげて本発明を説明したが、本発明は必ずしも、上記実施の形態及び実施例に限定されるものでなく、その技術的思想の範囲内において様々に変形して実施することができる。
本発明の一実施例による自然語クエリー要件展開器の概略図である。 要件関連性データベースの一例である。 本発明の一実施例による自然語クエリー要件展開方法のフローチャートである。 本発明による自然語クエリー要件展開器の概略図である。 本発明による知識ベースの概略図である。 本発明による知識ベースの階層を示す概略図である。 本発明による言語ベースの概略図である。 本発明による関連性データベースの概略図である。 本発明による関連性データベース生成装置の概略図である。 関連性データベース生成装置による関連性データベース生成方法のフローチャートである。 本発明によるクエリー要件理解装置の概略図である。 本発明によるクエリー要件理解方法のフローチャートである。 本発明によるクエリー要件理解動作の一例である。 本発明による意味的理解可能クエリー要件展開装置の概略図である。 本発明による意味的理解可能クエリー要件展開方法のフローチャートである。 本発明による構文的理解可能クエリー要件展開装置の概略図である。 本発明による構文的理解可能クエリー要件展開方法のフローチャートである。 本発明による構文的理解不能クエリー要件展開装置の概略図である。 本発明による構文的理解不能クエリー要件展開方法のフローチャートである。 3つの例である。 3つの例である。 3つの例である。 本発明の他の実施例による自然語クエリー要件展開器の概略図である。
符号の説明
1:クエリー受信機
2:クエリー要件理解装置
3:クエリー要件展開装置
4:展開応答生成装置
5:要件関連性データベース
101:クエリー受信機
102:応答送信機
201:知識ベース
202:言語ベース
203:関連性データベース
301:クエリー要件理解装置
302:意味的理解可能クエリー要件展開装置
303:構文的理解可能クエリー要件展開装置
304:構文的理解不能クエリー要件展開装置
305:展開応答生成装置
42:意味的関連度計算手段
44:統計的関連度計算手段
45:文字列関連度計算手段
46:サービス関連度計算手段
3011:構文分析手段
3012:照合手段
3013:意味整合性判定手段
3014:明示的クエリー要件生成手段
3015:要件タイプ判定手段
3021:関連質問タイプ取得手段
3022:関連クエリー概念取得手段
3023:関連クエリー要件選択手段
3024:クエリー要件展開生成手段
3031:概念制約取得手段
3032:関連クエリー概念取得手段
3033:クエリー要件展開生成手段
3041:類似質問タイプ取得手段
3042:概念意味推測手段
3043:類似クエリー概念取得手段
3044:クエリー要件展開生成手段

Claims (35)

  1. クエリー要件展開器であって、
    ユーザのクエリー要求に基づいて、明示的クエリー要件を生成するクエリー要件理解装置と、
    前記明示的クエリー要件に関連付けて暗黙クエリー要件を生成するクエリー要件展開装置とを備え
    前記クエリー要件理解装置が、
    知識ベースと言語ベースとに基づいてユーザクエリーを解析する解析手段と、
    一致する構文を検出するために、解析済みユーザクエリーを言語ベースと照合する照合手段と、
    前記知識ベースと前記言語ベースとに基づいて、ユーザクエリー内の概念に意味上の誤りがあるかどうかを判定する意味整合性判定手段と、
    一致した構文に基づいて、一致した構文に対応し、かつクエリー概念と質問タイプとを含む明示的クエリー要件を生成する明示的クエリー要件生成手段と、
    前記知識ベースと前記言語ベースとに基づいて、明示的クエリー要件がどのタイプに属し、意味的に理解可能か、構文的に理解可能か、または構文的に理解不能かを判定する要件タイプ判定手段とを備え、
    前記クエリー要件展開装置が、
    意味的に理解可能な明示的クエリー要件に基づいて関連性データベースを検索し、さらに、この意味的に理解可能なクエリー要件と関連付けられ、かつ、関連クエリー概念と関連質問タイプ、またはクエリー概念と関連質問タイプのいずれかを有する暗黙クエリー要件を含む関連クエリー要件セットを取得する意味的理解可能クエリー要件展開装置を備える
    ことを特徴とするクエリー要件展開器。
  2. 前記意味的理解可能クエリー要件展開装置は、
    前記関連性データベースを検索し、検索済み関連質問タイプセットとして、前記明示的クエリー要件におけるサービス関連度の高い質問タイプを取得する関連質問タイプ取得手段と、
    前記関連性データベースを検索し、検索済み関連クエリー概念セットとして、前記明示的クエリー要件内の概念との関連度の高い概念を取得する関連概念取得手段と、
    前記関連クエリー概念セットと前記関連質問タイプセットとを結合して関連クエリー要件セットを取得し、前記知識ベースと前記言語ベースとを検索して、意味的誤りを有する関連クエリー要件を除去する関連クエリー要件選択手段と、
    取得した前記関連クエリー要件と前記明示的クエリー要件との間の関連度を計算し、展開済みユーザクエリー要件として、関連度の高い前記関連クエリー要件を選択するクエリー要件展開生成手段とを備えることを特徴とする請求項1に記載のクエリー要件展開器
  3. 前記クエリー要件展開生成手段は、
    前記関連質問タイプと前記質問タイプの間の第2の関連度と共に前記関連クエリー概念とクエリー概念の間の第1の関連度をそれぞれ計算し、
    前記第1の関連度と前記第2の関連度を追加して、前記関連クエリー要件と前記明示的クエリー要件の間の関連度を取得し、
    前記関連クエリー概念と前記関連質問タイプは、前記関連クエリー要件に含まれ、また、前記クエリー概念および前記質問タイプは、前記明示的クエリー要件に含まれることを特徴とする請求項2に記載のクエリー要件展開器
  4. 前記クエリー要件展開装置は、前記知識ベースと前記関連性データベースとに基づいて、構文的に理解可能な明示的クエリー要件に含まれるクエリー概念との関連性の高い関連クエリー概念セットを形成し、前記知識ベースを利用して、この関連クエリー概念セットから、事前定義された制約条件を満たす少なくとも1つの関連クエリー概念を選択し、さらに、暗黙クエリー要件として、少なくとも1つの選択した関連クエリー概念を明示的クエリー要件の質問タイプと結合する、構文的理解可能クエリー要件展開装置を備えることを特徴とする請求項1に記載のクエリー要件展開器
  5. 前記構文的理解可能クエリー要件展開装置は、
    前記明示的クエリー要件に含まれる前記質問タイプに従って前記言語ベースを検索し、前記質問タイプに対応する構文において定義された概念制約を抽出する概念制約取得手段と、
    前記関連性データベースを利用して前記明示的クエリー要件に含まれるクエリー概念と関連度の高い概念を取得し、前記制約条件を満たす前記関連クエリー概念を選択するために、前記概念制約取得手段から取得した前記制約条件に従って前記知識ベースを検索する関連クエリー概念取得手段と、
    前記明示的クエリー要件内の関連クエリー概念と質問タイプとを結合して暗黙クエリー要件を生成するクエリー要件展開生成手段とを備えることを特徴とする請求項4に記載のクエリー要件展開器
  6. 前記クエリー要件展開装置は、類似したクエリー概念と類似した質問タイプの一方または両方を含む暗黙クエリー要件を取得するために、前記言語ベースを利用して、前記明示的クエリー要件に含まれる質問タイプに類似した質問タイプを検索するか、前記知識ベースと前記関連性データベースとを利用して、前記明示的クエリー要件内の未認識のクエリー概念に類似したクエリー概念を検索するか、またはその両方を実行する構文的理解不能クエリー要件展開装置を備えることを特徴とする請求項1に記載のクエリー要件展開器
  7. 前記構文的理解不能クエリー要件展開装置は、
    前記言語ベースを検索し、ユーザクエリーに含まれる質問タイプに類似した質問タイプを、類似質問タイプとして取得する類似質問タイプ取得手段と、
    関連性データベース内の文字列類似度データに基づいて、未認識概念の文字列に類似したクエリー概念を、類似クエリー概念として取得する類似クエリー概念取得手段と、
    前記類似クエリー概念と前記類似質問タイプとを結合し、暗黙クエリー要件を生成するクエリー要件展開生成手段とを備えることを特徴とする請求項6に記載のクエリー要件展開器
  8. 前記構文的理解不能クエリー要件展開装置は、
    前記知識ベースと、前記類似質問タイプに対応する構文に定義される概念制約を利用して、未認識クエリー概念が属するカテゴリーを推測する、前記類似質問タイプ取得手段に接続される概念意味推測手段を備え、
    前記類似クエリー概念取得手段は、類似概念として、前記未認識クエリー概念に類似する文字列を有する概念から、推測カテゴリーと同じカテゴリーに属する概念を選択することを特徴とする請求項7に記載のクエリー要件展開器。
  9. 前記クエリー要件展開装置は、
    意味的に理解可能な明示的クエリー要件に基づいて前記関連性データベースを検索し、さらに、この意味的に理解可能なクエリー要件と関連付けられ、かつ、前記関連クエリー概念と前記関連質問タイプ、または前記クエリー概念と前記関連質問のいずれかを有する暗黙クエリー要件を含む関連クエリー要件セットを取得する意味的理解可能クエリー要件展開装置と、
    前記知識ベースと前記関連性データベースとに基づいて、構文的に理解可能な明示的クエリー要件に含まれるクエリー概念との関連性の高い関連クエリー概念セットを形成し、前記知識ベースを利用して、この関連クエリー概念セットから、事前定義された制約条件を満たす少なくとも1つの関連クエリー概念を選択し、さらに、暗黙クエリー要件として、少なくとも1つの選択した関連クエリー概念を明示的クエリー要件の質問タイプと結合する、構文的理解可能クエリー要件展開装置を備えることを特徴とする請求項1に記載のクエリー要件展開器
  10. 前記意味的理解可能クエリー要件展開装置は、
    前記関連性データベースを検索し、検索済み関連質問タイプセットとして、前記明示的クエリー要件におけるサービス関連度の高い質問タイプを取得する関連質問タイプ取得手段と、
    前記関連性データベースを検索し、検索済み関連クエリー概念セットとして、前記明示的クエリー要件内の概念との関連度の高い概念を取得する関連概念取得手段と、
    前記関連クエリー概念セットと前記関連質問タイプセットとを結合して関連クエリー要件セットを取得し、前記知識ベースと前記言語ベースとを検索して、意味的誤りを有する関連クエリー要件を除去する関連クエリー要件選択手段と、
    取得した前記関連クエリー要件と前記明示的クエリー要件との間の関連度を計算し、展開済みユーザクエリー要件として、関連度の高い前記関連クエリー要件を選択するクエリー要件展開生成手段とを備えることを特徴とする請求項9に記載のクエリー要件展開器
  11. 前記クエリー要件展開生成手段は、
    前記関連質問タイプと前記質問タイプの間の第2の関連度と共に前記関連クエリー概念とクエリー概念の間の第1の関連度をそれぞれ計算し、
    前記第1の関連度と前記第2の関連度を追加して、前記関連クエリー要件と前記明示的クエリー要件の間の関連度を取得し、
    前記関連クエリー概念と前記関連質問タイプは、前記関連クエリー要件に含まれ、また、前記クエリー概念および前記質問タイプは、前記明示的クエリー要件に含まれることを特徴とする請求項10に記載のクエリー要件展開器
  12. 前記構文的理解可能クエリー要件展開装置は、
    前記明示的クエリー要件に含まれる前記質問タイプに従って前記言語ベースを検索し、前記質問タイプに対応する構文において定義された概念制約を抽出する概念制約取得手段と、
    前記関連性データベースを利用して前記明示的クエリー要件に含まれるクエリー概念と関連度の高い概念を取得し、前記制約条件を満たす前記関連クエリー概念を選択するために、前記概念制約取得手段から取得した前記制約条件に従って前記知識ベースを検索する関連クエリー概念取得手段と、
    前記明示的クエリー要件内の関連クエリー概念と質問タイプとを結合して暗黙クエリー要件を生成するクエリー要件展開生成手段とを備えることを特徴とする請求項9に記載のクエリー要件展開器
  13. 前記クエリー要件展開装置は、
    意味的に理解可能な明示的クエリー要件に基づいて前記関連性データベースを検索し、さらに、この意味的に理解可能なクエリー要件と関連付けられ、かつ、前記関連クエリー概念と前記関連質問タイプ、または前記クエリー概念と前記関連質問のいずれかを有する暗黙クエリー要件を含む関連クエリー要件セットを取得する意味的理解可能クエリー要件展開装置と、
    類似したクエリー概念と類似した質問タイプの一方または両方を含む暗黙クエリー要件を取得するために、前記言語ベースを利用して、前記明示的クエリー要件に含まれる質問タイプに類似した質問タイプを検索するか、前記知識ベースと前記関連性データベースとを利用して、前記明示的クエリー要件内の未認識のクエリー概念に類似したクエリー概念を検索するか、またはその両方を実行する構文的理解不能クエリー要件展開装置を備えることを特徴とする請求項1に記載のクエリー要件展開器
  14. 前記意味的理解可能クエリー要件展開装置は、
    前記関連性データベースを検索し、検索済み関連質問タイプセットとして、前記明示的クエリー要件におけるサービス関連度の高い質問タイプを取得する関連質問タイプ取得手段と、
    前記関連性データベースを検索し、検索済み関連クエリー概念セットとして、前記明示的クエリー要件内の概念との関連度の高い概念を取得する関連概念取得手段と、
    前記関連クエリー概念セットと前記関連質問タイプセットとを結合して関連クエリー要件セットを取得し、前記知識ベースと前記言語ベースとを検索して、意味的誤りを有する関連クエリー要件を除去する関連クエリー要件選択手段と、
    取得した前記関連クエリー要件と前記明示的クエリー要件との間の関連度を計算し、展開済みユーザクエリー要件として、関連度の高い前記関連クエリー要件を選択するクエリー要件展開生成手段とを備えることを特徴とする請求項13に記載のクエリー要件展開器
  15. 前記クエリー要件展開生成手段は、
    前記関連質問タイプと前記質問タイプの間の第2の関連度と共に前記関連クエリー概念とクエリー概念の間の第1の関連度をそれぞれ計算し、
    前記第1の関連度と前記第2の関連度を追加して、前記関連クエリー要件と前記明示的クエリー要件の間の関連度を取得し、
    前記関連クエリー概念と前記関連質問タイプは、前記関連クエリー要件に含まれ、また、前記クエリー概念および前記質問タイプは、前記明示的クエリー要件に含まれることを特徴とする請求項14に記載のクエリー要件展開器
  16. 前記構文的理解不能クエリー要件展開装置は、
    前記言語ベースを検索し、ユーザクエリーに含まれる質問タイプに類似した質問タイプを、類似質問タイプとして取得する類似質問タイプ取得手段と、
    関連性データベース内の文字列類似度データに基づいて、未認識概念の文字列に類似したクエリー概念を、類似クエリー概念として取得する類似クエリー概念取得手段と、
    前記類似クエリー概念と前記類似質問タイプとを結合し、暗黙クエリー要件を生成するクエリー要件展開生成手段とを備えることを特徴とする請求項13に記載のクエリー要件展開器
  17. 前記構文的理解不能クエリー要件展開装置は、
    前記知識ベースと、前記類似質問タイプに対応する構文に定義される概念制約を利用して、未認識クエリー概念が属するカテゴリーを推測する、前記類似質問タイプ取得手段に接続される概念意味推測手段を備え、
    前記類似クエリー概念取得手段は、類似概念として、前記未認識クエリー概念に類似する文字列を有する概念から、推測カテゴリーと同じカテゴリーに属する概念を選択することを特徴とする請求項16に記載のクエリー要件展開器
  18. 前記クエリー要件展開装置は、
    前記知識ベースと前記関連性データベースとに基づいて、構文的に理解可能な明示的クエリー要件に含まれるクエリー概念との関連性の高い関連クエリー概念セットを形成し、前記知識ベースを利用して、この関連クエリー概念セットから、事前定義された制約条件を満たす少なくとも1つの関連クエリー概念を選択し、さらに、暗黙クエリー要件として、少なくとも1つの選択した関連クエリー概念を明示的クエリー要件の質問タイプと結合する、構文的理解可能クエリー要件展開装置と、
    類似したクエリー概念と類似した質問タイプの一方または両方を含む暗黙クエリー要件を取得するために、前記言語ベースを利用して、前記明示的クエリー要件に含まれる質問タイプに類似した質問タイプを検索するか、前記知識ベースと前記関連性データベースとを利用して、前記明示的クエリー要件内の未認識のクエリー概念に類似したクエリー概念を検索するか、またはその両方を実行する構文的理解不能クエリー要件展開装置を備えることを特徴とする請求項1に記載のクエリー要件展開器
  19. 前記構文的理解可能クエリー要件展開装置は、
    前記明示的クエリー要件に含まれる前記質問タイプに従って前記言語ベースを検索し、前記質問タイプに対応する構文において定義された概念制約を抽出する概念制約取得手段と、
    前記関連性データベースを利用して前記明示的クエリー要件に含まれるクエリー概念と関連度の高い概念を取得し、前記制約条件を満たす前記関連クエリー概念を選択するために、前記概念制約取得手段から取得した前記制約条件に従って前記知識ベースを検索する関連クエリー概念取得手段と、
    前記明示的クエリー要件内の関連クエリー概念と質問タイプとを結合して暗黙クエリー要件を生成するクエリー要件展開生成手段とを備えることを特徴とする請求項18に記載のクエリー要件展開器
  20. 前記構文的理解不能クエリー要件展開装置は、
    前記言語ベースを検索し、ユーザクエリーに含まれる質問タイプに類似した質問タイプを、類似質問タイプとして取得する類似質問タイプ取得手段と、
    関連性データベース内の文字列類似度データに基づいて、未認識概念の文字列に類似したクエリー概念を、類似クエリー概念として取得する類似クエリー概念取得手段と、
    前記類似クエリー概念と前記類似質問タイプとを結合し、暗黙クエリー要件を生成するクエリー要件展開生成手段とを備えることを特徴とする請求項18に記載のクエリー要件展開器
  21. 前記構文的理解不能クエリー要件展開装置は、
    前記知識ベースと、前記類似質問タイプに対応する構文に定義される概念制約を利用して、未認識クエリー概念が属するカテゴリーを推測する、前記類似質問タイプ取得手段に接続される概念意味推測手段を備え、
    前記類似クエリー概念取得手段は、類似概念として、前記未認識クエリー概念に類似する文字列を有する概念から、推測カテゴリーと同じカテゴリーに属する概念を選択することを特徴とする請求項20に記載のクエリー要件展開器
  22. 前記クエリー要件展開装置は、
    意味的に理解可能な明示的クエリー要件に基づいて前記関連性データベースを検索し、さらに、この意味的に理解可能なクエリー要件と関連付けられ、かつ、前記関連クエリー概念と前記関連質問タイプ、または前記クエリー概念と前記関連質問のいずれかを有する暗黙クエリー要件を含む関連クエリー要件セットを取得する意味的理解可能クエリー要件展開装置と、
    前記知識ベースと前記関連性データベースとに基づいて、構文的に理解可能な明示的クエリー要件に含まれるクエリー概念との関連性の高い関連クエリー概念セットを形成し、前記知識ベースを利用して、この関連クエリー概念セットから、事前定義された制約条件を満たす少なくとも1つの関連クエリー概念を選択し、さらに、暗黙クエリー要件として、少なくとも1つの選択した関連クエリー概念を明示的クエリー要件の質問タイプと結合する、構文的理解可能クエリー要件展開装置と、
    類似したクエリー概念と類似した質問タイプの一方または両方を含む暗黙クエリー要件を取得するために、前記言語ベースを利用して、前記明示的クエリー要件に含まれる質問タイプに類似した質問タイプを検索するか、前記知識ベースと前記関連性データベースとを利用して、前記明示的クエリー要件内の未認識のクエリー概念に類似したクエリー概念を検索するか、またはその両方を実行する構文的理解不能クエリー要件展開装置と
    を備えることを特徴とする請求項1に記載のクエリー要件展開器
  23. 展開応答を生成するために、暗黙クエリー要件を使って前記言語ベース、前記知識ベースおよび情報ベースを検索する展開応答生成装置を備えることを特徴とする請求項1から請求項22の何れかに記載のクエリー要件展開器
  24. 直接クエリー応答を生成するために、明示的クエリー要件を利用して前記言語ベース、前記知識ベースおよび情報ベースを検索する直接応答生成装置を備えることを特徴とする請求項1から請求項23の何れかに記載のクエリー要件展開器
  25. ユーザのクエリー要求に基づいて、明示的クエリー要件を生成するクエリー要件理解ステップと、
    前記明示的クエリー要件に関連付けて暗黙クエリー要件を生成するクエリー要件展開ステップとを含み、
    前記クエリー要件理解ステップは、
    知識ベースと言語ベースとに基づいてユーザクエリーを解析する解析ステップと、
    一致する構文を検出するために、解析済みユーザクエリーを言語ベースと照合する照合ステップと、
    前記知識ベースと前記言語ベースとに基づいて、ユーザクエリー内の概念に意味上の誤りがあるかどうかを判定する意味整合性判定ステップと、
    一致した構文に基づいて、一致した構文に対応し、かつクエリー概念と質問タイプとを含む明示的クエリー要件を生成する明示的クエリー要件生成ステップと、
    前記知識ベースと前記言語ベースとに基づいて、明示的クエリー要件がどのタイプに属し、意味的に理解可能か、構文的に理解可能か、または構文的に理解不能かを判定する要件タイプ判定ステップとを含み、
    前記クエリー要件展開ステップは、
    意味的に理解可能な明示的クエリー要件に基づいて関連性データベースを検索し、さらに、この意味的に理解可能なクエリー要件と関連付けられ、かつ、関連クエリー概念と関連質問タイプ、またはクエリー概念と関連質問のいずれかを有する暗黙クエリー要件を含む関連クエリー要件セットを取得する意味的理解可能クエリー要件展開ステップと、
    前記知識ベースと前記関連性データベースとに基づいて、構文的に理解可能な明示的クエリー要件に含まれるクエリー概念との関連性の高い関連クエリー概念セットを形成し、前記知識ベースを利用して、この関連クエリー概念セットから、事前定義された制約条件を満たす少なくとも1つの関連クエリー概念を選択し、さらに、暗黙クエリー要件として、少なくとも1つの選択した関連クエリー概念を明示的クエリー要件の質問タイプと結合する、構文的理解可能クエリー要件展開ステップと、
    類似したクエリー概念と類似した質問タイプの一方または両方を含む暗黙クエリー要件を取得するために、前記言語ベースを利用して、前記明示的クエリー要件に含まれる質問タイプに類似した質問タイプを検索するか、前記知識ベースと前記関連性データベースとを利用して、前記明示的クエリー要件内の未認識のクエリー概念に類似したクエリー概念を検索するか、またはその両方を実行する構文的理解不能クエリー要件展開ステップのうちの少なくとも1つを含む
    ことを特徴とするクエリー要件展開方法
  26. 前記意味的理解可能クエリー要件展開ステップは、
    前記関連性データベースを検索し、検索済み関連質問タイプセットとして、前記明示的クエリー要件におけるサービス関連度の高い質問タイプを取得する関連質問タイプ取得ステップと、
    前記関連性データベースを検索し、検索済み関連クエリー概念セットとして、前記明示的クエリー要件内の概念との関連度の高い概念を取得する関連概念取得ステップと、
    前記関連クエリー概念セットと前記関連質問タイプセットとを結合して関連クエリー要件セットを取得し、前記知識ベースと前記言語ベースとを検索して、意味的誤りを有する関連クエリー要件を除去する関連クエリー要件選択ステップと、
    取得した前記関連クエリー要件と前記明示的クエリー要件との間の関連度を計算し、展開済みユーザクエリー要件として、関連度の高い前記関連クエリー要件を選択するクエリー要件展開生成ステップと
    を含むことを特徴とする請求項25に記載のクエリー要件展開方法
  27. 前記クエリー要件展開生成ステップは、
    前記関連質問タイプと前記質問タイプの間の第2の関連度と共に前記関連クエリー概念とクエリー概念の間の第1の関連度をそれぞれ計算し、
    前記第1の関連度と前記第2の関連度を追加して、前記関連クエリー要件と前記明示的クエリー要件の間の関連度を取得するステップを含み、
    前記関連クエリー概念と前記関連質問タイプは、前記関連クエリー要件に含まれ、また、前記クエリー概念および前記質問タイプは、前記明示的クエリー要件に含まれることを特徴とする請求項26に記載のクエリー要件展開方法
  28. 前記構文的理解可能クエリー要件展開ステップは、
    前記明示的クエリー要件に含まれる前記質問タイプに従って前記言語ベースを検索し、前記質問タイプに対応する構文において定義された概念制約を抽出する概念制約取得ステップと、
    前記関連性データベースを利用して前記明示的クエリー要件に含まれるクエリー概念と関連度の高い概念を取得し、前記制約条件を満たす前記関連クエリー概念を選択するために、前記概念制約取得ステップから取得した前記制約条件に従って前記知識ベースを検索する関連クエリー概念取得ステップと、
    前記明示的クエリー要件内の関連クエリー概念と質問タイプとを結合して暗黙クエリー要件を生成するクエリー要件展開生成ステップとを含むことを特徴とする請求項25に記載のクエリー要件展開方法
  29. 前記構文的理解不能クエリー要件展開ステップは、
    前記言語ベースを検索し、ユーザクエリーに含まれる質問タイプに類似した質問タイプを、類似質問タイプとして取得する類似質問タイプ取得ステップと、
    関連性データベース内の文字列類似度データに基づいて、未認識概念の文字列に類似したクエリー概念を、類似クエリー概念として取得する類似クエリー概念取得ステップと、
    前記類似クエリー概念と前記類似質問タイプとを結合し、暗黙クエリー要件を生成するクエリー要件展開生成ステップとを含むことを特徴とする請求項25に記載のクエリー要件展開方法
  30. 前記構文的理解不能クエリー要件展開ステップは、
    前記知識ベースと、前記類似質問タイプに対応する構文に定義される概念制約を利用して、未認識クエリー概念が属するカテゴリーを推測する概念意味推測ステップを含み、
    前記類似クエリー概念取得ステップは、類似概念として、前記未認識クエリー概念に類似する文字列を有する概念から、推測カテゴリーと同じカテゴリーに属する概念を選択することを特徴とする請求項29に記載のクエリー要件展開方法
  31. 意味的な関連データを生成するために前記知識ベースに基づいて前記知識ベースの概念間の意味的な関連性を計算するステップと、
    統計的関連度を生成するために、コーパスに対して統計を実行することにより、前記知識ベースにおける概念間の共通情報を計算するステップと、
    文字列類似データを生成するために、辞書に基づいて語句間の文字列類似度を計算するステップと、
    サービス関連データを生成するために、ユーザクエリーログに基づいて各クエリーの一致した構文に対応する質問タイプ間の関連度を計算するステップ
    の少なくとも1つによって前記関連性データベースを生成することを特徴とする請求項25から請求項30の何れかに記載のクエリー要件展開方法
  32. 各フィールド毎の知識ベースを生成するために、各フィールド情報ベースから概念、属性及び概念間の関係を抽出するステップと、
    マッピング知識ベースを生成するために、同義語辞書、省略ルールライブラリ、多言語辞書及び電子地図から同義語マッピング関係、言語マッピング関係及び空間マッピング関係を抽出するステップとによって前記知識ベースを生成することを特徴とする請求項25から請求項31の何れかに記載のクエリー要件展開方法
  33. 各フィールドクエリー言語を生成するために、各フィールド内のユーザクエリー文を収集し、クエリー文間の類似度を計算し、類似度に基づいてそれらのクエリー文をクラスター化するステップと、
    各フィールドクエリー言語間の類似度を計算し、パブリッククエリー言語を抽出するステップとによって前記言語ベースを生成することを特徴とする請求項25から請求項31の何れかに記載のクエリー要件展開方法
  34. 展開応答を生成するために、暗黙クエリー要件を使って前記言語ベース、前記知識ベースおよび情報ベースを検索する展開応答生成ステップを含むことを特徴とする請求項25から請求項33の何れかに記載のクエリー要件展開方法
  35. 直接クエリー応答を生成するために、明示的クエリー要件を利用して前記言語ベース、前記知識ベースおよび情報ベースを検索する直接応答生成ステップを含むことを特徴とする請求項25から請求項34の何れかに記載のクエリー要件展開方法
JP2008170339A 2007-07-05 2008-06-30 クエリー要件展開器およびクエリー要件展開方法 Expired - Fee Related JP4937201B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2007101274314A CN101339551B (zh) 2007-07-05 2007-07-05 自然语言查询需求扩展设备及其方法
CN200710127431.4 2007-07-05

Publications (2)

Publication Number Publication Date
JP2009037603A JP2009037603A (ja) 2009-02-19
JP4937201B2 true JP4937201B2 (ja) 2012-05-23

Family

ID=40213621

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008170339A Expired - Fee Related JP4937201B2 (ja) 2007-07-05 2008-06-30 クエリー要件展開器およびクエリー要件展開方法

Country Status (3)

Country Link
US (1) US8180628B2 (ja)
JP (1) JP4937201B2 (ja)
CN (1) CN101339551B (ja)

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100930617B1 (ko) * 2008-04-08 2009-12-09 한국과학기술정보연구원 다중 개체 중심적 통합 검색 시스템 및 방법
US20100241893A1 (en) 2009-03-18 2010-09-23 Eric Friedman Interpretation and execution of a customizable database request using an extensible computer process and an available computing environment
CN101872351B (zh) * 2009-04-27 2012-10-10 阿里巴巴集团控股有限公司 识别同义词的方法、装置及利用其进行搜索的方法和装置
CN101876981B (zh) * 2009-04-29 2015-09-23 阿里巴巴集团控股有限公司 一种构建知识库的方法及装置
JP5564898B2 (ja) * 2009-11-05 2014-08-06 富士ゼロックス株式会社 情報検索プログラム及び情報検索装置
US8805750B2 (en) * 2009-12-18 2014-08-12 Microsoft Corporation Providing comparison experiences in response to search queries
US20120284305A1 (en) * 2010-01-19 2012-11-08 Nec Corporation Trend information search device, trend information search method and recording medium
US8788342B2 (en) * 2010-03-04 2014-07-22 Yahoo! Inc. Intelligent feature expansion of online text ads
US9189566B2 (en) 2010-12-07 2015-11-17 Sap Se Facilitating extraction and discovery of enterprise services
US9098569B1 (en) * 2010-12-10 2015-08-04 Amazon Technologies, Inc. Generating suggested search queries
CN102073729B (zh) * 2011-01-14 2013-03-06 百度在线网络技术(北京)有限公司 一种关系化知识共享平台及其实现方法
US10642934B2 (en) 2011-03-31 2020-05-05 Microsoft Technology Licensing, Llc Augmented conversational understanding architecture
US9244984B2 (en) 2011-03-31 2016-01-26 Microsoft Technology Licensing, Llc Location based conversational understanding
US9858343B2 (en) 2011-03-31 2018-01-02 Microsoft Technology Licensing Llc Personalization of queries, conversations, and searches
US9842168B2 (en) 2011-03-31 2017-12-12 Microsoft Technology Licensing, Llc Task driven user intents
US9760566B2 (en) 2011-03-31 2017-09-12 Microsoft Technology Licensing, Llc Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof
US8983995B2 (en) 2011-04-15 2015-03-17 Microsoft Corporation Interactive semantic query suggestion for content search
US9064006B2 (en) 2012-08-23 2015-06-23 Microsoft Technology Licensing, Llc Translating natural language utterances to keyword search queries
CN103827854A (zh) * 2011-09-29 2014-05-28 富士通株式会社 检索方法以及信息管理装置
US9069844B2 (en) * 2011-11-02 2015-06-30 Sap Se Facilitating extraction and discovery of enterprise services
CN103324640B (zh) * 2012-03-23 2016-06-08 日电(中国)有限公司 一种确定搜索结果文档的方法、装置和设备
CN102651014B (zh) * 2012-03-29 2014-10-22 华侨大学 基于概念关系的领域数据语义的检索方法
US9177289B2 (en) 2012-05-03 2015-11-03 Sap Se Enhancing enterprise service design knowledge using ontology-based clustering
US20140006012A1 (en) * 2012-07-02 2014-01-02 Microsoft Corporation Learning-Based Processing of Natural Language Questions
US8661049B2 (en) * 2012-07-09 2014-02-25 ZenDesk, Inc. Weight-based stemming for improving search quality
JP2014021653A (ja) * 2012-07-17 2014-02-03 Aisin Aw Co Ltd 情報共有システム、情報共有方法及び端末装置
US8577671B1 (en) 2012-07-20 2013-11-05 Veveo, Inc. Method of and system for using conversation state information in a conversational interaction system
US9465833B2 (en) 2012-07-31 2016-10-11 Veveo, Inc. Disambiguating user intent in conversational interaction system for large corpus information retrieval
CN103218436B (zh) * 2013-04-17 2016-05-18 中国科学院自动化研究所 一种融合用户类别标签的相似问题检索方法及装置
CN104123319B (zh) * 2013-04-28 2019-08-27 百度在线网络技术(北京)有限公司 对具有地图需求的搜索项进行解析的方法和装置
DK2994908T3 (da) 2013-05-07 2019-09-23 Veveo Inc Grænseflade til inkrementel taleinput med realtidsfeedback
WO2014183035A1 (en) 2013-05-10 2014-11-13 Veveo, Inc. Method and system for capturing and exploiting user intent in a conversational interaction based information retrieval system
CN104298683B (zh) * 2013-07-18 2017-11-28 佳能株式会社 主题挖掘方法和设备、以及查询扩展方法和设备
CN104298676A (zh) * 2013-07-18 2015-01-21 佳能株式会社 主题挖掘方法和设备、以及查询扩展方法和设备
CN104424216B (zh) * 2013-08-23 2018-01-23 佳能株式会社 用于意图挖掘的方法和设备
US10068016B2 (en) * 2013-10-17 2018-09-04 Wolfram Alpha Llc Method and system for providing answers to queries
CN104915340B (zh) * 2014-03-10 2019-09-10 北京大学 自然语言问答方法及装置
CN103942257B (zh) * 2014-03-19 2017-05-24 百度在线网络技术(北京)有限公司 一种视频搜索的方法与装置
CN103853842B (zh) * 2014-03-20 2017-07-18 百度在线网络技术(北京)有限公司 一种自动问答方法和***
CN105095203B (zh) * 2014-04-17 2018-10-23 阿里巴巴集团控股有限公司 同义词的确定、搜索方法及服务器
US9984067B2 (en) * 2014-04-18 2018-05-29 Thomas A. Visel Automated comprehension of natural language via constraint-based processing
CN104360994A (zh) * 2014-12-04 2015-02-18 科大讯飞股份有限公司 自然语言理解方法及***
US9852136B2 (en) 2014-12-23 2017-12-26 Rovi Guides, Inc. Systems and methods for determining whether a negation statement applies to a current or past query
CN104572982B (zh) * 2014-12-31 2017-10-31 东软集团股份有限公司 基于问题引导的个性化推荐方法及***
CN104573009B (zh) * 2015-01-08 2018-08-24 南通大学 一种领域知识库属性扩展的方法
US11947582B2 (en) * 2015-01-12 2024-04-02 International Business Machines Corporation Enhanced knowledge delivery and attainment using a question answering system
CN104657346A (zh) * 2015-01-15 2015-05-27 深圳市前海安测信息技术有限公司 智能交互***中的问题匹配方法和***
US9854049B2 (en) 2015-01-30 2017-12-26 Rovi Guides, Inc. Systems and methods for resolving ambiguous terms in social chatter based on a user profile
JP6501159B2 (ja) * 2015-09-04 2019-04-17 株式会社網屋 コンピュータ装置の動作記録の解析、翻訳を行い、監査に対する情報の出力及びシステムの傾向分析装置。
JP6628455B2 (ja) * 2015-11-30 2020-01-08 華為技術有限公司Huawei Technologies Co.,Ltd. データ照会方法および装置ならびにデータベースシステム
CN105550360B (zh) * 2015-12-31 2018-09-04 上海智臻智能网络科技股份有限公司 优化抽象语义库的方法及装置
CN106095791B (zh) * 2016-01-31 2019-08-09 长源动力(北京)科技有限公司 一种基于上下文的抽象样本信息检索***
US10229687B2 (en) * 2016-03-10 2019-03-12 Microsoft Technology Licensing, Llc Scalable endpoint-dependent natural language understanding
CN105677931B (zh) * 2016-04-07 2018-06-19 北京百度网讯科技有限公司 信息搜索方法和装置
US10210201B2 (en) * 2016-05-13 2019-02-19 TCL Research America Inc. Method and system for App page recommendation via inference of implicit intent in a user query
CN106156848B (zh) * 2016-06-22 2018-08-14 中国民航大学 一种基于lstm-rnn的陆空通话语义一致性校验方法
CN108536708A (zh) * 2017-03-03 2018-09-14 腾讯科技(深圳)有限公司 一种自动问答处理方法及自动问答***
CN107329964B (zh) * 2017-04-19 2021-01-05 创新先进技术有限公司 一种文本处理方法及装置
CN107545033B (zh) * 2017-07-24 2020-12-01 清华大学 一种基于表示学习的知识库实体分类的计算方法
CN107609152B (zh) * 2017-09-22 2021-03-09 百度在线网络技术(北京)有限公司 用于扩展查询式的方法和装置
CN109785698B (zh) * 2017-11-13 2021-11-23 上海流利说信息技术有限公司 用于口语水平评测的方法、装置、电子设备以及介质
CN109933777B (zh) * 2017-12-18 2024-02-06 上海智臻智能网络科技股份有限公司 知识库扩展装置
CN108549656B (zh) * 2018-03-09 2022-06-28 北京百度网讯科技有限公司 语句解析方法、装置、计算机设备及可读介质
CN108536852B (zh) * 2018-04-16 2021-07-23 上海智臻智能网络科技股份有限公司 问答交互方法和装置、计算机设备及计算机可读存储介质
CN108881466B (zh) * 2018-07-04 2020-06-26 百度在线网络技术(北京)有限公司 交互方法和装置
CN109241255B (zh) * 2018-08-20 2021-05-18 华中师范大学 一种基于深度学习的意图识别方法
CN109710952B (zh) * 2018-12-27 2023-06-16 北京百度网讯科技有限公司 基于人工智能的翻译历史检索方法、装置、设备和介质
CN109977294B (zh) * 2019-04-03 2020-04-28 三角兽(北京)科技有限公司 信息/查询处理装置、查询处理/文本查询方法、存储介质
CN112347297A (zh) * 2019-07-22 2021-02-09 中兴通讯股份有限公司 语音信息的处理方法及装置、存储介质和电子装置
CN111382255B (zh) * 2020-03-17 2023-08-01 北京百度网讯科技有限公司 用于问答处理的方法、装置、设备和介质
CN111930891B (zh) * 2020-07-31 2024-02-02 中国平安人寿保险股份有限公司 基于知识图谱的检索文本扩展方法及相关装置
CN116521841B (zh) * 2023-04-18 2024-05-14 百度在线网络技术(北京)有限公司 用于生成回复信息的方法、装置、设备及介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH083795B2 (ja) * 1986-05-26 1996-01-17 株式会社東芝 質問推定装置
JP4114927B2 (ja) * 2003-08-13 2008-07-09 株式会社東芝 文書検索システム、質問応答システム、文書検索方法
JP2005275524A (ja) * 2004-03-23 2005-10-06 Techno Network Shikoku Co Ltd 共起動詞情報による検索要求理解キーワード拡充システム
US7664734B2 (en) * 2004-03-31 2010-02-16 Google Inc. Systems and methods for generating multiple implicit search queries
US7747601B2 (en) * 2006-08-14 2010-06-29 Inquira, Inc. Method and apparatus for identifying and classifying query intent
JP2006106970A (ja) * 2004-10-01 2006-04-20 Canon Inc 情報検索装置、情報検索方法およびコンピュータプログラム
CN1794240A (zh) * 2006-01-09 2006-06-28 北京大学深圳研究生院 基于自然语言理解的计算机信息检索***及其检索方法

Also Published As

Publication number Publication date
US20090012778A1 (en) 2009-01-08
JP2009037603A (ja) 2009-02-19
CN101339551A (zh) 2009-01-07
US8180628B2 (en) 2012-05-15
CN101339551B (zh) 2013-01-30

Similar Documents

Publication Publication Date Title
JP4937201B2 (ja) クエリー要件展開器およびクエリー要件展開方法
US10915564B2 (en) Leveraging corporal data for data parsing and predicting
JP5232415B2 (ja) 自然言語ベースのロケーション・クエリー・システム、キーワード・ベースのロケーション・クエリー・システム、及び自然言語ベース/キーワード・ベースのロケーション・クエリー・システム
CN106372060B (zh) 搜索文本的标注方法和装置
US7174507B2 (en) System method and computer program product for obtaining structured data from text
US8090724B1 (en) Document analysis and multi-word term detector
AU2016277558A1 (en) Generating a semantic network based on semantic connections between subject-verb-object units
CN109325201A (zh) 实体关系数据的生成方法、装置、设备及存储介质
CN103678684A (zh) 一种基于导航信息检索的中文分词方法
US11893537B2 (en) Linguistic analysis of seed documents and peer groups
CN112989208B (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN115186050B (zh) 基于自然语言处理的选题推荐方法、***及相关设备
JP2023519049A (ja) Poi状態情報を取得する方法、及び装置
CN115702422A (zh) 用于为文本数据匿名化生成参考数据结构的方法和***
JP2009110508A (ja) オブジェクト間の競合指標計算方法およびシステム
JP4979637B2 (ja) 複合語の区切り位置を推定する複合語区切り推定装置、方法、およびプログラム
JP2006227823A (ja) 情報処理装置及びその制御方法
CN114896387A (zh) 军事情报分析可视化方法、装置以及计算机可读存储介质
JP7110554B2 (ja) オントロジー生成装置、オントロジー生成プログラム及びオントロジー生成方法
US11170759B2 (en) System and method for discriminating removing boilerplate text in documents comprising structured labelled text elements
CN115335819A (zh) 用于搜索和检索信息的方法和***
CN110688559A (zh) 一种检索方法及装置
JP5688754B2 (ja) 情報検索装置及びコンピュータプログラム
CN101310274B (zh) 知识相关性搜索引擎
Gouvêa et al. Discovering Location Indicators of Toponyms from News to Improve Gazetteer-Based Geo-Referencing.

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110601

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110830

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120210

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120221

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150302

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees