JP4866153B2 - 対話型質問方法、対話型質問システム、対話型質問プログラム及びそのプログラムを記録した記録媒体 - Google Patents
対話型質問方法、対話型質問システム、対話型質問プログラム及びそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP4866153B2 JP4866153B2 JP2006153961A JP2006153961A JP4866153B2 JP 4866153 B2 JP4866153 B2 JP 4866153B2 JP 2006153961 A JP2006153961 A JP 2006153961A JP 2006153961 A JP2006153961 A JP 2006153961A JP 4866153 B2 JP4866153 B2 JP 4866153B2
- Authority
- JP
- Japan
- Prior art keywords
- hint
- answer
- correct answer
- sentence
- data group
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
キムビンステッド、滝澤修、「日本語駄洒落なぞなぞ生成システム"BOKE"」、人工知能学会誌、1998年11月、vol.13、No.6、p.920−927 堂坂浩二、外4名、「音声対話システム「飛遊夢(ひゅうむ)」」電子情報通信学会2001年総合大会講演論文集、2001年、p.506−507 佐々木裕、外7名、「SAIQA:大量文書に基づく質問応答システム」、自然言語処理研究会/情報学基礎研究会、FI64/NL145−12、情報処理学会、2001年9月11日、p.77−82 [online]、[平成18年5月31日検索]、インターネット<URL:http://www.asovision.com/20q/top.html>
[対話型質問システム]
図1は、本発明の第1実施形態に係る対話型質問システムに含まれるヒント生成装置の構成を示す機能ブロック図である。
対話型質問システム1は、予め定められた正答を当てる問題における正答に対応するヒントを示す文である複数のヒント文を質問として出力し、質問に対応する回答に応じて異なる質問を出力するものである。
以下の説明では、対話型質問システム1は、正答を人名として、人名を当てるヒントを質問として出力するものとする。
ヒント生成装置2は、正答を生成し、生成した正答に対応する複数のヒント文を生成し、ヒント文リストとして対話型質問装置3に出力するものである。
対話型質問装置3は、ヒント生成装置2から取得したヒント文リストからヒント文を選択して質問として出力し、質問に対応する回答に応じて異なる質問を出力するものである。
ヒント生成装置2は、図1に示すように、通信インタフェース11と、記憶手段12と、正答生成手段13と、ヒント表現取得手段14と、ヒント文候補生成手段15と、ヒント文リスト生成手段16とを備えている。
記憶手段12は、例えば、CPUによる演算処理等に利用されるRAMや、例えば、所定のプログラム、各種データベース、処理結果等を格納するROMやHDDを備えている。
正答候補データベース121は、複数の正答候補を格納するものであり、例えば、複数の人名が記録された人名リストである。
ヒント文候補データベース122は、ヒント文候補生成手段15で生成されたヒント文候補を格納するものである。ここで、ヒント文候補は、キーワードまたはフレーズなどのヒント表現を含む文である。
ヒント文リストデータベース123は、ヒント文リスト生成手段16で生成されたヒント文リストを格納するものである。ここで、ヒント文リストは、ヒント文候補から出題用に選択されて所定の順番に並べられた文(ヒント文)からなる。
ここでは、一例として、人名を当てるクイズを取り上げる。例えば、正答生成手段13が、人名として「織田信長」を選択した場合、「織田信長」を当てるという問題となり、ユーザは、順次出されるヒントが誰のことを指しているのかを当てることとなる。以下では、例えば、「織田信長」という人名を当てるためのヒント文が生成されることとして説明する。なお、正答を作成する方法は、辞書の定義文提示による見出し語当てクイズの問題作成法と同様なので、公知の問題作成法を利用する。
第1表現取得手段141は、図示を省略するが、公知のフレーズ検索を実行する手段と、形態素解析を実行する手段とを備え、ネットワークNから得られるWebデータから特徴的な表現(キーワード)をヒント表現として抽出するものである。
第2表現取得手段142は、第1表現取得手段141による形態素解析から得られる正答の読み仮名をヒント表現として抽出するものである。
第3表現取得手段143は、ネットワークNから得られるWebデータからフレーズをヒント表現として抽出するものである。ここで、フレーズは、動詞句である。
第4表現取得手段144は、質問応答システム5に質問を出力し、質問応答システム5の応答をヒント表現として取得するものである。
なお、ヒント表現取得手段14の内部構成は、これに限定されるものではなく、前記した第1表現取得手段141ないし第4表現取得手段144以外に、さらに、1以上の表現取得手段(第5表現取得手段等)を備えるようにしてもよい。例えば、文書中に正答と共に出現する頻度の高い表現を、ヒント表現として取得する手段を第5表現取得手段としてもよい。また、ヒント表現取得手段14の内部構成は、前記した第1表現取得手段141ないし第4表現取得手段144のうちの少なくとも1つを備えるように構成してもよい。以下、第1表現取得手段141ないし第4表現取得手段144の詳細を説明する。
人物を説明するのに特徴的なパターンを捉えて、「織田信長などの戦国大名」といった文から、「戦国大名」というヒント表現を獲得する。特徴的な表現を用いて、人物などの定義を獲得する従来手法には次のものが挙げられる
Joho, H. and Sanderson, M. (2000)”Retrieving Descriptive Phrases from Large Amounts of Free Text”. In: Agah, A.,Callan, J.& Rundenstenier, E. (eds), Proceedings of the 9th International Conference on Information and Knowledge Management, 180-186, McLean, VA: ACM.
(1)AというB、(2)AといったB、(3)A以外のB、(4)AなどのB、(5)AのようなB、(6)AというとB、(7)AといえばB、(8)AによるB、(9)AやB、(10)BやA
前記した(1)−(5)は、BがAのカテゴリ(例えば、「戦国大名」)を表すと考えられるものである。
前記した(6)−(7)は、BがAの連想(例えば、「敦盛」)を表すと考えられるものである。
前記した(8)は、BがAによって作られたもの・なされたこと(例えば、「安土城」)を表すと考えられるものである。
前記した(9)−(10)は、BがAと同じカテゴリに属する(例えば、「豊臣秀吉」)ことを表すと考えられるものである。
表1は、正答「織田信長」に関して、フレーズ検索に検索エンジンgoo(登録商標)を用いたときの検索結果と共に表示されるsnippetと呼ばれる要旨のテキストをWebデータとして用いて作成されたヒント表現である。
第2表現取得手段142は、正答(人名)の表記(最初の文字、最後の文字)からヒント文を作成する。対象となる人名を形態素解析すると、読み仮名が取得できるため、この最初の文字、最後の文字を取得する。
第3表現取得手段143は、特徴的な表現を用いず、A(正答)を含む文自体からヒント文を作成する。この場合、「Aが」という表現の係り先の動詞句が見つかれば、その動詞句をヒント表現として用いる。例えば、「織田信長が楽市楽座を開いた」とあれば、「織田信長が」は「楽市楽座を開いた」に係るため、「楽市楽座を開いた」をヒント表現とする。正答が「織田信長」の場合、例えば、以下の表2に示すヒント表現を取得することができる。この中で、「た」で終わるものだけを使用することとする。
第4表現取得手段144は、「○○の関連語は?」、「○○に関連する場所は?」、「○○に関連する人物は?」という3つの質問文を生成し、それらを質問応答システム5に送り、その応答をヒント表現とする。正答が「織田信長」の場合、例えば、以下の表3に示すヒント表現を質問応答システム5から取得することができる。
また、その人物に関する生年/没年情報が付与されている場合、第1候補生成手段151は、「○○よ」というテンプレートを用いてヒント文を作成する。例えば、その人物に関する生年/没年が「1534年/1582年」ならば、「1534年に生まれたよ」や「1582年に死んだよ」といったヒント文を生成する。
ヒント表現を取得する際に用いた特徴的な表現が、前記した(6)−(7)の場合には、第1候補生成手段151は、例えば、「○○といえば?」というテンプレートを用いてヒント文を作成する。
ヒント表現を取得する際に用いた特徴的な表現が、前記した(8)−(10)の場合には、第1候補生成手段151は、例えば、「○○に関係があるよ」というテンプレートを用いてヒント文を作成する。
なお、ヒント文候補生成手段15の内部構成は、これに限定されるものではなく、前記した第1候補生成段151ないし第4候補生成手段154以外に、さらに、1以上の候補生成手段(第5候補生成手段等)を備えるようにしてもよい。例えば、第5候補生成手段が前記した第5表現取得手段に対応する場合には、第5表現取得手段で取得されたヒント表現を用いて、例えば、「○○に関係あるよ。」というテンプレートを用いてヒント文を作成する。
ヒントキーワード抽出手段161は、ヒント文候補データベース122に格納された各ヒント文候補からキーワードを抽出するものである。以下では、ヒントキーワード抽出手段161で抽出されたキーワードのことを、単にキーワードという。キーワードは、例えば、形態素解析の結果、名詞とされたものである。例えば、ヒント文候補が「明智光秀に殺されたよ」ならば、「明智光秀」がキーワードとなる。また、ヒント文候補が「武将だよ」の場合には、「武将」がキーワードとなる。
なお、正答生成手段13、ヒント表現取得手段14、ヒント文候補生成手段15、およびヒント文リスト生成手段16は、CPUが記憶手段12のHDD等に格納された所定のプログラムをRAMに展開して実行することにより実現されるものである。
図1に示したヒント生成装置の動作について図2を参照(適宜図1参照)して説明する。図2は、図1に示したヒント生成装置の動作を示すフローチャートである。ヒント生成装置2は、正答生成手段13によって、正答候補を選択して正答を生成し(ステップS1)、ヒント表現取得手段14によって、正答に対応するヒント表現を取得する(ステップS2)。そして、ヒント生成装置2は、ヒント文候補生成手段15によって、取得したヒント表現でヒント文候補を生成し(ステップS3)、ヒントキーワード抽出手段161によって、各ヒント文候補からキーワードを抽出する(ステップS4)。そして、ヒント生成装置2は、特徴量抽出手段162によって、キーワードに関する複数の特徴量をネットワークNを介してWebデータから抽出し(ステップS5)、スコア算出手段163によって、抽出した特徴量に基づいて、各ヒント文候補に対する第1スコアを算出する(ステップS6)。続いて、ヒント生成装置2は、ソート手段164によって、各ヒント文候補のスコアと出題ルールとに基づいて、ヒント文リストを生成し(ステップS7)、格納手段165によって、ヒント文リストを問題別に格納する(ステップS8)。
表4および表5は、正答「織田信長」に関して、検索エンジンgoo(登録商標)を用いて取得されたWebデータによって作成されたヒント文リストである。ヒント文リストには、ヒント文ごとに、ヒント番号、ヒント文の内容およびキーワードと、type、score、HitCount、targetHitCount、psy、pathlenのそれぞれの数値が、この順番に記載されている。
typeの数値は、ヒント表現がどこから取得されたかを示すものである。
type=「1」は、表1の「カテゴリ情報」から取得されたものである。
type=「2」は、表1の「連想」から取得されるものである(該当なし)。
type=「3」は、表1の「作られたもの」から取得されたものである。
type=「4」は、表1の「同じカテゴリ」から取得されたものである。
type=「5」は、表2から取得されたものである。
type=「6」は、正答の読み(最初の1文字)から取得されたものである。
type=「7」は、正答の読み(最後の1文字)から取得されたものである。
type=「8」は、表3の「関連語」から取得されたものである。
type=「9」は、表3の「場所」から取得されたものである。
type=「10」は、表3の「人物」から取得されたものである。
scoreは、第1スコアS1の値である。HitCount、targetHitCountは、それぞれ、キーワードのヒット数、キーワードと答えを両方含むヒット数である。なお、psyとはキーワードの日本語語彙特性における親密度であり、pathlenとは日本語語彙体系におけるキーワードからルート概念までのパス長である。
図3は、本発明の第1実施形態に係る対話型質問システムに含まれる対話型質問装置の構成を示す機能ブロック図である。
対話型質問装置3は、図3に示すように、通信インタフェース31と、記憶手段32と、一致判定手段33と、検索手段34と、類似度算出手段35と、ヒント文選択手段36と、応答文生成手段37と、出題管理手段38とを備えている。
記憶手段32は、例えば、CPUによる演算処理等に利用されるRAMや、例えば、所定のプログラム、各種データベース、処理結果等を格納するROMやHDDを備えている。
ヒント文リストデータベース321は、ヒント生成装置2で生成されたヒント文リストを格納するものである。
応答文データベース322は、回答に対する応答文を格納するものである。応答文として、出題開始宣言文、回答が正答と一致するときの応答文、回答が正答と不一致のときの応答文等が準備される。それぞれの応答文は、例えば、「なぞなぞスタート!」、「あたり!」、「惜しい!」、「全然違う!」等である。
具体的には、検索手段34は、例えば、ネットワークN上の人物事典を利用して、回答と正答とをそれぞれ示す2つの人名に関する記事(説明ページ)が、その人物事典の記事全体からどのようにハイパーリンクによって参照されているかを検索する。すなわち、
検索手段34は、回答を示す人名に関する記事(説明ページ)と、正答を示す人名に関する記事(説明ページ)とに対して、これら両方を参照する共通の記事(人名に限らない)がどれくらいあるか検索する。
ヒント文選択手段36は、出題管理手段38の指示に基づいて、ヒント文リストの並べ替え処理をした場合には、並べ替えられた順番に基づいて、ヒント文を選択すると共に、並び替えられた順序の情報を出題管理手段38に通知する。
また、応答文生成手段37は、回答と正答とが一致する場合に、回答に対する応答文を生成する。この場合の応答文は、回答が正答であることをユーザに知らせるためのものである。なお、応答文は、所定の規則にしたがって生成される。
本実施形態では、応答文生成手段37は、応答文データベース322から応答文を選択することにより、応答文を生成する。この応答文生成手段37は、出題管理手段38から、ヒント文リストの並べ替え処理が行われたことを通知されると、通知された情報に基づいた応答文を生成する。ヒント文を単に並べ替えたときの応答文は、例えば、「これなら分かるかな?」などである。また、ヒント文の並べ替えの結果、中抜きをして最後のヒント文を出題するときの応答文は、例えば、「これが最後のヒントだよ。」などとなる。
図3に示した対話型質問装置の動作について図4を参照(適宜図3参照)して説明する。図4は、図3に示した対話型質問装置の動作を示すフローチャートである。対話型質問装置3は、出題管理手段38によって、制御変数iを初期化(i=0)し(ステップS11)、応答文生成手段37によって、出題開始宣言文(i=0)を生成する(ステップS12)。そして、対話型質問装置3は、出題管理手段38によって、制御変数iの現在の値に「1」を加算し(ステップS13)、類似度(p値)が所定値γ以上であるか否かを判別する(ステップS14)。そして、類似度(p値)が所定値γ以上である場合(ステップS14:No)、対話型質問装置3は、ヒント文選択手段36によって、i番目のヒント文を選択し(ステップS15)、出題管理手段38によって、ヒント文を表示させる。そして、対話型質問装置3は、出題管理手段38によって、入力があるか否かを判別する(ステップS16)。入力がある場合(ステップS16:Yes)、対話型質問装置3は、一致判定手段33によって、一致するか否かを判別する(ステップS17)。一方、一致しない場合(ステップS17:No)、対話型質問装置3は、検索手段34によって、Webデータにおいて、正答を含むデータ群と、回答を含むデータ群と、回答と正答との両方を含むデータ群とのそれぞれの文書数を検索する(ステップS18)。そして、対話型質問装置3は、類似度算出手段35によって、類似度を算出し(ステップS19)、応答文生成手段37によって、応答文を生成する(ステップS20)。
また、ステップS16において、入力がない場合(ステップS16:No)、対話型質問装置3は、出題管理手段38によって、所定時間Tが経過したか否かを判別する(ステップS24)。所定時間Tが経過した場合(ステップS24:Yes)、対話型質問装置3は、テップS20に進む。一方、所定時間Tが経過しない場合(ステップS24:No)、対話型質問装置3は、ステップS16に戻る。
表7は、正答「織田信長」を例に取ったユーザと対話型質問装置3との対話例である。
対話型質問装置3は、表4および表5に示したヒント文を順次提示し、ユーザの回答に応じて、正答との類似度に基づく応答文を生成する。
第2実施形態に係る対話型質問システム1Aは、ヒント生成装置2Aと、対話型質問装置3Aとを備えている。
[ヒント生成装置の構成]
図5は、本発明の第2実施形態に係る対話型質問システムに含まれるヒント生成装置の構成を示す機能ブロック図である。
ヒント生成装置2Aの構成において、図1に示したヒント生成装置2と同一の構成には同一の符号を付して説明を省略する。
ヒント生成装置2Aは、図5に示すように、通信インタフェース11と、記憶手段12と、正答生成手段13と、ヒント表現取得手段14Aと、ヒント文候補生成手段15Aと、ヒント文リスト生成手段16Aとを備えている。
特徴量抽出手段162Aは、辞書データにおいて、キーワードを含むエントリ(見出し語)の個数(文書に関する特徴量)Lと、正答とキーワードとの両方を含むエントリの個数(文書に関する特徴量)Kと、対象とする辞書データにおけるすべてのエントリの個数(文書に関する特徴量)Wとを抽出するものである。
ここで、αとβとは、共起頻度と一般性とのどちらを優先するかという優先度に基づく所定の重みである。例えば、一般性を重視する場合には、αを「1」、βを「1000.0」としてもよい。また、第2スコアS2は、式(3)に限定されるものではなく、自動文書要約に用いられるようなTF*IDFを用いてもよい。
図6は、図5に示したヒント生成装置の動作を示すフローチャートである。
ヒント生成装置2Aが実行する処理であるステップS31〜ステップS38は、図1に示したヒント生成装置2が実行する処理であるステップS1〜ステップS8(図2参照)と同様なので説明を省略する。ただし、ステップS35では、ヒント生成装置2Aは、特徴量抽出手段162Aによって、キーワードに関する複数の特徴量を正答候補事典データベース124から抽出する。また、ステップS36では、ヒント生成装置2Aは、スコア算出手段163Aによって、抽出した特徴量に基づいて、各ヒント文候補に対する第2スコアを算出する。
表8は、正答「織田信長」に関して、ネットワークN上の人物事典を用いて作成されたヒント文リストである。ヒント文リストには、ヒント文ごとに、ヒント番号、ヒント文の内容および第2スコアS2が、この順番に記載されている。ここで、J=10として、ヒント文のトップ10を決定し、さらに、その後に、読みから得たヒントを追加した。また、ヒント文のトップ10の前に、カテゴリ情報、生年/没年からそれぞれ得られたヒント文を追加した。そのため、ヒント文リストには、合計15個のヒント文が記録されている。なお、後から追加したヒント文の第2スコアS2は、規定値を「0.0」とした。
図7は、本発明の第2実施形態に係る対話型質問システムに含まれる対話型質問装置の構成を示す機能ブロック図である。
対話型質問装置3Aは、記憶手段12に正答候補事典データベース323を備えると共に、検索手段34Aおよび応答文生成手段37Aの機能が異なる点を除いて、図3に示した対話型質問装置3と同一の構成なので、図3と同一の構成には同一の符号を付して説明を省略する。
応答文生成手段37Aは、回答の付随データと正答の付随データとを用いて、例えば、「政治家というのは合ってるよ。」、「飛鳥・奈良時代の皇族じゃないよ。もう少し後の時代だよ。」などの応答文を生成する。
図8は、図7に示した対話型質問装置の動作を示すフローチャートである。
対話型質問装置3Aが実行する処理であるステップS41〜ステップS48およびステップS51〜ステップS56は、図3に示した対話型質問装置3が実行する処理であるステップS11〜ステップS18およびステップS19〜ステップS24(図4参照)と同様なので説明を省略する。
<具体例>
対話型質問装置3Aは、表6に示したヒント文を順次提示し、ユーザの回答に応じて、正答との類似度に基づく応答文を生成する。また、応答文として、職業(カテゴリ情報:戦国大名)が同じことを指摘した付随ヒントをユーザに提示する。これにより、ユーザは、正答を考えやすくなる。また、対話型質問装置3Aは、正答と回答のそれぞれの人名の生年が両方とも分かる場合、それらを比較し、応答文として、時代が後か先かをユーザに伝える付随ヒントを生成する。
第3実施形態に係る対話型質問システム1Bは、ヒント生成装置2(または2A)と、対話型質問装置3Bとを備えている。
[対話型質問装置の構成]
図9は、本発明の第3実施形態に係る対話型質問システムに含まれる対話型質問装置の構成を示す機能ブロック図である。対話型質問装置3Bは、擬似ユーザと対話をするものである。擬似ユーザとは、実際のユーザの代わりとなって対話を行うプログラムのことである。対話型質問装置3Bは、回答抽出手段39および正答候補データベース324を備えると共に、出題管理手段38Bの機能が異なる点を除いて、図7に示した対話型質問装置3Aと同一の構成なので、図7と同一の構成には同一の符号を付して説明を省略する。
出題管理手段38Bは、回答抽出手段39から受け付けた回答を一致判定手段33に出力する。なお、出題管理手段38Bは、入力装置Mから、所定の命令(クイズの開始、終了、ヒント文のスキップ等)を受け付ける。
図10は、図9に示した対話型質問装置の動作を示すフローチャートである。
対話型質問装置3Bが実行する処理であるステップS61〜ステップS75は、図7に示した対話型質問装置3Aが実行する処理であるステップS41〜ステップS55(図8参照)と同様なので説明を省略する。ただし、ステップS66では、対話型質問装置3Bは、回答抽出手段39によって、回答を正答候補データベース121から抽出し、抽出した回答を出題管理手段38Bに出力し、ステップS67に進む。
表10は、対話型質問システム1Bにおいて擬似ユーザに対するヒント文の例である。
また、本実施形態では、ヒント文選択手段36は、類似度(p値)が所定値γよりも小さい場合に、ヒント文リストの並べ替え処理をするものとして説明したが、例えば、類似度が所定値よりも大きい場合に、ヒント文リストを優先順と異なる順序に並べ替えるようにしてもよい。この場合には、ヒント文選択手段36は、例えば、第1番目のヒント文を、ヒント文リストの順番に関わらず途中から選択して出題し、類似度が所定値よりも大きい場合には、続いて、出題済みのヒント文よりも難易度の高いヒント文を出題できるようにヒント文を並べ替える。ここで、出題済みのヒント文よりも難易度の高いヒント文は、元のヒント文リストの上位(前方)に配置されていたものである。そして、類似度が所定値よりも大きい場合に、出題済みのヒント文よりも難易度の高いヒント文を出題することにより、正答と回答との類似度が下がり易くなる。その結果、対話を長期間継続させることが可能となる。さらに、類似度が所定値よりも小さい場合の処理と組み合わせるようにしてもよい。
2(2A) ヒント生成装置
3(3A,3B) 対話型質問装置
4 ネットワークデータサーバ
4a データベース
5 質問応答システム
11 通信インタフェース
12 記憶手段
121 正答候補データベース
122 ヒント文候補データベース
123 ヒント文リストデータベース
124 正答候補事典データベース
13 質問生成手段
14(14A) ヒント表現取得手段
141 第1表現取得手段
142 第2表現取得手段
143 第3表現取得手段
144 第4表現取得手段
15(15A) ヒント文候補生成手段
151 第1候補生成手段
152 第2候補生成手段
153 第3候補生成手段
154 第4候補生成手段
16(16A) ヒント文リスト生成手段
161 ヒントキーワード抽出手段
162 特徴量抽出手段
163 スコア算出手段
164 ソート手段
165 格納手段
162A 特徴量抽出手段
163A スコア算出手段
31 通信インタフェース
32 記憶手段
321 ヒント文リストデータベース
322 応答文データベース
323 正答候補事典データベース
324 正答候補データベース
33 一致判定手段
34(34A) 検索手段
35 類似度算出手段
36 ヒント文選択手段
37(37A) 応答文生成手段
38(38B) 出題管理手段
39 回答候補抽出手段
N ネットワーク
M 入力装置
D 出力装置
Claims (10)
- 予め定められた正答を当てる問題における正答に対応するヒントを示す文である複数のヒント文を質問として出力し、前記質問に対応する回答に応じて異なる質問を出力する対話型質問システムの対話型質問方法であって、
前記複数のヒント文が予め定められた優先順に並べられたヒント文リストの中から、前記優先順にしたがって前記ヒント文を選択するヒント文選択ステップと、
前記回答と前記正答とが一致するか否かを判定する一致判定ステップと、
前記回答と前記正答とが一致しない場合に、予め定められたテキストデータ群において、前記正答を含むデータ群と、前記回答を含むデータ群と、前記回答と前記正答との両方を含むデータ群とを検索する検索ステップと、
前記検索された結果に基づいて、前記テキストデータ群における前記回答と前記正答との共起性の高さを、前記回答と前記正答との類似度として算出する類似度算出ステップと、
前記算出された類似度に基づいて、前記回答に対する応答文を生成する応答文生成ステップと、
前記回答と前記正答とが一致するまで前記異なる質問を繰り返し出題する出題管理ステップと、
を有することを特徴とする対話型質問方法。 - 複数の正答候補を格納した正答候補データベースから所定の正答候補を選択し、前記選択した正答候補を正答として生成する正答生成ステップと、
前記生成された正答に対応するヒントとして、キーワードまたはフレーズで表現された複数のヒント表現を、前記テキストデータ群から取得するヒント表現取得ステップと、
前記取得されたヒント表現を含む文を示すヒント文候補を生成するヒント文候補生成ステップと、
前記生成された各ヒント文候補からキーワードを抽出するヒントキーワード抽出ステップと、
前記テキストデータ群において、前記正答と前記抽出されたキーワードとの両方を含む文書に関する特徴量と、前記テキストデータ群におけるすべての文書に関する特徴量とを含む複数の特徴量を抽出する特徴量抽出ステップと、
前記抽出された特徴量に基づいて、前記テキストデータ群における前記正答と前記抽出されたキーワードとの共起頻度と、前記テキストデータ群における前記抽出されたキーワードの一般性とを用いて、前記各ヒント文候補に対するスコアを算出するスコア算出ステップと、
前記各ヒント文候補のスコアに基づいて、前記各ヒント文候補の優先順を決定し、前記決定された優先順で前記ヒント文候補を並べて、前記ヒント文リストを生成するソートステップと、
をさらに有することを特徴とする請求項1に記載の対話型質問方法。 - 前記ヒント表現取得ステップは、前記複数のヒント表現を、ネットワークまたは/および前記対話型質問システムに備えられたテキストデータ群から取得し、
前記特徴量抽出ステップは、前記ヒントキーワード抽出ステップで抽出されたキーワードの特徴量を前記ネットワークまたは/および前記対話型質問システムに備えられたテキストデータ群から抽出することを特徴とする請求項2に記載の対話型質問方法。 - 前記ヒント表現取得ステップは、前記複数のヒント表現を、ネットワークまたは/および前記対話型質問システムに備えられた予め作成された辞書データベースのテキストデータ群から取得し、
前記特徴量抽出ステップは、前記ヒントキーワード抽出ステップで抽出されたキーワードの特徴量を前記辞書データベースのテキストデータ群から抽出し、
前記検索ステップによって、前記辞書データベースのテキストデータ群から前記回答に関する情報として前記回答に付随した付随データが検索された場合に、前記応答文生成ステップは、前記検索された付随データに基づいて、前記回答に対する応答文を生成することを特徴とする請求項2に記載の対話型質問方法。 - 前記回答を、前記正答候補データベースから抽出する回答抽出ステップをさらに有することを特徴とする請求項2ないし請求項4のいずれか一項に記載の対話型質問方法。
- 前記出題管理ステップは、前記回答と前記正答との類似度が所定値以上であるか否かを判別する判別ステップを有し、
前記ヒント文選択ステップは、前記回答と前記正答との類似度に基づいて、前記ヒント文リストを前記優先順と異なる順序に並べ替え、前記並べ替えた順序にしたがって前記ヒント文を選択する、
ことを特徴とする請求項1ないし請求項5のいずれか一項に記載の対話型質問方法。 - 予め定められた正答を当てる問題における正答に対応するヒントを示す文である複数のヒント文を質問として出力し、前記質問に対応する回答に応じて異なる質問を出力する対話型質問システムであって、
前記複数のヒント文が予め定められた優先順に並べられたヒント文リストの中から、前記優先順にしたがって前記ヒント文を選択するヒント文選択手段と、
前記回答と前記正答とが一致するか否かを判定する一致判定手段と、
前記回答と前記正答とが一致しない場合に、予め定められたテキストデータ群において、前記正答を含むデータ群と、前記回答を含むデータ群と、前記回答と前記正答との両方を含むデータ群とを検索する検索手段と、
前記検索された結果に基づいて、前記テキストデータ群における前記回答と前記正答との共起性の高さを、前記回答と前記正答との類似度として算出する類似度算出手段と、
前記算出された類似度に基づいて、前記回答に対する応答文を生成する応答文生成手段と、
前記回答と前記正答とが一致するまで前記異なる質問を繰り返し出題する出題管理手段と、
を備えることを特徴とする対話型質問システム。 - 複数の正答候補を格納した正答候補データベースから所定の正答候補を選択し、前記選択した正答候補を正答として生成する正答生成手段と、
前記生成された正答に対応するヒントとして、キーワードまたはフレーズで表現された複数のヒント表現を、前記テキストデータ群から取得するヒント表現取得手段と、
前記取得されたヒント表現を含む文を示すヒント文候補を生成するヒント文候補生成手段と、
前記生成された各ヒント文候補からキーワードを抽出するヒントキーワード抽出手段と、
前記テキストデータ群において、前記正答と前記抽出されたキーワードとの両方を含む文書に関する特徴量と、前記テキストデータ群におけるすべての文書に関する特徴量とを含む複数の特徴量を抽出する特徴量抽出手段と、
前記抽出された特徴量に基づいて、前記テキストデータ群における前記正答と前記抽出されたキーワードとの共起頻度と、前記テキストデータ群における前記抽出されたキーワードの一般性とを用いて、前記各ヒント文候補に対するスコアを算出するスコア算出手段と、
前記各ヒント文候補のスコアに基づいて、前記各ヒント文候補の優先順を決定し、前記決定された優先順で前記ヒント文候補を並べて、前記ヒント文リストを生成するソート手段と、
をさらに備えることを特徴とする請求項7に記載の対話型質問システム。 - 予め定められた正答を当てる問題における正答に対応するヒントを示す文である複数のヒント文を質問として出力し、前記質問に対応する回答に応じて異なる質問を出力する対話型質問システムのコンピュータに、
前記複数のヒント文が予め定められた優先順に並べられたヒント文リストの中から、前記優先順にしたがって前記ヒント文を選択するヒント文選択ステップと、
前記回答と前記正答とが一致するか否かを判定する一致判定ステップと、
前記回答と前記正答とが一致しない場合に、予め定められたテキストデータ群において、前記正答を含むデータ群と、前記回答を含むデータ群と、前記回答と前記正答との両方を含むデータ群とを検索する検索ステップと、
前記検索された結果に基づいて、前記テキストデータ群における前記回答と前記正答との共起性の高さを、前記回答と前記正答との類似度として算出する類似度算出ステップと、
前記算出された類似度に基づいて、前記回答に対する応答文を生成する応答文生成ステップと、
前記回答と前記正答とが一致するまで前記異なる質問を繰り返し出題する出題管理ステップと、
を実行させるための対話型質問プログラム。 - 予め定められた正答を当てる問題における正答に対応するヒントを示す文である複数のヒント文を質問として出力し、前記質問に対応する回答に応じて異なる質問を出力する対話型質問システムのコンピュータに、
前記複数のヒント文が予め定められた優先順に並べられたヒント文リストの中から、前記優先順にしたがって前記ヒント文を選択するヒント文選択ステップと、
前記回答と前記正答とが一致するか否かを判定する一致判定ステップと、
前記回答と前記正答とが一致しない場合に、予め定められたテキストデータ群において、前記正答を含むデータ群と、前記回答を含むデータ群と、前記回答と前記正答との両方を含むデータ群とを検索する検索ステップと、
前記検索された結果に基づいて、前記テキストデータ群における前記回答と前記正答との共起性の高さを、前記回答と前記正答との類似度として算出する類似度算出ステップと、
前記算出された類似度に基づいて、前記回答に対する応答文を生成する応答文生成ステップと、
前記回答と前記正答とが一致するまで前記異なる質問を繰り返し出題する出題管理ステップと、を実行させるための対話型質問プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006153961A JP4866153B2 (ja) | 2006-06-01 | 2006-06-01 | 対話型質問方法、対話型質問システム、対話型質問プログラム及びそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006153961A JP4866153B2 (ja) | 2006-06-01 | 2006-06-01 | 対話型質問方法、対話型質問システム、対話型質問プログラム及びそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007322836A JP2007322836A (ja) | 2007-12-13 |
JP4866153B2 true JP4866153B2 (ja) | 2012-02-01 |
Family
ID=38855690
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006153961A Expired - Fee Related JP4866153B2 (ja) | 2006-06-01 | 2006-06-01 | 対話型質問方法、対話型質問システム、対話型質問プログラム及びそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4866153B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021032911A (ja) * | 2019-08-13 | 2021-03-01 | 株式会社フォーサイト | 対話学習システム、方法、およびプログラム |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010129033A (ja) * | 2008-12-01 | 2010-06-10 | Nippon Telegr & Teleph Corp <Ntt> | 対話心理学習装置とその方法、対話制御装置とその方法、プログラムと記録媒体 |
JP5128514B2 (ja) * | 2009-02-10 | 2013-01-23 | 日本電信電話株式会社 | 多人数思考喚起型対話装置、多人数思考喚起型対話方法、多人数思考喚起型対話プログラム並びにそのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP5402307B2 (ja) * | 2009-06-25 | 2014-01-29 | 富士ゼロックス株式会社 | データ出力装置、表示装置及びプログラム |
JP6134746B2 (ja) * | 2015-01-07 | 2017-05-24 | 株式会社スマイルラボ | ビデオゲーム制御サーバ、およびビデオゲーム制御プログラム |
JP6519249B2 (ja) * | 2015-03-16 | 2019-05-29 | 富士通株式会社 | 回答支援プログラム、回答支援装置、及び回答支援方法 |
CN108347646B (zh) * | 2018-03-20 | 2019-07-02 | 百度在线网络技术(北京)有限公司 | 多媒体内容播放方法和装置 |
CN112337081B (zh) * | 2020-10-27 | 2022-10-14 | 四川长虹电器股份有限公司 | 用于实现语音竞猜游戏的交互方法 |
CN117151122B (zh) * | 2023-10-30 | 2024-03-22 | 湖南三湘银行股份有限公司 | 基于自然语言处理的银行客服会话问答处理方法及*** |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002132812A (ja) * | 2000-10-19 | 2002-05-10 | Nippon Telegr & Teleph Corp <Ntt> | 質問応答方法、質問応答システム及び質問応答プログラムを記録した記録媒体 |
JP3339853B2 (ja) * | 2000-11-24 | 2002-10-28 | 株式会社ナムコ | ゲーム装置、及び情報記憶媒体 |
JP2003173335A (ja) * | 2001-12-06 | 2003-06-20 | Canon Inc | 自然言語対話装置及び方法並びに記憶媒体 |
JP4083610B2 (ja) * | 2003-03-25 | 2008-04-30 | 株式会社東芝 | 質問応答システム |
-
2006
- 2006-06-01 JP JP2006153961A patent/JP4866153B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021032911A (ja) * | 2019-08-13 | 2021-03-01 | 株式会社フォーサイト | 対話学習システム、方法、およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2007322836A (ja) | 2007-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4866153B2 (ja) | 対話型質問方法、対話型質問システム、対話型質問プログラム及びそのプログラムを記録した記録媒体 | |
US7519529B1 (en) | System and methods for inferring informational goals and preferred level of detail of results in response to questions posed to an automated information-retrieval or question-answering service | |
Bailin et al. | Readability: Text and context | |
US7430505B1 (en) | Inferring informational goals and preferred level of detail of answers based at least on device used for searching | |
Burgess et al. | Explorations in context space: Words, sentences, discourse | |
US8700382B2 (en) | Personal text assistant | |
Mandera et al. | Recognition times for 62 thousand English words: Data from the English Crowdsourcing Project | |
US20070112554A1 (en) | System of interactive dictionary | |
Boulton | Integrating corpus tools and techniques in ESP courses | |
Isard et al. | Individuality and alignment in generated dialogues | |
JP4347226B2 (ja) | 情報抽出プログラムおよびその記録媒体、情報抽出装置ならびに情報抽出規則作成方法 | |
Derewianka | Pedagogical grammars: Their role in English language teaching | |
US20210117458A1 (en) | Response selecting apparatus, response selecting method, and response selecting program | |
Fantinuoli | The use of comparable corpora in interpreting practice and training | |
Jackson | Corpus and concordance: Finding out about style | |
JP4466334B2 (ja) | 情報分類方法及び装置及びプログラム及びプログラムを格納した記憶媒体 | |
Lancia | Word co-occurrence and similarity in meaning | |
Downs et al. | KidSpell: Making a difference in spellchecking for children | |
Goulart | Register variation in L1 and L2 student writing: A multidimensional analysis | |
JP4468294B2 (ja) | 体験情報評価装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
KR100353549B1 (ko) | 언어를 학습하기 위한 방법 및 시스템 | |
JP4153843B2 (ja) | 自然文検索装置、自然文検索方法、自然文検索プログラム及び自然文検索プログラム記憶媒体 | |
Mutanen | Philosophy of communication: A logico-conceptual approach | |
Cowles et al. | Conceptual similarity effects on working memory in sentence contexts: Testing a theory of anaphora | |
EP1118069A2 (en) | Apparatus and method for personalized language exercise generation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110331 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110531 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110621 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20110805 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111108 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141118 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4866153 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |