JP5212204B2 - 応答生成装置及びプログラム - Google Patents

応答生成装置及びプログラム Download PDF

Info

Publication number
JP5212204B2
JP5212204B2 JP2009068038A JP2009068038A JP5212204B2 JP 5212204 B2 JP5212204 B2 JP 5212204B2 JP 2009068038 A JP2009068038 A JP 2009068038A JP 2009068038 A JP2009068038 A JP 2009068038A JP 5212204 B2 JP5212204 B2 JP 5212204B2
Authority
JP
Japan
Prior art keywords
situation
word
response
extracted
clause
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009068038A
Other languages
English (en)
Other versions
JP2010224608A (ja
Inventor
和也 下岡
良子 堀田
貴克 吉村
宇唯 山口
生聖 渡部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Original Assignee
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp filed Critical Toyota Motor Corp
Priority to JP2009068038A priority Critical patent/JP5212204B2/ja
Publication of JP2010224608A publication Critical patent/JP2010224608A/ja
Application granted granted Critical
Publication of JP5212204B2 publication Critical patent/JP5212204B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、応答生成装置及びプログラムに係り、特に、ユーザと円滑な対話を行うための応答生成装置及びプログラムに関する。
従来、ユーザ発話を解析して述語及び格要素を抽出し、抽出した述語または格要素を確認する応答文候補、省略された格要素を質問する応答文候補、述語が行われた理由、時、場所を質問する応答文候補、及び述語同士の関係を確認する応答文候補を生成し、生成された応答文候補からランダムに選択した応答文候補を音声出力する応答生成装置が提案されている(例えば、特許文献1参照)。
また、形容詞、副詞、または名詞である単語を概念語として、修飾関係及びシソーラスに基づいて概念語の属性情報を定めた概念属性データベースを構築しておき、ユーザ発話を解析して概念語を抽出し、抽出された概念語と対応して登録されている属性情報を概念属性データベースから検索して、属性情報に対応した応答文を生成して出力する対話装置が提案されている(例えば、特許文献2参照)。
特開2007−206888号公報 特開2009−3811号公報
しかしながら、上記特許文献1の応答生成装置、及び特許文献2の対話装置では、応答文の内容をユーザに尋ねることが適切か不適切かにかかわらず、抽出された単語の品詞や属性情報に対応して定められた応答文が生成される。そのため、例えば、「あの石はすごく大きいよ」というユーザ発話に対して、「どうして大きいの?」といった不自然な応答が生成されてしまう場合がある、という問題がある。
本発明は、上記の問題を解決するためになされたものであり、不適切な応答文の生成を防止して、自然な対話を行うことができる応答生成装置及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明に係る応答生成装置は、入力文の構造を解析した解析結果に基づいて、事態を表す単語を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す単語が、感情を尋ねることが適切な単語または不適切な単語として感情質問可能判断辞書に登録されているか否かを判断し、感情を尋ねることが適切な単語である場合には、前記抽出された事態を表す単語に対する感情を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する感情質問応答生成手段とを含んで構成されている。
また、第2の発明に係る応答生成プログラムは、コンピュータを、入力文の構造を解析した解析結果に基づいて、事態を表す単語を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す単語が、感情を尋ねることが適切な単語または不適切な単語として感情質問可能判断辞書に登録されているか否かを判断し、感情を尋ねることが適切な単語である場合には、前記抽出された事態を表す単語に対する感情を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する感情質問応答生成手段として機能させるためのプログラムである。
第1の発明に係る応答生成装置、及び第2の発明に係る応答生成プログラムによれば、事態抽出手段が、入力文の構造を解析した解析結果に基づいて、事態を表す単語を入力文から抽出する。事態とは、人の行動や人が経験する事象及び出来事をいう。そして、感情質問応答生成手段が、事態抽出手段で抽出された事態を表す単語が、感情を尋ねることが適切な単語または不適切な単語として感情質問可能判断辞書に登録されているか否かを判断し、感情を尋ねることが適切な単語である場合には、抽出された事態を表す単語に対する感情を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに抽出された事態を表す単語を付加した応答文候補を生成する。
このように、抽出した事態を表す単語に基づいて、感情を尋ねることが適切か否かを判断した上で応答文候補を生成するため、不適切な応答文の生成を防止して、自然な対話を行うことができる。
また、第1の発明に係る応答生成装置、及び第2の発明に係る応答生成プログラムにおいて、前記感情質問可能判断辞書に、シソーラス内の感情に関する分類名が付されていない単語を、感情を尋ねることが適切な単語として登録するか、または、前記シソーラス内の感情に関する分類名が付されている単語を、感情を尋ねることが不適切な単語として登録することができる。このような感情質問可能判断辞書を用いることにより、感情を尋ねることが適切か不適切かを容易に判断することができる。
また、第3の発明に係る応答生成装置は、入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す節が、頻度を尋ねることが適切な節または不適切な節として頻度質問可能判断辞書に登録されているか否かを判断し、頻度を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する頻度を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する頻度質問応答生成手段とを含んで構成することができる。
また、第4の発明に係る応答生成プログラムは、コンピュータを、入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す節が、頻度を尋ねることが適切な節または不適切な節として頻度質問可能判断辞書に登録されているか否かを判断し、頻度を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する頻度を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する頻度質問応答生成手段として機能させるためのプログラムである。
第3の発明に係る応答生成装置、及び第4の発明に係る応答生成プログラムによれば、事態抽出手段が、入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出し、頻度質問応答生成手段が、事態抽出手段で抽出された事態を表す節が、頻度を尋ねることが適切な節または不適切な節として頻度質問可能判断辞書に登録されているか否かを判断し、頻度を尋ねることが適切な節である場合には、抽出された事態を表す節に対する頻度を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに抽出された事態を表す節を付加した応答文候補を生成する。
このように、抽出した事態を表す節に基づいて、頻度を尋ねることが適切か否かを判断した上で応答文候補を生成するため、不適切な応答文の生成を防止して、自然な対話を行うことができる。
また、第3の発明に係る応答生成装置、及び第4の発明に係る応答生成プログラムにおいて、前記頻度質問可能判断辞書に、経験する頻度が高い事態、経験する頻度が低い事態、特定の時期にのみ起こりうる事態、必ず別の事態に付随し、単独では起こりえない事態、必ず所定の目的のために起こり、単独では完結しない事態、開始または終了を意味する事態、及び存在を意味する事態のいずれかに該当する事態を表す節を、頻度を尋ねることが不適切な節として登録するか、または、前記いずれかに該当する事態以外の事態を表す節を、頻度を尋ねることが適切な節として登録することができる。このような頻度質問不可能判断辞書を用いることにより、頻度を尋ねることが適切か不適切かを容易に判断することができる。
また、第5の発明に係る応答生成装置は、入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す節が、並列する目的語を尋ねることが適切な節または不適切な節として並列目的語質問可能判断辞書に登録されているか否かを判断し、並列する目的語を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する並列する目的語を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する並列目的語質問応答生成手段とを含んで構成することができる。
また、第6の発明に係る応答生成プログラムは、コンピュータを、入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、前記事態抽出手段で抽出された事態を表す節が、並列する目的語を尋ねることが適切な節または不適切な節として並列目的語質問可能判断辞書に登録されているか否かを判断し、並列する目的語を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する並列する目的語を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する並列目的語質問応答生成手段として機能させるためのプログラムである。
第5の発明に係る応答生成装置、及び第6の発明に係る応答生成プログラムによれば、事態抽出手段が、入力文の構造を解析した解析結果に基づいて、事態を表す節を入力文から抽出し、並列目的語質問応答生成手段が、事態抽出手段で抽出された事態を表す節が、並列する目的語を尋ねることが適切な節または不適切な節として並列目的語質問可能判断辞書に登録されているか否かを判断し、並列する目的語を尋ねることが適切な節である場合には、抽出された事態を表す節に対する並列する目的語を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに抽出された事態を表す節を付加した応答文候補を生成する。
このように、抽出した事態を表す節に基づいて、並列する目的語を尋ねることが適切か否かを判断した上で応答文候補を生成するため、不適切な応答文の生成を防止して、自然な対話を行うことができる。
また、第5の発明に係る応答生成装置、及び第6の発明に係る応答生成プログラムにおいて、前記並列目的語質問可能判断辞書に、複数の入力文から、複数の並列した名詞を目的語としている事態を表す節を抽出し、前記複数の並列した名詞の各々を目的語とする節に分割し、分割された節の各々の出現頻度が所定値以上の前記分割された節を、並列する目的語を尋ねることが適切な節として登録するか、または、出現頻度が所定値より小さい前記分割された節を、並列する目的語を尋ねることが不適切な節として登録することができる。このような並列目的語質問可能判断辞書を用いることにより、並列する目的語を尋ねることが適切か不適切かを容易に判断することができる。
また、第1の発明に係る応答生成装置、第3の発明に係る応答生成装置、及び第5の発明に係る応答生成装置から選択した少なくとも2つの応答生成装置を組み合わせて構成することもできる。これにより、応答文候補のバリエーションが増え、柔軟に対話を行うことができる。
また、第1の発明に係る応答生成装置、第3の発明に係る応答生成装置、及び第5の発明に係る応答生成装置は、入力文の構造を解析した解析結果に基づいて、品詞が名詞の単語を前記入力文から抽出する名詞抽出手段と、前記名詞抽出手段で抽出された品詞が名詞の単語が、詳細を尋ねることが適切な単語または不適切な単語として名詞詳細質問可能判断辞書に登録されているか否かを判断し、詳細を尋ねることが適切な単語である場合には、前記抽出された品詞が名詞の単語に対する詳細を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する名詞詳細質問応答生成手段とを含んで構成することができる。
さらに、入力文の構造を解析した解析結果に基づいて、形容表現の単語または節を前記入力文から抽出する形容表現抽出手段と、前記形容表現抽出手段で抽出された形容表現の単語または節が、理由を尋ねることが適切な単語もしくは節、または不適切な単語もしくは節として形容表現理由質問可能判断辞書に登録されているか否かを判断し、理由を尋ねることが適切な単語または節である場合には、前記抽出された形容表現の単語または節に対する理由を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された形容表現の単語または節を付加した応答文候補を生成する形容表現質問応答生成手段とを含んで構成することもできる。
また、前記名詞詳細質問可能判断辞書に、品詞が名詞の単語と疑問詞との組合せのウェブ上での出現頻度が所定値以上の前記品詞が名詞の単語を、詳細を尋ねることが適切な単語として登録するか、または、前記品詞が名詞の単語と疑問詞との組合せのウェブ上での出現頻度が所定値より小さい前記品詞が名詞の単語を、詳細を尋ねることが不適切な単語として登録することができる。
また、前記形容表現理由質問可能判断辞書に、シソーラス内の人の感情及び感覚に関する分類名が付されている単語を、理由を尋ねることが適切な単語として登録するか、または、前記シソーラス内の人の感情及び感覚に関する分類名が付されていない単語を、理由を尋ねることが不適切な単語として登録することができる。
以上説明したように、本発明の応答生成装置及びプログラムによれば、不適切な応答文の生成を防止して、自然な対話を行うことができる、という効果が得られる。
本実施の形態に係る応答生成装置の概略構成を示すブロック図である。 事態性名詞辞書の一例を示すイメージ図である。 感情質問の質問文例の一例を示すイメージ図である。 頻度質問の応答文例及び応答文例フォーマットの一例を示すイメージ図である。 並列目的語質問の応答文例及び応答文例フォーマットの一例を示すイメージ図である。 形容表現理由質問の応答文例及び応答文例フォーマットの一例を示すイメージ図である。 感情質問可能判断DBの生成処理を示すフローチャートである。 形態素解析の結果の一例を示すイメージ図である。 シソーラスの内容を示すイメージ図である。 感情を尋ねることができるか否かを判断するためのルールの一例を示す図である。 シソーラスの内容を示す他のイメージ図である。 感情質問可能判断DBの一例を示すイメージ図である。 頻度質問不可能判断DBの生成処理を示すフローチャートである。 形態素解析の結果の他の例を示すイメージ図である。 頻度を尋ねるのが不適切な事態の種類を示す表である。 頻度質問不可能判断DBの一例を示すイメージ図である。 並列目的語質問可能判断DBの生成処理を示すフローチャートである。 形態素解析の結果の他の例を示すイメージ図である。 並列目的語を判断する言語パターンの一例を示す図である。 並列目的語の事態を表す節の出現頻度のカウント結果の一例である。 並列目的語質問可能判断DBの一例を示すイメージ図である。 並列目的語質問可能判断DBの他の例を示すイメージ図である。 名詞詳細質問可能判断DBの生成処理を示すフローチャートである。 形態素解析の結果の他の例を示すイメージ図である。 疑問詞と名詞との共起パターンの一例を示す図である。 疑問詞と名詞との共起パターンの出現頻度のカウント結果の一例である。 疑問詞と名詞との共起パターンの出現頻度のカウント結果の他の例である。 名詞詳細質問可能判断DBの一例を示すイメージ図である。 品詞が名詞の単語に対して詳細を尋ねるための疑問詞の一例を示す図である。 形容表現理由質問可能判断DBの生成処理を示すフローチャートである。 形態素解析の結果の他の例を示すイメージ図である。 シソーラスの内容を示す他のイメージ図である。 形容表現の理由を尋ねることができるか否かを判断するためのルールの一例を示す図である。 シソーラスの内容を示す他のイメージ図である。 形容表現理由質問可能判断DBの一例を示すイメージ図である。 本実施の形態の応答生成装置における応答生成処理ルーチンを示すフローチャートである。 形態素解析の結果の他の例を示すイメージ図である。
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態では、ユーザからの発話を入力として、所定の処理を実行して音声出力する応答生成装置に本発明を適用した場合について説明する。
図1に示すように、本実施の形態に係る応答生成装置10は、ユーザ発話を集音して音声信号を生成するマイク12と、音声出力を行うスピーカ14と、マイク12及びスピーカ14に接続され、かつ、適切な応答文を生成する所定の処理を実行するコンピュータ16とを備えている。
コンピュータ16は、応答生成装置10全体の制御を司るCPU、後述する応答生成プログラム等各種プログラムを記憶した記憶媒体としてのROM、ワークエリアとしてデータを一時格納するRAM、各種情報が記憶された記憶手段としてのHDD、I/O(入出力)ポート、及びこれらを接続するバスを含んで構成されている。I/Oポートには、マイク12及びスピーカ14が接続されている。
また、このコンピュータ16を、ハードウエアとソフトウエアとに基づいて定まる機能実現手段毎に分割した機能ブロックで説明すると、図1に示すように、マイク12から入力された音声信号を音声認識して、一般的な形態素解析器を用いて音声認識されたユーザ発話を示す文字列情報に対して形態素解析を行う言語解析部20、言語解析部20による解析結果に基づいて、ユーザ発話に事態が含まれているか否かを判別する事態判別部22、ユーザ発話に事態が含まれている場合に、ユーザ発話から事態を表す単語を抽出する事態(単語)抽出部24、事態(単語)抽出部24で抽出された単語が感情質問可能判断データベース(DB)28に登録されている場合に感情を尋ねる質問を応答文候補として生成する感情質問応答生成部26、ユーザ発話に事態が含まれている場合に、ユーザ発話から事態を表す節を抽出する事態(節)抽出部30、事態(節)抽出部30で抽出された節が頻度質問不可能判断DB34に登録されていない場合に頻度を尋ねる質問を応答文候補として生成する頻度質問応答生成部32、事態(節)抽出部30で抽出された節が並列目的語質問可能判断DB38に登録されている場合に並列する目的語を尋ねる質問を応答文候補として生成する並列目的語質問応答生成部36、言語解析部20による解析結果に基づいて、ユーザ発話に品詞が名詞の単語が含まれているか否かを判別する名詞判別部40、ユーザ発話に品詞が名詞の単語が含まれている場合に、ユーザ発話から品詞が名詞の単語を抽出する名詞抽出部42、名詞抽出部42で抽出された品詞が名詞の単語が名詞詳細質問可能判断DB46に登録されている場合に詳細を尋ねる質問を応答文候補として生成する名詞詳細質問応答生成部44、言語解析部20による解析結果に基づいて、ユーザ発話に形容表現の単語または節が含まれているか否かを判別する形容表現判別部48、ユーザ発話に形容表現の単語または節が含まれている場合に、ユーザ発話から形容表現の単語または節を抽出する形容表現抽出部50、形容表現抽出部50で抽出された形容表現の単語または節が形容表現理由質問可能判断DB54に登録されている場合に理由を尋ねる質問を応答文候補として生成する形容表現理由質問応答生成部52、応答文候補が生成されなかった場合に、相槌の応答文を生成する相槌応答生成部56、及び生成された応答文候補から選択された1つの応答文候補、または相槌の応答文を音声信号に変換してスピーカ14から出力させる出力部58を含んだ構成で表すことができる。
事態判別部22は、ユーザ発話に対する言語解析部20での解析結果に、事態を表す単語が含まれているか否かを判別する。事態とは、人の行動や人が経験する事象及び出来事であり、何らかの感情が対応付けられることが想定される。ここでは、解析結果に(i)「動詞」が含まれている場合、及び(ii)「事態性名詞+(”だ”または”です”)」が含まれている場合に「事態」が含まれていると判別する。「事態性名詞」とは、例えば「雨」や「運動会」といった出来事を示す名詞である。事態性名詞は、図2に示すような事態性名詞辞書を予め作成しておき、判別の際に、この事態性名詞辞書を参照して判別する。
事態(名詞)抽出部24は、事態判別部22で事態が含まれていると判別されたユーザ発話の解析結果から事態を表す単語を抽出する。上記(i)の場合であれば「動詞」である単語が抽出され、上記(ii)であれば「事態性名詞」である単語が抽出される。
感情質問応答生成部26は、事態(名詞)抽出部24で抽出された単語が後述する感情質問可能判断DB28に登録されているか否かを判断し、登録されている場合には、ユーザに感情を尋ねる質問文を応答文候補として生成する。応答文候補は、基本となる質問文、例えば、「どう思う?」や「どんな感じ?」といった文を予め作成しておき、ユーザ発話の解析結果に基づいて、この基本となる質問文から選択した1つの文の時制や表現(丁寧な表現か砕けた表現かなど)を修正して、応答文候補を生成する。また、図3に示すような質問文例を予め作成しておき、この中からランダムに選択するようにしてもよい。生成された応答文候補は、一旦所定の記憶領域に記憶される。
事態(節)抽出部30は、事態判別部22で事態が含まれていると判別されたユーザ発話の解析結果から事態を表す節を抽出する。上記(i)の場合であれば該当する「動詞」を含む節が抽出され、上記(ii)であれば該当する「事態性名詞」を含む節が抽出される。
頻度質問応答生成部32は、事態(節)抽出部30で抽出された節が後述する頻度質問不可能判断DB34に登録されているか否かを判断し、登録されていない場合には、ユーザに頻度を尋ねる質問文を応答文候補として生成する。応答文候補は、例えば、図4に示すような応答文例及び応答文例フォーマットを予め用意しておき、この応答文例からランダムに選択したり、応答文例フォーマットを用いて生成したりする。応答文例フォーマットは、例えば、「よく〜するんですか?」のようなフォーマットとすることができ、「〜」の部分に、ユーザ発話の解析結果から抽出された事態を表す節を挿入して応答文候補を生成することができる。生成された応答文候補は、一旦所定の記憶領域に記憶される。
並列目的語質問応答生成部36は、事態(節)抽出部30で抽出された節が後述する並列目的語質問可能判断DB38に登録されているか否かを判断し、登録されている場合には、ユーザに並列する目的語を尋ねる質問文を応答文候補として生成する。応答文候補は、例えば、図5に示すような応答文例及び応答文例フォーマットを予め用意しておき、この応答文例からランダムに選択したり、応答文例フォーマットを用いて生成したりする。応答文例フォーマットは、例えば、「他に何を〜?」のようなフォーマットとすることができ、「〜」の部分に、ユーザ発話の解析結果から抽出された事態を表す節の「動詞」である単語を挿入して応答文候補を生成することができる。生成された応答文候補は、一旦所定の記憶領域に記憶される。
名詞判別部40は、ユーザ発話に対する言語解析部20での解析結果に、品詞が名詞の単語が含まれているか否かを判別する。
名詞抽出部42は、名詞判別部40で品詞が名詞の単語が含まれていると判別されたユーザ発話の解析結果から品詞が名詞の単語を抽出する。
名詞詳細質問応答生成部44は、名詞抽出部42で抽出された単語が後述する名詞詳細質問可能判断DB46に登録されているか否かを判断し、登録されている場合には、ユーザに名詞である単語についての詳細を尋ねる質問文を応答文候補として生成する。なお、詳細は後述するが、名詞詳細質問可能判断DB46には、名詞の詳細を尋ねるために用いられる疑問詞(例えば、「どんな」「誰の」など)毎に単語が登録された構成となっている。応答文候補は、名詞詳細質問可能判断DB46に登録された単語に対応する疑問詞と抽出された品詞が名詞の単語とを組み合わせて、「どんな(抽出した品詞が名詞の単語)なの?」のように生成することができる。生成された応答文候補は、一旦所定の記憶領域に記憶される。
形容表現判別部48は、ユーザ発話に対する言語解析部20での解析結果に、形容表現の単語または節が含まれているか否かを判別する。「形容表現」とは、(i)品詞が「形容詞」の単語、及び(ii)「品詞が名詞の単語+(”だ”または”です”)」をいい、いずれかが含まれている場合に「形容表現」の単語または節が含まれていると判別する。
形容表現抽出部50は、形容表現判別部48で形容表現が含まれていると判別されたユーザ発話の解析結果から形容表現の単語または節を抽出する。上記(i)に該当する単語、または上記(ii)に該当する節が抽出される。
形容表現理由質問応答生成部52は、形容表現抽出部50で抽出された単語または節が後述する形容表現理由質問可能判断DB54に登録されているか否かを判断し、登録されている場合には、ユーザに形容表現に対する理由を尋ねる質問文を応答文候補として生成する。応答文候補は、例えば、図6に示すような応答文例及び応答文例フォーマットを予め用意しておき、この応答文例からランダムに選択したり、応答文例フォーマットを用いて生成したりする。応答文例フォーマットは、例えば、「どうして〜ですか?」のようなフォーマットとすることができ、「〜」の部分に、ユーザ発話の解析結果から抽出された形容表現の単語または節を挿入して応答文候補を生成することができる。生成された応答文候補は、一旦所定の記憶領域に記憶される。
次に、各種質問可能(不可能)判断DBの生成処理について説明する。
まず、図7を参照して、感情質問可能判断DB28の生成処理について説明する。
ステップ100で、ウェブ上のテキストなどの大規模コーパスから1文を抽出する。ここでは、「動物園に行った」という文が抽出されたものとする。次に、ステップ102で、上記ステップ100で抽出された1文に対して形態素解析を行う。ここでは、図8に示すように、「動物園(名詞)」「に(格助詞)」「行く(動詞)」「た(助動詞)」という解析結果が得られる。次に、ステップ104で、解析結果に事態が含まれているか否かを判断する。事態が含まれている場合には、ステップ106へ進み、事態が含まれていない場合には、ステップ114へ進む。ここでは「行く(動詞)」が含まれているため、事態が含まれていると判断されてステップ106へ進む。
ステップ106で、事態を表す単語を抽出する。ここでは、「行く(動詞)」が抽出される。次に、ステップ108で、抽出された単語について、感情質問可能判断DB28への登録の可否の判別を行ったか否かを判断する。未判別の場合には、ステップ110へ進み、判別済みの場合には、ステップ114へ進む。ここでは、まだ1文目であるので、未判別と判断されて、ステップ110へ進む。
ステップ110で、図9に示すような、複数の階層(ここでは5階層)の各々の単語間の意味的類似関係に応じて階層上に単語を分類し、かつ意味的類似関係に応じた分類名を各階層の各分類に付したシソーラス上の分類名を用いたルールに基づいて、上記ステップ106で抽出された単語が感情質問可能判断DB28への登録対象か否かを判断する。登録対象の場合には、ステップ112へ進み、登録対象ではない場合には、ステップ114へ進む。シソーラス上の分類名を用いたルールは、例えば、図10に示すように、シソーラス上の第4階層に感情に関する分類名が付されていない単語を登録するように定めることができる。ユーザ発話の解析結果から抽出された単語のシソーラス上の分類名に感情に関する分類名が付されている場合には、ユーザ発話の内容には既に感情が含まれていると想定されるため、このユーザ発話に対してさらに感情を尋ねる応答文を出力することは不適切であり、上記ルールに従って生成された感情質問可能判断DB28を用いれば、このような不適切な応答文の生成を防止することができる。ここでは、「行く(動詞)」のシソーラスの第4階層の分類名は「往復」であり、ルールに基づいて登録対象と判別されるため、ステップ112へ進む。
ステップ112で、上記ステップ110で登録対象と判断された単語を、感情を尋ねることが適切な単語として感情質問可能判断DB28に登録する。
次に、ステップ114で、コーパス上の全ての文について上記の処理が行われたか否かを判断し、未処理の文がある場合には、ステップ100へ戻り、次の一文について処理を行う。次に「遊園地に行って久々に楽しんだ」という文が抽出されたとすると、ステップ106で、「行く(動詞)」及び「楽しむ(動詞)」が抽出され、ステップ108で、「行く(動詞)」については判別済み、「楽しむ(動詞)」については未判別と判断される。ステップ110で、図11に示すように「楽しむ(動詞)」のシソーラス上の第4階層の分類名「快・喜び」をルールに基づいて判断すると、「楽しむ(動詞)」という動作に対して感情を尋ねることは適切ではないと判断できるため、「楽しむ(動詞)」は感情質問可能判断DB28へ登録されない。ステップ114で全ての文について上記の処理が終了したと判断された場合には、処理を終了する。図12に、本処理により生成された感情質問可能判断DB28を示す。
次に、図13を参照して、頻度質問不可能判断DB34の生成処理について説明する。
ステップ120で、ウェブ上のテキストなどの大規模コーパスから1文を抽出する。ここでは、「歯を磨いた」という文が抽出されたものとする。次に、ステップ122で、上記ステップ120で抽出された1文に対して形態素解析を行う。ここでは、図14に示すように、「歯(名詞)」「を(格助詞)」「磨く(動詞)」「た(助動詞)」という解析結果が得られる。次に、ステップ124で、解析結果に事態が含まれているか否かを判断する。事態が含まれている場合には、ステップ126へ進み、事態が含まれていない場合には、ステップ132へ進む。ここでは「磨く(動詞)」が含まれているため、事態が含まれていると判断されてステップ126へ進む。
ステップ126で、事態を表す節を抽出する。上記ステップ124で、(i)「動詞」が含まれていると判断された場合には、該当する動詞を述語とする節を抽出する。(ii)「事態性名詞+(”だ”または”です”)」が含まれていると判断された場合には、「事態性名詞+(”だ”または”です”)」を述語とする節を抽出する。ここでは、「歯を磨く」が抽出される。次に、ステップ128で、抽出された節は事態DBに登録済みか否かを判断する。事態DBは、後述する処理のために、大規模コーパスから抽出された大量の事態を表す節を一旦登録しておくためのデータベースである。未登録の場合には、ステップ130へ進み、抽出された節を事態DBへ登録してステップ132へ進む。一方、登録済みの場合には、そのままステップ132へ進む。
ステップ132で、コーパス上の全ての文について上記の処理が行われたか否かを判断し、未処理の文がある場合には、ステップ120へ戻り、次の一文について処理を行う。次に「遊園地に行った」という文が抽出されたとすると、ステップ126で、「遊園地に行く」が抽出され、ステップ130で事態DBに登録される。ステップ132で全ての文について上記の処理が終了したと判断された場合には、ステップ134へ進む。
ステップ134で、事態DBに登録された事態の各々が、図15に示すような、頻度を尋ねることが不適切な事態に該当する場合には、頻度質問不可能判断DB34へ登録する。頻度を尋ねることが不適切な事態に該当するか否かの判断は、人手で行う。「歯を磨く」は、頻度を尋ねることが不適切な事態として挙げられている「1.誰もが普段当たり前のように経験する事態」に該当するため、頻度質問不可能判断DB34へ登録する。「遊園地へ行く」は、頻度を尋ねるのは不適切な事態として挙げられている事態のいずれにも該当しないため、頻度質問不可能判断DB34へ登録されない。すなわち、頻度質問不可能判断DB34は、頻度質問不可能判断DB34に登録された事態に対して頻度を尋ねることは不適切であるということを示している。事態DBに登録された事態の全てについて上記の処理を終了した場合には、本処理を終了する。図16に、本処理により生成された頻度質問不可能判断DB34を示す。
次に、図17を参照して、並列目的語質問可能判断DB38の生成処理について説明する。
ステップ140で、ウェブ上のテキストなどの大規模コーパスから1文を抽出する。ここでは、「お昼にパンとサラダを食べた」という文が抽出されたものとする。次に、ステップ142で、上記ステップ140で抽出された1文に対して形態素解析を行う。ここでは、図18に示すように、「お昼(名詞)」「に(格助詞)」「パン(名詞)」「と(並列助詞)」「サラダ(名詞)」「を(格助詞)」「食べる(動詞)」「た(助動詞)」という解析結果が得られる。
次に、ステップ146で、名詞の並列を目的語とする動詞が含まれているか否かを、図19に示す言語パターンに該当するか否かに基づいて判断する。含まれる場合には、ステップ148へ進み、含まれない場合には、ステップ152へ進む。ここでは、「パン(名詞)」「と(並列助詞)」「サラダ(名詞)」「を(格助詞)」「食べる(動詞)」が、「1.名詞 と 名詞 格助詞 動詞」のパターンと一致するため、名詞の並列を目的語とする動詞が含まれていると判断されて、ステップ148へ進む。
ステップ148で、名詞の並列を目的語とする動詞が含まれている1文を、複数の並列した名詞の各々を目的語とする節に分割して、それぞれの節を事態を表す節として抽出する。ここでは、「パンを食べる」及び「サラダを食べる」が抽出される。
次に、ステップ150で、抽出された事態を表す節を、事態を表す節、及びその節の出現頻度を計数したカウント値を定めた事態DBに登録する。既に登録されている節と同一の節の場合は、カウント値を+1する。
次に、ステップ152で、コーパス上の全ての文について上記の処理が行われたか否かを判断し、未処理の文がある場合には、ステップ140へ戻り、次の一文について処理を行う。次に「パンとかサンドイッチを食べた」という文が抽出されたとすると、ステップ146で、「2.名詞 とか 名詞 格助詞 動詞」のパターンと一致するため、名詞の並列を目的語とする動詞が含まれていると判断されて、ステップ148で、「パンを食べる」及び「サンドイッチを食べる」が抽出され、ステップ150で、事態DBにおいて、「パンを食べる」については、カウント値を+1し、「サンドイッチを食べる」については、新規に登録する。ステップ152で全ての文について上記の処理が終了したと判断された場合には、ステップ154へ進む。
ステップ154で、事態DBを参照して、出現頻度が閾値以上の事態を表す節を並列目的語質問可能判断DBに登録する。コーパスの全ての文を処理した後の事態DBの一例を図20に示す。ここで、閾値を「10」とすると、図20において、「パンを食べる」〜「マウスを買う」までが並列目的語質問可能判断DB38に登録される。事態DBでのカウント値(出現頻度)が高いということは、元々名詞の並列を目的語とした文として現れることが多く、省略された目的語が他にもあることが想定されるため、並列する目的語を尋ねる質問は適切である。カウント値が閾値以上の節を全て並列目的語質問可能判断DB38に登録したら、本処理を終了する。図21に、本処理により生成された並列目的語質問可能判断DB38を示す。
なお、事態DBに登録された節の「動詞」に着目し、ある「動詞」についてはどのような目的語をとった節であっても、その「動詞」を含む節の全てについて、カウント値が閾値を超えている場合には、事態を表す節ではなく「動詞」のみを並列目的語質問可能判断DB38に登録するようにしてもよい。例えば、図20の事態DBに基づいて、「食べる(動詞)」を含む節は、「パンを」、「サラダを」、及び「サンドイッチを」のいずれの目的語をとった場合でも、カウント値が閾値を超えている。また、「行く(動詞)」についても、「映画館に」、「喫茶店に」、及び「本屋に」のいずれの目的語をとった場合でも、カウント値が閾値を超えている。そこで、図22に示すように、並列目的語質問可能判断DB38には、事態を表す節の各々ではなく「食べる」「行く」の動詞のみを登録する。一方、「買う(動詞)」については、「キーボードを」及び「マウスを」を目的語とする場合にはカウント値が閾値を超えているが、「家を」及び「土地を」を目的語とする場合にはカウント値が閾値を超えていないため、カウント値が閾値を超えている「キーボードを買う」及び「マウスを買う」を、それぞれ事態を表す節の状態で登録する。
次に、図23を参照して、名詞詳細質問可能判断DB46の生成処理について説明する。ここでは、疑問詞「どんな」を用いた名詞の詳細を尋ねる質問が適切か否かを判断するためのデータベースの生成の場合を例に説明する。
ステップ160で、ウェブ上のテキストなどの大規模コーパスから1文を抽出する。ここでは、「車を買った」という文が抽出されたものとする。次に、ステップ162で、上記ステップ160で抽出された1文に対して形態素解析を行う。ここでは、図24に示すように、「車(名詞)」「を(格助詞)」「買う(動詞)」「た(助動詞)」という解析結果が得られる。次に、ステップ164で、解析結果に名詞が含まれているか否かを判断する。名詞が含まれている場合には、ステップ166へ進み、含まれていない場合には、ステップ176へ進む。ここでは「車(名詞)」が含まれているため、名詞が含まれていると判断されてステップ166へ進む。
ステップ166で、品詞が名詞の単語を抽出する。ここでは、「車(名詞)」が抽出される。次に、ステップ168で、抽出された単語について、名詞詳細質問可能判断DB46への登録の可否の判別を行ったか否かを判断する。未判別の場合には、ステップ170へ進み、判別済みの場合には、ステップ176へ進む。ここでは、まだ1文目であるので、未判別と判断されて、ステップ170へ進む。
ステップ170で、図25に示すような、疑問詞と名詞との共起パターンに該当する抽出された単語と疑問詞との組合せのウェブ上で出現頻度をカウントする。ここでは、疑問詞「どんな」、及び抽出された単語「車(名詞)」について、例えば、ウェブ上に「どんな車を」が出現した場合には、共起パターン「1:疑問詞 名詞 格助詞(「より」以外)」に該当するため、カウントする。
次に、ステップ172で、抽出された単語と疑問詞との組合せのウェブ上での出現頻度が閾値以上か否かを判断する。閾値以上の場合には、ステップ174へ進み、閾値より小さい場合には、ステップ176へ進む。図26に、カウント結果の一例を示す。ここでは、閾値を「100」とすると、抽出された単語「車(名詞)」と疑問詞「どんな」との組合せの出現頻度の合計は閾値以上であるので、ステップ174へ進む。なお、図26では、共起パター毎に出現頻度をカウントしているが、合計の出現頻度がカウントできればよい。
ステップ174で、上記ステップ172で出現頻度が閾値以上と判断された単語と疑問詞との組合せの単語を、その疑問詞を用いて詳細を尋ねることが適切な単語として名詞詳細質問可能判断DB46に登録する。
次に、ステップ176で、コーパス上の全ての文について上記の処理が行われたか否かを判断し、未処理の文がある場合には、ステップ160へ戻り、次の一文について処理を行う。次に「車で焼肉を食べに行った」という文が抽出されたとすると、ステップ166で、「車(名詞)」及び「焼肉(名詞)」が抽出され、ステップ168で、「車(名詞)」については判別済み、「焼肉(名詞)」については未判別と判断される。ステップ170で、疑問詞「どんな」と抽出された単語「焼肉(名詞)」との組合せについて、共起パターンに該当するものをカウントする。図27に、カウント結果の一例を示す。抽出された単語「焼肉(名詞)」と疑問詞「どんな」との組合せの出現頻度の合計は閾値より小さいため、名詞詳細質問可能判断DB46には登録されない。すなわち、「焼肉(名詞)」に対して疑問詞「どんな」を用いて詳細を尋ねることは不適切であるということを示している。
ステップ176で、全ての文について上記の処理が終了したと判断された場合には、処理を終了する。図28に、本処理により生成された名詞詳細質問可能判断DB46の疑問詞「どんな」について登録された単語を示す。なお、図29に示すように、品詞が名詞の単語に対して詳細を尋ねるための疑問詞を予め複数定めておき、これらの疑問詞の各々について上記と同様の処理により、疑問詞に対応した適切な単語を登録して名詞詳細質問可能判断DB46を生成する。
次に、図30を参照して、形容表現理由質問可能判断DB54の生成処理について説明する。
ステップ180で、ウェブ上のテキストなどの大規模コーパスから1文を抽出する。ここでは、「退屈だったよ」という文が抽出されたものとする。次に、ステップ182で、上記ステップ180で抽出された1文に対して形態素解析を行う。ここでは、図31に示すように、「退屈(名詞)」「だ(助動詞)」「た(助動詞)」「よ(終助詞)」という解析結果が得られる。次に、ステップ184で、解析結果に形容表現が含まれているか否かを判断する。形容表現が含まれている場合には、ステップ186へ進み、形容表現が含まれていない場合には、ステップ194へ進む。ここでは「退屈だ(名詞+”だ”)」が含まれているため、形容表現が含まれていると判断されてステップ186へ進む。
ステップ186で、形容表現の単語または節を抽出する。ここでは、「退屈だ(名詞+”だ”)」が抽出される。次に、ステップ188で、抽出された単語または節について、形容表現理由質問可能判断DB54への登録の可否の判別を行ったか否かを判断する。未判別の場合には、ステップ190へ進み、判別済みの場合には、ステップ194へ進む。ここでは、まだ1文目であるので、未判別と判断されて、ステップ190へ進む。
ステップ190で、図32に示すようなシソーラス上の分類名を用いたルールに基づいて、上記ステップ186で抽出された単語または節が形容表現理由質問可能判断DB54への登録対象か否かを判断する。登録対象の場合には、ステップ192へ進み、登録対象ではない場合には、ステップ194へ進む。シソーラス上の分類名を用いたルールは、例えば、図33に示すように、シソーラス上の第4階層に人の感情及び感覚に関する分類名が付されている単語または節を登録するように定めることができる。人の感情及び感覚に関する分類名とは、例えば、「感覚」、「疲労・睡眠など」・「快・喜び」など、人の主観に関連するものをいう。ユーザ発話の解析結果から抽出された単語または節のシソーラス上の分類名に人の感情及び感覚に関する分類名が付されている場合には、ユーザ発話の内容にはユーザの主観が含まれていると想定されるため、その理由を尋ねることは適切である。ここでは、「退屈だ」のシソーラスの第4階層の分類名は「疲労・睡眠など」であり、ルールに基づいて登録対象であると判断されて、ステップ192へ進む。
ステップ192で、上記ステップ190で登録対象と判断された単語または節を、理由を尋ねることが適切な単語または節として形容表現理由質問可能判断DB54に登録する。
次に、ステップ194で、コーパス上の全ての文について上記の処理が行われたか否かを判断し、未処理の文がある場合には、ステップ180へ戻り、次の一文について処理を行う。次に「赤い車を買った」という文が抽出されたとすると、ステップ186で、「赤い(形容詞)」が抽出され、ステップ190で、図34に示すように「赤い(形容詞)」のシソーラス上の第4階層の分類名「色」をルールに基づいて判断すると、「赤い(形容詞)」という形容表現に対して理由を尋ねることは適切ではないと判断できるため、「赤い(形容詞)」は形容表現理由質問可能判断DB54へ登録されない。
ステップ194で全ての文について上記の処理が終了したと判断された場合には、処理を終了する。図35に、本処理により生成された形容表現理由質問可能判断DB54を示す。
次に、図36を参照して、本実施の形態の応答生成装置10における応答生成処理ルーチンについて説明する。本ルーチンは、ROMに記憶された応答生成プログラムをCPUが実行することにより行われる。
ステップ200で、マイク12からユーザ発話が入力されたか否かを判断し、ユーザ発話が入力された場合には、ステップ202へ進み、入力されない場合には、入力されるまで本ステップの判断を繰り返す。ここでは、ユーザ発話「映画を観たよ」が入力されたものとする。
ステップ202で、入力されたユーザ発話を示す音声信号を音声認識して文字列情報とし、この文字列情報に対して形態素解析を行う。ここでは、解析結果として、図37に示すように、「映画(名詞)」「を(格助詞)」「観る(動詞)」「た(助動詞)」「よ(終助詞)」が得られる。
次に、ステップ204で、形態素解析の解析結果に基づいて、ユーザ発話に事態が含まれているか否かを判別する。事態が含まれている場合には、ステップ206へ進み、含まれていない場合には、ステップ222へ進む。ここでは、「観る(動詞)」が含まれているため、事態が含まれていると判断されてステップ206へ進む。
ステップ206で、ユーザ発話の解析結果から事態を表す単語を抽出する。ここでは、「観る(動詞)」が抽出される。次に、ステップ208で、抽出された単語が感情質問可能判断DB28に登録されているか否かを判断することにより、感情を尋ねる質問を生成することが適切か否かを判断する。登録されている場合には、ステップ210へ進み、登録されていない場合には、ステップ212へ進む。ここでは、図12に示す感情質問可能判断DB28を参照して、「観る」が登録されているため、感情を尋ねる質問を生成することは適切であると判断されて、ステップ210へ進む。
ステップ210で、感情を尋ねるための応答文候補を生成して、予め定めた記憶領域に一旦記憶する。ここでは、図3に示す質問文例の中から、「どうでした?」を選択して応答文候補として生成する。
次に、ステップ212で、ユーザ発話の解析結果から事態を表す節を抽出する。ここでは、「映画を観る」が抽出される。次に、ステップ214で、抽出された節が頻度質問不可能判断DB34に登録されているか否かを判断することにより、頻度を尋ねる質問を生成することが適切か否かを判断する。登録されていない場合には、ステップ216へ進み、登録されている場合には、ステップ218へ進む。ここでは、図16に示す頻度質問不可能判断DB34を参照して、「映画を観る」が登録されていないため、頻度を尋ねる質問を生成することは適切であると判断されて、ステップ216へ進む。
ステップ216で、頻度を尋ねるための応答文候補を生成して、予め定めた記憶領域に一旦記憶する。ここでは、図4に示す応答文例及び応答文例フォーマットから応答文例フォーマット「よく〜するんですか?」を選択し、「〜」の部分に、抽出した事態を表す節を挿入して「よく映画を観るんですか?」のような応答文候補を生成する。
次に、ステップ218で、上記ステップ212で抽出された節が並列目的語質問可能判断DB38に登録されているか否かを判断することにより、並列する目的語を尋ねる質問を生成することが適切か否かを判断する。登録されている場合には、ステップ220へ進み、例えば、図5に示す応答文例及び応答文例フォーマットを用いて応答文候補を生成する。一方、抽出された節が並列目的語質問可能判断DB38に登録されていない場合には、ステップ230へ進む。ここでは、図21に示す並列目的語質問可能判断DB38を参照して、「映画を観る」が登録されていないため、並列する目的語を尋ねる質問を生成することは不適切であると判断されて、ステップ238へ進む。
また、上記ステップ204で、ユーザ発話に事態が含まれていないと判断されてステップ222へ進んだ場合には、形態素解析の解析結果に基づいて、ユーザ発話に名詞が含まれているか否かを判別する。名詞が含まれている場合には、ステップ224へ進み、含まれていない場合には、ステップ230へ進む。ここでは、「映画(名詞)」が含まれているため、名詞が含まれていると判断されてステップ224へ進む。
ステップ224で、ユーザ発話の解析結果から品詞が名詞の単語を抽出する。ここでは、「映画(名詞)」が抽出される。次に、ステップ226で、抽出された単語が名詞詳細質問可能判断DB46に登録されているか否かを判断することにより、抽出された単語に対する詳細を尋ねる質問を生成することが適切か否かを判断する。登録されている場合には、ステップ228へ進み、登録されていない場合には、ステップ238へ進む。ここでは、図28に示す名詞詳細質問可能判断DB46を参照して、疑問詞「どんな」に対応して「映画」が登録されているため、詳細を尋ねる質問を生成することは適切であると判断されて、ステップ228へ進む。
ステップ228で、抽出された単語に対する詳細を尋ねるための応答文候補を生成して、予め定めた記憶領域に一旦記憶する。ここでは、名詞詳細質問可能判断DB46に「映画」と対応して記憶された疑問詞「どんな」と「映画」とを組み合わせて「どんな映画?」のような応答文候補を生成する。
また、上記ステップ222で、ユーザ発話に名詞が含まれていないと判断されてステップ230へ進んだ場合には、形態素解析の解析結果に基づいて、ユーザ発話に形容表現が含まれているか否かを判別する。形容表現が含まれている場合には、ステップ232へ進み、含まれていない場合には、ステップ242へ進む。ここでは、(i)品詞が「形容詞」の単語、及び(ii)「品詞が名詞の単語+(”だ”または”です”)」のいずれも含まれていないため、形容表現が含まれていないと判断されてステップ242へ進む。
なお、形容表現が含まれている場合には、ステップ232で、ユーザ発話の解析結果から形容表現の単語または節を抽出し、次に、ステップ234で、抽出された単語または節が形容表現理由質問可能判断DB54に登録されているか否かを判断することにより、形容表現に対する理由を尋ねる質問を生成することが適切か否かを判断する。登録されている場合には、ステップ236へ進み、例えば、図6に示す応答文例及び応答文例フォーマットを用いて応答文候補を生成し、登録されていない場合には、ステップ238へ進む。
次に、ステップ238で、上記ステップ210、216、220、228、及び236で生成された応答文候補が少なくとも1つ以上あるか否かを判断する。予め定めた記憶領域に応答文候補が記憶されている場合には、ステップ240へ進んで、生成された応答文候補の中からランダムに1つ選択する。ここでは、「どうでした?」、「よく映画を観るんですか?」、及び「どんな映画?」という応答文候補が生成されており、この中から例えば、「どうでした?」を選択する。一方、応答文候補が1つも生成されていない場合には、ステップ242へ進んで、「へえ〜」や「それで?」などの相槌の応答文を生成する。相槌の応答文は、予め用意された定型文から選択したり、予め用意された定型フォーマットにユーザ発話の解析結果から抽出した単語を付加したりすることにより生成することができる。
次に、ステップ244で、上記ステップ240で選択された応答文候補、または上記ステップ242で生成された相槌の応答文を音声信号に変換して出力する。ここでは、「どうでした?」を音声出力して、処理を終了する。
なお、上記ステップ204〜220、ステップ222〜228、及びステップ230〜236の処理は並列して実行してもよい。また、上記ステップ206〜210、ステップ212〜216、及びステップ212−218−220の処理も並列して実行してもよい。
以上説明したように、本実施の形態の応答生成装置によれば、ユーザ発話の解析結果から抽出される事態を表す単語または節、品詞が名詞の単語、及び形容表現の単語または節に基づいて、予め質問することが適切か否かを判断するために生成されたデータベースにこれらの単語や節が登録されているか否かを判断することにより、質問する内容が適切か否かを判断できるため、不適切な応答文の生成を防止して、自然な対話を行うことができる。
なお、本実施の形態では、感情質問可能判断DB、並列目的語質問可能判断DB、名詞詳細質問可能判断DB、及び形容表現理由質問可能判断DBにおいては、適切な単語または節を登録し、頻度質問不可能判断DBにおいては、不適切な節を登録する場合について説明したが、同様のルールに基づいて、適切でなければ不適切であると判断することができるため、感情質問可能判断DB、並列目的語質問可能判断DB、名詞詳細質問可能判断DB、及び形容表現理由質問可能判断DBにおいても、不適切な単語または節を登録するようにしてもよいし、頻度質問不可能判断DBにおいても、適切な節を登録するようにしてもよい。
また、本実施の形態では、スピーカによる音声出力を行う場合を例に説明したが、これに限定されるものではなく、ディスプレイに応答文を表示するようにしてもよい。また、ユーザから音声がマイクに入力される場合を例に説明したが、ユーザがキーボードなどを用いて入力文としてのテキストを入力するようにしてもよい。
10 応答生成装置
12 マイク
14 スピーカ
16 コンピュータ
20 言語解析部
22 事態判別部
24 事態(単語)抽出部
26 感情質問応答生成部
28 感情質問可能判断DB(データベース)
30 事態(節)抽出部
32 頻度質問応答生成部
34 頻度質問可能判断DB
36 並列目的語質問応答生成部
38 並列目的語質問可能判断DB
40 名詞判別部
42 名詞抽出部
44 名詞詳細質問応答生成部
46 名詞詳細質問可能判断DB
48 形容表現判別部
50 形容表現抽出部
52 形容表現理由質問応答生成部
54 形容表現理由質問可能判断DB
56 相槌応答生成部
58 出力部

Claims (15)

  1. 入力文の構造を解析した解析結果に基づいて、事態を表す単語を前記入力文から抽出する事態抽出手段と、
    前記事態抽出手段で抽出された事態を表す単語が、感情を尋ねることが適切な単語または不適切な単語として感情質問可能判断辞書に登録されているか否かを判断し、感情を尋ねることが適切な単語である場合には、前記抽出された事態を表す単語に対する感情を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する感情質問応答生成手段と、
    を含む応答生成装置。
  2. 前記感情質問可能判断辞書に、シソーラス内の感情に関する分類名が付されていない単語を、感情を尋ねることが適切な単語として登録するか、または、前記シソーラス内の感情に関する分類名が付されている単語を、感情を尋ねることが不適切な単語として登録した請求項1記載の応答生成装置。
  3. 入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、
    前記事態抽出手段で抽出された事態を表す節が、頻度を尋ねることが適切な節または不適切な節として頻度質問可能判断辞書に登録されているか否かを判断し、頻度を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する頻度を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する頻度質問応答生成手段と、
    を含む応答生成装置。
  4. 前記頻度質問可能判断辞書に、経験する頻度が高い事態、経験する頻度が低い事態、特定の時期にのみ起こりうる事態、必ず別の事態に付随し、単独では起こりえない事態、必ず所定の目的のために起こり、単独では完結しない事態、開始または終了を意味する事態、及び存在を意味する事態のいずれかに該当する事態を表す節を、頻度を尋ねることが不適切な節として登録するか、または、前記いずれかに該当する事態以外の事態を表す節を、頻度を尋ねることが適切な節として登録した請求項3記載の応答生成装置。
  5. 入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、
    前記事態抽出手段で抽出された事態を表す節が、並列する目的語を尋ねることが適切な節または不適切な節として並列目的語質問可能判断辞書に登録されているか否かを判断し、並列する目的語を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する並列する目的語を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する並列目的語質問応答生成手段と、
    を含む応答生成装置。
  6. 前記並列目的語質問可能判断辞書に、複数の入力文から、複数の並列した名詞を目的語としている事態を表す節を抽出し、前記複数の並列した名詞の各々を目的語とする節に分割し、分割された節の各々の出現頻度が所定値以上の前記分割された節を、並列する目的語を尋ねることが適切な節として登録するか、または、出現頻度が所定値より小さい前記分割された節を、並列する目的語を尋ねることが不適切な節として登録した請求項5記載の応答生成装置。
  7. 請求項1または請求項2記載の応答生成装置、請求項3または請求項4記載の応答生成装置、及び請求項5または請求項6記載の応答生成装置から選択した少なくとも2つの応答生成装置を組み合わせた応答生成装置。
  8. 入力文の構造を解析した解析結果に基づいて、品詞が名詞の単語を前記入力文から抽出する名詞抽出手段と、
    前記名詞抽出手段で抽出された品詞が名詞の単語が、詳細を尋ねることが適切な単語または不適切な単語として名詞詳細質問可能判断辞書に登録されているか否かを判断し、詳細を尋ねることが適切な単語である場合には、前記抽出された品詞が名詞の単語に対する詳細を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する名詞詳細質問応答生成手段と、
    を含む請求項1〜請求項7のいずれか1項記載の応答生成装置。
  9. 前記名詞詳細質問可能判断辞書に、品詞が名詞の単語と疑問詞との組合せのウェブ上での出現頻度が所定値以上の前記品詞が名詞の単語を、詳細を尋ねることが適切な単語として登録するか、または、前記品詞が名詞の単語と疑問詞との組合せのウェブ上での出現頻度が所定値より小さい前記品詞が名詞の単語を、詳細を尋ねることが不適切な単語として登録した請求項8記載の応答生成装置。
  10. 入力文の構造を解析した解析結果に基づいて、形容表現の単語または節を前記入力文から抽出する形容表現抽出手段と、
    前記形容表現抽出手段で抽出された形容表現の単語または節が、理由を尋ねることが適切な単語もしくは節、または不適切な単語もしくは節として形容表現理由質問可能判断辞書に登録されているか否かを判断し、理由を尋ねることが適切な単語または節である場合には、前記抽出された形容表現の単語または節に対する理由を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された形容表現の単語または節を付加した応答文候補を生成する形容表現質問応答生成手段と、
    を含む請求項1〜請求項9のいずれか1項記載の応答生成装置。
  11. 前記形容表現理由質問可能判断辞書に、シソーラス内の人の感情及び感覚に関する分類名が付されている単語を、理由を尋ねることが適切な単語として登録するか、または、前記シソーラス内の人の感情及び感覚に関する分類名が付されていない単語を、理由を尋ねることが不適切な単語として登録した請求項10記載の応答生成装置。
  12. コンピュータを、
    入力文の構造を解析した解析結果に基づいて、事態を表す単語を前記入力文から抽出する事態抽出手段と、
    前記事態抽出手段で抽出された事態を表す単語が、感情を尋ねることが適切な単語または不適切な単語として感情質問可能判断辞書に登録されているか否かを判断し、感情を尋ねることが適切な単語である場合には、前記抽出された事態を表す単語に対する感情を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す単語を付加した応答文候補を生成する感情質問応答生成手段と、
    して機能させるための応答生成プログラム。
  13. コンピュータを、
    入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、
    前記事態抽出手段で抽出された事態を表す節が、頻度を尋ねることが適切な節または不適切な節として頻度質問可能判断辞書に登録されているか否かを判断し、頻度を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する頻度を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する頻度質問応答生成手段と、
    して機能させるための応答生成プログラム。
  14. コンピュータを、
    入力文の構造を解析した解析結果に基づいて、事態を表す節を前記入力文から抽出する事態抽出手段と、
    前記事態抽出手段で抽出された事態を表す節が、並列する目的語を尋ねることが適切な節または不適切な節として並列目的語質問可能判断辞書に登録されているか否かを判断し、並列する目的語を尋ねることが適切な節である場合には、前記抽出された事態を表す節に対する並列する目的語を尋ねるための予め用意された応答文候補、または予め用意された応答文フォーマットに前記抽出された事態を表す節を付加した応答文候補を生成する並列目的語質問応答生成手段と、
    して機能させるための応答生成プログラム。
  15. コンピュータを、請求項1〜請求項11のいずれか1項記載の応答生成装置を構成する各手段として機能させるための応答生成プログラム。
JP2009068038A 2009-03-19 2009-03-19 応答生成装置及びプログラム Expired - Fee Related JP5212204B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009068038A JP5212204B2 (ja) 2009-03-19 2009-03-19 応答生成装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009068038A JP5212204B2 (ja) 2009-03-19 2009-03-19 応答生成装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2010224608A JP2010224608A (ja) 2010-10-07
JP5212204B2 true JP5212204B2 (ja) 2013-06-19

Family

ID=43041767

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009068038A Expired - Fee Related JP5212204B2 (ja) 2009-03-19 2009-03-19 応答生成装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5212204B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798140A (zh) * 2017-11-23 2018-03-13 北京神州泰岳软件股份有限公司 一种对话***构建方法、语义受控应答方法及装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6295869B2 (ja) * 2014-07-23 2018-03-20 トヨタ自動車株式会社 応答生成装置、応答生成方法及びプログラム
JP2016080981A (ja) * 2014-10-21 2016-05-16 トヨタ自動車株式会社 応答生成装置、応答生成方法及び応答生成プログラム
JP6287754B2 (ja) * 2014-10-21 2018-03-07 トヨタ自動車株式会社 応答生成装置、応答生成方法及び応答生成プログラム
CN108109616A (zh) 2016-11-25 2018-06-01 松下知识产权经营株式会社 信息处理方法、信息处理装置以及程序
US11526674B2 (en) * 2019-03-01 2022-12-13 Rakuten Group, Inc. Sentence extraction system, sentence extraction method, and information storage medium
CN111611364B (zh) * 2020-05-15 2023-08-15 北京百度网讯科技有限公司 一种智能应答方法、装置、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3533371B2 (ja) * 2000-12-01 2004-05-31 株式会社ナムコ 模擬会話システム、模擬会話方法、および情報記憶媒体
JP2004191407A (ja) * 2002-12-06 2004-07-08 Casio Comput Co Ltd 会話システム及び会話処理プログラム
JP3699098B2 (ja) * 2003-09-04 2005-09-28 コナミ株式会社 ゲームプログラム及びゲーム装置
JP4186992B2 (ja) * 2006-01-31 2008-11-26 株式会社豊田中央研究所 応答生成装置、方法及びプログラム
JP2009003811A (ja) * 2007-06-22 2009-01-08 Toyota Central R&D Labs Inc 属性判別装置、対話装置、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107798140A (zh) * 2017-11-23 2018-03-13 北京神州泰岳软件股份有限公司 一种对话***构建方法、语义受控应答方法及装置
CN107798140B (zh) * 2017-11-23 2020-07-03 中科鼎富(北京)科技发展有限公司 一种对话***构建方法、语义受控应答方法及装置

Also Published As

Publication number Publication date
JP2010224608A (ja) 2010-10-07

Similar Documents

Publication Publication Date Title
JP5212204B2 (ja) 応答生成装置及びプログラム
Valitutti et al. Developing affective lexical resources.
Harris et al. Perspective-shifting with appositives and expressives
Dahl Egocentricity in discourse and syntax
Zagal et al. Natural language processing in game studies research: An overview
JP6676109B2 (ja) 発話文生成装置とその方法とプログラム
JP2005174330A (ja) テキスト・ドキュメントから表出されたオピニオンの分析方法、システム及びプログラム
Emmerson Composing strategies and pedagogy
JP6239344B2 (ja) テキスト処理装置、テキスト処理方法およびプログラム
Millar et al. Adjectives, communities, and taxonomies of evaluative meaning
JP7381052B2 (ja) 問合せ対応支援装置、問合せ対応支援方法、プログラム及び記録媒体
JP7091146B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP5872183B2 (ja) 情報処理システム、嗜好可視化システム及び検閲システム並びに嗜好可視化方法
Strelluf needs+ PAST PARTICIPLE in regional Englishes on Twitter
Frisch The ethics of testimony: a genealogical perspective
Pereira et al. An augmentative and alternative communication synthetic corpus for brazilian portuguese
Brook Syntactic categories informing variationist analysis: The case of English copy-raising
Malheiro et al. Keyword-based Approach for Lyrics Emotion Variation Detection.
Salah et al. Analysing storytelling in design talk using LIWC (Linguistic Inquiry and Word Count)
Tucker A functional lexicogrammar of adjectives
Panesar An evaluation of a linguistically motivated conversational software agent framework
Haugland “Excited to see what great things this year will bring💃�”; an empirical study on emojis and discourse relations
KR102366964B1 (ko) 미술치료를 위한 그림검사 평가보고서 자동생성 시스템
SARAGIH . An Analysis of Word Formation Process on Covid–19 News in BBC News Online
Bagchi A cognitive semantic analysis of ‘eat’verb usages in Bangla

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20111031

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20111031

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130129

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130211

R151 Written notification of patent or utility model registration

Ref document number: 5212204

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees