JP2010157081A - 応答生成装置及びプログラム - Google Patents

応答生成装置及びプログラム Download PDF

Info

Publication number
JP2010157081A
JP2010157081A JP2008334824A JP2008334824A JP2010157081A JP 2010157081 A JP2010157081 A JP 2010157081A JP 2008334824 A JP2008334824 A JP 2008334824A JP 2008334824 A JP2008334824 A JP 2008334824A JP 2010157081 A JP2010157081 A JP 2010157081A
Authority
JP
Japan
Prior art keywords
sentence
input
response
user
input sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008334824A
Other languages
English (en)
Other versions
JP5195414B2 (ja
Inventor
Kazuya Shimooka
和也 下岡
Yusuke Nakano
雄介 中野
Katsuji Yamashita
勝司 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Toyota Central R&D Labs Inc
Original Assignee
Toyota Motor Corp
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp, Toyota Central R&D Labs Inc filed Critical Toyota Motor Corp
Priority to JP2008334824A priority Critical patent/JP5195414B2/ja
Publication of JP2010157081A publication Critical patent/JP2010157081A/ja
Application granted granted Critical
Publication of JP5195414B2 publication Critical patent/JP5195414B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

【課題】ユーザからの入力内容に対応した適切な応答文を生成して、自然な対話を行う。
【解決手段】マイク12から入力された第1のユーザ発話を音声認識し、音声認識された第1のユーザ発話に対して形態素解析を行った解析結果に基づいて、事態判別部22で、第1のユーザ発話に事態が含まれているか否かを判別し、事態が含まれている場合に、感情極性推定部24で、第1のユーザ発話が表す感情極性を推定し、質問生成部26で、ユーザに感情を尋ねる質問文を生成して出力する。感情極性抽出部28が、質問文に対する第2のユーザ発話の解析結果から感情極性を抽出し、極性一致判別部30が、推定された感情極性と抽出された感情極性とが一致するか否かを判別する。応答生成部32は、感情極性が一致する場合は、「同意」を示す応答文を生成し、一致しない場合は、「驚き」を示す応答文を生成、または相槌や促しの定型応答文から応答文を選択する。
【選択図】図1

Description

本発明は、応答生成装置及びプログラムに係り、特に、ユーザと円滑な対話を行うための応答生成装置及びプログラムに関する。
従来、入力されたユーザ発話から概念を抽出して、抽出した概念またはその関連語を用いた複数の応答文を生成し、予め定めた概念毎の「話題の豊富さ」及び「感情」に基づいて、生成された複数の応答文の中から優先度の高い応答文を決定して出力する応答生成装置が提案されている(例えば、特許文献1参照)。
特開2007−219149号公報
しかしながら、上記の特許文献1の応答生成装置では、ユーザ発話に含まれる概念またはその関連語を用いて応答文を生成するため、異なる意図をもって発話されたものであっても、発話内容が同じ場合には同じ応答文が生成されることになり、自然な対話を行うことができない場合がある、という問題がある。例えば、以下の対話例1及び対話例2について、特許文献1の応答生成装置では、ユーザ発話2の「楽しかったよ」に基づいて、対話例1及び対話例2のいずれの場合も、例えば「楽しかったんだぁ」のような応答文が生成されることになる。
(対話例1)
ユーザ発話1:遊園地に行ったよ。
システム応答:どうだった?
ユーザ発話2:楽しかったよ。
(対話例2)
ユーザ発話1:雨の中の運動会だったよ。
システム応答:どうだった?
ユーザ発話2:楽しかったよ。
本発明は、上記の問題を解決するためになされたものであり、ユーザからの入力内容に対応した適切な応答文を生成して、自然な対話を行うことができる応答生成装置及びプログラムを提供することを目的とする。
上記目的を達成するために、本発明に係る応答生成装置は、ユーザからの入力文を入力する入力手段と、質問文を出力する前に、前記入力手段によって入力された入力文を第1の入力文として、該第1の入力文の構造を解析した解析結果に基づいて、前記第1の入力文に事態を表す単語または単語と単語との組み合わせが含まれているか否かを判別する事態判別手段と、前記事態判別手段で前記第1の入力文に事態が含まれていると判別された場合に、前記ユーザに感情を尋ねるための予め用意された質問文を出力するように制御する第1の制御手段と、前記事態判別手段で前記第1の入力文に事態が含まれていると判別された場合に、前記第1の入力文の解析結果に基づいて、前記第1の入力文が表す感情極性を推定する推定手段と、前記第1の制御手段により制御されて出力された質問文に対して、前記ユーザから前記入力手段によって入力された入力文を第2の入力文として、該第2の入力文の構造を解析した解析結果から、前記第2の入力文の感情極性を抽出する抽出手段と、前記推定手段で推定された感情極性と、前記抽出手段で抽出された感情極性とが一致する場合には、予め用意された第1の応答文を生成して出力し、一致しない場合には、予め用意された第2の応答文を生成して出力するように制御する第2の制御手段とを含んで構成されている。
また、本発明に係る応答生成プログラムは、コンピュータを、質問文を出力する前に、ユーザからの入力文を入力する入力手段によって入力された入力文を第1の入力文として、該第1の入力文の構造を解析した解析結果に基づいて、前記第1の入力文に事態を表す単語または単語と単語との組み合わせが含まれているか否かを判別する事態判別手段と、前記事態判別手段で前記第1の入力文に事態が含まれていると判別された場合に、前記ユーザに感情を尋ねるための予め用意された質問文を出力するように制御する第1の制御手段と、前記事態判別手段で前記第1の入力文に事態が含まれていると判別された場合に、前記第1の入力文の解析結果に基づいて、前記第1の入力文が表す感情極性を推定する推定手段と、前記第1の制御手段により制御されて出力された質問文に対して、前記ユーザから前記入力手段によって入力された入力文を第2の入力文として、該第2の入力文の構造を解析した解析結果から、前記第2の入力文の感情極性を抽出する抽出手段と、前記推定手段で推定された感情極性と、前記抽出手段で抽出された感情極性とが一致する場合には、予め用意された第1の応答文を生成して出力し、一致しない場合には、予め用意された第2の応答文を生成して出力するように制御する第2の制御手段として機能させるためのプログラムである。
本発明に係る応答生成装置及びプログラムによれば、事態判別手段が、質問文を出力する前にユーザからの入力文を入力する入力手段によって入力された入力文を第1の入力文として、第1の入力文の構造を解析した解析結果に基づいて、第1の入力文に事態を表す単語または単語と単語との組み合わせが含まれているか否かを判別する。「事態」とは、何らかの感情が対応付けられる行動、事象、出来事をいう。
そして、第1の制御手段は、事態判別手段で第1の入力文に事態が含まれていると判別された場合に、ユーザに感情を尋ねるための予め用意された質問文を出力するように制御する。この質問文に対して、ユーザから入力手段によって入力された入力文を第2の入力文として、抽出手段が、第2の入力文の構造を解析した解析結果から、第2の入力文の感情極性を抽出する。また、推定手段は、事態判別手段で第1の入力文に事態が含まれていると判別された場合に、第1の入力文の解析結果に基づいて、第1の入力文が表す感情極性を推定する。そして、第2の制御手段が、推定手段で推定された感情極性と、抽出手段で抽出された感情極性とが一致する場合には、予め用意された第1の応答文を生成して出力し、一致しない場合には、予め用意された第2の応答文を生成して出力するように制御する。
このように、第1の入力文から推定される感情極性と、第2の入力文から抽出される感情極性とが一致するか否かによって応答文を異ならせることができるため、ユーザからの入力内容に対応した適切な応答文を生成して、自然な対話を行うことができる。
また、前記第1の応答文を、前記第2の入力文に対して同意を示す応答文とし、前記第2の応答文を、前記第2の入力文に対して驚きを示す応答文、前記ユーザに入力文の入力を促す応答文、または相槌の応答文とすることができる。このように、第1の入力文から推定される感情極性と、第2の入力文から抽出される感情極性とが一致する場合には、同意を示す応答文を出力し、感情極性が一致しない場合には、驚きを示す応答文を出力することにより自然な対話を行うことができる。また、感情極性が一致しない場合には、例えば、音声認識の誤認識やユーザによる入力文の入力ミスがあった可能性があるものと想定して、誤認識の可能性のある解析結果に基づいた応答文を生成するのではなく、ユーザに入力文の入力を促す応答文または相槌の応答文を出力することにより、対話を破綻させることなく進行させることができる。
また、本発明の応答生成装置は、前記事態判別手段で前記第1の入力文に事態が含まれていないと判別された場合に、ユーザに入力文の入力を促す応答文、または相槌の応答文を出力するように制御する第3の制御手段を含んで構成することができる。第1の入力文に事態が含まれていない場合には、感情極性を推定することができないため、ユーザに入力文の入力を促す応答文、または相槌の応答文を出力することにより、対話を破綻させることなく進行させることができる。
以上説明したように、本発明の応答生成装置及びプログラムによれば、ユーザからの入力内容に対応した適切な応答文を生成して、自然な対話を行うことができる、という効果が得られる。
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態では、ユーザからの発話を入力として、所定の処理を実行して音声出力する応答生成装置に本発明を適用した場合について説明する。
図1に示すように、第1の実施の形態に係る応答生成装置10は、ユーザ発話を集音して音声信号を生成するマイク12と、音声出力を行うスピーカ14と、マイク12及びスピーカ14に接続され、かつ、適切な応答文を生成する所定の処理を実行するコンピュータ16とを備えている。
コンピュータ16は、応答生成装置10全体の制御を司るCPU、後述する応答生成プログラム等各種プログラムを記憶した記憶媒体としてのROM、ワークエリアとしてデータを一時格納するRAM、各種情報が記憶された記憶手段としてのHDD、I/O(入出力)ポート、及びこれらを接続するバスを含んで構成されている。I/Oポートには、マイク12及びスピーカ14が接続されている。
また、このコンピュータ16を、ハードウエアとソフトウエアとに基づいて定まる機能実現手段毎に分割した機能ブロックで説明すると、図1に示すように、マイク12から入力された音声信号を音声認識して、一般的な形態素解析器を用いて音声認識されたユーザ発話を示す文字列情報に対して形態素解析を行う言語解析部20、言語解析部20による解析結果に基づいて、ユーザ発話に事態が含まれているか否かを判別する事態判別部22、ユーザ発話に事態が含まれている場合に、ユーザ発話が表す感情極性を推定する感情極性推定部24、ユーザ発話に事態が含まれている場合に、ユーザに感情を尋ねる質問文を生成する質問生成部26、質問文に対するユーザ発話を言語解析部20で解析した解析結果から感情極性を抽出する感情極性抽出部28、感情極性推定部24で推定された感情極性と感情極性抽出部28で抽出された感情極性とが一致するか否かを判別する極性一致判別部30、極性一致判別部30の判別結果に基づいて、異なる応答文を生成する応答生成部32、ユーザ発話に事態が含まれていない場合に、定型の応答文を選択する定型応答部34、質問生成部26、応答生成部32、及び定型応答部34で生成または選択された応答文を音声信号に変換してスピーカ14から出力させる出力部36を含んだ構成で表すことができる。
ここで、本実施の形態では、後述するように、質問文の出力前に入力されたユーザ発話と出力後に入力されたユーザ発話とを区別する必要があるため、前者を「第1のユーザ発話」、後者を「第2のユーザ発話」と称する。
事態判別部22は、第1のユーザ発話に対する言語解析部20での解析結果に、事態を示す単語、または単語と単語との組み合わせが含まれているか否かを判別する。「事態」とは、何らかの感情が対応付けられる行動、事象、出来事であり、ここでは、解析結果に(i)「動詞」が含まれている場合、及び(ii)「事態性名詞+”だ”」が含まれている場合に「事態」が含まれていると判別する。「事態性名詞」とは、例えば「雨」や「運動会」といった出来事を示す名詞である。事態性名詞は、図2に示すような事態性名詞辞書を予め作成しておき、判別の際に、この事態性名詞辞書を参照して判別する。
感情極性推定部24は、事態判別部22で、第1のユーザ発話に事態が含まれていると判別された場合に、第1のユーザ発話が表す感情極性がポジティブかネガティブかを推定する。感情極性の推定は、例えば、感情極性が既知の学習データをSVM(Support Vecter Machine)の手法を用いて学習して感情極性モデルを構築し、この感情極性モデルと第1のユーザ発話の解析結果とを比較することにより行う。
質問生成部26は、事態判別部22で、第1のユーザ発話に事態が含まれていると判別された場合に、ユーザに感情を尋ねる質問文を生成する。質問文は、基本となる質問文、例えば、「どう思う?」や「どんな感じ?」といった文を予め作成しておき、ユーザ発話の解析結果に基づいて、この基本となる質問文から選択した1つの文の時制や表現(丁寧な表現か砕けた表現かなど)を修正して、質問文を生成する。また、図3に示すような質問文例を予め作成しておき、この中からランダムに選択するようにしてもよい。生成された質問文は、出力部36で音声信号に変換されてスピーカ14から出力される。
感情極性抽出部28は、質問生成部26で生成された質問文が出力された後に入力された第2のユーザ発話を言語解析部20で解析した解析結果から感情極性を抽出する。質問生成部26で生成された質問文は、ユーザの感情を尋ねる質問文であるため、ここで入力される第2のユーザ発話には、直接的に感情を表す単語が含まれていると考えられる。そこで、第2のユーザ発話に含まれる感情を表す単語について、図4に示すような感情極性辞書を参照して、感情極性を抽出する。感情極性辞書は、非特許文献「スピンモデルによる単語の感情極性抽出」(高村他、情報処理学会論文誌ジャーナルvol47、No.2、pp.627−637、2006)に記載の手法を用いるなどして、予め作成しておく。
応答生成部32は、極性一致判別部30で、感情極性推定部24で推定された感情極性と感情極性抽出部28で抽出された感情極性とが一致すると判別された場合には、「同意」のニュアンスを含んだ応答文を生成し、一致しないと判別された場合には、「驚き」のニュアンスを含んだ応答文を生成する。生成された応答文は、出力部36で音声信号に変換されてスピーカ14から出力される。
「同意」のニュアンスを含んだ応答文は、例えば、図5に示すような応答文例及び応答文例フォーマットを予め用意しておき、この応答文例からランダムに選択したり、応答文例フォーマットを用いて生成したりする。応答文例フォーマットは、例えば、「やっぱり(ユーザの感情)だよねぇ」のようなフォーマットとすることができ、「(ユーザの感情)」の部分に、第2のユーザ発話から抽出した感情を表す単語を挿入して応答文を生成することができる。
「驚き」のニュアンスを含んだ応答文は、例えば、図6に示すような応答文例及び応答文例フォーマットを予め用意しておき、この応答文例からランダムに選択したり、応答文例フォーマットを用いて生成したりする。応答文例フォーマットは、例えば、「え?(ユーザの感情)の」のようなフォーマットとすることができ、「(ユーザの感情)」の部分に、第2のユーザ発話から抽出した感情を表す単語を挿入して応答文を生成することができる。また、このように選択及び生成した応答文に、さらに理由を尋ねる応答文、例えば「なんで(ユーザの感情)の?」のような応答文を組み合わせてもよい。
定型応答部34は、事態判別部22で、第1のユーザ発話に事態が含まれていないと判別された場合に、予め定めた定型応答文からランダムに定型応答文を選択する。選択した定型応答文は、出力部36で音声信号に変換されてスピーカ14から出力される。定型応答文は、例えば、図7に示すように、ユーザへ発話を促すような応答文や相槌の応答文を予め定めておく。
次に、図8を参照して、第1の実施の形態の応答生成装置10における応答生成処理ルーチンについて説明する。本ルーチンは、ROMに記憶された応答生成プログラムをCPUが実行することにより行われる。
ステップ100で、マイク12から第1のユーザ発話が入力されたか否かを判断し、第1のユーザ発話が入力された場合には、ステップ102へ進み、入力されない場合には、入力されるまで本ステップの判断を繰り返す。ここでは、第1のユーザ発話「雨の中の運動会だったよ」が入力されたものとする。
ステップ102で、入力された第1のユーザ発話を示す音声信号を音声認識して文字列情報とし、この文字列情報に対して形態素解析を行う。
次に、ステップ104で、形態素解析の解析結果に基づいて、第1のユーザ発話に「事態」が含まれているか否かを判別する。「事態」が含まれている場合には、ステップ106へ進み、含まれていない場合には、ステップ122へ進む。ここでは、図2に示す事態性名詞辞書に事態性名詞として定められている「運動会」、及び事態性名詞に続く「だ」が含まれており、(ii)「事態性名詞+”だ”」の条件を満たすため、「事態」が含まれていると判別されてステップ106へ進む。
ステップ106で、解析結果及び予め定めた感情極性モデルに基づいて、第1のユーザ発話の感情極性を推定する。ここでは、感情極性が「ネガティブ」と推定されるものとする。
次に、ステップ108で、ユーザに感情を尋ねるための応答文を生成して、音声信号に変換して出力する。ここでは、図3に示す質問文例の中から、「どう思った?」を選択して出力するものとする。
次に、ステップ110で、マイク12から第2のユーザ発話が入力されたか否かを判断し、ユーザ発話が入力された場合には、ステップ112へ進み、入力されたユーザ発話を示す音声信号を音声認識して文字列情報とし、この文字列情報に対して形態素解析を行う。入力されない場合には、入力されるまで本ステップの判断を繰り返す。ここでは、第2のユーザ発話「楽しかったよ」が入力されたものとする。
次に、ステップ114で、解析結果及び図4に示す感情極性辞書に基づいて、第2のユーザ発話が表す感情極性を抽出する。ここでは、感情極性辞書を参照して、解析結果に含まれる「楽しかった」から感情極性「ポジティブ」が抽出される。
次に、ステップ116で、上記ステップ106で推定された感情極性と、上記ステップ114で抽出された感情極性とが一致するか否かを判断する。一致する場合は、ステップ118へ進み、一致しない場合には、ステップ120へ進む。ここでは、上記ステップ106で推定された感情極性は「ネガティブ」、上記ステップ114で抽出された感情極性は「ポジティブ」で一致しないため、否定されてステップ120へ進む。
ステップ120で、「驚き」のニュアンスを含んだ応答文を生成する。例えば、図6に示す応答文例及び応答文例フォーマットから応答文例フォーマット「え?(ユーザの感情)の」を選択し、「(ユーザの感情)」の部分に、第2のユーザ発話から抽出した感情を表す単語を挿入して「え?楽しかったの?」のような応答文を生成する。
また、上記ステップ110で、第2のユーザ発話「悲惨だったよ」が入力された場合には、上記ステップ112での解析結果及び感情極性辞書に基づいて、感情極性「ネガティブ」が抽出され、上記ステップ116で、感情極性が一致すると判断されてステップ118へ進む。ステップ118では、「同意」のニュアンスを含んだ応答文を生成する。例えば、図6に示す応答文例及び応答文例フォーマットから応答文例「そりゃそうだよね」を選択する。
また、例えば、第1のユーザ発話が「机だ」であった場合には、上記ステップ104で、第1のユーザ発話に「事態」が含まれていないと判別されてステップ122へ進む。ステップ122で、図7に示す定型応答文例から、例えば、「へー、それで」を選択する。
次に、ステップ124で、上記ステップ118、ステップ120、及びステップ122で生成または選択された応答文を音声信号に変換して出力して、処理を終了する。
なお、上記ステップ110で入力されたと判断されるユーザ発話は、上記ステップ108で質問文が出力された後に入力されるユーザ発話であるため、第2のユーザ発話としているが、ここでのユーザ発話が必ずしも感情を含んだものであるとは限らない。そこで、上記ステップ114で、第2のユーザ発話から感情極性を抽出することができない場合には、この第2のユーザ発話を第1のユーザ発話とみなしてステップ100へ戻ったり、ステップ122へ進んで定型の応答文を選択して出力したりするようにしてもよい。
以上説明したように、第1の実施の形態の応答生成装置によれば、第1のユーザ発話から感情極性を推定し、推定した感情極性と第2のユーザ発話から抽出した感情極性とが一致するか否かを判別するため、第2のユーザ発話が同じ内容であったとしても、感情極性が一致する場合には、「同意」を示す応答文が生成され、一致しない場合には、「驚き」を示す応答文が生成される。すなわち、第1のユーザ発話が表す感情極性を推定しておくことにより、第2のユーザ発話の内容が予想通りだった場合と、予想に反する場合とで応答を異ならせることができるため、自然な対話を行うことができる。
なお、第1の実施の形態では、第1のユーザ発話が表す感情極性を、予め学習データから生成した感情極性モデルと比較することにより推定する場合について説明したが、この手法に限定するものではない。例えば、単語毎に感情極性を定めた単語−感情極性辞書を予め作成しておき、第1のユーザ発話に含まれる単語の各々についてこの単語−感情極性辞書を参照して感情極性を得て、第1のユーザ発話中に含まれる感情極性が「ポジティブ」である単語の数、感情極性が「ネガティブ」である単語の数、及び否定表現があるか否か等に基づいて定めたルールに従って、感情極性を推定するようにしてもよい。また、第1のユーザ発話から直接感情極性を推定する場合に限らず、第1のユーザ発話が表す感情を推定して、推定した感情及び図4に示す感情極性辞書を参照して感情極性を推定するようにしてもよい。なお、感情の推定は、感情極性の推定の場合と同様、予め学習データから感情毎に生成した複数の感情モデルと比較することにより推定するなど、周知の技術を用いることができる。
次に、第2の実施の形態について説明する。第2の実施の形態では、第1のユーザ発話と第2のユーザ発話との感情極性が一致しなかった場合に、「驚き」を示す応答文を生成するのではなく、定型の応答文を選択する点が第1の実施の形態と異なっている。なお、第1の実施の形態と同様の構成及び処理については、同一の符号を付して説明を省略する。
第2の実施の形態に係る応答生成装置210の構成は、図1に示す第1の実施の形態に係る応答生成装置10の構成と同様である。第2の実施の形態の応答生成装置210において、応答生成部132は、極性一致判別部30で、感情極性推定部24で推定された感情極性と感情極性抽出部28で抽出された感情極性とが一致すると判別された場合には、「同意」のニュアンスを含んだ応答文を生成し、一致しないと判別された場合には、定型の応答文を選択する。生成または選択された応答文は、出力部36で音声信号に変換されてスピーカ14から出力される。「同意」のニュアンスを含んだ応答文の生成については、第1の実施の形態と同様であり、定型の応答文の選択については、第1の実施の形態の定型応答部34の処理と同様に、例えば、図7に示すような定型応答文例の中からランダムに応答文を選択する。
次に、図9を参照して、第2の実施の形態の応答生成装置210における応答生成処理ルーチンについて説明する。本ルーチンは、ROMに記憶された応答生成プログラムをCPUが実行することにより行われる。
ステップ100で、マイク12から第1のユーザ発話が入力されたか否かを判断し、第1のユーザ発話が入力された場合には、ステップ102へ進み、入力された第1のユーザ発話を示す音声信号を音声認識して文字列情報とし、この文字列情報に対して形態素解析を行う。入力されない場合には、入力されるまで本ステップの判断を繰り返す。ここでは、第1のユーザ発話「遊園地に行ったよ」が入力されたものとする。
次に、ステップ104で、形態素解析の解析結果に基づいて、第1のユーザ発話に「事態」が含まれているか否かを判別する。「事態」が含まれている場合には、ステップ106へ進み、含まれていない場合には、ステップ122へ進む。ここでは、動詞「行く」が含まれているため、「事態」が含まれていると判別されてステップ106へ進む。
ステップ106で、解析結果及び予め定めた感情極性モデルに基づいて、第1のユーザ発話の感情極性を推定する。ここでは、感情極性が「ポジティブ」と推定されるものとする。次に、ステップ108で、ユーザに感情を尋ねるための応答文、例えば、図3に示す質問文例の中から、「どうだった?」を選択して出力する。
次に、ステップ110で、マイク12から第2のユーザ発話が入力されたか否かを判断し、第2のユーザ発話が入力された場合には、ステップ112へ進み、入力された第2のユーザ発話を示す音声信号を音声認識して文字列情報とし、この文字列情報に対して形態素解析を行う。入力されない場合には、入力されるまで本ステップの判断を繰り返す。ここでは、第2のユーザ発話「楽しかったよ」が入力され、音声認識において「悲しかったよ」と誤認識されたものとする。
次に、ステップ114で、解析結果及び図4に示す感情極性辞書に基づいて、第2のユーザ発話の感情極性を抽出する。ここでは、誤認識された解析結果「悲しかったよ」に基づいて、感情極性辞書を参照して、感情極性「ネガティブ」が抽出される。
次に、ステップ116で、上記ステップ106で推定された感情極性と、上記ステップ114で抽出された感情極性とが一致するか否かを判断する。一致する場合は、ステップ118へ進み、一致しない場合には、音声認識を含む第1のユーザ発話の解析結果に誤りがあったものと想定して、ステップ122へ進む。ここでは、上記ステップ106で推定された感情極性は「ポジティブ」、上記ステップ114で抽出された感情極性は「ネガティブ」で一致しないため、否定されてステップ122へ進む。
ステップ122で、図7に示す定型応答文例から、例えば、「そうですかぁ」を選択し、次に、ステップ124で、選択した応答文を音声信号に変換して出力して、処理を終了する。
以上説明したように、第2の実施の形態の応答生成装置によれば、第1のユーザ発話が表す感情極性を推定し、推定した感情極性と第2のユーザ発話から抽出した感情極性とが一致するか否かを判別し、一致しない場合には、例えば音声認識に誤りがあったものと想定して、相槌の応答文やユーザ発話を促すような応答文などの定型の応答文を出力することができる。これにより、誤認識された解析結果に基づいて不適切な応答文を生成することを防止し、対話を破綻なく進行させることができる。
なお、上記第1及び第2の実施の形態では、スピーカによる音声出力を行う場合を例に説明したが、これに限定されるものではなく、ディスプレイに応答文を表示するようにしてもよい。また、ユーザから音声がマイクに入力される場合を例に説明したが、ユーザがキーボードなどを用いて入力文としてのテキストを入力するようにしてもよい。
本実施の形態に係る応答生成装置の概略構成を示すブロック図である。 事態性名詞辞書の一例を示す図である。 質問文例の一例を示す図である。 感情極性辞書の一例を示す図である。 「同意」を示す応答文の応答文例及び応答文例フォーマットの一例を示す図である。 「驚き」を示す応答文の応答文例及び応答文例フォーマットの一例を示す図である。 定型の応答文の応答文例の一例を示す図である。 第1の実施の形態の応答生成処理ルーチンを示すフローチャートである。 第2の実施の形態の応答生成処理ルーチンを示すフローチャートである。
符号の説明
10、210 応答生成装置
12 マイク
14 スピーカ
16 コンピュータ
20 言語解析部
22 事態判別部
24 感情極性推定部
26 質問生成部
28 感情極性抽出部
30 極性一致判別部
32、132 応答生成部
34 定型応答部
36 出力部

Claims (4)

  1. ユーザからの入力文を入力する入力手段と、
    質問文を出力する前に、前記入力手段によって入力された入力文を第1の入力文として、該第1の入力文の構造を解析した解析結果に基づいて、前記第1の入力文に事態を表す単語または単語と単語との組み合わせが含まれているか否かを判別する事態判別手段と、
    前記事態判別手段で前記第1の入力文に事態が含まれていると判別された場合に、前記ユーザに感情を尋ねるための予め用意された質問文を出力するように制御する第1の制御手段と、
    前記事態判別手段で前記第1の入力文に事態が含まれていると判別された場合に、前記第1の入力文の解析結果に基づいて、前記第1の入力文が表す感情極性を推定する推定手段と、
    前記第1の制御手段により制御されて出力された質問文に対して、前記ユーザから前記入力手段によって入力された入力文を第2の入力文として、該第2の入力文の構造を解析した解析結果から、前記第2の入力文の感情極性を抽出する抽出手段と、
    前記推定手段で推定された感情極性と、前記抽出手段で抽出された感情極性とが一致する場合には、予め用意された第1の応答文を生成して出力し、一致しない場合には、予め用意された第2の応答文を生成して出力するように制御する第2の制御手段と、
    を含む応答生成装置。
  2. 前記第1の応答文を、前記第2の入力文に対して同意を示す応答文とし、前記第2の応答文を、前記第2の入力文に対して驚きを示す応答文、前記ユーザに入力文の入力を促す応答文、または相槌の応答文とした請求項1記載の応答生成装置。
  3. 前記事態判別手段で前記第1の入力文に事態が含まれていないと判別された場合に、ユーザに入力文の入力を促す応答文、または相槌の応答文を出力するように制御する第3の制御手段を含む請求項1または請求項2記載の応答生成装置。
  4. コンピュータを、
    質問文を出力する前に、ユーザからの入力文を入力する入力手段によって入力された入力文を第1の入力文として、該第1の入力文の構造を解析した解析結果に基づいて、前記第1の入力文に事態を表す単語または単語と単語との組み合わせが含まれているか否かを判別する事態判別手段と、
    前記事態判別手段で前記第1の入力文に事態が含まれていると判別された場合に、前記ユーザに感情を尋ねるための予め用意された質問文を出力するように制御する第1の制御手段と、
    前記事態判別手段で前記第1の入力文に事態が含まれていると判別された場合に、前記第1の入力文の解析結果に基づいて、前記第1の入力文が表す感情極性を推定する推定手段と、
    前記第1の制御手段により制御されて出力された質問文に対して、前記ユーザから前記入力手段によって入力された入力文を第2の入力文として、該第2の入力文の構造を解析した解析結果から、前記第2の入力文の感情極性を抽出する抽出手段と、
    前記推定手段で推定された感情極性と、前記抽出手段で抽出された感情極性とが一致する場合には、予め用意された第1の応答文を生成して出力し、一致しない場合には、予め用意された第2の応答文を生成して出力するように制御する第2の制御手段と、
    して機能させるための応答生成プログラム。
JP2008334824A 2008-12-26 2008-12-26 応答生成装置及びプログラム Expired - Fee Related JP5195414B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008334824A JP5195414B2 (ja) 2008-12-26 2008-12-26 応答生成装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008334824A JP5195414B2 (ja) 2008-12-26 2008-12-26 応答生成装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2010157081A true JP2010157081A (ja) 2010-07-15
JP5195414B2 JP5195414B2 (ja) 2013-05-08

Family

ID=42574977

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008334824A Expired - Fee Related JP5195414B2 (ja) 2008-12-26 2008-12-26 応答生成装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5195414B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014115952A1 (ko) * 2013-01-25 2014-07-31 포항공과대학교 산학협력단 유머 발화를 이용하는 음성 대화 시스템 및 그 방법
JP2015110096A (ja) * 2009-07-10 2015-06-18 株式会社三洋物産 遊技機
JP2015148712A (ja) * 2014-02-06 2015-08-20 トヨタ自動車株式会社 音声対話装置、音声対話システム及びプログラム
JP2016024384A (ja) * 2014-07-23 2016-02-08 トヨタ自動車株式会社 応答生成装置、応答生成方法及びプログラム
EP2988298A1 (en) 2014-08-21 2016-02-24 Toyota Jidosha Kabushiki Kaisha Response generation method, response generation apparatus, and response generation program
JP2016080981A (ja) * 2014-10-21 2016-05-16 トヨタ自動車株式会社 応答生成装置、応答生成方法及び応答生成プログラム
JP2016085478A (ja) * 2016-02-12 2016-05-19 シャープ株式会社 対話型家電システム、サーバ装置、対話型家電機器、家電システムが対話を行なうための方法、当該方法をコンピュータに実現させるためのプログラム
JP2017037601A (ja) * 2015-08-14 2017-02-16 Psソリューションズ株式会社 対話インターフェース
JP2017091570A (ja) * 2017-01-19 2017-05-25 Psソリューションズ株式会社 対話インターフェース
WO2018034169A1 (ja) * 2016-08-17 2018-02-22 ソニー株式会社 対話制御装置および方法
JP2018160248A (ja) * 2018-05-01 2018-10-11 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム
US10224060B2 (en) 2014-03-25 2019-03-05 Sharp Kabushiki Kaisha Interactive home-appliance system, server device, interactive home appliance, method for allowing home-appliance system to interact, and nonvolatile computer-readable data recording medium encoded with program for allowing computer to implement the method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006178063A (ja) * 2004-12-21 2006-07-06 Toyota Central Res & Dev Lab Inc 対話処理装置
JP2006201870A (ja) * 2005-01-18 2006-08-03 Toyota Central Res & Dev Lab Inc 対話処理装置
JP2007219149A (ja) * 2006-02-16 2007-08-30 Toyota Central Res & Dev Lab Inc 応答生成装置、方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006178063A (ja) * 2004-12-21 2006-07-06 Toyota Central Res & Dev Lab Inc 対話処理装置
JP2006201870A (ja) * 2005-01-18 2006-08-03 Toyota Central Res & Dev Lab Inc 対話処理装置
JP2007219149A (ja) * 2006-02-16 2007-08-30 Toyota Central Res & Dev Lab Inc 応答生成装置、方法及びプログラム

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015110096A (ja) * 2009-07-10 2015-06-18 株式会社三洋物産 遊技機
WO2014115952A1 (ko) * 2013-01-25 2014-07-31 포항공과대학교 산학협력단 유머 발화를 이용하는 음성 대화 시스템 및 그 방법
JP2015148712A (ja) * 2014-02-06 2015-08-20 トヨタ自動車株式会社 音声対話装置、音声対話システム及びプログラム
US10224060B2 (en) 2014-03-25 2019-03-05 Sharp Kabushiki Kaisha Interactive home-appliance system, server device, interactive home appliance, method for allowing home-appliance system to interact, and nonvolatile computer-readable data recording medium encoded with program for allowing computer to implement the method
JP2016024384A (ja) * 2014-07-23 2016-02-08 トヨタ自動車株式会社 応答生成装置、応答生成方法及びプログラム
US9653078B2 (en) 2014-08-21 2017-05-16 Toyota Jidosha Kabushiki Kaisha Response generation method, response generation apparatus, and response generation program
EP2988298A1 (en) 2014-08-21 2016-02-24 Toyota Jidosha Kabushiki Kaisha Response generation method, response generation apparatus, and response generation program
JP2016045655A (ja) * 2014-08-21 2016-04-04 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム
JP2016080981A (ja) * 2014-10-21 2016-05-16 トヨタ自動車株式会社 応答生成装置、応答生成方法及び応答生成プログラム
JP2017037601A (ja) * 2015-08-14 2017-02-16 Psソリューションズ株式会社 対話インターフェース
JP2016085478A (ja) * 2016-02-12 2016-05-19 シャープ株式会社 対話型家電システム、サーバ装置、対話型家電機器、家電システムが対話を行なうための方法、当該方法をコンピュータに実現させるためのプログラム
WO2018034169A1 (ja) * 2016-08-17 2018-02-22 ソニー株式会社 対話制御装置および方法
JPWO2018034169A1 (ja) * 2016-08-17 2019-06-13 ソニー株式会社 対話制御装置および方法
US11183170B2 (en) 2016-08-17 2021-11-23 Sony Corporation Interaction control apparatus and method
JP7036015B2 (ja) 2016-08-17 2022-03-15 ソニーグループ株式会社 対話制御装置および方法
JP2017091570A (ja) * 2017-01-19 2017-05-25 Psソリューションズ株式会社 対話インターフェース
JP2018160248A (ja) * 2018-05-01 2018-10-11 トヨタ自動車株式会社 応答生成方法、応答生成装置及び応答生成プログラム

Also Published As

Publication number Publication date
JP5195414B2 (ja) 2013-05-08

Similar Documents

Publication Publication Date Title
JP5195414B2 (ja) 応答生成装置及びプログラム
US10460034B2 (en) Intention inference system and intention inference method
EP3489950B1 (en) Response sentence generation apparatus, method and program
JP6172417B1 (ja) 語学学習システム及び語学学習プログラム
JP4729902B2 (ja) 音声対話システム
JP2010020390A (ja) 感情推定装置及び感情推定プログラム
JP2007140200A (ja) 語学学習装置およびプログラム
WO2011033834A1 (ja) 音声翻訳システム、音声翻訳方法および記録媒体
WO2022057283A1 (zh) 声纹注册方法、装置和计算机可读存储介质
JP6390264B2 (ja) 応答生成方法、応答生成装置及び応答生成プログラム
KR20160061071A (ko) 발음 변이를 적용시킨 음성 인식 방법
JP5136512B2 (ja) 応答生成装置及びプログラム
JP2008276543A (ja) 対話処理装置、応答文生成方法、及び応答文生成処理プログラム
JP2010224153A (ja) 音声対話装置及びプログラム
JP2006259641A (ja) 音声認識装置及び音声認識用プログラム
JP2014048443A (ja) 音声合成システム、音声合成方法及び音声合成プログラム
KR20190140803A (ko) 감정 임베딩과 순환형 신경망을 이용한 대화 시스템 및 방법
JP2016024384A (ja) 応答生成装置、応答生成方法及びプログラム
JP2008293098A (ja) 応答スコア情報生成装置、対話処理装置
JPH117292A (ja) 音声認識装置
JP2015102914A (ja) 不理解文判定モデル学習方法、不理解文判定方法、装置、及びプログラム
JP6176137B2 (ja) 音声対話装置、音声対話システム及びプログラム
JP2009198871A (ja) 音声対話装置
JP2003162524A (ja) 言語処理装置
JP2005128130A (ja) 音声認識装置、音声認識方法及びプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20110719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110719

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160215

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5195414

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160215

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees