JP2010152119A - 応答生成装置及びプログラム - Google Patents

応答生成装置及びプログラム Download PDF

Info

Publication number
JP2010152119A
JP2010152119A JP2008330639A JP2008330639A JP2010152119A JP 2010152119 A JP2010152119 A JP 2010152119A JP 2008330639 A JP2008330639 A JP 2008330639A JP 2008330639 A JP2008330639 A JP 2008330639A JP 2010152119 A JP2010152119 A JP 2010152119A
Authority
JP
Japan
Prior art keywords
response
sentence
input
output
intention
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008330639A
Other languages
English (en)
Other versions
JP5195405B2 (ja
Inventor
Takakatsu Yoshimura
貴克 吉村
Kazuya Shimooka
和也 下岡
Hiroyuki Hoshino
博之 星野
Ryoko Hotta
良子 堀田
Yusuke Nakano
雄介 中野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toyota Motor Corp
Toyota Central R&D Labs Inc
Original Assignee
Toyota Motor Corp
Toyota Central R&D Labs Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toyota Motor Corp, Toyota Central R&D Labs Inc filed Critical Toyota Motor Corp
Priority to JP2008330639A priority Critical patent/JP5195405B2/ja
Publication of JP2010152119A publication Critical patent/JP2010152119A/ja
Application granted granted Critical
Publication of JP5195405B2 publication Critical patent/JP5195405B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】ユーザが自発的に、または装置からの応答文に応答して入力文を入力しようとしている場合に、装置からの応答文の出力により入力が妨げられないように、適切なタイミングで応答文を出力する。
【解決手段】言語解析部20で、マイク12から入力された音声信号を音声認識して形態素解析を行い、意図推定部22で、解析結果に基づいて、ユーザ発話の意図を推定し、応答候補生成部124で、推定された発話意図に対応付けられた応答候補タイプに基づいて応答文候補を生成し、出力タイミング計測部26及び発話待ち時間計測部126で、発話意図と応答候補タイプとの組み合わせ毎に定められた待ち時間が経過したか否かを計測し、ユーザからの次発話が入力されることなく待ち時間を経過した場合には、応答文の出力タイミングになったと判断して、出力部28で、生成された応答文候補を音声信号に変換してスピーカ14から出力させる。
【選択図】図9

Description

本発明は、応答生成装置及びプログラムに係り、特に、適切なタイミングで応答文の出力を行う応答生成装置及びプログラムに関する。
従来、適切なタイミングで応答する音声対話装置として、入力された音声の情報としての話速を算出し、また、入力された音声から単語列を抽出して、抽出した単語列の出現確率から後続して入力される単語列を予測し、算出した話速に基づいて、予測した後続して入力される単語列が入力されるまでの後続入力時間を予測し、後続入力時間に基づいて応答文の出力タイミングを決定する音声対話装置が提案されている(例えば、特許文献1参照)。また、この音声対話装置では、入力された音声の情報として、発話長、基本周波数、形態素数、品詞列などの情報を用いてもよいことが記載されている。
また、入力された音声に対応する文章データに所定回数以上出現した単語が存在しない場合には、一区切りの音声入力毎に相槌の応答文を出力し、所定回数以上出現した単語が存在する場合には、同様に相槌を出力すると共に、該単語をキーワードとして関連する内容を検索し、検索された内容に基づく応答文を出力する対話装置が提案されている(例えば、特許文献2参照)。
特開2008−241890号公報 特開2007−328283号公報
しかしながら、上記の特許文献1の音声対話装置では、入力された音声の情報に基づいて応答文の出力タイミングを決定しているため、出力する応答文が異なる場合であっても、音声入力直後などの同じタイミングで出力されてしまい、ユーザが自発的に次の音声入力を行おうとしているにもかかわらず、装置からの応答文が出力されてしまう場合がある、という問題がある。
また、上記特許文献2の対話装置では、所定回数以上出現した単語が存在する場合には、相槌を出力した後に検索された内容に基づく応答文を出力しているが、先に出力する応答文が相槌以外の場合には、ユーザが先に出力された応答文に対して応答するために次の音声入力を行おうとしているにもかかわらず、装置からの応答文が出力されてしまう場合がある、という問題がある。
本発明は、上記の問題を解決するためになされたものであり、ユーザが自発的に、または装置からの応答文に応答して入力文を入力しようとしている場合に、装置からの応答文の出力により入力が妨げられないように、適切なタイミングで応答文の出力をすることができる応答生成装置及びプログラムを提供することを目的とする。
上記目的を達成するために、第1の発明の応答生成装置は、ユーザからの入力文を入力する入力手段と、前記入力手段によって入力された前記入力文の構造を解析した解析結果から、前記入力文が表す意図を推定する意図推定手段と、前記意図推定手段で推定された前記入力文が表す意図に応じた応答文を少なくとも1つ以上生成する応答生成手段と、前記意図推定手段で推定された意図と前記応答生成手段で生成した応答文との組み合わせにより定まる待ち時間が経過した後に、前記応答生成手段で生成した応答文を出力すると共に、前記待ち時間が経過する前に前記入力手段によって次の入力文が入力された場合には、前記応答生成手段で生成した応答文を出力しないように制御する制御手段とを含んで構成されている。
また、第2の発明の応答生成プログラムは、コンピュータを、ユーザからの入力文を入力する入力手段によって入力された前記入力文の構造を解析した解析結果から、前記入力文が表す意図を推定する意図推定手段と、前記意図推定手段で推定された前記入力文が表す意図に応じた応答文を少なくとも1つ以上生成する応答生成手段と、前記意図推定手段で推定された意図と前記応答生成手段で生成した応答文との組み合わせにより定まる待ち時間が経過した後に、前記応答生成手段で生成した応答文を出力すると共に、前記待ち時間が経過する前に前記入力手段によって次の入力文が入力された場合には、前記応答生成手段で生成した応答文を出力しないように制御する制御手段として機能させるためのプログラムである。
第1の発明及び第2の発明によれば、入力手段によってユーザからの入力文が入力されると、意図推定手段が、入力文の構造を解析した解析結果から、入力文が表す意図を推定し、応答生成手段が、意図推定手段で推定された入力文が表す意図に応じた応答文を少なくとも1つ以上生成する。そして、制御手段が、意図推定手段で推定された意図と応答生成手段で生成した応答文との組み合わせにより定まる待ち時間が経過した後に、応答生成手段で生成した応答文を出力するように制御する。また、制御手段は、待ち時間が経過する前に入力手段によって次の入力文が入力された場合には、応答生成手段で生成した応答文を出力しないように制御する。
このように、推定された発話意図と応答文との組み合わせにより定まる待ち時間が経過するまで応答文の出力を待つことにより、ユーザが自発的に入力文を入力しようとしている場合に、装置からの応答文の出力により入力が妨げられないように、適切なタイミングで応答文の出力をすることができる。
第3の発明の応答生成装置は、ユーザからの入力文を入力する入力手段と、前記入力手段によって入力された前記入力文の構造を解析した解析結果から、前記入力文が表す意図を推定する意図推定手段と、前記意図推定手段で推定された前記入力文が表す意図に応じた応答文を少なくとも1つ以上生成する応答生成手段と、前記応答生成手段で生成された少なくとも1つ以上の応答文の中から1つの応答文を出力し、未出力の応答文が存在する場合には、前記意図推定手段で推定された意図と出力した応答文との組み合わせにより定まる待ち時間が経過した後に、前記未出力の応答文の中から他の1つの応答文を出力すると共に、前記待ち時間が経過する前に前記入力手段によって次の入力文が入力された場合には、前記他の1つの応答文を出力しないように制御する制御手段とを含んで構成されている。
また、第4の発明の応答生成プログラムは、コンピュータを、ユーザからの入力文を入力する入力手段によって入力された前記入力文の構造を解析した解析結果から、前記入力文が表す意図を推定する意図推定手段と、前記意図推定手段で推定された前記入力文が表す意図に応じた応答文を少なくとも1つ以上生成する応答生成手段と、前記応答生成手段で生成された少なくとも1つ以上の応答文の中から1つの応答文を出力し、未出力の応答文が存在する場合には、前記意図推定手段で推定された意図と出力した応答文との組み合わせにより定まる待ち時間が経過した後に、前記未出力の応答文の中から他の1つの応答文を出力すると共に、前記待ち時間が経過する前に前記入力手段によって次の入力文が入力された場合には、前記他の1つの応答文を出力しないように制御する制御手段として機能させるためのプログラムである。
第3の発明及び第4の発明によれば、入力手段によってユーザからの入力文が入力されると、意図推定手段が、入力文の構造を解析した解析結果から、入力文が表す意図を推定し、応答生成手段が、意図推定手段で推定された入力文が表す意図に応じた応答文を少なくとも1つ以上生成する。そして、制御手段が、応答生成手段で生成された少なくとも1つ以上の応答文の中から1つの応答文を出力し、未出力の応答文が存在する場合には、意図推定手段で推定された意図と出力した応答文との組み合わせにより定まる待ち時間が経過した後に、未出力の応答文の中から他の1つの応答文を出力するように制御する。また、待ち時間が経過する前に入力手段によって次の入力文が入力された場合には、他の1つの応答文を出力しないように制御する。
このように、1つの応答文を出力してから、推定された発話意図と応答文との組み合わせにより定まる待ち時間が経過するまで次の応答文の出力を待つことにより、ユーザが装置からの応答文に応答して入力文を入力しようとしている場合に、装置からの応答文の出力により入力が妨げられないように、適切なタイミングで応答文の出力をすることができる。
また、第3の発明及び第4の発明の前記制御手段は、前記未出力の応答文が存在しない場合で、かつ前記待ち時間が経過した場合には、入力文の入力を促す応答文を出力するように制御することができる。これにより、対話をさらに進めることができる。
また、前記推定手段で推定した意図に対して、前記入力文に含まれていない内容について質問または言明する応答文が組み合わされている場合の前記待ち時間を、前記推定手段で推定した意図に対して、回答、了解、繰り返し、または確認する応答文が組み合わされている場合の前記待ち時間に比べて長くするようにすることができる。
入力文に含まれていない内容について質問または言明の応答文を出力する場合には、ユーザが意図していない内容に話題が変更されることになるが、応答文の出力までの待ち時間を長くすることにより、待ち時間の間に引き続きユーザからの入力があれば話題を変更することなく対話を継続することができる。また、出力後の待ち時間を長くすることにより、出力した応答文に対するユーザからの応答を十分待つことができ、ユーザが応答内容について考えているにもかかわらず、波状して次の応答文を出力してしまうことを避けることができる。
また、前記待ち時間を、前記入力文が最初に入力されたときからの経過時間に応じて短くするか、または、前記ユーザによる過去の応答文出力から次の入力文入力までの沈黙時間に基づいて、該沈黙時間が長くなるほど長くすることができる。このように、待ち時間を動的に変更することにより、ユーザが装置との対話に慣れてきた場合や、ユーザがじっくり考えて応答するタイプか即答するタイプかなどの個人差がある場合などにも対応して、適切なタイミングで応答文を出力することができる。
以上説明したように、本発明の応答生成装置及びプログラムによれば、ユーザが自発的に、または装置からの応答文に応答して入力文を入力しようとしている場合に、装置からの応答文の出力により入力が妨げられないように、適切なタイミングで応答文の出力をすることができる、という効果が得られる。
以下、図面を参照して本発明の実施の形態を詳細に説明する。なお、本実施の形態では、ユーザからの発話を入力として、所定の処理を実行して音声出力する応答生成装置に本発明を適用した場合について説明する。
図1に示すように、第1の実施の形態に係る応答生成装置10は、ユーザ発話を集音して音声信号を生成するマイク12と、音声出力を行うスピーカ14と、マイク12及びスピーカ14に接続され、かつ、適切なタイミングで応答文を出力する所定の処理を実行するコンピュータ16とを備えている。
コンピュータ16は、応答生成装置10全体の制御を司るCPU、後述する応答生成処理及び意図推定処理のプログラム等各種プログラムを記憶した記憶媒体としてのROM、ワークエリアとしてデータを一時格納するRAM、各種情報が記憶された記憶手段としてのHDD、I/O(入出力)ポート、及びこれらを接続するバスを含んで構成されている。I/Oポートには、マイク12及びスピーカ14が接続されている。
また、このコンピュータ16を、ハードウエアとソフトウエアとに基づいて定まる機能実現手段毎に分割した機能ブロックで説明すると、図1に示すように、マイク12から入力された音声信号を音声認識して、一般的な形態素解析器を用いて音声認識されたユーザ発話を示す文字列情報に対して形態素解析を行う言語解析部20、言語解析部20による解析結果に基づいて、ユーザ発話の意図を推定する意図推定部22、意図推定部22で推定された意図に対応付けられた応答候補タイプに基づいて応答文を生成する応答生成部24、応答生成部24で生成された応答文の出力タイミングになったか否かを判断する出力タイミング計測部26、及び出力タイミング計測部26で出力タイミングになったと判断された場合に、生成された応答文を音声信号に変換してスピーカ14から出力させる出力部28を含んだ構成で表すことができる。
意図推定部22は、図2に示すように、ユーザ発話の意図として、「言明」、「言明型質問」、「Y/N質問」、「言明型回答」、「Y/N回答」、「了解」、及び「その他」の何れの発話意図クラスであるかを推定する。このユーザ発話の意図の分類は、談話分析におけるムーブ(質問や回答など談話機能を担う構成単位)に基づいて定めたものである。ユーザ発話を上記の意図の何れかに分類する場合には、ユーザ発話の言語的特徴によって複数のクラスに分類するという分類課題において、クラスの言語的特徴を最も代表する分類器を設計する。
発話意図クラスが「言明型質問」の場合には、例えば、「今、何時?」といった文のように、何かを質問する文となり、疑問文の形式をとる。また、「Y/N質問」の場合も同様に、例えば、「グラタン作れるの?」といった疑問文の形式をとり、Yes、Noを問う質問となる。一方、「言明型質問」及び「Y/N質問」以外の場合には、一般的に、平叙文の形式をとる。発話意図クラスが「言明」の場合には、例えば、「友達が遊びに来るよ」といった文のように、一定の意味内容を持った文となり、節を含むという特徴を有している。また、例えば、「友達が遊びに」のように動詞が省略されている場合も、省略部分(来るよ)を補完した文が節を含むという特徴を有しているため、発話意図クラスは「言明」となる。
また、発話意図クラスが「言明型回答」となる場合には、例えば、「何を作ってくれたんですか?」という質問に対する「グラタンを作ってくれて」という回答文となり、5W1H型の質問に対して、Yes、No以外の形式で質問に対して答える文であって、節を含むという特徴を有している。また、例えば、上記質問に対して、「グラタン」のように動詞を省略した発話の場合も、省略部分(を作ってくれて)を補完した文が節を含むという特徴を有しているため、発話意図クラスは「言明型回答」となる。また、発話意図クラスが「Y/N回答」となる場合には、例えば、「友達が遊びに来るんですか?」という質問に対する「そうなの。」という回答文となり、Yes、Noを問う質問に対して、Yes、Noの形式で答える文となる。
また、発話の意図が「了解」となる場合には、例えば、「そっか〜」、「ううん」、「そうなんだ」のように同意または不同意する文や了解する文となる。発話意図クラスが「その他」の場合には、例えば、「私は晴れ男なんですよ」という相手の発話に対する笑いに相当する文や「うん」のような文となる。
応答生成部24は、意図推定部22で推定された発話意図クラスに対応付けられた応答候補タイプの中から選択した応答候補タイプに基づいて、応答文を生成する。
図3に示すように、発話意図クラスが「言明」の場合には、応答候補タイプとして「了解」、「繰り返し」、「確認」、「深堀質問」、「言明」が対応付けられている。また、発話意図クラスが「言明型質問」の場合には、「言明型回答」、発話意図クラスが「Y/N質問」の場合には、「Y/N回答」、発話意図クラスが「言明型回答」の場合には、「了解」、発話意図クラスが「Y/N回答」の場合には、「了解」、発話意図クラスが「了解」の場合には、「了解」及び「言明」がそれぞれ応答候補タイプとして対応付けられて、所定の記憶領域に記憶されている。発話意図クラスに対して、応答候補タイプが複数対応付けられている場合には、複数の応答候補タイプの中からランダムに選択したり、過去の発話履歴に出現していない応答候補タイプを選択したりすることにより、1つまたは複数の応答候補タイプを選択する。
また、応答生成部24は、選択した応答候補タイプに基づいて、例えば、図3の「応答文例」に示すような応答文を生成する。具体的には、ユーザ発話が「友達が遊びに来るよ。」であった場合には、発話意図クラスは「言明」と推定され、これに対する応答候補タイプとして「了解」を選択した場合には、「そっか〜」のような応答文が生成される。また、応答候補タイプが「繰り返し」の場合には、ユーザ発話の内容を繰り返す「友達が遊びに来るんですね」のような応答文が生成される。また、応答候補タイプが「確認」の場合には、ユーザ発話の内容を確認する「友達が遊びに来るの?」のような応答文が生成される。また、応答候補タイプが「深堀質問」の場合には、ユーザ発話の内容に含まれていない事項について質問する「いつ遊びに来るの?」のような応答文が生成される。また、応答候補タイプが「言明」の場合には、ユーザの発話内容に対して新たな切り返しとなる「僕も友達が欲しいな」のような応答文が生成される。
なお、応答文の生成は、予め応答候補タイプ毎に定めたフォーマットにユーザ発話から抽出した単語を当てはめたり、ユーザ発話に含まれる単語の属性に従って予め定めた応答文生成ルールに従って生成したりなど、周知の技術を用いて行うことができる。
出力タイミング計測部26は、ユーザ発話が入力されない状態の継続時間を計測し、その継続時間が「応答文出力待ち時間」を経過した場合には、応答文の出力タイミングとなったと判断する。応答文出力待ち時間を経過する前にユーザから次の発話が入力された場合には、継続時間の計測が中断され、応答文の出力タイミングと判断されることはない。
この判断に用いる応答文出力待ち時間は、推定された発話意図クラスとそれに対応付けられた応答候補タイプとの組み合わせ毎に定められている。例えば、図3に示すように、発話意図クラス「言明」と応答候補タイプ「了解」、「繰り返し」、「確認」のそれぞれとの組み合わせの場合は、応答文出力待ち時間を”0(待ち時間なし)”とし、発話意図クラス「言明」と応答候補タイプ「深堀質問」及び「言明」のそれぞれとの組み合わせの場合は、応答文出力待ち時間を”T1(例えば、7秒)”とする。発話意図クラス「言明」のユーザ発話に対して、応答候補タイプ「深堀質問」及び「言明」に基づく応答文を出力する場合に応答文出力待ち時間をT1としたのは、ユーザの発話内容に含まれていない事項について質問したり、新たな切り返しをしたりなど、対話が別の方向へ展開を見せることになるからである。これにより、ユーザが引き続き自発的に発話を入力しようとしているにもかかわらず、装置から対話を別の方向へ展開させるような応答文が出力されてスムーズな対話が阻害されるということを回避することができる。
次に、図4を参照して、第1の実施の形態の応答生成装置10における応答生成処理ルーチンについて説明する。本ルーチンは、ROMに記憶された応答生成プログラムをCPUが実行することにより行われる。
ステップ100で、マイク12からユーザ発話が入力されたか否かを判断し、ユーザ発話が入力された場合には、ステップ102へ進み、入力されない場合には、入力されるまで本ステップの判断を繰り返す。ここでは、ユーザ発話「友達が遊びに来るよ」が入力されたものとする。
ステップ102で、入力されたユーザ発話を示す音声信号を音声認識して文字列情報とし、この文字列情報に対して形態素解析を行う。次に、ステップ104で、形態素解析の解析結果に基づいて、意図推定処理を実行する。
ここで、図5を参照して、意図推定処理ルーチンについて説明する。
ステップ200で、形態素解析の解析結果に基づいて、ユーザ発話の意図が「質問」であるか否かを判断する。ユーザ発話を示す文が疑問文の形式であれば、「質問」であると判断して、ステップ202へ進み、「質問」ではない場合には、ステップ208へ進む。
ステップ202で、ユーザ発話を示す疑問文がYes、Noの形式で答える「Y/N質問」であるか否かを判断する。「Y/N質問」の場合には、ステップ204に進んで、変数iに”Y/N質問”を格納する。「Y/N質問」ではない場合には、「言明型質問」であると判断して、ステップ206に進んで、変数iに”言明型質問”を格納する。
上記ステップ200で、発話意図が「質問」ではないと判断されて、ステップ208へ進んだ場合には、ユーザ発話の意図が「言明系」であるか否かを判断する。ユーザ発話を示す文またはユーザ発話の省略部分を補完した文が節を含む場合には、「言明系」であると判断して、ステップ210へ進み、「言明系」ではない場合には、ステップ216へ進む。
ステップ210で、ユーザ発話の意図が「言明回答」であるか否かを判断する。入力されたユーザ発話の前に装置から出力された前応答文を参照し、前応答文が疑問文の場合には、それに対する回答である「言明回答」であると判断して、ステップ212に進んで、変数iに”言明回答”を格納する。「言明回答」ではない場合には、ステップ214に進んで、変数iに”言明”を格納する。
上記ステップ208で、発話意図が「言明系」ではないと判断されて、ステップ216へ進んだ場合には、ユーザ発話の意図が「Y/N回答」であるか否かを判断する。入力されたユーザ発話の前に装置から出力された前応答文を参照し、前応答文が疑問文の場合には、それに対する回答である「Y/N回答」であると判断して、ステップ218に進んで、変数iに”Y/N回答”を格納する。「Y/N回答」ではない場合には、ステップ220に進んで、変数iに”了解”を格納する。
ここでは、ユーザ発話「友達が遊びに来るよ」は、平叙文であるため、ステップ200で否定され、また、節を含むため、ステップ208で肯定され、また、前応答文に対する回答ではないため、ステップ210で否定され、i=”言明”が格納されることになる。 次に、ステップ222で、推定された発話意図クラスを示す変数iを出力して、リターンする。
応答生成処理(図4)のステップ106へ戻ると、意図推定処理で出力された発話意図クラスiに対応する応答候補タイプの中から1つ以上の応答候補タイプを選択する。ここでは、i=”言明”であるので、図3を参照して、応答候補タイプ「了解」、「繰り返し」、「確認」、「深堀質問」、及び「言明」から1つ以上を選択する。なお、複数の応答候補タイプを選択する場合には、応答文出力待ち時間が”0(待ち時間なし)”の応答候補タイプを複数選択するよりも、応答文出力待ち時間が”0(待ち時間なし)”の応答候補タイプと応答文出力待ち時間が”T1”の応答候補タイプとを組み合わせて選択する方が望ましい。ここでは、「了解」及び「深堀質問」を選択することとする。
次に、ステップ108で、選択した応答候補タイプに基づく応答文を生成する。応答候補タイプ「了解」については、例えば、「そっか〜」のような応答文、応答候補タイプ「深堀質問」については、例えば、「いつ遊びに来るの?」のような応答文が生成される。
次に、ステップ110で、選択された応答候補タイプの中に、応答文出力待ち時間が”0(待ち時間なし)”のものが存在するか否かを判断する。存在する場合には、ステップ112へ進んで、上記ステップ108で生成した応答文の中から、応答文出力待ち時間が”0(待ち時間なし)” の応答候補タイプに基づく応答文「そっか〜」を音声合成して、スピーカ14から音声出力して、ステップ114へ進む。選択された応答候補タイプの中に、応答文出力待ち時間が”0(待ち時間なし)”のものが存在しない場合には、そのままステップ114へ進む。
ステップ114で、選択された応答候補タイプの中に、応答文出力待ち時間が”T1”のものが存在するか否かを判断する。存在する場合には、ステップ116へ進み、存在しない場合には、処理を終了する。
ステップ116で、ユーザから次発話が入力されたか否かを判断する。次発話が入力された場合には、上記ステップ108で生成した応答文出力待ち時間”T1”の 応答候補タイプに基づく応答文は出力することなく、ステップ102へ戻る。次発話が入力されない場合には、ステップ118へ進み、前のユーザ発話が入力されてから、発話の入力がされていない状態の継続時間がT1を経過したか否かを判断する。T1を経過していない場合には、ステップ116へ戻って処理を繰り返し、T1を経過した場合には、応答文出力待ち時間”T1”の 応答候補タイプに基づく応答文の出力タイミングである判断して、ステップ120へ進んで、上記ステップ108で生成した応答文の中から、応答文出力待ち時間が”T1” の応答候補タイプに基づく応答文「いつ遊びに来るの?」を音声合成して、スピーカ14から音声出力し、処理を終了する。
以上説明したように、第1の実施の形態の応答生成装置によれば、ユーザの発話内容に含まれていない事項について質問したり、新たな切り返しをしたりなど、対話が別の方向へ展開を見せるような応答文を出力する場合には、応答文出力までに発話意図と応答候補タイプとの組み合わせで定まる待ち時間を設けることにより、適切なタイミングで応答文を出力することができる。このため、ユーザが引き続き自発的に発話を入力しようとしているにもかかわらず、装置から応答文が出力されてスムーズな対話が阻害されるということを回避することができる。
なお、第1の実施の形態では、選択した応答候補タイプに基づく応答文を生成してから、出力のタイミングまで待って出力する場合について説明したが、選択した応答候補タイプに対応する出力待ち時間の経過を待って、選択した応答候補タイプに基づく応答文を生成して出力するようにしてもよい。
また、第1の実施の形態では、応答文出力待ち時間として、”0(待ち時間なし)”及び”T1”とした場合について説明したが、より詳細に3段階以上の待ち時間を設定してもよいし、発話意図クラスと応答候補タイプとの組み合わせ毎に異なる待ち時間を設定してもよい。
また、発話意図クラスを「言明型質問」、「Y/N質問」、「言明回答」、「言明」、「Y/N回答」、及び「了解」の何れかに分類する場合を例に説明したが、意図が認定できないフィラーやつぶやきなどがユーザ発話として入力される場合があるため、「その他」という分類を追加してもよい。この場合には、上記いずれのクラスにも分類できない場合を「その他」と判定するようにするとよい。
次に、第2の実施の形態について説明する。第2の実施の形態では、装置から応答文を出力した後に、ユーザからの発話を待つ発話待ち時間を設けた点が、第1の実施の形態と異なっている。なお、第1の実施の形態と同様の構成及び処理については、同一の符号を付して説明を省略する。
図6に示すように、第2の実施の形態に係る応答生成装置110は、ユーザ発話を集音して音声信号を生成するマイク12と、音声出力を行うスピーカ14と、マイク12及びスピーカ14に接続され、かつ、適切なタイミングで応答文を出力する所定の処理を実行するコンピュータ16とを備えている。
コンピュータ16を、ハードウエアとソフトウエアとに基づいて定まる機能実現手段毎に分割した機能ブロックで説明すると、図6に示すように、言語解析部20、意図推定部22、意図推定部22で推定された意図に対応付けられた応答候補タイプに基づいて応答文候補を生成する応答候補生成部124、応答候補生成部124で生成された応答文候補を一旦格納する応答候補記憶部30、応答文出力後のユーザからの発話待ち時間を計測して、次の応答文の出力タイミングになったか否かを判断する発話待ち時間計測部126、及び発話待ち時間計測部126で出力タイミングになったと判断された場合に、応答候補記憶部30に格納された応答文候補の中から1つを選択して音声信号に変換してスピーカ14から出力させる出力部28を含んだ構成で表すことができる。
応答候補生成部124は、意図推定部22で推定された発話意図クラスに対応付けられた応答候補タイプに基づいて、応答文候補を生成する。発話意図クラスの各々に対応付けられた応答候補タイプ、及び応答候補タイプの各々に基づいた応答文例は、第1の実施の形態の場合と同様である。
また、応答候補生成部124は、生成した応答文候補の中から選択した1つの応答文候補を出力する応答文として決定し、決定した応答文を出力部28へ送信する。一方、選択されなかった応答文候補を応答候補記憶部30へ格納する。生成した応答文候補から1つの応答文候補を選択する際には、ランダムに選択したり、過去の発話履歴に出現していない応答文候補を選択したりすることにより選択する。
発話待ち時間計測部126は、1つ目の応答文を出力した後のユーザ発話が入力されない状態の継続時間を計測し、その継続時間が「発話待ち時間」を経過した場合には、次の応答文の出力タイミングとなったと判断する。発話待ち時間を経過する前にユーザから次の発話が入力された場合には、継続時間の計測が中断され、次の応答文の出力タイミングと判断されることはない。
この判断に用いる発話待ち時間は、推定された発話意図クラスとそれに対応付けられた応答候補タイプとの組み合わせ毎に定められている。例えば、図7に示すように、発話意図クラス「言明」と応答候補タイプ「了解」、「繰り返し」、「言明」のそれぞれとの組み合わせの場合は、発話待ち時間を”T2”とし、発話意図クラス「言明」と応答候補タイプ「確認」及び「深堀質問」のそれぞれとの組み合わせの場合は、発話待ち時間を”T3”とする。なお、例えば、T2=8秒、T3=15秒のように、T3はT2より長い時間を設定する。これは、出力する応答文の内容が、ユーザに回答を求めるようなものであるため、ユーザに回答を考える時間を十分に与えるためである。また、T3は∞として、ユーザからの次発話があるまで待つようにしてもよい。これにより、ユーザが装置から出力された応答文に対する回答を考えているにもかかわらず、装置から次の応答文が出力されてスムーズな対話が阻害されるということを回避することができる。
次に、図8を参照して、第2の実施の形態の応答生成装置110における応答生成処理ルーチンについて説明する。本ルーチンは、ROMに記憶された応答生成プログラムをCPUが実行することにより行われる。
ステップ100で、ユーザ発話が入力されたか否かを判断し、次に、ステップ102で、入力されたユーザ発話を示す音声信号を音声認識して文字列情報とし、この文字列情報に対して形態素解析を行い、次に、ステップ104で、形態素解析の解析結果に基づいて、意図推定処理を実行して、発話意図クラスiを出力する。ここでは、第1の実施の形態と同様にユーザ発話「友達が遊びに来るよ」に対して、発話意図クラスi=”言明”が出力されたものとする。
次に、ステップ300で、意図推定処理で出力された発話意図クラスiに対応する応答候補タイプに基づく応答文候補を生成する。発話意図クラスiに対応する応答候補タイプが複数対応付けられている場合には、対応付けられている全ての応答候補タイプに基づく応答文候補を生成する。ここでは、i=”言明”に対応する応答候補タイプ「了解」、「繰り返し」、「確認」、「深堀質問」、及び「言明」のそれぞれに基づいて、「そっか〜」(了解)、「友達が遊びに来るんですね」(繰り返し)、「友達が遊びに来るの?」(確認)、「いつ遊びに来るの?」(深堀質問)、「僕も友達が欲しいな」(言明)のような応答文候補が生成される。
次に、ステップ302で、上記ステップ300で生成した応答文候補の中から1つの応答文候補を選択して、音声合成して、スピーカ14から音声出力する。ここでは、「いつ遊びに来るの?」(深堀質問)を選択して出力するものとする。次に、ステップ304で、出力しなかった残りの応答文候補を応答候補記憶部30に一旦格納する。
次に、ステップ306で、ユーザから次発話が入力されたか否かを判断する。次発話が入力された場合には、上記ステップ304で格納された応答文候補は出力することなく、ステップ102へ戻る。次発話が入力されない場合には、ステップ308へ進む。
ステップ308で、上記ステップ302で1つ目の応答文を出力してから、発話の入力がされていない状態の継続時間が出力した応答文の応答候補タイプに対応付けられている発話待ち時間を経過したか否かを判断する。ここでは、発話意図クラスi=”言明”に対する応答候補タイプ「深堀質問」の発話待ち時間”T3”である。T3を経過していない場合には、ステップ306へ戻って処理を繰り返し、T3を経過した場合には、次の応答文の出力タイミングである判断して、ステップ310へ進む。
ステップ310で、応答候補記憶部30に格納されている応答文候補が存在するか否かを判断し、存在する場合には、ステップ312へ進んで、応答候補記憶部30から応答文候補を1つ、例えば、「僕も友達が欲しいな」(言明)を選択して出力し、ステップ306へ戻る。応答候補記憶部30に格納されている応答文候補が存在しない場合には、ステップ314へ進んで、ユーザの発話を促す促し応答文を生成して出力し、処理を終了する。促し応答文は、例えば、「もっとお話が聞きたいな」、「他に何かあるの?」、「それでそれで」、「僕のお話してもいい?」のようの応答文である。
以上説明したように、第2の実施の形態の応答生成装置によれば、出力する応答文の内容が、ユーザに回答を求めるようなものである場合には、応答文を出力してから発話意図と応答候補タイプとの組み合わせで定まる待ち時間を設けることにより、ユーザに回答を考える時間を十分に与えて、適切なタイミングで次の応答文を出力することができる。このため、ユーザが装置から出力された応答文に対する回答を考えているにもかかわらず、装置から次の応答文が出力されてスムーズな対話が阻害されるということを回避することができる。
なお、第2の実施の形態では、発話意図クラスに対応する応答候補タイプが複数ある場合には、その全てについて応答文候補を生成する場合について説明したが、複数の応答候補タイプの中からいくつかの応答候補タイプを選択して、応答文候補を生成するようにしてもよい。例えば、発話意図クラスi=”言明”に対して、応答候補タイプ「了解」及び「深堀質問」を選択し、「そっか〜」及び「いつ遊びに来るの?」を応答文候補として生成するようにしてもよい。
また、第2の実施の形態では、応答候補タイプに基づく応答文候補を生成してから、応答候補記憶部に格納する場合について説明したが、発話意図クラスに対応する応答候補タイプを一旦記憶しておき、出力のタイミングになったときに、記憶しておいた応答候補タイプの中から1つを選択して、選択した応答候補タイプに基づく応答文を生成して出力するようにしてもよい。
また、第2の実施の形態では、発話待ち時間として、”T2”及び”T3”とした場合について説明したが、より詳細に3段階以上の待ち時間を設定してもよいし、発話意図クラスと応答候補タイプとの組み合わせ毎に異なる待ち時間を設定してもよい。
次に、第3の実施の形態について説明する。第3の実施の形態では、応答文出力待ち時間及び発話待ち時間を併用し、さらに応答文出力待ち時間及び発話待ち時間を動的に変更する点が、第1及び第2の実施の形態とは異なる。なお、第1及び第2の実施の形態と同様の構成及び処理については、同一の符号を付して説明を省略する。
図9に示すように、第3の実施の形態に係る応答生成装置210は、ユーザ発話を集音して音声信号を生成するマイク12と、音声出力を行うスピーカ14と、マイク12及びスピーカ14に接続され、かつ、適切なタイミングで応答文を出力する所定の処理を実行するコンピュータ16とを備えている。
コンピュータ16を、ハードウエアとソフトウエアとに基づいて定まる機能実現手段毎に分割した機能ブロックで説明すると、図9に示すように、言語解析部20、意図推定部22、応答候補生成部124、応答候補記憶部30、出力タイミング計測部26、発話待ち時間計測部126、出力部28、及び応答文出力待ち時間及び発話待ち時間を動的に変更する制御を行う待ち時間制御部32を含んだ構成で表すことができる。
第3の実施の形態では、生成された応答文候補または応答候補記憶部30に格納された応答文候補から選択された1つの応答文候補を出力する際、その応答文候補に対応する応答候補タイプの応答文出力待ち時間を待ってから出力する。
例えば、ユーザ発話「友達が遊びに来るよ」(i=”言明”)に対して、応答候補タイプ「了解」、「繰り返し」、「確認」、「深堀質問」、及び「言明」に基づく応答文候補が生成され、まず「いつ遊びに来るの?」(深堀質問)を出力する場合、第2の実施の形態では、1つ目の応答文は選択されるとすぐに出力したが、ここでは、i=”言明”に対する「深堀質問」の応答文出力待ち時間”T1”の経過 を待ってから出力する。ユーザの次発話がないままT1を経過すると、残りの応答文候補の中から、例えば、「僕も友達が欲しいな」(言明)を選択して出力する。
ここで、2つ目以降の応答文を出力する際には、出力しようとしている応答文の応答文出力待ち時間と、前に出力した応答文の発話待ち時間が競合することになる。例えば、上記の例では、1つ目の応答文「いつ遊びに来るの?」(深堀質問)について、発話待ち時間”T3”が設定されており、2つ目の応答文「僕も友達が欲しいな」(言明)について、応答文出力待ち時間”T1”が設定されている。この場合、「いつ遊びに来るの?」を出力してから「僕も友達が欲しいな」を出力するまでの時間は、T1を優先、T3を優先、またはT1及びT3の平均時間などのように決定することができるが、ユーザの発話を装置からの応答文の出力によって阻害しない、という点に鑑み、待ち時間の長い方を選択することが好ましい。
待ち時間制御部32は、応答文出力待ち時間及び発話待ち時間を動的に変更する。例えば、ユーザが対話に不慣れな対話開始時は待ち時間を長めに設定し、対話開始から所定時間を経過すると、はじめに設定した待ち時間より短い待ち時間に変更する。また、ユーザ毎に対話における沈黙時間の履歴をとっておき、ユーザの顔を撮影した画像を用いるなどしてユーザを認証し、そのユーザの沈黙時間の履歴を参照して、待ち時間を決定するようにしてもよい。具体的には、応答候補タイプ「言明」、「繰り返し」、「言明回答」、「Y/N回答」、及び「了解」に基づく応答文出力後のユーザ発話入力までの沈黙時間の平均をT2、応答候補タイプ「確認」、及び「深堀質問」に基づく応答文出力後のユーザ発話入力までの沈黙時間の平均をT3、対話全体の沈黙時間の平均をT1とすることができる。
以上説明したように、第3の実施の形態の応答生成装置によれば、待ち時間を動的に変更することにより、ユーザが装置との対話に慣れてきた場合や、ユーザがじっくり考えて応答するタイプか即答するタイプかなどの個人差がある場合などにも対応して、適切なタイミングで応答文を出力することができる。
なお、上記第1〜第3の実施の形態では、スピーカによる音声出力を行う場合を例に説明したが、これに限定されるものではなく、ディスプレイに応答文を表示するようにしてもよい。また、ユーザから音声がマイクに入力される場合を例に説明したが、ユーザがキーボードなどを用いて入力文としてのテキストを入力するようにしてもよい。
第1の実施の形態に係る応答生成装置の概略構成を示すブロック図である。 発話意図クラス、及び発話例を示す表である。 発話意図クラス、応答候補タイプ、応答文出力待ち時間、及び応答文例を示す表である。 第1の実施の形態の応答生成処理ルーチンを示すフローチャートである。 意図推定処理ルーチンを示すフローチャートである。 第2の実施の形態に係る応答生成装置の概略構成を示すブロック図である。 発話意図クラス、応答候補タイプ、発話待ち時間、及び応答文例を示す表である。 第2の実施の形態の応答生成処理ルーチンを示すフローチャートである。 第3の実施の形態に係る応答生成装置の概略構成を示すブロック図である。
符号の説明
10、110、210 応答生成装置
12 マイク
14 スピーカ
16 コンピュータ
20 言語解析部
22 意図推定部
26 出力タイミング計測部
28 出力部
30 応答候補記憶部
32 待ち時間制御部
124 応答候補生成部
126 発話待ち時間計測部

Claims (7)

  1. ユーザからの入力文を入力する入力手段と、
    前記入力手段によって入力された前記入力文の構造を解析した解析結果から、前記入力文が表す意図を推定する意図推定手段と、
    前記意図推定手段で推定された前記入力文が表す意図に応じた応答文を少なくとも1つ以上生成する応答生成手段と、
    前記意図推定手段で推定された意図と前記応答生成手段で生成した応答文との組み合わせにより定まる待ち時間が経過した後に、前記応答生成手段で生成した応答文を出力すると共に、前記待ち時間が経過する前に前記入力手段によって次の入力文が入力された場合には、前記応答生成手段で生成した応答文を出力しないように制御する制御手段と、
    を含む応答生成装置。
  2. ユーザからの入力文を入力する入力手段と、
    前記入力手段によって入力された前記入力文の構造を解析した解析結果から、前記入力文が表す意図を推定する意図推定手段と、
    前記意図推定手段で推定された前記入力文が表す意図に応じた応答文を少なくとも1つ以上生成する応答生成手段と、
    前記応答生成手段で生成された少なくとも1つ以上の応答文の中から1つの応答文を出力し、未出力の応答文が存在する場合には、前記意図推定手段で推定された意図と出力した応答文との組み合わせにより定まる待ち時間が経過した後に、前記未出力の応答文の中から他の1つの応答文を出力すると共に、前記待ち時間が経過する前に前記入力手段によって次の入力文が入力された場合には、前記他の1つの応答文を出力しないように制御する制御手段と、
    を含む応答生成装置。
  3. 前記制御手段は、前記未出力の応答文が存在しない場合で、かつ前記待ち時間が経過した場合には、入力文の入力を促す応答文を出力するように制御する請求項2記載の応答生成装置。
  4. 前記推定手段で推定した意図に対して、前記入力文に含まれていない内容について質問または言明する応答文が組み合わされている場合の前記待ち時間を、前記推定手段で推定した意図に対して、回答、了解、繰り返し、または確認する応答文が組み合わされている場合の前記待ち時間に比べて長くした請求項1〜請求項3のいずれか1項記載の応答生成装置。
  5. 前記待ち時間を、前記入力文が最初に入力されたときからの経過時間に応じて短くするか、または、前記ユーザによる過去の応答文出力から次の入力文入力までの沈黙時間に基づいて、該沈黙時間が長くなるほど長くなるようにした請求項1〜請求項4のいずれか1項記載の応答生成装置。
  6. コンピュータを、
    ユーザからの入力文を入力する入力手段によって入力された前記入力文の構造を解析した解析結果から、前記入力文が表す意図を推定する意図推定手段と、
    前記意図推定手段で推定された前記入力文が表す意図に応じた応答文を少なくとも1つ以上生成する応答生成手段と、
    前記意図推定手段で推定された意図と前記応答生成手段で生成した応答文との組み合わせにより定まる待ち時間が経過した後に、前記応答生成手段で生成した応答文を出力すると共に、前記待ち時間が経過する前に前記入力手段によって次の入力文が入力された場合には、前記応答生成手段で生成した応答文を出力しないように制御する制御手段と、
    して機能させるための応答生成プログラム。
  7. コンピュータを、
    ユーザからの入力文を入力する入力手段によって入力された前記入力文の構造を解析した解析結果から、前記入力文が表す意図を推定する意図推定手段と、
    前記意図推定手段で推定された前記入力文が表す意図に応じた応答文を少なくとも1つ以上生成する応答生成手段と、
    前記応答生成手段で生成された少なくとも1つ以上の応答文の中から1つの応答文を出力し、未出力の応答文が存在する場合には、前記意図推定手段で推定された意図と出力した応答文との組み合わせにより定まる待ち時間が経過した後に、前記未出力の応答文の中から他の1つの応答文を出力すると共に、前記待ち時間が経過する前に前記入力手段によって次の入力文が入力された場合には、前記他の1つの応答文を出力しないように制御する制御手段と、
    して機能させるための応答生成プログラム。
JP2008330639A 2008-12-25 2008-12-25 応答生成装置及びプログラム Active JP5195405B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008330639A JP5195405B2 (ja) 2008-12-25 2008-12-25 応答生成装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008330639A JP5195405B2 (ja) 2008-12-25 2008-12-25 応答生成装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2010152119A true JP2010152119A (ja) 2010-07-08
JP5195405B2 JP5195405B2 (ja) 2013-05-08

Family

ID=42571279

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008330639A Active JP5195405B2 (ja) 2008-12-25 2008-12-25 応答生成装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5195405B2 (ja)

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015064480A (ja) * 2013-09-25 2015-04-09 ヤマハ株式会社 音声合成装置およびプログラム
CN104699746A (zh) * 2013-12-10 2015-06-10 哈曼国际工业有限公司 情境感知主动数字助理
JP2015152868A (ja) * 2014-02-18 2015-08-24 シャープ株式会社 情報処理装置
WO2016027909A1 (ja) * 2014-08-20 2016-02-25 シャープ株式会社 データ構造、音声対話装置及び電子機器
WO2016043179A1 (ja) * 2014-09-16 2016-03-24 シャープ株式会社 音声対話装置、電子機器、音声対話方法、音声対話制御プログラム
WO2016104193A1 (ja) * 2014-12-26 2016-06-30 シャープ株式会社 対応決定装置、音声対話システム、対応決定装置の制御方法、および音声対話装置
JP2017049471A (ja) * 2015-09-03 2017-03-09 カシオ計算機株式会社 対話制御装置、対話制御方法及びプログラム
JP2018017776A (ja) * 2016-07-25 2018-02-01 トヨタ自動車株式会社 音声対話装置
KR101891489B1 (ko) * 2017-11-03 2018-08-24 주식회사 머니브레인 적시에 간투사 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체
JP2018136545A (ja) * 2012-06-18 2018-08-30 エイディシーテクノロジー株式会社 音声応答装置
US10068575B2 (en) 2012-02-16 2018-09-04 Kabushiki Kaisha Toshiba Information notification supporting device, information notification supporting method, and computer program product
JP2018151661A (ja) * 2018-05-21 2018-09-27 ヤマハ株式会社 音声制御装置、音声制御方法およびプログラム
WO2018211677A1 (ja) * 2017-05-19 2018-11-22 富士通株式会社 情報処理装置、情報処理方法及び情報処理プログラム
KR101932263B1 (ko) * 2017-11-03 2018-12-26 주식회사 머니브레인 적시에 실질적 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체
JP2019053473A (ja) * 2017-09-14 2019-04-04 日本電信電話株式会社 擬似応答送信装置、相づち表現学習装置、情報端末装置、通信システム、擬似応答送信方法、相づち表現学習方法および擬似応答送信プログラム
CN110503951A (zh) * 2018-05-18 2019-11-26 夏普株式会社 判定装置、电子设备、响应***、判定装置的控制方法
JP2020038397A (ja) * 2019-12-09 2020-03-12 カシオ計算機株式会社 対話制御装置、対話制御方法及びプログラム
JP2020076869A (ja) * 2018-11-07 2020-05-21 株式会社東芝 対話システム、対話装置、及び対話プログラム
JP2020522019A (ja) * 2017-06-02 2020-07-27 ロヴィ ガイズ, インコーポレイテッド 複数の音声動作型ユーザデバイスのための音量ベースの応答を生成するためのシステムおよび方法
WO2021009962A1 (ja) * 2019-07-12 2021-01-21 株式会社Nttドコモ 対話装置
CN113887224A (zh) * 2021-10-19 2022-01-04 京东科技信息技术有限公司 语句意图识别方法、语句应答方法、装置和电子设备
WO2022201458A1 (ja) * 2021-03-25 2022-09-29 三菱電機株式会社 音声対話システム、音声対話方法及び音声対話管理装置
JP7446900B2 (ja) 2020-04-16 2024-03-11 株式会社日立製作所 対話装置、対話システム及び対話方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0792993A (ja) * 1993-09-20 1995-04-07 Fujitsu Ltd 音声認識装置
JP2004037803A (ja) * 2002-07-03 2004-02-05 Nippon Telegr & Teleph Corp <Ntt> 応答制御装置、方法及び応答制御プログラム、記録媒体
JP2006178063A (ja) * 2004-12-21 2006-07-06 Toyota Central Res & Dev Lab Inc 対話処理装置
JP2007219149A (ja) * 2006-02-16 2007-08-30 Toyota Central Res & Dev Lab Inc 応答生成装置、方法及びプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0792993A (ja) * 1993-09-20 1995-04-07 Fujitsu Ltd 音声認識装置
JP2004037803A (ja) * 2002-07-03 2004-02-05 Nippon Telegr & Teleph Corp <Ntt> 応答制御装置、方法及び応答制御プログラム、記録媒体
JP2006178063A (ja) * 2004-12-21 2006-07-06 Toyota Central Res & Dev Lab Inc 対話処理装置
JP2007219149A (ja) * 2006-02-16 2007-08-30 Toyota Central Res & Dev Lab Inc 応答生成装置、方法及びプログラム

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10068575B2 (en) 2012-02-16 2018-09-04 Kabushiki Kaisha Toshiba Information notification supporting device, information notification supporting method, and computer program product
JP2018136545A (ja) * 2012-06-18 2018-08-30 エイディシーテクノロジー株式会社 音声応答装置
JP2015064480A (ja) * 2013-09-25 2015-04-09 ヤマハ株式会社 音声合成装置およびプログラム
CN104699746A (zh) * 2013-12-10 2015-06-10 哈曼国际工业有限公司 情境感知主动数字助理
JP2015115069A (ja) * 2013-12-10 2015-06-22 ハーマン インターナショナル インダストリーズ インコーポレイテッド コンテキストアウェアプロアクティブデジタルアシスタント
JP2015152868A (ja) * 2014-02-18 2015-08-24 シャープ株式会社 情報処理装置
WO2016027909A1 (ja) * 2014-08-20 2016-02-25 シャープ株式会社 データ構造、音声対話装置及び電子機器
JP2016045253A (ja) * 2014-08-20 2016-04-04 シャープ株式会社 データ構造、音声対話装置及び電子機器
WO2016043179A1 (ja) * 2014-09-16 2016-03-24 シャープ株式会社 音声対話装置、電子機器、音声対話方法、音声対話制御プログラム
WO2016104193A1 (ja) * 2014-12-26 2016-06-30 シャープ株式会社 対応決定装置、音声対話システム、対応決定装置の制御方法、および音声対話装置
JPWO2016104193A1 (ja) * 2014-12-26 2017-05-25 シャープ株式会社 対応決定装置、音声対話システム、対応決定装置の制御方法、および音声対話装置
JP2017049471A (ja) * 2015-09-03 2017-03-09 カシオ計算機株式会社 対話制御装置、対話制御方法及びプログラム
JP2018017776A (ja) * 2016-07-25 2018-02-01 トヨタ自動車株式会社 音声対話装置
WO2018211677A1 (ja) * 2017-05-19 2018-11-22 富士通株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP7239494B2 (ja) 2017-06-02 2023-03-14 ロヴィ ガイズ, インコーポレイテッド 複数の音声動作型ユーザデバイスのための音量ベースの応答を生成するためのシステムおよび方法
US11481187B2 (en) 2017-06-02 2022-10-25 Rovi Guides, Inc. Systems and methods for generating a volume-based response for multiple voice-operated user devices
JP2020522019A (ja) * 2017-06-02 2020-07-27 ロヴィ ガイズ, インコーポレイテッド 複数の音声動作型ユーザデバイスのための音量ベースの応答を生成するためのシステムおよび方法
JP2019053473A (ja) * 2017-09-14 2019-04-04 日本電信電話株式会社 擬似応答送信装置、相づち表現学習装置、情報端末装置、通信システム、擬似応答送信方法、相づち表現学習方法および擬似応答送信プログラム
WO2019088383A1 (ko) * 2017-11-03 2019-05-09 주식회사 머니브레인 적시에 간투사 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체
US11302332B2 (en) 2017-11-03 2022-04-12 Deepbrain Ai Inc. Method, computer device and computer readable recording medium for providing natural language conversation by timely providing substantial reply
CN111556999B (zh) * 2017-11-03 2023-11-28 株式会社明芒科技 通过即时提供实质性回答以提供自然语言对话的方法、计算机装置及计算机可读存储介质
KR101891489B1 (ko) * 2017-11-03 2018-08-24 주식회사 머니브레인 적시에 간투사 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체
KR101932263B1 (ko) * 2017-11-03 2018-12-26 주식회사 머니브레인 적시에 실질적 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체
CN111556999A (zh) * 2017-11-03 2020-08-18 财富智慧股份有限公司 通过即时提供实质性回答以提供自然语言对话的方法、计算机装置及计算机可读存储介质
US11481443B2 (en) 2017-11-03 2022-10-25 Deepbrain Ai Inc. Method and computer device for providing natural language conversation by providing interjection response in timely manner, and computer-readable recording medium
WO2019088638A1 (ko) * 2017-11-03 2019-05-09 주식회사 머니브레인 적시에 실질적 답변을 제공함으로써 자연어 대화를 제공하는 방법, 컴퓨터 장치 및 컴퓨터 판독가능 기록 매체
CN110503951A (zh) * 2018-05-18 2019-11-26 夏普株式会社 判定装置、电子设备、响应***、判定装置的控制方法
JP2018151661A (ja) * 2018-05-21 2018-09-27 ヤマハ株式会社 音声制御装置、音声制御方法およびプログラム
JP7022046B2 (ja) 2018-11-07 2022-02-17 株式会社東芝 対話システム、対話装置、及び対話プログラム
JP2020076869A (ja) * 2018-11-07 2020-05-21 株式会社東芝 対話システム、対話装置、及び対話プログラム
WO2021009962A1 (ja) * 2019-07-12 2021-01-21 株式会社Nttドコモ 対話装置
JP2020038397A (ja) * 2019-12-09 2020-03-12 カシオ計算機株式会社 対話制御装置、対話制御方法及びプログラム
JP7446900B2 (ja) 2020-04-16 2024-03-11 株式会社日立製作所 対話装置、対話システム及び対話方法
WO2022201458A1 (ja) * 2021-03-25 2022-09-29 三菱電機株式会社 音声対話システム、音声対話方法及び音声対話管理装置
JPWO2022201458A1 (ja) * 2021-03-25 2022-09-29
JP7361988B2 (ja) 2021-03-25 2023-10-16 三菱電機株式会社 音声対話システム、音声対話方法及び音声対話管理装置
CN113887224A (zh) * 2021-10-19 2022-01-04 京东科技信息技术有限公司 语句意图识别方法、语句应答方法、装置和电子设备

Also Published As

Publication number Publication date
JP5195405B2 (ja) 2013-05-08

Similar Documents

Publication Publication Date Title
JP5195405B2 (ja) 応答生成装置及びプログラム
JP5381988B2 (ja) 対話音声認識システム、対話音声認識方法および対話音声認識用プログラム
US9015048B2 (en) Incremental speech recognition for dialog systems
JP5195414B2 (ja) 応答生成装置及びプログラム
JP4729902B2 (ja) 音声対話システム
JP2003044088A (ja) プログラム、記録媒体、並びに音声対話装置および方法
WO2018034169A1 (ja) 対話制御装置および方法
JP2006251545A (ja) 音声対話システム及びコンピュータプログラム
KR20220140599A (ko) 대화의 사람 참가자를 대신하여 생성된 합성 스피치 오디오 데이터
JP2018049132A (ja) 音声対話システムおよび音声対話方法
CN116917984A (zh) 交互式内容输出
JP2006189730A (ja) 音声対話方法および音声対話装置
JPWO2020036195A1 (ja) 話し終わり判定装置、話し終わり判定方法およびプログラム
JP2004226881A (ja) 会話システム及び会話処理プログラム
JP2010197644A (ja) 音声認識システム
WO2017094913A1 (ja) 自然言語処理装置及び自然言語処理方法
JP4798039B2 (ja) 音声対話装置および方法
JP2010262147A (ja) 応答生成装置及びプログラム
JP2008152637A (ja) 応答生成装置及び応答生成プログラム
JP5818753B2 (ja) 音声対話システム及び音声対話方法
JP6736225B2 (ja) 対話装置、対話装置の制御方法およびプログラム
JP2008157987A (ja) 対話制御装置、対話制御方法及び対話制御プログラム
JP2009198871A (ja) 音声対話装置
JP2011175304A (ja) 音声対話装置および方法
US12001260B1 (en) Preventing inadvertent wake in a speech-controlled device

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20110802

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20110802

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120731

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130121

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160215

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5195405

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160215

Year of fee payment: 3