JP2001034289A - 自然言語を用いた対話システム - Google Patents

自然言語を用いた対話システム

Info

Publication number
JP2001034289A
JP2001034289A JP11202538A JP20253899A JP2001034289A JP 2001034289 A JP2001034289 A JP 2001034289A JP 11202538 A JP11202538 A JP 11202538A JP 20253899 A JP20253899 A JP 20253899A JP 2001034289 A JP2001034289 A JP 2001034289A
Authority
JP
Japan
Prior art keywords
task
response sentence
natural language
command
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11202538A
Other languages
English (en)
Other versions
JP3662780B2 (ja
Inventor
Seiya Osada
誠也 長田
Shinichi Doi
伸一 土井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP20253899A priority Critical patent/JP3662780B2/ja
Publication of JP2001034289A publication Critical patent/JP2001034289A/ja
Application granted granted Critical
Publication of JP3662780B2 publication Critical patent/JP3662780B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】ユーザの曖昧な発話をシステムが解釈し、解釈
した結果の確信度を用いてシステムの応答を変化させる
ことにより、ユーザの負担を軽減を図る対話システムの
提供。 【解決手段】入力装置1から文字列を受け取り、辞書記
憶部31を参照して複数のタスクコマンドに変換する自
然言語解析手段21と、曖昧性解消情報記憶部32を参
照して複数のタスクコマンドを1つに絞り込むととも
に、絞り込みの仕方から、確信度を求める曖昧性解消手
段22と、絞り込んだタスクコマンドと求められた確信
度と辞書記憶部31を参照して確信度に応じた応答文を
生成し、出力装置4に出力する応答文生成手段23とを
備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自然言語を用いた
対話システムに関し、特に、ユーザの曖昧な発話を解釈
しユーザへの応答を行なうシステム及び装置に関する。
【0002】
【従来の技術】タスクに対するユーザの発話は一般的に
は曖昧なものであり、曖昧な発話を解釈する従来のシス
テムとして以下のようなものがあげられる。
【0003】第1のシステムは、曖昧な発話に対してシ
ステムが確認の応答を行い、それに対してユーザに肯定
か否定かを答えさせることでユーザの発話を解釈するも
のである。例えば特開平9-171394号公報には、システム
がユーザの曖昧な発話から生成できるタスクを列挙し、
列挙したタスクの中から1つずつユーザの意図に合うか
どうか質問し、ユーザが肯定を意味する語を入力する
と、システムはそのタスクが正しい解釈であると決定す
る。
【0004】第2のシステムは、ユーザの曖昧な発話を
システムはさまざまな手がかりを用いて一意に解釈し
て、確認なしにタスクを実行するものである。
【0005】
【発明が解決しようとする課題】しかしながら、上記し
た従来のシステムは下記記載の問題点を有している。
【0006】上記第1のシステムの問題点は、ユーザが
曖昧な発話するたびにシステムが確認の応答文を出力す
ることから、ユーザはそのたびに応答文に答えなくては
ならず、煩雑であり、負担がかかる、ということであ
る。
【0007】一方、上記第2のシステムの問題点は、ユ
ーザの曖昧性のある発話を一意に解釈して必ず実行して
しまうと、システムの解釈が間違っていた時にユーザは
システムが行ってしまったタスクに対して修正を行わな
くてはならず、結果としてユーザに負担がかかる、とい
うことである。
【0008】したがって、本発明は、上記問題点に鑑み
てなされたものであって、その目的は、ユーザが発話し
た後、ユーザにできるだけ負荷のかけることなく、タス
クの実行と応答文の出力を行なうシステム及び装置を提
供することにある。これ以外の本発明の目的、特徴、利
点等は以下の説明から、当業者には直ちに明らかとされ
るであろう。
【0009】
【課題を解決するための手段】前記目的を達成する本発
明は、入力手段から入力された自然言語を受け取り、語
彙辞書を参照して1又は複数のタスクコマンドに変換す
る自然言語解析手段と、曖昧性解消情報を参照して、複
数のタスクコマンドを1つに絞り込むとともに、絞り込
みの仕方から、確信度を求める曖昧性解消手段と、絞り
込んだタスクコマンドと求められた確信度と語彙辞書を
参照して確信度に応じた応答文を生成し、出力手段に出
力する応答文生成手段とを備える。より詳細には、本発
明は、入力された自然言語を解釈するために必要な語彙
と、該自然言語の解釈結果から応答文を生成するために
必要な語彙を予め記憶する辞書記憶部と、前記辞書記憶
部を参照して、入力された自然言語の解釈を行う自然言
語解析手段と、前記自然言語解析手段で求められた解釈
結果が複数存在した時に、1つの解釈結果に絞り込むた
めの手がかりとして用いられる情報を記憶する曖昧性解
消情報記憶部と、前記自然言語解析手段で求められた解
釈結果が複数存在した時に、前記曖昧性解消情報記憶部
を参照して、前記複数の解釈結果を1つに絞り込むとと
もに、前記1つに絞り込んだ解釈結果に対する確信度を
求める曖昧性解消手段と、前記曖昧性解消手段で絞り込
んだ解釈結果を応答文として出力し、その際、前記曖昧
性解消手段で求められた前記確信度に応じて応答文を変
化させる応答文生成手段と、を備える。
【0010】本発明は、前記曖昧性解消手段で求められ
た解釈を受けて、該解釈をタスクコマンドに変換し、前
記タスクコマンドからタスクを実行するタスク実行手段
をさらに備える。
【0011】本発明においては、前記応答文生成手段
が、前記曖昧性解消手段で求められた確信度に応じて、
前記タスク実行手段でタスクを実行した後にタスクの実
行を報告する応答文を生成するか、もしくは、前記タス
ク実行手段でタスクを実行する前にタスクを実行してと
よいか否かを確認するための応答文を生成するか、を決
定する。
【0012】本発明においては、実行を行ったタスクコ
マンドに対する逆操作のタスクコマンドを記憶するキャ
ンセルコマンド記憶部と、キャンセルの意味を表す入力
があったときに、前記タスク実行手段でキャンセルコマ
ンドを実行するとともに、前記応答文生成手段におい
て、キャンセルコマンドを実行したことを報告する応答
文を生成する。
【0013】本発明においては、システムがタスクコマ
ンドを実行してようかどうかの確認をとる応答文を出力
した後、時間の経過を測定する時間管理手段を備え、前
記時間管理手段で計時を開始後、あらかじめ定められた
所定の時間が経過しても、ユーザからの応答がない時に
は、肯定を表す入力が前記入力装置に入力されたものと
解釈する。
【0014】
【発明の実施の形態】本発明の好ましい実施の形態につ
いて以下に説明する。本発明の自然言語を用いた対話シ
ステムは、入力された自然言語を解釈する自然言語解析
手段(図1の21)と、解釈結果が複数存在する時に解
釈を1つに絞り込むとともに、その絞り込み方を用い
て、確信度を求める曖昧性解消手段(図1の22)と、
1つに絞り込まれたタスクコマンドから確信度に応じた
応答文を生成する応答文生成手段(図1の23)と、を
有する。
【0015】本発明においては、ユーザの曖昧な発話を
確信度というパラメータに変換し、確信度に応じた応答
文を生成することにより、自然な対話を行うことができ
る。
【0016】本発明はその好ましい第1の実施の形態に
おいて、図1を参照すると、入力手段(1)から入力さ
れた自然言語に対して辞書記憶部(31)を参照して解
釈を行う自然言語解析手段(21)と、自然言語解析手
段(21)で求められた解釈結果が複数存在した時に、
自然言語解析手段(21)で求められた解釈結果が複数
存在した時に、解釈結果に絞り込むための手がかりとし
て用いられる情報を記憶する曖昧性解消情報記憶部(3
2)の情報を参照して、前記複数の解釈結果を1つに絞
り込むとともに、前記1つに絞り込んだ解釈結果に対す
る確信度を求める曖昧性解消手段(22)と、曖昧性解
消手段(22)で絞り込んだ解釈結果を応答文として出
力手段(4)から出力し、その際、前記曖昧性解消手段
で求められた前記確信度に応じて応答文を変化させる応
答文生成手段(23)と、を備える。
【0017】自然言語解析手段(21)で求められた複
数の解釈として複数の処理要求(タスクコマンド)があ
る場合、曖昧性解消手段(22)は、曖昧性解消情報記
憶部(32)に記憶された情報(例えば処理対象の物理
的な条件、入力された自然言語の文脈、ユーザの操作履
歴等)に基づき、複数の処理要求のうち妥当な処理要求
を一つ選択するとともに確信度を設定する。その際、自
然言語解析手段(21)で求められた解釈が一つの場
合、曖昧性がないため、確信度最大とする。
【0018】本発明は、その好ましい第2の実施の形態
において、図3を参照すると、曖昧性解消手段(22)
で求められた解釈を受けて、該解釈をタスクコマンドに
変換し、前記タスクコマンドからタスクを実行するタス
ク実行手段(24)をさらに備える。
【0019】応答文生成手段(23)は、前記曖昧性解
消手段(22)で求められた確信度に応じて、前記タス
ク実行手段(24)でタスクを実行した後にタスクの実
行を報告する応答文を生成するか、もしくは、タスク実
行手段(24)でタスクを実行する前にタスクを実行し
てよいか否かを確認するための応答文を生成するかを決
定する。
【0020】すなわち、自然言語解析手段(21)で
は、入力された自然言語を解釈し、該入力された自然言
語から解釈可能な処理要求(タスクコマンド)が複数あ
る場合、前記曖昧性解消手段(22)で複数のタスクコ
マンドを一つに絞り込み、該一つの絞り込まれた確信度
が小の場合、タスクコマンドを直ちに実行せずに、未実
行タスクコマンド記憶部(33)に一旦記憶しておき、
タスクを実行する前にタスクを実行してよいか否かを確
認するための応答文を出力する。該応答文に対してユー
ザが肯定を意味する入力を行なった場合、未実行タスク
コマンド記憶部(33)からタスクコマンドを取り出し
て、タスク実行手段でタスクコマンドを実行し、タスク
実行完了の応答文を出力し、一方否定入力の場合、未実
行タスク取り消しの応答文を作成して出力する。
【0021】応答文生成手段(23)が、曖昧性解消手
段(22)で求められた確信度に応じて、応答文を生成
するかしないかを決定するようにしてもよい。
【0022】応答文生成手段(23)は、曖昧性解消手
段(22)で求められた確信度に応じて、曖昧性解消手
段(22)が解釈した結果を、報告、確認、質問のうち
のいずれかを表す応答文に変更する。
【0023】本発明は、その好ましい第3の実施の形態
において、図5を参照すると、タスク実行手段で実行を
行ったタスクコマンドに対する逆操作のタスクコマンド
を記憶するキャンセルコマンド記憶部(34)を備え、
ユーザからキャンセルの意味を表す入力があったとき
に、タスク実行手段でキャンセルコマンドを実行すると
ともに、応答文生成手段(22)では、キャンセルコマ
ンドを実行したことを報告する応答文を生成する。
【0024】本発明は、その好ましい第4の実施の形態
において、図7を参照すると、絞り込まれたタスクコマ
ンドの確信度が低いときに、応答文生成手段(22)で
は、タスクコマンドを実行していいかどうかの確認をと
る応答文を出力し、該応答文を出力した後、時間の経過
を測定するタイマ等の時間管理手段(35)を備え、計
時を開始後、あらかじめ定められた所定の時間が経過し
ても、ユーザからの応答がない時には、肯定を表す入力
が入力手段(1)に入力されたものと解釈する。
【0025】時間管理手段(35)によって前記所定の
時間が経過した後に、肯定を表す入力が入力手段(1)
に入力されたか否かを、曖昧性解消手段(22)で求め
た確信度に応じて決定するようにしてもよい。
【0026】本発明の実施の形態において、自然言語解
析手段、曖昧性解消手段、応答文生成手段、及びタスク
実行手段はコンピュータ等データ処理装置上で実行され
るプログラムにより各々の処理・機能が実現される。こ
の場合、該プログラムを記録した記録媒体又は通信媒体
より該プログラムをデータ処理装置に読み出して実行す
ることにより本発明を実施することができる。
【0027】
【実施例】本発明の実施例について図面を参照して以下
に説明する。
【0028】本発明の第1の実施例について説明する。
図1は、本発明の第1の実施例の構成を示す図である。
図1を参照すると、本発明の第1の実施例は、キーボー
ドや音声認識装置等の入力装置1と、プログラム制御に
より動作するデータ処理装置2と、情報を記憶する記憶
装置3と、ディスプレイ装置や音声合成装置等の出力装
置4とを含む。
【0029】記憶装置3は、辞書記憶部31と、曖昧性
解消情報記憶部32とを備えている。辞書記憶部31に
は、タスクを実行するためにユーザが使う語彙、及び、
ユーザへの応答文を生成するために使う語彙があらかじ
め記憶されている。
【0030】曖昧性解消情報記憶部32には、タスクが
どのような構成になっているのか、タスク先の現在の状
態、ユーザが発話した文脈等、ユーザの発話の曖昧性を
解消するために必要な情報が記憶されている。
【0031】データ処理装置2は、自然言語解析手段2
1と、曖昧性解消手段22と、応答文生成手段23と、
を備えている。
【0032】自然言語解析手段21は、入力装置1で得
た入力文字列を辞書記憶部31に記憶された語彙を用い
て解釈する。
【0033】曖昧性解消手段22は、自然言語解析手段
21で複数の解釈結果が得られた時に、曖昧性解消情報
記憶部32の情報を参照して、解釈を1つに絞る。
【0034】また、解釈の絞り方に応じてシステムが曖
昧性を解消した結果の確信度も求める。
【0035】確信度は、どの手段を用いて曖昧性が解消
されたか、また曖昧性解消情報記憶部に記憶されている
どの情報を用いて曖昧性が解消されたかを用いて、求め
られる。
【0036】以下、タスクとして、家庭内の機器操作を
例に挙げて、確信度の定義の一例について説明する。
【0037】(1).自然言語解析手段21で解釈が1
つに絞られていた時は確信度最大とする。
【0038】(2).タスクを実行の可否によって解釈
を1つに絞った時、例えば「つけて」という入力に対し
て、 ・「テレビをつける」というタスクと、 ・「ビデオをつける」というタスクと、 ・「明かりをつける」というタスクと、 の3つ解釈が自然言語解析手段21で行われたときに、
例えば、曖昧性解消情報記憶部32の情報から、テレビ
と明かりの電源はすでについており(電源オンとされて
おり)、ビデオの電源はついていない場合、「ビデオを
つける」という解釈に、曖昧性解消手段22で解釈を1
つに絞った時には、確信度大とする。
【0039】(3).文脈によって解釈を1つに絞った
時、例えば「1チャンネルにして」という入力に対し
て、自然言語解析手段21で、 ・「テレビのチャンネルを1にする」というタスクと、 ・「ビデオのチャンネルを1にする」というタスクと、 の二つの解釈ができたときに、前回の入力が「テレビを
つけて」であったため、「テレビ」が話題になっている
ものと判断して、「テレビのチャンネルを1にする」と
曖昧性解消手段22で1に絞った時には「確信度中」と
する。
【0040】(4).ユーザの操作の頻度によって解釈
を1つに絞った時、例えば「つけて」という入力に対し
て、自然言語解析手段21で、 ・「テレビをつける」というタスク、 ・「ビデオをつける」というタスク、 ・「明かりをつける」というタスク の三つに解釈できた時に、今までの過去の履歴を見る
と、「明かりをつける」ことが多いので、「明かりをつ
ける」という解釈に、曖昧性解消手段22で1つに絞っ
た時には、「確信度小」とする。
【0041】(5).曖昧性を解消する手がかりが何も
ないため、自然言語解析手段21で見つけた順番を用い
て曖昧性解消手段22で解釈を1つに絞った時には、
「確信度最小」とする。
【0042】応答文生成手段23は、曖昧性解消手段2
2で1つに絞った解釈と、その確信度、さらに辞書記憶
部3を使って、ユーザにできるだけ負担にならないよう
な応答文を生成する。
【0043】例えば、確信度が高い時には、タスクを実
行してしまい、実行した結果を伝える応答文を生成す
る。
【0044】一方、確信度が低い時には、タスクを実行
せずに、実行していいかどうかの応答文を生成する。
【0045】図2は、本発明の一実施例の処理手順を示
す流れ図である。図1及び図2を参照して、本発明の一
実施例の動作について詳細に説明する。
【0046】入力装置1で得た入力文字列は、自然言語
解析手段21に供給される(図2のステップ101)。
【0047】自然言語解析手段21は、辞書記憶部31
に記憶されている語彙を参照して、この入力文字列を解
釈する(図2のステップ102)。
【0048】曖昧性解消手段22は、曖昧性解消情報記
憶部32に記憶されている情報を参照して、解釈が複数
存在している時に解釈を1つに絞り込む(図2のステッ
プ103)。
【0049】また、どのように解釈を1つに絞ったかを
用いてシステムが曖昧性を解消した結果の確信度を求め
る(図2のステップ104)。
【0050】応答文生成手段23は、辞書記憶部31に
記憶されている語彙を参照して、確信度の大きさに応じ
て異なった応答文を生成し、出力装置4に出力する(図
2のステップ105)。
【0051】本発明の第1の実施例について具体例に即
して以下に説明する。
【0052】入力装置1として、マイクを備え、該マイ
クから入力された信号をディジタル信号に変換して音声
認識を行ない認識結果をテキストコードとして出力する
音声認識システムからなるものとする。データ処理装置
2はパーソナル・コンピュータよりなり、磁気ディスク
記憶装置等よりなる記憶装置3を備える。また出力装置
4は、スピーカを備えた音声合成システムよりなり、応
答文生成手段23から出力されたテキスト情報を音声合
成して音声出力する。
【0053】データ処理装置2(パーソナル・コンピュ
ータ)は、自然言語解析手段21、曖昧性解消手段2
2、応答文生成手段23を備え、これらの各手段は、C
PU(中央演算装置)で実行されるプログラムによりそ
の処理・機能が実現される。すなわち、該プログラムを
記録した記録媒体、もしくは通信媒体から該プログラム
を読み出してデータ処理装置2で実行することにより、
本発明を実施することができる。記憶装置3には、辞書
31及び曖昧性解消情報記憶部32を備える。
【0054】以下は本発明を適用したシステムとして、
テレビとビデオの電源等の制御を行なう構成を例に説明
する。なお、記憶装置1の曖昧性解消情報記憶部32に
は、テレビ及びビデオの各機器の電源のオン・オフ状態
が記憶管理されるものとする。
【0055】ユーザが、テレビとビデオがある家の中
で、テレビを操作するために、「電源つけて」と、入力
装置1のマイクに向かって話したとする。
【0056】入力装置1をなす音声認識システムは、
「電源つけて」と音声認識して、テキスト文字に変換す
る。
【0057】このテキスト文字と、辞書記憶部31を参
照して自然言語解析手段31は、「テレビの電源をつけ
る」と「ビデオの電源をつける」という複数の解釈結果
を出力する。
【0058】曖昧性解消手段32は、曖昧性解消情報と
して、テレビ及びビデオの各機器の現在状態を見ると、
「テレビの電源はオフ」、「ビデオの電源はオン」であ
ることから、「テレビの電源をつける」という解釈(タ
スク)に絞り込む。
【0059】また機器の現在状態から、曖昧性を解消す
ることができたことから、確信度での最大〜最小の5段
階評価のうち「確信度大」であるとする。
【0060】応答文生成手段23では、確信度大と「テ
レビの電源をつける」という解釈結果と辞書記憶部31
を参照して、「テレビの電源をつけます」という応答文
を生成し、出力装置4をなす音声合成システムでスピー
カに出力する。
【0061】次に本発明の第2の実施例について図面を
参照して詳細に説明する。
【0062】図3は、本発明の第2の実施例の構成を示
す図である。図3において、図1と同等の要素には同一
の参照符号が付されている。図3を参照すると、本発明
の第2の実施例は、図1を参照して説明した前記第1の
実施例に対して、タスク実行手段24がデータ処理装置
2に追加されており、未実行タスクコマンド記憶部33
が記憶装置3にさらに付加されて構成されている。
【0063】タスク実行手段24は、曖昧性解消手段2
2で生成された解釈を、応答文生成手段23で実行すべ
きタスクであるか否かを判断し、実行すべきタスクであ
ると判断された時に、タスクを実行する。
【0064】未実行タスクコマンド記憶部33は、応答
文生成手段23で応答文を生成した中で、確信度が低
く、応答文が質問型「〜しますか」などになったとき
に、そのタスクコマンドを記憶している。
【0065】図4は、本発明の第2の実施例の動作を説
明するための流れ図である。図3及び図4を参照して、
本発明の第2の実施例の動作について説明する。入力装
置1で得た入力文字列は自然言語解析手段21に供給さ
れ(図4のステップ201)、自然言語解析手段21
は、辞書記憶部31に記憶されている語彙を参照して、
この入力文字列を解釈し、解釈可能な複数のタスクコマ
ンドに変換し(図4のステップ202)、曖昧性解消手
段22は、曖昧性解消情報記憶部32に記憶されている
情報を参照して、タスクコマンドが複数存在している時
に1つに絞り込み(図4のステップ203)、また、ど
のようにタスクコマンドを1つに絞ったかを用いてシス
テムが曖昧性を解消した結果の確信度を求める(図4の
ステップ204)。
【0066】前記第1の実施例では、確信度の大きさに
かかわらず、応答文生成手段23で応答文を生成し、出
力装置4で出力していた。
【0067】本発明の第2の実施例では、曖昧性解析手
段22で求められた確信度に応じて、システムがタスク
コマンドを実行してよいかどうか判断する(図4のステ
ップ205)。
【0068】ステップ205で、確信度が低く、タスク
コマンドを実行してはいけないと判断したときには、未
実行タスクコマンド記憶部33に、タスクコマンドが記
憶される(図4のステップ208)。
【0069】そして、タスクコマンドを実行してよいか
どうかを表す「〜していいですか?」というような応答
文を応答文生成手段23で生成する(図4のステップ2
09)。
【0070】該応答文に対する、ユーザからの返答入力
を入力装置1を介してを得ると(ステップ201)、自
然言語解析手段21は、入力の自然言語と未実行タスク
コマンド記憶部33で記憶されている未実行タスクコマ
ンドを参照して、解釈可能な複数のタスクコマンドに変
換する(図4のステップ202)。
【0071】図4のステップ203では、複数のタスク
コマンドの絞り込みを行ない、ステップ204では、絞
り込まれたタスクコマンドの確信度を求め、確信度によ
りタスクコマンドを実行してよいかどうかを判断する。
【0072】「〜していいですか?」のような応答に対
して、図4のステップ204で求めた確信度が高いとき
には、入力が「はい」のような肯定を意味する入力か、
「いいえ」のような否定を意味する入力かどうかを判断
する(図4のステップ206)。
【0073】ユーザから入力が、肯定を意味するもので
ある時には、応答文生成手段23はタスク実行手段24
にタスクコマンドを送り、タスク実行手段24でタスク
を実行する。
【0074】また応答文生成手段23は、タスクの実行
完了を表す「〜しました。」のような応答文を生成する
(図4のステップ207)。
【0075】また、否定を意味する入力の時には、タス
クコマンドを破棄し、未実行タスクの取り消しを表す
「〜を取り消します」のような応答文を生成する(図4
のステップ210)。
【0076】本発明の第2の実施例について具体例に即
して説明する。以下の例でも、前記第1の実施例と同様
にテレビとビデオがある家の中での状況を想定して説明
する。
【0077】今、ユーザがテレビの電源をつけるため
に、「テレビ」とマイクに向かって話したとする。
【0078】入力装置1をなす音声認識システムは、
「テレビ」と音声認識し、テキスト文字に変換する。
【0079】このテキスト文字と辞書記憶部31とを参
照して、自然言語解析手段21は、 ・「テレビの電源をつける」、 ・「テレビのチャンネルを1にする」、 ・「テレビのチャンネルを2にする」、… といった複数のタスクコマンドに変換する。
【0080】曖昧性解消手段22は、曖昧性解消情報記
憶部32からテレビの現在状況を見て、入力された「テ
レビ」に対するタスクとしては、「テレビの電源はオ
フ」から、「テレビの電源をつける」くらいの操作で大
丈夫だろうと判断し、絞り込む。また確信度は前記確信
度での最大〜最小の5段階評価で「確信度最小」と求め
たとする。
【0081】応答文生成手段23は、確信度最小と「テ
レビの電源をつける」というタスクコマンドと辞書記憶
部31を参照して、「テレビをつけますか?」という応
答文を生成し、出力装置4をなす音声合成システムのス
ピーカーに出力する。
【0082】また「テレビの電源をつける」というタス
クコマンドを未実行タスクコマンド記憶部33に記憶す
る。
【0083】このシステムからの応答後に、ユーザが
「はい」と入力すると、自然言語解析手段31は、辞書
記憶部31を参照して、この発話が肯定を意味する語だ
と認識し、また未実行タスクコマンド記憶部33に、
「テレビの電源をつける」というコマンドが記憶されて
いるため、「テレビの電源をつける」というタスクコマ
ンドを生成する。
【0084】曖昧性解消手段22では、すでにタスクコ
マンドが一意に決まっているため、確信度を最大〜最小
の5段階評価で、「確信度最大」とする。
【0085】応答文生成手段23では、確信度最大と
「テレビの電源をつける」というタスクコマンドと辞書
記憶部31を参照して、「テレビの電源をつけました」
という応答文を生成し、音声合成システムでスピーカに
出力する。
【0086】次に本発明の第3の実施例について図面を
参照して詳細に説明する。
【0087】図5は、本発明の第3の実施例の構成を示
す図である。図5において、図3に示した要素と同等の
要素には同一の参照符号が付されている。
【0088】図5を参照すると、本発明の第3の実施例
は、データ処理装置2は、図3に示した前記第2の実施
例と同様に、自然言語解析手段21、曖昧製解消手段2
2、応答文生成手段23、タスク実行手段24を備えて
いる。記憶装置3は、辞書記憶部31、曖昧性解消情報
記憶部32、キャンセルコマンド記憶部34を備えてい
る。
【0089】キャンセルコマンド記憶部34には、ユー
ザの意図に反したタスクを実行してしまったときに、元
に復旧するためのタスクコマンドが予め記憶されてい
る。
【0090】図6は、本発明の第3の実施例の動作を説
明するための流れ図である。図5及び図6を参照して、
本発明の第3の実施例の動作について詳細に説明する。
なお、図6のステップ301〜304は、図2に示した
ステップ201〜204と同様とされる。
【0091】前記第1の実施例では、曖昧性解消手段2
2で確信度が高く求められてしまうと、ユーザの意図に
反したものでも、応答文生成部23で実行完了の応答文
を生成して出力装置4に出力してしまう。
【0092】本発明の第3の実施例においては、システ
ムがタスク実行完了の応答文を応答文生成手段23で生
成し、出力装置4に出力した時に、キャンセルや取り消
しを意味する入力を受け付けると、図6のステップ30
1−304の一連の処理において、図4のステップ20
1−204の前記第2の実施例の処理と同様に、タスク
コマンドを1つに絞り込む。その際、キャンセルや取り
消しを意味する入力を受け付けた時には、キャンセルコ
マンドが絞り込まれる。
【0093】絞り込まれたタスクコマンドがキャンセル
コマンドであるか否か判定する(図6のステップ30
5)。
【0094】キャンセルコマンドでなければ、前記第1
の実施例と同様に、確信度に応じて応答文生成部23で
応答文を生成し、出力装置4に出力する(図6のステッ
プ306)。
【0095】キャンセルコマンドである場合、キャンセ
ルコマンド記憶部34を参照して応答文生成部23で応
答文を生成し、出力装置4に出力する(図6のステップ
307)。
【0096】例えば、システムが「テレビをつけまし
た」という応答文を返した時に、ユーザが、キャンセル
や取り消しを意味する入力として、「違う」と答えた時
に、システムは、「テレビを消しました」という応答文
を生成する。
【0097】本発明の第3の実施例について具体例に即
して説明する。以下でも、前記第1の実施例と同様にテ
レビとビデオがある家の中での状況を想定する。
【0098】今、ユーザがテレビの電源をつけるため
に、「テレビをつけて」とマイクに向かって話したとす
る。
【0099】入力装置1をなす音声認識システムは、あ
やまって「ビデオをつけて」と誤認識し、テキスト文字
に変換する。このテキスト文字と辞書記憶部31を参照
して自然言語解析手段21は、「ビデオの電源をつけ
る」というタスクコマンドに変換する。
【0100】曖昧性解消手段22では、すでにタスクコ
マンドが一意に決まっているので、「確信度最大」とす
る。
【0101】応答文生成手段23は、「確信度最大」
と、「ビデオの電源をつける」というタスクコマンドと
辞書記憶部31を参照して、「ビデオの電源をつけまし
た」という応答文を生成し、出力装置4をなす音声合成
システムでスピーカに出力する。
【0102】また、キャンセルコマンド記憶部34に、
「ビデオの電源をつける」という操作の逆操作である
「ビデオの電源を消す」というコマンドが記憶される。
【0103】システムはユーザの意図とは異なる応答を
したために、マイクからユーザは「違う」と入力した場
合、自然言語解析手段31は辞書記憶部31を参照して
この発話がキャンセルを意味する語だと認識し、またキ
ャンセルコマンド記憶部34に「ビデオの電源を消す」
というタスクコマンドが記憶されていることを認識し
て、「ビデオの電源を消す」というタスクコマンドを生
成する。
【0104】曖昧性解消手段22では、すでにタスクコ
マンドが一意に決まっているので、確信度最大とする。
【0105】応答文生成手段23では、「確信度最大」
と「ビデオの電源を消す」というタスクコマンドと辞書
記憶部31を参照して、「ビデオの電源を消しました」
という応答文を生成し、該応答文を出力装置4をなす音
声合成システムよりスピーカに出力する。
【0106】次に本発明の第4の実施例について説明す
る。図7は、本発明の第4の実施例の構成を示す図であ
る。図7を参照すると、本発明の第4の実施例は、図3
に示した前記第2の実施例に、時間管理部35を記憶装
置3に備えたものである。
【0107】図8は、本発明の第4の実施例の動作を説
明するための流れ図である。図7及び図8を参照して、
本発明の第4の実施例の動作について説明する。
【0108】図8のステップ402−405、ステップ
408−409は、その流れ図を図4に示した前記第2
の実施例における202−205、ステップ208−2
09と同一とされ、また、図8のステップ406、40
7、410は、前記第2の実施例におけるステップ20
6、207、210と同一の処理とされている。前記第
2の実施例と同様な手順で、図8のステップ409まで
処理が終わったとする。前記第2の実施例では、図4に
示すように、ステップ209で応答文を生成して、入力
装置1でユーザからの返答入力を待ち、返答が入力され
たときにステップ201からの処理を行っている。
【0109】本発明の第4の実施例では、システムがユ
ーザの入力を待つような応答をしたときに、時間管理部
35に現在時刻を設定し、入力装置1では、不図示のタ
イマ(計時手段)により予め定められた一定時間だけ待
つことにする(図8のステップ401)。
【0110】一定時間内に、すなわち、タイマでのタイ
ムアウト発生前に、応答文に対するユーザからの入力が
あれば、以下の処理を前記第2の実施例と同様に行う
(図8のステップ402以降)。
【0111】一定時間の間にユーザからの入力がなけれ
ば、すんわち、タイマでのタイムアウトが発生した際に
は、ユーザは、応答の内を了解したものとして、入力装
置1にユーザが肯定を意味する入力を行なったものとみ
なす。
【0112】ステップ409で生成された「〜していい
ですか?」のような応答に対して、図8のステップ40
4で求めた確信度が高いときには、入力が「はい」のよ
うな肯定を意味する入力か、「いいえ」のような否定を
意味する入力かどうかを判断する(図8のステップ40
6)。
【0113】ユーザから入力が、肯定を意味するもので
ある時には、応答文生成手段23はタスク実行手段24
にタスクコマンドを送り、タスク実行手段24でタスク
を実行する。
【0114】また応答文生成手段23は、タスクの実行
完了を表す「〜しました。」のような応答文を生成する
(図8のステップ407)。
【0115】また、否定を意味する入力の時には、タス
クコマンドを破棄し、未実行タスクの取り消しを表す
「〜を取り消します」のような応答文を生成する(図8
のステップ410)。
【0116】本発明の第4の実施例について具体例に即
して以下に説明する。以下でも、前記第2の実施例と同
様にテレビとビデオがある家の中での状況を想定して説
明する。
【0117】今、ユーザがテレビの電源をつけた後に、
テレビのチャンネルを1にするために「1チャンネルに
して」とマイクに向かって話したものとする。音声認識
システムは「1チャンネルにして」と認識し、テキスト
文字に変換する。
【0118】このテキスト文字と辞書を参照して自然言
語解析手段31は、「テレビのチャンネルを1にす
る」、「ビデオのチャンネルを1にする」という複数の
タスクコマンドに変換する。
【0119】曖昧性解消手段22では、文脈を用いて
「テレビの電源をつける」を実行した後であることか
ら、「テレビのチャンネルを1にする」であるものと判
断する。また、文脈を用いて曖昧性を解消したので、確
信度を中とする。
【0120】応答文生成手段23では確信度中と「テレ
ビのチャンネルを1にする」というタスクコマンドと辞
書記憶部31を参照して、「テレビのチャンネルを1に
しますね」という応答文を生成し、出力装置4をなす音
声合成システムでスピーカに出力する。
【0121】また、未実行タスクコマンド記憶部33に
「テレビのチャンネルを1にする」というタスクコマン
ドを記憶する。
【0122】またスピーカで応答文を出力するのと同時
に、時間管理部35に、現在時刻を記憶させる。
【0123】出力装置4をなすスピーカからの応答文を
出力した後、ユーザから一定時間入力がないときには、
入力装置1から肯定を表す語が入力されたものとして、
前記第2の実施例と同様な処理を行い、応答文生成手段
23において、「テレビのチャンネル1を1にしまし
た」という応答文を生成し、該応答文を、出力装置4を
なす音声合成システムよりスピーカに出力する。
【0124】
【発明の効果】以上説明したように、本発明によれば下
記記載の効果を奏する。
【0125】本発明の第1の効果は、にユーザはその応
答に必ずしも返答する必要がなくなるので、ユーザにか
かる負荷を削減する、ということである。
【0126】その理由は次の通りである。本発明におい
ては、システムが求めた確信度を用いて応答文を変化さ
せることで、システムは必ずしも確認を求める応答文を
出力するわけではない。このため、ユーザはシステムか
らの応答に必ずしも返答する必要がないためである。
【0127】本発明の第2の効果は、システムが操作を
行う前に、ユーザとシステムとの対話により曖昧性を解
消することを可能とし、システムがユーザの本来の意図
とは異なった解釈をする可能性を低減し、その結果、ユ
ーザは修正取り消し作業を行う可能性を特段に低減して
いる、ということである。
【0128】その理由は、本発明においては、システム
が求めた確信度が低いときには、システムは、システム
で解釈したタスクを実行してよいかどうかをユーザに質
問する構成とされているためである。
【0129】本発明の第3の効果は、システムがユーザ
の意図と異なった解釈をしてしまう場合でも、修正取り
消し可能とし、ユーザにかかる負荷を削減する、という
ことである。
【0130】本発明の第4の効果は、システムがユーザ
に質問をしたときに、ユーザから一定時間応答がないと
システムに肯定を表す語が入力されたときと同様な処理
がおこなわれ、このため、ユーザはシステムの確認を表
す応答に必ずしも答える必要がないので、ユーザの負荷
を削減する、ということである。
【図面の簡単な説明】
【図1】本発明の第1の実施例の構成を示す図である。
【図2】本発明の第1の実施例の動作を説明するための
流れ図である。
【図3】本発明の第2の実施例の構成を示すブロック図
である。
【図4】本発明の第2の実施例の動作を説明するための
流れ図である。
【図5】本発明の第3の実施例の構成を示す図である。
【図6】本発明の第3の実施例の動作を説明するための
流れ図である。
【図7】本発明の第4の実施例の構成を示す図である。
【図8】本発明の第4の実施例の動作を説明するための
流れ図である。
【符号の説明】
1 入力装置 2 データ処理装置 3 記憶装置 4 出力装置 21 自然言語解析手段 22 曖昧性解消手段 23 応答文生成手段 24 タスク実行手段 31 辞書記憶部 32 曖昧性解消情報記憶部 33 未実行タスクコマンド記憶部 34 キャンセルコマンド記憶部 35 時間管理部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 3/00 537Z 561C Fターム(参考) 5B091 AA15 CA12 CA14 CB12 CD03 DA09 5D015 AA05 HH23 KK02 KK04 LL04 LL05 5D045 AB01

Claims (19)

    【特許請求の範囲】
  1. 【請求項1】入力された自然言語を解釈するために必要
    な語彙と、該自然言語の解釈結果から応答文を生成する
    ために必要な語彙とを予め記憶する辞書記憶部と、 前記辞書記憶部を参照して、入力手段から入力された自
    然言語の解釈を行う自然言語解析手段と、 前記自然言語解析手段で求められた解釈結果が複数存在
    した場合、1つの解釈結果に絞り込むための手がかりと
    して用いられる情報を記憶する曖昧性解消情報記憶部
    と、 前記自然言語解析手段で求められた解釈結果が複数存在
    した場合に、前記曖昧性解消情報記憶部を参照して、前
    記複数の解釈結果を1つに絞り込むとともに、前記1つ
    に絞り込んだ解釈結果に対する確信度を求める曖昧性解
    消手段と、 前記曖昧性解消手段で絞り込んだ解釈結果を応答文とし
    て出力し、その際、前記曖昧性解消手段で求められた前
    記確信度に応じて応答文を変更させる応答文生成手段
    と、 を備えたことを特徴とする自然言語を用いた対話システ
    ム。
  2. 【請求項2】前記曖昧性解消手段で求められた解釈を受
    けて、該解釈に対応するタスクコマンドを実行するタス
    ク実行手段をさらに備えたことを特徴とする請求項1に
    記載の自然言語を用いた対話システム。
  3. 【請求項3】前記応答文生成手段が、前記曖昧性解消手
    段で求められた確信度に応じて、前記タスク実行手段で
    タスクを実行した後にタスクの実行を報告する応答文を
    生成するか、もしくは、前記タスク実行手段でタスクを
    実行する前にタスクを実行してとよいか否かを確認する
    ための応答文を生成するか、を決定する、ことを特徴と
    する請求項2に記載の自然言語を用いた対話システム。
  4. 【請求項4】前記応答文生成手段が、前記曖昧性解消手
    段で求められた確信度に応じて、応答文を生成するかし
    ないかを決定する、ことを特徴とする請求項2又は3に
    記載の自然言語を用いた対話システム。
  5. 【請求項5】前記応答文生成手段が、前記曖昧性解消手
    段で求められた確信度に応じて、前記曖昧性解消手段が
    解釈した結果を、報告、確認、及び質問のうちのいずれ
    かを表す応答文に変更する、ことを特徴とする請求項
    2、3、4のいずれか一に記載の自然言語を用いた対話
    システム。
  6. 【請求項6】実行を行ったタスクコマンドに対する逆操
    作のタスクコマンドを記憶するキャンセルコマンド記憶
    部と、 キャンセルの意味を表す入力がなされたときに、前記タ
    スク実行手段でキャンセルコマンドを実行するととも
    に、前記応答文生成手段において、キャンセルコマンド
    を実行したことを報告する応答文を生成する、ことを特
    徴とする請求項2、3、4、5のいずれか一に記載の自
    然言語を用いた対話システム。
  7. 【請求項7】システムがタスクコマンドを実行してよう
    かどうかの確認をとる応答文を出力した後、時間の経過
    を測定する時間管理手段を備え、 前記時間管理手段で計時を開始後、あらかじめ定められ
    た所定の時間が経過しても、ユーザからの応答がない場
    合には、肯定を表す入力が前記入力手段から入力された
    ものと解釈する、ことを特徴とする請求項2乃至6のい
    ずれか一に記載の自然言語を用いた対話システム。
  8. 【請求項8】前記時間管理手段で計時を開始後、前記所
    定の時間が経過した後に、肯定を表す入力が前記入力手
    段から入力されたか否かを、前記曖昧性解消手段で求め
    た確信度に応じて決定する、ことを特徴とする請求項7
    に記載の自然言語を用いた対話システム。
  9. 【請求項9】入力手段から入力された自然言語を受け取
    り、語彙辞書を参照して1又は複数のタスクコマンドに
    変換する自然言語解析手段と、 曖昧性解消情報を参照して、複数のタスクコマンドを1
    つに絞り込むとともに、絞り込みの仕方から、確信度を
    求める曖昧性解消手段と、 絞り込んだタスクコマンドと求められた確信度と語彙辞
    書とを参照して、前記確信度に応じた応答文を生成し、
    出力手段に出力する応答文生成手段と、を備えたことを
    特徴とする自然言語対話処理装置。
  10. 【請求項10】入力手段から入力された自然言語を語彙
    辞書を参照して解釈し、解釈結果として該自然言語に対
    応した1又は複数のタスクコマンドを候補として出力す
    る自然言語解析手段と、 前記自然言語解析手段で求められたタスクコマンドが複
    数存在した場合、該解釈された自然言語の文脈情報、タ
    スクの履歴情報、該タスク候補の処理対象物の状況情報
    のいずれかの情報を含む、曖昧性を解消するための所定
    の情報に基づき、1つのタスクコマンドに絞り込むとと
    もに、前記1つに絞り込んだタスクコマンドに対する確
    信度を求める曖昧性解消手段と、 前記曖昧性解消手段で求められたタスクコマンド及び前
    記確信度に応じて応答文を自動作成して出力手段から出
    力する応答文生成手段と、 前記タスクコマンドを実行するタスク実行手段とを備え
    たことを特徴とする自然言語対話処理装置。
  11. 【請求項11】前記一つの絞り込まれたタスクコマンド
    の確信度が小の場合、該タスクコマンドを直ちに実行せ
    ずに一旦未実行コマンド記憶手段に記憶しておき、前記
    応答文生成手段が、前記タスクコマンドを実行してよい
    か否かを確認するための応答文を生成して前記出力手段
    に出力し、 該応答文に対してユーザが肯定を意味する入力を前記入
    力手段から行なった場合、前記未実行コマンド記憶手段
    からタスクコマンドを取り出して前記タスク実行手段で
    前記タスクコマンドを実行し、前記応答文生成手段では
    タスク実行完了の応答文を出力し、一方、否定を意味す
    る入力が前記入力手段から行われた場合、前記応答文生
    成手段では未実行タスク取り消しの応答文を作成して出
    力する、ことを特徴とする請求項10記載の自然言語対
    話処理装置。
  12. 【請求項12】前記タスク実行手段で実行したたタスク
    コマンドの操作をキャンセルするキャンセルコマンドを
    記憶するキャンセルコマンド記憶手段をさらに備え、 タスクコマンド実行後該タスクのキャンセルの意味を表
    す入力が前記入力手段から行われたときに、前記キャン
    セルコマンド記憶手段から前記キャンセルコマンドを読
    み出して前記タスク実行手段で前記キャンセルコマンド
    を実行するとともに、前記応答文生成手段において、前
    記キャンセルコマンドを実行したことを報告する応答文
    を生成出力する、ことを特徴とする請求項10又は11
    記載の自然言語対話処理装置。
  13. 【請求項13】前記応答文生成手段が、前記タスクコマ
    ンドを実行してよいか否かを確認するための応答文を生
    成して出力した後、時間の経過を測定する時間管理手段
    を備え、 前記時間管理手段で計時を開始後、あらかじめ定められ
    た所定の時間が経過しても、ユーザからの応答がない場
    合には、肯定を表す入力が前記入力手段に入力されたも
    のと解釈する、ことを特徴とする請求項11記載の自然
    言語対話処理装置。
  14. 【請求項14】前記入力手段が入力された音声を認識し
    てテキストに変換出力する音声認識手段よりなり、前記
    出力手段が、前記応答文生成手段で作成された前記応答
    文のテキスト情報を入力し音声合成して音声出力手段か
    ら出力する音声合成手段よりなる、ことを特徴とする請
    求項10乃至13のいずれか一に記載の自然言語対話処
    理装置。
  15. 【請求項15】請求項14記載の自然言語対話処理装置
    において、 一又は複数の機器の所定の操作を、前記所定の操作を指
    示するユーザからの音声入力により行なうことを特徴と
    する自然言語対話処理装置。
  16. 【請求項16】(a)入力手段から入力された自然言語
    について語彙辞書記憶部を参照して解釈を行う自然言語
    解析処理と、 (b)前記自然言語解析処理で求められた解釈結果が複
    数存在した時に、複数の解釈結果を1つの解釈結果に絞
    り込むための手がかりとして用いられる情報を記憶する
    曖昧性解消情報記憶部を参照して、前記複数の解釈結果
    を1つに絞り込むとともに、前記1つに絞り込んだ解釈
    結果に対する確信度を求める曖昧性解消処理と、 (c)前記曖昧性解消処理で絞り込んだ解釈結果を語彙
    辞書記憶部を参照して応答文として自動生成し出力手段
    から出力し、その際、前記曖昧性解消手段で求められた
    前記確信度に応じて応答文を変化させる応答文生成処理
    と、 の前記(a)乃至(c)の処理をコンピュータで実行さ
    せるためのプログラムを記録した記録媒体。
  17. 【請求項17】請求項16記載の記録媒体において、 (d)前記曖昧性解消処理(b)で求められた解釈を受
    けて、該解釈に対応するタスクコマンドを実行する処
    理、 を前記コンピュータで実行させるためのプログラムを記
    録した記録媒体。
  18. 【請求項18】請求項17記載の記録媒体において、 前記応答文生成処理(c)が、前記曖昧性解消処理
    (b)で求められた確信度に応じて、タスクを実行した
    後にタスクの実行を報告する応答文を生成するか、もし
    くは、タスクを実行する前にタスクを実行してとよいか
    否かを確認するための応答文を生成するかを決定する処
    理を含み、前記処理を前記コンピュータで実行させるた
    めのプログラムを記録した記録媒体。
  19. 【請求項19】請求項17記載の記録媒体において、 実行を行ったタスクコマンドに対する逆操作のタスクコ
    マンドを記憶するキャンセルコマンド記憶部を備え、 (f)キャンセルの意味を表す入力が前記入力手段から
    行われたときに、キャンセルコマンドを実行するととも
    に、前記応答文生成処理(c)において、キャンセルコ
    マンドを実行したことを報告する応答文を生成する処理
    を、前記コンピュータで実行させるためのプログラムを
    記録した記録媒体。
JP20253899A 1999-07-16 1999-07-16 自然言語を用いた対話システム Expired - Fee Related JP3662780B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP20253899A JP3662780B2 (ja) 1999-07-16 1999-07-16 自然言語を用いた対話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP20253899A JP3662780B2 (ja) 1999-07-16 1999-07-16 自然言語を用いた対話システム

Publications (2)

Publication Number Publication Date
JP2001034289A true JP2001034289A (ja) 2001-02-09
JP3662780B2 JP3662780B2 (ja) 2005-06-22

Family

ID=16459171

Family Applications (1)

Application Number Title Priority Date Filing Date
JP20253899A Expired - Fee Related JP3662780B2 (ja) 1999-07-16 1999-07-16 自然言語を用いた対話システム

Country Status (1)

Country Link
JP (1) JP3662780B2 (ja)

Cited By (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520982A (ja) * 1991-07-16 1993-01-29 Aichi Denki Seisakusho:Kk 真空切替遮断器
JP2002169590A (ja) * 2000-12-01 2002-06-14 Namco Ltd 模擬会話システム、模擬会話方法、および情報記憶媒体
JP2002287793A (ja) * 2001-03-28 2002-10-04 Just Syst Corp コマンド処理装置、コマンド処理方法、及びコマンド処理プログラム
JP2002304192A (ja) * 2001-04-05 2002-10-18 Denso Corp 音声認識装置
JP2005181386A (ja) * 2003-12-16 2005-07-07 Mitsubishi Electric Corp 音声対話処理装置及び音声対話処理方法並びにプログラム
JP2005300989A (ja) * 2004-04-13 2005-10-27 Mitsubishi Electric Corp 音声認識システム
JP2006146182A (ja) * 2004-11-16 2006-06-08 Microsoft Corp 音声コマンドを明瞭化する集中化された方法およびシステム
JP2009036999A (ja) * 2007-08-01 2009-02-19 Infocom Corp コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体
US7516077B2 (en) 2002-07-25 2009-04-07 Denso Corporation Voice control system
WO2013190956A1 (ja) * 2012-06-19 2013-12-27 株式会社エヌ・ティ・ティ・ドコモ 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム
JP2015018265A (ja) * 2011-09-28 2015-01-29 アップル インコーポレイテッド コンテキスト情報を使用した音声認識修正
US9548050B2 (en) 2010-01-18 2017-01-17 Apple Inc. Intelligent automated assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9632650B2 (en) 2006-03-10 2017-04-25 Microsoft Technology Licensing, Llc Command searching enhancements
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
WO2017145373A1 (ja) * 2016-02-26 2017-08-31 三菱電機株式会社 音声認識装置
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10102359B2 (en) 2011-03-21 2018-10-16 Apple Inc. Device access using voice authentication
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
JP2019523907A (ja) * 2016-06-07 2019-08-29 グーグル エルエルシー パーソナルアシスタントモジュールによる非決定的なタスク開始
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
JP2019185360A (ja) * 2018-04-09 2019-10-24 富士ゼロックス株式会社 情報処理装置およびプログラム
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
JP2020505643A (ja) * 2017-02-15 2020-02-20 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 音声認識方法、電子機器、及びコンピュータ記憶媒体
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05216618A (ja) * 1991-11-18 1993-08-27 Toshiba Corp 音声対話システム
JPH09171394A (ja) * 1995-11-06 1997-06-30 Thomson Multimedia Sa 家庭環境内の装置の音声識別システム
JPH11143489A (ja) * 1997-11-10 1999-05-28 Sony Corp 音声操作機能付き電子機器、電子機器における音声操作方法、及び音声操作機能付き電子機器を備える自動車

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05216618A (ja) * 1991-11-18 1993-08-27 Toshiba Corp 音声対話システム
JPH09171394A (ja) * 1995-11-06 1997-06-30 Thomson Multimedia Sa 家庭環境内の装置の音声識別システム
JPH11143489A (ja) * 1997-11-10 1999-05-28 Sony Corp 音声操作機能付き電子機器、電子機器における音声操作方法、及び音声操作機能付き電子機器を備える自動車

Cited By (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0520982A (ja) * 1991-07-16 1993-01-29 Aichi Denki Seisakusho:Kk 真空切替遮断器
US9646614B2 (en) 2000-03-16 2017-05-09 Apple Inc. Fast, language-independent method for user authentication by voice
JP2002169590A (ja) * 2000-12-01 2002-06-14 Namco Ltd 模擬会話システム、模擬会話方法、および情報記憶媒体
JP2002287793A (ja) * 2001-03-28 2002-10-04 Just Syst Corp コマンド処理装置、コマンド処理方法、及びコマンド処理プログラム
JP4724943B2 (ja) * 2001-04-05 2011-07-13 株式会社デンソー 音声認識装置
JP2002304192A (ja) * 2001-04-05 2002-10-18 Denso Corp 音声認識装置
US7516077B2 (en) 2002-07-25 2009-04-07 Denso Corporation Voice control system
JP2005181386A (ja) * 2003-12-16 2005-07-07 Mitsubishi Electric Corp 音声対話処理装置及び音声対話処理方法並びにプログラム
JP2005300989A (ja) * 2004-04-13 2005-10-27 Mitsubishi Electric Corp 音声認識システム
JP2006146182A (ja) * 2004-11-16 2006-06-08 Microsoft Corp 音声コマンドを明瞭化する集中化された方法およびシステム
US8942985B2 (en) 2004-11-16 2015-01-27 Microsoft Corporation Centralized method and system for clarifying voice commands
US9972317B2 (en) 2004-11-16 2018-05-15 Microsoft Technology Licensing, Llc Centralized method and system for clarifying voice commands
US10748530B2 (en) 2004-11-16 2020-08-18 Microsoft Technology Licensing, Llc Centralized method and system for determining voice commands
US10318871B2 (en) 2005-09-08 2019-06-11 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9632650B2 (en) 2006-03-10 2017-04-25 Microsoft Technology Licensing, Llc Command searching enhancements
JP2009036999A (ja) * 2007-08-01 2009-02-19 Infocom Corp コンピュータによる対話方法、対話システム、コンピュータプログラムおよびコンピュータに読み取り可能な記憶媒体
US9626955B2 (en) 2008-04-05 2017-04-18 Apple Inc. Intelligent text-to-speech conversion
US9865248B2 (en) 2008-04-05 2018-01-09 Apple Inc. Intelligent text-to-speech conversion
US10795541B2 (en) 2009-06-05 2020-10-06 Apple Inc. Intelligent organization of tasks items
US11080012B2 (en) 2009-06-05 2021-08-03 Apple Inc. Interface for a virtual digital assistant
US10283110B2 (en) 2009-07-02 2019-05-07 Apple Inc. Methods and apparatuses for automatic speech recognition
US9548050B2 (en) 2010-01-18 2017-01-17 Apple Inc. Intelligent automated assistant
US10706841B2 (en) 2010-01-18 2020-07-07 Apple Inc. Task flow identification based on user intent
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US9633660B2 (en) 2010-02-25 2017-04-25 Apple Inc. User profiling for voice input processing
US10049675B2 (en) 2010-02-25 2018-08-14 Apple Inc. User profiling for voice input processing
US10102359B2 (en) 2011-03-21 2018-10-16 Apple Inc. Device access using voice authentication
JP2015018265A (ja) * 2011-09-28 2015-01-29 アップル インコーポレイテッド コンテキスト情報を使用した音声認識修正
US9953088B2 (en) 2012-05-14 2018-04-24 Apple Inc. Crowd sourcing information to fulfill user requests
US10079014B2 (en) 2012-06-08 2018-09-18 Apple Inc. Name recognition system
JPWO2013190956A1 (ja) * 2012-06-19 2016-05-26 株式会社Nttドコモ 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム
WO2013190956A1 (ja) * 2012-06-19 2013-12-27 株式会社エヌ・ティ・ティ・ドコモ 機能実行指示システム、機能実行指示方法及び機能実行指示プログラム
US9971774B2 (en) 2012-09-19 2018-05-15 Apple Inc. Voice-based media searching
US9620104B2 (en) 2013-06-07 2017-04-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9966060B2 (en) 2013-06-07 2018-05-08 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US10657961B2 (en) 2013-06-08 2020-05-19 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US9966068B2 (en) 2013-06-08 2018-05-08 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10185542B2 (en) 2013-06-09 2019-01-22 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
US10169329B2 (en) 2014-05-30 2019-01-01 Apple Inc. Exemplar-based natural language processing
US9668024B2 (en) 2014-06-30 2017-05-30 Apple Inc. Intelligent automated assistant for TV user interactions
US10904611B2 (en) 2014-06-30 2021-01-26 Apple Inc. Intelligent automated assistant for TV user interactions
US9986419B2 (en) 2014-09-30 2018-05-29 Apple Inc. Social reminders
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US10356243B2 (en) 2015-06-05 2019-07-16 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
WO2017145373A1 (ja) * 2016-02-26 2017-08-31 三菱電機株式会社 音声認識装置
JPWO2017145373A1 (ja) * 2016-02-26 2018-08-09 三菱電機株式会社 音声認識装置
US10446155B2 (en) 2016-02-26 2019-10-15 Mitsubishi Electric Corporation Voice recognition device
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
JP2019523907A (ja) * 2016-06-07 2019-08-29 グーグル エルエルシー パーソナルアシスタントモジュールによる非決定的なタスク開始
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
US10354011B2 (en) 2016-06-09 2019-07-16 Apple Inc. Intelligent automated assistant in a home environment
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US10297253B2 (en) 2016-06-11 2019-05-21 Apple Inc. Application integration with a digital assistant
US10089072B2 (en) 2016-06-11 2018-10-02 Apple Inc. Intelligent device arbitration and control
US10521466B2 (en) 2016-06-11 2019-12-31 Apple Inc. Data driven natural language event detection and classification
US10269345B2 (en) 2016-06-11 2019-04-23 Apple Inc. Intelligent task discovery
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
JP2020505643A (ja) * 2017-02-15 2020-02-20 ▲騰▼▲訊▼科技(深▲セン▼)有限公司 音声認識方法、電子機器、及びコンピュータ記憶媒体
US10755703B2 (en) 2017-05-11 2020-08-25 Apple Inc. Offline personal assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US10410637B2 (en) 2017-05-12 2019-09-10 Apple Inc. User-specific acoustic models
US10791176B2 (en) 2017-05-12 2020-09-29 Apple Inc. Synchronization and task delegation of a digital assistant
US10810274B2 (en) 2017-05-15 2020-10-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10482874B2 (en) 2017-05-15 2019-11-19 Apple Inc. Hierarchical belief states for digital assistants
US11217255B2 (en) 2017-05-16 2022-01-04 Apple Inc. Far-field extension for digital assistant services
JP2019185360A (ja) * 2018-04-09 2019-10-24 富士ゼロックス株式会社 情報処理装置およびプログラム

Also Published As

Publication number Publication date
JP3662780B2 (ja) 2005-06-22

Similar Documents

Publication Publication Date Title
JP2001034289A (ja) 自然言語を用いた対話システム
US11393476B2 (en) Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface
US9805723B1 (en) Method for processing the output of a speech recognizer
US6952665B1 (en) Translating apparatus and method, and recording medium used therewith
US20020178005A1 (en) System and method for adaptive language understanding by computers
JP4729902B2 (ja) 音声対話システム
CN110021293B (zh) 语音识别方法及装置、可读存储介质
JP2007093789A (ja) 音声認識装置、音声認識方法および音声認識プログラム
JPH07219961A (ja) 音声対話システム
JP2007041319A (ja) 音声認識装置および音声認識方法
CN114127710A (zh) 利用对话搜索历史的歧义解决方案
US11942091B2 (en) Alphanumeric sequence biasing for automatic speech recognition using a grammar and a speller finite state transducer
US11532301B1 (en) Natural language processing
JP2002207496A (ja) 音声処理システム
JPH09127978A (ja) 音声認識方法及び装置及びコンピュータ制御装置
US11823664B2 (en) Correcting speech misrecognition of spoken utterances
Kumar et al. Enabling the rapid development and adoption of speech-user interfaces
KR20230158107A (ko) 효율적인 스트리밍 비-순환 온-디바이스 엔드-투-엔드 모델
US11626107B1 (en) Natural language processing
US7272560B2 (en) Methodology for performing a refinement procedure to implement a speech recognition dictionary
JP2003162524A (ja) 言語処理装置
US20240233732A1 (en) Alphanumeric sequence biasing for automatic speech recognition
US20230206910A1 (en) Method and system for recognizing a user utterance
CN112669848B (zh) 一种离线语音识别方法、装置、电子设备及存储介质
Christina et al. Powerpoint Controller using Speech Recognition

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030603

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050202

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050324

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080401

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090401

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100401

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110401

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120401

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120401

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130401

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130401

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140401

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees