JP2003058188A - 音声対話システム - Google Patents

音声対話システム

Info

Publication number
JP2003058188A
JP2003058188A JP2001245707A JP2001245707A JP2003058188A JP 2003058188 A JP2003058188 A JP 2003058188A JP 2001245707 A JP2001245707 A JP 2001245707A JP 2001245707 A JP2001245707 A JP 2001245707A JP 2003058188 A JP2003058188 A JP 2003058188A
Authority
JP
Japan
Prior art keywords
voice
dictionary
recognition
voice recognition
engine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001245707A
Other languages
English (en)
Inventor
Hideki Nakamura
英樹 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Original Assignee
Denso Ten Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd filed Critical Denso Ten Ltd
Priority to JP2001245707A priority Critical patent/JP2003058188A/ja
Publication of JP2003058188A publication Critical patent/JP2003058188A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 音声認識に当たって認識率の高い音声対話シ
ステムを提供する。 【解決手段】 本音声対話システムは、ユーザの発声を
認識するための音声認識エンジンと、その認識結果に応
じてユーザへの発話を作成する対話処理エンジンと、作
成された発話を音声に合成するための音声合成エンジン
と、音声認識のための音声パターンを含む辞書データを
格納する音声認識辞書と、音声の入出力手段とを備え
る。さらにこの音声認識エンジンは、前回のユーザ発声
の認識結果を音声認識辞書において探索し、探索された
認識結果に関連する辞書データを抽出して自身の記憶領
域内に設定するよう構成されている。従って、次回のユ
ーザの発声の音声認識に当たっては、前回の認識結果に
関連する辞書データが使用されるので、認識率が向上す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、各種の機器例えば
車両に搭載されたカーナビゲーションシステム、オーデ
ィオ機器などの操作を、ユーザとの対話に基づいて自動
的に遂行する音声対話システムに関する。
【0002】
【従来の技術】カーナビゲーションシステム、オーディ
オ機器など操作が複雑な機器では、機器を操作するため
に音声対話システムが用いられる。このシステムでは、
予め決められたステップに基づいて作成される質問をシ
ステムが発話し、この発話に対するユーザの回答を音声
認識し、認識結果に基づいて新たな発話を作成すると言
う手順によって、機器の操作に必要な情報をユーザより
得ている。
【0003】
【発明が解決しようとする課題】ところがユーザの発声
は、発声の速度、音質、イントネーションなどが種々万
別であり、従って音声パターンの比較照合による音声認
識では、往々にして認識エラーが発生する。このような
エラーが発生すると、ユーザはそのエラーを訂正するた
めの発声を行なった後、同じ発声を繰り返す必要があ
り、対話の進行速度が大幅に低下する。従って、認識エ
ラーが度々発生すると、機器の操作性は大幅に低下す
る。
【0004】本発明は、従来の音声対話システムの上記
の点に関してなされたもので、認識率が高く、従って操
作性の良い音声対話システムを提供することを目的とす
る。
【0005】
【課題を解決するための手段】上記課題を解決するため
に、本発明の第1の態様では、ユーザの発声を認識する
ための音声認識エンジンと、その認識結果に応じてユー
ザへの発話を作成する対話処理エンジンと、作成された
発話を音声に合成するための音声合成エンジンと、前記
音声認識のための音声パターンを含む辞書データを格納
する音声認識辞書と、音声の入出力手段とを備え、前記
音声認識エンジンは前回のユーザ発声の認識結果を前記
音声認識辞書において探索し、探索された認識結果に関
連する辞書データを抽出して該音声認識エンジンに設定
し次のユーザ発声の音声認識を行なう、音声対話システ
ムが提供される。
【0006】この音声対話システムでは、音声認識エン
ジンは、前回の認識結果を音声認識辞書内で探索し、探
索された認識結果に関連する辞書データのみを音声認識
辞書から抽出し、これを自身の記憶領域内に辞書として
設定する。次回の音声認識は、音声認識エンジンにおい
てこの様にして設定された辞書を用いて実施される。そ
のため、前回の認識結果に関連しない認識結果を得ると
言う認識エラーの発生が防止される。また、認識のため
の辞書データが大幅に絞り込まれるので、認識速度が向
上し、しいては対話の応答速度が向上する。
【0007】上記態様の音声システムにおいて、前回の
ユーザ発声の認識結果が複数ある場合、音声認識エンジ
ンはそのいずれをも前記音声認識辞書において探索し、
いずれの認識結果にも関連する辞書データを前記音声認
識エンジンに設定する。
【0008】これによって、音声認識エンジンに辞書と
して組み込まれるデータがさらに絞り込まれ、認識エラ
ーの発生率が低下すると共に、対話の応答速度が向上す
る。
【0009】上記態様の音声システムにおいて、音声認
識エンジンは認識結果の探索対象とする単語属性のリス
トを有している。従って前回の音声認識に当たってこの
リストに無い単語が認識された場合は、その単語を除外
してリストにある単語のみを辞書中で探索する。これに
よって、探索対象とする必要がない単語がユーザ発声中
に含まれていた場合でも、対処することができる。
【0010】上記態様の音声システムにおいて、前記音
声認識エンジンは前回のユーザ発声の認識結果中に前記
リストに対応する単語属性がある場合、それを保存して
おく。これによって、次回のユーザ発声の認識にエラー
が生じた場合、保存してある単語属性を利用して辞書の
探索、関連する辞書データの抽出を行なうことができ
る。この結果、認識エラーに対して速やかに対処可能と
なる。
【0011】本発明の第2の態様では、ユーザの発声を
認識するための音声認識エンジンと、その認識結果に応
じてユーザへの発話を作成する対話処理エンジンと、作
成された発話を音声に合成するための音声合成エンジン
と、前記音声認識のための音声パターンを含む辞書デー
タを格納する音声認識辞書と、音声の入出力手段とを備
え、前記音声認識辞書は複数の種類の辞書を有し、前記
音声認識エンジンは対話状態と該対話状態で使用する種
類の辞書の対応テーブルを有し、各対話状態のユーザ発
声の認識に当たって前記対応テーブルに従って対応する
種類の辞書を前記音声認識辞書から抽出して使用する、
音声対話システムが提供される。
【0012】また、この音声対話システムにおいて、前
記音声認識エンジンは前記対応テーブルに従って複数の
種類の辞書を前記音声認識辞書より抽出し使用する。
【0013】この音声対話システムによれば、音声認識
エンジンは対話状態に応じて予め設定されている対応テ
ーブルに従って、必要とする種類の辞書のみを音声認識
辞書から抽出し、これを自身の記憶領域に設定する。従
って、音声認識に当たって、必要とする辞書以外は認識
作業の対象とならないので、音声認識エンジンにかかる
負荷が低減され、その結果音声認識の処理時間が短縮さ
れ、しいては音声対話のレスポンスが改善される。
【0014】
【発明の実施の形態】以下に、図面を参照して本発明の
実施形態を説明する。図1は、本発明の1実施形態にか
かる音声対話システム10の基本構成を示すブロック図
である。このシステムは、カーナビゲーションシステム
に音声による案内機能を提供するためのシステムであっ
て、映像出力装置としてのディスプレイ12、音声出力
装置としてのスピーカ14、音声入力装置としてのマイ
ク16、音声対話開始スイッチ18及び処理装置20を
備えている。
【0015】処理装置20は、ハードウェアとしては、
周知のように、中央処理装置(CPU)、主記憶装置等
からなるものである。また、処理装置20は、主記憶装
置上で走行せしめられるソフトウェアとして、図1に示
すように、ディスプレイ12に画像を表示する処理を行
う画像表示エンジン202、マイク16から入力される
音声のパターンを認識するための処理を行う音声認識エ
ンジン204、およびスピーカ14から出力されるべき
音声を電子的に合成する処理を行う音声合成エンジン2
06を備えている。
【0016】さらに、処理装置20は、ソフトウェアと
して、図1に示すように、アプリケーションプログラム
208の指示を受けて上述の画像表示エンジン、音声認
識エンジン及び音声合成エンジンを制御する対話処理専
用エンジン210を備えている。また、処理装置20
は、上述の音声認識エンジン204、音声合成エンジン
206及び対話処理専用エンジン210によって参照さ
れる対話用データベース212と主に音声認識エンジン
204によって参照される音声認識辞書214を備え
る。
【0017】なお、当然のことながら、ハードウェア及
びソフトウェアを総合的に管理及び制御するオペレーテ
ィングシステム(OS)216も処理装置20において
走行する。また、上述の対話用データベース212およ
び音声認識辞書214は、処理装置20内に組み込むこ
となく、CD−ROM、DVD−ROM、メモリカード
等の外部メモリ上に構成されてもよい事は勿論である。
【0018】音声認識エンジン204は、図2に示す様
に、音声認識のための処理プログラム(図示せず)と、
カーナビゲーションシステムの操作に用いられる基本用
語のための辞書204a、さらに音声認識辞書214か
ら所定の部分を抽出して設定するRAM領域204bを
有している。基本用語辞書204aには、対話に必要な
基本的な用語、例えば「はい」、「いいえ」、「戻
る」、「行く」などの言葉と、都道府県名、および頻繁
に使用される大都市名、デパート、レストランなどの施
設名などが、その音声パターンと共に記憶されている。
尚、基本用語辞書204aは常時RAM領域204bに
設定され、その語は音声認識可能となっている。また都
道府県名及び大都市名は基本用語辞書204aから外
し、地名に関する辞書の最上位の階層として扱うことも
可能である。
【0019】また音声認識エンジンは、探索対象単語属
性リスト、対話状態とその対話に使用する辞書の種類な
どを記載したテーブルが保存される領域204c、探索
対象単語属性リスト中にある単語属性が認識された場合
それを保存するための保存領域204dなどが設けられ
ているが、これらについては、各実施形態の説明の項で
詳細に述べる。
【0020】音声認識辞書214には、図3に示す様
に、住所の辞書、施設名称の辞書などが記憶されてい
る。住所の辞書は、本発明では、図4に示す様に、概念
的に上下関係を有する属性の単語を階層状に配置した階
層構造を有すると共に、上位の階層の各単語をノードと
して、このノードから関連する下位の階層の単語を分岐
させた構造、即ちツリー構造を有している。
【0021】図示の例では、最上位の階層を「府県名」
を属性に持つ単語で構成し、2段目の階層を「市名」を
属性に持つ単語で構成し、3段目の階層を「区名」を属
性に持つ単語で構成している。さらに、最上位の階層の
府県名をそれぞれノードとし、各府県中の都市名を分岐
させている。同様に、都市名の階層に属する各単語をノ
ードとし、区名を分岐させている。これにより図4に示
すような、ツリー状の3階層文法のイメージが構成され
る。
【0022】この様な文法構造を有する住所の認識辞書
を記憶する音声認識辞書214に対して、音声認識エン
ジン204は、前回のユーザ発声による音声認識の結果
を参照して、特定のノード以下の文法を辞書214内か
ら抽出し、これを自身のRAM領域204bに設定す
る。音声認識エンジン204はこの様にして設定された
辞書を用いて次のユーザ発声を認識する。従って、この
音声認識に当たっては、前回の認識結果によって規定さ
れたノード以降の単語属性のデータ以外は音声認識エン
ジン204に設定されず、例えば兵庫県内の市名を発声
したのにそれを大阪府内の市名と誤認識するような事態
の発生は無い。従って、音声認識にあたって、認識率が
向上する。
【0023】以下に、上記基本構造を有する音声対話シ
ステムの各種の実施形態の動作を、フローチャートを示
して詳細に説明する。
【0024】図5は、本発明の第1の実施形態にかかる
音声対話システムの動作説明のためのフローチャートで
ある。また、図6はこのフローチャートの説明のため
の、音声対話システムとユーザとの対話例(対話例1)
を示す。
【0025】システムが駆動設定されると、対話処理用
エンジン210が作動して目的地設定のための最初の質
問「どこへ行きたいですか」が作成され、この質問が音
声合成エンジン206によって音声に変換され、スピー
カ14から出力される。この質問に対してユーザが「兵
庫県」と答えると、音声認識エンジン204が自身の持
っている基本辞書204aを参照してユーザ発声を認識
する(図5のステップS1)。
【0026】次に、音声認識エンジン204は、最初の
認識結果である単語属性「兵庫県」を、音声認識辞書2
04の住所辞書中で探索し(ステップS2)、探索され
た単語属性以降の辞書データを抽出して音声認識エンジ
ン204のRAM領域204bに設定する(ステップS
3)。具体的には、図4のノード10以下の辞書データ
が領域204bに設定される。
【0027】システムは次に「兵庫県のどこですか」を
質問する。これに対してユーザが「神戸市」と答える
と、音声認識エンジン204はRAM領域204bに設
定された辞書データを用いてこれを認識する(ステップ
S4)。次のステップS5において対話が終了していな
いことを確認すると、音声認識エンジン204は再びス
テップS2に戻って、認識結果の単語属性である「神戸
市」を図4の辞書中で探索し、ステップS3においてノ
ード20以下の辞書データをRAM領域204bに設定
する。
【0028】システムは次に「神戸市のどこですか」を
質問し、ユーザはこれに対して「灘区」と答える。この
ユーザ発声は、RAM領域204bに設定されたノード
20以下の辞書データを用いて認識される。これらの操
作を対話終了、即ち目的地の発声が終了するまで繰り返
すことにより、目的地の設定が完了する。
【0029】上述の実施形態では、「神戸市」の音声認
識に当たって、音声認識エンジン204のRAM領域2
04bには、兵庫県以下の各都市名の辞書しか設定され
ないので、「神戸市」を間違って他府県の都市名と誤認
識する事は無い。同様に、「灘区」の認識に当たって
も、RAM領域204bには、神戸市内の区名しか設定
されないので、これを他市の区名と誤認識する可能性が
排除される。
【0030】そのため、システムとユーザ間で、例え
ば、システム「どこに行きますか」、ユーザ「大阪
府」、システム「大阪府のどこですか」、ユーザ「堺
市」、システム「明石市のどこですか」(ユーザ発声
「堺市」を「明石市」と誤認識)のような不自然な会話
の発生が防止される。また、各認識に当たって、認識対
象となる単語が絞り込まれるので、認識の速度が大幅に
向上する。
【0031】図7は、本発明の第2の実施形態にかかる
音声対話システムの動作説明のためのフローチャートで
あり、図8はこのフローチャートの説明に使用する対話
例(対話例2)を示す。
【0032】この実施形態では、システム側の質問「ど
こへ行きたいですか」に対して、ユーザが「兵庫県神戸
市」と2個の単語で答えた場合に対処し得る構成を有し
ている。
【0033】まず、ユーザの最初の発声「兵庫県神戸
市」を、例えば基本辞書204aを用いて認識する(ス
テップS10)。次に音声認識エンジン204は、認識
結果の単語属性「兵庫県」について、これを認識辞書2
14中で探索し(ステップS11)、探索された単語属
性以下の辞書、即ち図4のノード10以下の辞書を抽出
する(ステップS12)。次に、未探索の認識結果が存
在するか否か判断し(ステップS13)、存在する場
合、ステップS11に戻って未探索の認識結果に対して
辞書中で探索を行なう。図8の場合は、未探索の認識結
果「神戸市」が存在するのでこれをノード10以下の辞
書中から探索し、ノード20以下の辞書を抽出する。
【0034】この操作を、未探索の認識結果が無くなる
まで繰り返し、無くなると、ステップS14において最
終的に抽出された辞書のデータを音声認識エンジン20
4のRAM領域204bに設定する。この後、次のユー
ザ発声「灘区」を、設定された辞書データを用いて認識
する(ステップS15)。
【0035】以上の操作を対話終了まで繰り返す(ステ
ップS16)事により、システムへの目的地の設定が完
了する。
【0036】この実施形態では、ユーザによる複数の単
語属性の発声に対して、音声認識エンジンが単語属性毎
に繰り返して設定する辞書を絞り込むので、第1の実施
形態の場合と同様、目的地の音声入力に当たって誤認識
の発生が防止され、かつ高い応答速度を得ることができ
る。
【0037】図9は、本発明の第3の実施形態を説明す
るための図であって、具体的には音声認識エンジン20
6内に予め設定される探索対象単語属性リストを示す。
この実施形態は、例えば、「大阪府に行く」と言うよう
なユーザの発声に対して、最初の音声認識で「大阪」、
「に」、「行く」と言う3つの単語属性からなる認識結
果を得ている場合に対処するものである。
【0038】本実施形態では、認識された各単語属性に
ついて、それぞれが探索対象単語属性リスト中に存在す
るか否かをまず探索する。図示の例では、「大阪府」の
みがリスト中に存在するため、「大阪府」と言う単語属
性に対して図5のフローチャートに示す処理を行なう。
これによって、次のユーザ発声で大阪府の市区町村以外
の単語属性を持つ結果が認識されることを防止すること
が出来る。
【0039】図10は、本発明にかかる第4の実施形態
の構成を説明するための対話例(対話例3)を示す図で
ある。この実施形態では、過去に認識された認識結果に
ついて、図9に示すような探索対象単語属性リストに属
する単語属性があった場合、これを認識エンジン204
の保存領域204dに保存しておき、その後、ユーザ発
声の認識のための辞書データを作成するに当たって、前
回の認識結果に加えて保存された結果を使用することを
特徴とする。
【0040】即ち、図10に示す様に、システム側の質
問「どこに行きますか」に対するユーザの回答「兵庫
県」が認識されると、図5または図7のフローチャート
に示す様に、音声認識エンジン204中のRAM領域2
06bには「兵庫県」をノードとするそれ以降の辞書デ
ータが設定される。認識された単語属性「兵庫県」は、
図9に示す探索対象単語属性リスト中に含まれているの
で、この単語属性「兵庫県」は、音声認識エンジン20
4の保存領域204d中に保存される。
【0041】システムは、次に「兵庫県のどこですか」
を質問する。ユーザはこれに対して「ラーメン屋」と答
える。「ラーメン屋」と言う単語属性は、音声認識エン
ジン204中の基本辞書における施設の種類の辞書中に
含まれているので、その波形データを使用して「ラーメ
ン屋」が認識される。
【0042】「ラーメン屋」が認識されると、音声認識
エンジンは、音声認識辞書214中の施設名の辞書に含
まれている、ラーメン屋の辞書を抽出し、さらに保存領
域204d中に保存された単語属性「兵庫県」を用いて
ラーメン屋の辞書をさらに絞り込む。これによって、兵
庫県内のラーメン屋の辞書が抽出され、これが音声認識
エンジン204のRAM領域204bに設定される。次
のユーザ発声「○○ラーメン」は、この様にして設定さ
れた辞書データを用いて認識される。
【0043】なお、施設名の単語属性には、それぞれの
住所がデータとして添付されているので、このデータを
探索することにより、特定の地域のラーメン屋を特定す
ることができる。
【0044】図11は、本発明にかかる第5の実施形態
の構成を説明するための対話例(対話例4)を示す図で
ある。この実施形態では、過去に認識された認識結果に
ついて、図9に示すような探索対象単語属性リストに属
する単語属性があった場合、これを認識エンジン204
の保存領域204dに保存しておき、その後、システム
とユーザの対話の過程で認識間違いがあった場合、保存
領域204dに保存されている単語属性を用いて辞書の
絞り込みを行なうことを特徴としている。
【0045】即ち、図11に示す様に、システム側の質
問「どこに行きますか」に対するユーザの回答「兵庫
県」が認識されると、図5または図7のフローチャート
に示す様に、音声認識エンジン204中のRAM領域2
06bには「兵庫県」をノードとするそれ以降の辞書デ
ータが設定される。認識された単語属性「兵庫県」は、
図9に示す探索対象単語属性リスト中に含まれているの
で、音声認識エンジン204の保存領域204d中に保
存される。
【0046】システムは、次に「兵庫県のどこですか」
を質問する。ユーザはこれに対して「神戸市」と答える
が、システムがこれを「明石市」と誤認識し、次の質問
「明石市のどこですか」を発話する。ユーザはシステム
のこの質問によって前回の自身の回答が誤認識されたこ
とを知って、「ちがう」と回答する。システムが基本辞
書を用いてこの発声を認識すると、保存領域204dを
探索して保存されている単語属性「兵庫県」を見出す。
次に、この単語属性を用いて辞書の絞り込みを行なうと
共に、質問「兵庫県のどこですか」を再度作成する。
【0047】この操作は、図11において二重線矢印で
示すように、認識を誤った場所まで対話が戻ることを示
している。システムの再度の質問以降は、図の二重線矢
印で示す様に、上記各実施形態の処理が実行される。
【0048】図12〜14は、本発明の第6の実施形態
を説明するための図であって、図12はこの実施形態に
適用される対話例(対話例5)を示し、図13、14は
本実施形態における音声認識エンジン204と音声認識
辞書214の構造を概念的に示す図である。
【0049】本実施形態では、ユーザとシステムの対話
状態(図12参照)に応じて使用する辞書の種類を予め
設定しておき、各対話状態に達したとき、予め設定され
た種類の辞書のデータを音声認識辞書から抜き出して、
音声認識エンジン204のRAM領域204bに設定す
るようにしたことを特徴とする。
【0050】例えば、対話状態1〜4に対して図13に
示すような対応テーブル204eが予め形成されている
と、対話状態4では、該対応テーブルに従って施設名称
の辞書のデータを音声認識辞書214から取り出して来
てRAM領域204bに設定し、この辞書を用いて次の
ユーザ発声の音声認識を実行する。
【0051】あるいは、対話状態2の場合は、図14に
示す様に、対応テーブル204eに従って住所の辞書と
施設の種類の辞書を音声認識辞書214から取り出し、
それらを共にRAM領域204bに設定する。これによ
り、ユーザの次の発声が「ラーメン屋」であっても容易
に音声認識される。
【0052】本実施形態によれば、対話の各状態におい
て、ユーザが発生すると思われる発声パターンを有する
辞書のみを音声認識辞書から取り出し、音声認識エンジ
ンに設定することで、該エンジンにかかる負荷(処理
量)を低減することができる。その結果、音声認識の応
答時間が短縮でき、音声対話のレスポンスが改善され
る。
【0053】本発明のさらに他の実施形態として、ある
状態で、既に得られている単語属性以外の、対話タスク
を達成させるに必要な単語属性を含む音声認識用辞書を
自動的に選択し、音声認識エンジンに設定する事も可能
である。即ち、目的地設定の対話で、既に「県名」の属
性を持つ認識結果が得られている場合、タスク達成のた
めに他に必要な属性は、「市名」、「町名」、「番地」
などであり、これらの単語属性を含む辞書を、複数の辞
書から探索し、適合する辞書を組み合わせて音声認識エ
ンジンに設定する。
【0054】これによって、第6の実施形態のように対
応テーブルを持つことなく、この場合の実施形態と同じ
効果を得ることができ、処理量(データ量)の削減が期
待できる。
【0055】
【発明の効果】以上、各実施形態を挙げて説明したよう
に、本発明の音声対話システムによれば、既に得られて
いる音声認識の結果に関連する辞書データを音声認識辞
書から取り出して音声認識エンジンに設定し、次のユー
ザ発声の音声認識を行なうので、音声認識の誤認率が低
下する。同時に音声認識エンジンに設定されるデータ量
が減少するので認識エンジンの負荷が減少し、認識速度
が速くなる。その結果、対話の応答速度が向上する。
【図面の簡単な説明】
【図1】本発明の1実施形態にかかる音声対話システム
の構成を示すブロック図。
【図2】図1に示す音声認識エンジンの構成を示す図。
【図3】図1に示す音声認識辞書の構成を示す図。
【図4】ツリー状階層構造を有する住所辞書の構成を示
す図。
【図5】本発明の第1の実施形態にかかる音声対話シス
テムの動作説明のためのフローチャート。
【図6】図5のフローチャートの説明に提供する第1の
対話例。
【図7】本発明の第2の実施形態にかかる音声対話シス
テムの動作説明のためのフローチャート。
【図8】図7のフローチャートの説明に提供する第2の
対話例。
【図9】探索対象単語属性リストの一例を示す図。
【図10】本発明の第3の実施形態の説明に供する第3
の対話例。
【図11】本発明の第4の実施形態の説明に供する第4
の対話例。
【図12】本発明の第5の実施形態の説明に供する第5
の対話例。
【図13】本発明の第6の実施形態の説明に供する図。
【図14】本発明の第6の実施形態の説明に供する図。
【符号の説明】
10…音声対話システム 12…ディスプレイ 14…スピーカ 16…マイク 18…スイッチ 20…処理装置 202…画像表示エンジン 204…音声認識エンジン 206…音声合成エンジン 208…アプリケーションプログラム 210…対話処理用エンジン 212…対話用データベース 214…音声認識辞書
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G10L 15/18 G10L 3/00 537F 15/28 521W

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 ユーザの発声を認識するための音声認識
    エンジンと、その認識結果に応じてユーザへの発話を作
    成する対話処理エンジンと、作成された発話を音声に合
    成するための音声合成エンジンと、前記音声認識のため
    の音声パターンを含む辞書データを格納する音声認識辞
    書と、音声の入出力手段とを備え、前記音声認識エンジ
    ンは前回のユーザ発声の認識結果を前記音声認識辞書に
    おいて探索し、探索された認識結果に関連する辞書デー
    タを抽出して前記音声認識エンジンに設定し次のユーザ
    発声の音声認識を行なうものである、音声対話システ
    ム。
  2. 【請求項2】 請求項1に記載の音声対話システムにお
    いて、前記音声認識エンジンは前回のユーザ発声の認識
    結果が複数ある場合、そのいずれをも前記音声認識辞書
    において探索し、いずれの認識結果にも関連する辞書デ
    ータを前記音声認識エンジンに設定するものである、音
    声対話システム。
  3. 【請求項3】 請求項1に記載の音声対話システムにお
    いて、前記音声認識エンジンは認識結果の探索対象とす
    る単語属性のリストを有している、音声対話システム。
  4. 【請求項4】 請求項3に記載の音声対話システムにお
    いて、前記音声認識エンジンは前回のユーザ発声の認識
    結果中に前記リストに対応する単語属性がある場合、そ
    れを保存しておくものである、音声対話システム。
  5. 【請求項5】 ユーザの発声を認識するための音声認識
    エンジンと、その認識結果に応じてユーザへの発話を作
    成する対話処理エンジンと、作成された発話を音声に合
    成するための音声合成エンジンと、前記音声認識のため
    の音声パターンを含む辞書データを格納する音声認識辞
    書と、音声の入出力手段とを備え、前記音声認識辞書は
    複数の種類の辞書を有し、前記音声認識エンジンは対話
    状態と該対話状態で使用する種類の辞書の対応テーブル
    を有し、各対話状態のユーザ発声の認識に当たって前記
    対応テーブルに従って対応する種類の辞書を前記音声認
    識辞書から抽出して使用するものである、音声対話シス
    テム。
  6. 【請求項6】 請求項5に記載の音声対話システムにお
    いて、前記音声認識エンジンは前記対応テーブルに従っ
    て複数の種類の辞書を前記音声認識辞書より抽出し使用
    するものである、音声対話システム。
  7. 【請求項7】 ユーザの発声を認識するための音声認識
    エンジンと、その認識結果に応じてユーザへの発話を作
    成する対話処理エンジンと、作成された発話を音声に合
    成するための音声合成エンジンと、前記音声認識のため
    の音声パターンを含む辞書データを格納する音声認識辞
    書と、音声の入出力手段とを備え、前記音声認識エンジ
    ンは所定の対話タスクを達成する複数の単語属性中で前
    回のユーザ発声の認識時に使用された単語属性以外の単
    語属性を含む辞書データを前記音声認識辞書から抽出し
    て次回のユーザ発声の認識に使用するものである、音声
    対話システム。
JP2001245707A 2001-08-13 2001-08-13 音声対話システム Pending JP2003058188A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001245707A JP2003058188A (ja) 2001-08-13 2001-08-13 音声対話システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001245707A JP2003058188A (ja) 2001-08-13 2001-08-13 音声対話システム

Publications (1)

Publication Number Publication Date
JP2003058188A true JP2003058188A (ja) 2003-02-28

Family

ID=19075403

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001245707A Pending JP2003058188A (ja) 2001-08-13 2001-08-13 音声対話システム

Country Status (1)

Country Link
JP (1) JP2003058188A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004084183A1 (ja) * 2003-03-20 2004-09-30 Sony Corporation 音声対話装置及び方法並びにロボット装置
WO2019058453A1 (ja) * 2017-09-20 2019-03-28 三菱電機株式会社 音声対話制御装置および音声対話制御方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000057490A (ja) * 1998-08-06 2000-02-25 Fujitsu Ten Ltd ナビゲーション装置
JP2001034292A (ja) * 1999-07-26 2001-02-09 Denso Corp 単語列認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000057490A (ja) * 1998-08-06 2000-02-25 Fujitsu Ten Ltd ナビゲーション装置
JP2001034292A (ja) * 1999-07-26 2001-02-09 Denso Corp 単語列認識装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004084183A1 (ja) * 2003-03-20 2004-09-30 Sony Corporation 音声対話装置及び方法並びにロボット装置
WO2019058453A1 (ja) * 2017-09-20 2019-03-28 三菱電機株式会社 音声対話制御装置および音声対話制御方法
JPWO2019058453A1 (ja) * 2017-09-20 2019-12-12 三菱電機株式会社 音声対話制御装置および音声対話制御方法

Similar Documents

Publication Publication Date Title
US5797116A (en) Method and apparatus for recognizing previously unrecognized speech by requesting a predicted-category-related domain-dictionary-linking word
EP1162602B1 (en) Two pass speech recognition with active vocabulary restriction
US6718304B1 (en) Speech recognition support method and apparatus
US6230132B1 (en) Process and apparatus for real-time verbal input of a target address of a target address system
JP5334178B2 (ja) 音声認識装置およびデータ更新方法
US20080162137A1 (en) Speech recognition apparatus and method
JP4928701B2 (ja) 目的案内システム内に定義されている入力ダイアログを使って目的地を言語入力するための方法
JP4116233B2 (ja) 音声認識装置ならびにその方法
JPH11175568A (ja) 入力システム
JP3278222B2 (ja) 情報処理方法及び装置
JP2000315096A (ja) 音声認識装置を備えたマンマシンシステム
JP2002123290A (ja) 音声認識装置ならびに音声認識方法
JP2007505365A (ja) 音声制御ナビゲーションシステムの操作方法
JP2003015686A (ja) 音声対話装置、音声対話方法及び音声対話処理プログラム
JP4661239B2 (ja) 音声対話装置及び音声対話方法
JP4639990B2 (ja) 音声対話装置及び音声理解結果生成方法
JP3645104B2 (ja) 辞書検索装置及び辞書検索プログラムを記録した記録媒体
JP4244423B2 (ja) 適正単語列推定装置
JP2003058188A (ja) 音声対話システム
JP4684583B2 (ja) 対話装置
US20040015354A1 (en) Voice recognition system allowing different number-reading manners
JP2001242885A (ja) 音声認識装置および音声認識方法、並びに記録媒体
JP3296783B2 (ja) 車載用ナビゲーション装置および音声認識方法
JP3112037B2 (ja) 音声認識装置
JP2009282835A (ja) 音声検索装置及びその方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101012

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110222