JP4363076B2

JP4363076B2 - 音声制御装置

Info

Publication number: JP4363076B2
Application number: JP2003109283A
Authority: JP
Inventors: 雅之 ▲高▼見; 徹名田
Original assignee: Denso Corp
Current assignee: Denso Corp
Priority date: 2002-06-28
Filing date: 2003-04-14
Publication date: 2009-11-11
Anticipated expiration: 2023-04-14
Also published as: US7469211B2; JP2004086150A; US20040030560A1

Description

【０００１】
【発明の属する技術分野】
本発明は、ユーザの発話内容を認識し、その発話内容に応じた制御対象機器の制御を行う音声制御装置に関する。
【０００２】
【従来の技術】
従来、ユーザの発話内容を認識し、これに基づいて制御対象機器を操作する音声制御装置がある。
【０００３】
この従来装置によれば、図９で示すように、ユーザがマイクＺ１に発話を行うと、音声認識エンジンＺ２は発話内容に対応するコマンドを認識し、そのコマンドを機器操作信号発生部Ｚ３へ出力する。同時に、音声合成エンジンＺ４に対して、ユーザの発話内容が認識された旨の内容を通知する音声データを合成して、スピーカＺ５へ出力するよう指示を与える。これにより、ユーザは自身の発話内容に対する音声認識が成功したことを確認することができる。
【０００４】
次に、機器操作信号発生部Ｚ３は、音声認識エンジンＺ２から出力されたコマンドに対応する制御信号を制御対象機器Ｚ６へ出力する。制御対象機器Ｚ６は、機器操作信号発生部Ｚ３から出力された制御信号に基づいて動作状態を変更する。動作状態の変更が完了すると、制御対象機器Ｚ６は音声合成エンジンＺ４に対して、動作状態変更完了を通知する信号を出力する。音声合成エンジンＺ４は、前述の通知信号を受けると、制御対象機器Ｚ６の動作状態の変更が完了した旨の内容を通知する音声データを合成し、スピーカＺ５へ出力する。これにより、ユーザは制御対象機器Ｚ６の動作状態が変更されたことを確認することができる。
【０００５】
【発明が解決しようとする課題】
しかしながら、従来技術の音声制御装置では、ユーザの発話内容を認識する際に、制御対象機器の動作状態までは考慮していない。そのため、ユーザが現在の動作状態においては操作できないコマンドを発話した場合、以下のような問題が生ずる。
【０００６】
例えば、ラジオのＡＭモードのチャンネルを受信している際に、ＦＭモードの放送局をユーザが発話した場合、その放送局を認識した時点で、その放送局名を音声合成エンジンＺ４によってトークバックする。しかしながら、ＡＭモードにおいてＦＭモードの放送局に変更することはできないため、直後に、ＡＭモードからＦＭモードに変更してからやり直して下さい等の報知を行う。この場合、ユーザは自身の発話内容の音声認識が成功したと思った直後に、音声操作の失敗を報知されるため、音声操作に関して不快感が生ずる場合がある。
【０００７】
また、例えばオーディオがＯＮの時、ユーザがオーディオＯＦＦと発話したにも関わらず、音声認識エンジンＺ２がオーディオＯＮと誤認識すると、既にオーディオはＯＮされていますと、トークバックする。この場合も、制御対象機器の動作状態を何ら考慮していないため、上記のような誤認識及び不適切なトークバックが行われてしまう。
【０００８】
本発明は、前述の問題点を鑑み、ユーザの発話内容を認識する際、制御対象機器の動作状態を考慮することにより、ユーザの発話内容の認識や制御対象機器の制御を適切に行いうる音声制御装置を提供することを目的とする。
【００１８】
【課題を解決するための手段】
上記目的を達成するために、請求項１に記載の音声制御装置は、ユーザの発話内容を認識し、その発話内容に応じた制御対象機器の操作を行う音声制御装置であって、発話されるべき複数のコマンドを音声認識データとして記憶する記憶手段と、記憶手段に記憶されている複数のコマンドを用いて、ユーザの発話内容をその中の１つのコマンドとして認識する音声認識手段と、制御対象機器の動作状態を検出する検出手段と、音声認識手段によって認識されたコマンドが、相反する操作を実行するための２種のコマンドの一方のコマンドであり、かつ前記検出手段によって検出された前記制御対象機器の動作状態においてその一方のコマンドが選択不可と判別した場合、音声認識手段によって認識されたコマンドを、前記２種のコマンドの他方のコマンドに置換する置換手段とを備えることを特徴とする。
【００１９】
音声認識手段が２〜３回連続して音声認識を誤ると、ユーザは音声によるコマンド入力を断念し、制御対象機器を手動で操作することが多く、却って使い勝手が悪くなる。相反する操作を実行するための２種のコマンドに関して、音声認識手段によって認識されたコマンドが２種のコマンドの一方のコマンドであり、かつ検出手段によって検出された制御対象機器の動作状態においてその一方のコマンドが選択不可と判別された場合には、置換手段によって、２種のコマンドの他方のコマンドに置換することで、音声認識手段がユーザの発話したコマンドを誤認識した場合においても、制御対象機器の動作状態に応じてコマンドの置換が行われることとなり、ユーザの意図した動作を実行することが可能となる。そのため、ユーザは、自身が意図するコマンドが決定されるまで何度も発話を繰り返す必要がなくなり、音声操作における煩わしさが低減される。
【００２４】
請求項２に記載のように、相反する操作を実行するための２種のコマンドは、制御対象機器の動作または所定の機能をオンするためのコマンドとオフするためのコマンドであることが望ましい。特に、制御対象機器の動作または所定の機能をオンするためのコマンドとオフするためのコマンドに関しては、音声認識手段によって他方のコマンドとして誤認識されやすいためである。
【００２５】
請求項３に記載のように、相反する操作を実行するための２種のコマンドにより、制御対象機器の動作状態が多段階に変化するものである場合、音声認識手段によって認識されたコマンドが２種のコマンドの一方のコマンドであり、かつ検出手段によって検出された制御対象機器の動作状態においてその一方のコマンドが選択不可と判別された場合であっても、置換手段は、その一方のコマンドの置換を実行しないことが望ましい。例えば、オーディオのボリュームが既に最大音量まで高められている場合に、ユーザが音量を高めるためのコマンドを発話した場合、このコマンドを、音量を低くするコマンドに置換して実行すると、ユーザは発話したコマンドが音量を低下するコマンドとして誤認識されて実行されたと誤解してしまう可能性がある。このようなコマンドに関しては置換を実行しないことにより、ユーザの誤解を防ぐことができる。
【００２６】
請求項４に記載のように、一方のコマンドによる操作が実行できない旨を報知する報知手段をさらに備えることが望ましい。これにより、音声認識手段の誤認識によって当該コマンドによる操作が実行できないのではなく、当該コマンドによる操作自体が実行できないことをユーザに通知することが可能となる。
【００２７】
【発明の実施の形態】
（第１実施形態）
図１は、本発明の第１実施形態の全体構成を示すブロック図である。
【００２８】
本実施形態における音声制御装置は、車両に搭載された制御対象機器の動作状態に基づいてユーザの発話を認識し、制御対象機器の音声による操作を行う。
【００２９】
ＥＣＵ４は、音声認識辞書１ａ、音声認識エンジン３、機器状態検出部４ａ、音声認識辞書切換部４ｂ、認識結果決定部４ｃ、機器操作信号発生部４ｄ及び音声合成エンジン５から構成される。
【００３０】
音声認識データとしての音声認識辞書１ａは、ユーザが発話したコマンドを認識するためのコマンドデータを有し、エアコン２ａやオーディオ２ｂ等の制御対象機器２の各動作状態において、選択可能なコマンドからなる音声認識辞書を区分して記憶している。
【００３１】
例えば、エアコン２ａがオンの場合に利用される音声認識辞書には、エアコン２ａをオフするためのコマンドは含まれるが、エアコン２ａをオンするコマンドは含まれない。また、例えば、車両にナビゲーション装置が搭載されており、当該ナビゲーション装置を制御対象機器２のひとつとして制御する場合、当該ナビゲーション装置の画面が２Ｄ表示機能を実行している場合に利用される音声認識辞書には、これを３Ｄ表示に切り換えるためのコマンドは含まれるが、２Ｄ表示に切り換えるコマンドは含まれない。
【００３２】
音声認識手段である音声認識エンジン３は、制御対象機器２の各動作状態において選択可能なコマンドからなる音声認識辞書を利用して、マイク６から入力されたユーザの発話と音声認識辞書に含まれるコマンドとの合致度を算出する。
【００３３】
音声合成エンジン５は、ユーザによって入力された音声の認識結果をトークバックしたり、制御対象機器２に対する、音声による操作の結果を報知するための音声データを合成する。合成した音声データはスピーカ７へ出力され、ユーザに報知される。
【００３４】
検出手段である機器状態検出部４ａは、エアコン２ａやオーディオ２ｂ等の複数の制御対象機器２に接続されており、これらの動作状態を割り込み処理によって一定時間毎に検出する。検出方法としては、制御対象機器２の動作状態が変更されるたびに制御対象機器２から信号を出力させ、それをトリガとして制御対象機器２の動作状態の変更を検出するイベントドリブン方式を用いても良い。
【００３５】
識別手段である音声認識辞書切換部４ｂは、機器状態検出部４ａが制御対象機器２の動作状態を検出するたびに、これに連動して、その動作状態に対応する音声認識辞書の区分を選択し、その選択結果に基づいて音声認識辞書の切り換えを指示する。その際には、音声認識エンジン３に対して音声認識の中断および再開の指示も行う。
【００３６】
なお、音声認識辞書の切り換えに関しては、制御対象機器２の動作状態を保持するコマンドが含まれず、かつ、制御対象機器２の動作状態を変更するコマンドが含まれる音声認識辞書に切り換えられる。例えば、エアコン２ａがオンに切り換わった場合は、エアコン２ａをオンするコマンドが含まれず、かつ、エアコン２ａをオフするコマンドが含まれる音声認識辞書に切り換えられる。また、例えば、車両にナビゲーション装置が搭載されており、当該ナビゲーション装置を制御対象機器２のひとつとして制御する場合、当該ナビゲーション装置の画面が３Ｄ表示に切り換わった時は、これを３Ｄ表示に切り換えるコマンドは含まれず、かつ、２Ｄ表示に切り換えるコマンドが含まれる音声認識辞書に切り換えられる。
【００３７】
認識結果決定部４ｃは、音声認識エンジン３からユーザの発話と音声認識辞書に含まれる各コマンドとの合致度を取得し、最も合致度の大きいコマンドを、ユーザの発話したコマンドとして決定する。
【００３８】
機器操作信号発生部４ｄは、認識結果決定部４ｃが決定したコマンドを取得し、これに対応する機器操作信号を制御対象機器２へ出力する。制御対象機器２は、取得した機器操作信号に従って、動作状態の変更を行う。
【００３９】
図２は、本実施形態の音声制御装置が、音声認識辞書を切り換えるフローチャートである。本フローチャートの処理は、一定時間が経過するごとに実行される。
【００４０】
ステップ２０１では、エアコン２ａやオーディオ２ｂ等の制御対象機器２の動作状態を検出するとともに、前回検出した動作状態と今回検出した動作状態とに変化があるか否かを判別する。そして、動作状態が変化した場合には、ステップ２０２へ進む。
【００４１】
ステップ２０２では、音声認識辞書の切り換えに先立ち、音声認識を中断する。これにより、音声認識辞書の切り換え中に音声認識が行われることを防止できる。なお、音声認識辞書の切り換え中に音声認識が行われると、音声の入力操作が複数のコマンドを発話することによってなされる場合、一貫性のない対応となったり、途中でコマンドが認識できなくなる等の問題が生じる。
【００４２】
ステップ２０３では、検出した制御対象機器２の動作状態から、これに対応する区分の音声認識辞書を選定する。ステップ２０４では、選定された区分の音声認識辞書を用いて、音声認識辞書の切り換えを行う。
【００４３】
ステップ２０５では、音声認識を再開する。すなわち、音声認識エンジン３は中断していた音声認識を再開する。これ以降、音声認識エンジン３は切り換えられた新たな音声認識辞書を用いて、音声認識を行う。
【００４４】
なお、ＥＣＵ４がイベントドリブン方式によって制御対象機器２の動作状態を検出する場合は、本フローチャートの処理は、制御対象機器２の動作状態変更の際に出力される信号をＥＣＵ４が受け取るたびに、ステップ２０２から処理が開始される。
【００４５】
図３は、本実施形態の音声制御装置が、ユーザの発話内容に応じて制御対象機器２の動作状態を変更するフローチャートである。
【００４６】
ステップ３０１では、マイク６から入力したユーザの発話と、音声認識辞書に含まれる各コマンドとの合致度を算出する。ステップ３０２では、音声認識エンジン３が算出した合致度を取得し、最も合致度の大きい音声認識データに対応するコマンドを、ユーザの発話したコマンドであると決定する。
【００４７】
ステップ３０３では、ステップ３０２にて決定したコマンドに対応する機器操作信号を制御対象機器２へ出力する。この結果、制御対象機器２は、その機器操作信号に従って動作状態を変更する。
【００４８】
ステップ３０４では、制御対象機器２の動作状態が変更されたことをユーザに報知する音声データを作成する。この音声データはスピーカ７へ出力され、制御対象機器２の動作状態の変更をユーザに報知する。
【００４９】
なお、制御対象機器２の動作状態が変更されたことをユーザに報知する方法としては、例えば図示しないナビゲーション装置の液晶ディスプレイ等にその旨の内容を表示する方法を用いてもよい。
【００５０】
このように、本実施形態の音声制御装置は、制御対象機器２の動作状態を検出し、その動作状態において選択可能なコマンドからなる音声認識辞書を選定する。音声認識エンジン３は、ユーザの発話と音声認識辞書に含まれる各コマンドとの合致度を算出し、これが最も大きいコマンドを、ユーザの発話したコマンドとして認識する。これにより、ユーザの発話したコマンドが認識されたにもかかわらず、制御対象機器２の動作状態を変更することができない、といったことがなくなる。また、ユーザの発話したコマンドを誤って他のコマンドとして誤認識する機会も減少させることができ、音声操作におけるユーザの違和感や不快感を低減することができる。また、制御対象機器２の各動作状態において、選択可能なコマンドの音声認識辞書を区分することで、選択可能なコマンドを短時間で識別することも可能となる。
【００５１】
次に、第１実施形態の変形例について説明する。
【００５２】
図４は、本発明の第１実施形態の変形例における音声制御装置の全体構成を示すブロック図である。図４に示すように、本変形例では、上述の第１実施形態における音声認識辞書切換部４ｂに代えて、識別データ算出部４ｅを設けた点が第１実施形態と異なる。また、制御対象機器２の各動作状態に応じて音声認識辞書を区分しておらず、制御対象機器２を音声操作するための全てのコマンドを１つの音声認識辞書（全てのコマンドを含む１セットの辞書）１ｂに格納している。
【００５３】
識別コード算出部４ｅは、機器状態検出部４ａが制御対象機器２の動作状態の変化を検出するたびに、音声認識辞書１ｂに格納された、制御対象機器２の動作状態変化によって影響を受ける全てのコマンドの各々に対して識別コードを算出する。識別コードは０と１の２種類からなり、機器状態検出部４ａが検出した動作状態において、選択可能なコマンドには１の識別コードが、選択不可能なコマンドには０の識別コードが付与される。
【００５４】
音声認識エンジン３は、マイク６から入力されたユーザの発話と音声認識辞書に含まれる各コマンドとの合致度を算出する。合致度の算出は２段階で行われる。まず、マイク６から入力されたユーザの発話と音声認識辞書に含まれる各コマンドとの合致度が算出される。次に、算出された合致度に対して、識別コードの値を掛け算し、この結果を最終的な合致度とする。
【００５５】
なお、その他の構成に関しては、前述の実施例と同様であるため、説明しない。
【００５６】
図５は、本実施例の音声制御装置において、音声認識辞書の各コマンドに識別コードを付与するためのフローチャートである。本フローチャートの処理は、一定時間が経過するごとに実行される。
【００５７】
ステップ５０１では、エアコン２ａやオーディオ２ｂ等の制御対象機器２の動作状態を検出するとともに、前回検出した動作状態から変化したか否かを判別する。
【００５８】
ステップ５０２では、全てのコマンドの各々に関して、ステップ５０１にて検出した制御対象機器２の動作状態において、選択可能であるかどうかを判別する。そして、選択可能なコマンドについては、その識別コードを１とし、選択不可能なコマンドについては、その識別コードを０として算出する。ステップ５０３では、各コマンドへの識別コードの付与に先立ち、音声認識動作を中断する。
【００５９】
ステップ５０４では、ステップ５０２で算出した識別コードが音声認識辞書に含まれる各コマンドに付与される。なお、既に前回の動作状態に応じた識別コードが各コマンドに付与されていた場合には、その識別コードを消去した後に、新たに今回の識別コードを付与する。
【００６０】
ステップ５０５では、音声認識を再開する。すなわち、音声認識エンジン３は中断していた音声認識を再開する。これ以降、音声認識エンジン３は識別コード算出部４ｅによって算出された識別コードが付与されたコマンドからなる音声認識辞書を用いて、ユーザの発話との合致度を算出する。
【００６１】
このように、本実施例の識別コード算出部４ｅは、制御対象機器２の動作状態が変更されるたびに、音声認識辞書１ｂに格納された、制御対象機器２の動作状態変化によって影響を受ける全てのコマンドの各々に対する識別コードを算出し、これを各コマンドに付与する。その際には、選択可能なコマンドの識別コードは１とし、選択不可能なコマンドの識別コードは０とする。
【００６２】
例えば、エアコン２ａがオンされた場合には、エアコン２ａをオンするコマンドの識別コードは０に、エアコン２ａをオフするコマンドの識別コードは１となるように付与される。また、例えば、車両にナビゲーション装置が搭載されており、当該ナビゲーション装置を制御対象機器２の一つとして本音声制御装置によって制御する場合において、当該ナビゲーション装置の画面が２Ｄ表示に切り換わった時には、これを２Ｄ表示に切り換えるコマンドの識別コードは０に、３Ｄ表示に切り換えるコマンドの識別コードは１となるように付与される。
【００６３】
そして、ユーザの発話との合致度を算出する際には、この識別コードを合致度に掛け合わせるため、識別コードが０のコマンドは合致度が０となり、このようなコマンドがユーザの発話に対応するコマンドとして抽出されることを防止できる。そして、本変形例では、コマンドを重複して記憶する必要がないため、音声認識辞書の容量の低減を図ることが可能となる。
【００６４】
（第２実施形態）
図６は、本発明の第２実施形態における全体構成を示すブロック図である。
【００６５】
認識結果解析部４ｆは、音声認識辞書に格納された全てのコマンドに対して、誤認識されやすいコマンドを記載した誤認識リストを有している。そして、機器状態検出部４ａが検出する制御対象機器２の動作状態における、各コマンドに対する識別コードを算出する。識別コードの内容については、前述の実施例と同様である。
【００６６】
ユーザの発話内容であるコマンドの決定は、以下の手順で行われる。
【００６７】
まず、認識結果解析部４ｆは、ユーザの発話と音声認識辞書に記載された各コマンドとの合致度を、音声認識エンジン３から取得する。次に、合致度が最も高いコマンドの識別コードを判別する。これが１である場合には、そのコマンドは制御対象機器２の動作状態において選択可能なコマンドであるため、これをユーザの発話したコマンドとして決定する。
【００６８】
一方、合致度の最も高いコマンドの識別コードが０である場合には、そのコマンドの誤認識コマンドリストに記載されているコマンドについて、ユーザの発話との合致度が高い順に識別コードを判別する。識別コードが１であるコマンドがあった場合は、そのコマンドをユーザの発話したコマンドとして決定する。誤認識コマンドリストに記載されている全てのコマンドの識別コードが０である場合は、ユーザの発話との合致度が次に大きいコマンドを取り出して、上述の手順を繰り返す。ユーザの発話として決定されたコマンドは、機器操作信号発生部４ｄへ出力される。
【００６９】
なお、その他の構成に関しては、第１実施形態と同様であるため、説明を省略する。
【００７０】
図７は、本実施形態の音声制御装置が、ユーザの発話によって制御対象機器２の動作状態を変更するフローチャートである。
【００７１】
ステップ７０１では、マイク６から入力したユーザの発話と、音声認識辞書に含まれる各コマンドとの合致度を算出する。ステップ７０２では、ステップ７０１で算出された合致度から、最も高い合致度を有するコマンドを特定する。
【００７２】
ステップ７０３では、検出した制御対象機器２の動作状態において、ステップ７０２で特定したコマンドの識別コードを算出する。識別コードが１である場合には、そのコマンドは制御対象機器２の動作状態において選択可能であるため、ステップ７０８へ進む。そうでない場合は、ステップ７０４へ進む。
【００７３】
ステップ７０４では、ステップ７０２で特定したコマンドに対応する誤認識コマンドリストから、ユーザの発話との合致度が最大のコマンドを選択する。具体例としては、誤認識コマンドリストには、当該コマンドによる操作と相反する操作を実行して制御対象機器の動作または機能を切り換えるコマンドを含むように構成される。例えば、制御対象機器２の動作や任意の機能をオンに切り換えるコマンドの誤認識コマンドリストには、当該動作や任意の機能をオフに切り換えるコマンドが含まれることとなる。また、動作や任意の機能をオフに切り換えるコマンドの誤認識コマンドリストには、当該動作や機能をオンに切り換えるコマンドが含まれることとなる。
【００７４】
ステップ７０５では、ステップ７０３で検出した制御対象機器２の動作状態における、ステップ７０４で選択したコマンドの識別コードを算出する。識別コードが１である場合には、そのコマンドは制御対象機器２の動作状態において選択可能であるため、ステップ７０８へ進む。そうでない場合は、ステップ７０６へ進む。
【００７５】
ステップ７０６では、誤認識コマンドリストに記載されている全てのコマンドについて、その識別コードを判別したかを判定する。全てのコマンドについて判別した場合は、ステップ７０７へ進む。そうでない場合は、ステップ７１２へ進み、誤認識コマンドリストからユーザの発話との合致度が次に大きいコマンドを選択して判定を繰り返す。
【００７６】
ステップ７０７では、音声認識辞書に記載されている全てのコマンドについて、その識別コードを調べたかを判定する。全てのコマンドについて調べた場合は、ユーザの発話に該当するコマンドはないものとして、そのまま処理を終了する。そうでない場合は、ステップ７１１へ進み、ユーザの発話との合致度が次に大きいコマンドを選択して判定を繰り返す。
【００７７】
ステップ７０８では、ステップ７０３もしくはステップ７０５で選択したコマンドが、ユーザの発話に対応するコマンドであると決定する。ステップ７０９では、ステップ７０８にて決定したコマンドに対応する機器操作信号を発生して、制御対象機器２の動作状態を変更する。
【００７８】
ステップ７１０では、制御対象機器２の動作状態が変更されたことをユーザに報知する音声データを作成する。この音声データはスピーカ７へ出力され、制御対象機器２の動作状態の変更をユーザに報知する。
【００７９】
このように、第２実施形態の音声制御装置は、ユーザの発話との合致度が最も高いコマンドが、制御対象機器２の動作状態において選択不可である場合には、これよりも合致度の低いコマンドや、当該コマンドの誤認識コマンドリストに記載されたコマンドを、ユーザの発話したコマンドとして決定する。そのため、ユーザは、自身が意図するコマンドが決定されるまで何度も発話を繰り返す必要がなくなり、音声操作における煩わしさが低減される。
【００８０】
（第３実施形態）
次に、本発明の第３実施形態における音声制御装置について説明する。本実施形態の音声制御装置では、特に、相反する操作を実行する２つのコマンドによる、制御対象機器２の動作や各機能の変更に関するものである。
【００８１】
本実施形態の音声認識辞書１ｂには、例えばオーディオの動作をオンまたはオフにするコマンドや、ナビゲーション装置における表示画面のオンまたはオフを行うコマンド等、制御対象機器２の動作または各機能において、相反する操作を実行する２つのコマンドが記憶されている。
【００８２】
なお、このようなコマンド以外のコマンドに関しては、前述の実施形態と同様にして認識する。従って、相反する操作を実行する２つのコマンド以外の構成・動作に関しては、第２実施形態の音声制御装置の場合と同様であるため、説明しない。
【００８３】
図８は、本発明の第３実施形態における音声制御装置が、ユーザの発話によって制御対象機器２の動作状態を変更する処理に関するフローチャートである。
【００８４】
ステップ８０１では、マイク６から入力したユーザの発話と、音声認識辞書１ｂに含まれる各コマンドとの合致度を算出する。ステップ８０２では、ステップ８０１で算出された合致度から、最も高い合致度を有するコマンドを特定する。
【００８５】
ステップ８０３では、制御対象機器２の動作状態を検出するとともに、ステップ８０２で特定されたコマンドの識別コードを算出する。識別コードが１である場合には、ステップ８０４へ進み、ステップ８０２で特定したコマンドをユーザの発話したコマンドとして決定する。一方、識別コードが０である場合には、ステップ８０５へ進み、ステップ８０２で特定したコマンドと相反するコマンドを読み出し、当該コマンドをユーザの発話したコマンドとして決定する。これにより、ユーザの発話したコマンドが誤認識された場合でも、当該コマンドを相反するコマンドに置換して実行することにより、ユーザの意図したコマンドを実行することが可能となるのである。
【００８６】
ステップ８０６では、ステップ８０４またはステップ８０５において、ユーザの発話したコマンドとして決定されたコマンドに対応する機器操作信号を発生し、制御対象機器２の動作状態を変更する。ステップ８０７では、制御対象機器２の動作状態が変更されたことをユーザに通知する音声データを作成し、これをスピーカ７へ出力することにより、制御対象機器２の動作状態の変更をユーザに通知する。
【００８７】
このように、本実施形態の音声制御装置では、制御対象機器２の動作状態に基づいて、認識されたコマンドまたは認識されたコマンドと相反するコマンドのいずれを実行するかを決定する。これにより、ユーザの発話したコマンドが誤認識された場合においても、ユーザの意図した動作を確実に実行することが可能となる。
【００８８】
なお、ユーザの発話したコマンドが制御対象機器２の動作状態を多段階に変化させるコマンドであった場合には、当該コマンドの識別コードを１にすることにより、前述したコマンドの置換は行わない。これは、コマンドの置換を行った場合に引き起こされる、発話したコマンドの誤認識によって意図しない操作が行われたとユーザが誤解してしまうのを防止するためである。例えば、オーディオのボリュームが既に最大音量まで高められている場合に、ユーザが音量を高めるためのコマンドを発話した場合、当該コマンドを音量を低くするコマンドに置換すると、ユーザは発話したコマンドが音量を低くするコマンドとして誤認識されたと誤解する。制御対象機器２の動作状態を多段階に変化させるコマンドである場合には、コマンドの置換を行わないことにより、このようなユーザの誤解を防止することができるのである。
【００８９】
以上説明した実施形態では、例えばオーディオの動作をオンまたはオフにするコマンドや、ナビゲーション装置における表示画面のオンまたはオフを行うコマンドに対して説明したが、これらコマンド以外の他のコマンドに対しても本発明は適用可能である。例えば、車両のライトの点灯／消灯を指示するためのコマンドや、音声にて移動制御可能な移動体に対し、移動体が停止中で後退不可能な状況にありそのような状況が検出可能な場合に、移動体の前進／後退を指示するためのコマンドなどである。
【００９０】
また、制御対象機器としては、例えば、家電、ＯＡ機器、産業機器、携帯端末、等々が挙げられる。
【図面の簡単な説明】
【図１】本発明の第１実施形態における音声制御装置の全体構成を示すブロック図である。
【図２】第１実施形態の音声制御装置が、音声認識辞書を切り換えるフローチャートである。
【図３】第１実施形態の音声制御装置が、ユーザの発話に応じて制御対象機器の動作状態を変更するフローチャートである。
【図４】本発明の第１実施形態の変形例における全体構成を示すブロック図である。
【図５】第１実施形態の変形例としての音声制御装置が、音声認識辞書の各コマンドに識別コードを付与するフローチャートである。
【図６】本発明の第２実施形態における全体構成を示すブロック図である。
【図７】第２実施形態の音声制御装置が、ユーザの発話から制御対象機器の動作状態を変更するフローチャートである。
【図８】第３実施形態の音声制御装置が、ユーザの発話から制御対象機器の動作状態を変更する処理に関するフローチャートである。
【図９】従来技術において、使用者の発話に基づいてナビゲーションの設定変更を行う装置のブロック図である。
【符号の説明】
１ａ…メモリ、２…制御対象機器、２ａ…エアコン、２ｂ…オーディオ、３…音声認識エンジン、４…ＥＣＵ、４ａ…機器状態検出部、４ｂ…音声認識辞書切換部、４ｃ…認識結果決定部、４ｄ…機器操作信号発生部、５…音声合成エンジン、６…マイク、７…スピーカ

Claims

ユーザの発話内容を認識し、その発話内容に応じた制御対象機器の操作を行う音声制御装置であって、
発話されるべき複数のコマンドを音声認識データとして記憶する記憶手段と、
前記記憶手段に記憶されている複数のコマンドを用いて、ユーザの発話内容をその中の１つのコマンドとして認識する音声認識手段と、
前記制御対象機器の動作状態を検出する検出手段と、
前記音声認識手段によって認識されたコマンドが、相反する操作を実行するための２種のコマンドの一方のコマンドであり、かつ前記検出手段によって検出された前記制御対象機器の動作状態においてその一方のコマンドが選択不可と判別した場合、前記音声認識手段によって認識されたコマンドを、前記２種のコマンドの他方のコマンドに置換する置換手段とを備えることを特徴とする音声制御装置。
前記相反する操作を実行するための２種のコマンドは、前記制御対象機器の動作または所定の機能をオンするためのコマンドとオフするためのコマンドであることを特徴とする請求項１に記載の音声制御装置。
前記相反する操作を実行するための２種のコマンドにより、前記制御対象機器の動作状態が多段階に変化するものである場合、前記音声認識手段によって認識されたコマンドが前記２種のコマンドの一方のコマンドであり、かつ前記検出手段によって検出された前記制御対象機器の動作状態においてその一方のコマンドが選択不可と判別された場合であっても、前記置換手段は、その一方のコマンドの置換を実行しないことを特徴とする請求項１に記載の音声制御装置。
前記一方のコマンドによる操作が実行できない旨を報知する報知手段をさらに備えることを特徴とする請求項３に記載の音声制御装置。