JP2013007917A

JP2013007917A - 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム

Info

Publication number: JP2013007917A
Application number: JP2011141031A
Authority: JP
Inventors: Ryuji Mizutani; 龍治水谷; 順也 ▲高▼橋; Junya Takahashi; Yoriko Sasaki; ヨリ子佐々木; Yasushi Kamisawa; 泰上澤; Masakazu Itakura; 雅和板倉; Manabu Matsuyama; 学松山; Kenichi Murata; 賢一村田; Takafumi Hitotsumatsu; 孝文一ツ松; Takeshi Hotehama; 剛保手浜
Original assignee: Aisin AW Co Ltd; Denso Corp; Toyota Motor Corp
Current assignee: Aisin AW Co Ltd; Denso Corp; Toyota Motor Corp
Priority date: 2011-06-24
Filing date: 2011-06-24
Publication date: 2013-01-10
Anticipated expiration: 2031-06-24
Also published as: JP5408810B2

Abstract

【課題】ユーザの操作負担の増大を抑制しつつ、ユーザにとって影響の大きいコマンドを誤って実行することを防止できる、音声認識制御システム、音声認識制御方法、及び音声認識制御プログラムを提供すること。
【解決手段】音声認識制御システム１は、ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定部１１ａと、音声認識コマンドを特定するコマンド情報と、音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて格納する影響度ＤＢ１２ａと、影響度ＤＢ１２ａに格納されているコマンド情報及び影響度情報に基づき、音声認識コマンド特定部１１ａにより特定された音声認識コマンドの影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定部１１ｂとを備える。
【選択図】図１

Description

本発明は、音声認識制御システム、音声認識制御方法、及び音声認識制御プログラムに関する。

従来、カーナビゲーションシステム等において、例えば経路案内における目的地設定等の入力を、ユーザの音声を認識することで受け付けるための音声認識装置が用いられている。

例えば、地図検索のためにユーザが発声した音声に対する音声認識結果（例えば地名または施設名）の示す地点と、認識に先立って設定された基準点との距離を算出し、当該算出した距離が閾値以上である場合には、当該認識結果の正否の確認をユーザに対して促すための確認メッセージを生成して、それをユーザに提示する、音声認識支援方法が提案されている（例えば、特許文献１参照）。

特開２００１−１３９９１号公報

しかしながら、上述の如き従来の方法は、音声認識結果の示す地点と基準点との距離に応じて認識結果の正否を確認するものであるため、地図検索等の限られた機能にしか適用することができなかった。すなわち、地名や施設名等の地点を示す音声とは異なる音声（例えば、オーディオやパワーウィンドウを操作するための音声等）に対する音声認識結果の正否を確認することはできなかった。その結果、音声認識結果が誤っていた場合であってもその正否を確認せず、発声したユーザの意図とは異なる機能を実行してしまい、操作のやり直し等が必要になる可能性があった。また、全ての音声認識結果について正否を毎回確認することも考えられるが、正否に応じた入力をユーザが毎回行わなければならず、操作が煩雑になる場合があった。

本発明は、上記に鑑みてなされたものであって、ユーザの操作負担の増大を抑制しつつ、ユーザにとって影響の大きいコマンドを誤って実行することを防止できる、音声認識制御システム、音声認識制御方法、及び音声認識制御プログラムを提供することを目的とする。

上述した課題を解決し、目的を達成するために、請求項１に記載の音声認識制御システムは、ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段と、前記音声認識コマンドを特定するコマンド情報と、前記音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて格納する影響度情報格納手段と、前記影響度情報格納手段に格納されている前記コマンド情報及び前記影響度情報に基づき、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定手段と、を備える。

また、請求項２に記載の音声認識制御システムは、請求項１に記載の音声認識制御システムにおいて、前記判定手段は、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度が所定値以上の場合、当該音声認識コマンドに対応する機能を直ちに実行しないと判定し、ユーザに当該音声認識コマンドの正否を確認するための制御を行い、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度が所定値未満の場合、当該音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行う。

また、請求項３に記載の音声認識制御システムは、請求項２に記載の音声認識制御システムにおいて、前記影響度情報格納手段は、所定の機能を実行させるために前記音声認識コマンド特定手段により最後に特定されるべき前記音声認識コマンドの前記影響度が前記所定値以上となるように設定された前記影響度情報を格納する。

また、請求項４に記載の音声認識制御システムは、請求項３に記載の音声認識制御システムにおいて、前記影響度情報格納手段は、前記所定の機能を実行するための前記音声認識コマンドの数が多いほど、当該所定の機能を実行させるために前記音声認識コマンド特定手段により最後に特定されるべき音声認識コマンドの前記影響度が大きくなるように設定された前記影響度情報を格納する。

また、請求項５に記載の音声認識制御システムは、請求項１から４のいずれか一項に記載の音声認識制御システムにおいて、前記音声認識コマンド特定手段は、当該音声認識コマンド特定手段による前記音声認識コマンドの特定結果の信頼度を特定し、前記判定手段は、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度と、当該音声認識コマンドについて前記音声認識コマンド特定手段により特定された前記信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する。

また、請求項６に記載の音声認識制御方法は、ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定ステップと、前記音声認識コマンドを特定するコマンド情報と、前記音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて記憶手段に格納する影響度情報格納ステップと、前記影響度情報格納ステップで前記記憶手段に格納されている前記コマンド情報及び前記影響度情報に基づき、前記音声認識コマンド特定ステップで特定された音声認識コマンドの前記影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定ステップと、を含む。

また、請求項７に記載の音声認識制御プログラムは、請求項６に記載の方法をコンピュータに実行させる。

請求項１に記載の音声認識制御システム、請求項６に記載の音声認識制御方法、及び請求項７に記載の音声認識制御プログラムによれば、判定手段は、影響度情報格納手段に格納されているコマンド情報及び影響度情報に基づき、音声認識コマンド特定手段により特定された音声認識コマンドの影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、ユーザにとって相対的に影響の大きいコマンドについては音声認識結果についての正否を確認し、ユーザにとって相対的に影響の小さいコマンドについては当該音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザにとって影響の大きいコマンドを誤って実行することを防止できる。

また、請求項２に記載の音声認識制御システムによれば、判定手段は、音声認識コマンド特定手段により特定された音声認識コマンドの影響度が所定値以上の場合、当該音声認識コマンドに対応する機能を直ちに実行しないと判定し、ユーザに当該音声認識コマンドの正否を確認するための制御を行うので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が所定値以上のコマンドについては音声認識コマンドの正否を確認することができ、ユーザにとって影響の大きいコマンドを誤って実行することを確実に防止できる。また、判定手段は、音声認識コマンド特定手段により特定された音声認識コマンドの影響度が所定値未満の場合、当該音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行うので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が所定値未満のコマンドについては当該音声認識コマンドに対応する機能を直ちに実行することができ、ユーザの操作負担の増大を確実に抑制することができる。

また、請求項３に記載の音声認識制御システムによれば、影響度情報格納手段は、所定の機能を実行させるために音声認識コマンド特定手段により最後に特定されるべき音声認識コマンドの影響度が所定値以上となるように設定された影響度情報を格納するので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が大きいコマンドを誤って実行することを、一層確実に防止できる。

また、請求項４に記載の音声認識制御システムによれば、影響度情報格納手段は、所定の機能を実行するための音声認識コマンドの数が多いほど、当該所定の機能を実行させるために音声認識コマンド特定手段により最後に特定されるべき音声認識コマンドの影響度が大きくなるように設定された影響度情報を格納するので、ユーザが音声認識コマンドの発話をやり直す場合における労力が大きく当該ユーザへの影響が特に大きいコマンドを誤って実行することを、一層確実に防止できる。

また、請求項５に記載の音声認識制御システムによれば、判定手段は、音声認識コマンド特定手段により特定された音声認識コマンドの影響度と、当該音声認識コマンドについて音声認識コマンド特定手段により特定された信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、音声認識コマンド特定手段により特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性が高い場合には音声認識結果についての正否を確認し、当該音声認識コマンドがユーザの意図するコマンドとは異なる可能性が低い場合には当該音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザの意図するコマンドとは異なるコマンドを誤って実行することを防止できる。

実施の形態１に係る音声認識制御システムを例示するブロック図である。影響度ＤＢに格納されている情報を例示した表である。判定テーブルに格納されている情報を例示した表である。音声認識制御処理のフローチャートである。ユーザに音声認識コマンドの発話を促すメッセージを表示するディスプレイを例示した図である。ユーザの発話音声の認識においてエラーが発生した旨の通知を表示するディスプレイを例示した図である。音声認識コマンドの正否を確認する旨を表示するディスプレイを例示した図である。実施の形態２に係る判定テーブルに格納されている情報を例示した表である。音声認識コマンドの正否を確認する旨を表示するディスプレイを例示した図である。音声認識コマンドの正否を確認する旨を表示するディスプレイを例示した図である。音声認識コマンドの正否を確認する旨を表示するディスプレイを例示した図である。

以下、本発明に係る音声認識制御システム、音声認識制御方法、及び音声認識制御プログラムの各実施の形態について図面を参照しつつ詳細に説明する。ただし、これらの各実施の形態によって本発明が限定されるものではない。なお、以下の説明では、カーナビゲーションシステムの一部として音声認識制御システムが車両に搭載されているものとする。

〔実施の形態１〕
まず、実施の形態１に係る音声認識制御システムについて説明する。この実施の形態１は、音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度と、当該音声認識コマンドの特定結果の信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する形態である。ここで「音声認識コマンド」とは、音声認識制御システムに接続されたナビゲーション装置やエアコン等の各種接続機器に対する操作指示を含み、当該操作指示に伴って必要になる情報を含む、一連の発話内容をいうものとする。

（構成）
最初に、実施の形態１に係る音声認識制御システムの構成について説明する。図１は、本実施の形態１に係る音声認識制御システムを例示するブロック図である。この音声認識制御システム１は、概略的に、ユーザが発話した音声に基づいて音声認識コマンドを特定する。そして、音声認識制御システム１に接続された各種接続機器（図１の例では、ナビゲーション装置６、エアコン７、オーディオ８、携帯電話９、及びＥＣＵ１０（ＥｌｅｃｔｒｏｎｉｃＣｏｎｔｒｏｌＵｎｉｔ））に、当該特定した音声認識コマンドに対応する機能を実行させる。

この音声認識制御システム１は、図１に示すように、制御部１１、及びデータ記録部１２を備えている。また、音声認識制御システム１には、マイク２、タッチパネル３、ディスプレイ４、及びスピーカ５が接続されている。

（構成−音声認識制御システム−制御部）
制御部１１は、音声認識制御システム１を制御する制御手段であり、具体的には、ＣＰＵ、当該ＣＰＵ上で解釈実行される各種のプログラム（ＯＳなどの基本制御プログラムや、ＯＳ上で起動され特定機能を実現するアプリケーションプログラムを含む）、及びプログラムや各種のデータを格納するためのＲＡＭの如き内部メモリを備えて構成されるコンピュータである。特に、本実施の形態１に係る音声認識制御プログラムは、任意の記録媒体又はネットワークを介して音声認識制御システム１にインストールされることで、制御部１１の各部を実質的に構成する。

この制御部１１は、機能概念的に、音声認識コマンド特定部１１ａ、及び判定部１１ｂを備えている。音声認識コマンド特定部１１ａは、ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段である。判定部１１ｂは、音声認識コマンド特定部１１ａにより特定された音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定手段である。これらの制御部１１の各部によって実行される処理の詳細については後述する。

（構成−音声認識制御システム−データ記録部）
データ記録部１２は、音声認識制御システム１の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記憶装置としてのハードディスク（図示省略）の如き磁気的記録媒体を用いて構成されている。ただし、ハードディスクに代えてあるいはハードディスクと共に、フラッシュメモリの如き半導体型記憶媒体、又はＤＶＤやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる。

このデータ記録部１２は、影響度データベース１２ａ（以下、データベースをＤＢと略記する）、及び判定テーブル１２ｂを備えている。

影響度ＤＢ１２ａは、音声認識コマンドを特定するコマンド情報と、音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて格納する影響度情報格納手段である。図２は、影響度ＤＢ１２ａに格納されている情報を例示した表である。この図２に示すように、影響度ＤＢ１２ａには、項目「音声認識コマンド」及び「影響度」に対応する情報が、相互に関連付けて格納されている。この内、項目「音声認識コマンド」に対応して格納される情報は、音声認識コマンドを特定するコマンド情報である（図２では、例えば「目的地に設定」等）。項目「影響度」に対応して格納される情報は、音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報である。図２の例では、影響度を示す１から３の整数（影響度が大きいほど値が大きい）が項目「影響度」に対応して格納されている。

ここで、「音声認識コマンドに対応する機能を直ちに実行する」とは、ユーザが発話した音声に基づいて特定された音声認識コマンドが当該ユーザの意図したコマンドであるか否か（以下、必要に応じて「音声認識コマンドの正否」）をユーザに確認することなく、当該音声認識コマンドに対応する機能を実行することを意味する。すなわち、音声認識コマンドの正否をユーザに確認することなく、当該音声認識コマンドに対応する機能を実行した場合におけるユーザへの影響が大きいほど、当該音声コマンドに対応する影響度は大きくなる。

より具体的には、例えば、所定の機能を実行させるためにユーザが複数の音声認識コマンドを段階的に発話する場合において、影響度ＤＢ１２ａに格納されている影響度情報は、所定の機能を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドの影響度が所定値以上（図２では「３」）となるように設定されている。これは、所定の機能を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドの正否をユーザに確認することなく、当該音声認識コマンドに対応する機能を実行した場合、当該音声認識コマンドが当該ユーザの意図したコマンドであるか否かに関わらず所定の機能が自動的に実行されるため、仮に当該音声認識コマンドが当該ユーザの意図しないコマンドであった場合、ユーザは音声認識コマンドの発話を初めからやり直さなければならず、当該ユーザへの影響が大きいと考えられるからである。また、所定の機能を実行させるために音声認識コマンド特定部１１ａにより特定されるべき音声認識コマンドであって、最後に特定されるべき音声認識コマンド以外の音声認識コマンド（以下、必要に応じて「途中で特定されるべき音声認識コマンド」）の影響度は所定値未満（図２では「２」又は「１」）となるように設定されている。これは、仮に当該音声認識コマンドが当該ユーザの意図しないコマンドであっても所定の機能が自動的に実行されることはないため、当該音声認識コマンドを再度発話し直せばよく、ユーザへの影響が相対的に小さいと考えられるからである。

さらに、影響度ＤＢ１２ａに格納されている影響度情報を、所定の機能を実行するための音声認識コマンドの数が多いほど、当該所定の機能を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドの影響度が大きくなるように設定してもよい。すなわち、所定の機能を実行するために必要となる複数の音声認識コマンドがツリー構造として構成されており、上位階層の音声認識コマンドから下位階層の音声認識コマンドへと順次音声認識コマンドが入力されることで所定の機能が実行される場合において、最上位階層から最下位階層までの階層数が多いほど、最下位階層の音声認識コマンドの影響度が大きくなるように設定してもよい。例えばナビゲーション装置６に対して、特定の施設名称を用いて目的地設定を行う場合、目的地設定を実行するために必要となる音声認識コマンドは、上位階層から順に、目的地の施設名称（例えば「東京タワー」等）を設定するための音声認識コマンド、及び、目的地設定を確定して実行させるための音声認識コマンド（例えば「目的地に設定」）が必要となる。この場合、最上位階層から最下位階層までの階層数は２階層となる。一方、住所を用いて目的地設定を行う場合、目的地設定を実行するために必要となる音声認識コマンドは、上位階層から順に、「都道府県」を設定するための音声認識コマンド、「市区」を設定するための音声認識コマンド、「町村」を設定するための音声認識コマンド、「番地」を設定するための音声認識コマンド、及び、目的地設定を確定して実行させるための音声認識コマンド（「目的地に設定」）が、階層的に構成されている。この場合、最上位階層から最下位階層までの階層数は５階層となる。この場合に、目的地設定を行うための最下位階層の音声認識コマンド「目的地に設定」の影響度は、特定の施設名称を用いて目的地設定を行う場合よりも、住所を用いて目的地設定を行う場合の方が大きくなるように設定してもよい。

また、音声認識コマンドの正否をユーザに確認することなく当該音声認識コマンドに対応する所定の機能を実行した場合におけるユーザへの影響が小さいと考えられる場合には、その音声認識コマンドが当該所定の機能を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドであっても、影響度が所定値未満（図２では３未満）となるように設定してもよい。

図１に戻り、判定テーブル１２ｂは、判定部１１ｂが音声認識コマンドに対応する機能を直ちに実行するか否かを判定する際に参照するための情報を格納する判定情報格納手段である。図３は、判定テーブル１２ｂに格納されている情報を例示した表である。この図３に示すように、判定テーブル１２ｂには、音声認識コマンド特定部１１ａによる音声認識コマンドの特定結果の信頼度を特定する信頼度情報（図３では１から３の整数。値が大きいほど信頼度が高い）と、音声認識コマンドの影響度を特定する影響度情報との双方に対応付けて、判定部１１ｂによる判定内容を特定する判定情報が格納されている（例えば、信頼度「３」及び影響度「３」に対応して「ユーザに確認」等）。なお、この判定テーブル１２ｂに格納されている情報を用いた処理の詳細については後述する。

（構成−マイク）
図１に戻り、マイク２は、音声を電気信号に変換して音声認識制御システム１に出力する。このマイク２としては、公知のマイクを用いることができる。

（構成−タッチパネル）
タッチパネル３は、ユーザの指等で押圧されることにより、当該ユーザから各種手動入力を受け付けるものである。このタッチパネル３は、透明又は半透明状に形成され、ディスプレイ４の前面において当該ディスプレイ４の表示面と重畳するように設けられている。このタッチパネル３としては、例えば抵抗膜方式や静電容量方式等による操作位置検出手段を備えた公知のタッチパネルを使用することができる。

（構成−ディスプレイ）
ディスプレイ４は、音声認識制御システム１の制御に基づいて情報を表示にて出力する表示出力手段である。なお、このディスプレイ４の具体的な構成は任意であり、公知の液晶ディスプレイや有機ＥＬディスプレイの如きフラットパネルディスプレイを使用することができる。

（構成−スピーカ）
スピーカ５は、音声認識制御システム１の制御に基づいて情報を音声にて出力する音声出力手段である。スピーカ５から出力される音声の具体的な態様は任意であり、必要に応じて生成された合成音声や、予め録音された音声を出力することができる。

（処理−表示制御処理）
次に、このように構成された音声認識制御システム１によって実行される音声認識制御処理について説明する。図４は音声認識制御処理のフローチャートである（以下の各処理の説明ではステップを「Ｓ」と略記する）。この音声認識制御処理は、例えば、音声認識制御システム１に電源が投入された後に起動される。

図４に示すように、音声認識制御処理が開始されると、音声認識コマンド特定部１１ａは、マイク２を介してユーザの発話音声が入力されるまで待機する（ＳＡ１、Ｎｏ）。例えば音声認識コマンド特定部１１ａは、ユーザに音声認識コマンドの発話を促すメッセージをディスプレイ４に表示させ、マイク２を介してユーザの発話音声が入力されるまで待機する。図５は、ユーザに音声認識コマンドの発話を促すメッセージを表示するディスプレイ４を例示した図である。

図４に戻り、マイク２を介してユーザの発話音声が入力された場合（ＳＡ１、Ｙｅｓ）、音声認識コマンド特定部１１ａは、ユーザの発話音声を認識する（ＳＡ２）。なお、音声認識コマンド特定部１１ａは公知の音声認識技術を用いてユーザの発話音声を認識する。

続いて音声認識コマンド特定部１１ａは、ＳＡ２で認識したユーザの発話音声に基づいて音声認識コマンドを特定する（ＳＡ３）。例えば音声認識コマンド特定部１１ａは、図２に例示した影響度ＤＢ１２ａの項目「音声認識コマンド」に対応して格納されているコマンド情報に基づき特定される音声認識コマンドと、ＳＡ２で認識したユーザの発話音声とを比較し、一致度が最も高い音声認識コマンドを、ユーザにより入力された音声認識コマンドとして特定する。

次に、音声認識コマンド特定部１１ａは、当該音声認識コマンド特定部１１ａによる音声認識コマンドの特定結果の信頼度を特定する（ＳＡ４）。例えば音声認識コマンド特定部１１ａは、ＳＡ２で認識したユーザの発話音声と、ＳＡ３で特定した音声認識コマンドとの一致度に基づき、信頼度を特定する。以下の説明では、ＳＡ２で認識したユーザの発話音声と、ＳＡ３で特定した音声認識コマンドとの一致度が高いほど、特定される信頼度が高くなるものとする。

続いて判定部１１ｂは、影響度ＤＢ１２ａに格納されているコマンド情報及び影響度情報に基づき、音声認識コマンド特定部１１ａにより特定された音声認識コマンドの影響度を特定する（ＳＡ５）。

図２に例示した影響度ＤＢ１２ａによれば、判定部１１ｂは、例えばＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドが「目的地に設定」である場合、その音声認識コマンドの影響度が「３」であると特定する。この音声認識コマンド「目的地に設定」は、所定の機能（すなわち選択された地点を目的地に設定する機能）を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドであり、特に、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合、都道府県名や市区町村名を最初から発話し直さなければならず、ユーザにとって負担が大きいため、最も大きい影響度「３」が設定されている。

また、例えばＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドが「曲を削除する」である場合、その音声認識コマンドの影響度が「３」であると特定する。この音声認識コマンド「曲を削除する」は、所定の機能（すなわち選択された曲を削除する機能）を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドであり、特に、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合、削除された曲を元に戻すことはできず、改めてその曲を登録し直さなければならないことから、ユーザにとって負担が大きいため、最も大きい影響度「３」が設定されている。

また、例えばＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドが「○○を購入」である場合、その音声認識コマンドの影響度が「３」であると特定する。この音声認識コマンド「○○を購入」は、所定の機能（すなわち選択された商品を購入する機能）を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドであり、特に、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合、その商品購入に伴う課金処理を取り消すことはできず、ユーザは無駄な出費を強いられてしまうことから、最も大きい影響度「３」が設定されている。

また、例えばＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドが「窓を開ける」である場合、その音声認識コマンドの影響度が「３」であると特定する。この音声認識コマンド「窓を開ける」は、所定の機能（すなわち車両の窓を開ける機能）を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドであり、特に、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合、車内に風雨が吹き込んでくる可能性があり、ユーザに物理的な影響が及ぶことから、最も大きい影響度「３」が設定されている。

また、例えばＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドが「電話をかける」である場合には、判定部１１ｂは当該音声認識コマンドの影響度が「３」であると特定する。この音声認識コマンド「電話をかける」は、所定の機能（すなわち電話をかける機能）を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドであり、特に、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合、その通話に伴う課金処理を取り消すことはできず、ユーザは無駄な出費を強いられてしまい、意図する宛先に電話をかけ直す必要もあることから、最も大きい影響度「３」が設定されている。

また、例えばＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドが「周辺施設探索」である場合には、判定部１１ｂは当該音声認識コマンドの影響度が「２」であると特定する。この音声認識コマンド「周辺施設探索」は、所定の機能（すなわち所定の地点の周辺施設を探索する機能）を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドではあるものの、万一当該音声認識コマンドが当該ユーザの意図しないコマンドであった場合には、ユーザは探索結果を無視すればよく、ユーザへの影響が若干小さいと考えられるため、影響度「３」よりも一段階小さい影響度「２」が設定されている。

また、例えばＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドが「次の曲を再生」である場合には、判定部１１ｂは当該音声認識コマンドの影響度が「１」であると特定する。この音声認識コマンド「次の曲を再生」は、所定の機能（すなわち次の曲を再生する機能）を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドではあるものの、万一当該音声認識コマンドが当該ユーザの意図しないコマンドであった場合であっても、再生された次の曲を聴き続けることも可能であり、ユーザへの影響は小さいと考えられるため、最も小さい影響度「１」が設定されている。

このように、所定の機能を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドの中でも、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合において、再度の発話負担が大きいもの、データが削除されてしまうもの、取り消し不可能な課金処理が行われるもの、ユーザに物理的な影響が及ぶもの等は、ユーザへの影響が大きいと考えられることから、最も大きい影響度「３」が設定されている。これに対して、万一音声認識コマンドがユーザの意図しないコマンドであった場合でも、再度の発話負担が小さかったり、誤って特定された音声認識コマンドに基づき実行された機能をユーザが無視可能である場合には、ユーザへの影響が小さいと考えられることから、相対的に小さい影響度「２」や「１」が設定されている。

また、例えばＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドが地名である場合には、判定部１１ｂは当該音声認識コマンドの影響度が「２」であると特定する。音声認識コマンドとして地名が入力された場合、当該音声認識コマンドは、所定の機能（例えば目的地設定等）を実行させるために音声認識コマンド特定部１１ａにより途中で特定されるべき音声認識コマンドであり、仮に特定された地名がユーザの意図しない地名であっても所定の機能が自動的に実行されることはないため、ユーザは意図する地名を再度発話し直せばよく、ユーザへの影響が相対的に小さいと考えられるため、影響度「３」よりも一段階小さい影響度「２」が設定されている。

図４に戻り、ＳＡ５の処理の後、判定部１１ｂは判定テーブル１２ｂを参照し、ＳＡ５で当該判定部１１ｂが特定した音声認識コマンドの影響度と、当該音声認識コマンドについてＳＡ４で音声認識コマンド特定部１１ａにより特定された信頼度とに対応する判定内容を特定する（ＳＡ６）。

図３の判定テーブル１２ｂによれば、音声認識コマンドの影響度に関わらず、ＳＡ４で音声認識コマンド特定部１１ａにより特定された信頼度が「１」である場合、音声認識コマンド特定部１１ａによる音声認識コマンドの特定結果の信頼度が低く、当該特定された音声認識コマンドに対応する機能を実行することは適切ではないと考えられることから、対応する判定内容は、ユーザの発話音声の認識においてエラーが発生した旨を示す「認識エラー」となっている。

また、ＳＡ４で音声認識コマンド特定部１１ａにより特定された信頼度が「２」であり、且つＳＡ５で判定部１１ｂが特定した音声認識コマンドの影響度が「２」以上である場合、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性があることから、対応する判定内容は、音声認識コマンドの正否をユーザに確認すべき旨を示す「ユーザに確認」となっている。また、ＳＡ４で音声認識コマンド特定部１１ａにより特定された信頼度が「３」であり、且つＳＡ５で判定部１１ｂが特定した音声認識コマンドの影響度が「３」である場合、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性は低いものの、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響が大きいことから、対応する判定内容は、音声認識コマンドの正否をユーザに確認すべき旨を示す「ユーザに確認」となっている。

ＳＡ４で音声認識コマンド特定部１１ａにより特定された信頼度が「２」であり、且つＳＡ５で判定部１１ｂが特定した音声認識コマンドの影響度が「１」である場合、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性があるものの、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響が最小であることから、対応する判定内容は、当該音声認識コマンドに対応する機能を直ちに実行すべき旨を示す「機能実行」となっている。また、ＳＡ４で音声認識コマンド特定部１１ａにより特定された信頼度が「３」であり、且つＳＡ５で判定部１１ｂが特定した音声認識コマンドの影響度が「２」以下である場合、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性が低く、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響も小さいことから、対応する判定内容は、当該音声認識コマンドに対応する機能を直ちに実行すべき旨を示す「機能実行」となっている。

図４に戻り、判定部１１ｂは、ＳＡ６で特定した判定内容が「認識エラー」か否かを判定する（ＳＡ７）。その結果、ＳＡ６で特定した判定内容が「認識エラー」である場合（ＳＡ７、Ｙｅｓ）、判定部１１ｂは、ユーザの発話音声の認識においてエラーが発生した旨の通知をディスプレイ４やスピーカ５を介して出力させる（ＳＡ８）。図６は、ユーザの発話音声の認識においてエラーが発生した旨の通知を表示するディスプレイ４を例示した図である。図４に戻り、ＳＡ８の処理の後、ＳＡ１に戻り、音声認識コマンド特定部１１ａは、マイク２を介してユーザの発話音声が入力されるまで待機する（ＳＡ１、Ｎｏ）。

一方、ＳＡ６で特定した判定内容が「認識エラー」ではない場合（ＳＡ７、Ｎｏ）、すなわち図３の判定テーブル１２ｂによれば、ＳＡ４で音声認識コマンド特定部１１ａにより特定された信頼度が「２」以上である場合、判定部１１ｂは、ＳＡ６で特定した判定内容が「機能実行」か否かを判定する（ＳＡ９）。

その結果、ＳＡ６で特定した判定内容が「機能実行」ではない場合（「ユーザに確認」である場合）（ＳＡ９、Ｎｏ）、判定部１１ｂは、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドの正否を確認する旨をディスプレイ４やスピーカ５を介して出力させる（ＳＡ１０）。図７は、音声認識コマンドの正否を確認する旨を表示するディスプレイ４を例示した図である。

図４に戻り、ＳＡ１０の処理の後、判定部１１ｂは、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザにより承認されたか否かを判定する（ＳＡ１１）。例えば判定部１１ｂは、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドを承認する旨の操作（図７の例では「はい」ボタンを押す操作）がタッチパネル３を介して入力された場合、当該音声認識コマンドがユーザにより承認されたと判定する。また、当該音声認識コマンドを承認しない旨の操作（図７の例では「いいえ」ボタンを押す操作）がタッチパネル３を介して入力された場合、当該音声認識コマンドがユーザにより承認されなかったと判定する。なお、マイク２を介して入力されたユーザの発話音声（例えば「はい」又は「いいえ」との発話）に基づいて、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドを承認する旨の操作入力及び承認しない旨の操作入力を受け付けることとしてもよい。

その結果、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザにより承認されなかった場合（ＳＡ１１、Ｎｏ）、ＳＡ１に戻り、音声認識コマンド特定部１１ａは、マイク２を介してユーザの発話音声が入力されるまで待機する（ＳＡ１、Ｎｏ）。

一方、ＳＡ９において、ＳＡ６で特定した判定内容が「機能実行」である場合（ＳＡ９、Ｙｅｓ）、判定部１１ｂは、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行う（ＳＡ１２）。

また、ＳＡ１１において、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザにより承認された場合（ＳＡ１１、Ｙｅｓ）、当該音声認識コマンドはユーザの意図するコマンドと考えられることから、判定部１１ｂは当該音声認識コマンドに対応する機能を実行するための制御を行う（ＳＡ１２）。

ＳＡ１２の処理の後、制御部１１は音声認識制御処理を終了する。

（効果）
このように本実施の形態１によれば、判定部１１ｂは、影響度ＤＢ１２ａに格納されているコマンド情報及び影響度情報に基づき、音声認識コマンド特定部１１ａにより特定された音声認識コマンドの影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、ユーザにとって相対的に影響の大きいコマンドについては音声認識結果についての正否を確認し、ユーザにとって相対的に影響の小さいコマンドについては当該音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザにとって影響の大きいコマンドを誤って実行することを防止できる。

また、判定部１１ｂは、音声認識コマンド特定部１１ａにより特定された音声認識コマンドの影響度が所定値以上の場合、当該音声認識コマンドに対応する機能を直ちに実行しないと判定し、ユーザに当該音声認識コマンドの正否を確認するための制御を行うので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が所定値以上のコマンドについては音声認識コマンドの正否を確認することができ、ユーザにとって影響の大きいコマンドを誤って実行することを確実に防止できる。また、判定部１１ｂは、音声認識コマンド特定部１１ａにより特定された音声認識コマンドの影響度が所定値未満の場合、当該音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行うので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が所定値未満のコマンドについては当該音声認識コマンドに対応する機能を直ちに実行することができ、ユーザの操作負担の増大を確実に抑制することができる。

また、影響度ＤＢ１２ａは、所定の機能を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドの影響度が所定値以上となるように設定された影響度情報を格納するので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が大きいコマンドを誤って実行することを、一層確実に防止できる。

また、影響度ＤＢ１２ａは、所定の機能を実行するための音声認識コマンドの数が多いほど、当該所定の機能を実行させるために音声認識コマンド特定部１１ａにより最後に特定されるべき音声認識コマンドの影響度が大きくなるように設定された影響度情報を格納するので、ユーザが音声認識コマンドの発話をやり直す場合における労力が大きく当該ユーザへの影響が特に大きいコマンドを誤って実行することを、一層確実に防止できる。

また、判定部１１ｂは、音声認識コマンド特定部１１ａにより特定された音声認識コマンドの影響度と、当該音声認識コマンドについて音声認識コマンド特定部１１ａにより特定された信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性が高い場合には音声認識結果についての正否を確認し、当該音声認識コマンドがユーザの意図するコマンドとは異なる可能性が低い場合には当該音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザの意図するコマンドとは異なるコマンドを誤って実行することを防止できる。

〔実施の形態２〕
次に、実施の形態２について説明する。この実施の形態２は、ユーザの発話音声に含まれる単語毎に信頼度を特定する形態である。なお、実施の形態２の構成は、特記する場合を除いて、実施の形態１の構成と略同一であり、実施の形態１の構成と略同一の構成についてはこの実施の形態１で用いたものと同一の符号及び／又は名称を必要に応じて付して、その説明を省略する。

（構成−音声認識制御システム−データ記録部）
まず、実施の形態２に係るデータ記録部１２について説明する。図８は、実施の形態２に係る判定テーブル１２ｂに格納されている情報を例示した表である。この図８に示すように、判定テーブル１２ｂには、音声認識コマンド特定部１１ａにより特定された音声認識コマンドに含まれる各単語の信頼度の組み合わせを特定する信頼度情報（図８では、「全て３」、「「全て３」又は「全て１」以外」、及び「全て１」）と、音声認識コマンドの影響度を特定する影響度情報（図８では１から３の整数）との双方に対応付けて、判定部１１ｂによる判定内容を特定する判定情報が格納されている（例えば、信頼度「全て３」及び影響度「３」に対応して「ユーザに確認」等）。なお、この判定テーブル１２ｂに格納されている情報を用いた処理の詳細については後述する。

（処理−表示制御処理）
次に、実施の形態２に係る音声認識制御処理について説明する。なお、本実施の形態２に係る音声認識制御処理における各処理は、図４のＳＡ４、６、９、及び１０の各処理の内容を除き、実施の形態１で説明した音声認識制御処理と同じであるので、図示及び説明を省略する。

図４のＳＡ４において、音声認識コマンド特定部１１ａは、ＳＡ２で当該音声認識コマンド特定部１１ａが認識したユーザの発話音声に含まれる各単語の信頼度を特定する（ＳＡ４）。例えば、予めデータ記録部１２に音声データ辞書を記録させておき、音声認識コマンド特定部１１ａは、ＳＡ２で認識したユーザの発話音声に含まれる各単語と、音声データ辞書に登録されている単語との一致度に基づき、ユーザの発話音声に含まれる各単語の信頼度を特定する。以下の説明では、ＳＡ２で認識したユーザの発話音声に含まれる各単語と、音声データ辞書に登録されている単語との一致度が高いほど、各単語について特定される信頼度が高くなるものとする。

ＳＡ６において、判定部１１ｂは判定テーブル１２ｂを参照し、ＳＡ５で当該判定部１１ｂが特定した音声認識コマンドの影響度と、ＳＡ４で音声認識コマンド特定部１１ａが特定したユーザの発話音声に含まれる各単語の信頼度の組み合わせとに対応する判定内容を特定する（ＳＡ６）。

図８の判定テーブル１２ｂによれば、ＳＡ４で音声認識コマンド特定部１１ａが特定したユーザの発話音声に含まれる各単語の信頼度が全て「１」である場合、音声認識コマンド特定部１１ａによる音声認識コマンドの特定結果の信頼度が低く、当該特定された音声認識コマンドに対応する機能を実行することは適切ではないと考えられることから、対応する判定内容は、ユーザの発話音声の認識においてエラーが発生した旨を示す「認識エラー」となっている。

また、ＳＡ４で音声認識コマンド特定部１１ａが特定したユーザの発話音声に含まれる各単語の信頼度が全て「１」又は全て「３」以外であり、且つＳＡ５で判定部１１ｂが特定した音声認識コマンドの影響度が「２」以上である場合、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性があることから、対応する判定内容は、音声認識コマンドの正否をユーザに確認すべき旨を示す「ユーザに確認」となっている。また、ＳＡ４で音声認識コマンド特定部１１ａが特定したユーザの発話音声に含まれる各単語の信頼度が全て「３」であり、且つＳＡ５で判定部１１ｂが特定した音声認識コマンドの影響度が「３」である場合、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性は低いものの、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響が大きいことから、対応する判定内容は、音声認識コマンドの正否をユーザに確認すべき旨を示す「ユーザに確認」となっている。

また、ＳＡ４で音声認識コマンド特定部１１ａが特定したユーザの発話音声に含まれる各単語の信頼度が全て「１」又は全て「３」以外であり、且つＳＡ５で判定部１１ｂが特定した音声認識コマンドの影響度が「１」である場合、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性があるものの、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響が最小であることから、対応する判定内容は、当該音声認識コマンドに対応する機能を直ちに実行すべき旨を示す「機能実行」となっている。また、ＳＡ４で音声認識コマンド特定部１１ａが特定したユーザの発話音声に含まれる各単語の信頼度が全て「３」であり、且つＳＡ５で判定部１１ｂが特定した音声認識コマンドの影響度が「２」以下である場合、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性が低く、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響も小さいことから、対応する判定内容は、当該音声認識コマンドに対応する機能を直ちに実行すべき旨を示す「機能実行」となっている。

図４に戻り、ＳＡ９において、判定部１１ｂは、ＳＡ６で特定した判定内容が「機能実行」か否かを判定する（ＳＡ９）。

その結果、ＳＡ６で特定した判定内容が「機能実行」ではない場合（「ユーザに確認」である場合）（ＳＡ９、Ｎｏ）、判定部１１ｂは、ＳＡ３で音声認識コマンド特定部１１ａにより特定された音声認識コマンドの正否を確認する旨をディスプレイ４やスピーカ５を介して出力させる（ＳＡ１０）。

例えば、ＳＡ２で音声認識コマンド特定部１１ａが認識したユーザの発話音声に含まれる単語が「電話をかける」及び「○○さん」であり、「電話をかける」の信頼度が「２」又は「３」、「○○さん」の信頼度が「１」の場合、ユーザの意図する宛て先とは異なる宛て先に電話をかけてしまう可能性がある。そこで判定部１１ｂは、図９に示すように、信頼度が最小であった単語「○○さん」の正否を確認する旨をディスプレイ４やスピーカ５を介して出力させる。さらに、図９に示すように、「○○さん」と代替可能な他の宛て先（図９では「○△さん」や「×○さん」）をディスプレイ４やスピーカ５を介して出力させるようにしてもよい。

また、「電話をかける」の信頼度が「１」、「○○さん」の信頼度が「２」又は「３」の場合、「○○さん」に対してユーザが「電話をかける」ことを意図していない可能性がある。そこで判定部１１ｂは、図１０に示すように、信頼度が最小であった単語「電話をかける」の正否を確認する旨をディスプレイ４やスピーカ５を介して出力させる。さらに、図１０に示すように、「電話をかける」と代替可能な他の音声認識コマンド（図１０では「家に行く」や「曲を再生する」）をディスプレイ４やスピーカ５を介して出力させるようにしてもよい。

また、「電話をかける」及び「○○さん」の信頼度が「２」又は「３」であって、両方の信頼度が「３」ではない場合、これらの２つの単語を組み合わせた音声認識コマンド「○○さんに電話をかける」がユーザの意図するコマンドとは異なる可能性がある。そこで判定部１１ｂは、図１１に示すように、音声認識コマンド「○○さんに電話をかける」の正否を確認する旨をディスプレイ４やスピーカ５を介して出力させる。

（効果）
このように本実施の形態２によれば、音声認識コマンド特定部１１ａは、当該音声認識コマンド特定部１１ａが認識したユーザの発話音声に含まれる各単語の信頼度を特定し、判定部１１ｂは、音声認識コマンド特定部１１ａにより特定された音声認識コマンドの影響度と、音声認識コマンド特定部１１ａが特定したユーザの発話音声に含まれる各単語の信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、ユーザの発話音声に含まれる単語がユーザの意図する単語とは異なる可能性が高い場合には当該単語について音声認識結果の正否を確認し、ユーザの発話音声に含まれる単語がユーザの意図する単語とは異なる可能性が低い場合には音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザの意図するコマンドとは異なるコマンドを誤って実行することを一層確実に防止できる。

〔各実施の形態に対する変形例〕
以上、本発明に係る各実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。

（解決しようとする課題や発明の効果について）
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏することがある。

（音声認識制御システムの構成について）
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成できる。例えば、音声認識制御システム１を一体の装置として車両に搭載してもよく、あるいは制御部１１やデータ記録部１２をネットワーク上に分散配置してもよい。

（音声認識制御処理について）
上述の各実施の形態では、判定部１１ｂが、音声認識コマンド特定部１１ａにより特定された音声認識コマンドの影響度と、当該音声認識コマンドについて音声認識コマンド特定部１１ａにより特定された信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する場合を例として説明したが、音声認識コマンド特定部１１ａにより特定された音声認識コマンドの影響度のみに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するようにしてもよい。この場合、図４に示した音声認識制御処理において、ＳＡ４の処理を省略することができいる。

あるいは、音声認識コマンドについて音声認識コマンド特定部１１ａにより特定された信頼度のみに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するようにしてもよい。この場合、図４に示した音声認識制御処理において、ＳＡ５の処理を省略することができいる。

１音声認識制御システム
２マイク
３タッチパネル
４ディスプレイ
５スピーカ
６ナビゲーション装置
７エアコン
８オーディオ
９携帯電話
１０ＥＣＵ
１１制御部
１１ａ音声認識コマンド特定部
１１ｂ判定部
１２データ記録部
１２ａ影響度ＤＢ
１２ｂ判定テーブル

Claims

ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段と、
前記音声認識コマンドを特定するコマンド情報と、前記音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて格納する影響度情報格納手段と、
前記影響度情報格納手段に格納されている前記コマンド情報及び前記影響度情報に基づき、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定手段と、
を備える音声認識制御システム。
前記判定手段は、
前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度が所定値以上の場合、当該音声認識コマンドに対応する機能を直ちに実行しないと判定し、ユーザに当該音声認識コマンドの正否を確認するための制御を行い、
前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度が所定値未満の場合、当該音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行う、
請求項１に記載の音声認識制御システム。
前記影響度情報格納手段は、
所定の機能を実行させるために前記音声認識コマンド特定手段により最後に特定されるべき前記音声認識コマンドの前記影響度が前記所定値以上となるように設定された前記影響度情報を格納する、
請求項２に記載の音声認識制御システム。
前記影響度情報格納手段は、
前記所定の機能を実行するための前記音声認識コマンドの数が多いほど、当該所定の機能を実行させるために前記音声認識コマンド特定手段により最後に特定されるべき音声認識コマンドの前記影響度が大きくなるように設定された前記影響度情報を格納する、
請求項３に記載の音声認識制御システム。
前記音声認識コマンド特定手段は、当該音声認識コマンド特定手段による前記音声認識コマンドの特定結果の信頼度を特定し、
前記判定手段は、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度と、当該音声認識コマンドについて前記音声認識コマンド特定手段により特定された前記信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する、
請求項１から４のいずれか一項に記載の音声認識制御システム。
ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定ステップと、
前記音声認識コマンドを特定するコマンド情報と、前記音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて記憶手段に格納する影響度情報格納ステップと、
前記影響度情報格納ステップで前記記憶手段に格納されている前記コマンド情報及び前記影響度情報に基づき、前記音声認識コマンド特定ステップで特定された音声認識コマンドの前記影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定ステップと、
を含む音声認識制御方法。
請求項６に記載の方法をコンピュータに実行させる音声認識制御プログラム。