JP2013007917A - 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム - Google Patents

音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム Download PDF

Info

Publication number
JP2013007917A
JP2013007917A JP2011141031A JP2011141031A JP2013007917A JP 2013007917 A JP2013007917 A JP 2013007917A JP 2011141031 A JP2011141031 A JP 2011141031A JP 2011141031 A JP2011141031 A JP 2011141031A JP 2013007917 A JP2013007917 A JP 2013007917A
Authority
JP
Japan
Prior art keywords
voice recognition
recognition command
command
influence
specified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2011141031A
Other languages
English (en)
Other versions
JP5408810B2 (ja
Inventor
Ryuji Mizutani
龍治 水谷
順也 ▲高▼橋
Junya Takahashi
Yoriko Sasaki
ヨリ子 佐々木
Yasushi Kamisawa
泰 上澤
Masakazu Itakura
雅和 板倉
Manabu Matsuyama
学 松山
Kenichi Murata
賢一 村田
Takafumi Hitotsumatsu
孝文 一ツ松
Takeshi Hotehama
剛 保手浜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisin AW Co Ltd
Denso Corp
Toyota Motor Corp
Original Assignee
Aisin AW Co Ltd
Denso Corp
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisin AW Co Ltd, Denso Corp, Toyota Motor Corp filed Critical Aisin AW Co Ltd
Priority to JP2011141031A priority Critical patent/JP5408810B2/ja
Publication of JP2013007917A publication Critical patent/JP2013007917A/ja
Application granted granted Critical
Publication of JP5408810B2 publication Critical patent/JP5408810B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】ユーザの操作負担の増大を抑制しつつ、ユーザにとって影響の大きいコマンドを誤って実行することを防止できる、音声認識制御システム、音声認識制御方法、及び音声認識制御プログラムを提供すること。
【解決手段】音声認識制御システム1は、ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定部11aと、音声認識コマンドを特定するコマンド情報と、音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて格納する影響度DB12aと、影響度DB12aに格納されているコマンド情報及び影響度情報に基づき、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定部11bとを備える。
【選択図】図1

Description

本発明は、音声認識制御システム、音声認識制御方法、及び音声認識制御プログラムに関する。
従来、カーナビゲーションシステム等において、例えば経路案内における目的地設定等の入力を、ユーザの音声を認識することで受け付けるための音声認識装置が用いられている。
例えば、地図検索のためにユーザが発声した音声に対する音声認識結果(例えば地名または施設名)の示す地点と、認識に先立って設定された基準点との距離を算出し、当該算出した距離が閾値以上である場合には、当該認識結果の正否の確認をユーザに対して促すための確認メッセージを生成して、それをユーザに提示する、音声認識支援方法が提案されている(例えば、特許文献1参照)。
特開2001−13991号公報
しかしながら、上述の如き従来の方法は、音声認識結果の示す地点と基準点との距離に応じて認識結果の正否を確認するものであるため、地図検索等の限られた機能にしか適用することができなかった。すなわち、地名や施設名等の地点を示す音声とは異なる音声(例えば、オーディオやパワーウィンドウを操作するための音声等)に対する音声認識結果の正否を確認することはできなかった。その結果、音声認識結果が誤っていた場合であってもその正否を確認せず、発声したユーザの意図とは異なる機能を実行してしまい、操作のやり直し等が必要になる可能性があった。また、全ての音声認識結果について正否を毎回確認することも考えられるが、正否に応じた入力をユーザが毎回行わなければならず、操作が煩雑になる場合があった。
本発明は、上記に鑑みてなされたものであって、ユーザの操作負担の増大を抑制しつつ、ユーザにとって影響の大きいコマンドを誤って実行することを防止できる、音声認識制御システム、音声認識制御方法、及び音声認識制御プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、請求項1に記載の音声認識制御システムは、ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段と、前記音声認識コマンドを特定するコマンド情報と、前記音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて格納する影響度情報格納手段と、前記影響度情報格納手段に格納されている前記コマンド情報及び前記影響度情報に基づき、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定手段と、を備える。
また、請求項2に記載の音声認識制御システムは、請求項1に記載の音声認識制御システムにおいて、前記判定手段は、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度が所定値以上の場合、当該音声認識コマンドに対応する機能を直ちに実行しないと判定し、ユーザに当該音声認識コマンドの正否を確認するための制御を行い、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度が所定値未満の場合、当該音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行う。
また、請求項3に記載の音声認識制御システムは、請求項2に記載の音声認識制御システムにおいて、前記影響度情報格納手段は、所定の機能を実行させるために前記音声認識コマンド特定手段により最後に特定されるべき前記音声認識コマンドの前記影響度が前記所定値以上となるように設定された前記影響度情報を格納する。
また、請求項4に記載の音声認識制御システムは、請求項3に記載の音声認識制御システムにおいて、前記影響度情報格納手段は、前記所定の機能を実行するための前記音声認識コマンドの数が多いほど、当該所定の機能を実行させるために前記音声認識コマンド特定手段により最後に特定されるべき音声認識コマンドの前記影響度が大きくなるように設定された前記影響度情報を格納する。
また、請求項5に記載の音声認識制御システムは、請求項1から4のいずれか一項に記載の音声認識制御システムにおいて、前記音声認識コマンド特定手段は、当該音声認識コマンド特定手段による前記音声認識コマンドの特定結果の信頼度を特定し、前記判定手段は、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度と、当該音声認識コマンドについて前記音声認識コマンド特定手段により特定された前記信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する。
また、請求項6に記載の音声認識制御方法は、ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定ステップと、前記音声認識コマンドを特定するコマンド情報と、前記音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて記憶手段に格納する影響度情報格納ステップと、前記影響度情報格納ステップで前記記憶手段に格納されている前記コマンド情報及び前記影響度情報に基づき、前記音声認識コマンド特定ステップで特定された音声認識コマンドの前記影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定ステップと、を含む。
また、請求項7に記載の音声認識制御プログラムは、請求項6に記載の方法をコンピュータに実行させる。
請求項1に記載の音声認識制御システム、請求項6に記載の音声認識制御方法、及び請求項7に記載の音声認識制御プログラムによれば、判定手段は、影響度情報格納手段に格納されているコマンド情報及び影響度情報に基づき、音声認識コマンド特定手段により特定された音声認識コマンドの影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、ユーザにとって相対的に影響の大きいコマンドについては音声認識結果についての正否を確認し、ユーザにとって相対的に影響の小さいコマンドについては当該音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザにとって影響の大きいコマンドを誤って実行することを防止できる。
また、請求項2に記載の音声認識制御システムによれば、判定手段は、音声認識コマンド特定手段により特定された音声認識コマンドの影響度が所定値以上の場合、当該音声認識コマンドに対応する機能を直ちに実行しないと判定し、ユーザに当該音声認識コマンドの正否を確認するための制御を行うので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が所定値以上のコマンドについては音声認識コマンドの正否を確認することができ、ユーザにとって影響の大きいコマンドを誤って実行することを確実に防止できる。また、判定手段は、音声認識コマンド特定手段により特定された音声認識コマンドの影響度が所定値未満の場合、当該音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行うので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が所定値未満のコマンドについては当該音声認識コマンドに対応する機能を直ちに実行することができ、ユーザの操作負担の増大を確実に抑制することができる。
また、請求項3に記載の音声認識制御システムによれば、影響度情報格納手段は、所定の機能を実行させるために音声認識コマンド特定手段により最後に特定されるべき音声認識コマンドの影響度が所定値以上となるように設定された影響度情報を格納するので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が大きいコマンドを誤って実行することを、一層確実に防止できる。
また、請求項4に記載の音声認識制御システムによれば、影響度情報格納手段は、所定の機能を実行するための音声認識コマンドの数が多いほど、当該所定の機能を実行させるために音声認識コマンド特定手段により最後に特定されるべき音声認識コマンドの影響度が大きくなるように設定された影響度情報を格納するので、ユーザが音声認識コマンドの発話をやり直す場合における労力が大きく当該ユーザへの影響が特に大きいコマンドを誤って実行することを、一層確実に防止できる。
また、請求項5に記載の音声認識制御システムによれば、判定手段は、音声認識コマンド特定手段により特定された音声認識コマンドの影響度と、当該音声認識コマンドについて音声認識コマンド特定手段により特定された信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、音声認識コマンド特定手段により特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性が高い場合には音声認識結果についての正否を確認し、当該音声認識コマンドがユーザの意図するコマンドとは異なる可能性が低い場合には当該音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザの意図するコマンドとは異なるコマンドを誤って実行することを防止できる。
実施の形態1に係る音声認識制御システムを例示するブロック図である。 影響度DBに格納されている情報を例示した表である。 判定テーブルに格納されている情報を例示した表である。 音声認識制御処理のフローチャートである。 ユーザに音声認識コマンドの発話を促すメッセージを表示するディスプレイを例示した図である。 ユーザの発話音声の認識においてエラーが発生した旨の通知を表示するディスプレイを例示した図である。 音声認識コマンドの正否を確認する旨を表示するディスプレイを例示した図である。 実施の形態2に係る判定テーブルに格納されている情報を例示した表である。 音声認識コマンドの正否を確認する旨を表示するディスプレイを例示した図である。 音声認識コマンドの正否を確認する旨を表示するディスプレイを例示した図である。 音声認識コマンドの正否を確認する旨を表示するディスプレイを例示した図である。
以下、本発明に係る音声認識制御システム、音声認識制御方法、及び音声認識制御プログラムの各実施の形態について図面を参照しつつ詳細に説明する。ただし、これらの各実施の形態によって本発明が限定されるものではない。なお、以下の説明では、カーナビゲーションシステムの一部として音声認識制御システムが車両に搭載されているものとする。
〔実施の形態1〕
まず、実施の形態1に係る音声認識制御システムについて説明する。この実施の形態1は、音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度と、当該音声認識コマンドの特定結果の信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する形態である。ここで「音声認識コマンド」とは、音声認識制御システムに接続されたナビゲーション装置やエアコン等の各種接続機器に対する操作指示を含み、当該操作指示に伴って必要になる情報を含む、一連の発話内容をいうものとする。
(構成)
最初に、実施の形態1に係る音声認識制御システムの構成について説明する。図1は、本実施の形態1に係る音声認識制御システムを例示するブロック図である。この音声認識制御システム1は、概略的に、ユーザが発話した音声に基づいて音声認識コマンドを特定する。そして、音声認識制御システム1に接続された各種接続機器(図1の例では、ナビゲーション装置6、エアコン7、オーディオ8、携帯電話9、及びECU10(Electronic Control Unit))に、当該特定した音声認識コマンドに対応する機能を実行させる。
この音声認識制御システム1は、図1に示すように、制御部11、及びデータ記録部12を備えている。また、音声認識制御システム1には、マイク2、タッチパネル3、ディスプレイ4、及びスピーカ5が接続されている。
(構成−音声認識制御システム−制御部)
制御部11は、音声認識制御システム1を制御する制御手段であり、具体的には、CPU、当該CPU上で解釈実行される各種のプログラム(OSなどの基本制御プログラムや、OS上で起動され特定機能を実現するアプリケーションプログラムを含む)、及びプログラムや各種のデータを格納するためのRAMの如き内部メモリを備えて構成されるコンピュータである。特に、本実施の形態1に係る音声認識制御プログラムは、任意の記録媒体又はネットワークを介して音声認識制御システム1にインストールされることで、制御部11の各部を実質的に構成する。
この制御部11は、機能概念的に、音声認識コマンド特定部11a、及び判定部11bを備えている。音声認識コマンド特定部11aは、ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段である。判定部11bは、音声認識コマンド特定部11aにより特定された音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定手段である。これらの制御部11の各部によって実行される処理の詳細については後述する。
(構成−音声認識制御システム−データ記録部)
データ記録部12は、音声認識制御システム1の動作に必要なプログラム及び各種のデータを記録する記録手段であり、例えば、外部記憶装置としてのハードディスク(図示省略)の如き磁気的記録媒体を用いて構成されている。ただし、ハードディスクに代えてあるいはハードディスクと共に、フラッシュメモリの如き半導体型記憶媒体、又はDVDやブルーレイディスクの如き光学的記録媒体を含む、その他の任意の記録媒体を用いることができる。
このデータ記録部12は、影響度データベース12a(以下、データベースをDBと略記する)、及び判定テーブル12bを備えている。
影響度DB12aは、音声認識コマンドを特定するコマンド情報と、音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて格納する影響度情報格納手段である。図2は、影響度DB12aに格納されている情報を例示した表である。この図2に示すように、影響度DB12aには、項目「音声認識コマンド」及び「影響度」に対応する情報が、相互に関連付けて格納されている。この内、項目「音声認識コマンド」に対応して格納される情報は、音声認識コマンドを特定するコマンド情報である(図2では、例えば「目的地に設定」等)。項目「影響度」に対応して格納される情報は、音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報である。図2の例では、影響度を示す1から3の整数(影響度が大きいほど値が大きい)が項目「影響度」に対応して格納されている。
ここで、「音声認識コマンドに対応する機能を直ちに実行する」とは、ユーザが発話した音声に基づいて特定された音声認識コマンドが当該ユーザの意図したコマンドであるか否か(以下、必要に応じて「音声認識コマンドの正否」)をユーザに確認することなく、当該音声認識コマンドに対応する機能を実行することを意味する。すなわち、音声認識コマンドの正否をユーザに確認することなく、当該音声認識コマンドに対応する機能を実行した場合におけるユーザへの影響が大きいほど、当該音声コマンドに対応する影響度は大きくなる。
より具体的には、例えば、所定の機能を実行させるためにユーザが複数の音声認識コマンドを段階的に発話する場合において、影響度DB12aに格納されている影響度情報は、所定の機能を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドの影響度が所定値以上(図2では「3」)となるように設定されている。これは、所定の機能を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドの正否をユーザに確認することなく、当該音声認識コマンドに対応する機能を実行した場合、当該音声認識コマンドが当該ユーザの意図したコマンドであるか否かに関わらず所定の機能が自動的に実行されるため、仮に当該音声認識コマンドが当該ユーザの意図しないコマンドであった場合、ユーザは音声認識コマンドの発話を初めからやり直さなければならず、当該ユーザへの影響が大きいと考えられるからである。また、所定の機能を実行させるために音声認識コマンド特定部11aにより特定されるべき音声認識コマンドであって、最後に特定されるべき音声認識コマンド以外の音声認識コマンド(以下、必要に応じて「途中で特定されるべき音声認識コマンド」)の影響度は所定値未満(図2では「2」又は「1」)となるように設定されている。これは、仮に当該音声認識コマンドが当該ユーザの意図しないコマンドであっても所定の機能が自動的に実行されることはないため、当該音声認識コマンドを再度発話し直せばよく、ユーザへの影響が相対的に小さいと考えられるからである。
さらに、影響度DB12aに格納されている影響度情報を、所定の機能を実行するための音声認識コマンドの数が多いほど、当該所定の機能を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドの影響度が大きくなるように設定してもよい。すなわち、所定の機能を実行するために必要となる複数の音声認識コマンドがツリー構造として構成されており、上位階層の音声認識コマンドから下位階層の音声認識コマンドへと順次音声認識コマンドが入力されることで所定の機能が実行される場合において、最上位階層から最下位階層までの階層数が多いほど、最下位階層の音声認識コマンドの影響度が大きくなるように設定してもよい。例えばナビゲーション装置6に対して、特定の施設名称を用いて目的地設定を行う場合、目的地設定を実行するために必要となる音声認識コマンドは、上位階層から順に、目的地の施設名称(例えば「東京タワー」等)を設定するための音声認識コマンド、及び、目的地設定を確定して実行させるための音声認識コマンド(例えば「目的地に設定」)が必要となる。この場合、最上位階層から最下位階層までの階層数は2階層となる。一方、住所を用いて目的地設定を行う場合、目的地設定を実行するために必要となる音声認識コマンドは、上位階層から順に、「都道府県」を設定するための音声認識コマンド、「市区」を設定するための音声認識コマンド、「町村」を設定するための音声認識コマンド、「番地」を設定するための音声認識コマンド、及び、目的地設定を確定して実行させるための音声認識コマンド(「目的地に設定」)が、階層的に構成されている。この場合、最上位階層から最下位階層までの階層数は5階層となる。この場合に、目的地設定を行うための最下位階層の音声認識コマンド「目的地に設定」の影響度は、特定の施設名称を用いて目的地設定を行う場合よりも、住所を用いて目的地設定を行う場合の方が大きくなるように設定してもよい。
また、音声認識コマンドの正否をユーザに確認することなく当該音声認識コマンドに対応する所定の機能を実行した場合におけるユーザへの影響が小さいと考えられる場合には、その音声認識コマンドが当該所定の機能を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドであっても、影響度が所定値未満(図2では3未満)となるように設定してもよい。
図1に戻り、判定テーブル12bは、判定部11bが音声認識コマンドに対応する機能を直ちに実行するか否かを判定する際に参照するための情報を格納する判定情報格納手段である。図3は、判定テーブル12bに格納されている情報を例示した表である。この図3に示すように、判定テーブル12bには、音声認識コマンド特定部11aによる音声認識コマンドの特定結果の信頼度を特定する信頼度情報(図3では1から3の整数。値が大きいほど信頼度が高い)と、音声認識コマンドの影響度を特定する影響度情報との双方に対応付けて、判定部11bによる判定内容を特定する判定情報が格納されている(例えば、信頼度「3」及び影響度「3」に対応して「ユーザに確認」等)。なお、この判定テーブル12bに格納されている情報を用いた処理の詳細については後述する。
(構成−マイク)
図1に戻り、マイク2は、音声を電気信号に変換して音声認識制御システム1に出力する。このマイク2としては、公知のマイクを用いることができる。
(構成−タッチパネル)
タッチパネル3は、ユーザの指等で押圧されることにより、当該ユーザから各種手動入力を受け付けるものである。このタッチパネル3は、透明又は半透明状に形成され、ディスプレイ4の前面において当該ディスプレイ4の表示面と重畳するように設けられている。このタッチパネル3としては、例えば抵抗膜方式や静電容量方式等による操作位置検出手段を備えた公知のタッチパネルを使用することができる。
(構成−ディスプレイ)
ディスプレイ4は、音声認識制御システム1の制御に基づいて情報を表示にて出力する表示出力手段である。なお、このディスプレイ4の具体的な構成は任意であり、公知の液晶ディスプレイや有機ELディスプレイの如きフラットパネルディスプレイを使用することができる。
(構成−スピーカ)
スピーカ5は、音声認識制御システム1の制御に基づいて情報を音声にて出力する音声出力手段である。スピーカ5から出力される音声の具体的な態様は任意であり、必要に応じて生成された合成音声や、予め録音された音声を出力することができる。
(処理−表示制御処理)
次に、このように構成された音声認識制御システム1によって実行される音声認識制御処理について説明する。図4は音声認識制御処理のフローチャートである(以下の各処理の説明ではステップを「S」と略記する)。この音声認識制御処理は、例えば、音声認識制御システム1に電源が投入された後に起動される。
図4に示すように、音声認識制御処理が開始されると、音声認識コマンド特定部11aは、マイク2を介してユーザの発話音声が入力されるまで待機する(SA1、No)。例えば音声認識コマンド特定部11aは、ユーザに音声認識コマンドの発話を促すメッセージをディスプレイ4に表示させ、マイク2を介してユーザの発話音声が入力されるまで待機する。図5は、ユーザに音声認識コマンドの発話を促すメッセージを表示するディスプレイ4を例示した図である。
図4に戻り、マイク2を介してユーザの発話音声が入力された場合(SA1、Yes)、音声認識コマンド特定部11aは、ユーザの発話音声を認識する(SA2)。なお、音声認識コマンド特定部11aは公知の音声認識技術を用いてユーザの発話音声を認識する。
続いて音声認識コマンド特定部11aは、SA2で認識したユーザの発話音声に基づいて音声認識コマンドを特定する(SA3)。例えば音声認識コマンド特定部11aは、図2に例示した影響度DB12aの項目「音声認識コマンド」に対応して格納されているコマンド情報に基づき特定される音声認識コマンドと、SA2で認識したユーザの発話音声とを比較し、一致度が最も高い音声認識コマンドを、ユーザにより入力された音声認識コマンドとして特定する。
次に、音声認識コマンド特定部11aは、当該音声認識コマンド特定部11aによる音声認識コマンドの特定結果の信頼度を特定する(SA4)。例えば音声認識コマンド特定部11aは、SA2で認識したユーザの発話音声と、SA3で特定した音声認識コマンドとの一致度に基づき、信頼度を特定する。以下の説明では、SA2で認識したユーザの発話音声と、SA3で特定した音声認識コマンドとの一致度が高いほど、特定される信頼度が高くなるものとする。
続いて判定部11bは、影響度DB12aに格納されているコマンド情報及び影響度情報に基づき、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度を特定する(SA5)。
図2に例示した影響度DB12aによれば、判定部11bは、例えばSA3で音声認識コマンド特定部11aにより特定された音声認識コマンドが「目的地に設定」である場合、その音声認識コマンドの影響度が「3」であると特定する。この音声認識コマンド「目的地に設定」は、所定の機能(すなわち選択された地点を目的地に設定する機能)を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドであり、特に、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合、都道府県名や市区町村名を最初から発話し直さなければならず、ユーザにとって負担が大きいため、最も大きい影響度「3」が設定されている。
また、例えばSA3で音声認識コマンド特定部11aにより特定された音声認識コマンドが「曲を削除する」である場合、その音声認識コマンドの影響度が「3」であると特定する。この音声認識コマンド「曲を削除する」は、所定の機能(すなわち選択された曲を削除する機能)を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドであり、特に、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合、削除された曲を元に戻すことはできず、改めてその曲を登録し直さなければならないことから、ユーザにとって負担が大きいため、最も大きい影響度「3」が設定されている。
また、例えばSA3で音声認識コマンド特定部11aにより特定された音声認識コマンドが「○○を購入」である場合、その音声認識コマンドの影響度が「3」であると特定する。この音声認識コマンド「○○を購入」は、所定の機能(すなわち選択された商品を購入する機能)を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドであり、特に、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合、その商品購入に伴う課金処理を取り消すことはできず、ユーザは無駄な出費を強いられてしまうことから、最も大きい影響度「3」が設定されている。
また、例えばSA3で音声認識コマンド特定部11aにより特定された音声認識コマンドが「窓を開ける」である場合、その音声認識コマンドの影響度が「3」であると特定する。この音声認識コマンド「窓を開ける」は、所定の機能(すなわち車両の窓を開ける機能)を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドであり、特に、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合、車内に風雨が吹き込んでくる可能性があり、ユーザに物理的な影響が及ぶことから、最も大きい影響度「3」が設定されている。
また、例えばSA3で音声認識コマンド特定部11aにより特定された音声認識コマンドが「電話をかける」である場合には、判定部11bは当該音声認識コマンドの影響度が「3」であると特定する。この音声認識コマンド「電話をかける」は、所定の機能(すなわち電話をかける機能)を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドであり、特に、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合、その通話に伴う課金処理を取り消すことはできず、ユーザは無駄な出費を強いられてしまい、意図する宛先に電話をかけ直す必要もあることから、最も大きい影響度「3」が設定されている。
また、例えばSA3で音声認識コマンド特定部11aにより特定された音声認識コマンドが「周辺施設探索」である場合には、判定部11bは当該音声認識コマンドの影響度が「2」であると特定する。この音声認識コマンド「周辺施設探索」は、所定の機能(すなわち所定の地点の周辺施設を探索する機能)を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドではあるものの、万一当該音声認識コマンドが当該ユーザの意図しないコマンドであった場合には、ユーザは探索結果を無視すればよく、ユーザへの影響が若干小さいと考えられるため、影響度「3」よりも一段階小さい影響度「2」が設定されている。
また、例えばSA3で音声認識コマンド特定部11aにより特定された音声認識コマンドが「次の曲を再生」である場合には、判定部11bは当該音声認識コマンドの影響度が「1」であると特定する。この音声認識コマンド「次の曲を再生」は、所定の機能(すなわち次の曲を再生する機能)を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドではあるものの、万一当該音声認識コマンドが当該ユーザの意図しないコマンドであった場合であっても、再生された次の曲を聴き続けることも可能であり、ユーザへの影響は小さいと考えられるため、最も小さい影響度「1」が設定されている。
このように、所定の機能を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドの中でも、万一当該音声認識コマンドがユーザの意図しないコマンドであった場合において、再度の発話負担が大きいもの、データが削除されてしまうもの、取り消し不可能な課金処理が行われるもの、ユーザに物理的な影響が及ぶもの等は、ユーザへの影響が大きいと考えられることから、最も大きい影響度「3」が設定されている。これに対して、万一音声認識コマンドがユーザの意図しないコマンドであった場合でも、再度の発話負担が小さかったり、誤って特定された音声認識コマンドに基づき実行された機能をユーザが無視可能である場合には、ユーザへの影響が小さいと考えられることから、相対的に小さい影響度「2」や「1」が設定されている。
また、例えばSA3で音声認識コマンド特定部11aにより特定された音声認識コマンドが地名である場合には、判定部11bは当該音声認識コマンドの影響度が「2」であると特定する。音声認識コマンドとして地名が入力された場合、当該音声認識コマンドは、所定の機能(例えば目的地設定等)を実行させるために音声認識コマンド特定部11aにより途中で特定されるべき音声認識コマンドであり、仮に特定された地名がユーザの意図しない地名であっても所定の機能が自動的に実行されることはないため、ユーザは意図する地名を再度発話し直せばよく、ユーザへの影響が相対的に小さいと考えられるため、影響度「3」よりも一段階小さい影響度「2」が設定されている。
図4に戻り、SA5の処理の後、判定部11bは判定テーブル12bを参照し、SA5で当該判定部11bが特定した音声認識コマンドの影響度と、当該音声認識コマンドについてSA4で音声認識コマンド特定部11aにより特定された信頼度とに対応する判定内容を特定する(SA6)。
図3の判定テーブル12bによれば、音声認識コマンドの影響度に関わらず、SA4で音声認識コマンド特定部11aにより特定された信頼度が「1」である場合、音声認識コマンド特定部11aによる音声認識コマンドの特定結果の信頼度が低く、当該特定された音声認識コマンドに対応する機能を実行することは適切ではないと考えられることから、対応する判定内容は、ユーザの発話音声の認識においてエラーが発生した旨を示す「認識エラー」となっている。
また、SA4で音声認識コマンド特定部11aにより特定された信頼度が「2」であり、且つSA5で判定部11bが特定した音声認識コマンドの影響度が「2」以上である場合、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性があることから、対応する判定内容は、音声認識コマンドの正否をユーザに確認すべき旨を示す「ユーザに確認」となっている。また、SA4で音声認識コマンド特定部11aにより特定された信頼度が「3」であり、且つSA5で判定部11bが特定した音声認識コマンドの影響度が「3」である場合、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性は低いものの、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響が大きいことから、対応する判定内容は、音声認識コマンドの正否をユーザに確認すべき旨を示す「ユーザに確認」となっている。
SA4で音声認識コマンド特定部11aにより特定された信頼度が「2」であり、且つSA5で判定部11bが特定した音声認識コマンドの影響度が「1」である場合、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性があるものの、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響が最小であることから、対応する判定内容は、当該音声認識コマンドに対応する機能を直ちに実行すべき旨を示す「機能実行」となっている。また、SA4で音声認識コマンド特定部11aにより特定された信頼度が「3」であり、且つSA5で判定部11bが特定した音声認識コマンドの影響度が「2」以下である場合、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性が低く、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響も小さいことから、対応する判定内容は、当該音声認識コマンドに対応する機能を直ちに実行すべき旨を示す「機能実行」となっている。
図4に戻り、判定部11bは、SA6で特定した判定内容が「認識エラー」か否かを判定する(SA7)。その結果、SA6で特定した判定内容が「認識エラー」である場合(SA7、Yes)、判定部11bは、ユーザの発話音声の認識においてエラーが発生した旨の通知をディスプレイ4やスピーカ5を介して出力させる(SA8)。図6は、ユーザの発話音声の認識においてエラーが発生した旨の通知を表示するディスプレイ4を例示した図である。図4に戻り、SA8の処理の後、SA1に戻り、音声認識コマンド特定部11aは、マイク2を介してユーザの発話音声が入力されるまで待機する(SA1、No)。
一方、SA6で特定した判定内容が「認識エラー」ではない場合(SA7、No)、すなわち図3の判定テーブル12bによれば、SA4で音声認識コマンド特定部11aにより特定された信頼度が「2」以上である場合、判定部11bは、SA6で特定した判定内容が「機能実行」か否かを判定する(SA9)。
その結果、SA6で特定した判定内容が「機能実行」ではない場合(「ユーザに確認」である場合)(SA9、No)、判定部11bは、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドの正否を確認する旨をディスプレイ4やスピーカ5を介して出力させる(SA10)。図7は、音声認識コマンドの正否を確認する旨を表示するディスプレイ4を例示した図である。
図4に戻り、SA10の処理の後、判定部11bは、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザにより承認されたか否かを判定する(SA11)。例えば判定部11bは、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドを承認する旨の操作(図7の例では「はい」ボタンを押す操作)がタッチパネル3を介して入力された場合、当該音声認識コマンドがユーザにより承認されたと判定する。また、当該音声認識コマンドを承認しない旨の操作(図7の例では「いいえ」ボタンを押す操作)がタッチパネル3を介して入力された場合、当該音声認識コマンドがユーザにより承認されなかったと判定する。なお、マイク2を介して入力されたユーザの発話音声(例えば「はい」又は「いいえ」との発話)に基づいて、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドを承認する旨の操作入力及び承認しない旨の操作入力を受け付けることとしてもよい。
その結果、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザにより承認されなかった場合(SA11、No)、SA1に戻り、音声認識コマンド特定部11aは、マイク2を介してユーザの発話音声が入力されるまで待機する(SA1、No)。
一方、SA9において、SA6で特定した判定内容が「機能実行」である場合(SA9、Yes)、判定部11bは、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行う(SA12)。
また、SA11において、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザにより承認された場合(SA11、Yes)、当該音声認識コマンドはユーザの意図するコマンドと考えられることから、判定部11bは当該音声認識コマンドに対応する機能を実行するための制御を行う(SA12)。
SA12の処理の後、制御部11は音声認識制御処理を終了する。
(効果)
このように本実施の形態1によれば、判定部11bは、影響度DB12aに格納されているコマンド情報及び影響度情報に基づき、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、ユーザにとって相対的に影響の大きいコマンドについては音声認識結果についての正否を確認し、ユーザにとって相対的に影響の小さいコマンドについては当該音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザにとって影響の大きいコマンドを誤って実行することを防止できる。
また、判定部11bは、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度が所定値以上の場合、当該音声認識コマンドに対応する機能を直ちに実行しないと判定し、ユーザに当該音声認識コマンドの正否を確認するための制御を行うので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が所定値以上のコマンドについては音声認識コマンドの正否を確認することができ、ユーザにとって影響の大きいコマンドを誤って実行することを確実に防止できる。また、判定部11bは、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度が所定値未満の場合、当該音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行うので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が所定値未満のコマンドについては当該音声認識コマンドに対応する機能を直ちに実行することができ、ユーザの操作負担の増大を確実に抑制することができる。
また、影響度DB12aは、所定の機能を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドの影響度が所定値以上となるように設定された影響度情報を格納するので、音声認識コマンドの正否を確認せずに機能を実行した場合のユーザへの影響が大きいコマンドを誤って実行することを、一層確実に防止できる。
また、影響度DB12aは、所定の機能を実行するための音声認識コマンドの数が多いほど、当該所定の機能を実行させるために音声認識コマンド特定部11aにより最後に特定されるべき音声認識コマンドの影響度が大きくなるように設定された影響度情報を格納するので、ユーザが音声認識コマンドの発話をやり直す場合における労力が大きく当該ユーザへの影響が特に大きいコマンドを誤って実行することを、一層確実に防止できる。
また、判定部11bは、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度と、当該音声認識コマンドについて音声認識コマンド特定部11aにより特定された信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性が高い場合には音声認識結果についての正否を確認し、当該音声認識コマンドがユーザの意図するコマンドとは異なる可能性が低い場合には当該音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザの意図するコマンドとは異なるコマンドを誤って実行することを防止できる。
〔実施の形態2〕
次に、実施の形態2について説明する。この実施の形態2は、ユーザの発話音声に含まれる単語毎に信頼度を特定する形態である。なお、実施の形態2の構成は、特記する場合を除いて、実施の形態1の構成と略同一であり、実施の形態1の構成と略同一の構成についてはこの実施の形態1で用いたものと同一の符号及び/又は名称を必要に応じて付して、その説明を省略する。
(構成−音声認識制御システム−データ記録部)
まず、実施の形態2に係るデータ記録部12について説明する。図8は、実施の形態2に係る判定テーブル12bに格納されている情報を例示した表である。この図8に示すように、判定テーブル12bには、音声認識コマンド特定部11aにより特定された音声認識コマンドに含まれる各単語の信頼度の組み合わせを特定する信頼度情報(図8では、「全て3」、「「全て3」又は「全て1」以外」、及び「全て1」)と、音声認識コマンドの影響度を特定する影響度情報(図8では1から3の整数)との双方に対応付けて、判定部11bによる判定内容を特定する判定情報が格納されている(例えば、信頼度「全て3」及び影響度「3」に対応して「ユーザに確認」等)。なお、この判定テーブル12bに格納されている情報を用いた処理の詳細については後述する。
(処理−表示制御処理)
次に、実施の形態2に係る音声認識制御処理について説明する。なお、本実施の形態2に係る音声認識制御処理における各処理は、図4のSA4、6、9、及び10の各処理の内容を除き、実施の形態1で説明した音声認識制御処理と同じであるので、図示及び説明を省略する。
図4のSA4において、音声認識コマンド特定部11aは、SA2で当該音声認識コマンド特定部11aが認識したユーザの発話音声に含まれる各単語の信頼度を特定する(SA4)。例えば、予めデータ記録部12に音声データ辞書を記録させておき、音声認識コマンド特定部11aは、SA2で認識したユーザの発話音声に含まれる各単語と、音声データ辞書に登録されている単語との一致度に基づき、ユーザの発話音声に含まれる各単語の信頼度を特定する。以下の説明では、SA2で認識したユーザの発話音声に含まれる各単語と、音声データ辞書に登録されている単語との一致度が高いほど、各単語について特定される信頼度が高くなるものとする。
SA6において、判定部11bは判定テーブル12bを参照し、SA5で当該判定部11bが特定した音声認識コマンドの影響度と、SA4で音声認識コマンド特定部11aが特定したユーザの発話音声に含まれる各単語の信頼度の組み合わせとに対応する判定内容を特定する(SA6)。
図8の判定テーブル12bによれば、SA4で音声認識コマンド特定部11aが特定したユーザの発話音声に含まれる各単語の信頼度が全て「1」である場合、音声認識コマンド特定部11aによる音声認識コマンドの特定結果の信頼度が低く、当該特定された音声認識コマンドに対応する機能を実行することは適切ではないと考えられることから、対応する判定内容は、ユーザの発話音声の認識においてエラーが発生した旨を示す「認識エラー」となっている。
また、SA4で音声認識コマンド特定部11aが特定したユーザの発話音声に含まれる各単語の信頼度が全て「1」又は全て「3」以外であり、且つSA5で判定部11bが特定した音声認識コマンドの影響度が「2」以上である場合、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性があることから、対応する判定内容は、音声認識コマンドの正否をユーザに確認すべき旨を示す「ユーザに確認」となっている。また、SA4で音声認識コマンド特定部11aが特定したユーザの発話音声に含まれる各単語の信頼度が全て「3」であり、且つSA5で判定部11bが特定した音声認識コマンドの影響度が「3」である場合、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性は低いものの、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響が大きいことから、対応する判定内容は、音声認識コマンドの正否をユーザに確認すべき旨を示す「ユーザに確認」となっている。
また、SA4で音声認識コマンド特定部11aが特定したユーザの発話音声に含まれる各単語の信頼度が全て「1」又は全て「3」以外であり、且つSA5で判定部11bが特定した音声認識コマンドの影響度が「1」である場合、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性があるものの、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響が最小であることから、対応する判定内容は、当該音声認識コマンドに対応する機能を直ちに実行すべき旨を示す「機能実行」となっている。また、SA4で音声認識コマンド特定部11aが特定したユーザの発話音声に含まれる各単語の信頼度が全て「3」であり、且つSA5で判定部11bが特定した音声認識コマンドの影響度が「2」以下である場合、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドがユーザの意図するコマンドとは異なる可能性が低く、音声認識コマンドの正否を確認せずに対応する機能を実行した場合のユーザへの影響も小さいことから、対応する判定内容は、当該音声認識コマンドに対応する機能を直ちに実行すべき旨を示す「機能実行」となっている。
図4に戻り、SA9において、判定部11bは、SA6で特定した判定内容が「機能実行」か否かを判定する(SA9)。
その結果、SA6で特定した判定内容が「機能実行」ではない場合(「ユーザに確認」である場合)(SA9、No)、判定部11bは、SA3で音声認識コマンド特定部11aにより特定された音声認識コマンドの正否を確認する旨をディスプレイ4やスピーカ5を介して出力させる(SA10)。
例えば、SA2で音声認識コマンド特定部11aが認識したユーザの発話音声に含まれる単語が「電話をかける」及び「○○さん」であり、「電話をかける」の信頼度が「2」又は「3」、「○○さん」の信頼度が「1」の場合、ユーザの意図する宛て先とは異なる宛て先に電話をかけてしまう可能性がある。そこで判定部11bは、図9に示すように、信頼度が最小であった単語「○○さん」の正否を確認する旨をディスプレイ4やスピーカ5を介して出力させる。さらに、図9に示すように、「○○さん」と代替可能な他の宛て先(図9では「○△さん」や「×○さん」)をディスプレイ4やスピーカ5を介して出力させるようにしてもよい。
また、「電話をかける」の信頼度が「1」、「○○さん」の信頼度が「2」又は「3」の場合、「○○さん」に対してユーザが「電話をかける」ことを意図していない可能性がある。そこで判定部11bは、図10に示すように、信頼度が最小であった単語「電話をかける」の正否を確認する旨をディスプレイ4やスピーカ5を介して出力させる。さらに、図10に示すように、「電話をかける」と代替可能な他の音声認識コマンド(図10では「家に行く」や「曲を再生する」)をディスプレイ4やスピーカ5を介して出力させるようにしてもよい。
また、「電話をかける」及び「○○さん」の信頼度が「2」又は「3」であって、両方の信頼度が「3」ではない場合、これらの2つの単語を組み合わせた音声認識コマンド「○○さんに電話をかける」がユーザの意図するコマンドとは異なる可能性がある。そこで判定部11bは、図11に示すように、音声認識コマンド「○○さんに電話をかける」の正否を確認する旨をディスプレイ4やスピーカ5を介して出力させる。
(効果)
このように本実施の形態2によれば、音声認識コマンド特定部11aは、当該音声認識コマンド特定部11aが認識したユーザの発話音声に含まれる各単語の信頼度を特定し、判定部11bは、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度と、音声認識コマンド特定部11aが特定したユーザの発話音声に含まれる各単語の信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するので、ユーザの発話音声に含まれる単語がユーザの意図する単語とは異なる可能性が高い場合には当該単語について音声認識結果の正否を確認し、ユーザの発話音声に含まれる単語がユーザの意図する単語とは異なる可能性が低い場合には音声認識コマンドに対応する機能を直ちに実行することができる。すなわち、ユーザの操作負担の増大を抑制しつつ、ユーザの意図するコマンドとは異なるコマンドを誤って実行することを一層確実に防止できる。
〔各実施の形態に対する変形例〕
以上、本発明に係る各実施の形態について説明したが、本発明の具体的な構成及び手段は、特許請求の範囲に記載した各発明の技術的思想の範囲内において、任意に改変及び改良することができる。以下、このような変形例について説明する。
(解決しようとする課題や発明の効果について)
まず、発明が解決しようとする課題や発明の効果は、上述の内容に限定されるものではなく、発明の実施環境や構成の細部に応じて異なる可能性があり、上述した課題の一部のみを解決したり、上述した効果の一部のみを奏することがある。
(音声認識制御システムの構成について)
また、上述した各電気的構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成できる。例えば、音声認識制御システム1を一体の装置として車両に搭載してもよく、あるいは制御部11やデータ記録部12をネットワーク上に分散配置してもよい。
(音声認識制御処理について)
上述の各実施の形態では、判定部11bが、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度と、当該音声認識コマンドについて音声認識コマンド特定部11aにより特定された信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する場合を例として説明したが、音声認識コマンド特定部11aにより特定された音声認識コマンドの影響度のみに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するようにしてもよい。この場合、図4に示した音声認識制御処理において、SA4の処理を省略することができいる。
あるいは、音声認識コマンドについて音声認識コマンド特定部11aにより特定された信頼度のみに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定するようにしてもよい。この場合、図4に示した音声認識制御処理において、SA5の処理を省略することができいる。
1 音声認識制御システム
2 マイク
3 タッチパネル
4 ディスプレイ
5 スピーカ
6 ナビゲーション装置
7 エアコン
8 オーディオ
9 携帯電話
10 ECU
11 制御部
11a 音声認識コマンド特定部
11b 判定部
12 データ記録部
12a 影響度DB
12b 判定テーブル

Claims (7)

  1. ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定手段と、
    前記音声認識コマンドを特定するコマンド情報と、前記音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて格納する影響度情報格納手段と、
    前記影響度情報格納手段に格納されている前記コマンド情報及び前記影響度情報に基づき、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定手段と、
    を備える音声認識制御システム。
  2. 前記判定手段は、
    前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度が所定値以上の場合、当該音声認識コマンドに対応する機能を直ちに実行しないと判定し、ユーザに当該音声認識コマンドの正否を確認するための制御を行い、
    前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度が所定値未満の場合、当該音声認識コマンドに対応する機能を直ちに実行すると判定し、当該音声認識コマンドに対応する機能を実行するための制御を行う、
    請求項1に記載の音声認識制御システム。
  3. 前記影響度情報格納手段は、
    所定の機能を実行させるために前記音声認識コマンド特定手段により最後に特定されるべき前記音声認識コマンドの前記影響度が前記所定値以上となるように設定された前記影響度情報を格納する、
    請求項2に記載の音声認識制御システム。
  4. 前記影響度情報格納手段は、
    前記所定の機能を実行するための前記音声認識コマンドの数が多いほど、当該所定の機能を実行させるために前記音声認識コマンド特定手段により最後に特定されるべき音声認識コマンドの前記影響度が大きくなるように設定された前記影響度情報を格納する、
    請求項3に記載の音声認識制御システム。
  5. 前記音声認識コマンド特定手段は、当該音声認識コマンド特定手段による前記音声認識コマンドの特定結果の信頼度を特定し、
    前記判定手段は、前記音声認識コマンド特定手段により特定された音声認識コマンドの前記影響度と、当該音声認識コマンドについて前記音声認識コマンド特定手段により特定された前記信頼度とに基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する、
    請求項1から4のいずれか一項に記載の音声認識制御システム。
  6. ユーザの発話音声を認識し、当該認識した音声に基づいて音声認識コマンドを特定する音声認識コマンド特定ステップと、
    前記音声認識コマンドを特定するコマンド情報と、前記音声認識コマンドに対応する機能を直ちに実行した場合のユーザへの影響度を特定する影響度情報とを、相互に関連付けて記憶手段に格納する影響度情報格納ステップと、
    前記影響度情報格納ステップで前記記憶手段に格納されている前記コマンド情報及び前記影響度情報に基づき、前記音声認識コマンド特定ステップで特定された音声認識コマンドの前記影響度を特定し、当該特定した影響度に基づき、当該音声認識コマンドに対応する機能を直ちに実行するか否かを判定する判定ステップと、
    を含む音声認識制御方法。
  7. 請求項6に記載の方法をコンピュータに実行させる音声認識制御プログラム。
JP2011141031A 2011-06-24 2011-06-24 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム Active JP5408810B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011141031A JP5408810B2 (ja) 2011-06-24 2011-06-24 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011141031A JP5408810B2 (ja) 2011-06-24 2011-06-24 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム

Publications (2)

Publication Number Publication Date
JP2013007917A true JP2013007917A (ja) 2013-01-10
JP5408810B2 JP5408810B2 (ja) 2014-02-05

Family

ID=47675314

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011141031A Active JP5408810B2 (ja) 2011-06-24 2011-06-24 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム

Country Status (1)

Country Link
JP (1) JP5408810B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2016051519A1 (ja) * 2014-09-30 2017-04-27 三菱電機株式会社 音声認識システム
WO2017195412A1 (ja) * 2016-05-13 2017-11-16 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2018031985A (ja) * 2016-08-26 2018-03-01 恒次 國分 音声認識補完システム
US10328950B2 (en) 2014-09-15 2019-06-25 Denso Corporation Vehicle equipment control device and method of searching for control content
JP2019168636A (ja) * 2018-03-26 2019-10-03 株式会社エヌ・ティ・ティ・データ 情報処理装置及びプログラム
JP2019533194A (ja) * 2016-09-29 2019-11-14 合肥華凌股▲フン▼有限公司Hefei Hualing Co.,Ltd. ブラインド信号分離方法、構成及び音声制御システム、並びに電器アセンブリ
JP2020156650A (ja) * 2019-03-26 2020-10-01 株式会社セガ ゲームシステム
JP2020170051A (ja) * 2019-04-01 2020-10-15 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP2021135648A (ja) * 2020-02-26 2021-09-13 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
WO2022003822A1 (ja) * 2020-06-30 2022-01-06 日産自動車株式会社 情報処理装置及び情報処理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03248199A (ja) * 1990-02-26 1991-11-06 Ricoh Co Ltd 音声認識方式
JP2009251019A (ja) * 2008-04-01 2009-10-29 Toyota Motor Corp 音声認識装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03248199A (ja) * 1990-02-26 1991-11-06 Ricoh Co Ltd 音声認識方式
JP2009251019A (ja) * 2008-04-01 2009-10-29 Toyota Motor Corp 音声認識装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10328950B2 (en) 2014-09-15 2019-06-25 Denso Corporation Vehicle equipment control device and method of searching for control content
JPWO2016051519A1 (ja) * 2014-09-30 2017-04-27 三菱電機株式会社 音声認識システム
US10475448B2 (en) 2014-09-30 2019-11-12 Mitsubishi Electric Corporation Speech recognition system
JPWO2017195412A1 (ja) * 2016-05-13 2019-03-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
WO2017195412A1 (ja) * 2016-05-13 2017-11-16 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
JP2018031985A (ja) * 2016-08-26 2018-03-01 恒次 國分 音声認識補完システム
JP2019533194A (ja) * 2016-09-29 2019-11-14 合肥華凌股▲フン▼有限公司Hefei Hualing Co.,Ltd. ブラインド信号分離方法、構成及び音声制御システム、並びに電器アセンブリ
JP2019168636A (ja) * 2018-03-26 2019-10-03 株式会社エヌ・ティ・ティ・データ 情報処理装置及びプログラム
JP2020156650A (ja) * 2019-03-26 2020-10-01 株式会社セガ ゲームシステム
JP2020170051A (ja) * 2019-04-01 2020-10-15 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP7363075B2 (ja) 2019-04-01 2023-10-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
JP2021135648A (ja) * 2020-02-26 2021-09-13 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
WO2022003822A1 (ja) * 2020-06-30 2022-01-06 日産自動車株式会社 情報処理装置及び情報処理方法
JP7396490B2 (ja) 2020-06-30 2023-12-12 日産自動車株式会社 情報処理装置及び情報処理方法

Also Published As

Publication number Publication date
JP5408810B2 (ja) 2014-02-05

Similar Documents

Publication Publication Date Title
JP5408810B2 (ja) 音声認識制御システム、音声認識制御方法、及び音声認識制御プログラム
US20220301566A1 (en) Contextual voice commands
US9779723B2 (en) Multi-pass vehicle voice recognition systems and methods
JP4804052B2 (ja) 音声認識装置、音声認識装置を備えたナビゲーション装置及び音声認識装置の音声認識方法
US9805722B2 (en) Interactive speech recognition system
US8340958B2 (en) Text and speech recognition system using navigation information
US9188456B2 (en) System and method of fixing mistakes by going back in an electronic device
JP5821639B2 (ja) 音声認識装置
JP5637131B2 (ja) 音声認識装置
JP2013512476A (ja) 複数の辞書を用いたスピーチ認識
JP2018200452A (ja) 音声認識装置および音声認識方法
US9355639B2 (en) Candidate selection apparatus and candidate selection method utilizing voice recognition
JP2011170087A (ja) 音声認識装置
JP2011203434A (ja) 音声認識装置及び音声認識方法
AU2020264367B2 (en) Contextual voice commands
JP2011180416A (ja) 音声合成装置、音声合成方法およびカーナビゲーションシステム
JP2000089782A (ja) 音声認識装置と方法、ナビゲーションシステム、及び記録媒体
JP2009251019A (ja) 音声認識装置
AU2014221287A1 (en) Contextual voice commands
JPWO2019058453A1 (ja) 音声対話制御装置および音声対話制御方法
JP2011080824A (ja) ナビゲーション装置
JP2008233009A (ja) カーナビゲーション装置及びカーナビゲーション装置用プログラム
JP2012058311A (ja) 動的音声認識辞書の生成方法及びその生成装置
JP5895878B2 (ja) 入力支援システム、方法およびプログラム
JP2020012860A (ja) 音声認識装置および音声認識方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130426

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130705

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130724

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131008

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131101

R150 Certificate of patent or registration of utility model

Ref document number: 5408810

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250