JP2011102984A - ナビゲーション装置、音声認識方法、およびプログラム - Google Patents
ナビゲーション装置、音声認識方法、およびプログラム Download PDFInfo
- Publication number
- JP2011102984A JP2011102984A JP2010266397A JP2010266397A JP2011102984A JP 2011102984 A JP2011102984 A JP 2011102984A JP 2010266397 A JP2010266397 A JP 2010266397A JP 2010266397 A JP2010266397 A JP 2010266397A JP 2011102984 A JP2011102984 A JP 2011102984A
- Authority
- JP
- Japan
- Prior art keywords
- delay
- microphone
- microphones
- monitor
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Navigation (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【課題】音声入力用マイクロフォンの指向性軸を音源に対して向ける。
【解決手段】ナビゲーション装置は、音声入力用の複数のマイクロフォンと、上記複数のマイクロフォンからの出力信号のそれぞれにディレイを加え、上記ディレイが加えられたそれぞれの信号を加算した音声信号を生成する音声信号生成部と、を有し上記出力信号に加えられるディレイ量を変更することにより指向性軸が変更されるマイクロフォンシステムと、上記複数のマイクロフォンからの出力信号にそれぞれサンプルディレイを加えた信号を加算したサンプル音声信号の出力レベルに基づいて、上記出力信号のそれぞれに対して加えるディレイ量の複数の組合せの中から、選択するディレイ量選択部、選択されたディレイ量の組合せを用いて生成された上記音声信号を認識する認識部と、上記認識部の認識結果に基づいて当該装置の動作を制御する制御部と、を有する。
【選択図】図14
【解決手段】ナビゲーション装置は、音声入力用の複数のマイクロフォンと、上記複数のマイクロフォンからの出力信号のそれぞれにディレイを加え、上記ディレイが加えられたそれぞれの信号を加算した音声信号を生成する音声信号生成部と、を有し上記出力信号に加えられるディレイ量を変更することにより指向性軸が変更されるマイクロフォンシステムと、上記複数のマイクロフォンからの出力信号にそれぞれサンプルディレイを加えた信号を加算したサンプル音声信号の出力レベルに基づいて、上記出力信号のそれぞれに対して加えるディレイ量の複数の組合せの中から、選択するディレイ量選択部、選択されたディレイ量の組合せを用いて生成された上記音声信号を認識する認識部と、上記認識部の認識結果に基づいて当該装置の動作を制御する制御部と、を有する。
【選択図】図14
Description
本発明は車載機器に関し、特に音声認識機能を備えたカーナビゲーションシステムに関するものである。
GPS(GlobalPositioningSystem:全地球測位システム)を利用したカーナビゲーションシステムが普及している。このカーナビゲーションシステムは、地図情報その他の情報を表示する表示部(一般には、モニタと呼ばれる)と、演算処理装置その他を収容する本体と、カーナビゲーションシステムへの制御情報を入力するためのリモコン等を備えている。最近、リモコンのほかに制御情報を入力する手段として、音声認識機能を有する音声入力装置を備えたカーナビゲーションシステムも実用化されている。この音声入力装置を備えたカーナビゲーションシステムには音声入力用のマイクロフォンが設けられることになる。従来、このマイクロフォンは、例えば、車室内のダッシュボード、ステアリングコラム、サンバイザ、Aピラー部などに取り付けられていた。そして、マイクロフォンは、カーナビゲーションシステムの本体から引き出されたマイクロフォンケーブルに接続されていた。カーナビゲーションシステムの本体は、車室内ではなくトランクルーム内に設置されることが多い。したがって、音声入力装置を備えたカーナビゲーションシステムでは、トランクルームからマイクロフォンケーブルを引き出し、上述のように、車室内のダッシュボード上等にマイクロフォンを取り付けていた。したがって、必要となるマイクロフォンケーブルの長さも7mにも及んでいた。また、マイクロフォンケーブルの配線作業が煩雑であるという問題があった。
カーナビゲーションシステムの音声入力装置には、音声入力用マイクロフォンの他に、ノイズ信号を入力するためのノイズマイクロフォンを設けることが提案、実用化されている。音声入力用マイクロフォンに入力される信号は音声信号とノイズ信号が混在した信号であり、一方、ノイズマイクロフォンに入力される信号は専らノイズ信号である。したがって、音声入力用マイクロフォンに入力される信号からノイズマイクロフォンに入力される信号を減ずることにより、音声信号のみを抽出することができる。ところが、音声入力用マイクロフォンとノイズマイクロフォンの2つのマイクロフォンを設けることはコストの点で不利である。したがって、1つのマイクロフォンでS/Nが良好となることが望ましい。
このような問題点を解消し得る音声入力装置が特開平10−11084号公報に開示されている。特開平10−11084号公報の音声入力装置は、遠隔制御を行うためのナビリモコンと、音声認識を用いて制御を行うために音声を入力するマイクロフォンとを有する車載用ナビゲーションシステムの音声入力装置であって、前記ナビリモコン内に前記マイクロフォンを設けることを特徴としている。特開平10−11084号公報に開示された音声入力システムは、カーナビゲーションシステムの制御信号に入力するためのワイヤレスリモコン内にマイクロフォンを設けているため、マイクロフォンケーブルのための配線作業を行う必要がない。しかも、ユーザが音声入力を行う際には、マイクロフォン内蔵のリモコンを口元に近づけて発声することができる。したがって、ノイズの影響を受けにくいという利点もある。
以上説明したように、ワイヤレスリモコンにマイクロフォンを内蔵する特開平10−11084号公報の提案は従来の問題点を解消することのできる有益なものである。ところが、マイクロフォン内蔵ワイヤレスリモコンに音声入力を行うためには、ユーザが当該ワイヤレスリモコンを持つ必要がある。音声入力を車両走行中に行う場合には、運転操作に支障をきたすおそれがある。したがって、本発明はマイクロフォンのための長いケーブルが不要で、かつマイクロフォンケーブル配線作業が不要かまたは簡便な車載機器、特にカーナビゲーションシステムの提供を課題とする。また本発明は、音声入力時に運転操作に支障をきたすことのない車載機器、特にカーナビゲーションシステムの提供を課題とする。
上記課題を解決するために、本発明のある観点によれば、音声入力用の複数のマイクロフォンと、上記複数のマイクロフォンからの出力信号のそれぞれにディレイを加え、上記ディレイが加えられたそれぞれの信号を加算した音声信号を生成する音声信号生成部と、を有し上記出力信号に加えられるディレイ量を変更することにより指向性軸が変更されるマイクロフォンシステムと、上記複数のマイクロフォンからの出力信号にそれぞれサンプルディレイを加えた信号を加算したサンプル音声信号の出力レベルに基づいて、上記出力信号のそれぞれに対して加えるディレイ量の複数の組合せの中から、一のディレイ量の組合せを選択するディレイ量選択部と、上記ディレイ量選択部により選択されたディレイ量の組合せを用いて生成された上記音声信号を認識する認識部と、上記認識部の認識結果に基づいて当該装置の動作を制御する制御部と、を有する、ナビゲーション装置が提供される。
また、上記ディレイ量選択部は、上記出力レベルが最も高い上記ディレイ量の組合せを選択してもよい。
また、上記ディレイ量決定部が決定したディレイ量の組合せを、上記音源である話者と対応づけて記憶する記憶部をさらに有し、上記音声信号生成部は、指定された話者と対応づけて上記記憶部に記憶されたディレイ量の組合せを用いて上記音声信号を生成してもよい。
また、上記ディレイ量選択部は、複数の上記ディレイ量の組合せについて上記出力レベルを検出し、上記出力レベルが最も高くなる上記ディレイ量の組合せを選択してもよい。
また、上記複数のマイクロフォンからの出力信号は、上記でディレイ量選択部を有する音源推定系統と、上記音声信号生成部、上記認識部、および上記制御部を有する出力信号系統とにそれぞれ入力され、上記ディレイ量選択部は、上記出力信号系統において上記制御部が上記認識結果に基づいた制御を行っている期間中、上記ディレイ量の組合せ選択処理を実行してもよい。
また、上記複数のマイクロフォンは、等間隔に配置されてもよい。
また、上記課題を解決するために、本発明の別の観点によれば、複数のマイクロフォンにより音声を取得するステップと、上記複数のマイクロフォンからの出力信号にそれぞれサンプルディレイを加えるステップと、上記サンプルディレイが加えられた信号を加算したサンプル音声信号を生成するステップと、上記サンプル音声信号の出力レベルを検出するステップと、上記出力レベルに基づいて、上記出力信号の夫々に対して加えるディレイ量の組合せを選択するステップと、選択された上記ディレイ量の組合せに基づいて、上記複数のマイクロフォンからの出力信号のそれぞれにディレイを加えるステップと、上記ディレイが加えられたそれぞれの信号を加算することにより、音声信号を生成するステップと、上記音声信号を認識するステップと、上記認識の結果に基づいて当該装置の動作を制御するステップと、を含む、音声認識方法が提供される。
また、上記課題を解決するために、本発明の別の観点によれば、コンピュータを、音声入力用の複数のマイクロフォンと、上記複数のマイクロフォンからの出力信号のそれぞれにディレイを加え、上記ディレイが加えられたそれぞれの信号を加算した音声信号を生成する音声信号生成部と、を有し上記出力信号に加えられるディレイ量を変更することにより指向性軸が変更されるマイクロフォンシステムと、上記複数のマイクロフォンからの出力信号にそれぞれサンプルディレイを加えた信号を加算したサンプル音声信号の出力レベルに基づいて、上記出力信号のそれぞれに対して加えるディレイ量の複数の組合せの中から、一のディレイ量の組合せを選択するディレイ量選択部と、上記ディレイ量選択部により選択されたディレイ量の組合せを用いて生成された上記音声信号を認識する認識部と、上記認識部の認識結果に基づいて当該装置の動作を制御する制御部とを有する、ナビゲーション装置として機能させるためのプログラムが提供される。
本発明者は、マイクロフォンケーブルの引き出しの対象としてモニタを利用することに着目した。カーナビゲーションシステムにおいて、モニタは、通常、ダッシュボード上に取り付けられている。したがって、モニタからマイクロフォンケーブルを引き出し、例えば、ダッシュボード上にマイクロフォンを取り付けたとしても、マイクロフォンケーブルは従来に比べて短くてすみ、かつ配線作業も極めて簡便である。しかも、モニタから引き出されたマイクロフォンは、ダッシュボードのほか、ステアリングコラム、サンバイザ、Aピラー部といった従来と同様の個所に取り付けて使用することができるから、ユーザがマイクロフォンを手に持つ必要がない。また、マイクロフォンケーブル自体を無くすことも可能である。つまり、マイクロフォンをモニタを構成する筐体と一体化することによっても、前記課題を解決できることを知見した。この場合、マイクロフォンケーブルが存在しないことになるので、配線作業は全く不要となる。しかも、マイクロフォンケーブルが車室内に露出することがないため、配線が露出することによる見栄えの劣化という心配もなくなる。
本発明は以上のような利点を供えた車載機器であって、音声認識を用いて制御することのできる車載機器であって、地図情報その他の情報を表示するためのモニタと、音声入力用のマイクロフォンと、を備え、前記マイクロフォンが前記モニタに接続されることを特徴とする車載機器である。本発明の車載機器において、音声入力用のマイクロフォン(以下、単にマイクロフォンという)を前記モニタに接続する形態としては、マイクロフォン用のケーブルを介して前記モニタに接続する形態と、ケーブルを介さずにマイクロフォンを直接前記モニタに接続する形態がある。ケーブルを介して前記モニタに接続する形態によれば、トランクルームから車室内前部まで配線作業をしていた従来に比べて配線作業が著しく軽減される。また、ケーブルの長さも従来に比べて短くて済む。マイクロフォンを直接モニタに接続する形態によれば、配線作業自体が不要となる。しかも、ケーブルが不要となるため、従来のようにケーブルが車室内に露出することがないため、見栄えが悪い、といったユーザからの苦情を解決することができる。ケーブルを介してマイクロフォンをモニタに取り付けた場合、マイクロフォンを設置する位置は任意である。つまり、従来のように、ダッシュボード、ステアリングコラム、サンバイザ、Aピラーといった個所にマイクロフォンを設置することができる。マイクロフォンを直接前記モニタに接続する形態としては、以下の2つの形態がある。一般にモニタは、液晶表示素子等の表示部、その他の部分を保持する筐体を備えているが、その筐体外側にマイクロフォンを取り付ける形態と、筐体内部にマイクロフォンを取り付ける(内蔵する)形態である。いずれの場合であっても、マイクロフォンはモニタに設置されることになる。
モニタに接続されるマイクロフォンの数は単数に限らず、複数とすることもできる。また、マイクロフォンはモニタに対して着脱自在とすることもできる。つまり、マイクロフォンのケーブルまたはマイクロフォン自体が、前記モニタに対して着脱自在に接続されるようにすることも本発明の範囲内である。マイクロフォンを直接モニタに接続する場合には、マイクロフォンをモニタに対して固定とすることもできるが、その向きを変更可能とすることもできる。マイクロフォンの指向性軸を話者に対して最適な向きとすることが望ましいからである。マイクロフォンの向きを変更する手段としては、ユーザによる手動の他、モータ等の駆動源を用いることができる。
本発明の車載機器の典型的な適用例はカーナビゲーションシステムである。したがって、本発明では入力された音声を認識するための認識部と、前記認識部で認識された結果を表示するためのモニタと、前記モニタに一体的に接続され、かつ前記音声を入力するためのマイクロフォンと、を備えたことを特徴とするカーナビゲーションシステムが提供される。また、カーオーディオにも適用することができるが、車載機器であれば用途は問わない。また、車室内において、マイクロフォンには音声認識のための音声の他に、エンジン音、その他のノイズが入力される。本発明のカーナビゲーションシステムにおいては、ノイズを抑制するためのノイズ抑制手段を設けることができる。ノイズ抑制手段としては、公知のノイズ抑制手段を広く適用することができるが、本発明において特徴的なノイズ抑制手段は、マイクロフォンをモニタに直接接続した場合に機能する。つまり、モニタ全体の回折効果によりマイクロフォンの感度が向上し、ノイズが抑制される。したがってこの場合には、モニタがノイズ抑制手段を構成することになる。ノイズを抑制する手法として、ノイズ集音用のマイクロフォンを音声入力用のマイクロフォンとは別途設けることが従来より行われている。本発明では、モニタの表裏いずれか一方の面に音声入力用マイクロフォンを設置し、またモニタの他方の面にノイズ入力用マイクロフォンを設置することができる。つまり本発明では、地図情報その他の情報を表示するためのモニタ本体と、前記モニタ本体の表裏いずれか一方の面に設置した音声入力用マイクロフォンと、前記モニタ本体の他方の面に設置したノイズ入力用マイクロフォンと、を備えたことを特徴とするモニタ装置が提供される。ノイズ入力用マイクロフォンは前述のノイズ抑制手段に該当するが、音声入力用マイクロフォンが設置されたモニタ本体の面の裏面に設置する点に特徴を有する。その利点については、後述する発明の実施の形態において説明する。
以上説明したように、本発明の車載機器によれば、マイクロフォンをモニタに接続したので、マイクロフォンのための長いケーブルが不要で、かつマイクロフォンフォンケーブル配線作業が不要かまたは簡便となる。
<第1実施形態>
以下、添付図面に示す実施の形態に基づいてこの発明を詳細に説明する。図1は第1実施形態におけるカーナビゲーションシステムの全体的なシステム構成を説明するための図である。この図において、符号1はナビゲーション装置の全体を司る演算処理部、2は自らの位置を計測する測位部、3はカーナビゲーションシステムの操作手段としてのリモートコントローラ、4はリモートコントローラ3からの操作情報を受信する受信部、5は入力された音声を認識処理する認識部、6は地図情報その他の情報を表示するためのモニタである。
以下、添付図面に示す実施の形態に基づいてこの発明を詳細に説明する。図1は第1実施形態におけるカーナビゲーションシステムの全体的なシステム構成を説明するための図である。この図において、符号1はナビゲーション装置の全体を司る演算処理部、2は自らの位置を計測する測位部、3はカーナビゲーションシステムの操作手段としてのリモートコントローラ、4はリモートコントローラ3からの操作情報を受信する受信部、5は入力された音声を認識処理する認識部、6は地図情報その他の情報を表示するためのモニタである。
ここで、演算処理部1は、その全体を制御するCPU7と、所定のプログラムが格納されたROM8と、各種データを記憶するRAM9と、前記測位部2、受信部4、認識部5、モニタ6等との間で入出力を行うI/O回路部10とを備えている。測位部2は、GPS(GlobalPositioningSystem:全地球測位システム)により測位を行うもので、高度約2万km上の複数(通常4つ以上)のGPS衛星から発信された1575.42MHzの信号(電波)を図示しない受信アンテナで受信し、この信号に基づき測位計算を行い、現在位置を示す測位データを演算処理部1に転送する。また、このカーナビゲーションシステムの各種操作は、リモートコントローラ3により行うことができる。このリモートコントローラ3は、例えば操作メニューをモニタ6に表示させたり、モニタ6への電子地図の表示範囲を変更したり、モニタ6に表示された各種操作メニュー等においてカーソルを移動させたり、することができる。そして、このリモートコントローラ3による操作情報に基づく信号はワイヤレスで送信され、これが受信部4において受信された後、演算処理部1に伝達されてその操作内容が実行される。
モニタ6には音声入力用のマイクロフォン40が接続してある。このマイクロフォン40で入力された音声によっても、リモートコントローラ3と同様にカーナビゲーションシステムの各種操作を制御することができるし、その結果がモニタ6に表示される。例えば、行き先を音声で指示することにより、その行き先を含む地図情報をモニタ6に表示させることができる。マイクロフォン40に入力された音声は、認識部5で認識処理がなされる。認識部5は図2に示すように、CPU51と、所定のプログラムが格納されたROM52と、各種データを記憶するRAM53とから構成される。認識部5では図3に示すように認識処理が実行される。すなわち、入力された音声信号をアナログ値からデジタル値に変換する。変換された音声信号に対してノイズ抑制処理を施した後に、音響分析を行う。ノイズ抑制処理は公知の手法を適用することができる。音響分析においては、音声の特徴量を抽出する。その後、この抽出された特徴量と標準パターンとを比較することにより音声認識がなされる。認識された結果は、モニタ6に表示される。さらに、このカーナビゲーションシステムには、図1に示したように、地図情報その他の情報を記憶した記憶媒体11が備えられている。
図4は、モニタ6の正面図を示す。モニタ6は、地図情報その他を表示するための表示部61と、表示部61その他を収容するモニタ筐体62とから構成される。モニタ6のモニタ筐体62からは、マイクロフォン40のマイクロフォンケーブル41が引き出されている。本実施の形態においてマイクロフォンケーブル41はモニタ筐体62に固着させているが、着脱自在とすることもできる。つまり、モニタ筐体62にコネクタを内蔵し、そのコネクタに対してマイクロフォンケーブル41を着脱可能とする。モニタ6はコラム63を介してダッシュボード、コンソールボックス等の車室内前部に取り付けられる。したがって、マイクロフォン40を、従来のように、サンバイザ、あるいはダッシュボード上に取り付けたとすると、マイクロフォンケーブル41の長さは1〜2m程度あれば十分に足りる。なお、マイクロフォン40を取り付ける位置を限定するものではなく、サンバイザ、ダッシュボードの他、車室内の任意の位置に取り付けることができる。もっとも、マイクロフォン40に対する話者は、運転手または助手席に座っている者であろうから、車室内前部のいずれかの位置ということになろう。
また、本実施の形態によれば、従来のようにトランクルームからマイクロフォンケーブルを車室内前部まで配線するのに比べて、モニタ6が車室内前部に配置されているため、マイクロフォンケーブル41の配線作業は簡単である。本実施の形態において、マイクロフォン40およびマイクロフォンケーブル41は、従来公知のものを適用することができる。たとえば、マイクロフォン40としては、単一指向性マイクロフォンおよび無指向性マイクロフォンがあるが、いずれでも使用することができる。ただし、単一指向性マイクロフォンの方が、ノイズの集音の可能性が低くなることから望ましい。また、本実施の形態ではマイクロフォン40は単数としているが、複数取り付けてもよい。
<第2実施形態>
本発明にかかる第2実施形態を図5および図6に基づき説明する。なお、第2実施形態にかかるカーナビゲーションシステムの基本構成は、第1実施形態と同様であるので、ここでは相違点を中心に説明する。図5に示すように、第2実施形態にかかるモニタ160は、地図情報その他を表示するための表示部161と、表示部161その他を収容するモニタ筐体162とから構成される。第2実施形態が第1実施形態と相違する点は、第1実施形態がマイクロフォン40とモニタ筐体62とがマイクロフォンケーブル41を介して接続されているのに対して、第2実施形態はマイクロフォン140がモニタ筐体162に直接接続されている点である。また、モニタ筐体162にはマイクロフォン140と接続されるコネクタが内蔵されており、図6に示すようにマイクロフォン140はモニタ筐体162に着脱自在となっている。
本発明にかかる第2実施形態を図5および図6に基づき説明する。なお、第2実施形態にかかるカーナビゲーションシステムの基本構成は、第1実施形態と同様であるので、ここでは相違点を中心に説明する。図5に示すように、第2実施形態にかかるモニタ160は、地図情報その他を表示するための表示部161と、表示部161その他を収容するモニタ筐体162とから構成される。第2実施形態が第1実施形態と相違する点は、第1実施形態がマイクロフォン40とモニタ筐体62とがマイクロフォンケーブル41を介して接続されているのに対して、第2実施形態はマイクロフォン140がモニタ筐体162に直接接続されている点である。また、モニタ筐体162にはマイクロフォン140と接続されるコネクタが内蔵されており、図6に示すようにマイクロフォン140はモニタ筐体162に着脱自在となっている。
以上の第2実施形態によれば、マイクロフォン140がモニタ筐体162に直接接続されているので、マイクロフォンケーブルの配線作業が全く不要となる。また、マイクロフォンケーブルが車室内に露出することがない。車室内にマイクロフォンケーブルが露出すると見栄えが悪いと嫌うユーザもいるが、この第2実施形態は、このようなユーザの要望に応えることができる。また、この第2実施形態のようにモニタ160にマイクロフォン140を直接接続、つまり一体的に取り付けることにより、ノイズ抑制効果が期待できる。つまり、モニタ160全体の回折効果によりマイクロフォン140の感度が向上するためである。この回折効果による感度向上は、人間が小さい音を聞くときに耳の後ろに手のひらをあてることにより経験することができる。
本第2実施形態において、マイクロフォン140は、図7に示すように、マイクロフォン本体141とマイクロフォン筐体142とから構成される。マイクロフォン本体141は単一指向性のマイクロフォンから構成されているが、この指向特性をマイクロフォン筐体142と組み合わせることにより制御し、音声を増幅しノイズを抑制している。単一指向性のマイクロフォン本体141は、正面の音響端子と背面の音響端子間の距離、つまり音響2端子間距離、を長く取ることにより指向性を向上することができる。図7はマイクロフォン140の正面図(左側)および側面図(右側)を示しているが、マイクロフォン筐体142は、貫通孔142hを有する断面がかまくら型をなしていることがわかる。マイクロフォン本体141は、この貫通孔142hの貫通方向の中間部に配置されている。マイクロフォン本体141単体の音響2端子間距離がd1であるのに対して、マイクロフォン筐体142と組み合わせることにより、マイクロフォン140としての音響2端子間距離d2を、マイクロフォン本体141単体の音響2端子間距離d1より大きくすることができる。市販されているマイクロフォン本体141は図7に示すように単純な円柱形であることが多いが、本実施の形態によれば、市販のマイクロフォン本体141を用い、かつモニタ160にマイクロフォン本体141を取り付けるためのマイクロフォン筐体142と組み合わせることにより、音響2端子間距離を大きくすることができるという利点がある。本実施の形態ではマイクロフォン筐体142をかまくら型としたが、本発明はこれに限定されない。マイクロフォン本体140をモニタ160に取り付ける機能と、音響2端子間距離を大きくすることができる機能を備えていれば、如何なる形態であっても本発明にとって有効である。図8にマイクロフォン140の他の構成例を示す。図8のマイクロフォン140は、図7に示したマイクロフォン140と基本的には同様の構成からなるが、マイクロフォン筐体142の上部に貫通孔142iを形成している。この貫通孔142iを空気が流通することにより、マイクロフォン140が日射などにより高熱になることを防止することができる。
<第3実施形態>
本発明にかかる第3実施形態を図9および図10に基づき説明する。なお、第3実施形態にかかるカーナビゲーションシステムの基本構成は、第1〜第2実施形態と同様であるので、ここでは相違点を中心に説明する。また、図9は第3実施形態にかかるモニタ260の正面図であり、図10は同背面図である。図9に示すように、第3実施形態にかかるモニタ260は、地図情報その他を表示するための表示部261と、表示部261その他を収容するモニタ筐体262とから構成される。第3実施形態が第2実施形態と相違する点は、第2実施形態がマイクロフォン140がモニタ筐体162の外部に取り付けられているのに対して、第3実施形態はマイクロフォン240がモニタ筐体262内部に埋め込まれている点である。
本発明にかかる第3実施形態を図9および図10に基づき説明する。なお、第3実施形態にかかるカーナビゲーションシステムの基本構成は、第1〜第2実施形態と同様であるので、ここでは相違点を中心に説明する。また、図9は第3実施形態にかかるモニタ260の正面図であり、図10は同背面図である。図9に示すように、第3実施形態にかかるモニタ260は、地図情報その他を表示するための表示部261と、表示部261その他を収容するモニタ筐体262とから構成される。第3実施形態が第2実施形態と相違する点は、第2実施形態がマイクロフォン140がモニタ筐体162の外部に取り付けられているのに対して、第3実施形態はマイクロフォン240がモニタ筐体262内部に埋め込まれている点である。
以上の第3実施形態によれば、マイクロフォン240がモニタ筐体262に直接接続されている。したがって、第2実施形態と同様に、マイクロフォンケーブルの配線作業が全く不要となる、マイクロフォンケーブルが車室内に露出することがない、といった効果を有する。しかも、マイクロフォン240が、モニタ筐体262内部に埋め込まれているので、第2実施形態のようにマイクロフォン140がモニタ160の外部に突出することなくすっきりとした感じとなる。また、第3実施形態によっても、第2実施形態と同様に、マイクロフォン240をモニタ260に取り付けているので、モニタ260全体の回折効果によりマイクロフォン240の感度を向上することができる。
第3実施形態では、図10に示すように、モニタ260の背面側に、ノイズを集音するためのノイズマイクロフォン241をモニタ筐体262に内蔵させている。図9に示したマイクロフォン240は、音声のみならず雑音をも集音する。一方、ノイズマイクロフォン241は雑音を集音する。したがって、マイクロフォン240による「音声信号+雑音信号」からノイズマイクロフォン241による「雑音信号」を減ずれば、音声信号のみを抽出することができる。このように一方のマイクロフォンを「音声信号+雑音信号」用に、他方のマイクロフォンを「雑音信号」用に用い、「音声信号」のみを抽出する技術は既に知られている。しかし、第3実施形態のように、モニタ260の表裏面にそれぞれ「音声信号+雑音信号」用のマイクロフォン240および「雑音信号」用のノイズマイクロフォン241を配置する構成は新規である。
マイクロフォン240とノイズマイクロフォン241との距離が離れていると、マイクロフォン240で集められる雑音信号とノイズマイクロフォン241で集められる雑音信号とが相違するため、「音声信号+雑音信号」から「雑音信号」を減ずるという処理が現実的でなくなる。したがって、マイクロフォン240とノイズマイクロフォン241とは近接した位置に配置されることが望ましい。ところが、ノイズマイクロフォン241は、雑音信号がほしい信号であるから、話者の音声を集めにくい位置に配置されるべきである。つまり、この点を考慮すると、マイクロフォン240とノイズマイクロフォン241とは、あまり近い位置に配置することは望ましくない。しかるに、第3実施形態のように、モニタ260の背面側にノイズマイクロフォン241を配置すれば、話者からの音声はモニタ260により遮られる。つまり、ノイズマイクロフォン241は、話者の音声を集めにくい位置に配置されているということができる。しかも、ノイズマイクロフォン241は、マイクロフォン240と近接した位置に配置すべきであるという要求をも満足することができる。したがって、「音声信号+雑音信号」から「雑音信号」を減ずるという処理が、有効なものとなる。
第3実施形態ではマイクロフォン240およびノイズマイクロフォン241を各々2個ずつ設けた例を示したが、本発明はこれに限定されず、各々1個ずつ設けてもよいし、各々3個以上設けてもよい。また、マイクロフォン240およびノイズマイクロフォン241を配置する位置についても、第3実施形態ではモニタ260の上部両端としたが、これに限定されず、マイクロフォン240およびノイズマイクロフォン241の個数に応じて適宜定めることができる。ノイズ抑制は、以上の他に、例えば図11に示すような電気的な仕組みによっても行うこともできる。図11において、Mがマイクロフォン、Aがアンプ、τが1サンプルのディレイを示しているが、このような公知の電気的なノイズ抑制手段を設けることができる。
<第4実施形態>
本発明にかかる第4実施形態を図12および図13に基づき説明する。なお、第4実施形態にかかるカーナビゲーションシステムの基本構成は、第1〜第3実施形態と同様であるので、ここでは相違点を中心に説明する。また、図12は第4実施形態にかかるモニタ360の正面図であり、図13は平面図である。図12に示すように、第4実施形態にかかるモニタ360は、地図情報その他を表示するための表示部361と、表示部361その他を収容するモニタ筐体362とから構成される。第4実施形態は、第2実施形態と同様に、モニタ筐体362にマイクロフォン340が直接接続されている。第2実施形態では、モニタ筐体162に取り付けられたマイクロフォン140は着脱自在ではあったものの、その向きを変えることはできなかった。ところが、第4実施形態では、マイクロフォン340の向きを変えることが可能に構成されている。つまり、図13に示すように、マイクロフォン340は、モニタ360に対して回動可能に取り付けられている。したがって、話者、つまり音源に対してマイクロフォン340の指向性軸を向けることができる。
本発明にかかる第4実施形態を図12および図13に基づき説明する。なお、第4実施形態にかかるカーナビゲーションシステムの基本構成は、第1〜第3実施形態と同様であるので、ここでは相違点を中心に説明する。また、図12は第4実施形態にかかるモニタ360の正面図であり、図13は平面図である。図12に示すように、第4実施形態にかかるモニタ360は、地図情報その他を表示するための表示部361と、表示部361その他を収容するモニタ筐体362とから構成される。第4実施形態は、第2実施形態と同様に、モニタ筐体362にマイクロフォン340が直接接続されている。第2実施形態では、モニタ筐体162に取り付けられたマイクロフォン140は着脱自在ではあったものの、その向きを変えることはできなかった。ところが、第4実施形態では、マイクロフォン340の向きを変えることが可能に構成されている。つまり、図13に示すように、マイクロフォン340は、モニタ360に対して回動可能に取り付けられている。したがって、話者、つまり音源に対してマイクロフォン340の指向性軸を向けることができる。
マイクロフォン340の回動は、手動で行うこととしてもよいし、モータ等の駆動源を用いて行うようにしてもよい。第4実施形態のように複数のマイクロフォン340を設ける場合には、リンク機構その他を利用して複数のマイクロフォン340を同時に回動するようにすることができる。また、第4実施形態では、水平方向にマイクロフォン340の向きを変える例を示したが、鉛直方向に向きを変えることもできる。また、各話者に適したマイクロフォン340の向きを予め登録(プリセット)しておき、その話者がドライバとなった際に、プリセットしておいた向きにマイクロフォン340が向くようにすることもできる。例えば、第4実施形態によるナビゲーション装置を搭載した自動車を家族で使用する場合には、その家族で当該自動車を運転する者毎にマイクロフォン340の向きをプリセットしておく。そして、自分が運転する場合には、プリセットしておいたマイクロフォン340の向きを読み出し、その向きにマイクロフォン340の向きをセットさせる。
マイクロフォン340の向きのプリセットは、音源推定手段を用いることにより実現することができる。図14に音源推定手段の1例を示すが、図11に示したノイズ抑制手段を利用したものである。図11に示したノイズ抑制手段は、τ(1サンプルディレイ)が各マイクロフォンMに付加されているが、そのディレイ量をソフト的に増減させることでマイクロフォンシステムとしての指向性軸を変えることができるというものである。例えば、図14に示すように4つのマイクロフォンM1〜M4が等間隔に配置されていたとする。出力信号系統とは別に音源推定系を設け、その中で逐次ディレイ量変更を行う。はじめに、マイクロフォンM1の出力には6サンプルディレイ、マイクロフォンM2には4サンプルディレイおよびマイクロフォンM3には2サンプルディレイを加算し、マイクロフォンM4にはディレイ無し、とし、それらの出力を加算して音声出力レベルを検出する。次に、マイクロフォンM1の出力にはディレイ無し、マイクロフォンM2には2サンプルディレイおよびマイクロフォンM3には4サンプルディレイおよびマイクロフォンM4には6サンプルディレイを加算、とし、それらの出力を加算して音声出力レベルを検出する。さらに、全てのマイクロフォンM1〜M4にディレイをかけない場合の音声出力レベルを検出する。これら3種類の音声出力レベルの中で、最もレベルの高いものを選び、そのときのディレイのかけかたを出力信号系統にコピーして音源推定処理を行う。マイクロフォン340のプリセットについては、上記の音源推定手段の他に、公知の如何なる手段を採用してもよい。
<第5実施形態>
本発明にかかる第5実施形態を図15および図16に基づき説明する。なお、第5実施形態にかかるナビゲーションシステムの基本構成は第1実施形態と同様であり、マイクロフォン440はマイクロフォンケーブル441を介してモニタ460に接続された構成となっている。図15および図16に示すように、第5実施形態にかかるモニタ460は地図情報その他を表示するための表示部461と、表示部461その他を収容するモニタ筐体462とから構成される。モニタ460は、コラム470を介して車室内前部の任意の位置に取り付けられる。一般的には、ダッシュボードの車体幅方向の中央部に取り付ける。コラム470からマイクロフォン440を固定するためのL字状かつ中空のアーム480が延設されている。アーム480の先端部にマイクロフォン440が取り付けられている。マイクロフォン440は、モニタ460の表面に近接配置されている。マイクロフォン440は、マイクロフォンケーブル441を介してモニタ460に接続されている。マイクロフォンケーブル441は、モニタ460の背面から引き出され、アーム480の中空部に配線されてマイクロフォン440に接続される。
本発明にかかる第5実施形態を図15および図16に基づき説明する。なお、第5実施形態にかかるナビゲーションシステムの基本構成は第1実施形態と同様であり、マイクロフォン440はマイクロフォンケーブル441を介してモニタ460に接続された構成となっている。図15および図16に示すように、第5実施形態にかかるモニタ460は地図情報その他を表示するための表示部461と、表示部461その他を収容するモニタ筐体462とから構成される。モニタ460は、コラム470を介して車室内前部の任意の位置に取り付けられる。一般的には、ダッシュボードの車体幅方向の中央部に取り付ける。コラム470からマイクロフォン440を固定するためのL字状かつ中空のアーム480が延設されている。アーム480の先端部にマイクロフォン440が取り付けられている。マイクロフォン440は、モニタ460の表面に近接配置されている。マイクロフォン440は、マイクロフォンケーブル441を介してモニタ460に接続されている。マイクロフォンケーブル441は、モニタ460の背面から引き出され、アーム480の中空部に配線されてマイクロフォン440に接続される。
第2(第3,第4)実施形態のように、マイクロフォン140(240,340)をモニタ160(260,360)に直接接続した場合には、モニタ160(260,360)全体の回折効果によりマイクロフォン140(240,340)の感度を向上することができた。第5実施形態の場合には、マイクロフォン440をマイクロフォンケーブル441を介してモニタ460に接続されているが、アーム480を用いてマイクロフォン440をモニタ460の表面に近接配置している。したがって、モニタ460全体の回折効果により、マイクロフォン440の感度を向上することができる。
1…演算処理部、3…リモートコントローラ、5…認識部、6,160,260,360,460…モニタ、11…記憶媒体、40,140,240,340,440…マイクロフォン、41,441…マイクロフォンケーブル、61,161,261,361,461…表示部、62,162,262,362,462…モニタ筐体
Claims (8)
- 音声入力用の複数のマイクロフォンと、前記複数のマイクロフォンからの出力信号のそれぞれにディレイを加え、前記ディレイが加えられたそれぞれの信号を加算した音声信号を生成する音声信号生成部と、を有し前記出力信号に加えられるディレイ量を変更することにより指向性軸が変更されるマイクロフォンシステムと、
前記複数のマイクロフォンからの出力信号にそれぞれサンプルディレイを加えた信号を加算したサンプル音声信号の出力レベルに基づいて、前記出力信号のそれぞれに対して加えるディレイ量の複数の組合せの中から、一のディレイ量の組合せを選択するディレイ量選択部と、
前記ディレイ量選択部により選択されたディレイ量の組合せを用いて生成された前記音声信号を認識する認識部と、
前記認識部の認識結果に基づいて当該装置の動作を制御する制御部と、
を備える、ナビゲーション装置。 - 前記ディレイ量選択部は、前記出力レベルが最も高い前記ディレイ量の組合せを選択する、請求項1に記載のナビゲーション装置。
- 前記ディレイ量決定部が決定したディレイ量の組合せを、前記音源である話者と対応づけて記憶する記憶部、
をさらに備え、
前記音声信号生成部は、指定された話者と対応づけて前記記憶部に記憶されたディレイ量の組合せを用いて前記音声信号を生成する、請求項1または2に記載のナビゲーション装置。 - 前記ディレイ量選択部は、複数の前記ディレイ量の組合せについて前記出力レベルを検出し、前記出力レベルが最も高くなる前記ディレイ量の組合せを選択する、請求項1〜3のいずれか1項に記載のナビゲーション装置。
- 前記複数のマイクロフォンからの出力信号は、前記でディレイ量選択部を有する音源推定系統と、前記音声信号生成部、前記認識部、および前記制御部を有する出力信号系統とにそれぞれ入力され、
前記ディレイ量選択部は、前記出力信号系統において前記制御部が前記認識結果に基づいた制御を行っている期間中、前記ディレイ量の組合せ選択処理を実行する、請求項1に記載のナビゲーション装置。 - 前記複数のマイクロフォンは、等間隔に配置される、請求項1に記載のナビゲーション装置。
- 複数のマイクロフォンにより音声を取得するステップと、
前記複数のマイクロフォンからの出力信号にそれぞれサンプルディレイを加えるステップと、
前記サンプルディレイが加えられた信号を加算したサンプル音声信号を生成するステップと、
前記サンプル音声信号の出力レベルを検出するステップと、
前記出力レベルに基づいて、前記出力信号の夫々に対して加えるディレイ量の組合せを選択するステップと、
選択された前記ディレイ量の組合せに基づいて、前記複数のマイクロフォンからの出力信号のそれぞれにディレイを加えるステップと、
前記ディレイが加えられたそれぞれの信号を加算することにより、音声信号を生成するステップと、
前記音声信号を認識するステップと、
前記認識の結果に基づいて当該装置の動作を制御するステップと、
を含む、音声認識方法。 - コンピュータを、
音声入力用の複数のマイクロフォンと、前記複数のマイクロフォンからの出力信号のそれぞれにディレイを加え、前記ディレイが加えられたそれぞれの信号を加算した音声信号を生成する音声信号生成部と、を有し前記出力信号に加えられるディレイ量を変更することにより指向性軸が変更されるマイクロフォンシステムと、
前記複数のマイクロフォンからの出力信号にそれぞれサンプルディレイを加えた信号を加算したサンプル音声信号の出力レベルに基づいて、前記出力信号のそれぞれに対して加えるディレイ量の複数の組合せの中から、一のディレイ量の組合せを選択するディレイ量選択部と、
前記ディレイ量選択部により選択されたディレイ量の組合せを用いて生成された前記音声信号を認識する認識部と、
前記認識部の認識結果に基づいて当該装置の動作を制御する制御部と、
を備える、ナビゲーション装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010266397A JP2011102984A (ja) | 2010-11-30 | 2010-11-30 | ナビゲーション装置、音声認識方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010266397A JP2011102984A (ja) | 2010-11-30 | 2010-11-30 | ナビゲーション装置、音声認識方法、およびプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000148949A Division JP2001331195A (ja) | 2000-05-19 | 2000-05-19 | 車載機器、カーナビゲーションシステムおよびモニタ装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2011102984A true JP2011102984A (ja) | 2011-05-26 |
Family
ID=44193313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010266397A Pending JP2011102984A (ja) | 2010-11-30 | 2010-11-30 | ナビゲーション装置、音声認識方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2011102984A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102645977A (zh) * | 2012-03-26 | 2012-08-22 | 广东翼卡车联网服务有限公司 | 一种车载语音唤醒人机交互***及方法 |
US10572073B2 (en) | 2015-08-24 | 2020-02-25 | Sony Corporation | Information processing device, information processing method, and program |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04119400A (ja) * | 1990-09-11 | 1992-04-20 | Fujitsu Ten Ltd | 音声認識装置 |
JPH04236385A (ja) * | 1991-01-21 | 1992-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 音響監視装置および監視方法 |
JPH10145763A (ja) * | 1996-11-15 | 1998-05-29 | Mitsubishi Electric Corp | 会議システム |
JPH11219193A (ja) * | 1998-02-03 | 1999-08-10 | Fujitsu Ten Ltd | 車載用音声認識装置 |
-
2010
- 2010-11-30 JP JP2010266397A patent/JP2011102984A/ja active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04119400A (ja) * | 1990-09-11 | 1992-04-20 | Fujitsu Ten Ltd | 音声認識装置 |
JPH04236385A (ja) * | 1991-01-21 | 1992-08-25 | Nippon Telegr & Teleph Corp <Ntt> | 音響監視装置および監視方法 |
JPH10145763A (ja) * | 1996-11-15 | 1998-05-29 | Mitsubishi Electric Corp | 会議システム |
JPH11219193A (ja) * | 1998-02-03 | 1999-08-10 | Fujitsu Ten Ltd | 車載用音声認識装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102645977A (zh) * | 2012-03-26 | 2012-08-22 | 广东翼卡车联网服务有限公司 | 一种车载语音唤醒人机交互***及方法 |
US10572073B2 (en) | 2015-08-24 | 2020-02-25 | Sony Corporation | Information processing device, information processing method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001331195A (ja) | 車載機器、カーナビゲーションシステムおよびモニタ装置 | |
CN107211216B (zh) | 用于提供虚拟音频再现的方法和装置 | |
JP6456656B2 (ja) | ウェアラブルデバイスに基づく車両システムの適合 | |
CN108349423A (zh) | 用于车载***的用户界面 | |
CN109565629B (zh) | 用于控制音频信号的处理的方法和装置 | |
US20070203646A1 (en) | Image correction method and apparatus for navigation system with portable navigation unit | |
US10085106B2 (en) | Sound control device for vehicle and method for controlling the same | |
JP2015508487A (ja) | ナビゲーションサウンドスケーピング | |
US9268522B2 (en) | Devices and methods for conveying audio information in vehicles | |
US9807497B2 (en) | Sound source localization device, sound processing system, and control method of sound source localization device | |
WO2014176133A1 (en) | Frequency domain active noise cancellation system | |
JP2009025715A (ja) | 車載装置および音声認識方法 | |
WO2024104045A1 (zh) | 基于座舱区域获取操作指示的方法、显示方法及相关设备 | |
JP2008153743A (ja) | 車内会話補助装置 | |
JP2011102984A (ja) | ナビゲーション装置、音声認識方法、およびプログラム | |
JP6003773B2 (ja) | 車両用操作装置、ナビゲーション装置 | |
JP4539634B2 (ja) | エンジン音加工装置 | |
JP5451562B2 (ja) | 音響処理システム及びこれを用いた機械 | |
CN104769392B (zh) | 具有集成式无线电接收器的便携式装置 | |
JP5305034B2 (ja) | 操作システム | |
CN115428067A (zh) | 用于提供个性化虚拟个人助理的***和方法 | |
JP5205993B2 (ja) | 車両用聴覚モニター装置および方法 | |
EP4129766A1 (en) | Sound data processing device and sound data processing method | |
JP7456838B2 (ja) | 車両内音源探査装置及び車両内音源探査方法 | |
JP2022148823A (ja) | エージェント装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111107 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111115 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120306 |