JP2009288630A - 車両用音声認識システム - Google Patents

車両用音声認識システム Download PDF

Info

Publication number
JP2009288630A
JP2009288630A JP2008142603A JP2008142603A JP2009288630A JP 2009288630 A JP2009288630 A JP 2009288630A JP 2008142603 A JP2008142603 A JP 2008142603A JP 2008142603 A JP2008142603 A JP 2008142603A JP 2009288630 A JP2009288630 A JP 2009288630A
Authority
JP
Japan
Prior art keywords
vehicle
processing device
voice recognition
voice
terminal device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008142603A
Other languages
English (en)
Inventor
Kunio Yokoi
邦雄 横井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Corp
Original Assignee
Denso Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Corp filed Critical Denso Corp
Priority to JP2008142603A priority Critical patent/JP2009288630A/ja
Publication of JP2009288630A publication Critical patent/JP2009288630A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

【課題】情報センタなどに設置された外部装置との通信品質の影響を少なくし、安価でレスポンスの速い車両用音声認識システムを提供する。
【解決手段】車載端末装置200において使用者の音声の音声認識を実行し、その音声認識結果の信頼度を判定して、信頼度が所定の値より高いときは、そのままその音声認識結果を用い、信頼度が所定の値以下のときは、音声処理部10で抽出した音声の特徴量を、送受信部30を介して、可搬型の車載処理装置50と地上処理装置60に送信する。車載端末装置200では、車載処理装置50と通信を行うことにより、車載処理装置50の存在を認識できるか否かを判定し、車載処理装置50の存在を認識できる場合には、車載処理装置50から音声認識結果を受信する処理を行い、車載処理装置50の存在を認識できない場合には、地上処理装置60から音声認識結果を受信する処理を行う。
【選択図】図1

Description

本発明は、運転者等の使用者の音声の音声認識を正確にしかもレスポンスよく行う車両用音声認識システムに関する。
従来、携帯電話やPDAなどの携帯機器のように、CPUやメモリリソースの少ない機器で音声認識をする場合に分散型音声認識という方式がよく用いられている。この方式は、携帯機器で特徴量という音声認識に使うパラメータだけを抽出し、その特徴量のみを通信で情報センタに送る。そして、計算負荷が高くメモリを多く使用するマッチング処理などを情報センタなど大型コンピュータで行い、処理結果のみを通信で携帯機器に送り返すという方式である(例えば、特許文献1参照)。
この方式では、計算負荷が高く、メモリを多く使用するマッチング処理を携帯機器側で行う必要がないので、携帯機器の処理能力やメモリ容量を高くする必要がないという利点がある。
特開2004−184858号公報
ところが、この方法には、特徴量や認識結果を一旦何らかの方法で情報センタと通信で送受信する必要があるため、音声認識のレスポンスが遅くなる、通信に費用がかかる、あるいは、通信品質が悪いと利用できない場合がある、などの問題がある。
本発明は、こうした問題に鑑みなされたもので、情報センタなどに設置された外部装置との通信品質の影響を少なくし、安価でレスポンスの速い、車両用音声認識システムを提供することを目的とする。
かかる問題を解決するためになされた請求項1に記載の車両用音声認識システム(1:この欄においては、発明に対する理解を容易にするため、必要に応じて「発明を実施するための最良の形態」欄において用いた符号を付すが、この符号によって請求の範囲を限定することを意味するものではない。)は、外部処理装置(100)及び車載端末装置(200)を備えている。
外部端末装置は、送信された音声の特徴量を受信し、受信した特徴量に基づいて音声認識処理を実行し、その実行した音声認識結果を送信する。
また、車載端末装置(200)は、音声認識手段(10)、信頼度判定手段(10)、送受信手段(30)及び制御手段(10)を備えている。
音声認識手段(10)は、使用者の音声の音声認識を実行するとともに音声の特徴量を抽出し、信頼度判定手段(10)は、音声認識手段(10)で実行した音声認識結果の信頼度を判定し、送受信手段(30)は、外部処理装置(100)とデータの送受信を行う。
制御手段(10)は、音声認識結果を得るための制御を行う。そのため、制御手段(10)は、車載端末装置(200)の信頼度判定手段(10)で判定された、音声認識結果の信頼度が所定の値より高いときは、音声認識手段(10)で行った音声認識結果を用い、音声認識結果の信頼度が所定の値以下のときは、車載端末装置(200)の音声認識手段(10)で抽出した音声の特徴量を、送受信手段(30)を介して外部処理装置(100)に送信するとともに、送信した音声の特徴量に基づいて外部処理装置(100)において実行され、送信される音声認識結果を送受信手段(30)で受信し、受信した音声認識結果を用いる。
ここで、「音声認識結果の信頼度」について説明すると、音声認識では、入力された音声が辞書に登録されている単語の中のどれと一番近いかを出力する。また、その際には相対的な確からしさが尤度という数値としてあらわされ、絶対値として認識結果の確からしさを表現することは困難である。しかし、絶対的な確からしさが分かると音声認識システムとしては様々な利用法があるため、擬似的に絶対的な確からしさとする場合も多い。そこで、信頼度を第一位の尤度で正規化して第2位との差で表し、差が大きければ信頼度が高いとしたり、特定の単語などを基準にその基準との差が近ければ、信頼度が高いとしたりする。なお、信頼度の高低については、これ以外の公知な方法を用いてもよい。
また、「音声の特徴量」とは、音声の情報を扱い安くするために信号処理された後の情報のことであり、LPCケプストラム、メルケプストラムなどが用いられることが多い。
このような車両用音声認識システム(1)によれば、車載端末装置(200)において使用者の音声の音声認識を実行し、その音声認識結果の信頼度を判定して、信頼度が所定の値より高いときは、そのままその音声認識結果を用い、信頼度が所定の値以下のときは、音声認識手段(10)で抽出した音声の特徴量を、送受信手段(30)を介して外部処理装置(100)に送信する。
そして、送信した音声の特徴量に基づいて外部処理装置(100)において実行され、送信される音声認識結果を送受信手段(30)で受信し、受信した音声認識結果を用いる。
このように、車載端末装置(200)側で実行する音声認識の信頼度が高い場合には、その音声認識結果を用い、信頼度が低いときのみ外部処理装置(100)における音声認識結果を用いるので、車載端末装置(200)と外部処理装置(100)の送受信が減少する。つまり、外部処理装置(100)との通信品質の影響を少なくし、安価でレスポンスの速い、車両用音声認識システム(1)とすることができる。
ところで、音声認識に用いるソフトウエアには、例えば、POIの辞書などのように、機能や用いるデータが頻繁に更新される場合があり、音声認識の信頼度を上げるためには最新のものを使用することがよい。
そこで、請求項2に記載のように、車載端末装置(200)の音声認識手段(10)は、音声認識に用いるソフトウエアを、送受信手段(30)を介して外部処理装置(100)から取得するようにすると、最新のソフトウエアを取得して用いることができるので、音声認識の信頼度を向上させることができる。
ところで、車両に搭載されている車載端末装置(200)と外部処理装置(100)との間で送受信を行う場合、車両が高速で移動するため、送受信のエラーが発生する頻度が多くなり、その結果、通信速度が遅くなったりすることがある。
そこで、請求項3に記載のように、外部処理装置(100)は、車載端末装置(200)と同じ車両に搭載される車載処理装置(50)と地上に設置される地上処理装置(60)とで構成する。
そして、車載処理装置(50)は、車載端末装置(200)から送信された音声の特徴量を受信し、受信した特徴量に基づいて音声認識処理を実行し、その実行した音声認識結果を車載端末装置(200)に送信する。
また、地上処理装置(60)は、車載端末装置(200)以外に設置され、送信された音声の特徴量を受信し、受信した特徴量に基づいて音声認識処理を実行し、その実行した音声認識結果を送信する。
さらに、車載端末装置(200)の制御手段(10)は、送受信手段(30)を介して車載処理装置(50)と通信を行うことにより、車載処理装置(50)の存在を認識できるか否かを判定し、車載処理装置(50)の存在を認識できると判定された場合には、車載処理装置(50)から音声認識結果を受信する処理を行い、車載処理装置(50)の存在を認識できると判定されない場合には、地上処理装置(60)から音声認識結果を受信する処理を行うようにするとよい。
このように、外部処理装置(100)を車載処理装置(50)及び地上処理装置(60)で構成することによって外部処理装置(100)と車載端末装置(200)の間の通信状態の良否にかかわらず、より安定した音声認識を行うことができる。
つまり、車両に搭載している車載処理装置(50)と通信を行うことにより、車載処理装置(50)の存在を認識できる場合、例えば、車両に車載処理装置(50)が搭載されており、正常に作動しているような場合には、車載処理装置(50)に音声認識処理を実行させることができる。
この場合、車載処理装置(50)は車両に搭載されているので、車載端末装置(200)との間の通信状態は、車両の位置や車両の周辺状況によらずに安定したものとなるので、車両処理装置(50)において音声認識を安定して行うことができる。
一方、車載処理装置(50)の存在が認識できない場合、例えば、車両に車載処理装置(50)が搭載されていないような場合や車載処理装置(50)が正常に作動しないような場合には、地上処理装置(60)に音声認識処理を実行させることができる。
このように、外部処理装置(100)を車載処理装置(50)及び地上処理装置(60)で構成することによって、外部処理装置(100)と車載端末装置(200)の間の通信状態にかかわらず、より安定した音声認識を行うことができるのである。
ところで、車載処理装置(50)は車両に搭載するものであるが、車両に固定されておらず、請求項4に記載のように、車載処理装置(50)が可搬形であると、便利である。
つまり、例えば、車載処理装置(50)として送受信機能を有する可搬型のパーソナルコンピュータ(いわゆるノートパソコン)や、全部あるいは一部を取り外して持ち運びができるカーナビゲーション装置などを用いれば、それらの機器が本来備えている機能を有効に活用するとともに車載処理装置(50)としての機能を発揮させることができるので便利である。
また、車載処理装置(50)を可搬型にした場合、車載処理装置(50)が常に車室内にあると限らないような場合がある。そのような場合であっても、ノートパソコン等を車室内に持ち込んでいる場合には、地上処理装置(60)によらず、ノートパソコン等に音声認識を実行させ、その認識結果を用いることができるので、通信に時間を要することなく負荷の大きい音声認識処理を車載端末装置(200)に行わせることなく実行することができる。
逆に、ノートパソコン等を車室内に持ち込んでいない場合には、外部の地上処理装置(60)から音声認識結果を得ることができるので、負荷の大きい音声認識処理を車載端末装置(200)に行わせることなく実行することができる。
つまり、負荷の大きい音声認識処理を車載端末装置(200)に行わせることなく安定的に実行させることができる。
ところで、前述のように音声認識に用いるソフトウエアには、機能や用いるデータが頻繁に更新される場合がある。ところが、更新された機能やデータのうち常に最新のものを使う必要がない場合がある。
そこで、請求項5に記載のように、車載端末装置(200)の音声認識手段(10)は、音声認識に用いるソフトウエアのうち所定の更新条件を満たすものについては、送受信手段(30)を介して地上処理装置(60)から取得し、所定の更新条件を満たさないものについては、車載処理装置(50)から取得するようにするとよい。
このようにすると、音声認識ソフトウエアを必要な更新条件を有するものに保つことができる。以下説明する。
前述のように、音声認識に用いるソフトウエアには、機能や用いるデータが頻繁に更新される場合がある。そのような更新ソフトウエアは、例えばインターネット等を通じて自動的に蓄積するなどして、地上処理装置(60)に蓄積することが容易である。
そこで、所定の更新条件を満たす必要があるもの、例えば、更新されてから、車載端末装置(200)が取得しなければならない期間が短く設定されているようなソフトウエアについては、地上処理装置(60)から取得すると、更新条件を満たすソフトウエアが入手できる。
また、音声認識に用いるソフトウエアを更新するためには、請求項6に記載のようにしてもよい。つまり、外部処理装置(100)は、音声認識に用いるソフトウエアのうち所定の更新条件を満たす必要があるものについては、車載処理装置(50)が地上処理装置(60)から取得して蓄積するように構成し、車載端末装置(200)の音声認識手段(10)は、送受信手段(30)を介して車載処理装置(50)が地上処理装置(60)から取得した所定の更新条件を満たす必要があるソフトウエアを、車載処理装置(50)から取得するのである。
このようにすると、音声認識のためのソフトウエアを地上処理装置(60)から車載処理装置(50)に蓄積しておくことができるので、車載端末装置(200)と地上処理装置(60)との間の通信状態が悪い状態が続く場合であっても、車載端末装置(200)は、音声認識のためのソフトウエアを取得することができる。
また、ソフトウエアの更新を行う場合、車両が走行するため、通常状態が変化する。また、大容量のソフトウエアをダウンロードするような場合には通信料金が高くなるような場合がある。したがって、そのような通信条件によっては、地上処理装置(60)から常に更新ソフトウエアを取得できない場合がある。
そこで、請求項7に記載のように、車載端末装置(200)の制御手段(10)が、送受信手段(30)を介して地上処理装置(60)とのデータの送受信を行う際、所定の通信条件を確保できるか否かを判定する通信条件満足度判定手段(10)を備え、車載端末装置(200)の音声認識手段(10)は、通信条件満足度判定手段(10)により、通所定の通信条件を確保できないと判定された場合には、所定の更新条件を満たす必要があるソフトウエアであっても、車載処理装置(50)から取得するようにするとよい。
このようにすると、地上処理装置(60)との送受信を行う際、所定の通信条件を満たさない場合であっても、更新条件にできるだけ近いソフトウエアを車載処理装置(50)から取得することができるので、音声認識の質を可能な限り向上させることができる。
ところで、通信条件満足度判定手段(10)で判定する所定の通信条件には、種々のものが考えられる。そこで、請求項8に記載のように、通信条件満足度判定手段(10)は、地上処理装置(60)と車載端末装置(200)の間の所定時間内の通信負荷が所定の値よりも高い場合、地上処理装置(60)と車載端末装置(200)の間の所定時間内の通信料金が所定の額を超える場合、又は、送受信手段(30)を介して地上処理装置(60)から取得される地上処理装置(60)側の接続負荷が、所定の値より高い場合、の何れかの場合に所定の通信条件を満たさないと判定するようにするとよい。
このようにすると、地上処理装置(60)との通信条件を満足する場合のみ地上処理装置(60)からソフトウエアを取得することができ、通信条件を満足しない場合には、車載処理装置(50)からソフトウエアが取得される。
つまり、地上処理装置(60)側の負荷や通信料金などによって地上処理装置(60)からのソフトウエアの取得を制限できるので、大きな待ち時間や使用者側の料金的な負担を軽減することができる。
以下、本発明が適用された実施形態について図面を用いて説明する。なお、本発明の実施の形態は、下記の実施形態に何ら限定されることはなく、本発明の技術的範囲に属する限り種々の形態を採りうる。
[第1実施形態]
図1は、本発明が適用された車両用音声認識システム1の概略の構成を示すブロック図である。車両用音声認識システム1は、図1に示すように、外部処理装置100と車載端末装置200とから構成される。
外部処理装置100は、送信された音声の特徴量を受信し、受信した特徴量に基づいて音声認識処理を実行し、その実行した音声認識結果を送信ものであり、車載処理装置50と地上処理装置60とから構成されている。
車載処理装置50は、可搬型で、車載端末装置200と同じ車両に搭載され、車載端末装置200から送信された音声の特徴量を受信し、受信した特徴量に基づいて音声認識処理を実行し、その実行した音声認識結果を車載端末装置200に送信する。
地上処理装置60は、車載端末装置200以外に設置され、送信された音声の特徴量を受信し、受信した特徴量に基づいて音声認識処理を実行し、その実行した音声認識結果を送信する。
車載端末装置200は、音声処理部10、音声発生部20、送受信部30、マイク40及びスピーカ42を備えている。
音声処理部10は、図示しないCPU、ROM、RAM及びI/Oなどから構成されており、ROM及びRAMに格納されたプログラム及びデータ(音響モデル12、言語モデル14、基本認識辞書16、ユーザ認識辞書18)により、音声認識機能、信頼度判定機能、制御機能及び通信条件満足度判定機能を実行する。
音声認識機能は、マイク40で取得した使用者の音声の音声認識をするとともに、音声の情報を扱い安くするために信号処理された後の情報である音声の特徴量を抽出する。音声認識や音声の特徴量の抽出は公知の方法で実行される。
信頼度判定機能は、音声処理部10で実行した音声認識結果の信頼度を判定する。
制御機能は、音声認識結果を得るための制御を行うものであり、以下の(ア)〜(カ)の処理により実現される。
(ア)信頼度判定機能で判定された、音声認識結果の信頼度が所定の値より高いときは、音声認識機能で行った音声認識結果を用いる。
(イ)音声認識結果の信頼度が所定の値以下のときは、車載端末装置200の音声認識機能で抽出した音声の特徴量を、送受信部30を介して外部処理装置100に送信する。
(ウ)送信した音声の特徴量に基づいて外部処理装置100において実行され、送信される音声認識結果を送受信部30で受信し、受信した音声認識結果を用いる。
(エ)送受信部30を介して車載処理装置50と通信を行うことにより、車載処理装置50の存在を認識できるか否かを判定する。
(オ)車載処理装置50の存在を認識できると判定された場合には、車載処理装置50から音声認識結果を受信する処理を行う。
(カ)車載処理装置50の存在を認識できると判定されない場合には、地上処理装置60から音声認識結果を受信する処理を行う。
さらに、制御機能は、音声認識に用いるソフトウエアを、送受信部30を介して外部処理装置100から取得する機能を有しており、その機能は以下の(キ)及び(ク)の処理により実現される。
(キ)音声認識に用いるソフトウエアのうち所定の更新条件を満たす必要があるものについては、送受信部30を介して地上処理装置60から取得し、所定の更新条件を満たす必要がないものについては、車載処理装置50から取得する。
(ク)後述する通信条件満足度判定機能により、通信状態が所定の通信条件を確保できないと判定された場合には、所定の更新条件を満たすソフトウエアであっても、車載処理装置50から取得する。
通信条件満足度判定機能は、送受信部30を介して地上処理装置60とのデータの送受信を行う際、以下の(ケ)〜(サ)の何れかの場合に所定の通信条件を満たさないと判定する。
(ケ)地上処理装置60と車載端末装置200の間の所定時間内の通信負荷が所定の値よりも高い場合。
(コ)地上処理装置60と車載端末装置200の間の所定時間内の通信料金が所定の額を超える場合。
(サ)送受信部30を介して地上処理装置60から取得される地上処理装置60側の接続負荷が、所定の値より高い場合。
音声発生部20は、音声処理部10において実行される音声認識等の音声処理の結果を報知音や音声などにより使用者に伝達するためのものであり、音声処理部10からのディジタルデータをD/A変換し、増幅してスピーカ42に出力する。
マイク40は、使用者の発する声を取得するためのマイクであり、車室内の前部に使用者の声を入力できるように取り付けられている。また、スピーカ42は、音声発生部20からのアナログ信号により音を発生させるためのスピーカであり、車室内前部のコンソール内部に埋め込まれている。
送受信部30は、外部処理装置100とデータの送受信を行うものであり、データの変調及び増幅を行って電波として送信する送信機、受信した電波を増幅及び復調しデータを抽出する受信機及び電波を送受信するアンテナ32から構成される。
アンテナ32は、電波を外部処理装置100へ出力するためのものであり、ロッドアンテナ、ルーフアンテナあるいはフィルムアンテナといった自動車用アンテナである。
(音声処理)
次に、音声処理部10において実行される音声処理につき、図2に基づいて説明する。図2は音声処理の流れを示すフローチャートである。音声処理では、まずS100において、マイク40から使用者の音声が取得され、続くS105では、S100において取得された使用者の音声から、その特徴量が抽出される。
具体的には、取得された使用者の音声から、音響モデル12、言語モデル14、基本認識辞書16、ユーザ認識辞書18に基づいて、LPCケプストラム、メルケプストラムなどの音声の特徴量が抽出される。
続く、S110では、S105において抽出された使用者の音声の特徴量から、音声認識が実行され、特定の使用者の音声であるか否かが判定されるとともに、その信頼度が算出される。音声認識は、公知の音声認識処理で実行される。
ここで、「音声認識結果の信頼度」について説明すると、音声認識では、入力された音声が辞書に登録されている単語の中のどれと一番近いかを出力する。また、その際には相対的な確からしさが尤度という数値としてあらわされ、絶対値として認識結果の確からしさを表現することは困難である。
しかし、絶対的な確からしさが分かると音声認識システムとしては様々な利用法があるため、擬似的に絶対的な確からしさとする場合も多い。そこで、信頼度を第一位の尤度で正規化して第2位との差で表し、差が大きければ信頼度が高いとしたり、特定の単語などを基準にその基準との差が近ければ、信頼度が高いとしたりする。なお、信頼度の高低については、これ以外の公知な方法を用いてもよい。
続くS115では、S110において算出された信頼度が所定の値以上であるか否かが判定される。そして、信頼度が所定の値以上であると判定された場合(S115:Yes)、処理がS120へ移行され、信頼度が所定の値未満であると判定された場合(S115:No)、処理がS125へ移行される。
S125では、送受信部30を介して外部処理装置100のうち車載処理装置50とデータの送受信が行われる。この場合、送受信されるデータは、車載端末装置200と車載処理装置50の間のリンクができるか否かの確認を行うために送受信されるものであり、アルファベット1文字のデータでもよい。
続くS130では、S125において車載処理装置50とリンクができたか否か、つまり、データの送受信が正常にできたか否かが判定される。そして、データの送受信が正常にできたと判定された場合(S130:Yes)、処理がS135へ移行され、正常にできなかったと判定された場合(S130:No)、処理がS135へ移行される。
S135では、S105で抽出した特徴量が、送受信部30を介して車載処理装置50に送信され、続くS140では、車載処理装置50において得られた音声認識結果及びその信頼度が送受信部30を介して取得される。
続くS145では、S140において取得された信頼度が所定の値以上であるか否かが判定される。そして、信頼度が所定の値以上であると判定された場合(S145:Yes)、処理がS120へ移行され、信頼度が所定の値未満であると判定された場合(S145:No)、処理がS150へ移行される。
S150では、S105で抽出した特徴量が、送受信部30を介して地上処理装置60に送信され、続くS155では、地上処理装置60において得られた音声認識結果及びその信頼度が、送受信部30を介して取得され、その後処理がS120へ移行される。
S120では、音声認識結果が取得され、処理がS100へ戻され、音声処理が繰り返される。
(プログラム取得処理)
次に、音声処理部10において実行されるプログラム取得処理につき、図3に基づいて説明する。図3はプログラム取得処理の流れを示すフローチャートである。プログラム取得処理では、まずS200において、音声処理部10で実行されているプログラムやデータ(音響モデル12、言語モデル14、基本認識辞書16、ユーザ認識辞書18)の更新情報を取得する。
更新情報とは、ソフトウエアやデータのバージョンや更新期間、あるいは更新日などである。つまり、現在使用中のソフトウエアやデータのバーションは、何年何月何日に更新する必要がある、あるいは、更新することが望ましいといった情報や、何ヶ月毎に更新することが必要である、あるいは、望ましいといった情報である。
続くS205では、ソフトウエアやデータを更新する必要があるか否かが判定される。そして、更新する必要があると判定された場合(S205:Yes)、処理がS210へ移行され、更新する必要がないと判定された場合(S205:No)、処理が終了される。
S210では、送受信部30を介して地上処理装置60とデータが送受信される。この場合、送受信されるデータは、以下の(シ)〜(セ)の何れかである。
(シ)地上処理装置60と車載端末装置200の間の所定時間内の通信負荷
(ス)地上処理装置60と車載端末装置200の間の所定時間内の通信料金
(セ)地上処理装置60側の接続負荷
続く、S215では、S210において取得したデータに基づき、地上処理装置60からソフトウエアあるいはデータの取得が可能か否かが判定される。
つまり、所定時間内の通信負荷が所定の値より高いか否か(高い場合は取得不可)、所定時間内の通信料金が所定の値より高いか否か(高い場合は所得不可)、あるいは、地上処理装置60側の接続負荷が所定の値より高いか否か(高い場合は取得不可)が判定される。そして、取得可能と判定された場合(S215:Yes)、処理がS220へ移行され、取得不可能と判定された場合(S215:No)、処理がS225へ移行される。
S220では、送受信部30を介して地上処理装置60からソフトウエアあるいはデータ(音響モデル12、言語モデル14、基本認識辞書16、ユーザ認識辞書18)が取得され、取得後処理が終了される。また、S225では、送受信部30を介して車載処理装置50からソフトウエアあるいはデータが取得され、処理が終了される。
(車両用音声認識システム1の特徴)
以上の車両用音声認識システム1によれば、車載端末装置200において使用者の音声の音声認識を実行し、その音声認識結果の信頼度を判定して、信頼度が所定の値より高いときは、そのままその音声認識結果を用い、信頼度が所定の値以下のときは、音声処理部10で抽出した音声の特徴量を、送受信部30を介して外部処理装置100に送信する。
そして、送信した音声の特徴量に基づいて外部処理装置100において実行され、送信される音声認識結果を送受信部30で受信し、受信した音声認識結果を用いる。
このように、車載端末装置200側で実行する音声認識の信頼度が高い場合には、その音声認識結果を用い、信頼度が低いときのみ外部処理装置100における音声認識結果を用いるので、車載端末装置200と外部処理装置100の送受信が減少する。つまり、外部処理装置100との通信品質の影響を少なくし、安価でレスポンスの速い、車両用音声認識システム1とすることができる。
さらに、外部処理装置100を車両に搭載する可搬型の車載処理装置50と車両以外に設置する地上処理装置60とで構成し、車載処理装置50は、車載端末装置200から送信された音声の特徴量を受信し、受信した特徴量に基づいて音声認識処理を実行し、その実行した音声認識結果を車載端末装置200に送信する。
また、地上処理装置60は、車載端末装置200から送信された音声の特徴量を受信し、受信した特徴量に基づいて音声認識処理を実行し、その実行した音声認識結果を送信する。
さらに、車載端末装置200では、車載処理装置50と通信を行うことにより、車載処理装置50の存在を認識できるか否かを判定し、車載処理装置50の存在を認識できる場合には、車載処理装置50から音声認識結果を受信する処理を行い、車載処理装置50の存在を認識できない場合には、地上処理装置60から音声認識結果を受信する処理を行っている。
したがって、例えば、車載処理装置50として送受信機能を有するパーソナルコンピュータ(いわゆるノートパソコン)を用いた場合など、車載処理装置50が常に車室内にあると限らないような場合であっても、ノートパソコンを車室内に持ち込んでいる場合には、地上処理装置60によらず、ノートパソコンに音声認識を実行させ、その認識結果を用いることができるので、通信に時間を要することなく負荷の大きい音声認識処理を車載端末装置200に行わせることなく実行することができる。
逆に、ノートパソコンを車室内に持ち込んでいない場合には、外部の地上処理装置60から音声認識結果を得ることができるので、負荷の大きい音声認識処理を車載端末装置200に行わせることなく実行することができる。つまり、負荷の大きい音声認識処理を車載端末装置200に行わせることなく安定的に実行させることができる。
また、車載端末装置200は、音声認識に用いるソフトウエアやデータを、送受信部30を介して外部処理装置100から取得するようにしている。したがって、最新のソフトウエアやデータを取得して用いることができるので、音声認識の信頼度を向上させることができる。
その際、車載端末装置200は、音声認識に用いるソフトウエアのうち所定の更新条件を満たすものについては、送受信部30を介して地上処理装置60から取得し、所定の更新条件を満たさないものについては、車載処理装置50から取得している。
したがって、音声認識ソフトウエアを必要な更新条件を有するものに保つことができる。つまり、音声認識に用いるソフトウエアには、機能や用いるデータが頻繁に更新される場合がある。そのような更新ソフトウエアは、例えばインターネット等を通じて自動的に蓄積するなどして、地上処理装置60に蓄積することが容易である。
そこで、所定の更新条件を満たす必要があるもの、例えば、更新されてから、車載端末装置200が取得しなければならない期間が短く設定されているようなソフトウエアについては、地上処理装置60から取得すると、更新条件を満たすソフトウエアが入手できる。
一方、車載処理装置50については、可搬型であるため、そこに蓄積される更新ソフトウエアは、必ずしも地上処理装置60と同じ更新条件を満たしたものとは限らない。したがって、更新条件を満たす必要がないソフトウエアについては、車載処理装置50から取得できるようになっていると、地上処理装置60との通信状態がよくない場合、ソフトウエアの更新に緊急性を要しないような場合には、車載処理装置50から更新ソフトウエアを入手することができるので、便利である。
また、車載端末装置200が、送受信部30を介して地上処理装置60とのデータの送受信を行う際、地上処理装置60と車載端末装置200の間の所定時間内の通信負荷が所定の値よりも高い場合、地上処理装置60と車載端末装置200の間の所定時間内の通信料金が所定の額を超える場合、又は、送受信部30を介して地上処理装置60から取得される地上処理装置60側の接続負荷が、所定の値より高い場合、の何れかの場合には、所定の更新条件を満たす必要があるソフトウエアであっても、車載処理装置50から取得している。
したがって、地上処理装置60との送受信を行う際、所定の通信条件を満たさない場合であっても、更新条件にできるだけ近いソフトウエアを車載処理装置50から取得することができるので、音声認識の質を可能な限り向上させることができる。
つまり、地上処理装置60側の負荷や通信料金などによって地上処理装置60からのソフトウエアの取得を制限できるので、大きな待ち時間や使用者側の料金的な負担を軽減することができる。
[第2実施形態」
次に、図4に基づき第2実施形態について説明する。第1実施形態における車両用音声認識システム1では、車載端末装置200が音声認識のためのソフトウエアを車載装置50又は地上処理装置60から取得していたが、第2実施形態における車両用音声認識システム2では、車載端末装置200は、車載処理装置50から取得するようになっている。
車両用音声認識システム2は、図4に示すように、車載端末装置200の送受信部30と外部処理装置100の車載処理装置50とが有線で結合され、データが送受信される。また、外部処理装置100の車載処理装置50と地上処理装置60の間は無線によりデータが送受信される。これ以外の車両用音声認識システム2の構成は、車両用音声認識システム1の構成と同じであるので、説明は省略する。
そして、車載端末装置200の音声処理部10で実行されるプログラム取得処理(図3参照)では、S215の処理が行われず、つまり、S215においてソフトウエアを取得可能か否かを判定せず、処理がS225へ移行され、更新が必要なソフトウエアが車載処理装置50から取得される。
このようにすると、音声認識のためのソフトウエアを地上処理装置60から車載処理装置50に蓄積しておくことができるので、車載端末装置200と地上処理装置60との間の通信状態が悪い状態が続く場合であっても、車載端末装置200の音声認識のためのソフトウエアを取得することができる。
[その他の実施形態]
以上、本発明の実施形態について説明したが、本発明は、本実施形態に限定されるものではなく、種々の態様を採ることができる。
例えば、上記実施形態では、車載処理装置50をノートパソコンなどの可搬型の装置としたが、車載されているものであれば、カーナビゲーション装置などの車載用電子装置に組み込まれているものであってもよい。
車両用音声認識システム1の概略の構成を示すブロック図である。 音声処理部10において実行される音声処理音声処理の流れを示すフローチャートである。 音声処理部10において実行されるプログラム取得処理の流れを示すフローチャートである。 車両用音声認識システム2の概略の構成を示すブロック図である。
符号の説明
1,2…車両用音声認識システム、10…音声処理部、12…音響モデル、14…言語モデル、16…基本認識辞書、18…ユーザ認識辞書、20…音声発生部、30…送受信部、32…アンテナ、40…マイク、42…スピーカ、50…車載処理装置、60…地上処理装置、100…外部処理装置、200…車載端末装置。

Claims (8)

  1. 送信された音声の特徴量を受信し、受信した前記特徴量に基づいて音声認識処理を実行し、その実行した音声認識結果を送信する外部処理装置と、
    使用者の音声の音声認識を実行するとともに前記音声の特徴量を抽出する音声認識手段と、
    前記音声認識手段で実行した音声認識結果の信頼度を判定する信頼度判定手段と、
    前記外部処理装置とデータの送受信を行うための送受信手段と、
    音声認識結果を得るための制御を行う制御手段と、
    を有する車載端末装置と、
    を備え、
    前記制御手段は、
    前記車載端末装置の信頼度判定手段で判定された、音声認識結果の信頼度が所定の値より高いときは、前記音声認識手段で行った音声認識結果を用い、前記音声認識結果の信頼度が所定の値以下のときは、前記車載端末装置の音声認識手段で抽出した前記音声の特徴量を、前記送受信手段を介して前記外部処理装置に送信するとともに、前記送信した前記音声の特徴量に基づいて前記外部処理装置において実行され、送信される音声認識結果を前記送受信手段で受信し、前記受信した音声認識結果を用いることを特徴とする車両用音声認識システム。
  2. 請求項1に記載の車両用音声認識システムにおいて、
    前記車載端末装置の前記音声認識手段は、
    前記音声認識に用いるソフトウエアを、前記送受信手段を介して前記外部処理装置から取得することを特徴とする車両用音声認識システム。
  3. 請求項1又は請求項2に記載の車両用音声認識システムにおいて、
    前記外部処理装置は、
    前記車載端末装置と同じ車両に搭載され、前記車載端末装置から送信された音声の特徴量を受信し、受信した前記特徴量に基づいて音声認識処理を実行し、その実行した音声認識結果を前記車載端末装置に送信する車載処理装置と、
    地上に設置され、送信された音声の特徴量を受信し、受信した前記特徴量に基づいて音声認識処理を実行し、その実行した音声認識結果を送信する地上処理装置と、
    を備え、
    前記車載端末装置の制御手段は、
    前記送受信手段を介して前記車載処理装置と通信を行うことにより、前記車載処理装置の存在を認識できるか否かを判定し、前記車載処理装置の存在を認識できると判定された場合には、前記車載処理装置から前記音声認識結果を受信する処理を行い、前記車載処理装置の存在を認識できると判定されない場合には、前記地上処理装置から前記音声認識結果を受信する処理を行うことを特徴とする車両用音声認識システム。
  4. 請求項3に記載の車両用音声認識システムにおいて、
    前記車載処理装置は、可搬形であることを特徴とする車両用音声認識システム。
  5. 請求項3又は請求項4に記載の車両用音声認識システムにおいて、
    前記車載端末装置の前記音声認識手段は、
    前記音声認識に用いるソフトウエアのうち所定の更新条件を満たす必要があるものについては、前記送受信手段を介して前記地上処理装置から取得し、所定の更新条件を満たす必要がないものについては、前記車載処理装置から取得することを特徴とする車両用音声認識システム。
  6. 請求項3又は請求項4に記載の車両用音声認識システムにおいて、
    前記外部処理装置は、
    前記音声認識に用いるソフトウエアのうち所定の更新条件を満たす必要があるものについては、前記車載処理装置が前記地上処理装置から取得して蓄積するように構成され、
    前記車載端末装置の前記音声認識手段は、
    前記送受信手段を介して前記車載処理装置が前記地上処理装置から取得した前記所定の更新条件を満たす必要があるソフトウエアを、前記車載処理装置から取得することを特徴とする車両用音声認識システム。
  7. 請求項4〜請求項6の何れかに記載の車両用音声認識システムにおいて、
    前記車載端末装置の前記制御手段が、前記送受信手段を介して前記地上処理装置とのデータの送受信を行う際、所定の通信条件を確保できるか否かを判定する通信条件満足度判定手段を備え、
    前記車載端末装置の前記音声認識手段は、
    前記通信条件満足度判定手段により、通信状態が所定の通信条件を確保できないと判定された場合には、前記所定の更新条件を満たすソフトウエアであっても、前記車載処理装置から取得することを特徴とする車両用音声認識システム。
  8. 請求項7に記載の車両用音声認識システムにおいて、
    前記通信条件満足度判定手段は、
    前記地上処理装置と前記車載端末装置の間の所定時間内の通信負荷が所定の値よりも高い場合、前記地上処理装置と前記車載端末装置の間の所定時間内の通信料金が所定の額を超える場合、又は、前記送受信手段を介して前記地上処理装置から取得される前記地上処理装置側の接続負荷が、所定の値より高い場合、の何れかの場合に所定の通信条件を満たさないと判定することを特徴とする車両用音声認識システム。
JP2008142603A 2008-05-30 2008-05-30 車両用音声認識システム Pending JP2009288630A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008142603A JP2009288630A (ja) 2008-05-30 2008-05-30 車両用音声認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008142603A JP2009288630A (ja) 2008-05-30 2008-05-30 車両用音声認識システム

Publications (1)

Publication Number Publication Date
JP2009288630A true JP2009288630A (ja) 2009-12-10

Family

ID=41457877

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008142603A Pending JP2009288630A (ja) 2008-05-30 2008-05-30 車両用音声認識システム

Country Status (1)

Country Link
JP (1) JP2009288630A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012252026A (ja) * 2011-05-31 2012-12-20 Ntt Docomo Inc 音声認識装置、音声認識方法、及び音声認識プログラム
JP2013064777A (ja) * 2011-09-15 2013-04-11 Ntt Docomo Inc 端末装置、音声認識プログラム、音声認識方法および音声認識システム
JP2015141226A (ja) * 2014-01-27 2015-08-03 パイオニア株式会社 情報処理装置
JP2017097373A (ja) * 2010-06-24 2017-06-01 本田技研工業株式会社 音声認識処理のための方法、車載システム及び不揮発性記憶媒体
CN110556104A (zh) * 2018-06-04 2019-12-10 本田技研工业株式会社 语音识别装置、语音识别方法以及存储程序的存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175091A (ja) * 1997-12-05 1999-07-02 Nec Corp 電話回線用音声認識装置
JPH11338671A (ja) * 1998-05-21 1999-12-10 Alpine Electronics Inc 電子メールの受信メッセージ出力方法
JP2000075887A (ja) * 1998-08-31 2000-03-14 Sony Corp パターン認識装置、方法及びシステム
JP2001242888A (ja) * 2000-02-29 2001-09-07 Ricoh Co Ltd 音声認識システムおよび音声認識方法および記録媒体
JP2002044742A (ja) * 2000-07-28 2002-02-08 Omron Corp 車載制御装置の運用システム及び車載制御装置
JP2002049390A (ja) * 2000-08-04 2002-02-15 Asahi Kasei Corp 音声認識方法およびサーバならびに音声認識システム
JP2003044091A (ja) * 2001-07-31 2003-02-14 Ntt Docomo Inc 音声認識システム、携帯情報端末、音声情報処理装置、音声情報処理方法および音声情報処理プログラム
JP2004012653A (ja) * 2002-06-05 2004-01-15 Matsushita Electric Ind Co Ltd 音声認識システム、音声認識クライアント、音声認識サーバ、音声認識クライアントプログラムおよび音声認識サーバプログラム
JP2004184858A (ja) * 2002-12-05 2004-07-02 Omron Corp 音声認識サービス仲介システムと、それに用いる音声認識マスター参照方法、プログラム、およびそのプログラムを内蔵する記憶媒体
JP2004325688A (ja) * 2003-04-23 2004-11-18 Toyota Motor Corp 音声認識システム
JP2005349878A (ja) * 2004-06-08 2005-12-22 Fujitsu Ten Ltd ソフトウェア管理装置
JP2007033901A (ja) * 2005-07-27 2007-02-08 Nec Corp 音声認識システム、音声認識方法、および音声認識用プログラム
JP2007140194A (ja) * 2005-11-18 2007-06-07 Mitsubishi Electric Corp 番組検索装置および形態素辞書管理サーバ

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11175091A (ja) * 1997-12-05 1999-07-02 Nec Corp 電話回線用音声認識装置
JPH11338671A (ja) * 1998-05-21 1999-12-10 Alpine Electronics Inc 電子メールの受信メッセージ出力方法
JP2000075887A (ja) * 1998-08-31 2000-03-14 Sony Corp パターン認識装置、方法及びシステム
JP2001242888A (ja) * 2000-02-29 2001-09-07 Ricoh Co Ltd 音声認識システムおよび音声認識方法および記録媒体
JP2002044742A (ja) * 2000-07-28 2002-02-08 Omron Corp 車載制御装置の運用システム及び車載制御装置
JP2002049390A (ja) * 2000-08-04 2002-02-15 Asahi Kasei Corp 音声認識方法およびサーバならびに音声認識システム
JP2003044091A (ja) * 2001-07-31 2003-02-14 Ntt Docomo Inc 音声認識システム、携帯情報端末、音声情報処理装置、音声情報処理方法および音声情報処理プログラム
JP2004012653A (ja) * 2002-06-05 2004-01-15 Matsushita Electric Ind Co Ltd 音声認識システム、音声認識クライアント、音声認識サーバ、音声認識クライアントプログラムおよび音声認識サーバプログラム
JP2004184858A (ja) * 2002-12-05 2004-07-02 Omron Corp 音声認識サービス仲介システムと、それに用いる音声認識マスター参照方法、プログラム、およびそのプログラムを内蔵する記憶媒体
JP2004325688A (ja) * 2003-04-23 2004-11-18 Toyota Motor Corp 音声認識システム
JP2005349878A (ja) * 2004-06-08 2005-12-22 Fujitsu Ten Ltd ソフトウェア管理装置
JP2007033901A (ja) * 2005-07-27 2007-02-08 Nec Corp 音声認識システム、音声認識方法、および音声認識用プログラム
JP2007140194A (ja) * 2005-11-18 2007-06-07 Mitsubishi Electric Corp 番組検索装置および形態素辞書管理サーバ

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017097373A (ja) * 2010-06-24 2017-06-01 本田技研工業株式会社 音声認識処理のための方法、車載システム及び不揮発性記憶媒体
US20170169825A1 (en) * 2010-06-24 2017-06-15 Honda Motor Co., Ltd. Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system
US10269348B2 (en) 2010-06-24 2019-04-23 Honda Motor Co., Ltd. Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system
US10818286B2 (en) 2010-06-24 2020-10-27 Honda Motor Co., Ltd. Communication system and method between an on-vehicle voice recognition system and an off-vehicle voice recognition system
JP2012252026A (ja) * 2011-05-31 2012-12-20 Ntt Docomo Inc 音声認識装置、音声認識方法、及び音声認識プログラム
JP2013064777A (ja) * 2011-09-15 2013-04-11 Ntt Docomo Inc 端末装置、音声認識プログラム、音声認識方法および音声認識システム
JP2015141226A (ja) * 2014-01-27 2015-08-03 パイオニア株式会社 情報処理装置
CN110556104A (zh) * 2018-06-04 2019-12-10 本田技研工业株式会社 语音识别装置、语音识别方法以及存储程序的存储介质
US11164578B2 (en) * 2018-06-04 2021-11-02 Honda Motor Co., Ltd. Voice recognition apparatus, voice recognition method, and non-transitory computer-readable storage medium storing program
CN110556104B (zh) * 2018-06-04 2023-05-30 本田技研工业株式会社 语音识别装置、语音识别方法以及存储程序的存储介质

Similar Documents

Publication Publication Date Title
US10170111B2 (en) Adaptive infotainment system based on vehicle surrounding and driver mood and/or behavior
US7941189B2 (en) Communicating road noise control system, in-vehicle road noise controller, and server
JP2009288630A (ja) 車両用音声認識システム
US20110288871A1 (en) Information presentation system
US20100204987A1 (en) In-vehicle speech recognition device
US20140066132A1 (en) Vehicle communications using a mobile device
JP2007065347A (ja) 音声認識システム
US20090004968A1 (en) In-vehicle apparatus with radio transmission restricting function and radio transmission restricting system
US8892593B2 (en) In-vehicle communication system
US7298322B2 (en) Navigation device which switches the feed to an interface of a central processing unit between digital position information obtained with an internal antenna or digital position information obtained with an external antenna
JP2015074315A (ja) 車載中継装置及び車載通信システム
US7751796B2 (en) In-vehicle emergency report device
US9925867B2 (en) Fuel control regulator system with acoustic pliability
JP2018180409A (ja) 音声認識装置、ナビゲーション装置、音声認識システム、及び、音声認識方法
US20030220797A1 (en) Voice Recognition system preventing lowering performance
CN111128143B (zh) 驾驶辅助设备、车辆、驾驶辅助方法及存储程序的非暂时性存储介质
CN104575556A (zh) 智能车联网车载导航多媒体***
JP2019144831A (ja) 情報処理装置および情報処理方法
US20070099674A1 (en) Handsfree apparatus
JP2017181667A (ja) 音声認識装置および音声認識方法
JP2001513206A (ja) 車両ナビゲーションの助けとしてメモリを使用する方法
JP2007271378A (ja) 車載ナビゲーション装置
US20190228776A1 (en) Speech recognition device and speech recognition method
KR101073158B1 (ko) 이동 통신 단말기를 사용하는 차량용 제어 시스템 및 그제어 방법
US20150310851A1 (en) Method and Apparatus for Extra-Vehicular Voice Recognition Training Including Vehicular Updating

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20101108

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120110

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120508