JP6594721B2 - 音声認識システム、ゲイン設定システム及びコンピュータプログラム - Google Patents
音声認識システム、ゲイン設定システム及びコンピュータプログラム Download PDFInfo
- Publication number
- JP6594721B2 JP6594721B2 JP2015189433A JP2015189433A JP6594721B2 JP 6594721 B2 JP6594721 B2 JP 6594721B2 JP 2015189433 A JP2015189433 A JP 2015189433A JP 2015189433 A JP2015189433 A JP 2015189433A JP 6594721 B2 JP6594721 B2 JP 6594721B2
- Authority
- JP
- Japan
- Prior art keywords
- gain
- control information
- gain control
- vehicle speed
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004590 computer program Methods 0.000 title description 2
- 238000001514 detection method Methods 0.000 claims description 41
- 238000010295 mobile communication Methods 0.000 claims description 31
- 230000005236 sound signal Effects 0.000 claims description 13
- 238000000034 method Methods 0.000 description 24
- 230000001276 controlling effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/3005—Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G3/00—Gain control in amplifiers or frequency changers
- H03G3/20—Automatic control
- H03G3/30—Automatic control in amplifiers having semiconductor devices
- H03G3/32—Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Control Of Amplification And Gain Control (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Navigation (AREA)
Description
まず、第1の実施形態について説明する。
図1に、本実施形態に係る車載システム100の構成を示す。
本第1実施形態に係る車載システム100は、自動車に搭載されるシステムであり、図示するように、音声入力装置1、音声入力装置1を入力に用いながらユーザに所定のサービスを提供するサービス提供装置2、自動車の車速を検出する車速検出部3を備えている。
図示するように、ゲインテーブル16は、車速とゲインとの対応を規定したテーブルである。より具体的には、ゲインテーブル16は、車速の範囲毎に対応して設けたエントリを有し、各エントリには対応する車速の範囲と、当該車速の範囲に対応するゲインとが登録されている。
すなわち、車速の範囲に対応するゲインの算出においては、まず、試験車両を各車速で走行させながら、音声認識エンジン14が検出した発話音声区間においてマイクロフォン11が出力した入力音声信号のピーク値と、当該発話音声区間において車速検出部3が検出した車速を収集する。
ここで、音声認識エンジン14が入力する入力音声データの音声を正しく受け付けることのできる音声の大きさの範囲である入力レンジの幅は固定である。一方、入力アンプ12のゲインGの大きさによって、音声認識エンジン14に入力する入力音声データの音声の大きさは変化する。よって、入力アンプ12のゲインGによって、音声認識エンジン14に入力レンジ内の音声の入力音声データとして入力することとなる、マイクロフォン11が出力する入力音声信号の音声の大きさの範囲は変化する。より具体的には、入力アンプ12のゲインGが大きくなるほど、音声認識エンジン14に入力レンジ内の入力音声データの音声として入力する、マイクロフォン11が出力する入力音声信号の音声の大きさの範囲は、より小さな大きさの音声の範囲となり、入力アンプ12のゲインGが小さくなるほど、音声認識エンジン14に入力レンジ内の入力音声データの音声として入力する、マイクロフォン11が出力する入力音声信号の音声の大きさの範囲は、より大きな大きさの音声の範囲となる。
なお、より高速な車速の範囲ほど、当該車速の範囲に対応するゲインは小さくなる。これは、自動車が高速となるほど車内騒音が大きくなること、及び、車内騒音が大きくなるほど、ユーザが、より大きな声で発話するようになるためである。
したがって、ゲインテーブル16は、各車載システム100の音声入力装置1について共通となる。
ただし、各種の車種の自動車を試験車両として用いて車種毎に対応して以上のようなゲインテーブル16を作成しておき、音声入力装置1のユーザへの引き渡し前に、当該音声入力装置1に、当該音声入力装置1が搭載される自動車の車種に対応するゲインテーブル16を、設定するようにしてもよい。
すなわち、ゲイン制御部17は、ユーザのトークスイッチ15の押し下げが発生したならば、車速検出部3が検出している自動車の車速を取得し、取得した車速が含まれる車速の範囲が登録されているゲインテーブル16のエントリに登録されているゲインを取得し、取得したゲインを入力アンプ12のゲインGとして設定する。
ここで、自動車が高速となるほど車内騒音が大きくなり、また、車内騒音が大きくなるほど、ユーザが、より大きな声で発話するようになるので、音声入力装置1に入力される音声の大きさは、自動車の車速と大きく相関する。
図4に本第2実施形態に係る車載システム100の構成を示す。
図示するように、本第2実施形態に係る車載システム100は、図1に示した車載システム100と、車両状態検出部4を備えている点と、ゲインテーブル16の内容と、ゲイン制御部17の入力アンプ12のゲインGの制御の内容のみが異なる。また、本第2実施形態では、サービス提供装置2としてナビゲーション装置を備えている。
図示するように、第2実施形態に係るゲインテーブル16は、車速の範囲と、自動車の窓の開閉状態と、トンネル内走行中の有無の状態と、ワイパーの動作中/停止中の状態との組み合わせと、ゲインとの対応を規定したテーブルである。
すなわち、試験車両を各車速で、自動車の窓の開閉状態やトンネル内走行中の有無の状態やワイパーの動作中/停止中の状態を変化させながら走行させると共に、当該走行中に音声認識エンジン14が検出した発話音声区間においてマイクロフォン11が出力した入力音声信号のピーク値と当該発話音声区間において車速検出部3が検出した車速を収集する。
すなわち、ゲイン制御部17は、ユーザのトークスイッチ15の押し下げが発生したならば、車速検出部3が検出している自動車の車速と、車両状態検出部4が検出している自動車の窓の開閉状態とワイパーの動作中/停止中の状態とを取得する。また、ナビゲーション装置に問い合わせることにより、現在自動車がトンネル内を走行中であるかどうかを識別する。
ここで、自動動車の窓の開閉状態やワイパーの動作中/停止中の状態やトンネル内の走行中の有無の状態も、車速と同様に車内騒音の大きさに関わるので、音声入力装置1に入力される音声の大きさとの相関が比較的大きい。よって、車速に加え、窓の開閉の状態やワイパーの動作状態やトンネル内走行の有無などにも応じて入力アンプ12のゲインを設定する本第2実施形態によれば、より適切なゲインを入力アンプ12に設定することができるようになる。なお、自動動車の窓の開状態のときには風音によって車内騒音が増加し、ワイパーの動作中は、降雨によって車内騒音が増加し、トンネル内の走行中はトンネル壁面の走行音の反射によって車内騒音が増加する。
図6に、第3実施形態に係る車載システム100の構成を示す。
図示するように、本第3実施形態に係る車載システム100は、音声入力装置1、音声入力装置1を入力に用いながら所定のサービスを提供するサービス提供装置2、自動車の車速を検出する車速検出部3、移動通信網を介した通信を行う移動通信装置5とを備えている。
ここで、図7aに、ゲイン情報サーバ200のゲインデータベース201の内容を示す。
図示するように、ゲインデータベース201には、自動車の車種毎に対応して設けられた車種毎ゲインデータが蓄積されている。各車種毎ゲインデータは、対応する車種を表す車種識別情報と、ゲインテーブルとを含んでいる。
まず、ピーク値報告処理について説明す。
音声認識エンジン14は発話音声区間を検出している期間中、ゲイン制御部17に発話区間信号を出力する。ゲイン制御部17は、ピーク値報告処理において、発話区間信号を受信したならば、現時点で車速検出部3が検出している車速を取得すると共に、現時点で入力アンプ12に設定しているゲインGの逆数1/Gを乗算器18に出力する。
次に、車載システム100のゲイン制御部17が行うゲインテーブル取得処理について説明する。
ゲイン制御部17は、ゲインテーブル取得処理において、定期的(たとえば、1日おきに)、移動通信装置5の移動通信を介して、ゲイン情報サーバ200のゲインデータ提供部203にアクセスし、車種データ20が示す自車の車種を表す車種識別情報を伴わせたゲインテーブル要求を発行する。
次に、車載システム100のゲイン制御部17が行うゲイン制御処理について説明する。
ゲイン制御部17は、ゲイン制御処理において、ユーザのトークスイッチ15の押し下げが発生したならば、車速検出部3が検出している自動車の車速を取得し、取得した車速が含まれる車速の範囲が登録されているゲインテーブル16のエントリに登録されているゲインを取得し、取得したゲインを入力アンプ12のゲインGとして設定する。
次に、ゲイン情報サーバ200のゲインデータ生成部202は、車載システム100のゲイン制御部17からピーク値報告データを受信したならば、受信したピーク値報告データを保存する。
このような第3実施形態では、ゲイン情報サーバ200において、各自動車における実際の音声入力装置1への音声入力の大きさと車速との関係に基づいてゲインテーブル16を作成することができる。また、自動車に搭載された音声入力装置1は、ゲイン情報サーバ200からゲインテーブル16を取得し、取得したゲインテーブル16に従って、車速に応じたゲインを入力アンプ12に設定する。よって、ユーザの音声入力装置1の使用開始直後から適切なゲインを入力アンプ12に設定することができるようになる。
Claims (2)
- 自動車に搭載される音声認識システムと、当該音声認識システムが移動通信を介してアクセス可能なサーバとより構成されるゲイン設定システムであって、
前記サーバは、
自動車の車速とゲインとの対応が登録されたゲイン制御情報を格納したゲイン制御情報格納部と、
当該サーバにアクセスした前記音声認識システムに前記ゲイン制御情報格納部に格納されている前記ゲイン制御情報を提供するゲイン制御情報提供部とを有し、
前記音声認識システムは、
前記移動通信を行う移動通信装置と、
入力音声を、入力音声信号に変換し出力するマイクロフォンと、
前記マイクロフォンが出力する入力音声信号を増幅する、ゲインが可変な入力アンプと、
前記入力ゲインアンプで増幅された入力音声信号が表す音声の音声認識を行う音声認識部と、
前記自動車の車速を検出する車速検出部と、
記憶部と、
前記サーバに前記移動通信を介してアクセスし、前記サーバから前記ゲイン制御情報を取得して前記記憶部に記憶するゲイン制御情報取得部と、
前記車速検出部が検出した車速を取得し、取得した車速に対応するゲインとして前記記憶部に記憶されているゲイン制御情報に登録されているゲインに、前記入力アンプのゲインを制御するゲイン制御部とを有し、かつ、
前記サーバは、
前記ゲイン制御情報格納部に格納する前記ゲイン制御情報を管理するゲイン制御情報管理部を有し、
前記音声認識システムは、
前記マイクロフォンが出力する入力音声信号のピーク値を検出するピーク値検出部と、
前記音声認識部が音声認識を行っている期間中に前記ピーク値検出部が検出したピーク値と、前記車速検出部が検出した当該ピーク値が検出されたときの車速とを含めたピーク値情報を、前記移動通信を介してゲイン制御情報管理部に送信するピーク値情報報告部とを有し、
前記ゲイン制御情報管理部は、受信したピーク値情報に基づいて、各車速の範囲について、当該車速の範囲内の車速を含む前記ピーク値情報に含まれていたピーク値の度数分布を求めると共に、当該度数分布における、当該ゲインで増幅した場合に大きさが前記音声認識部の入力レンジ内の大きさとなるピーク値の度数が最大となるゲインを、当該車速の範囲に対応するゲインとして登録した前記ゲイン制御情報を生成し、前記ゲイン制御情報格納部に格納することを特徴とするゲイン設定システム。 - 自動車に搭載される音声認識システムと、当該音声認識システムが移動通信を介してアクセス可能なサーバとより構成されるゲイン設定システムであって、
前記サーバは、
自動車の車速とゲインとの対応が登録されたゲイン制御情報を格納したゲイン制御情報格納部と、
当該サーバにアクセスした前記音声認識システムに前記ゲイン制御情報格納部に格納されている前記ゲイン制御情報を提供するゲイン制御情報提供部とを有し、
前記音声認識システムは、
前記移動通信を行う移動通信装置と、
入力音声を、入力音声信号に変換し出力するマイクロフォンと、
前記マイクロフォンが出力する入力音声信号を増幅する、ゲインが可変な入力アンプと、
前記入力ゲインアンプで増幅された入力音声信号が表す音声の音声認識を行う音声認識部と、
前記自動車の車速を検出する車速検出部と、
記憶部と、
前記サーバに前記移動通信を介してアクセスし、前記サーバから前記ゲイン制御情報を取得して前記記憶部に記憶するゲイン制御情報取得部と、
前記車速検出部が検出した車速を取得し、取得した車速に対応するゲインとして前記記憶部に記憶されているゲイン制御情報に登録されているゲインに、前記入力アンプのゲインを制御するゲイン制御部とを有し、かつ、
前記ゲイン制御情報格納部には、各車種用のゲイン制御情報が格納されており、
前記ゲイン制御情報取得部は、前記サーバから当該音声認識システムが搭載されている前記自動車の車種用の前記ゲイン制御情報を取得して前記記憶部に記憶し、
前記各車種用のゲイン制御情報は、当該車種の自動車の車速とゲインとの対応が登録されており、
前記サーバは、
前記ゲイン制御情報格納部に格納する前記ゲイン制御情報を管理するゲイン制御情報管理部を有し、
前記音声認識システムは、
前記マイクロフォンが出力する入力音声信号のピーク値を検出するピーク値検出部と、
前記音声認識部が音声認識を行っている期間中に前記ピーク値検出部が検出したピーク値と、前記車速検出部が検出した当該ピーク値が検出されたときの車速と、当該音声認識システムが搭載されている自動車の車種とを含めたピーク値情報を、前記移動通信を介してゲイン制御情報管理部に送信するピーク値情報報告部とを有し、
前記ゲイン制御情報管理部は、
受信したピーク値情報に基づいて、各車種毎に、各車速の範囲について、当該車種と当該車速の範囲内の車速を含む前記ピーク値情報に含まれていたピーク値の度数分布を求めると共に、当該度数分布における、当該ゲインで増幅した場合に大きさが前記音声認識部の入力レンジ内の大きさとなるピーク値の度数が最大となるゲインを、当該車速の範囲に対応するゲインとして登録した当該車種用の前記ゲイン制御情報を生成し、前記ゲイン制御情報格納部に格納することを特徴とするゲイン設定システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015189433A JP6594721B2 (ja) | 2015-09-28 | 2015-09-28 | 音声認識システム、ゲイン設定システム及びコンピュータプログラム |
US15/221,027 US10319393B2 (en) | 2015-09-28 | 2016-07-27 | Speech recognition system and gain setting system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015189433A JP6594721B2 (ja) | 2015-09-28 | 2015-09-28 | 音声認識システム、ゲイン設定システム及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017067812A JP2017067812A (ja) | 2017-04-06 |
JP6594721B2 true JP6594721B2 (ja) | 2019-10-23 |
Family
ID=58406602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015189433A Active JP6594721B2 (ja) | 2015-09-28 | 2015-09-28 | 音声認識システム、ゲイン設定システム及びコンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10319393B2 (ja) |
JP (1) | JP6594721B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3479378B1 (en) * | 2016-07-04 | 2023-05-24 | Harman Becker Automotive Systems GmbH | Automatic correction of loudness level in audio signals containing speech signals |
US11206001B2 (en) | 2017-09-27 | 2021-12-21 | Dolby International Ab | Inference and correction of automatic gain compensation |
US11437015B2 (en) * | 2018-06-12 | 2022-09-06 | Harman International Industries, Incorporated | System and method for adaptive magnitude vehicle sound synthesis |
CN109671448B (zh) * | 2018-12-29 | 2021-05-18 | 联想(北京)有限公司 | 一种数据处理方法及装置 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3350106B2 (ja) * | 1992-08-20 | 2002-11-25 | 株式会社リコー | 音声認識装置 |
JP2002314637A (ja) * | 2001-04-09 | 2002-10-25 | Denso Corp | 雑音低減装置 |
JP4352790B2 (ja) * | 2002-10-31 | 2009-10-28 | セイコーエプソン株式会社 | 音響モデル作成方法および音声認識装置ならびに音声認識装置を有する乗り物 |
JP4587941B2 (ja) * | 2005-11-18 | 2010-11-24 | アルパイン株式会社 | 音声補正システムおよびこれに用いる適応フィルタ |
JP4950672B2 (ja) * | 2007-01-09 | 2012-06-13 | 本田技研工業株式会社 | 磁歪式トルクセンサの製造方法、及び、電動パワーステアリングシステム |
JP5614767B2 (ja) * | 2009-04-14 | 2014-10-29 | アルパイン株式会社 | 音声処理装置 |
JP5672770B2 (ja) * | 2010-05-19 | 2015-02-18 | 富士通株式会社 | マイクロホンアレイ装置及び前記マイクロホンアレイ装置が実行するプログラム |
JP5457293B2 (ja) | 2010-07-14 | 2014-04-02 | アルパイン株式会社 | 音声認識装置 |
-
2015
- 2015-09-28 JP JP2015189433A patent/JP6594721B2/ja active Active
-
2016
- 2016-07-27 US US15/221,027 patent/US10319393B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20170092289A1 (en) | 2017-03-30 |
US10319393B2 (en) | 2019-06-11 |
JP2017067812A (ja) | 2017-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6594721B2 (ja) | 音声認識システム、ゲイン設定システム及びコンピュータプログラム | |
US11120650B2 (en) | Method and system for sending vehicle health report | |
US9558739B2 (en) | Methods and systems for adapting a speech system based on user competance | |
CN104954420B (zh) | 可变报告速率远程信息处理 | |
US20160063773A1 (en) | Apparatus and System for Generating Emergency Vehicle Record Data | |
US10990703B2 (en) | Cloud-configurable diagnostics via application permissions control | |
JP6011584B2 (ja) | 音声認識装置及び音声認識システム | |
CN108140294B (zh) | 车辆内部触觉输出 | |
CN104516449A (zh) | 车辆用装置、服务器和信息处理方法 | |
US20140136214A1 (en) | Adaptation methods and systems for speech systems | |
US8115616B2 (en) | Garage door alert employing a global positioning system | |
WO2016014970A1 (en) | Text rule based multi-accent speech recognition with single acoustic model and automatic accent detection | |
US20150274180A1 (en) | Workload estimation for mobile device feature integration | |
CN108986819B (zh) | 用于车辆自动语音识别错误检测的***和方法 | |
CN104603871A (zh) | 用于运行车辆用的语音控制的信息***的方法和设备 | |
CN106156036B (zh) | 一种车载音频处理方法及车载设备 | |
CN112026732A (zh) | 预增压控制方法、装置、车辆及存储介质 | |
US10468017B2 (en) | System and method for understanding standard language and dialects | |
US20140365030A1 (en) | Driving behaviour monitoring systems | |
US10951590B2 (en) | User anonymity through data swapping | |
US11557275B2 (en) | Voice system and voice output method of moving machine | |
CN111261149B (zh) | 语音信息识别方法和装置 | |
CN111768794A (zh) | 一种语音降噪方法、语音降噪***、设备及存储介质 | |
CN108806682B (zh) | 获取天气信息的方法和装置 | |
JP7434016B2 (ja) | 起動語登録の支援方法、支援装置、音声認識装置、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180308 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190116 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190129 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190326 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190611 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190805 |
|
A911 | Transfer of reconsideration by examiner before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20190828 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190917 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190925 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6594721 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |