JP4924652B2 - 音声認識装置及びカーナビゲーション装置 - Google Patents
音声認識装置及びカーナビゲーション装置 Download PDFInfo
- Publication number
- JP4924652B2 JP4924652B2 JP2009112777A JP2009112777A JP4924652B2 JP 4924652 B2 JP4924652 B2 JP 4924652B2 JP 2009112777 A JP2009112777 A JP 2009112777A JP 2009112777 A JP2009112777 A JP 2009112777A JP 4924652 B2 JP4924652 B2 JP 4924652B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- voice recognition
- volume
- voice
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Navigation (AREA)
Description
本実施例のカーナビゲーション装置1は、マイクロフォン3及び車載オーディオ機器5に接続された音声認識装置10と、CPUやメモリ41等を備えモニタ7の表示制御やその他の当該装置各部を統括制御する制御部40と、オーディオ機器5のスピーカSR,SLに接続され、制御部40からの指令信号に従って音声信号を生成しスピーカSR,SLに出力する音声生成部50と、を備える。
オーディオ機器本体部6は、スピーカSR,SLから出力される音響の音量を調節するための音量調節部6aを備えており、オーディオ機器本体部6組付の操作パネル(図示せず)や、カーナビゲーション装置1の制御部40から入力される指令信号に従って、音量調節部6aを制御し、スピーカSR,SLから出力される音響の音量を調節する。尚、オーディオ機器本体部6から出力される各チャンネルのオーディオ信号は、そのチャンネルに対応するスピーカSR,SLと、音声認識装置10に入力される。
尚、本実施例では、上記信号XM(t),XL(t),XR(t),UL(t),UR(t),U(t)の取り得る値が、−1以上1以下の実数であるとする。
音声認識部30は、制御部40から入力される動作開始指令信号に従い動作を開始し、オーディオキャンセラ20から所定期間音声信号U(t)を取得し、取得した所定期間分の音声信号U(t)を音響分析し、音声信号U(t)の特徴量(例えばケプストラム)を得る。尚、音声信号U(t)を取得する上記所定期間を、以下では、音声認識対象区間と表現する。
尚、γ’算出の際には、上記γと、P0(z)と、PUP及びPDOWNと、を変数にもつ所定の関数hが用いられる。但し、関数hは、値PUPと比較して値P0(z)が大きい場合に、γより小さい値をとり、値PDOWNと比較して値P0(z)が小さい場合に、γより大きい値をとり、また、値P0(z)が値PDOWN以上でかつ値PUP以下の場合に、γと同一の値をとるものである。具体的に説明すると、γ’は、例えば、次式に従って算出される。尚、εは予め適切に設定された正の実係数である。
例えば、上記実施例では、オーディオキャンセラ20で用いる非線形関数としてtanh関数、sign関数、式(4)に示す関数g(x)を挙げたが、その他の非線形関数を用いても構わない。
Claims (3)
- 音響の多チャンネル再生を行うオーディオ機器から各チャンネルのオーディオ信号を取得し、該各チャンネルのオーディオ信号に基づき、マイクロフォンから入力される音声信号から、前記オーディオ機器の再生音に関する雑音成分を除去する雑音除去装置と、
該雑音除去装置より得られる雑音除去後の音声信号に基づき、前記マイクロフォンに入力された音声を認識する音声認識手段と、
外部から音声認識開始指令が入力されると前記音声認識手段を作動させる制御手段と、
前記音声認識手段の動作時において、前記雑音除去装置から得られた前記雑音除去後の音声信号に基づき、利用者の発声音量に関する履歴情報を作成する履歴作成手段と、
該履歴作成手段により作成された前記履歴情報に基づいて、次回の音声認識時に前記オーディオ機器に対して設定すべき音量を決定する音量決定手段と、
を備え、
前記制御手段は、前記オーディオ機器の動作時に、前記音声認識開始指令が入力されると、前記オーディオ機器によって再生される音響の音量を、前記音量決定手段により決定された前記音量に変更した後、前記音声認識手段を作動させ、
前記音量決定手段は、前記履歴情報に基づいて、利用者の声の大小を評価し、その評価値が予め定められた評価基準値より小さい場合には、次回の音声認識時に前記オーディオ機器に対して設定すべき音量を、予め定められた基準値よりも大きい音量に決定すること
を特徴とする音声認識装置。 - 音響の多チャンネル再生を行うオーディオ機器から各チャンネルのオーディオ信号を取得し、該各チャンネルのオーディオ信号に基づき、マイクロフォンから入力される音声信号から、前記オーディオ機器の再生音に関する雑音成分を除去する雑音除去装置と、
該雑音除去装置より得られる雑音除去後の音声信号に基づき、前記マイクロフォンに入力された音声を認識する音声認識手段と、
外部から音声認識開始指令が入力されると前記音声認識手段を作動させる制御手段と、
前記音声認識手段の動作時において、前記雑音除去装置から得られた前記雑音除去後の音声信号に基づき、利用者の発声音量に関する履歴情報を作成する履歴作成手段と、
該履歴作成手段により作成された前記履歴情報に基づいて、次回の音声認識時に前記オーディオ機器に対して設定すべき音量を決定する音量決定手段と、
を備え、
前記制御手段は、前記オーディオ機器の動作時に、前記音声認識開始指令が入力されると、前記オーディオ機器によって再生される音響の音量を、前記音量決定手段により決定された前記音量に変更した後、前記音声認識手段を作動させ、
前記音量決定手段は、前記履歴情報に基づいて、利用者の声の大小を評価し、その評価値が予め定められた評価基準値より大きい場合には、次回の音声認識時に前記オーディオ機器に対して設定すべき音量を、予め定められた基準値よりも小さい音量に決定すること
を特徴とする音声認識装置。 - 請求項1又は請求項2に記載の音声認識装置を備えることを特徴とするカーナビゲーション装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009112777A JP4924652B2 (ja) | 2009-05-07 | 2009-05-07 | 音声認識装置及びカーナビゲーション装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009112777A JP4924652B2 (ja) | 2009-05-07 | 2009-05-07 | 音声認識装置及びカーナビゲーション装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004002387A Division JP4333369B2 (ja) | 2004-01-07 | 2004-01-07 | 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009169445A JP2009169445A (ja) | 2009-07-30 |
JP4924652B2 true JP4924652B2 (ja) | 2012-04-25 |
Family
ID=40970584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009112777A Expired - Fee Related JP4924652B2 (ja) | 2009-05-07 | 2009-05-07 | 音声認識装置及びカーナビゲーション装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4924652B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2553681A2 (en) * | 2010-03-30 | 2013-02-06 | NVOQ Incorporated | Dictation client feedback to facilitate audio quality |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0522779A (ja) * | 1991-07-09 | 1993-01-29 | Sony Corp | 音声認識遠隔制御装置 |
JP3407392B2 (ja) * | 1994-03-22 | 2003-05-19 | 松下電器産業株式会社 | ステレオエコーキャンセラ |
JP2000112499A (ja) * | 1998-10-02 | 2000-04-21 | Kenwood Corp | 音響機器 |
JP2000181500A (ja) * | 1998-12-15 | 2000-06-30 | Equos Research Co Ltd | 音声認識装置及びエ―ジェント装置 |
ES2269137T3 (es) * | 1999-05-25 | 2007-04-01 | British Telecommunications Public Limited Company | Cancelacion del eco acustico. |
JP2001236090A (ja) * | 2000-02-22 | 2001-08-31 | Alpine Electronics Inc | 音声入力装置 |
JP2002297186A (ja) * | 2001-03-30 | 2002-10-11 | Kddi Corp | 音声認識装置 |
JP2003249996A (ja) * | 2002-02-25 | 2003-09-05 | Kobe Steel Ltd | 音声信号入出力装置 |
JP2004037823A (ja) * | 2002-07-03 | 2004-02-05 | Sanyo Electric Co Ltd | 映像・音響機器の音量調整装置 |
-
2009
- 2009-05-07 JP JP2009112777A patent/JP4924652B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009169445A (ja) | 2009-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4333369B2 (ja) | 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置 | |
JP4283212B2 (ja) | 雑音除去装置、雑音除去プログラム、及び雑音除去方法 | |
CN109389990B (zh) | 加强语音的方法、***、车辆和介质 | |
US20200045166A1 (en) | Acoustic signal processing device, acoustic signal processing method, and hands-free communication device | |
CN111489750B (zh) | 声音处理设备和声音处理方法 | |
JP5649488B2 (ja) | 音声判別装置、音声判別方法および音声判別プログラム | |
JP2005084253A (ja) | 音響処理装置、方法、プログラム及び記憶媒体 | |
JP2008299221A (ja) | 発話検知装置 | |
MX2007015446A (es) | Mejora de lenguaje multi-sensorial utilizando un modelo de estado de lenguaje. | |
JP2005257817A (ja) | 雑音除去装置、方法、及びプログラム | |
JP4924652B2 (ja) | 音声認識装置及びカーナビゲーション装置 | |
JP6878776B2 (ja) | 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム | |
JP2000148200A (ja) | 音声入力装置 | |
JP2004198810A (ja) | 音声認識装置 | |
JP4464797B2 (ja) | 音声認識方法、この方法を実施する装置、プログラムおよびその記録媒体 | |
JP2007206603A (ja) | 音響モデルの作成方法 | |
JP2009031809A (ja) | 音声認識装置 | |
JP2007058237A (ja) | 雑音除去方法 | |
JP4608670B2 (ja) | 音声認識装置および音声認識方法 | |
JP4765394B2 (ja) | 音声対話装置 | |
JP4173978B2 (ja) | 雑音除去装置、及び、音声認識装置、並びに音声通信装置 | |
JP2010041188A (ja) | 音声認識装置 | |
JP2006084928A (ja) | 音声入力装置 | |
JP2008299341A (ja) | 雑音除去方法 | |
JP2023113171A (ja) | 音声処理装置、音声処理方法、音声処理プログラム、および音声処理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090507 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110825 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111102 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120110 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120123 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150217 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |