JP2001228893A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2001228893A
JP2001228893A JP2000041086A JP2000041086A JP2001228893A JP 2001228893 A JP2001228893 A JP 2001228893A JP 2000041086 A JP2000041086 A JP 2000041086A JP 2000041086 A JP2000041086 A JP 2000041086A JP 2001228893 A JP2001228893 A JP 2001228893A
Authority
JP
Japan
Prior art keywords
signal
gain
power
noise
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000041086A
Other languages
English (en)
Inventor
Takeo Kanamori
丈郎 金森
Yoshihisa Nakato
良久 中藤
Takeshi Kawamura
岳 河村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000041086A priority Critical patent/JP2001228893A/ja
Publication of JP2001228893A publication Critical patent/JP2001228893A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 雑音環境下における音声認識性能を、低処理
量で改善できる音声認識装置を実現すること。 【解決手段】 音声認識手段100の前段処理として、
入力信号を帯域分割する帯域分割手段10を設け、低域
側と高域側に分割する。第1及び第2の信号パワ推定手
段21,22で各帯域の信号パワを推定し、第1及び第
2の雑音パワ推定手段31,32で雑音パワを推定す
る。第1及び第2の利得算出手段41,42は最適利得
を演算し、第1及び第2の信号増幅手段51,52の増
幅率を制御する。信号加算手段60は信号増幅手段5
1,52の出力信号を加算し、音声認識手段100に与
える。こうすると、少ない帯域分割数で雑音による音声
スペクトルの歪みを補正することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声認識の耐雑音
性能を向上させるために前処理装置を設けた音声認識装
置に関する。
【0002】
【従来の技術】マイクロホンを介して音声信号を音声認
識装置に入力して音声認識を行うとき、高い認識率を得
る条件の1つは、雑音の少ない高S/Nの音声信号を入
力することである。高S/Nを得るために、通常は接話
マイクロホンを用い、話者の口元にマイクロホンに接近
させて使用する。しかし用途によっては、マイクロホン
が話者の位置から数10cm〜数m離れた位置に設けら
れる場合がある。例えばマイクロホンが機器に内蔵され
ていたり、アーム又はスタンドに固定されている状態
で、話者自身が移動したり、話者が座っている状態で頭
部を左右又は上下に向けると、口元とマイクロホンとの
間隔が大幅に変動する。このような場合、マイクロホン
に収音される音声信号は絶対レベルが変動すると共に、
周囲騒音レベルに対して音声のレベルが相対的に低くな
り、所謂S/Nが劣化する。
【0003】一方、音声認識部は、雑音のない環境で収
録された音声のスペクトルに関する辞書を持ち、照合に
よって認識結果を出している。従って、マイクロホンへ
の雑音成分が混入すると、音声認識部で音声スペクトル
の照合不一致を起こし、認識結果に悪影響を及ぼしてし
まう。
【0004】このような問題点の解決策として、音声認
識の認識辞書側に予め雑音を想定したものを持つ方法
や、マイクロホンからの出力信号を信号処理によって雑
音抑圧する方法などが提案されている。ここでは、マイ
クロホンからの出力信号に信号処理を施し、音声認識の
耐雑音性能を向上させる音声認識装置について述べる。
【0005】先ずこのような音声認識前処理装置の構成
について説明する。図13は音声認識前処理装置を有す
る従来例の音声認識装置の構成図である。周波数領域変
換手段1000は、入力音響信号(以下、入力信号とい
う)を周波数領域に変換するもので、変換にはフーリエ
変換手段(FFT)などが用いられる。音声検出手段1
001は、入力信号が音声区間であるか否かを検出し
て、検出結果を出力するものである。
【0006】雑音スペクトル推定手段1002は、周波
数領域変換手段1000からの出力信号と、音声検出手
段1001からの出力信号とを入力し、入力信号が音声
区間でないときのパワスペクトルを平均して、平均雑音
パワスペクトルを推定するものである。スペクトル減算
部1003は、周波数領域変換手段1000からの出力
信号と、雑音スペクトル推定手段1002からの出力信
号を入力して、入力信号スペクトルから雑音スペクトル
を引き去り、雑音を抑圧した音声スペクトルを合成する
ものである。時間領域変換手段1004は、スペクトル
減算部1003からの音声スペクトルを時間領域に変換
して時間波形を出力し、音声認識手段1005に出力す
るものである。音声認識手段1005は雑音成分の低減
された音声信号を入力し、話者の発声した単語又はメッ
セージの内容を識別するものである。
【0007】このような音声認識装置の動作について説
明する。この処理は、一般にスペクトル減算法と呼ばれ
る定常的雑音の抑圧手法を用いたものであり、定常的な
雑音と音声信号が混ざり合った入力信号から、音声信号
のみを取り出す方式である。まず、入力信号xは、1フ
レーム分(数msec〜数10msec)を処理単位として周波
数領域変換手段1000に入力され、信号スペクトルX
(ω)に変換される。ここでX(ω)は複素数のベクト
ルとなる。音声検出手段1001では、例えば入力信号
のレベル変化を監視していて、レベルが低く一定である
部分を雑音区間と判定し、ある閾値よりレベルが大きく
なる場合を音声区間などと判定して音声区間を検出す
る。
【0008】雑音スペクトル推定手段1002は、音声
検出手段1001が雑音区間であると判定したとき、周
波数領域変換手段1000の出力X(ω)から入力信号
パワスペクトルを平均化して、定常雑音パワスペクトル
Np(ω)を推定する。スペクトル減算部1003は、
入力信号スペクトルX(ω)からパワスペクトルXp
(ω)を計算し、推定音声パワスペクトルSp(ω)を
Sp(ω)=Xp(ω)−Np(ω)の演算により算出
する。そして入力信号スペクトルX(ω)の位相情報P
x(ω)と、Sp(ω)の平方根である推定音声スペク
トル振幅Sa(ω)から、推定音声スペクトルS(ω)
を合成する。
【0009】時間領域変換手段1004は、推定音声ス
ペクトルS(ω)の時間領域信号への変換を行い、雑音
成分の抑圧された音声信号を出力する。スペクトル減算
部1003において、入力信号スペクトルX(ω)から
雑音パワスペクトルNp(ω)を減算することによって
雑音が除去できるのは、2つの信号が互いに独立である
とし、2つの信号が混ざり合った信号の平均パワが、夫
々の信号の平均パワの加算値で近似できることに基づい
ている。
【0010】
【発明が解決しようとする課題】しかしながら、上記の
ような構成では、周波数スペクトルの導出や音声検出な
どの処理が必要となり、その処理量が大きくなり、コス
ト的にも問題が生じる。処理量を大きくしている要因と
して、性能を得るためにある程度の周波数分解能を必要
とすることが1つの原因であり、具体的にはFFTなど
の周波数領域変換手段1000や、IFFTなどで実現
される時間領域変換手段1004の処理が大きくなるこ
とである。また、雑音パワスペクトル推定のために音声
検出手段1001も必要となる。このための雑音抑圧処
理は、音声認識手段の処理量に対して無視することので
きない大きな処理量となる。例えば、サンプリング周波
数を8kHzとし、周波数領域変換手段1000に64
ポイントのFFTを用いた場合、DSP(digital sign
al processer)を用いて処理をすると、約10〜20MI
PS程度の演算量を要する。
【0011】従来例では、定常的な雑音を抑圧して聴感
において音声品質を向上させることにより、音声認識率
の向上を期待することができる。しかし、低処理量で改
善効果の大きい音声認識装置を実現することはできなか
った。
【0012】本発明は、このような従来の問題点に鑑み
てなされたものであって、入力信号を複数帯域に分割
し、各帯域の信号を雑音レベルと信号レベルの割合に応
じて適応的に利得制御し、利得制御された各帯域の出力
信号を再合成し、スペクトルの全体の傾斜を補正するこ
とにより、音声認識の耐雑音性能を高めた音声認識装置
を実現することを目的とする。
【0013】
【課題を解決するための手段】本願の請求項1の発明
は、入力音声に混入した雑音成分によって変形した音響
信号に対して、信号スペクトルの形状を補正して音声認
識を行う音声認識装置であって、入力音響信号をn個の
帯域に分割する帯域分割手段と、前記帯域分割手段によ
ってn分割された周波数帯域の音響信号を入力し、制御
利得に基づいて音響信号の増幅又は減衰を行う第1〜第
nの信号増幅手段と、前記帯域分割手段からの出力信号
のレベルに応じて前記制御利得を演算し、前記第1〜第
nの信号増幅手段の利得を制御する第1〜第nの利得制
御手段と、前記第1〜第nの信号増幅手段からの出力信
号を加算し、雑音成分の低減された音声信号を出力する
信号加算手段と、前記信号加算手段から出力された音声
信号を入力し、音声認識を行う音声認識手段と、を具備
することを特徴とするものである。
【0014】本願の請求項2の発明は、請求項1の音声
認識装置において、前記利得制御手段は、前記帯域分割
手段で分割された帯域信号を入力し、短時間平均パワを
出力する信号パワ推定手段と、前記信号パワ推定手段か
らの出力信号を入力し、信号の雑音パワを推定する雑音
パワ推定手段と、前記信号パワ推定手段の出力信号と前
記雑音パワ推定手段の出力信号とを入力し、入力信号パ
ワと雑音パワの割合に応じた利得量となるように前記利
得制御手段の制御利得を算出する利得算出手段と、を有
し、前記利得算出手段は、制御利得をai とし、信号パ
ワをPXi (i=1〜n)とし、雑音パワをPNi とす
るとき、前記制御利得をai =(PXi−PNi )/P
i により算出することを特徴とするものである。
【0015】本願の請求項3の発明は、請求項1の音声
認識装置において、前記利得制御手段は、前記帯域分割
手段で分割された帯域信号を入力し、短時間平均パワを
出力する信号パワ推定手段と、前記信号パワ推定手段か
らの出力信号を入力し、信号の雑音成分パワを推定する
雑音パワ推定手段と、前記信号パワ推定手段の出力信号
と前記雑音パワ推定手段の出力信号とを入力し、入力信
号パワと雑音パワの割合に応じた利得量となるように前
記利得制御手段の制御利得を算出する利得算出手段と、
を有し、前記利得算出手段は、制御利得をai とし、信
号パワをPXi(i=1〜n)とし、雑音パワをPNi
とし、利得制御範囲パラメータをBi (0<Bi )とす
るとき、前記制御利得をai =(PXi −Bi ×PN
i )/PX i により算出することを特徴とするものであ
る。
【0016】本願の請求項4の発明は、請求項1の音声
認識装置において、前記利得制御手段は、前記帯域分割
手段で分割された帯域信号を入力し、短時間平均パワを
出力する信号パワ推定手段と、前記信号パワ推定手段か
らの出力信号を入力し、信号の雑音パワを推定する雑音
パワ推定手段と、前記信号パワ推定手段の出力信号と前
記雑音パワ推定手段の出力信号とを入力し、入力信号パ
ワと雑音パワの割合に応じた利得量となるように前記利
得制御手段の制御利得を算出する利得算出手段と、を有
し、前記利得算出手段は、制御利得をai とし、信号パ
ワをPXi (i=1〜n)とし、雑音パワをPNi
し、利得制御範囲パラメータをBi (0<Bi )、Ci
(0<Ci )とするとき、前記制御利得をai =(PX
i −Bi ×PNi )/PXi +Ci により算出すること
を特徴とするものである。
【0017】本願の請求項5の発明は、請求項1の音声
認識装置において、前記利得制御手段は、前記帯域分割
手段で分割された帯域信号を入力し、短時間平均パワを
出力する信号パワ推定手段と、前記信号パワ推定手段か
らの出力信号を入力し、信号の雑音パワを推定する雑音
パワ推定手段と、前記信号パワ推定手段の出力信号と前
記雑音パワ推定手段の出力信号とを入力し、入力信号パ
ワと雑音パワの割合に応じた利得量となるように前記利
得制御手段の制御利得を算出する利得算出手段と、を有
し、前記利得算出手段は、制御利得をai とし、信号パ
ワをPXi とし、雑音パワをPNi (i=1〜n)と
し、利得制御範囲パラメータをBi (0<Bi )、Di
(0<Di )とするとき、前記制御利得をai =(PX
i −Bi ×PNi +Di )/(PXi +Di )により算
出することを特徴とするものである。
【0018】本願の請求項6の発明は、請求項3〜5い
ずれか1項の音声認識装置において、入力音響信号の信
号S/Nを推定する信号S/N推定手段を更に設け、前
記第1〜第nの利得制御手段の制御利得に対して、前記
信号S/N推定手段で推定されたS/Nが高いときは利
得の可変範囲を小さく、S/Nが低いときは利得の可変
範囲を大きくすることを特徴とするものである。
【0019】本願の請求項7の発明は、請求項6の音声
認識装置において、前記信号S/N推定手段は、入力信
号レベルの単位時間内の最大値を出力するマックスホー
ルド手段と、入力信号レベルの単位時間内の最小値を出
力するミニマムホールド手段と、前記マックスホールド
手段の出力Pmax 及び前記ミニマムホールド手段の出力
min を入力し、2つの入力の比(Pmin /Pmax )又
は差(Pmax −Pmin)に基づいて利得制御範囲パラメ
ータBi を生成し、前記利得制御手段に与えるパラメー
タ化手段と、を有することを特徴とするものである。
【0020】本願の請求項8の発明は、請求項6又は請
求項7の音声認識装置において、信号S/N推定手段
は、前記帯域分割手段で分割された各帯域毎に独立に設
けたことを特徴とするものである。
【0021】本願の請求項9の発明は、請求項1〜8い
ずれか1項の音声認識装置において、前記帯域分割手段
は、帯域分割数が2であることを特徴とするものであ
る。
【0022】本願の請求項10の発明は、請求項9の音
声認識装置において、前記帯域分割手段は、クロスオー
バー周波数が350Hz〜500Hの間に設定されるこ
とを特徴とするものである。
【0023】本願の請求項11の発明は、請求項9の音
声認識装置において、低域側の利得制御手段を第1の利
得制御手段とし、高域側の利得制御手段を第2の利得制
御手段とするとき、前記第1の利得制御手段の利得制御
範囲の方が、前記第2の利得制御手段の利得制御範囲よ
り大きいことを特徴とするものである。
【0024】本願の請求項12の発明は、請求項11の
音声認識装置において、前記第1の利得制御手段が制御
する利得制御範囲が15dB以下であることを特徴とす
るものである。
【0025】
【発明の実施の形態】以下、本発明の各実施の形態の音
声認識装置について、図面を参照しつつ説明する。
【0026】(実施の形態1)本発明の実施の形態1に
おける音声認識装置について、図1〜図7を用いて説明
する。図1は本実施の形態の音声認識装置の全体構成を
示すブロック図である。この音声認識装置には、入力信
号を2つ以上の周波数帯に分割する帯域分割手段10が
設けられる。音声信号と雑音信号とを含む信号を音響信
号と呼ぶと、ここでは、マイクロホンによって入力され
た音響信号を2つの帯域を分割した場合について説明す
る。第1の帯域とは音声周波数帯の低域側を意味し、第
2の帯域とは音声周波数帯域の高域側を意味する。両者
の境界をクロスオーバー周波数という。
【0027】先ず第1の帯域の構成要素について説明す
る。第1の信号パワ推定手段21は、帯域分割手段10
から第1の帯域に分割された音響信号を入力して、信号
パワの短時間平均を算出するものである。第1の雑音パ
ワ推定手段31は、第1の信号パワ推定手段21からの
出力信号を入力して、音声の発声されていない区間の信
号、即ち雑音のみの区間のパワを推定するものである。
【0028】第1の信号パワ推定手段21からの出力信
号をPX1 とし、第1の雑音パワ推定手段31の出力信
号をPN1 とする。第1の利得算出手段41は、信号P
1と、信号PN1 とを入力し、利得a1 を制御利得と
して決定し、第1の信号増幅手段51に与えるものであ
る。第1の信号増幅手段51は、帯域分割手段10から
の第1の帯域に分割された音響信号を入力して、所定の
制御利得で増幅又は減衰して出力するものである。ここ
で第1の信号パワ推定手段21、第1の雑音パワ推定手
段31、第1の利得算出手段41は、帯域分割手段10
からの出力信号のレベルに応じて制御利得を演算し、第
1の信号増幅手段51の増幅又は減衰率を制御する第1
の利得制御手段を構成している。
【0029】第2の帯域の構成要素についても同様であ
る。即ち、第2の信号パワ推定手段22は、帯域分割手
段10から第2の帯域に分割された音響信号を入力し
て、信号パワの短時間平均を算出するものである。第2
の雑音パワ推定手段32は、第2の信号パワ推定手段2
2からの出力信号を入力して、音声の発声されていない
区間の信号、即ち雑音のみの区間のパワを推定するもの
である。
【0030】第2の信号パワ推定手段22からの出力信
号をPX2 とし、第2の雑音パワ推定手段32の出力信
号をPN2 とする。第2の利得算出手段42は、信号P
2と、信号PN2 とを入力し、利得a2 を決定し、第
2の信号増幅手段52に与えるものである。第2の信号
増幅手段52は、帯域分割手段10からの第2の帯域に
分割された音響信号を入力して、所定の制御利得で増幅
又は減衰して出力するものである。ここでも第2の信号
パワ推定手段22、第2の雑音パワ推定手段32、第2
の利得算出手段42は、帯域分割手段10からの出力信
号のレベルに応じて制御利得を演算し、第2の信号増幅
手段52の増幅又は減衰率を制御する第2の利得制御手
段を構成している。信号加算手段60は、第1と第2の
信号増幅手段51,52からの出力信号を加算して音声
認識手段100に雑音成分の低減された音声信号を与え
るものである。
【0031】このように構成された音声認識装置の動作
について説明する。入力信号として話者からの音声信号
に周囲の定常的な雑音が混入した音響信号を考える。こ
れは実環境下でのマイクロホンに入力される信号を想定
するもので、周囲騒音のレベルや、話者からマイクロホ
ンまでの距離などによって、そのS/N値は様々に変化
する。
【0032】まず、入力信号xは、帯域分割手段10に
入力されと、低域側と高域側の2つの周波数帯域に分割
される。帯域分割手段10からの低域側の出力信号を第
1の帯域信号x1 とし、高域側の出力信号を第2の帯域
信号x2 とする。第1及び第2の帯域信号x1 、x2
は、夫々第1及び第2の信号パワ推定手段21,22に
入力され、信号パワの短時間平均に変換される。
【0033】図2(a)は、第1及び第2の信号パワ推
定手段21,22の構成例を示すブロック図である。こ
の回路は自乗演算手段211とLPF212とにより構
成される。自乗演算手段211はサンプルポイント毎に
信号xi (iは帯域番号)を自乗して出力する。そした
後段のLPF212は自乗演算手段211の出力信号を
平滑化し、信号パワの短時間平均値PXi を出力する。
【0034】図2(b)は、信号パワ推定手段21への
入力信号xi の波形例を示す。ここでは定常雑音、即ち
音声信号のパワ変動に比較してパワ変動量が十分小さい
雑音が、音声信号に重畳されている場合の波形を示す。
図2(c)は、図2(a)の構成の信号パワ推定手段2
1の出力する信号パワの短時間平均値(以下では信号パ
ワという)PXi の波形例を示す。図2の(b)と
(c)とを比較して判るように、入力信号xi のレベル
に応じて信号パワPXi が大きく変動する(ただし、i
=1,2)。
【0035】次に、第1及び第2の信号パワ推定手段2
1,22からの出力信号PX1 ,PX2 は、夫々第1及
び第2の雑音パワ推定手段31,32に入力され、雑音
パワが推定される。第1及び第2の雑音パワ推定手段の
機能を低処理量で実現する方法としてミニマムホールド
手段を用いるものがある。この方法では、音声検出器が
無くても定常雑音のレベルを検出することができる。
【0036】図3(a)は、ミニマムホールドを実現す
るための演算フローを示す。先ずステップS1で信号パ
ワPXi を入力する。次のステップS2では、信号パワ
PX i と、前回検出された雑音成分のパワ(以下では、
単に雑音パワという)PNiの大小を比較する。PXi
>PNiならステップS3に分岐し、PXi ≦PNiな
らステップS4に分岐する。ステップS3では前回得ら
れたPNiに微小値αを加え、新たなPNiとする。ま
たステップS4では前回得られたPNiを新たに入力さ
れたPXi の値に置き換える。こうすると、ステップS
5で現フレームの雑音パワPNiが得られる。
【0037】このようなミニマムホールド手段を用いた
第1及び第2の雑音パワ推定手段31,32からの出力
信号は、図3(b)のように入力信号PXi の最低レベ
ルを保持した雑音パワPNi として出力される。このよ
うにして、PXi はi番目の帯域の信号パワ、PNi
i番目の帯域の雑音パワとなる。
【0038】次に、第1の利得算出手段41では、第1
の信号パワ推定手段21の出力信号PX1 と、第1の雑
音パワ推定手段31の出力信号PN1 とを入力して、第
1の信号増幅手段51の利得a1 を算出する。同様に第
2の利得算出手段42では、第2の信号パワ推定手段2
2の出力信号PX2 と、第2の雑音パワ推定手段32の
出力信号PN2 とを入力して、第2の信号増幅手段52
の利得a2 を算出する。利得a1 ,a2 の決定方法は、
例えば下記の(1)式、(2)式、(3)式、又は
(4)式のいずれかを用いて行うことができる。
【数1】 ただし、i=1,2
【数2】 ただし、Bi はai の変化範囲を制限する利得制御範囲
パラメータ 0≦Bi ,i=1,2
【数3】 ただし、Bi とCi はai の変化範囲を制限する利得制
御範囲パラメータ 0≦Bi ,0≦Ci ,i=1,2
【数4】 ただし、Bi とDi はai の変化範囲を制限する利得制
御範囲パラメータ 0≦Bi ,0≦Di ,i=1,2
【0039】図4(a)は、(3)式の信号処理を実現
する機能ブロック図である。この場合の利得算出手段4
1,42は、信号増幅手段411、信号加算手段41
2、信号除算手段413、信号乗算手段414、信号加
算手段415、信号増幅手段416で構成することがで
きる。各信号の流れは(3)式の演算手順に準じる。即
ち信号加算手段412と信号除算手段413とにPXi
が入力され、信号増幅手段411にPNi が入力され
る。信号増幅手段411は信号PNi を、後述する利得
制御範囲パラメータである増幅率Bi で増幅し、信号P
i ×Bi を出力する。信号加算手段412は、信号P
i から信号PNi ×Bi を減算し、信号(PXi −P
i ×Bi )を出力する。信号除算手段413は信号1
/|PXi |を演算し、信号乗算手段414に与える。
信号乗算手段414は信号加算手段412の出力と信号
除算手段413の出力とを乗算し、信号(PXi −PN
i ×B i )/|PXi |を出力する。信号加算手段41
5は信号乗算手段414の出力に利得制御範囲パラメー
タCi を加算し、[(PXi −PNi ×Bi )/|PX
i |+Ci ]を出力する。信号増幅手段416は信号加
算手段415の出力を(1+Ci )で除算し、(3)式
の値を出力する。ここで、(3)式において、B i
1、Ci =0としたものが(1)式であり、Ci =0と
したものが(2)式となる。
【0040】図4(b)は、図3(b)に示される信号
パワPXi と雑音パワPNi とが図4(a)の利得算出
手段に入力されたときの出力利得ai の応答波形であ
る。図4(b)において、 波形b0 は、Bi =1,Ci =0の状態、(1)式に相
当 波形b1 は、Bi =0,Ci =0.5の状態、 波形b2 は、Bi =0.5,Ci =0の状態、(2)式
に相当 波形b3 は、Bi =0.5,Ci =0.5の状態を示し
ている。
【0041】(3)式では、Bi をゼロに近づけるほど
出力利得ai の変化範囲(減衰量)が制限され、Ci
大きいほど出力ai の変化範囲(減衰量)が制限される
ことになる。
【0042】図5は(4)式の信号処理を実現する機能
ブロック図である。図4(a)との違いは、信号増幅手
段416が削除され、信号加算手段417が追加された
ことである。この回路の信号の流れは(4)式の演算手
順に準じ、構成の説明省略する。(3)式の場合と同様
に利得制御範囲パラメータDi を大きくするほど出力利
得ai の変化範囲(減衰量)を制限することができる。
【0043】次に、第1及び第2の利得算出手段41,
42で算出された利得a1 ,a2 に基づいて、第1及び
第2の信号増幅手段51,52が信号x1 、x2 を夫々
増幅する。信号加算手段60はa1 ×x1 とa2 ×x2
とを加算する。こうして信号加算手段60から出力され
た信号は、雑音成分により変化したスペクトルの傾斜や
レベルが補正され、雑音成分の少ない音声信号に変換さ
れる。この音声信号は後段の音声認識手段100に入力
される。音声認識手段100では、雑音による変形が取
り除かれた音声のスペクトルが得られるため、音声認識
率を向上させることができる。
【0044】図6(a)は定常雑音に音声信号が重畳さ
れた入力信号xの波形を示している。図6(b)は、図
6(a)の時刻t1 における信号スペクトルを模式的に
表したもので、横軸が周波数、縦軸がパワである。今、
低域側の信号パワがPX1 、雑音パワがPN1 、高域側
の信号パワがPX2 、雑音パワがPN2 であるとする。
定常雑音信号と音声信号が互いに独立な信号であるとす
れば、短時間平均信号パワPSi は(5)式で近似され
る。
【数5】 よって、図6(b)の斜線部分が音声スペクトル成分と
なり、その下の部分が雑音スペクトル成分となる。
【0045】ここで、例えば(1)式によって利得ai
を決定することで、信号加算手段60の出力信号は斜線
部のスペクトルを取り出したものとなる。また、図6
(c)は、図6(a)の時刻t2 における信号スペクト
ルを模式的に表したものであり、(b)と同様の形式で
表示している。定常雑音成分は時間的に変化が少ない雑
音であり、時刻t1 でも時刻t2 でも同様のスペクトル
を持つが、音声信号は時々刻々と変化しているため、図
6(b)から図6(c)へと変化する。上記構成は、こ
の音声信号の時間変化に応じて利得ai を変化させるこ
とができ、結果として、定常雑音成分を取り除いた音声
信号を得ることができる。
【0046】実際には回路規模などの問題で帯域分割数
は可能な限り小さい方が良い。しかし最小の帯域分割数
である2帯域では、理想的に雑音成分の影響を完全に取
り除くことはできない。これは図6の(b)や(c)の
スペクトルのように、雑音スペクトルや音声スペクトル
が直線では表現できないことによる誤差があること、雑
音パワPNi の推定には必ず誤差が生じること、また
(5)式は近似式であることなどに起因している。誤差
を持つ状態で(1)式による利得決定を行った場合、音
声信号成分の欠落が生じることがあり、逆に音声認識結
果を劣化させることになる。そこで、誤差の発生を予め
考慮して、利得決定における利得ai の変化範囲に制限
を設けることで、2帯域の分割数でも雑音環境下での音
声認識率を改善することができる。
【0047】図7は、(3)式において、B1 =0.
8,B2 =0.8、C1 =0.25,C2 =0.5とし
たときの音声認識実験結果を示し、横軸を入力信号のS
/N(dB)とし、縦軸を音声認識率(%)とする。こ
の実験では、雑音を自動車走行中の雑音とし、話者は6
名、認識対象用の単語数は100とした。実施の形態1
の特性では、入力信号S/Nが約10dB以下の雑音状
況下で、発声単語の認識性能をかなり改善できることが
判る。
【0048】尚、本実施の形態では、帯域分割手段10
における帯域分割数を2としたが、分割数を3以上にす
ると、より高い効果が得られる。
【0049】(実施の形態2)次に本発明の実施の形態
2における音声認識装置について、図8〜図11を用い
て説明する。図8は本実施の形態の音声認識装置の全体
構成を示すブロック図である。この音声認識装置には、
帯域分割手段10、第1及び第2の信号パワ推定手段2
1,22、第1及び第2の雑音パワ推定手段31,3
2、第1及び第2の利得算出手段41,42、第1及び
第2の信号増幅手段51,52、信号加算手段60、音
声認識手段100が設けられていることは、実施の形態
1の場合と同様であり、それらの説明は省略する。
【0050】実施の形態1の構成要素に加えて、本実施
の形態では信号S/N推定手段80が設けられる。信号
S/N推定手段80は、入力信号xのS/Nを推定し、
第1の利得算出手段41及び第2の利得算出手段42の
利得a1 ,a2 の可変範囲を、入力信号のS/Nが高い
ときには可変範囲を小さく、入力信号のS/Nが低いと
きには可変範囲を大きくするように制御するものであ
る。
【0051】このような構成の音声認識装置の動作につ
いて説明する。実施の形態1では、第1及び第2の利得
算出手段41,42で算出される利得ai の可変範囲を
(3)式のBi とCi とに固定値を与えて制限した。こ
の方法では、認識率の改善効果はある限られたS/Nの
範囲になり、図7の結果の例では、S/Nが11dB以
上の入力信号に対しては、逆に認識性能を劣化されてし
まう。実験的に求めた結果からは、S/Nが悪いとき
に、利得ai の変化範囲を大きくした方が改善率が大き
く得られ、S/Nが良いときには利得ai の変化範囲を
小さくした方が良好な結果が得られる。これは、S/N
が悪いときには、音声認識率を劣化させている主たる要
因が雑音であるため、雑音の影響を取り除く度合いを大
きくした方が良い結果となることを意味する。
【0052】一方、S/Nが良いときには、雑音による
音声認識率の劣化分より、処理によって利得ai が変動
することによる波形歪みの影響が強くなる。これが高S
/N時の認識率劣化につながる。このような理由から、
本実施の形態では、信号S/N推定手段80において、
定常雑音区間のS/Nが悪い場合、(3)式のBi の最
大値を1に制限し、音声区間で雑音成分が少ないような
S/Nの良いときには、Bi の最小値を0.5になるよ
うに制御する。即ち、0.5≦Bi ≦1の範囲でBi
値を適応的に変化させる。
【0053】図9は、信号S/N推定手段80の構成例
を示すブロック図である。信号パワ推定手段801は、
信号x0 を入力し、短時間平均パワに変換された信号P
0を出力する。ミニマムホールド手段802は、信号
パワ推定手段801からの出力信号PX0 を入力し、定
常雑音パワレベルに対応する最小値として出力信号Pmi
n を出力する。マックスホールド手段803は、信号パ
ワ推定手段801からの出力信号PX0 を入力し、信号
パワのピーク値に対応する出力信号Pmax を出力する。
パラメータ化手段804は、例えば(6)式を用いて利
得制御範囲パラメータBを決定する。
【数6】
【0054】(6)式によれば、入力信号x0 のS/N
が悪いとき、Pmin がPmax ほぼ等しい状態になるた
め、Bは1.0に近づく。逆に入力信号x0 のS/Nが
良いとき、Pmin <<Pmax となり、Bは0.5に近づ
く。このようにして、入力信号のS/Nに応じたBの値
が0.5≦B≦1.0の範囲で得られる。これを第1及
び第2の利得算出手段41,42における(3)式のB
i に代入することで、最適の制御が行える。
【0055】このようにして、実施の形態1に対して入
力信号S/Nの適用範囲が拡大し、認識率も大幅に向上
する。図10は本実施の形態による音声認識の実験の結
果を示す説明図である。図7と比較すると、本実施の形
態では、低S/Nから高S/Nまでの全S/N範囲に渡
って認識率を更に改善されることが判る。また、本実施
の形態において、帯域分割手段の帯域分割数が2のと
き、クロスオーバー周波数は、音声の重要な周波数成分
が存在する200Hz〜2kHzの間の値に設定するの
がよい。好ましくは350〜500Hzが良い。図11
は、帯域分割手段10のクロスオーバー周波数を変化さ
せた場合の音声認識率を示した説明図である。この結果
から、クロスオーバー周波数は350Hz〜500Hz
に最適値があることが判る。
【0056】また、実施の形態1及び2において、第1
及び第2の利得算出手段41,42における(3)式の
定数Ci として、低域側の定数をC1 =0.25とし、
高域側の定数C2 =0.5としたが、これを第1及び第
2の信号増幅手段51,52での利得変化範囲に換算す
ると、低域側が14dB、高域側が9.5dBとなる。
実験的にはこの数値が最適値となっており、信号に与え
る波形歪みの観点から、減衰量はこれより小さくしてお
くことが望ましい。
【0057】一般的に環境騒音は、低域成分の方がパワ
が大きい。従って、スペクトル傾斜補正の観点から、低
域側の補正量を大きく取る必要があり、前記のように高
域側より低域側の利得変化範囲を大きくすることが望ま
しい。この場合、第1の利得制御手段の利得制御範囲
を、第2の利得制御手段の利得制御範囲より大きくす
る。
【0058】尚、本実施の形態における信号S/N推定
手段80での信号パワ推定手段801では、パワでなく
振幅値を求めるなど、レベルを表す出力で代用すること
もできる。
【0059】(実施の形態3)次に本発明の実施の形態
3における音声認識装置について、図12を用いて説明
する。図12は本実施の形態の音声認識装置の全体構成
を示すブロック図である。この音声認識装置には、帯域
分割手段10、第1及び第2の信号パワ推定手段21,
22、第1及び第2の雑音パワ推定手段31,32、第
1及び第2の利得算出手段41,42、第1及び第2の
信号増幅手段51,52、信号加算手段60、音声認識
手段100が設けられていることは、実施の形態1と同
様である。
【0060】実施の形態1と異なる部分は、第1の信号
帯域処理系に第1のマックスホールド手段71と第1の
帯域S/Nパラメータ化手段81とを設け、第2の信号
帯域処理系に第2のマックスホールド手段72と第2の
帯域S/Nパラメータ化手段82とを設けたことであ
る。
【0061】第1のマックスホールド手段71は、第1
の信号パワ推定手段21からの出力信号PX1 を入力
し、その単位時間内の最大値Pmax1を出力するものであ
る。第1の帯域S/Nパラメータ化手段81は、第1の
マックスホールド手段71からの出力信号Pmax1と、第
1の雑音パワ推定手段31からの出力信号PN1 を入力
し、第1の利得算出手段41に対する利得変化範囲を制
限するパラメータB1 を出力するものである。第2の信
号帯域処理系における第2のマックスホールド手段7
2、第2の帯域S/Nパラメータ化手段82について
も、第1の信号帯域処理系のものと同一である。
【0062】このような構成の音声認識装置の動作につ
いて説明する。実施の形態3は、実施の形態2における
信号S/N推定手段80に相当する機能を、帯域分割手
段10からの各帯域出力毎に設けた構成としている。即
ち、図9の信号パワ推定手段801を図12の第1及び
第2の信号パワ推定手段21,22で置き換え、図9の
ミニマムホールド手段802を図12の第1及び第2の
雑音パワ推定手段31,32で置き換え、図9のマック
スホールド手段803を図12の第1及び第2のマック
スホールド手段71,72で置き換え、図9のパラメー
タ化手段804を図12の第1及び第2の帯域S/Nパ
ラメータ化手段81,82で置き換えたものである。
【0063】第1及び第2の帯域S/Nパラメータ化手
段81,82の動作や、第1及び第の利得算出手段4
1,42の動作は、実施の形態2と場合と機能的には同
様である。実施の形態3では、第1及び第2の帯域S/
Nパラメータ化手段81,82によって、各周波数帯域
毎に利得変化範囲の制限の調整が行えるようになる。こ
のため利得の最適化の自由度が高まり、音声認識装置と
しての性能の改善が見込めるものとなる。
【0064】
【発明の効果】本願発明の音声認識装置によれば、周囲
騒音とレベルや周波数成分に応じて入力信号のレベルや
周波数特性を、音声信号成分が雑音の無い環境のものに
近づくように適応的に変化させることにより、音声認識
手段での認識性能を改善することができる。
【0065】特に請求項3,4,5の発明によれば、第
1〜第nの信号増幅手段における利得の変化範囲を制御
することが可能となり、音声認識手段に対する最適化が
行え、音声認識性能を改善することができる。
【0066】特に請求項6,7,8の発明によれば、入
力信号の音声信号レベル対雑音信号レベル(S/N)の
状態に応じて、第1〜第nの信号増幅手段における利得
の変化範囲を自動的に最適値に制御できるようになり、
様々な使用環境での音声認識性能を改善することができ
る。
【0067】特に請求項9の発明によれば、本願の最小
処理規模となる2帯域の分割で、認識率改善の効果が得
られ、処理量削減の面で効果が得られる。
【0068】特に請求項10,11,12の発明によれ
ば、より少ない帯域分割数で音声認識率を向上すること
ができる。
【図面の簡単な説明】
【図1】本発明の実施の形態1における音声認識装置の
全体構成を示すブロック図である。
【図2】(a)は実施の形態1の音声認識装置における
信号パワ推定手段の構成例を示すブロック図、(b)は
実施の形態1の音声認識装置における信号パワ推定手段
への入力信号の波形図、(c)は実施の形態1の音声認
識装置における信号パワ推定手段の応答例である。
【図3】(a)は実施の形態1の音声認識装置における
雑音パワ推定手段の構成例を示すブロック図、(b)は
実施の形態1の音声認識装置における雑音パワ推定手段
の応答例である。
【図4】(a)は実施の形態1の音声認識装置における
利得算出手段の構成例(その1)を示すブロック図、
(b)は実施の形態1の音声認識装置における利得算出
手段の応答例である。
【図5】実施の形態1の音声認識装置における利得算出
手段の構成例(その2)を示すブロック図である。
【図6】(a)は実施の形態1の音声認識装置における
入力信号の波形例であり、(b)は入力信号の時刻t1
における信号スペクトル図であり、(c)は入力信号の
時刻t2 における信号スペクトル図である。
【図7】実施の形態1の音声認識装置における音声認識
率の改善効果を示す特性図である。
【図8】本発明の実施の形態2における音声認識装置の
全体構成を示すブロック図である。
【図9】実施の形態2の音声認識装置における信号S/
N推定手段の構成例を示すブロック図である。
【図10】実施の形態2の音声認識装置における音声認
識率の改善効果を示す特性図である。
【図11】実施の形態1の音声認識装置における音声認
識率と帯域分割手段のクロスオーバー周波数との関係を
示す説明図である。
【図12】本発明の実施の形態3における音声認識装置
の全体構成を示すブロック図である。
【図13】従来例の音声認識装置の全体構成を示すブロ
ック図である。
【符号の説明】
10 帯域分割手段 21 第1の信号パワ推定手段 22 第2の信号パワ推定手段 31 第1の雑音パワ推定手段 32 第2の雑音パワ推定手段 41 第1の利得算出手段 42 第2の利得算出手段 51 第1の信号増幅手段 52 第2の信号増幅手段 60 信号加算手段 71 第1のマックスホールド手段 72 第2のマックスホールド手段 80 信号S/N推定手段 81 第1の帯域S/Nパラメータ化手段 82 第2の帯域S/Nパラメータ化手段 100 音声認識手段 211 自乗演算手段 212 LPF 411,416 信号増幅手段 412,415 信号加算手段 413 信号除算手段 414 信号乗算手段 801 信号パワ推定手段 802 ミニマムホールド手段 803 マックスホールド手段 804 パラメータ化手段
───────────────────────────────────────────────────── フロントページの続き (72)発明者 河村 岳 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5D015 EE05 9A001 FF05 GG05 HH17

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 入力音声に混入した雑音成分によって変
    形した音響信号に対して、信号スペクトルの形状を補正
    して音声認識を行う音声認識装置であって、 入力音響信号をn個の帯域に分割する帯域分割手段と、 前記帯域分割手段によってn分割された周波数帯域の音
    響信号を入力し、制御利得に基づいて音響信号の増幅又
    は減衰を行う第1〜第nの信号増幅手段と、 前記帯域分割手段からの出力信号のレベルに応じて前記
    制御利得を演算し、前記第1〜第nの信号増幅手段の利
    得を制御する第1〜第nの利得制御手段と、 前記第1〜第nの信号増幅手段からの出力信号を加算
    し、雑音成分の低減された音声信号を出力する信号加算
    手段と、 前記信号加算手段から出力された音声信号を入力し、音
    声認識を行う音声認識手段と、を具備することを特徴と
    する音声認識装置。
  2. 【請求項2】 前記利得制御手段は、 前記帯域分割手段で分割された帯域信号を入力し、短時
    間平均パワを出力する信号パワ推定手段と、 前記信号パワ推定手段からの出力信号を入力し、信号の
    雑音パワを推定する雑音パワ推定手段と、 前記信号パワ推定手段の出力信号と前記雑音パワ推定手
    段の出力信号とを入力し、入力信号パワと雑音パワの割
    合に応じた利得量となるように前記利得制御手段の制御
    利得を算出する利得算出手段と、を有し、 前記利得算出手段は、 制御利得をai とし、信号パワをPXi (i=1〜n)
    とし、雑音パワをPN i とするとき、前記制御利得をa
    i =(PXi −PNi )/PXi により算出することを
    特徴とする請求項1記載の音声認識装置。
  3. 【請求項3】 前記利得制御手段は、 前記帯域分割手段で分割された帯域信号を入力し、短時
    間平均パワを出力する信号パワ推定手段と、 前記信号パワ推定手段からの出力信号を入力し、信号の
    雑音成分パワを推定する雑音パワ推定手段と、 前記信号パワ推定手段の出力信号と前記雑音パワ推定手
    段の出力信号とを入力し、入力信号パワと雑音パワの割
    合に応じた利得量となるように前記利得制御手段の制御
    利得を算出する利得算出手段と、を有し、 前記利得算出手段は、 制御利得をai とし、信号パワをPXi (i=1〜n)
    とし、雑音パワをPN i とし、利得制御範囲パラメータ
    をBi (0<Bi )とするとき、前記制御利得をai
    (PXi −Bi ×PNi )/PXi により算出すること
    を特徴とする請求項1記載の音声認識装置。
  4. 【請求項4】 前記利得制御手段は、 前記帯域分割手段で分割された帯域信号を入力し、短時
    間平均パワを出力する信号パワ推定手段と、 前記信号パワ推定手段からの出力信号を入力し、信号の
    雑音パワを推定する雑音パワ推定手段と、 前記信号パワ推定手段の出力信号と前記雑音パワ推定手
    段の出力信号とを入力し、入力信号パワと雑音パワの割
    合に応じた利得量となるように前記利得制御手段の制御
    利得を算出する利得算出手段と、を有し、 前記利得算出手段は、 制御利得をai とし、信号パワをPXi (i=1〜n)
    とし、雑音パワをPN i とし、利得制御範囲パラメータ
    をBi (0<Bi )、Ci (0<Ci )とするとき、前
    記制御利得をai =(PXi −Bi ×PNi )/PXi
    +Ci により算出することを特徴とする請求項1記載の
    音声認識装置。
  5. 【請求項5】 前記利得制御手段は、 前記帯域分割手段で分割された帯域信号を入力し、短時
    間平均パワを出力する信号パワ推定手段と、 前記信号パワ推定手段からの出力信号を入力し、信号の
    雑音パワを推定する雑音パワ推定手段と、 前記信号パワ推定手段の出力信号と前記雑音パワ推定手
    段の出力信号とを入力し、入力信号パワと雑音パワの割
    合に応じた利得量となるように前記利得制御手段の制御
    利得を算出する利得算出手段と、を有し、 前記利得算出手段は、 制御利得をai とし、信号パワをPXi とし、雑音パワ
    をPNi (i=1〜n)とし、利得制御範囲パラメータ
    をBi (0<Bi )、Di (0<Di )とするとき、前
    記制御利得をai =(PXi −Bi ×PNi +Di )/
    (PXi +Di)により算出することを特徴とする請求
    項1記載の音声認識装置。
  6. 【請求項6】 入力音響信号の信号S/Nを推定する信
    号S/N推定手段を更に設け、前記第1〜第nの利得制
    御手段の制御利得に対して、前記信号S/N推定手段で
    推定されたS/Nが高いときは利得の可変範囲を小さ
    く、S/Nが低いときは利得の可変範囲を大きくするこ
    とを特徴とする請求項3〜5いずれか1項記載の音声認
    識装置。
  7. 【請求項7】 前記信号S/N推定手段は、 入力信号レベルの単位時間内の最大値を出力するマック
    スホールド手段と、 入力信号レベルの単位時間内の最小値を出力するミニマ
    ムホールド手段と、 前記マックスホールド手段の出力Pmax 及び前記ミニマ
    ムホールド手段の出力Pmin を入力し、2つの入力の比
    (Pmin /Pmax )又は差(Pmax −Pmin )に基づい
    て利得制御範囲パラメータBi を生成し、前記利得制御
    手段に与えるパラメータ化手段と、を有することを特徴
    とする請求項6記載の音声認識装置。
  8. 【請求項8】 信号S/N推定手段は、 前記帯域分割手段で分割された各帯域毎に独立に設けた
    ことを特徴とする請求項6又は請求項7記載の音声認識
    装置。
  9. 【請求項9】 前記帯域分割手段は、 帯域分割数が2であることを特徴とする請求項1〜8い
    ずれか1項記載の音声認識装置。
  10. 【請求項10】 前記帯域分割手段は、 クロスオーバー周波数が350Hz〜500Hの間に設
    定されることを特徴とする請求項9記載の音声認識装
    置。
  11. 【請求項11】 低域側の利得制御手段を第1の利得制
    御手段とし、高域側の利得制御手段を第2の利得制御手
    段とするとき、 前記第1の利得制御手段の利得制御範囲の方が、前記第
    2の利得制御手段の利得制御範囲より大きいことを特徴
    とする請求項9記載の音声認識装置。
  12. 【請求項12】 前記第1の利得制御手段が制御する利
    得制御範囲が15dB以下であることを特徴とする請求
    項11記載の音声認識装置。
JP2000041086A 2000-02-18 2000-02-18 音声認識装置 Pending JP2001228893A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000041086A JP2001228893A (ja) 2000-02-18 2000-02-18 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000041086A JP2001228893A (ja) 2000-02-18 2000-02-18 音声認識装置

Publications (1)

Publication Number Publication Date
JP2001228893A true JP2001228893A (ja) 2001-08-24

Family

ID=18564369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000041086A Pending JP2001228893A (ja) 2000-02-18 2000-02-18 音声認識装置

Country Status (1)

Country Link
JP (1) JP2001228893A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005098818A1 (ja) * 2004-04-06 2005-10-20 Matsushita Electric Industrial Co., Ltd. 特定番組検出装置及び方法並びにプログラム
WO2006077934A1 (ja) * 2005-01-21 2006-07-27 Matsushita Electric Industrial Co., Ltd. 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法
WO2008032828A1 (fr) * 2006-09-15 2008-03-20 Panasonic Corporation Dispositif de codage audio et procédé de codage audio
JP2013137361A (ja) * 2011-12-28 2013-07-11 Pioneer Electronic Corp ノイズレベル推定装置、ノイズ低減装置及びノイズレベル推定方法
JP2016136286A (ja) * 2016-04-28 2016-07-28 パイオニア株式会社 ノイズレベル推定装置、ノイズ低減装置及びノイズレベル推定方法
CN108717851A (zh) * 2018-03-28 2018-10-30 深圳市三诺数字科技有限公司 一种语音识别方法及装置
CN113938805A (zh) * 2020-07-14 2022-01-14 广州汽车集团股份有限公司 一种低音音质的量化方法及装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8014882B2 (en) 2004-04-06 2011-09-06 Panasonic Corporation Particular program detection device, method, and program
JPWO2005098818A1 (ja) * 2004-04-06 2008-02-28 松下電器産業株式会社 特定番組検出装置及び方法並びにプログラム
WO2005098818A1 (ja) * 2004-04-06 2005-10-20 Matsushita Electric Industrial Co., Ltd. 特定番組検出装置及び方法並びにプログラム
JP4675884B2 (ja) * 2004-04-06 2011-04-27 パナソニック株式会社 特定番組検出装置及び方法並びにプログラム
WO2006077934A1 (ja) * 2005-01-21 2006-07-27 Matsushita Electric Industrial Co., Ltd. 帯域分割型雑音抑圧装置及び帯域分割型雑音抑圧方法
US8239191B2 (en) 2006-09-15 2012-08-07 Panasonic Corporation Speech encoding apparatus and speech encoding method
WO2008032828A1 (fr) * 2006-09-15 2008-03-20 Panasonic Corporation Dispositif de codage audio et procédé de codage audio
JP5061111B2 (ja) * 2006-09-15 2012-10-31 パナソニック株式会社 音声符号化装置および音声符号化方法
JP2013137361A (ja) * 2011-12-28 2013-07-11 Pioneer Electronic Corp ノイズレベル推定装置、ノイズ低減装置及びノイズレベル推定方法
JP2016136286A (ja) * 2016-04-28 2016-07-28 パイオニア株式会社 ノイズレベル推定装置、ノイズ低減装置及びノイズレベル推定方法
CN108717851A (zh) * 2018-03-28 2018-10-30 深圳市三诺数字科技有限公司 一种语音识别方法及装置
CN108717851B (zh) * 2018-03-28 2021-04-06 深圳市三诺数字科技有限公司 一种语音识别方法及装置
CN113938805A (zh) * 2020-07-14 2022-01-14 广州汽车集团股份有限公司 一种低音音质的量化方法及装置
CN113938805B (zh) * 2020-07-14 2024-04-23 广州汽车集团股份有限公司 一种低音音质的量化方法及装置

Similar Documents

Publication Publication Date Title
US9113241B2 (en) Noise removing apparatus and noise removing method
US8509451B2 (en) Noise suppressing device, noise suppressing controller, noise suppressing method and recording medium
JP4583781B2 (ja) 音声補正装置
JP3457293B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JP5265056B2 (ja) 雑音抑圧装置
JP5219522B2 (ja) 音声明瞭度改善システム及び音声明瞭度改善方法
JP4753821B2 (ja) 音信号補正方法、音信号補正装置及びコンピュータプログラム
JP6135106B2 (ja) 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
EP3276621B1 (en) Noise suppression device and noise suppressing method
US8391471B2 (en) Echo suppressing apparatus, echo suppressing system, echo suppressing method and recording medium
JP2007011330A (ja) スピーチ信号の適合する強化のためのシステム
JP2004507141A (ja) 音声強調システム
JP2001134287A (ja) 雑音抑圧装置
CN102402987A (zh) 噪声抑制装置、噪声抑制方法和程序
JPWO2010131470A1 (ja) ゲイン制御装置及びゲイン制御方法、音声出力装置
JP7325445B2 (ja) ギャップ信頼度を用いた背景雑音推定
US8259961B2 (en) Audio processing apparatus and program
JP2000330597A (ja) 雑音抑圧装置
JP2001228893A (ja) 音声認識装置
SE2150611A1 (en) Voice optimization in noisy environments
JP4460256B2 (ja) 雑音低減処理方法、この方法を実施する装置、プログラム、記録媒体
JP2962572B2 (ja) 雑音除去装置
CN103187068B (zh) 基于Kalman的先验信噪比估计方法、装置及噪声抑制方法
JP5105912B2 (ja) 音声明瞭度改善装置およびその騒音レベル推定方法
CN114596874A (zh) 一种基于多麦克风的风噪抑制方法与装置