JP2003131689A - ノイズ除去方法及び装置 - Google Patents
ノイズ除去方法及び装置Info
- Publication number
- JP2003131689A JP2003131689A JP2001327839A JP2001327839A JP2003131689A JP 2003131689 A JP2003131689 A JP 2003131689A JP 2001327839 A JP2001327839 A JP 2001327839A JP 2001327839 A JP2001327839 A JP 2001327839A JP 2003131689 A JP2003131689 A JP 2003131689A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- noise
- signal
- frequency
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
的な音質に優れた強調音声を得ることのできるノイズ除
去の方法及び装置を提供することである。 【解決手段】 逆フーリエ変換出力の隣接する2 フレー
ムから取り出した信号サンプルを窓がけ処理するための
窓がけ処理部22 を有する。
Description
び装置に関し、特に、音声信号に重畳されているノイズ
を除去するためのノイズ除去方法及び装置に関する。
(ノイズ)を消去する技術として、ノイズ・サプレッサ
がある。ノイズ・サプレッサは、cos変換やフーリエ
変換などによって周波数領域に変換した入力信号を用い
てノイズ成分のパワースペクトルを推定し、推定したパ
ワースペクトルを入力信号から差し引くことにより、音
声信号に混在するノイズを抑圧するように動作する。
無音区間を検出して更新することにより、非定常なノイ
ズの抑圧にも適用することができる。
「1984年12月、アイ・イー・イー・イー・トランザクシ
ョンズ・オン・アクースティクス・スピーチ・アンド・
シグナル・プロセシング、第32巻、第6号(IEEE TRANSAC
TIONS ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING,VO
L.32,NO.6 PP.1109-1121,DEC,1984)、1109〜1121ペー
ジ」(以下、「文献1」と称する。)に記載されている方
式がある。
2乗誤差短時間スペクトル振幅法として知られている。
ズ・サプレッサの模式的な構成を示すブロック図であ
る。
在する信号である劣化音声信号が、サンプル値系列とし
て供給される。劣化音声信号は、フレーム分割部1に供
給され、K/2サンプル毎のフレームに分割される。こ
こで、Kは偶数とする。
がけ処理部2に供給され、窓関数w(t)との乗算が行
われる。第nフレームの入力信号yn(t)(t=0,
1,…,K/2−1)に対するw(t)で窓がけされた信
号yn(t)バーは、数式1で与えられる。
ラップ)して窓がけすることも広く行われている。オー
バラップ長としてフレーム長の50%を仮定すれば、 t=0,1,…,K/2−1 に対して、数式2で得られるyn(t)バー(t=0,
1,…,K−1)が、窓がけ処理部2の出力となる。
た、窓関数は、抑圧係数を1に設定したときの入力信号
と出力信号が計算誤差を除いて一致するように設計され
る。これは、 w(t)+w(t+K/2)=1 となることを意味する。
バラップして窓がけする場合を例として説明を続ける。
ニング窓を用いることができる。
に供給され、劣化音声スペクトルYn(k)に変換され
る。劣化音声スペクトルYn(k)は位相と振幅に分離
され、劣化音声位相スペクトルのargYn(k)は逆
フーリエ変換部9に、劣化音声振幅スペクトル|Y
n(k)|は音声検出部4、多重乗算部16及び多重乗
算部17にそれぞれ供給される。
|Yn(k)|に基づいて音声の有無を検出し、その結
果によって定められる音声検出フラグを、推定雑音計算
部51に伝達する。
幅スペクトル|Yn(k)|を用いて劣化音声パワース
ペクトルを計算し、推定雑音計算部51と周波数別信号
対雑音比(以下、「SNR」と略す。)計算部6とに伝
達する。
劣化音声パワースペクトル、及びカウンタ13から供給
されるカウント値を用いて雑音のパワースペクトルを推
定し、推定雑音パワースペクトルとして周波数別SNR
計算部6に伝達する。
化音声パワースペクトルと推定雑音パワースペクトルと
を用いて周波数別にSNRを計算し、後天的SNRとし
て推定先天的SNR計算部7と雑音抑圧係数生成部8と
に供給する。
後天的SNR及び雑音抑圧係数生成部8から供給された
抑圧係数を用いて先天的SNRを推定し、推定先天的S
NRとして、雑音抑圧係数生成部8に帰還する。
された後天的SNRと推定先天的SNRとを用いて雑音
抑圧係数を生成し、抑圧係数として推定先天的SNR計
算部7に帰還すると同時に多重乗算部16に伝達する。
供給された劣化音声振幅スペクトル|Yn(k)|を、
雑音抑圧係数生成部8から供給された抑圧係数G
n(k)バーで重み付けすることによって強調音声振幅
スペクトル|Xn(k)|バーを求め、逆フーリエ変換
部9に伝達する。|Xn(k)|バーは、数式4で与え
られる。
強調音声振幅スペクトル|Xn(k)|バーとフーリエ
変換部3から供給された劣化音声位相スペクトルarg
|Yn(k)|とを乗算して、強調音声Xn(k)バーを
求める。すなわち、数式5に示す演算を行う。
し、1フレームがKサンプルから構成される時間領域サ
ンプル値系列Xn(t)バー(t=0,1,…,K−1)
としてフレーム合成部10に伝達する。
隣接する2フレームからK/2サンプルずつを取り出し
て重ね合わせ、数式6によって強調音声Xn(t)ハッ
トを得る。得られた強調音声Xn(t)ハット(t=
0,1,…,K−1)が、フレーム合成部10の出力と
して出力端子12に伝達される。
れていない。しかし、音声検出部の実現例としては、
「2000年3月、日本音響学会講演論文集、321〜322ペー
ジ」(以下、「文献2」と称する。)が知られているの
で、以降、文献2に示されたものを従来の方法として説
明する。
示すブロック図である。音声検出部4は、閾値記憶部4
01、比較部402、乗算器404、対数計算部40
5、パワー計算部406、重みつき加算部407、重み
記憶部408、論理否定回路409を有する。
劣化音声振幅スペクトルは、パワー計算部406に供給
される。パワー計算部406は、劣化音声振幅スペクト
ルのパワー|Yn(k)|2のk=0〜K−1に対する総
和を計算して、対数計算部405に伝達する。
スペクトルパワーの対数を求め、乗算器404に伝達す
る。
倍して劣化音声パワーQn(901)を求め、比較部4
02及び重みつき加算部407に供給する。すなわち、
第nフレームの劣化音声パワーQnは、数式7で与えら
れる。
プルであるyn(t)バーを用いて、数式8に従ってQn
を求めている。
論、コロナ社、75〜76ページ」(以下、「文献3」と称
する。)にあるように、数式8と数式7とが等価である
ことは、パーセバル(Parseval)の等式として知られてい
る。
ら、閾値THnが供給されている。比較部402は、乗
算器404の出力と閾値THnとを比較し、THn>Qn
のときは有音を表す“1”を、THn≦Qnのときは無音
を表す"0"を、音声検出フラグとして出力する。
力である音声検出フラグとして外部に供給されると同時
に、否定演算回路409に供給される。否定演算回路4
09の出力は、重みつき加算部制御信号905として重
みつき加算部407に供給される。
憶部401から閾値と、重み記憶部408から重み90
3とが供給される。重みつき加算部407は、閾値記憶
部401から供給される閾値902を、重みつき加算部
制御信号905に基づいて選択的に更新し、更新閾値9
04として閾値記憶部401に帰還する。
パワー901を、重み記憶部408から供給される重み
903を用いて重みつき加算することによって求める。
更新閾値THnの計算は、論理否定回路409の出力で
ある重みつき加算部制御信号905が“1”に等しいと
きだけ行われる。すなわち、無音のときだけ、閾値TH
nが更新される。更新によって得られた更新閾値904
は、閾値記憶部401に帰還される。
構成を示すブロック図である。パワー計算部406は、
分離部4061、乗算器40620〜4062K-1、加算
器4063を有する。
部3から供給された劣化音声振幅スペクトルは、分離部
4061において周波数別のKサンプルに分離され、そ
れぞれ乗算器40620〜4062K-1に供給される。
れ入力された信号を2乗し、加算器4063に伝達す
る。加算器4063は、入力された信号の総和を求めて
出力する。
の構成を示すブロック図である。重みつき加算部407
は、乗算器4071,4073、定数乗算器4075、
加算器4072,4074を有する。
器404から劣化音声パワー901と、図26の閾値記
憶部401から閾値902と、図26の重み記憶部40
8から重み903と、図26の論理否定回路409から
重みつき加算部制御信号905とが、それぞれ入力とし
て供給される。
075と乗算器4073とに伝達される。定数乗算器4
075は入力信号を−1倍して得られた−βを、加算器
4074に伝達する。加算器4074のもう一方の入力
としては1が供給されており、加算器4074の出力は
両者の和である1−βとなる。1−βは乗算器4071
に供給されて、もう一方の入力である劣化音声パワーQ
nと乗算され、積である(1−β)Qnが加算器4072に
伝達される。
して供給されたβと閾値902とが乗算され、積である
βTHn-1が加算器4072に伝達される。加算器40
72は、βTHn-1と(1−β)Qnとの和を、更新閾値9
04として出力する。
制御信号905が“1”に等しいときだけ行われる。す
なわち、重みつき加算部の機能は、無音のときに、閾値
TH n-1を更新してTHnを求めることであり、数式9に
よって表すことができる。
成を示すブロック図である。多重化乗算部17は、乗算
器17010〜1701K-1、分離部1702,170
3、多重化部1704を有する。多重化された状態で図
25のフーリエ変換部3から供給された劣化音声振幅ス
ペクトルは、分離部1702,1703において周波数
別のKサンプルに分離され、それぞれ乗算器17010
〜1701K-1に供給される。
れ入力された信号を2乗し、多重化部1704に伝達す
る。多重化部1704は、入力された信号を多重化し、
劣化音声パワースペクトルとして出力する。
構成を示すブロック図である。推定雑音計算部51は、
分離部502、多重化部503、周波数別推定雑音計算
部5140〜514K-1を有する。
検出フラグと図25のカウンタ13から供給されたカウ
ント値は、周波数別推定雑音計算部5140〜514K-1
に伝達される。
化音声パワースペクトルは、分離部502に伝達され
る。分離部502は、多重化された状態で供給された劣
化音声パワースペクトルをK個の周波数に対応した成分
に分離して、周波数別推定雑音計算部5140〜514
K-1に伝達する。
K-1は、分離部502から供給された劣化音声パワース
ペクトルを用いて雑音パワースペクトルを計算し、多重
化部503に伝達する。雑音パワースペクトルの計算
は、カウント値と音声検出フラグの値によって制御さ
れ、予め定めた条件が満足されるときだけ実行される。
パワースペクトル値を多重化して、推定雑音パワースペ
クトルとして出力する。
部514の構成を示すブロック図である。文献2に記載
された雑音推定は、無音区間において雑音推定値を更新
するものであり、雑音推定値として巡回型フィルタによ
る平均化を施した推定雑音の瞬時値を用いている。
イー・トランザクションズ・オン・スピーチ・アンド・
オーディオ・プロセシング、第6巻、第3号(IEEE TRANS-
ACTIONS ON SPEECH AND AUDIO PROCESSING,VOL.6,NO.3,
PP.287-292,MAY,1998)、287〜292ページ」(以下、「文
献4」と称する。)に記載された雑音推定では、推定雑
音の瞬時値を平均化して用いると記述されている。
ル型フィルタ(シフトレジスタを用いた構成)を用いた
平均化の実現を示唆している。どちらの実現も機能は等
しいので、ここでは文献4に記載された方法について説
明する。
定部521、レジスタ長記憶部5041、スイッチ50
44、シフトレジスタ5045、加算器5046、最小
値選択部5047、除算部5048、カウンタ5049
を有する。
02から、周波数別劣化音声パワースペクトルが供給さ
れている。スイッチ5044を閉じたときに、周波数別
劣化音声パワースペクトルは、シフトレジスタ5045
に伝達される。
に、更新判定部521から供給される制御信号に応じ
て、内部レジスタの記憶値を隣接レジスタにシフトす
る。シフトレジスタ長は、後述するレジスタ長記憶部5
941に記憶されている値に等しい。シフトレジスタ5
045の全レジスタ出力は、加算器5046に供給され
る。
出力を加算して、加算結果を除算部5048に伝達す
る。
と音声検出フラグが供給されている。更新判定部521
は、カウント値が予め設定された値に到達するまでは常
に“1”を、到達した後は音声検出フラグが"0"である
(無音の)ときに“1”を、それ以外のときに“0”を
出力し、カウンタ5049、スイッチ5044及びシフ
トレジスタ5045に伝達する。
ら供給された信号が“1”のときに回路を閉じ、“0”
のときに開く。
ら供給された信号が“1”のときにカウント値を増加
し、“0”のときには変更しない。
ら供給された信号が“1”のときにスイッチ5044か
ら供給される信号サンプルを1サンプル取り込むと同時
に、内部レジスタの記憶値を隣接レジスタにシフトす
る。
49の出力とレジスタ長記憶部5941の出力とが供給
されている。最小値選択部5047は、供給されたカウ
ント値とレジスタ長とのうち、小さい方を選択して、除
算部5048に伝達する。
給された周波数別劣化音声パワースペクトルの加算値を
カウント値とレジスタ長との小さい方の値で除算し、商
を周波数別推定雑音パワースペクトルλn(k)として
出力する。Bn(k)(n=0,1,…,N−1)をシフ
トレジスタ5045に保存されている劣化音声パワース
ペクトルのサンプル値とすると、λn(k)は、数式1
0で示すことができる。
の値である。カウント値はゼロから始まって単調に増加
するので、最初はカウント値で除算が行われ、後にはレ
ジスタ長で除算が行われる。レジスタ長で除算が行われ
ることは、シフトレジスタに格納された値の平均値を求
めることになる。
くの値が記憶されていないために、実際に値が記憶され
ているレジスタの数で除算する。実際に値が記憶されて
いるレジスタの数は、カウント値がレジスタ長より小さ
いときはカウント値に等しく、カウント値がレジスタ長
より大きくなると、レジスタ長と等しくなる。
成を示すブロック図である。更新判定部521は、論理
否定回路5202、比較部5203、閾値記憶部520
4、論理和計算部5211を有する。
ント値は、比較部5203に伝達される。閾値記憶部5
204の出力である閾値も、比較部5203に伝達され
る。比較部5203は、供給されたカウント値と閾値と
を比較し、カウント値が閾値より小さいときに“1”
を、カウント値が閾値より大きいときに"0"を論理和計
算部5211に伝達する。
定回路5202に伝達される。論理否定回路5202
は、入力された信号の論理否定値を求め、論理和計算部
5211に伝達する。すなわち、音声検出フラグが
“1”である有音部では“0”を、音声検出フラグが
“0”である無音部では“1”を論理和計算部5211
に伝達することになる。
は、音声検出フラグが“0”である無音部のとき、又は
カウント値が閾値より小さいときに“1”となって、図
31のスイッチを閉じ、カウンタ5049をカウントア
ップさせる。
6の構成を示すブロック図である。周波数別SNR計算
部6は、除算部6010〜601K-1、分離部602,6
03、多重化部604を有する。
化音声パワースペクトルは、分離部602に伝達され
る。図25の推定雑音計算部51から供給される推定雑
音パワースペクトルは、分離部603に伝達される。劣
化音声パワースペクトルは分離部602において、推定
雑音パワースペクトルは分離部603において、それぞ
れ周波数成分に対応したKサンプルに分離され、それぞ
れ除算部6010〜601K-1に供給される。
に従って、供給された劣化音声パワースペクトルを推定
雑音パワースペクトルで除算して周波数別SNR γ
n(k)を求め、多重化部604に伝達する。
る。多重化部604は、伝達されたK個の周波数別SN
Rを多重化して、後天的SNRとして出力する。
部7の構成を示すブロック図である。推定先天的SNR
計算部7は、多重値域限定処理部701、後天的SNR
記憶部702、抑圧係数記憶部703、多重乗算部70
4,705、重み記憶部706、多重重みつき加算部7
07、加算器708を有する。
される後天的SNR γn(k)(k=0,1,…,K−
1)は、後天的SNR記憶部702と加算器708とに
伝達される。
ムにおける後天的SNR γn(k)を記憶すると共に、
第n−1フレームにおける後天的SNR γn-1(k)を
多重乗算部705に伝達する。
れる抑圧係数Gn(k)バー(k=0,1,…,K−1)
は、抑圧係数記憶部703に伝達される。抑圧係数記憶
部703は、第nフレームにおける抑圧係数Gn(k)
バーを記憶すると共に、第n−1フレームにおける抑圧
係数Gn-1(k)バーを多重乗算部704に伝達する。
n-1(k)バーを2乗してG2 n-1(k)バーを求め、多
重乗算部705に伝達する。
γn-1(k)とをk=0,1,…,K−1に対して乗算し
てG2 n-1(k)バーγn-1(k)を求め、結果を多重重
みつき加算部707に過去の推定SNR922として伝
達する。
29を用いて説明した多重乗算部17と同様である。
されており、加算結果γn(k)−1が多重値域限定処
理部701に伝達される。
8から供給された加算結果γn(k)−1に値域限定演
算子P[・]による演算を施し、結果であるP[γ
n(k)−1]を多重重みつき加算部707に瞬時推定
SNR921として伝達する。ただし、P[x]は数式
12で定められる。
6から重み923が供給されている。多重重みつき加算
部707は、これらの供給された瞬時推定SNR92
1、過去の推定SNR922、重み923を用いて推定
先天的SNR924を求める。重み923をαとし、ξ
n(k)ハットを推定先天的SNRとすると、ξn(k)
ハットは、数式13を用いて計算される。
01の構成を示すブロック図である。多重値域限定処理
部701は、定数記憶部7011、最大値選択部701
20〜7012K-1、分離部7013、多重化部7014
を有する。
8からγn(k)−1が供給される。分離部7013
は、供給されたγn(k)−1をK個の周波数別成分に
分離し、最大値選択部70120〜7012K-1に供給す
る。
方の入力には、定数記憶部7011からゼロが供給され
ている。最大値選択部70120〜7012K-1は、γn
(k)−1をゼロと比較し、大きい方の値を多重化部7
014へ伝達する。この最大値選択演算は、数式12を
実行することに相当する。多重化部7014は、これら
の値を多重化して出力する。
07の構成を示すブロック図である。多重重みつき加算
部7071は、重みつき加算部70710〜707
1K-1、分離部7072,7074、多重化部7075
を有する。
定処理部701から、P[γn(k)−1]が瞬時推定S
NR921として供給される。分離部7072は、P
[γn(k)−1]をK個の周波数別成分に分離し、周波
数別瞬時推定SNR9210〜921K-1として、重みつ
き加算部70710〜7071K-1に伝達する。
705からG2 n-1(k)バーγn-1(k)が過去の推定
SNR922として供給される。分離部7074は、G
2 n-1(k)バーγn-1(k)をK個の周波数別成分に分
離し、過去の周波数別推定SNR9220〜922K-1と
して、重みつき加算部70710〜7071K-1に伝達す
る。
1K-1には、重み923も供給される。重みつき加算部
70710〜7071K-1は、数式13によって表される
重みつき加算を実行し、周波数別推定先天的SNR92
40〜924K-1を多重化部7075に伝達する。
SNR9240〜924K-1を多重化し、推定先天的SN
R924として出力する。
1K-1の動作と構成は、図28を用いて説明した重みつ
き加算部407と同様であるが、重みつき加算の計算は
常に行われる。
の構成を示すブロック図である。雑音抑圧係数生成部8
は、抑圧係数検索部8010〜801K-1、分離部80
2,803、多重化部804を有する。
R計算部6から後天的SNRが供給される。分離部80
2は、供給された後天的SNRをK個の周波数別成分に
分離し、抑圧係数検索部8010〜801K-1に伝達す
る。
NR計算部7から推定先天的SNRが供給される。分離
部803は、供給された推定先天的SNRをK個の周波
数別成分に分離し、抑圧係数検索部8010〜801K-1
に伝達する。
給された後天的SNRと推定先天的SNRに対応した抑
圧係数とを検索し、検索結果を多重化部804に伝達す
る。
多重化して出力する。
0〜801K-1の構成を示すブロック図である。抑圧係数
検索部801は、抑圧係数テーブル8011、アドレス
変換部8012,8013を有する。
離部802から周波数別後天的SNRが供給される。ア
ドレス変換部8012は、供給された周波数別後天的S
NRを対応したアドレスに変換し、抑圧係数テーブル8
011に伝達する。
離部803から、周波数別推定先天的SNRが供給され
る。アドレス変換部8013は、供給された周波数別推
定先天的SNRを対応したアドレスに変換し、抑圧係数
テーブル8011に伝達する。
換部8012とアドレス変換部8013とから供給され
たアドレスに対応した領域に格納されている抑圧係数
を、周波数別抑圧係数として出力する。
は、逆フーリエ変換して得られた時間領域信号の隣接す
る2フレームから取り出した信号サンプルを重ね合わせ
加算することによって、強調音声を得ていた、一方で、
フーリエ変換前に時間領域信号にかける窓関数は、雑音
抑圧処理を行わないときに、入力が出力において再現さ
れるように設計されていた。
サンプルが、隣接するフレームにおいて異なった抑圧係
数値で抑圧されると、フレーム境界において信号サンプ
ルに不連続性を生じ、出力信号に発生する雑音によっ
て、主観的な音質が劣化するという問題があった。
することがなく、主観的な音質に優れた強調音声を得る
ことのできるノイズ除去の方法及び装置を提供すること
を課題とする。
に、本発明のノイズ除去方法は、入力信号を周波数領域
信号に変換し、該周波数領域信号に基づいて信号対雑音
比を求め、該信号対雑音比に基づいて抑圧係数を定め、
該抑圧係数に基づいて前記周波数領域信号を重みづけ
し、該重みづけされた周波数領域信号を時間領域信号に
変換することによってノイズを除去した出力信号を得る
際に、前記入力信号に第1の窓がけを施してから周波数
領域信号に変換し、前記時間領域信号に第2の窓がけを
施して前記出力信号を得る。
号を周波数領域信号に変換し、該周波数領域信号に基づ
いて推定雑音を求め、該推定雑音に対応した値を前記周
波数領域信号から差し引いて周波数領域の強調音声を求
め、該強調音声を時間領域信号に変換することによって
ノイズを除去した出力信号を得る際に、前記入力信号に
第1の窓がけを施してから周波数領域信号に変換し、前
記時間領域信号に第2の窓がけを施して出力信号を得
る。
信号に窓がけ処理を施す第1の窓がけ処理部と、前記第
1の窓がけ処理部で窓がけ処理が施された入力信号を周
波数領域信号に変換する変換部と、前記変換部で変換さ
れた周波数領域信号の振幅成分に基づいて信号対雑音比
を求める信号対雑音比計算部と、前記信号雑音比計算部
で求められた信号対雑音比に基づいて抑圧係数を生成す
る抑圧係数生成部と、前記抑圧係数生成部で生成された
抑圧係数に基づいて前記周波数領域信号の振幅成分を重
みづけするための乗算部と、前記乗算部で重みづけされ
た周波数領域信号の振幅成分と前記変換部で変換された
周波数領域信号の位相成分を時間領域信号に変換する逆
変換部と、前記逆変換部で変換された時間領域信号に窓
がけ処理を施す第2の窓がけ処理部とを備える。
取り出した逆フーリエ変換出力を窓がけ処理してから重
ね合わせ加算することによって、強調音声を得ることを
特徴としている。より具体的には、逆フーリエ変換出力
の隣接する2フレームから取り出した信号サンプルを窓
がけ処理するための窓がけ処理部を備える。
を構成する逆フーリエ変換出力を窓がけ処理してから重
ね合わせ加算することによって、フレーム境界における
信号サンプルの連続性が改善され、雑音を防止するよう
にしている。
図面を用いて説明する。
1のノイズ除去装置の模式的な構成を示すブロック図で
ある。図1に示すノイズ除去装置は、図25に示したノ
イズ除去装置と比較して、窓がけ処理部22を有する点
が相違する。なお、図1において図25に示した部分と
同様の部分には同一符号を付している。以下、この相違
点を中心に動作を説明する。
から供給されたXn(t)バーに窓関数h(t)を乗算
し、積であるh(t)Xn(t)バーをフレーム合成部
10に伝達するものである。
n(t)バーの隣接する2フレームからK/2サンプル
ずつを取り出して重ね合わせ、数式14によって、強調
音声Xn(t)ハットを得る。
/2−1)が、フレーム合成部10の出力として、出力
端子12に伝達される。オーバラップが、50%ではな
くMサンプルで、フレーム長がLサンプル(M<L)の
場合は、数式15によって、強調音声Xn(t)ハット
を得る。
は、左右対称窓関数が用いられる。また、窓関数は、抑
圧係数を1に設定したときの入力信号と出力信号とが計
算誤差を除いて一致するように設計される。
っても、h(t)として使用することができる。その一
例として、ハニング窓を開平した関数(ルートハニング
窓)をあげることができる。他にもこれらの条件を満た
す窓関数は存在するので、そちらを用いてもよい。
2のノイズ除去装置の模式的な構成を示すブロック図で
ある。図2と図1とは、推定雑音計算部5、重みつき劣
化音声計算部14及び抑圧係数補正部15を除いて同様
とし、同様の部分には同一符号を付している。
報通信学会技術研究報告、DSP、53〜60ページ」(以下、
「文献5」と称する。)に記載されたものに、窓がけ処
理部22を備えている。
された方法とは異なり、重みつき劣化音声スペクトルを
用いて、雑音のパワースペクトルを推定することによっ
て、正確な推定雑音を得ることができる。以下、これら
の相違点を中心に動作を説明する。
4の構成を示すブロック図である。重みつき劣化音声計
算部14は、推定雑音記憶部1401、周波数別SNR
計算部1402、多重非線形処理部1405、及び多重
乗算部1404を有する。
音計算部5から供給される推定雑音パワースペクトルを
記憶し、1フレーム前に記憶された推定雑音パワースペ
クトルを周波数別SNR計算部1402へ出力する。
音記憶部1401から供給される推定雑音パワースペク
トルと図2の多重乗算部17から供給される劣化音声パ
ワースペクトルとを用いてSNRを各周波数毎に求め、
多重非線形処理部1405に出力する。
NR計算部1402から供給されるSNRを用いて重み
係数ベクトルを求め、重み係数ベクトルを多重乗算部1
404に出力する。
17から供給される劣化音声パワースペクトルと、多重
非線形処理部1405から供給される重み係数ベクトル
との積を周波数毎に計算し、重みつき劣化音声パワース
ペクトルを図2の推定雑音記憶部5に出力する。
図33を用いて説明した周波数別SNR計算部6と同様
である。また、多重乗算部1404の構成は、図29を
用いて説明した多重乗算部17と同様である。
の構成を示すブロック図である。多重非線形処理部14
05は、分離部1495、非線形処理部14850〜1
485K-1、及び多重化部1475を有する。
計算部1402から供給されるSNRを周波数別のSN
Rに分離し、非線形処理部14850〜1485K-1に出
力する。
それぞれ入力値に応じた実数値を出力する非線形関数を
有する。
5K-1等から出力される非線形関数の例を示す図であ
る。f1を入力値としたとき、図5に示される非線形関
数の出力値f2は、数式16で示される。
5から供給される周波数別SNRを、非線形関数によっ
て処理して重み係数を求め、多重化部1475に出力す
る。すなわち、非線形処理部14850〜1485K-1は
SNRに応じた1から0までの重み係数を出力する。S
NRが小さい時は1を、大きい時は0を出力する。
50〜1485K-1から出力された重み係数を多重化し、
重み係数ベクトルを多重乗算部1404に出力する。
ースペクトルと乗算される重み係数は、SNRに応じた
値になっており、SNRが大きい程、すなわち劣化音声
に含まれる音声成分が大きい程、重み係数の値は小さく
なる。
スペクトルが用いられるが、推定雑音の更新に用いる劣
化音声パワースペクトルに対して、SNRに応じた重み
づけを行うことで、劣化音声パワースペクトルに含まれ
る音声成分の影響を小さくすることができ、より精度の
高い雑音推定を行うことができる。
た例を示したが、非線形関数以外にも線形関数や高次多
項式など、他の形で表されるSNRの関数を用いること
も可能である。
示すブロック図である。図2の推定雑音計算部5は、図
25に示した推定雑音計算部51に対して、分離部50
5が存在する点と、周波数別推定雑音計算部5140〜
514K-1を周波数別推定雑音計算部5040〜504
K-1に置換している点とが相違する。なお、図6におい
て図30に示した部分と同様の部分には同一符号を付し
ている。以下、これらの相違点を中心に動作を説明す
る。
計算部から供給される重みつき劣化音声パワースペクト
ルを、周波数別の重みつき劣化音声パワースペクトルに
分離し、周波数別推定雑音計算部5040〜504K-1に
出力する。
K-1は、分離部502から供給される周波数別劣化音声
パワースペクトル、分離部505から供給される周波数
別重みつき劣化音声パワースペクトル、図2の音声検出
部4から供給される音声検出フラグ及び図2のカウンタ
13から供給されるカウント値から周波数別推定雑音パ
ワースペクトルを計算し、多重化部503へ出力する。
部5040〜504K-1から供給される周波数別推定雑音
パワースペクトルを多重化し、推定雑音パワースペクト
ルを図2の周波数別SNR計算部6と重みつき劣化音声
計算部14とへ出力する。
040〜504K-1の構成を示すブロック図である。図6
の周波数別推定雑音計算部5040〜504K-1は、図3
0に示した周波数別推定雑音計算部514に対して、周
波数別推定雑音計算部504 0〜504K-1が推定雑音記
憶部5942を有する点と、更新判定部521が更新判
定部520に置換されている点と、スイッチ5044へ
の入力が周波数別劣化音声パワースペクトルから周波数
別重みつき劣化音声パワースペクトルに置換されている
点とが相違する。なお、図7において図31に示した部
分と同様の部分には同一符号を付している。
5040〜504K-1は、図9を用いて後述するような構
成としてもよい。
K-1は、推定雑音の計算に劣化音声パワースペクトルで
はなく重みつき劣化音声パワースペクトルを用いてお
り、また、推定雑音の更新判定に、推定雑音と劣化音声
パワースペクトルを用いているため、これらの相違点が
発生する。
8から供給される周波数別推定雑音パワースペクトルを
記憶し、1フレーム前に記憶された周波数別推定雑音パ
ワースペクトルを更新判定部520に出力する。
示すブロック図である。図7の更新判定部520は、図
31に示した更新判定部521に対して、論理和計算部
5211が論理和計算部5201に置換されている点
と、更新判定部520が比較部5205、閾値記憶部5
206及び閾値計算部5207を有する点とが相違す
る。なお、図8において図32に示した部分と同様の部
分には同一符号を付している。以下、これらの相違点を
中心に動作を説明する。
憶部5942から供給される周波数別推定雑音パワース
ペクトルに応じた値を計算し、計算結果を閾値として閾
値記憶部5206に出力する。最も簡単には、閾値を周
波数別推定雑音パワースペクトルの定数倍とすることで
ある。その他に、高次多項式や非線形関数を用いて閾値
を計算することも可能である。
7から出力された閾値を記憶し、1フレーム前に記憶さ
れた閾値を比較部5205へ出力する。
ら供給される閾値と図6の分離部502から供給される
周波数別劣化音声パワースペクトルとを比較し、周波数
別劣化音声パワースペクトルが閾値よりも小さければ
“1”を、大きければ“0”を論理和計算部5201に
出力する。すなわち、推定雑音パワースペクトルの大き
さをもとに、劣化音声信号が雑音であるか否かを判別し
ている。
の出力値、論理否定回路5202の出力値、及び比較部
5205の出力値の論理和を計算し、計算結果を図7の
スイッチ5044、シフトレジスタ5045及びカウン
タ5049に出力する。
く、有音区間でも劣化音声パワーが小さい場合には、更
新判定部520は“1”を出力する。すなわち、推定雑
音の更新が行われる。閾値の計算は各周波数毎に行われ
るため、各周波数毎に推定雑音の更新を行うことができ
る。
のカウント値、Nをシフトレジスタ5045のレジスタ
長とする。そして、Bn(k)(n=0,1,…,N−
1)をシフトレジスタ5045に蓄積されている周波数
別重みつき劣化音声パワースペクトルとする。このと
き、除算部5048から出力される周波数別推定雑音パ
ワースペクトルλn(k)は、数式17に示すようにな
る。
されている周波数別重みつき劣化音声パワースペクトル
の平均値となる。平均値の計算は、重みつき加算部(巡
回型フィルタ)を用いて行うことも可能である。
040〜504K-1の構成例を示すブロック図である。図
6の周波数別推定雑音計算部5040〜504K-1は、図
7のシフトレジスタ5045、加算器5046、最小値
選択部5047、除算部5048、カウンタ5049、
レジスタ長記憶部5941に代えて、重みつき加算部5
071、重み記憶部5072を有する点が相違する。な
お、図9において図6に示した部分と同様の部分には同
一符号を付している。
部5942から供給される1フレーム前の周波数別推定
雑音パワースペクトル、スイッチ5044から供給され
る周波数別重みつき劣化音声パワースペクトル及び重み
記憶部5072から出力される重みを用いて、周波数別
推定雑音を計算し、多重化部503へ出力する。
重みをδ、周波数別重みつき劣化音声パワースペクトル
を|Yn(k)|2バーとしたとき、重みつき加算部50
71から出力される周波数別推定雑音パワースペクトル
λn(k)は、数式18で表せる。
した重みつき加算部407と同様であるが、重みつき加
算の計算は常に行われる。
成を示すブロック図である。SNRが低いときに抑圧不
足により発生する残留雑音や、SNRが高いときに過度
の抑圧で発生する音声の歪みによる音質劣化を防ぐため
に、抑圧係数補正部15は、SNRに応じて抑圧係数の
補正を行う。
圧係数に修正値を加えて残留雑音を抑圧し、SNRが高
いときには抑圧係数に下限値を設定して音声の歪みを防
止する。抑圧係数補正部15は、周波数別抑圧係数補正
部15010〜1501K-1、分離部1502,1503
及び多重化部1504を有する。
R計算部7から供給される推定先天的SNRを周波数別
成分に分離し、それぞれ周波数別抑圧係数補正部150
10〜1501K-1に出力する。
8から供給される抑圧係数を周波数別成分に分離し、そ
れぞれ周波数別抑圧係数補正部15010〜1501K-1
に出力する。
01K-1は、分離部1502から供給される周波数別推
定先天的SNRと、分離部1503から供給される周波
数別抑圧係数とから、周波数別補正抑圧係数を計算して
多重化部1504へ出力する。
正部15010〜1501K-1から供給される周波数別補
正抑圧係数を多重化し、補正抑圧係数として多重乗算部
16と推定先天的SNR計算部7とへ出力する。
まれる周波数別抑圧係数補正部15010〜1501K-1
の構成を示すブロック図である。周波数別抑圧係数補正
部1501は、最大値選択部1591、抑圧係数下限値
記憶部1592、閾値記憶部1593、比較部159
4、スイッチ1595、修正値記憶部1596及び乗算
器1597を有する。
ている抑圧係数の下限値を、最大値選択部1591に供
給する。
1503から供給される周波数別抑圧係数と抑圧係数下
限値記憶部1592から供給される抑圧係数下限値とを
比較し、大きい方の値をスイッチ1595に出力する。
すなわち、抑圧係数は抑圧係数下限値記憶部1592が
記憶する下限値以上の大きい値になる。従って、過度の
抑圧により発生する音声の歪みを防ぐことができる。
ら供給される閾値と、図10の分離部1502から供給
される周波数別推定先天的SNRとを比較し、周波数別
推定先天的SNRが閾値よりも大きければ“0”を、小
さければ“1”をスイッチ1595に供給する。
1から供給される信号を、比較部1594の出力値が
“1”のとき乗算器1597に出力し、比較部1594
の出力値が“0”のとき図10の多重化部1504に出
力する。すなわち、周波数別推定先天的SNRが閾値よ
りも小さいときに、抑圧係数の補正が行われる。こうし
て、音声成分を過剰に抑圧することなく、残留雑音量を
減らすことができる。
力値と修正値記憶部1596の出力値との積を計算し、
計算結果を図10の多重化部1504へ出力する。抑圧
係数値を小さくするため、修正値は1より小さい値が普
通であるが、目的によってはこの限りではない。
算部16と推定先天的SNR計算部7とへ供給すること
なく、補正抑圧係数を多重乗算部16と推定先天的SN
R計算部7とへ供給している。
変形例である雑音抑圧係数生成部81の構成を示すブロ
ック図である。雑音抑圧係数生成部81は、ゲイン関数
値計算部811、一般化尤度比計算部812、音声存在
確率記憶部813及び抑圧係数計算部814を有する。
供給された推定先天的SNRと後天的SNRとから抑圧
係数を演算で求める点が、検索で求める図2の雑音抑圧
係数生成部8と異なる。以下、文献1に記載されている
計算式をもとに、抑圧係数の計算方法を説明する。
γn(k)を図2の周波数別SNR計算部6から供給さ
れる周波数別後天的SNR、ξn(k)ハットを図2の
推定先天的SNR計算部7から供給される周波数別推定
先天的SNRとする。また、 ηn(k)=ξn(k)ハット/q vn(k)=(ηn(k)γn(k))/(1+η
n(k)) とする。
数別SNR計算部6から供給される後天的SNRγ
n(k)、図2の推定先天的SNR計算部7から供給さ
れる推定先天的SNRξn(k)ハット及び音声存在確
率記憶部813から供給される音声存在確率qとをもと
に、各周波数毎に例えば文献1に記載されているような
MMSE STSAゲイン関数値を計算し、抑圧係数計
算部814に出力する。
数値Gn(k)は、数式19で表せる。
は1次変形ベッセル関数である。変形ベッセル関数につ
いては、「1985年、数学辞典、岩波書店、374.Gペー
ジ」(文献6)に記載されている。
数別SNR計算部6から供給される後天的SNRγ
n(k)、図2の推定先天的SNR計算部7から供給さ
れる推定先天的SNRΛn(k)ハット及び音声存在確
率記憶部813から供給される音声存在確率qをもと
に、周波数毎に一般化尤度比を計算し、抑圧係数計算部
814に出力する。
式20で表せる。
ら供給されるMMSESTSAゲイン関数値Gn(k)
と一般化尤度比計算部812から供給される一般化尤度
比Λn(k)とから周波数毎に抑圧係数を計算し、図2
の抑圧係数補正部15へ出力する。
式21で表せる。
ら構成される帯域に共通なSNRを求めて、これを用い
ることも可能である。
の変形例である周波数別SNR計算部61の構成例を示
すブロック図である。図13の周波数別SNR計算部6
1は、図2に示した周波数別SNR計算部6に対して、
帯域別SNR計算部61が帯域別パワー計算部611,
612を有する点が相違する。なお、図13において図
33に示した部分と同様の部分には同一符号を付してい
る。
2から供給される周波数別劣化音声パワースペクトルを
もとに帯域別のパワーを計算し、除算部6010〜60
1K-1へ出力する。
3から供給される周波数別推定雑音パワースペクトルを
もとに帯域別のパワーを計算し、除算部6010〜60
1K-1へ出力する。
11の構成を示すブロック図である。ここでは、帯域幅
Lを有するM個の帯域に等分割する例を説明する。ここ
で、LとMは、K=LMの関係を満たす自然数であると
する。
00〜6110M-1を有する。図13の分離部602から
供給される周波数別劣化音声パワースペクトル9100
〜910K-1(9100〜910ML-1)は、各周波数に対応
した加算器61100〜6110M-1へそれぞれ伝達され
る。
は0からL−1なので、周波数別劣化音声パワースペク
トル9100〜910L-1は加算器61100へ伝達され
る。また、帯域番号1に対応する周波数番号はLから2
L−1なので、周波数別劣化音声パワースペクトル91
0L〜9102L-1は加算器61101へ伝達される。
れた周波数別劣化音声パワースペクトルの総和をそれぞ
れ計算し、帯域別劣化音声パワースペクトル9110〜
911ML-1(9110〜911K-1)を図13の除算部6
010〜601K-1へ出力する。各加算器61100〜6
110M-1の計算結果は、それぞれの帯域番号に応じた
周波数毎に帯域別劣化音声パワースペクトルとして出力
される。
帯域別劣化音声パワースペクトル9110〜911L-1と
して出力される。また、加算器61101の計算結果
は、帯域別劣化音声パワースペクトル911L〜911
2L-1として出力される。構成と動作は帯域別パワー計算
部611と同様である。
を示したが、「1980年、聴覚と音声、電子情報通信学
会、115〜118ページ」(文献7)に記載されている臨界帯
域に分割する方法、「1983年、マルチレート・ディジタ
ル・シグナル・プロセシング(Multirate Digital Si
gnal Processing),1983,Prentice-Hall Inc.,USA」(以
下、「文献8」と称する。)に記載されているオクター
ブ帯域に分割する方法など、他の帯域分割方法を用いる
ことも可能である。
態3のノイズ除去装置の模式的な構成を示すブロック図
である。図15に示すノイズ除去装置は、図2に対し
て、推定雑音計算部5が推定雑音計算部52に置換され
ている点と、重みつき劣化音声計算部14が存在しない
点とが相違する。なお、図15において、図2に示した
部分と同様の部分には同一符号を付している。以下、こ
れらの相違点を中心に動作を説明する。
構成を示すブロック図である。図15の推定雑音計算部
52は、図2の推定雑音計算部5に対して、周波数別推
定雑音計算部5040〜504K-1が周波数別推定雑音計
算部5060〜506K-1に置換されている点と、推定雑
音計算部52が入力信号に重みつき劣化音声パワースペ
クトルを有しない点とが相違する。なお、図16におい
て、図6に示した部分と同様の部分には同一符号を付し
ている。
は、周波数別推定雑音計算部5040〜504K-1が入力
信号に周波数別重みつき劣化音声パワースペクトルを必
要とするのに対して、推定雑音計算部5060〜506
K-1は、入力信号に周波数別重みつき劣化音声パワース
ペクトルを必要としないためである。
部5060〜506K-1の構成を示すブロック図である。
図16の周波数別推定雑音計算部5060〜506
K-1は、図6の周波数別推定雑音計算部5040〜504
K-1に対して、周波数別推定雑音計算部506が入力信
号に周波数別重みつき劣化音声パワースペクトルを有し
ていない点と、除算部5041、非線形処理部5042
及び乗算器5043を有している点とが相違する。な
お、図17において、図7に示した部分と同様の部分に
は同一符号を付している。以下、これらの相違点を中心
に動作を説明する。
から供給される周波数別劣化音声パワースペクトルを、
推定雑音記憶部5942から供給される1フレーム前の
推定雑音パワースペクトルで除算し、除算結果を非線形
処理部5042に出力する。図4に示した非線形処理部
1485と同様の構成及び機能を有する非線形処理部5
042は、除算部5041の出力値に応じた重み係数を
計算し、乗算器5043に出力する。
から供給される周波数別劣化音声パワースペクトルと非
線形処理部5042から供給される重み係数の積を計算
し、スイッチ5044へ出力する。乗算器5043の出
力信号は、図5の周波数別推定雑音計算部504におけ
る周波数別重みつき劣化音声パワースペクトルと同様で
ある。すなわち、周波数別重みつき劣化音声パワースペ
クトルは、周波数別推定雑音計算部506の内部におい
て計算することも可能である。したがって、重みつき劣
化音声計算部14を省略することが可能となる。
態4のノイズ除去装置の模式的な構成を示すブロック図
である。図18に示すノイズ除去装置は、図2に示した
ノイズ除去装置に対して、推定先天的SNR計算部71
を備えている点が相違する。なお、図18において、図
2に示した部分と同様の部分には同一符号を付してい
る。以下、この相違点を中心に動作を説明する。
部71の構成を示すブロック図である。図18の推定先
天的SNR計算部71は、図34の推定先天的SNR計
算部7の後天的SNR記憶部702、抑圧係数記憶部7
03、多重乗算部705,704に代えて、推定雑音記
憶部712、強調音声パワースペクトル記憶部713、
周波数別SNR計算部715、多重乗算部716を有す
る。なお、図19において、図34に示した部分と同様
の部分には同一符号を付している。
抑圧係数に代えて、強調音声振幅スペクトルと推定雑音
パワースペクトルを入力信号としている。
16から供給される強調音声振幅スペクトルを周波数毎
に2乗して強調音声パワースペクトルを求め、強調音声
パワースペクトル記憶部713に出力する。多重乗算部
716の構成は、図29を用いて説明した多重乗算部1
7と同様である。
は、多重乗算部716から供給される強調音声パワース
ペクトルを記憶し、1フレーム前に供給された強調音声
パワースペクトルを周波数別SNR計算部715へ出力
する。周波数別SNR計算部715の構成は、図33を
用いて説明した周波数別SNR計算部6と同様である。
音計算部5から供給される推定雑音パワースペクトルを
記憶し、1フレーム前に供給された推定音声パワースペ
クトルを周波数別SNR計算部715へ出力する。
パワースペクトル記憶部713から供給される強調音声
パワースペクトルと、推定雑音記憶部712から供給さ
れる推定雑音パワースペクトルのSNRを各周波数毎に
計算し、多重重みつき加算部707へ出力する。
図34の多重乗算部705の出力信号は同様のものであ
る。したがって、本実施形態では、推定先天的SNR計
算部7を推定先天的SNR計算部17に置換することが
可能となる。
態5のノイズ除去装置の模式的な構成を示すブロック図
である。図20に示すノイズ除去装置は、図2に示した
ノイズ除去装置に対して、推定雑音計算部5が推定雑音
部52に、推定先天的SNR計算部7が推定先天的SN
R計算部71に、それぞれ置換されている点と、重みつ
き劣化音声計算部14が存在しない点とが相違する。
3で説明した推定雑音部と同様である。また、推定先天
的SNR計算部71は、実施形態4で説明した推定先天
的SNR計算部と同様である。
態6のノイズ除去装置の模式的な構成を示すブロック図
である。図21のノイズ除去装置は、図2に示したノイ
ズ除去装置に対して、推定雑音計算部5が推定雑音計算
部53で置換されている点と、音声検出部4が存在しな
い点とが相違する。すなわち、図21のノイズ除去装置
は、雑音の推定に音声検出部を必要としない。以下、こ
れらの相違点を中心に動作を説明する。
構成を示すブロック図である。図21の推定雑音計算部
53は、図6に示した推定雑音計算部5に対して、周波
数別推定雑音計算部5040〜504K-1が周波数別推定
雑音計算部5080〜508K -1に置換されている点と、
推定雑音計算部53が入力信号に音声検出フラグを有し
ていない点とが相違する。
部5080〜508K-1の構成を示すブロック図である。
図22の周波数別推定雑音計算部5080〜508
K-1は、図7に示した周波数別推定雑音計算部504に
対して、更新判定部520が更新判定部522に置換さ
れている点と、周波数別推定雑音計算部5080〜50
8K-1が入力に音声検出フラグを有していない点とが相
違する。
成を示すブロック図である。図23の更新判定部522
は、図8に示した更新判定部520に対して、論理和計
算部5201が論理和計算部5221に置換されている
点と、更新判定部522が論理否定回路5202を有し
ていない点と、入力信号に音声検出フラグを有していな
い点とが相違する。すなわち、更新判定部522は、推
定雑音の更新に音声検出フラグを用いていない。この点
が、図8の更新判定部520と異なる。
の出力値と比較部5203の出力値の論理和を計算し、
計算結果を図23のスイッチ5044、シフトレジスタ
5045及びカウンタ5049に出力する。すなわち、
更新判定部522は、カウント値が予め設定された値に
到達するまでは常に“1”を出力し、到達した後は、劣
化音声パワーが閾値よりも小さいときに“1”を出力す
る。
化音声信号が雑音であるか否かの判定を行っている。す
なわち、比較部5205は各周波数毎に音声検出を行っ
ているといえる。したがって、音声検出フラグを入力に
有しない更新判定部を実現することが可能となる。
去の方式として、最小平均2乗誤差短時間スペクトル振
幅法を用いる場合を例に説明したが、その他の方法にも
適用することができる。
・オブ・ザ・アイ・イー・イー・イー、第67巻、第12号
(PROCEEDINGS OF THE IEEE,VOL.67,NO.12,PP.1586-160
4,DEC,1979)、1586〜1604ページ」(文献9)に記載され
ているウィーナーフィルタ法や、「1979年4月、アイ・
イー・イー・イー・トランザクションズ・オン・アクー
スティクス・スピーチ・アンド・シグナル・プロセシン
グ、第27巻、第2号(IEEETRANSACTIONS ON ACOUSTICS,SP
EECH,AND SIGNAL PROCESSING,VOL.27,NO.2,PP.113-120,
APR,1979)、113〜120ページ」(以下、「文献10」と称
する。)に記載されているスペクトル減算法などであ
る。
トル減算法の概略動作の説明図である。図21におい
て、多重乗算部16を多重減算部に、雑音抑圧係数生成
部8を雑音抑圧量計算部に、抑圧係数補正部15を抑圧
量補正部に置き換えれば、スペクトル減算法による動作
を実現することができる。
量を劣化音声振幅スペクトルから減算し、得られた結果
を逆フーリエ変換することによって、強調音声を得るこ
とができる。ここでは、SNRを計算してから、SNR
に基づいて雑音抑圧量を計算する例について説明した
が、推定雑音計算部53で得られた推定雑音を、直接劣
化音声振幅スペクトルから減算することもできる。
る2フレームを構成する逆フーリエ変換出力を窓がけ処
理してから重ね合わせ加算するので、フレーム境界にお
ける信号サンプルの連続性が改善され、雑音を防止する
ことができる。
な構成を示すブロック図である。
な構成を示すブロック図である。
すブロック図である。
ブロック図である。
力される非線形関数の例を示す図である。
図である。
4K-1の構成を示すブロック図である。
図である。
4K-1の構成例を示すブロック図である。
ック図である。
別抑圧係数補正部15010〜1501K-1の構成を示す
ブロック図である。
雑音抑圧係数生成部81の構成を示すブロック図であ
る。
る周波数別SNR計算部61の構成例を示すブロック図
である。
示すブロック図である。
的な構成を示すブロック図である。
ロック図である。
506K-1の構成を示すブロック図である。
的な構成を示すブロック図である。
を示すブロック図である。
的な構成を示すブロック図である。
的な構成を示すブロック図である。
ロック図である。
508K-1の構成を示すブロック図である。
ック図である。
構成を示すブロック図である。
図である。
ロック図である。
ブロック図である。
ック図である。
ロック図である。
成を示すブロック図である。
ック図である。
すブロック図である。
示すブロック図である。
示すブロック図である。
示すブロック図である。
ブロック図である。
の構成を示すブロック図である。
乗算部 401,1593,5204,5206 閾値記憶部 402,1594,5203,5205 比較部 404,4075 定数乗算器 405 対数計算部 406 パワー計算部 407,5071,70710〜7071K-1 重みつき
加算部 408,706,5072 重み記憶部 409,5202 論理否定回路 502,505,602,603 分離部 503,604,804,147 多重化部 5040〜504K-1,5060〜506K-1,507,5
080〜508K-1,5140〜514K-1 周波数別推定
雑音計算部 520,521,522 更新判定部 6010〜601K-1,5041,5048 除算部 611,612 周波数別パワー計算部 701 多重値域限定処理部 702 後天的SNR記憶部 703 抑圧係数記憶部 707 多重重みつき加算部 708,4063,4072,4074,5046,6
1100〜6110M-1加算器 712,1401,5942 推定雑音記憶部 713 強調音声パワースペクトル記憶部 8010〜801K-1 抑圧係数検索部 811 ゲイン関数値計算部 812 一般化尤度比計算部 813 音声存在確率記憶部 814 抑圧係数計算部 901 劣化音声パワー 902 閾値 903,923 重み 904 更新閾値 905 重みつき加算部制御信号 9100〜910K-1,9100〜910ML-1 周波数別
劣化音声パワースペクトル 9110〜911K-1,9110〜911ML-1 帯域別劣
化音声パワースペクトル 921 瞬時推定SNR 9210〜921K-1 周波数別瞬時推定SNR 922 過去の推定SNR 9220〜922K-1 過去の周波数別推定SNR 924 推定先天的SNR 9240〜924K-1 周波数別推定先天的SNR 1405 多重非線形処理部 14850〜1485K-1,5042 非線形処理部 15010〜1501K-1 周波数別抑圧係数補正部 1591,70120〜7012K-1 最大値選択部 1592 抑圧係数下限値記憶部 1595,5044 スイッチ 1596 修正量記憶部 1597,17010〜1701K-1,40620〜406
2K-1,4071,4073,5043 乗算器 5045 シフトレジスタ 5047 最小値選択部 5201,5211,5221 論理和計算部 5207 閾値計算部 5941 レジスタ長記憶部 7011 定数記憶部 8011 抑圧係数テーブル 8012,8013 アドレス変換部
Claims (18)
- 【請求項1】 入力信号を周波数領域信号に変換し、該
周波数領域信号に基づいて信号対雑音比を求め、該信号
対雑音比に基づいて抑圧係数を定め、該抑圧係数に基づ
いて前記周波数領域信号を重みづけし、該重みづけされ
た周波数領域信号を時間領域信号に変換することによっ
てノイズを除去した出力信号を得る際に、前記入力信号
に第1の窓がけを施してから周波数領域信号に変換し、
前記時間領域信号に第2の窓がけを施して前記出力信号
を得ることを特徴とするノイズ除去方法。 - 【請求項2】 前記第1の窓がけを施す際の第1の窓関
数と前記第2の窓がけを施す際の第2の窓関数とが、前
記抑圧係数を1に設定したときの前記入力信号と前記出
力信号が一致するような特性を有することを特徴とする
請求項1記載のノイズ除去方法。 - 【請求項3】 前記第1の窓がけを施す際の第1の窓関
数と前記第2の窓がけを施す際の第2の窓関数とが等し
いことを特徴とする請求項1又は2記載のノイズ除去方
法。 - 【請求項4】 前記抑圧係数を補正して得られる補正抑
圧係数を用いて前記周波数領域信号を重みづけすること
を特徴とする請求項1、2又は3記載のノイズ除去方
法。 - 【請求項5】 前記信号対雑音比を補正して得られる補
正信号対雑音比に基づいて前記抑圧係数を定めることを
特徴とする請求項1、2又は3記載のノイズ除去方法。 - 【請求項6】 前記周波数領域信号を重みづけして重み
つき周波数領域信号を求め、該重みつき周波数領域信号
を用いて推定雑音を求め、該推定雑音と前記周波数領域
信号を用いて信号対雑音比を求めることを特徴とする請
求項1、2、3、4又は5記載のノイズ除去方法。 - 【請求項7】 入力信号を周波数領域信号に変換し、該
周波数領域信号に基づいて推定雑音を求め、該推定雑音
に対応した値を前記周波数領域信号から差し引いて周波
数領域の強調音声を求め、該強調音声を時間領域信号に
変換することによってノイズを除去した出力信号を得る
際に、前記入力信号に第1の窓がけを施してから周波数
領域信号に変換し、前記時間領域信号に第2の窓がけを
施して出力信号を得ることを特徴とするノイズ除去方
法。 - 【請求項8】 前記周波数領域信号を重みづけして重み
つき周波数領域信号を求め、該重みつき周波数領域信号
を用いて前記推定雑音を求めることを特徴とする請求項
7記載のノイズ除去方法。 - 【請求項9】 前記周波数領域信号を重みづけして重み
つき周波数領域信号を求める際に、信号対雑音比を用い
て重みを求めることを特徴とする請求項6又は8記載の
ノイズ除去方法。 - 【請求項10】 前記周波数領域信号を重みづけして重
みつき周波数領域信号を求める際に、信号対雑音比を用
いて重みを求め、該重みを非線形関数によって処理して
補正重みを求め、該補正重みを用いて前記周波数領域信
号を重みづけすることを特徴とする請求項6又は8記載
のノイズ除去方法。 - 【請求項11】 入力信号に窓がけ処理を施す第1の窓
がけ処理部と、 前記第1の窓がけ処理部で窓がけ処理が施された入力信
号を周波数領域信号に変換する変換部と、 前記変換部で変換された周波数領域信号の振幅成分に基
づいて信号対雑音比を求める信号対雑音比計算部と、 前記信号雑音比計算部で求められた信号対雑音比に基づ
いて抑圧係数を生成する抑圧係数生成部と、 前記抑圧係数生成部で生成された抑圧係数に基づいて前
記周波数領域信号の振幅成分を重みづけするための乗算
部と、 前記乗算部で重みづけされた周波数領域信号の振幅成分
と前記変換部で変換された周波数領域信号の位相成分を
時間領域信号に変換する逆変換部と、 前記逆変換部で変換された時間領域信号に窓がけ処理を
施す第2の窓がけ処理部とを備えることを特徴とするノ
イズ除去装置。 - 【請求項12】 前記第1の窓がけ処理部で窓がけ処理
を施す際の第1の窓関数と前記第2の窓がけ処理部で窓
がけ処理を施す際の第2の窓関数とが、前記抑圧係数を
1に設定したときの入力信号と出力信号とが一致するよ
うな特性を有することを特徴とする請求項11記載のノ
イズ除去装置。 - 【請求項13】 前記第1の窓がけ処理部で窓がけ処理
を施す際の第1の窓関数と前記第2の窓がけ処理部で窓
がけ処理を施す際の第2の窓関数とが等しいことを特徴
とする請求項11又は12記載のノイズ除去装置。 - 【請求項14】 前記抑圧係数を補正する抑圧係数補正
部を有し、前記乗算部は前記抑圧係数補正部で補正され
た補正抑圧係数を用いて前記周波数領域信号の振幅成分
を重みづけすることを特徴とする請求項11、12又は
13記載のノイズ除去装置。 - 【請求項15】 前記抑圧係数生成部は、前記信号対雑
音比を補正して補正信号対雑音比を求める補正信号対雑
音比計算部を含むことを特徴とする請求項14記載のノ
イズ除去装置。 - 【請求項16】 前記信号対雑音比計算部は、前記周波
数領域信号の振幅成分を用いて雑音を推定する推定雑音
計算部を含み、当該推定雑音計算部の推定結果に基づい
て前記信号対雑音比を求めることを特徴とする請求項1
1,12,13,14又は15記載のノイズ除去装置。 - 【請求項17】 前記推定雑音計算部は、前記周波数領
域信号の振幅成分を重みづけして重みつき振幅成分を求
める重みつき劣化音声計算部を含むことを特徴とする請
求項16記載のノイズ除去装置。 - 【請求項18】 前記重みつき劣化音声計算部は、前記
信号対雑音比を非線形関数によって処理して重み係数を
求める非線形処理部を含むことを特徴とする請求項17
記載のノイズ除去装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001327839A JP2003131689A (ja) | 2001-10-25 | 2001-10-25 | ノイズ除去方法及び装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001327839A JP2003131689A (ja) | 2001-10-25 | 2001-10-25 | ノイズ除去方法及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003131689A true JP2003131689A (ja) | 2003-05-09 |
Family
ID=19143999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001327839A Withdrawn JP2003131689A (ja) | 2001-10-25 | 2001-10-25 | ノイズ除去方法及び装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2003131689A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005202222A (ja) * | 2004-01-16 | 2005-07-28 | Toshiba Corp | ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置 |
WO2006046293A1 (ja) * | 2004-10-28 | 2006-05-04 | Fujitsu Limited | 雑音抑圧装置 |
WO2007029536A1 (ja) | 2005-09-02 | 2007-03-15 | Nec Corporation | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
WO2007058121A1 (ja) * | 2005-11-15 | 2007-05-24 | Nec Corporation | 残響抑圧の方法、装置及び残響抑圧用プログラム |
CN101091209B (zh) * | 2005-09-02 | 2010-06-09 | 日本电气株式会社 | 抑制噪声的方法及装置 |
US8090119B2 (en) | 2007-04-06 | 2012-01-03 | Yamaha Corporation | Noise suppressing apparatus and program |
JP2015049354A (ja) * | 2013-08-30 | 2015-03-16 | 富士通株式会社 | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
-
2001
- 2001-10-25 JP JP2001327839A patent/JP2003131689A/ja not_active Withdrawn
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4542790B2 (ja) * | 2004-01-16 | 2010-09-15 | 株式会社東芝 | ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置 |
JP2005202222A (ja) * | 2004-01-16 | 2005-07-28 | Toshiba Corp | ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置 |
WO2006046293A1 (ja) * | 2004-10-28 | 2006-05-04 | Fujitsu Limited | 雑音抑圧装置 |
JP5092748B2 (ja) * | 2005-09-02 | 2012-12-05 | 日本電気株式会社 | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
EP2555190A1 (en) | 2005-09-02 | 2013-02-06 | NEC Corporation | Method, apparatus and computer program for suppressing noise |
CN101091209B (zh) * | 2005-09-02 | 2010-06-09 | 日本电气株式会社 | 抑制噪声的方法及装置 |
US9318119B2 (en) | 2005-09-02 | 2016-04-19 | Nec Corporation | Noise suppression using integrated frequency-domain signals |
CN101300623B (zh) * | 2005-09-02 | 2011-07-27 | 日本电气株式会社 | 用于抑制噪声的方法、设备和计算机程序 |
US8489394B2 (en) | 2005-09-02 | 2013-07-16 | Nec Corporation | Method, apparatus, and computer program for suppressing noise |
US8477963B2 (en) | 2005-09-02 | 2013-07-02 | Nec Corporation | Method, apparatus, and computer program for suppressing noise |
JPWO2007029536A1 (ja) * | 2005-09-02 | 2009-03-19 | 日本電気株式会社 | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
US8233636B2 (en) | 2005-09-02 | 2012-07-31 | Nec Corporation | Method, apparatus, and computer program for suppressing noise |
WO2007029536A1 (ja) | 2005-09-02 | 2007-03-15 | Nec Corporation | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
JP4973873B2 (ja) * | 2005-11-15 | 2012-07-11 | 日本電気株式会社 | 残響抑圧の方法、装置及び残響抑圧用プログラム |
US8073147B2 (en) | 2005-11-15 | 2011-12-06 | Nec Corporation | Dereverberation method, apparatus, and program for dereverberation |
WO2007058121A1 (ja) * | 2005-11-15 | 2007-05-24 | Nec Corporation | 残響抑圧の方法、装置及び残響抑圧用プログラム |
US8090119B2 (en) | 2007-04-06 | 2012-01-03 | Yamaha Corporation | Noise suppressing apparatus and program |
JP2015049354A (ja) * | 2013-08-30 | 2015-03-16 | 富士通株式会社 | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4282227B2 (ja) | ノイズ除去の方法及び装置 | |
JP3454206B2 (ja) | 雑音抑圧装置及び雑音抑圧方法 | |
KR101052445B1 (ko) | 잡음 억압을 위한 방법과 장치, 및 컴퓨터 프로그램 | |
JP4670483B2 (ja) | 雑音抑圧の方法及び装置 | |
KR100927897B1 (ko) | 잡음억제방법과 장치, 및 컴퓨터프로그램 | |
RU2127454C1 (ru) | Способ понижения шума и устройство для его осуществления | |
EP1806739B1 (en) | Noise suppressor | |
JP5435204B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
WO2002080148A1 (fr) | Dispositif eliminateur de bruit | |
US20010005822A1 (en) | Noise suppression apparatus realized by linear prediction analyzing circuit | |
JP3858668B2 (ja) | ノイズ除去方法及び装置 | |
JP2007006525A (ja) | ノイズ除去の方法及び装置 | |
WO2012070668A1 (ja) | 信号処理装置、信号処理方法、及び信号処理プログラム | |
JP2008216721A (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP4395772B2 (ja) | ノイズ除去方法及び装置 | |
JP2003131689A (ja) | ノイズ除去方法及び装置 | |
JP5413575B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
EP1278185A2 (en) | Method for improving noise reduction in speech transmission | |
JP4968355B2 (ja) | 雑音抑圧の方法及び装置 | |
JP2022011890A (ja) | ノイズ更新回路 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20040423 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050816 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051028 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051227 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060413 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20060515 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060608 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060515 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060704 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20060810 |