JP3484757B2 - 音声信号の雑音低減方法及び雑音区間検出方法 - Google Patents
音声信号の雑音低減方法及び雑音区間検出方法Info
- Publication number
- JP3484757B2 JP3484757B2 JP09986994A JP9986994A JP3484757B2 JP 3484757 B2 JP3484757 B2 JP 3484757B2 JP 09986994 A JP09986994 A JP 09986994A JP 9986994 A JP9986994 A JP 9986994A JP 3484757 B2 JP3484757 B2 JP 3484757B2
- Authority
- JP
- Japan
- Prior art keywords
- noise
- value
- voice
- signal
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 43
- 230000009467 reduction Effects 0.000 title claims description 18
- 238000001514 detection method Methods 0.000 title description 11
- 238000001228 spectrum Methods 0.000 claims description 30
- 238000012545 processing Methods 0.000 claims description 23
- 230000001629 suppression Effects 0.000 claims description 22
- 238000009499 grossing Methods 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 9
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 description 32
- 238000007476 Maximum Likelihood Methods 0.000 description 11
- 230000007774 longterm Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 125000000205 L-threonino group Chemical group [H]OC(=O)[C@@]([H])(N([H])[*])[C@](C([H])([H])[H])([H])O[H] 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 238000011045 prefiltration Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02168—Noise filtering characterised by the method used for estimating noise the estimation exclusively taking place during speech pauses
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
- G10L2025/786—Adaptive threshold
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Noise Elimination (AREA)
- Time-Division Multiplex Systems (AREA)
Description
法及び雑音区間検出方法に関し、特に、入力音声信号に
基づいて算出されたSN比及び音声存在確率に基づい
て、音声成分を算出するための最尤フィルタを適応的に
制御することで雑音抑圧を行う音声信号の雑音低減方
法、及びこの雑音低減方法に用いて好適な雑音区間検出
方法に関する。
て、収音された音声信号に含まれる環境雑音や背景雑音
等の雑音を抑圧し、音声成分を強調することが必要とさ
れている。
術として、減衰ファクタの調整のために条件付き確率関
数を用いる例が、文献「軟判定雑音抑圧フィルタを用い
る音声強調」(Speech Enhancement Using a Soft-Deci
sion Noise Suppression Filter, R.J.McAulay, M.L.Ma
lpass, IEEE Trans. Acoust.,Speech, Signal Processi
ng, Vol.28, pp.137-145, April 1980)や、「移動電話
システムにおける周波数領域雑音抑圧研究」(Frequenc
y Domain Noise Suppression Approach in Mobile Tele
phone Systems, J.Yang, IEEE ICASSP, Vol.II, pp.363
-366, April 1993)等に開示されている。
の雑音抑圧技術においては、不適切な固定のSNR(信
号対雑音比)に基づく動作をするため、又は不適切な抑
圧ファクタにより、音色の不自然さや歪んだ音声を生ず
ることがある。実際の運用の際に、最適の性能を得るた
めに雑音抑圧装置のパラメータの1つであるSNRを調
整することは、ユーザにとって望ましいことではない。
さらに、従来の音声信号強調技術は、短時間SNRの大
きな変動がある音声信号に対して副作用として発生して
しまう歪を持たせずに充分雑音を除去することは困難で
ある。
減方法においては、雑音区間検出の技術が用いられ、入
力レベルやパワー等を所定の閾値で比較することにより
雑音区間判別を行っているが、音声にトラッキングする
ことを防ぐために閾値の時定数を大きくすると、ノイズ
レベルが変化するとき、特に増加するときに追従できな
くなり、誤判別が生じ易くなる。
であり、入力音声信号に応じて実際の入力のSNRに最
適化した抑圧ファクタに調整が行われ、ユーザが使用に
先立って調整等を行う必要がなく、副作用的な歪を発生
すること無く充分な雑音除去が行えるような音声信号の
雑音低減方法の提供を目的とする。
じて最適の閾値による雑音区間判別が行われて、ノイズ
レベル変動時にも誤判断が生じないような雑音区間検出
方法を提供することである。
雑音低減方法は、入力音声信号に基づいて算出されたS
N比及び音声存在確率に基づいて、音声成分を算出する
ためのフィルタを適応的に制御することで雑音抑圧を行
う音声信号の雑音低減方法であって、上記音声存在確率
の算出に、入力信号のスペクトルから推定雑音スペクト
ルを減算したものを用いることを特徴とする。
記減算出力の値と一定値とを比較して大きい方を取り出
したものを用いるのが好ましい。また、この比較結果に
ついて、現フレームの値と前フレームの値に一定の減衰
係数を乗算した値とを比較して大きい方を取り出したも
のを用いることが好ましい。
波数軸方向と時間軸方向の円滑化フィルタ処理を施すこ
とが挙げられ、上記周波数軸方向の円滑化フィルタ処理
に、処理対象の周波数帯域の上記最尤フィルタ特性と隣
接する周波数帯域の最尤フィルタ特性との中央値あるい
はメジアン値を用いることが好ましい。
いて算出される閾値Th2 を用いて現フレームの相対エネ
ルギを弁別した結果と、上記RMS値を閾値Th1 で比較
した結果とに基づいて上記雑音区間検出を行うことが好
ましい。上記閾値Th2 は、後述する実施例においては、
dBthresrel[k] とされており、フレーム毎の相対エネル
ギはdBrel とされている。なお、相対エネルギdB
rel は、直前に存在した信号エネルギのローカルピーク
に基づく値との相対値で現在の信号エネルギを記述した
ものである。
を、上記本発明に係る音声信号の雑音低減方法に用いる
ことが好ましい。
ば、入力信号のスペクトルから雑音推定スペクトルを減
算するスペクトルサブトラクションにより音声存在確率
を算出し、この算出された音声存在確率に基づいて、最
尤フィルタを適応的に制御しているため、入力音声信号
のSNRに応じて最適の抑圧ファクタに調整が行われ、
ユーザが使用に先立って調整等を行う必要が無い。
雑音区間判別のための閾値Th1 を求めるのに用いられる
値thを、現フレームのRMS値と前フレームの値thに係
数αを乗算したものとの小さい方の値を用いて算出し、
係数αを現フレームのRMS値に応じて切り換えている
ため、入力信号に応じた最適の閾値による雑音区間判別
が行われて、ノイズレベル変動時にも誤判断が生じな
い。
法の好ましい実施例について、図面を参照しながら説明
する。図1は、本発明の実施例となる音声信号のノイズ
低減方法が適用されたノイズ低減装置の概略構成を示す
ブロック回路図である。
声(speech)成分と雑音(noise )成分とを含む入力信
号y[t]が供給されている。この入力信号y[t]は、例えば
サンプリング周波数がFSのディジタル信号であり、フレ
ーム化・窓かけ処理回路12に送られて、フレーム長が
FLサンプルのフレームに分割され、以下各フレーム毎に
処理が行われる。このフレームの時間軸方向の移動量で
あるフレーム間隔はFIサンプルであり、第k+1フレーム
は第kフレームからFIサンプル後に開始されることにな
る。次の直交変換である例えばFFT(高速フーリエ変
換)回路13での計算に先立って、フレーム化・窓かけ
処理回路12では、各フレームの信号に対して窓関数w
input による窓かけ処理が施される。なお、各フレーム
毎の信号処理の終段での後述する逆FFTあるいはIF
FTの後には、出力信号に対して窓関数woutputによる
窓かけ処理が施される。このような各窓関数winput 及
びwoutputの一例を、次の(1)式及び(2)式にそれ
ぞれ示す。
挙げると、サンプリング周波数FSを8000Hz=8kHzとす
るとき、フレーム間隔FIを80サンプルとすると10ms
に、またフレーム長FLを160サンプルとすると20ms
に相当することになる。
トのFFT処理が施され、得られた周波数スペクトル振
幅値は、バンド分割回路14により例えば18バンドに
分割される。これらの各バンドの周波数レンジの一例
を、次の表1に示す。
ムが高域ほど知覚分解能が劣化することに基づいてい
る。各帯域の振幅として、対応する周波数レンジ内の最
大FFT振幅を用いる。
信号y[t]中のノイズを音声から区別し、ノイズと推定さ
れるフレームを検出している。この雑音区間推定あるい
はノイズフレーム検出処理は、例えば3種類の検出処理
を組み合わせている。この雑音区間推定の具体例につい
て、図2を参照しながら説明する。
号y[t]は、RMS(自乗平均の平方根、Root Mean Squa
re)計算回路15Aに送られて各フレーム毎の短時間R
MS値が計算され、このRMS計算回路15Aからの出
力が、相対エネルギ計算回路15B、最小RMS計算回
路15C、最大信号計算回路15D及び雑音スペクトル
推定回路15Eに送られている。また、雑音スペクトル
推定回路15Eには、これらの相対エネルギ計算回路1
5B、最小RMS計算回路15C及び最大信号計算回路
15Dからの各出力と、上記バンド分割回路14からの
出力とが送られている。
ム毎の信号のRMS値の計算を行っている。第kフレー
ムのRMS値であるRMS[k]は、次の式で計算される。
ームからの減衰エネルギに関連する第kフレームの相対
エネルギを示すdBrel[k]を計算している。このdB表
示の相対エネルギdBrel[k]は、次の(4)式により算
出され、この(4)式中のエネルギ値E[k] 及び減衰エ
ネルギ値Edecay[k]は、それぞれ次の(5)式及び
(6)式により求められる。
と表すことができるから、RMS計算回路15Aからの
出力であるRMS[k]を用いることができるが、RMS計算
回路15Aでの上記(3)式の計算の途中で得られる上
記(5)式の値をそのまま相対エネルギ計算回路15B
に送るようにしてもよいことは勿論である。また上記
(6)式においては、減衰時間(ディケイタイム)を
0.65sec とした例を示している。
ギEdecay[k]の具体例を、図3に示す。
ラウンドノイズあるいは背景雑音のレベルを評価するの
に好適な最小RMS値を求めている。ここでは、上記フ
レーム毎の短期間(short term)及び複数フレームに亘
る長期間(long term )での最小RMS値を計算してい
る。この長期間値が用いられるのは、短期間値がノイズ
レベルにの大きな変化にトラッキングできない、すなわ
ち追従できないときである。短期間での最小ノイズRM
S値MinNoiseshort は、次の(7)式により算出され
る。
short は、音声(speech)無しの背景雑音、いわゆるバ
ックグラウンドノイズのときに上昇してゆくように設定
されている。ノイズレベルが高いときの上昇のレートは
指数関数的であるが、低いノイズレベルのときには、よ
り大きな上昇を得るために固定の上昇レートが用いられ
る。
longは、例えば0.6秒毎に算出される。この値MinNoi
selongは、上記dB表示の相対エネルギdBrel が19
dBを超えるようなフレームのRMS値、すなわち上記
短時間RMS値で、現時点より前の1.8秒間における
最小値である。もしこの1.8秒間で上記dBrel が1
9dBを超える値が存在しなければ、上記長期間値MinN
oiselongは使用されない。なぜなら、信号の現時点より
前の1.8秒間には、背景雑音のみのフレームを含まな
いからである。上記各0.6秒毎の区間において、も
し、MinNoiselong>MinNoiseshort であれば、直ちにMi
nNoiseshort をMinNoiselongの値に設定する。
値や最大SNR(SN比)値を計算している。最大RM
S値は、最適あるいは最大SNR値を算出するのに用い
られる。この最大RMS値も、短期間と長期間の値を計
算する。短期間の最大RMS値MaxSignalshortは、次の
(8)式により求められる。
は、0.4秒毎に算出される。この値MaxSignal
shortは、フレームRMS値で現時点より前の0.8秒
間における最大の値である。上記各0.4秒毎の区間に
おいて、もしMaxSignallong がMaxSignalshortより小さ
いときは、MaxSignalshortは、 (0.7・MaxSignalshort+0.3・MaxSignallong ) の値に設定する。
ズRMS値MinNoise[k] 及び最大信号RMS値MaxSigna
l[k]の具体例を、図4に示す。この図4中で、最小ノイ
ズRMS値MinNoise[k] は、上記長期間の値MinNoise
longを考慮に入れた上記短期間の値MinNoiseshort を示
すものであり、また、最大信号RMS値MaxSignal[k]
も、上記長期間の値MaxSignallong を考慮に入れた上記
短期間の値MaxSignalshortを示すものである。
shortと上記短期間最小ノイズRMS値MinNoiseshort
とを用いることによって、信号の最大SNR値が推定さ
れる。ノイズ区間判定の閾値とノイズ抑圧特性は、この
推定に基づいて行われ、ノイズの無いクリーンな音声信
号を歪ませる可能性を低減するように変更される。最大
SNR値MaxSNRは、次の(9)式にて算出される。
ベルを示す0から1までの範囲の正規化パラメータNR_l
evelが算出される。以下のNR_levelの関数が用いられ
る。
動作を説明する。上記相対エネルギ計算回路15B、最
小RMS計算回路15C及び最大信号計算回路15Dに
おいて算出した値は、音声(speech)を背景雑音(back
ground noise)から区別するために用いられる。次の条
件が正しいとき、第kフレーム中の信号は背景雑音とし
て分類される。
示の相対エネルギdBrel[k]と、最大SNR値MaxSNR
[k] と、雑音判別の閾値の1つであるdBthresrel[k] と
の具体例を示している。また図6は、上記(10)式の
MaxSNR[k] の関数としてのNR_level[k] を示している。
して分類される場合、ノイズスペクトルの時間平均推定
値N[w,k]は、現在フレームの信号のスペクトルY[w,k]に
よって、次の(12)式のように更新される。なお、w
は上記バンド分割のバンドの番号を示すものである。
して分類された場合、N[w,k]はN[w,k-1]の値をそのまま
用いる。
からの出力は、音声推定回路16、Pr(Sp)計算回路1
7、Pr(Sp|Y) 計算回路18及び最尤フィルタ19に送
られている。
れた各周波数バンド毎のSN比を計算している。音声推
定回路16には、上記バンド分割回路14からのスペク
トル振幅データY[w,k]と、雑音推定回路15からのノイ
ズスペクトル振幅推定データN[w,k]とが供給されてお
り、これらのデータに基づいて音声スペクトル推定デー
タS[w,k]を得ている。ノイズの無いクリーンな音声スペ
クトルの粗い推定値は、後述する確率Pr(Sp|Y) を算出
するのに用いられる。これは、先ず、次の(13)式に
よりスペクトルの差をとることで計算される。
スペクトルの推定値S[w,k]が、上記(13)式により算
出した音声スペクトルの粗い推定値S'[w,k] を用いて、
次の(14)式により算出される。(14)式において
は、減衰速度decay_rateを、式中の値としている。
5)式により計算される。(15)式において、ノイズ
スペクトルの推定値N[ ]は上記(12)式から、音声ス
ペクトルの推定値S[ ]は上記(14)式から求めること
ができる。
する。ここで、確率Pr(Sp)は、想定した入力信号中で音
声信号が存在する確率である。従来は常に0.5 に固定
されていた。ここで、SN比の高い信号については、確
率Pr(Sp)は、音質劣化を防ぐために、高くすればよい。
このような確率Pr(Sp)は、最大信号計算回路15Dで算
出されたNR_level関数を用いて、(16)式により計算
される。
説明する。Pr(Sp|Y) は、上記入力信号y[t]中に音声信
号が実際に存在する確率で、Pr(Sp)とSNR[w,k]を用いて
算出される。またPr(Sp|Y) は、無音声の区画をより狭
くとるために用いられる。算出に当たっては、文献「軟
判定抑圧フィルタを用いた音声強調」(R. McAulay,M.
Malpass, "Speech Enhancement Using a Soft-Decision
Noise SuppressionFilter", IEEE Transactions on Ac
oustics, Speech, and Signal Processing,Vol.ASSP-2
8, No.2, April 1980 )に開示された方法を採用した。
その方法を下記に示す。
いて、H0は無音声事象、すなわち入力信号y(t)がノイズ
信号n(t)のときを、H1は音声事象、すなわち入力信号y
(t)が音声信号s(t)とノイズ信号n(t)との和であって s
(t)≠0のときをそれぞれ示し、wは上記分割バンドのバ
ンドの番号を、kはフレーム番号を、Yは入力信号Y[w,k]
を、Sは音声信号推定値S[w,k]を、そしてσはノイズ信
号推定値の二乗N[w,k]2をそれぞれ示している。
る。また、(17)式中のp(Y|H0)は(18)式より、
p(Y|H1)は(19)式より求められる。そして(20)
式からはベッセル関数I0(|X|)を算出する。ベッセル
関数は、次の(21)式により近似される。
用いずにPr(H1|Y) を得るために、固定されたSN比の
値(SNR=5 等)を用いていた。よってp(Y|H1)は、次の
(22)式のように単純化されていた。
り低い瞬時SN比を持つ信号は、大きく抑圧されてい
る。ここで、上記SN比の値SNR が過度に高く設定され
たと仮定すると、比較的小さなレベルのノイズで歪まさ
れた音声でも、低レベルの音声部分が過剰に弱められ、
この結果得られた音声は、不自然なものになってしま
う。また逆に、上記SN比の値SNR が過度に低く設定さ
れると、比較的大きなレベルのノイズで歪まされた音声
で、低レベルの音声部分でも、抑圧が足りなく、ノイジ
ーに感じられる。従って、固定した上記SN比の値SNR
を用いる代わりに、本実施例に示すように可変のSN比
の値SNRnew[w,k] を用いると、広範囲のバックグランド
/音声レベルに対応したp(Y|H1)が得られる。そのSNR
new[w,k] は、次の(23)式により求められる。(2
3)式中のMIN_SNR の値は、(24)式により求めた値
を用いる。
た第kフレームにおける瞬時SNRである。このSNRnew
[w,k] は、全体として高いSN比を有する信号に対して
は1.5 まで落とすことができ、そのような場合には瞬
時SNRの低いセグメントに対して抑圧を行わないよう
にしている。全体として低い瞬時SN比を有する信号に
対しては3より小さな値になることはできない。従っ
て、瞬時SNRの低いセグメントに対しても充分な抑圧
を維持できる。
る。この最尤フィルタ19は、上記バンド分割の各バン
ドの入力信号から、雑音信号を除くために設けられたプ
レフィルタの一つである。この最尤フィルタ19におい
ては、上記バンド分割回路14からのスペクトル振幅デ
ータY[w,k]を、雑音推定回路15からのノイズスペクト
ル振幅データN[w,k]を用いて、H[w,k]という信号に変換
する。H[w,k]は、次の(25)式により算出される。
は、上記αを1/2としていたが、本実施例ではSNR
の概略の値がわかっているので、雑音抑圧の程度は最大
SNRに依存して可変とすることができる。
明する。この軟判定抑圧回路20は、最尤フィルタ19
からの信号H[w,k]から、音声部分の信号を強調するため
に設けられた、プレフィルタの一つである。信号H[w,k]
と Pr(Sp|Y)計算回路18からの値Pr(H1|Y)を用い
て、次の(26)式に示す方法で変換する。 H[w,k]←Pr(H1|Y)[w,k]・H[w,k]+(1-Pr(H1|Y)[w,k])・MIN_GAIN …(26) この(26)式中のMIN_GAINとは、最小利得を示すパラ
メータで、例えば0.1すなわち−15dBとすればよ
い。
明する。ここでは、周波数軸方向と時間軸方向とについ
て、軟判定抑圧回路20からの信号H[w,k]がフィルタ処
理される。周波数軸方向のフィルタ処理は、信号H[w,k]
の有効インパルス応答長を短くする効果がある。これに
より周波数領域での乗算によるフィルタの実現に起因す
る環状畳み込みによるエリアシングの発生を未然に防い
でいる。また、時間軸方向のフィルタ処理は、突発的な
雑音を抑えるフィルタの変化の速さを制限する効果があ
る。
ての説明をする。上記バンド分割で例えば18バンドに
分割された各バンドの信号H[w,k]の、メディアン(中央
値)フィルタ処理を施す。次の(27)、(28)式
で、この方法を示す。 Step1:H1[w,k]=max(median(H[w-1,k],H[w,k],H[w+1,k]),H[w,k]) …(27) ただし、w-1又はw+1が存在しないときは、H1[w,k]=H
[w,k] Step2:H2[w,k]=min(median(H1[w-1,k],H1[w,k],H1[w+1,k]),H1[w,k]) …(28) ただし、w-1又はw+1が存在しないときは、H2[w,k]=H1
[w,k]
単一のあるいは孤立した0のバンドを無くしたH[w,k]で
あり、第2段階(Step1) において、H2[w,k] は、単一の
あるいは孤立した突出したバンドを無くしたH1[w,k] で
ある。この周波数軸方向のフィルタ処理により得られる
信号は、H2[w,k] となる。
説明する。時間軸方向のフィルタ処理を施す際におい
て、入力信号には、音声、バックグランドノイズ、そし
て音声の立ち上がり部分である過渡的状態の3種あるこ
とを考慮に入れる。音声の信号に対しては、次の(2
9)式に示すように時間軸での円滑化あるいはスムージ
ングを行う。
式に示すような時間軸での円滑化あるいはスムージング
を行う。 Hnoise[w,k]=0.7・Min_H+0.3・Max_H ・・・ (30) この(30)式において、Min_H 、Max_H は、それぞ
れ、 Min_H=min(H2[w,k],H2[w,k-1]) Max_H=max(H2[w,k],H2[w,k-1])
スムージングは行わない。最終的に、次の(31)式に
より円滑化出力信号Ht_smooth[w,k]を得るような計算が
行われる。 Ht_smooth[w,k] =(1-αtr)(αsp・Hspeech[w,k]+(1-αsp)・Hnoise[w,k])+αtr・H2[w,k] ・・・ (31)
2)式から、αtrは次の(33)式からそれぞれ求めら
れる。
明する。ここでは、フィルタ処理回路21からの例えば
18バンド分の信号Ht_smooth[w,k]を、例えば128バ
ンド分の信号H128[w,k] に、補間処理により拡張変換す
る。この変換は、例えば2段階で行っており、18バン
ドから64バンドへの拡張はゼロ次ホールドにより、6
4バンドから128バンドへの拡張はローパスフィルタ
型の補間処理により、それぞれ行っている。
を説明する。FFT回路13で得られた入力信号のFF
T係数の実部と虚部に各々上記信号H128[w,k] を乗じて
スペクトラム修正を行う。この結果、スペクトルの振幅
は修正されるが位相は変形を受けない。
クトラム修正回路23で得た信号を用いて、逆高速フー
リエ変換(IFFT)を行う。
フレーム毎のIFFT出力信号のフレーム境界部分につ
いての重ね合わせ加算をする。出力端子26からは、以
上説明したような手順で雑音低減処理された出力信号を
得ることができる。
ば携帯用電話機の各種エンコーダ回路や、音声認識装置
の信号処理回路等に送られる。あるいは携帯用電話機の
デコーダ出力信号に本雑音抑圧処理を施してもよい。
れるものではなく、例えば、従来より知られた最尤フィ
ルタを用いる雑音抑圧技術において、上記フィルタ処理
回路21によるフィルタ処理を施すようにしてもよい。
また、上記雑音推定回路15における雑音区間検出方法
は、雑音低減装置のみならず、他の種々の装置に適用可
能である。
よれば、入力音声信号に基づいて算出されたSN比及び
音声存在確率に基づいて、音声成分を算出するためのフ
ィルタを適応的に制御することで雑音抑圧を行う音声信
号の雑音低減方法であって、上記音声存在確率の算出
に、入力信号のスペクトルから推定雑音スペクトルを減
算したものを用いることにより、入力音声信号のSNに
応じて最適の雑音抑圧ファクタに調整が行われ、ユーザ
が使用に先立って調整等を行う必要が無い。
存在確率を高くすることにより、副作用的な歪を発生す
ることなく充分な雑音除去が行える。
れば、入力音声信号をフレーム単位で区分して各フレー
ム毎にRMS(自乗平均の平方根)値を求め、このRMS
値を閾値(NoiseRMSthres)で比較することにより雑音区
間を検出する雑音区間検出方法において、上記閾値(Noi
seRMSthres)を求めるための値(MinNoiseshort)を、現フ
レームのRMS値と前フレームの値(MinNoiseshort)に
係数αを乗算したものとの小さい方の値を用いて算出
し、係数αを現フレームのRMS値に応じて切り換える
ことにより、入力信号に応じた最適の閾値による雑音区
間判別が行われて、ノイズレベル変動時にも誤判断が生
じない。
が適用される回路構成を説明するためのブロック回路図
である。
の具体例を示すブロック回路図である。
衰エネルギEdecay[k]の具体例を示す図である。であ
る。
[k]、最小ノイズRMS値MinNoise[k] 及び最大信号R
MS値MaxSignal[k]の具体例を示す図である。
ギdBrel[k]、最大SNR値MaxSNR[k] 、及び雑音判別
の閾値の1つであるdBthresrel[k] の具体例を示す図で
ある。
[k] に対して定義される関数としてのNR_level[k] を示
すグラフである。
Claims (7)
- 【請求項1】 入力音声信号に基づいて算出されたSN
比及び音声存在確率に基づいて、音声成分を算出するた
めのフィルタを適応的に制御することで雑音抑圧を行う
音声信号の雑音低減方法であって、 上記音声存在確率の算出に、入力信号のスペクトルから
推定雑音スペクトルを減算したものを用いることを特徴
とする音声信号の雑音低減方法。 - 【請求項2】 上記音声存在確率の算出には、現フレー
ムの値と前フレームの値に一定の減衰係数を乗算した値
とを比較して大きい方を取り出したものを用いることを
特徴とする請求項1記載の音声信号の雑音低減方法。 - 【請求項3】 上記フィルタの特性に対して、周波数軸
方向と時間軸方向の円滑化フィルタ処理を施すことを特
徴とする請求項1記載の音声信号の雑音低減方法。 - 【請求項4】 入力音声信号に基づいて算出されたSN
比及び音声存在確率に基づいて、音声成分を算出するた
めのフィルタを適応的に制御することで雑音抑圧を行う
音声信号の雑音低減方法であって、上記フィルタの特性
に対して、周波数軸方向と時間軸方向の円滑化フィルタ
処理を施すことを特徴とする音声信号の雑音低減方法。 - 【請求項5】 上記周波数軸方向の円滑化フィルタ処理
に、処理対象の周波数帯域の上記フィルタの特性と隣接
する左右の周波数帯域のフィルタの特性とのメジアン値
を当該周波数帯域のフィルタ特性として用いることを特
徴とする請求項4記載の音声信号の雑音低減方法。 - 【請求項6】 上記周波数軸方向の円滑化フィルタ処理
は、上記メジアン値と上記処理対象の周波数帯域のフィ
ルタ特性とを比較して大きい方を選択する工程と、その
処理結果に対する当該周波数帯域のメジアン値と処理対
象の周波数帯域のフィルタ特性とを比較して小さい方を
選択する工程とを有することを特徴とする請求項5記載
の音声信号の雑音低減方法。 - 【請求項7】 上記時間軸方向の円滑化フィルタ処理
は、音声部分の信号に対する円滑化処理と、雑音部分に
対する円滑化処理とを有することを特徴とする請求項5
記載の音声信号の雑音低減方法。
Priority Applications (15)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09986994A JP3484757B2 (ja) | 1994-05-13 | 1994-05-13 | 音声信号の雑音低減方法及び雑音区間検出方法 |
US08/431,746 US5668927A (en) | 1994-05-13 | 1995-05-01 | Method for reducing noise in speech signals by adaptively controlling a maximum likelihood filter for calculating speech components |
DE69522605T DE69522605T2 (de) | 1994-05-13 | 1995-05-02 | Verfahren zur Rauschreduktion eines Sprachsignals und zur Detektion des Rauschbereichs |
EP95303004A EP0683482B1 (en) | 1994-05-13 | 1995-05-02 | Method for reducing noise in speech signal and method for detecting noise domain |
TW084104386A TW262620B (en) | 1994-05-13 | 1995-05-02 | Decreasing noise method of speech signal and detecting method of noise segment |
EP00120756A EP1065656B1 (en) | 1994-05-13 | 1995-05-02 | Method for reducing noise in an input speech signal |
DE69529002T DE69529002T2 (de) | 1994-05-13 | 1995-05-02 | Verfahren zur Detektion des Rauschbereichs |
EP00120757A EP1065657B1 (en) | 1994-05-13 | 1995-05-02 | Method for detecting a noise domain |
DE69531710T DE69531710T2 (de) | 1994-05-13 | 1995-05-02 | Verfahren und Vorrichtung zur Verminderung von Rauschen bei Sprachsignalen |
MYPI95001231A MY121946A (en) | 1994-05-13 | 1995-05-09 | Method for reducing noise in speech signal and method for detecting noise domain. |
CN95104844A CN1113335A (zh) | 1994-05-13 | 1995-05-12 | 降低语音信号中噪声的方法和检测噪声域的方法 |
KR1019950011826A KR100335162B1 (ko) | 1994-05-13 | 1995-05-13 | 음성신호의잡음저감방법및잡음구간검출방법 |
US08/744,918 US5974373A (en) | 1994-05-13 | 1996-11-07 | Method for reducing noise in speech signal and method for detecting noise domain |
US08/744,915 US5771486A (en) | 1994-05-13 | 1996-11-07 | Method for reducing noise in speech signal and method for detecting noise domain |
US11/608,999 US7895313B2 (en) | 1994-05-13 | 2006-12-11 | Systems and methods for storing, delivering, and managing messages |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09986994A JP3484757B2 (ja) | 1994-05-13 | 1994-05-13 | 音声信号の雑音低減方法及び雑音区間検出方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07306695A JPH07306695A (ja) | 1995-11-21 |
JP3484757B2 true JP3484757B2 (ja) | 2004-01-06 |
Family
ID=14258823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09986994A Expired - Lifetime JP3484757B2 (ja) | 1994-05-13 | 1994-05-13 | 音声信号の雑音低減方法及び雑音区間検出方法 |
Country Status (8)
Country | Link |
---|---|
US (3) | US5668927A (ja) |
EP (3) | EP0683482B1 (ja) |
JP (1) | JP3484757B2 (ja) |
KR (1) | KR100335162B1 (ja) |
CN (1) | CN1113335A (ja) |
DE (3) | DE69529002T2 (ja) |
MY (1) | MY121946A (ja) |
TW (1) | TW262620B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106199549A (zh) * | 2016-06-30 | 2016-12-07 | 南京理工大学 | 一种采用谱减法提升lfmcw雷达信噪比的方法 |
Families Citing this family (78)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3484801B2 (ja) * | 1995-02-17 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び装置 |
JP3453898B2 (ja) * | 1995-02-17 | 2003-10-06 | ソニー株式会社 | 音声信号の雑音低減方法及び装置 |
FI100840B (fi) * | 1995-12-12 | 1998-02-27 | Nokia Mobile Phones Ltd | Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin |
US6256394B1 (en) * | 1996-01-23 | 2001-07-03 | U.S. Philips Corporation | Transmission system for correlated signals |
JP3483695B2 (ja) * | 1996-03-14 | 2004-01-06 | 株式会社リコー | 音声通信装置 |
KR100250561B1 (ko) * | 1996-08-29 | 2000-04-01 | 니시무로 타이죠 | 잡음소거기 및 이 잡음소거기를 사용한 통신장치 |
US5933495A (en) * | 1997-02-07 | 1999-08-03 | Texas Instruments Incorporated | Subband acoustic noise suppression |
US6104993A (en) * | 1997-02-26 | 2000-08-15 | Motorola, Inc. | Apparatus and method for rate determination in a communication system |
US6353809B2 (en) * | 1997-06-06 | 2002-03-05 | Olympus Optical, Ltd. | Speech recognition with text generation from portions of voice data preselected by manual-input commands |
DE19747885B4 (de) * | 1997-10-30 | 2009-04-23 | Harman Becker Automotive Systems Gmbh | Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion |
US6175602B1 (en) * | 1998-05-27 | 2001-01-16 | Telefonaktiebolaget Lm Ericsson (Publ) | Signal noise reduction by spectral subtraction using linear convolution and casual filtering |
US6549586B2 (en) * | 1999-04-12 | 2003-04-15 | Telefonaktiebolaget L M Ericsson | System and method for dual microphone signal noise reduction using spectral subtraction |
US7209567B1 (en) | 1998-07-09 | 2007-04-24 | Purdue Research Foundation | Communication system with adaptive noise suppression |
US6453285B1 (en) | 1998-08-21 | 2002-09-17 | Polycom, Inc. | Speech activity detector for use in noise reduction system, and methods therefor |
US6351731B1 (en) | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
US6122610A (en) * | 1998-09-23 | 2000-09-19 | Verance Corporation | Noise suppression for low bitrate speech coder |
US6574334B1 (en) | 1998-09-25 | 2003-06-03 | Legerity, Inc. | Efficient dynamic energy thresholding in multiple-tone multiple frequency detectors |
US6711540B1 (en) * | 1998-09-25 | 2004-03-23 | Legerity, Inc. | Tone detector with noise detection and dynamic thresholding for robust performance |
US6289309B1 (en) | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
CN1348583A (zh) * | 1999-02-18 | 2002-05-08 | 安德烈电子公司 | 消除噪声的***、方法和设备 |
US6363345B1 (en) * | 1999-02-18 | 2002-03-26 | Andrea Electronics Corporation | System, method and apparatus for cancelling noise |
JP2001016057A (ja) | 1999-07-01 | 2001-01-19 | Matsushita Electric Ind Co Ltd | 音響装置 |
US6349278B1 (en) * | 1999-08-04 | 2002-02-19 | Ericsson Inc. | Soft decision signal estimation |
WO2001024167A1 (fr) | 1999-09-30 | 2001-04-05 | Fujitsu Limited | Dispositif antiparasite |
EP1096471B1 (en) * | 1999-10-29 | 2004-09-22 | Telefonaktiebolaget LM Ericsson (publ) | Method and means for a robust feature extraction for speech recognition |
JP3454206B2 (ja) * | 1999-11-10 | 2003-10-06 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
US6804640B1 (en) * | 2000-02-29 | 2004-10-12 | Nuance Communications | Signal noise reduction using magnitude-domain spectral subtraction |
US6898566B1 (en) | 2000-08-16 | 2005-05-24 | Mindspeed Technologies, Inc. | Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal |
JP3566197B2 (ja) * | 2000-08-31 | 2004-09-15 | 松下電器産業株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
GB2367467B (en) * | 2000-09-30 | 2004-12-15 | Mitel Corp | Noise level calculator for echo canceller |
SE0003608L (sv) * | 2000-10-06 | 2001-12-17 | Xcounter Ab | Metod för reducering av högfrekvent brus i bilder med hjälp av medelvärdesbildning av pixlar och parvis addering av pixelpar som uppfyller ett villkor |
US7139711B2 (en) * | 2000-11-22 | 2006-11-21 | Defense Group Inc. | Noise filtering utilizing non-Gaussian signal statistics |
EP1376539B8 (en) | 2001-03-28 | 2010-12-15 | Mitsubishi Denki Kabushiki Kaisha | Noise suppressor |
US7013273B2 (en) * | 2001-03-29 | 2006-03-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition based captioning system |
DE60212617T2 (de) | 2001-04-09 | 2007-06-14 | Koninklijke Philips Electronics N.V. | Vorrichtung zur sprachverbesserung |
US7136813B2 (en) | 2001-09-25 | 2006-11-14 | Intel Corporation | Probabalistic networks for detecting signal content |
US7096184B1 (en) * | 2001-12-18 | 2006-08-22 | The United States Of America As Represented By The Secretary Of The Army | Calibrating audiometry stimuli |
US7149684B1 (en) | 2001-12-18 | 2006-12-12 | The United States Of America As Represented By The Secretary Of The Army | Determining speech reception threshold |
US6864104B2 (en) | 2002-06-28 | 2005-03-08 | Progressant Technologies, Inc. | Silicon on insulator (SOI) negative differential resistance (NDR) based memory device with reduced body effects |
DE10252946B3 (de) * | 2002-11-14 | 2004-07-15 | Atlas Elektronik Gmbh | Verfahren zur Unterdrückung des Rauschanteils eines Sensorsignals |
US6874796B2 (en) * | 2002-12-04 | 2005-04-05 | George A. Mercurio | Sulky with buck-bar |
JP4128916B2 (ja) | 2003-08-15 | 2008-07-30 | 株式会社東芝 | 字幕制御装置および方法ならびにプログラム |
US7363221B2 (en) * | 2003-08-19 | 2008-04-22 | Microsoft Corporation | Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation |
US7720233B2 (en) * | 2003-09-02 | 2010-05-18 | Nec Corporation | Signal processing method and apparatus |
JP3909709B2 (ja) * | 2004-03-09 | 2007-04-25 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 雑音除去装置、方法、及びプログラム |
DE102004017486A1 (de) * | 2004-04-08 | 2005-10-27 | Siemens Ag | Verfahren zur Geräuschreduktion bei einem Sprach-Eingangssignal |
US7729456B2 (en) * | 2004-11-17 | 2010-06-01 | Via Technologies, Inc. | Burst detection apparatus and method for radio frequency receivers |
GB2422237A (en) * | 2004-12-21 | 2006-07-19 | Fluency Voice Technology Ltd | Dynamic coefficients determined from temporally adjacent speech frames |
US20060184363A1 (en) * | 2005-02-17 | 2006-08-17 | Mccree Alan | Noise suppression |
US20060206320A1 (en) * | 2005-03-14 | 2006-09-14 | Li Qi P | Apparatus and method for noise reduction and speech enhancement with microphones and loudspeakers |
EP1861847A4 (en) * | 2005-03-24 | 2010-06-23 | Mindspeed Tech Inc | ADAPTIVE NOISE STATUS UPDATE FOR VOICE ACTIVITY DETECTOR |
CN1841500B (zh) * | 2005-03-30 | 2010-04-14 | 松下电器产业株式会社 | 一种基于自适应非线性谱减的抗噪方法和装置 |
KR100745977B1 (ko) | 2005-09-26 | 2007-08-06 | 삼성전자주식회사 | 음성 구간 검출 장치 및 방법 |
US20070100611A1 (en) * | 2005-10-27 | 2007-05-03 | Intel Corporation | Speech codec apparatus with spike reduction |
JP4863713B2 (ja) * | 2005-12-29 | 2012-01-25 | 富士通株式会社 | 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム |
JP4753821B2 (ja) * | 2006-09-25 | 2011-08-24 | 富士通株式会社 | 音信号補正方法、音信号補正装置及びコンピュータプログラム |
ATE427589T1 (de) * | 2006-12-27 | 2009-04-15 | Abb Technology Ag | Verfahren zur bestimmung von kanalqualitat und modem |
KR20090122143A (ko) * | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
KR20100006492A (ko) * | 2008-07-09 | 2010-01-19 | 삼성전자주식회사 | 부호화 방식 결정 방법 및 장치 |
TWI355771B (en) | 2009-02-23 | 2012-01-01 | Acer Inc | Multiband antenna and communication device having |
EP2401872A4 (en) * | 2009-02-25 | 2012-05-23 | Conexant Systems Inc | SYSTEM AND METHOD FOR REDUCING SPEAKER DISTORTION |
CN101859568B (zh) * | 2009-04-10 | 2012-05-30 | 比亚迪股份有限公司 | 一种语音背景噪声的消除方法和装置 |
FR2944640A1 (fr) * | 2009-04-17 | 2010-10-22 | France Telecom | Procede et dispositif d'evaluation objective de la qualite vocale d'un signal de parole prenant en compte la classification du bruit de fond contenu dans le signal. |
CN101599274B (zh) * | 2009-06-26 | 2012-03-28 | 瑞声声学科技(深圳)有限公司 | 语音增强的方法 |
WO2011004299A1 (en) * | 2009-07-07 | 2011-01-13 | Koninklijke Philips Electronics N.V. | Noise reduction of breathing signals |
DE112009005215T8 (de) * | 2009-08-04 | 2013-01-03 | Nokia Corp. | Verfahren und Vorrichtung zur Audiosignalklassifizierung |
JP2011100029A (ja) * | 2009-11-06 | 2011-05-19 | Nec Corp | 信号処理方法、情報処理装置、及び信号処理プログラム |
JP5609157B2 (ja) * | 2010-02-26 | 2014-10-22 | ヤマハ株式会社 | 係数設定装置および雑音抑圧装置 |
CN103594094B (zh) * | 2012-08-15 | 2016-09-07 | 湖南涉外经济学院 | 自适应谱减法实时语音增强 |
US9107010B2 (en) * | 2013-02-08 | 2015-08-11 | Cirrus Logic, Inc. | Ambient noise root mean square (RMS) detector |
US9231740B2 (en) * | 2013-07-12 | 2016-01-05 | Intel Corporation | Transmitter noise in system budget |
EP3152756B1 (en) * | 2014-06-09 | 2019-10-23 | Dolby Laboratories Licensing Corporation | Noise level estimation |
US10149047B2 (en) * | 2014-06-18 | 2018-12-04 | Cirrus Logic Inc. | Multi-aural MMSE analysis techniques for clarifying audio signals |
CN106885971B (zh) * | 2017-03-06 | 2020-07-03 | 西安电子科技大学 | 一种用于电缆故障检测定点仪的智能背景降噪方法 |
US10504538B2 (en) | 2017-06-01 | 2019-12-10 | Sorenson Ip Holdings, Llc | Noise reduction by application of two thresholds in each frequency band in audio signals |
CN112000047A (zh) * | 2020-09-07 | 2020-11-27 | 广东众科智能科技股份有限公司 | 一种远程智能化监控*** |
CN113488032A (zh) * | 2021-07-05 | 2021-10-08 | 湖北亿咖通科技有限公司 | 车辆以及车辆用语音识别***和方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0127718B1 (fr) * | 1983-06-07 | 1987-03-18 | International Business Machines Corporation | Procédé de détection d'activité dans un système de transmission de la voix |
EP0140249B1 (en) * | 1983-10-13 | 1988-08-10 | Texas Instruments Incorporated | Speech analysis/synthesis with energy normalization |
US4630305A (en) * | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic gain selector for a noise suppression system |
US5036540A (en) * | 1989-09-28 | 1991-07-30 | Motorola, Inc. | Speech operated noise attenuation device |
CA2040025A1 (en) * | 1990-04-09 | 1991-10-10 | Hideki Satoh | Speech detection apparatus with influence of input level and noise reduced |
FI92535C (fi) * | 1992-02-14 | 1994-11-25 | Nokia Mobile Phones Ltd | Kohinan vaimennusjärjestelmä puhesignaaleille |
DE4405723A1 (de) * | 1994-02-23 | 1995-08-24 | Daimler Benz Ag | Verfahren zur Geräuschreduktion eines gestörten Sprachsignals |
JP3484801B2 (ja) * | 1995-02-17 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び装置 |
-
1994
- 1994-05-13 JP JP09986994A patent/JP3484757B2/ja not_active Expired - Lifetime
-
1995
- 1995-05-01 US US08/431,746 patent/US5668927A/en not_active Expired - Lifetime
- 1995-05-02 TW TW084104386A patent/TW262620B/zh not_active IP Right Cessation
- 1995-05-02 EP EP95303004A patent/EP0683482B1/en not_active Expired - Lifetime
- 1995-05-02 EP EP00120756A patent/EP1065656B1/en not_active Expired - Lifetime
- 1995-05-02 DE DE69529002T patent/DE69529002T2/de not_active Expired - Lifetime
- 1995-05-02 EP EP00120757A patent/EP1065657B1/en not_active Expired - Lifetime
- 1995-05-02 DE DE69531710T patent/DE69531710T2/de not_active Expired - Lifetime
- 1995-05-02 DE DE69522605T patent/DE69522605T2/de not_active Expired - Lifetime
- 1995-05-09 MY MYPI95001231A patent/MY121946A/en unknown
- 1995-05-12 CN CN95104844A patent/CN1113335A/zh active Pending
- 1995-05-13 KR KR1019950011826A patent/KR100335162B1/ko not_active IP Right Cessation
-
1996
- 1996-11-07 US US08/744,918 patent/US5974373A/en not_active Expired - Lifetime
- 1996-11-07 US US08/744,915 patent/US5771486A/en not_active Expired - Lifetime
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106199549A (zh) * | 2016-06-30 | 2016-12-07 | 南京理工大学 | 一种采用谱减法提升lfmcw雷达信噪比的方法 |
CN106199549B (zh) * | 2016-06-30 | 2019-01-22 | 南京理工大学 | 一种采用谱减法提升lfmcw雷达信噪比的方法 |
Also Published As
Publication number | Publication date |
---|---|
KR950034057A (ko) | 1995-12-26 |
EP0683482B1 (en) | 2001-09-12 |
DE69531710D1 (de) | 2003-10-09 |
US5771486A (en) | 1998-06-23 |
DE69529002T2 (de) | 2003-07-24 |
DE69531710T2 (de) | 2004-07-15 |
MY121946A (en) | 2006-03-31 |
EP1065656A2 (en) | 2001-01-03 |
DE69522605T2 (de) | 2002-07-04 |
DE69522605D1 (de) | 2001-10-18 |
JPH07306695A (ja) | 1995-11-21 |
TW262620B (en) | 1995-11-11 |
US5668927A (en) | 1997-09-16 |
DE69529002D1 (de) | 2003-01-09 |
EP1065657A1 (en) | 2001-01-03 |
KR100335162B1 (ko) | 2002-09-27 |
EP0683482A2 (en) | 1995-11-22 |
EP1065656A3 (en) | 2001-01-10 |
EP1065657B1 (en) | 2002-11-27 |
CN1113335A (zh) | 1995-12-13 |
EP1065656B1 (en) | 2003-09-03 |
EP0683482A3 (en) | 1997-12-03 |
US5974373A (en) | 1999-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3484757B2 (ja) | 音声信号の雑音低減方法及び雑音区間検出方法 | |
JP3484801B2 (ja) | 音声信号の雑音低減方法及び装置 | |
JP3453898B2 (ja) | 音声信号の雑音低減方法及び装置 | |
EP1080465B1 (en) | Signal noise reduction by spectral substraction using linear convolution and causal filtering | |
Martin | Spectral subtraction based on minimum statistics | |
US6023674A (en) | Non-parametric voice activity detection | |
US6487257B1 (en) | Signal noise reduction by time-domain spectral subtraction using fixed filters | |
EP1169883B1 (en) | System and method for dual microphone signal noise reduction using spectral subtraction | |
JP3626492B2 (ja) | 会話の品質向上のための背景雑音の低減 | |
EP2031583B1 (en) | Fast estimation of spectral noise power density for speech signal enhancement | |
EP1080463B1 (en) | Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging | |
WO2008121436A1 (en) | Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate | |
WO2001031631A1 (en) | Mel-frequency domain based audible noise filter and method | |
US6507623B1 (en) | Signal noise reduction by time-domain spectral subtraction | |
EP1278185A2 (en) | Method for improving noise reduction in speech transmission | |
CN113593599A (zh) | 一种去除语音信号中噪声信号的方法 | |
Adrian et al. | An acoustic noise suppression system with reduced musical artifacts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030924 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081024 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091024 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091024 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101024 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111024 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111024 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121024 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121024 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131024 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |