JP4210521B2 - 雑音低減法および装置 - Google Patents

雑音低減法および装置 Download PDF

Info

Publication number
JP4210521B2
JP4210521B2 JP2002561819A JP2002561819A JP4210521B2 JP 4210521 B2 JP4210521 B2 JP 4210521B2 JP 2002561819 A JP2002561819 A JP 2002561819A JP 2002561819 A JP2002561819 A JP 2002561819A JP 4210521 B2 JP4210521 B2 JP 4210521B2
Authority
JP
Japan
Prior art keywords
noise reduction
impulse response
frame
reduction filter
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002561819A
Other languages
English (en)
Other versions
JP2004520616A (ja
JP2004520616A5 (ja
Inventor
パスカル スカラル、
クロード マロ、
ローラン モウアリ、
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=8859390&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP4210521(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of JP2004520616A publication Critical patent/JP2004520616A/ja
Publication of JP2004520616A5 publication Critical patent/JP2004520616A5/ja
Application granted granted Critical
Publication of JP4210521B2 publication Critical patent/JP4210521B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01LMEASURING FORCE, STRESS, TORQUE, WORK, MECHANICAL POWER, MECHANICAL EFFICIENCY, OR FLUID PRESSURE
    • G01L21/00Vacuum gauges
    • G01L21/02Vacuum gauges having a compression chamber in which gas, whose pressure is to be measured, is compressed

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Superconductors And Manufacturing Methods Therefor (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)

Description

本発明は入力信号中に存在する雑音レベルを低減するために用いられる信号処理技術に関するものである。
重要な応用分野は、
・雑音の多い環境における電話会議またはテレビ会議(専用室内またはマルチメディア・コンピュータからでさえ、等);
・電話:固定電話または携帯電話等の端末器と、伝送ネットワークとの少なくとも一方における処理;
・特に事務所、車両または携帯端末機におけるハンドフリー端末機;
・公共の場所(駅、空港、等)における音を拾うこと;
・車両内で両手を使用せずに音を拾うこと;
・騒がしい環境内で音声を確実に認識すること;
・映画およびメディア(たとえば、スポーツ報道または演奏会のための、ラジオ、テレビジョン、等)のために音響を拾うこと;
を非限定的に含めた、オーディオ信号(音声または音楽)処理の分野である。
本発明は、雑音を含んでいる観察から有用な情報を取り出す必要がある分野であればどのような分野にも応用できる。特に、次の分野を引用できる:水中画像観測、水中リモートセンシング、バイオメディカル信号処理(EEG、ECG、バイオメディカル画像形成、等)。
集音の特徴的な問題は、集音マイクロホンが設置される音響環境に関連し、更に詳しくいえばその環境を完全に管理統制することは不可能であるので、観測信号中には妨害信号(雑音と呼ばれる)も存在する。
信号の質を高めるために、雑音が含まれている観測信号を処理することにより有用な情報を取り出す目的で雑音低減装置が開発されている。オーディオ信号が遠く離れた所から送られてきた音声信号である場合は、それらの装置を用いてそれの了解度を高め、通信相手に及ぼす負担を軽減するためにそれらの装置を使用できる。会話通信のそれらの応用に加えて、音声信号の質を高めることによって音声認識に有用なことが判明もした。使用者が騒がしい環境に居ると音声認識性が大きく損なわれる。
雑音低減操作を実行するための信号処理技術の選択は、まず、処理の入力側において利用できる観測数に依存する。ここでの説明では、ただ1つの観測信号を利用できる場合について考えることにする。この単一獲得問題に適用される雑音低減法は、時間進み/時間遅れを伴う適応濾波、パラメトリック・カルマン濾波、または短時間スペクトル変更による濾波までも、などの信号処理技術に主として依存する。
後者の集り(短時間スペクトル変更による濾波)は、包含されている概念が簡単で、それらをプログラムするために要する基本的なツール(たとえば、離散フーリェ変換)の有用性が広いために、産業機器に使用されているほぼ全ての解決技術を組合わせている。しかし、それらの雑音低減技術の急速な進歩は、処理操作の出力側で使用できる信号を大きく歪ませることなしに、信号処理プロセッサでそれらの処理操作を実時間で容易に実行する可能性に大きく依存している。この集まりの方法では、処理は、雑音低減フィルタの伝達関数を推定することと、その後でブロックごとの処理でスペクトル領域内での乗算を基にして濾波を行うことにのみ最もしばしばある。スペクトル領域内での乗算によって短時間スペクトル減衰による雑音低減が可能にされる。
所望の信号s(n)と妨害信号b(n)との混合から生ずる、雑音を含んでいる観測信号はx(n)と記される。ここにnは離散時間内での時間指標を示す。離散時間における表現の選択は、信号のデジタル処理へ向けられる手法に関連させられるが、上記方法は連続時間信号にも適用されることに気が付くであろう。信号は一定長さの指標kの連続する区画すなわちフレームで解析される。離散時間領域および離散周波数領域での表現のために現在使用されている記法は:
・X(k,f):解析される信号x(n)のk番目のフレーム(kはフレーム指標)のフーリェ変換(fは周波数指標);
・S(k,f):所望の信号s(n)のk番目のフレームのフーリェ変換;
Figure 0004210521
:量(時間領域内または周波数領域内の)vの推定;たとえば、
Figure 0004210521
は所望の信号のフーリェ変換の推定である;
・γuu(f):信号u(n)のパワースペクトル密度(PSD)である。
ほとんどの雑音低減技術では、雑音を含んでいる信号x(n)は周波数領域内で濾波を受けて、いかなる妨害も受けていない元の信号s(n)にできるだけ近い有用な推定された信号
Figure 0004210521
を生ずる。前に示したように、この濾波操作は、雑音を含んでいる信号の各周波数成分fを減少することにあり、その信号にはその周波数成分中の推定された信号対雑音比(SNR)を与えられている。周波数fに依存する、このSNRをここではフレームkに対してη(k,f)と記すことにする。
各フレームに対して、雑音低減フィルタを計算するために求められるスペクトル量の後での推定を改善するために、信号に重み付けウィンドウをまず乗ずる。そのようにしてウィンドウ化された各フレームをその後でスペクトル領域内で解析する(それの最初の実行では離散フーリェ変換を一般に用いる)。この操作は短時間フーリェ変換(STFT)と呼ばれている。観測された信号のこの周波数領域表現X(k,f)は、雑音低減フィルタの伝達関数H(k,f)を同時に推定するため、およびこのフィルタを、この伝達関数に雑音を含んでいる信号の短時間スペクトルを単に乗ずることにより、スペクトル領域に適用するために、使用できる。すなわち、
Figure 0004210521
である。
このようにして得られた信号はその後で簡単な逆スペクトル変換により時間領域へ戻される。雑音を除去された信号はブロックの重ね合わせおよび加え合わせの技術(OLA、「重ね合わせ−加え合わせ」)またはブロックをセーブする技術(OLS、「重ね合わせ−セーブ」)により一般に合成される。時間領域内の信号を再構成するこの操作は逆短時間フーリェ変換(ISTFT)と呼ばれる。
短時間スペクトル減衰法についての詳細な説明が次の文献に見出される:J.S.Lim、A.V.Oppenheim、「雑音を含む音声の強調および帯域幅圧縮(Enhancement and bandwith compression of noisy speech)」Proceeding of the IEEE、67巻、1586〜1604ページ、1979;R.E.Crochiere、L.R.Rabiner、「マルチレート・デジタル信号処理(Multirate digital signal processing)」Prentice Hall、1983。
そのような雑音低減装置により実行される主な作業は:
・有声検出(VAD);
・無声期間中の雑音のパワースペクトル密度(PSD)の推定
・雑音のスペクトル成分を抑制するための規則を基にして推定された短時間スペクトル減衰の適用;
・処理された信号のOLS型またはOLA型技術を基にした合成。
雑音成分を抑制する規則は伝送される信号の質を決定するので、その規則の選択は重要である。それらの抑制技術は雑音を含んでいる信号のスペクトル成分の位相ではなくて振幅|X(k,f)|のみを一般に変更する。一般に、下記の仮定が行われる:
・雑音と有用な信号とは統計的に相関していない;
・有用な雑音は断続的である(雑音を推定できる期間であるような沈黙期間の存在);
・人の耳は信号の位相を感知しない(D.L.Wang、J.S.Lim、「音声強調における位相の非重要性(The unimportance of phase in speech enhancement)」、IEEE Trans. on ASSP、30巻、4号、679〜681、1982、参照)。
周波数領域成分fにおけるインデックスkのフレーム上の観測信号X(k,f)に適用される短時間スペクトル減衰H(k,f)は、局部的な信号対雑音比η(k,f)の推定を基にして一般に決定される。全ての抑制規則に共通の特徴は、
Figure 0004210521
により与えられるそれらの規則の漸近的な挙動である。
現在採用されている抑制規則は:
・パワースペクトル差し引き(J.S.Lim、A.V.Oppenheimによる上記文献参照)。これに対しては雑音低減フィルタの伝達関数H(k,f)は
Figure 0004210521
として表される。
・振幅スペクトル差し引き(S.F.Boll、「スペクトル差し引きを用いる音声の雑音抑制(Suppression of acoustic noise in speech using spectral subtraction)」、IEEE Trans. on Audio,Speech and Signal Processing、27巻、2号、113〜120ページ、1979年4月、参照)。それに対しては伝達関数H(k,f)は
Figure 0004210521
として表される。
・ウィーナーフィルタの直接適用(J.S.Lim、A.V.Oppenheimにより上記文献参照)。これに対しては雑音低減フィルタの伝達関数H(k, f)は
Figure 0004210521
として表される。
それらの表現では、γss(k,f)とγbb(k,f)は有用な信号と、インデックスkのフレーム上の観察信号X(k,f)の周波数領域成分f内に存在する雑音とのパワースペクトル密度をそれぞれ表す。
式(3)〜(5)から、与えられた周波数領域成分fについて測定された局部的な信号対雑音比に従って、雑音を含む信号に加えられるスペクトル減衰の挙動を研究することが可能である。局部的な信号対雑音比が高い時に、あらゆる規則が同一の減衰を生ずることが注目される。パワー差し引き規則はガウスモデルに対して最大限起きやすいという意味で最適である(O.Cappe、「EphraimおよびMalah雑音抑制器による楽音ノイズ音(musical noise)現象除去(Elimination of the musicalnoise phenomenon with the Ephraim and Malah noise suppressor)」、IEEE Trans.on Speech and Audio Processing、2巻、3号、345〜349ページ、1994年4月、参照)。しかし、それは処理の出力側において雑音パワーが最大のままであるという規則である。全ての抑制規則に対して、遮断値付近の局部的な信号対雑音比の小さい変化が、完全な減衰
Figure 0004210521
の場合から無視できるスペクトル変更
Figure 0004210521
の場合まで変更させるのに十分である。
後者の特性は「楽音ノイズ」として知られている現象の原因の1つを構成する。実際に、決定論的な成分およびランダムな成分により特徴付けられる、周囲の雑音は無音期間中にのみ特徴付けることができる。それらのランダムな成分が存在するために、有声期間中の雑音の周波数領域成分fの寄与と、無声期間中のいくつかのフレームにわたって行われるそれの平均推定との間に非常に著しい変動がある。この違いのために、局部的な信号対雑音比の推定が遮断レベルを中心として変動することがある、すなわち、したがって、それは、出現し、その後で消失するスペクトル成分を、処理の出力側に、生ずることができ、それらの成分の平均寿命は考察している解析ウィンドウの大きさ程度を統計的に超えない。この挙動を全通過帯域にわたって一般化すると、「楽音ノイズ」として知られている、いらいらさせる可聴残留雑音が導入される。
この雑音の影響を減少するために多くの研究が行われている。推奨されている解決策は種々の線に沿って開発されている。それらは、:
・短時間推定の平均化(S.F.Bollによる前記論文参照);
・雑音電力スペクトルの過大推定(M.Berouti他、「雑音に埋もれている音声の増強(Enhanncement of speech corrupted by acoustic noise)」、Int. Conf. on Speech,Signal Processing、208〜211ページ、1979、およびP.Lockwood、J.Boudy、「非直線スペクトル除去器による実験、隠されたマルコフモデルおよび車両における強固な音声認識(Experiments with a non‐linear spectral subtractor,hidden Markov models and the projection for robust speech recognition in cars)」、Proc. of EUSIPCO’91、79〜82ページ、1991、参照);
・最低雑音スペクトル密度のトラッキング(R.Martin、「最小統計を基にしたスペクトル除去(Spectaral subtraction based on minimum statistics)」、in Signal Processing VII:Theories and Applications,EUSIPCO’94、1182〜1185ページ、1994、9月、参照);
音声信号と付加雑音との統計モデルを基にした新規な抑制規則についての多くの研究も行われてきた。それらの研究によって新規な「ソフト決定」アルゴリズムが導入されるようになった。その理由は、従来の方法と比較してそれらのアルゴリズムが自由度を余分に有しているからである(R.J.MacAulay、M.L.Malpass、「ソフト決定雑音抑制フィルタを用いる音声強調(Speech enhancement using a soft‐decision noise suppression filter)」、IEEE trans. on Audio,Speech and Signal Processing、28巻、2号、138〜145ページ、1980、4月、Y.Ephraim、D.Malah、「最適非直線スペクトル振幅推定を用いる音声強調(Speech enhandement using optimal non‐linear spectral amplitude estimation)、Int.Conf.on Speech,Signal Processing、1118〜1121ページ、1983、Y.Ephraim、D.Malah、「最小平均二乗誤差短時間スペクトル振幅推定値を用いる音声強調(Speech enhandement using a minimum mean square error short‐time spectral amplitude estimator)、IEEE trans. on ASSP、32巻、6号、1109〜1121ページ、1984、参照)。
上記短時間スペクトル変更規則は次の特徴を有する:
・短時間スペクトル減衰の計算は各スペクトル成分における雑音レベルの推定に依存し、各等式は量
Figure 0004210521
を含んでいる。したがって、この雑音低減技術(歪み、雑音レベルの効果的な低減)の性能は信号対雑音比のこの推定値の適切さにより支配される。
・それらの技術はブロックごとの処理を基にしており(連続するブロックの間で重なり合う可能性がある)、その処理は、雑音低減装置の入力端子に存在する、所与のフレームの全ての標本を単一のスペクトル減衰で濾波することにある。この特性は、フィルタがスペクトル領域内で乗算を適用されるという事実にある。これは、たとえば、ある語の始まりまたは終わりの場合、あるいは有声/無声が混じったフレームの場合でさえ、現在のフレームに存在する信号が第2種の静止仮定を満たさない場合に特に制限する。
・スペクトル領域内で行われる乗算は実際には周期的なくりこみ演算に相当する。実際には、歪みを避けるために、試みられる操作は線形くりこみである。それはある数の零標本を各入力フレームに加えること(零パッディングと呼ばれる技術)と、雑音低減フィルタのインパルス応答の時間領域サポートを制限することを目的とした付加処理を実行することとを要する。そのために、時間領域くりこみ制約はスペクトル変換の次数を、したがって、雑音低減処理の数学的な複雑さを、必然的に増加する。雑音低減フィルタのインパルス応答の時間領域サポートを制限するために最も用いられる技術は時間領域内に制約を導入することにある。それは(i)フィルタの伝達関数H(k,f)についての知識を基にしてインパルス応答h(k,n)を得るために第1の「逆」スペクトル変換と、(ii)このインパルス応答の点の数を制限すること、これによって切り詰められた時間領域フィルタh′(k,f)になる、その後で、(iii)変更された伝達関数H′(k,f)を得るために切り詰められたインパルス応答h′(k,n)を基にして第2の「直接」スペクトル変換とを要する。
・実際には、スペクトル変換演算を行う前に、各解析フレームには解析ウィンドウw(n)が乗ぜられる。雑音低減フィルタが全通過型(すなわち、
Figure 0004210521
であると、完全な再構成の条件が満たされることを希望するならば、解析ウィンドウは次の条件
Figure 0004210521
を満たさねばならない。この式では、パラメータDは連続する2つの解析フレームの間の移動(標本の数で)を表す。他方、重み付けウィンドウw(n)の選択(典型的にはHanning型、Hamming型、Blackman型等の)がW(f)の主ローブの幅と第2のローブの振幅(第1のローブの振幅に対する)を決定する。主ローブが広いとすると、元の信号の変換の速い遷移が非常に悪く近似される。第2のローブの相対的な振幅が大きいとすると、得られる近似は、特に不連続部を中心として、いらいらさせる発振を行うものである。したがって、関連するスペクトル解析要求(主ローブの幅の選択と、副ローブの振幅の選択)と、雑音低減濾波過程により導入される小さい遅延(処理の入力端子と出力端子とにおける信号の間の時間のずれ)の要求とを満たすことは困難である。第2の要求を満たすと、なんら重なり合うことのない連続するフレーム、したがって、長方形型解析ウィンドウを使用することになる。それによって関連するスペクトル解析を実行する結果となることはない。それらの要求を同時に満たす唯一のやり方は、適切な解析ウィンドウにより重み付けられているフレームに対して行われる第1のスペクトル変換を基にしてスペクトル解析を行い、かつウィンドウ化されていないデータに対して第2のスペクトル変換を並行に行う(スペクトル乗算によりくりこみ操作を行うために)ことである。実際には、そのような技術は数学的な複雑さの面で費用がかかり過ぎることが判明している。
EP‐A‐0 710 947がエコー打ち消し器に結合されている雑音低減装置を開示している。雑音低減は、スペクトル解析中に信号対雑音比に従って推定される伝達関数H(k,f)の逆フーリェ変換により得られるインパルス応答によって、時間領域内でのブロックごとの濾波により実行される。
本発明の主な目的は雑音低減法の性能を向上することである。
したがって、本発明は、入力信号の引き続くフレーム中の雑音を低減する方法であって、下記のステップ、
‐周波数領域へ変換することにより入力信号のスペクトラムを計算することと、
‐周波数依存雑音レベル推定値を得ることと、
‐そのフレームに対する第1の有用な周波数依存信号レベル推定値を計算することと、
‐第1の雑音低減フィルタの伝達関数を、第1の有用な周波数依存信号レベル推定値および周波数依存雑音レベル推定値を基にして計算することと、
‐入力信号のスペクトラムと第1の雑音低減フィルタの伝達関数を組合わせることにより、そのフレームに対する第2の有用な周波数依存信号レベル推定値を計算することと、
‐第2の雑音低減フィルタの伝達関数を、第2の有用な周波数依存信号レベル推定値および周波数依存雑音レベル推定値を基にして計算することと、
‐雑音が低減された信号を生ずるために、フレーム濾波操作で第2の雑音低減フィルタの伝達関数を使用することと、
をフレームの少なくともいくつかに対して備える、入力信号の引き続くフレーム中の雑音を低減する方法を提供するものである。
推定される雑音のレベルと有用な信号のレベルは通常はPSDsであり、またはより一般的にはそれらのPSDsに相関させられている量である。
2つの操作における計算、それの特定の面が有用な信号のPSD γss(k,f)のより速い更新にある、によって従来の方法よりも大きな2つの利点を得る第2の雑音低減フィルタをもたらす結果となる。第1に、特に有用な信号の時間的な包絡線のより速い変化中に、有用な信号の非静止性のより速いトラッキングがある(たとえば、無声/音声遷移中にある音声信号を冒すすなわち消去する)。第2に、雑音低減フィルタはより良く推定される。これによってこの方法の性能が向上する結果となる(雑音が一層著しく低減しかつ有用な信号の劣化が減少する)。
この方法は、3つ以上の操作が実行される場合に一般化できる。得られたp番目(p≧2)の伝達関数を基にして、有用な信号レベル推定値がその後で再計算され、(p+1)番目の伝達関数がその雑音低減のために再推定される。この方法の上記定義は、P>2の操作が行われる場合にも適用される。すなわち、この定義に従って「第1の有用な信号レベル推定値」を(p−1)番目の操作中に得られたものとして単に考察する必要がある。実際には、この方法の満足できる性能はP=2で観察される。
この方法の1つの有利な実施形態では、スペクトラムの計算が、入力信号フレームをウィンドウ化関数により重み付けすることと、重み付けられたフレームを周波数領域へ変換することとで構成され、フレームのより近い半分に対してフレームのより近くない半分よりも強い重み付けを行うように、ウィンドウ化関数は非対称である。
そのようなウィンドウ化関数の選択は、スペクトル推定の重みを最も近い標本へ向かって集中でき、一方では良いスペクトル特性を持つウィンドウを提供する(第2のローブの制御されている増加)ことを意味する。これによって信号の変化に迅速に追従できるようにされる。周波数を基にした解析のためのスペクトルのこの計算モードは、雑音低減フィルタの伝達関数の推定がただ1つの操作で行われる場合に適用することもできることに注目すべきである。
この方法は、上記短時間スペクトル減衰法により、周波数領域内で入力信号がブロックごとに濾波される場合に使用できる。その後で、雑音を除去された信号がそれのスペクトル成分
Figure 0004210521
の形で発生される。それは直接利用でき(たとえば、符号化応用または音声認識応用において)、または信号
Figure 0004210521
を明確に得るために時間領域へ変換できる。
しかし、この方法の1つの好適な実施形態では、雑音低減フィルタ・インパルス応答が、第2の雑音低減フィルタの伝達関数の時間領域への変換を基にして、現在のフレームに対して決定され、その時間領域内のフレームに対する濾波操作が前記フレームに対して決定された雑音低減フィルタ・インパルス応答により実行され、時間領域内のフレームに対する濾波操作は前記フレームに対して決定されたインパルス応答により実行される
有利なことに、そうすると、現在のフレームに対する雑音低減フィルタ・インパルス応答の決定は:
‐第2の雑音低減フィルタの伝達関数を時間領域へ変換して第1のインパルス応答を得るステップと、
‐第1のインパルス応答を、時間領域への変換の点の数より十分少ない(通常は少なくとも5分の1)標本数に対応する打ち切り長さに打ち切るステップと、
を備えている。
雑音低減フィルタの時間領域サポートにおけるこの制限は2倍の利点をもたらす。まず、それは時間領域エイリアシング問題が避けられることを意味する(線形くりこみに従う)。第2に、有用な信号を劣化させることがある、強すぎるフィルタの作用を避けることを可能にする滑らかな作用を提供することである。それには、ウィンドウ化機能により切り詰められたインパルス応答が切り詰め長さに対応する標本の数に及ぼす重み付けが付随することがある。フィルタの時間領域サポートにおけるこの制限は、伝達関数の推定が単一の操作で行われる時に適用することもできる。
濾波が時間領域において行われる時は、現在のフレームをいくつかのサブフレームに細分し、補間されたインパルス応答を各サブフレームに対して、現在のフレームに対して決定された雑音低減フィルタ・インパルス応答と、少なくとも1つの以前のフレームに対して決定された雑音低減フィルタ・インパルス応答とを基にして計算すると有利である。そうするとフレームの濾波操作は、前記サブフレームに対して計算された補間されたインパルス応答に従って、時間領域内の各サブフレームの信号の濾波を含む。
サブフレームへのこの処理によって、同じフレーム内で変化する雑音低減フィルタを適用することが可能になり、したがって、処理された信号の非静止性に良く適する。ボイス信号を処理する場合には、この状況には混合されているフレーム(すなわち、有声音と無声音を有するフレーム)で特に遭遇させられる。サブフレームへのこの処理は、フィルタの伝達関数の推定が単一の操作で行われる時にも適用できることが注目される。
本発明の他の面は上記方法を実現するために構成された雑音低減装置に関する。
本発明のその他の特徴およびその他の利点は、添付図面を参照しての、非限定的実施形態についての以下の説明で明らかになるであろう。
図1ないし図3は本発明の装置を別々のユニットの形で表したものである。この方法の1つの典型的な実現では、信号処理操作は、上記ユニットに対応する種々の機能モジュールを有するデジタル信号プロセッサ実行プログラムにより、通常のものとして、実行される。
図1を参照して、本発明の雑音低減装置は、デジタル・オーディオ信号などの、入力信号x(n)を長さLの標本(整数kにより示されている)の引き続くフレームに分配するユニット1を有する。指標kの各フレームにウィンドウ化関数w(n)を乗ずることにより、それは重み付けられ(乗数2)て信号xw(k,n)=w(n).x(k,n)(0≦n≦Lに対して)を生ずる。
周波数領域への移行は、離散フーリェ変換(DFT)を、現在のフレームのフーリェ変換X(k,f)を行うユニット3により、重み付けられているフレームxw(k,n)に施すことによって行われる。
本発明に含まれている、時間‐周波数領域遷移、およびその逆、のために、必要があれば下流側(ユニット7)で用いられるDFTおよび時間領域への逆変換(IDFT)は、有利なことに高速フーリェ変換(FFT)および逆高速フーリェ変換(IFFT)である。ウェーブレット(wavelet)変換などの、その他の時間‐周波数変換も使用できる。
雑音のみのフレームを音声フレームから弁別し、現在のフレームに2進発声活動指示δを与えるために、ボイス活動検出(VAD)ユニット4が用いられる。信号x(k,n)を基にして時間領域において動作るか、破線で示すように、信号X(k,f)を基にして周波数領域において動作するかによらず、いかなる既知のVAD法でも使用できる。
VADはユニット5による雑音のPSDの推定を制御する。したがって、ユニット4により検出された各「雑音のみ」フレームkbに対して(δ=0)、雑音パワースペクトル密度
Figure 0004210521
は次の回帰式により計算される。
Figure 0004210521
ここにkbは、δ=0であれば現在の雑音フレーム、δ=1であれば最後の雑音フレームであり(kは有用な信号のフレームとして検出される)、α(kb)は時間的に変化できる平滑化パラメータである。
Figure 0004210521
の計算法は指数平滑化を行うこの推定値に限定されるものではなく、ユニット5で判定状態のいかなるPSD推定値も使用できることに気が付くであろう。
現在のフレームのスペクトラムX(k,f)および雑音レベル推定
Figure 0004210521
を用いて、他のユニット6が雑音低減フィルタ
Figure 0004210521
の伝達関数(TF)を推定する。ユニット7はこのTFにIDFTを施して対応するインパルス応答
Figure 0004210521
を得る。
ウィンドウ化関数wfilt(n)が乗算器8によりこのインパルス応答
Figure 0004210521
に乗ぜられて、雑音低減装置の時間領域フィルタのインパルス応答
Figure 0004210521
を得る。雑音を除去された時間領域信号
Figure 0004210521
を生ずるために濾波ユニット9により行われる操作は、それの原理として、現在のフレームに対して決定されたインパルス応答
Figure 0004210521
による入力信号のくりこみである。
ウィンドウ化関数wfilt(n)はフレームの長さより著しく短いサポートを有する。いいかえると、IDFTの結果としてのインパルス応答
Figure 0004210521
が、関数wfilt(n)による重み付けがそれに適用される前に、切り詰められる。好ましいのは、標本の数として表される、切り詰め長さLfiltはフレームの長さの少なくとも5分の1である。それは通常はこのフレーム長さの10分の1の長さ程度である。
インパルス応答の最上位のLfilt係数は、ウィンドウwfilt(n)による重み付けの主体であり、それはたとえば長さLfiltのHammingまたはHanningウィンドウである。
Figure 0004210521
雑音低減フィルタの時間領域サポートにおける制限は、線形くりこみを満たすために、時間領域エイリアシング問題を避けることを可能にする。更に、それは平滑化を行って、有用な信号を劣化させることがある、フィルタのあまりにも強過ぎる作用を避けることを可能する。
図2は雑音低減フィルタの伝達関数
Figure 0004210521
推定するユニット6の好適な構成を示す。その伝達関数は雑音b(n)のPSDと有用な信号s(n)のPSDに依存する。
ユニット5が雑音のPSD
Figure 0004210521
をどのようにして推定できるかについて説明してきた。しかし、発声活動期間中は信号と雑音が混合されているので有用な信号のPSD γss(k,f)は直接得ることができない。それを予め推定するために、図2のユニット6のモジュール11は、下記の式に従って、たとえば、指令された決定推定値を使用する(Y.Ephraim、D.Malah、「最小平均二乗誤差短時間スペクトル振幅推定値を用いる音声強調(Speech enhandement using a minimummean square error short‐time spectral amplitude estimator)、IEEE trans. on ASSP、32巻、6号、1109〜1121ページ、1984、参照」。
Figure 0004210521
ここにβ(k)は時間的に変化できる重心パラメータ、
Figure 0004210521
は指標k−1の先行フレームに対して推定された有用な信号のスペクトラムである(たとえば、図2の乗算器12により得られた、
Figure 0004210521
)。関数Pは、推定の誤りの場合に負となる危険を招く量
Figure 0004210521
のしきい値化を行う。それは、
Figure 0004210521
により与えられる。
Figure 0004210521
の計算はこの指定された決定推定値に限定されないことに注意すべきである。実際に、指数平滑化推定値または他の任意のパワースペクトル密度推定値を使用できる。
現在のフレームに対する雑音低減フィルタのTFの予推定がモジュール13によって、推定されたPSDs
Figure 0004210521
の関数として計算される:
Figure 0004210521
このモジュール13は、振幅スペクトル差し引き((4)に従って
Figure 0004210521
)のパワースペクトル差し引き((3)に従って
Figure 0004210521
)の規則、または開ループ・ウィーナーフィルタ((5)に従ってF(y,z)=y/(y+z)の規則を特に実現できる。
通常は、雑音低減フィルタの最後の伝達関数は式(4)を用いて得られる。このフィルタの性能を向上するために、2回の操作に反復手順を用いてそれを推定することが提案されている。最初の操作はモジュール11ないし13により行われる動作で構成されている。
そのようにして得られた伝達関数
Figure 0004210521
を再び用いて有用な信号のPSDの推定を改善する。ユニット6(乗算器14とモジュール15)は、このために、
Figure 0004210521
により与えられる量
Figure 0004210521
を計算する。そうすると第2の操作は、モジュール16に対しては、雑音低減フィルタの伝達関数の最後の推定値
Figure 0004210521
を、有用な信号のPSDの改善された推定を基にして計算することにある。
Figure 0004210521
関数Fはモジュール13により使用されたものと同じにできる。
2回の操作におけるこの計算によって有用な信号のPSD
Figure 0004210521
のより速い更新とフィルタのより良い推定が可能にされる。
図3はN個のサブフレームへの細分を基にした、したがって、同じ信号フレーム内で展開できる雑音低減機能の応用を可能にする時間領域濾波ユニット9の好適な構成を示す。
モジュール21が、サブフレーム
Figure 0004210521
(iは1からNまで増大する)のフィルタのN≧2のセットのインパルス応答を得るために、切り詰められ、かつ重みづけられインパルス応答
Figure 0004210521
の補間を行う。
サブフレームを基にした濾波は長さLfiltの横型フィルタ(transverse filter)23を用いて実現できる。それの係数
Figure 0004210521
(0≦n≦Lfilt、1≦i≦N)は、現在のフレームの指標iを基にしてセレクタ22により縦続して提供される。濾波すべき信号のサブフレームは入力フレームx(k,n)の細分により得られる。横型フィルタ23は、現在のサブフレームに関連させられている係数
Figure 0004210521
を持つ入力信号x(n)のくりこみにより雑音が低減された信号
Figure 0004210521
をこのようにして計算する。
サブフレーム・フィルタの応答
Figure 0004210521
はモジュール21により、現在のフレームに対して決定されたインパルス応答
Figure 0004210521
n)の重み付けられた和と、以前のフレームに対して決定されたインパルス応答
Figure 0004210521
の重み付けられた和として計算できる。サブフレームがフレーム内で規則的に分割されると、重み付けられた混合関数を特に
Figure 0004210521
とすることができる。フィルタ
Figure 0004210521
が直接適用される場合がN=1(サブフレーム無し)に対応することが観察される。
実施例 1
この実施例は会話による通信、特に低ビット速度の音声符号器の前処理に、適用するのに適する。
処理により導入される遅延を理論的な最大まで短縮し、しかも適用に適切なウィンドウを選択する可能性を利用者に提供するために、重なり合わないウィンドウが使用される。これは、装置の入力信号のウィンドウ化が完全な再構成制約を受けないので、可能である。
そのような応用では、あまり近くない半分よりも一層近い半分に対してより大きな重み付けを行うために、乗算器2により適用されるウィンドウ化関数w(n)は非対称であることが有利である。
図4に示されているように、異なるサイズL1とL2の2つのHanning半ウィンドウを用いて非対称解析ウィンドウw(n)を構成できる。
Figure 0004210521
移動用の多数の音声符号器は長さが20msのフレームを使用し、Fe=8kHzの標本化周波数(すなわち、フレーム当り160お標本)で動作する。図4に示されている実施例では、次の値が選択されている。L=160、L1=120およびL2=40。
そのようなウィンドウの選択は、スペクトル推定の重みを最も近い標本へ向かって集中して、良いスペクトル・ウィンドウを確保できることを意味する。提案されている方法によってそのような選択が可能にされる。その理由は、合成における信号の完全な再構成の制約がないからである(時間領域濾波による出力端子における信号再構成)。
周波数分解を一層良くするために、ユニット3と7は長さLFFT=256のFFTを使用する。この選択の背後にはある理由も存在する。その理由は、長さが2のべきであるフレームにFFTが適用される時に、FFTが数値的に最適であるからである。したがって、ウィンドウ・ブロックxw(k,n)をLFFT−L=96零標本(零パッディング)だけ前もって拡張する必要がある。
w(k,n)=0 L≦n≦LFFTに対して (19)
この実施例で用いられるボイス活動は、信号における短期間/長期間エネルギー比較を基にする従来の方法である。雑音パワースペクトル密度γbb(k,f)の推定は、信頼できる推定と雑音統計量の時間領域変動のトラッキングとの間の妥協を確保するために十分であるとみなされる、128msの時定数に対応する、α(kb)=0.8553である式(10)に従って、指数的平滑化により更新される。
雑音低減フィルタ
Figure 0004210521
のTFは、β(k)=0.98である(12)で定められている指定された決定推定値に従って有用な信号のPSDを前に推定した後で、式(5)(開ループ・ウィーナーフィルタ)に従って予め推定される。TFの最後の推定
Figure 0004210521
を生ずるために同じ関数Fがモジュール16により再び使用される。
Figure 0004210521
は実数値にされたTFであるので、時間領域フィルタは、
Figure 0004210521
により原因にされる。
その後でこのフィルタのLfilt=21係数を選択する。それは長さLfilt、この応用のための重要な標本に対応する値である、のHanningウィンドウwfilt(n)により重み付けられている。
Figure 0004210521
ここに
Figure 0004210521
時間領域濾波は、(17)により得られたサブフレーム
Figure 0004210521
のN=4個のフィルタにより行われる。それら4個のフィルタはその後で長さLfilt=21の横濾波(transverse filtering)を用いて入力信号x(i)(k,n)に適用される。それらのサブフレームは観察信号x(k,n)
(i)(k,n)=x(k,n)
(i−1).L/N≦n≦i.L/Nに対して (22)
のサイズL/4=40個の標本の連続抽出により得られている。
実施例 2
この実施例の装置は高性能の音声認識(騒がしい環境内での)への応用に適している。
この実施例では、連続する2つのフレームの間のL/2個の標本の相互に重なり合っている長さLの解析フレームが用いられ、用いられるウィンドウはHanninng型のものである。
Figure 0004210521
フレーム長さは20msに固定される、すなわち、標本化周波数Fe=8kHzにおいてL=160であり、フレームはFFTのために96の零標本が補充される(「零パッディング」。
この実施例では、雑音低減フィルタのTFの計算は、雑音
Figure 0004210521
のパワースペクトル密度の平方根と有用な信号
Figure 0004210521
のパワースペクトル密度の平方根との比を基にしており、したがって、雑音
Figure 0004210521
推定の係数と有用な信号
Figure 0004210521
推定の係数との比を基にしている。
この実施例で使用されるボイス活動検出は、信号における短期間/長期間エネルギー比較を基にしている既存の従来方法である。雑音信号
Figure 0004210521
Figure 0004210521
により更新される。ここにkbは現在の雑音フレームまたは最後の雑音フレームである(kが有用な信号フレームとして検出されるならば)。平滑化量αは定数として選択され、0.99に等しい。これは1.6sの時定数である。
雑音低減フィルタ
Figure 0004210521
のTFは、
Figure 0004210521
に従ってモジュール13により予め推定される。ここに、
F(y,z)=y/(y+z) (26)
である。
平方根を計算するとその係数に対して推定を行うことが可能にされる。それは、
Figure 0004210521
によりSNR η(k,f)に関連させられている。
係数
Figure 0004210521
としての有用な信号の推定値は、
Figure 0004210521
により得られる。ここにβ(k)=0.98である。
乗算器14は予め推定されたTF
Figure 0004210521
とスペクトラムX(k,f)の乗算を行い、その結果の係数(そしてそれの二乗ではない)は15で得られて、
Figure 0004210521
の改善された推定を提供し、それを基にして係数16は(25)におけるのと同じ関数Fを用いてTFの最後の推定
Figure 0004210521
を生ずる。
その後で時間領域応答
Figure 0004210521
が実施例1と全く同じやり方で得られる(時間領域への遷移、因果関係の復帰、重要な標本の選択およびウィンドウ化)。唯一の違いは、係数Lfiltの選択された数の選択にある。それはこの実施例ではLfilt=17に固定される。
入力フレームx(k,n)は、得られた雑音低減フィルタ時間領域応答
Figure 0004210521
に直接加えることにより、濾波される。サブフレームで濾波を行わないと式(17)でN=1を取ることになる。
本発明の方法を実施するために構成された雑音低減装置のブロック図である。 図1の装置で使用できる雑音低減フィルタの伝達関数を推定するユニットのブロック図である。 図1の装置で使用できる時間領域濾波ユニットのブロック図である。 この方法の特定の実施形態で使用できるウィンドウ化関数のグラフである。

Claims (18)

  1. 入力信号(x(n))の引き続くフレーム中の雑音を低減する方法であって、下記のステップ、
    ‐周波数領域へ変換することにより入力信号(x(n))のスペクトラム(X(k,f))を計算することと、
    前記スペクトラムから、周波数依存雑音レベル推定値を得ることと、
    前記スペクトラムと前記周波数依存雑音レベル推定値とから、そのフレームに対する第1の有用な周波数依存信号レベル推定値を計算することと、
    ‐第1の雑音低減フィルタの伝達関数
    Figure 0004210521
    を、第1の有用な周波数依存信号レベル推定値および周波数依存雑音レベル推定値を基にして計算することと、
    ‐入力信号のスペクトラムと第1の雑音低減フィルタの伝達関数を組合わせることにより、そのフレームに対する第2の有用な周波数依存信号レベル推定値を計算することと、
    ‐第2の雑音低減フィルタの伝達関数
    Figure 0004210521
    を、第2の有用な周波数依存信号レベル推定値および周波数依存雑音レベル推定値を基にして計算することと、
    ‐雑音が低減された信号を生ずるために、フレーム濾波する操作で第2の雑音低減フィルタの伝達関数を使用することと、
    をフレームの少なくともいくつかに対して備える、入力信号(x(n))の引き続くフレーム中の雑音を低減する方法。
  2. スペクトラム(X(k,f))の計算が、入力信号フレームをウィンドウ化関数(w(n))により重み付けすることと、重み付けられたフレームを周波数領域へ変換することとを備え、フレームのより近い半分に対してフレームのより近くない半分よりも強い重み付けを行うように、ウィンドウ化関数は非対称である請求項1に記載の方法。
  3. 雑音低減フィルタ・インパルス応答
    Figure 0004210521
    が、第2の雑音低減フィルタの伝達関数
    Figure 0004210521
    の時間領域への変換を基にして、現在のフレームに対して決定され、その時間領域内のフレームに対する濾波操作が前記フレームに対して決定された雑音低減フィルタ・インパルス応答により実行される請求項1または2に記載の方法。
  4. 現在のフレームに対する雑音低減フィルタ・インパルス応答
    Figure 0004210521
    の決定が、
    ‐第2の雑音低減フィルタの伝達関数
    Figure 0004210521
    を時間領域へ変換し第1のインパルス応答を得るステップと、
    ‐第1のインパルス応答を、時間領域への変換の点の数より十分少ない標本数に対応する打ち切り長さに打ち切るステップと、
    を備えている請求項3に記載の方法。
  5. 現在のフレームに対する雑音低減フィルタ・インパルス応答
    Figure 0004210521
    の決定が、
    ‐打ち切られている第1のインパルス応答に、前記打ち切り長さに対応する標本の数で、ウィンドウ化関数(wfilt(n))により重み付けするステップ、
    を更に備えている請求項4に記載の方法。
  6. 現在のフレームが複数のサブフレームに細分され、各サブフレームに対して補間されたインパルス応答
    Figure 0004210521
    は、現在のフレームに対して決定された雑音低減フィルタ・インパルス応答と、少なくとも1つの以前のフレームに対して決定された雑音低減フィルタ・
    インパルス応答とを基にして計算され、フレームの濾波操作が、時間領域内の各サブフレームの信号を、前記サブフレームに対して計算された補間されたインパルス応答に従って濾波することを含む請求項3から請求項5のいずれか1項に記載の方法。
  7. 補間されたインパルス応答
    Figure 0004210521
    が、現在のフレームの種々のサブフレームに対して、現在のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 0004210521
    の重み付けられた和と、以前のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 0004210521
    の重み付けられた和として計算される請求項6に記載の方法。
  8. 現在のフレームのi番目(1≦i≦N)のサブフレームに対して計算された補間されたインパルス応答
    Figure 0004210521
    は、以前のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 0004210521
    の(N−i)/N倍、現在のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 0004210521
    のi/N倍との和に等しく、Nは現在のフレームのサブフレームの数である請求項7に記載の方法。
  9. 入力信号(x(n))がオーディオ信号である請求項1から請求項8のいずれか1項に記載の方法。
  10. ‐周波数領域への変換により入力信号のフレームのスペクトラム(X(k,f))を計算する手段(1〜3)と、
    前記スペクトラムから、周波数依存雑音レベル推定値を得る手段(5)と、
    前記スペクトラムと前記周波数依存雑音レベル推定値とから、そのフレームに対する第1の有用な周波数依存信号レベル推定値を計算する手段(11)と、
    ‐第1の雑音低減フィルタの伝達関数
    Figure 0004210521
    を、第1の有用な周波数依存信号レベル推定値および周波数依存雑音レベル推定値を基にして計算する手段(13)と、
    ‐入力信号のスペクトラムと第1の雑音低減フィルタの伝達関数を組合わせることにより、フレームに対する第2の有用な周波数依存信号レベル推定値を計算する手段(14〜15)と、
    ‐第2の雑音低減フィルタの伝達関数
    Figure 0004210521
    を、第2の有用な周波数依存信号レベル推定値および周波数依存雑音レベル推定値を基にして計算する手段(16)と、
    ‐雑音が低減されている信号を生ずるためにフレームを第2の雑音低減フィルタの伝達関数により濾波する手段(7〜9)と、
    を備える入力信号(x(n))中の雑音を低減する装置。
  11. スペクトラム計算手段が、入力信号フレームをウィンドウ化関数(w(n))により重み付けする手段(2)と、重み付けられたフレームを周波数領域へ変換する手段(3)とを備え、フレームのより近い半分に対してフレームのより近くない半分よりも強い重み付けを行うように、ウィンドウ化関数は非対称である請求項10に記載の装置。
  12. 現在のフレームに対する雑音低減フィルタ・インパルス応答
    Figure 0004210521
    を、第2の雑音低減フィルタの伝達関数
    Figure 0004210521
    の時間領域への変換を基にして決定する手段(7〜8)を備え、この装置において濾波手段(9)は現在のフレームに対して決定された雑音低減フィルタ・インパルス応答によりその時間領域内で動作する請求項10または11に記載の装置。
  13. 現在のフレームに対する雑音低減フィルタ・インパルス応答
    Figure 0004210521
    を決定する手段が、第1のインパルス応答を得るために、第2の雑音低減フィルタの伝達関数
    Figure 0004210521
    を時間領域へ変換する手段(7)と、第1のインパルス応答を、時間領域への変換の点の数より十分少ない標本数に対応する打ち切り長さに打ち切る手段(8)とを備えている請求項12に記載の装置。
  14. 現在のフレームに対する雑音低減フィルタ・インパルス応答を決定する手段が、打ち切られている第1のインパルス応答に、前記打ち切り長さに対応する標本の数で、ウィンドウ化関数(wfilt(n))により重み付けする手段(8)を備えている請求項13に記載の装置。
  15. 現在のフレームを複数のサブフレームに細分する手段と、各サブフレームに対して補間されたインパルス応答
    Figure 0004210521
    を、現在のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 0004210521
    と、少なくとも1つの以前のフレームに対して決定された雑音低減フィルタ・インパルス応答とを基にして計算する手段(21)とを更に備え、濾波手段(9)は、時間領域内の各サブフレームの信号を、前記サブフレームに対して計算された補間されたインパルス応答に従って濾波する手段(23)を備えている請求項12から請求項14のいずれか1項に記載の装置。
  16. 補間されたインパルス応答
    Figure 0004210521
    を計算する手段が、現在のフレームの種々のサブフレームに対して、現在のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 0004210521
    の重み付けられた和と、以前のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 0004210521
    の重み付けられた和として計算するために構成されている請求項15に記載の装置。
  17. 現在のフレームのi番目(1≦i≦N)のサブフレームに対して計算された補間されたインパルス応答
    Figure 0004210521
    は、以前のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 0004210521
    の(N−i)/N倍、現在のフレームに対して決定された雑音低減フィルタ・インパルス応答
    Figure 0004210521
    のi/N倍との和に等しく、Nは現在のフレームのサブフレームの数である請求項16に記載の装置。
  18. 入力信号(x(n))がオーディオ信号である請求項10から請求項17のいずれか1項に記載の装置。
JP2002561819A 2001-01-30 2001-11-19 雑音低減法および装置 Expired - Fee Related JP4210521B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0101220A FR2820227B1 (fr) 2001-01-30 2001-01-30 Procede et dispositif de reduction de bruit
PCT/FR2001/003624 WO2002061731A1 (fr) 2001-01-30 2001-11-19 Procede et dispositif de reduction de bruit

Publications (3)

Publication Number Publication Date
JP2004520616A JP2004520616A (ja) 2004-07-08
JP2004520616A5 JP2004520616A5 (ja) 2005-11-17
JP4210521B2 true JP4210521B2 (ja) 2009-01-21

Family

ID=8859390

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002561819A Expired - Fee Related JP4210521B2 (ja) 2001-01-30 2001-11-19 雑音低減法および装置

Country Status (14)

Country Link
US (1) US7313518B2 (ja)
EP (1) EP1356461B1 (ja)
JP (1) JP4210521B2 (ja)
KR (1) KR100549133B1 (ja)
CN (1) CN1284139C (ja)
AT (1) ATE472794T1 (ja)
BR (1) BRPI0116844B1 (ja)
CA (1) CA2436318C (ja)
DE (1) DE60142490D1 (ja)
ES (1) ES2347760T3 (ja)
FR (1) FR2820227B1 (ja)
HK (1) HK1057639A1 (ja)
MX (1) MXPA03006667A (ja)
WO (1) WO2002061731A1 (ja)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7725315B2 (en) 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7885420B2 (en) 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US7895036B2 (en) 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7778425B2 (en) * 2003-12-24 2010-08-17 Nokia Corporation Method for generating noise references for generalized sidelobe canceling
US7516069B2 (en) * 2004-04-13 2009-04-07 Texas Instruments Incorporated Middle-end solution to robust speech recognition
EP1591995B1 (en) * 2004-04-29 2019-06-19 Harman Becker Automotive Systems GmbH Indoor communication system for a vehicular cabin
JP5068653B2 (ja) * 2004-09-16 2012-11-07 フランス・テレコム 雑音のある音声信号を処理する方法および該方法を実行する装置
US7383179B2 (en) * 2004-09-28 2008-06-03 Clarity Technologies, Inc. Method of cascading noise reduction algorithms to avoid speech distortion
KR100565086B1 (ko) * 2004-10-13 2006-03-30 삼성전자주식회사 뮤지컬 잡음을 감쇄하는 스펙트럼 잡음 제거 방법 및 그장치
JP2008529073A (ja) 2005-01-31 2008-07-31 ソノリト・アンパルトセルスカブ 重み付けされたオーバーラップ加算方法
FR2888458A1 (fr) * 2005-07-11 2007-01-12 France Telecom Procede et dispositif de prise de son, notamment dans des terminaux telephoniques en "mains libres"
JP4765461B2 (ja) * 2005-07-27 2011-09-07 日本電気株式会社 雑音抑圧システムと方法及びプログラム
US8358866B2 (en) * 2006-01-31 2013-01-22 Canadian Space Agency Method and system for increasing signal-to-noise ratio
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
JP4653059B2 (ja) * 2006-11-10 2011-03-16 オリンパス株式会社 撮像システム、画像処理プログラム
DE602007004217D1 (de) * 2007-08-31 2010-02-25 Harman Becker Automotive Sys Schnelle Schätzung der Spektraldichte der Rauschleistung zur Sprachsignalverbesserung
EP2058803B1 (en) * 2007-10-29 2010-01-20 Harman/Becker Automotive Systems GmbH Partial speech reconstruction
US20100151118A1 (en) * 2008-12-17 2010-06-17 Eastman Chemical Company Carrier solvent compositions, coatings compositions, and methods to produce thick polymer coatings
US9449611B2 (en) * 2011-09-30 2016-09-20 Audionamix System and method for extraction of single-channel time domain component from mixture of coherent information
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
WO2012126415A2 (zh) 2012-05-04 2012-09-27 华为技术有限公司 一种信号发送方法、通信设备及***
CN103916730B (zh) * 2013-01-05 2017-03-08 中国科学院声学研究所 一种能够改善音质的声场聚焦方法及***
CN103916733B (zh) * 2013-01-05 2017-09-26 中国科学院声学研究所 基于均方误差最小准则的声能量对比控制方法及***
US9318125B2 (en) * 2013-01-15 2016-04-19 Intel Deutschland Gmbh Noise reduction devices and noise reduction methods
BR112015031606B1 (pt) * 2013-06-21 2021-12-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para desvanecimento de sinal aperfeiçoado em diferentes domínios durante ocultação de erros
US10149047B2 (en) * 2014-06-18 2018-12-04 Cirrus Logic Inc. Multi-aural MMSE analysis techniques for clarifying audio signals
CN113115197B (zh) * 2016-05-09 2022-09-16 哈曼国际工业有限公司 噪声检测方法和***
CN108848435B (zh) * 2018-09-28 2021-03-09 广州方硅信息技术有限公司 一种音频信号的处理方法和相关装置
CN110010144A (zh) * 2019-04-24 2019-07-12 厦门亿联网络技术股份有限公司 语音信号增强方法及装置
CN111402917B (zh) * 2020-03-13 2023-08-04 北京小米松果电子有限公司 音频信号处理方法及装置、存储介质
CN111968615A (zh) * 2020-08-31 2020-11-20 Oppo广东移动通信有限公司 降噪处理方法及装置、终端设备和可读存储介质
US20210012767A1 (en) * 2020-09-25 2021-01-14 Intel Corporation Real-time dynamic noise reduction using convolutional networks
CN112489615B (zh) * 2020-10-29 2024-06-18 宁波方太厨具有限公司 降噪方法、降噪***、降噪装置及吸油烟机
CN112960012B (zh) * 2021-02-03 2022-05-31 中国铁道科学研究院集团有限公司节能环保劳卫研究所 基于阈值归一化短时功率谱密度的高速铁路钢轨波磨声学诊断方法
KR20240048109A (ko) 2022-10-06 2024-04-15 주식회사 쿱와 센싱신호로부터 노이즈를 제거하기 위한 장치 및 노이즈 제거하기 위한 방법
CN116952355B (zh) * 2023-07-24 2024-05-14 中国人民解放军海军工程大学 一种浅海环境近场辐射噪声测量***及终端
CN116952356A (zh) * 2023-07-24 2023-10-27 中国人民解放军海军工程大学 基于浅海环境水下声全息技术的近场辐射噪声测量方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69428612T2 (de) * 1993-01-25 2002-07-11 Matsushita Electric Industrial Co., Ltd. Verfahren und Vorrichtung zur Durchführung einer Zeitskalenmodifikation von Sprachsignalen
FR2726392B1 (fr) * 1994-10-28 1997-01-10 Alcatel Mobile Comm France Procede et dispositif de suppression de bruit dans un signal de parole, et systeme avec annulation d'echo correspondant
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
JP2760373B2 (ja) * 1995-03-03 1998-05-28 日本電気株式会社 雑音消去装置
JP2874679B2 (ja) * 1997-01-29 1999-03-24 日本電気株式会社 雑音消去方法及びその装置
US5999561A (en) * 1997-05-20 1999-12-07 Sanconix, Inc. Direct sequence spread spectrum method, computer-based product, apparatus and system tolerant to frequency reference offset
FR2771542B1 (fr) * 1997-11-21 2000-02-11 Sextant Avionique Procede de filtrage frequentiel applique au debruitage de signaux sonores mettant en oeuvre un filtre de wiener
US6549586B2 (en) * 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
US6792405B2 (en) * 1999-12-10 2004-09-14 At&T Corp. Bitstream-based feature extraction method for a front-end speech recognizer

Also Published As

Publication number Publication date
KR100549133B1 (ko) 2006-02-03
CA2436318C (fr) 2007-09-04
MXPA03006667A (es) 2003-10-24
BR0116844A (pt) 2003-12-16
KR20030074762A (ko) 2003-09-19
CA2436318A1 (fr) 2002-08-08
ATE472794T1 (de) 2010-07-15
EP1356461B1 (fr) 2010-06-30
US7313518B2 (en) 2007-12-25
JP2004520616A (ja) 2004-07-08
DE60142490D1 (de) 2010-08-12
BRPI0116844B1 (pt) 2015-07-28
FR2820227B1 (fr) 2003-04-18
EP1356461A1 (fr) 2003-10-29
ES2347760T3 (es) 2010-11-04
HK1057639A1 (en) 2004-04-08
US20040064307A1 (en) 2004-04-01
WO2002061731A1 (fr) 2002-08-08
FR2820227A1 (fr) 2002-08-02
CN1488136A (zh) 2004-04-07
CN1284139C (zh) 2006-11-08

Similar Documents

Publication Publication Date Title
JP4210521B2 (ja) 雑音低減法および装置
JP5068653B2 (ja) 雑音のある音声信号を処理する方法および該方法を実行する装置
US6549586B2 (en) System and method for dual microphone signal noise reduction using spectral subtraction
KR100594563B1 (ko) 선형 컨벌루션 및 인과 필터링을 사용하는 스펙트럼 감산에 의한 신호 잡음 감소
EP1252796B1 (en) System and method for dual microphone signal noise reduction using spectral subtraction
US8010355B2 (en) Low complexity noise reduction method
AU696152B2 (en) Spectral subtraction noise suppression method
US6487257B1 (en) Signal noise reduction by time-domain spectral subtraction using fixed filters
CN111554315B (zh) 单通道语音增强方法及装置、存储介质、终端
KR100789084B1 (ko) 웨이블릿 패킷 영역에서 비선형 구조의 과중 이득에 의한음질 개선 방법
CN102347028A (zh) 双麦克风语音增强装置及方法
EP1080463B1 (en) Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging
CN108172231A (zh) 一种基于卡尔曼滤波的去混响方法及***
JP2004502977A (ja) サブバンド指数平滑雑音消去システム
RU2768514C2 (ru) Процессор сигналов и способ обеспечения обработанного аудиосигнала с подавленным шумом и подавленной реверберацией
AT509570B1 (de) Methode und apparat zur einkanal-sprachverbesserung basierend auf einem latenzzeitreduzierten gehörmodell
Compernolle DSP techniques for speech enhancement
Djendi A new efficient wavelet-based adaptive algorithm for automatic speech quality enhancement
Krishnamoorthy et al. Processing noisy speech for enhancement
Kamaraju et al. Speech Enhancement Technique Using Eigen Values
GALA SPEECH SIGNAL ENHANCEMENT TECHNIQUES FOR MICROPHONE ARRAYS
Ohtani et al. REVERB Workshop 2014
Islam et al. Single Channel Speech Enhancement Using Spectral Subtraction Based on Minimum Statistics

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040408

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040408

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070117

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070910

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081008

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081027

R150 Certificate of patent or registration of utility model

Ref document number: 4210521

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111031

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121031

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131031

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees