JP2002537586A - 雑音を消去するためのシステム、方法及び装置 - Google Patents

雑音を消去するためのシステム、方法及び装置

Info

Publication number
JP2002537586A
JP2002537586A JP2000600263A JP2000600263A JP2002537586A JP 2002537586 A JP2002537586 A JP 2002537586A JP 2000600263 A JP2000600263 A JP 2000600263A JP 2000600263 A JP2000600263 A JP 2000600263A JP 2002537586 A JP2002537586 A JP 2002537586A
Authority
JP
Japan
Prior art keywords
noise
frequency bins
audio signal
minimum
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2000600263A
Other languages
English (en)
Inventor
マラシュ,ジョセフ
バードュゴ,バルチ
Original Assignee
アンドレア エレクトロニクス コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/252,874 external-priority patent/US6363345B1/en
Application filed by アンドレア エレクトロニクス コーポレイション filed Critical アンドレア エレクトロニクス コーポレイション
Publication of JP2002537586A publication Critical patent/JP2002537586A/ja
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

(57)【要約】 コンピュータに用いられるAC−DC電力コンバータのような電気的または電磁気的雑音源から発生する音声信号雑音の消去及び低減を行うためのシステム。システムは、音声信号帯域の少なくとも2倍の周波数でサンプリングされたデジタル音声信号(102)を受け取る。サンプリングされた入力は256点の一時バッファ(104)に格納され、バッファが一杯になると、結合器(106)により新しい256点が前の256点と結合されて512点の入力が与えられ、この512点に乗算器(108)により長さが512点のシェーディングウインドウが乗じられる。シェーディングがかけられた結果はFFTプロセッサ(110)により周波数ドメインに変換される。FFTの出力は、それぞれの周波数ビンに対する雑音強度推定プロセス、それぞれの周波数ビンに対する無雑音複素数値を推定する減算プロセス及び残留雑音低減プロセスを含む、雑音プロセッサ(112)で処理される。

Description

【発明の詳細な説明】参照として含まれる関連出願 本出願は、1999年2月18日に出願された米国特許出願第09/252,
874号及び1999年8月30日に出願された米国特許出願第09/385,
996号による優先権を主張し、1999年3月26日に出願された米国特許出
願第60/126,567号への参照がなされ、これらの特許出願の全てが本明
細書に参照により含まれる。 以下の特許出願及び特許が引用され、本明細書に参照により含まれる:199
9年2月18日に出願された米国特許出願第09/252,874号;1998
年8月6日に出願された米国特許出願第09/130,923号;1998年4
月7日に出願された米国特許出願第09/055,709号;1998年4月1
3日に出願された米国特許出願第09/059,503号;1997年4月14
日に出願された米国特許出願第08/840,159号;1998年8月6日に
出願された米国特許出願第09/130,923号;今は発行済米国特許第5,
825,898号(1998年10月20日発行)になった米国特許出願第08/
672,899号;及び1998年6月3日に出願された米国特許出願第09/
089,710号;1998年10月20日に発行された米国特許第5,825
,897号;1998年3月24日に発行された米国特許第5,732,143
号;1997年9月30日に発行された米国特許第5,673,325号;19
95年1月10日に発行された米国特許第5,381,473号;1997年4
月4日に出願された米国特許出願第08/833,384号。また、本明細書に
引用される資料は全て本明細書に参照により含まれ、本明細書に引用される資料
に引用されるか参照される資料も同様である。発明の属する技術分野 本発明は雑音消去及び低減に関し、さらに詳しくは、スペクトル減算を用いる
雑音消去及び低減に関する。発明の背景 音声に付加される周囲雑音は音声処理アルゴリズムの性能を劣化させる。その
ような処理アルゴリズムには、ディクテーション、音声起動、音声圧縮及びその
他のシステムが含まれ得る。そのようなシステムにおいては、音声及びその特徴
に影響を与えずに雑音を低減して、 信号対雑音比(S/N比)を向上させること
が望ましい。 近距離音場防騒音マイクロフォンは満足すべき解決を与えるが、音声源(例え
ば口)の近くにマイクロフォンがなければならない。多くの場合、このことはヘ
ッドフォンのブームにマイクロフォンを取り付けて、ブーム末端にあるマイクロ
フォンを着用者の口の近くに位置させることにより達成される。しかしヘッドフ
ォンは着用するに快適ではなく、あるいは、例えば自動車内での操作には窮屈す
ぎることがわかっている。 一般にマイクロフォンアレイ技術、特に補償ビーム形成アレイは、激しい方向
性雑音を最も効率のよい態様で処理する。これらのシステムは雑音場をマッピン
グし、雑音源に向けて複数のヌルを生成する。ヌルの数はマイクロフォン素子の
数及び処理能力により制限される。そのようなアレイは、ヘッドフォンを必要と
しない、ハンドフリー操作という利点を有する。 しかし、雑音源が拡散している場合には、必ずしも十分ではない定常遅延及び
加算マイクロフォンアレイの能力まで、補償システムの性能が低下することにな
ろう。これは、雑音が部屋の壁で強く反射されて無限数の方向からアレイに到達
するような、環境が極めて反響性の高い場合に当てはまる。雑音の内のいくらか
が車台から放射される車内環境における場合にも当てはまる。発明の目的及び概要 スペクトル減算法は、汚染された信号の雑音強度スペクトルを推定することに
よる、雑音をさらに低減するための解決法を提供する。本方法は、雑音のスペク
トル強度レベルを、音声スイッチにより検出された無声時間区間の間に雑音を測
定することにより推定し、次いで信号から雑音強度スペクトルを減算する。この
方法は、 「スペクトル減算を用いる音声内音響雑音の抑制」(スティーブン・F・ボ
ル(Steven F. Boll),“IEEE ASSP”誌,第27巻,第2号(1979年
4月))に詳細に説明されており、音声信号と相関しない定常拡散雑音に対しては
良好な結果が得られる。しかしスペクトル減算法は、スペクトル減算が制御され
ていなければ(ボコーダーまたは音声起動のような)音声アルゴリズムの性能を低
下させ得る、時に楽音ノイズと称される、アーティファクトをつくりだす。さら
にスペクトル減算法は、音声スイッチが音声の存在を正確に検出し、また無声時
間区間を正確に捜しあてるという仮定に強く依存している。この仮定はオフライ
ンシステムに対しては妥当であるが、リアルタイムシステムで達成するかまたは
成立させることは困難である。 さらに詳しくは、無声時間区間の256点FFT(高速フーリエ変換)を行い、
周波数ビンのそれぞれのエネルギーを計算することにより、雑音強度スペクトル
が推定される。 FFTは時間ドメイン信号に50%の重なりをもつ(ハニング(H
anning)またはその他の)シェーディングウインドウが乗じられた後に行われる。
それぞれの周波数ビンのエネルギーは、隣り合うFFT時間フレームと平均され
る。フレームの数は定められていないが、雑音の安定性に依存する。定常雑音に
対しては、より良い雑音推定を達成するために多くのフレームが平均されること
が好ましい。非定常雑音に対しては、長平均化は有害であり得る。問題は、定常
雑音であるか非定常雑音であるかを先験的に知る手段がないことである。 推定雑音強度スペクトラムが計算されたとすれば、 入力信号に(ハニングまた
はその他の)シェーディングウインドウが乗じられ、(256点またはその他の数
の点の)FFTが重なり50%で行われ、 周波数ビンのそれぞれの強度が2〜3
のFFTフレームにかけて平均される。次いで雑音強度スペクトルが信号強度か
ら減算される。減算結果が負であればその値はゼロで置き換えられる(半波整流)
。しかし、低い値を最小値(またはゼロ)で置き換えるか、あるいは残留雑音を3
0dB減衰させることにより、無声区間中に存在する残留雑音をさらに低減する
ことが推奨される。得られる出力は無雑音強度スペクトルである。 スペクトルの複素データは、信号のFFTの該当する周波数ビンの位相情報を
無雑音強度に適用することにより再構成される。次いで、無雑音時間ドメインデ
ータを得るために、IFFT(高速逆フーリエ変換)プロセスが複素データに施さ
れる。得られた時間ドメインデータは、FFTの重ね合わせプロセスを補償する
ために、前のフレームで得られたデータと重ね合わされて足し合わされる。 上述のシステムにはいくつかの問題がともなっている。第1に、システムは、
あらかじめ有声及び無声時間区間についての知識があることを前提としている。
音声スイッチはこれらの時間区間を検出するには実用的でない。理論上、音声ス
イッチはエネルギーレベルを測定してこれを閾値と比較することにより音声の存
在を検出する。閾値が高すぎると、ある有声時間区間が無声時間区間と見なされ
るかもしれず、よってシステムが音声情報を雑音と見なしてしまう危険性がある
。この結果、特に信号対雑音比が劣っている場合に、音声歪が生じる。他方で閾
値が低すぎると、特に信号対雑音比が劣っている場合及び音声がほとんど間をお
かずに持続している場合に、無声区間が短くなりすぎる危険性がある。 別の問題はFFT結果の強度計算が極めて複雑なことである。強度計算には、
計算負荷の点で非常に高コストである二乗及び平方根演算が含まれる。また別の
問題は、IFFTのための情報を得るための、無雑音強度スペクトルへの位相情
報の関連付けである。このプロセスには、位相の計算、情報の格納、及びこの情
報の強度データへの適用が必要であり、これらは全て計算負荷及び所要メモリの
点で高コストである。さらに別の問題は雑音強度スペクトルの推定である。FF
Tプロセスは質が低く不安定なエネルギー推定法である。フレームの時間平均化
は、安定性に十分には寄与しない。FFT結果の長さを短縮すれば、周波数ビン
のそれぞれの帯域が広くなり、安定性が高くなるが、システムの性能は低下する
。時間平均化はさらに、データを不鮮明にし、このため数フレームより多くのフ
レームにまで拡張することができない。このことは、提案された雑音推定プロセ
スの安定性が必ずしも十分ではないことを意味する。 したがって本発明の目的は、信号対雑音比が劣っている情況及び持続的な早口
の音声の場合であっても雑音強度スペクトルを推定するための、単純ではあるが
効率のよい機構を有するスペクトル減算システムを提供することにある。 本発明の別の目的は、わずかなコストで強度推定を実行でき、位相関連付けの
問題を克服するであろう、効率のよい機構を提供することにある。 本発明のまた別の目的は、データを不鮮明にすることなく雑音強度スペクトル
を推定するための安定な機構を提供することにある。 上記の目的にしたがい、本発明は音声信号の無声区間を正しく決定し、よって
有声区間内での雑音消去信号の誤処理を防止するシステムを提供する。好ましい
実施形態において、本発明は、周波数ビンのそれぞれに対し別々の閾値検出器を
用いて無声区間を正確に決定することにより音声スイッチを不要にする。閾値検
出器は、入力信号の周波数スペクトル要素、すなわち周波数ビンが、プリセット
された期間にわたる周波数スペクトル要素の最小値にしたがって、さらに詳しく
は、周波数スペクトル要素の現在及び将来の最小値にしたがって設定された閾値
の範囲内にあるか否かを決定することにより、持続的有声区間内であってさえ、
雑音要素の位置を精確に検出する。すなわち、それぞれの音節に対し、信号全体
のエネルギーを調べることなく別々の閾値を決定することにより雑音要素のエネ
ルギーが決定され、よって、雑音の良好で安定な推定値を与える。さらに、シス
テムは継続的に閾値をセットし、あらかじめ定められた期間内、例えば5秒以内
に閾値をリセットすることが好ましい。 複素数の計算を少なくするため、本発明においては、例えば入力音声信号の実
数部及び虚数部の高い方の値及び低い方の値にしたがう、入力信号の実数部と虚
数部の乗算結合を用いて入力信号の強度の推定値を得ることが好ましい。スペク
トル推定の不安定性をさらに低減するために、2元(2D)平滑化プロセスが信号
推定に適用される。まずそれぞれの時間フレームにおける隣り合う周波数ビンを
用い、次いでそれぞれの周波数ビンに対して時間平均をとる指数時間平均を施す
2ステップ平滑化関数により優れた結果が得られる。 減算中に周波数ビンの位相を決定し、よって減算している要素の位相を揃える
ことの複雑さを低減するため、本発明はフィルタ乗算を適用して減算を行う。フ
ィルタ関数、例えばウイーナーフィルタ関数、または近似ウイーナーフィルタ関
数に、周波数ドメイン音声信号の複素データが乗じられる。フィルタ関数は全波
整流、あるいはそうでなければ本減算プロセスまたは単純減算の負の結果に対し
て、半波整流を行うことができる。雑音要素は持続的有声区間中に決定されるか
ら、雑音推定は正確であり、この推定雑音を音声信号から継続的に消去すること
ができて、優れた雑音消去特性を得られることが理解されよう。 本発明は、雑音消去後に残る残留雑音を低減するための残留雑音低減プロセス
も提供する。残留雑音は、例えば持続的音声内の無声区間をゼロ化するかあるい
は無声区間を減衰させることにより低減される。音声スイッチ、または時間ドメ
インにおける無声区間を検出するその他の閾値検出器を用いることができる。 本発明は、本明細書に参照により含めた米国特許出願に記述されるシステムを
含むが、これらには限定されない、様々な雑音消去システムに適用できる。本発
明は、例えば補償ビーム形成アレイに適用できる。さらに、本発明は、アプリケ
ーションソフトウエアまたはハードウエアとしてインストールされた、コンピュ
ータプロセッサを駆動するためのコンピュータプログラムとして実施することが
できる。 本発明にしたがうその他の目的、特徴及び利点は、例示的実施形態についての
以下の詳細な説明を、相応する要素は同じ参照数字で識別される添付図面ととも
に読めば明らかになるであろう。好ましい実施形態の詳細な説明 一実施形態において、本発明は、電気的または電磁気的雑音源、例えばAC電
源またはコンピュータ、特にラップトップコンピュータに用いられるようなAC
−DC電力コンバータのような電力供給源を含む電源のような外部電磁雑音源、
から発生する雑音を消去及び/または低減するためのスペクトル減算システム、
方法及び装置として実施できる。特に、ラップトップ機のようなコンピュータの
電力供給源は、ユニバーサル・シリアル・バス(USB)ライン、ポートまたはU
SB上の信号に、あるいはこれらに関連して、妨害雑音を発生することが発見さ
れた。電力変換に関わる電源は、例えばUSB信号ラインへの電磁結合を介して
伝達される、(本明細書で“等方性拡散定常雑音”または“等方性雑音”と称さ
れる)USB信号ライン上の信号と干渉する妨害信号を明らかに発生する。この
雑音はトランスデューサによって再生されると、例えばバズ音として聞こえる。
皮肉なことにUSBは、サウンドカードのようなデバイス上に現れる、そのよう
な雑音源から音声雑音が生じることを回避すると以前は考えられていた。USB
は、例えばインターネットまたはその他の遠隔通信媒体を介して受け取られる信
号を含む音声信号周辺装置から受け取られる、会話及び音声の交信用途のための
標準に急速になりつつあるため、上記の等方性雑音を除去することは重要な業績
であり、実際、ドルビー(商標)方式が発明されたときと同じ衝撃を市場に与える
ことになろう。 本明細書に説明される本発明は、電源または電力コンバータから発生し、US
B信号ライン上に現れる“汚い雑音”を除去するために見いだされた。当業者で
あれば、例えばデバイスドライバあるいは関連の米国特許出願第60/126,
567号で特に述べられているようなダイナミックリンクライブラリを含む、コ
ンピュータ上への良く知られたコンピュータソフトウエア及び/またはハードウ
エアアプリケーションのいずれとしても、本明細書に説明されるスペクトル減算
システム、方法及び装置がどのように実施されるかを理解するであろう。米国特
許出願第60/126,567号の発明と協同して、本発明は、プルダウンメニ
ューにより選択可能な、等方性雑音をフィルタリングして除去するためのフィル
タを含む。一実施形態において、本発明の好ましい動作範囲は、コンピュータプ
ロセッサの制御の下で自動的にあるいは、例えばポテンショメータまたはタブ付
プルダウンスライダーにより与えられるクリック可能なオブジェクトを用いてユ
ーザにより手動で、8dBから14dBの間で増減可能であることがわかった。
他のdB範囲を与えることも本発明の範囲内ではあるが、このdB範囲で最適な
性能が得られると思われる。しかし、雑音低減量が14dBを超えると音声が侵
されて、音声認識の劣化がおこり得る。 すなわち、本発明は音響雑音だけでなく、固有のシステム雑音すなわちシステ
ムにより誘起される雑音にも適用可能であり、本発明は音響雑音だけでなくシス
テムにより誘起されるシステム固有雑音(例えば電源または電力コンバータから
の雑音)も低減または除去する。 図1は、本発明の実施形態100を示す。システムは、音声信号帯域幅の少な
くとも2倍の周波数でサンプリングされたデジタル音声信号を、入力102で受
け取る。一実施形態において、信号は、アナログフロントエンド、A/Dコンバ
ータ、及び所要のサンプリング周波数を得るためのデシメーションフィルタを通
して処理されたマイクロフォン信号から得られる。別の実施形態においては、入
力はビーム形成器の出力から、または補償ビーム形成器の出力からさえもとられ
る。この場合、信号は、所望の信号と同じ方向から発する雑音のほとんどを残し
、所望の信号とは別の方向から到達する雑音を除去するように処理される。また
別の実施形態において、入力信号は、処理プロセスがPCプロセッサまたは同様
のコンピュータプロセッサ上で実施される場合に、サウンドボードから得ること
ができる。 サンプリングされた入力は256点の一時バッファ104に格納される。バッ
ファが一杯になると、新しい256点が結合器106で前の256点と結合され
て512点の入力を与える。乗算器108で長さ512点のシェーディングウイ
ンドウが512点の入力に乗じられる。シェーディングウインドウは適宜入力デ
ータに乗じられる係数をもつ。シェーディングウインドウはハニングまたはその
他のウインドウとすることができ、2つの目的:第1は処理された2つのブロッ
クの間の過渡部分を(重ね合わせプロセスとともに)平滑化すること;第2は周波
数ドメインのサイドローブを減衰し、よって高エネルギーサイドローブによる低
エネルギーの音調のマスキングを防止すること、に役立つ。シェーディングをか
けられた結果はFFT(高速フーリエ変換)プロセッサ110により周波数ドメイ
ンに変換される。256点または1024点を含むその他の長さのFFTサンプ
ル(したがって入力バッファ)もとることができる。 FFTの出力は256の有効点の複素ベクトルである(残りの256点は初め
の256点の反対称写像である)。これらのデータ点は、それぞれの周波数ビン
に対する雑音強度推定−それぞれの周波数ビンに対して無雑音複素数値を推定す
る減算プロセス、及び雑音低減プロセス−を含む、雑音処理ブロック112(2
00)で処理される。IFFT(高速逆フーリエ変換)プロセッサ114が複素無
雑音データに逆フーリエ変換を施し、512の時間ドメインデータ点を与える。
前半の256の時間ドメインデータ点は加算器116により前の512の時間ド
メインデータ点の後半の256のデータ点と加算されて、入力の重ね合わせ及び
シェーディングプロセスについて補償され、出力端子118に出力される。残り
の256点は次の反復のために取りおかれる。 好ましい実施形態においては特定の変換が利用されるが、他の変換を本発明に
適用しても雑音信号スペクトルが得られることは当然理解されよう。 図2は雑音処理ブロック200(112)の詳細図である。初めに、それぞれの
周波数ビン(n)202の強度が推定される。直截的な手法は:
【数1】 を計算することにより強度を推定することである。 処理時間を短縮し複雑さを軽減するために、信号強度(Y)は推定器204によ
り近似公式:
【数2】 を代わりに用いて推定される。 FFTプロセスを一般に悩ませる (参考文献[2]:オッペンハイム・シェイフ
ァー(Oppenheim Schfer),「デジタル信号処理」,プレンティス・ホール(Prentic
e Hall)社, 542〜545ページ)、スペクトル推定の不安定性を小さくする
ために、本発明は2D平滑化プロセスを実施する。それぞれの周波数ビンは、第
1の平均化器206によりそれぞれの周波数ビンの値と(同じ時間フレ−ムの)隣
り合う2つの周波数ビンの値との平均値で置き換えられる。さらに、平滑化され
たそれぞれの周波数ビンの平滑化された値は、 時定数が(3つの時間フレームに
わたる平均化に等価な)0.7の、指数時間平均を用いる第2の平均化器208
によりさらに平滑化される。次いで、2D平滑化された値に2つのプロセス−雑
音推定プロセッサ212(300)による雑音推定プロセス及び減算器210によ
る減算プロセス−が施される。雑音推定プロセスはそれぞれの周波数ビンにおけ
る雑音を推定し、その結果が雑音減算プロセスに用いられる。雑音減算出力は残
留雑音低減プロセッサ216に与えられ、雑音をさらに低減する。一実施形態に
おいて、無声区間を決定するために、時間ドメイン信号も残留雑音プロセス21
6で用いられる。無雑音信号218は、時間ドメイン出力を得るため、IFFT
プロセスに送られる。 図3は、雑音推定プロセッサ300(212)の詳細図である。理論上、雑音は
無声時間区間の信号強度(Y)の長時間平均をとることにより推定されるべきであ
る。このためには、有声/無声区間を検出するために音声スイッチが用いられな
ければならない。しかし感度閾値が高すぎるスイッチでは、処理後の音声信号に
欠落を生じさせるような音声入力信号を雑音推定に使用することになる可能性が
ある。他方で、 感度閾値がかなり低いスイッチは雑音時間区間長を(特に持続的
音声の場合に)大幅に短くし、雑音推定の有効性を失わせる可能性がある。 本発明においては、それぞれの周波数ビン302に対して個別の補償閾値が実
施される。これにより、それぞれの周波数ビンに対して信号の全体エネルギーを
調べることなく個別に雑音要素の位置をつきとめることができる。この方法の背
後にある論理は、それぞれの音節に対して、エネルギーは相異なる周波数帯に出
現し得るということである。同時に、他の周波数帯はおそらく雑音要素を含む。
したがって雑音に対して無感度の閾値を適用し、それでも、持続的音声の中でさ
え、それぞれの周波数ビンに対して多くの無声データ点の位置をつきとめること
が可能である。本方法の利点は、持続的音声区間内であっても、良好で安定な雑
音推定のために多くの雑音区間を収集できることである。 閾値決定プロセスにおいては、それぞれの周波数ビンに対して、2つの最小値
が計算される。304において、5秒毎に将来の最小値が現在の強度(Y(n))で
開始され、以下のプロセスにより次の5秒間にわたってより小さい最小値で置き
換えられる。それぞれの周波数ビンの将来の最小値は、現在の信号強度値と比較
される。現在の強度値が将来の最小値より小さければ、将来の最小値が現在の強
度値で置き換えられ、現在の強度値が新しい将来の最小値になる。 同時に、現在の最小値が306において計算される。現在の最小値は、5秒毎
に前の5秒間にわたって決定された将来の最小値で開始され、現在の強度値と比
較されることにより次の5秒間の信号の最小値に追随する。現在の最小値は減算
プロセスに用いられ、一方将来の最小値は現在の最小値の開始及び更新に用いら
れる。 本発明の雑音推定機構は、限られたプロセスメモリ(5秒間)を用いて、雑音値
の厳密で迅速な推定を保証する一方で、高すぎる雑音推定を防止する。 それぞれの周波数ビンの強度(Y(n))は、コンパレータ308により、当該周
波数ビンの補償閾値としてはたらく当該周波数ビンの現在の最小値の4倍と比較
される。強度が範囲内に(すなわち閾値より下に)あれば雑音として認められ、当
該周波数の雑音312のレベルを決定する指数平均化ユニット310により用い
られる。強度が閾値より上にあれば、雑音推定には用いられずに棄却される。指
数平均化の時定数は一般に0.95であり、 これは最新20フレームの平均を
とるとして解することができる。用途によっては4×最小値の閾値を変更するこ
とができる。 図4は、減算プロセッサ400(210)の詳細図である。直截的手法において
は、推定された周波数ビン雑音強度値が現在の周波数ビン強度から減算される。
周波数ビンの現在の位相が計算され、減算結果の実数部及び虚数部を得るために
減算結果とともに用いられる。この手法は、複素ベクトルの偏角の正弦及び余弦
を複素ベクトルが位置し得る4つの象限を考慮して計算する必要があるため、処
理及びメモリの点で非常に高コストである。本発明で用いられる代替手法は、フ
ィルタを用いる手法である。減算は、H(フィルタ係数)が:
【数3】 であるフィルタ402により実行されるフィルタ乗算として解される。 ここでY(n)は周波数ビンの現在の強度、N(n)は当該周波数ビンの雑音推定
値である。404において、(それぞれの周波数ビンで別々の)フィルタ係数の値
Hに現在の周波数ビンの実数部及び虚数部が乗じられ:
【数4】 が得られる。 ここでEは無雑音複素数値である。直截的手法においては減算で負の強度値が
生じ得る。この値はゼロで置き換えられるか(半波整流)、あるいは負の値に絶対
値が等しい正の値に置き換えられる(全波整流)。フィルタ手法では、ここで説明
されるように、全波整流が直接に得られる。全波整流では大きな雑音低減は得ら
れないが、信号に導入されるアーティファクトがはるかに少ない。本フィルタ手
法は、分子に実値をとり、負の値をゼロで置き換えることにより、半波整流を行
うように改変できることは理解されよう。 図中のYの値は、隣り合う周波数ビンにわたって平均され、時間フレームにわ
たって平均された後(2D平滑化後)の、平滑化されたY値であることにも注意さ
れたい。別の手法は、雑音推定(N)だけに平滑化されたYを用い、Hの計算には
平滑化されていないYを用いることである。 図5は残留雑音低減プロセッサ500(216)を示す。残留雑音は無声区間中
に残っている雑音として定義される。無声区間における雑音はまず、有声時間区
間と無声時間区間とを区別しない減算プロセスにより低減される。残りの残留雑
音は、音声スイッチ502を用い、残留雑音に減衰因子を乗じるかあるいは残留
雑音をゼロで置き換えることにより、さらに低減することができる。ゼロ化に代
わる別の方法が、504における雑音の最小値による残留雑音の置換である。 また別の、音声スイッチを使用しない手法が、図5Aに示される。残留雑音プ
ロセッサ506が雑音推定器508で用いられるものと同様の閾値を無雑音周波
数ビン出力に適用し、無雑音出力が閾値より低い場合に510において結果を置
換するか減衰させる。 本発明の残留雑音処理の結果は、無声区間における、より静寂な音場である。
しかし、雑音レベルが有声区間と無声区間との間で切り替えられるときのポップ
雑音のようなアーティファクトの出現もある種の用途ではおこり得る。 本発明のスペクトル減算法は、アレイ技術または接話マイクロフォン技術とと
もに、あるいは独立型システムとして、利用できる。本発明のスペクトル減算は
独立型システムとして埋込ハードウエア(DSP)上で、補償ビーム形成のような
その他の埋込アルゴリズムの一部として、あるいはサウンドポートから得られる
データを用いてPC上で実行されるソフトウエアアプリケーションとして、実施
できる。 例えば、図6〜9に示されるように、本発明をソフトウエアアプリケーション
として実施できる。ステップ600において、サンプリングされた入力が読み込
まれる。ステップ602で、読み込まれたサンプリング値がバッファに格納され
る。ステップ604で新しい256点が蓄積されるとプログラム制御はステップ
606に進む。そうでなければ制御はステップ600に戻り、サンプリング値を
さらに読み込む。256点の新しいサンプリング値が読み込まれてしまうと、ス
テップ606で最新の512点が処理バッファに移される。格納された256点
の新しいサンプリング値がステップ608で前の256点と結合されて512点
が得られる。ステップ610において、フーリエ変換が512点について施され
る。もちろん、別の変換を用いて雑音信号スペクトルを得ることもできる。ステ
ップ612において、変換で得られた256の有効複素データ点がバッファに格
納される。第2の256点は第1の256点の共役写像であり、実入力に対する
冗長性を提供している。ステップ614で格納されたデータは、256の実数点
及び256の虚数点を含む。次いで制御は、丸で囲まれた文字Aに示されるよう
に、図7に進む。 図7において、信号処理が行われ、ステップ700で信号強度が推定される。
直截的手法を用い得ることは当然であるが、図2を参照して論じたように、直截
的手法では余分な処理時間及び複雑さが必要になる。ステップ702において、
格納された複素データ点がバッファから読み込まれ、ステップ700に示される
推定式を用いる計算が行われる。計算結果はステップ704で格納される。2元
(2D)平滑化プロセスがステップ706及び708で施され、ステップ706で
は、それぞれの点の推定値が隣り合う点の推定値と平均され、ステップ708で
は、それぞれの点における推定値を、例えばそれぞれの周波数ビンの3サンプリ
ング時間にわたって、平均する効果を有する指数平均を用いて推定値が平均され
る。ステップ710及び712では、平滑化された推定値を用いて将来の最小値
及び現在の最小値が計算される。平滑化された推定値がステップ710で決定さ
れる計算された将来の最小値より小さければ、将来の最小値は平滑化された推定
値で置き換えられて、ステップ714で格納される。 一方、平滑化された推定値が現在の最小値より小さいことがステップ712で
決定されれば、現在の最小値は平滑化された推定値で置き換えられて、ステップ
720で格納される。将来及び現在の最小値は継続的に計算され、定期的に、例
えばステップ724で定められるように5秒毎に開始され、次いで、制御は新し
い将来及び現在の最小値が計算される、ステップ722及び726に進む。その
後、制御は、丸で囲まれた文字Bで示されるように、減算及び残留雑音低減が行
われる図8に進む。 図8においては、サンプル値が閾値より小さいか否かがステップ800で決定
される。サンプル値が閾値内にあれば、ステップ804でサンプル値は指数平均
化が施されて、ステップ802でバッファに格納される。そうでなければ、制御
はステップ808に直接進む。ステップ808において、ステップ806で取り
出された信号サンプル値、ステップ806で取り出される信号サンプル値から決
定される、ステップ810で取り出されたサンプル値、及びステップ810から
取り出された推定サンプル値から、フィルタ係数が決定される。位相が推定され
て適用される直截的手法を用いることもできるが、ウイーナーフィルタは処理時
間を短縮し複雑さを軽減するので、これを代わりに用いることが好ましい。ステ
ップ814においてフィルタ変換値にステップ816で取り出されたサンプル値
が乗じられて、ステップ812で格納される。 ステップ818及び820において残留雑音低減プロセスが実行され、ステッ
プ818で処理された雑音信号が閾値の範囲内であれば、制御は処理された雑音
信号に置換、例えば減衰を受けさせるステップ820に進む。しかし、残留雑音
低減プロセスは、その適用の効果がないようなある種の用途には適していないこ
とがある。 本発明に用いられるいくつかの式及び計算には特定の値が用いられているが、
これらの値は本明細書に示された値と異なっていてもよいことは理解されよう。 図9においては、ステップ904で取り出された雑音処理済音声信号を基に、
ステップ902で逆フーリエ変換が生成されて、ステップ900で格納される。
ステップ906では、実質的に雑音の無い音声信号を再生するために、時間ドメ
イン信号がオーバーレイされる。 本発明が、例えばプログラム可能なメモリチップに埋め込むことができるか、
あるいは、例えば光ディスクのようなコンピュータ読出可能な媒体に格納でき、
これらから取り出されてコンプユータプロセッサを駆動することができる、Cま
たはその他のいずれかのプログラム言語を用いて書かれることが好ましいソフト
ウエアアプリケーションとして実施できることは理解されよう。本発明の代表的
なプログラムコードのサンプルが付録Aに示され、このコードは、当業者には理
解されるように、本発明の精神及び範囲を逸脱することなく、様々なオペレ−テ
ィングシステム及びコンパイラに適合させるために、 あるいは様々な合図(例え
ば‘チン’音または‘ピー’音)を含めるために、変更することができる。 本発明により、信号対雑音比が劣っている情況及び持続的な早口の音声の場合
においてさえ雑音強度スペクトルを推定するための、単純ではあるが効率のよい
機構を有するスペクトル減算システムが提供される。低コストで強度推定を実行
でき、位相関連付けの問題を克服するであろう、効率のよい機構が提供される。
データを不鮮明にすることなく雑音強度スペクトルを推定するための安定な機構
が提供される。 本発明の好ましい実施形態及びこれらの変更例を本明細書で詳細に説明したが
、本発明は上記と寸分違わない実施形態及び変更例に限定されず、その他の変更
及びバリエーションが添付特許請求事項により定められる本発明の精神及び範囲
を逸脱することなく当業者によりなされ得ることは当然である。
【図面の簡単な説明】
【図1】 本発明を示す
【図2】 本発明の雑音処理プロセスを示す
【図3】 本発明の雑音推定処理プロセスを示す
【図4】 本発明の減算処理プロセスを示す
【図5】 本発明の残留雑音処理プロセスを示す
【図5A】 本発明の残留雑音処理プロセスの一変形を示す
【図6】 本発明のフローチャートを示す
【図7】 本発明のフローチャートを示す
【図8】 本発明のフローチャートを示す
【図9】 本発明のフローチャートを示す
【符号の説明】
102 デジタル音声信号 104 一時バッファ 106 結合器 108 乗算器 110 FFTプロセッサ 112 雑音プロセッサ
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),CA,CN,I L,JP,US

Claims (100)

    【特許請求の範囲】
  1. 【請求項1】 ユニバーサル・シリアル・バス上を伝送される信号内の雑音
    を消去するための装置であって: 雑音信号を含む音声信号を入力するための入力; 前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
    数ビンを生成するための、周波数スペクトル発生器;及び 前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
    の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
    素の位置を検出する閾値検出器; を含むことを特徴とする装置。
  2. 【請求項2】 前記閾値検出器が前記複数の周波数ビンに対して複数の無声
    データ点の位置を検出することを特徴とする請求項1記載の装置。
  3. 【請求項3】 前記閾値検出器が前記音声信号の持続的有声区間内で前記複
    数の周波数ビンに対して前記複数の無声データ点の位置を検出することを特徴と
    する請求項2記載の装置。
  4. 【請求項4】 前記閾値検出器が、将来の最小値にしたがって導かれる前記
    複数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定することに
    より、前記雑音要素の位置を検出することを特徴とする請求項1記載の装置。
  5. 【請求項5】 前記将来の最小値があらかじめ定められた期間内の将来の最
    小値として決定されることを特徴とする請求項4記載の装置。
  6. 【請求項6】 前記現在の最小値があらかじめ定められた期間内の現在の最
    小値として決定されることを特徴とする請求項4記載の装置。
  7. 【請求項7】 前記現在の最小値が前記将来の最小値に定期的に設定される
    ことを特徴とする請求項5記載の装置。
  8. 【請求項8】 前記将来の最小値が前記現在の強度値に定期的に設定される
    ことを特徴とする請求項5記載の装置。
  9. 【請求項9】 前記将来の最小値が前記現在の強度値より大きいときに、前
    記将来の最小値が前記現在の強度値で置き換えられることを特徴とする請求項7
    記載の装置。
  10. 【請求項10】 前記現在の最小値が前記現在の強度値より大きいときに、
    前記現在の最小値が前記現在の強度値で置き換えられることを特徴とする請求項
    7記載の装置。
  11. 【請求項11】 前記閾値が前記現在の最小値に係数を乗じることにより設
    定されることを特徴とする請求項4記載の装置。
  12. 【請求項12】 前記それぞれの周波数ビンの中の前記雑音のレベルを決定
    するための平均化ユニットをさらに含み;前記閾値検出器が前記平均化ユニット
    で決定された前記雑音の前記レベルが前記閾値の範囲内にある前記雑音要素の位
    置を検出することを特徴とする請求項1記載の装置。
  13. 【請求項13】 前記音声信号から前記閾値検出器により決定された前記位
    置において推定された前記雑音要素を減算して実質的に前記雑音の無い前記音声
    信号を導くための減算器をさらに含むことを特徴とする請求項1記載の装置。
  14. 【請求項14】 前記減算器が前記音声信号にフィルタ関数を乗じるフィル
    タ乗算を用いて減算を行うことを特徴とする請求項13記載の装置。
  15. 【請求項15】 前記フィルタ関数が前記複数の周波数ビンの前記雑音要素
    及び強度の関数であるウイーナーフィルタ関数であることを特徴とする請求項1
    4記載の装置。
  16. 【請求項16】 前記フィルタ乗算が前記複数の周波数ビンの複素要素に前
    記ウイーナーフィルタ関数を乗じることを特徴とする請求項15記載の装置。
  17. 【請求項17】 前記複数の周波数ビンのそれぞれの強度を推定するための
    推定器をさらに含むことを特徴とする請求項1記載の装置。
  18. 【請求項18】 前記推定器が、数がnの前記複数の周波数ビンに対して、
    前記複数の周波数ビンの前記複素要素の最大値及び最小値の関数として前記複数
    の周波数ビンのそれぞれの前記強度を推定することを特徴とする請求項17記載
    の装置。
  19. 【請求項19】 前記複数の周波数ビンのそれぞれの前記推定値を平滑化す
    る平滑化ユニットをさらに含むことを特徴とする請求項17記載の装置。
  20. 【請求項20】 前記平滑化ユニットが、前記複数の周波数ビンのそれぞれ
    と前記それぞれの周波数ビンに隣り合う周波数ビンとの平均をとり、複数の周波
    数ビンにわたり時間に関する平均をとる指数時間平均化を用いて前記それぞれの
    周波数ビンを平均する2元プロセスを含むことを特徴とする請求項19記載の装
    置。
  21. 【請求項21】 前記減算器が前記閾値検出器により決定された前記位置に
    おける前記雑音要素を前記音声信号から減算した後に残っている残留雑音を低減
    するための残留雑音プロセッサをさらに含むことを特徴とする請求項13記載の
    装置。
  22. 【請求項22】 前記残留雑音プロセッサが前記音声信号の無声区間に対応
    する前記複数の周波数ビンをある最小値で置き換えることを特徴とする請求項2
    1記載の装置。
  23. 【請求項23】 前記残留雑音プロセッサが前記無声区間を検出するための
    音声スイッチを含むことを特徴とする請求項22記載の装置。
  24. 【請求項24】 前記残留雑音プロセッサがあらかじめ定められた閾値より
    小さい前記音声信号を検出することにより前記無声区間を検出するための別の閾
    値検出器を含むことを特徴とする請求項22記載の装置。
  25. 【請求項25】 前記音声信号を受け取るための複数のマイクロフォンを含
    む補償アレイをさらに含むことを特徴とする請求項1記載の装置。
  26. 【請求項26】 ユニバーサル・シリアル・バス上を伝送される信号内の雑
    音を消去するための装置であって: 雑音信号を含む音声信号を入力するための入力手段; 前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
    数ビンを生成するための、周波数スペクトル発生手段;及び 前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
    の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
    素の位置を検出する閾値検出手段; を含むことを特徴とする装置。
  27. 【請求項27】 前記閾値検出手段が、将来の最小値にしたがって導かれる
    前記複数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定するこ
    とにより、前記雑音要素の位置を検出することを特徴とする請求項26記載の装
    置。
  28. 【請求項28】 前記閾値検出手段が、現在の最小値にしたがって導かれる
    前記複数の周波数ビンの強度の将来の最小値にしたがって前記閾値を設定するこ
    とにより、前記雑音要素の位置を検出することを特徴とする請求項26記載の装
    置。
  29. 【請求項29】 前記将来の最小値があらかじめ定められた期間内の将来の
    最小値として決定されることを特徴とする請求項27記載の装置。
  30. 【請求項30】 前記現在の最小値があらかじめ定められた期間内の現在の
    最小値として決定されることを特徴とする請求項27記載の装置。
  31. 【請求項31】 前記それぞれの周波数ビンの中の前記雑音のレベルを決定
    するための平均化手段をさらに含み;前記閾値検出手段が前記平均化手段で決定
    された前記雑音の前記レベルが前記閾値の範囲内にある前記雑音要素の位置を検
    出することを特徴とする請求項26記載の装置。
  32. 【請求項32】 前記音声信号から前記閾値検出手段により決定された前記
    位置における前記雑音要素を減算して実質的に前記雑音の無い前記音声信号を導
    くための減算手段をさらに含むことを特徴とする請求項26記載の装置。
  33. 【請求項33】 前記減算手段が前記音声信号にフィルタ関数を乗じるフィ
    ルタ乗算を用いて減算を行うことを特徴とする請求項32記載の装置。
  34. 【請求項34】 前記複数の周波数ビンのそれぞれの強度を推定するための
    推定手段をさらに含むことを特徴とする請求項26記載の装置。
  35. 【請求項35】 前記推定手段が、数がnの前記複数の周波数ビンに対して
    前記複数の周波数ビンの最大値及び最小値の関数として前記複数の周波数ビンの
    それぞれの前記強度を推定することを特徴とする請求項34記載の装置。
  36. 【請求項36】 前記複数の周波数ビンのそれぞれの推定値を平滑化するた
    めの平滑化手段をさらに含むことを特徴とする請求項34記載の装置。
  37. 【請求項37】 前記減算手段が前記閾値検出手段により決定された前記位
    置における前記雑音要素を前記音声信号から減算した後に残っている残留雑音を
    低減するための残留雑音処理手段をさらに含むことを特徴とする請求項32記載
    の装置。
  38. 【請求項38】 前記音声信号を受け取るための複数のマイクロフォンを含
    む補償アレイ手段をさらに含むことを特徴とする請求項26記載の装置。
  39. 【請求項39】 ユニバーサル・シリアル・バス上に発生する可聴雑音を表
    す雑音信号を含む可聴音響を表す音声信号から雑音を消去するための雑音消去信
    号を発生するためにコンピュータプロセッサを駆動するための方法であって: 前記雑音信号を含む前記音声信号を入力する工程; 前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
    数ビンを生成する工程; 前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
    の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
    素の位置を検出する工程;及び 前記検出工程で検出された前記雑音要素を前記音声信号から減算して、実質的
    に前記可聴雑音の無い前記可聴音響を表す音声信号をつくる工程; を含むことを特徴とする方法。
  40. 【請求項40】 前記検出工程が将来の最小値にしたがって導かれる前記複
    数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定することによ
    り前記雑音要素の位置を検出することを特徴とする請求項39記載の方法。
  41. 【請求項41】 前記検出工程が現在の最小値にしたがって導かれる前記複
    数の周波数ビンの強度の将来の最小値にしたがって前記閾値を設定することによ
    り前記雑音要素の位置を検出することを特徴とする請求項39記載の方法。
  42. 【請求項42】 前記検出工程が前記将来の最小値をあらかじめ定められた
    期間内の将来の最小値として決定する工程をさらに含むことを特徴とする請求項
    40記載の方法。
  43. 【請求項43】 前記検出工程が前記現在の最小値をあらかじめ定められた
    期間内の現在の最小値として決定する工程をさらに含むことを特徴とする請求項
    41記載の方法。
  44. 【請求項44】 前記それぞれの周波数ビンの前記雑音のレベルを平均する
    工程をさらに含み;前記検出工程が前記平均工程で決定された前記雑音の前記レ
    ベルが前記閾値の範囲内にある前記雑音要素の位置を検出することを特徴とする
    請求項39記載の方法。
  45. 【請求項45】 前記減算工程が前記音声信号にフィルタ関数を乗じるフィ
    ルタ乗算を用いて減算を行うことを特徴とする請求項39記載の方法。
  46. 【請求項46】 数がnの前記複数の周波数ビンに対して前記複数の周波数
    ビンの最大値及び最小値の関数として前記複数の周波数ビンのそれぞれの強度を
    推定する工程をさらに含むことを特徴とする請求項39記載の方法。
  47. 【請求項47】 前記それぞれの周波数ビンの推定値を平滑化する工程をさ
    らに含むことを特徴とする請求項46記載の方法。
  48. 【請求項48】 前記減算工程が前記検出工程で決定された前記位置におけ
    る前記雑音要素を前記音声信号から減算した後に残っている残留雑音を低減する
    工程をさらに含むことを特徴とする請求項39記載の方法。
  49. 【請求項49】 複数のマイクロフォンの補償アレイから前記音声信号を受
    け取る工程をさらに含むことを特徴とする請求項39記載の方法。
  50. 【請求項50】 前記雑音が電源から発生することを特徴とする請求項1記
    載の装置。
  51. 【請求項51】 前記雑音が電源から発生することを特徴とする請求項39
    記載の方法。
  52. 【請求項52】 雑音を消去するための装置であって: 雑音信号を含む音声信号を入力するための入力; 前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
    数ビンを生成するための周波数スペクトル発生器;及び 前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
    の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
    素の位置を検出する閾値検出器; を含むことを特徴とする装置。
  53. 【請求項53】 前記閾値検出器が前記複数の周波数ビンに対する複数の無
    声データ点の位置を検出することを特徴とする請求項52記載の装置。
  54. 【請求項54】 前記閾値検出器が前記音声信号の持続的有声区間内で前記
    複数の周波数ビンに対する前記複数の無声データ点の位置を検出することを特徴
    とする請求項53記載の装置。
  55. 【請求項55】 前記閾値検出器が将来の最小値にしたがって導かれる前記
    複数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定することに
    より前記雑音要素の位置を検出することを特徴とする請求項52記載の装置。
  56. 【請求項56】 前記将来の最小値があらかじめ定められた期間内の将来の
    最小値として決定されることを特徴とする請求項55記載の装置。
  57. 【請求項57】 前記現在の最小値があらかじめ定められた期間内の現在の
    最小値として決定されることを特徴とする請求項55記載の装置。
  58. 【請求項58】 前記現在の最小値が前記将来の最小値に定期的に設定され
    ることを特徴とする請求項56記載の装置。
  59. 【請求項59】 前記将来の最小値が前記現在の強度値に定期的に設定され
    ることを特徴とする請求項56記載の装置。
  60. 【請求項60】 前記将来の最小値が前記現在の強度値より大きいときに、
    前記将来の最小値が前記現在の強度値で置き換えられることを特徴とする請求項
    58記載の装置。
  61. 【請求項61】 前記現在の最小値が前記現在の強度値より大きいときに、
    前記現在の最小値が前記現在の強度値で置き換えられることを特徴とする請求項
    58記載の装置。
  62. 【請求項62】 前記閾値が前記現在の最小値に係数を乗じることにより設
    定されることを特徴とする請求項55記載の装置。
  63. 【請求項63】 前記それぞれの周波数ビンの中の前記雑音のレベルを決定
    するための平均化ユニットをさらに含み;前記閾値検出器が前記平均化ユニット
    で決定された前記雑音の前記レベルが前記閾値の範囲内にある前記雑音要素の位
    置を検出することを特徴とする請求項52記載の装置。
  64. 【請求項64】 前記音声信号から前記閾値検出器により決定された前記位
    置において推定された前記雑音要素を減算して実質的に前記雑音の無い前記音声
    信号を導くための減算器をさらに含むことを特徴とする請求項52記載の装置。
  65. 【請求項65】 前記減算器が前記音声信号にフィルタ関数を乗じるフィル
    タ乗算を用いて減算を行うことを特徴とする請求項64記載の装置。
  66. 【請求項66】 前記フィルタ関数が前記複数の周波数ビンの前記雑音要素
    及び強度の関数であるウイーナーフィルタ関数であることを特徴とする請求項6
    5記載の装置。
  67. 【請求項67】 前記フィルタ乗算が前記複数の周波数ビンの複素要素に前
    記ウイーナーフィルタ関数を乗じることを特徴とする請求項66記載の装置。
  68. 【請求項68】 前記複数の周波数ビンのそれぞれの強度を推定するための
    推定器をさらに含むことを特徴とする請求項52記載の装置。
  69. 【請求項69】 前記推定器が、数がnの前記複数の周波数ビンに対して、
    前記複数の周波数ビンの複素要素の最大値及び最小値の関数として前記複数の周
    波数ビンのそれぞれの前記強度を推定することを特徴とする請求項68記載の装
    置。
  70. 【請求項70】 前記複数の周波数ビンのそれぞれの前記推定値を平滑化す
    る平滑化ユニットをさらに含むことを特徴とする請求項68記載の装置。
  71. 【請求項71】 前記平滑化ユニットが、前記複数の周波数ビンのそれぞれ
    と前記それぞれの周波数ビンに隣り合う周波数ビンとの平均をとり、前記複数の
    周波数ビンにわたり時間に関する平均をとる指数時間平均化を用いて前記それぞ
    れの周波数ビンを平均する2元プロセスを含むことを特徴とする請求項70記載
    の装置。
  72. 【請求項72】 前記減算器が前記閾値検出器により決定された前記位置に
    おける前記雑音要素を前記音声信号から減算した後に残っている残留雑音を低減
    するための残留雑音プロセッサをさらに含むことを特徴とする請求項64記載の
    装置。
  73. 【請求項73】 前記残留雑音プロセッサが前記音声信号の無声区間に対応
    する前記複数の周波数ビンをある最小値で置き換えることを特徴とする請求項7
    2記載の装置。
  74. 【請求項74】 前記残留雑音プロセッサが前記無声区間を検出するための
    音声スイッチを含むことを特徴とする請求項73記載の装置。
  75. 【請求項75】 前記残留雑音プロセッサがあらかじめ定められた閾値より
    小さい前記音声信号を検出することにより前記無声区間を検出するための別の閾
    値検出器を含むことを特徴とする請求項73記載の装置。
  76. 【請求項76】 前記音声信号を受け取るための複数のマイクロフォンを含
    む適応アレイをさらに含むことを特徴とする請求項52記載の装置。
  77. 【請求項77】 雑音を消去するための装置であって: 雑音信号を含む音声信号を入力するための入力手段; 前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
    数ビンを生成するための周波数スペクトル発生手段;及び 前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
    の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
    素の位置を検出する閾値検出手段; を含むことを特徴とする装置。
  78. 【請求項78】 前記閾値検出手段が、将来の最小値にしたがって導かれる
    前記複数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定するこ
    とにより、前記雑音要素の位置を検出することを特徴とする請求項77記載の装
    置。
  79. 【請求項79】 前記閾値検出手段が、現在の最小値にしたがって導かれる
    前記複数の周波数ビンの強度の将来の最小値にしたがって前記閾値を設定するこ
    とにより、前記雑音要素の位置を検出することを特徴とする請求項77記載の装
    置。
  80. 【請求項80】 前記将来の最小値があらかじめ定められた期間内の将来の
    最小値として決定されることを特徴とする請求項78記載の装置。
  81. 【請求項81】 前記現在の最小値があらかじめ定められた期間内の現在の
    最小値として決定されることを特徴とする請求項78記載の装置。
  82. 【請求項82】 前記それぞれの周波数ビンの中の前記雑音のレベルを決定
    するための平均化手段をさらに含み;前記閾値検出手段が前記平均化手段で決定
    された前記雑音の前記レベルが前記閾値の範囲内にある前記雑音要素の位置を検
    出することを特徴とする請求項77記載の装置。
  83. 【請求項83】 前記音声信号から前記閾値検出手段により決定された前記
    位置における前記雑音要素を減算して実質的に前記雑音の無い前記音声信号を導
    くための減算手段をさらに含むことを特徴とする請求項77記載の装置。
  84. 【請求項84】 前記減算手段が前記音声信号にフィルタ関数を乗じるフィ
    ルタ乗算を用いて減算を行うことを特徴とする請求項83記載の装置。
  85. 【請求項85】 前記複数の周波数ビンのそれぞれの強度を推定するための
    推定手段をさらに含むことを特徴とする請求項77記載の装置。
  86. 【請求項86】 前記推定手段が、数がnの前記複数の周波数ビンに対して
    前記複数の周波数ビンの最大値及び最小値の関数として前記複数の周波数ビンの
    それぞれの前記強度を推定することを特徴とする請求項85記載の装置。
  87. 【請求項87】 前記複数の周波数ビンのそれぞれの推定値を平滑化するた
    めの平滑化手段をさらに含むことを特徴とする請求項85記載の装置。
  88. 【請求項88】 前記減算手段が前記閾値検出手段により決定された前記位
    置における前記雑音要素を前記音声信号から減算した後に残っている残留雑音を
    低減するための残留雑音処理手段をさらに含むことを特徴とする請求項83記載
    の装置。
  89. 【請求項89】 前記音声信号を受け取るための複数のマイクロフォンを含
    む補償アレイ手段をさらに含むことを特徴とする請求項77記載の装置。
  90. 【請求項90】 可聴雑音を表す雑音信号を含む可聴音響を表す音声信号か
    ら雑音を消去するための雑音消去信号を発生するためにコンピュータプロセッサ
    を駆動するための方法において、前記方法が: 前記雑音信号を含む前記音声信号を入力する工程; 前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
    数ビンを生成する工程; 前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
    の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
    素の位置を検出する工程;及び 前記検出工程で検出された前記雑音要素を前記音声信号から減算して、実質的
    に前記可聴雑音の無い前記可聴音響を表す音声信号をつくる工程; を含むことを特徴とする方法。
  91. 【請求項91】 前記検出工程が将来の最小値にしたがって導かれる前記複
    数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定することによ
    り前記雑音要素の位置を検出することを特徴とする請求項90記載の方法。
  92. 【請求項92】 前記検出工程が現在の最小値にしたがって導かれる前記複
    数の周波数ビンの強度の将来の最小値にしたがって前記閾値を設定することによ
    り前記雑音要素の位置を検出することを特徴とする請求項90記載の方法。
  93. 【請求項93】 前記検出工程が前記将来の最小値をあらかじめ定められた
    期間内の将来の最小値として決定する工程をさらに含むことを特徴とする請求項
    91記載の方法。
  94. 【請求項94】 前記検出工程が前記現在の最小値をあらかじめ定められた
    期間内の現在の最小値として決定する工程を含むことを特徴とする請求項92記
    載の方法。
  95. 【請求項95】 前記それぞれの周波数ビンの前記雑音のレベルを平均する
    工程をさらに含み;前記検出工程が前記平均工程で決定された前記雑音の前記レ
    ベルが前記閾値の範囲内にある前記雑音要素の位置を検出することを特徴とする
    請求項90記載の方法。
  96. 【請求項96】 前記減算工程が前記音声信号にフィルタ関数を乗じるフィ
    ルタ乗算を用いて減算を行うことを特徴とする請求項90記載の方法。
  97. 【請求項97】 数がnの前記複数の周波数ビンに対して前記複数の周波数
    ビンの最大値及び最小値の関数として前記複数の周波数ビンのそれぞれの強度を
    推定する工程をさらに含むことを特徴とする請求項90記載の方法。
  98. 【請求項98】 前記複数の周波数ビンのそれぞれの推定値を平滑化する工
    程をさらに含むことを特徴とする請求項90記載の方法。
  99. 【請求項99】 前記検出工程で決定された前記位置における前記雑音要素
    を前記音声信号から減算した後に残っている残留雑音を低減する工程をさらに含
    むことを特徴とする請求項90記載の方法。
  100. 【請求項100】 複数のマイクロフォンの補償アレイから前記音声信号を
    受け取る工程をさらに含むことを特徴とする請求項90記載の方法。
JP2000600263A 1999-02-18 2000-02-11 雑音を消去するためのシステム、方法及び装置 Withdrawn JP2002537586A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US09/252,874 1999-02-18
US09/252,874 US6363345B1 (en) 1999-02-18 1999-02-18 System, method and apparatus for cancelling noise
US38599699A 1999-08-30 1999-08-30
US09/385,996 1999-08-30
PCT/US2000/003538 WO2000049602A1 (en) 1999-02-18 2000-02-11 System, method and apparatus for cancelling noise

Publications (1)

Publication Number Publication Date
JP2002537586A true JP2002537586A (ja) 2002-11-05

Family

ID=26942758

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000600263A Withdrawn JP2002537586A (ja) 1999-02-18 2000-02-11 雑音を消去するためのシステム、方法及び装置

Country Status (6)

Country Link
EP (1) EP1157376A1 (ja)
JP (1) JP2002537586A (ja)
CN (1) CN1348583A (ja)
CA (1) CA2358710A1 (ja)
IL (1) IL143989A0 (ja)
WO (1) WO2000049602A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007147736A (ja) * 2005-11-24 2007-06-14 Nec Access Technica Ltd 音声通信装置
JP2009535997A (ja) * 2006-05-04 2009-10-01 株式会社ソニー・コンピュータエンタテインメント コンソール上にファーフィールドマイクロフォンを有する電子装置におけるノイズ除去
KR20190129805A (ko) * 2017-05-15 2019-11-20 한국전기연구원 잡음 환경 분류 및 제거 기능을 갖는 보청기 및 그 방법

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60235701D1 (de) 2001-06-28 2010-04-29 Oticon As Verfahren zur rauschverminderung in einem hörgerät und nach einem solchen verfahren funktionierendes hörgerät
JP4199144B2 (ja) * 2004-03-11 2008-12-17 株式会社東芝 ウェイト関数生成装置、参照信号生成装置、送信信号生成装置、信号処理装置及びアンテナ装置
CN1822092B (zh) * 2006-03-28 2010-05-26 北京中星微电子有限公司 一种消除语音输入中背景噪声的方法及其装置
US9392360B2 (en) 2007-12-11 2016-07-12 Andrea Electronics Corporation Steerable sensor array system with video input
US8818000B2 (en) 2008-04-25 2014-08-26 Andrea Electronics Corporation System, device, and method utilizing an integrated stereo array microphone
US8923529B2 (en) 2008-08-29 2014-12-30 Biamp Systems Corporation Microphone array system and method for sound acquisition
WO2010079526A1 (ja) * 2009-01-06 2010-07-15 三菱電機株式会社 雑音除去装置及び雑音除去プログラム
DE102009013037A1 (de) * 2009-03-13 2010-09-23 Eads Deutschland Gmbh Verfahren zur Unterscheidung von Rauschen und Nutzsignalen
EP2652737B1 (en) * 2010-12-15 2014-06-04 Koninklijke Philips N.V. Noise reduction system with remote noise detector
CN104734736B (zh) * 2013-12-19 2018-06-22 南京航空航天大学 一种采用自适应滤波器消除开关电源开关噪声的实现方法
CN104810024A (zh) * 2014-01-28 2015-07-29 上海力声特医学科技有限公司 一种双路麦克风语音降噪处理方法及***
CN103761974B (zh) * 2014-01-28 2017-01-25 上海力声特医学科技有限公司 一种人工耳蜗
CN103854662B (zh) * 2014-03-04 2017-03-15 ***装备发展部第六十三研究所 基于多域联合估计的自适应语音检测方法
US9721580B2 (en) * 2014-03-31 2017-08-01 Google Inc. Situation dependent transient suppression
US9620142B2 (en) * 2014-06-13 2017-04-11 Bose Corporation Self-voice feedback in communications headsets

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08506434A (ja) * 1993-11-30 1996-07-09 エイ・ティ・アンド・ティ・コーポレーション 通信システムにおける伝送ノイズ低減
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
US5787259A (en) * 1996-03-29 1998-07-28 Microsoft Corporation Digital interconnects of a PC with consumer electronics devices
US5818948A (en) * 1996-10-23 1998-10-06 Advanced Micro Devices, Inc. Architecture for a universal serial bus-based PC speaker controller
US5914877A (en) * 1996-10-23 1999-06-22 Advanced Micro Devices, Inc. USB based microphone system
US5995150A (en) * 1998-02-20 1999-11-30 Winbond Electronics Corporation America Dual compressed video bitstream camera for universal serial bus connection

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007147736A (ja) * 2005-11-24 2007-06-14 Nec Access Technica Ltd 音声通信装置
JP4527654B2 (ja) * 2005-11-24 2010-08-18 Necアクセステクニカ株式会社 音声通信装置
JP2009535997A (ja) * 2006-05-04 2009-10-01 株式会社ソニー・コンピュータエンタテインメント コンソール上にファーフィールドマイクロフォンを有する電子装置におけるノイズ除去
JP4866958B2 (ja) * 2006-05-04 2012-02-01 株式会社ソニー・コンピュータエンタテインメント コンソール上にファーフィールドマイクロフォンを有する電子装置におけるノイズ除去
KR20190129805A (ko) * 2017-05-15 2019-11-20 한국전기연구원 잡음 환경 분류 및 제거 기능을 갖는 보청기 및 그 방법
KR102206546B1 (ko) * 2017-05-15 2021-01-22 한국전기연구원 잡음 환경 분류 및 제거 기능을 갖는 보청기 및 그 방법

Also Published As

Publication number Publication date
CN1348583A (zh) 2002-05-08
WO2000049602A1 (en) 2000-08-24
EP1157376A1 (en) 2001-11-28
CA2358710A1 (en) 2000-08-24
IL143989A0 (en) 2002-04-21

Similar Documents

Publication Publication Date Title
US6363345B1 (en) System, method and apparatus for cancelling noise
US6377637B1 (en) Sub-band exponential smoothing noise canceling system
JP2002537586A (ja) 雑音を消去するためのシステム、方法及び装置
CA2346251C (en) A method and system for updating noise estimates during pauses in an information signal
KR950011964B1 (ko) 신호처리장치
US7912231B2 (en) Systems and methods for reducing audio noise
US8015002B2 (en) Dynamic noise reduction using linear model fitting
US6549586B2 (en) System and method for dual microphone signal noise reduction using spectral subtraction
US7133825B2 (en) Computationally efficient background noise suppressor for speech coding and speech recognition
US20070174050A1 (en) High frequency compression integration
US20050288923A1 (en) Speech enhancement by noise masking
JP2009031793A (ja) 調整されたトーンノイズの低減を用いたノイズの低減
JPH07306695A (ja) 音声信号の雑音低減方法及び雑音区間検出方法
JP4965891B2 (ja) 信号処理装置およびその方法
US20060184361A1 (en) Method and apparatus for reducing an interference noise signal fraction in a microphone signal
Compernolle DSP techniques for speech enhancement
US20050118956A1 (en) Audio enhancement system having a spectral power ratio dependent processor
JP2004020679A (ja) 雑音抑圧装置および雑音抑圧方法
JP3279254B2 (ja) スペクトル雑音除去装置
KR20130112287A (ko) 적응적 잡음 처리 장치 및 방법
Smékal et al. Single-channel noise suppression by wavelets in spectral domain

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070501