JP2002537586A

JP2002537586A - 雑音を消去するためのシステム、方法及び装置

Info

Publication number: JP2002537586A
Application number: JP2000600263A
Authority: JP
Inventors: マラシュ，ジョセフ; バードュゴ，バルチ
Original assignee: アンドレアエレクトロニクスコーポレイション
Priority date: 1999-02-18
Filing date: 2000-02-11
Publication date: 2002-11-05
Also published as: CN1348583A; WO2000049602A1; EP1157376A1; CA2358710A1; IL143989A0

Abstract

(57)【要約】コンピュータに用いられるＡＣ−ＤＣ電力コンバータのような電気的または電磁気的雑音源から発生する音声信号雑音の消去及び低減を行うためのシステム。システムは、音声信号帯域の少なくとも２倍の周波数でサンプリングされたデジタル音声信号(１０２)を受け取る。サンプリングされた入力は２５６点の一時バッファ(１０４)に格納され、バッファが一杯になると、結合器(１０６)により新しい２５６点が前の２５６点と結合されて５１２点の入力が与えられ、この５１２点に乗算器(１０８)により長さが５１２点のシェーディングウインドウが乗じられる。シェーディングがかけられた結果はＦＦＴプロセッサ(１１０)により周波数ドメインに変換される。ＦＦＴの出力は、それぞれの周波数ビンに対する雑音強度推定プロセス、それぞれの周波数ビンに対する無雑音複素数値を推定する減算プロセス及び残留雑音低減プロセスを含む、雑音プロセッサ(１１２)で処理される。

Description

【発明の詳細な説明】参照として含まれる関連出願本出願は、１９９９年２月１８日に出願された米国特許出願第０９／２５２，
８７４号及び１９９９年８月３０日に出願された米国特許出願第０９／３８５，
９９６号による優先権を主張し、１９９９年３月２６日に出願された米国特許出
願第６０／１２６，５６７号への参照がなされ、これらの特許出願の全てが本明
細書に参照により含まれる。以下の特許出願及び特許が引用され、本明細書に参照により含まれる：１９９
９年２月１８日に出願された米国特許出願第０９／２５２，８７４号；１９９８
年８月６日に出願された米国特許出願第０９／１３０，９２３号；１９９８年４
月７日に出願された米国特許出願第０９／０５５，７０９号；１９９８年４月１
３日に出願された米国特許出願第０９／０５９，５０３号；１９９７年４月１４
日に出願された米国特許出願第０８／８４０，１５９号；１９９８年８月６日に
出願された米国特許出願第０９／１３０，９２３号；今は発行済米国特許第５，
８２５，８９８号(１９９８年１０月２０日発行)になった米国特許出願第０８／
６７２，８９９号；及び１９９８年６月３日に出願された米国特許出願第０９／
０８９，７１０号；１９９８年１０月２０日に発行された米国特許第５，８２５
，８９７号；１９９８年３月２４日に発行された米国特許第５，７３２，１４３
号；１９９７年９月３０日に発行された米国特許第５，６７３，３２５号；１９
９５年１月１０日に発行された米国特許第５，３８１，４７３号；１９９７年４
月４日に出願された米国特許出願第０８／８３３，３８４号。また、本明細書に
引用される資料は全て本明細書に参照により含まれ、本明細書に引用される資料
に引用されるか参照される資料も同様である。発明の属する技術分野本発明は雑音消去及び低減に関し、さらに詳しくは、スペクトル減算を用いる
雑音消去及び低減に関する。発明の背景音声に付加される周囲雑音は音声処理アルゴリズムの性能を劣化させる。その
ような処理アルゴリズムには、ディクテーション、音声起動、音声圧縮及びその
他のシステムが含まれ得る。そのようなシステムにおいては、音声及びその特徴
に影響を与えずに雑音を低減して、信号対雑音比(Ｓ／Ｎ比)を向上させること
が望ましい。近距離音場防騒音マイクロフォンは満足すべき解決を与えるが、音声源(例え
ば口)の近くにマイクロフォンがなければならない。多くの場合、このことはヘ
ッドフォンのブームにマイクロフォンを取り付けて、ブーム末端にあるマイクロ
フォンを着用者の口の近くに位置させることにより達成される。しかしヘッドフ
ォンは着用するに快適ではなく、あるいは、例えば自動車内での操作には窮屈す
ぎることがわかっている。一般にマイクロフォンアレイ技術、特に補償ビーム形成アレイは、激しい方向
性雑音を最も効率のよい態様で処理する。これらのシステムは雑音場をマッピン
グし、雑音源に向けて複数のヌルを生成する。ヌルの数はマイクロフォン素子の
数及び処理能力により制限される。そのようなアレイは、ヘッドフォンを必要と
しない、ハンドフリー操作という利点を有する。しかし、雑音源が拡散している場合には、必ずしも十分ではない定常遅延及び
加算マイクロフォンアレイの能力まで、補償システムの性能が低下することにな
ろう。これは、雑音が部屋の壁で強く反射されて無限数の方向からアレイに到達
するような、環境が極めて反響性の高い場合に当てはまる。雑音の内のいくらか
が車台から放射される車内環境における場合にも当てはまる。発明の目的及び概要スペクトル減算法は、汚染された信号の雑音強度スペクトルを推定することに
よる、雑音をさらに低減するための解決法を提供する。本方法は、雑音のスペク
トル強度レベルを、音声スイッチにより検出された無声時間区間の間に雑音を測
定することにより推定し、次いで信号から雑音強度スペクトルを減算する。この
方法は、「スペクトル減算を用いる音声内音響雑音の抑制」(スティーブン・Ｆ・ボ
ル(Steven F. Boll)，“ＩＥＥＥＡＳＳＰ”誌，第２７巻，第２号(１９７９年
４月))に詳細に説明されており、音声信号と相関しない定常拡散雑音に対しては
良好な結果が得られる。しかしスペクトル減算法は、スペクトル減算が制御され
ていなければ(ボコーダーまたは音声起動のような)音声アルゴリズムの性能を低
下させ得る、時に楽音ノイズと称される、アーティファクトをつくりだす。さら
にスペクトル減算法は、音声スイッチが音声の存在を正確に検出し、また無声時
間区間を正確に捜しあてるという仮定に強く依存している。この仮定はオフライ
ンシステムに対しては妥当であるが、リアルタイムシステムで達成するかまたは
成立させることは困難である。さらに詳しくは、無声時間区間の２５６点ＦＦＴ(高速フーリエ変換)を行い、
周波数ビンのそれぞれのエネルギーを計算することにより、雑音強度スペクトル
が推定される。ＦＦＴは時間ドメイン信号に５０％の重なりをもつ(ハニング(H
anning)またはその他の)シェーディングウインドウが乗じられた後に行われる。
それぞれの周波数ビンのエネルギーは、隣り合うＦＦＴ時間フレームと平均され
る。フレームの数は定められていないが、雑音の安定性に依存する。定常雑音に
対しては、より良い雑音推定を達成するために多くのフレームが平均されること
が好ましい。非定常雑音に対しては、長平均化は有害であり得る。問題は、定常
雑音であるか非定常雑音であるかを先験的に知る手段がないことである。推定雑音強度スペクトラムが計算されたとすれば、入力信号に(ハニングまた
はその他の)シェーディングウインドウが乗じられ、(２５６点またはその他の数
の点の)ＦＦＴが重なり５０％で行われ、周波数ビンのそれぞれの強度が２〜３
のＦＦＴフレームにかけて平均される。次いで雑音強度スペクトルが信号強度か
ら減算される。減算結果が負であればその値はゼロで置き換えられる(半波整流)
。しかし、低い値を最小値(またはゼロ)で置き換えるか、あるいは残留雑音を３
０ｄＢ減衰させることにより、無声区間中に存在する残留雑音をさらに低減する
ことが推奨される。得られる出力は無雑音強度スペクトルである。スペクトルの複素データは、信号のＦＦＴの該当する周波数ビンの位相情報を
無雑音強度に適用することにより再構成される。次いで、無雑音時間ドメインデ
ータを得るために、ＩＦＦＴ(高速逆フーリエ変換)プロセスが複素データに施さ
れる。得られた時間ドメインデータは、ＦＦＴの重ね合わせプロセスを補償する
ために、前のフレームで得られたデータと重ね合わされて足し合わされる。上述のシステムにはいくつかの問題がともなっている。第１に、システムは、
あらかじめ有声及び無声時間区間についての知識があることを前提としている。
音声スイッチはこれらの時間区間を検出するには実用的でない。理論上、音声ス
イッチはエネルギーレベルを測定してこれを閾値と比較することにより音声の存
在を検出する。閾値が高すぎると、ある有声時間区間が無声時間区間と見なされ
るかもしれず、よってシステムが音声情報を雑音と見なしてしまう危険性がある
。この結果、特に信号対雑音比が劣っている場合に、音声歪が生じる。他方で閾
値が低すぎると、特に信号対雑音比が劣っている場合及び音声がほとんど間をお
かずに持続している場合に、無声区間が短くなりすぎる危険性がある。別の問題はＦＦＴ結果の強度計算が極めて複雑なことである。強度計算には、
計算負荷の点で非常に高コストである二乗及び平方根演算が含まれる。また別の
問題は、ＩＦＦＴのための情報を得るための、無雑音強度スペクトルへの位相情
報の関連付けである。このプロセスには、位相の計算、情報の格納、及びこの情
報の強度データへの適用が必要であり、これらは全て計算負荷及び所要メモリの
点で高コストである。さらに別の問題は雑音強度スペクトルの推定である。ＦＦ
Ｔプロセスは質が低く不安定なエネルギー推定法である。フレームの時間平均化
は、安定性に十分には寄与しない。ＦＦＴ結果の長さを短縮すれば、周波数ビン
のそれぞれの帯域が広くなり、安定性が高くなるが、システムの性能は低下する
。時間平均化はさらに、データを不鮮明にし、このため数フレームより多くのフ
レームにまで拡張することができない。このことは、提案された雑音推定プロセ
スの安定性が必ずしも十分ではないことを意味する。したがって本発明の目的は、信号対雑音比が劣っている情況及び持続的な早口
の音声の場合であっても雑音強度スペクトルを推定するための、単純ではあるが
効率のよい機構を有するスペクトル減算システムを提供することにある。本発明の別の目的は、わずかなコストで強度推定を実行でき、位相関連付けの
問題を克服するであろう、効率のよい機構を提供することにある。本発明のまた別の目的は、データを不鮮明にすることなく雑音強度スペクトル
を推定するための安定な機構を提供することにある。上記の目的にしたがい、本発明は音声信号の無声区間を正しく決定し、よって
有声区間内での雑音消去信号の誤処理を防止するシステムを提供する。好ましい
実施形態において、本発明は、周波数ビンのそれぞれに対し別々の閾値検出器を
用いて無声区間を正確に決定することにより音声スイッチを不要にする。閾値検
出器は、入力信号の周波数スペクトル要素、すなわち周波数ビンが、プリセット
された期間にわたる周波数スペクトル要素の最小値にしたがって、さらに詳しく
は、周波数スペクトル要素の現在及び将来の最小値にしたがって設定された閾値
の範囲内にあるか否かを決定することにより、持続的有声区間内であってさえ、
雑音要素の位置を精確に検出する。すなわち、それぞれの音節に対し、信号全体
のエネルギーを調べることなく別々の閾値を決定することにより雑音要素のエネ
ルギーが決定され、よって、雑音の良好で安定な推定値を与える。さらに、シス
テムは継続的に閾値をセットし、あらかじめ定められた期間内、例えば５秒以内
に閾値をリセットすることが好ましい。複素数の計算を少なくするため、本発明においては、例えば入力音声信号の実
数部及び虚数部の高い方の値及び低い方の値にしたがう、入力信号の実数部と虚
数部の乗算結合を用いて入力信号の強度の推定値を得ることが好ましい。スペク
トル推定の不安定性をさらに低減するために、２元(２Ｄ)平滑化プロセスが信号
推定に適用される。まずそれぞれの時間フレームにおける隣り合う周波数ビンを
用い、次いでそれぞれの周波数ビンに対して時間平均をとる指数時間平均を施す
２ステップ平滑化関数により優れた結果が得られる。減算中に周波数ビンの位相を決定し、よって減算している要素の位相を揃える
ことの複雑さを低減するため、本発明はフィルタ乗算を適用して減算を行う。フ
ィルタ関数、例えばウイーナーフィルタ関数、または近似ウイーナーフィルタ関
数に、周波数ドメイン音声信号の複素データが乗じられる。フィルタ関数は全波
整流、あるいはそうでなければ本減算プロセスまたは単純減算の負の結果に対し
て、半波整流を行うことができる。雑音要素は持続的有声区間中に決定されるか
ら、雑音推定は正確であり、この推定雑音を音声信号から継続的に消去すること
ができて、優れた雑音消去特性を得られることが理解されよう。本発明は、雑音消去後に残る残留雑音を低減するための残留雑音低減プロセス
も提供する。残留雑音は、例えば持続的音声内の無声区間をゼロ化するかあるい
は無声区間を減衰させることにより低減される。音声スイッチ、または時間ドメ
インにおける無声区間を検出するその他の閾値検出器を用いることができる。本発明は、本明細書に参照により含めた米国特許出願に記述されるシステムを
含むが、これらには限定されない、様々な雑音消去システムに適用できる。本発
明は、例えば補償ビーム形成アレイに適用できる。さらに、本発明は、アプリケ
ーションソフトウエアまたはハードウエアとしてインストールされた、コンピュ
ータプロセッサを駆動するためのコンピュータプログラムとして実施することが
できる。本発明にしたがうその他の目的、特徴及び利点は、例示的実施形態についての
以下の詳細な説明を、相応する要素は同じ参照数字で識別される添付図面ととも
に読めば明らかになるであろう。好ましい実施形態の詳細な説明一実施形態において、本発明は、電気的または電磁気的雑音源、例えばＡＣ電
源またはコンピュータ、特にラップトップコンピュータに用いられるようなＡＣ
−ＤＣ電力コンバータのような電力供給源を含む電源のような外部電磁雑音源、
から発生する雑音を消去及び／または低減するためのスペクトル減算システム、
方法及び装置として実施できる。特に、ラップトップ機のようなコンピュータの
電力供給源は、ユニバーサル・シリアル・バス(ＵＳＢ)ライン、ポートまたはＵ
ＳＢ上の信号に、あるいはこれらに関連して、妨害雑音を発生することが発見さ
れた。電力変換に関わる電源は、例えばＵＳＢ信号ラインへの電磁結合を介して
伝達される、(本明細書で“等方性拡散定常雑音”または“等方性雑音”と称さ
れる)ＵＳＢ信号ライン上の信号と干渉する妨害信号を明らかに発生する。この
雑音はトランスデューサによって再生されると、例えばバズ音として聞こえる。
皮肉なことにＵＳＢは、サウンドカードのようなデバイス上に現れる、そのよう
な雑音源から音声雑音が生じることを回避すると以前は考えられていた。ＵＳＢ
は、例えばインターネットまたはその他の遠隔通信媒体を介して受け取られる信
号を含む音声信号周辺装置から受け取られる、会話及び音声の交信用途のための
標準に急速になりつつあるため、上記の等方性雑音を除去することは重要な業績
であり、実際、ドルビー(商標)方式が発明されたときと同じ衝撃を市場に与える
ことになろう。本明細書に説明される本発明は、電源または電力コンバータから発生し、ＵＳ
Ｂ信号ライン上に現れる“汚い雑音”を除去するために見いだされた。当業者で
あれば、例えばデバイスドライバあるいは関連の米国特許出願第６０／１２６，
５６７号で特に述べられているようなダイナミックリンクライブラリを含む、コ
ンピュータ上への良く知られたコンピュータソフトウエア及び／またはハードウ
エアアプリケーションのいずれとしても、本明細書に説明されるスペクトル減算
システム、方法及び装置がどのように実施されるかを理解するであろう。米国特
許出願第６０／１２６，５６７号の発明と協同して、本発明は、プルダウンメニ
ューにより選択可能な、等方性雑音をフィルタリングして除去するためのフィル
タを含む。一実施形態において、本発明の好ましい動作範囲は、コンピュータプ
ロセッサの制御の下で自動的にあるいは、例えばポテンショメータまたはタブ付
プルダウンスライダーにより与えられるクリック可能なオブジェクトを用いてユ
ーザにより手動で、８ｄＢから１４ｄＢの間で増減可能であることがわかった。
他のｄＢ範囲を与えることも本発明の範囲内ではあるが、このｄＢ範囲で最適な
性能が得られると思われる。しかし、雑音低減量が１４ｄＢを超えると音声が侵
されて、音声認識の劣化がおこり得る。すなわち、本発明は音響雑音だけでなく、固有のシステム雑音すなわちシステ
ムにより誘起される雑音にも適用可能であり、本発明は音響雑音だけでなくシス
テムにより誘起されるシステム固有雑音(例えば電源または電力コンバータから
の雑音)も低減または除去する。図１は、本発明の実施形態１００を示す。システムは、音声信号帯域幅の少な
くとも２倍の周波数でサンプリングされたデジタル音声信号を、入力１０２で受
け取る。一実施形態において、信号は、アナログフロントエンド、Ａ／Ｄコンバ
ータ、及び所要のサンプリング周波数を得るためのデシメーションフィルタを通
して処理されたマイクロフォン信号から得られる。別の実施形態においては、入
力はビーム形成器の出力から、または補償ビーム形成器の出力からさえもとられ
る。この場合、信号は、所望の信号と同じ方向から発する雑音のほとんどを残し
、所望の信号とは別の方向から到達する雑音を除去するように処理される。また
別の実施形態において、入力信号は、処理プロセスがＰＣプロセッサまたは同様
のコンピュータプロセッサ上で実施される場合に、サウンドボードから得ること
ができる。サンプリングされた入力は２５６点の一時バッファ１０４に格納される。バッ
ファが一杯になると、新しい２５６点が結合器１０６で前の２５６点と結合され
て５１２点の入力を与える。乗算器１０８で長さ５１２点のシェーディングウイ
ンドウが５１２点の入力に乗じられる。シェーディングウインドウは適宜入力デ
ータに乗じられる係数をもつ。シェーディングウインドウはハニングまたはその
他のウインドウとすることができ、２つの目的：第１は処理された２つのブロッ
クの間の過渡部分を(重ね合わせプロセスとともに)平滑化すること；第２は周波
数ドメインのサイドローブを減衰し、よって高エネルギーサイドローブによる低
エネルギーの音調のマスキングを防止すること、に役立つ。シェーディングをか
けられた結果はＦＦＴ(高速フーリエ変換)プロセッサ１１０により周波数ドメイ
ンに変換される。２５６点または１０２４点を含むその他の長さのＦＦＴサンプ
ル(したがって入力バッファ)もとることができる。ＦＦＴの出力は２５６の有効点の複素ベクトルである(残りの２５６点は初め
の２５６点の反対称写像である)。これらのデータ点は、それぞれの周波数ビン
に対する雑音強度推定−それぞれの周波数ビンに対して無雑音複素数値を推定す
る減算プロセス、及び雑音低減プロセス−を含む、雑音処理ブロック１１２(２
００)で処理される。ＩＦＦＴ(高速逆フーリエ変換)プロセッサ１１４が複素無
雑音データに逆フーリエ変換を施し、５１２の時間ドメインデータ点を与える。
前半の２５６の時間ドメインデータ点は加算器１１６により前の５１２の時間ド
メインデータ点の後半の２５６のデータ点と加算されて、入力の重ね合わせ及び
シェーディングプロセスについて補償され、出力端子１１８に出力される。残り
の２５６点は次の反復のために取りおかれる。好ましい実施形態においては特定の変換が利用されるが、他の変換を本発明に
適用しても雑音信号スペクトルが得られることは当然理解されよう。図２は雑音処理ブロック２００(１１２)の詳細図である。初めに、それぞれの
周波数ビン(ｎ)２０２の強度が推定される。直截的な手法は：

【数１】を計算することにより強度を推定することである。処理時間を短縮し複雑さを軽減するために、信号強度(Ｙ)は推定器２０４によ
り近似公式：

【数２】を代わりに用いて推定される。ＦＦＴプロセスを一般に悩ませる (参考文献[２]：オッペンハイム・シェイフ
ァー(Oppenheim Schfer)，「デジタル信号処理」，プレンティス・ホール(Prentic
e Hall)社，５４２〜５４５ページ)、スペクトル推定の不安定性を小さくする
ために、本発明は２Ｄ平滑化プロセスを実施する。それぞれの周波数ビンは、第
１の平均化器２０６によりそれぞれの周波数ビンの値と(同じ時間フレ−ムの)隣
り合う２つの周波数ビンの値との平均値で置き換えられる。さらに、平滑化され
たそれぞれの周波数ビンの平滑化された値は、時定数が(３つの時間フレームに
わたる平均化に等価な)０．７の、指数時間平均を用いる第２の平均化器２０８
によりさらに平滑化される。次いで、２Ｄ平滑化された値に２つのプロセス−雑
音推定プロセッサ２１２(３００)による雑音推定プロセス及び減算器２１０によ
る減算プロセス−が施される。雑音推定プロセスはそれぞれの周波数ビンにおけ
る雑音を推定し、その結果が雑音減算プロセスに用いられる。雑音減算出力は残
留雑音低減プロセッサ２１６に与えられ、雑音をさらに低減する。一実施形態に
おいて、無声区間を決定するために、時間ドメイン信号も残留雑音プロセス２１
６で用いられる。無雑音信号２１８は、時間ドメイン出力を得るため、ＩＦＦＴ
プロセスに送られる。図３は、雑音推定プロセッサ３００(２１２)の詳細図である。理論上、雑音は
無声時間区間の信号強度(Ｙ)の長時間平均をとることにより推定されるべきであ
る。このためには、有声／無声区間を検出するために音声スイッチが用いられな
ければならない。しかし感度閾値が高すぎるスイッチでは、処理後の音声信号に
欠落を生じさせるような音声入力信号を雑音推定に使用することになる可能性が
ある。他方で、感度閾値がかなり低いスイッチは雑音時間区間長を(特に持続的
音声の場合に)大幅に短くし、雑音推定の有効性を失わせる可能性がある。本発明においては、それぞれの周波数ビン３０２に対して個別の補償閾値が実
施される。これにより、それぞれの周波数ビンに対して信号の全体エネルギーを
調べることなく個別に雑音要素の位置をつきとめることができる。この方法の背
後にある論理は、それぞれの音節に対して、エネルギーは相異なる周波数帯に出
現し得るということである。同時に、他の周波数帯はおそらく雑音要素を含む。
したがって雑音に対して無感度の閾値を適用し、それでも、持続的音声の中でさ
え、それぞれの周波数ビンに対して多くの無声データ点の位置をつきとめること
が可能である。本方法の利点は、持続的音声区間内であっても、良好で安定な雑
音推定のために多くの雑音区間を収集できることである。閾値決定プロセスにおいては、それぞれの周波数ビンに対して、２つの最小値
が計算される。３０４において、５秒毎に将来の最小値が現在の強度(Ｙ(ｎ))で
開始され、以下のプロセスにより次の５秒間にわたってより小さい最小値で置き
換えられる。それぞれの周波数ビンの将来の最小値は、現在の信号強度値と比較
される。現在の強度値が将来の最小値より小さければ、将来の最小値が現在の強
度値で置き換えられ、現在の強度値が新しい将来の最小値になる。同時に、現在の最小値が３０６において計算される。現在の最小値は、５秒毎
に前の５秒間にわたって決定された将来の最小値で開始され、現在の強度値と比
較されることにより次の５秒間の信号の最小値に追随する。現在の最小値は減算
プロセスに用いられ、一方将来の最小値は現在の最小値の開始及び更新に用いら
れる。本発明の雑音推定機構は、限られたプロセスメモリ(５秒間)を用いて、雑音値
の厳密で迅速な推定を保証する一方で、高すぎる雑音推定を防止する。それぞれの周波数ビンの強度(Ｙ(ｎ))は、コンパレータ３０８により、当該周
波数ビンの補償閾値としてはたらく当該周波数ビンの現在の最小値の４倍と比較
される。強度が範囲内に(すなわち閾値より下に)あれば雑音として認められ、当
該周波数の雑音３１２のレベルを決定する指数平均化ユニット３１０により用い
られる。強度が閾値より上にあれば、雑音推定には用いられずに棄却される。指
数平均化の時定数は一般に０．９５であり、これは最新２０フレームの平均を
とるとして解することができる。用途によっては４×最小値の閾値を変更するこ
とができる。図４は、減算プロセッサ４００(２１０)の詳細図である。直截的手法において
は、推定された周波数ビン雑音強度値が現在の周波数ビン強度から減算される。
周波数ビンの現在の位相が計算され、減算結果の実数部及び虚数部を得るために
減算結果とともに用いられる。この手法は、複素ベクトルの偏角の正弦及び余弦
を複素ベクトルが位置し得る４つの象限を考慮して計算する必要があるため、処
理及びメモリの点で非常に高コストである。本発明で用いられる代替手法は、フ
ィルタを用いる手法である。減算は、Ｈ(フィルタ係数)が：

【数３】であるフィルタ４０２により実行されるフィルタ乗算として解される。ここでＹ(ｎ)は周波数ビンの現在の強度、Ｎ(ｎ)は当該周波数ビンの雑音推定
値である。４０４において、(それぞれの周波数ビンで別々の)フィルタ係数の値
Ｈに現在の周波数ビンの実数部及び虚数部が乗じられ：

【数４】が得られる。ここでＥは無雑音複素数値である。直截的手法においては減算で負の強度値が
生じ得る。この値はゼロで置き換えられるか(半波整流)、あるいは負の値に絶対
値が等しい正の値に置き換えられる(全波整流)。フィルタ手法では、ここで説明
されるように、全波整流が直接に得られる。全波整流では大きな雑音低減は得ら
れないが、信号に導入されるアーティファクトがはるかに少ない。本フィルタ手
法は、分子に実値をとり、負の値をゼロで置き換えることにより、半波整流を行
うように改変できることは理解されよう。図中のＹの値は、隣り合う周波数ビンにわたって平均され、時間フレームにわ
たって平均された後(２Ｄ平滑化後)の、平滑化されたＹ値であることにも注意さ
れたい。別の手法は、雑音推定(Ｎ)だけに平滑化されたＹを用い、Ｈの計算には
平滑化されていないＹを用いることである。図５は残留雑音低減プロセッサ５００(２１６)を示す。残留雑音は無声区間中
に残っている雑音として定義される。無声区間における雑音はまず、有声時間区
間と無声時間区間とを区別しない減算プロセスにより低減される。残りの残留雑
音は、音声スイッチ５０２を用い、残留雑音に減衰因子を乗じるかあるいは残留
雑音をゼロで置き換えることにより、さらに低減することができる。ゼロ化に代
わる別の方法が、５０４における雑音の最小値による残留雑音の置換である。また別の、音声スイッチを使用しない手法が、図５Ａに示される。残留雑音プ
ロセッサ５０６が雑音推定器５０８で用いられるものと同様の閾値を無雑音周波
数ビン出力に適用し、無雑音出力が閾値より低い場合に５１０において結果を置
換するか減衰させる。本発明の残留雑音処理の結果は、無声区間における、より静寂な音場である。
しかし、雑音レベルが有声区間と無声区間との間で切り替えられるときのポップ
雑音のようなアーティファクトの出現もある種の用途ではおこり得る。本発明のスペクトル減算法は、アレイ技術または接話マイクロフォン技術とと
もに、あるいは独立型システムとして、利用できる。本発明のスペクトル減算は
独立型システムとして埋込ハードウエア(ＤＳＰ)上で、補償ビーム形成のような
その他の埋込アルゴリズムの一部として、あるいはサウンドポートから得られる
データを用いてＰＣ上で実行されるソフトウエアアプリケーションとして、実施
できる。例えば、図６〜９に示されるように、本発明をソフトウエアアプリケーション
として実施できる。ステップ６００において、サンプリングされた入力が読み込
まれる。ステップ６０２で、読み込まれたサンプリング値がバッファに格納され
る。ステップ６０４で新しい２５６点が蓄積されるとプログラム制御はステップ
６０６に進む。そうでなければ制御はステップ６００に戻り、サンプリング値を
さらに読み込む。２５６点の新しいサンプリング値が読み込まれてしまうと、ス
テップ６０６で最新の５１２点が処理バッファに移される。格納された２５６点
の新しいサンプリング値がステップ６０８で前の２５６点と結合されて５１２点
が得られる。ステップ６１０において、フーリエ変換が５１２点について施され
る。もちろん、別の変換を用いて雑音信号スペクトルを得ることもできる。ステ
ップ６１２において、変換で得られた２５６の有効複素データ点がバッファに格
納される。第２の２５６点は第１の２５６点の共役写像であり、実入力に対する
冗長性を提供している。ステップ６１４で格納されたデータは、２５６の実数点
及び２５６の虚数点を含む。次いで制御は、丸で囲まれた文字Ａに示されるよう
に、図７に進む。図７において、信号処理が行われ、ステップ７００で信号強度が推定される。
直截的手法を用い得ることは当然であるが、図２を参照して論じたように、直截
的手法では余分な処理時間及び複雑さが必要になる。ステップ７０２において、
格納された複素データ点がバッファから読み込まれ、ステップ７００に示される
推定式を用いる計算が行われる。計算結果はステップ７０４で格納される。２元
(２Ｄ)平滑化プロセスがステップ７０６及び７０８で施され、ステップ７０６で
は、それぞれの点の推定値が隣り合う点の推定値と平均され、ステップ７０８で
は、それぞれの点における推定値を、例えばそれぞれの周波数ビンの３サンプリ
ング時間にわたって、平均する効果を有する指数平均を用いて推定値が平均され
る。ステップ７１０及び７１２では、平滑化された推定値を用いて将来の最小値
及び現在の最小値が計算される。平滑化された推定値がステップ７１０で決定さ
れる計算された将来の最小値より小さければ、将来の最小値は平滑化された推定
値で置き換えられて、ステップ７１４で格納される。一方、平滑化された推定値が現在の最小値より小さいことがステップ７１２で
決定されれば、現在の最小値は平滑化された推定値で置き換えられて、ステップ
７２０で格納される。将来及び現在の最小値は継続的に計算され、定期的に、例
えばステップ７２４で定められるように５秒毎に開始され、次いで、制御は新し
い将来及び現在の最小値が計算される、ステップ７２２及び７２６に進む。その
後、制御は、丸で囲まれた文字Ｂで示されるように、減算及び残留雑音低減が行
われる図８に進む。図８においては、サンプル値が閾値より小さいか否かがステップ８００で決定
される。サンプル値が閾値内にあれば、ステップ８０４でサンプル値は指数平均
化が施されて、ステップ８０２でバッファに格納される。そうでなければ、制御
はステップ８０８に直接進む。ステップ８０８において、ステップ８０６で取り
出された信号サンプル値、ステップ８０６で取り出される信号サンプル値から決
定される、ステップ８１０で取り出されたサンプル値、及びステップ８１０から
取り出された推定サンプル値から、フィルタ係数が決定される。位相が推定され
て適用される直截的手法を用いることもできるが、ウイーナーフィルタは処理時
間を短縮し複雑さを軽減するので、これを代わりに用いることが好ましい。ステ
ップ８１４においてフィルタ変換値にステップ８１６で取り出されたサンプル値
が乗じられて、ステップ８１２で格納される。ステップ８１８及び８２０において残留雑音低減プロセスが実行され、ステッ
プ８１８で処理された雑音信号が閾値の範囲内であれば、制御は処理された雑音
信号に置換、例えば減衰を受けさせるステップ８２０に進む。しかし、残留雑音
低減プロセスは、その適用の効果がないようなある種の用途には適していないこ
とがある。本発明に用いられるいくつかの式及び計算には特定の値が用いられているが、
これらの値は本明細書に示された値と異なっていてもよいことは理解されよう。図９においては、ステップ９０４で取り出された雑音処理済音声信号を基に、
ステップ９０２で逆フーリエ変換が生成されて、ステップ９００で格納される。
ステップ９０６では、実質的に雑音の無い音声信号を再生するために、時間ドメ
イン信号がオーバーレイされる。本発明が、例えばプログラム可能なメモリチップに埋め込むことができるか、
あるいは、例えば光ディスクのようなコンピュータ読出可能な媒体に格納でき、
これらから取り出されてコンプユータプロセッサを駆動することができる、Ｃま
たはその他のいずれかのプログラム言語を用いて書かれることが好ましいソフト
ウエアアプリケーションとして実施できることは理解されよう。本発明の代表的
なプログラムコードのサンプルが付録Ａに示され、このコードは、当業者には理
解されるように、本発明の精神及び範囲を逸脱することなく、様々なオペレ−テ
ィングシステム及びコンパイラに適合させるために、あるいは様々な合図(例え
ば‘チン’音または‘ピー’音)を含めるために、変更することができる。本発明により、信号対雑音比が劣っている情況及び持続的な早口の音声の場合
においてさえ雑音強度スペクトルを推定するための、単純ではあるが効率のよい
機構を有するスペクトル減算システムが提供される。低コストで強度推定を実行
でき、位相関連付けの問題を克服するであろう、効率のよい機構が提供される。
データを不鮮明にすることなく雑音強度スペクトルを推定するための安定な機構
が提供される。本発明の好ましい実施形態及びこれらの変更例を本明細書で詳細に説明したが
、本発明は上記と寸分違わない実施形態及び変更例に限定されず、その他の変更
及びバリエーションが添付特許請求事項により定められる本発明の精神及び範囲
を逸脱することなく当業者によりなされ得ることは当然である。

【図面の簡単な説明】

【図１】本発明を示す

【図２】本発明の雑音処理プロセスを示す

【図３】本発明の雑音推定処理プロセスを示す

【図４】本発明の減算処理プロセスを示す

【図５】本発明の残留雑音処理プロセスを示す

【図５Ａ】本発明の残留雑音処理プロセスの一変形を示す

【図６】本発明のフローチャートを示す

【図７】本発明のフローチャートを示す

【図８】本発明のフローチャートを示す

【図９】本発明のフローチャートを示す

【符号の説明】

１０２デジタル音声信号１０４一時バッファ１０６結合器１０８乗算器１１０ＦＦＴプロセッサ１１２雑音プロセッサ

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＣＹ，ＤＥ，ＤＫ，ＥＳ，ＦＩ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＣＡ，ＣＮ，ＩＬ，ＪＰ，ＵＳ

Claims

【特許請求の範囲】

【請求項１】ユニバーサル・シリアル・バス上を伝送される信号内の雑音
を消去するための装置であって：雑音信号を含む音声信号を入力するための入力；前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
数ビンを生成するための、周波数スペクトル発生器；及び前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
素の位置を検出する閾値検出器；を含むことを特徴とする装置。
【請求項２】前記閾値検出器が前記複数の周波数ビンに対して複数の無声
データ点の位置を検出することを特徴とする請求項１記載の装置。
【請求項３】前記閾値検出器が前記音声信号の持続的有声区間内で前記複
数の周波数ビンに対して前記複数の無声データ点の位置を検出することを特徴と
する請求項２記載の装置。
【請求項４】前記閾値検出器が、将来の最小値にしたがって導かれる前記
複数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定することに
より、前記雑音要素の位置を検出することを特徴とする請求項１記載の装置。
【請求項５】前記将来の最小値があらかじめ定められた期間内の将来の最
小値として決定されることを特徴とする請求項４記載の装置。
【請求項６】前記現在の最小値があらかじめ定められた期間内の現在の最
小値として決定されることを特徴とする請求項４記載の装置。
【請求項７】前記現在の最小値が前記将来の最小値に定期的に設定される
ことを特徴とする請求項５記載の装置。
【請求項８】前記将来の最小値が前記現在の強度値に定期的に設定される
ことを特徴とする請求項５記載の装置。
【請求項９】前記将来の最小値が前記現在の強度値より大きいときに、前
記将来の最小値が前記現在の強度値で置き換えられることを特徴とする請求項７
記載の装置。
【請求項１０】前記現在の最小値が前記現在の強度値より大きいときに、
前記現在の最小値が前記現在の強度値で置き換えられることを特徴とする請求項
７記載の装置。
【請求項１１】前記閾値が前記現在の最小値に係数を乗じることにより設
定されることを特徴とする請求項４記載の装置。
【請求項１２】前記それぞれの周波数ビンの中の前記雑音のレベルを決定
するための平均化ユニットをさらに含み；前記閾値検出器が前記平均化ユニット
で決定された前記雑音の前記レベルが前記閾値の範囲内にある前記雑音要素の位
置を検出することを特徴とする請求項１記載の装置。
【請求項１３】前記音声信号から前記閾値検出器により決定された前記位
置において推定された前記雑音要素を減算して実質的に前記雑音の無い前記音声
信号を導くための減算器をさらに含むことを特徴とする請求項１記載の装置。
【請求項１４】前記減算器が前記音声信号にフィルタ関数を乗じるフィル
タ乗算を用いて減算を行うことを特徴とする請求項１３記載の装置。
【請求項１５】前記フィルタ関数が前記複数の周波数ビンの前記雑音要素
及び強度の関数であるウイーナーフィルタ関数であることを特徴とする請求項１
４記載の装置。
【請求項１６】前記フィルタ乗算が前記複数の周波数ビンの複素要素に前
記ウイーナーフィルタ関数を乗じることを特徴とする請求項１５記載の装置。
【請求項１７】前記複数の周波数ビンのそれぞれの強度を推定するための
推定器をさらに含むことを特徴とする請求項１記載の装置。
【請求項１８】前記推定器が、数がｎの前記複数の周波数ビンに対して、
前記複数の周波数ビンの前記複素要素の最大値及び最小値の関数として前記複数
の周波数ビンのそれぞれの前記強度を推定することを特徴とする請求項１７記載
の装置。
【請求項１９】前記複数の周波数ビンのそれぞれの前記推定値を平滑化す
る平滑化ユニットをさらに含むことを特徴とする請求項１７記載の装置。
【請求項２０】前記平滑化ユニットが、前記複数の周波数ビンのそれぞれ
と前記それぞれの周波数ビンに隣り合う周波数ビンとの平均をとり、複数の周波
数ビンにわたり時間に関する平均をとる指数時間平均化を用いて前記それぞれの
周波数ビンを平均する２元プロセスを含むことを特徴とする請求項１９記載の装
置。
【請求項２１】前記減算器が前記閾値検出器により決定された前記位置に
おける前記雑音要素を前記音声信号から減算した後に残っている残留雑音を低減
するための残留雑音プロセッサをさらに含むことを特徴とする請求項１３記載の
装置。
【請求項２２】前記残留雑音プロセッサが前記音声信号の無声区間に対応
する前記複数の周波数ビンをある最小値で置き換えることを特徴とする請求項２
１記載の装置。
【請求項２３】前記残留雑音プロセッサが前記無声区間を検出するための
音声スイッチを含むことを特徴とする請求項２２記載の装置。
【請求項２４】前記残留雑音プロセッサがあらかじめ定められた閾値より
小さい前記音声信号を検出することにより前記無声区間を検出するための別の閾
値検出器を含むことを特徴とする請求項２２記載の装置。
【請求項２５】前記音声信号を受け取るための複数のマイクロフォンを含
む補償アレイをさらに含むことを特徴とする請求項１記載の装置。
【請求項２６】ユニバーサル・シリアル・バス上を伝送される信号内の雑
音を消去するための装置であって：雑音信号を含む音声信号を入力するための入力手段；前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
数ビンを生成するための、周波数スペクトル発生手段；及び前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
素の位置を検出する閾値検出手段；を含むことを特徴とする装置。
【請求項２７】前記閾値検出手段が、将来の最小値にしたがって導かれる
前記複数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定するこ
とにより、前記雑音要素の位置を検出することを特徴とする請求項２６記載の装
置。
【請求項２８】前記閾値検出手段が、現在の最小値にしたがって導かれる
前記複数の周波数ビンの強度の将来の最小値にしたがって前記閾値を設定するこ
とにより、前記雑音要素の位置を検出することを特徴とする請求項２６記載の装
置。
【請求項２９】前記将来の最小値があらかじめ定められた期間内の将来の
最小値として決定されることを特徴とする請求項２７記載の装置。
【請求項３０】前記現在の最小値があらかじめ定められた期間内の現在の
最小値として決定されることを特徴とする請求項２７記載の装置。
【請求項３１】前記それぞれの周波数ビンの中の前記雑音のレベルを決定
するための平均化手段をさらに含み；前記閾値検出手段が前記平均化手段で決定
された前記雑音の前記レベルが前記閾値の範囲内にある前記雑音要素の位置を検
出することを特徴とする請求項２６記載の装置。
【請求項３２】前記音声信号から前記閾値検出手段により決定された前記
位置における前記雑音要素を減算して実質的に前記雑音の無い前記音声信号を導
くための減算手段をさらに含むことを特徴とする請求項２６記載の装置。
【請求項３３】前記減算手段が前記音声信号にフィルタ関数を乗じるフィ
ルタ乗算を用いて減算を行うことを特徴とする請求項３２記載の装置。
【請求項３４】前記複数の周波数ビンのそれぞれの強度を推定するための
推定手段をさらに含むことを特徴とする請求項２６記載の装置。
【請求項３５】前記推定手段が、数がｎの前記複数の周波数ビンに対して
前記複数の周波数ビンの最大値及び最小値の関数として前記複数の周波数ビンの
それぞれの前記強度を推定することを特徴とする請求項３４記載の装置。
【請求項３６】前記複数の周波数ビンのそれぞれの推定値を平滑化するた
めの平滑化手段をさらに含むことを特徴とする請求項３４記載の装置。
【請求項３７】前記減算手段が前記閾値検出手段により決定された前記位
置における前記雑音要素を前記音声信号から減算した後に残っている残留雑音を
低減するための残留雑音処理手段をさらに含むことを特徴とする請求項３２記載
の装置。
【請求項３８】前記音声信号を受け取るための複数のマイクロフォンを含
む補償アレイ手段をさらに含むことを特徴とする請求項２６記載の装置。
【請求項３９】ユニバーサル・シリアル・バス上に発生する可聴雑音を表
す雑音信号を含む可聴音響を表す音声信号から雑音を消去するための雑音消去信
号を発生するためにコンピュータプロセッサを駆動するための方法であって：前記雑音信号を含む前記音声信号を入力する工程；前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
数ビンを生成する工程；前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
素の位置を検出する工程；及び前記検出工程で検出された前記雑音要素を前記音声信号から減算して、実質的
に前記可聴雑音の無い前記可聴音響を表す音声信号をつくる工程；を含むことを特徴とする方法。
【請求項４０】前記検出工程が将来の最小値にしたがって導かれる前記複
数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定することによ
り前記雑音要素の位置を検出することを特徴とする請求項３９記載の方法。
【請求項４１】前記検出工程が現在の最小値にしたがって導かれる前記複
数の周波数ビンの強度の将来の最小値にしたがって前記閾値を設定することによ
り前記雑音要素の位置を検出することを特徴とする請求項３９記載の方法。
【請求項４２】前記検出工程が前記将来の最小値をあらかじめ定められた
期間内の将来の最小値として決定する工程をさらに含むことを特徴とする請求項
４０記載の方法。
【請求項４３】前記検出工程が前記現在の最小値をあらかじめ定められた
期間内の現在の最小値として決定する工程をさらに含むことを特徴とする請求項
４１記載の方法。
【請求項４４】前記それぞれの周波数ビンの前記雑音のレベルを平均する
工程をさらに含み；前記検出工程が前記平均工程で決定された前記雑音の前記レ
ベルが前記閾値の範囲内にある前記雑音要素の位置を検出することを特徴とする
請求項３９記載の方法。
【請求項４５】前記減算工程が前記音声信号にフィルタ関数を乗じるフィ
ルタ乗算を用いて減算を行うことを特徴とする請求項３９記載の方法。
【請求項４６】数がｎの前記複数の周波数ビンに対して前記複数の周波数
ビンの最大値及び最小値の関数として前記複数の周波数ビンのそれぞれの強度を
推定する工程をさらに含むことを特徴とする請求項３９記載の方法。
【請求項４７】前記それぞれの周波数ビンの推定値を平滑化する工程をさ
らに含むことを特徴とする請求項４６記載の方法。
【請求項４８】前記減算工程が前記検出工程で決定された前記位置におけ
る前記雑音要素を前記音声信号から減算した後に残っている残留雑音を低減する
工程をさらに含むことを特徴とする請求項３９記載の方法。
【請求項４９】複数のマイクロフォンの補償アレイから前記音声信号を受
け取る工程をさらに含むことを特徴とする請求項３９記載の方法。
【請求項５０】前記雑音が電源から発生することを特徴とする請求項１記
載の装置。
【請求項５１】前記雑音が電源から発生することを特徴とする請求項３９
記載の方法。
【請求項５２】雑音を消去するための装置であって：雑音信号を含む音声信号を入力するための入力；前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
数ビンを生成するための周波数スペクトル発生器；及び前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
素の位置を検出する閾値検出器；を含むことを特徴とする装置。
【請求項５３】前記閾値検出器が前記複数の周波数ビンに対する複数の無
声データ点の位置を検出することを特徴とする請求項５２記載の装置。
【請求項５４】前記閾値検出器が前記音声信号の持続的有声区間内で前記
複数の周波数ビンに対する前記複数の無声データ点の位置を検出することを特徴
とする請求項５３記載の装置。
【請求項５５】前記閾値検出器が将来の最小値にしたがって導かれる前記
複数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定することに
より前記雑音要素の位置を検出することを特徴とする請求項５２記載の装置。
【請求項５６】前記将来の最小値があらかじめ定められた期間内の将来の
最小値として決定されることを特徴とする請求項５５記載の装置。
【請求項５７】前記現在の最小値があらかじめ定められた期間内の現在の
最小値として決定されることを特徴とする請求項５５記載の装置。
【請求項５８】前記現在の最小値が前記将来の最小値に定期的に設定され
ることを特徴とする請求項５６記載の装置。
【請求項５９】前記将来の最小値が前記現在の強度値に定期的に設定され
ることを特徴とする請求項５６記載の装置。
【請求項６０】前記将来の最小値が前記現在の強度値より大きいときに、
前記将来の最小値が前記現在の強度値で置き換えられることを特徴とする請求項
５８記載の装置。
【請求項６１】前記現在の最小値が前記現在の強度値より大きいときに、
前記現在の最小値が前記現在の強度値で置き換えられることを特徴とする請求項
５８記載の装置。
【請求項６２】前記閾値が前記現在の最小値に係数を乗じることにより設
定されることを特徴とする請求項５５記載の装置。
【請求項６３】前記それぞれの周波数ビンの中の前記雑音のレベルを決定
するための平均化ユニットをさらに含み；前記閾値検出器が前記平均化ユニット
で決定された前記雑音の前記レベルが前記閾値の範囲内にある前記雑音要素の位
置を検出することを特徴とする請求項５２記載の装置。
【請求項６４】前記音声信号から前記閾値検出器により決定された前記位
置において推定された前記雑音要素を減算して実質的に前記雑音の無い前記音声
信号を導くための減算器をさらに含むことを特徴とする請求項５２記載の装置。
【請求項６５】前記減算器が前記音声信号にフィルタ関数を乗じるフィル
タ乗算を用いて減算を行うことを特徴とする請求項６４記載の装置。
【請求項６６】前記フィルタ関数が前記複数の周波数ビンの前記雑音要素
及び強度の関数であるウイーナーフィルタ関数であることを特徴とする請求項６
５記載の装置。
【請求項６７】前記フィルタ乗算が前記複数の周波数ビンの複素要素に前
記ウイーナーフィルタ関数を乗じることを特徴とする請求項６６記載の装置。
【請求項６８】前記複数の周波数ビンのそれぞれの強度を推定するための
推定器をさらに含むことを特徴とする請求項５２記載の装置。
【請求項６９】前記推定器が、数がｎの前記複数の周波数ビンに対して、
前記複数の周波数ビンの複素要素の最大値及び最小値の関数として前記複数の周
波数ビンのそれぞれの前記強度を推定することを特徴とする請求項６８記載の装
置。
【請求項７０】前記複数の周波数ビンのそれぞれの前記推定値を平滑化す
る平滑化ユニットをさらに含むことを特徴とする請求項６８記載の装置。
【請求項７１】前記平滑化ユニットが、前記複数の周波数ビンのそれぞれ
と前記それぞれの周波数ビンに隣り合う周波数ビンとの平均をとり、前記複数の
周波数ビンにわたり時間に関する平均をとる指数時間平均化を用いて前記それぞ
れの周波数ビンを平均する２元プロセスを含むことを特徴とする請求項７０記載
の装置。
【請求項７２】前記減算器が前記閾値検出器により決定された前記位置に
おける前記雑音要素を前記音声信号から減算した後に残っている残留雑音を低減
するための残留雑音プロセッサをさらに含むことを特徴とする請求項６４記載の
装置。
【請求項７３】前記残留雑音プロセッサが前記音声信号の無声区間に対応
する前記複数の周波数ビンをある最小値で置き換えることを特徴とする請求項７
２記載の装置。
【請求項７４】前記残留雑音プロセッサが前記無声区間を検出するための
音声スイッチを含むことを特徴とする請求項７３記載の装置。
【請求項７５】前記残留雑音プロセッサがあらかじめ定められた閾値より
小さい前記音声信号を検出することにより前記無声区間を検出するための別の閾
値検出器を含むことを特徴とする請求項７３記載の装置。
【請求項７６】前記音声信号を受け取るための複数のマイクロフォンを含
む適応アレイをさらに含むことを特徴とする請求項５２記載の装置。
【請求項７７】雑音を消去するための装置であって：雑音信号を含む音声信号を入力するための入力手段；前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
数ビンを生成するための周波数スペクトル発生手段；及び前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
素の位置を検出する閾値検出手段；を含むことを特徴とする装置。
【請求項７８】前記閾値検出手段が、将来の最小値にしたがって導かれる
前記複数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定するこ
とにより、前記雑音要素の位置を検出することを特徴とする請求項７７記載の装
置。
【請求項７９】前記閾値検出手段が、現在の最小値にしたがって導かれる
前記複数の周波数ビンの強度の将来の最小値にしたがって前記閾値を設定するこ
とにより、前記雑音要素の位置を検出することを特徴とする請求項７７記載の装
置。
【請求項８０】前記将来の最小値があらかじめ定められた期間内の将来の
最小値として決定されることを特徴とする請求項７８記載の装置。
【請求項８１】前記現在の最小値があらかじめ定められた期間内の現在の
最小値として決定されることを特徴とする請求項７８記載の装置。
【請求項８２】前記それぞれの周波数ビンの中の前記雑音のレベルを決定
するための平均化手段をさらに含み；前記閾値検出手段が前記平均化手段で決定
された前記雑音の前記レベルが前記閾値の範囲内にある前記雑音要素の位置を検
出することを特徴とする請求項７７記載の装置。
【請求項８３】前記音声信号から前記閾値検出手段により決定された前記
位置における前記雑音要素を減算して実質的に前記雑音の無い前記音声信号を導
くための減算手段をさらに含むことを特徴とする請求項７７記載の装置。
【請求項８４】前記減算手段が前記音声信号にフィルタ関数を乗じるフィ
ルタ乗算を用いて減算を行うことを特徴とする請求項８３記載の装置。
【請求項８５】前記複数の周波数ビンのそれぞれの強度を推定するための
推定手段をさらに含むことを特徴とする請求項７７記載の装置。
【請求項８６】前記推定手段が、数がｎの前記複数の周波数ビンに対して
前記複数の周波数ビンの最大値及び最小値の関数として前記複数の周波数ビンの
それぞれの前記強度を推定することを特徴とする請求項８５記載の装置。
【請求項８７】前記複数の周波数ビンのそれぞれの推定値を平滑化するた
めの平滑化手段をさらに含むことを特徴とする請求項８５記載の装置。
【請求項８８】前記減算手段が前記閾値検出手段により決定された前記位
置における前記雑音要素を前記音声信号から減算した後に残っている残留雑音を
低減するための残留雑音処理手段をさらに含むことを特徴とする請求項８３記載
の装置。
【請求項８９】前記音声信号を受け取るための複数のマイクロフォンを含
む補償アレイ手段をさらに含むことを特徴とする請求項７７記載の装置。
【請求項９０】可聴雑音を表す雑音信号を含む可聴音響を表す音声信号か
ら雑音を消去するための雑音消去信号を発生するためにコンピュータプロセッサ
を駆動するための方法において、前記方法が：前記雑音信号を含む前記音声信号を入力する工程；前記音声信号の周波数スペクトルを発生し、よって前記音声信号の複数の周波
数ビンを生成する工程；前記複数の周波数ビンのそれぞれが閾値の範囲内にあるか否かを前記それぞれ
の周波数ビンに対して検出し、よって前記それぞれの周波数ビンに対する雑音要
素の位置を検出する工程；及び前記検出工程で検出された前記雑音要素を前記音声信号から減算して、実質的
に前記可聴雑音の無い前記可聴音響を表す音声信号をつくる工程；を含むことを特徴とする方法。
【請求項９１】前記検出工程が将来の最小値にしたがって導かれる前記複
数の周波数ビンの強度の現在の最小値にしたがって前記閾値を設定することによ
り前記雑音要素の位置を検出することを特徴とする請求項９０記載の方法。
【請求項９２】前記検出工程が現在の最小値にしたがって導かれる前記複
数の周波数ビンの強度の将来の最小値にしたがって前記閾値を設定することによ
り前記雑音要素の位置を検出することを特徴とする請求項９０記載の方法。
【請求項９３】前記検出工程が前記将来の最小値をあらかじめ定められた
期間内の将来の最小値として決定する工程をさらに含むことを特徴とする請求項
９１記載の方法。
【請求項９４】前記検出工程が前記現在の最小値をあらかじめ定められた
期間内の現在の最小値として決定する工程を含むことを特徴とする請求項９２記
載の方法。
【請求項９５】前記それぞれの周波数ビンの前記雑音のレベルを平均する
工程をさらに含み；前記検出工程が前記平均工程で決定された前記雑音の前記レ
ベルが前記閾値の範囲内にある前記雑音要素の位置を検出することを特徴とする
請求項９０記載の方法。
【請求項９６】前記減算工程が前記音声信号にフィルタ関数を乗じるフィ
ルタ乗算を用いて減算を行うことを特徴とする請求項９０記載の方法。
【請求項９７】数がｎの前記複数の周波数ビンに対して前記複数の周波数
ビンの最大値及び最小値の関数として前記複数の周波数ビンのそれぞれの強度を
推定する工程をさらに含むことを特徴とする請求項９０記載の方法。
【請求項９８】前記複数の周波数ビンのそれぞれの推定値を平滑化する工
程をさらに含むことを特徴とする請求項９０記載の方法。
【請求項９９】前記検出工程で決定された前記位置における前記雑音要素
を前記音声信号から減算した後に残っている残留雑音を低減する工程をさらに含
むことを特徴とする請求項９０記載の方法。
【請求項１００】複数のマイクロフォンの補償アレイから前記音声信号を
受け取る工程をさらに含むことを特徴とする請求項９０記載の方法。