JP2009031793A

JP2009031793A - 調整されたトーンノイズの低減を用いたノイズの低減

Info

Publication number: JP2009031793A
Application number: JP2008186578A
Authority: JP
Inventors: Phil A Hetherington; エー．ヘザーリントンフィル; Xueman Li; リーシュエマン
Original assignee: QNX Software Systems Wavemakers Inc
Current assignee: QNX Software Systems Wavemakers Inc
Priority date: 2007-07-25
Filing date: 2008-07-17
Publication date: 2009-02-12
Also published as: US20080167870A1; EP2023342A1; CA2638265A1; CA2638265C; KR20090012154A; US8489396B2

Abstract

【課題】ノイズ除去システムに対する改善を提供すること。
【解決手段】トーンノイズを識別する方法であって、入力信号を複数の周波数のビンに変換することと、各ビンにおいて、平滑化された背景ノイズと背景ノイズの概算値とを計算することと、該各ビンにおいて、該平滑化された背景ノイズを該背景ノイズの概算値と比較することと、該平滑化された背景ノイズに対する該背景ノイズの概算値の比が、閾値を上回るときには、トーンピークを有するとしてビンを識別することとを包含する、方法。
【選択図】図４

Description

（関連出願の引用）
本出願は、「ＮｏｉｓｅＲｅｄｕｃｔｉｏｎＷｉｔｈＩｎｔｅｇｒａｔｅｄＴｏｎａｌＮｏｉｓｅＲｅｄｕｃｔｉｏｎ」と題される、２００７年７月２５日出願の米国仮特許出願第６０／９５１，９５２号に対する優先権を主張するものであり、該米国仮特許出願は、本明細書において、その全体が参考として援用される。

（技術分野）
本システムは、音響処理の分野に関する。さらに詳細には、本システムは、発話または音楽の質を低下させることなく、トーンノイズを除去する方法を提供する。

発話の増強は、多くの場合に、発話信号からのノイズの除去を含む。発話がスピーチプロセッサまたは聴取者によって認識され得るように、信号から異質なノイズを除去することによって発話信号を強化することが、困難な研究課題となっている。過去数十年に渡って、様々な手法が開発されてきた。それらの中で、スペクトルサブトラクション方法が、現在の用途において最も広く使用されている。この方法において、平均ノイズスペクトルが概算され、ノイズ信号スペクトルから減算され、それにより信号対ノイズ比（ＳＮＲ）が改善される。

しかしながら、ノイズが「トーン」ノイズと呼ばれるタイプであるときには、従来技術の発話強化技術は、常に上手くいくわけではない。トーンノイズは、家庭、オフィス、自動車、および他の環境において生じ得る。家庭およびオフィスにおけるトーンノイズに関して多くの場合に引用されるソースは、蛍光灯のバズである。別のソースは、コンピュータまたはプロジェクタのファンのハムである。自動車において、トーンノイズは、ランブルストリップ、自動車のエンジン、オルタネータの泣き音、ラジオの干渉（「ＧＳＭバズ」）、または開いた窓からの鳴笛音（ｗｈｉｓｔｌｅ）である。このトーンノイズは、電話の会話および発話の認識に悪影響を与え得、発話を理解または認識することをわずかばかり困難にする。

所望の信号の内容に対して入力信号を検査する発話処理システムは、トーンノイズを発話と解釈し得、トーンノイズを有する入力信号のセグメントを隔離し得、そして、トーンノイズを処理することを試み得る。発話処理システムは、セグメントを隔離するためだけでなく、セグメントを処理し、処理の結果に基づいた動作を行うためにも貴重な演算リソースを消費する。発話認識システムにおいては、システムは、トーンノイズをボイスコマンドとして解釈し、スプリアスコマンドを実行し、それに応答して、まったく意図されていない動作を行い得る。

トーンノイズは、音響周波数スペクトルに関して一定のピークとして現れる。当然、ピークは、より広い範囲から、多くの場合に、６ｄＢ〜２０ｄＢだけ突出する。ノイズの低減は、一般的には、全ての周波数を均等に減衰し、それにより残りのトーンノイズはより静かになるが、ノイズの低減前と全く同様にノイズの低減後も明瞭である。従って、既存のノイズ除去の手法は、より広範な背景ノイズに対してトーンノイズを低減することを本当に助けるわけではない。

本発明は、ノイズ除去システムに対する改善を詳述する。準定常トーンノイズは、通常では広帯域ノイズまたは散乱ノイズのスペクトルにおけるピークとして現れる。ノイズの低減は、一般的には、全ての周波数を均等に減衰し、それによりトーンノイズはより静かになるが、ノイズの低減後もノイズの低減前と全く同様に明瞭である。システムは、ピークを識別し、どのピークがトーンピークでありそうかを決定し、トーンノイズに適応性の抑制を適用する。システムは、トーンノイズの低減（ＴＮＲ）の技術を使用しており、トーンノイズの低減（ＴＮＲ）は、トーンノイズが見つかった周波数をより大きく減衰する。ＴＮＲシステムは、追加的な処理（位相ランダム化）を行なうことにより、あらゆる残余のトーン音を事実上排除し得る。このシステムは、単純な一連の受動的なノッチフィルタではなく、従って、周波数が重なる発話または音楽を除去しない。さらに、システムは適応性であり、トーンノイズが存在しない場合には、追加的なフィルタリングを全く行なわない。

本発明はさらに以下の手段を提供する。

（項目１）
トーンノイズを識別する方法であって、
入力信号を複数の周波数のビンに変換することと、
各ビンにおいて、平滑化された背景ノイズと背景ノイズの概算値とを計算することと、
該各ビンにおいて、該平滑化された背景ノイズを該背景ノイズの概算値と比較することと、
該平滑化された背景ノイズに対する該背景ノイズの概算値の比が、閾値を上回るときには、トーンピークを有するとしてビンを識別することと
を包含する、方法。

（項目２）
比較する上記ステップは、同じビンの上記背景ノイズの概算値に対する上記平滑化された背景ノイズを含む、項目１に記載の方法。

（項目３）
上記閾値は、１を上回る、項目１に記載の方法。

（項目４）
現在のフレームｎに対する平滑化された背景ノイズを決定する上記ステップは、

のときに、

によって達成され、ここで、Ｂ_ｎ（ｋ）は、周波数のビンｋにおける現在のフレームｎの上記背景ノイズの概算値であり、

は、先のビンｋ−１の該平滑化された背景ノイズである、項目２に記載の方法。

（項目５）
平滑化された背景ノイズを決定する上記ステップは、

のときには、

によって与えられる、項目２に記載の方法。

（項目６）
β_１およびβ_２は、０から１の範囲にある２つのパラメータである、項目４および項目５に記載の方法。

（項目７）
比

は、

によって与えられる、項目１に記載の方法。

（項目８）
信号からトーンノイズを除去する方法であって、
ｎ番目のフレームおよびｋ番目の周波数のビンにおいて、ノイズを伴う発話信号の短時間のスペクトルの大きさ

を決定することと、
概算された純粋な発話信号

を

によって生成することであって、ここで、

は、適応性抑制ゲイン値である、ことと
を包含する、方法。

（項目９）

は、

によって生成され、
ここで、σ_ｎ，ｋは、現在の周波数のビンに関する適応性ゲイン係数である、項目８に記載の方法。

（項目１０）
σ_ｎ，ｋは、

によって生成され、
ここで、σは、一定の係数であり、

は、ビンｋにおける、背景ノイズの概算値と平滑化された背景ノイズとの間の比である、項目９に記載の方法。

（項目１１）

であり、
ここで、Ｂ_ｎ（ｋ）は、周波数ｋにおける現在のフレームｎの上記背景ノイズの概算値であり、

は、同じビンの上記平滑化された背景ノイズである、項目１０に記載の方法。

（項目１２）

と比較するステップをさらに包含する、項目１１に記載の方法。

（項目１３）

のときに、

を受け入れるステップをさらに含む、項目１２に記載の方法。

（項目１４）

のときに、最初の位相をランダム位相と置き換えるステップをさらに含む、項目１２に記載の方法。

（摘要）
システムは、入力信号におけるトーンノイズを抑制または排除する技術を提供する。システムは、複数の周波数のビンにおいて入力信号を処理し、次のビンにおける値を計算することを補助するために、先のビンにおいて生成された情報を使用する。システムは、最初に、信号におけるピークを識別し、次に、ピークがトーン効果によるものであるかを決定する。これは、現在のビンの概算された背景ノイズを、同じビンの平滑化された背景ノイズと比較することによって行なわれる。平滑化された背景ノイズは、非対称ＩＩＲフィルタを使用して計算され得る。現在計算された平滑化された背景ノイズに対する、現在の背景ノイズの概算値の比が、１を大幅に上回るときには、トーンノイズが想定される。トーンノイズが発見されたときには、多数の抑制技術が適用されることにより、トーンノイズが低減され得る。該多数の抑制技術は、固定のフロア係数を用いたゲイン抑制、適応性フロア係数のゲイン抑制技術、およびランダム位相技術を含む。

本発明は、以下の図面と記述とを参照して、より良く理解され得る。図面内のコンポーネントは、必ずしもサイズに比例しておらず、その代わりに、本発明の原理を例示することに重きを置いている。さらに、図面においては、同様な参照番号は、異なる図面全体を通して、対応する部分を示している。

一般的な周波数領域の発話強化システムは、通常、スペクトル抑制ゲインの計算方法と、背景ノイズのパワースペクトル密度（ＰＳＤ）の概算方法とから成る。スペクトル抑制は充分に理解されているが、ＰＳＤノイズ概算は、歴史的にはあまり注目されなかった。しかしながら、近年、ＰＳＤノイズ概算は、システム全体の質および明瞭性にとって非常に重要であることが分かった。背景ノイズが、時の経過によって変化がないか、またはほとんど変化がないときには、大部分のスペクトル抑制方法は、良好な質を達成し得る。トーンノイズが背景に存在するときには、従来のスペクトル抑制方法が、トーンノイズを抑制し得るが、トーンノイズを排除し得ない。残余のトーンノイズは明瞭であり、人間の耳を不快にし得る。このシステムは、発話の質を低下させることなく、完全にトーンノイズを除去する原理と技術とを提供する。

システムのトーンノイズ低減（ＴＮＲ）は、ピークが散乱ノイズを上回る程度まで、ピーク周波数をより大きく減衰する。例えば、周囲の周波数におけるノイズよりも１０ｄＢ上回るピークが、ノイズの概算値に見られた場合には、余分に１０ｄＢのノイズの減衰が、その周波数に行われる。このようにして、ＴＮＲ後のスペクトルの形状は、隣接する周波数全体に渡って平滑になり、トーンノイズがかなり低減される。

任意の所与の周波数において、発話がノイズよりも１２ｄＢ上回るときには、ノイズの寄与は些細なものと考えられ得る。従って、信号が、トーンノイズなどのノイズよりもかなり高いときには、ＴＮＲを用いるＮＲ、またはＴＮＲを用いないＮＲは、目立った影響を全く有するべきではなく、そして全く有していない。より低いＳＮＲ信号は、トーンピークの付近でより大きく減衰され、トーンノイズのピークと等しい信号は、結果として生じるスペクトルがピーク周波数の付近で平坦になるように減衰される（ピーク周波数の大きさは、隣接した周波数におけるノイズの大きさと等しい）。

（トーンノイズの位相をそのままにしておきながら）トーンノイズの出力を低減させることは、トーンの音を完全に除去しないことがあり得る。なぜならば、所与の周波数における位相が、まだ、トーンの知覚に寄与するからである。一方法において、信号がトーンノイズに近い場合には、その周波数のビンにおける位相がランダム化され得る。これが、その周波数におけるトーンを完全に除去する利益を有する。システムは、音質の改善と、聴取者の疲労の軽減と、発話認識の改善とを提供する。

本発明の他のシステム、方法、特徴および利点は、以下の図面および詳細な記述を考察すると、当業者には明らかであるか、または当業者に明らかになる。全てのかかる追加のシステム、方法、特徴および利点は、この記述の範囲内に含まれ、本発明の範囲内にあり、そして添付の特許請求の範囲によって保護されるということが意図されている。

（トーンノイズを検出する方法）
一般的な自動車のノイズは散乱ノイズである。周波数が増加したときに、散乱ノイズの出力密度は平滑に減少する。一般的な自動車のノイズのスペクトログラムは、スペクトログラム全体に渡って、比較的平滑であり、かつ、やや均一な分布を示す。対照的に、トーンノイズは、通常、一定の周波数だけに及び、比較的長い期間の間持続する。トーンノイズのスペクトログラムは、非常に不均一な分布を示す。

一般的な自動車のノイズのＰＳＤが図１に例示されている。グラフは、信号の出力が周波数によってどのように分布されるかを示す。見られ得るように、一般的な道路のノイズは、より低い周波数においてより多くの出力を有し、周波数と共に出力が実質的に低減し、それにより、より高い周波数において、信号の出力は比較的小さい。対照的に、図２に例示されたトーンノイズのＰＳＤは、出力が様々な周波数における多数のピークに分布されるということを示す。図２のトーンノイズ信号のＰＳＤは、一般的な道路のノイズよりも非常に多く「ピークを成している」。

妥当な周波数分解能を有する、ほとんどの従来的なノイズ追跡アルゴリズムは、背景におけるトーンノイズを追跡し得る。トーンノイズは、通常、ノイズスペクトルにおいて、図２における多数の周波数で例示されたように、隣のピークをかなり上回って立ち上がるピークとして示す。

図５は、トーンノイズを識別および抑制する際の、システムの動作を例示する流れ図である。ステップ５０１において、システムは、背景ノイズのスペクトルのピークを識別する。ステップ５０２において、抑制されるトーンピークが識別される。ステップ５０３において、トーンピークが抑制され、それにより信号におけるトーンピークの影響が低減される。

（トーンノイズのピークの検出）
トーンノイズに対処するために、一方法は、最初にトーンノイズのピークを識別することであるということが理解され得る。図６は、入力信号におけるピークを識別するために、システムによって使用される技術を例示する流れ図である。システムは、時間領域の信号を周波数領域の信号に変換する。周波数の分解能は、システム毎に変化し得る。システムの一部の実施形態において、システムのこの部分の周波数の分解能は、ビン当たり４３Ｈｚである。入力信号は、周波数のビンのそれぞれにおいて解析される。ステップ６０１において、考慮されている現在のビンに対する背景ノイズの概算値が獲得される。ステップ６０２において、現在の背景ノイズの概算値が、先のビン（現在のビンの直前に分析されたビン）に対する平滑化された背景ノイズと比較される。決定ブロック６０３において、現在の背景ノイズの概算値が、先のビンの平滑化された背景ノイズ以上であるかが決定される。そうである場合には、第１のアルゴリズムがステップ６０４において適用される。そうでない場合には、第２のアルゴリズムがステップ６０５において適用される。

図６の技術を実装する一方法は、トーンノイズのピークの位置および大きさを検出するための、非対称ＩＩＲ（無限インパルス応答）フィルタの適用である。

ステップ６０１において示されたように、ｎ番目のフレームおよびｋ番目の周波数のビンにおける背景ノイズの概算値Ｂ_ｎ（ｋ）が、概算される。このｋ番目のビンに対する平滑化された背景ノイズ

が、非対称ＩＩＲフィルタによって計算され得る。現在のビンの背景ノイズの概算値Ｂ_ｎ（ｋ）が、先のビンの平滑化された背景ノイズ

と比較される（ステップ６０２）。比較の結果に応じて、非対称ＩＩＲフィルタの異なる分枝が適用される。

のとき（ステップ６０３が真であるとき）には、次式が適用される。

（ステップ６０４）。

のとき（ステップ６０３が偽であるとき）には、次式が適用される。

（ステップ６０５）。

ここで、β_１およびβ_２は、０から１の範囲にある２つのパラメータである。β_１およびβ_２は、増減する適応速度を調節するために使用される。β_１以上になるようにβ_２を選択することによって、平滑化された背景ノイズは、ノイズの概算値にほぼしたがうが、トーンのピークがある場所が異なる。次に、平滑化された背景は、次のステップにおいてトーンノイズを除去するために使用される。同じフィルタが、前後の方向にノイズスペクトル全体に渡って走らされ、複数のパスに対しても走られ得るということに留意されたい。

（トーンノイズのピークを識別すること）
図７は、トーンピークの存在を決定する比技術（ｒａｔｉｏｔｅｃｈｎｉｑｕｅ）を例示する流れ図である。ステップ７０１において、現在のビンに対する平滑化された背景ノイズが計算される（これは、図６に記述されたように行われ得る）。ステップ７０２において、現在のビンの平滑化された背景ノイズが、現在のビンの背景ノイズの概算値と比較される。決定ブロック７０３において、比が１を大幅に上回るかどうかが決定される。そうである場合には、そのビンにおけるピークが、ステップ７０４において、トーンピークであるということが想定される。そうでない場合には、そのビンにおけるピークは、ステップ７０５において、一般的なノイズであることが想定される。

図７の技術を実装する一方法が、ここで記述される。平滑化されていない（Ｂ_ｎ（ｋ））背景ノイズと、平滑化された

（ステップ７０１）背景ノイズとの間の比が、

（ステップ７０２）によって与えられる。

通常、

の値は、約１（ステップ７０３は偽）であり、平滑化されていない背景ノイズが、平滑化された背景ノイズとほぼ等しく、従って一般的なノイズであるということを意味する（ステップ７０５）。しかしながら、背景にトーンノイズが存在するときには、

の大きな値が、異なる周波数において見つけられる（ステップ７０３は真である）。従って、大きな

がトーンノイズのインジケータとして使用される（ステップ７０４）。

システムは、どのビンがトーン効果によりノイズを有するかと、どのビンが一般的なノイズであると考えられるかとを追跡する。

（トーンノイズを除去する方法）
（非適応性）
処理を必要とするピークが決定されると、矯正動作が行われ得る。図８は、純粋な発話信号を概算する非適応性の技術を例示する流れ図である。ステップ８０１において、現在のビンにおける、ノイズを伴う発話信号のスペクトルの大きさが決定される。ステップ８０２において、抑制ゲインの値がスペクトルの大きさに適用される。ステップ８０３において、純粋は発話スペクトルの大きさの概算値が生成される。

図８のシステムは、以下のように実装され得る。標準的な適応性ノイズのモデルにおいて、ノイズを伴う発話は、
ｙ＝ｘ（ｔ）＋ｄ（ｔ）
によって与えられる。

ここで、ｘ（ｔ）とｄ（ｔ）とは、発話信号とノイズ信号とをそれぞれ示す。

ｎ番目のフレームとｋ番目の周波数のビンとにおいて、ノイズを伴う発話の短時間のスペクトルの大きさと、発話の短時間のスペクトルの大きさと、ノイズの短時間のスペクトルの大きさとをそれぞれ、

が示すようにする。ノイズを伴う発話スペクトルの大きさは分かり得る（ステップ８０１）が、ノイズの実際の値と、純粋な発話の実際の値とは、分からない。きれいになった発話信号を獲得することは、ノイズを伴う発話スペクトルの大きさの操作を必要とする。ノイズの低減プロセスは、各短時間のスペクトル値に対するスペクトルのゲイン値Ｇ_ｎ，ｋの適用（ステップ８０２）から成る。純粋な発話スペクトルの大きさの概算値は、

として獲得され得る（ステップ８０３）。

ここで、Ｇ_ｎ，ｋは、スペクトル抑制ゲインである。このゲインを計算する方法に関して、様々な方法が、文献に紹介されている。例としては、Ｅｐｈｒａｉｍ，Ｙ，；Ｍａｌａｈ，Ｄ．；ＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔＵｓｉｎｇＡＭｉｎｉｍｕｍ−ＭｅａｎＳｑｕａｒｅＥｒｒｏｒＳｈｏｒｔ−ＴｉｍｅＳｐｅｃｔｒａｌＡｍｐｌｉｔｕｄｅＥｓｔｉｍａｔｏｒ，ＩＥＥＥＴｒａｎｓ．ｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＶｏｌｕｍｅ３２，Ｉｓｓｕｅ６，１９８４年１２月，ページ：１１０９〜１１２１において提案された、決定に従う手法を含む。

（音楽のトーンノイズ）
スペクトル抑制方法に関する１つの問題は、音楽のトーンノイズの存在の可能性である。音楽のノイズを排除またはマスクするために、抑制ゲインがフロアされるべきである。
Ｇ_ｎ，ｋ＝ｍａｘ（σ，Ｇ_ｎ，ｋ）
ここで、σは、一定であり、０と１との間の値を有する。

上記のスペクトルのゲインに基づいたノイズ低減方法は、一般的な自動車のノイズに対しては良好な性能を有する。しかしながら、トーンノイズが背景にあるときには、これらの方法は、トーンノイズを抑制し得るだけであり、トーンノイズを排除し得ない。ここで図３を参照すると、従来技術のノイズの低減後の信号のＰＳＤが示されている。信号は、まだ、トーンノイズが存在する周波数においてピークを有する。従って、信号ノイズ全体が抑制されるが、トーンノイズは残る。

（適応性の方法）
トーンノイズを除去するために、一定のフロアσを使用する代わりに、システムは、可変フロアを使用し、該可変フロアは、各周波数のビンにおいて規定される。図９は、抑制ゲイン値を計算するための適応性係数の使用を例示する流れ図である。ステップ９０１において、平滑化された背景ノイズと、背景ノイズの概算値とが、現在の周波数帯域に対して決定される。

ステップ９０２において、平滑化された背景の値と、背景ノイズの概算値とが、比を生成するために使用される。この比が、ステップ９０３において、現在のビンに対して使用される適応性係数の値を計算するために使用される。ステップ９０４において、適応性係数は、現在のビンに対する抑制ゲインの値を生成するために使用される。このように、各周波数のビンは、変化する抑制ゲインのフロアを有しており、該変化する抑制ゲインのフロアは、そのビンにおける比の値に依存している。図のシステムの動作は、以下に記述される。

周波数のビンにおいて、背景ノイズＢ_ｎ（ｋ）を概算し、平滑化された背景ノイズ

を計算する（ステップ９０１）。上記の技術は、値を生成するために使用され得る。ステップ９０２において、上に記述されたように、比

を計算する。次に、これが、ステップ９０３において、適応性係数σを生成するために使用され、該適応性係数σは、現在の周波数のビンと関連付けられる。適応性係数は、

によって定義される。

次に、信号に適用されるトーンノイズの抑制ゲインが、

によって与えられる（ステップ９０４）。

（ランダム化技術）
スペクトルの大きさに対して上記の適応性抑制ゲインを適用することが、トーンノイズの除去の改善を達成する。しかしながら、いくつかのトーンノイズが背景に存在するときには、最初のノイズの位相を使用することが、処理された信号において、トーン音をまだ聞き取ることができるものにし得る。さらなる平滑化に関して、代替の技術は、ノイズを伴う最初の信号に適用される適応性抑制ゲインが、平滑化された背景ノイズを下回るときには必ず、最初の位相をランダム位相と取り替えることである。

図１０は、ランダム位相を使用する抑制技術を例示する流れ図である。ステップ１００１において、図９の適応性抑制を適用する。ステップ１００２において、（ノイズを伴う信号によって乗算された）結果を、現在の周波数のビンに対する平滑化された背景ノイズの値と比較する。決定ブロック１００３において、結果が平滑化された値を下回るかどうかを決定する。下回らない場合には、生成された結果が使用され得る。結果が平滑化された背景ノイズを下回る場合には、ステップ１００５において、最初の位相をランダム位相と交換する。ステップ１００２とステップ１００３とは、以下のように実装され得る：

の場合には、純粋な発話スペクトルの大きさの概算値が、

として取得され得る（ステップ１００１）。

複合的な純粋な発話の概算値が、

によって与えられる。

ここで、Ｒ_ｎ，ｋとＩ_ｎ，ｋとは、ゼロ平均と単位分散とを有する２つのガウス乱数である。

図４は、開示されたトーンノイズの低減方法によって処理されたトーンノイズのＰＳＤを例示する。見られ得るように、結果として生じた波形は、より少ないピークを有し、より平滑なプロフィールを有する。

モジュールおよびコンポーネントとして識別された機能ブロックを参照して、例示が考察されてきた。該モジュールおよびコンポーネントは、別々の構造を表すことを意図されておらず、組み合わせられたり、またはさらに分けられたりし得る。さらに、本発明の様々な実施形態が記述されてきたが、本発明の範囲内で他の実施形態および他の実装が可能であるということが当業者には明白である。従って、本発明は、添付の特許請求の範囲およびその均等物以外では制限されない。

図１は、一般的な自動車ノイズのＰＳＤである。図２は、トーンノイズのＰＳＤである。図３は、従来技術のノイズの低減後の、トーンノイズのＰＳＤである。図４は、開示されたトーンノイズの低減方法によって処理されたトーンノイズのＰＳＤを例示する。図５は、トーンノイズを識別し抑制する際のシステムの動作を例示する流れ図である。図６は、平滑化された背景ノイズを概算するために、システムによって使用される技術を例示する流れ図である。図７は、トーンピークの存在を決定する技術を例示する流れ図である。図８は、純粋な発話信号を概算する従来技術を例示する流れ図である。図９は、抑制ゲイン値を計算するための、適応性係数の使用を例示する流れ図である。図１０は、ランダム位相を使用する抑制技術を例示する流れ図である。

Claims

トーンノイズを識別する方法であって、
入力信号を複数の周波数のビンに変換することと、
各ビンにおいて、平滑化された背景ノイズと背景ノイズの概算値とを計算することと、
該各ビンにおいて、該平滑化された背景ノイズを該背景ノイズの概算値と比較することと、
該平滑化された背景ノイズに対する該背景ノイズの概算値の比が、閾値を上回るときには、トーンピークを有するとしてビンを識別することと
を包含する、方法。
比較する前記ステップは、同じビンの前記背景ノイズの概算値に対する前記平滑化された背景ノイズを含む、請求項１に記載の方法。
前記閾値は、１を上回る、請求項１に記載の方法。
現在のフレームｎに対する平滑化された背景ノイズを決定する前記ステップは、

のときに、

によって達成され、ここで、Ｂ_ｎ（ｋ）は、周波数のビンｋにおける現在のフレームｎの前記背景ノイズの概算値であり、

は、先のビンｋ−１の該平滑化された背景ノイズである、請求項２に記載の方法。
平滑化された背景ノイズを決定する前記ステップは、

のときには、

によって与えられる、請求項２に記載の方法。
β_１およびβ_２は、０から１の範囲にある２つのパラメータである、請求項４および請求項５に記載の方法。
比

は、

によって与えられる、請求項１に記載の方法。
信号からトーンノイズを除去する方法であって、
ｎ番目のフレームおよびｋ番目の周波数のビンにおいて、ノイズを伴う発話信号の短時間のスペクトルの大きさ

を決定することと、
概算された純粋な発話信号

を

によって生成することであって、ここで、

は、適応性抑制ゲイン値である、ことと
を包含する、方法。
は、

によって生成され、
ここで、σ_ｎ，ｋは、現在の周波数のビンに関する適応性ゲイン係数である、請求項８に記載の方法。
σ_ｎ，ｋは、

によって生成され、
ここで、σは、一定の係数であり、

は、ビンｋにおける、背景ノイズの概算値と平滑化された背景ノイズとの間の比である、請求項９に記載の方法。
であり、
ここで、Ｂ_ｎ（ｋ）は、周波数ｋにおける現在のフレームｎの前記背景ノイズの概算値であり、

は、同じビンの前記平滑化された背景ノイズである、請求項１０に記載の方法。
と比較するステップをさらに包含する、請求項１１に記載の方法。
のときに、

を受け入れるステップをさらに含む、請求項１２に記載の方法。
のときに、最初の位相をランダム位相と置き換えるステップをさらに含む、請求項１２に記載の方法。