JP2009031793A - 調整されたトーンノイズの低減を用いたノイズの低減 - Google Patents
調整されたトーンノイズの低減を用いたノイズの低減 Download PDFInfo
- Publication number
- JP2009031793A JP2009031793A JP2008186578A JP2008186578A JP2009031793A JP 2009031793 A JP2009031793 A JP 2009031793A JP 2008186578 A JP2008186578 A JP 2008186578A JP 2008186578 A JP2008186578 A JP 2008186578A JP 2009031793 A JP2009031793 A JP 2009031793A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- background noise
- bin
- tone
- smoothed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000009467 reduction Effects 0.000 title description 17
- 238000000034 method Methods 0.000 claims abstract description 70
- 230000001629 suppression Effects 0.000 claims description 25
- 238000001228 spectrum Methods 0.000 claims description 24
- 230000003044 adaptive effect Effects 0.000 claims description 16
- 238000010586 diagram Methods 0.000 description 12
- 230000003595 spectral effect Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02085—Periodic noise
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Noise Elimination (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
Abstract
【課題】ノイズ除去システムに対する改善を提供すること。
【解決手段】トーンノイズを識別する方法であって、入力信号を複数の周波数のビンに変換することと、各ビンにおいて、平滑化された背景ノイズと背景ノイズの概算値とを計算することと、該各ビンにおいて、該平滑化された背景ノイズを該背景ノイズの概算値と比較することと、該平滑化された背景ノイズに対する該背景ノイズの概算値の比が、閾値を上回るときには、トーンピークを有するとしてビンを識別することとを包含する、方法。
【選択図】図4
【解決手段】トーンノイズを識別する方法であって、入力信号を複数の周波数のビンに変換することと、各ビンにおいて、平滑化された背景ノイズと背景ノイズの概算値とを計算することと、該各ビンにおいて、該平滑化された背景ノイズを該背景ノイズの概算値と比較することと、該平滑化された背景ノイズに対する該背景ノイズの概算値の比が、閾値を上回るときには、トーンピークを有するとしてビンを識別することとを包含する、方法。
【選択図】図4
Description
(関連出願の引用)
本出願は、「Noise Reduction With Integrated Tonal Noise Reduction」と題される、2007年7月25日出願の米国仮特許出願第60/951,952号に対する優先権を主張するものであり、該米国仮特許出願は、本明細書において、その全体が参考として援用される。
本出願は、「Noise Reduction With Integrated Tonal Noise Reduction」と題される、2007年7月25日出願の米国仮特許出願第60/951,952号に対する優先権を主張するものであり、該米国仮特許出願は、本明細書において、その全体が参考として援用される。
(技術分野)
本システムは、音響処理の分野に関する。さらに詳細には、本システムは、発話または音楽の質を低下させることなく、トーンノイズを除去する方法を提供する。
本システムは、音響処理の分野に関する。さらに詳細には、本システムは、発話または音楽の質を低下させることなく、トーンノイズを除去する方法を提供する。
発話の増強は、多くの場合に、発話信号からのノイズの除去を含む。発話がスピーチプロセッサまたは聴取者によって認識され得るように、信号から異質なノイズを除去することによって発話信号を強化することが、困難な研究課題となっている。過去数十年に渡って、様々な手法が開発されてきた。それらの中で、スペクトルサブトラクション方法が、現在の用途において最も広く使用されている。この方法において、平均ノイズスペクトルが概算され、ノイズ信号スペクトルから減算され、それにより信号対ノイズ比(SNR)が改善される。
しかしながら、ノイズが「トーン」ノイズと呼ばれるタイプであるときには、従来技術の発話強化技術は、常に上手くいくわけではない。トーンノイズは、家庭、オフィス、自動車、および他の環境において生じ得る。家庭およびオフィスにおけるトーンノイズに関して多くの場合に引用されるソースは、蛍光灯のバズである。別のソースは、コンピュータまたはプロジェクタのファンのハムである。自動車において、トーンノイズは、ランブルストリップ、自動車のエンジン、オルタネータの泣き音、ラジオの干渉(「GSMバズ」)、または開いた窓からの鳴笛音(whistle)である。このトーンノイズは、電話の会話および発話の認識に悪影響を与え得、発話を理解または認識することをわずかばかり困難にする。
所望の信号の内容に対して入力信号を検査する発話処理システムは、トーンノイズを発話と解釈し得、トーンノイズを有する入力信号のセグメントを隔離し得、そして、トーンノイズを処理することを試み得る。発話処理システムは、セグメントを隔離するためだけでなく、セグメントを処理し、処理の結果に基づいた動作を行うためにも貴重な演算リソースを消費する。発話認識システムにおいては、システムは、トーンノイズをボイスコマンドとして解釈し、スプリアスコマンドを実行し、それに応答して、まったく意図されていない動作を行い得る。
トーンノイズは、音響周波数スペクトルに関して一定のピークとして現れる。当然、ピークは、より広い範囲から、多くの場合に、6dB〜20dBだけ突出する。ノイズの低減は、一般的には、全ての周波数を均等に減衰し、それにより残りのトーンノイズはより静かになるが、ノイズの低減前と全く同様にノイズの低減後も明瞭である。従って、既存のノイズ除去の手法は、より広範な背景ノイズに対してトーンノイズを低減することを本当に助けるわけではない。
本発明は、ノイズ除去システムに対する改善を詳述する。準定常トーンノイズは、通常では広帯域ノイズまたは散乱ノイズのスペクトルにおけるピークとして現れる。ノイズの低減は、一般的には、全ての周波数を均等に減衰し、それによりトーンノイズはより静かになるが、ノイズの低減後もノイズの低減前と全く同様に明瞭である。システムは、ピークを識別し、どのピークがトーンピークでありそうかを決定し、トーンノイズに適応性の抑制を適用する。システムは、トーンノイズの低減(TNR)の技術を使用しており、トーンノイズの低減(TNR)は、トーンノイズが見つかった周波数をより大きく減衰する。TNRシステムは、追加的な処理(位相ランダム化)を行なうことにより、あらゆる残余のトーン音を事実上排除し得る。このシステムは、単純な一連の受動的なノッチフィルタではなく、従って、周波数が重なる発話または音楽を除去しない。さらに、システムは適応性であり、トーンノイズが存在しない場合には、追加的なフィルタリングを全く行なわない。
本発明はさらに以下の手段を提供する。
(項目1)
トーンノイズを識別する方法であって、
入力信号を複数の周波数のビンに変換することと、
各ビンにおいて、平滑化された背景ノイズと背景ノイズの概算値とを計算することと、
該各ビンにおいて、該平滑化された背景ノイズを該背景ノイズの概算値と比較することと、
該平滑化された背景ノイズに対する該背景ノイズの概算値の比が、閾値を上回るときには、トーンピークを有するとしてビンを識別することと
を包含する、方法。
トーンノイズを識別する方法であって、
入力信号を複数の周波数のビンに変換することと、
各ビンにおいて、平滑化された背景ノイズと背景ノイズの概算値とを計算することと、
該各ビンにおいて、該平滑化された背景ノイズを該背景ノイズの概算値と比較することと、
該平滑化された背景ノイズに対する該背景ノイズの概算値の比が、閾値を上回るときには、トーンピークを有するとしてビンを識別することと
を包含する、方法。
(項目2)
比較する上記ステップは、同じビンの上記背景ノイズの概算値に対する上記平滑化された背景ノイズを含む、項目1に記載の方法。
比較する上記ステップは、同じビンの上記背景ノイズの概算値に対する上記平滑化された背景ノイズを含む、項目1に記載の方法。
(項目3)
上記閾値は、1を上回る、項目1に記載の方法。
上記閾値は、1を上回る、項目1に記載の方法。
(項目4)
現在のフレームnに対する平滑化された背景ノイズを決定する上記ステップは、
現在のフレームnに対する平滑化された背景ノイズを決定する上記ステップは、
(項目5)
平滑化された背景ノイズを決定する上記ステップは、
平滑化された背景ノイズを決定する上記ステップは、
(項目6)
β1およびβ2は、0から1の範囲にある2つのパラメータである、項目4および項目5に記載の方法。
β1およびβ2は、0から1の範囲にある2つのパラメータである、項目4および項目5に記載の方法。
(項目7)
比
比
(項目8)
信号からトーンノイズを除去する方法であって、
n番目のフレームおよびk番目の周波数のビンにおいて、ノイズを伴う発話信号の短時間のスペクトルの大きさ
信号からトーンノイズを除去する方法であって、
n番目のフレームおよびk番目の周波数のビンにおいて、ノイズを伴う発話信号の短時間のスペクトルの大きさ
(項目9)
(項目10)
σn,kは、
σn,kは、
(項目11)
(項目12)
(項目13)
(項目14)
(摘要)
システムは、入力信号におけるトーンノイズを抑制または排除する技術を提供する。システムは、複数の周波数のビンにおいて入力信号を処理し、次のビンにおける値を計算することを補助するために、先のビンにおいて生成された情報を使用する。システムは、最初に、信号におけるピークを識別し、次に、ピークがトーン効果によるものであるかを決定する。これは、現在のビンの概算された背景ノイズを、同じビンの平滑化された背景ノイズと比較することによって行なわれる。平滑化された背景ノイズは、非対称IIRフィルタを使用して計算され得る。現在計算された平滑化された背景ノイズに対する、現在の背景ノイズの概算値の比が、1を大幅に上回るときには、トーンノイズが想定される。トーンノイズが発見されたときには、多数の抑制技術が適用されることにより、トーンノイズが低減され得る。該多数の抑制技術は、固定のフロア係数を用いたゲイン抑制、適応性フロア係数のゲイン抑制技術、およびランダム位相技術を含む。
システムは、入力信号におけるトーンノイズを抑制または排除する技術を提供する。システムは、複数の周波数のビンにおいて入力信号を処理し、次のビンにおける値を計算することを補助するために、先のビンにおいて生成された情報を使用する。システムは、最初に、信号におけるピークを識別し、次に、ピークがトーン効果によるものであるかを決定する。これは、現在のビンの概算された背景ノイズを、同じビンの平滑化された背景ノイズと比較することによって行なわれる。平滑化された背景ノイズは、非対称IIRフィルタを使用して計算され得る。現在計算された平滑化された背景ノイズに対する、現在の背景ノイズの概算値の比が、1を大幅に上回るときには、トーンノイズが想定される。トーンノイズが発見されたときには、多数の抑制技術が適用されることにより、トーンノイズが低減され得る。該多数の抑制技術は、固定のフロア係数を用いたゲイン抑制、適応性フロア係数のゲイン抑制技術、およびランダム位相技術を含む。
本発明は、以下の図面と記述とを参照して、より良く理解され得る。図面内のコンポーネントは、必ずしもサイズに比例しておらず、その代わりに、本発明の原理を例示することに重きを置いている。さらに、図面においては、同様な参照番号は、異なる図面全体を通して、対応する部分を示している。
一般的な周波数領域の発話強化システムは、通常、スペクトル抑制ゲインの計算方法と、背景ノイズのパワースペクトル密度(PSD)の概算方法とから成る。スペクトル抑制は充分に理解されているが、PSDノイズ概算は、歴史的にはあまり注目されなかった。しかしながら、近年、PSDノイズ概算は、システム全体の質および明瞭性にとって非常に重要であることが分かった。背景ノイズが、時の経過によって変化がないか、またはほとんど変化がないときには、大部分のスペクトル抑制方法は、良好な質を達成し得る。トーンノイズが背景に存在するときには、従来のスペクトル抑制方法が、トーンノイズを抑制し得るが、トーンノイズを排除し得ない。残余のトーンノイズは明瞭であり、人間の耳を不快にし得る。このシステムは、発話の質を低下させることなく、完全にトーンノイズを除去する原理と技術とを提供する。
システムのトーンノイズ低減(TNR)は、ピークが散乱ノイズを上回る程度まで、ピーク周波数をより大きく減衰する。例えば、周囲の周波数におけるノイズよりも10dB上回るピークが、ノイズの概算値に見られた場合には、余分に10dBのノイズの減衰が、その周波数に行われる。このようにして、TNR後のスペクトルの形状は、隣接する周波数全体に渡って平滑になり、トーンノイズがかなり低減される。
任意の所与の周波数において、発話がノイズよりも12dB上回るときには、ノイズの寄与は些細なものと考えられ得る。従って、信号が、トーンノイズなどのノイズよりもかなり高いときには、TNRを用いるNR、またはTNRを用いないNRは、目立った影響を全く有するべきではなく、そして全く有していない。より低いSNR信号は、トーンピークの付近でより大きく減衰され、トーンノイズのピークと等しい信号は、結果として生じるスペクトルがピーク周波数の付近で平坦になるように減衰される(ピーク周波数の大きさは、隣接した周波数におけるノイズの大きさと等しい)。
(トーンノイズの位相をそのままにしておきながら)トーンノイズの出力を低減させることは、トーンの音を完全に除去しないことがあり得る。なぜならば、所与の周波数における位相が、まだ、トーンの知覚に寄与するからである。一方法において、信号がトーンノイズに近い場合には、その周波数のビンにおける位相がランダム化され得る。これが、その周波数におけるトーンを完全に除去する利益を有する。システムは、音質の改善と、聴取者の疲労の軽減と、発話認識の改善とを提供する。
本発明の他のシステム、方法、特徴および利点は、以下の図面および詳細な記述を考察すると、当業者には明らかであるか、または当業者に明らかになる。全てのかかる追加のシステム、方法、特徴および利点は、この記述の範囲内に含まれ、本発明の範囲内にあり、そして添付の特許請求の範囲によって保護されるということが意図されている。
(トーンノイズを検出する方法)
一般的な自動車のノイズは散乱ノイズである。周波数が増加したときに、散乱ノイズの出力密度は平滑に減少する。一般的な自動車のノイズのスペクトログラムは、スペクトログラム全体に渡って、比較的平滑であり、かつ、やや均一な分布を示す。対照的に、トーンノイズは、通常、一定の周波数だけに及び、比較的長い期間の間持続する。トーンノイズのスペクトログラムは、非常に不均一な分布を示す。
一般的な自動車のノイズは散乱ノイズである。周波数が増加したときに、散乱ノイズの出力密度は平滑に減少する。一般的な自動車のノイズのスペクトログラムは、スペクトログラム全体に渡って、比較的平滑であり、かつ、やや均一な分布を示す。対照的に、トーンノイズは、通常、一定の周波数だけに及び、比較的長い期間の間持続する。トーンノイズのスペクトログラムは、非常に不均一な分布を示す。
一般的な自動車のノイズのPSDが図1に例示されている。グラフは、信号の出力が周波数によってどのように分布されるかを示す。見られ得るように、一般的な道路のノイズは、より低い周波数においてより多くの出力を有し、周波数と共に出力が実質的に低減し、それにより、より高い周波数において、信号の出力は比較的小さい。対照的に、図2に例示されたトーンノイズのPSDは、出力が様々な周波数における多数のピークに分布されるということを示す。図2のトーンノイズ信号のPSDは、一般的な道路のノイズよりも非常に多く「ピークを成している」。
妥当な周波数分解能を有する、ほとんどの従来的なノイズ追跡アルゴリズムは、背景におけるトーンノイズを追跡し得る。トーンノイズは、通常、ノイズスペクトルにおいて、図2における多数の周波数で例示されたように、隣のピークをかなり上回って立ち上がるピークとして示す。
図5は、トーンノイズを識別および抑制する際の、システムの動作を例示する流れ図である。ステップ501において、システムは、背景ノイズのスペクトルのピークを識別する。ステップ502において、抑制されるトーンピークが識別される。ステップ503において、トーンピークが抑制され、それにより信号におけるトーンピークの影響が低減される。
(トーンノイズのピークの検出)
トーンノイズに対処するために、一方法は、最初にトーンノイズのピークを識別することであるということが理解され得る。図6は、入力信号におけるピークを識別するために、システムによって使用される技術を例示する流れ図である。システムは、時間領域の信号を周波数領域の信号に変換する。周波数の分解能は、システム毎に変化し得る。システムの一部の実施形態において、システムのこの部分の周波数の分解能は、ビン当たり43Hzである。入力信号は、周波数のビンのそれぞれにおいて解析される。ステップ601において、考慮されている現在のビンに対する背景ノイズの概算値が獲得される。ステップ602において、現在の背景ノイズの概算値が、先のビン(現在のビンの直前に分析されたビン)に対する平滑化された背景ノイズと比較される。決定ブロック603において、現在の背景ノイズの概算値が、先のビンの平滑化された背景ノイズ以上であるかが決定される。そうである場合には、第1のアルゴリズムがステップ604において適用される。そうでない場合には、第2のアルゴリズムがステップ605において適用される。
トーンノイズに対処するために、一方法は、最初にトーンノイズのピークを識別することであるということが理解され得る。図6は、入力信号におけるピークを識別するために、システムによって使用される技術を例示する流れ図である。システムは、時間領域の信号を周波数領域の信号に変換する。周波数の分解能は、システム毎に変化し得る。システムの一部の実施形態において、システムのこの部分の周波数の分解能は、ビン当たり43Hzである。入力信号は、周波数のビンのそれぞれにおいて解析される。ステップ601において、考慮されている現在のビンに対する背景ノイズの概算値が獲得される。ステップ602において、現在の背景ノイズの概算値が、先のビン(現在のビンの直前に分析されたビン)に対する平滑化された背景ノイズと比較される。決定ブロック603において、現在の背景ノイズの概算値が、先のビンの平滑化された背景ノイズ以上であるかが決定される。そうである場合には、第1のアルゴリズムがステップ604において適用される。そうでない場合には、第2のアルゴリズムがステップ605において適用される。
図6の技術を実装する一方法は、トーンノイズのピークの位置および大きさを検出するための、非対称IIR(無限インパルス応答)フィルタの適用である。
ステップ601において示されたように、n番目のフレームおよびk番目の周波数のビンにおける背景ノイズの概算値Bn(k)が、概算される。このk番目のビンに対する平滑化された背景ノイズ
ここで、β1およびβ2は、0から1の範囲にある2つのパラメータである。β1およびβ2は、増減する適応速度を調節するために使用される。β1以上になるようにβ2を選択することによって、平滑化された背景ノイズは、ノイズの概算値にほぼしたがうが、トーンのピークがある場所が異なる。次に、平滑化された背景は、次のステップにおいてトーンノイズを除去するために使用される。同じフィルタが、前後の方向にノイズスペクトル全体に渡って走らされ、複数のパスに対しても走られ得るということに留意されたい。
(トーンノイズのピークを識別すること)
図7は、トーンピークの存在を決定する比技術(ratio technique)を例示する流れ図である。ステップ701において、現在のビンに対する平滑化された背景ノイズが計算される(これは、図6に記述されたように行われ得る)。ステップ702において、現在のビンの平滑化された背景ノイズが、現在のビンの背景ノイズの概算値と比較される。決定ブロック703において、比が1を大幅に上回るかどうかが決定される。そうである場合には、そのビンにおけるピークが、ステップ704において、トーンピークであるということが想定される。そうでない場合には、そのビンにおけるピークは、ステップ705において、一般的なノイズであることが想定される。
図7は、トーンピークの存在を決定する比技術(ratio technique)を例示する流れ図である。ステップ701において、現在のビンに対する平滑化された背景ノイズが計算される(これは、図6に記述されたように行われ得る)。ステップ702において、現在のビンの平滑化された背景ノイズが、現在のビンの背景ノイズの概算値と比較される。決定ブロック703において、比が1を大幅に上回るかどうかが決定される。そうである場合には、そのビンにおけるピークが、ステップ704において、トーンピークであるということが想定される。そうでない場合には、そのビンにおけるピークは、ステップ705において、一般的なノイズであることが想定される。
図7の技術を実装する一方法が、ここで記述される。平滑化されていない(Bn(k))背景ノイズと、平滑化された
通常、
システムは、どのビンがトーン効果によりノイズを有するかと、どのビンが一般的なノイズであると考えられるかとを追跡する。
(トーンノイズを除去する方法)
(非適応性)
処理を必要とするピークが決定されると、矯正動作が行われ得る。図8は、純粋な発話信号を概算する非適応性の技術を例示する流れ図である。ステップ801において、現在のビンにおける、ノイズを伴う発話信号のスペクトルの大きさが決定される。ステップ802において、抑制ゲインの値がスペクトルの大きさに適用される。ステップ803において、純粋は発話スペクトルの大きさの概算値が生成される。
(非適応性)
処理を必要とするピークが決定されると、矯正動作が行われ得る。図8は、純粋な発話信号を概算する非適応性の技術を例示する流れ図である。ステップ801において、現在のビンにおける、ノイズを伴う発話信号のスペクトルの大きさが決定される。ステップ802において、抑制ゲインの値がスペクトルの大きさに適用される。ステップ803において、純粋は発話スペクトルの大きさの概算値が生成される。
図8のシステムは、以下のように実装され得る。標準的な適応性ノイズのモデルにおいて、ノイズを伴う発話は、
y=x(t)+d(t)
によって与えられる。
y=x(t)+d(t)
によって与えられる。
ここで、x(t)とd(t)とは、発話信号とノイズ信号とをそれぞれ示す。
n番目のフレームとk番目の周波数のビンとにおいて、ノイズを伴う発話の短時間のスペクトルの大きさと、発話の短時間のスペクトルの大きさと、ノイズの短時間のスペクトルの大きさとをそれぞれ、
ここで、Gn,kは、スペクトル抑制ゲインである。このゲインを計算する方法に関して、様々な方法が、文献に紹介されている。例としては、Ephraim,Y,;Malah,D.;Speech Enhancement Using A Minimum−Mean Square Error Short−Time Spectral Amplitude Estimator,IEEE Trans. on Acoustics,Speech,and Signal Processing Volume 32, Issue 6, 1984年12月,ページ:1109〜1121において提案された、決定に従う手法を含む。
(音楽のトーンノイズ)
スペクトル抑制方法に関する1つの問題は、音楽のトーンノイズの存在の可能性である。音楽のノイズを排除またはマスクするために、抑制ゲインがフロアされるべきである。
Gn,k=max(σ,Gn,k)
ここで、σは、一定であり、0と1との間の値を有する。
スペクトル抑制方法に関する1つの問題は、音楽のトーンノイズの存在の可能性である。音楽のノイズを排除またはマスクするために、抑制ゲインがフロアされるべきである。
Gn,k=max(σ,Gn,k)
ここで、σは、一定であり、0と1との間の値を有する。
上記のスペクトルのゲインに基づいたノイズ低減方法は、一般的な自動車のノイズに対しては良好な性能を有する。しかしながら、トーンノイズが背景にあるときには、これらの方法は、トーンノイズを抑制し得るだけであり、トーンノイズを排除し得ない。ここで図3を参照すると、従来技術のノイズの低減後の信号のPSDが示されている。信号は、まだ、トーンノイズが存在する周波数においてピークを有する。従って、信号ノイズ全体が抑制されるが、トーンノイズは残る。
(適応性の方法)
トーンノイズを除去するために、一定のフロアσを使用する代わりに、システムは、可変フロアを使用し、該可変フロアは、各周波数のビンにおいて規定される。図9は、抑制ゲイン値を計算するための適応性係数の使用を例示する流れ図である。ステップ901において、平滑化された背景ノイズと、背景ノイズの概算値とが、現在の周波数帯域に対して決定される。
トーンノイズを除去するために、一定のフロアσを使用する代わりに、システムは、可変フロアを使用し、該可変フロアは、各周波数のビンにおいて規定される。図9は、抑制ゲイン値を計算するための適応性係数の使用を例示する流れ図である。ステップ901において、平滑化された背景ノイズと、背景ノイズの概算値とが、現在の周波数帯域に対して決定される。
ステップ902において、平滑化された背景の値と、背景ノイズの概算値とが、比を生成するために使用される。この比が、ステップ903において、現在のビンに対して使用される適応性係数の値を計算するために使用される。ステップ904において、適応性係数は、現在のビンに対する抑制ゲインの値を生成するために使用される。このように、各周波数のビンは、変化する抑制ゲインのフロアを有しており、該変化する抑制ゲインのフロアは、そのビンにおける比の値に依存している。図のシステムの動作は、以下に記述される。
周波数のビンにおいて、背景ノイズBn(k)を概算し、平滑化された背景ノイズ
次に、信号に適用されるトーンノイズの抑制ゲインが、
(ランダム化技術)
スペクトルの大きさに対して上記の適応性抑制ゲインを適用することが、トーンノイズの除去の改善を達成する。しかしながら、いくつかのトーンノイズが背景に存在するときには、最初のノイズの位相を使用することが、処理された信号において、トーン音をまだ聞き取ることができるものにし得る。さらなる平滑化に関して、代替の技術は、ノイズを伴う最初の信号に適用される適応性抑制ゲインが、平滑化された背景ノイズを下回るときには必ず、最初の位相をランダム位相と取り替えることである。
スペクトルの大きさに対して上記の適応性抑制ゲインを適用することが、トーンノイズの除去の改善を達成する。しかしながら、いくつかのトーンノイズが背景に存在するときには、最初のノイズの位相を使用することが、処理された信号において、トーン音をまだ聞き取ることができるものにし得る。さらなる平滑化に関して、代替の技術は、ノイズを伴う最初の信号に適用される適応性抑制ゲインが、平滑化された背景ノイズを下回るときには必ず、最初の位相をランダム位相と取り替えることである。
図10は、ランダム位相を使用する抑制技術を例示する流れ図である。ステップ1001において、図9の適応性抑制を適用する。ステップ1002において、(ノイズを伴う信号によって乗算された)結果を、現在の周波数のビンに対する平滑化された背景ノイズの値と比較する。決定ブロック1003において、結果が平滑化された値を下回るかどうかを決定する。下回らない場合には、生成された結果が使用され得る。結果が平滑化された背景ノイズを下回る場合には、ステップ1005において、最初の位相をランダム位相と交換する。ステップ1002とステップ1003とは、以下のように実装され得る:
複合的な純粋な発話の概算値が、
ここで、Rn,kとIn,kとは、ゼロ平均と単位分散とを有する2つのガウス乱数である。
図4は、開示されたトーンノイズの低減方法によって処理されたトーンノイズのPSDを例示する。見られ得るように、結果として生じた波形は、より少ないピークを有し、より平滑なプロフィールを有する。
モジュールおよびコンポーネントとして識別された機能ブロックを参照して、例示が考察されてきた。該モジュールおよびコンポーネントは、別々の構造を表すことを意図されておらず、組み合わせられたり、またはさらに分けられたりし得る。さらに、本発明の様々な実施形態が記述されてきたが、本発明の範囲内で他の実施形態および他の実装が可能であるということが当業者には明白である。従って、本発明は、添付の特許請求の範囲およびその均等物以外では制限されない。
Claims (14)
- トーンノイズを識別する方法であって、
入力信号を複数の周波数のビンに変換することと、
各ビンにおいて、平滑化された背景ノイズと背景ノイズの概算値とを計算することと、
該各ビンにおいて、該平滑化された背景ノイズを該背景ノイズの概算値と比較することと、
該平滑化された背景ノイズに対する該背景ノイズの概算値の比が、閾値を上回るときには、トーンピークを有するとしてビンを識別することと
を包含する、方法。 - 比較する前記ステップは、同じビンの前記背景ノイズの概算値に対する前記平滑化された背景ノイズを含む、請求項1に記載の方法。
- 前記閾値は、1を上回る、請求項1に記載の方法。
- β1およびβ2は、0から1の範囲にある2つのパラメータである、請求項4および請求項5に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US95192207P | 2007-07-25 | 2007-07-25 | |
US11/961,715 US8489396B2 (en) | 2007-07-25 | 2007-12-20 | Noise reduction with integrated tonal noise reduction |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009031793A true JP2009031793A (ja) | 2009-02-12 |
Family
ID=39712585
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008186578A Pending JP2009031793A (ja) | 2007-07-25 | 2008-07-17 | 調整されたトーンノイズの低減を用いたノイズの低減 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8489396B2 (ja) |
EP (1) | EP2023342A1 (ja) |
JP (1) | JP2009031793A (ja) |
KR (1) | KR20090012154A (ja) |
CA (1) | CA2638265C (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011522294A (ja) * | 2008-05-29 | 2011-07-28 | クゥアルコム・インコーポレイテッド | スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品 |
US8538749B2 (en) | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
US9202456B2 (en) | 2009-04-23 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2347556B1 (en) * | 2008-09-19 | 2012-04-04 | Dolby Laboratories Licensing Corporation | Upstream signal processing for client devices in a small-cell wireless network |
JP5141542B2 (ja) * | 2008-12-24 | 2013-02-13 | 富士通株式会社 | 雑音検出装置及び雑音検出方法 |
CN101986386B (zh) * | 2009-07-29 | 2012-09-26 | 比亚迪股份有限公司 | 一种语音背景噪声的消除方法和装置 |
JP5383828B2 (ja) * | 2009-12-25 | 2014-01-08 | 三菱電機株式会社 | 雑音除去装置及び雑音除去プログラム |
JP5738020B2 (ja) * | 2010-03-11 | 2015-06-17 | 本田技研工業株式会社 | 音声認識装置及び音声認識方法 |
CN102314883B (zh) * | 2010-06-30 | 2013-08-21 | 比亚迪股份有限公司 | 一种判断音乐噪声的方法以及语音消噪方法 |
JP5566846B2 (ja) * | 2010-10-15 | 2014-08-06 | 本田技研工業株式会社 | ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法 |
US8818806B2 (en) * | 2010-11-30 | 2014-08-26 | JVC Kenwood Corporation | Speech processing apparatus and speech processing method |
WO2013125257A1 (ja) * | 2012-02-20 | 2013-08-29 | 株式会社Jvcケンウッド | 雑音信号抑制装置、雑音信号抑制方法、特殊信号検出装置、特殊信号検出方法、報知音検出装置、および、報知音検出方法 |
JP6054142B2 (ja) * | 2012-10-31 | 2016-12-27 | 株式会社東芝 | 信号処理装置、方法およびプログラム |
WO2014202770A1 (en) | 2013-06-21 | 2014-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals |
MY181026A (en) | 2013-06-21 | 2020-12-16 | Fraunhofer Ges Forschung | Apparatus and method realizing improved concepts for tcx ltp |
CN110265059B (zh) * | 2013-12-19 | 2023-03-31 | 瑞典爱立信有限公司 | 估计音频信号中的背景噪声 |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
WO2015170140A1 (en) * | 2014-05-06 | 2015-11-12 | Advanced Bionics Ag | Systems and methods for cancelling tonal noise in a cochlear implant system |
RU2713852C2 (ru) | 2014-07-29 | 2020-02-07 | Телефонактиеболагет Лм Эрикссон (Пабл) | Оценивание фонового шума в аудиосигналах |
KR102277952B1 (ko) * | 2019-01-11 | 2021-07-19 | 브레인소프트주식회사 | 디제이 변환에 의한 주파수 추출 방법 |
KR102382208B1 (ko) * | 2020-07-21 | 2022-04-04 | 브레인소프트주식회사 | 복합음을 구성하는 순음의 추출 방법 |
EP4189679A1 (en) * | 2020-07-30 | 2023-06-07 | Dolby International AB | Hum noise detection and removal for speech and music recordings |
CN114076681B (zh) * | 2020-08-20 | 2024-07-05 | 上海汽车集团股份有限公司 | 一种啸叫噪声评价方法和相关装置 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1796078U (de) * | 1957-01-30 | 1959-09-17 | Bosch Gmbh Robert | Zahnradpumpe. |
DE69124005T2 (de) * | 1990-05-28 | 1997-07-31 | Matsushita Electric Ind Co Ltd | Sprachsignalverarbeitungsvorrichtung |
US5485522A (en) * | 1993-09-29 | 1996-01-16 | Ericsson Ge Mobile Communications, Inc. | System for adaptively reducing noise in speech signals |
JP3604393B2 (ja) * | 1994-07-18 | 2004-12-22 | 松下電器産業株式会社 | 音声検出装置 |
US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
US5950154A (en) * | 1996-07-15 | 1999-09-07 | At&T Corp. | Method and apparatus for measuring the noise content of transmitted speech |
DE69708693C5 (de) * | 1996-11-07 | 2021-10-28 | Godo Kaisha Ip Bridge 1 | Verfahren und Vorrichtung für CELP Sprachcodierung oder -decodierung |
US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
US6519559B1 (en) * | 1999-07-29 | 2003-02-11 | Intel Corporation | Apparatus and method for the enhancement of signals |
US6910011B1 (en) * | 1999-08-16 | 2005-06-21 | Haman Becker Automotive Systems - Wavemakers, Inc. | Noisy acoustic signal enhancement |
US6111183A (en) * | 1999-09-07 | 2000-08-29 | Lindemann; Eric | Audio signal synthesis system based on probabilistic estimation of time-varying spectra |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
US6674865B1 (en) * | 2000-10-19 | 2004-01-06 | Lear Corporation | Automatic volume control for communication system |
GB2375028B (en) * | 2001-04-24 | 2003-05-28 | Motorola Inc | Processing speech signals |
US7272234B2 (en) * | 2002-04-04 | 2007-09-18 | Brigham Young University | Multi-channel active control system and method for the reduction of tonal noise from an axial fan |
US7277537B2 (en) * | 2003-09-02 | 2007-10-02 | Texas Instruments Incorporated | Tone, modulated tone, and saturated tone detection in a voice activity detection device |
US20050091049A1 (en) * | 2003-10-28 | 2005-04-28 | Rongzhen Yang | Method and apparatus for reduction of musical noise during speech enhancement |
JP4520732B2 (ja) * | 2003-12-03 | 2010-08-11 | 富士通株式会社 | 雑音低減装置、および低減方法 |
US7725314B2 (en) * | 2004-02-16 | 2010-05-25 | Microsoft Corporation | Method and apparatus for constructing a speech filter using estimates of clean speech and noise |
US20060018457A1 (en) * | 2004-06-25 | 2006-01-26 | Takahiro Unno | Voice activity detectors and methods |
US20050288923A1 (en) * | 2004-06-25 | 2005-12-29 | The Hong Kong University Of Science And Technology | Speech enhancement by noise masking |
US7917356B2 (en) * | 2004-09-16 | 2011-03-29 | At&T Corporation | Operating method for voice activity detection/silence suppression system |
US7716046B2 (en) * | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
EP1806739B1 (en) * | 2004-10-28 | 2012-08-15 | Fujitsu Ltd. | Noise suppressor |
EP1703494A1 (en) | 2005-03-17 | 2006-09-20 | Emma Mixed Signal C.V. | Listening device |
EP1708370A3 (en) * | 2005-03-28 | 2009-05-20 | Pioneer Corporation | Noise removal device |
US8520861B2 (en) * | 2005-05-17 | 2013-08-27 | Qnx Software Systems Limited | Signal processing system for tonal noise robustness |
GB2429139B (en) * | 2005-08-10 | 2010-06-16 | Zarlink Semiconductor Inc | A low complexity noise reduction method |
US7912567B2 (en) * | 2007-03-07 | 2011-03-22 | Audiocodes Ltd. | Noise suppressor |
-
2007
- 2007-12-20 US US11/961,715 patent/US8489396B2/en active Active
-
2008
- 2008-07-16 EP EP08012861A patent/EP2023342A1/en not_active Withdrawn
- 2008-07-17 JP JP2008186578A patent/JP2009031793A/ja active Pending
- 2008-07-23 CA CA2638265A patent/CA2638265C/en active Active
- 2008-07-25 KR KR1020080072811A patent/KR20090012154A/ko not_active Application Discontinuation
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011522294A (ja) * | 2008-05-29 | 2011-07-28 | クゥアルコム・インコーポレイテッド | スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品 |
US8831936B2 (en) | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
US8538749B2 (en) | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
US9202456B2 (en) | 2009-04-23 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation |
US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
Also Published As
Publication number | Publication date |
---|---|
US20080167870A1 (en) | 2008-07-10 |
EP2023342A1 (en) | 2009-02-11 |
CA2638265A1 (en) | 2009-01-25 |
CA2638265C (en) | 2013-06-18 |
KR20090012154A (ko) | 2009-02-02 |
US8489396B2 (en) | 2013-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009031793A (ja) | 調整されたトーンノイズの低減を用いたノイズの低減 | |
JP5275748B2 (ja) | 動的ノイズ低減 | |
US8073689B2 (en) | Repetitive transient noise removal | |
US7133825B2 (en) | Computationally efficient background noise suppressor for speech coding and speech recognition | |
US8612222B2 (en) | Signature noise removal | |
US8352257B2 (en) | Spectro-temporal varying approach for speech enhancement | |
US9584087B2 (en) | Post-processing gains for signal enhancement | |
KR100789084B1 (ko) | 웨이블릿 패킷 영역에서 비선형 구조의 과중 이득에 의한음질 개선 방법 | |
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
JP2004254322A (ja) | ウィンドノイズを抑制するシステム | |
US8326621B2 (en) | Repetitive transient noise removal | |
JP2008537185A (ja) | オーディオ雑音を減少させるシステムおよび方法 | |
JP2007306546A (ja) | 時変拡声器−部屋−マイクロホンシステムにおけるエコー減少 | |
US7885810B1 (en) | Acoustic signal enhancement method and apparatus | |
US8199928B2 (en) | System for processing an acoustic input signal to provide an output signal with reduced noise | |
Nongpiur | Impulse noise removal in speech using wavelets | |
JP6857344B2 (ja) | オーディオ信号を処理するための装置および方法 | |
Shajeesh et al. | Speech enhancement based on Savitzky-Golay smoothing filter | |
Yektaeian et al. | Comparison of spectral subtraction methods used in noise suppression algorithms | |
KR101993003B1 (ko) | 잡음 제거 장치 및 방법 | |
JP5316127B2 (ja) | 音処理装置およびプログラム | |
Ma et al. | A perceptual kalman filtering-based approach for speech enhancement | |
Alam et al. | Speech enhancement based on a hybrid a priori signal-to-noise ratio (SNR) estimator and a self-adaptive Lagrange multiplier | |
Alam et al. | Speech enhancement using a wiener denoising technique and musical noise reduction. | |
Zhao et al. | Reverberant speech enhancement by spectral processing with reward-punishment weights |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110621 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111115 |