JP2009031793A - 調整されたトーンノイズの低減を用いたノイズの低減 - Google Patents

調整されたトーンノイズの低減を用いたノイズの低減 Download PDF

Info

Publication number
JP2009031793A
JP2009031793A JP2008186578A JP2008186578A JP2009031793A JP 2009031793 A JP2009031793 A JP 2009031793A JP 2008186578 A JP2008186578 A JP 2008186578A JP 2008186578 A JP2008186578 A JP 2008186578A JP 2009031793 A JP2009031793 A JP 2009031793A
Authority
JP
Japan
Prior art keywords
noise
background noise
bin
tone
smoothed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008186578A
Other languages
English (en)
Inventor
Phil A Hetherington
エー. ヘザーリントン フィル
Xueman Li
リー シュエマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
QNX Software Systems Wavemakers Inc
Original Assignee
QNX Software Systems Wavemakers Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by QNX Software Systems Wavemakers Inc filed Critical QNX Software Systems Wavemakers Inc
Publication of JP2009031793A publication Critical patent/JP2009031793A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02085Periodic noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)

Abstract

【課題】ノイズ除去システムに対する改善を提供すること。
【解決手段】トーンノイズを識別する方法であって、入力信号を複数の周波数のビンに変換することと、各ビンにおいて、平滑化された背景ノイズと背景ノイズの概算値とを計算することと、該各ビンにおいて、該平滑化された背景ノイズを該背景ノイズの概算値と比較することと、該平滑化された背景ノイズに対する該背景ノイズの概算値の比が、閾値を上回るときには、トーンピークを有するとしてビンを識別することとを包含する、方法。
【選択図】図4

Description

(関連出願の引用)
本出願は、「Noise Reduction With Integrated Tonal Noise Reduction」と題される、2007年7月25日出願の米国仮特許出願第60/951,952号に対する優先権を主張するものであり、該米国仮特許出願は、本明細書において、その全体が参考として援用される。
(技術分野)
本システムは、音響処理の分野に関する。さらに詳細には、本システムは、発話または音楽の質を低下させることなく、トーンノイズを除去する方法を提供する。
発話の増強は、多くの場合に、発話信号からのノイズの除去を含む。発話がスピーチプロセッサまたは聴取者によって認識され得るように、信号から異質なノイズを除去することによって発話信号を強化することが、困難な研究課題となっている。過去数十年に渡って、様々な手法が開発されてきた。それらの中で、スペクトルサブトラクション方法が、現在の用途において最も広く使用されている。この方法において、平均ノイズスペクトルが概算され、ノイズ信号スペクトルから減算され、それにより信号対ノイズ比(SNR)が改善される。
しかしながら、ノイズが「トーン」ノイズと呼ばれるタイプであるときには、従来技術の発話強化技術は、常に上手くいくわけではない。トーンノイズは、家庭、オフィス、自動車、および他の環境において生じ得る。家庭およびオフィスにおけるトーンノイズに関して多くの場合に引用されるソースは、蛍光灯のバズである。別のソースは、コンピュータまたはプロジェクタのファンのハムである。自動車において、トーンノイズは、ランブルストリップ、自動車のエンジン、オルタネータの泣き音、ラジオの干渉(「GSMバズ」)、または開いた窓からの鳴笛音(whistle)である。このトーンノイズは、電話の会話および発話の認識に悪影響を与え得、発話を理解または認識することをわずかばかり困難にする。
所望の信号の内容に対して入力信号を検査する発話処理システムは、トーンノイズを発話と解釈し得、トーンノイズを有する入力信号のセグメントを隔離し得、そして、トーンノイズを処理することを試み得る。発話処理システムは、セグメントを隔離するためだけでなく、セグメントを処理し、処理の結果に基づいた動作を行うためにも貴重な演算リソースを消費する。発話認識システムにおいては、システムは、トーンノイズをボイスコマンドとして解釈し、スプリアスコマンドを実行し、それに応答して、まったく意図されていない動作を行い得る。
トーンノイズは、音響周波数スペクトルに関して一定のピークとして現れる。当然、ピークは、より広い範囲から、多くの場合に、6dB〜20dBだけ突出する。ノイズの低減は、一般的には、全ての周波数を均等に減衰し、それにより残りのトーンノイズはより静かになるが、ノイズの低減前と全く同様にノイズの低減後も明瞭である。従って、既存のノイズ除去の手法は、より広範な背景ノイズに対してトーンノイズを低減することを本当に助けるわけではない。
本発明は、ノイズ除去システムに対する改善を詳述する。準定常トーンノイズは、通常では広帯域ノイズまたは散乱ノイズのスペクトルにおけるピークとして現れる。ノイズの低減は、一般的には、全ての周波数を均等に減衰し、それによりトーンノイズはより静かになるが、ノイズの低減後もノイズの低減前と全く同様に明瞭である。システムは、ピークを識別し、どのピークがトーンピークでありそうかを決定し、トーンノイズに適応性の抑制を適用する。システムは、トーンノイズの低減(TNR)の技術を使用しており、トーンノイズの低減(TNR)は、トーンノイズが見つかった周波数をより大きく減衰する。TNRシステムは、追加的な処理(位相ランダム化)を行なうことにより、あらゆる残余のトーン音を事実上排除し得る。このシステムは、単純な一連の受動的なノッチフィルタではなく、従って、周波数が重なる発話または音楽を除去しない。さらに、システムは適応性であり、トーンノイズが存在しない場合には、追加的なフィルタリングを全く行なわない。
本発明はさらに以下の手段を提供する。
(項目1)
トーンノイズを識別する方法であって、
入力信号を複数の周波数のビンに変換することと、
各ビンにおいて、平滑化された背景ノイズと背景ノイズの概算値とを計算することと、
該各ビンにおいて、該平滑化された背景ノイズを該背景ノイズの概算値と比較することと、
該平滑化された背景ノイズに対する該背景ノイズの概算値の比が、閾値を上回るときには、トーンピークを有するとしてビンを識別することと
を包含する、方法。
(項目2)
比較する上記ステップは、同じビンの上記背景ノイズの概算値に対する上記平滑化された背景ノイズを含む、項目1に記載の方法。
(項目3)
上記閾値は、1を上回る、項目1に記載の方法。
(項目4)
現在のフレームnに対する平滑化された背景ノイズを決定する上記ステップは、
Figure 2009031793
のときに、
Figure 2009031793
によって達成され、ここで、B(k)は、周波数のビンkにおける現在のフレームnの上記背景ノイズの概算値であり、
Figure 2009031793
は、先のビンk−1の該平滑化された背景ノイズである、項目2に記載の方法。
(項目5)
平滑化された背景ノイズを決定する上記ステップは、
Figure 2009031793
のときには、
Figure 2009031793
によって与えられる、項目2に記載の方法。
(項目6)
βおよびβは、0から1の範囲にある2つのパラメータである、項目4および項目5に記載の方法。
(項目7)
Figure 2009031793
は、
Figure 2009031793
によって与えられる、項目1に記載の方法。
(項目8)
信号からトーンノイズを除去する方法であって、
n番目のフレームおよびk番目の周波数のビンにおいて、ノイズを伴う発話信号の短時間のスペクトルの大きさ
Figure 2009031793
を決定することと、
概算された純粋な発話信号
Figure 2009031793
Figure 2009031793
によって生成することであって、ここで、
Figure 2009031793
は、適応性抑制ゲイン値である、ことと
を包含する、方法。
(項目9)
Figure 2009031793
は、
Figure 2009031793
によって生成され、
ここで、σn,kは、現在の周波数のビンに関する適応性ゲイン係数である、項目8に記載の方法。
(項目10)
σn,kは、
Figure 2009031793
によって生成され、
ここで、σは、一定の係数であり、
Figure 2009031793
は、ビンkにおける、背景ノイズの概算値と平滑化された背景ノイズとの間の比である、項目9に記載の方法。
(項目11)
Figure 2009031793
であり、
ここで、B(k)は、周波数kにおける現在のフレームnの上記背景ノイズの概算値であり、
Figure 2009031793
は、同じビンの上記平滑化された背景ノイズである、項目10に記載の方法。
(項目12)
Figure 2009031793
と比較するステップをさらに包含する、項目11に記載の方法。
(項目13)
Figure 2009031793
のときに、
Figure 2009031793
を受け入れるステップをさらに含む、項目12に記載の方法。
(項目14)
Figure 2009031793
のときに、最初の位相をランダム位相と置き換えるステップをさらに含む、項目12に記載の方法。
(摘要)
システムは、入力信号におけるトーンノイズを抑制または排除する技術を提供する。システムは、複数の周波数のビンにおいて入力信号を処理し、次のビンにおける値を計算することを補助するために、先のビンにおいて生成された情報を使用する。システムは、最初に、信号におけるピークを識別し、次に、ピークがトーン効果によるものであるかを決定する。これは、現在のビンの概算された背景ノイズを、同じビンの平滑化された背景ノイズと比較することによって行なわれる。平滑化された背景ノイズは、非対称IIRフィルタを使用して計算され得る。現在計算された平滑化された背景ノイズに対する、現在の背景ノイズの概算値の比が、1を大幅に上回るときには、トーンノイズが想定される。トーンノイズが発見されたときには、多数の抑制技術が適用されることにより、トーンノイズが低減され得る。該多数の抑制技術は、固定のフロア係数を用いたゲイン抑制、適応性フロア係数のゲイン抑制技術、およびランダム位相技術を含む。
本発明は、以下の図面と記述とを参照して、より良く理解され得る。図面内のコンポーネントは、必ずしもサイズに比例しておらず、その代わりに、本発明の原理を例示することに重きを置いている。さらに、図面においては、同様な参照番号は、異なる図面全体を通して、対応する部分を示している。
一般的な周波数領域の発話強化システムは、通常、スペクトル抑制ゲインの計算方法と、背景ノイズのパワースペクトル密度(PSD)の概算方法とから成る。スペクトル抑制は充分に理解されているが、PSDノイズ概算は、歴史的にはあまり注目されなかった。しかしながら、近年、PSDノイズ概算は、システム全体の質および明瞭性にとって非常に重要であることが分かった。背景ノイズが、時の経過によって変化がないか、またはほとんど変化がないときには、大部分のスペクトル抑制方法は、良好な質を達成し得る。トーンノイズが背景に存在するときには、従来のスペクトル抑制方法が、トーンノイズを抑制し得るが、トーンノイズを排除し得ない。残余のトーンノイズは明瞭であり、人間の耳を不快にし得る。このシステムは、発話の質を低下させることなく、完全にトーンノイズを除去する原理と技術とを提供する。
システムのトーンノイズ低減(TNR)は、ピークが散乱ノイズを上回る程度まで、ピーク周波数をより大きく減衰する。例えば、周囲の周波数におけるノイズよりも10dB上回るピークが、ノイズの概算値に見られた場合には、余分に10dBのノイズの減衰が、その周波数に行われる。このようにして、TNR後のスペクトルの形状は、隣接する周波数全体に渡って平滑になり、トーンノイズがかなり低減される。
任意の所与の周波数において、発話がノイズよりも12dB上回るときには、ノイズの寄与は些細なものと考えられ得る。従って、信号が、トーンノイズなどのノイズよりもかなり高いときには、TNRを用いるNR、またはTNRを用いないNRは、目立った影響を全く有するべきではなく、そして全く有していない。より低いSNR信号は、トーンピークの付近でより大きく減衰され、トーンノイズのピークと等しい信号は、結果として生じるスペクトルがピーク周波数の付近で平坦になるように減衰される(ピーク周波数の大きさは、隣接した周波数におけるノイズの大きさと等しい)。
(トーンノイズの位相をそのままにしておきながら)トーンノイズの出力を低減させることは、トーンの音を完全に除去しないことがあり得る。なぜならば、所与の周波数における位相が、まだ、トーンの知覚に寄与するからである。一方法において、信号がトーンノイズに近い場合には、その周波数のビンにおける位相がランダム化され得る。これが、その周波数におけるトーンを完全に除去する利益を有する。システムは、音質の改善と、聴取者の疲労の軽減と、発話認識の改善とを提供する。
本発明の他のシステム、方法、特徴および利点は、以下の図面および詳細な記述を考察すると、当業者には明らかであるか、または当業者に明らかになる。全てのかかる追加のシステム、方法、特徴および利点は、この記述の範囲内に含まれ、本発明の範囲内にあり、そして添付の特許請求の範囲によって保護されるということが意図されている。
(トーンノイズを検出する方法)
一般的な自動車のノイズは散乱ノイズである。周波数が増加したときに、散乱ノイズの出力密度は平滑に減少する。一般的な自動車のノイズのスペクトログラムは、スペクトログラム全体に渡って、比較的平滑であり、かつ、やや均一な分布を示す。対照的に、トーンノイズは、通常、一定の周波数だけに及び、比較的長い期間の間持続する。トーンノイズのスペクトログラムは、非常に不均一な分布を示す。
一般的な自動車のノイズのPSDが図1に例示されている。グラフは、信号の出力が周波数によってどのように分布されるかを示す。見られ得るように、一般的な道路のノイズは、より低い周波数においてより多くの出力を有し、周波数と共に出力が実質的に低減し、それにより、より高い周波数において、信号の出力は比較的小さい。対照的に、図2に例示されたトーンノイズのPSDは、出力が様々な周波数における多数のピークに分布されるということを示す。図2のトーンノイズ信号のPSDは、一般的な道路のノイズよりも非常に多く「ピークを成している」。
妥当な周波数分解能を有する、ほとんどの従来的なノイズ追跡アルゴリズムは、背景におけるトーンノイズを追跡し得る。トーンノイズは、通常、ノイズスペクトルにおいて、図2における多数の周波数で例示されたように、隣のピークをかなり上回って立ち上がるピークとして示す。
図5は、トーンノイズを識別および抑制する際の、システムの動作を例示する流れ図である。ステップ501において、システムは、背景ノイズのスペクトルのピークを識別する。ステップ502において、抑制されるトーンピークが識別される。ステップ503において、トーンピークが抑制され、それにより信号におけるトーンピークの影響が低減される。
(トーンノイズのピークの検出)
トーンノイズに対処するために、一方法は、最初にトーンノイズのピークを識別することであるということが理解され得る。図6は、入力信号におけるピークを識別するために、システムによって使用される技術を例示する流れ図である。システムは、時間領域の信号を周波数領域の信号に変換する。周波数の分解能は、システム毎に変化し得る。システムの一部の実施形態において、システムのこの部分の周波数の分解能は、ビン当たり43Hzである。入力信号は、周波数のビンのそれぞれにおいて解析される。ステップ601において、考慮されている現在のビンに対する背景ノイズの概算値が獲得される。ステップ602において、現在の背景ノイズの概算値が、先のビン(現在のビンの直前に分析されたビン)に対する平滑化された背景ノイズと比較される。決定ブロック603において、現在の背景ノイズの概算値が、先のビンの平滑化された背景ノイズ以上であるかが決定される。そうである場合には、第1のアルゴリズムがステップ604において適用される。そうでない場合には、第2のアルゴリズムがステップ605において適用される。
図6の技術を実装する一方法は、トーンノイズのピークの位置および大きさを検出するための、非対称IIR(無限インパルス応答)フィルタの適用である。
ステップ601において示されたように、n番目のフレームおよびk番目の周波数のビンにおける背景ノイズの概算値B(k)が、概算される。このk番目のビンに対する平滑化された背景ノイズ
Figure 2009031793
が、非対称IIRフィルタによって計算され得る。現在のビンの背景ノイズの概算値B(k)が、先のビンの平滑化された背景ノイズ
Figure 2009031793
と比較される(ステップ602)。比較の結果に応じて、非対称IIRフィルタの異なる分枝が適用される。
Figure 2009031793
のとき(ステップ603が真であるとき)には、次式が適用される。
Figure 2009031793
(ステップ604)。
Figure 2009031793
のとき(ステップ603が偽であるとき)には、次式が適用される。
Figure 2009031793
(ステップ605)。
ここで、βおよびβは、0から1の範囲にある2つのパラメータである。βおよびβは、増減する適応速度を調節するために使用される。β以上になるようにβを選択することによって、平滑化された背景ノイズは、ノイズの概算値にほぼしたがうが、トーンのピークがある場所が異なる。次に、平滑化された背景は、次のステップにおいてトーンノイズを除去するために使用される。同じフィルタが、前後の方向にノイズスペクトル全体に渡って走らされ、複数のパスに対しても走られ得るということに留意されたい。
(トーンノイズのピークを識別すること)
図7は、トーンピークの存在を決定する比技術(ratio technique)を例示する流れ図である。ステップ701において、現在のビンに対する平滑化された背景ノイズが計算される(これは、図6に記述されたように行われ得る)。ステップ702において、現在のビンの平滑化された背景ノイズが、現在のビンの背景ノイズの概算値と比較される。決定ブロック703において、比が1を大幅に上回るかどうかが決定される。そうである場合には、そのビンにおけるピークが、ステップ704において、トーンピークであるということが想定される。そうでない場合には、そのビンにおけるピークは、ステップ705において、一般的なノイズであることが想定される。
図7の技術を実装する一方法が、ここで記述される。平滑化されていない(B(k))背景ノイズと、平滑化された
Figure 2009031793
(ステップ701)背景ノイズとの間の比が、
Figure 2009031793
(ステップ702)によって与えられる。
通常、
Figure 2009031793
の値は、約1(ステップ703は偽)であり、平滑化されていない背景ノイズが、平滑化された背景ノイズとほぼ等しく、従って一般的なノイズであるということを意味する(ステップ705)。しかしながら、背景にトーンノイズが存在するときには、
Figure 2009031793
の大きな値が、異なる周波数において見つけられる(ステップ703は真である)。従って、大きな
Figure 2009031793
がトーンノイズのインジケータとして使用される(ステップ704)。
システムは、どのビンがトーン効果によりノイズを有するかと、どのビンが一般的なノイズであると考えられるかとを追跡する。
(トーンノイズを除去する方法)
(非適応性)
処理を必要とするピークが決定されると、矯正動作が行われ得る。図8は、純粋な発話信号を概算する非適応性の技術を例示する流れ図である。ステップ801において、現在のビンにおける、ノイズを伴う発話信号のスペクトルの大きさが決定される。ステップ802において、抑制ゲインの値がスペクトルの大きさに適用される。ステップ803において、純粋は発話スペクトルの大きさの概算値が生成される。
図8のシステムは、以下のように実装され得る。標準的な適応性ノイズのモデルにおいて、ノイズを伴う発話は、
y=x(t)+d(t)
によって与えられる。
ここで、x(t)とd(t)とは、発話信号とノイズ信号とをそれぞれ示す。
n番目のフレームとk番目の周波数のビンとにおいて、ノイズを伴う発話の短時間のスペクトルの大きさと、発話の短時間のスペクトルの大きさと、ノイズの短時間のスペクトルの大きさとをそれぞれ、
Figure 2009031793
が示すようにする。ノイズを伴う発話スペクトルの大きさは分かり得る(ステップ801)が、ノイズの実際の値と、純粋な発話の実際の値とは、分からない。きれいになった発話信号を獲得することは、ノイズを伴う発話スペクトルの大きさの操作を必要とする。ノイズの低減プロセスは、各短時間のスペクトル値に対するスペクトルのゲイン値Gn,kの適用(ステップ802)から成る。純粋な発話スペクトルの大きさの概算値は、
Figure 2009031793
として獲得され得る(ステップ803)。
ここで、Gn,kは、スペクトル抑制ゲインである。このゲインを計算する方法に関して、様々な方法が、文献に紹介されている。例としては、Ephraim,Y,;Malah,D.;Speech Enhancement Using A Minimum−Mean Square Error Short−Time Spectral Amplitude Estimator,IEEE Trans. on Acoustics,Speech,and Signal Processing Volume 32, Issue 6, 1984年12月,ページ:1109〜1121において提案された、決定に従う手法を含む。
(音楽のトーンノイズ)
スペクトル抑制方法に関する1つの問題は、音楽のトーンノイズの存在の可能性である。音楽のノイズを排除またはマスクするために、抑制ゲインがフロアされるべきである。
n,k=max(σ,Gn,k
ここで、σは、一定であり、0と1との間の値を有する。
上記のスペクトルのゲインに基づいたノイズ低減方法は、一般的な自動車のノイズに対しては良好な性能を有する。しかしながら、トーンノイズが背景にあるときには、これらの方法は、トーンノイズを抑制し得るだけであり、トーンノイズを排除し得ない。ここで図3を参照すると、従来技術のノイズの低減後の信号のPSDが示されている。信号は、まだ、トーンノイズが存在する周波数においてピークを有する。従って、信号ノイズ全体が抑制されるが、トーンノイズは残る。
(適応性の方法)
トーンノイズを除去するために、一定のフロアσを使用する代わりに、システムは、可変フロアを使用し、該可変フロアは、各周波数のビンにおいて規定される。図9は、抑制ゲイン値を計算するための適応性係数の使用を例示する流れ図である。ステップ901において、平滑化された背景ノイズと、背景ノイズの概算値とが、現在の周波数帯域に対して決定される。
ステップ902において、平滑化された背景の値と、背景ノイズの概算値とが、比を生成するために使用される。この比が、ステップ903において、現在のビンに対して使用される適応性係数の値を計算するために使用される。ステップ904において、適応性係数は、現在のビンに対する抑制ゲインの値を生成するために使用される。このように、各周波数のビンは、変化する抑制ゲインのフロアを有しており、該変化する抑制ゲインのフロアは、そのビンにおける比の値に依存している。図のシステムの動作は、以下に記述される。
周波数のビンにおいて、背景ノイズB(k)を概算し、平滑化された背景ノイズ
Figure 2009031793
を計算する(ステップ901)。上記の技術は、値を生成するために使用され得る。ステップ902において、上に記述されたように、比
Figure 2009031793
を計算する。次に、これが、ステップ903において、適応性係数σを生成するために使用され、該適応性係数σは、現在の周波数のビンと関連付けられる。適応性係数は、
Figure 2009031793
によって定義される。
次に、信号に適用されるトーンノイズの抑制ゲインが、
Figure 2009031793
によって与えられる(ステップ904)。
(ランダム化技術)
スペクトルの大きさに対して上記の適応性抑制ゲインを適用することが、トーンノイズの除去の改善を達成する。しかしながら、いくつかのトーンノイズが背景に存在するときには、最初のノイズの位相を使用することが、処理された信号において、トーン音をまだ聞き取ることができるものにし得る。さらなる平滑化に関して、代替の技術は、ノイズを伴う最初の信号に適用される適応性抑制ゲインが、平滑化された背景ノイズを下回るときには必ず、最初の位相をランダム位相と取り替えることである。
図10は、ランダム位相を使用する抑制技術を例示する流れ図である。ステップ1001において、図9の適応性抑制を適用する。ステップ1002において、(ノイズを伴う信号によって乗算された)結果を、現在の周波数のビンに対する平滑化された背景ノイズの値と比較する。決定ブロック1003において、結果が平滑化された値を下回るかどうかを決定する。下回らない場合には、生成された結果が使用され得る。結果が平滑化された背景ノイズを下回る場合には、ステップ1005において、最初の位相をランダム位相と交換する。ステップ1002とステップ1003とは、以下のように実装され得る:
Figure 2009031793
の場合には、純粋な発話スペクトルの大きさの概算値が、
Figure 2009031793
として取得され得る(ステップ1001)。
複合的な純粋な発話の概算値が、
Figure 2009031793
によって与えられる。
ここで、Rn,kとIn,kとは、ゼロ平均と単位分散とを有する2つのガウス乱数である。
図4は、開示されたトーンノイズの低減方法によって処理されたトーンノイズのPSDを例示する。見られ得るように、結果として生じた波形は、より少ないピークを有し、より平滑なプロフィールを有する。
モジュールおよびコンポーネントとして識別された機能ブロックを参照して、例示が考察されてきた。該モジュールおよびコンポーネントは、別々の構造を表すことを意図されておらず、組み合わせられたり、またはさらに分けられたりし得る。さらに、本発明の様々な実施形態が記述されてきたが、本発明の範囲内で他の実施形態および他の実装が可能であるということが当業者には明白である。従って、本発明は、添付の特許請求の範囲およびその均等物以外では制限されない。
図1は、一般的な自動車ノイズのPSDである。 図2は、トーンノイズのPSDである。 図3は、従来技術のノイズの低減後の、トーンノイズのPSDである。 図4は、開示されたトーンノイズの低減方法によって処理されたトーンノイズのPSDを例示する。 図5は、トーンノイズを識別し抑制する際のシステムの動作を例示する流れ図である。 図6は、平滑化された背景ノイズを概算するために、システムによって使用される技術を例示する流れ図である。 図7は、トーンピークの存在を決定する技術を例示する流れ図である。 図8は、純粋な発話信号を概算する従来技術を例示する流れ図である。 図9は、抑制ゲイン値を計算するための、適応性係数の使用を例示する流れ図である。 図10は、ランダム位相を使用する抑制技術を例示する流れ図である。

Claims (14)

  1. トーンノイズを識別する方法であって、
    入力信号を複数の周波数のビンに変換することと、
    各ビンにおいて、平滑化された背景ノイズと背景ノイズの概算値とを計算することと、
    該各ビンにおいて、該平滑化された背景ノイズを該背景ノイズの概算値と比較することと、
    該平滑化された背景ノイズに対する該背景ノイズの概算値の比が、閾値を上回るときには、トーンピークを有するとしてビンを識別することと
    を包含する、方法。
  2. 比較する前記ステップは、同じビンの前記背景ノイズの概算値に対する前記平滑化された背景ノイズを含む、請求項1に記載の方法。
  3. 前記閾値は、1を上回る、請求項1に記載の方法。
  4. 現在のフレームnに対する平滑化された背景ノイズを決定する前記ステップは、
    Figure 2009031793
    のときに、
    Figure 2009031793
    によって達成され、ここで、B(k)は、周波数のビンkにおける現在のフレームnの前記背景ノイズの概算値であり、
    Figure 2009031793
    は、先のビンk−1の該平滑化された背景ノイズである、請求項2に記載の方法。
  5. 平滑化された背景ノイズを決定する前記ステップは、
    Figure 2009031793
    のときには、
    Figure 2009031793
    によって与えられる、請求項2に記載の方法。
  6. βおよびβは、0から1の範囲にある2つのパラメータである、請求項4および請求項5に記載の方法。

  7. Figure 2009031793
    は、
    Figure 2009031793
    によって与えられる、請求項1に記載の方法。
  8. 信号からトーンノイズを除去する方法であって、
    n番目のフレームおよびk番目の周波数のビンにおいて、ノイズを伴う発話信号の短時間のスペクトルの大きさ
    Figure 2009031793
    を決定することと、
    概算された純粋な発話信号
    Figure 2009031793

    Figure 2009031793
    によって生成することであって、ここで、
    Figure 2009031793
    は、適応性抑制ゲイン値である、ことと
    を包含する、方法。
  9. Figure 2009031793
    は、
    Figure 2009031793
    によって生成され、
    ここで、σn,kは、現在の周波数のビンに関する適応性ゲイン係数である、請求項8に記載の方法。
  10. σn,kは、
    Figure 2009031793
    によって生成され、
    ここで、σは、一定の係数であり、
    Figure 2009031793
    は、ビンkにおける、背景ノイズの概算値と平滑化された背景ノイズとの間の比である、請求項9に記載の方法。
  11. Figure 2009031793
    であり、
    ここで、B(k)は、周波数kにおける現在のフレームnの前記背景ノイズの概算値であり、
    Figure 2009031793
    は、同じビンの前記平滑化された背景ノイズである、請求項10に記載の方法。
  12. Figure 2009031793
    と比較するステップをさらに包含する、請求項11に記載の方法。
  13. Figure 2009031793
    のときに、
    Figure 2009031793
    を受け入れるステップをさらに含む、請求項12に記載の方法。
  14. Figure 2009031793
    のときに、最初の位相をランダム位相と置き換えるステップをさらに含む、請求項12に記載の方法。
JP2008186578A 2007-07-25 2008-07-17 調整されたトーンノイズの低減を用いたノイズの低減 Pending JP2009031793A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US95192207P 2007-07-25 2007-07-25
US11/961,715 US8489396B2 (en) 2007-07-25 2007-12-20 Noise reduction with integrated tonal noise reduction

Publications (1)

Publication Number Publication Date
JP2009031793A true JP2009031793A (ja) 2009-02-12

Family

ID=39712585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008186578A Pending JP2009031793A (ja) 2007-07-25 2008-07-17 調整されたトーンノイズの低減を用いたノイズの低減

Country Status (5)

Country Link
US (1) US8489396B2 (ja)
EP (1) EP2023342A1 (ja)
JP (1) JP2009031793A (ja)
KR (1) KR20090012154A (ja)
CA (1) CA2638265C (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011522294A (ja) * 2008-05-29 2011-07-28 クゥアルコム・インコーポレイテッド スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2347556B1 (en) * 2008-09-19 2012-04-04 Dolby Laboratories Licensing Corporation Upstream signal processing for client devices in a small-cell wireless network
JP5141542B2 (ja) * 2008-12-24 2013-02-13 富士通株式会社 雑音検出装置及び雑音検出方法
CN101986386B (zh) * 2009-07-29 2012-09-26 比亚迪股份有限公司 一种语音背景噪声的消除方法和装置
JP5383828B2 (ja) * 2009-12-25 2014-01-08 三菱電機株式会社 雑音除去装置及び雑音除去プログラム
JP5738020B2 (ja) * 2010-03-11 2015-06-17 本田技研工業株式会社 音声認識装置及び音声認識方法
CN102314883B (zh) * 2010-06-30 2013-08-21 比亚迪股份有限公司 一种判断音乐噪声的方法以及语音消噪方法
JP5566846B2 (ja) * 2010-10-15 2014-08-06 本田技研工業株式会社 ノイズパワー推定装置及びノイズパワー推定方法並びに音声認識装置及び音声認識方法
US8818806B2 (en) * 2010-11-30 2014-08-26 JVC Kenwood Corporation Speech processing apparatus and speech processing method
WO2013125257A1 (ja) * 2012-02-20 2013-08-29 株式会社Jvcケンウッド 雑音信号抑制装置、雑音信号抑制方法、特殊信号検出装置、特殊信号検出方法、報知音検出装置、および、報知音検出方法
JP6054142B2 (ja) * 2012-10-31 2016-12-27 株式会社東芝 信号処理装置、方法およびプログラム
WO2014202770A1 (en) 2013-06-21 2014-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals
MY181026A (en) 2013-06-21 2020-12-16 Fraunhofer Ges Forschung Apparatus and method realizing improved concepts for tcx ltp
CN110265059B (zh) * 2013-12-19 2023-03-31 瑞典爱立信有限公司 估计音频信号中的背景噪声
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
WO2015170140A1 (en) * 2014-05-06 2015-11-12 Advanced Bionics Ag Systems and methods for cancelling tonal noise in a cochlear implant system
RU2713852C2 (ru) 2014-07-29 2020-02-07 Телефонактиеболагет Лм Эрикссон (Пабл) Оценивание фонового шума в аудиосигналах
KR102277952B1 (ko) * 2019-01-11 2021-07-19 브레인소프트주식회사 디제이 변환에 의한 주파수 추출 방법
KR102382208B1 (ko) * 2020-07-21 2022-04-04 브레인소프트주식회사 복합음을 구성하는 순음의 추출 방법
EP4189679A1 (en) * 2020-07-30 2023-06-07 Dolby International AB Hum noise detection and removal for speech and music recordings
CN114076681B (zh) * 2020-08-20 2024-07-05 上海汽车集团股份有限公司 一种啸叫噪声评价方法和相关装置

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1796078U (de) * 1957-01-30 1959-09-17 Bosch Gmbh Robert Zahnradpumpe.
DE69124005T2 (de) * 1990-05-28 1997-07-31 Matsushita Electric Ind Co Ltd Sprachsignalverarbeitungsvorrichtung
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
JP3604393B2 (ja) * 1994-07-18 2004-12-22 松下電器産業株式会社 音声検出装置
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US5950154A (en) * 1996-07-15 1999-09-07 At&T Corp. Method and apparatus for measuring the noise content of transmitted speech
DE69708693C5 (de) * 1996-11-07 2021-10-28 Godo Kaisha Ip Bridge 1 Verfahren und Vorrichtung für CELP Sprachcodierung oder -decodierung
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
US6519559B1 (en) * 1999-07-29 2003-02-11 Intel Corporation Apparatus and method for the enhancement of signals
US6910011B1 (en) * 1999-08-16 2005-06-21 Haman Becker Automotive Systems - Wavemakers, Inc. Noisy acoustic signal enhancement
US6111183A (en) * 1999-09-07 2000-08-29 Lindemann; Eric Audio signal synthesis system based on probabilistic estimation of time-varying spectra
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US6674865B1 (en) * 2000-10-19 2004-01-06 Lear Corporation Automatic volume control for communication system
GB2375028B (en) * 2001-04-24 2003-05-28 Motorola Inc Processing speech signals
US7272234B2 (en) * 2002-04-04 2007-09-18 Brigham Young University Multi-channel active control system and method for the reduction of tonal noise from an axial fan
US7277537B2 (en) * 2003-09-02 2007-10-02 Texas Instruments Incorporated Tone, modulated tone, and saturated tone detection in a voice activity detection device
US20050091049A1 (en) * 2003-10-28 2005-04-28 Rongzhen Yang Method and apparatus for reduction of musical noise during speech enhancement
JP4520732B2 (ja) * 2003-12-03 2010-08-11 富士通株式会社 雑音低減装置、および低減方法
US7725314B2 (en) * 2004-02-16 2010-05-25 Microsoft Corporation Method and apparatus for constructing a speech filter using estimates of clean speech and noise
US20060018457A1 (en) * 2004-06-25 2006-01-26 Takahiro Unno Voice activity detectors and methods
US20050288923A1 (en) * 2004-06-25 2005-12-29 The Hong Kong University Of Science And Technology Speech enhancement by noise masking
US7917356B2 (en) * 2004-09-16 2011-03-29 At&T Corporation Operating method for voice activity detection/silence suppression system
US7716046B2 (en) * 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
EP1806739B1 (en) * 2004-10-28 2012-08-15 Fujitsu Ltd. Noise suppressor
EP1703494A1 (en) 2005-03-17 2006-09-20 Emma Mixed Signal C.V. Listening device
EP1708370A3 (en) * 2005-03-28 2009-05-20 Pioneer Corporation Noise removal device
US8520861B2 (en) * 2005-05-17 2013-08-27 Qnx Software Systems Limited Signal processing system for tonal noise robustness
GB2429139B (en) * 2005-08-10 2010-06-16 Zarlink Semiconductor Inc A low complexity noise reduction method
US7912567B2 (en) * 2007-03-07 2011-03-22 Audiocodes Ltd. Noise suppressor

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011522294A (ja) * 2008-05-29 2011-07-28 クゥアルコム・インコーポレイテッド スペクトルコントラスト強調のためのシステム、方法、装置、およびコンピュータプログラム製品
US8831936B2 (en) 2008-05-29 2014-09-09 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement
US8538749B2 (en) 2008-07-18 2013-09-17 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced intelligibility
US9202456B2 (en) 2009-04-23 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization

Also Published As

Publication number Publication date
US20080167870A1 (en) 2008-07-10
EP2023342A1 (en) 2009-02-11
CA2638265A1 (en) 2009-01-25
CA2638265C (en) 2013-06-18
KR20090012154A (ko) 2009-02-02
US8489396B2 (en) 2013-07-16

Similar Documents

Publication Publication Date Title
JP2009031793A (ja) 調整されたトーンノイズの低減を用いたノイズの低減
JP5275748B2 (ja) 動的ノイズ低減
US8073689B2 (en) Repetitive transient noise removal
US7133825B2 (en) Computationally efficient background noise suppressor for speech coding and speech recognition
US8612222B2 (en) Signature noise removal
US8352257B2 (en) Spectro-temporal varying approach for speech enhancement
US9584087B2 (en) Post-processing gains for signal enhancement
KR100789084B1 (ko) 웨이블릿 패킷 영역에서 비선형 구조의 과중 이득에 의한음질 개선 방법
KR101737824B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
JP2004254322A (ja) ウィンドノイズを抑制するシステム
US8326621B2 (en) Repetitive transient noise removal
JP2008537185A (ja) オーディオ雑音を減少させるシステムおよび方法
JP2007306546A (ja) 時変拡声器−部屋−マイクロホンシステムにおけるエコー減少
US7885810B1 (en) Acoustic signal enhancement method and apparatus
US8199928B2 (en) System for processing an acoustic input signal to provide an output signal with reduced noise
Nongpiur Impulse noise removal in speech using wavelets
JP6857344B2 (ja) オーディオ信号を処理するための装置および方法
Shajeesh et al. Speech enhancement based on Savitzky-Golay smoothing filter
Yektaeian et al. Comparison of spectral subtraction methods used in noise suppression algorithms
KR101993003B1 (ko) 잡음 제거 장치 및 방법
JP5316127B2 (ja) 音処理装置およびプログラム
Ma et al. A perceptual kalman filtering-based approach for speech enhancement
Alam et al. Speech enhancement based on a hybrid a priori signal-to-noise ratio (SNR) estimator and a self-adaptive Lagrange multiplier
Alam et al. Speech enhancement using a wiener denoising technique and musical noise reduction.
Zhao et al. Reverberant speech enhancement by spectral processing with reward-punishment weights

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110621

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111115