JP5300861B2 - 雑音抑圧装置 - Google Patents

雑音抑圧装置 Download PDF

Info

Publication number
JP5300861B2
JP5300861B2 JP2010536590A JP2010536590A JP5300861B2 JP 5300861 B2 JP5300861 B2 JP 5300861B2 JP 2010536590 A JP2010536590 A JP 2010536590A JP 2010536590 A JP2010536590 A JP 2010536590A JP 5300861 B2 JP5300861 B2 JP 5300861B2
Authority
JP
Japan
Prior art keywords
noise
spectrum
noise suppression
suppression
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010536590A
Other languages
English (en)
Other versions
JPWO2010052749A1 (ja
Inventor
裕久 田崎
訓 古田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Publication of JPWO2010052749A1 publication Critical patent/JPWO2010052749A1/ja
Application granted granted Critical
Publication of JP5300861B2 publication Critical patent/JP5300861B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

この発明は、種々の雑音環境下で用いられる音声通信システムや音声認識システム等において、音声・音響信号などの目的信号以外の雑音を抑圧して、携帯電話などの音声通信システム・ハンズフリー通話システム・TV会議システム等の音質改善や、音声認識システムの認識率の向上等を行う雑音抑圧装置に関するものである。
雑音が混入した入力信号から目的外信号である雑音を抑圧することで、目的信号である音声信号などを強調する雑音抑圧処理の代表的な手法として、例えば、スペクトルサブトラクション(Spectral Subtraction:SS)法があり、これは振幅スペクトルから別途推定した平均的な雑音スペクトルを減算することにより雑音抑圧を行うものである(例えば、非特許文献1)。
スペクトルサブトラクション法などの雑音抑圧処理を行った場合、雑音スペクトルの推定誤差が雑音抑圧処理後の信号に歪として残留し、これが処理前の信号と大きく異なる特性を持つ上、耳障りな雑音(人工的な雑音、ミュージカルトーンとも呼ばれる)として出現するので、出力信号の主観品質を大きく劣化させることがある。
上記のような主観的な劣化感を抑制する方法として例えば特許文献1に開示されているものがある。特許文献1は、雑音区間ではミュージカルノイズが発生せず、音声区間での歪みも発生しない雑音抑圧装置を提供することを目的としており、入力信号から目的信号区間と雑音信号区間を判定する音声・雑音判定部と、入力信号と推定雑音信号とから第1の抑圧係数に応じて雑音抑圧をする雑音抑圧部と、入力信号と推定雑音信号とから第1の抑圧係数よりも大きな第2の抑圧係数に応じて雑音抑圧をする雑音過剰抑圧部と、音声・雑音判定部の判定結果に応じて雑音抑圧部の出力信号と雑音過剰抑圧部の出力信号とを切り替える切替部を備えている。
Steven F. Boll, "Suppression of Acoustic noise in speech using spectral subtraction",IEEE Trans. ASSP, Vol. ASSP-27, No.2, April 1979. 特開2005−195955号公報(第8頁〜第9頁、図1、図2)
従来の雑音抑圧装置は以上のように構成されているので、音声・雑音判定部の判定結果に応じて雑音抑圧部の出力信号と雑音過剰抑圧部の出力信号とを切り替えを行っており、誤判定による品質劣化を避けられないという課題があった。また、音声信号、雑音信号は千差万別で、時間変動を伴うため、100%正しい判定は困難であるという課題があった。
特に、雑音信号区間を音声信号区間と誤判定すると、同区間でミュージカルノイズが発生し、大きく品質劣化するという課題があった。
また、音声信号区間であっても、周波数帯域別にみた場合、音声成分が極めて小さく、雑音成分が支配的な帯域があると、この帯域でミュージカルノイズが発生し、大きく品質劣化するという課題があった。
さらに、音声信号区間を雑音信号区間と誤判定した場合には、入力信号の加算によって音声の抑圧を軽減しているが、同じ音声信号区間内で頻繁に誤判定が挿入されると、不安定な変動が感じられて、品質劣化するという課題があった。
この発明は、上記のような課題を解決するためになされたもので、ミュージカルノイズの発生を大きく軽減した高音質の雑音抑圧装置を提供することを目的とする。
この発明に係る雑音抑圧装置は、雑音が含まれる音声信号の入力スペクトルに対して雑音抑圧処理を行い、得られた雑音抑圧スペクトルを出力する複数の雑音抑圧部と、各周波数成分毎に、前記複数の雑音抑圧スペクトルの値を比較し、最大値を有する雑音抑圧スペクトルを選択して当該周波数成分のスペクトルとして出力する選択部とを備え、各周波数成分のスペクトルにより過抑圧を抑制するものである。
この発明によれば、過抑圧されていないスペクトルが選択されることで、ミュージカルノイズを大きく軽減でき、音声信号区間における不安定な変動が少ない高品質な雑音抑圧装置を実現することができる。
実施の形態1の雑音抑圧装置の構成を示すブロック図である。 実施の形態1におけるスペクトル成分の時間推移の一例を示す模式図である。 実施の形態2の雑音抑圧装置の構成を示すブロック図である。 実施の形態2におけるスペクトル成分の時間推移の一例を示す模式図である。
以下、この発明をより詳細に説明するために、この発明を実施するための最良の形態について、添付の図面に従って説明する。
実施の形態1.
図1は、実施の形態1に係る雑音抑圧装置の構成を示すブロック図である。
雑音抑圧装置は、時間・周波数変換部1、音声らしさ分析部2、雑音スペクトル推定部3、第1の雑音抑圧部4、第2の雑音抑圧部5、最大振幅選択部6および周波数・時間変換部7で構成されている。
また、第1の雑音抑圧部4は、SN推定部4aおよびスペクトル振幅抑圧部4bで構成され、第2の雑音抑圧部5は、スペクトル減算部5aおよびスペクトル振幅抑圧部5bで構成されている。
次に、この雑音抑圧装置の動作原理について説明する。
まず、入力信号101が所定のサンプリング周波数(例えば、8kHz)でサンプリングされ、所定のフレーム周期(例えば、20msec)にフレーム分割されて、時間・周波数変換部1および音声らしさ分析部2に入力される。
時間・周波数変換部1は、フレーム周期に分割された入力信号101に対して窓掛け処理を行い、窓掛け後の信号に対して、例えば256点のFFT(Fast Fourier Transform:高速フーリエ変換)を用いて、周波数毎のスペクトル成分である入力スペクトル102に変換し、音声らしさ分析部2、雑音スペクトル推定部3、SN推定部4a、スペクトル振幅抑圧部4b、スペクトル減算部(減算部)5aおよびスペクトル振幅抑圧部(振幅抑圧部)5bへ出力する。窓掛け処理には、例えばハニング窓、台形窓など公知の手法を用いることができる。また、FFTは周知の手法であるので説明は省略する。
音声らしさ分析部2は、入力信号101、時間・周波数変換部1が出力する入力スペクトル102、および後述する雑音スペクトル推定部3の内部メモリ等に格納されている前フレームの推定雑音スペクトル104を用いて、現フレームの入力信号が、音声あるいは雑音であるかどうかの度合いとして、例えば、音声の可能性が高い場合には大きな評価値を取り、音声の可能性が低い場合には小さな評価値を取るような、音声らしさ評価値103の算出を行い、これを雑音スペクトル推定部3に出力する。
音声らしさ評価値103の算出方法として、例えば、入力信号101の自己相関分析結果の最大値や、入力スペクトル102のパワーと推定雑音スペクトル104のパワーの比から算出できるフレームSN比を、それぞれ単独あるいは組み合わせて用いることが可能である。ここで、入力信号101の自己相関分析の最大値ACFmaxは式(1)、フレームSN比SNRfrについては式(2)によりそれぞれ算出される。推定雑音スペクトル104は、後述する雑音スペクトル推定部3の内部メモリに格納されている前フレームのものを読み出して用いる。
Figure 0005300861
ここで、x(t)は時間tにおけるフレーム分割された入力信号101、Nは自己相関分析区間長、S(k)は入力スペクトル102の第k番目の成分、N(k)は推定雑音スペクトル104の第k番目の成分、MはFFTポイント数である。
上記式(1)で求められた自己相関分析の最大値ACFmaxと、式(2)で求められたフレームSN比SNRfrから、音声らしさ評価値VADは次式によって算出される。
Figure 0005300861
ここで、SNRnormはSNRfrの値を0〜1の範囲内に正規化するための所定の値、wACFおよびwSNRは重み付けのための所定の値であり、それぞれ騒音の種類や騒音のパワーに応じて、音声らしさ評価値が好適に判定できるように予め調整すればよい。ACFmaxは、式(1)の性質から、0〜1の範囲の値を取る。以上の処理によって算出された音声らしさ評価値103は雑音スペクトル推定部3に出力される。
また、式(3)において、wACFあるいはwSNRの値のどちらかを0に設定することにより、0以外に設定した方のパラメータ単独で音声らしさ評価値103を算出することも可能である。具体的には、wSNRを0にした場合、自己相関分析の最大値ACFmaxのみで音声らしさ評価値103を求めることとなる。
さらに、音声らしさ評価値103の算出において、式(3)に示した指標・値以外の分析パラメータを追加することも可能である。例えば、入力スペクトル102と推定雑音スペクトル104とを用いて、周波数毎のスペクトル成分のSN比を算出し、その周波数毎のスペクトル成分のSN比の総和を取った値(総和が大きいほど、音声の可能性が高い)や、周波数毎のスペクトル成分のSN比の分散(分散が大きいほど、音声の調波構造が現れていることとなり、音声の可能性が高い)を利用するなど、適宜変更可能である。
雑音スペクトル推定部3は、音声らしさ分析部2から入力される音声らしさ評価値103を参照し、現フレームの入力信号の様態が音声の可能性が低い場合、現フレームの入力スペクトル102を用いて、内部メモリ(図示せず)などに格納されている前フレームの推定雑音スペクトルの更新を行い、更新した結果を推定雑音スペクトル104として、SN推定部4aと、スペクトル減算部5aとに出力する。推定雑音スペクトルの更新は、例えば、以下の式(4)に従って入力スペクトルを反映することにより行う。
Figure 0005300861
ここで、nはフレーム番号、N(n−1,k)は更新前の推定雑音スペクトル、Snoise(n,k)は音声の可能性が低いと判断された現フレームの入力スペクトル、N(n,k)チルダは更新後の推定雑音スペクトルである。また、α(k)は0〜1の値を取る所定の更新速度係数であり、比較的0に近い値を設定すると良い。また、高域になるに従って、係数値をやや大きくした方が良い場合があり、雑音の種類などに応じて調整すると良い。
なお、この推定雑音スペクトルの更新方法については、更に推定精度や推定追従性を向上させるために、音声らしさ評価値103の値に応じて複数の更新速度係数を適用する、フレーム間での入力スペクトルのパワーや推定雑音スペクトルのパワーの変動性を参照し、これらの変動が大きい場合には更新速度を速めるような更新速度係数を適用する、ある一定時間において、最もパワーが小さい、あるいは音声らしさ評価値が最も小さいフレームの入力スペクトルで推定雑音スペクトルを置き換える(リセットする)など、適宜変更可能である。また、音声らしさ評価値103の値が十分大きい場合、すなわち、現フレームの入力信号が確率的に音声の可能性が高い場合には、推定雑音スペクトルの更新を行わなくても良い。
第1の雑音抑圧部4では、SN推定部4aが、入力スペクトル102および推定雑音スペクトル104に基づいて推定SN比を算出し、スペクトル振幅抑圧部4bが、この推定SN比に基づいて振幅抑圧ゲインを算出すると共に、この振幅抑圧ゲインに入力スペクトル102を乗じ、得られた結果を第1の雑音抑圧スペクトル105として最大振幅選択部6に出力する。
なお、SN推定部4aにおける推定SN比の算出は、例えば、上述した式(2)のフレームSN比の算出と同様に実施することができる。音声らしさ分析部2にてフレームSN比を算出している場合には、これをそのまま、もしくは時間方向の平滑化などの適切な加工を行って推定SN比としてもよい。
スペクトル振幅抑圧部4bにおける振幅抑圧ゲインの算出は、推定SN比が高いフレームでは大きい振幅抑圧ゲイン、推定SN比が低いフレームでは小さい振幅抑圧ゲインとなるように行う。但し、その振幅抑圧ゲインについては、後述する第2の雑音抑圧部5の雑音信号区間における大半の振幅抑圧ゲイン(入力スペクトル102と後述する第2の雑音抑圧スペクトル106の振幅比)より大きい値となるように設定しておく。
例えば、推定SN比と、入力スペクトル102のパワーとを用いて、当該フレームの音声パワー、すなわち雑音を取り除いた時のパワーを推定し、第1の雑音抑圧スペクトル105のパワーがこれに一致するように振幅抑圧ゲインを求め、この振幅抑圧ゲインが所定の下限値以下となる場合には下限値に置換すればよい。
一方、第2の雑音抑圧部5では、入力スペクトル102に対して、スペクトル減算部5aが推定雑音スペクトル104に基づくスペクトル減算処理を行い、減算後のスペクトルに対して、スペクトル振幅抑圧部5bが周波数毎のスペクトル成分に減衰量を与えるスペクトル振幅抑圧を行い、得られた結果を第2の雑音抑圧スペクトル106として最大振幅選択部6に出力する。
ここで、雑音信号区間における、第2の雑音抑圧部5全体の振幅抑圧ゲイン(入力スペクトル102と第2の雑音抑圧スペクトル106の振幅比)の変動が少なくなるように、スペクトル振幅抑圧部5bの減衰量の適応制御を行うようにする。
なお、この第2の雑音抑圧部5の構成として、例えば、特許第3454190号「雑音抑圧装置および方法」に記載のものを適用することが可能である。
また、スペクトル振幅抑圧部5bとスペクトル減算部5aの順序を逆にして、入力スペクトル102に対して、スペクトル振幅抑圧部5bが周波数毎のスペクトル成分に減衰量を与えるスペクトル振幅抑圧を行い、振幅抑圧後のスペクトルに対して、スペクトル減算部5aが推定雑音スペクトル104に基づくスペクトル減算処理を行い、得られた結果を第2の雑音抑圧スペクトル106として最大振幅選択部6に出力する構成も可能である。
最大振幅選択部6は、第1の雑音抑圧スペクトル105と第2の雑音抑圧スペクトル106を比較し、周波数毎に大きい方のスペクトル成分を選択し、選択した大きい方のスペクトル成分を集めて出力スペクトル107として周波数・時間変換部7に出力する。
周波数・時間変換部7は、最大振幅選択部6から入力された出力スペクトル107に逆FFT処理を行って時間領域信号に戻し、前後フレームとの滑らかな接続のための窓掛け処理を行うと共に連接を行い、得られた信号を出力信号108として出力する。
図2は、ある周波数のスペクトル成分の時間推移を示している。図2(a)は入力スペクトル、図2(b)は第1の雑音抑圧スペクトル、図2(c)は第2の雑音抑圧スペクトル、図2(d)は出力スペクトルの時間推移を示している。各図において、横軸は時間、縦軸は振幅を示している。さらに、白抜きの棒グラフは雑音の振幅を示し、斜線の棒グラフは音声の振幅を示しており、時間軸に対して前半の5区間が雑音信号区間、後半の3区間が雑音が重畳した音声信号区間である。
第1の雑音抑圧部4では、上述のように推定SN比に基づいて振幅抑圧ゲインを算出し、この振幅抑圧ゲインを図2(a)に示す入力スペクトル102に乗じることで、図2(b)に示す第1の雑音抑圧スペクトル105を得る。雑音信号区間では、推定SNが低いので小さい振幅抑圧ゲインが算出され、第1の雑音抑圧スペクトルの振幅値が小さくなる。音声信号区間では、推定SNが高いので大きい振幅抑圧ゲインが算出され、第1の雑音抑圧スペクトルの振幅値があまり小さくならない。なお、音声信号区間の先頭付近では推定SNを低く誤りやすく、このため図2(b)に示すように、実際の音声の振幅以上に抑圧されて、音声の途切れ感を発生する場合がある。
第2の雑音抑圧部5では、図2(a)に示す入力スペクトル102から、推定雑音スペクトル104に基づく減算および振幅抑圧を行うことで、図2(c)に示すように、雑音信号区間の振幅が概ね小さくなり、音声信号区間の振幅が音声の振幅に近づいた第2の雑音抑圧スペクトル106が得られる。しかしながら、雑音の変動や音声らしさ評価値の誤差によって、推定雑音スペクトル104が実際の値以上に大きくなると、図2(c)に示すように、雑音信号区間では残留雑音が島状に残り、耳障りな人工的な雑音(ミュージカルノイズ)を発生し、音声信号区間では過抑圧によって音声の途切れ感が発生してしまう。
図2(d)は、最大振幅選択部6において、図2(b)の第1の雑音抑圧スペクトル105と、図2(c)の第2の雑音抑圧スペクトル106の大きい方を選択して得られた出力スペクトル107を示している。第1の雑音抑圧部4における振幅抑圧ゲインを、第2の雑音抑圧部5の雑音信号区間における大半の振幅抑圧ゲインより大きい値となるように設定してあるので、雑音信号区間では、大半が第1の雑音抑圧スペクトル105の振幅が大きくなり、出力スペクトル107として選択される。これにより雑音信号区間における島状の残留雑音がなくなり、ミュージカルノイズが解消する。また音声信号区間では、過抑圧が少ない方が選択されるので、過抑圧が抑制された出力スペクトル107が得られ、音声の途切れ感が軽減される。
なお、上述した実施の形態1では、第1の雑音抑圧部4および第2の雑音抑圧部5の2つの雑音抑圧部を備える構成としたが、3つ以上の雑音抑圧部を備えて最大振幅選択部6が3つ以上の雑音抑圧スペクトルから、周波数毎にスペクトル成分の最大の値を選択するように構成しても良い。
また、第2の雑音抑圧部5に、スペクトル減算部5aおよびスペクトル振幅抑圧部5bを備える構成としたが、これに限るものではなく、例えばスペクトル減算部5aのみを備える構成としても構わない。
さらに、上述した実施の形態1では、推定雑音スペクトル104の推定を音声らしさ分析部2および雑音スペクトル推定部3が行うように構成したが、推定雑音スペクトル104を得る手段としてはこの構成に限られるものではない。
例えば、雑音スペクトル推定部3における更新速度を非常にゆっくりとし、常に更新を行うように構成することで、音声らしさ分析部2を省略したり、推定雑音スペクトル104の推定を入力信号101から行わずに、雑音のみが入力される雑音推定用の入力信号から別途分析・推定する方法を取っても良い。
以上のように、この実施の形態1によれば、各周波数成分毎に、第1および第2の雑音抑圧部4,5が出力した第1および第2の雑音抑圧スペクトル105,106の値を比較し、値が最も大きいものを選択して当該周波数成分の値とした出力スペクトル107を得るように構成したので、過抑圧されていないスペクトルが選択されることで、ミュージカルノイズを大きく軽減でき、音声信号区間における不安定な変動が少ない高品質な雑音抑圧装置を実現することができる。
また、周波数成分毎の大小比較に基づきスペクトル選択を行うので、音声・雑音判定などに基づいて雑音抑圧部の出力の一方を選択する従来技術のように雑音抑圧部が全周波数成分を一括して切り替えることがなく、スペクトルの大きな変動の発生を抑制し、音声・雑音判定の誤りにより品質劣化を防止し、さらに音声信号区間の雑音成分が支配的な帯域でのミュージカルノイズの発生を抑制することができる。
また、この実施の形態1によれば、第1の雑音抑圧部4の振幅抑圧ゲインを、第2の雑音抑圧部5の雑音信号区間における大半の振幅抑圧ゲインより大きい値とするように設定し、雑音信号区間では概ね第1の雑音抑圧部4の出力が選択されるように構成したので、雑音信号区間では、ミュージカルノイズが発生しない振幅抑圧だけが行われた出力となり、品質を向上させることができる。
また、複数の雑音抑圧部を備えた場合、その他の雑音抑圧部では雑音信号区間のミュージカルノイズ発生を容認して、音声信号区間の品質がよい方式を適用できるので、音声信号区間でも高品質な雑音抑圧を実現することができる。
さらに、この実施の形態1によれば、第1の雑音抑圧部4の振幅抑圧ゲインを、推定SN比が高い時には大きい値とし、推定SN比が低い時には小さい値とするように構成したので、音声信号区間では小さい振幅抑圧ゲインとなり、その他の雑音抑圧部が過抑圧を起こした場合には第1の雑音抑圧部の出力が選択されるので、品質を向上させることができる。
さらに、この実施の形態1によれば、第2の雑音抑圧部5が、スペクトル減算とスペクトル振幅抑圧とを組み合わせて雑音抑圧スペクトルを生成するように構成したので、雑音信号区間における第2の雑音抑圧部5全体としての振幅抑圧ゲインの変動が少なくなるように、その内部のスペクトル振幅抑圧部5bの減衰量を適応制御することができ、雑音信号区間において概ね第1の雑音抑圧部の出力が選択されるように設定することが容易となる。これにより、雑音信号区間のミュージカルノイズをさらに抑制することができる。
実施の形態2.
図3は、この発明の実施の形態2に係る雑音抑圧装置の構成を示すブロック図である。実施の形態2に係る雑音抑圧装置は、第1雑音抑圧部をスペクトル振幅抑圧部のみで構成している。以下、実施の形態1と同一の構成には図1で使用した符号と同一の符号を付し、説明を省略または簡略化する。
第1の雑音抑圧部4では、時間・周波数変換部1から入力される入力スペクトル102に対してスペクトル振幅抑圧部4b´が固定の振幅抑圧ゲインを乗じ、得られた結果を第1の雑音抑圧スペクトル105´として最大振幅選択部6に出力する。
図4は、ある周波数のスペクトル成分の時間推移を示している。図4(a)は入力スペクトル、図4(b)は第1の雑音抑圧スペクトル、図4(c)は第2の雑音抑圧スペクトル、図4(d)は出力スペクトルの時間推移を示している。各図において、横軸は時間、縦軸は振幅を示している。さらに、白抜きの棒グラフは雑音の振幅を示し、斜線の棒グラフは音声の振幅を示しており、時間軸に対して前半の5区間が雑音信号区間、後半の3区間が雑音が重畳した音声信号区間である。
なお、図4(a)の入力スペクトルは実施の形態1における図2(a)と同一である。また、実施の形態2の雑音抑圧装置は、実施の形態1と同一の第2の雑音抑圧部5を備えているため、図4(a)の雑音抑圧スペクトルは実施の形態1における図3(c)と同一であるため、説明を省略する。
第1の雑音抑圧部4のスペクトル振幅抑圧部4b´では、固定の振幅抑圧ゲインを図4(a)に示す入力スペクトル102に乗じることで、図4(b)に示す第1の雑音抑圧スペクトル105´を得る。固定の振幅抑圧ゲインを乗じるので、耳障りな人工的な雑音(ミュージカルノイズ)の発生もないが、単に振幅が小さくなるのみである。
図4(d)は、最大振幅選択部6において図4(b)の第1の雑音抑圧スペクトル105´と、図4(c)の第2の雑音抑圧スペクトル106の大きい方を選択して得られた出力スペクトル107を示している。第1の雑音抑圧部4における振幅抑圧ゲインを、第2の雑音抑圧部5の雑音信号区間における大半の振幅抑圧ゲインより大きい値となるように設定してあるので、雑音信号区間では、大半が第1の雑音抑圧スペクトル105´の振幅が大きくなり、出力スペクトル107として選択される。これにより雑音信号区間における島状の残留雑音がなくなり、ミュージカルノイズが解消する。また音声信号区間では、大半が第2の雑音抑圧スペクトル106の振幅が大きくなり、出力スペクトル107として選択される。図示していないが、音声信号区間において、第2の雑音抑圧スペクトル106の振幅が極めて小さくなった場合には、第1の雑音抑圧スペクトル105´が選択される。これにより、一定レベルの音声が出力されて音声の途切れ感が軽減される。
なお、上述した実施の形態2では、第1の雑音抑圧部4および第2の雑音抑圧部5の2つの雑音抑圧部を備える構成としたが、3つ以上の雑音抑圧部を備えて最大振幅選択部6が3つ以上の雑音抑圧スペクトルから、周波数毎にスペクトル成分の最大の値を選択するように構成しても良い。
また、第2の雑音抑圧部5に、スペクトル減算部5aおよびスペクトル振幅抑圧部5bを備える構成としたが、これに限るものではなく、例えばスペクトル減算部5aのみを備える構成としても構わない。
さらに、上述した実施の形態2では、推定雑音スペクトル104の推定を音声らしさ分析部2および雑音スペクトル推定部3が行うように構成したが、推定雑音スペクトル104を得る手段としてはこの構成に限られるものではない。
例えば、雑音スペクトル推定部3における更新速度を非常にゆっくりとし、常に更新を行うように構成することで、音声らしさ分析部2を省略したり、推定雑音スペクトル104の推定を入力信号101から行わずに、雑音のみが入力される雑音推定用の入力信号から別途分析・推定する方法を取っても良い。
以上のように、この実施の形態2によれば、各周波数成分毎に、第1および第2の雑音抑圧部4,5が出力した第1および第2の雑音抑圧スペクトル105´,106の値を比較し、値が最も大きいものを選択して当該周波数成分の値とした出力スペクトル107を得るように構成したので、過抑圧されていないスペクトルが選択されることで、ミュージカルノイズを大きく軽減でき、音声信号区間における不安定な変動が少ない高品質な雑音抑圧装置を実現することができる。
また、周波数成分毎の大小比較に基づきスペクトル選択を行うので、音声・雑音判定などに基づいて雑音抑圧部の出力の一方を選択する従来技術のように雑音抑圧部が全周波数成分を一括して切り替えることがなく、スペクトルの大きな変動の発生を抑制し、音声・雑音判定の誤りにより品質劣化を防止し、さらに音声信号区間の雑音成分が支配的な帯域でのミュージカルノイズの発生を抑制することができる。
また、この実施の形態2によれば、第1の雑音抑圧部4の振幅抑圧ゲインを、第2の雑音抑圧部5の雑音信号区間における大半の振幅抑圧ゲインより大きい値とするように設定し、雑音信号区間では概ね第1の雑音抑圧部4の出力が選択されるように構成したので、雑音信号区間では、ミュージカルノイズが発生しない振幅抑圧だけが行われた出力となり、品質を向上させることができる。
また、複数の雑音抑圧部を備えた場合、その他の雑音抑圧部では雑音信号区間のミュージカルノイズ発生を容認して、音声信号区間の品質がよい方式を適用できるので、音声信号区間でも高品質な雑音抑圧を実現することができる。
さらに、この実施の形態2によれば、第2の雑音抑圧部5が、スペクトル減算とスペクトル振幅抑圧とを組み合わせて雑音抑圧スペクトルを生成するように構成したので、雑音信号区間における第2の雑音抑圧部5全体としての振幅抑圧ゲインの変動が少なくなるように、その内部のスペクトル振幅抑圧部5bの減衰量を適応制御することができ、雑音信号区間において概ね第1の雑音抑圧部の出力が選択されるように設定することが容易となる。これにより、雑音信号区間のミュージカルノイズをさらに抑制することができる。
実施の形態3.
上述した実施の形態1および実施の形態2では、各周波数成分毎に複数の雑音抑圧部4,5が出力した複数の雑音抑圧スペクトル105(105´),106の値を比較し、値が最も大きいものを選択して当該周波数成分の値とした出力スペクトル107を得る構成を示したが、複数の雑音抑圧スペクトルをそれぞれ時間領域信号に戻し、得られた複数の時間領域信号の中で最も大きいものを選択するように構成してもよい。
雑音抑圧スペクトルを時間領域信号に戻す手段としては、周波数・時間変換部7と同一のものを適用することが可能である。また、前後フレームとの滑らかな接続のための窓掛け処理を行う前に、値が最も大きいものを選択するように構成してもよい。
以上のように、この実施の形態3によれば、複数の雑音抑圧部が出力した複数の雑音抑圧スペクトルを時間領域信号に戻し、得られた複数の時間領域信号の中で値が最も大きいものを選択するように構成したので、過抑圧されていない信号が選択されることで、ミュージカルノイズを大きく軽減でき、音声信号区間における不安定な変動が少ない高品質な雑音抑圧装置を実現することができる。
また、時間領域信号の大小比較に基づき信号選択を行うので、音声・雑音判定などに基づいて雑音抑圧部の出力の一方を選択する従来技術のように雑音抑圧部が全周波数成分を一括して切り替えることがなく、信号の大きな変動の発生を抑制し、音声・雑音判定の誤りによる品質劣化を防止することができる。
以上のように、この発明は耳障りな雑音(ミュージカルノイズ)の発生を軽減し高品質な雑音抑圧に優れ、種々の雑音環境下でも用いられる音声通信システムや音声認識システムに幅広く適用することができる。

Claims (4)

  1. 雑音が含まれる音声信号の入力スペクトルに対して雑音抑圧処理を行い、得られた雑音抑圧スペクトルを出力する複数の雑音抑圧部と、
    各周波数成分毎に、前記複数の雑音抑圧スペクトルの値を比較し、最大値を有する雑音抑圧スペクトルを選択して当該周波数成分のスペクトルとして出力する選択部とを備え
    前記各周波数成分のスペクトルにより過抑圧を抑制することを特徴とする雑音抑圧装置。
  2. 雑音抑圧部は、第1の雑音抑圧部を有し、
    前記第1の雑音抑圧部は、入力スペクトルに対して振幅抑圧ゲインを乗じることにより雑音抑圧スペクトルを生成し、
    前記第1の雑音抑圧部の振幅抑圧ゲインは、他の雑音抑圧部の雑音信号区間のおける振幅抑圧ゲインよりも大きいことを特徴とする請求項1記載の雑音抑圧装置。
  3. 第1の雑音抑圧部は、入力スペクトルおよび過去のフレームから推定された雑音スペクトルに基づき算出される推定SN比が高い場合には振幅抑圧ゲインを大きい値とし、前記推定SN比が低い場合には振幅抑圧ゲインを小さい値とすることを特徴とする請求項2記載の雑音抑圧装置。
  4. 雑音抑圧部は、第2の雑音抑圧部を有し、
    前記第2の雑音抑圧部は、スペクトル減算処理を行う減算部と、スペクトル振幅の抑圧を行う振幅抑圧部とを備えたことを特徴とする請求項2記載の雑音抑圧装置。
JP2010536590A 2008-11-04 2008-11-04 雑音抑圧装置 Active JP5300861B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2008/003162 WO2010052749A1 (ja) 2008-11-04 2008-11-04 雑音抑圧装置

Publications (2)

Publication Number Publication Date
JPWO2010052749A1 JPWO2010052749A1 (ja) 2012-03-29
JP5300861B2 true JP5300861B2 (ja) 2013-09-25

Family

ID=42152566

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010536590A Active JP5300861B2 (ja) 2008-11-04 2008-11-04 雑音抑圧装置

Country Status (5)

Country Link
US (1) US8737641B2 (ja)
EP (1) EP2362389B1 (ja)
JP (1) JP5300861B2 (ja)
CN (1) CN102132343B (ja)
WO (1) WO2010052749A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103824563A (zh) * 2014-02-21 2014-05-28 深圳市微纳集成电路与***应用研究院 一种基于模块复用的助听器去噪装置和方法

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2546831B1 (en) * 2010-03-09 2020-01-15 Mitsubishi Electric Corporation Noise suppression device
JP5588233B2 (ja) * 2010-06-10 2014-09-10 日本放送協会 雑音抑圧装置およびプログラム
JP5724361B2 (ja) * 2010-12-17 2015-05-27 富士通株式会社 音声認識装置、音声認識方法および音声認識プログラム
DE112011105791B4 (de) * 2011-11-02 2019-12-12 Mitsubishi Electric Corporation Störungsunterdrückungsvorrichtung
JPWO2013111360A1 (ja) * 2012-01-27 2015-05-11 三菱電機株式会社 高周波電流低減装置
JP6182895B2 (ja) * 2012-05-01 2017-08-23 株式会社リコー 処理装置、処理方法、プログラム及び処理システム
JP6027804B2 (ja) * 2012-07-23 2016-11-16 日本放送協会 雑音抑圧装置およびそのプログラム
JP2014145838A (ja) * 2013-01-28 2014-08-14 Honda Motor Co Ltd 音響処理装置及び音響処理方法
US9601130B2 (en) * 2013-07-18 2017-03-21 Mitsubishi Electric Research Laboratories, Inc. Method for processing speech signals using an ensemble of speech enhancement procedures
JP6379839B2 (ja) * 2014-08-11 2018-08-29 沖電気工業株式会社 雑音抑圧装置、方法及びプログラム
US20160379661A1 (en) * 2015-06-26 2016-12-29 Intel IP Corporation Noise reduction for electronic devices
CN108292501A (zh) * 2015-12-01 2018-07-17 三菱电机株式会社 声音识别装置、声音增强装置、声音识别方法、声音增强方法以及导航***
JP6668995B2 (ja) * 2016-07-27 2020-03-18 富士通株式会社 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
CN107786709A (zh) * 2017-11-09 2018-03-09 广东欧珀移动通信有限公司 通话降噪方法、装置、终端设备及计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004341339A (ja) * 2003-05-16 2004-12-02 Mitsubishi Electric Corp 雑音抑圧装置
JP2004347956A (ja) * 2003-05-23 2004-12-09 Toshiba Corp 音声認識装置、音声認識方法及び音声認識プログラム
JP2005195955A (ja) * 2004-01-08 2005-07-21 Toshiba Corp 雑音抑圧装置及び雑音抑圧方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3327058A (en) * 1963-11-08 1967-06-20 Bell Telephone Labor Inc Speech wave analyzer
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
JP2950260B2 (ja) * 1996-11-22 1999-09-20 日本電気株式会社 雑音抑圧送話装置
US6122384A (en) * 1997-09-02 2000-09-19 Qualcomm Inc. Noise suppression system and method
US6088668A (en) 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing
JP3454190B2 (ja) 1999-06-09 2003-10-06 三菱電機株式会社 雑音抑圧装置および方法
FR2797343B1 (fr) * 1999-08-04 2001-10-05 Matra Nortel Communications Procede et dispositif de detection d'activite vocale
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
JP5086442B2 (ja) * 2007-12-20 2012-11-28 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 雑音抑圧方法及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004341339A (ja) * 2003-05-16 2004-12-02 Mitsubishi Electric Corp 雑音抑圧装置
JP2004347956A (ja) * 2003-05-23 2004-12-09 Toshiba Corp 音声認識装置、音声認識方法及び音声認識プログラム
JP2005195955A (ja) * 2004-01-08 2005-07-21 Toshiba Corp 雑音抑圧装置及び雑音抑圧方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103824563A (zh) * 2014-02-21 2014-05-28 深圳市微纳集成电路与***应用研究院 一种基于模块复用的助听器去噪装置和方法

Also Published As

Publication number Publication date
US8737641B2 (en) 2014-05-27
WO2010052749A1 (ja) 2010-05-14
US20110123045A1 (en) 2011-05-26
EP2362389B1 (en) 2014-03-26
JPWO2010052749A1 (ja) 2012-03-29
EP2362389A1 (en) 2011-08-31
CN102132343A (zh) 2011-07-20
EP2362389A4 (en) 2012-07-25
CN102132343B (zh) 2014-01-01

Similar Documents

Publication Publication Date Title
JP5300861B2 (ja) 雑音抑圧装置
JP5153886B2 (ja) 雑音抑圧装置および音声復号化装置
CN111899752B (zh) 快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端
US8521530B1 (en) System and method for enhancing a monaural audio signal
EP1252796B1 (en) System and method for dual microphone signal noise reduction using spectral subtraction
JP4423300B2 (ja) 雑音抑圧装置
JP3568922B2 (ja) エコー処理装置
JP4836720B2 (ja) ノイズサプレス装置
KR101088627B1 (ko) 잡음 억압 장치 및 잡음 억압 방법
US8804980B2 (en) Signal processing method and apparatus, and recording medium in which a signal processing program is recorded
CN104050971A (zh) 声学回声减轻装置和方法、音频处理装置和语音通信终端
US9454956B2 (en) Sound processing device
KR101791444B1 (ko) 동적 마이크로폰 신호 믹서
KR101088558B1 (ko) 잡음 억압 장치 및 잡음 억압 방법
JP2008216721A (ja) 雑音抑圧の方法、装置、及びプログラム
CN112151060B (zh) 单通道语音增强方法及装置、存储介质、终端
US8406430B2 (en) Simulated background noise enabled echo canceller
JP4413205B2 (ja) エコー抑圧方法、装置、エコー抑圧プログラム、記録媒体
JP5413575B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP6182862B2 (ja) 信号処理装置、信号処理方法、及び信号処理プログラム
US20160005418A1 (en) Signal processor and method therefor
JP4209348B2 (ja) エコー抑圧方法、この方法を実施する装置、プログラムおよび記録媒体
Dam et al. Optimization of Sigmoid Functions for Approximation of Speech Presence Probability and Gain Function in Speech Enhancement

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130521

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130618

R150 Certificate of patent or registration of utility model

Ref document number: 5300861

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250