JP2010102201A - 雑音抑圧装置及び雑音抑圧方法 - Google Patents

雑音抑圧装置及び雑音抑圧方法 Download PDF

Info

Publication number
JP2010102201A
JP2010102201A JP2008274858A JP2008274858A JP2010102201A JP 2010102201 A JP2010102201 A JP 2010102201A JP 2008274858 A JP2008274858 A JP 2008274858A JP 2008274858 A JP2008274858 A JP 2008274858A JP 2010102201 A JP2010102201 A JP 2010102201A
Authority
JP
Japan
Prior art keywords
noise
gain
noise suppression
frame
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008274858A
Other languages
English (en)
Other versions
JP5526524B2 (ja
Inventor
Onsai Ryu
恩彩 劉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2008274858A priority Critical patent/JP5526524B2/ja
Priority to KR1020090101092A priority patent/KR101088558B1/ko
Priority to CN2009102055351A priority patent/CN101727911B/zh
Publication of JP2010102201A publication Critical patent/JP2010102201A/ja
Application granted granted Critical
Publication of JP5526524B2 publication Critical patent/JP5526524B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/083Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

【課題】 ミュージカルノイズを発生させず、また、音声フレーム及び雑音フレーム間の切り替り場面でも雑音量の変化が自然であるような、雑音抑圧装置を提供する。
【解決手段】 K個の周波数帯域ごと(ただし、Kは2以上の自然数)に、入力信号に含まれる雑音スペクトルを推定する雑音スペクトル推定部(20)と、その推定結果に基づいて、前記K個の周波数帯域ごとの雑音抑圧ゲインを算出する雑音抑圧ゲイン演算部(30)と、前記入力信号に前記雑音抑圧ゲインを適用した結果得られる第1雑音抑圧後信号に、当該雑音抑圧ゲインと目標雑音抑圧ゲインとの差に基づいて定められた第1割合で、前記入力信号を加算する原音加算手段(図中、符号50・60参照)と、を備える。
【選択図】図1

Description

本発明は、雑音抑圧装置及び雑音抑圧方法に関する。
従来、入力信号に応じてスピーカ等の負荷を駆動する音声再生装置、遠隔地間で音声を伝達する音声通信装置、音声の種別等を区別・認識することでその意味等を理解する音声認識装置、等々が提案されている。これら各装置では、音声を正確に再生し、伝達し、あるいは認識等するため、そこに含まれる雑音の影響が除去されるのが好適である。
そのような雑音抑圧の技術としては、例えば以下の特許文献1及び2、並びに非特許文献1乃至5に開示されているようなものが知られている。
特開2007−226264号公報 特開2005−257748号公報 Boll,S., "Suppression of acoustic noise in speech using spectral subtraction", IEEE Trans.Vol.ASSP-27, No2, pp.113-120, 1979. M.Berouti, el al, "Enhancement of Speech Corrupted by Acoustic Noise", Proceedings of ICASSP, pp.201-211, 1979. Lim & Oppenheim, "Enhancement and Bandwidth Compression of Noisy Speech", Proc.IEEE, Vol67, No12, pp.1586-1604, 1979 Y.Ephraim and D.Malah, "Speech Enhancement Using a Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator", IEEE Trans.Vol.ASSP-32, No.6, pp1109-1121, 1984.. 佐々木潤子、田中雅史,"マスキング効果を用いた低歪み雑音低減方式の検討",信学技報,EA98-106, pp.37-42, 1998
これら各文献に開示される技術は、基本的に、周波数領域の振幅スペクトルのレベルを適当な手法によって差し引くことによって雑音を抑圧する手法、即ちいわゆるスペクトラル・サブトラクション法(Spectral Subtraction)に関連し、これらいずれの技術よっても、一定の雑音抑圧効果が享受され得る。
しかしながら、これらの文献においては未開示・未解決の課題はなおある。
例えば、前記のスペクトラル・サブトラクション法は、入力信号中に含まれる雑音スペクトルを推定し、その雑音スペクトル推定値を、振幅スペクトルから差し引く手法に基づくが、この場合、いわゆるミュージカルノイズが発生するおそれが高いという問題がある。これは、ここでいう雑音スペクトル推定値が、必ずしも、実際の雑音スペクトルを反映するとは限らないことによる。つまり、ある周波数帯域では、雑音スペクトル推定値を差し引いた後にもなお雑音が残る場合があり、また、他の周波数帯域では、引き過ぎが生じる場合があるのである。このため、雑音スペクトル差し引き後の振幅スペクトルを時間領域に再変換すると、複数のランダムな周波数をもつ正弦波が合成されたものが現れる可能性があり、これが再生されることによって、非常に耳障りな雑音(即ち、ミュージカルノイズ)が発生してしまうおそれがあるのである。
また、このミュージカルノイズを抑圧するため、雑音スペクトル推定値を差し引いた後の振幅スペクトルに、原音を加算する処理を行うことが提案されている(前記非特許文献5参照)。
しかし、この技術では、原音加算割合が、入力信号のSNRを推定することに基づき定められるようになっているので、雑音抑圧処理のいわば柔軟性に若干欠ける嫌いがある。例えば、前記非特許文献5では、SNRが10〜15〔dB〕であることを基準に、SNRがそれ以上の時は原音加算割合が0.05、それを下回る時は0.5、などというように、本来抑圧したい、あるいは、抑圧すべき雑音量とは無関係に、原音加算割合の設定が行われるため、実際上享受される雑音抑圧効果に若干の問題があるのである。このような事情は、前述した特許文献2においてもあてはまる。
さらに、入力信号中には、主に音声が占める部分(音声部分)と、それが殆どない部分(雑音部分)とが存在する。
このような状況下で、例えば、前述の非特許文献1のように、音声部分にはスペクトラル・サブトラクション法を適用するが、雑音部分には固定ゲインを適用して雑音を抑圧するという場合、その固定ゲインの値が過小のときは、雑音部分から音声部分への切り替わりの場面において、背景雑音量が大きくなるという現象が生じ、固定ゲインの値が過大のときは、逆に背景雑音量が小さくなるという現象が生じ得る。これが例えば再生されれば、聴取者に、聴感上の不自然さを感じさせるおそれが高い。
本発明は、上述した課題の少なくとも一部を解決することの可能な雑音抑圧装置及び雑音抑圧方法を提供することを課題とする。
本発明に係る雑音抑圧装置は、上述した課題を解決するため、K個の周波数帯域ごと(ただし、Kは2以上の自然数)に、入力信号に含まれる雑音スペクトルを当該入力信号に基づいて推定する雑音スペクトル推定手段と、前記雑音スペクトル推定手段による推定結果に基づいて、前記K個の周波数帯域ごとの雑音抑圧ゲインを算出する第1ゲイン演算手段と、前記入力信号に前記雑音抑圧ゲインを適用した結果得られる第1雑音抑圧後信号に、当該雑音抑圧ゲインと目標雑音抑圧ゲインとの差に基づいて定められた第1割合で、前記入力信号を加算する原音加算手段と、を備える。
本発明によれば、まず、原音加算手段が、第1雑音抑圧後信号に入力信号を加算するようになっているので、例えば前述したような雑音スペクトル推定値による振幅スペクトルの引き過ぎの事例が発生したとしても、その部分が当該原音によっていわば埋め合わせされるようなかたちになるので、前記ミュージカルノイズの発生がきわめて実効的に抑圧される。
しかも、本発明においては、原音加算割合としての意義をもつ「第1割合」が、雑音抑圧ゲインと目標雑音抑圧ゲインとの差に基づいて定められるようになっているので、実際上享受される雑音抑圧効果がきわめて実効的になる。というのも、本発明の場合、前述の例のようにSNR推定値と基準値との単純な比較によるのではなく、当該の「第1割合」が、目標雑音抑圧ゲインとの関係において定められ、また、この目標雑音抑圧ゲインは、本来抑圧したい、あるいは抑圧すべき雑音量に基づいて設定され得るものであるからである。
なお、本発明にいう「目標雑音抑圧ゲイン」は、本発明に係る雑音抑圧装置外部に設置された操作部等を介することによって人為的に与えられるようにしたり、あるいは、何らかの適当な手法により自動的に演算されるようにしてよい。
この発明に係る雑音抑圧装置では、前記雑音抑圧ゲインについての、前記K個の周波数帯域に関する平均値ゲインを算出する第2ゲイン演算手段を更に備え、前記原音加算手段は、前記入力信号に前記平均値ゲインを適用した結果得られる第2雑音抑圧後信号に、当該平均値ゲインと前記目標雑音抑圧ゲインとの差に基づいて定められた第2割合で、前記入力信号を加算する、ように構成してもよい。
この態様によれば、第2雑音抑圧後信号に、「第2割合」で、入力信号が加算される。
ここで本態様では、「平均値ゲイン」が用いられることに特徴の1つがある。この平均値ゲインは、仮に、前記の雑音抑圧ゲインが、G(1),G(2),…,G(K)であるとすると、例えば、その平均値ゲインたるGaveが、Cave=(G(1)+G(2)+…+G(K))/Kなどとして求められる。そして、さらに、入力信号を、周波数領域に変換して得られる振幅スペクトルが、Y(1),Y(2),…,Y(K)であるとすると、周波数領域にある出力信号は、Gave・Y(1),Gave・Y(2),…,Gave・Y(K)、などと得られることになる(これは、本態様にいう「平均値ゲインを適用した結果得られる第2雑音抑圧後信号」の一具体例である。)。
したがって、まず、このような平均値ゲインの存在によれば、例えば前述したような雑音スペクトル推定値による振幅スペクトルの引き過ぎの事例等が発生することがないから、ミュージカルノイズの発生がきわめて実効的に抑圧される。
のみならず、本態様では更に、このような平均値ゲインと前記目標雑音抑圧ゲインとの差に基づいて定められた第2割合で、原音加算が行われるようになっているので、ミュージカルノイズの抑圧効果は更に効果的に享受されることになる。
なお、本態様にいう「第2雑音抑圧後信号に、…第2割合で、…入力信号を加算する」と、前記の「第1雑音抑圧後信号に、…第1割合で、…入力信号を加算する」との関係は、次のようである。
まず、「第1雑音抑圧後信号」の生成及び「第1割合」の定立の双方に「雑音抑圧ゲイン」が関わり、前者は後者に基づく原音加算処理の対象となる一方、「第2雑音抑圧後信号」の生成及び「第2割合」の定立の双方に「平均値ゲイン」が関わり、前者は後者に基づく原音加算処理の対象となる、という概念上の区別を確認する。
この前提で、まず、本態様にいう「平均値ゲイン」が算出される以上は、本発明に係る「原音加算手段」は、その「平均値ゲイン」に基づく「第2割合」による原音加算を行うだけで、「第1割合」による原音加算は行わないという関係が、本発明においては成立しうる。つまり、この場合は、本態様が、前述の「第1割合」を含む態様に対して、いわば優先的地位に立つ。
あるいは、入力信号中のある部分では「第1割合」による原音加算が、他の部分では「第2割合」による原音加算が行われる、などといった態様も、本発明においては成立しうる(この場合、前者の部分は「第1雑音抑圧後信号」に関連し、後者の部分は「第2雑音抑圧後信号」に関連するということになる。)。
さらに、場合によっては、「第2雑音抑圧後信号」に「第2割合」による原音加算を行うだけでなく、「第1雑音抑圧後信号」にも「第2割合」による原音加算を行う、などといった態様も、本発明は特にその範囲内に収める(かかる態様は、本発明の各種態様の1つとして、後に言及される。)。このことはつまり、「平均値ゲイン」でなく「雑音抑圧ゲイン」の関与で成立する「第1雑音抑圧後信号」にも、「平均値ゲイン」に基づいて定められる「第2割合」の適用があってよいことを含意する(場合によっては、その逆も然りである。)。
また、本発明に係る雑音抑圧装置では、前記原音加算手段は、前記第1又は第2割合を時間軸上で平滑化した平滑化割合を算出し、前記第1又は第2雑音抑圧後信号に、前記平滑化割合で、前記入力信号を加算する、ように構成してもよい。
この態様によれば、前記第1又は第2割合を時間軸上で平滑化した平滑化割合が算出される。したがって、この平滑化割合は、「第1割合」又は「第2割合」が、前述の「差」に基づいて定立された後、なおこれらが平滑化処理を受けたものである。なお、「時間軸上で平滑化」とは、算出後の平滑化割合が、時系列に沿って、OGsmt-T(1),OGsmt-T(2),…,OGsmt-T(r),…、とあるとすると(rは適当な整数)、例えば、適当な平滑化係数δを用いて、OGsmt-T(r)=δ・OGsmt-T(r−1)+(1−δ)・ogなどとして算出されることを意味する(ただし、ogは、「第1割合」又は「第2割合」である。)。
これによれば、第1又は第2割合(正確に言うと、平滑化された第1又は第2割合。つまり、本態様に言う「平滑化割合」)の時間の経過に従った急激な変化が生じないから、雑音抑圧処理の連続性・一貫性が維持される。
なお、本発明においては、後述するように、経時的に区分されたフレーム毎の処理が行われると好適であるが、その場合、本態様にいう「時間軸」は、より具体的には、そのフレームの1個1個が順に並べられていく場合に観念される軸、として想定され得る。この点についての、より詳細な具体例については、後述する実施形態、特に式(7)に関して説明される。
また、本態様に関連して、本態様にいう「第1割合」又は「第2割合」は、後述する実施形態においては、「原音加算率og」として、同じく「平滑化割合」は「原音加算割合OG」として、それぞれ具体化されて説明される。
また、前記の「平均値ゲイン」等の概念を含む本発明の態様では、前記入力信号に含まれる音声の有無を検出することで、当該入力信号を、経時的に、当該音声が含まれる音声フレーム及び当該音声が含まれない雑音フレームに区分する音声検出手段を更に備え、前記第2雑音抑圧後信号は、前記入力信号のうち前記雑音フレームに該当する部分に、前記平均値ゲインを適用した結果得られる、ように構成してもよい。
この態様によれば、前述の平均値ゲインが、雑音フレームに、より好適には雑音フレームだけに適用されて、第2雑音抑圧後信号が生成される(そして、この第2雑音抑圧後信号は、前記第2割合による原音加算処理を受ける。)。雑音フレームでは、ミュージカルノイズが比較的に発生しやすいことからすると、本態様は、それを狙うかの如く平均値ゲインの適用を行うことになるので、ミュージカルノイズ抑圧効果を得るための最適な態様の1つということができる。
なお、本態様において、音声が「含まれる」あるいは「含まれない」という用語は、いわば絶対的な意味に解されてはならない。例えば、“すべてが音声”で満たされるフレームと、“全く音声が不存在”のフレームという2つの態様が観念的には想定されるが、この両者両極端を指して「音声フレーム」及び「雑音フレーム」の区別が行われる場合に本態様が限定されるわけでは勿論なく、また、後者のみが「雑音フレーム」で、それ以外はすべて「音声フレーム」という区別が行われる場合に、本態様が限定されるわけでもない。つまり、本態様は、「雑音フレーム」と認定される場合においても、当該の雑音フレームに「音声」が全く含まれてはならないということまで要求せず、本態様にいう「音声フレーム」及び「雑音フレーム」の区別は、上記の2つの場合の適当な中間点を基準に行われてよいのである。
以上のような意味において、本態様にいう「含まれる」あるいは「含まれない」という用語、あるいは、本態様に係る「音声フレーム」及び「雑音フレーム」の区別は、相対的なものということができる。
この態様では、前記第1雑音抑圧後信号は、前記入力信号のうち前記音声フレームに該当する部分に、前記雑音抑圧ゲインを適用した結果得られる、ように構成してもよい。
この態様によれば、前述の雑音抑圧ゲインが、音声フレームに適用されて、第1雑音抑圧後信号が生成される(そして、この第1雑音抑圧後信号は、前記第1割合による原音加算処理を受ける。)。この態様は、すぐ前に述べた態様と併存可能であるが、その場合、好適には、音声フレームでは、平均化処理を経ないいわば通常の雑音抑圧ゲインのみが利用され、雑音フレームでは、平均化処理を経た、平均値ゲインのみが利用される、ということになる。音声フレームでは、雑音の存在が然程目立たず、雑音フレームでは、その逆であるという事情に鑑みるなら、本態様に係る処理内容は、きわめて合理的・効率的・実効的な雑音抑圧効果を享受可能にする。
この態様では、前記原音加算手段は、前記第1雑音抑圧後信号に、前記第1割合に代えて前記第2割合で、前記入力信号を加算する、ように構成してもよい。
この態様によれば、「第2雑音抑圧後信号」に「第2割合」による原音加算を行うだけでなく、「第1雑音抑圧後信号」にも「第2割合」による原音加算を行うことになる。つまり、この場合、「平均値ゲイン」でなく「雑音抑圧ゲイン」の関与で成立する「第1雑音抑圧後信号」にも、「平均値ゲイン」に基づいて定められる「第2割合」による原音加算処理が行われるのである。
これによれば、原音加算割合として利用されるものが、「第2割合」に一本化されるので、処理の効率化等が実現される。
また、「音声フレーム」に「雑音抑圧ゲイン」を適用して「第1雑音抑圧後信号」を得る態様では、前記原音加算手段は、前記音声フレームに係る前記第1雑音抑圧後信号に前記入力信号を加算しようとする場合は、当該音声フレームに直近の雑音フレームに関して既に算出された前記第2割合を、当該音声フレームにおける前記第1割合であるものとして、前記第1雑音抑圧後信号に前記入力信号を加算する、ように構成してもよい。
この態様によれば、音声フレームにおける原音加算処理では、その直近に処理された雑音フレームにおいて利用された原音加算割合(即ち、「第2割合」)が、その原音加算割合(即ち、「第1割合」)であるものとして利用される。つまり、この場合、その実質は直近の雑音フレームの「第2割合」の値であるのに、あたかもそれが、当該音声フレームにおける「第1割合」の値であるかのように擬制されるということである。
このようなことから、本態様においては、直近の雑音フレームで実行された雑音抑圧処理が、それに続く音声フレームにおける雑音抑圧処理にいわば引き継がれるようなことになり、雑音フレームから音声フレームへの切り替わりの場面において、雑音抑圧処理の一貫性が保持される。これにより、当該切り替わりの場面において、雑音量が急激に変化するといった現象の発生が未然に防止される。
なお、この態様は、第1雑音抑圧後信号に第1割合で原音を加算し、第2雑音抑圧後信号に第2割合で原音を加算するという態様が並存し、かつ、前者は入力信号中の雑音フレームに関し、後者は音声フレームに関するということを前提とする。
あるいは、「音声フレーム」に「雑音抑圧ゲイン」を適用して「第1雑音抑圧後信号」を得る態様では、前記原音加算手段は、前記雑音フレームに係る前記第2雑音抑圧後信号に前記入力信号を加算しようとする場合は、一時的第2割合を算出した後、当該雑音フレームの直前のフレームにおける前記第1又は第2割合を用いて、当該一時的第2割合を時間軸上で平滑化した平滑化割合を算出し、この平滑化割合を前記第2割合であるものとして、前記第2雑音抑圧後信号に前記入力信号を加算し、前記音声フレームに係る前記第1雑音抑圧後信号に前記入力信号を加算しようとする場合は、当該音声フレームの直前のフレームにおける前記第1又は第2割合を、当該音声フレームにおける前記第1割合であるものとして、前記第1雑音抑圧後信号に前記入力信号を加算する、ように構成してもよい。
この態様によれば、音声フレーム及び雑音フレームそれぞれについての第1又は第2割合が好適に定立される。雑音フレームに関しては、平滑化割合が算出されるので、雑音抑圧処理の一貫性・連続性が保持されるし、音声フレームに関しては、前述したような「直近の雑音フレーム」における雑音スペクトルの維持が好適になされる(つまり、本態様によれば、ある雑音フレームについての第2割合が既に設定されているなら、その後、音声フレームが続く限りは、当該第2割合の値が、新たな第1割合の値として維持され続ける。)。この点についての、より詳細な具体例については、後述する実施形態、特に式(7)に関して説明される。
なお、本態様において、単に「フレーム」という場合、それは「音声フレーム」である場合も、「雑音フレーム」である場合もある。
また、この態様は、第1雑音抑圧後信号に第1割合で原音を加算し、第2雑音抑圧後信号に第2割合で原音を加算するという態様が並存し、かつ、前者は入力信号中の雑音フレームに関し、後者は音声フレームに関するということを前提とする。
さらに、本態様に関連して、本態様にいう「第1割合」、「第2割合」及び「平滑化割合」等は、後述する実施形態においては、「原音加算率og」あるいは「原音加算割合OG」などとして具体化されて説明されるが、この場合、前者における1つの言葉が、後者における1つの言葉に、1対1で対応するという関係は成立しないことに注意を要する。
また、本発明に係る雑音抑圧装置では、前記第1又は第2割合は、以下の式(A)によって求められる、ように構成してもよい。
og=max(0,tg−G) …… (A)
ここで、ogは、求めるべき第1又は第2割合、tgは、前記目標雑音抑圧ゲイン、Gは、前記雑音抑圧ゲイン又は前記平均値ゲイン、max(a,b)は、a及びbのうちいずれか大きい値を返す関数を意味する。
この態様によれば、第1又は第2割合が好適に算出される。この点についての、より詳細な具体例については、後述する実施形態、特に式(5)に関して説明される。
一方、本発明に係る雑音抑圧方法は、上記課題を解決するため、K個の周波数帯域ごと(ただし、Kは2以上の自然数)に、入力信号に含まれる雑音スペクトルを当該入力信号に基づいて推定する雑音スペクトル推定工程と、前記雑音スペクトル推定工程における推定結果に基づいて、前記K個の周波数帯域ごとの雑音抑圧ゲインを算出する第1ゲイン演算工程と、前記入力信号に前記雑音抑圧ゲインを適用した結果得られる第1雑音抑圧後信号に、当該雑音抑圧ゲインと目標雑音抑圧ゲインとの差に基づいて定められた第1割合で、前記入力信号を加算する原音加算工程と、を含む。
本発明によれば、上述した、本発明に係る雑音抑圧装置に関して述べた作用効果と本質的に異ならない作用効果が奏されることが明白である。
この発明に係る雑音抑圧方法では、前記雑音抑圧ゲインについての、前記K個の周波数帯域に関する平均値ゲインを算出する第2ゲイン演算工程を更に含み、前記原音加算工程では、前記入力信号に前記平均値ゲインを適用した結果得られる第2雑音抑圧後信号に、当該平均値ゲインと前記目標雑音抑圧ゲインとの差に基づいて定められた第2割合で、前記入力信号が加算される、ように構成してもよい。
この態様によれば、上述した、本発明に係る雑音抑圧装置の各種態様のうち、第2雑音抑圧後信号に第2割合で入力信号が加算される態様に関して述べた作用効果と本質的に異ならない作用効果が奏されることが明白である。
なお、本態様にいう「第2雑音抑圧後信号に、…第2割合で、…入力信号を加算する」と、前記の「第1雑音抑圧後信号に、…第1割合で、…入力信号を加算する」との関係については、上述と同様である。
また、本発明に係る雑音抑圧方法では、前記入力信号に含まれる音声の有無を検出することで、当該入力信号を、経時的に、当該音声が含まれる音声フレーム及び当該音声が含まれない雑音フレームに区分する音声検出工程を更に含み、前記第2雑音抑圧後信号は、前記入力信号のうち前記雑音フレームに該当する部分に、前記平均値ゲインを適用した結果得られる、ように構成してもよい。
この態様によれば、上述した、本発明に係る雑音抑圧装置の各種態様のうち、雑音フレームに平均値ゲインを適用する態様に関して述べた作用効果と本質的に異ならない作用効果が奏されることが明白である。
なお、本態様にいう「含まれる」あるいは「含まれない」という用語の意義については、上述と同様である。
以上のほか、本発明の、より具体化された態様、あるいはそれによって奏される作用効果は、すぐ後から始まる実施形態における記載において明らかにされる。
<第1実施形態>
以下では、本発明に係る第1の実施の形態について図1を参照しながら説明する。なお、ここに言及した図1に加え、以下で参照する各図面(例えば図6等のグラフをも含む。)においては、各部の寸法の比率が実際のものとは適宜に異ならせてある場合がある。
雑音抑圧装置1は、図1に示すように、時間・周波数変換部10、雑音スペクトル推定部20、雑音抑圧ゲイン演算部30、雑音期間・雑音抑圧ゲイン演算部40、原音加算率演算部50、原音加算ゲイン演算部60、周波数・時間変換部70、及び音声検出部80からなる。
時間・周波数変換部10は、時間領域の入力信号にフーリエ変換をかけて、周波数領域の信号に変換する。このフーリエ変換は、入力信号を経時的に所定数のフレームに分け、かつ、そのフレームに適当な窓関数をかけることを通じて行われるのが好適である。
前記の周波数領域の信号は、振幅スペクトル及び位相スペクトルに分けられ、このうちの位相スペクトルは、後述する周波数・時間変換部70にそのまま送られる。他方、振幅スペクトルは、後述する雑音スペクトル推定部20以後の各部に送られて、後述する各種の処理を受ける。
前記の時間領域の入力信号は、音声検出部80にも供給される。音声検出部80は、この入力信号の中の音声信号の有無を検出する。前述のように、入力信号がフレームに分けられる場合には、フレームごとの音声検出が行われる(なお、第1実施形態では、このような処理を前提とする。)。ここで「音声」とは特に、会話、話し言葉、音楽、各種の信号等々、人にとって有意味な音響を意味する。つまり、入力信号を適当な再生手段によって再生するとした場合、その入力信号中の「音声信号」を再生すれば、当該音響となる、という関係が成立する。
この音声信号は、例えば、入力信号のレベルが予め定めた閾値を超えるか否かを基準として検出される。もっとも、本発明は、これ以外にも様々な手法を採用することが可能である。例えば、確率・統計的手法を用いて音声信号の発生確率を推定する手法等が採用されてもよいし、あるいは、検出対象としても、前記入力信号を利用するのではなく、そのフーリエ変換後の信号(つまり、前記でいう周波数領域の信号)を利用する手法等が採用されてもよい。
なお、以下では、この音声検出部80によって音声信号が存在すると判定されたフレームは、「音声フレーム」と、不存在であると判定されたフレームは、「雑音フレーム」と、それぞれ呼ぶことがある。なお、ここで存在・不存在というのは、いわば絶対的な意義をもたない。前述のように、音声信号の有無が所定の閾値を基準に判断されることがある以上、「雑音フレーム」に、厳密に言えば音声信号と呼べるものが含まれている可能性は排除されない。
雑音スペクトル推定部20は、前記振幅スペクトルに基づいて、雑音スペクトルの推定値を算出する。第1実施形態では特に、以下の式(1)に基づいて、所定の個数に分割された周波数帯域ごとの雑音スペクトルが推定される。
Figure 2010102201

ここで、N(n)は、現に処理中であるフレームにおける雑音スペクトル推定値、Nt−1(n)は、その直前のフレームにおける雑音スペクトル推定値(したがって、“t”は、現に処理中であるフレームそれ自体を表現する添え字である。)、Y(n)は入力された振幅スペクトル、nは周波数帯域(に付けられた番号。なお、周波数帯域はN個に分割される。なお、このNは、本発明にいう「K個の周波数帯域」のK以下(=N≦K)である。)、βは平滑化係数である。また、式(1)中、case・Aとあるのは、雑音スペクトル推定部20が雑音フレームを処理する場合を表現し、case・Bとあるのは、音声フレームを処理する場合を表現している。
このように、雑音スペクトル推定部20は、現に処理しているフレームが、雑音フレームであるか音声フレームであるかに応じて、雑音スペクトル推定値N(n)を求めるために利用する式を変更する。すなわち、音声フレーム処理時(case・B)には、その直前の雑音スペクトル推定値をそのまま用いて雑音スペクトル推定値N(t)を求め、雑音フレーム処理時(case・A)には、入力した振幅スペクトルを時間軸上で平滑化することで、雑音スペクトル推定値N(n)を求める。
雑音抑圧ゲイン演算部30は、前記振幅スペクトルと、式(1)で求められた雑音スペクトル推定値N(n)とに基づいて、雑音抑圧ゲインを算出する。第1実施形態では特に、以下の式(2)により雑音抑圧ゲインを算出する。
Figure 2010102201

ここで、max(a,b)は、a及びbのうちいずれか大きい値を返す関数を意味する(以下、同じ。)。
この式(2)により、入力された振幅スペクトルY(n)に対する雑音スペクトル推定値N(n)との間において、Y(n)<N(n)が成立する場合は、G(n)=0となり、Y(n)>N(n)が成立する場合は、G(n)=(Y(n)−N(n))/Y(n)となる。
この雑音抑圧ゲイン演算部30で算出された雑音抑圧ゲインは、前記音声検出部80によって区分された音声フレーム及び雑音フレームの別に応じて、雑音期間・雑音抑圧ゲイン演算部40を介して又は直接に、原音加算ゲイン演算部60に供給される。図1に示す雑音抑圧装置1は、このような処理を実現するためのスイッチを備える(図中弧線矢印参照)。
雑音期間・雑音抑圧ゲイン演算部40(以下、簡単のため、「雑音期間用ゲイン演算部40」ということがある。)は、雑音フレームに適用すべき雑音抑圧ゲインを算出する。第1実施形態においては、この雑音抑圧ゲインを算出するために、以下の手法がとられる。
まず、式(2)で求められた雑音抑圧ゲインG(n)に基づいて、以下の式(3)で表現されるgが算出される。
Figure 2010102201

このgは、式(3)の右辺から明らかなように、式(2)の雑音抑圧ゲインについての、周波数帯域nに関する平均値を意味する。
次いで、この式(3)の雑音抑圧ゲイン平均値gが、以下の式(4)によって平滑化される。
Figure 2010102201

ここで、μは平滑化係数、Gは、現に処理中である雑音フレームについての雑音抑圧ゲイン、Gt−1は、その直前に処理した雑音フレームについての雑音抑圧ゲインである。
前述の式(1)のcase・Aとして示される式もそうであるが、この式(4)では、現に処理中のフレームにおける雑音抑圧ゲインを求めるにあたって、その直前に処理されたフレームにおけるそれが参照されていることから、時間軸上で平滑化が行われているということがいえる(後述する式(7)についても同様である。)。
この式(4)中のGが、本雑音期間用ゲイン演算部40において求められるべき、雑音期間に適用するための雑音抑圧ゲイン(以下、簡単のため、「雑音期間用ゲイン」ということがある。)である。
雑音期間用ゲイン演算部40は、このようにして求められた雑音期間用ゲインGを、すべての周波数帯域に対して一律に適用する。以下では、この事情を表現するため、この一律に適用されるGを、G1(n)と表現する。この場合、G1(0),G1(1),…,G1(N−1)のすべてが、Gに等しい。
原音加算率演算部50は、雑音抑圧された信号に対する、原音信号の原音加算率を算出する。第1実施形態では特に、この原音加算率ogが、以下の式(5)に基づいて求められる。
Figure 2010102201

ここで、tgは、目標雑音抑圧ゲインであり、以下の式(6)に基づいている。
Figure 2010102201

この式(6)中のTGは、目標雑音抑圧量であり、dB単位で与えられる。このTG(あるいは、tg)は、装置外部から図示しない操作部等を介することによって人為的に与えられたり、あるいは、何らかの適当な手法により自動的に演算されてよい。
以上の式(5)によれば、目標雑音抑圧ゲインtgと雑音期間用ゲインGとの間において、tg<Gが成立する場合は、og=0となり、tg≧Gが成立する場合は、og=tg−Gとなる。
原音加算ゲイン演算部60は、前記の原音加算率ogに基づいて、原音加算後の雑音抑圧ゲインを算出する。第1実施形態においては、この雑音抑圧ゲインを算出するために、以下の手法がとられる。
まず、式(5)で求められた原音加算率ogに基づいて、以下の式(7)で表現されるOGが算出される。
Figure 2010102201

ここでOGは、現に処理中であるフレームにおける原音加算割合、OGt−1は、その直前のフレームにおける原音加算割合、λは平滑化係数である。なお、式(7)中のcase・A及びcase・Bの意義は、上述の式(1)の場合と同様である(以下の式(8)においても同じである。)。
このように、原音加算ゲイン演算部60は、現に処理しているフレームが、雑音フレームであるか音声フレームであるかに応じて、原音加算割合OGを求めるために利用する式を変更する。すなわち、音声フレーム処理時(case・B)には、その直前の原音加算割合をそのまま用いて、原音加算割合OGを求め、雑音フレーム処理時(case・A)には、前記の原音加算率ogを時間軸上で平滑化することで、原音加算割合OGを求める。
次いで、原音加算ゲイン演算部60は、以下の式(8)に基づいて、原音加算後の雑音抑圧ゲインを求める。
Figure 2010102201

ここで、G1(n)は、上で説明したように、雑音フレームにおいて、すべての周波数帯域に対して一律に適用される雑音期間用ゲインを表している。
この式(8)によれば、前述の式(7)における場合分けに応じて、原音加算後の雑音抑圧ゲインG2(n)(以下、簡単のため、「修正後ゲインG2(n)」ということがある。)が求められる。
図1に示す乗算器11は、以上のようにして求められた修正後ゲインG2(n)を、振幅スペクトルY(n)にかける。すなわち、S(n)=G2(n)・Y(n)なる演算が行われ、その結果、最終的に得るべき雑音抑圧後の振幅スペクトルS(n)が得られる。
最後に、周波数・時間変換部70は、以上のようにして求められた雑音抑圧後の振幅スペクトルS(n)と、時間・周波数変換部10から直接的に供給される位相スペクトルに基づいて、時間領域の出力信号を生成する。第1実施形態では、時間・周波数変換部10においてフーリエ変換がかけられているので、周波数・時間変換部70は、逆フーリエ変換を実施する。
次に、以上に述べた第1実施形態に係る雑音抑圧装置1の作用ないし動作及び効果について、既に参照した図1に加えて、図2乃至図4を参照しながら説明する。
まず、時間・周波数変換部10は、入力信号に対して、フーリエ変換を施し、更にこれを、図1に示すように、振幅スペクトルY(n)及び位相スペクトルに分解する(図2のステップS101)。この際、時間・周波数変換部10は、前述のように、フレームごとの処理を実施する。
また、これと並行して、音声検出部80は、入力信号中に含まれる音声信号の有無を検出する(図2のステップS102)。この検出処理は、入力信号を、音声フレームと雑音フレームとに分別する処理を可能にする。音声検出部80は、当該の処理も行う。
次に、雑音スペクトル推定部20は、前述した振幅スペクトルY(n)、及び、前記式(1)によって、所定の幅を持つ周波数帯域nごとに雑音スペクトル推定値N(n)を求める。この場合、前述のように、現に処理しているフレームが雑音フレームであるか音声フレームであるかに応じて、異なる処理が行われる(図2のステップS103参照)。なお、図2に示すように、この雑音スペクトル推定値N(n)の算出処理以降は、図1に示す乗算器11による出力信号生成処理(図2のステップS104)までの間は、雑音フレームと音声フレームとの区別に応じて、その内容が実質的に異なる処理が展開される。したがって、以下では、第1に雑音フレーム用の処理について、第2に音声フレーム用の処理について、〔I〕及び〔II〕に分別して説明する。
なお、このような分別処理は、図1に示すように、音声検出部80の検出結果に応じたスイッチの切り替えによっている。
〔I〕 まず、雑音フレーム用処理では、前記式(1)のcase・Aとして示される式により、雑音スペクトル推定値N(n)が求められる(図2のステップS201)。前述のように、これは、入力した振幅スペクトルY(n)の平滑化処理による。
次に、前述の雑音スペクトル推定値N(n)、及び、前記式(2)に基づいて、雑音抑圧ゲインG(n)が算出される(図2のステップS202)。これは、図1の雑音抑圧ゲイン演算部30の作用による。前述のように、Y(n)>N(n)が成立する場合はG(n)=(Y(n)−N(n))/Y(n)となるが、そうでない場合は、G(n)=0となる。これによると、例えば、図3(C)のような雑音抑圧ゲインが得られることになる(なお、図3(B)では、前述の雑音スペクトル推定値N(n)、図3(A)では、入力信号の振幅スペクトルがそれぞれ例示されている。)。
次に、前記式(3)及び式(4)により、この雑音抑圧ゲインG(n)の、周波数帯域に関する平均値gをとり、かつ、そのgについての平滑化処理を行うことで、雑音期間用ゲインGが求められる(図2のステップS203)。この平均化・平滑化を経た雑音期間用ゲインGが、全周波数帯域に共通のG1(n)となる。これは、雑音期間用ゲイン演算部40の作用による。
このように、第1実施形態においては、式(2)により求められる雑音抑圧ゲインG(n)をそのままの状態で用いるのではなく、そのG(n)に対して、式(3)による周波数帯域に関する平均化、及び、式(4)による時間軸上の平滑化、を行った後の雑音期間用ゲインGを、全周波数帯域用の雑音期間用ゲインG1(n)として用いることに、その大きな特徴の1つがある。
なお、図3(D)では、雑音抑圧ゲインG(n)に対する平均化処理を行った場合の一例が例示されている(図3(C)中に示される破線も参照)。
次に、前述の雑音期間用ゲインG、及び、前記式(5)により、原音加算率ogが求められる(図2のステップS204)。これは、図1の原音加算率演算部50の作用による。ここでは、目標雑音抑圧ゲインtgないし目標雑音抑圧量TGの設定の如何が1つの支配的要因として働く。つまり、雑音期間用ゲインGが、目標雑音抑圧ゲインtgよりも大きくなれば、原音加算率ogは0に設定され、そうでなければ、雑音期間用ゲインGに応じた原音加算率og(即ち、og=tg−G)が設定される。この両者の使い分けは、原音を加算することによってもたらされる音質改善の効果を、目標雑音抑圧量TGとの関係でどのように享受するかを決める意義がある。すなわち、後者の場合は、目標雑音抑圧量によって定められる枠内(即ち、tgとGとの差にあたる部分)で原音を加算して音質改善を図ることを主目的とし、前者の場合は、G>tgが成立していて、すでに音質改善の余裕がないので、原音加算率ogを0にするのである(この場合、これによりむしろ、雑音量が多くなることが抑止される)。結局、前記の式(5)及び式(6)は、目標雑音抑圧量を遵守することを基準に、なお原音加算の余裕がある場合に、その枠内で音質改善を図っていく、という処理を実現する意義がある。
このように、第1実施形態においては、原音加算率ogが、雑音期間用ゲインGを利用することによって求められることに、その大きな特徴の1つがある。
次に、前述の原音加算率og、及び、前記式(7)のcase・Aとして示される式により、原音加算割合OGが求められる(図2のステップS205)。この原音加算割合OGは、前述のように、原音加算率ogを時間軸上で平滑化することによって求められる。そして、このようにして求められた原音加算割合OG、及び、前記式(8)により、原音加算後の雑音抑圧ゲイン、即ち、修正後ゲインG2(n)が求められる。以上は、原音加算ゲイン演算部60の作用による。
この場合、この修正後ゲインG2(n)は結局、前述の平均化・平滑化を経た雑音期間用ゲインG1(n)と、原音加算の程度とを勘案した上で決定されたゲインであるという意味合いをもつ。
なお、装置立ち上げ直後の場合に配慮して、前記式(1)のNt−1(n)に該当する値としての初期値が適当に定められていると好ましい(このような初期値としてのNt−1(n)は、当然、後述する音声フレーム用処理における雑音スペクトル推定値N(n)の算出処理においても利用可能である。)。これと同様のことは、前記式(4)、式(7)中のGt−1(n)についてもいえる。
〔II〕 他方、音声フレーム用処理では、基本的には、上述の雑音フレーム処理とほぼ同様の各処理が実行される。つまり、雑音スペクトル推定値N(n)及びそれに基づく雑音抑圧ゲインG(n)が求められ(図2のステップS301・S202参照)、原音加算割合OGに基づいて修正後ゲインG2(n)が求められる(図2のステップS303・S304)ことは、雑音フレーム処理と同じである。
ただし、この音声フレーム処理では、雑音フレーム処理と比べて、以下のような異同、あるいは注意点がある。
(i) 雑音スペクトル推定値N(n)は、前記式(1)のcase・Aとして示される式によるのではなく、case・Bとして示される式により求められる(図2のステップS301)。この式は、N(n)=Nt−1(n)であるから、音声フレーム処理は、いわば現状を維持する処理であるということがいえる。もう少し詳しく言うと、当該の音声フレームの前が、雑音フレームであった場合は、その雑音フレームにおいて算出された雑音スペクトル推定値Nt−1(n)がそのまま、当該の音声フレーム処理で利用されるということになり、また一方、当該の音声フレームの前が音声フレームであり、かつ、更にその前が雑音フレームであったという場合は、その雑音フレームにおいて算出された雑音スペクトル推定値Nt−2(n)がそのまま、当該の音声フレーム処理で利用される、などということになる。
要するに、音声フレームでは、直近の雑音フレームにおいて算出された雑音スペクトル推定値Nt−p(n)(pは、当該の音声フレームの直前のフレームから数えて、その直近の雑音フレームまでのフレーム数(両端を含む。))が利用されることになるのである。
(ii) これと同様のことは、前記式(7)を用いて行われる、原音加算割合OGの算出処理においてもいえる。すなわち、式(7)のcase・Bとして示される式は、OG=OGt−1であるから、この場合もやはり、音声フレーム処理では、いわば現状が維持されるのである(図2のステップS303参照)。
上述の場合と表現を一致させるなら、音声フレームでは、直近の雑音フレームにおいて算出された原音加算割合OGt−p(n)(pは、当該の音声フレームの直前のフレームから数えて、その直近の雑音フレームまでのフレーム数(両端を含む。))が利用される、ということになる。
(iii) 雑音抑圧ゲインG(n)の演算それ自体は、音声フレーム及び雑音フレームの別に関わらず、前記式(2)を用いて同様に行われる。図2のステップS202において、〔雑音フレーム用処理〕と〔音声フレーム用処理〕とに対応するボックスが繋げられて描かれているのは、それを象徴的に表現している(もっとも、式(2)中のN(n)の値は、式(1)のcase・A及びcase・Bの別に応じて、両フレームに関し当然異なる。)。
(iv) 音声フレーム処理では、前記式(3)及び式(4)に関わる処理、即ち、雑音抑圧ゲインG(n)についての平均化・平滑化処理が行われない(図2のステップS203及びその図中右方参照)。また、これに伴って、正当な雑音期間用ゲインGがいわば存在しないような状態となるので、前記式(5)に関わる処理、即ち、原音加算率ogを算出する処理もまた行われない(図2のステップS204及びその図中右方参照)。
(v) 最終的に算出される修正後ゲインG2(n)は、前記式(8)のcase・Aとして示される式によるのではなく、case・Bとして示される式により求められる(図2のステップS304)。この場合、雑音フレーム処理時においては、平均化・平滑化を経た雑音期間用ゲインG1(n)が用いられるところ、音声フレーム処理時においては、式(2)から求められた雑音抑圧ゲインG(n)がそのまま用いられる点が異なっている。
以上の〔I〕及び〔II〕の処理を経ると、いずれにしても修正後ゲインG2(n)が得られるが、この修正後ゲインG2(n)に、元の振幅スペクトルY(n)をかければ、雑音抑圧後の振幅スペクトルS(n)が算出される(図2のステップS104)。
図3(E)では、簡単のため、単純に図3(A)の振幅スペクトルY(n)に、図3(C)の平均化された雑音抑圧ゲイン(つまり、g)が乗算された結果が示されている。第1実施形態では、上述のように、これに加えて、原音加算の程度に配慮されたゲインの調整が更に行われはするが(式(8)、特にOG(n)の役割、参照)、図3(E)は、仮に、そのような原音加算処理への配慮を省く場合を想定したときの処理の本質をよく表している(式(8)において、OG(n)=0ならば、修正後ゲインG2(n)は、単にG1(n)、又は、G(n)に等しいというだけである。)。
以上に述べたような構成及び作用をもつ雑音抑圧装置1によれば、以下の効果が奏される。
まず、第1実施形態の雑音抑圧装置1によれば、入力信号に含まれる雑音が極めて好適に抑圧される。ここで「好適に」ということのうちには、第1実施形態において特に、以下に記す各点の内実が含まれる。
(1) 第1に、第1実施形態によれば、いわゆるミュージカルノイズの発生をきわめて実効的に防止することができる。ここでミュージカルノイズとは、入力信号の振幅スペクトルから雑音スペクトル推定値を差し引いた後に発生するノイズを意味する。
例えば、雑音スペクトル推定値に基づく雑音抑圧ゲインは、簡単には、前記式(2)中の(Y(n)−N(n))/Y(n)を用いて求めることが可能であり、これをそのまま図1に示す乗算器11で適用する態様を想定すれば、雑音抑圧後の振幅スペクトルS(n)は、S(n)={(Y(n)−N(n))/Y(n)}・Y(n)=Y(n)−N(n)として求められることになる。つまり、この場合は、入力信号の振幅スペクトルから雑音スペクトル推定値を単純に差し引くことによって、雑音抑圧後の振幅スペクトルS(n)が得られることになる。
しかし、この場合の雑音スペクトル推定値は、あくまでも“推定値”であるから、必ずしも、実際の雑音スペクトルを反映しているとは限らない。したがって、ある周波数帯域では、雑音スペクトル推定値差し引き後にもなお雑音が残る場合があり、また、他の周波数帯域では、引き過ぎが生じる場合もある(この引き過ぎの場合は、負の振幅スペクトルが考えられない以上、0に設定される。)。図4では、このような事情が概念的に表現されており、例えば図4(C)中の実線は引き残り(符号“KN”参照)、破線は引き過ぎ(符号“HS”参照)の各場合を表現している(なお、図4(A)及び(B)は、図3(A)及び(B)と全く同じである。また、図4(C)の符号HStが指示する部分は、たまたま、Y(n)−N(n)=0が成立する場合の例示である。)。
このような振幅スペクトルS(n)を時間領域に逆フーリエ変換すると、その信号は、複数のランダムな周波数をもつ正弦波が合成されたもののようになり、これが再生されれば、非常に耳障りな音となって聞こえてくることになる。これがミュージカルノイズである。
このように、ミュージカルノイズは、厳密に言えば不可知の実際の雑音スペクトルと、雑音スペクトル推定値とが一致しないことを主な原因として発生する。
第1実施形態では、このようなミュージカルノイズの発生が極めて効果的に抑制される。というのも、雑音フレーム処理時においては、平均化・平滑化された雑音期間用ゲインGが用いられて、修正後ゲインG2(n)が求められ、これが振幅スペクトルY(n)に適用されるようになっているからである(図3(E)参照)。これにより、もともとの振幅スペクトルがもっていた周波数構造が維持されたまま、雑音抑圧が行われることになるので、ミュージカルノイズは極めて発生しがたくなっているのである。
(1-i) なお、雑音期間用ゲインGを求めるにあたって行われる平均化(前記式(3))及び平滑化(前記式(4))のそれぞれには、固有の意義がある。前者の目的は、図3からも明らかなように、主に、前記ミュージカルノイズの抑圧という効果を導くことにあり、後者の目的は、主に、いわば通時的にみた雑音抑圧処理の連続性を維持することにある。後者によれば、雑音期間用ゲインG(n)の時間の経過に従った急激な変化が生じないから、例えば、当該雑音フレームに含まれる信号が再生されるとした場合に、聴取者に、聴感上の違和感を与えることがない(なお、第1実施形態において行われる、その他の平滑化処理(即ち、式(1)のcase・A、式(7)のcase・A)は、基本的に、これと本質的に異ならない意義を持つ。)。
(2) 第2に、上記(1)は雑音フレーム処理に関するミュージカルノイズの発生予防についてであるが、これに関連して、第1実施形態によれば、音声フレーム処理に関するミュージカルノイズの発生予防もよりよく実現される。これは、前述のように、音声フレーム処理では、平均化・平滑化を経ない雑音抑圧ゲインG(n)(式(2)参照)がいわばそのまま用いられるようなかたちで、修正後ゲインG2(n)が求められることによる(式(8)のcase・B、あるいは、前述の〔II〕(v))。
(3) しかも第3に、第1実施形態によれば、雑音フレームから音声フレームへの切り替わりの場面において、雑音抑圧処理の一貫性が保持される。これは、前述のように、音声フレーム処理時においては、雑音スペクトル推定値N(n)として、直近の雑音フレームにおいて算出されたNt−p(n)が利用されるようになっていることによる(前述の〔II〕(i)の記載参照)。
以上の(2)及び(3)を要するに、第1実施形態では、音声フレームにおいて、実効的な雑音抑圧が行われながらも、なお雑音フレーム処理時における雑音抑圧処理(特に、その効果)を尊重して、両フレーム間の流れがより自然なものとなるような工夫がなされているのである。これによれば、第1実施形態の雑音抑圧装置1が何らかの音声再生手段に接続されたとした場合、雑音フレームから音声フレームへの切り替わりの場面において、聴取者に、雑音に係る音量感の変更等々の聴感上の違和感を与えることがない。
なお、音声フレームにおけるミュージカルノイズを抑制するためには、前述のS(n)=Y(n)−N(n)に代えて、S(n)=Y(n)−αN(n)とし、このα(>0)の値を大きくするという手法も考えられるが、これでは、音質の劣化が激しくなるおそれが極めて高くなるという欠点を抱え込む。かといって、αを小さくするのでは、ミュージカルノイズの抑圧が不十分となる。
また、図4(C)中の破線で示す、雑音抑圧後の振幅スペクトルが0となってしまう部分(即ち、符号HS及びHStが指示する部分)に、一定の値(ノイズ・フロア)を加算する手法をとることによって、ミュージカルノイズを抑圧することも考えられる。これは、当該の部分HS及びHStに、いわば下駄を履かせることによって、引き残りの部分KNをマスキングしよう(あるいは、目立たなくしよう)とする発想に出ている(また、この手法と、前記のαを使う手法とを併用する場合、αはより小さく設定されてもよいから、その場合、音質の劣化防止という効果も得られる。)。
しかし、このようなノイズ・フロアの加算は、とりもなおさず雑音の絶対量を増加させることを意味するから、雑音抑圧という本来の目的達成の観点からみて問題があるだけでなく、そのノイズ・フロアの量の設定如何によっては、雑音抑圧効果が極めて不十分になるおそれが高いという問題を生じさせる。
このような観点からみても、第1実施形態の雑音抑圧装置1が極めて優位に立つことが明らかである。すなわち、第1実施形態では、前記のαの利用のように、差し引き量をいわば機械的に増加するのではないから、音質の劣化が生じるおそれは殆どなく、また、前記ノイズ・フロアの単なる加算というような処理が行われるのではないから、いったんは行った雑音抑圧効果が犠牲になるというようなこともない。そして、既に述べたように、そうであるにも関わらず、ミュージカルノイズは、実効的に抑圧されるのである。
(4) 第1実施形態の雑音抑圧装置1によれば、前述の式(5)〜式(7)、あるいは、図2のステップS205及びS303を参照して説明したように、原音加算処理が行われるようになっているので、雑音抑圧効果が更に実効的に奏される。この原音加算処理によれば、あたかも、前述したノイズ・フロアの加算処理と同様の効果、即ち図4(C)の引き残り部分KNのマスキング効果が期待できることから、ミュージカルノイズの抑圧、あるいは、音質の劣化防止がより実効的になるのである(もっとも、前記ノイズ・フロアはあくまでも「一定」である。この点が「原音」を利用する場合との決定的な相違である。)。
なお、上述においては、第1実施形態の雑音抑圧装置1によって奏される効果をより明瞭に把握するため、前記αを用いる手法、あるいはノイズ・フロアを用いる手法との対比において、当該効果についての説明を行っている部分があるが、本発明は、これらαあるいはノイズ・フロアを用いてミュージカルノイズを抑圧する手法を積極的に排除する意図までは有しない。すなわち、これらの手法と本発明及びその各種態様とは併用可能であり、そのような併用形態によれば、当該手法の良いところを享受しつつ、本発明及びその各種態様の効果をより際立たせること等が可能となる。
しかも、第1実施形態では、単に原音加算を実行するというのではなく、以下の各点に特徴がある。
(4-i) まず、原音加算の割合(即ち、OG)が、雑音期間用ゲインGと目標雑音抑圧ゲインtgとの大きさの如何に応じて定まる原音加算率ogに基づいて定められるようになっている。具体的には、既に述べたように、原音加算処理においては、目標としている雑音抑圧の程度(即ち、tg)を支配的要因の1つとし、これとの関係において原音加算率ogが決められるようになっているので、雑音期間用ゲインGに基づく処理と、原音加算処理との間で、バランスがとれた使い分けが行われることにより、より実効的に雑音抑圧効果ないしミュージカルノイズ抑圧効果、さらには音質改善効果が享受されることになる。
(4-ii) また、このような原音加算処理でも、音声フレーム処理時においては、原音加算割合OGとして、直近の雑音フレームにおいて算出されたOGt―pが利用されるようになっている(前述の〔II〕(ii)の記載参照)。これは、ある音声フレームにおける雑音スペクトル推定値N(n)として、その前の雑音スペクトル推定値Nt−1(n)がそのまま利用されるという、前述の考え方とその本質を同じくする。つまり、この原音加算処理においても、雑音フレーム及び音声フレーム間の切り替わりの場面において、雑音抑圧処理の一貫性が保持されるのである。
<第2実施形態>
以下では、本発明に係る第2の実施の形態について図5乃至図7を参照しながら説明する。なお、この第2実施形態は、上記第1実施形態との対比において、音声検出処理に関連する相違点があり、その他の点については、特に断りがない限り上記第1実施形態と全く同じである。したがって、以下では、前記相違点に関する説明を主に行い、その他の点についての説明は簡略化ないし省略する。また、図面上の符号についても前記相違点以外については流用する。
この第2実施形態の雑音抑圧装置1’は、図5に示すように、音声検出部801が、雑音抑圧ゲイン演算部30の後段に接続される構成をもつ。すなわち、この音声検出部801は、前記式(2)によって算出される雑音抑圧ゲインG(n)を利用することで、入力信号中の音声信号の有無を検出し、あるいは、音声フレームと雑音フレームとの区別を行う。
第2実施形態においては、音声信号の有無を検出するために、以下の手法がとられる。
まず、式(2)で求められた雑音抑圧ゲインG(n)に基づいて、以下の式(9)で表現されるVarが算出される。
Figure 2010102201

ここで、gは、上記第1実施形態において利用されていた式(3)によって表現されるgであって、要するに、G(n)についての周波数帯域nに関する平均値である(第2実施形態は、このgの演算を、雑音期間用ゲイン演算部40だけでなく、音声検出部801も行う。むろん、両者の一方で行った演算の結果を、両者間で共用してもよい。)。
この式(9)のVarは、表式から明らかな通り、G(n)の分散を表す。
次に、このVarが所定値を越えるかどうかが判断される。この判断の意義は以下にある。
一般に、式(2)によって算出される雑音抑圧ゲインG(n)は、音声信号が含まれる場合と含まれない場合とで大きく異なる様相を示す。図6及び図7はその一例を示しており、前者は、音声信号が含まれる場合の雑音抑圧ゲインG(n)の演算例、後者は、含まれない場合の雑音抑圧ゲインG(n)の演算例である。これらの図を対比すると明らかなように、両者の場合それぞれにおけるG(n)の分散を計算すれば、両者間に大きな隔たりが生じることが容易に推測される。つまり、あるフレームについてのG(n)の分散の値が一定程度大きければ、それは音声信号を含み、そうでなければ、音声信号を含まないという判断を行うことが、相当程度の確からしさで可能である。
前述のVarに係る大小判断の意義は、ここにある。改めていえば、ある所定値VBがあるとして、Var>VBであれば、当該フレームには音声信号があり、したがって、それは「音声フレーム」に区別され、Var≦VBであれば、当該フレームには音声信号がなく、したがって、それは「雑音フレーム」に区別される、ということになる。
なお、図5の構成では、図1の構成とは異なって、雑音スペクトル推定部20が音声信号の検出結果を利用することができない。つまり、雑音スペクトル推定部20は、音声フレーム及び雑音フレームの区別を前提とすることなく、雑音スペクトル推定値N(n)を演算する。
このような場合における雑音スペクトル推定値N(n)は、例えば、以下の式(10)及び式(11)によって求められてよい。
Figure 2010102201

Figure 2010102201

ここで、PA(n)は、現に処理中であるフレームにおける入力信号中の振幅スペクトルであって平滑化されたもの、PAt−1(n)は、その直前のフレームにおける当該振幅スペクトルであって平滑化されたもの、αは平滑化係数、γ・βは制御パラメータである。また、式(11)中、case・Cとあるのは、PA(n)>Nt−1(n)が成立する場合を表現し、case・Dとあるのは、それ以外の場合を表現している。
この場合、式(11)のcase・Dとして示される式及び式(10)の組み合わせが前記の式(1)のcase・Aとして示される式と実質的にほぼ同義である。
他方、式(11)のcase・Cとして示される式は、前記式(1)中においては該当するものはない。もっとも、この式は、上述のように、即ちPA(n)>Nt−1(n)が成立する場合、即ち、現に処理中であるフレームにおける振幅スペクトルが、その直前のフレームにおける雑音スペクトル推定値を越える場合に発動するから、このcase・Cは、その現に処理中であるフレームが、音声フレームである可能性を示唆するものと捉えることも不可能でない(仮に、多くのn(=0,1,2,3,…)について、かかる条件が満たされるなら、その可能性はより高まるといえる。ただし、あくまでも“示唆”に過ぎない。)。
これら式(10)及び式(11)は、以上のような意味における限りで、前記式(1)と共通性をもつといえる。
いずれにしても、雑音スペクトル推定値が好適に算出されることに変わりはない。
このような第2実施形態によれば、次のような効果が奏される。
まず、この第2実施形態によっても、上記第1実施形態によって奏された作用効果と本質的に異ならない作用効果が奏されることは明白である。すなわち、この第2実施形態でも、上記第1実施形態に関し述べた(1)から(4)の効果がほぼ同様に奏される。
加えて、この第2実施形態によれば、図1と図5とを対比すると明らかなように、処理効率の向上、回路構成の簡易化等の効果が享受される。これは、第1実施形態における音声検出が、いわば独立に行われていたのに代えて、第2実施形態における音声検出が、雑音抑圧ゲインG(n)の利用が図られることによって行われ、その従属化が行われていることによる。
本発明においては、雑音抑圧ゲインG(n)の演算は必ず行わなければならない処理である以上、その演算結果を利用して音声検出処理をも行ってしまうことが、処理の効率化・合理化を導くことは論を俟たない。しかも、その検出性能は相当程度高い(図6及び図7対比参照)。
以上、本発明に係る実施の形態について説明したが、本発明に係る雑音抑圧装置は、上述した形態に限定されることはなく、各種の変形が可能である。
(1) 上記第1及び第2実施形態では、雑音期間用ゲインGが、周波数軸上で平均化され、時間軸上で平滑化されているが、本発明は、かかる形態に限定されない。上でも既に述べたが、平均化処理と平滑化処理とでは、その主な狙いが異なっているので、特に平滑化処理に関しては、場合によっては省略されてよい。図3(E)にみられるように、平均化処理だけを実施したとしても、ミュージカルノイズの抑圧効果は一定程度享受可能である。
(2) また、上記第1及び第2実施形態では、雑音期間用ゲインGが、前記式(3)による平均化処理、及び、前記式(4)による平滑化処理を経て求められているが、本発明は、これら式(3)及び式(4)のかたちにも拘らない。
まず、本発明において、雑音抑圧ゲイン平均値gは、式(3)によって求められる形態に限定されない。
すなわち、式(3)において、gは、N個すべての周波数帯域(全部でN個の0,1,2,…,N−1番目の周波数帯域)を用いて算出されているが、このgは、例えば、そのうちの一部だけの周波数帯域を用いて算出されてもよい。この場合、極低域(DC成分に近い帯域)や極高域(ナイキスト周波数に近い帯域)の双方又は一方を除く、周波数帯域を用いることが考えられる。
また、雑音抑圧ゲイン平均値gを求めるにあたっては、個々の周波数帯域に異なる重み付けを行ってもよい。例えば、ある特定の重み係数を特定の周波数帯域についてだけ乗算したり、あるいは、連続的、段階的に増加又は減少する重み付け係数をすべての周波数帯域について乗算したり、等々のようである。
次に、本発明において、雑音期間用ゲインGは、前記式(4)によって求められる形態に限定されない。
すなわち、式(4)において、Gは、雑音抑圧ゲイン平均値gを時間軸上で平滑化することにより求められているが、このGは、例えば、相隣接するフレームのgの平均値として算出されてもよい。
(3) 加えて、上記第1及び第2実施形態では、平均化・平滑化された雑音期間用ゲインGないしG1(n)がすべての周波数帯域に適用されているが(式(8)のcase・A、あるいは、図3(E)参照)、本発明は、かかる形態にも限定されない。
例えば、前述した極低域や極高域の双方又は一方を除く周波数帯域にだけ、当該雑音期間用ゲインGないしG1(n)が適用されてよい。この場合、その適用除外となった周波数帯域については、固定値たるゲインが適用されるとよい。
(4) 上記第1及び第2実施形態では、雑音抑圧ゲインG(n)が、式(2)によって算出されているが、本発明は、かかる形態に限定されない。例えば、これ以外にも、ウィナーフィルタ法、MMSE(Minimum Mean-Square Error)法等が用いられてよい(これらについては、前述の非特許文献3及び4を参照)。SNR(音声(信号)/ノイズ比率)を推定し、そのSNRに基づいて雑音抑圧ゲインG(n)が求められてもよい。
(5) 上記第2実施形態では、音声フレーム及び雑音フレーム間の区別を行うために、前記式(9)により、雑音抑圧ゲインG(n)についての周波数軸上の分散がとられているが、本発明は、かかる形態に限定されない。
例えば、分散に代えて、標準偏差が用いられてよいことは当然、時間軸上の分散、あるいは標準偏差が用いられてもよい。また、周波数帯域ごとの雑音抑圧ゲインG(n)のうち、所定の2つの基準値によって画された空間内に収まるものが幾つあるか等に基づいて、音声フレーム及び雑音フレーム間の区別が行われてもよい(例えば、その数が比較的大であれば、雑音抑圧ゲインG(n)は一定の箇所に集中して存在すると判断可能であるから、その散らばりの程度は小さいといえ、したがって、当該のフレームは、雑音フレームと認定される、などというようである。)。さらには、上述した各種の判断手法は、場合によって併用されてよい。これによれば、例えば、散らばりの程度が、前記分散と前記空間内に収まる雑音抑圧ゲインG(n)の数との双方が参照された上で判断される、などということになる。
本発明の第1実施形態に係る雑音抑圧装置の構成を示すブロック図である。 第1実施形態に係る雑音抑圧処理の流れを示すフローチャートである。 第1実施形態に係る雑音抑圧処理の内容を説明するための説明図である。 従来の雑音抑圧処理の内容を説明するための説明図である。 本発明の第2実施形態に係る雑音抑圧装置の構成を示すブロック図である。 音声信号が含まれる場合の雑音抑圧ゲインG(n)の演算例を示すグラフである。 音声信号が含まれない場合の雑音抑圧ゲインG(n)の演算例を示すグラフである。
符号の説明
1,1’……雑音抑圧装置、10……時間・周波数変換部、20……雑音スペクトル推定部、30……雑音抑圧ゲイン演算部、40……雑音期間・雑音抑圧ゲイン演算部(雑音期間用ゲイン演算部)、50……原音加算率演算部、60……原音加算ゲイン演算部、70……周波数・時間変換部、11……乗算器
Y(n)……入力信号の振幅スペクトル、N(n)……雑音スペクトル推定値、G(n)……雑音抑圧ゲイン、g……雑音抑圧ゲイン平均値、G,G1(n)……雑音期間に適用するための雑音抑圧ゲイン(雑音期間用ゲイン)、og……原音加算率、tg……目標雑音抑圧ゲイン、TG……目標雑音抑圧量、OG……原音加算割合、G2(n)……原音加算後の雑音抑圧ゲイン(修正後ゲイン)

Claims (12)

  1. K個の周波数帯域ごと(ただし、Kは2以上の自然数)に、入力信号に含まれる雑音スペクトルを当該入力信号に基づいて推定する雑音スペクトル推定手段と、
    前記雑音スペクトル推定手段による推定結果に基づいて、前記K個の周波数帯域ごとの雑音抑圧ゲインを算出する第1ゲイン演算手段と、
    前記入力信号に前記雑音抑圧ゲインを適用した結果得られる第1雑音抑圧後信号に、当該雑音抑圧ゲインと目標雑音抑圧ゲインとの差に基づいて定められた第1割合で、前記入力信号を加算する原音加算手段と、
    を備えることを特徴とする雑音抑圧装置。
  2. 前記雑音抑圧ゲインについての、前記K個の周波数帯域に関する平均値ゲインを算出する第2ゲイン演算手段を更に備え、
    前記原音加算手段は、
    前記入力信号に前記平均値ゲインを適用した結果得られる第2雑音抑圧後信号に、当該平均値ゲインと前記目標雑音抑圧ゲインとの差に基づいて定められた第2割合で、前記入力信号を加算する、
    ことを特徴とする請求項1に記載の雑音抑圧装置。
  3. 前記原音加算手段は、
    前記第1又は第2割合を時間軸上で平滑化した平滑化割合を算出し、
    前記第1又は第2雑音抑圧後信号に、前記平滑化割合で、前記入力信号を加算する、
    ことを特徴とする請求項1又は2に記載の雑音抑圧装置。
  4. 前記入力信号に含まれる音声の有無を検出することで、当該入力信号を、経時的に、当該音声が含まれる音声フレーム及び当該音声が含まれない雑音フレームに区分する音声検出手段を更に備え、
    前記第2雑音抑圧後信号は、
    前記入力信号のうち前記雑音フレームに該当する部分に、前記平均値ゲインを適用した結果得られる、
    ことを特徴とする請求項2に記載の雑音抑圧装置。
  5. 前記第1雑音抑圧後信号は、
    前記入力信号のうち前記音声フレームに該当する部分に、前記雑音抑圧ゲインを適用した結果得られる、
    ことを特徴とする請求項4に記載の雑音抑圧装置。
  6. 前記原音加算手段は、
    前記第1雑音抑圧後信号に、前記第1割合に代えて前記第2割合で、前記入力信号を加算する、
    ことを特徴とする請求項5に記載の雑音抑圧装置。
  7. 前記原音加算手段は、
    前記音声フレームに係る前記第1雑音抑圧後信号に前記入力信号を加算しようとする場合は、
    当該音声フレームに直近の雑音フレームに関して既に算出された前記第2割合を、当該音声フレームにおける前記第1割合であるものとして、前記第1雑音抑圧後信号に前記入力信号を加算する、
    ことを特徴とする請求項5に記載の雑音抑圧装置。
  8. 前記原音加算手段は、
    前記雑音フレームに係る前記第2雑音抑圧後信号に前記入力信号を加算しようとする場合は、
    一時的第2割合を算出した後、当該雑音フレームの直前のフレームにおける前記第1又は第2割合を用いて、当該一時的第2割合を時間軸上で平滑化した平滑化割合を算出し、この平滑化割合を前記第2割合であるものとして、前記第2雑音抑圧後信号に前記入力信号を加算し、
    前記音声フレームに係る前記第1雑音抑圧後信号に前記入力信号を加算しようとする場合は、
    当該音声フレームの直前のフレームにおける前記第1又は第2割合を、当該音声フレームにおける前記第1割合であるものとして、前記第1雑音抑圧後信号に前記入力信号を加算する、
    ことを特徴とする請求項5又は7に記載の雑音抑圧装置。
  9. 前記第1又は第2割合は、
    以下の式(A)によって求められることを特徴とする請求項1乃至8のいずれか一項に記載の雑音抑圧装置。
    og=max(0,tg−G) …… (A)
    ここで、ogは、求めるべき第1又は第2割合、
    tgは、前記目標雑音抑圧ゲイン、
    Gは、前記雑音抑圧ゲイン又は前記平均値ゲイン、
    max(a,b)は、a及びbのうちいずれか大きい値を返す関数を意味する。
  10. K個の周波数帯域ごと(ただし、Kは2以上の自然数)に、入力信号に含まれる雑音スペクトルを当該入力信号に基づいて推定する雑音スペクトル推定工程と、
    前記雑音スペクトル推定工程における推定結果に基づいて、前記K個の周波数帯域ごとの雑音抑圧ゲインを算出する第1ゲイン演算工程と、
    前記入力信号に前記雑音抑圧ゲインを適用した結果得られる第1雑音抑圧後信号に、当該雑音抑圧ゲインと目標雑音抑圧ゲインとの差に基づいて定められた第1割合で、前記入力信号を加算する原音加算工程と、
    を含むことを特徴とする雑音抑圧方法。
  11. 前記雑音抑圧ゲインについての、前記K個の周波数帯域に関する平均値ゲインを算出する第2ゲイン演算工程を更に含み、
    前記原音加算工程では、
    前記入力信号に前記平均値ゲインを適用した結果得られる第2雑音抑圧後信号に、当該平均値ゲインと前記目標雑音抑圧ゲインとの差に基づいて定められた第2割合で、前記入力信号が加算される、
    ことを特徴とする請求項10に記載の雑音抑圧方法。
  12. 前記入力信号に含まれる音声の有無を検出することで、当該入力信号を、経時的に、当該音声が含まれる音声フレーム及び当該音声が含まれない雑音フレームに区分する音声検出工程を更に含み、
    前記第2雑音抑圧後信号は、
    前記入力信号のうち前記雑音フレームに該当する部分に、前記平均値ゲインを適用した結果得られる、
    ことを特徴とする請求項11に記載の雑音抑圧方法。
JP2008274858A 2008-10-24 2008-10-24 雑音抑圧装置及び雑音抑圧方法 Expired - Fee Related JP5526524B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008274858A JP5526524B2 (ja) 2008-10-24 2008-10-24 雑音抑圧装置及び雑音抑圧方法
KR1020090101092A KR101088558B1 (ko) 2008-10-24 2009-10-23 잡음 억압 장치 및 잡음 억압 방법
CN2009102055351A CN101727911B (zh) 2008-10-24 2009-10-26 噪声抑制装置及噪声抑制方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008274858A JP5526524B2 (ja) 2008-10-24 2008-10-24 雑音抑圧装置及び雑音抑圧方法

Publications (2)

Publication Number Publication Date
JP2010102201A true JP2010102201A (ja) 2010-05-06
JP5526524B2 JP5526524B2 (ja) 2014-06-18

Family

ID=42273495

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008274858A Expired - Fee Related JP5526524B2 (ja) 2008-10-24 2008-10-24 雑音抑圧装置及び雑音抑圧方法

Country Status (3)

Country Link
JP (1) JP5526524B2 (ja)
KR (1) KR101088558B1 (ja)
CN (1) CN101727911B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2016038704A1 (ja) * 2014-09-10 2017-04-27 三菱電機株式会社 雑音抑圧装置、雑音抑圧方法および雑音抑圧プログラム
US10109291B2 (en) 2016-01-05 2018-10-23 Kabushiki Kaisha Toshiba Noise suppression device, noise suppression method, and computer program product

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9173025B2 (en) 2012-02-08 2015-10-27 Dolby Laboratories Licensing Corporation Combined suppression of noise, echo, and out-of-location signals
US8712076B2 (en) 2012-02-08 2014-04-29 Dolby Laboratories Licensing Corporation Post-processing including median filtering of noise suppression gains
CN104915930B (zh) * 2014-03-14 2019-05-28 深圳迈瑞生物医疗电子股份有限公司 对图像进行灰度补偿和噪声抑制的方法及装置
WO2017135484A1 (ko) * 2016-02-05 2017-08-10 볼보 컨스트럭션 이큅먼트 에이비 건설기계의 냉각팬 가변장치
EP3312838A1 (en) * 2016-10-18 2018-04-25 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for processing an audio signal

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10161694A (ja) * 1996-11-28 1998-06-19 Nippon Telegr & Teleph Corp <Ntt> 帯域分割型雑音低減方法
JP2000082999A (ja) * 1998-09-07 2000-03-21 Nippon Telegr & Teleph Corp <Ntt> 雑音低減処理方法、その装置及びプログラム記憶媒体
JP2000347688A (ja) * 1999-06-09 2000-12-15 Mitsubishi Electric Corp 雑音抑圧装置
JP2002140100A (ja) * 2000-11-02 2002-05-17 Matsushita Electric Ind Co Ltd 騒音抑圧装置
JP2002169599A (ja) * 2000-11-30 2002-06-14 Toshiba Corp ノイズ抑制方法及び電子機器
JP2005195955A (ja) * 2004-01-08 2005-07-21 Toshiba Corp 雑音抑圧装置及び雑音抑圧方法
JP2005257748A (ja) * 2004-03-09 2005-09-22 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、収音プログラム
JP2006215568A (ja) * 2005-02-03 2006-08-17 Samsung Electronics Co Ltd 音声向上装置、音声向上方法及び音声向上プログラムを記録したコンピュータで読み取り可能な媒体
JP2007183306A (ja) * 2005-12-29 2007-07-19 Fujitsu Ltd 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1376539B8 (en) * 2001-03-28 2010-12-15 Mitsubishi Denki Kabushiki Kaisha Noise suppressor
JP4520732B2 (ja) * 2003-12-03 2010-08-11 富士通株式会社 雑音低減装置、および低減方法
US7957964B2 (en) 2004-12-28 2011-06-07 Pioneer Corporation Apparatus and methods for noise suppression in sound signals
US8275611B2 (en) 2007-01-18 2012-09-25 Stmicroelectronics Asia Pacific Pte., Ltd. Adaptive noise suppression for digital speech signals
JP5245714B2 (ja) * 2008-10-24 2013-07-24 ヤマハ株式会社 雑音抑圧装置及び雑音抑圧方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10161694A (ja) * 1996-11-28 1998-06-19 Nippon Telegr & Teleph Corp <Ntt> 帯域分割型雑音低減方法
JP2000082999A (ja) * 1998-09-07 2000-03-21 Nippon Telegr & Teleph Corp <Ntt> 雑音低減処理方法、その装置及びプログラム記憶媒体
JP2000347688A (ja) * 1999-06-09 2000-12-15 Mitsubishi Electric Corp 雑音抑圧装置
JP2002140100A (ja) * 2000-11-02 2002-05-17 Matsushita Electric Ind Co Ltd 騒音抑圧装置
JP2002169599A (ja) * 2000-11-30 2002-06-14 Toshiba Corp ノイズ抑制方法及び電子機器
JP2005195955A (ja) * 2004-01-08 2005-07-21 Toshiba Corp 雑音抑圧装置及び雑音抑圧方法
JP2005257748A (ja) * 2004-03-09 2005-09-22 Nippon Telegr & Teleph Corp <Ntt> 収音方法、収音装置、収音プログラム
JP2006215568A (ja) * 2005-02-03 2006-08-17 Samsung Electronics Co Ltd 音声向上装置、音声向上方法及び音声向上プログラムを記録したコンピュータで読み取り可能な媒体
JP2007183306A (ja) * 2005-12-29 2007-07-19 Fujitsu Ltd 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2016038704A1 (ja) * 2014-09-10 2017-04-27 三菱電機株式会社 雑音抑圧装置、雑音抑圧方法および雑音抑圧プログラム
US10109291B2 (en) 2016-01-05 2018-10-23 Kabushiki Kaisha Toshiba Noise suppression device, noise suppression method, and computer program product

Also Published As

Publication number Publication date
CN101727911A (zh) 2010-06-09
KR101088558B1 (ko) 2011-12-05
CN101727911B (zh) 2012-07-04
KR20100045934A (ko) 2010-05-04
JP5526524B2 (ja) 2014-06-18

Similar Documents

Publication Publication Date Title
JP5245714B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JP5071346B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JP5526524B2 (ja) 雑音抑圧装置及び雑音抑圧方法
US9502048B2 (en) Adaptively reducing noise to limit speech distortion
JP5183828B2 (ja) 雑音抑圧装置
JP5293817B2 (ja) 音声信号処理装置及び音声信号処理方法
JP5153886B2 (ja) 雑音抑圧装置および音声復号化装置
JP5646077B2 (ja) 雑音抑圧装置
JP2001134287A (ja) 雑音抑圧装置
JP5300861B2 (ja) 雑音抑圧装置
US20130070939A1 (en) Signal processing apparatus
JP5834088B2 (ja) 動的マイクロフォン信号ミキサ
WO2002101729A1 (fr) Attenuateur de bruit
JPWO2006046293A1 (ja) 雑音抑圧装置
JP3960834B2 (ja) 音声強調装置及び音声強調方法
JP2004341339A (ja) 雑音抑圧装置
JP2008309955A (ja) ノイズサプレス装置
US11183172B2 (en) Detection of fricatives in speech signals
JP5131149B2 (ja) 雑音抑圧装置及び雑音抑圧方法
JP5316127B2 (ja) 音処理装置およびプログラム
JP2004317993A (ja) 雑音低減回路および雑音低減方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111020

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121109

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121211

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140331

R150 Certificate of patent or registration of utility model

Ref document number: 5526524

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees