JPH09204196A - 雑音抑圧器及び移動局並びに雑音抑圧方法 - Google Patents

雑音抑圧器及び移動局並びに雑音抑圧方法

Info

Publication number
JPH09204196A
JPH09204196A JP8332237A JP33223796A JPH09204196A JP H09204196 A JPH09204196 A JP H09204196A JP 8332237 A JP8332237 A JP 8332237A JP 33223796 A JP33223796 A JP 33223796A JP H09204196 A JPH09204196 A JP H09204196A
Authority
JP
Japan
Prior art keywords
noise
signal
voice
suppression
calculated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8332237A
Other languages
English (en)
Other versions
JP4163267B2 (ja
Inventor
Antti Vaehaetalo
ベーヘータロ アンティ
Juha Haekkinen
ヘッキネン ユーハ
Erkki Paajanen
パージャネン エルッキ
Ville-Veikko Mattila
マッティラ ビレ−ベイコ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of JPH09204196A publication Critical patent/JPH09204196A/ja
Application granted granted Critical
Publication of JP4163267B2 publication Critical patent/JP4163267B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Noise Elimination (AREA)

Abstract

(57)【要約】 【課題】 雑音抑圧方法、移動局、及び音声信号中の雑
音を抑圧するための雑音抑圧器に関する。 【解決手段】 該雑音抑圧器は、音声信号を第1の周波
数範囲を表す第1の量のサブ信号(X,P)に分割する
ための手段(20,50)と、決定された抑圧係数
(G)に基づいて該サブ信号(X,P)中の雑音を抑圧
するための抑圧手段(30)と、第2の量のサブ信号
(X,P)を再結合させて、該第1の周波数範囲より広
い第2の周波数範囲を表す計算信号(S)とするための
再結合手段(60)と、該計算信号(S)に含まれる雑
音に基づいて該計算信号についての抑圧係数(G)を決
定するための決定手段(200)とをそなえる。該抑圧
手段は、再結合されて該計算信号(S)とされた該サブ
信号(X,P)を、該計算信号(S)に基づいて決定さ
れた抑圧係数(G)で抑圧するようにされる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、雑音抑圧方法、移
動局、及び、音声信号中の雑音を抑圧するための雑音抑
圧器に関する。この抑圧器は、前記音声信号を所定の第
1周波数範囲を表す第1の量のサブ信号に分割するため
の手段と、サブ信号中の雑音を所定の抑圧係数に従って
抑圧するための抑圧手段とを有する。本発明の雑音抑圧
器は、特にセルラー通信網で動作する移動局において音
響暗騒音を消去するために用いることのできるものであ
る。本発明は、特にスペクトル減算に基づく暗騒音抑圧
に関する。
【0002】
【従来の技術】スペクトル減算に基づく種々の雑音抑圧
方法が従来技術から知られている。スペクトル減算を使
用するアルゴリズムは、一般に、特許公報WO89/0
6877及びUS5、012、519に開示されている
ように高速フーリエ変換(FFT)を使用することによ
り、又は特許公報US4、630、305、US4、6
30、304、US4、628、529、US4、81
1、404及びEP343792に開示されているよう
にフィルター群を使用することによって、信号を周波数
に応じて各周波数成分に、即ちより小さな周波数範囲
に、分割することに基づいている。スペクトル減算に基
づく従来の手法では、パワースペクトル(振幅スペクト
ル)の各周波数範囲に対応する成分が計算され、各周波
数範囲が別々に処理される、即ち雑音は各周波数範囲に
ついて別々に抑圧される。通常、この様な処理は次のよ
うに行われる。即ち、各周波数範囲の信号が音声を含ん
でいるか否か各周波数範囲について別々に検出し、もし
含んでいなければ雑音が関係しているので、その信号を
抑圧する。最後に、各周波数範囲の信号を再結合させる
ことにより、雑音抑圧された信号である出力とする。ス
ペクトル減算に基づく従来公知の方法の欠点は、各周波
数範囲について別々に計算を実行しなければならないた
めに計算量が多いことである。
【0003】スペクトル減算に基づく雑音抑圧方法は、
一般に、雑音信号の推定値を求め、種々の周波数帯域で
の雑音減衰量を調整するためにそれを利用する。雑音の
パワーを表す変数の量を測定し、それを利用して増幅率
を調整することが従来公知である。特許US4、63
0、305は雑音抑圧方法を開示しており、その方法
は、種々の周囲雑音値についての抑圧値のテーブルを利
用して、減衰量調整のために平均雑音レベルを利用しよ
うとするものである。
【0004】スペクトル減算に関連して窓掛け(window
ing) が知られている。窓掛けの目的は、一般に、信号
を時間領域において各フレームに分割することによっ
て、その信号のスペクトル推定値の質を高めることであ
る。窓掛けのもう一つの基本的目的は、例えばスピーチ
などの変動する(不安定な)信号を、変動しないと(安
定していると)見なすことのできる各セグメント(各フ
レーム)に細分することである。窓掛けに関して、ハミ
ング型(Hamming type)、ハニング型(H
anning type)、又はカイゼル型(Kais
er type)の窓掛け方法を使うことが一般に知ら
れている。スペクトル減算に基づく方法では、いわゆる
50%重なりハニング窓掛け方法(50 % overlapping H
anning windowing)と、逆FFT(IFFT)と関連し
て使用されるいわゆる重なり・加算方法(overlap-add
method)を使用するのが一般的である。
【0005】
【発明が解決しようとする課題】これらの従来公知の方
法の全てに伴う問題は、窓掛け方法が特定のフレーム長
を持っていて、窓掛けフレームの長さを他のフレーム長
と調和させるのが困難であるということである。例えば
デジタル移動電話通信網では、音声はフレームにより符
号化され、特定の音声フレームがシステムで使用され、
従って各音声フレームは例えば20msなどの指定され
た同じ長さを有する。窓掛けのためのフレーム長が音声
符号化用のフレーム長と異なるときには、雑音抑圧及び
音声符号化に使用される各フレーム長が異なるために雑
音抑圧及び音声符号化を行うことに起因して発生する総
遅延量が問題となる。
【0006】
【課題を解決するための手段】本発明による雑音を抑圧
する方法においては、入力信号は始めに第1の量の周波
数帯域に分割し、各周波数帯域に対応するパワースペク
トル成分を計算し、第2の量のパワースペクトル成分を
再結合させることにより、前記の第1の周波数帯域より
広い第2の周波数帯域を表す計算スペクトル成分とし、
この計算スペクトル成分に含まれている雑音に基づいて
該計算スペクトル成分についての抑圧係数を決定し、前
記計算スペクトル成分に基づく抑圧係数を用いて前記の
第2の量のパワースペクトル成分を抑圧する。隣り合う
数個の周波数帯域を表す数個の計算スペクトル成分を形
成するのが好ましく、各計算スペクトル成分は種々のパ
ワースペクトル成分を再結合させることにより形成され
る。各計算スペクトル成分は、他とは異なる数個のパワ
ースペクトル成分からなり、或いは他の計算スペクトル
成分と等しい数個のパワースペクトル成分からなってい
てもよい。この様にして各計算スペクトル成分について
雑音抑圧のための抑圧係数が形成され、各計算スペクト
ル成分が減衰させられ、減衰後の計算スペクトル成分が
時間領域に再変換され、再結合されて、雑音抑圧された
出力信号となる。計算スペクトル成分を前記の第1の量
の周波数帯域より少数とし、その結果として声の質を低
下させることなく計算量を減らすのが好ましい。
【0007】本発明の一実施例は、FFT変換に基づい
て各周波数成分に分割する。本発明の利点の一つは、本
発明の方法では周波数範囲成分の数が減少していて、そ
の結果として抑圧係数を計算する際の計算が少なくなる
という顕著な利点が得られることである。各抑圧係数を
広い周波数範囲に基づいて形成するときには、ランダム
な雑音は抑圧係数の値を急に変化させることはできな
い。抑圧係数の値の急な変動は不快に聞こえるので、こ
の様にして音声の質の向上が達成される。
【0008】本発明の方法では、入力信号から窓掛けに
より各フレームが形成され、その窓掛けにおいては、音
声符号化に用いられるフレーム長の均等商(even
quotient)であるような長さのフレームが用い
られる。この文脈において均等商とは音声符号化に用い
られるフレーム長で均等に割り切れる数を意味し、例え
ばフレーム長160の均等商は80、40、32、2
0、16、8、5、4、2及び1であることを意味す
る。この種の手法は総遅延量を著しく短くする。
【0009】更に前記の米国特許第4、630、305
号と本発明の方法との他の差違は、平均音声パワーを得
て相対雑音レベルを決定することである。推定音声レベ
ル及び雑音レベルを決定し、それらを用いて雑音抑圧を
行うことにより、雑音レベルだけを用いる場合より良好
な結果が得られる。その理由は、雑音抑圧アルゴリズム
に関しては音声のレベルと雑音レベルとの比率が非常に
重要な意味を持つことである。
【0010】更に、本発明の方法では、テーブルに載っ
ている固定された値を使用する従来の方法とは異なっ
て、連続的な雑音レベル値(連続的な相対雑音レベル
値)に従って抑圧量を調整する。本発明の方法では、後
でもっと詳しく説明するように、各帯域での現在の信号
対雑音比に応じて、相対雑音推定値に従って抑圧量を減
少させる。このため、音声は可能な限り自然なままに保
たれ、音声が優勢となっている帯域で音声が雑音を圧倒
することが可能となる。この連続的抑圧調整は、連続的
な値を有する各変数を使用することにより実現されてい
る。連続的な、即ちテーブル上で固定されていない、各
パラメータを使用することにより、雑音抑圧値に大きな
瞬間的変化が生じることのない雑音抑圧が可能となる。
また、従来公知の利得値のテーブル化のために必要な大
きな記憶容量が不要となる。
【0011】本発明の雑音抑圧器及び移動局は、第2の
量のサブ信号を再結合させて、前記の第1の周波数範囲
より広い所定の第2の周波数範囲を表す計算信号とする
再結合手段と、該計算信号に含まれている雑音に基づい
て該計算信号についての抑圧係数を決定するための決定
手段とを更にそなえており、抑圧手段が、再結合されて
該計算信号となっている各該サブ信号を、該計算信号に
基づいて決定された前記抑圧係数により抑圧するように
されていることを特徴とする。
【0012】本発明の雑音抑圧方法は、雑音抑圧を行う
前に、第2の量のサブ信号を再結合させて、前記の第1
の周波数範囲より広い所定の第2の周波数範囲を表す計
算信号とし、該計算信号に含まれる雑音に基づいて該計
算信号についての抑圧係数を決定し、再結合されて該計
算信号となった各該サブ信号を、該計算信号に基づいて
決定された前記抑圧係数により抑圧することを特徴とす
る。
【0013】
【発明の実施の形態】次に、添付図面を参照して本発明
の雑音抑圧システムについて詳しく解説する。
【0014】図1は、本発明の装置の基本的機能を示す
ためのブロック図である。該装置の一実施例が図2及び
図3に一層詳しく示されている。マイクロホン1から到
来する音声信号はA/D変換器2でサンプリングされて
デジタル信号x(n)となる。
【0015】音声コーデックにより使用されるフレーム
長の均等商(even quotient)に対応する
量の各サンプルがデジタル信号x(n)から取り出され
て窓掛けブロック(windowing block)
10に送られる。窓掛けブロック10において、フレー
ムを形成するために、各サンプルに所定の窓(wind
ow)が乗算される。ブロック10において、フレーム
の長さをフーリエ変換に適するように調整するために、
もし必要ならば窓掛けされたフレームに各サンプルが加
算される。窓掛け後に、FFTブロック20において該
フレームについて高速フーリエ変換(FFT)を使用し
てスペクトルが計算される。
【0016】FFT計算20の後に、信号中の雑音を抑
圧するために計算ブロック200で雑音抑制のための計
算が行われる。雑音抑制のための計算を実行するため
に、FFTブロック20から得られたスペクトル成分X
(f)に基づいて例えば振幅又はパワースペクトルP
(f)などの所望のタイプのスペクトルがスペクトル形
成ブロック50で形成される。各スペクトル成分P
(f)は周波数領域において或る周波数範囲を表す、即
ちスペクトルを利用して、処理される信号が異なる周波
数の幾つかの信号即ちスペクトル成分P(f)に分割さ
れる。計算量を少なくするために、隣り合うスペクトル
成分P(f)同士が計算ブロック60で合計され、スペ
クトル成分P(f)の数より少数の、或る数のスペクト
ル成分結合が得られて、前記スペクトル成分結合が抑圧
係数を計算するために計算スペクトル成分S(s)とし
て使われる。計算スペクトル成分S(s)に基づいて、
推定ブロック190において信号が音声又は暗騒音を含
んでいるか否かが検出され、暗騒音についてのモデルが
形成され、計算スペクトル成分の各周波数範囲について
信号対雑音比が形成される。この様にして得られた信号
対雑音比と暗騒音モデルとに基づいて、各計算スペクト
ル成分S(s)について計算ブロック130で抑圧値G
(s)が計算される。
【0017】雑音を抑圧するために、掛け算器30にお
いて、スペクトル成分X(f)がその中に位置する周波
数範囲に対応する抑圧係数G(s)が、FFTブロック
20から得られた各スペクトル成分X(f)に乗じられ
る。IFFTブロック40において、雑音抑圧係数G
(s)で調整された各スペクトル成分に対して逆高速フ
ーリエ変換IFFTが実行され、ここから、窓掛けブロ
ック10のために選択された各サンプルに対応する各サ
ンプルが選択されて出力されて、出力即ち雑音抑圧され
たデジタル信号y(n)となり、この信号は移動局にお
いて音声コーデックに回送されて音声符号化される。デ
ジタル信号y(n)の各サンプルの量は、音声コーデッ
クが使用するフレーム長の均等商であるので、音声コー
デックのフレーム長に対応するような信号フレームが得
られるまで、連続する雑音抑圧された信号y(n)が必
要な量だけ音声コーデックに集められ、その後に音声コ
ーデックは該音声フレームに対して音声符号化を実行す
ることができるようになる。雑音抑圧器に使用されるフ
レーム長は音声コーデックのフレーム長の均等商である
ので、この様にして雑音抑圧音声フレームと音声コーデ
ック音声フレームとの長さが異なることに起因する遅延
が防止される。
【0018】計算スペクトル成分S(s)の数はスペク
トル成分P(f)の数より少ないので、それらに基づい
て抑圧成分を計算することは、パワースペクトル成分P
(f)を計算に用いる場合よりかなり容易である。より
広い周波数範囲について各々の新しい計算スペクトル成
分S(s)が計算されているので、それらの変化はスペ
クトル成分P(f)の変化より小さい。それらの変化の
原因は特に信号中のランダム雑音である。計算に使用さ
れる成分S(s)のランダムな変化が小さいので、連続
するフレーム同士の間で計算される抑圧係数G(s)の
変化も小さい。上記のように、周波数応答X(f)の数
個のサンプルを乗じるために同じ抑圧係数G(s)が使
用される結果として、同じフレーム内での周波数領域の
変化が小さくなる。その結果として、抑圧係数の急激す
ぎる変化は不快に聞こえるので、音声の質が向上する。
【0019】次に、主として図2及び図3を参照して本
発明の一実施例を更に詳しく説明する。以下の記述に現
れるパラメータの値は例示的な値であって、本発明の一
実施例を描写するものであるけれども、それらは本発明
の方法の機能を特定のパラメータ値のみに限定するもの
ではない。この実施例では、FFT計算の長さは128
サンプルであり、音声コーデックが使用するフレーム長
は160サンプルであり、各音声フレームは20msの
音声から成ると仮定されている。また、この実施例で
は、各スペクトル成分の数を65から8まで減らす、ス
ペクトル成分の再結合が提示される。
【0020】図2及び図3は本発明の装置の一実施例の
より詳しいブロック図である。図2及び図3において、
該装置への入力はA/D変換されたマイクロホン信号で
あるが、このことは、音声信号がサンプリングされて8
0個のサンプルから成るデジタル音声フレームとなって
いることを意味する。音声フレームは窓掛けブロック1
0に入力され、ここで音声フレームに窓が乗算させられ
る。この実施例で使用される窓掛け(windowin
g)では窓同士が部分的に重なり合うので、部分的に重
なり合う各サンプルが次のフレームのためにメモリ(ブ
ロック15)に記憶される。80個のサンプルが信号か
ら取り出されて、前のフレームの際に記憶された16個
のサンプルと結合されて、合計で96サンプルとなる。
最後に収集された各80個のサンプルの中から、最後の
16個のサンプルが次のフレームの計算のために記憶さ
れる。
【0021】この様にして、与えられた96個のサンプ
ルに96個のサンプル値から成る窓が窓掛けブロック1
0において乗算され、図11に描かれているようにその
窓の始めの8個の値は窓の立ち上がり部IU を形成し、
最後の8個の値は窓の立ち下がり部ID を形成する。窓
I(n)を下記のように定義することができ、ブロック
11(図4)で実現される:
【数1】
【0022】窓掛け(ブロック11)をデジタル的に実
施する方法はデジタル信号処理技術から当業者に知られ
ている。この窓で中間の80個の値(n = 8,..,87 即ち
中間部IM )は1であり、従ってそれらを乗算しても結
果は変わらないので掛け算は省略される。従って、窓の
中の始めの8個のサンプルと終わりの8個のサンプルだ
けを掛ければよい。FFTの長さは2の累乗でなければ
ならないので、ブロック11から得られた96個のサン
プルの終端部に32個のゼロ(0)がブロック12(図
4)において付加されて、128個のサンプルから成る
音声フレームとなる。サンプル列の終端部にサンプルを
付加することは単純な操作であって、ブロック12をデ
ジタル的に実現することは当業者にとっては従来公知の
ことである。
【0023】窓掛けブロック10で実行される窓掛けの
後に、ブロック20において音声フレームのスペクトル
が高速フーリエ変換FFTにより計算される。FFTか
ら得られた実数成分及び虚数成分は平方ブロック50で
絶対値平方され、対をなして加え合わされ、その出力は
音声フレームのパワースペクトルである。FFTの長さ
が128であるならば、得られるパワースペクトル成分
の数は65であり、これはFFT変換の長さを2で割っ
て、その結果を1だけ増やす(インクリメントする)こ
とにより得られる。即ちFFT/2+1の長さである。
【0024】FFTブロック20に到着したフレームの
中の各サンプルx(0),x(1),..,x(n);
n=127(即ち前記の128個のサンプル)は実数
(real)FFT(高速フーリエ変換)により周波数
領域に変換されて周波数領域サンプルX(0),X
(1),..,X(f);f=64(より一般的にはf
=(n+1)/2)となり、その各サンプルは実数成分
Xr(f)と虚数成分Xi(f)とから成る:
【数2】
【0025】高速フーリエ変換をデジタル的に実現する
ことは当業者にとっては従来公知のことである。パワー
スペクトルは、実数成分及び虚数成分の2乗の和を成分
毎に計算することにより平方ブロック(squarin
g block)50から得られる:
【数3】
【0026】図5に示されているように、実数成分及び
虚数成分を平方ブロック(squaring bloc
ks)51及び52(これらのブロックは従来公知の単
純な2乗の計算をデジタル的に実行する)に入力し、そ
の2乗された成分同士を総和器53で加え合わせること
によって、平方ブロック50の機能を実現することがで
きる。この様にして、平方ブロック50の出力として、
パワースペクトル成分P(0),P(1),..,P
(f);f=64が得られ、これらのパワースペクトル
成分は次のように時間領域信号の種々の周波数の成分の
パワーに対応する(8kHzのサンプリング周波数を使
用すると仮定する):f=0,...,64の値につい
てのP(f)は中間周波数(f・4000/64Hz)
に対応する。 (4)
【0027】8個の新しいパワースペクトル成分、即ち
パワースペクトル成分結合S(s),s=0,..,7
がブロック60で形成され、本書ではそれらを計算スペ
クトル成分と称する。この計算スペクトル成分S(s)
は、次の〔数4〕の通りに各計算スペクトル成分S
(s)について常に7個の隣り合うパワースペクトル成
分P(f)を合計することにより形成される:
【数4】
【0028】図6に示されているように、カウンタ61
が常に7まで数え上げ、該カウンタにより制御されて総
和器62が常に7個の連続する成分を合計してその総和
を出力として発生するようにカウンタ61と総和器62
とを利用することにより、これを実現することができ
る。この場合、最低位の結合成分S(0)は中間周波数
[62.5Hz〜437.5Hz] に対応し、最高位の
結合成分S(7)は中間周波数 [3125Hz〜350
0Hz] に対応する。これより低い(62.5Hzより
低い)周波数と、これより高い(3500Hzより高
い)周波数とは音声については重要でないので、電話シ
ステムでは常に減衰させられ、従って、それらを抑圧係
数の計算に使うことは必要でない。
【0029】他の種類の周波数範囲分割方法を用いてパ
ワースペクトル成分P(f)から計算スペクトル成分S
(s)を形成することもできる。例えば、結合されて1
つの計算スペクトル成分S(s)とされるパワースペク
トル成分P(f)の個数は、異なる計算スペクトル成分
又は異なるsの値に対応する異なる周波数帯域について
異なっていてもよい。更に、異なる数、即ち8より大き
い数や小さい数、の計算スペクトル成分S(s)を使用
することもできる。
【0030】隣り合う成分同士を加え合わせるという方
法以外にも、各成分を再結合させる方法が幾つもあるこ
とに注意しなければならない。一般に、次のように適当
な係数でパワースペクトル成分P(f)に重みを付ける
ことによって前記計算スペクトル成分S(s)を計算す
ることができる:
【数5】 ここで係数a(0)〜a(64)は定数(各成分S
(s),s=0,・・・,7について異なる係数)であ
る。
【0031】上記したように、スペクトル成分、即ち周
波数範囲、の質は数個の範囲の成分を合計することによ
ってかなり低下している。計算スペクトル成分を形成し
た後の、次の段階は、抑圧係数の計算である。
【0032】抑圧係数を計算するとき、前記の計算スペ
クトル成分S(s)が使われ、それらに対応する抑圧係
数G(s),s=0,・・・,7が計算ブロック130
で計算される。周波数領域サンプルX(0),X
(1),...,X(f);f=0,..,64に前記
の抑圧係数が乗算される。各係数G(s)は、各成分S
(s)を計算する基礎として使われた各サンプルに乗算
される、例えば各サンプルX(15),..,X(2
1)にG(2)が乗算される。また、最下位のサンプル
X(0)にはサンプルX(1)と同じ係数が乗算され、
最高位の各サンプルX(57),..,X(64)には
サンプルX(56)と同じ係数が乗算される。
【0033】乗算は掛け算器30で実数成分と虚数成分
とを別々に掛け合わせることにより実行され、その出力
として下記の結果が得られる:
【数6】
【0034】この様にしてY(f);f=0,..,6
4が得られ、その実逆高速フーリエ変換(real i
nverse fast Fourier trans
form)がIFFTブロック40で計算され、その出
力として時間領域サンプルy(n),n=0,..,1
27が得られるが、その中の雑音は抑圧されている。
【0035】より一般的には、各周波数領域サンプルX
(0),X(1),..,X(f),f=0,..,6
4についての抑圧を、次のようにして数個の抑圧係数の
重み付き総和として計算することができる:
【数7】 ここで各係数b(0),..,b(7)は定数である
(各成分X(f),f=0,..,64について異なる
係数)。
【0036】計算スペクトル成分S(s)は8個しかな
いので、それらに基づく抑圧係数の計算は、65個のパ
ワースペクトル成分P(f)を用いて計算を行う場合よ
りは相当容易である。各々の新しい計算スペクトル成分
S(s)はより広い範囲について計算されているので、
それらの値の変化は各パワースペクトル成分P(f)の
変化より小さい。これらの変化は特に信号中のランダム
雑音に起因するものである。計算に用いられる計算スペ
クトル成分S(s)のランダムな変化が小さいので、連
続するフレーム同士の間での計算された各抑圧係数G
(s)の変化も小さい。同じ抑圧係数G(s)が、上記
の通りに、周波数応答X(f)の幾つかのサンプルに乗
算されるので、フレーム内の周波数領域の変化が小さく
なる。抑圧係数の急激すぎる変化は不快に聞こえるの
で、その結果として音声の質が向上する。
【0037】計算ブロック90において、次に説明する
ように、関係するフレームのパワースペクトル成分と、
暗騒音モデルの対応する成分との比として各周波数帯域
で後天的(posteriori)信号対雑音比が計算
される。
【0038】音声活性検出器(voice activ
ity detector)が音声を検出しないとき、
雑音のスペクトルN(s),s=0,..,7が推定ブ
ロック80で推定される(図10により詳しく示されて
いる)。ブロック80において、ブロック60から得ら
れた信号のスペクトルの各成分S(s),s=
0,..,7について時間平均された平均値を巡回的に
(recursively)計算することにより、推定
が行われる:
【数8】
【0039】この文脈において、Nn-1 (s) は、図10
に示されているように、メモリ83から得られる、前の
フレームについて計算された雑音スペクトル推定値を意
味し、Nn (s) は上記の等式による現在のフレーム(n
=フレームの順序番号)についての推定値を意味する。
この計算はブロック81で好ましくはデジタル的に実行
される。ブロック81の入力は、ブロック60からの各
スペクトル成分S(s)と、メモリ83から得られる前
のフレームについての推定値Nn-1 (s) と、ブロック8
2で計算される変数λの値とである。変数λは、
ind ’(音声活性検出器の出力)の値とST
count (暗騒音スペクトル推定値の更新の制御に関連す
る変数)の値とに依存し、その計算については後述す
る。変数λの値は、下記の表3のテーブル(λについて
の代表的な値)に従って決定される:
【表3】
【0040】後に、現在のフレームについて計算された
雑音スペクトル推定値について、より短い記号N(s)
が用いられる。上記の推定方法による計算はデジタル的
に実行されるのが好ましい。上記の式に従って掛け算、
足し算及び引き算をデジタル的に実行する方法は当業者
にとっては従来公知のことである。
【0041】計算ブロック90において、入力スペクト
ル及び雑音スペクトルから、比γ(s),s=
0,..,7が成分毎に計算され、この比は後天的信号
対雑音比と呼ばれる:
【数9】
【0042】
【表4】 計算ブロック90も好ましくはデジタル的に実現され、
該ブロックは上記の割り算を実行する。割り算をデジタ
ル的に実行すること自体は当業者にとっては従来公知の
ことである。この後天的信号対雑音比推定値γ(s)
と、前のフレームの抑圧係数(ハ)、s=0,..,7
とを利用して、抑圧係数を計算するために使用されるべ
き先天的(priori)信号対雑音比推定値(ニ)が
第2計算ユニット140で各周波数帯域について計算さ
れる。この推定は、下記の式に従ってデジタル的に実行
されるのが好ましい:
【数10】 ここでnは上記したようにフレームの順序番号を表し、
各副添え字(subindex)は、各推定値(先天的
信号対雑音比、抑圧係数、後天的信号対雑音比)が計算
されるフレームを指す。計算ブロック140のより詳し
い構成が図9に示されている。パラメータμは定数で、
その値は0.0〜1.0であり、これで現在及びその前
のフレームに関する情報に重みが付けられ、このμの値
は例えば前もってメモリ141に記憶され、このメモリ
からμがブロック145に読み込まれ、該ブロックは上
記の式の計算を実行する。音声フレーム及び雑音フレー
ムについて係数μに異なる値を与えることができ、正し
い値は音声活性検出器の決定に従って選択される(通
常、雑音フレームについては音声フレームについてより
も大きな値がμに与えられる)。ξ_min は、音声を全
く含んでいないような入力信号の各シーケンスにおい
て、信号対雑音比の急速な変動に起因する残留雑音を減
少させるために使われる先天的信号対雑音比の最小値で
ある。ξ_min は前もってメモリ146に記憶され、保
持される。通常、ξ_min の値は0.35〜0.8であ
る。前の式において、関数P( γn (s) −1) は下記の
様に半波整流を実現するものである:
【数11】 この計算は計算ブロック144で実行され、このブロッ
クに、前の式に従って、ブロック90から得られた後天
的信号対雑音比γ(s) が入力される。計算ブロック14
4からの出力として、関数P( γn (s) −1) の値がブ
ロック145へ送られる。また、先天的信号対雑音比推
定値(ニ)を計算するとき、前のフレームについての後
天的信号対雑音比γn-1 (s) が使われ、前のフレームの
対応する抑圧係数の2乗が乗算される。この値は、ブロ
ック145において後天的信号対雑音比γ(s) の値と、
同じフレームで計算された対応する抑圧係数の2乗との
積をメモリ143に記憶させることにより、得られる。
抑圧係数G(s)はブロック130(これは図8に詳し
く示されている)から得られ、ここで始めに係数(ハ)
が下記の式:
【数12】 から計算される。ここで先天的信号対雑音比推定値
(ヘ)の修正推定値(ホ)、s=0,..,7が使用さ
れ、この(ホ)の計算方法について後に図8を参照して
説明する。この種の計算をデジタル的に実行する方法も
当業者にとっては従来公知のことである。
【0043】この修正推定値(ホ)を計算するときに
は、本発明に従って相対雑音レベル(relative
noise level)を使用する。このことにつ
いて次に説明をする。
【0044】本発明の方法では、雑音抑圧の調節は、相
対雑音レベルη(その計算については後述する)に基づ
いて、現在のフレームから計算されるパラメータを追加
的に使用して制御され、このパラメータは入力信号と雑
音モデルとの間のスペクトル距離DSNR を表し、この距
離の計算方法については後述する。このパラメータは、
相対雑音レベルを表すパラメータを、そしてそれを通じ
て先天的信号対雑音比(ヘ)の値をスケーリング(sc
aling)するために使われる。スペクトル距離パラ
メータの値は、現在のフレームにおける音声の出現確率
を表す。従って、フレームに暗騒音だけがきれいに含ま
れているほど、先天的信号対雑音比(ヘ)の値の増加量
は少なくされ、これにより実際上より効果的な雑音抑圧
を行えるようになる。フレームが音声を含んでいるとき
には抑圧量は少なくされるが、音声が周波数領域及び時
間領域の両方で効果的に雑音をマスクする。抑圧量の調
節のために使われるスペクトル距離パラメータの値は連
続的な値を持っていて、信号のパワーの変化に即座に反
応するので、不快に聞こえる抑圧量調節の中断は生じな
い。
【0045】音声と比べて雑音が大きくなるほど、雑音
抑圧により一層大きな歪みが音声に生じるというのが従
来公知の雑音抑圧方法の特徴である。本発明では、操作
が改善されていて、音声のパワー及び雑音のパワーか
ら、滑らかに移行する平均値(ト)及び(チ)が巡回的
に(recursively)計算される。それらに基
づいて、相対雑音レベルを表すパラメータηが計算さ
れ、雑音抑圧G(s)がそれにより調整される。
【0046】前記の平均値及びパラメータはブロック7
0で計算される。このブロックのより詳細な構成が図7
に示されており、これについて次に説明する。抑圧量の
調節は、相対雑音レベルηに基づいて先天的信号対雑音
比(ヘ)の値を大きくすることにより実行される。これ
により、顕著な歪みが音声に生じないように雑音抑圧量
を相対雑音レベルηに従って調節することができる。
【0047】音声の過渡的変化に対する良好な応答を確
保するために、等式(11)の抑圧係数G(s)は音声
の活性に対して速やかに反応しなければならない。残念
なことに、音声の過渡的変化に対する抑圧係数の感度が
高くなると、不安定な雑音に対する抑圧係数の感度も高
くなり、残留雑音の響きは元の雑音より滑らかでなくな
る。更に、等式(7)の暗騒音スペクトルN(s)の形
及びレベルの推定は算術平均により巡回的に実行される
ので、推定アルゴリズムは、急速に変化する雑音成分を
模するのに充分な速さで順応することができなくて、そ
の様な雑音成分の減衰の効率が悪くなる。実際、減衰さ
せられた変化しない雑音によるその様な急速に変化する
雑音成分のマスキング効果が低下しているために、強化
後にはその様な成分がもっとはっきりと区別できるよう
になることがある。
【0048】スペクトル成分の数を増やすことにより抑
圧係数の計算のスペクトル分解能を高めたときにも、残
留雑音の望ましくない変化が生じる。この様な滑らかさ
の低下は、周波数領域でのパワースペクトル成分の平均
化が弱まった結果である。しかし、音声活性時の適切な
減衰と、音声に生じる歪みの極小化とのために、充分な
分解能が必要である。
【0049】周波数範囲の分割が最適でない場合には、
雑音が低周波数に高度に集中していると、抑圧作用にお
いて低周波数暗騒音に望ましくない変動が生じることが
ある。音声に低周波数の雑音が大量に含まれているため
に、音声を含むフレームにおいて同じ低周波数領域の雑
音の減衰が弱まり、不快に聞こえる変調が残留雑音に対
して音声のリズムでかけられる結果となる。
【0050】上記した3つの問題を、最小利得探索によ
り効率よく軽減することができる。この方式の原理は、
各周波数成分において信号のパワーは雑音よりも音声に
おいてゆっくりと且つ比較的に軽い不規則性をもって変
化するという事実に導かれている。この方式により、暗
騒音抑圧の結果が滑らかになり且つ安定し、音声音の劣
化の程度が軽くなり、残留暗騒音がより滑らかになり、
強化された音声の主観的な質が向上する。特に、音声及
び雑音の双方がある時にこの方法により、あらゆる種類
の急速に変化する不安定な暗騒音成分を効率よく減衰さ
せることができる。更に、この方法は音声に如何なる歪
みも生じさせず、余計な雑音を減らして音声をきれいに
響かせる。更に、最小利得探索法(minimum g
ainsearch)によれば、残留雑音に余分の変動
を生じさせることなく等式(11)での抑圧係数G
(s)の計算における周波数成分の数を増やすようにす
ることができる。
【0051】最小利得探索法では、現在のフレームと、
現在のフレームが音声音を含んでいるか否かにより例え
ば1個又は2個の前のフレームとから、各周波数成分s
での等式(24)の抑圧係数G’(s)の最小値を探索
する。最小利得探索方式は、下記の様に表現できるもの
である:
【数13】 ここでG(s,n)は、最小利得探索後のフレームnで
の周波数sでの抑圧係数を表し、Vind ’は音声活性検
出器の出力を表す。その計算については後述する。
【0052】抑圧係数G’(s)は、ブロック30(図
3の)での複素FFT(complex FFT)の該
抑圧係数との乗算の前に等式(12)に従って最小利得
探索法により修正される。最小利得法(minimum
gain)は、ブロック130で、又はブロック13
0と120との間に挿入される別のブロックで実行され
ることができる。
【0053】その中から抑圧係数の最小値を探し出す前
のフレームの個数は2より多くてもよい。更に、最小値
を取る方法以外の、抑圧係数についての他の種類の非線
形フィルタリング操作(例えば、中央値、最小値と中央
値との何らかの組み合わせ、など)又は線形フィルタリ
ング操作(例えば、平均)を本発明で用いることもでき
る。
【0054】上記した方式の算術的複雑さは低い。雑音
抑圧に抑圧係数の下限を導入することにより最大減衰量
を限定しており、また抑圧係数は振幅領域に関連するも
のであって累乗変数(power variable)
ではなく、従って程良いダイナミックレンジを保有する
ので、これらの係数を効率よく圧縮することができる。
前の数個のフレームの抑圧係数を記憶させなければなら
ないけれども、静的メモリの消費量は少ない。雑音抑圧
結果を滑らかにする上記の方法のメモリ要件は、例えば
以前の幾つかの方式で提案されている、同じ目的のため
に過去のフレームの高分解能パワースペクトルを利用す
る方法と比べて、有利である。
【0055】
【表5】 図7に示されているブロックにおいて、パワースペクト
ル推定値S(s),s=0,..,7を用いて音声につ
いての時間平均された平均値(リ)が計算される。時間
平均された平均値(リ)は、音声活性検出器(voic
e activity detector)110(V
AD)が音声を検出したときに、更新される。始めに現
在のフレームの各成分(ヌ)についての平均値がブロッ
ク71で下記の様に計算され、これに入力として各スペ
クトル成分S(s)がブロック60から得られる:
【数14】
【0056】時間平均された平均値(リ)は、前のフレ
ームの時に計算された時間平均された平均値が記憶され
ているメモリ78から得られる前のフレームについての
時間平均された平均値(ル)と、ブロック71から得ら
れる計算スペクトル平均値(ヌ)と、前もってメモリ7
9aに記憶されている時定数αとに基づいて、ブロック
72において(例えば巡回的に)計算される:
【数15】 ここでnはフレームの順序番号であり、αは前記の時定
数であり、その値は0.0〜1.0であり、通常は0.
9と1.0との間である。非常に弱い音声を時間平均さ
れた平均値に含めないために(例えば、文の終わり
で)、この平均値は、現在のフレームについてのスペク
トル成分の平均値が時間平均された平均値に依存する閾
値を上回る場合に限って更新される。この閾値は通常は
時間平均された平均値の四分の一である。前の2つの等
式の計算はデジタル的に実行されるのが好ましい。
【0057】同様に、雑音のパワーの時間平均された平
均値(オ)は雑音N(s),s=0,..,7のパワー
スペクトル推定値を用いて計算ブロック73から得ら
れ、成分平均値(ワ)はそれから次の等式に従って計算
される:
【数16】
【0058】ここでβは時定数であって、その値は0.
0〜1.0であり、通常は0.9と1.0との間であ
る。雑音パワーの時間平均された平均値は各フレームで
更新される。雑音スペクトル成分の平均値(ワ)は、ス
ペクトル成分N(s)に基づいてブロック76で次のよ
うに計算される:
【数17】 前のフレームについての雑音パワーの時間平均された平
均値(カ)はメモリ74から得られるが、それは前のフ
レームの時に該メモリに記憶されたものである。
【0059】相対雑音レベルηは、ブロック75におい
て、雑音及び音声の時間平均された平均値のスケーリン
グされ且つ最大値限定された商として計算される:
【数18】 ここでκはスケーリング定数(scaling con
stant)(代表的な値は4.0)であり、前もって
メモリ77に記憶されており、max_ηは相対雑音レ
ベルの最大値であり(通常は1.0)、メモリ79bに
記憶されている。
【0060】相対雑音レベルηについてのこのパラメー
タから、抑圧量調整に使われる最終補正項が、入力信号
と雑音モデルとの間の距離を表すパラメータDSNR でそ
れをスケーリングすることによって得られ、このDSNR
は、後天的信号対雑音比γ(s)を用いて音声活性検出
器110で計算され、これはデジタル的計算により次の
式を実現する:
【数19】 ここでs_l及びs_hは、含まれている最低周波数成
分及び最高周波数成分の指数の値であり、υS は成分に
ついての重み付け係数であり、これらは前もって決めら
れてメモリに記憶され、このメモリから計算のために読
み出される。通常、全ての後天的信号対雑音推定値成分
s_l=0及びs_h=7が使われ、等しい重みυS
1.0/8.0;s=0,..,7がそれらに付けられ
る。
【0061】次に、図12を参照して音声活性検出器1
10の実施例について詳しく説明する。音声活性検出器
の実施例は新しいものであって、本発明の雑音抑圧器に
用いるのに特に適しているけれども、この音声活性検出
器を、例えば断続的な接続を制御するため及び音響エコ
ー消去のために音声検出を行う他の種類の雑音抑圧器
に、或いは他の目的のために、用いることも可能であ
る。音声活性検出器における音声の検出は、信号対雑音
比に、又は図2及び図3から分かるようにブロック90
で計算された種々の周波数帯域での後天的信号対雑音比
に基づいている。この信号対雑音比は、フレームについ
てのパワースペクトル成分S(s)(ブロック60から
の)を、暗騒音推定値の対応する成分N(s)(ブロッ
ク80からの)で割ることにより、計算される。音声活
性検出器の中の総和器111は、種々の周波数帯域から
得られる後天的信号対雑音比の値を合計し、これによ
り、入力信号と雑音モデルとの間のスペクトル距離を表
すパラメータDSNR が上記の式(18)に従って得ら
れ、この総和器からの値は比較器112において所定の
閾値vthと比較される。もし閾値の方が小さければ、
そのフレームは音声を含むと見なされる。この合計を計
算するとき、信号対雑音比が良好であると期待すること
のできる周波数に、より大きな重みを付けるように、重
み付けを行うこともできる。音声活性検出器の出力を変
数Vind ’で表すことができるが、その値について下記
の条件が得られる:
【数20】
【0062】音声活性検出器110は暗騒音スペクトル
推定値N(s)の更新を制御し、この推定値は上記した
ように音声活性検出器の機能に影響を及ぼすので、もし
暗騒音レベルが急に上昇すると暗騒音スペクトル推定値
N(s)が低すぎるレベルにとどまる可能性がある。こ
れを防止するために、その中では連続するフレームが音
声を含んでいると考えられる時間(フレームの個数)が
監視される。もしこの連続するフレームの個数が閾値m
ax_spf(その値は例えば50である)を上回れ
ば、変数STcount の値は1にセットされる。変数ST
count は、Vind’が値0となったときに0にリセット
される。
【0063】しかし、連続するフレームのエネルギーの
変化が信号が安定していないことをブロック80に示す
ならば、連続するフレームのためのカウンタ(この図に
は示されていないけれども図10にはブロック82とし
て含まれており、ここに変数STcount の値も記憶され
る)の値は増やされない。定常度を表すパラメータST
ind がブロック100で計算される。もしエネルギーの
変化が充分に大きければ、該カウンタはリセットされ
る。これらのことの目的は、音声時に暗騒音スペクトル
推定値が更新されないことを保証することである。ま
た、当該フレームのパワースペクトル成分が暗騒音スペ
クトル推定値N(s)の対応する成分より小さいときに
は常に各周波数帯域で暗騒音スペクトル推定値N(s)
が小さくされる。これにより、誤った更新がなされた後
に暗騒音スペクトル推定値N(s)が確実に急速に正し
いレベルに戻ることになる。
【0064】定常度についての条件を、後記の式(2
7)で見ることができる。項目a)は信号が安定した状
況に対応し、このときは連続する音声フレームのカウン
タの値が増やされる。項目b)は非安定状態に対応し、
このときは該カウンタはリセットされ、項目c)は該カ
ウンタの値が変えられない状態に対応する。
【0065】また、本発明では、相対雑音レベルη(こ
れはブロック70で計算される)を利用して音声活性検
出器の前記の閾値vthを調整することにより、音声活
性検出器110及び暗騒音スペクトル推定値N(s)の
精度が高められる。信号対雑音比が非常に良好である
(即ち相対雑音レベルηが低い)様な環境では、閾値v
thの値は相対雑音レベルηに基づいて高められる。こ
れにより暗騒音の急速な変化を音声と解釈することが少
なくなる。閾値の適応化は、次の式に従ってブロック1
13で実行される:
【数21】 ここでvth_fix、vth_min、及びvth_
slopeは定数であり、その代表的な値は、例えば、
vth_fix=2.5、vth_min=2.0、v
th_slope=−8.0である。
【0066】
【表6】 音声活性検出器110でしばしば生じる問題は、スピー
チ開始時にスピーチが直ぐには検出されず、談話の終わ
りも正しく検出されないということである。これが原因
となって暗騒音スペクトル推定値N(s)が正しくない
値となり、そのために音声活性検出器の後の結果に影響
が及ぶことになる。遅延を用いて暗騒音推定値を更新す
ることによりこの問題を解消することができる。この場
合、暗騒音推定値N(s)を更新する前に最後の数個の
フレームの一定の数N(例えばN=4)のパワースペク
トルS1 (s),..,SN (s)が記憶される。もし
最後の2倍の量のフレーム(即ち2N個のフレーム)の
間に、音声活性検出器110が音声を検出しなければ、
暗騒音推定値N(s)はメモリの中の最も古いパワース
ペクトルS1 (s)で更新され、その他の場合には更新
は行われない。これにより、更新時に使われたフレーム
の前のN個のフレームと後のN個のフレームとが雑音で
あったことが保証される。この方法に伴う問題は、大量
のメモリを、即ちN×8個の記憶場所を必要とすること
である。始めに次のM個のパワースペクトル(ヨ)の平
均値を計算して記憶場所Aに記憶させ、その後に次のM
個(例えばM=4)のパワースペクトル(タ)の平均値
を記憶場所Bに記憶させることにより、メモリの消費を
更に最適化することができる。最後の3M個のフレーム
の間に音声活性検出器が雑音だけを検出したならば、暗
騒音推定値は記憶場所Aに記憶されている値で更新され
る。その後に記憶場所Aはリセットされ、次のM個のフ
レームについてのパワースペクトル平均値(レ)が計算
される。これが計算された後、最後の3M個のフレーム
の間に雑音だけがあったならば暗騒音スペクトル推定値
N(s)は記憶場所Bの値で更新される。このプロセス
がこの様にして続けて行われ、平均値を計算して記憶場
所A及びBに交互に記憶させてゆく。このようにして、
必要な記憶場所は2×8個だけになる(記憶場所A及び
Bは各々8個の値を包含する。)
【0067】音声バースト後でも、音声活性検出器が雑
音だけを検出してもN個のフレーム(例えばN=1)
(このときは「ホールド時間」と呼ばれる)の間の音声
を意味する決定を音声活性検出器から強制的に出させる
ようにして音声活性検出器110を強化することもでき
る。これにより、音声がゆっくりと静かになりつつある
ときに音声の終わりが雑音と解されることがあり得るの
で、作用が向上する。
【0068】前記ホールド時間を相対雑音レベルηに適
応的に依存させることができる。その場合、暗騒音が強
いとき、静かなときと比べてホールド時間はゆっくりと
長くされる。このホールド作用を次のように実現するこ
とができる。即ち、ホールド時間nに値0,1,..,
Nが与えられ、相対雑音レベルの閾値η0
η1 ,....,ηN-1 ;ηK <ηK+1 ,が計算され、
その値はホールド時間に対応すると見なされ得るもので
ある。実時間でホールド時間は相対雑音レベルの瞬時値
を閾値と比較することにより選択される。例えば、次の
通りである(N=1,η0=0.01):
【数22】
【0069】このホールド時間を含むVAD決定はV
ind で表される。
【0070】ホールド作用を、図12に示されているよ
うに音声活性検出器の出力側に置かれる遅延ブロック1
14を用いて好ましく実現することができる。特許US
4,811,404は、暗騒音スペクトル推定値を更新
する方法を開示しており、この方法では、暗騒音スペク
トル推定値の前回の更新の時から一定の時間が経過する
と自動的に新たに更新が行われる。本発明では暗騒音ス
ペクトル推定値の更新は、一定の間隔では行わず、上記
したように音声活性検出器の検出結果に応じて行う。暗
騒音スペクトル推定値が計算された後、音声活性検出器
が現在のフレームの前にも後にも音声を検出していない
ときに限って暗騒音スペクトル推定値の更新が行われ
る。この処理手順により、可能な限り正しい値を暗騒音
スペクトル推定値に与えることができる。特にこの特徴
と、前記の他の特徴(例えば、音声があるか無いかを判
定する基礎となる閾値の値vthを、音声及び雑音の両
方のレベルを考慮に入れた相対雑音レベルに基づいて調
節するという特徴など)は、暗騒音スペクトル推定値の
精度と音声活性検出器の動作との双方を本質的に向上さ
せる。
【0071】次に、抑圧係数G’(s)の計算方法を図
8を参照して説明する。相対雑音レベルについてのパラ
メータηにスペクトル距離についてのパラメータDSNR
を乗じ、その積をメモリ132に記憶されているスケー
リング定数(scalingconstant)ρでス
ケーリングし、その積の最大値を制限することによっ
て、抑圧係数の計算を制御するための補正項φがブロッ
ク131から得られる:
【数23】 ここでρ=スケーリング定数(scaling con
stant)(代表的な値は8.0)、max_φは補
正項の最大値(代表的な値は1.0)であり、これは前
もってメモリ135に記憶されている。
【0072】抑圧係数(ソ)(s=0,...,7)の
計算の調整は次のようにして行われる。即ち、式(9)
に従って計算ブロック140から得られる先天的信号対
雑音比(ツ)の値を、先ずブロック131で計算された
補正項φを使って、ブロック133での計算により次の
ように変換する:
【数24】 そして抑圧係数(ソ)はブロック134で式(11)か
ら更に計算される。
【0073】信号が最早音声を含んでいないことを音声
活性検出器110が検出すると、適当な時定数を用いて
信号が更に抑圧される。音声活性検出器110は、音声
表示出力Vind ’を出すことによって、信号が音声を含
んでいるか否かを示し、この出力は例えば1ビットであ
り、その値は、もし音声がなければ0であり、信号が音
声を含んでいるならば1である。追加の抑圧は、動き検
出器(mobility detector)100で
計算される信号安定度指示子STind に基づいて更に調
整される。この方法により、音声活性検出器110が暗
騒音と解釈する可能性のある静かな音声シーケンスを抑
圧することが防止される。
【0074】追加の抑圧は、抑圧係数G’(s)を計算
する計算ブロック138で実行される。音声の開始時
に、適当な時定数を用いて追加の抑圧が解除される。音
声活性検出器110により、音声活性の終了後に、音声
を含まない或る数(その数は予め決められた定数(ハン
グオーバー期間(hangover period) である)のフレーム
が検出されたときに、追加の抑圧が開始される。関係期
間(ハングオーバー期間)に含まれるフレームの数は分
かっているので、フレームの数を数えるカウンタCTを
用いてその期間の終了を検出することができる。
【0075】追加の抑圧を含む抑圧係数G’(s)は、
前もってブロック134で計算された抑圧値(ソ)とブ
ロック137で計算される追加の抑圧係数σとに基づい
てブロック138で次の式に従って計算される:
【数25】 ここでσは追加の抑圧係数であり、その値は、安定度指
示子STind に基づいてブロック136で決定される差
項δ(n)の値と、前のフレームの時に抑圧係数が格納
されたメモリ139aから得られる前のフレームについ
ての追加の抑圧係数σ(n−1)の値と、前もってメモ
リ139bに記憶されている抑圧係数の最小値min_
σとを用いてブロック137で計算される。最初は追加
の抑圧係数はσ=1(追加の抑圧は無し)であり、その
値は、音声活性検出器110が音声を含まないフレーム
を検出したときに指示子Vind ’に基づいて次のように
調整される:
【数26】 ここでn=フレームの順序番号であり、n0 =追加の抑
圧に先立つ期間に属する最後のフレームの順序番号の値
である。追加の抑圧係数σの最小値は、最高の最終抑圧
量を決定するmin_σにより限定される最小値である
(代表的な値は0.5...1.0)。差項δ(n)の
値は信号の安定度に依存する。安定度を決定するため
に、前のフレームと現在のフレームとの間で信号のパワ
ースペクトル平均値(ネ)の変化を比較する。差項δ
(n)の値はブロック136で次のように決定される:
【数27】 ここで差項の値は、安定度指示子STind に基づいて決
定される条件a)、b)及びc)に従ってこの様に決定
される。条件a)、b)及びc)の比較はブロック10
0で実行され、出力として得られる安定度指示子ST
ind は、ブロック136に対して、条件a)、b)及び
c)のうちのどれが満たされるかを知らせ、ブロック1
00は次の比較を実行する:
【数28】
【0076】定数th_s及びth_nは1より大き
い。代表的な値は、例えば、th_s=6.0/5.0
で、th_n=2.0、又は例えばth_s=3.0/
2.0で、th_n=8.0である。各差項δs、δn
及びδmの値は、たとえ安定度指示子STind の値が非
常に頻繁に変化しても連続するフレーム間での追加の抑
圧量の差が騒がしく聞こえることのない様に、選択され
る。
【数29】
【0077】音声活性検出器110が音声を再び検出す
ると、追加の抑圧は、追加の抑圧係数σをブロック13
7で次の様に計算することにより除去される:
【数30】 ここでn1 =雑音シーケンス後の第1フレームの順序番
号であり、δγは正の定数で、その絶対値は、前もって
例えばメモリ139bなどのメモリに記憶された、追加
の抑圧(代表的な値は例えば(1.0-min_σ)/4.0)を調整
する上記の差項の絶対値より一般に相当大きい。図8に
示されている各ブロックの機能は好ましくはデジタル的
に実現される。ブロック130で実行されるべき、各等
式の計算動作をデジタル的に実行することは、当業者に
とってよく知られている。
【0078】抑圧値計算ブロック130から得られた8
個の抑圧値G(s)は、処理される周波数範囲の外側の
周波数(0−62.5Hz及び3500Hz−4000
Hz)に対応する抑圧値が、隣接する処理される周波数
帯域についての抑圧値に等しくセットされることとなる
ように、補間器120において補間されて65個のサン
プルとされる。補間器120もデジタル的に実現される
のが好ましい。
【0079】掛け算器30において、FFTブロック2
0により作られた対をなす実数成分Xr (f)及び虚数
部分Xi (f)に補間器120から得られた抑圧値が乗
算され、ここでFFTブロックからの8個の連続するサ
ンプルX(f)に実際上常に同じ抑圧値G(s)が乗算
され、前記の式(6)に従って各サンプルが掛け算器3
0の出力として得られる。
【0080】ここで各サンプルY(f),f=
0,..,64が得られ、これから実逆高速フーリエ変
換がIFFTブロック40で計算され、ここでその出力
として時間領域サンプルy(n),n=0,..,12
7が得られ、このサンプルでは雑音が抑圧されている。
雑音が既に抑圧されている各サンプルy(n)は、FF
Tブロックに入力される各サンプルx(n)に対応す
る。
【0081】それらのサンプルy(n)の中から80個
のサンプルが選択ブロック160で選択されて送信され
るべく出力される。それらのサンプルはy(n);n=
8,..,87であり、それらに対応するx(n)の値
には窓のストリップが乗算されていないので、それらを
直接出力側に送ることができる。この場合、出力側に8
0個のサンプルが得られるが、それらのサンプルは、窓
掛けブロック10に入力信号として読み込まれる各サン
プルに対応するサンプルである。ここで説明した実施例
では各サンプルは8番目のサンプルから出力側へ選択さ
れるけれども、現在のフレームに対応する各サンプルは
16番目のサンプルからはじめて始まるので(始めの1
6個は前のフレームからメモリに記憶されたサンプルで
ある)、信号に8サンプルの遅延即ち1msの遅延が生
じる。もし最初に、もっと多数の(例えば112個の)
サンプルを読み出していれば(112+前のフレームの
16サンプル=128)、0を信号に付け加える必要は
なく、その結果として前記の112個のサンプルが直接
出力側から得られることになる。しかし、今は一度に8
0個のサンプルを出力側から得たいので、2個の連続す
るフレームに対する計算の後に160個のサンプルが得
られ、これは現在(例えばGSM移動電話などで)使用
されている殆どの音声コーデックが利用しているサンプ
ルに等しい。これにより、上記の1msを除いて、如何
なる遅延も生じさせることなく雑音抑圧と音声符号化と
を効果的に組み合わせることができる。比較のために、
次の様に言うことができる、即ち、現在の技術水準では
遅延は通常は窓(window)の長さの半分であり、
従って本書に開示した例示的解決策による窓(wind
ow)を使用するときは(この窓の長さは96フレーム
である)、遅延は48サンプル即ち6msとなり、この
遅延は本発明の解決策で達成される遅延の6倍の長さで
ある。
【0082】雑音抑圧のための本発明の方法と装置とは
移動局又は移動通信システムに用いるのに特に適してい
て、特別のアーキテクチャ(TDMA、CDMA、デジ
タル/アナログ)に限定されるものではない。図13は
本発明の移動局を示し、これに本発明の雑音抑圧方法が
使用されている。マイクロホン1から到来する、送信さ
れるべき音声信号は、A/D変換器2でサンプリングさ
れ、本発明の雑音抑圧器3で雑音抑圧され、音声符号器
4で音声符号化され、その後に、例えばチャネル符号
化、インタリーブなどの従来公知の基本周波数信号処理
がブロック5で実行される。この後、信号は無線周波数
に変換され、送信器6により複式フィルターDPLX及
びアンテナANTを通して送信される。受信された音声
に対して受信部7の公知の動作が受信時に実行され、ス
ピーカー8を通して再生される。
【0083】本発明の方法及び装置の実施態様及び実施
例をここに開示した。本発明は、ここに開示した実施例
の細目に限定されるものではなく、本発明の特徴から逸
脱せずに他の形でも本発明を実施し得ることは当業者に
は明かである。ここに開示した実施例は単なる例に過ぎ
ないと見なされるべきであり、発明を限定するものと解
されるべきではない。従って、本発明を実施し利用する
可能性は、特許請求の範囲に規定された種々の請求項の
みにより限定される。該請求項で規定される発明を実施
するための、均等実施態様を含む種々の選択肢が本発明
の範囲に含まれる。
【図面の簡単な説明】
【図1】音声信号中の雑音を抑圧するための本発明の装
置の基本的機能に関するブロック図である。
【図2】本発明による雑音抑圧器(noise sup
pressor)の一層詳しいブロック図(その1)で
ある。
【図3】本発明による雑音抑圧器の一層詳しいブロック
図(その2)である。
【図4】窓掛けブロック(windowing blo
ck)の実施態様をブロック図の形で示す図である。
【図5】平方ブロック(squaring bloc
k)の実施態様を示す図である。
【図6】スペクトル再結合ブロック(spectral
recombinationblock)の実施態様
を示す図である。
【図7】相対雑音レベル(relative nois
e level)を計算するためのブロックの実施態様
を示す図である。
【図8】抑圧係数(suppression coef
ficients)を計算するためのブロックの実施態
様を示す図である。
【図9】信号対雑音比を計算するための構成を示す図で
ある。
【図10】暗騒音モデル(background no
ise model)を計算するための構成を示す図で
ある。
【図11】本発明による窓掛け(windowing)
における連続する音声信号フレームを示す図である。
【図12】音声活性検出器(voice activi
ty detector)の実施態様をブロック図の形
で示す図である。
【図13】本発明による移動局をブロック図の形で示す
図である。
【符号の説明】
1…マイクロホン 10…窓掛けブロック 20…FFTブロック 30…掛け算器 40…IFFTブロック 50…スペクトル形成ブロック 60…計算ブロック 130…計算ブロック 190…推定ブロック 200…計算ブロック G(s)…抑圧係数
フロントページの続き (72)発明者 ユーハ ヘッキネン フィンランド国,エフイーエン−33710 タームペーレ,ルコンメーエンカツ 20ベ ー11 (72)発明者 エルッキ パージャネン フィンランド国,エフイーエン−33540 タームペーレ,サルビーヤーコンカツ 16 アー20 (72)発明者 ビレ−ベイコ マッティラ フィンランド国,エフイーエン−33500 タームペーレ,イルマリンカツ 39ベー18

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 音声信号中の雑音を抑圧するための雑音
    抑圧器であって、該抑圧器は、前記音声信号を所定の第
    1の周波数範囲を表す第1の量のサブ信号(X,P)に
    分割するための手段(20,50)と、決定された抑圧
    係数(G)に基づいてサブ信号(X,P)中の雑音を抑
    圧するための抑圧手段(30)とをそなえ、更に、第2
    の量のサブ信号(X,P)を再結合させて、前記の第1
    の周波数範囲より広い所定の第2の周波数範囲を表す計
    算信号(S)とするための再結合手段(60)と、該計
    算信号(S)に含まれている雑音に基づいて該計算信号
    についての抑圧係数(G)を決定するための決定手段
    (200)とをそなえており、該抑圧手段(30)は、
    再結合されて該計算信号(S)とされた該サブ信号
    (X,P)を、該計算信号(S)に基づいて決定された
    前記抑圧係数(G)で抑圧するようにされていることを
    特徴とする雑音抑圧器。
  2. 【請求項2】 音声信号を前記サブ信号を表す各スペク
    トル成分(X,P)に分割するためのスペクトル形成手
    段(20,50)をそなえる、請求項1に記載の雑音抑
    圧器。
  3. 【請求項3】 前記雑音抑圧器は、該音声信号をサンプ
    リングして時間領域の各サンプルとするためのサンプリ
    ング手段(2)と、各サンプル同士を組み立ててフレー
    ムとするための窓掛け手段(10)と、前記フレームの
    周波数領域成分(X)を形成するための処理手段(2
    0)とをそなえ、該スペクトル形成手段(20,50)
    は、該周波数領域成分(X)から前記スペクトル成分
    (X,P)を形成するようにされており、該再結合手段
    (60)は、該第2の量のスペクトル成分(X,P)を
    再結合させて、前記計算信号(S)を表す計算スペクト
    ル成分(S)とするようにされており、前記決定手段
    (200)は、前記計算スペクトル成分(S)に含まれ
    る雑音に基づいて前記計算スペクトル成分(S)につい
    ての抑圧係数(G)を計算するための計算手段(19
    0,130)をそなえており、該抑圧手段(30)は、
    雑音抑圧された周波数領域成分(Y)を形成するため
    に、再結合されて計算スペクトル成分(S)とされてい
    る、該スペクトル成分(P)に対応する該周波数領域成
    分(X)に前記抑圧係数(G)を乗算するための掛け算
    器をそなえ、該抑圧器は、前記の雑音抑圧された周波数
    領域成分(Y)を時間領域信号(y)に変換して、それ
    を雑音抑圧された出力信号として出力するための手段を
    そなえる、請求項1に記載の雑音抑圧器。
  4. 【請求項4】 前記計算手段(190)は、該入力信号
    に含まれている雑音成分及び音声成分の平均レベル
    (イ)を決定するための手段(70)と、前記の雑音レ
    ベル及び音声レベル(イ)に基づいて前記計算スペクト
    ル成分(S)についての抑圧係数(G)を計算するため
    の手段(130)とをそなえる、請求項3に記載の雑音
    抑圧器。 【表1】
  5. 【請求項5】 前記雑音抑圧器の出力信号は音声コーデ
    ックに供給されて音声符号化されるようになっており、
    前記出力信号のサンプルの量は音声フレーム中のサンプ
    ルの数の均等商である、請求項3に記載の雑音抑圧器。
  6. 【請求項6】 前記周波数領域成分(X)を形成するた
    めの前記処理手段(20)は所定のスペクトル長を有
    し、前記窓掛け手段(10)は、各サンプルに所定の窓
    を乗算するための掛け算手段(11)と、フレームを形
    成するために、その乗算された各サンプルに各サンプル
    を付加するためのサンプル作成手段(12)とをそなえ
    ており、該フレームの長さは前記スペクトル長に等しく
    されている、請求項3に記載の雑音抑圧器。
  7. 【請求項7】 音声信号中の音声と各ポーズとを検出し
    て、該音声信号における音声の発生に応じて抑圧を調整
    するために、該抑圧係数を計算するための前記手段(1
    30)に検出結果を与える音声活性検出器(110)を
    そなえる、請求項4に記載の雑音抑圧器。
  8. 【請求項8】 前記抑圧係数計算手段(130)は、現
    在のフレームに基づく値と過去のフレームに基づく値だ
    け、現在のフレームについての抑圧係数(G)を更に修
    正するようにされている、請求項4に記載の雑音抑圧
    器。
  9. 【請求項9】 音声検出判定を行うために該検出器に入
    力された信号を所定の閾値と比較するための手段(11
    2)と、該雑音成分及び該音声成分の平均レベル(ロ)
    に基づいて前記閾値を調整するための手段(113)と
    をそなえている、請求項7に記載の雑音抑圧器。 【表2】
  10. 【請求項10】 前記雑音のレベルを推定して前記レベ
    ルの値を記憶するための雑音推定手段(80)をそな
    え、各々の分析された音声信号の時に、各々の検出され
    た音声信号の前後の所定の時間内に該音声活性検出器
    (110)が音声を検出しなかった場合に限って雑音推
    定値が更新される、請求項7に記載の雑音抑圧器。
  11. 【請求項11】 該音声信号の安定度を示すための安定
    度表示手段(100)をそなえており、前記雑音推定手
    段(80)は、安定度の示度に基づいて、その示度が該
    信号が安定であることを示しているときに前記の雑音推
    定値を更新するようにされている、請求項10に記載の
    雑音抑圧器。
  12. 【請求項12】 送信されるべき音声を音声信号に変換
    するためのマイクロホン(1)を有する音声送受信用の
    移動局であって、該音声信号中の雑音を抑圧するために
    該移動局は、前記音声信号を所定の第1の周波数範囲を
    表す第1の量のサブ信号(X,P)に分割するための手
    段(20,50)と、決定された抑圧係数(G)に基づ
    いてサブ信号(X,P)中の雑音を抑圧するための抑圧
    手段(30)とをそなえ、更に、第2の量のサブ信号
    (X,P)を再結合させて、前記の第1の周波数範囲よ
    り広い第2の周波数範囲を表す計算信号(S)とするた
    めの再結合手段(60)と、該計算信号(S)に含まれ
    ている雑音に基づいて該計算信号(S)についての抑圧
    係数を決定するための決定手段(200)とをそなえて
    おり、該抑圧手段(30)は、再結合されて該計算信号
    (S)とされた該サブ信号(X,P)を、該計算信号
    (S)に基づいて決定された前記抑圧係数(G)で抑圧
    するようにされていることを特徴とする移動局。
  13. 【請求項13】 音声信号中の雑音を抑圧する雑音抑圧
    方法であって、前記音声信号を、所定の第1の周波数範
    囲を表す第1の量のサブ信号(X,P)に分割し、サブ
    信号(X,P)中の雑音を、決定された抑圧係数(G)
    に基づいて抑圧するようになっており、雑音抑圧の前に
    第2の量のサブ信号(X,P)を再結合させて、前記の
    第1の周波数範囲より広い所定の第2の周波数範囲を表
    す計算信号(S)とし、該計算信号(S)に含まれてい
    る雑音に基づいて該計算信号(S)についての抑圧係数
    (G)を決定し、再結合されて該計算信号(S)とされ
    た該サブ信号(X,P)を、該計算信号(S)に基づい
    て決定された前記抑圧係数(G)により抑圧することを
    特徴とする方法。
JP33223796A 1995-12-12 1996-12-12 雑音抑圧器及び移動局並びに雑音抑圧方法 Expired - Lifetime JP4163267B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI955947A FI100840B (fi) 1995-12-12 1995-12-12 Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
FI955947 1995-12-12

Publications (2)

Publication Number Publication Date
JPH09204196A true JPH09204196A (ja) 1997-08-05
JP4163267B2 JP4163267B2 (ja) 2008-10-08

Family

ID=8544524

Family Applications (4)

Application Number Title Priority Date Filing Date
JP33223796A Expired - Lifetime JP4163267B2 (ja) 1995-12-12 1996-12-12 雑音抑圧器及び移動局並びに雑音抑圧方法
JP8331874A Withdrawn JPH09212195A (ja) 1995-12-12 1996-12-12 音声活性検出装置及び移動局並びに音声活性検出方法
JP2007051941A Withdrawn JP2007179073A (ja) 1995-12-12 2007-03-01 音声活性検出装置及び移動局並びに音声活性検出方法
JP2008184572A Expired - Lifetime JP5006279B2 (ja) 1995-12-12 2008-07-16 音声活性検出装置及び移動局並びに音声活性検出方法

Family Applications After (3)

Application Number Title Priority Date Filing Date
JP8331874A Withdrawn JPH09212195A (ja) 1995-12-12 1996-12-12 音声活性検出装置及び移動局並びに音声活性検出方法
JP2007051941A Withdrawn JP2007179073A (ja) 1995-12-12 2007-03-01 音声活性検出装置及び移動局並びに音声活性検出方法
JP2008184572A Expired - Lifetime JP5006279B2 (ja) 1995-12-12 2008-07-16 音声活性検出装置及び移動局並びに音声活性検出方法

Country Status (7)

Country Link
US (2) US5839101A (ja)
EP (2) EP0790599B1 (ja)
JP (4) JP4163267B2 (ja)
AU (2) AU1067797A (ja)
DE (2) DE69630580T2 (ja)
FI (1) FI100840B (ja)
WO (2) WO1997022117A1 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11344999A (ja) * 1998-06-03 1999-12-14 Nec Corp ノイズキャンセラ
JP2001344000A (ja) * 2000-05-31 2001-12-14 Toshiba Corp ノイズキャンセラとこのノイズキャンセラを備えた通信装置、並びにノイズキャンセル処理プログラムを記憶した記憶媒体
WO2002054387A1 (fr) * 2000-12-28 2002-07-11 Nec Corporation Dispositif et procede d'eliminaton du bruit
JP2003295898A (ja) * 2002-04-05 2003-10-15 Nippon Telegr & Teleph Corp <Ntt> 音声処理方法、音声処理装置、音声処理プログラム
JP2004513381A (ja) * 1999-01-08 2004-04-30 ノキア モービル フォーンズ リミティド 音声符号化パラメータを決定する方法及び装置
JP2004527797A (ja) * 2001-05-15 2004-09-09 ウェーヴコム 音声信号の処理方法
JP2005321821A (ja) * 2005-06-17 2005-11-17 Nec Corp ノイズ除去方法及び装置
WO2010058804A1 (ja) * 2008-11-21 2010-05-27 ヤマハ株式会社 ノイズゲート、収音装置及びノイズ除去方法
JPWO2009038136A1 (ja) * 2007-09-19 2011-01-06 日本電気株式会社 雑音抑圧装置、その方法及びプログラム
JP2017511901A (ja) * 2014-03-12 2017-04-27 華為技術有限公司Huawei Technologies Co.,Ltd. 音声信号を検出するための方法および装置

Families Citing this family (191)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3352997A (en) * 1996-07-03 1998-02-02 British Telecommunications Public Limited Company Voice activity detector
US6766176B1 (en) * 1996-07-23 2004-07-20 Qualcomm Incorporated Method and apparatus for automatically adjusting speaker and microphone gains within a mobile telephone
WO1999001942A2 (en) * 1997-07-01 1999-01-14 Partran Aps A method of noise reduction in speech signals and an apparatus for performing the method
FR2768544B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de detection d'activite vocale
FR2768547B1 (fr) * 1997-09-18 1999-11-19 Matra Communication Procede de debruitage d'un signal de parole numerique
IL136722A0 (en) * 1997-12-24 2001-06-14 Mitsubishi Electric Corp A method for speech coding, method for speech decoding and their apparatuses
US6023674A (en) * 1998-01-23 2000-02-08 Telefonaktiebolaget L M Ericsson Non-parametric voice activity detection
FI116505B (fi) 1998-03-23 2005-11-30 Nokia Corp Menetelmä ja järjestelmä suunnatun äänen käsittelemiseksi akustisessa virtuaaliympäristössä
US6182035B1 (en) 1998-03-26 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for detecting voice activity
US6067646A (en) * 1998-04-17 2000-05-23 Ameritech Corporation Method and system for adaptive interleaving
US6175602B1 (en) * 1998-05-27 2001-01-16 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using linear convolution and casual filtering
US6549586B2 (en) * 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
JP2000047696A (ja) * 1998-07-29 2000-02-18 Canon Inc 情報処理方法及び装置、その記憶媒体
US6272460B1 (en) * 1998-09-10 2001-08-07 Sony Corporation Method for implementing a speech verification system for use in a noisy environment
US6188981B1 (en) 1998-09-18 2001-02-13 Conexant Systems, Inc. Method and apparatus for detecting voice activity in a speech signal
US6108610A (en) * 1998-10-13 2000-08-22 Noise Cancellation Technologies, Inc. Method and system for updating noise estimates during pauses in an information signal
US6289309B1 (en) 1998-12-16 2001-09-11 Sarnoff Corporation Noise spectrum tracking for speech enhancement
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
FI118359B (fi) * 1999-01-18 2007-10-15 Nokia Corp Menetelmä puheentunnistuksessa ja puheentunnistuslaite ja langaton viestin
US6604071B1 (en) * 1999-02-09 2003-08-05 At&T Corp. Speech enhancement with gain limitations based on speech activity
US6327564B1 (en) * 1999-03-05 2001-12-04 Matsushita Electric Corporation Of America Speech detection using stochastic confidence measures on the frequency spectrum
US6556967B1 (en) * 1999-03-12 2003-04-29 The United States Of America As Represented By The National Security Agency Voice activity detector
US6618701B2 (en) 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6349278B1 (en) * 1999-08-04 2002-02-19 Ericsson Inc. Soft decision signal estimation
SE514875C2 (sv) 1999-09-07 2001-05-07 Ericsson Telefon Ab L M Förfarande och anordning för konstruktion av digitala filter
US7161931B1 (en) * 1999-09-20 2007-01-09 Broadcom Corporation Voice and data exchange over a packet based network
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
FI19992453A (fi) 1999-11-15 2001-05-16 Nokia Mobile Phones Ltd Kohinanvaimennus
JP3878482B2 (ja) * 1999-11-24 2007-02-07 富士通株式会社 音声検出装置および音声検出方法
US7263074B2 (en) * 1999-12-09 2007-08-28 Broadcom Corporation Voice activity detection based on far-end and near-end statistics
JP4510977B2 (ja) * 2000-02-10 2010-07-28 三菱電機株式会社 音声符号化方法および音声復号化方法とその装置
US6885694B1 (en) 2000-02-29 2005-04-26 Telefonaktiebolaget Lm Ericsson (Publ) Correction of received signal and interference estimates
US6671667B1 (en) * 2000-03-28 2003-12-30 Tellabs Operations, Inc. Speech presence measurement detection techniques
US7225001B1 (en) 2000-04-24 2007-05-29 Telefonaktiebolaget Lm Ericsson (Publ) System and method for distributed noise suppression
DE10026872A1 (de) * 2000-04-28 2001-10-31 Deutsche Telekom Ag Verfahren zur Berechnung einer Sprachaktivitätsentscheidung (Voice Activity Detector)
US20020026253A1 (en) * 2000-06-02 2002-02-28 Rajan Jebu Jacob Speech processing apparatus
US7072833B2 (en) * 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US7010483B2 (en) * 2000-06-02 2006-03-07 Canon Kabushiki Kaisha Speech processing system
US7035790B2 (en) * 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US6741873B1 (en) * 2000-07-05 2004-05-25 Motorola, Inc. Background noise adaptable speaker phone for use in a mobile communication device
US6898566B1 (en) 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
US7457750B2 (en) 2000-10-13 2008-11-25 At&T Corp. Systems and methods for dynamic re-configurable speech recognition
US20020054685A1 (en) * 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US6707869B1 (en) * 2000-12-28 2004-03-16 Nortel Networks Limited Signal-processing apparatus with a filter of flexible window design
US20020103636A1 (en) * 2001-01-26 2002-08-01 Tucker Luke A. Frequency-domain post-filtering voice-activity detector
US20030004720A1 (en) * 2001-01-30 2003-01-02 Harinath Garudadri System and method for computing and transmitting parameters in a distributed voice recognition system
FI110564B (fi) * 2001-03-29 2003-02-14 Nokia Corp Järjestelmä automaattisen kohinanvaimennuksen (ANC) kytkemiseksi päälle ja poiskytkemiseksi matkapuhelimessa
US7013273B2 (en) * 2001-03-29 2006-03-14 Matsushita Electric Industrial Co., Ltd. Speech recognition based captioning system
US20020147585A1 (en) * 2001-04-06 2002-10-10 Poulsen Steven P. Voice activity detection
US7031916B2 (en) * 2001-06-01 2006-04-18 Texas Instruments Incorporated Method for converging a G.729 Annex B compliant voice activity detection circuit
DE10150519B4 (de) * 2001-10-12 2014-01-09 Hewlett-Packard Development Co., L.P. Verfahren und Anordnung zur Sprachverarbeitung
US7299173B2 (en) * 2002-01-30 2007-11-20 Motorola Inc. Method and apparatus for speech detection using time-frequency variance
US6978010B1 (en) 2002-03-21 2005-12-20 Bellsouth Intellectual Property Corp. Ambient noise cancellation for voice communication device
US7116745B2 (en) * 2002-04-17 2006-10-03 Intellon Corporation Block oriented digital communication system and method
DE10234130B3 (de) * 2002-07-26 2004-02-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer komplexen Spektraldarstellung eines zeitdiskreten Signals
US7146315B2 (en) * 2002-08-30 2006-12-05 Siemens Corporate Research, Inc. Multichannel voice detection in adverse environments
US7146316B2 (en) * 2002-10-17 2006-12-05 Clarity Technologies, Inc. Noise reduction in subbanded speech signals
US7343283B2 (en) * 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
DE10251113A1 (de) * 2002-11-02 2004-05-19 Philips Intellectual Property & Standards Gmbh Verfahren zum Betrieb eines Spracherkennungssystems
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7895036B2 (en) 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US8073689B2 (en) * 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
KR100506224B1 (ko) * 2003-05-07 2005-08-05 삼성전자주식회사 이동 통신 단말기에서 노이즈 제어장치 및 방법
US20040234067A1 (en) * 2003-05-19 2004-11-25 Acoustic Technologies, Inc. Distributed VAD control system for telephone
JP2004356894A (ja) * 2003-05-28 2004-12-16 Mitsubishi Electric Corp 音質調整装置
US6873279B2 (en) * 2003-06-18 2005-03-29 Mindspeed Technologies, Inc. Adaptive decision slicer
GB0317158D0 (en) * 2003-07-23 2003-08-27 Mitel Networks Corp A method to reduce acoustic coupling in audio conferencing systems
US7133825B2 (en) * 2003-11-28 2006-11-07 Skyworks Solutions, Inc. Computationally efficient background noise suppressor for speech coding and speech recognition
JP4497911B2 (ja) * 2003-12-16 2010-07-07 キヤノン株式会社 信号検出装置および方法、ならびにプログラム
JP4490090B2 (ja) * 2003-12-25 2010-06-23 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
JP4601970B2 (ja) * 2004-01-28 2010-12-22 株式会社エヌ・ティ・ティ・ドコモ 有音無音判定装置および有音無音判定方法
KR101058003B1 (ko) * 2004-02-11 2011-08-19 삼성전자주식회사 소음 적응형 이동통신 단말장치 및 이 장치를 이용한통화음 합성방법
KR100677126B1 (ko) * 2004-07-27 2007-02-02 삼성전자주식회사 레코더 기기의 잡음 제거 장치 및 그 방법
FI20045315A (fi) * 2004-08-30 2006-03-01 Nokia Corp Ääniaktiivisuuden havaitseminen äänisignaalissa
FR2875633A1 (fr) * 2004-09-17 2006-03-24 France Telecom Procede et dispositif d'evaluation de l'efficacite d'une fonction de reduction de bruit destinee a etre appliquee a des signaux audio
DE102004049347A1 (de) * 2004-10-08 2006-04-20 Micronas Gmbh Schaltungsanordnung bzw. Verfahren für Sprache enthaltende Audiosignale
CN1763844B (zh) * 2004-10-18 2010-05-05 中国科学院声学研究所 基于滑动窗口的端点检测方法、装置和语音识别***
KR100677396B1 (ko) * 2004-11-20 2007-02-02 엘지전자 주식회사 음성인식장치의 음성구간 검출방법
CN100593197C (zh) * 2005-02-02 2010-03-03 富士通株式会社 信号处理方法和装置
FR2882458A1 (fr) * 2005-02-18 2006-08-25 France Telecom Procede de mesure de la gene due au bruit dans un signal audio
EP1861847A4 (en) * 2005-03-24 2010-06-23 Mindspeed Tech Inc ADAPTIVE NOISE STATUS UPDATE FOR VOICE ACTIVITY DETECTOR
US8280730B2 (en) * 2005-05-25 2012-10-02 Motorola Mobility Llc Method and apparatus of increasing speech intelligibility in noisy environments
US8170875B2 (en) * 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
US8311819B2 (en) * 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
WO2007017993A1 (ja) 2005-07-15 2007-02-15 Yamaha Corporation 発音期間を特定する音信号処理装置および音信号処理方法
DE102006032967B4 (de) * 2005-07-28 2012-04-19 S. Siedle & Söhne Telefon- und Telegrafenwerke OHG Hausanlage und Verfahren zum Betreiben einer Hausanlage
GB2430129B (en) * 2005-09-08 2007-10-31 Motorola Inc Voice activity detector and method of operation therein
US7813923B2 (en) * 2005-10-14 2010-10-12 Microsoft Corporation Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
US7565288B2 (en) * 2005-12-22 2009-07-21 Microsoft Corporation Spatial noise suppression for a microphone array
JP4863713B2 (ja) * 2005-12-29 2012-01-25 富士通株式会社 雑音抑制装置、雑音抑制方法、及びコンピュータプログラム
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
EP1982324B1 (en) * 2006-02-10 2014-09-24 Telefonaktiebolaget LM Ericsson (publ) A voice detector and a method for suppressing sub-bands in a voice detector
US8032370B2 (en) * 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US7680657B2 (en) * 2006-08-15 2010-03-16 Microsoft Corporation Auto segmentation based partitioning and clustering approach to robust endpointing
JP4890195B2 (ja) * 2006-10-24 2012-03-07 日本電信電話株式会社 ディジタル信号分波装置及びディジタル信号合波装置
EP1939859A3 (en) * 2006-12-25 2013-04-24 Yamaha Corporation Sound signal processing apparatus and program
US8352257B2 (en) * 2007-01-04 2013-01-08 Qnx Software Systems Limited Spectro-temporal varying approach for speech enhancement
JP4840149B2 (ja) * 2007-01-12 2011-12-21 ヤマハ株式会社 発音期間を特定する音信号処理装置およびプログラム
EP1947644B1 (en) * 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
BRPI0807703B1 (pt) 2007-02-26 2020-09-24 Dolby Laboratories Licensing Corporation Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador
CN101622660A (zh) * 2007-02-28 2010-01-06 日本电气株式会社 语音识别装置、语音识别方法及语音识别程序
KR101009854B1 (ko) * 2007-03-22 2011-01-19 고려대학교 산학협력단 음성 신호의 하모닉스를 이용한 잡음 추정 방법 및 장치
US8526645B2 (en) * 2007-05-04 2013-09-03 Personics Holdings Inc. Method and device for in ear canal echo suppression
US11856375B2 (en) 2007-05-04 2023-12-26 Staton Techiya Llc Method and device for in-ear echo suppression
US9191740B2 (en) * 2007-05-04 2015-11-17 Personics Holdings, Llc Method and apparatus for in-ear canal sound suppression
US11683643B2 (en) 2007-05-04 2023-06-20 Staton Techiya Llc Method and device for in ear canal echo suppression
WO2008137870A1 (en) 2007-05-04 2008-11-13 Personics Holdings Inc. Method and device for acoustic management control of multiple microphones
US10194032B2 (en) 2007-05-04 2019-01-29 Staton Techiya, Llc Method and apparatus for in-ear canal sound suppression
JP4580409B2 (ja) * 2007-06-11 2010-11-10 富士通株式会社 音量制御装置および方法
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8374851B2 (en) * 2007-07-30 2013-02-12 Texas Instruments Incorporated Voice activity detector and method
US8954324B2 (en) 2007-09-28 2015-02-10 Qualcomm Incorporated Multiple microphone voice activity detector
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
KR101437830B1 (ko) * 2007-11-13 2014-11-03 삼성전자주식회사 음성 구간 검출 방법 및 장치
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8560307B2 (en) * 2008-01-28 2013-10-15 Qualcomm Incorporated Systems, methods, and apparatus for context suppression using receivers
US8223988B2 (en) 2008-01-29 2012-07-17 Qualcomm Incorporated Enhanced blind source separation algorithm for highly correlated mixtures
US8180634B2 (en) * 2008-02-21 2012-05-15 QNX Software Systems, Limited System that detects and identifies periodic interference
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
WO2009130388A1 (en) * 2008-04-25 2009-10-29 Nokia Corporation Calibrating multiple microphones
US8244528B2 (en) * 2008-04-25 2012-08-14 Nokia Corporation Method and apparatus for voice activity determination
US8275136B2 (en) * 2008-04-25 2012-09-25 Nokia Corporation Electronic device speech enhancement
JP5381982B2 (ja) * 2008-05-28 2014-01-08 日本電気株式会社 音声検出装置、音声検出方法、音声検出プログラム及び記録媒体
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
JP4660578B2 (ja) * 2008-08-29 2011-03-30 株式会社東芝 信号補正装置
JP5103364B2 (ja) 2008-11-17 2012-12-19 日東電工株式会社 熱伝導性シートの製造方法
WO2010146711A1 (ja) * 2009-06-19 2010-12-23 富士通株式会社 音声信号処理装置及び音声信号処理方法
GB2473267A (en) 2009-09-07 2011-03-09 Nokia Corp Processing audio signals to reduce noise
GB2473266A (en) * 2009-09-07 2011-03-09 Nokia Corp An improved filter bank
US8571231B2 (en) * 2009-10-01 2013-10-29 Qualcomm Incorporated Suppressing noise in an audio signal
WO2011049514A1 (en) 2009-10-19 2011-04-28 Telefonaktiebolaget Lm Ericsson (Publ) Method and background estimator for voice activity detection
CN102576528A (zh) 2009-10-19 2012-07-11 瑞典爱立信有限公司 用于语音活动检测的检测器和方法
GB0919672D0 (en) * 2009-11-10 2009-12-23 Skype Ltd Noise suppression
JP5621786B2 (ja) * 2009-12-24 2014-11-12 日本電気株式会社 音声検出装置、音声検出方法、および音声検出プログラム
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
JP5424936B2 (ja) * 2010-02-24 2014-02-26 パナソニック株式会社 通信端末及び通信方法
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US9378754B1 (en) * 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
JP5870476B2 (ja) * 2010-08-04 2016-03-01 富士通株式会社 雑音推定装置、雑音推定方法および雑音推定プログラム
EP2656341B1 (en) 2010-12-24 2018-02-21 Huawei Technologies Co., Ltd. Apparatus for performing a voice activity detection
SI3493205T1 (sl) 2010-12-24 2021-03-31 Huawei Technologies Co., Ltd. Postopek in naprava za adaptivno zaznavanje glasovne aktivnosti v vstopnem avdio signalu
US20140006019A1 (en) * 2011-03-18 2014-01-02 Nokia Corporation Apparatus for audio signal processing
US20120265526A1 (en) * 2011-04-13 2012-10-18 Continental Automotive Systems, Inc. Apparatus and method for voice activity detection
JP2013148724A (ja) * 2012-01-19 2013-08-01 Sony Corp 雑音抑圧装置、雑音抑圧方法およびプログラム
US9280984B2 (en) * 2012-05-14 2016-03-08 Htc Corporation Noise cancellation method
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
CN103730110B (zh) * 2012-10-10 2017-03-01 北京百度网讯科技有限公司 一种检测语音端点的方法和装置
CN109119096B (zh) * 2012-12-25 2021-01-22 中兴通讯股份有限公司 一种vad判决中当前激活音保持帧数的修正方法及装置
US9210507B2 (en) * 2013-01-29 2015-12-08 2236008 Ontartio Inc. Microphone hiss mitigation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
JP6339896B2 (ja) * 2013-12-27 2018-06-06 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 雑音抑圧装置および雑音抑圧方法
US9978394B1 (en) * 2014-03-11 2018-05-22 QoSound, Inc. Noise suppressor
KR101895391B1 (ko) * 2014-07-29 2018-09-07 텔레호낙티에볼라게트 엘엠 에릭슨(피유비엘) 오디오 신호의 배경 잡음 추정
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung
US9450788B1 (en) 2015-05-07 2016-09-20 Macom Technology Solutions Holdings, Inc. Equalizer for high speed serial data links and method of initialization
JP6447357B2 (ja) * 2015-05-18 2019-01-09 株式会社Jvcケンウッド オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
US9691413B2 (en) * 2015-10-06 2017-06-27 Microsoft Technology Licensing, Llc Identifying sound from a source of interest based on multiple audio feeds
CN109076294B (zh) 2016-03-17 2021-10-29 索诺瓦公司 多讲话者声学网络中的助听***
WO2018152034A1 (en) * 2017-02-14 2018-08-23 Knowles Electronics, Llc Voice activity detector and methods therefor
US10224053B2 (en) * 2017-03-24 2019-03-05 Hyundai Motor Company Audio signal quality enhancement based on quantitative SNR analysis and adaptive Wiener filtering
US10339962B2 (en) * 2017-04-11 2019-07-02 Texas Instruments Incorporated Methods and apparatus for low cost voice activity detector
US10332545B2 (en) * 2017-11-28 2019-06-25 Nuance Communications, Inc. System and method for temporal and power based zone detection in speaker dependent microphone environments
US10911052B2 (en) 2018-05-23 2021-02-02 Macom Technology Solutions Holdings, Inc. Multi-level signal clock and data recovery
CN109273021B (zh) * 2018-08-09 2021-11-30 厦门亿联网络技术股份有限公司 一种基于rnn的实时会议降噪方法及装置
US11005573B2 (en) 2018-11-20 2021-05-11 Macom Technology Solutions Holdings, Inc. Optic signal receiver with dynamic control
US11575437B2 (en) 2020-01-10 2023-02-07 Macom Technology Solutions Holdings, Inc. Optimal equalization partitioning
EP4088394A4 (en) 2020-01-10 2024-02-07 MACOM Technology Solutions Holdings, Inc. OPTIMAL EQUALIZATION PARTITIONING
CN111508514A (zh) * 2020-04-10 2020-08-07 江苏科技大学 基于补偿相位谱的单通道语音增强算法
US12013423B2 (en) 2020-09-30 2024-06-18 Macom Technology Solutions Holdings, Inc. TIA bandwidth testing system and method
US11658630B2 (en) 2020-12-04 2023-05-23 Macom Technology Solutions Holdings, Inc. Single servo loop controlling an automatic gain control and current sourcing mechanism
US11616529B2 (en) 2021-02-12 2023-03-28 Macom Technology Solutions Holdings, Inc. Adaptive cable equalizer
CN113707167A (zh) * 2021-08-31 2021-11-26 北京地平线信息技术有限公司 残留回声抑制模型的训练方法和训练装置

Family Cites Families (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4071826A (en) * 1961-04-27 1978-01-31 The United States Of America As Represented By The Secretary Of The Navy Clipped speech channel coded communication system
JPS56104399A (en) * 1980-01-23 1981-08-20 Hitachi Ltd Voice interval detection system
JPS57177197A (en) * 1981-04-24 1982-10-30 Hitachi Ltd Pick-up system for sound section
DE3230391A1 (de) * 1982-08-14 1984-02-16 Philips Kommunikations Industrie AG, 8500 Nürnberg Verfahren zur signalverbesserung von gestoerten sprachsignalen
JPS5999497A (ja) * 1982-11-29 1984-06-08 松下電器産業株式会社 音声認識装置
EP0127718B1 (fr) * 1983-06-07 1987-03-18 International Business Machines Corporation Procédé de détection d'activité dans un système de transmission de la voix
JPS6023899A (ja) * 1983-07-19 1985-02-06 株式会社リコー 音声認識装置における音声切り出し方式
JPS61177499A (ja) * 1985-02-01 1986-08-09 株式会社リコー 音声区間検出方式
US4630305A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US4630304A (en) 1985-07-01 1986-12-16 Motorola, Inc. Automatic background noise estimator for a noise suppression system
US4628529A (en) 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4897878A (en) * 1985-08-26 1990-01-30 Itt Corporation Noise compensation in speech recognition apparatus
US4764966A (en) * 1985-10-11 1988-08-16 International Business Machines Corporation Method and apparatus for voice detection having adaptive sensitivity
US4811404A (en) 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
IL84948A0 (en) 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
GB8801014D0 (en) 1988-01-18 1988-02-17 British Telecomm Noise reduction
US5276765A (en) 1988-03-11 1994-01-04 British Telecommunications Public Limited Company Voice activity detection
US5285165A (en) * 1988-05-26 1994-02-08 Renfors Markku K Noise elimination method
FI80173C (fi) 1988-05-26 1990-04-10 Nokia Mobile Phones Ltd Foerfarande foer daempning av stoerningar.
US5027410A (en) * 1988-11-10 1991-06-25 Wisconsin Alumni Research Foundation Adaptive, programmable signal processing and filtering for hearing aids
JP2701431B2 (ja) * 1989-03-06 1998-01-21 株式会社デンソー 音声認識装置
JPH0754434B2 (ja) * 1989-05-08 1995-06-07 松下電器産業株式会社 音声認識装置
JPH02296297A (ja) * 1989-05-10 1990-12-06 Nec Corp 音声認識装置
EP0763811B1 (en) * 1990-05-28 2001-06-20 Matsushita Electric Industrial Co., Ltd. Speech signal processing apparatus for detecting a speech signal
JP2658649B2 (ja) * 1991-07-24 1997-09-30 日本電気株式会社 車載用音声ダイヤラ
US5410632A (en) * 1991-12-23 1995-04-25 Motorola, Inc. Variable hangover time in a voice activity detector
FI92535C (fi) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
JP3176474B2 (ja) * 1992-06-03 2001-06-18 沖電気工業株式会社 適応ノイズキャンセラ装置
DE69331719T2 (de) * 1992-06-19 2002-10-24 Agfa Gevaert Nv Verfahren und Vorrichtung zur Geräuschunterdrückung
JPH0635498A (ja) * 1992-07-16 1994-02-10 Clarion Co Ltd 音声認識装置及び方法
FI100154B (fi) * 1992-09-17 1997-09-30 Nokia Mobile Phones Ltd Menetelmä ja järjestelmä kohinan vaimentamiseksi
DE69420027T2 (de) * 1993-02-12 2000-07-06 British Telecomm Rauschverminderung
US5459814A (en) * 1993-03-26 1995-10-17 Hughes Aircraft Company Voice activity detector for speech signals in variable background noise
US5533133A (en) * 1993-03-26 1996-07-02 Hughes Aircraft Company Noise suppression in digital voice communications systems
US5457769A (en) * 1993-03-30 1995-10-10 Earmark, Inc. Method and apparatus for detecting the presence of human voice signals in audio signals
US5446757A (en) * 1993-06-14 1995-08-29 Chang; Chen-Yi Code-division-multiple-access-system based on M-ary pulse-position modulated direct-sequence
DE69428119T2 (de) * 1993-07-07 2002-03-21 Picturetel Corp Verringerung des hintergrundrauschens zur sprachverbesserung
US5406622A (en) * 1993-09-02 1995-04-11 At&T Corp. Outbound noise cancellation for telephonic handset
IN184794B (ja) * 1993-09-14 2000-09-30 British Telecomm
US5485522A (en) * 1993-09-29 1996-01-16 Ericsson Ge Mobile Communications, Inc. System for adaptively reducing noise in speech signals
EP0681730A4 (en) * 1993-11-30 1997-12-17 At & T Corp REDUCTION OF TRANSMISSION NOISE IN COMMUNICATION SYSTEMS.
US5471527A (en) * 1993-12-02 1995-11-28 Dsc Communications Corporation Voice enhancement system and method
EP0682801B1 (en) * 1993-12-06 1999-09-15 Koninklijke Philips Electronics N.V. A noise reduction system and device, and a mobile radio station
JPH07160297A (ja) * 1993-12-10 1995-06-23 Nec Corp 音声パラメータ符号化方式
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
US5550893A (en) * 1995-01-31 1996-08-27 Nokia Mobile Phones Limited Speech compensation in dual-mode telephone
JP3591068B2 (ja) * 1995-06-30 2004-11-17 ソニー株式会社 音声信号の雑音低減方法
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5689615A (en) * 1996-01-22 1997-11-18 Rockwell International Corporation Usage of voice activity detection for efficient coding of speech

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11344999A (ja) * 1998-06-03 1999-12-14 Nec Corp ノイズキャンセラ
JP2004513381A (ja) * 1999-01-08 2004-04-30 ノキア モービル フォーンズ リミティド 音声符号化パラメータを決定する方法及び装置
JP2001344000A (ja) * 2000-05-31 2001-12-14 Toshiba Corp ノイズキャンセラとこのノイズキャンセラを備えた通信装置、並びにノイズキャンセル処理プログラムを記憶した記憶媒体
JP4580508B2 (ja) * 2000-05-31 2010-11-17 株式会社東芝 信号処理装置及び通信装置
US7590528B2 (en) 2000-12-28 2009-09-15 Nec Corporation Method and apparatus for noise suppression
WO2002054387A1 (fr) * 2000-12-28 2002-07-11 Nec Corporation Dispositif et procede d'eliminaton du bruit
JP2002204175A (ja) * 2000-12-28 2002-07-19 Nec Corp ノイズ除去の方法及び装置
JP2004527797A (ja) * 2001-05-15 2004-09-09 ウェーヴコム 音声信号の処理方法
JP2003295898A (ja) * 2002-04-05 2003-10-15 Nippon Telegr & Teleph Corp <Ntt> 音声処理方法、音声処理装置、音声処理プログラム
JP2005321821A (ja) * 2005-06-17 2005-11-17 Nec Corp ノイズ除去方法及び装置
JPWO2009038136A1 (ja) * 2007-09-19 2011-01-06 日本電気株式会社 雑音抑圧装置、その方法及びプログラム
JP5483000B2 (ja) * 2007-09-19 2014-05-07 日本電気株式会社 雑音抑圧装置、その方法及びプログラム
WO2010058804A1 (ja) * 2008-11-21 2010-05-27 ヤマハ株式会社 ノイズゲート、収音装置及びノイズ除去方法
KR101254876B1 (ko) * 2008-11-21 2013-04-15 야마하 가부시키가이샤 노이즈 게이트, 수음 장치 및 노이즈 제거 방법
US9036830B2 (en) 2008-11-21 2015-05-19 Yamaha Corporation Noise gate, sound collection device, and noise removing method
JP2017511901A (ja) * 2014-03-12 2017-04-27 華為技術有限公司Huawei Technologies Co.,Ltd. 音声信号を検出するための方法および装置
US10304478B2 (en) 2014-03-12 2019-05-28 Huawei Technologies Co., Ltd. Method for detecting audio signal and apparatus
US10818313B2 (en) 2014-03-12 2020-10-27 Huawei Technologies Co., Ltd. Method for detecting audio signal and apparatus
US11417353B2 (en) 2014-03-12 2022-08-16 Huawei Technologies Co., Ltd. Method for detecting audio signal and apparatus

Also Published As

Publication number Publication date
JP2007179073A (ja) 2007-07-12
US5963901A (en) 1999-10-05
EP0784311A1 (en) 1997-07-16
AU1067897A (en) 1997-07-03
JPH09212195A (ja) 1997-08-15
JP2008293038A (ja) 2008-12-04
EP0790599B1 (en) 2003-11-05
WO1997022117A1 (en) 1997-06-19
FI955947A (fi) 1997-06-13
WO1997022116A2 (en) 1997-06-19
AU1067797A (en) 1997-07-03
EP0784311B1 (en) 2001-09-05
EP0790599A1 (en) 1997-08-20
DE69614989D1 (de) 2001-10-11
FI100840B (fi) 1998-02-27
JP5006279B2 (ja) 2012-08-22
JP4163267B2 (ja) 2008-10-08
DE69630580T2 (de) 2004-09-16
FI955947A0 (fi) 1995-12-12
WO1997022116A3 (en) 1997-07-31
US5839101A (en) 1998-11-17
DE69614989T2 (de) 2002-04-11
DE69630580D1 (de) 2003-12-11

Similar Documents

Publication Publication Date Title
JPH09204196A (ja) 雑音抑圧器及び移動局並びに雑音抑圧方法
US7424424B2 (en) Communication system noise cancellation power signal calculation techniques
US6523003B1 (en) Spectrally interdependent gain adjustment techniques
US5544250A (en) Noise suppression system and method therefor
KR100860805B1 (ko) 음성 강화 시스템
KR100546468B1 (ko) 잡음 억제 시스템 및 방법
JP4423300B2 (ja) 雑音抑圧装置
US6766292B1 (en) Relative noise ratio weighting techniques for adaptive noise cancellation
US6671667B1 (en) Speech presence measurement detection techniques
WO2000062280A1 (en) Signal noise reduction by time-domain spectral subtraction using fixed filters
EP3074975A1 (en) Method of operating a hearing aid system and a hearing aid system
US5666429A (en) Energy estimator and method therefor
CA2401672A1 (en) Perceptual spectral weighting of frequency bands for adaptive noise cancellation
EP1010169B1 (en) Channel gain modification system and method for noise reduction in voice communication
JP2003517761A (ja) 通信システムにおける音響バックグラウンドノイズを抑制するための方法と装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060711

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061010

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20070109

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20070109

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20070116

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070202

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080624

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080724

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110801

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120801

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130801

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term