JP2008203879A - 雑音抑圧の方法及び装置並びにコンピュータプログラム - Google Patents
雑音抑圧の方法及び装置並びにコンピュータプログラム Download PDFInfo
- Publication number
- JP2008203879A JP2008203879A JP2008110432A JP2008110432A JP2008203879A JP 2008203879 A JP2008203879 A JP 2008203879A JP 2008110432 A JP2008110432 A JP 2008110432A JP 2008110432 A JP2008110432 A JP 2008110432A JP 2008203879 A JP2008203879 A JP 2008203879A
- Authority
- JP
- Japan
- Prior art keywords
- frequency domain
- noise
- signal
- suppression
- domain signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000004590 computer program Methods 0.000 title claims description 17
- 230000001629 suppression Effects 0.000 claims abstract description 192
- 238000012937 correction Methods 0.000 claims description 82
- 238000012545 processing Methods 0.000 claims description 55
- 230000010354 integration Effects 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 230000003595 spectral effect Effects 0.000 abstract 2
- 238000001228 spectrum Methods 0.000 description 76
- 238000004364 calculation method Methods 0.000 description 73
- 238000010586 diagram Methods 0.000 description 39
- 238000000926 separation method Methods 0.000 description 33
- 230000006870 function Effects 0.000 description 30
- 230000004044 response Effects 0.000 description 11
- 230000005236 sound signal Effects 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 206010010356 Congenital anomaly Diseases 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Noise Elimination (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
【課題】少ない演算量で高品質な雑音抑圧を達成することのできる雑音抑圧の方法及び装置を提供する。
【解決手段】入力信号を周波数領域信号に変換し、該周波数領域信号の帯域を統合して統合周波数領域信号を求め、該統合周波数領域信号を用いて推定雑音を求め、該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定め、該抑圧係数で前記周波数領域信号を重みづけすることによって、入力信号に含まれている雑音を抑圧する。
【選択図】図2
【解決手段】入力信号を周波数領域信号に変換し、該周波数領域信号の帯域を統合して統合周波数領域信号を求め、該統合周波数領域信号を用いて推定雑音を求め、該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定め、該抑圧係数で前記周波数領域信号を重みづけすることによって、入力信号に含まれている雑音を抑圧する。
【選択図】図2
Description
本発明は、所望の音声信号に重畳されている雑音を抑圧するための雑音抑圧の方法及び装置、並びに雑音抑圧の信号処理に用いるコンピュータプログラムに関する。
ノイズサプレッサ(雑音抑圧システム)は、所望の音声信号に重畳されている雑音(ノイズ)を抑圧するシステムであり、一般的に、周波数領域に変換した入力信号を用いて雑音成分のパワースペクトルを推定し、この推定パワースペクトルを入力信号から差し引くことにより、所望の音声信号に混在する雑音を抑圧するように動作する。雑音成分のパワースペクトルを継続的に推定することにより、非定常な雑音の抑圧にも適用することができる。従来のノイズサプレッサは、例えば、特許文献1(特開2002−204175号公報)に記載されている。
通常、音波を収集するマイクロフォンの出力信号をアナログ−ディジタル(AD)変換したディジタル信号が、入力信号としてノイズサプレッサに供給される。主として、マクロフォンにおける集音やAD変換の際に付加される低周波成分を抑圧する目的で、一般的にAD変換とノイズサプレッサの間には高域通過フィルタを配置する。このような構成の例は、例えば特許文献2(米国特許5,659,622号)に開示されている。
図1に、特許文献1のノイズサプレッサに特許文献2の高域通過フィルタを適用した構成を示す。
入力端子11には、劣化音声信号(所望音声信号と雑音の混在する信号)が、サンプル値系列として供給される。劣化音声信号サンプルは、高域通過フィルタ17に供給され、低域成分が抑圧された後、フレーム分割部1に供給される。低域成分の抑圧は、入力される劣化音声の線形性を保ち、十分な信号処理性能を発揮するために、実用上不可欠な処理である。フレーム分割部1は、劣化音声信号サンプルを特定の数を単位としたフレームに分割し、窓掛け処理部2へ伝達する。窓掛け処理部2は、フレームに分割された劣化音声サンプルと窓関数を乗算し、その結果をフーリエ変換部3へ伝達する。
フーリエ変換部3は、窓掛けされた劣化音声サンプルにフーリエ変換を施して複数の周波数成分に分割し、振幅値を多重化して、推定雑音計算部52、雑音抑圧係数生成部82、及び多重乗算部16へ供給する。位相は逆フーリエ変換部9に伝達される。推定雑音計算部52は、供給された複数の周波数成分それぞれに対して雑音を推定し、雑音抑圧係数生成部82へ伝達する。雑音推定の一例として、過去の信号対雑音比で劣化音声を重み付けて雑音成分とする方式があり、その詳細は特許文献1に記載されている。
雑音抑圧係数生成部82では、劣化音声に乗算することによって雑音が抑圧された強調音声を求めるため、雑音抑圧係数を、複数の周波数成分それぞれに対して生成する。雑音抑圧係数生成の一例としては、強調音声の平均二乗パワーを最小化する最小平均二乗短時間スペクトル振幅法が広く用いられており、その詳細は特許文献1に記載されている。
周波数別に生成した雑音抑圧係数は多重乗算部16に供給される。多重乗算部16は、フーリエ変換部3から供給された劣化音声と雑音抑圧係数生成部82から供給された雑音抑圧係数を、各周波数毎に乗算し、その積を強調音声の振幅として逆フーリエ変換部9に伝達する。逆フーリエ変換部9は、多重乗算部16から供給された強調音声振幅とフーリエ変換部3から供給された劣化音声の位相を合わせて逆フーリエ変換を行い、強調音声信号サンプルとして、フレーム合成部10に供給する。このフレーム合成部10では、隣接フレームの強調音声サンプルを用いて当該フレームの出力音声サンプルを合成し、出力端子12に供給する。
特開2002−204175号公報
米国特許5,659,622号
高域通過フィルタ17は、直流近傍の周波数成分を抑圧するものであり、通常、100Hzから120Hzの周波数以上の成分は抑圧せずにそのまま通過させる。高域通過フィルタ17の構成は、有限インパルス応答(FIR)型または無限インパルス応答(IIR)型のフィルタとすることができるが、鋭い通過帯域端特性が必要であるために、通常は後者を用いる。IIR型フィルタはその伝達関数が有利関数で表され、分母係数の感度が極めて高いことが知られている。従って、高域通過フィルタ17を有限語長演算で実現する際には、十分な精度を達成するために、倍精度演算を多用しなければならず、演算量が多くなるという問題があった。一方、演算量低減のために高域通過フィルタ17を除去すると、入力信号の線形性を保つことが困難となり、高品質な雑音抑圧が不可能になる。
また、推定雑音計算部52では、フーリエ変換部3から供給された全ての周波数成分に対して雑音を推定し、それらに対応した雑音抑圧係数を雑音抑圧係数生成部82で求めていた。このため、周波数分解能を向上させるためにフーリエ変換のブロック長(フレーム長)を長くすると、各ブロックを構成するサンプル数が多くなり、演算量が増大するという問題があった。
本発明の目的は、少ない演算量で高品質な雑音抑圧を達成することのできる雑音抑圧の方法及び装置を提供することである。
上記目的を達成するため、本発明に係る雑音抑圧の方法は、
入力信号に含まれている雑音を抑圧する方法であって、
単一チャネルの入力信号を複数の帯域から構成される周波数領域信号に変換し、
前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求め、
該統合周波数領域信号を用いて推定雑音を求め、
該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定め、
該抑圧係数で前記周波数領域信号を重みづけする、
ことを特徴とする。
入力信号に含まれている雑音を抑圧する方法であって、
単一チャネルの入力信号を複数の帯域から構成される周波数領域信号に変換し、
前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求め、
該統合周波数領域信号を用いて推定雑音を求め、
該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定め、
該抑圧係数で前記周波数領域信号を重みづけする、
ことを特徴とする。
本発明に係る別の雑音抑圧の方法は、
単一チャネルの入力信号を複数の帯域成分から構成される周波数領域信号に変換し、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を求め、該抑圧係数で前記周波数領域信号を重みづけすることによって入力信号に含まれている雑音を抑圧する方法であって、
少なくとも一つの抑圧係数を複数の帯域成分に対して利用する、ことを特徴とする。
単一チャネルの入力信号を複数の帯域成分から構成される周波数領域信号に変換し、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を求め、該抑圧係数で前記周波数領域信号を重みづけすることによって入力信号に含まれている雑音を抑圧する方法であって、
少なくとも一つの抑圧係数を複数の帯域成分に対して利用する、ことを特徴とする。
本発明に係る雑音抑圧の装置は、
入力信号に含まれている雑音を抑圧する装置であって、
単一チャネルの入力信号を複数の帯域から構成される周波数領域信号に変換する変換部と、
前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求める帯域統合部と、
該統合周波数領域信号を用いて推定雑音を求める雑音推定部と、
該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める抑圧係数生成部と、
該抑圧係数で前記周波数領域信号を重みづけする乗算部と、
を有することを特徴とする。
入力信号に含まれている雑音を抑圧する装置であって、
単一チャネルの入力信号を複数の帯域から構成される周波数領域信号に変換する変換部と、
前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求める帯域統合部と、
該統合周波数領域信号を用いて推定雑音を求める雑音推定部と、
該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める抑圧係数生成部と、
該抑圧係数で前記周波数領域信号を重みづけする乗算部と、
を有することを特徴とする。
本発明に係る別の雑音抑圧の装置は、
単一チャネルの入力信号を複数の帯域成分から構成される周波数領域信号に変換する変換部と、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を求める抑圧係数生成部と、該抑圧係数で前記周波数領域信号を重みづけする乗算部と、を少なくとも具備する雑音抑圧の装置であって、
前記周波数領域信号の帯域を統合して統合周波数領域信号を求める帯域統合部を有し、
前記抑圧係数生成部は、前記統合周波数領域信号を用いて抑圧係数を定め、
前記乗算部は、該抑圧係数の少なくとも一つを複数の帯域に対して共用して前記周波数領域信号を重みづけすることを特徴とする。
単一チャネルの入力信号を複数の帯域成分から構成される周波数領域信号に変換する変換部と、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を求める抑圧係数生成部と、該抑圧係数で前記周波数領域信号を重みづけする乗算部と、を少なくとも具備する雑音抑圧の装置であって、
前記周波数領域信号の帯域を統合して統合周波数領域信号を求める帯域統合部を有し、
前記抑圧係数生成部は、前記統合周波数領域信号を用いて抑圧係数を定め、
前記乗算部は、該抑圧係数の少なくとも一つを複数の帯域に対して共用して前記周波数領域信号を重みづけすることを特徴とする。
本発明に係る雑音抑圧用のコンピュータプログラムは、
入力信号に含まれている雑音を抑圧する信号処理を行なうコンピュータプログラムであって、
単一チャネルの入力信号を複数の帯域から構成される周波数領域信号に変換する処理と、
前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求める処理と、
該統合周波数領域信号を用いて推定雑音を求める処理と、
該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める処理と、
該抑圧係数で前記周波数領域信号を重みづけする処理と、
をコンピュータに実行させることを特徴とする。
入力信号に含まれている雑音を抑圧する信号処理を行なうコンピュータプログラムであって、
単一チャネルの入力信号を複数の帯域から構成される周波数領域信号に変換する処理と、
前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求める処理と、
該統合周波数領域信号を用いて推定雑音を求める処理と、
該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める処理と、
該抑圧係数で前記周波数領域信号を重みづけする処理と、
をコンピュータに実行させることを特徴とする。
本発明に係る別の雑音抑圧用のコンピュータプログラムは、
単一チャネルの入力信号を複数の帯域成分から構成される周波数領域信号に変換し、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を定め、該抑圧係数で前記周波数領域信号を重みづけする信号処理を行なうコンピュータプログラムであって、
前記周波数領域信号の帯域を統合して統合周波数領域信号を求め、該統合周波数領域信号を用いて前記抑圧係数を定め、該抑圧係数の少なくとも一つを複数の帯域に対して共用して前記周波数領域信号を重みづけする処理をコンピュータに実行させることを特徴とする。
単一チャネルの入力信号を複数の帯域成分から構成される周波数領域信号に変換し、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を定め、該抑圧係数で前記周波数領域信号を重みづけする信号処理を行なうコンピュータプログラムであって、
前記周波数領域信号の帯域を統合して統合周波数領域信号を求め、該統合周波数領域信号を用いて前記抑圧係数を定め、該抑圧係数の少なくとも一つを複数の帯域に対して共用して前記周波数領域信号を重みづけする処理をコンピュータに実行させることを特徴とする。
本発明によれば、単精度演算による実現が可能であり、少ない演算量で高品質の雑音抑圧を達成することができる。更に、本発明によれば、雑音推定と雑音抑圧係数生成を、フーリエ変換の各ブロックを構成するサンプル数よりも少ない数の周波数成分に対して行うので、演算量を削減することができる。
図2は、本発明の第1の実施の形態を示すブロック図である。
図2に示す構成と従来例である図1に示した構成とは、高域通過フィルタ17、振幅補正部18、位相補正部19、窓がけ処理部20、帯域統合部53、推定雑音補正部54、多重乗算部161を除いて同一である。以下、これらの相違点を中心に詳細な動作を説明する。
図2では、図1の高域通過フィルタ17と多重乗算部16とを削除し、代わりに振幅補正部18、位相補正部19、窓がけ処理部20、帯域統合部53、推定雑音補正部54、多重乗算部161を加えている。
振幅補正部18と位相補正部19は、高域通過フィルタの周波数応答を周波数領域に変換された信号に対して適用するために設けられている。即ち、図2では、図1の高域通過フィルタ17の伝達関数にz=exp(j・2πf)を適用して得られるfの関数の絶対値(振幅周波数応答)を振幅補正部18で入力信号に適用し、位相(位相周波数応答)を位相補正部19で入力信号に適用する。これらの操作により、図1の高域通過フィルタ17を入力信号に適用したときと同等の効果を得ることができる。すなわち、高域通過フィルタ17の伝達関数を時間領域で入力信号と畳み込む代わりに、フーリエ変換部3で周波数領域信号に変換した後に周波数応答を乗算することになる。
振幅補正部18の出力は帯域統合部53と多重乗算部161に供給される。帯域統合部53は、複数の周波数成分に対応した信号サンプルを統合して総数を削減し、推定雑音計算部52と雑音抑圧係数生成部82へ伝達する。統合に際しては、複数の信号サンプルを加算し、加算したサンプル数で除することによって平均値を求める。推定雑音補正部54は、推定雑音計算部52から供給された推定雑音を補正して雑音抑圧係数生成部82へ伝達する。
推定雑音補正部54における補正の最も基本的な動作は、全周波数成分に同じ定数を乗じることである。定数を周波数毎に異なったものとすることも可能である。この特殊な場合が、特定の周波数に対する定数を1.0に設定することであり、定数1.0が適用された周波数におけるデータには補正が行われず、それ以外の周波数のデータに対して補正が行われる。すなわち、周波数に対して選択的な補正が可能となる。このほかにも、周波数毎に異なった値を加算したり、非線形処理したりするなどの補正が可能である。
このような補正を行うことによって、帯域統合によって生じた推定雑音値の真値からのずれを低減し、出力である強調音声の音質を高く保つことが可能となる。後述の帯域統合法に対しては、8kHzサンプリングにおいて、1000Hz相当以上の帯域の推定雑音に定数0.7を乗じることが適切であることが、非公式な主観評価によって明らかになっている。
位相補正部19の出力は、逆フーリエ変換部9に伝達される。これ以降の動作は、図1を用いて説明した通りである。窓がけ処理部20は、特許文献3(特開2003-131689号公報)に開示されているように、フレーム境界における断続音を抑圧するために装備されている。
図3に、図2の振幅補正部18の構成例を示す。ここでは、独立なフーリエ変換出力成分の個数をKとする。フーリエ変換部3から供給された多重化劣化音声振幅スペクトルは、分離部1801に伝達される。分離部1801は、多重化された劣化音声振幅スペクトルを各周波数成分に分解して、重み付け処理部18020〜1802K-1に伝達する。重み付け処理部18020〜1802K-1はそれぞれ、各周波数成分に分解された劣化音声振幅スペクトルを、対応する振幅周波数応答で重み付けして、多重化部1803に伝達する。多重化部1803は、重み付け処理部18020〜1802K-1から伝達された信号を多重化し、補正劣化音声振幅スペクトルとして出力する。
図4に、図2の位相補正部19の構成例を示す。フーリエ変換部3から供給された多重化劣化音声位相スペクトルは、分離部1901に伝達される。分離部1901は、多重化された劣化音声位相スペクトルを各周波数成分に分解して、位相回転部19020〜1902K-1に伝達する。位相回転部19020〜1902K-1はそれぞれ、各周波数成分に分解された劣化音声位相スペクトルを対応する位相周波数応答に応じて回転させ、多重化部1903に伝達する。多重化部1903は、位相回転部19020〜1902K-1から伝達された信号を多重化して補正劣化音声位相スペクトルとして出力する。
図5は、図2の帯域統合部53において複数の周波数サンプルが統合される様子を説明するための図である。ここでは、8kHzサンプリング、すなわち帯域が4kHzである信号を、ブロック長Lでフーリエ変換する場合を示している。特許文献1では、フーリエ変換された劣化音声信号サンプルは、フーリエ変換のブロック長Lと等しい数だけ生じるが、このうち互いに独立なものはその半分のL/2である。
本発明では、これらL/2サンプルを部分的に統合し、独立な周波数成分の数を削減する。その際に、高周波領域でより多くのサンプルを1つのサンプルに統合する。すなわち、高域成分ほどたくさんの周波数成分を1つに統合することになり、不等分割されることになる。このような不等分割の例としては、低域側に向かって2のべき乗で帯域が狭くなるオクターブ分割、人間の聴覚特性に基づいて帯域分割された臨界帯域などが知られている。臨界帯域の詳細に関しては、非特許文献1(1999年1月、サイコアクースティクス、第2版、スプリンガー(PSYCHOACOUSTICS, 2ND ED., SPRINGER, JAN. 1999) 158〜164ページ)を参照することができる。
特に、臨界帯域に従った帯域分割は、人間の聴覚特性と整合性が高いために、広く用いられている。4kHz帯域では、臨界帯域は全部で18の帯域から構成される。一方、図5に示すように、本発明では、特に低域で臨界帯域よりも細分化することによって、雑音抑圧特性の劣化を防いでいる。1156Hzより高い周波数から4kHzまでは、臨界帯域と同じ帯域分割を採用するが、それよりも低域ではさらに帯域を細分化することに特徴がある。
図5には、L=256の例を示している。直流から13番目の周波数成分までは、統合せずにそのまま独立に取り扱う。これらに続く14成分は2成分ずつの7グループに統合する。さらに続く6成分は3成分ずつの2グループに統合する。この後、4成分で1グループに統合し、それ以上は臨界帯域に一致するように成分を統合する。
このように周波数成分を統合することによって、独立な周波数成分の数を、128から32に低減することができる。フーリエ変換後の128周波数成分と統合後の32周波数成分の対応を表1に示す。周波数成分一つあたり4000/128=31.25Hzとなるので、これを用いて計算した対応周波数が一番右の欄に示されている。
帯域統合部53の動作においては、400Hz程度以下の周波数で周波数成分の統合を行わないことが重要である。この周波数領域で周波数成分の統合を行うと、分解能が低下し、音質の低下をもたらす。一方、1156Hz程度以上の周波数では、臨界帯域に従って周波数成分を統合してもよい。また、入力信号の帯域が広くなったときには、フーリエ変換のブロック長Lを長くして、音質を保つ必要がある。これは、上記400Hz以下の周波数成分の統合を行わない帯域で、一つの周波数成分あたりの帯域が増加し、分解能が劣化するためである。例えば、L=256、帯域4kHzを基準にすると、フーリエ変換のブロック長Lを、L>fs/31.25で求めることによって、広帯域信号でも4kHz帯域のときと同程度の音質を維持することができる。この法則に従って、Lを2のべき乗に選ぶと、8kHz<fs≦16kHzでL=512、16kHz<fs≦32kHzでL=1024、32kHz<fs≦64kHzでL=2048となる。表1に対応したfs=16kHzの例を表2に示す。表2は一例であり、帯域統合の境界が少しだけ異なるものは同等の効果を有する。
図6に、多重乗算部161の構成例を示す。多重乗算部161は、乗算器16010〜1601K-1、分離部1602、1603、多重化部1604を有する。多重化された状態で図2の振幅補正部18から供給された補正劣化音声振幅スペクトルは、分離部1602において周波数別のKサンプルに分離され、それぞれ乗算器16010〜1601K-1に供給される。多重化された状態で図2の雑音抑圧係数生成部82から供給された雑音抑圧係数は、分離部1603において周波数別に分離され、乗算器16010〜1601K-1に供給される。
周波数別に分離された雑音抑圧係数の数は、帯域統合部53において統合された帯域の数に等しい。すなわち、帯域統合部53で統合されたサブバンドのそれぞれに対応した雑音抑圧係数が、分離部1603において分離されることになる。
図5の例では、分離された雑音抑圧係数の数は、32となる。分離された雑音抑圧係数は、帯域統合部53における帯域統合パターンに対応した乗算器に供給される。図5の例では、表1に従って、複数の乗算器に同一の雑音抑圧係数が供給される。
表1の例では、K=128なので、乗算器160113〜160114、乗算器160115〜160116、乗算器160117〜160118、乗算器160119〜160120、乗算器160121〜160122、乗算器160123〜160124、乗算器160125〜160126、乗算器160127〜160129、乗算器160130〜160132、乗算器160133〜160136、乗算器160137〜160142、乗算器160143〜160148、乗算器160149〜160156、乗算器160157〜160165、乗算器160166〜160175、乗算器160176〜160187、乗算器160188〜1601101、乗算器1601102〜1601119、乗算器1601120〜1601128には、それぞれ共通の雑音抑圧係数が伝達される。乗算器16010〜160112には、それぞれ独立の雑音抑圧係数が伝達される。乗算器16010〜1601K-1は、それぞれ入力された補正劣化音声スペクトルと雑音抑圧係数を乗算し、多重化部1604に伝達する。多重化部1604は、入力された信号を多重化し、強調音声振幅スペクトルとして出力する。
図7は、本発明の第2の実施の形態を示すブロック図である。第1の実施の形態を示す図2の構成との違いは、オフセット除去部22である。オフセット除去部22は、窓がけ処理された劣化音声に対してオフセットを除去して出力する。オフセット除去の最も簡単な方式は、フレーム毎に劣化音声の平均値を求めてオフセットとし、これを当該フレーム内の全サンプルから差し引くことである。また、フレーム毎の平均値を複数フレームに渡って平均化し、その平均値をオフセットとして差し引いてもよい。オフセット除去によって、次に続くフーリエ変換部における変換精度が向上し、出力における強調音声の音質を改善することができる。
図8は、本発明の第3の実施の形態を示すブロック図である。入力端子11には、劣化音声信号が、サンプル値系列として供給される。劣化音声信号サンプルは、フレーム分割部1に供給され、K/2サンプル毎のフレームに分割される。ここで、Kは偶数とする。フレームに分割された劣化音声信号サンプルは、窓がけ処理部2に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号yn(t) (t=0, 1, ..., K/2-1)に対するw(t)で窓がけされた信号yn(t)バーは、次式で与えられる。
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけすることも広く行なわれている。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1に対して、
で得られるyn(t)バー (t=0, 1, ..., K-1)が、窓がけ処理部2の出力となる。実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、抑圧係数を1に設定したときの入力信号と出力信号が、計算誤差を除いて一致するように設計される。これは、w(t)+w(t+K/2)=1となることを意味する。
以後、連続する2フレームの50%をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば次式に示すハニング窓を用いることができる。
このほかにも、ハミング窓、ケイザー窓、ブラックマン窓など、様々な窓関数が知られている。窓がけされた出力yn(t)バーは、オフセット除去部22に供給されて、オフセットを除去される。オフセット除去の詳細に関しては、図7を用いて説明した通りである。オフセット除去後の信号はフーリエ変換部3に供給され、劣化音声スペクトルYn(k)に変換される。劣化音声スペクトルYn(k)は位相と振幅に分離され、劣化音声位相スペクトルarg Yn(k)は、位相補正部19を経て、逆フーリエ変換部9に、劣化音声振幅スペクトル|Yn(k)|は、振幅補正部18を経て、多重乗算部13と多重乗算部16に供給される。位相補正部19と振幅補正部18の動作については、図2を用いて説明した通りである。
多重乗算部13は、振幅補正された劣化音声振幅スペクトルを用いて劣化音声パワースペクトルを計算し、帯域統合部53に伝達する。帯域統合部53は、劣化音声パワースペクトルを部分的に統合して独立な周波数成分の数を削減した後、推定雑音計算部5、周波数別SNR(信号対雑音比)計算部6及び重みつき劣化音声計算部14に伝達する。帯域統合部53の動作については、図2を用いて説明した通りである。重みつき劣化音声計算部14は、多重乗算部13から供給された劣化音声パワースペクトルを用いて重みつき劣化音声パワースペクトルを計算し、推定雑音計算部5に伝達する。推定雑音計算部5は、劣化音声パワースペクトル、重みつき劣化音声パワースペクトル、及びカウンタ4から供給されるカウント値を用いて雑音のパワースペクトルを推定し、推定雑音パワースペクトルとして周波数別SNR計算部6に伝達する。
周波数別SNR計算部6は、入力された劣化音声パワースペクトルと推定雑音パワースペクトルを用いて周波数帯域別にSNRを計算し、後天的SNRとして推定先天的SNR計算部7と雑音抑圧係数生成部8に供給する。
推定先天的SNR計算部7は、入力された後天的SNR、及び抑圧係数補正部15から供給された補正抑圧係数を用いて先天的SNRを推定し、推定先天的SNRとして、雑音抑圧係数生成部8に伝達する。雑音抑圧係数生成部8は、入力として供給された後天的SNR、推定先天的SNR及び音声非存在確率記憶部21から供給される音声非存在確率を用いて雑音抑圧係数を生成し、抑圧係数として抑圧係数補正部15に伝達する。
抑圧係数補正部15は、入力された推定先天的SNRと抑圧係数を用いて抑圧係数を補正し、補正抑圧係数Gn(k)バーとして多重乗算部161に供給する。多重乗算部161は、フーリエ変換部3から振幅補正部18を経て供給された補正劣化音声振幅スペクトルを、抑圧係数補正部15から供給された補正抑圧係数Gn(k)バーで重み付けすることによって強調音声振幅スペクトル|Xn(k)|バーを求め、逆フーリエ変換部9に伝達する。|Xn(k)|バーは、次式で与えられる。
ここで、Hn(k)は、振幅補正部18における補正利得であり、高域通過フィルタ17の振幅周波数応答を近似する特性を有する。
逆フーリエ変換部9は、多重乗算部161から供給された強調音声振幅スペクトル|Xn(k)|バーとフーリエ変換部3から位相補正部19を経て供給された補正劣化音声位相スペクトル arg Yn(k) + arg Hn(k)を乗算して、強調音声Xn(k)バーを求める。すなわち、
を実行する。ここで、arg Hn(k)は、位相補正部19における補正位相であり、高域通過フィルタ17の位相周波数応答を近似する特性を有する。
得られた強調音声Xn(k)バーに逆フーリエ変換を施し、1フレームがKサンプルから構成される時間領域サンプル値系列xn(t)バー (t=0, 1, ..., K-1)として、窓がけ処理部20に供給され、窓関数w(t)との乗算が行なわれる。第nフレームの入力信号xn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけされた信号xn(t)バーは、次式で与えられる。
また、連続する2フレームの一部を重ね合わせ(オーバラップ)して窓がけすることも広く行なわれている。オーバラップ長としてフレーム長の50%を仮定すれば、t=0, 1, ..., K/2-1に対して、
で得られるyn(t)バー (t=0, 1, ..., K-1)が、窓がけ処理部20の出力となり、フレーム合成部10に伝達される。フレーム合成部10は、xn(t)バーの隣接する2フレームからK/2サンプルずつを取り出して重ね合わせ、
によって、強調音声xn(t)ハットを得る。得られた強調音声xn(t)ハット (t=0, 1, ..., K-1)が、フレーム合成部10の出力として、出力端子12に伝達される。
図9は、図8に示した多重乗算部13の構成を示すブロック図である。多重乗算部13は、乗算器13010〜1301K-1、分離部1302、1303、多重化部1304を有する。多重化された状態で図8の振幅補正部18から供給された補正劣化音声振幅スペクトルは、分離部1302及び1303において周波数別のKサンプルに分離され、それぞれ乗算器13010〜1301K-1に供給される。乗算器13010〜1301K-1は、それぞれ入力された信号を2乗し、多重化部1304に伝達する。多重化部1304は、入力された信号を多重化し、劣化音声パワースペクトルとして出力する。
図10は重みつき劣化音声計算部14の構成を示すブロック図である。重みつき劣化音声計算部14は、推定雑音記憶部1401、周波数別SNR計算部1402、多重非線形処理部1405、及び多重乗算部1404を有する。推定雑音記憶部1401は、図8の推定雑音計算部5から供給される推定雑音パワースペクトルを記憶し、1フレーム前に記憶された推定雑音パワースペクトルを周波数別SNR計算部1402へ出力する。周波数別SNR計算部1402は、推定雑音記憶部1401から供給される推定雑音パワースペクトルと図8の帯域統合部53から供給される劣化音声パワースペクトルを用いてSNRを各周波数帯域毎に求め、多重非線形処理部1405に出力する。
多重非線形処理部1405は、周波数別SNR計算部1402から供給されるSNRを用いて重み係数ベクトルを計算し、重み係数ベクトルを多重乗算部1404に出力する。多重乗算部1404は、図8の帯域統合部53から供給される劣化音声パワースペクトルと、多重非線形処理部1405から供給される重み係数ベクトルの積を周波数帯域毎に計算し、重みつき劣化音声パワースペクトルを図8の推定雑音記憶部5に出力する。多重乗算部1404の構成は、図9を用いて説明した多重乗算部13に等しいので、詳細な説明は省略する。
図11は、図10に示した周波数別SNR計算部1402の構成を示すブロック図である。周波数別SNR計算部1402は、除算部 14210〜1421M-1、分離部1422、1423、多重化部1424を有する。図8の帯域統合部53から供給される劣化音声パワースペクトルは、分離部1422に伝達される。図10の推定雑音記憶部1401から供給される推定雑音パワースペクトルは、分離部1423に伝達される。劣化音声パワースペクトルは分離部1422において、推定雑音パワースペクトルは分離部1423において、それぞれ周波数成分に対応したMサンプルに分離され、それぞれ除算部14210〜1421M-1に供給される。これらのMサンプルは、帯域統合部53において統合された周波数成分から構成されるサブバンドに対応している。除算部14210〜1421M-1では、次式に従って、供給された劣化音声パワースペクトルを推定雑音パワースペクトルで除算して周波数別SNR γn(k)ハットを求め、多重化部1424に伝達する。
ここで、λn-1(k)は1フレーム前に記憶された推定雑音パワースペクトルである。多重化部1424は、伝達されたM個の周波数別SNRを多重化して、図10の多重非線形処理部1405へ伝達する。
次に、図12を参照しながら、図10の多重非線形処理部1405の構成と動作について詳しく説明する。図12は、重みつき劣化音声計算部14に含まれる多重非線形処理部1405の構成を示すブロック図である。多重非線形処理部1405は、分離部1495、非線形処理部14850〜1485M-1及び多重化部1475を有する。分離部1495は、図10の周波数別SNR計算部1402から供給されるSNRを周波数帯域別のSNRに分離し、非線形処理部14850〜1485M-1に伝達する。非線形処理部14850〜1485M-1は、それぞれ入力値に応じた実数値を出力する非線形関数を有する。
図13に非線形関数の例を示す。f1を入力値としたとき、図13に示される非線形関数の出力値f2は、
で与えられる。但し、aとbは任意の実数である。
図12の非線形処理部14850〜1485M-1は、分離部1495から供給される周波数帯域別SNRを、非線形関数によって処理して重み係数を求め、多重化部1475に出力する。すなわち、非線形処理部14850〜1485M-1はSNRに応じた1から0までの重み係数を出力する。SNRが小さい時は1を、大きい時は0を出力する。多重化部1475は、非線形処理部14850〜1485M-1から出力された重み係数を多重化し、重み係数ベクトルとして多重乗算部1404に出力する。
図10の多重乗算部1404で劣化音声パワースペクトルと乗算される重み係数は、SNRに応じた値になっており、SNRが大きい程、すなわち劣化音声に含まれる音声成分が大きい程、重み係数の値は小さくなる。推定雑音の更新には一般に劣化音声パワースペクトルが用いられるが、推定雑音の更新に用いる劣化音声パワースペクトルに対して、SNRに応じた重みづけを行うことで、劣化音声パワースペクトルに含まれる音声成分の影響を小さくすることができ、より精度の高い雑音推定を行うことができる。なお、重み係数の計算に非線形関数を用いた例を示したが、非線形関数以外にも線形関数や高次多項式など、他の形で表されるSNRの関数を用いる事も可能である。
図14は、図8に示した推定雑音計算部5の構成を示すブロック図である。雑音推定計算部5は、分離部501、502、多重化部503、及び周波数別推定雑音計算部5040〜504M-1を有する。分離部501は、図8の重みつき劣化音声計算部14から供給される重みつき劣化音声パワースペクトルを周波数帯域別の重みつき劣化音声パワースペクトルに分離し、周波数別推定雑音計算部5040〜504M-1にそれぞれ供給する。分離部502 は、図8の帯域統合部53から供給される劣化音声パワースペクトルを周波数帯域別の劣化音声パワースペクトルに分離し、周波数別推定雑音計算部5040〜504M-1にそれぞれ出力する。
周波数別推定雑音計算部5040〜504M-1は、分離部501から供給される周波数帯域別重みつき劣化音声パワースペクトル、分離部502から供給される周波数帯域別劣化音声パワースペクトル、及び図8のカウンタ4から供給されるカウント値から周波数別推定雑音パワースペクトルを計算し、多重化部503へ出力する。多重化部503は、周波数別推定雑音計算部5040〜504M-1から供給される周波数別推定雑音パワースペクトルを多重化し、推定雑音パワースペクトルを図8の周波数別SNR計算部6と重みつき劣化音声計算部14へ出力する。周波数別推定雑音計算部5040〜504M-1の構成と動作の詳細な説明は、図15を参照しながら行う。
図15は、図14に示した周波数別推定雑音計算部5040〜504M-1の構成を示すブロック図である。周波数別推定雑音計算部504は、更新判定部520、レジスタ長記憶部5041、推定雑音記憶部5042、スイッチ5044、シフトレジスタ5045、加算器5046、最小値選択部5047、除算部5048、カウンタ5049を有する。スイッチ5044には、図14の分離部501から、周波数別重みつき劣化音声パワースペクトルが供給されている。スイッチ5044が回路を閉じたときに、周波数別重みつき劣化音声パワースペクトルは、シフトレジスタ5045に伝達される。シフトレジスタ5045は、更新判定部520から供給される制御信号に応じて、内部レジスタの記憶値を隣接レジスタにシフトする。シフトレジスタ長は、後述するレジスタ長記憶部5041に記憶されている値に等しい。シフトレジスタ5045の全レジスタ出力は、加算器5046に供給される。加算器5046は、供給された全レジスタ出力を加算して、加算結果を除算部5048に伝達する。
一方、更新判定部520には、カウント値、周波数別劣化音声パワースペクトル及び周波数別推定雑音パワースペクトルが供給されている。更新判定部520は、カウント値が予め設定された値に到達するまでは常に“1”を、到達した後は入力された劣化音声信号が雑音であると判定されたときに“1”を、それ以外のときに“0”を出力し、カウンタ5049、スイッチ5044、及びシフトレジスタ5045に伝達する。スイッチ5044は、更新判定部520から供給された信号が“1”のときに回路を閉じ、“0”のときに開く。カウンタ5049は、更新判定部520から供給された信号が“1”のときにカウント値を増加し、“0”のときには変更しない。シフトレジスタ5045は、更新判定部520から供給された信号が“1”のときにスイッチ5044から供給される信号サンプルを1サンプル取り込むと同時に、内部レジスタの記憶値を隣接レジスタにシフトする。最小値選択部5047には、カウンタ5049の出力とレジスタ長記憶部5041の出力が供給されている。
最小値選択部5047は、供給されたカウント値とレジスタ長のうち、小さい方を選択して、除算部5048に伝達する。除算部5048は、加算器5046から供給された周波数別劣化音声パワースペクトルの加算値をカウント値又はレジスタ長の小さい方の値で除算し、商を周波数別推定雑音パワースペクトルλn(k)として出力する。Bn(k)(n=0, 1, ..., N-1)をシフトレジスタ5045に保存されている劣化音声パワースペクトルのサンプル値とすると、λn(k)は
で与えられる。ただし、Nはカウント値とレジスタ長のうちの小さい方の値である。カウント値はゼロから始まって単調に増加するので、最初はカウント値で除算が行なわれ、後にはレジスタ長で除算が行なわれる。レジスタ長で除算が行なわれることは、シフトレジスタに格納された値の平均値を求めることになる。最初は、シフトレジスタ5045に十分多くの値が記憶されていないために、実際に値が記憶されているレジスタの数で除算する。実際に値が記憶されているレジスタの数は、カウント値がレジスタ長より小さいときはカウント値に等しく、カウント値がレジスタ長より大きくなるとレジスタ長と等しくなる。
図16は、図15に示した更新判定部520の構成を示すブロック図である。更新判定部520は、論理和計算部5201、比較部5203及び5205、閾値記憶部5204及び5206、閾値計算部5207を有する。図8のカウンタ4から供給されるカウント値は、比較部5203に伝達される。閾値記憶部5204の出力である閾値も、比較部5203に伝達される。比較部5203は、供給されたカウント値と閾値を比較し、カウント値が閾値より小さいときに“1”を、カウント値が閾値より大きいときに“0”を、論理和計算部5201に伝達する。一方、閾値計算部5207は、図15の推定雑音記憶部5042から供給される周波数別推定雑音パワースペクトルに応じた値を計算し、閾値として閾値記憶部5206に出力する。
最も簡単な閾値の計算方法は、周波数別推定雑音パワースペクトルを定数倍する方法である。その他に、高次多項式や非線形関数を用いて閾値を計算することも可能である。閾値記憶部5206は、閾値計算部5207から出力された閾値を記憶し、1フレーム前に記憶された閾値を比較部5205へ出力する。比較部5205は、閾値記憶部5206から供給される閾値と図14の分離部502から供給される周波数別劣化音声パワースペクトルを比較し、周波数別劣化音声パワースペクトルが閾値よりも小さければ“1”を、大きければ“0”を論理和計算部5201に出力する。すなわち、推定雑音パワースペクトルの大きさをもとに、劣化音声信号が雑音であるか否かを判別している。論理和計算部5201は、比較部5203の出力値と比較部5205の出力値との論理和を計算し、計算結果を図15のスイッチ5044、シフトレジスタ5045及びカウンタ5049に出力する。
このように、初期状態や無音区間だけでなく、有音区間でも劣化音声パワーが小さい場合には、更新判定部520は“1”を出力する。すなわち、推定雑音の更新が行われる。閾値の計算は各周波数毎に行われるため、各周波数毎に推定雑音の更新を行うことができる。
図17は、図8に示した推定先天的SNR計算部7の構成を示すブロック図である。推定先天的SNR計算部7は、多重値域限定処理部701、後天的SNR記憶部702、抑圧係数記憶部703、多重乗算部704及び705、重み記憶部706、多重重みつき加算部707、加算器708を有する。図8の周波数別SNR計算部6から供給される後天的SNR γn(k)(k=0, 1, ..., M-1)は、後天的SNR記憶部702と加算器708に伝達される。後天的SNR記憶部702は、第nフレームにおける後天的SNR γn(k)を記憶すると共に、第n-1フレームにおける後天的SNR γn-1(k)を多重乗算部705に伝達する。
図8の抑圧係数補正部15から供給される補正抑圧係数Gn(k)バー(k=0, 1, ..., M-1)は、抑圧係数記憶部703に伝達される。抑圧係数記憶部703は、第nフレームにおける補正抑圧係数Gn(k)バーを記憶すると共に、第n-1フレームにおける補正抑圧係数Gn-1(k)バーを多重乗算部704に伝達する。多重乗算部704は、供給されたGn(k)バーを2乗してG2 n-1(k)バーを求め、多重乗算部705に伝達する。多重乗算部705は、G2 n-1(k)バーとγn-1(k)をk=0, 1,..., M-1に対して乗算してG2 n-1(k)バーγn-1(k)を求め、結果を多重重みつき加算部707に過去の推定SNR 922として伝達する。多重乗算部704及び705の構成は、図9を用いて説明した多重乗算部13に等しいので詳細な説明は省略する。
加算器708の他方の端子には−1が供給されており、加算結果γn(k)-1が多重値域限定処理部701に伝達される。多重値域限定処理部701は、加算器708から供給された加算結果γn(k)-1に値域限定演算子P[x]による演算を施し、結果であるP[γn(k)-1]を多重重みつき加算部707に瞬時推定SNR 921として伝達する。ただし、P[x]は次式で定められる。
多重重みつき加算部707には、また、重み記憶部706から重み923が供給されている。多重重みつき加算部707は、これらの供給された瞬時推定SNR 921、過去の推定SNR 922、重み923を用いて推定先天的SNR 924を求める。重み923をαとし、ξn(k)ハットを推定先天的SNRとすると、ξn(k)ハットは、次式によって計算される。
ここでは、G2 -1(k)γ-1(k)バー=1とする。
図18は、図17に示した多重値域限定処理部701の構成を示すブロック図である。多重値域限定処理部701は、定数記憶部7011、最大値選択部70120〜7012M-1、分離部7013、多重化部7014を有する。分離部7013には、図17の加算器708から、γn(k)-1が供給される。分離部7013は、供給されたγn(k)-1をM個の周波数帯域別成分に分離し、最大値選択部70120〜7012M-1に供給する。最大値選択部70120〜7012M-1の他方の入力には、定数記憶部7011からゼロが供給されている。最大値選択部70120〜7012M-1は、γn(k)-1をゼロと比較し、大きい方の値を多重化部7014へ伝達する。この最大値選択演算は、上述の式12を実行することに相当する。多重化部7014は、これらの値を多重化して出力する。
図19は、図17に含まれる多重重みつき加算部707の構成を示すブロック図である。多重重みつき加算部707は、重みつき加算部70710〜7071M-1、分離部7072、7074、多重化部7075を有する。分離部7072には、図17の多重値域限定処理部701から、P[γn(k)-1]が瞬時推定SNR 921として供給される。分離部7072は、P[γn(k)-1]をM個の周波数帯域別成分に分離し、周波数帯域別瞬時推定SNR 9210〜921M-1として、重みつき加算部70710〜7071M-1に伝達する。分離部7074には、図17の多重乗算部705から、G2 n-1(k)バーγn-1(k)が過去の推定SNR 922として供給される。分離部7074は、G2 n-1(k)バーγn-1(k)をM個の周波数帯域別成分に分離し、過去の周波数帯域別推定SNR 9220〜922M-1として、重みつき加算部70710〜7071M-1に伝達する。一方、重みつき加算部70710〜7071M-1には、重み923も供給される。重みつき加算部70710〜7071M-1は、上述の式13によって表される重みつき加算を実行し、周波数帯域別推定先天的SNR 9240〜924M-1を多重化部7075に伝達する。多重化部7075は、周波数帯域別推定先天的SNR 9240〜924M-1を多重化し、推定先天的SNR 924として出力する。重みつき加算部70710〜7071M-1の動作と構成については、次に図20を参照しながら説明する。
図20は、図19に示した重みつき加算部70710〜7071M-1の構成を示すブロック図である。重みつき加算部7071は、乗算器7091及び7093、定数乗算器7095、加算器7092及び7094を有する。図19の分離部7072から周波数帯域別瞬時推定SNR 921が、図19の分離部7074から過去の周波数帯域別SNR 922が、図17の重み記憶部706から重み923が、それぞれ入力として供給される。値αを有する重み923は、定数乗算器7095と乗算器7093に伝達される。定数乗算器7095は入力信号を−1倍して得られた−αを、加算器7094に伝達する。加算器7094のもう一方の入力としては1が供給されており、加算器7094の出力は両者の和である1−αとなる。1−αは乗算器7091に供給されて、もう一方の入力である周波数帯域別瞬時推定SNR P[γn(k)−1]と乗算され、それらの積である(1−α)P[γn(k)−1]が加算器7092に伝達される。一方、乗算器7093では、重み923として供給されたαと過去の推定SNR 922が乗算され、それらの積であるαG2 n-1(k)バーγn-1(k)が加算器7092に伝達される。加算器7092は、(1−α)P[γn(k)−1]とαG2 n-1(k)バーγn-1(k)の和を、周波数帯域別推定先天的SNR 904として出力する。
図21は、図8に示した雑音抑圧係数生成部8を示すブロック図である。雑音抑圧係数生成部8は、MMSE STSA ゲイン関数値計算部811、一般化尤度比計算部812、及び抑圧係数計算部814を有する。以下、非特許文献2(1984年12月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第32巻、第6号(IEEE TRANSACTIONSON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING,VOL.32, NO.6, PP.1109-1121, DEC,1984)、1109〜1121 ページ)に記載されている計算式をもとに、抑圧係数の計算方法を説明する。
フレーム番号をn、周波数番号をkとし、γn(k)を図8の周波数別SNR計算部6から供給される周波数別後天的SNR、ξn(k)ハットを図8の推定先天的SNR計算部7から供給される周波数別推定先天的SNR、qを図8の音声非存在確率記憶部21から供給される音声非存在確率とする。また、
ηn(k)= ξn(k)ハット/(1-q)、
vn(k) = (ηn(k)γn(k))/(1+ηn(k))
とする。MMSE STSA ゲイン関数値計算部811は、図8の周波数別SNR計算部6から供給される後天的SNR γn(k)、図8の推定先天的SNR計算部7から供給される推定先天的SNR ξn(k)ハット及び図8の音声非存在確率記憶部21から供給される音声非存在確率qをもとに、各周波数帯域毎にMMSE STSAゲイン関数値を計算し、抑圧係数計算部814に出力する。各周波数帯域毎のMMSE STSAゲイン関数値 Gn(k) は、
ηn(k)= ξn(k)ハット/(1-q)、
vn(k) = (ηn(k)γn(k))/(1+ηn(k))
とする。MMSE STSA ゲイン関数値計算部811は、図8の周波数別SNR計算部6から供給される後天的SNR γn(k)、図8の推定先天的SNR計算部7から供給される推定先天的SNR ξn(k)ハット及び図8の音声非存在確率記憶部21から供給される音声非存在確率qをもとに、各周波数帯域毎にMMSE STSAゲイン関数値を計算し、抑圧係数計算部814に出力する。各周波数帯域毎のMMSE STSAゲイン関数値 Gn(k) は、
で与えられる。ここで、I0(z)は0次変形ベッセル関数、I1(z)は1次変形ベッセル関数である。変形ベッセル関数については、非特許文献3(1985年、数学辞典、岩波書店、374.Gページ)に記載されている。
一般化尤度比計算部812は、図8の周波数別SNR計算部6から供給される後天的SNR γn(k)、図8の推定先天的SNR計算部7から供給される推定先天的SNR ξn(k)ハット及び図8の音声非存在確率記憶部21から供給される音声非存在確率qをもとに、周波数帯域毎に一般化尤度比を計算し、抑圧係数計算部814に伝達する。周波数帯域毎の一般化尤度比Λn(k)は、
で与えられる。
抑圧係数計算部814は、MMSE STSA ゲイン関数値計算部811から供給されるMMSE STSA ゲイン関数値Gn(k)と一般化尤度比計算部812から供給される一般化尤度比Λn(k)から周波数毎に抑圧係数を計算し、図8の抑圧係数補正部15へ出力する。周波数帯域毎の抑圧係数Gn(k)バーは、
で与えられる。周波数帯域別にSNRを計算する代わりに、複数の周波数帯域から構成される広い帯域に共通なSNRを求めて、これを用いることも可能である。
図22は、図8に示した抑圧係数補正部15の構成を示すブロック図である。抑圧係数補正部15は、周波数別抑圧係数補正部15010〜1501M-1、分離部1502及び1503、及び多重化部1504を有する。分離部1502は、図8の推定先天的SNR計算部7から供給される推定先天的SNRを周波数帯域別成分に分離し、それぞれ周波数別抑圧係数補正部15010〜1501M-1に出力する。分離部1503は、図8の抑圧係数生成部8から供給される抑圧係数を周波数帯域別成分に分離し、それぞれ周波数別抑圧係数補正部15010〜1501M-1に出力する。周波数別抑圧係数補正部15010〜1501M-1は、分離部1502から供給される周波数帯域別推定先天的SNRと、分離部1503から供給される周波数帯域別抑圧係数から、周波数帯域別補正抑圧係数を計算し、多重化部1504へ出力する。多重化部1504は、周波数別抑圧係数補正部15010〜1501M-1から供給される周波数帯域別補正抑圧係数を多重化し、補正抑圧係数として図8の多重乗算部16と推定先天的SNR計算部7へ出力する。
次に図23を参照しながら、周波数別抑圧係数補正部15010〜1501M-1の構成と動作について詳細に説明する。
図23は、抑圧係数補正部15に含まれる周波数別抑圧係数補正部15010〜1501M-1の構成を示すブロック図である。周波数別抑圧係数補正部1501は、最大値選択部1591、抑圧係数下限値記憶部1592、閾値記憶部1593、比較部1594、スイッチ1595、修正値記憶部1596及び乗算器1597を有する。比較部1594は、閾値記憶部1593から供給される閾値と、図22の分離部1502から供給される周波数帯域別推定先天的SNRを比較し、周波数帯域別推定先天的SNRが閾値よりも大きければ“0”を、小さければ“1”をスイッチ 1595に供給する。スイッチ1595は、図22の分離部1503から供給される周波数帯域別抑圧係数を、比較部1594の出力値が“1”のときに乗算器1597に出力し、“0”のときに最大値選択部1591に出力する。すなわち、周波数帯域別推定先天的SNRが閾値よりも小さいときに、抑圧係数の補正が行われる。乗算器1597は、スイッチ1595の出力値と修正値記憶部1596の出力値との積を計算し、最大値選択部1591に伝達する。
一方、抑圧係数下限値記憶部1592は、記憶している抑圧係数の下限値を、最大値選択部1591に供給する。最大値選択部1591は、図22の分離部1503から供給される周波数帯域別抑圧係数、又は乗算器1597で計算された積と、抑圧係数下限値記憶部1592から供給される抑圧係数下限値とを比較し、大きい方の値を図22の多重化部1504に出力する。すなわち、抑圧係数は抑圧係数下限値記憶部1592が記憶する下限値よりも必ず大きい値になる。
これまで説明した全ての実施の形態では、雑音抑圧の方式として、最小平均2乗誤差短時間スペクトル振幅法を仮定してきたが、その他の方法にも適用することができる。このような方法の例として、非特許文献4(1979年12月、プロシーディングス・オブ・ザ・アイ・イー・イー・イー、第67 巻、第12 号(PROCEEDINGS OF THE IEEE, VOL.67, NO.12, PP.1586-1604, DEC, 1979)、1586〜1604 ページ)に開示されているウィーナーフィルタ法や、非特許文献5(1979年4月、アイ・イー・イー・イー・トランザクションズ・オン・アクースティクス・スピーチ・アンド・シグナル・プロセシング、第27巻、第2号(IEEETRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.27, NO.2,PP.113-120, APR, 1979)、113〜120 ページ)に開示されているスペクトル減算法などがあるが、これらの詳細な構成例については説明を省略する。
また、上述した各実施形態の雑音抑圧装置は、プログラムなどを蓄積する記憶装置、入力用のキーやスイッチが配置された操作部、LCDなどの表示装置、操作部からの入力を受け付けて各部の動作を制御する制御装置から構成されるコンピュータ装置によって構成することができる。前述した各実施形態の雑音抑圧装置における動作は、制御装置が記憶装置に格納されたプログラムを実行することで実現される。プログラムは、予め記憶部に格納されていてもよく、また、CD-ROMなどの記録媒体に書き込まれた状態でユーザに提供されてもよい。また、ネットワークを通じて、プログラムを提供することも可能である。
1 フレーム分割部
2,20 窓がけ処理部
3 フーリエ変換部
4,5049 カウンタ
5,52 推定雑音計算部
6,1402 周波数別SNR計算部
7 推定先天的SNR計算部
8,82 雑音抑圧係数生成部
9 逆フーリエ変換部
10 フレーム合成部
11 入力端子
12 出力端子
13,16,161,704,705,1404 多重乗算部
14 重みつき劣化音声計算部
15 抑圧係数補正部
17 高域通過フィルタ
18 振幅補正部
19 位相補正部
21 音声非存在確率記憶部
22 オフセット除去部
53 帯域統合部
54 推定雑音補正部
501,502,1302,1303,1422,1423,1495,1502,1503,1602,1603,1801,1901,7013,7072,7074 分離部
503,1304,1424,1475,1504,1604,1803,1903,7014,7075 多重化部
5040〜504M-1 周波数別推定雑音計算部
520 更新判定部
701 多重値域限定処理部
702 後天的SNR記憶部
703 抑圧係数記憶部
706 重み記憶部
707 多重重みつき加算部
708,5046,7092,7094 加算器
811 MMSE STSA ゲイン関数値計算部
812 一般化尤度比計算部
814 抑圧係数計算部
921 瞬時推定SNR
9210〜921M-1 周波数帯域別瞬時推定SNR
922 過去の推定SNR
9220〜922M-1 過去の周波数帯域別推定SNR
923 重み
924 推定先天的SNR
9240〜924M-1 周波数帯域別推定先天的SNR
13010〜1301K-1,1597,7091,7093 乗算器
1401,5042 推定雑音記憶部
1405 多重非線形処理部
14210〜1421M-1 5048 除算部
14850〜1485M-1 非線形処理部
15010〜1501M-1 周波数別抑圧係数補正部
1591,70120〜7012M-1 最大値選択部
1592 抑圧係数下限値記憶部
1593,5204,5206 閾値記憶部
1594,5203,5205 比較部
1595,5044 スイッチ
1596 修正値記憶部
18020〜1802K-1 重み付け処理部
19020〜1902K-1 位相回転部
5041 レジスタ長記憶部
5045 シフトレジスタ
5047 最小値選択部
5201 論理和計算部
5207 閾値計算部
7011 定数記憶部
70710〜7071M-1 重みつき加算部
7095 定数乗算器
2,20 窓がけ処理部
3 フーリエ変換部
4,5049 カウンタ
5,52 推定雑音計算部
6,1402 周波数別SNR計算部
7 推定先天的SNR計算部
8,82 雑音抑圧係数生成部
9 逆フーリエ変換部
10 フレーム合成部
11 入力端子
12 出力端子
13,16,161,704,705,1404 多重乗算部
14 重みつき劣化音声計算部
15 抑圧係数補正部
17 高域通過フィルタ
18 振幅補正部
19 位相補正部
21 音声非存在確率記憶部
22 オフセット除去部
53 帯域統合部
54 推定雑音補正部
501,502,1302,1303,1422,1423,1495,1502,1503,1602,1603,1801,1901,7013,7072,7074 分離部
503,1304,1424,1475,1504,1604,1803,1903,7014,7075 多重化部
5040〜504M-1 周波数別推定雑音計算部
520 更新判定部
701 多重値域限定処理部
702 後天的SNR記憶部
703 抑圧係数記憶部
706 重み記憶部
707 多重重みつき加算部
708,5046,7092,7094 加算器
811 MMSE STSA ゲイン関数値計算部
812 一般化尤度比計算部
814 抑圧係数計算部
921 瞬時推定SNR
9210〜921M-1 周波数帯域別瞬時推定SNR
922 過去の推定SNR
9220〜922M-1 過去の周波数帯域別推定SNR
923 重み
924 推定先天的SNR
9240〜924M-1 周波数帯域別推定先天的SNR
13010〜1301K-1,1597,7091,7093 乗算器
1401,5042 推定雑音記憶部
1405 多重非線形処理部
14210〜1421M-1 5048 除算部
14850〜1485M-1 非線形処理部
15010〜1501M-1 周波数別抑圧係数補正部
1591,70120〜7012M-1 最大値選択部
1592 抑圧係数下限値記憶部
1593,5204,5206 閾値記憶部
1594,5203,5205 比較部
1595,5044 スイッチ
1596 修正値記憶部
18020〜1802K-1 重み付け処理部
19020〜1902K-1 位相回転部
5041 レジスタ長記憶部
5045 シフトレジスタ
5047 最小値選択部
5201 論理和計算部
5207 閾値計算部
7011 定数記憶部
70710〜7071M-1 重みつき加算部
7095 定数乗算器
Claims (27)
- 入力信号に含まれている雑音を抑圧する方法であって、
単一チャネルの入力信号を複数の帯域から構成される周波数領域信号に変換し、
前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求め、
該統合周波数領域信号を用いて推定雑音を求め、
該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定め、
該抑圧係数で前記周波数領域信号を重みづけする、
ことを特徴とする雑音抑圧の方法。 - 前記複数の帯域は、互いに隣接して連続した周波数帯域であることを特徴とする請求項1に記載の雑音抑圧の方法。
- 前記推定雑音を補正して補正推定雑音を求め、
該補正推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める、
ことを特徴とする請求項1または2に記載の雑音抑圧の方法。 - 前記周波数領域信号の振幅を補正して振幅補正信号を求め、
該振幅補正信号の帯域を統合して統合周波数領域信号を求める、
ことを特徴とする請求項1から3のいずれか1項に記載の雑音抑圧の方法。 - 前記周波数領域信号の位相を補正して位相補正信号を求め、
前記抑圧係数で前記振幅補正信号を重みづけした結果と前記位相補正信号を時間領域信号に変換する、
ことを特徴とする請求項4に記載の雑音抑圧の方法。 - 入力信号のオフセットを除去してオフセット除去信号を求め、
該オフセット除去信号を周波数領域信号に変換する、
ことを特徴とする請求項4または5に記載の雑音抑圧の方法。 - 入力信号に含まれている雑音を抑圧する装置であって、
単一チャネルの入力信号を複数の帯域から構成される周波数領域信号に変換する変換部と、
前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求める帯域統合部と、
該統合周波数領域信号を用いて推定雑音を求める雑音推定部と、
該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める抑圧係数生成部と、
該抑圧係数で前記周波数領域信号を重みづけする乗算部と、
を有することを特徴とする雑音抑圧の装置。 - 前記帯域統合部は、互いに隣接して連続した周波数の複数の帯域を統合することを特徴とする請求項7に記載の雑音抑圧の装置。
- 前記推定雑音を補正して補正推定雑音を求める推定雑音補正部と
該補正推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める抑圧係数生成部と、
を有することを特徴とする請求項7または8に記載の雑音抑圧の装置。 - 前記周波数領域信号の振幅を補正して振幅補正信号を求める振幅補正部と、
該振幅補正信号の帯域を統合して統合周波数領域信号を求める帯域統合部と、
を有することを特徴とする請求項7から9のいずれか1項に記載の雑音抑圧の装置。 - 前記周波数領域信号の位相を補正して位相補正信号を求める位相補正部と、
前記抑圧係数で前記振幅補正信号を重みづけした結果と前記位相補正信号を時間領域信号に変換する逆変換部と、
を有することを特徴とする請求項10に記載の雑音抑圧の装置。 - 入力信号のオフセットを除去してオフセット除去信号を求めるオフセット除去部と、
該オフセット除去信号を周波数領域信号に変換する変換部と、
を有する請求項10または11に記載の雑音抑圧の装置。 - 入力信号に含まれている雑音を抑圧する信号処理を行なうコンピュータプログラムであって、
単一チャネルの入力信号を複数の帯域から構成される周波数領域信号に変換する処理と、
前記帯域を統合して前記帯域の数より少ない複数の帯域から構成される統合周波数領域信号を求める処理と、
該統合周波数領域信号を用いて推定雑音を求める処理と、
該推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める処理と、
該抑圧係数で前記周波数領域信号を重みづけする処理と、
をコンピュータに実行させることを特徴とする雑音抑圧用のコンピュータプログラム。 - 前記複数の帯域は、互いに隣接して連続した周波数帯域であることを特徴とする請求項13に記載の雑音抑圧用のコンピュータプログラム。
- 前記推定雑音を補正して補正推定雑音を求める処理と、
該補正推定雑音と前記統合周波数領域信号を用いて抑圧係数を定める処理と、
をコンピュータにさらに実行させることを特徴とする請求項13または14に記載の雑音抑圧用のコンピュータプログラム。 - 前記周波数領域信号の振幅を補正して振幅補正信号を求める処理と、
該振幅補正信号の帯域を統合して統合周波数領域信号を求める処理と、
をコンピュータにさらに実行させることを特徴とする請求項13から15のいずれか1項に記載の雑音抑圧用のコンピュータプログラム。 - 前記周波数領域信号の位相を補正して位相補正信号を求める処理と、
前記抑圧係数で前記振幅補正信号を重みづけした結果と前記位相補正信号を時間領域信号に変換する処理と、
をコンピュータにさらに実行させることを特徴とする請求項16に記載の雑音抑圧用のコンピュータプログラム。 - 前記入力信号のオフセットを除去してオフセット除去信号を求める処理と、
該オフセット除去信号を周波数領域信号に変換する処理と、
をコンピュータにさらに実行させることを特徴とする請求項16または17に記載の雑音抑圧用のコンピュータプログラム。 - 単一チャネルの入力信号を複数の帯域成分から構成される周波数領域信号に変換し、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を求め、該抑圧係数で前記周波数領域信号を重みづけすることによって入力信号に含まれている雑音を抑圧する方法であって、
少なくとも一つの抑圧係数を複数の帯域成分に対して利用する、ことを特徴とする雑音抑圧の方法。 - 前記複数の帯域は、互いに隣接して連続した周波数帯域であることを特徴とする請求項19に記載の雑音抑圧の方法。
- 前記抑圧係数を定める際に、抑圧係数毎に該抑圧係数を用いる複数の帯域の前記周波数領域信号を用いて前記複数の帯域で共通な推定雑音を求め、該推定雑音を用いて前記抑圧係数を定めることを特徴とする、請求項19または20に記載の雑音抑圧の方法。
- 単一チャネルの入力信号を複数の帯域成分から構成される周波数領域信号に変換する変換部と、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を求める抑圧係数生成部と、該抑圧係数で前記周波数領域信号を重みづけする乗算部と、を少なくとも具備する雑音抑圧の装置であって、
前記周波数領域信号の帯域を統合して統合周波数領域信号を求める帯域統合部を有し、
前記抑圧係数生成部は、前記統合周波数領域信号を用いて抑圧係数を定め、
前記乗算部は、該抑圧係数の少なくとも一つを複数の帯域に対して共用して前記周波数領域信号を重みづけすることを特徴とする雑音抑圧の装置。 - 前記帯域統合部は、互いに隣接して連続した周波数の複数帯域を統合することを特徴とする請求項22に記載の雑音抑圧の装置。
- 前記統合周波数領域信号を用いて前記複数の帯域で共通な推定雑音を求める雑音推定部をさらに有し、
前記抑圧係数生成部は、該推定雑音を用いて前記抑圧係数を定めることを特徴とする請求項22または23に記載の雑音抑圧の装置。 - 単一チャネルの入力信号を複数の帯域成分から構成される周波数領域信号に変換し、該周波数領域信号を用いて該周波数領域信号の帯域成分の数より少ない複数の抑圧係数を定め、該抑圧係数で前記周波数領域信号を重みづけする信号処理を行なうコンピュータプログラムであって、
前記周波数領域信号の帯域を統合して統合周波数領域信号を求め、該統合周波数領域信号を用いて前記抑圧係数を定め、該抑圧係数の少なくとも一つを複数の帯域に対して共用して前記周波数領域信号を重みづけする処理をコンピュータに実行させることを特徴とする雑音抑圧用のコンピュータプログラム。 - 前記複数の帯域は、互いに隣接して連続した周波数帯域であることを特徴とする請求項25に記載の雑音抑圧用のコンピュータプログラム。
- 前記統合周波数領域信号を用いて前記複数の帯域で共通な推定雑音を求め、該推定雑音を用いて前記抑圧係数を定める処理を、コンピュータにさらに実行させることを特徴とする請求項25または26に記載の雑音抑圧用のコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008110432A JP2008203879A (ja) | 2005-09-02 | 2008-04-21 | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005255748 | 2005-09-02 | ||
JP2008110432A JP2008203879A (ja) | 2005-09-02 | 2008-04-21 | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007505297A Division JP4172530B2 (ja) | 2005-09-02 | 2006-08-29 | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008203879A true JP2008203879A (ja) | 2008-09-04 |
Family
ID=37808780
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007505297A Expired - Fee Related JP4172530B2 (ja) | 2005-09-02 | 2006-08-29 | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
JP2008110432A Pending JP2008203879A (ja) | 2005-09-02 | 2008-04-21 | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007505297A Expired - Fee Related JP4172530B2 (ja) | 2005-09-02 | 2006-08-29 | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US9318119B2 (ja) |
EP (2) | EP1921609B1 (ja) |
JP (2) | JP4172530B2 (ja) |
KR (1) | KR100927897B1 (ja) |
CN (1) | CN101091209B (ja) |
WO (1) | WO2007026691A1 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011055829A1 (ja) | 2009-11-06 | 2011-05-12 | 日本電気株式会社 | 信号処理方法、情報処理装置、及び信号処理プログラム |
WO2011055834A1 (ja) | 2009-11-06 | 2011-05-12 | 日本電気株式会社 | 信号処理方法、情報処理装置、及び信号処理プログラム |
WO2011055832A1 (ja) | 2009-11-06 | 2011-05-12 | 日本電気株式会社 | 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム |
WO2011148860A1 (ja) | 2010-05-24 | 2011-12-01 | 日本電気株式会社 | 信号処理方法、情報処理装置、及び信号処理プログラム |
WO2012070684A1 (ja) | 2010-11-25 | 2012-05-31 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
JP2012532650A (ja) * | 2009-07-07 | 2012-12-20 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 呼吸信号のノイズ低減 |
EP2767978A1 (en) | 2010-05-25 | 2014-08-20 | Nec Corporation | Audio signal processing |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9318119B2 (en) | 2005-09-02 | 2016-04-19 | Nec Corporation | Noise suppression using integrated frequency-domain signals |
NL1032724C2 (nl) * | 2006-10-23 | 2008-04-25 | Ten Cate Thiolon Bv | Kunstgrasveld, in het bijzonder voor een kunstgrassportveld. |
US20100207689A1 (en) * | 2007-09-19 | 2010-08-19 | Nec Corporation | Noise suppression device, its method, and program |
JP4660578B2 (ja) * | 2008-08-29 | 2011-03-30 | 株式会社東芝 | 信号補正装置 |
JP4516157B2 (ja) * | 2008-09-16 | 2010-08-04 | パナソニック株式会社 | 音声分析装置、音声分析合成装置、補正規則情報生成装置、音声分析システム、音声分析方法、補正規則情報生成方法、およびプログラム |
JP5423689B2 (ja) * | 2009-02-09 | 2014-02-19 | 日本電気株式会社 | 経路制御システム、経路制御装置、通信装置、経路制御方法およびプログラム |
JP5299233B2 (ja) | 2009-11-20 | 2013-09-25 | ソニー株式会社 | 信号処理装置、および信号処理方法、並びにプログラム |
JP5325134B2 (ja) * | 2010-02-04 | 2013-10-23 | 日本電信電話株式会社 | 反響消去方法、反響消去装置、そのプログラムおよび記録媒体 |
EP2546831B1 (en) | 2010-03-09 | 2020-01-15 | Mitsubishi Electric Corporation | Noise suppression device |
WO2012014451A1 (ja) | 2010-07-26 | 2012-02-02 | パナソニック株式会社 | 多入力雑音抑圧装置、多入力雑音抑圧方法、プログラムおよび集積回路 |
JP2012058358A (ja) * | 2010-09-07 | 2012-03-22 | Sony Corp | 雑音抑圧装置、雑音抑圧方法およびプログラム |
EP2645368B1 (en) * | 2010-11-24 | 2019-05-08 | Nec Corporation | Signal processing device, signal processing method and signal processing program |
JP6070953B2 (ja) * | 2011-02-26 | 2017-02-01 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び記憶媒体 |
JP2014123011A (ja) * | 2012-12-21 | 2014-07-03 | Sony Corp | 雑音検出装置および方法、並びに、プログラム |
MX370859B (es) * | 2012-12-31 | 2020-01-08 | Philip Morris Products Sa | Artículo para fumar que incluye un restrictor de flujo en un tubo hueco. |
CN104103278A (zh) * | 2013-04-02 | 2014-10-15 | 北京千橡网景科技发展有限公司 | 一种实时语音去噪的方法和设备 |
CN104702558B (zh) * | 2013-12-05 | 2018-03-09 | 上海数字电视国家工程研究中心有限公司 | Ofdm***的相位噪声消除方法 |
EP3103204B1 (en) * | 2014-02-27 | 2019-11-13 | Nuance Communications, Inc. | Adaptive gain control in a communication system |
US10149047B2 (en) * | 2014-06-18 | 2018-12-04 | Cirrus Logic Inc. | Multi-aural MMSE analysis techniques for clarifying audio signals |
EP2963648A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using vertical phase correction |
CN104134444B (zh) * | 2014-07-11 | 2017-03-15 | 福建星网视易信息***有限公司 | 一种基于mmse的歌曲去伴奏方法和装置 |
CN104090253B (zh) * | 2014-07-14 | 2016-12-07 | 中国电子科技集团公司第四十一研究所 | 一种基于数据模型的校准件定标数据中噪声的处理方法 |
CN105635453B (zh) * | 2015-12-28 | 2020-12-29 | 上海博泰悦臻网络技术服务有限公司 | 一种通话音量自动调节方法、***、车载设备及汽车 |
US10825465B2 (en) | 2016-01-08 | 2020-11-03 | Nec Corporation | Signal processing apparatus, gain adjustment method, and gain adjustment program |
CN106228993B (zh) * | 2016-09-29 | 2020-02-07 | 北京奇艺世纪科技有限公司 | 一种消除噪声的方法和装置以及电子设备 |
WO2018164699A1 (en) * | 2017-03-10 | 2018-09-13 | James Jordan Rosenberg | System and method for relative enhancement of vocal utterances in an acoustically cluttered environment |
CN108281149B (zh) * | 2017-12-29 | 2021-08-27 | 芯原微电子(北京)有限公司 | 一种基于加Blackman窗的FIR滤波器的音频采样率转换方法及*** |
JP7152112B2 (ja) * | 2018-08-24 | 2022-10-12 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
CN109613336B (zh) * | 2018-12-07 | 2020-12-01 | 中国电子科技集团公司第四十一研究所 | 一种任意长度fft多模信号频域分析装置及方法 |
CN110164467B (zh) * | 2018-12-18 | 2022-11-25 | 腾讯科技(深圳)有限公司 | 语音降噪的方法和装置、计算设备和计算机可读存储介质 |
KR102569365B1 (ko) * | 2018-12-27 | 2023-08-22 | 삼성전자주식회사 | 가전기기 및 이의 음성 인식 방법 |
CN109829899B (zh) * | 2019-01-18 | 2020-08-07 | 创新奇智(广州)科技有限公司 | 一种针对钢卷端面缺陷检测的背景抑制算法 |
CN110931033B (zh) * | 2019-11-27 | 2022-02-18 | 深圳市悦尔声学有限公司 | 一种麦克风内置耳机的语音聚焦增强方法 |
CN111131965A (zh) * | 2019-12-26 | 2020-05-08 | 九江慧明电子科技有限公司 | 一种带有保护功能的音频***及其调节方法 |
CN111163399A (zh) * | 2019-12-26 | 2020-05-15 | 九江慧明电子科技有限公司 | 一种具有高灵敏度的音频***及其调节方法 |
CN111402917B (zh) * | 2020-03-13 | 2023-08-04 | 北京小米松果电子有限公司 | 音频信号处理方法及装置、存储介质 |
CN113936670A (zh) * | 2020-06-28 | 2022-01-14 | 腾讯科技(深圳)有限公司 | 丢包重发方法、***、装置、计算机可读存储介质及设备 |
CN111899752B (zh) * | 2020-07-13 | 2023-01-10 | 紫光展锐(重庆)科技有限公司 | 快速计算语音存在概率的噪声抑制方法及装置、存储介质、终端 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944186A (ja) * | 1995-07-31 | 1997-02-14 | Matsushita Electric Ind Co Ltd | 雑音抑制装置 |
WO2002080148A1 (fr) * | 2001-03-28 | 2002-10-10 | Mitsubishi Denki Kabushiki Kaisha | Dispositif eliminateur de bruit |
JP2005195955A (ja) * | 2004-01-08 | 2005-07-21 | Toshiba Corp | 雑音抑圧装置及び雑音抑圧方法 |
WO2007026691A1 (ja) * | 2005-09-02 | 2007-03-08 | Nec Corporation | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR940009391B1 (ko) | 1985-07-01 | 1994-10-07 | 모토로라 인코포레이티드 | 잡음 억제 시스템 |
US4630304A (en) | 1985-07-01 | 1986-12-16 | Motorola, Inc. | Automatic background noise estimator for a noise suppression system |
US4628529A (en) * | 1985-07-01 | 1986-12-09 | Motorola, Inc. | Noise suppression system |
IL84948A0 (en) * | 1987-12-25 | 1988-06-30 | D S P Group Israel Ltd | Noise reduction system |
US5432859A (en) * | 1993-02-23 | 1995-07-11 | Novatel Communications Ltd. | Noise-reduction system |
US5544250A (en) * | 1994-07-18 | 1996-08-06 | Motorola | Noise suppression system and method therefor |
JP3338573B2 (ja) | 1994-11-01 | 2002-10-28 | ユナイテッド・モジュール・コーポレーション | サブバンド分割演算回路 |
JP3591068B2 (ja) * | 1995-06-30 | 2004-11-17 | ソニー株式会社 | 音声信号の雑音低減方法 |
US5659622A (en) * | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
JP3522954B2 (ja) * | 1996-03-15 | 2004-04-26 | 株式会社東芝 | マイクロホンアレイ入力型音声認識装置及び方法 |
US6144937A (en) * | 1997-07-23 | 2000-11-07 | Texas Instruments Incorporated | Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information |
FR2768547B1 (fr) * | 1997-09-18 | 1999-11-19 | Matra Communication | Procede de debruitage d'un signal de parole numerique |
US6415253B1 (en) * | 1998-02-20 | 2002-07-02 | Meta-C Corporation | Method and apparatus for enhancing noise-corrupted speech |
JPH11289312A (ja) | 1998-04-01 | 1999-10-19 | Toshiba Tec Corp | マルチキャリア無線通信装置 |
US6381570B2 (en) * | 1999-02-12 | 2002-04-30 | Telogy Networks, Inc. | Adaptive two-threshold method for discriminating noise from speech in a communication signal |
US6618701B2 (en) * | 1999-04-19 | 2003-09-09 | Motorola, Inc. | Method and system for noise suppression using external voice activity detection |
JP2000357969A (ja) | 1999-06-16 | 2000-12-26 | Victor Co Of Japan Ltd | オーディオ信号の符号化装置 |
GB2355834A (en) * | 1999-10-29 | 2001-05-02 | Nokia Mobile Phones Ltd | Speech recognition |
US6757395B1 (en) * | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
US7058572B1 (en) * | 2000-01-28 | 2006-06-06 | Nortel Networks Limited | Reducing acoustic noise in wireless and landline based telephony |
US6529868B1 (en) * | 2000-03-28 | 2003-03-04 | Tellabs Operations, Inc. | Communication system noise cancellation power signal calculation techniques |
US6523003B1 (en) * | 2000-03-28 | 2003-02-18 | Tellabs Operations, Inc. | Spectrally interdependent gain adjustment techniques |
US6766292B1 (en) * | 2000-03-28 | 2004-07-20 | Tellabs Operations, Inc. | Relative noise ratio weighting techniques for adaptive noise cancellation |
US6701291B2 (en) * | 2000-10-13 | 2004-03-02 | Lucent Technologies Inc. | Automatic speech recognition with psychoacoustically-based feature extraction, using easily-tunable single-shape filters along logarithmic-frequency axis |
JP4282227B2 (ja) * | 2000-12-28 | 2009-06-17 | 日本電気株式会社 | ノイズ除去の方法及び装置 |
DE60212617T2 (de) * | 2001-04-09 | 2007-06-14 | Koninklijke Philips Electronics N.V. | Vorrichtung zur sprachverbesserung |
JP2002316580A (ja) | 2001-04-24 | 2002-10-29 | Murakami Corp | カメラ内蔵ミラー装置 |
JP3457293B2 (ja) * | 2001-06-06 | 2003-10-14 | 三菱電機株式会社 | 雑音抑圧装置及び雑音抑圧方法 |
EP1278185A3 (en) * | 2001-07-13 | 2005-02-09 | Alcatel | Method for improving noise reduction in speech transmission |
JP2003131689A (ja) * | 2001-10-25 | 2003-05-09 | Nec Corp | ノイズ除去方法及び装置 |
AU2003242903A1 (en) * | 2002-07-08 | 2004-01-23 | Koninklijke Philips Electronics N.V. | Audio processing |
US20040148160A1 (en) * | 2003-01-23 | 2004-07-29 | Tenkasi Ramabadran | Method and apparatus for noise suppression within a distributed speech recognition system |
JP4247037B2 (ja) | 2003-01-29 | 2009-04-02 | 株式会社東芝 | 音声信号処理方法と装置及びプログラム |
JP4542790B2 (ja) * | 2004-01-16 | 2010-09-15 | 株式会社東芝 | ノイズサプレッサ及びノイズサプレッサを備えた音声通信装置 |
US7492889B2 (en) * | 2004-04-23 | 2009-02-17 | Acoustic Technologies, Inc. | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
GB2466668A (en) * | 2009-01-06 | 2010-07-07 | Skype Ltd | Speech filtering |
WO2019021609A1 (ja) | 2017-07-28 | 2019-01-31 | シャープ株式会社 | カメラモジュール製造方法およびカメラモジュール製造装置 |
-
2006
- 2006-08-29 US US11/794,563 patent/US9318119B2/en not_active Expired - Fee Related
- 2006-08-29 CN CN2006800015392A patent/CN101091209B/zh not_active Expired - Fee Related
- 2006-08-29 EP EP06796943.6A patent/EP1921609B1/en not_active Expired - Fee Related
- 2006-08-29 WO PCT/JP2006/316963 patent/WO2007026691A1/ja active Application Filing
- 2006-08-29 EP EP12190386.8A patent/EP2555190B1/en not_active Expired - Fee Related
- 2006-08-29 JP JP2007505297A patent/JP4172530B2/ja not_active Expired - Fee Related
- 2006-08-29 KR KR1020077014813A patent/KR100927897B1/ko active IP Right Grant
-
2008
- 2008-04-21 JP JP2008110432A patent/JP2008203879A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0944186A (ja) * | 1995-07-31 | 1997-02-14 | Matsushita Electric Ind Co Ltd | 雑音抑制装置 |
WO2002080148A1 (fr) * | 2001-03-28 | 2002-10-10 | Mitsubishi Denki Kabushiki Kaisha | Dispositif eliminateur de bruit |
JP2005195955A (ja) * | 2004-01-08 | 2005-07-21 | Toshiba Corp | 雑音抑圧装置及び雑音抑圧方法 |
WO2007026691A1 (ja) * | 2005-09-02 | 2007-03-08 | Nec Corporation | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
JP4172530B2 (ja) * | 2005-09-02 | 2008-10-29 | 日本電気株式会社 | 雑音抑圧の方法及び装置並びにコンピュータプログラム |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012532650A (ja) * | 2009-07-07 | 2012-12-20 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 呼吸信号のノイズ低減 |
WO2011055829A1 (ja) | 2009-11-06 | 2011-05-12 | 日本電気株式会社 | 信号処理方法、情報処理装置、及び信号処理プログラム |
WO2011055834A1 (ja) | 2009-11-06 | 2011-05-12 | 日本電気株式会社 | 信号処理方法、情報処理装置、及び信号処理プログラム |
WO2011055832A1 (ja) | 2009-11-06 | 2011-05-12 | 日本電気株式会社 | 情報処理装置、その付属装置、情報処理システム、その制御方法並びに制御プログラム |
WO2011148860A1 (ja) | 2010-05-24 | 2011-12-01 | 日本電気株式会社 | 信号処理方法、情報処理装置、及び信号処理プログラム |
US9837097B2 (en) | 2010-05-24 | 2017-12-05 | Nec Corporation | Single processing method, information processing apparatus and signal processing program |
EP2767978A1 (en) | 2010-05-25 | 2014-08-20 | Nec Corporation | Audio signal processing |
WO2012070684A1 (ja) | 2010-11-25 | 2012-05-31 | 日本電気株式会社 | 信号処理装置、信号処理方法、及び信号処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JPWO2007026691A1 (ja) | 2009-03-26 |
JP4172530B2 (ja) | 2008-10-29 |
KR100927897B1 (ko) | 2009-11-23 |
US20100010808A1 (en) | 2010-01-14 |
CN101091209B (zh) | 2010-06-09 |
CN101091209A (zh) | 2007-12-19 |
EP2555190B1 (en) | 2014-07-02 |
EP1921609A4 (en) | 2012-07-25 |
EP1921609A1 (en) | 2008-05-14 |
US9318119B2 (en) | 2016-04-19 |
EP2555190A1 (en) | 2013-02-06 |
KR20070088751A (ko) | 2007-08-29 |
EP1921609B1 (en) | 2014-07-16 |
WO2007026691A1 (ja) | 2007-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4172530B2 (ja) | 雑音抑圧の方法及び装置並びにコンピュータプログラム | |
JP5092748B2 (ja) | 雑音抑圧の方法及び装置並びにコンピュータプログラム | |
JP4282227B2 (ja) | ノイズ除去の方法及び装置 | |
JP5435204B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP4670483B2 (ja) | 雑音抑圧の方法及び装置 | |
JP4973873B2 (ja) | 残響抑圧の方法、装置及び残響抑圧用プログラム | |
JP2008216721A (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP2003140700A (ja) | ノイズ除去方法及び装置 | |
JP2007006525A (ja) | ノイズ除去の方法及び装置 | |
JP4395772B2 (ja) | ノイズ除去方法及び装置 | |
JP5413575B2 (ja) | 雑音抑圧の方法、装置、及びプログラム | |
JP2003131689A (ja) | ノイズ除去方法及び装置 | |
JP4968355B2 (ja) | 雑音抑圧の方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110413 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120131 |