JP5875609B2

JP5875609B2 - 雑音抑圧装置

Info

Publication number: JP5875609B2
Application number: JP2013557243A
Authority: JP
Inventors: 訓古田
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2012-02-10
Filing date: 2012-02-10
Publication date: 2016-03-02
Anticipated expiration: 2032-02-10
Also published as: JPWO2013118192A1; DE112012005855B4; DE112012005855T5; US20140316775A1; WO2013118192A1; CN104067339A; CN104067339B

Description

この発明は、入力信号に重畳した背景雑音を抑圧する雑音抑圧装置に関する。

近年のディジタル信号処理技術の進展に伴い、携帯電話による屋外での音声通話、自動車内でのハンズフリー音声通話、および音声認識によるハンズフリー操作が広く普及している。これらの機能を実現する装置は高騒音環境下で用いられることが多いため、音声と共に背景雑音もマイクに入力されてしまい、通話音声の劣化および音声認識率の低下などを招く。そのため、快適な音声通話および高精度の音声認識を実現するためには、入力信号に混入した背景雑音を抑圧する雑音抑圧装置が必要である。

従来の雑音抑圧装置としては、例えば、時間領域の入力信号を周波数領域の信号であるパワースペクトルに変換し、入力信号のパワースペクトルと、入力信号から別途推定した推定雑音スペクトルとを用い、音声スペクトルがスーパーガウス分布、雑音スペクトルがガウス分布に従うと仮定して、ＭＡＰ（事後確率最大化）推定法により雑音抑圧のための抑圧量を算出し、得られた抑圧量を用いて入力信号をパワースペクトルの振幅抑圧を行い、振幅抑圧されたパワースペクトルと入力信号の位相スペクトルを時間領域へ変換して雑音抑圧信号を得る方法がある（例えば、非特許文献１参照）。

さらに先行技術として、例えば特許文献１が開示されている。この従来の雑音抑圧装置では、周波数スペクトルに含まれる音声スペクトルの実部および虚部毎の出現確率を統計分布モデルにより近似することにより導出される音声スペクトルの推定式を偏微分して零とおき、かつ位相スペクトルをφとしたときの｜ｃｏｓφ｜＋｜ｓｉｎφ｜を定数として近似される演算式に従って雑音抑圧量を算出することで、高品質な雑音抑圧装置を実現している。

また、別の先行技術として、例えば、音声スペクトルと雑音スペクトルの出現確率を、複数の確率密度関数を組み合わせた混合分布モデルで近似することで、精度の高い雑音抑圧を行う方法がある（例えば、非特許文献２参照）。

特開２００５−２０２２２２号公報（第６〜１１頁、図１）

Ｔ．Ｌｏｔｔｅｒ，Ｐ．Ｖａｒｙ，"ＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔｂｙＭＡＰＳｐｅｃｔｒａｌＡｍｐｌｉｔｕｄｅＥｓｔｉｍａｔｉｏｎＵｓｉｎｇａＳｕｐｅｒ−ＧａｕｓｓｉａｎＳｐｅｅｃｈＭｏｄｅｌ"，ＥＵＲＡＳＩＰＪｏｕｒｎａｌｏｎＡｐｐｌｉｅｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，ｐｐ．１１１０−１１２６，Ｎｏ．７，２００５藤本、有木、"ＧＭＭとＥＭアルゴリズムを用いた加法性雑音及び乗法性歪みの抑圧"、電子情報通信学会技術報告、ＳＰ２００３−１１７、ｐｐ．２５−３０、２００３年１２月

上記の従来法には、以下に述べる課題がある。

上記非特許文献１に開示された従来の雑音抑圧装置では、確率密度関数の分布形状を決定するパラメータが１つであり、また、そのパラメータは入力信号の様態によらず固定であるので、様々な入力信号に対して雑音抑圧量の推定精度が低いという課題がある。

また、上記特許文献１に開示された従来の雑音抑圧装置では、確率密度関数の分布形状を決定するために入力信号の位相スペクトルを用いているので、高品質な雑音抑圧を行うためには、音声信号の位相スペクトルを高精度に分析する必要がある。また、分布形状を定義するパラメータ（当該文献中では、近似のための設定値λと称している）を入力信号の様態に応じて変化させず固定であるので、入力信号である音声ならびに雑音が、近似のための設定値を越えるような変動をするなどの想定外の急激な変動が起きた場合に、雑音抑圧量の推定が追従できない課題がある。

また、上記非特許文献２に開示された従来の雑音抑圧装置では、複数の確率密度関数を組み合わせた混合分布モデルを用いることで精度の高い雑音抑圧が可能であるが、膨大な処理量が必要となる課題がある。

この発明は、かかる課題を解決するためになされたもので、簡便な処理で高品質な雑音抑圧装置を提供することを目的とする。

この発明の雑音抑圧装置は、入力信号のパワースペクトルと推定雑音スペクトルとから周波数別のＳＮ比を推定するＳＮ比計算部と、入力信号のパワースペクトルを分析して、入力信号が音声らしいか、あるいは、雑音らしいかを示す第１の指標を算出し、音声の分布状態を表す予め定義された確率密度関数を当該第１の指標に基づいて制御する確率密度関数制御部とを備え、ＳＮ比計算部で推定された周波数別のＳＮ比と確率密度関数制御部により制御される確率密度関数を用いて抑圧量を算出するようにしたものである。

この発明によれば、パワースペクトルと推定雑音スペクトルから推定されるＳＮ比に加え、入力信号が音声らしいか、あるいは、雑音らしいかを示す第１の指標に基づいて制御した確率密度関数を用いて、雑音抑圧のための抑圧量を算出することにより、簡便な処理で、雑音区での違和感がなく、かつ、音声のゆがみも少ない高品質な雑音抑圧を行うことができる。

この発明の実施の形態１に係る雑音抑圧装置の構成を示すブロック図である。実施の形態１における、確率密度関数制御部の内部構成を示すブロック図である。実施の形１における、確率密度関数の変化を説明するグラフである。この発明の実施の形態２に係る雑音抑圧装置の構成を示すブロック図である。実施の形態２における、確率密度関数制御部の内部構成を示すブロック図である。実施の形態２における、周期成分推定部による音声の調波構造の検出法を模式的に示したグラフである。実施の形態２における、周期成分推定部による音声の調波構造の補正法を模式的に示したグラフである。実施の形態２における、重み付きＳＮ比計算部が第１の重み付き事後ＳＮ比算出時に用いる、非線形関数を示すグラフである。実施の形態２に係る雑音抑圧装置の出力結果の一例であり、事後ＳＮ比の重み付けを行わない場合を示す。実施の形態２に係る雑音抑圧装置の出力結果の一例であり、事後ＳＮ比の重み付けを行う場合を示す。この発明の実施の形態４に係る雑音抑圧装置の構成を示すブロック図である。

以下、この発明をより詳細に説明するために、この発明を実施するための形態について、添付の図面に従って説明する。
実施の形態１．
図１は、本実施の形態１による雑音抑圧装置の全体構成を示すブロック図である。本実施の形態１の雑音抑圧装置は、入力端子１、フーリエ変換部２、パワースペクトル計算部３、音声・雑音区間判定部４、雑音スペクトル推定部５、ＳＮ比計算部６、確率密度関数制御部７、抑圧量計算部８、スペクトル抑圧部９、逆フーリエ変換部１０、出力端子１１から構成されている。

以下、図に基づいてこの雑音抑圧装置の動作原理を説明する。

まず、マイクロホン（図示せず）などを通じて取り込まれた音声や音楽などが、Ａ／Ｄ（アナログ・デジタル）変換された後、所定のサンプリング周波数（例えば、８ｋＨｚ）でサンプリングされると共にフレーム単位（例えば、１０ｍｓ）に分割され、本実施の形態１の雑音抑圧装置へ入力端子１を介して入力される。

フーリエ変換部２は、入力信号に対し例えばハニング窓掛けを行った後、例えば次の式（１）のように２５６点の高速フーリエ変換を行って、時間領域の信号ｘ（ｔ）から周波数領域の信号であるスペクトル成分Ｘ（λ，ｋ）に変換する。

ここで、ｔはサンプリング時間、λは入力信号をフレーム分割したときのフレーム番号、ｋはスペクトルの周波数帯域の周波数成分を指定する番号（以下、スペクトル番号と称する）、ＦＴ［・］はフーリエ変換処理を表す。

パワースペクトル計算部３では、次の式（２）を用いて、入力信号のスペクトル成分Ｘ（λ，ｋ）からパワースペクトルＹ（λ，ｋ）を得る。

ここで、Ｒｅ｛Ｘ（λ，ｋ）｝およびＩｍ｛Ｘ（λ，ｋ）｝は、それぞれフーリエ変換後の入力信号スペクトルの実数部および虚数部を示す。

音声・雑音区間判定部４は、現フレームの入力信号が音声であるか雑音であるかの判定を行う。まず、次の式（３）を用いて、パワースペクトルＹ（λ，ｋ）から正規化自己相関関数ρ_Ｎ（λ，τ）を求める。

ここで、τは遅延時間であり、ＦＴ［・］はフーリエ変換処理を表し、例えば上式（１）と同じポイント数＝２５６にて高速フーリエ変換を行えばよい。なお、式（３）はウィナーヒンチン（Ｗｉｅｎｅｒ−Ｋｈｉｎｔｃｈｉｎｅ）の定理であるので説明は省略する。

続いて音声・雑音区間判定部４は、パワースペクトル計算部３が出力するパワースペクトルＹ（λ，ｋ）と、前述の処理で得られた正規化自己相関関数の最大値ρ_ｍａｘ（λ）と、後述する雑音スペクトル推定部５が出力する推定雑音スペクトルＮ（λ，ｋ）とを入力し、現フレームの入力信号が音声であるか雑音であるかどうかの判定を行い、その結果を判定フラグとして出力する。音声区間と雑音区間の判定方法として、例えば、次の式（５）の条件を満たす場合に、音声であるとして判定フラグＶｆｌａｇを“１（音声）”にセットし、それ以外の場合には雑音であるとして判定フラグＶｆｌａｇを“０（雑音）”にセットして出力する。

ここで、式（５）において、Ｎ（λ，ｋ）は推定雑音スペクトルであり、Ｓ_ｐｏｗとＮ_ｐｏｗはそれぞれ入力信号のパワースペクトルの総和と推定雑音スペクトルの総和を表す。また、ＴＨ_{ＦＥ＿ＳＮ}およびＴＨ_ＡＣＦは、判定用の所定の定数閾値であり、好適な例としてＴＨ_{ＦＲ＿ＳＮ}＝３．０およびＴＨ_ＡＣＦ＝０．３であるが、入力信号の状態および雑音レベルに応じて適宜変更することもできる。
なお、本実施の形態１では音声・雑音区間判定方法として、自己相関関数法と入力信号の平均ＳＮ比を用いているが、これに限定されることは無く、ケプストラム分析など公知の手法を用いてもよい。また、当業者の自由裁量で様々な公知の手法を組み合わせることにより、判定精度を向上させることも可能である。

雑音スペクトル推定部５は、パワースペクトル計算部３が出力するパワースペクトルＹ（λ，ｋ）と、音声・雑音区間判定部４が出力する判定フラグＶｆｌａｇとを入力し、次の式（６）と判定フラグＶｆｌａｇに従って雑音スペクトルの推定と更新を行い、推定雑音スペクトルＮ（λ，ｋ）を出力する。

ここで、Ｎ（λ−１，ｋ）は前フレームにおける推定雑音スペクトルであり、雑音スペクトル推定部５内の例えばＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）などの記憶手段（不図示）に保持されている。αは更新係数であり、０＜α＜１の範囲の所定の定数である。好適な例としてはα＝０．９５であるが、入力信号の状態および雑音レベルに応じて適宜変更することもできる。

上式（６）において、判定フラグＶｆｌａｇ＝０の場合には、現フレームの入力信号が雑音と判定されていることから、入力信号のパワースペクトルＹ（λ，ｋ）と更新係数αを用いて、前フレームの推定雑音スペクトルＮ（λ−１，ｋ）の更新を行っている。
一方、判定フラグＶｆｌａｇ＝１の場合には、現フレームの入力信号が音声であり、前フレームの推定雑音スペクトルＮ（λ−１，ｋ）を、そのまま現フレームの推定雑音スペクトルＮ（λ，ｋ）として出力する。

ＳＮ比計算部６は、パワースペクトル計算部３が出力するパワースペクトルＹ（λ，ｋ）と、雑音スペクトル推定部５が出力する推定雑音スペクトルＮ（λ，ｋ）と、後述する抑圧量計算部８が出力する前フレームのスペクトル抑圧量Ｇ（λ−１，ｋ）とを用いて、スペクトル成分毎の事後ＳＮ比（ａｐｏｓｔｅｒｉｏｒｉＳｉｇｎａｌｔｏＮｏｉｓｅＲａｔｉｏ）と事前ＳＮ比（ａｐｒｉｏｒｉＳｉｇｎａｌｔｏＮｏｉｓｅＲａｔｉｏ）を計算する。
事後ＳＮ比γ（λ，ｋ）は、パワースペクトルＹ（λ，ｋ）と推定雑音スペクトルＮ（λ，ｋ）とを用いて、次の式（７）から求める。
また、事前ＳＮ比ξ（λ，ｋ）は、前フレームのスペクトル抑圧量Ｇ（λ−１，ｋ）と、前フレームの事後ＳＮ比γ（λ，ｋ）とを用いて、次の式（８）から求める。

ここで、δは０＜δ＜１の範囲の所定の定数であり、本実施の形態ではδ＝０．９８が好適である。また、Ｆ［・］は半波整流を意味し、事後ＳＮ比γ（λ，ｋ）がデシベル値で負の場合にゼロにフロアリングするものである。

以上、得られた事後ＳＮ比γ（λ，ｋ）と事前ＳＮ比ξ（λ，ｋ）とを、ＳＮ比計算部６からスペクトル抑圧部９へ出力する。

確率密度関数制御部７は、パワースペクトル計算部３が出力するパワースペクトルＹ（λ，ｋ）と雑音スペクトル推定部５が出力する推定雑音スペクトルＮ（λ，ｋ）とを用いて、現フレームの入力信号の様態に応じた確率密度関数の形状（分布状態）を決定し、第１の制御係数ν（λ，ｋ）と第２の制御係数μ（λ，ｋ）とを抑圧量計算部８へ出力する。この確率密度関数制御部７の詳細な動作については後述する。

抑圧量計算部８は、ＳＮ比計算部６が出力する事前ＳＮ比ξ（λ，ｋ）および事後ＳＮ比γ（λ，ｋ）と、確率密度関数制御部７が出力する第１の制御係数ν（λ，ｋ）と第２の制御係数μ（λ，ｋ）とを入力し、スペクトル毎の雑音抑圧量であるスペクトル抑圧量Ｇ（λ，ｋ）を求め、スペクトル抑圧部９へ出力する。

スペクトル抑圧量Ｇ（λ，ｋ）を求める手法としては、例えばＪｏｉｎｔＭＡＰ法を適用できる。ＪｏｉｎｔＭＡＰ法は、雑音信号と音声信号をガウス分布であると仮定してスペクトル抑圧量Ｇ（λ，ｋ）を推定する方法であり、事前ＳＮ比ξ（λ，ｋ）および事後ＳＮ比γ（λ，ｋ）を用いて、条件付き確率密度関数を最大にする振幅スペクトルと位相スペクトルを求め、その値を推定値として利用する。スペクトル抑圧量Ｇ（λ，ｋ）は、確率密度関数の形状を決定する第１の制御係数ν（λ，ｋ）と第２の制御係数μ（λ，ｋ）とをパラメータとして、次の式（９）および式（１０）で表すことができる。なお、ＪｏｉｎｔＭＡＰ法におけるスペクトル抑圧量導出法の詳細については、非特許文献１を参照することとし、ここでは省略する。

スペクトル抑圧部９は、次の式（１１）に従って、入力信号のスペクトル毎にスペクトル抑圧量Ｇ（λ，ｋ）だけ抑圧を行い、雑音抑圧された音声信号スペクトルＳ（λ，ｋ）を求め、逆フーリエ変換部１０へ出力する。

以上、得られた音声スペクトルＳ（λ，ｋ）を逆フーリエ変換部１０で逆フーリエ変換し、前フレームの出力信号と重ね合わせ処理した後、雑音抑圧された音声信号ｓ（ｔ）を出力端子１１より出力する。

続いて、本発明の主要部である、確率密度関数制御部７の動作を説明する。図２に、確率密度関数制御部７の内部構成を示す。
この確率密度関数制御部７は、パワースペクトル計算部３が出力するパワースペクトルＹ（λ，ｋ）と、雑音スペクトル推定部５が出力する推定雑音スペクトルＮ（λ，ｋ）とを用いて、入力信号の様態に応じた確率密度関数の形状を決定すると共に、抑圧量計算部８でのスペクトル抑圧量Ｇ（λ，ｋ）を計算するために必要な第１の制御係数ν（λ，ｋ）と第２の制御係数μ（λ，ｋ）とを出力する。

まず、本処理の内容を説明するために、前出の式（９）および式（１０）を定義付けている、ＪｏｉｎｔＭＡＰ法における音声スペクトルの振幅｜Ｘ｜の確率密度関数ｐ（｜Ｘ｜）を、式（１２）に示す。

ここで、Γ（・）はガンマ関数、σ_ｘは音声スペクトルの分散である。また、μおよびνはそれぞれ確率密度関数の分布の急峻さ、分布の広がりを決める定数係数であるが、この２つの係数を変更することで、確率密度関数の形状を制御することができる。そこで、入力信号の様態に応じてμおよびνを変更することで、入力信号の様態に応じた確率密度関数を得ることができる。入力信号の様態に応じて確率密度関数を制御するには、例えば、前述の式（７）の事後ＳＮ比γ（λ，ｋ）を利用することができる。

第２のＳＮ比計算部７１は、パワースペクトルＹ（λ，ｋ）と推定雑音スペクトルＮ（λ，ｋ）とを用いて対数を取り、次の式（１３）のようにデシベル値で表現した第２の事後ＳＮ比γ_ｐ（λ，ｋ）を計算する。

制御係数計算部７２は、第２のＳＮ比計算部７１で得られた第２の事後ＳＮ比γ_ｐ（λ，ｋ）を用いて、次の式（１４）〜（１６）のように第１の制御係数ν（λ，ｋ）、第２の制御係数μ（λ，ｋ）を算出し、それぞれ抑圧量計算部８へ出力する。

ここで、ν_ＭＡＸ，ν_ＭＩＮおよびμ_ＭＡＸ，μ_ＭＩＮは、それぞれ、第１の制御係数ν（λ，ｋ）の上限・下限を決める所定の定数、および第２の制御係数μ（λ，ｋ）の上限・下限を決める所定の定数であり、本実施の形態での好適な一例として、ν_ＭＡＸ＝２．０，ν_ＭＩＮ＝０．０，μ_ＭＡＸ＝１０．０，μ_ＭＩＮ＝１．０であるが、入力信号中の音声および雑音の様態に応じて適宜変更することが可能である。
また、上式（１６）のＫ_ν（ｋ）およびＫ_μ（ｋ）は、第２の事後ＳＮ比と制御係数とを対応付ける関数であり、周波数が高くなるに従って、第２の事後ＳＮ比γ_ｐ（λ，ｋ）の値に対して第１の制御係数ν（λ，ｋ）または第２の制御係数μ（λ，ｋ）をより大きく変化させるように動作する。こうすることにより、例えば、高域の子音などの振幅が小さい音声に対し、雑音と誤って抑圧してしまうのを防止する効果がある。
また、Ｃ_νおよびＣ_μは実験的に得られる所定の定数であり、本実施の形態での好適な一例として、Ｃ_ν＝０．１，Ｃ_μ＝−１０であるが、これらも入力信号中の音声および雑音の様態に応じて適宜変更することが可能である。

上述の式（１４）〜（１６）によれば、第２の事後ＳＮ比γ_ｐ（λ，ｋ）が大きくなるに従って第１の制御係数ν（λ，ｋ）は大きくなる、即ち、分散度合いが広がる一方、第２の制御係数μ（λ，ｋ）は小さくなって分布の鋭さは小さくなる。その結果、確率密度関数ｐ（｜Ｘ｜）の分布の形状はなだらかな傾きとなり、音声区間での音声信号の分布状態に近似していく。
他方、第２の事後ＳＮ比γ_ｐ（λ，ｋ）が小さくなるに従って、第１の制御係数ν（λ，ｋ）は小さくなって分散度合いが狭くなる一方、第２の制御係数μ（λ，ｋ）は大きくなって分布の鋭さは大きくなる。その結果、確率密度関数ｐ（｜Ｘ｜）の分布の形状は急峻な傾きとなり、雑音区間での音声信号の分布状態（音声が存在しないか、あるいは小振幅の音声が存在する状態）に近似する。

図３に、第２の制御係数μ（λ，ｋ）を固定して、第１の制御係数ν（λ，ｋ）を変化させた場合の確率密度関数ｐ（｜Ｘ｜）の分布状態の一例を示す。図３において、横軸は音声スペクトルの振幅｜Ｘ｜、縦軸は確率密度関数ｐ（｜Ｘ｜）の値である。図３より、第１の制御係数ν（λ，ｋ）が小さくなるに従って、確率密度関数ｐ（｜Ｘ｜）の形状は狭く鋭くなり、音声信号の分布状態から雑音信号混在時の音声信号の分布状態に変化することが分かる。上記得られた第１の制御係数ν（λ，ｋ）および第２の制御係数μ（λ，ｋ）を、上式（１２）および式（１３）に当てはめることで、入力信号の様態に応じた高精度なスペクトル抑圧量Ｇ（λ，ｋ）の算出を行うことができ、高品質な雑音抑圧が可能となる。

以上より、この実施の形態１によれば、雑音抑圧装置は、入力信号を入力する入力端子１と、時間領域の入力信号を周波数領域の信号に変換するフーリエ変換部２と、周波数領域の信号からパワースペクトルを計算するパワースペクトル計算部３と、入力信号のパワースペクトルに基づき音声区間と雑音区間を判定する音声・雑音区間判定部４と、パワースペクトルと判定結果より推定雑音スペクトルを推定する雑音スペクトル推定部５と、パワースペクトルと推定雑音スペクトルよりＳＮ比を計算するＳＮ比計算部６と、入力信号が音声らしいか雑音らしいかを示す第１の指標に基づいて、音声の分布状態を定義する確率密度関数を制御する確率密度関数制御部７と、ＳＮ比と確率密度関数より雑音抑圧のための抑圧量を算出する抑圧量計算部８と、抑圧量に応じてパワースペクトルの振幅抑圧を行うスペクトル抑圧部９と、振幅抑圧されたパワースペクトルを時間領域へ変換して雑音抑圧信号を得る逆フーリエ変換部１０と、雑音抑圧信号を出力する出力端子１１とを備え、確率密度関数制御部７が、入力信号の周波数別のＳＮ比（第２の事後ＳＮ比）を推定する第２のＳＮ比計算部７１と、第２のＳＮ比計算部７１で推定されたＳＮ比を第１の指標に用いて確率密度関数を制御する制御係数計算部７２とを有するように構成した。このため、スペクトル抑圧量算出時において、入力信号の様態に応じた確率密度関数、即ち、音声区間および雑音区間での音声信号の分布状態に適合した確率密度関数を適用できるので、簡便な処理で、雑音区間での異音感が無く、かつ、音声の歪みも少ない高品質な雑音抑圧を行うことができる。

なお、実施の形態１では、第１の制御係数ν（λ，ｋ）および第２の制御係数μ（λ，ｋ）の両方について入力信号の様態に応じた制御を行っているが、どちらか一方の制御だけでも良く、単独でも同様な効果を奏効する。

実施の形態２．
上記実施の形態１では、事後ＳＮ比を用いることで入力信号の様態に応じた確率密度関数の制御を行っているが、例えば、この事後ＳＮ比に対して重み付けを行うことも可能である。これは、音声信号が雑音に埋もれている場合など、音声が存在するにも関わらずＳＮ比が低くなる場合があるが、音声が存在する可能性が高い周波数帯域に対し、その事後ＳＮ比を高くなるように重み付け補正することで、雑音に埋もれた音声信号を誤って抑圧することを防止することを狙ったものである。

図４は、本実施の形態２に係る雑音抑圧装置の全体構成を示すブロック図であり、図５は、そのうちの確率密度関数制御部７ａの内部構成を示すブロック図である。図４に示す確率密度関数制御部７ａは、パワースペクトル計算部３のパワースペクトルＹ（λ，ｋ）と、音声・雑音区間判定部４の判定フラグＶｆｌａｇと、雑音スペクトル推定部５の推定雑音スペクトルＮ（λ，ｋ）と、ＳＮ比計算部６の事前ＳＮ比ξ（λ，ｋ）とを入力に用いる。その他の構成については図１と同様である。
図５に示す確率密度関数制御部７ａにおいて、図２の確率密度関数制御部７と異なる構成としては、周期成分推定部７３、重み係数計算部７４、重み付きＳＮ比計算部７５である。その他の構成については図２と同様である。

周期成分推定部７３は、パワースペクトル計算部３が出力するパワースペクトルＹ（λ，ｋ）を入力し、入力信号スペクトルの調波構造の分析を行う。調波構造の分析には、図６に示すように、パワースペクトルが構成する調波構造の山（以降、スペクトルピークと称する）を検出することで行う。具体的には、調波構造とは関係無い微小ピーク成分除去のため、例えば、パワースペクトルの最大値の２０％程度の値を各パワースペクトル成分から減算した後、低域から順にパワースペクトルのスペクトル包絡の極大値をトラッキングして求める。なお、図６のパワースペクトル例は説明を容易にするために、音声スペクトルと雑音スペクトルを別成分として記載しているが、実際の入力信号は音声スペクトルに雑音スペクトルが重畳（加算）しており、雑音スペクトルよりもパワーが小さい音声スペクトルのピークは観測できない。
スペクトルピーク探索後、周期成分推定部７３は、周期性情報ｐ（λ，ｋ）として、パワースペクトルの極大値（スペクトルピークである）であればｐ（λ，ｋ）＝１とし、そうでなければｐ（λ，ｋ）＝０としてスペクトル番号ｋ毎に値をセットする。なお、図６の例では、全てのスペクトルピークの抽出を行っているが、例えば、ＳＮ比の良い帯域のみなど、特定の周波数帯域に限って行ってもよい。

続いて周期成分推定部７３は、観測されたスペクトルピークの高調波周期を元に、雑音スペクトルに埋もれている音声スペクトルのピークを推定する。具体的には、例えば図７のように、スペクトルピークが観測されていない区間（雑音に埋もれた低域部分および高域部分）において、観測されたスペクトルピークの高調波周期（ピーク間隔）でスペクトルピークが存在すると見なし、そのスペクトル番号の周期性情報ｐ（λ，ｋ）＝１をセットする。なお、極めて低い周波数帯域（例えば、１２０Ｈｚ以下）では音声成分が存在することは稀なので、その帯域では周期性情報ｐ（λ，ｋ）に“１”をセットしないこともできる。極めて高い周波数帯域でも同様なことが可能である。以上の処理を実施し、周期性情報ｐ（λ，ｋ）を周期成分推定部７３から重み係数計算部７４へ出力する。

重み係数計算部７４は、周期成分推定部７３が出力する周期性情報ｐ（λ，ｋ）と、雑音スペクトル推定部５が出力する判定フラグＶｆｌａｇと、ＳＮ比計算部６が出力する事前ＳＮ比ξ（λ，ｋ）とを入力し、後述の重み付きＳＮ比計算部７５で計算する事後ＳＮ比に対し、スペクトル成分毎の重み付けを行うための調波構造重み係数Ｗ_ｈ（λ，ｋ）の算出を行う。

ここで、Ｗ_ｈ（λ−１，ｋ）は前フレームの調波構造重み係数、βは平滑化のための所定の定数であり、例えばβ＝０．８が好適である。また、ｗ_ｐ（ｋ）は、周期性情報ｐ（λ，ｋ）＝１の場合の重み付け定数であり、例えば次の式（１８）のように判定フラグＶｆｌａｇと事前ＳＮ比ξ（λ，ｋ）とから決定され、当該スペクトル番号での値と隣接するスペクトル番号の値とで平滑化される。隣接するスペクトル成分と平滑化することで、重み付け係数の急峻化抑制およびスペクトルピーク分析の誤差を吸収する効果がある。
なお、周期性情報ｐ（λ，ｋ）＝０の場合の重み付け定数ｗ_ｚ（ｋ）については通常は１．０のまま重み付け無しでよいが、必要に応じて次の式（１８）のｗ_ｐ（ｋ）と同様に、判定フラグＶｆｌａｇと事前ＳＮ比ξ（λ，ｋ）で制御することも可能である。

ただし、
周期性情報ｐ（λ，ｋ）＝１、かつ、判定フラグＶｆｌａｇ＝１（音声）の場合、

周期性情報ｐ（λ，ｋ）＝１、かつ、判定フラグＶｆｌａｇ＝０（雑音）の場合、

ここで、ＴＨ_{ＳＢ＿ＳＮＲ}は所定の定数閾値である。上式（１８）のように判定フラグと事前ＳＮ比で重み付け定数ｗ_ｐ（ｋ）を制御することで、音声・雑音区間判定部４で入力信号が音声と判定された場合には、音声が雑音に埋もれているような帯域のスペクトルピーク（スペクトルの調波構造の山部分）に大きな重み付けを行い、また、もともとＳＮ比が高い帯域のスペクトル成分には、過剰な重み付けを行わないようにできる。
一方、音声・雑音区間判定部４で入力信号が雑音と判定された場合には、重み付けを抑制する（重み付け定数ｗ_ｐ（ｋ）を１．０にする）と共に、ＳＮ比が高いと推定されたスペクトル成分に対して重み付けを行うことで、例えば、現フレームが音声なのに雑音であると判定フラグが誤った場合においても、重み付けを行うことができる。なお、閾値ＴＨ_{ＳＢ＿ＳＮＲ}は、入力信号の状態および雑音レベルに応じて適宜変更することもできる。

重み付きＳＮ比計算部７５は、制御係数計算部７２で第１の制御係数ν（λ，ｋ）および第２の制御係数μ（λ，ｋ）を計算するために必要な重み付き事後ＳＮ比を求める。まず、入力信号のパワースペクトルＹ（λ，ｋ）と推定雑音スペクトルＮ（λ，ｋ）より、次の式（１９）により仮の事後ＳＮ比γ_ｔ（λ，ｋ）を求める。

続いて重み付きＳＮ比計算部７５は、図８に示す非線形関数を参照し、仮の事後ＳＮ比γ_ｔ（λ，ｋ）に対応する重み係数Ｗ（λ，ｋ）を算出する。図８に示すように、重み係数Ｗ（λ，ｋ）は、仮の事後ＳＮ比γ_ｔ（λ，ｋ）が小さい程大きくなる一方、仮の事後ＳＮ比γ_ｔ（λ，ｋ）がある一定程度大きい（あるいは小さい）場合には一定の重みになるような関数を取る。また、図８中のＷ_ＭＩＮは重み係数Ｗ（λ，ｋ）の下限を決める所定の定数、γ_０ハットおよびγ_１ハット（電子出願の関係上、ギリシャ文字の上の「＾」を「ハット」と表記する）は所定の定数であり、本実施の形態における好適な一例として、Ｗ_ＭＩＮ＝０．２５、γ_０ハット＝３（ｄＢ）、γ_１ハット＝１２（ｄＢ）であるが、入力信号中の音声および雑音の様態に応じて適宜変更することが可能である。
以上、得られた重み係数Ｗ（λ，ｋ）を用いて推定雑音スペクトルＮ（λ，ｋ）に重み付けを行い、次の式（２０）のように第１の重み付き事後ＳＮ比γ_ｗ１（λ，ｋ）を算出する。

上式（２０）に示す重み付け処理を行うことで、ＳＮ比の低い帯域の事後ＳＮ比を高く推定するように補正した上で確率密度関数の制御を行うことができるので、音声の過度の抑圧を抑制することができ、高品質な雑音抑圧を行うことができる。

続いて重み付きＳＮ比計算部７５は、次の式（２１）に示すように、高調波構造重み係数Ｗ_ｈ（λ，ｋ）を用いて、音声の高調波成分が存在する可能性が高い帯域では上式（２０）で得られた第１の重み付き事後ＳＮ比γ_ｗ１（λ，ｋ）を高く推定するように補正を行い、第２の重み付き事後ＳＮ比γ_Ｗ２（λ，ｋ）を算出する。

上式（２１）に示す重み付け処理を行うことで、音声の調波成分が存在する可能性が高い帯域の事後ＳＮ比を高く推定するように補正した上で確率密度関数の制御を行うことができるので、音声の過度の抑圧を抑制することができ、高品質な雑音抑圧を行うことができる。

以上、得られた第２の重み付き事後ＳＮ比γ_Ｗ２（λ，ｋ）を、重み付きＳＮ比計算部７５から制御係数計算部７２へ出力する。

図９および図１０は、本実施の形態２に係る雑音抑圧装置の出力結果の一例として、音声区間における出力信号のスペクトルと対応する事後ＳＮ比とを模式的に示したグラフである。図９（ａ）は、図６に示すスペクトルを入力信号とした場合に、重み付けを行わない場合の事後ＳＮ比を示し、その場合の雑音抑圧処理結果である出力信号スペクトルを図９（ｂ）に示す。他方、図１０（ａ）は、上式（２０）および式（２１）に示す重み付けを行う場合の事後ＳＮ比を示し、その場合の雑音抑圧処理結果である出力信号スペクトルを図１０（ｂ）に示す。
なお、図９（ａ）、図１０（ａ）において、事後ＳＮ比はデシベル値で示しており、事後ＳＮ比のデシベル値が負になる場合は表示を省略してゼロにフロアリングしている。

図９（ａ），（ｂ）を見ると、雑音に埋もれている、あるいはＳＮ比が低い帯域の音声のパワーが減衰してしまうのに対し、図１０（ａ），（ｂ）では、雑音に埋もれている、あるいはＳＮ比が低い帯域の音声の事後ＳＮ比が高く推定されるように補正されているので、その帯域の音声パワーが回復し、更に良好な雑音抑圧を行えることがわかる。

以上より、この実施の形態２によれば、雑音抑圧装置の確率密度関数制御部７ａは、入力信号の周波数別のＳＮ比（仮の事後ＳＮ比）を推定し、入力信号が音声らしいか、あるいは、雑音らしいかを示す第２の指標に基づいて、当該周波数別のＳＮ比を重み付けする重み付きＳＮ比計算部７５を有し、制御係数計算部７２は、重み付きＳＮ比計算部７５で算出された重み付きＳＮ比（第２の重み付き事後ＳＮ比）を第１の指標に用いて、確率密度関数を制御するように構成した。このため、音声の過度の抑圧を抑制することができ、高品質な雑音抑圧を行うことができる。

なお、この実施の形態２では、重み付きＳＮ比計算部７５が、入力信号の周波数別のＳＮ比を推定し、このＳＮ比に重み付けする構成にしたが、これに限定されるものではなく、重み付きＳＮ比計算部７５からＳＮ比推定のための機能を分離して上記実施の形態１の第２のＳＮ比計算部７１に相当するＳＮ比計算部を別途構成してもよい。この構成の場合には、重み付きＳＮ比計算部７５は、入力信号が音声らしいか、あるいは、雑音らしいかを示す第２の指標に基づいて周波数別のＳＮ比を重み付けする。

また、この発明の実施の形態２によれば、第２の指標として、重み付きＳＮ比計算部７５が入力信号のパワースペクトルと推定雑音スペクトルとを用いて算出した仮の事後ＳＮ比を用い、音声が雑音に埋もれてＳＮ比が負になっているような帯域においても、音声を保持するように事後ＳＮ比を補正した上で確率密度関数の制御を行っているので、音声の過度の抑圧を抑制することができ、高品質な雑音抑圧を行うことができる。

また、この実施の形態２によれば、第２の指標として、ＳＮ比計算部６が入力信号のパワースペクトルと推定雑音スペクトルとを用いて算出した事前ＳＮ比、および、音声・雑音区間判定部４が入力信号のパワースペクトルに基づき判定した音声区間と雑音区間の判定結果を用いて、事後ＳＮ比の重み付け制御を行っているので、雑音区間やＳＮ比が高い帯域で不必要な重み付けを抑制できる効果があり、更に高品質な雑音抑圧を行うことができる。

また、この実施の形態２によれば、確率密度関数制御部７ａが、入力信号中の音声の調波構造を分析する周期成分推定部７３を有し、重み付きＳＮ比計算部７５は、周期成分推定部７３の分析結果を第２の指標に用いて、入力信号のパワースペクトルのピーク部分のＳＮ比を大きくするよう重み付けする構成にした。このため、音声が雑音に埋もれているような帯域においても、音声を保持するように事後ＳＮ比を補正することができ、更に高品質な雑音抑圧を行うことができる。

なお、この実施の形態２では、すべての帯域の事後ＳＮ比の補正を行っているが、これに限定されることはなく、必要に応じて低域のみあるいは高域のみの補正でも良いし、例えば５００〜８００Ｈｚ近傍のみなど、特定の周波数帯域の補正を行ってもよい。このような周波数帯域の補正は、例えば、風きり音、自動車エンジン音等の狭帯域性ノイズに埋もれた音声の補正に有効である。

また、この実施の形態２では、式（２０）に示すＳＮ比が低い帯域の重み付け処理と、式（２１）に示す音声の調波構造に基づく重み付け処理の両方の重み付け処理を行っているが、これに限定されることは無く、どちらか一方だけ重み付け処理を行ってもよく、それぞれの重み付け処理にて述べている効果を奏効する。

実施の形態３．
上記実施の形態３の式（１８）において、重み付けの値（重み付け定数ｗ_ｐ（ｋ），ｗ_ｚ（ｋ））を周波数方向に一定としているが、周波数別に異なる値にしても良い。重み係数計算部７４は、例えば、音声の一般的な特徴として低域の方が調波構造がはっきりしている（スペクトルのピークと谷との差が大きい）ことから重み付けを大きくし、周波数が高くなるにつれて重み付けを小さくすることが可能である。

この実施の形態３によれば、重み係数計算部７４が、重み付きＳＮ比計算部７５の重み付けの強度を周波数別に制御するように構成したので、音声の周波数特性に適した重み付けを行うことができ、更に高品質な雑音抑圧を行うことができる。

実施の形態４．
また、上記実施の形態２の式（１８）において、重み付けの値（重み付け定数ｗ_ｐ（ｋ），ｗ_ｚ（ｋ））を所定の定数としているが、例えば、入力信号の音声らしさの指標に応じて複数の重み付け定数を切り替えて用いたり、所定の関数を用いて制御してもよい。
図１１は、本実施の形態４に係る雑音抑圧装置の全体構成を示すブロック図である。図１１に示す確率密度関数制御部７ｂは、パワースペクトル計算部３のパワースペクトルＹ（λ，ｋ）と、音声・雑音区間判定部４の判定フラグＶｆｌａｇおよび正規化自己相関関数の最大値ρ_ｍａｘ（λ）と、雑音スペクトル推定部５の推定雑音スペクトルＮ（λ，ｋ）と、ＳＮ比計算部６の事前ＳＮ比ξ（λ，ｋ）とを入力に用いる。その他の構成については図４と同様である。また、確率密度関数制御部７ｂは、図５と同様の内部構成である。

本実施の形態４に係る雑音抑圧装置では、入力信号の音声らしさの指標、即ち、入力信号の様態の制御要因として、例えば音声・雑音区間判定部４が出力する正規化自己相関関数の最大値ρ_ｍａｘ（λ）を確率密度関数制御部７ｂの重み係数計算部７４（図５に示す）に入力する。この重み係数計算部７４は、上式（４）での正規化自己相関関数の最大値ρ_ｍａｘ（λ）が高い場合、即ち、入力信号の周期構造がはっきりしている場合（入力信号が音声の可能性が高い）には重みを大きく、低い場合には重みを小さくすることが可能である。
また、正規化自己相関関数の最大値ρ_ｍａｘ（λ）と、音声・雑音区間の判定フラグＶｆｌａｇを併せて用いてもよい。
さらに、上記実施の形態３を組み合わせてもよい。

以上より、この実施の形態４によれば、重み係数計算部７４が、入力信号の様態に応じて、重み付きＳＮ比計算部７５の重み付けの強度を制御するように構成したので、入力信号が音声である可能性の高い場合に、音声の周期性構造を際立たせるように重み付けすることができるようになり、音声の劣化が少なくなり、更に高品質な雑音抑圧を行うことができる。

実施の形態５．
本実施の形態５の雑音抑圧装置は、上記実施の形態２の図４および図５に示す雑音抑圧装置と図面上では同様の構成であるため、以下では図４および図５を援用して説明する。
上記実施の形態２の図６の説明において、周期成分推定のために全てのスペクトルピークの検出を行っているが、例えば、ＳＮ比計算部６が出力する事前ＳＮ比ξ（λ，ｋ）を周期成分推定部７３へ入力し、その事前ＳＮ比ξ（λ，ｋ）を用いてＳＮ比が所定の閾値より高い帯域のみでスペクトルピークの検出を行うことも可能である。
同様に、音声・雑音区間判定部４による正規化自己相関関数ρ_Ｎ（λ，ｋ）の算出においても、ＳＮ比が所定の閾値より高い帯域のみで計算を行うことも可能である。

以上より、この実施の形態５によれば、入力信号のうち、ＳＮ比が所定の閾値より高い周波数帯域の信号成分を用いて算出された第２の指標を用いるように構成した。このため、ＳＮ比が高い帯域のみでスペクトルピークの検出、および正規化自己相関関数の計算を行うことになり、スペクトルピークの検出精度および音声／雑音区間の判定精度を高めることができ、更に高品質な雑音抑圧を行うことができる。

実施の形態６．
本実施の形態６の雑音抑圧装置は、上記実施の形態２の図４および図５、または上記実施の形態４の図１１に示す雑音抑圧装置と図面上では同様の構成であるため、以下では図４、図５および図１１を援用して説明する。
上記実施の形態２〜５において、確率密度関数制御部７ａ，７ｂがスペクトルピークを強調するようにＳＮ比の重み付けを行っているが、逆にスペクトルの谷部分を強調するように、即ち、スペクトルの谷においてはＳＮ比を小さくするような重み付けも可能である。周期成分推定部７３によるスペクトルの谷の検出法として、例えば、スペクトルピーク間のスペクトル番号の中央値をスペクトルの谷部分とすることが可能である。

以上より、この実施の形態６によれば、確率密度関数制御部７ａ，７ｂが、入力信号中の音声の調波構造を分析する周期成分推定部７３を有し、重み付きＳＮ比計算部７５は、周期成分推定部７３の分析結果を第２の指標に用いて、入力信号のパワースペクトルの他に部分のＳＮ比を小さくするよう重み付けする構成にした。このため、音声の周期性構造を際立たせることができ、更に高品質な雑音抑圧を行うことができる。

実施の形態７．
本実施の形態７の雑音抑圧装置は、上記実施の形態１の図１、上記実施の形態２の図４、または上記実施の形態４の図１１に示す雑音抑圧装置と図面上では同様の構成であるため、以下では図１、図４および図１１を援用して説明する。
上記実施の形態１〜６において、確率密度関数制御部７，７ａ，７ｂがスペクトル成分毎に確率密度関数の制御を行っているが、例えば、３〜４ｋＨｚの高域についてはスペクトル成分毎の事後ＳＮ比による制御ではなく、当該帯域の事後ＳＮ比の平均値に基づく一括制御とすることも可能である。

以上より、この実施の形態７によれば、確率密度関数制御部７，７ａ，７ｂの制御係数計算部７２が、所定の周波数帯域の平均ＳＮ比を用いて、当該周波数帯域一括で確率密度関数を制御するように構成したので、高品質な雑音抑圧が可能となる上、処理量削減が可能となる。

実施の形態８．
本実施の形態８の雑音抑圧装置は、上記実施の形態１の図１、上記実施の形態２の図４または上記実施の形態４の図１１に示す雑音抑圧装置と図面上では同様の構成であるため、以下では図１、図４および図１１を援用して説明する。
上記実施の形態１〜７において、確率密度関数制御部７，７ａ，７ｂは、入力信号の事後ＳＮ比を第１の指標に用いて確率密度関数を制御しているが、これに限ることは無く、入力信号が音声らしいか、あるいは、雑音らしいかを示す別の指標を用いることが可能である。例えば、入力信号スペクトルの分散、入力信号スペクトルのスペクトルエントロピ、自己相関関数、ゼロ交差数などの、公知の分析手段により得られる指標を単独または複数組み合わせて用いることができる。

例えば、第１の指標に入力信号スペクトルの分散を用いる場合、確率密度関数制御部７，７ａ，７ｂは、分散が大きい場合には音声の可能性が高いので、第１の制御係数ν（λ，ｋ）を大きくし、第２の制御係数μ（λ，ｋ）は小さくするような制御を行う。分散が小さい場合には逆に第１の制御係数ν（λ，ｋ）を小さくし、第２の制御係数μ（λ，ｋ）は大きくするような制御を行えば良い。また、指標である入力信号スペクトルの分散と制御係数とを対応付ける関数は、指標と制御係数の対応状態を観察して実験的に求めることが可能である。

以上より、この実施の形態８によれば、入力信号の様態を表す第１の指標として事後ＳＮ比以外の指標を用いても、音声区間および雑音区間での音声信号の分布状態に適合した確率密度関数を適用できるので、簡便な処理で、雑音区間での異音感が無く、かつ、音声の歪みも少ない高品質な雑音抑圧を行うことができる。また、複数の指標を組み合わせることで確率密度関数の制御精度を高めることができ、更に高品質な雑音抑圧を行うことができる。

実施の形態９．
本実施の形態９の雑音抑圧装置は、上記実施の形態２の図４および図５、または上記実施の形態４の図１１に示す雑音抑圧装置と図面上では同様の構成であるため、以下では図４および図５を援用して説明する。
上記実施の形態２において、重み係数計算部７４が音声の調波構造の分析結果から調波構造重み係数を算出し、重み付きＳＮ比計算部７５がその調波構造重み係数Ｗｈ（λ，ｋ）で事後ＳＮ比を重み付けし、制御係数計算部７２が重み付けされた事後ＳＮ比を用いて確率密度関数の制御を行っていたが、例えば、音声の調波構造の分析結果から直接確率密度関数の制御を行うことも可能である。

具体的には、周期成分推定部７３が出力する周期性情報ｐ（λ，ｋ）を直接、制御係数計算部７２へ入力する。制御係数計算部７２は、周期性情報ｐ（λ，ｋ）＝１の場合にはその帯域は音声の可能性が高いので、第１の制御係数ν（λ，ｋ）を大きくし、第２の制御係数μ（λ，ｋ）は小さくするような制御を行う。一方、周期性情報ｐ（λ，ｋ）＝０の場合にはその帯域は雑音の可能性が高いので、逆に第１の制御係数ν（λ，ｋ）を小さくし、第２の制御係数μ（λ，ｋ）は大きくするような制御を行う。なお、制御要因である周期性情報と制御係数とを対応付ける関数は、制御要因と制御係数の対応状態を観察して実験的に求めることが可能である。
この構成の場合には、図５の確率密度関数制御部７ａのうち、重み係数計算部７４および重み付きＳＮ比計算部７５が省略可能である。

以上より、この実施の形態９によれば、確率密度関数制御部７ａ，７ｂが、入力信号中の音声の調波構造を分析する周期成分推定部７３と、周期成分推定部７３の分析結果を第１の指標に用いて確率密度関数を制御する制御係数計算部７２とを有するように構成した。このため、音声区間および雑音区間での音声信号の分布状態に適合した確率密度関数を適用できるので、簡便な処理で、雑音区間での異音感が無く、かつ、音声の歪みも少ない高品質な雑音抑圧を行うことができる上、事後ＳＮ比計算などの処理を省略できるので処理量削減の効果がある。

以上の全ての実施の形態１〜９では、雑音抑圧の方法として、最大事後確率法（ＪｏｉｎｔＭＡＰ法）を用いて説明しているが、その他の方法（例えば、最小平均２乗誤差短時間スペクトル振幅法）にも適用することができる。最小平均２乗誤差短時間スペクトル振幅法は例えば“ＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔＵｓｉｎｇａＭｉｎｉｍｕｍ−ＭｅａｎＳｑｕａｒｅＥｒｒｏｒＳｈｏｒｔ−ＴｉｍｅＳｐｅｃｔｒａｌＡｍｐｌｉｔｕｄｅＥｓｔｉｍａｔｏｒ”（Ｙ．Ｅｐｈｒａｉｍ，Ｄ．Ｍａｌａｈ，ＩＥＥＥＴｒａｎｓ．ＡＳＳＰ，ｖｏｌ．ＡＳＳＰ−３２，Ｎｏ．６Ｄｅｃ．１９８４）に詳述されているため、説明は省略する。

また、以上の全ての実施の形態１〜９では、狭帯域電話（０〜４０００Ｈｚ）の場合について説明しているが、狭帯域電話音声に限られるものではなく、例えば、０〜８０００Ｈｚなどの広帯域電話音声、および音楽などの音響信号に対しても適用可能である。

また、以上の全ての実施の形態１〜９において、雑音抑圧された出力信号は、デジタルデータ形式で音声符号化装置、音声認識装置、音声蓄積装置、ハンズフリー通話装置などの各種音声音響処理装置へ送出されるが、本実施の形態１〜９の雑音抑圧装置を、単独または上述の他の装置と共にＤＳＰ（デジタル信号処理プロセッサ）によって実現したり、ソフトウエアプログラムとして実行することでも実現可能である。プログラムは、ソフトウエアプログラムを実行するコンピュータの記憶装置に記憶していても良いし、ＣＤ−ＲＯＭなどの記憶媒体にて配布される形式でも良い。また、ネットワークを通じてプログラムを提供することも可能である。さらに、各種音声音響処理装置へ送出される他、Ｄ／Ａ（デジタル・アナログ）変換の後、増幅装置にて増幅し、スピーカなどから直接音声信号として出力することも可能である。

上記以外にも、本願発明はその発明の範囲内において、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。

以上のように、この発明に係る雑音抑圧装置は、高品質な雑音抑圧が可能なため、音声通信・音声蓄積・音声認識システムが導入された、カーナビゲーション・携帯電話・インターフォン等の音声通信システム・ハンズフリー通話システム・ＴＶ会議システム・監視システム等の音質改善、および、音声認識システムの認識率の向上のために供するのに適している。

１入力端子、２フーリエ変換部、３パワースペクトル計算部、４音声・雑音区間判定部、５雑音スペクトル推定部、６ＳＮ比計算部、７，７ａ，７ｂ確率密度関数制御、８抑圧量計算部、９スペクトル抑圧部、１０逆フーリエ変換部、１１出力端子、７１第２のＳＮ比計算部、７２制御係数計算部、７３周期成分推定部、７４重み係数計算部、７５重み付きＳＮ比計算部。

Claims

時間領域の入力信号を周波数領域の信号であるスペクトル成分およびパワースペクトルに変換し、前記パワースペクトルと前記入力信号から別途推定した推定雑音スペクトルとを用いて雑音抑圧のための抑圧量を算出し、前記抑圧量に応じて前記スペクトル成分の振幅抑圧を行い、当該振幅抑圧されたスペクトル成分を時間領域へ変換して雑音抑圧信号を得る雑音抑圧装置において、
前記入力信号のパワースペクトルと前記推定雑音スペクトルとから周波数別のＳＮ比を推定するＳＮ比計算部と、
前記入力信号のパワースペクトルを分析して、前記入力信号が音声らしいか、あるいは、雑音らしいかを示す第１の指標を算出し、音声の分布状態を表す予め定義された確率密度関数を当該第１の指標に基づいて制御する確率密度関数制御部とを備え、
前記ＳＮ比計算部で推定された前記周波数別のＳＮ比と前記確率密度関数制御部により制御される前記確率密度関数を用いて前記抑圧量を算出することを特徴とする雑音抑圧装置。
前記確率密度関数制御部は、
前記入力信号のパワースペクトルと前記推定雑音スペクトルとから第２のＳＮ比を推定する第２のＳＮ比計算部と、
前記第２のＳＮ比計算部で推定された第２のＳＮ比を前記第１の指標に用いて、前記確率密度関数を制御する制御係数計算部とを有することを特徴とする請求項１記載の雑音抑圧装置。
前記確率密度関数制御部は、
前記入力信号のパワースペクトルと前記推定雑音スペクトルとから仮のＳＮ比を推定し、前記入力信号が音声らしいか、あるいは、雑音らしいかを示す、前記第１の指標とは異なる第２の指標に基づいて前記仮のＳＮ比を重み付けして重み付きＳＮ比を算出する重み付きＳＮ比計算部と、
前記重み付きＳＮ比計算部で算出された重み付きＳＮ比を前記第１の指標に用いて、前記確率密度関数を制御する制御係数計算部とを有することを特徴とする請求項１記載の雑音抑圧装置。
前記第２の指標は、前記ＳＮ比計算部で推定された前記周波数別のＳＮ比、前記入力信号のパワースペクトルに基づき判定した音声区間と雑音区間の判定結果、前記入力信号のパワースペクトル中の音声の調波構造を分析した分析結果のうちの少なくとも１つであることを特徴とする請求項３記載の雑音抑圧装置。
前記入力信号のパワースペクトルを用いて前記入力信号の音声らしさの指標となる前記入力信号の態様を判定する音声・雑音区間判定部を備え、
前記確率密度関数制御部は、前記音声・雑音区間判定部で判定された前記入力信号の様態に応じて、前記重み付きＳＮ比計算部の重み付けの強度を制御する重み係数計算部を有することを特徴とする請求項３記載の雑音抑圧装置。
前記確率密度関数制御部は、前記重み付きＳＮ比計算部の重み付けの値として周波数別に異なる値を用いる重み係数計算部を有することを特徴とする請求項３記載の雑音抑圧装置。
前記確率密度関数制御部は、
前記入力信号のパワースペクトル中の音声の調波構造を分析する周期成分推定部と、
前記周期成分推定部の分析結果を前記第１の指標に用いて、前記確率密度関数を制御する制御係数計算部とを有することを特徴とする請求項１記載の雑音抑圧装置。
前記ＳＮ比計算部で推定された前記周波数別のＳＮ比が所定の閾値より高い周波数帯域における前記第２の指標を用いることを特徴とする請求項４記載の雑音抑圧装置。
前記確率密度関数制御部は、
前記入力信号のパワースペクトル中の音声の調波構造を分析する周期成分推定部を有し、
前記重み付きＳＮ比計算部は、前記周期成分推定部の分析結果を前記第２の指標に用いて、前記入力信号のパワースペクトルのピーク部分のＳＮ比を大きくするよう重み付けするか、当該パワースペクトルの谷部分のＳＮ比を小さくするよう重み付けするか、少なくとも何れか一方を行うことを特徴とする請求項３記載の雑音抑圧装置。
前記制御係数計算部は、前記第２のＳＮ比計算部で推定された周波数別の前記第２のＳＮ比を用いて所定の周波数帯域の平均ＳＮ比を計算し、当該平均ＳＮ比を用いて前記所定の周波数帯域一括で前記確率密度関数を制御することを特徴とする請求項２記載の雑音抑圧装置。
前記制御係数計算部は、前記重み付きＳＮ比計算部で推定された周波数別の前記重み付きＳＮ比を用いて所定の周波数帯域の平均ＳＮ比を計算し、当該平均ＳＮ比を用いて前記所定の周波数帯域一括で前記確率密度関数を制御することを特徴とする請求項３記載の雑音抑圧装置。