JP5689844B2 - スペクトル推定装置、その方法及びプログラム - Google Patents

スペクトル推定装置、その方法及びプログラム Download PDF

Info

Publication number
JP5689844B2
JP5689844B2 JP2012060159A JP2012060159A JP5689844B2 JP 5689844 B2 JP5689844 B2 JP 5689844B2 JP 2012060159 A JP2012060159 A JP 2012060159A JP 2012060159 A JP2012060159 A JP 2012060159A JP 5689844 B2 JP5689844 B2 JP 5689844B2
Authority
JP
Japan
Prior art keywords
spectrum
state
spectral
model
estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012060159A
Other languages
English (en)
Other versions
JP2013195511A (ja
Inventor
中谷 智広
智広 中谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012060159A priority Critical patent/JP5689844B2/ja
Publication of JP2013195511A publication Critical patent/JP2013195511A/ja
Application granted granted Critical
Publication of JP5689844B2 publication Critical patent/JP5689844B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は一次元時系列信号を周波数分割した信号から、信号のスペクトルを推定するスペクトル推定技術に関する。
以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号、「^」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
nを短時間フレームの番号、k(=1〜N)を、観測信号を周波数分割する際の周波数の番号とし、短時間フレームにおける各周波数分割した信号をxn,kと表す。さらに、xn,kを全ての周波数についてひとまとめにしてできるベクトルをx=[xn,1,xn,2,…,xn,Nkと表記し(ただし、下付添え字NkはNを表す)、以下では、短時間フレームnの周波数信号と呼ぶ。Nは周波数分割数を表す。は、ベクトルや行列の非共役転置を表す。
図1は、非特許文献1などに開示されている従来のスペクトル推定装置9の機能ブロック図を示す。スペクトル推定装置9は、各短時間フレームnにおいて、周波数信号xを受け取り、最尤法に基づき、周波数信号xのスペクトルσ=[σn,1,σn,2,…,σn,Nkを推定する。より具体的には、非特許文献1では、信号の周波数分割に短時間フーリエ変換を用いており、残響除去された信号の短時間フーリエ変換の推定値がxと与えられているときに、xn,kが平均0、分散σn,kの複素正規分布に従うとの仮定の下で、最尤スペクトル推定部91において、分散σn,k(=スペクトルの値)を最尤法により求める。つまり、xn,kの条件付き確率密度関数p(xn,k|σn,k)は、以下の式でモデル化される。
Figure 0005689844
そして、対数尤度関数L(σ)=Σlogp(xn,k|σn,k)を最大にする値として、以下のようにスペクトルσ=[σn,1,σn,2,…,σn,Nkを推定する。
Figure 0005689844
なお、推定値と推定すべき変数を区別するために、推定値には^をつけて、σ^等と表記することにする。
一方、非特許文献2等に詳述されているように、(1)式に加えて、分散σn,kのとりうる値を規定する事前確率密度関数p(σ;Θ)を導入し、σの値を、周波数信号xが与えられた下での事後確率最大化(Maximum a posteriori、以下「MAP」ともいう)推定により求める方法が説明されている。ここで、Θは、事前確率密度関数のモデルパラメータである。この場合のスペクトル推定装置8の機能ブロック図を図2に示す。MAP推定は、以下のように定義される。
Figure 0005689844
事後確率最大化スペクトル推定部81は、スペクトル事前分布記憶部82から事前確率密度関数のモデルパラメータΘを取り出し、(4)式により、σを求める。このように、σの事前確率密度関数p(σ;Θ)を考慮することで、σがとりうる値の傾向をある程度制限できることになる。事前確率密度関数p(σ;Θ)として、ガウス分布の分散に関する自然共役分布である逆ガンマ分布等を用いると、効率的な計算が可能なことが知られている。
中谷智広、吉岡拓也、木下慶介、三好正人、Biing-Hwang Juang、"短時間フーリエ変換表現を用いた最尤推定に基づく音声信号の残響除去"、日本音響学会春季研究発表会、2008年3月、pp.733-736 C. M. Bishop著、元田浩、栗田多喜夫、樋口知之、松本裕治訳、「パターン認識と機械学習上- ベイズ理論による統計的予測」、シュプリンガー・ジャパン、2007年、pp.95-100
非特許文献1では、周波数信号として短時間フーリエ変換の推定値を用いているが、一般に、推定値には必ず推定誤差が含まれる。また、周波数信号としてマイクロホンで収音した観測信号を用いる場合なども、一般に、観測信号には必ず何らかの雑音が含まれる。その結果、これらの周波数信号に基づき、従来の方法でスペクトル推定を行うと、誤差や雑音の影響で必ずしも精度よく推定が行えないという問題がある。特に、非特許文献1のように、短時間フーリエ変換の推定とスペクトルの推定を相互に依存させながら交互に繰り返すような場合、繰り返しにより誤差の影響が拡大して推定値が劣化する場合もある。
一方、非特許文献2にあるように、分散の事前確率密度関数p(σ;Θ)を導入し、分散の値をMAP推定によって求めるようにすることで、分散がとりうる値を制限し、ある程度、誤差の影響を弱めることができる。しかし、MAP推定において効率的に最適化が行えるのは、自然共役分布のようなごく一部の事前確率密度関数p(σ;Θ)を用いる場合に限られ、σの分布を精度よくあらわすものを必ずしも利用できないという問題がある。特に、自動音声認識システムの音響モデルとして利用される確率分布と類似性の高い対数スペクトルに関する混合ガウス分布等(ガウス分布、混合ガウス分布、ガウス分布を出力確率分布に持つ隠れマルコフモデル等を含む)は、精度よく音声信号のスペクトルの分布を表すと考えられているが、(4)式の事前確率密度関数p(σ;Θ)として用いた場合に、効率的に最適化を行う方法は知られていない。
この発明はこの課題に鑑みてなされたものであり、周波数信号が誤差を含む場合でも、対数スペクトルに関する混合ガウス分布等をスペクトルの事前確率密度関数として用いて、高精度かつ効率的にスペクトル推定が行える技術を提供することを目的とする。
上記の課題を解決するために、本発明の第一の態様によれば、スペクトル推定装置は、各短時間フレームnにおける周波数信号xのスペクトル値σを推定する。スペクトル推定装置は、記憶部、スペクトル状態推定部及び事後確率最大化スペクトル推定部を含む。記憶部は、周波数信号xの対数スペクトルρの状態を表す状態パラメータθの事前確率密度関数p(θ;Θθ)に関するモデルパラメータであるスペクトル状態モデルΘθと、状態パラメータθが既知の条件下での対数スペクトルρの条件付き確率密度関数p(ρ|θ;Θρ)に関するモデルパラメータである状態依存スペクトルモデルΘρとを記憶する。スペクトル状態推定部は、対数スペクトルの推定値ρ^、スペクトル状態モデルΘθ及び状態依存スペクトルモデルΘρを用いて、対数尤度重みwθnを推定する。事後確率最大化スペクトル推定部は、周波数信号x、対数尤度重みwθn及び状態依存スペクトルモデルΘρを用いて、目的関数を最大化する対数スペクトルρを推定する。収束条件を満たすまで、スペクトル状態推定部及び事後確率最大化スペクトル推定部における処理を繰り返す。
上記の課題を解決するために、本発明の第二の態様によれば、スペクトル推定方法は、各短時間フレームnにおける周波数信号xのスペクトル値σを推定する。スペクトル推定方法は、スペクトル状態推定ステップ及び事後確率最大化スペクトル推定ステップを含む。周波数信号xの対数スペクトルρの状態を表す状態パラメータθの事前確率密度関数p(θ;Θθ)に関するモデルパラメータであるスペクトル状態モデルΘθと、状態パラメータθが既知の条件下での対数スペクトルρの条件付き確率密度関数p(ρ|θ;Θρ)に関するモデルパラメータである状態依存スペクトルモデルΘρとを記憶しておく。スペクトル状態推定ステップは、対数スペクトルの推定値ρ^、スペクトル状態モデルΘθ及び状態依存スペクトルモデルΘρを用いて、対数尤度重みwθnを推定する。事後確率最大化スペクトル推定ステップは、周波数信号x、対数尤度重みwθn及び状態依存スペクトルモデルΘρを用いて、目的関数を最大化する対数スペクトルρを推定する。収束条件を満たすまで、スペクトル状態推定ステップ及び事後確率最大化スペクトル推定ステップにおける処理を繰り返す。
本発明によれば、スペクトルの分布を高精度に表現可能な対数スペクトルに関する潜在変数依存型ガウス分布をスペクトルの事前確率密度関数として用いた場合でも、効率的にスペクトルの値を推定できる。その結果、周波数信号が誤差を含むような場合でも、効率的かつ高精度に、そのスペクトルの推定が可能になるという効果を奏する。
従来のスペクトル推定装置の機能ブロック図。 従来のスペクトル推定装置の機能ブロック図。 第一実施形態のスペクトル推定装置の機能ブロック図。 第一実施形態のスペクトル推定装置の処理フローを示す図。 第一実施形態の事後確率最大化スペクトル推定部の機能ブロック図。 第一実施形態のスペクトル状態推定部と事後確率最大化スペクトル推定部の処理フローを示す図。 第一実施形態の変形例のスペクトル状態推定部の機能ブロック図。 第一実施形態の変形例のスペクトル状態推定部の処理フローを示す図。 第二実施形態のスペクトル状態推定部の機能ブロック図。 第二実施形態のスペクトル状態推定部の処理フローを示す図。 従来技術(最尤法)、第一実施形態、第二実施形態を用いた場合の比較結果を示す図。
以下、本発明の実施形態について説明する。
<第一実施形態>
図3はスペクトル推定装置10の機能ブロック図を、図4はその処理フローを示す。スペクトル推定装置10は、スペクトル状態モデル記憶部101、状態依存スペクトルモデル記憶部102、スペクトル状態推定部104及び事後確率最大化スペクトル推定部106を含む。
スペクトル推定装置10は、各短時間フレームnにおいて、周波数信号xを受け取り、そのスペクトルの推定値σ^を出力する。
まず、周波数信号xの対数スペクトルをρ=[ρn,1,ρn,2,…,ρn,Nkと表すことにする。ただし、ρn,k=logσn,kである。
スペクトル状態モデル記憶部101は、周波数信号xの対数スペクトルρの状態を表す状態パラメータθの事前確率密度関数p(θ;Θθ)に関するモデルパラメータを記憶している。以下、このモデルパラメータをスペクトル状態モデルΘθと呼ぶ。
状態依存スペクトルモデル記憶部102は、状態パラメータθが既知の条件下での対数スペクトルρの条件付き確率密度関数p(ρ|θ;Θρ)に関するモデルパラメータを記憶している。以下、このモデルパラメータを状態依存スペクトルモデルΘρと呼ぶ。
スペクトル状態推定部104は、後述する事後確率最大化スペクトル推定部106が推定した対数スペクトルの推定値ρ^を受け取るとともに、スペクトル状態モデル記憶部101と状態依存スペクトルモデル記憶部102のそれぞれからスペクトル状態モデルΘθと状態依存スペクトルモデルΘρを受け取り、対数尤度重みwθn(ただし、下付添え字θnはθを表す)を推定し(s1)、出力する。
事後確率最大化スペクトル推定部106は、周波数信号xと、対数尤度重みwθnと、状態依存スペクトルモデルΘρを受け取り、後述する目的関数を最大化する対数スペクトルの推定値ρ^=[ρ^n,1,ρ^n,2,…,ρ^n,Nkを推定し(s2)、出力する。また収束条件を満たすまで(s3)、スペクトル状態推定部104及び事後確率最大化スペクトル推定部106における処理(s1及びs2)を繰り返す。収束条件としては、例えば、(1)繰り返し回数が所定の回数を超えることや、(2)一つ前の繰り返し時に得られた対数スペクトルの推定値と現在の繰り返し時に得られた対数スペクトルの推定値との差分が閾値以下であること等が挙げられる。収束条件を満たした場合は、満たした時点の対数スペクトルの推定値ρ^からスペクトルの推定値σ^=[σ^n,1,σ^n,2,…,σ^n,Nkを求め、出力する。ただし、σ^n,k=exp(ρ^n,k)である。推定値ρ^n,kが得られれば推定値σ^n,kも与えられるので、以下では推定値ρ^n,kについての推定方法のみについて記述する。
<第一実施形態のポイント>
スペクトル推定装置10では、対数スペクトルρがとりうる値を規定する事前確率密度関数p(ρ;Θθ,Θρ)を導入し、対数スペクトルρの値を、周波数信号xが与えられた下での事後確率最大化(MAP)推定により求める。すなわち、以下のように求める。
Figure 0005689844
これにより、(1)式で定義される周波数信号xの条件付き確率密度関数p(xn,k|σn,k)に加えて、対数スペクトルρの事前確率密度関数p(ρ;Θθ,Θρ)をも考慮しながら対数スペクトルρが推定されることになる。そのため、周波数信号xに含まれる誤差の影響を比較的受けにくいスペクトル推定が可能になる。なお、(5)式のp(x|ρ)は、従来の最尤法と同様に、p(x|ρ)=Πp(xn,k|ρn,k)のように分解でき、(1)式とσn,k=exp(ρn,k)の関係式に基づき、以下のように定義されているものとする。
Figure 0005689844
さらに、第一実施形態のスペクトル推定装置10では、高精度で効率的な推定を実現するために、以下の3つの仮定を導入する。
仮定(1):周波数信号xの対数スペクトルρの事前確率密度関数p(ρ;Θθ,Θρ)は、状態パラメータθを潜在変数として持つ以下の式でモデル化されている。
Figure 0005689844
なお、上式では、状態パラメータθは離散値を取るものと仮定し、その周辺化のために全状態の総和をとっている。一方、本発明は、状態パラメータθが連続値を取る場合も含む。その場合、状態パラメータθの周辺化は、以下のように、状態パラメータθがとりうる値の全範囲にわたる積分として定義される。
Figure 0005689844
本実施形態では、状態パラメータθは離散値を取るものとして説明する。なお、連続値を取る場合については、状態パラメータθに関する総和の部分を、適宜、状態パラメータθがとりうる値の全範囲にわたる積分として読み替えるだけでよいので、個別の説明は省略する。
仮定(2):状態パラメータθが与えられた下での対数スペクトルρの条件付き確率密度関数p(ρ|θ;Θρ)は、多変量ガウス分布に従う。以下、仮定(1)及び仮定(2)に従う分布を潜在変数依存型ガウス分布と呼ぶ。
仮定(3):さらに、条件付き確率密度関数p(ρ|θ;Θρ)は、各周波数kの対数スペクトルρn,kに関する条件付き確率密度関数p(ρn,k|θ;Θρ)の積に分解できる。
Figure 0005689844
なお、仮定(3)を満たすとき、条件付き確率密度関数p(ρ|θ;Θρ)は周波数分解可能であるという。なお、仮定(2)により、上式の右辺はさらに以下のように書き換えられる。
Figure 0005689844
ここで、N(x;μ,ξ)は、平均μ、分散ξの一次元ガウス分布の確率密度関数を表す。例えば、(8)式において、状態パラメータθが単一の状態しかとらないとすると事前確率密度関数p(ρ;Θθ,Θρ)はガウス分布に一致する。状態パラメータθが有限個の状態のどれか一つを取ると仮定すると事前確率密度関数p(ρ;Θθ,Θρ)は混合ガウス分布に一致する。さらに、隣り合う短時間フレーム間での状態パラメータθの遷移が、ある状態遷移確率に従うと仮定すると、対数スペクトルρに関する隠れマルコフモデルになる。上記の仮定および以下では、簡単のため、対数スペクトルρの事前確率密度関数p(ρ;Θθ,Θρ)は、短時間フレームn毎に独立な分布として説明する。なお、本実施形態において、短時間フレーム間の状態遷移過程を導入する方法は、隠れマルコフモデルに関する既知の技術に基づき自明であるので、その説明を省略する。
(5)式の解は、状態パラメータθを隠れ変数とした期待値最大化(Expextation Maximization:以下「EM」とする)アルゴリズム(及び、その関連最適化手法)で求めることができる。このとき、補助関数Q(ρ|ρ^)は、以下のように定義される。
Figure 0005689844
ここで、対数スペクトルρが既知の下で、周波数信号xは、状態パラメータθと独立であると仮定すると、上記右辺に含まれる完全データの確率密度関数p(x,ρ,θ;Θθ,Θρ)は、以下のように展開できる。
Figure 0005689844
したがって、ρと無関係の項を省略して(11)式をさらに展開し、以下を得る。
Figure 0005689844
ただし、
Figure 0005689844
Figure 0005689844
したがって、EMアルゴリズムでは、収束するまで、以下の二つの処理を交互に繰り返すことで、MAP推定は実現される。
1.E−step:スペクトル状態推定部104が、対数尤度重みwθnを(18)式に従い更新する(s1)。
2.M−step:事後確率最大化スペクトル推定部106が、(15)式を最大化するρn,kを対数スペクトルの推定値ρ^n,kとして更新する(s2)。
なお、(18)式は、状態パラメータθが連続値を取る場合は、状態パラメータθに関する連続関数になる。上記の繰り返しのうち、最も計算コストを増大させる可能性があるのは、補助関数Q(ρ|ρ^)の値を最大化する対数スペクトルρを求めるM−stepである。これに対し、本実施形態では、上記の仮定(1)〜(3)により、すなわち、対数スペクトルρの事前確率密度関数p(ρ;Θθ,Θρ)が潜在変数依存型ガウス分布に従い、その条件付き確率密度関数p(ρ|θ;Θρ)が周波数分解可能であるとき、計算コストを抑えた処理が可能になる。より具体的には、以下の二つのポイントにより、計算コストを抑えることができる。
ポイント(1):(15)式は、各時間周波数に閉じて、対数スペクトルρn,kに関するスカラー1変数関数になっている。すなわち、ρの更新は、各時間周波数n,kにおける対数スペクトルρn,kの更新に分解できる。
ポイント(2):さらに、各時間周波数n,kにおいて最大化をするべき関数であるQ(ρn,k|ρ^n,k)をρn,kで微分して得られる関数は、以下のような単純な形式をしている。
f(z)=exp(z)+z+a (19)
Figure 0005689844
Figure 0005689844
したがって、(15)式を最大にするρn,kは、(19)式においてf(z)=0となるzを求めた後に、(20)式から求めることができる。一方、(19)式は、スカラー定数aのみで形状が定まる1変数凸関数であり、効率的にf(z)=0の解を求める方法が存在する。例えば、aの値毎にf(z)=0を与える解をあらかじめ求めておき、解の参照表を用意しておけば、参照表を見るだけで近似解を得ることができる。また、(19)式を詳しく調べると、a>−1/2でf(z)≒exp(z)+a,a≦−1/2でf(z)≒z+aと荒く近似できることがわかる。これより、以下の近似解を得ることもできる。
Figure 0005689844
さらに、f(z)=0を与える解の初期推定値としてこれらの近似解を用い、ニュートン法などの勾配法を用いて数値的な探索を行うことで、解の精度を上げることができる。しかも、このとき、f(z)は、1変数凸関数であるため、非常に効率的かつ効果的に勾配法による探索を実現できる。
(対数スペクトルの事前確率密度関数p(ρ;Θθ,Θρ))
本実施形態では、対数スペクトルの事前確率密度関数p(ρ;Θθ,Θρ)を、混合ガウス分布でモデル化する。状態パラメータθは、各短時間フレームnにおいて、1からNθで番号付されたNθ個の有限状態の何れかの状態iをとるとする。事前確率密度関数p(ρ;Θθ,Θρ)は、以下で定義される。
Figure 0005689844
ただし、
Figure 0005689844
p(θn=i;Θθ)=βi (25)
スペクトル状態モデルΘθは、全ての状態iに関する混合比βからなり、状態依存スペクトルモデルΘρは、全ての状態i、全ての周波数kに関する平均μ と共分散行列ξ とからなる。これらのモデルは、スペクトル推定の対象となる信号に関する学習データを用いて、事前に学習されているとする。混合ガウス分布のモデルパラメータの学習には、EMアルゴリズムを用いる方法などが知られている。
以下、各部の詳細を説明する。
<事後確率最大化スペクトル推定部106及びスペクトル状態推定部104の詳細>
事後確率最大化スペクトル推定部106が、一つのスカラー変数zとそのスカラー変数に関する指数関数exp(z)と一つのスカラー定数aとの和によって規定される非線形方程式(例えば(19)式)に関して、各短時間フレームnにおける周波数k毎の周波数信号xn,kと対数尤度重みwθnと状態依存スペクトルモデルΘρに依存してスカラー定数aを定めるとともに(例えば(21)式)、非線形方程式が0に一致するスカラー変数zの値を求め(例えば(19)式、(22)式)、その求めたスカラー変数zと周波数信号xn,kと対数尤度重みwθnと状態依存スペクトルモデルΘρとに基づき、対数スペクトルの推定値ρ^を更新する(例えば(20)式)。
図5は事後確率最大化スペクトル推定部106の機能ブロック図を、図6はスペクトル状態推定部104及び事後確率最大化スペクトル推定部106の処理フローを表す。
事後確率最大化スペクトル推定部106は、初期値設定部106a、スカラー定数算出部106b、スカラー変数算出部106c、対数スペクトル算出部106d、収束判定部106e及びスペクトル算出部106fを備える。
初期値設定部106aは、周波数信号xを受け取り、式(3’)のように対数スペクトルの推定値ρ^の初期値を、従来の最尤法により求める(s21)。
Figure 0005689844
スペクトル状態推定部104が、対数スペクトルの推定値ρ^に加えて、(24)式と(25)式のそれぞれで定義されるスペクトル状態モデルΘθである混合比βと状態依存スペクトルモデルΘρである平均μ 及び共分散行列ξ を受け取り、対数尤度重みwを(18)式に基づき以下のように求める(s1)。
Figure 0005689844
さらに、周波数k毎に、以下の手順により、対数スペクトルの推定値ρ^n,kを更新する。
スカラー定数算出部106bは、周波数信号xと、対数尤度重みwと、状態依存スペクトルモデルΘρである全ての状態i、全ての周波数kに関する平均μ と共分散行列ξ とを受け取り、(21)式によりスカラー定数aを求める(s22)。
スカラー変数算出部106cは、スカラー定数aを受け取り、(19)式に関して、f(z)=0となるスカラー変数zを(近似的に)求める(s23)。
対数スペクトル算出部106dは、周波数信号xと、対数尤度重みwと、状態依存スペクトルモデルΘρである全ての状態i、全ての周波数kに関する共分散行列ξ と、スカラー変数zとを受け取り、(20)式を満たす対数スペクトルρn,kを求め、その推定値ρ^n,kとする(s24)。
スペクトル状態推定部104における処理をE−stepとし、事後確率最大化スペクトル推定部106における処理をM−stepとし、EMアルゴリズムに基づき、s1〜s24を収束条件を満たすまで繰り返す。そのため、収束判定部106eは、対数スペクトルの推定値ρ^n,kを受け取り、収束条件を満たすか否かを判定する(s3)。収束条件を満たさない場合には、対数スペクトルの推定値ρ^をスペクトル状態推定部104に出力し、各部に対し、処理を繰り返すように制御信号を出力する。収束条件を満たす場合には、対数スペクトルの推定値ρ^をスペクトル算出部106fに出力する。
スペクトル算出部106fは、対数スペクトルの推定値ρ^を受け取り、各周波数kにおけるスペクトルの推定値σ^n,kを、σ^n,k=exp(ρ^n,k)として求め(s26)、スペクトルの推定値σ^をスペクトル推定装置10の出力値として出力する。
<効果>
このような構成により、スペクトルの分布を高精度に表現可能な対数スペクトルに関する潜在変数依存型ガウス分布をスペクトルの事前確率密度関数として用いて、効率的にスペクトルの値を推定できる。その結果、周波数信号が誤差を含むような場合でも、効率的かつ高精度に、そのスペクトルの推定が可能になる。
<変形例>
第一実施形態の変形例として、EMアルゴリズムのE−stepにおいて、各状態の事後確率p(θ|ρ^;Θρ)を求める代わりに、最大の事後確率を与える状態を選択する場合の例を説明する。これは、混合ガウス分布や隠れマルコフモデルを用いた推定において、計算量削減のためにしばしば導入される近似計算である。この変形は、より厳密には、第一実施形態ではθを隠れ変数として扱っていたのに対し、ρと一緒にθも事後確率最大化推定で求めることに相当する。すなわち、以下の問題を解くことに相当する。
Figure 0005689844
具体的な処理手順としては、第一実施形態の処理手順の中のs1の処理が以下のように修正されるのみで、それ以外は、第一実施形態と同じである。
以下、変形例のスペクトル状態推定部104における処理(E−step、s1)を説明する。図7は変形例のスペクトル状態推定部104の機能ブロック図を、図8はその処理フローを示す。スペクトル状態推定部104は状態番号推定部104aと対数尤度重み設定部104bとを含む。
状態番号推定部104aは、対数スペクトルの推定値ρ^、と、スペクトル状態モデルΘθである混合比βと、状態依存スペクトルモデルΘρである全ての状態i、全ての周波数kに関する平均μ 及び共分散行列ξ とを受け取り、事後確率最大となる状態番号の推定値i^を
Figure 0005689844
として求める(s104a)。
対数尤度重み設定部104bは推定値i^を受け取り、対数尤度重みw
Figure 0005689844
として定める(s104b)。
<第二実施形態>
第一実施形態と異なる部分についてのみ説明する。第二実施形態として、状態パラメータθが連続値をとる場合の実施形態について説明する。
スペクトル状態モデル記憶部101に記憶されているスペクトル状態モデル、状態依存スペクトルモデル記憶部102に記憶されている状態依存スペクトルモデル、及び各部の処理等が、第一実施形態とは異なる。
(状態パラメータの定義)
本実施形態では、状態パラメータθとして、周波数信号に対応するメル周波数ケプストラム係数(Mel-frequency cepstral coefficient、以下「MFCC」という)cを用いる。MFCCcは、各次数に対応するN個の要素cn,mを持つベクトルとして表現されているとする。よって、c=[cn,1,cn,2,…,cn,Nc、ただし下付添え字NcはNを表す。いま、c=H(ρ)を信号の対数スペクトルρをMFCCに変換する関数とする。すると、H(ρ)は、まず、対数スペクトルρの各要素に対数変換の逆変換(exp(・))を適用し、メルフィルタバンク処理(mfb(・)と表記)を施し、個々のベクトル要素に対数変換(log(・))を適用したのち、離散コサイン変換(D(・))を適応することに対応する。すなわち、H(ρ)は、以下の変換過程で表現される。
Figure 0005689844
(スペクトル状態モデルの定義)
本実施形態では、状態パラメータθの事前確率密度関数p(θ;Θθ)としてMFCCの混合ガウス分布を用いるとする。これは、jをガウス分布の番号とすると、以下でモデル化される。
Figure 0005689844
ここで、γは分布番号jに対応する混合比、μとΣは、分布番号jに対応するガウス分布の平均と共分散行列である。したがって、スペクトル状態モデルΘθは、全てのjに関するγとμとΣの集合とする。
(状態依存スペクトルモデルの定義)
本実施形態では、状態パラメータであるMFCCcが既知の場合の対数スペクトルρの条件付き確率密度関数p(ρ|c;Θρ)は、上記のc=H(ρ)の逆変換過程としてモデル化する。一般に、c=H(s)は多対一の変換となるため、その逆変換はユニークには定められない。したがって、その定め方には任意性がある。ここでは、一例を挙げる。まず、以下のように、線形回帰を用いて、c=H(ρ)の疑似逆変換であるρ^=G(c)を定義する。
G(c)=Ac+b (35)
ただし、Aは行列(N×N)、bはベクトル(N×1)を表す。行列Aとベクトルbの値は、事前に音響信号のデータベースにより学習されるか、観測信号を用いて学習されるものとする。すなわち、いま学習用のデータベース(もしくは、観測信号)から、複数の周波数信号xにそれぞれ対応する複数の対数スペクトルρと、それに対応するMFCCc=H(ρ)の組合せが与えられているときに、行列Aとベクトルbは、以下のように定められるものとする。
Figure 0005689844
また、逆変換誤差e=ρ−ρ^=ρ−G(H(ρ))は、平均0と共分散行列Ξのガウス分布に従うと仮定する。すなわち、
p(e)=N(e;0,Ξ) (37)
これにより、条件付き確率密度関数p(ρ|c;Θρ)は、以下のように定義される。
p(ρn|cnρ)=N(ρn;G(cn),Ξ) (38)
本実施形態では、上記条件付き確率密度関数p(ρ|c;Θρ)は、周波数毎の要素の積に分解可能と仮定されているので、共分散行列Ξは、対角要素にξをもつ対角行列になる。よって、Ξ=diag(ξ)と表すことができる。G(c)のk番目の要素をG(c)と書くとすると、ξは平均自乗回帰誤差E{|ρn,k−G(c)|}として、事前に学習されるとする。すると、上記条件付き確率密度関数は、以下のように書くことができる。
Figure 0005689844
したがって、状態依存スペクトルモデルΘρとして、(36)式の係数である行列Aとベクトルb、及び全ての周波数kにおける逆変換誤差の分散ξを含んでいれば、上記条件付き確率密度関数p(ρ|c;Θρ)は規定されることになる。
(最適化関数)
本実施形態では、第一実施形態の変形例と同様に、対数スペクトルρと状態パラメータであるMFCCcの両方をMAP推定により推定する場合を考える。
Figure 0005689844
したがって、第一実施形態の変形例と同様に、ρ^とc^を交互に更新することで、上式を最大化するρ^とc^を求める。
スペクトル状態推定部104は、対数スペクトルの推定値ρ^が固定された下で、上式を最大化するMFCCcの推定値c^を求める。これは、例えば、p(c;Θθ)の混合ガウス分布の分布番号jを隠れ変数としたEMアルゴリズムで求めることができる(つまり、スペクトル状態推定部104と事後確率最大化スペクトル推定部106において行われるEMアルゴリズムのE−step内で、後述する期待値算出部204bと状態パラメータ算出部204cとにおいてEMアルゴリズムを行う)。このための補助関数は以下のように定めることができる。
Figure 0005689844
ただし、
Figure 0005689844
したがって、EMアルゴリズムでは、以下の処理を収束するまで繰り返すことで、(43)式を最大化するcを求める。これをMFCCである状態パラメータの推定値c^とする。
1.E−step:(44)式により、E{j|c^}の値を更新する。
2.M−step:(43)式を最大化するcの値として、c^を更新する。具体的には、以下の式を計算する。
Figure 0005689844
そして、上記のように、本実施形態では、状態パラメータcを潜在変数ではなく、MAP推定により求めるべきパラメータとして扱う。このため、確定値として求めた上記の状態パラメータの推定値c^に関する対数尤度重みは、以下のようにディラックデルタ関数δ(・)を用いて表現される。
Figure 0005689844
一方、事後確率最大化スペクトル推定部106は、wcn(ただし、下付添え字cnはcを表す)を受け取り、(15)式を最大化するρを求め、ρ^とする。(15)式は、以下のように書き換えられる。
Figure 0005689844
上式は、(16)式と同じ形をしているので、本実施形態により効率的に最大化することができる。例えば、本実施形態に基づくスペクトル状態推定部104の手順は以下のようになる。
<スペクトル状態推定部104の詳細>
図9は第二実施形態のスペクトル状態推定部104の機能ブロック図を、図10はその処理フローを示す。
スペクトル状態推定部104は、初期値算出部204a、期待値算出部204b、状態パラメータ算出部204c、収束判定部204e及び対数尤度重み算出部204fを含む。
初期値算出部204aは、対数スペクトルの推定値ρ^を受け取り、状態パラメータの初期値をc^=H(ρ^)として定める(s204a)((31)式参照)。
期待値算出部204bは、状態パラメータの推定値c^とスペクトル状態モデルΘθである混合比γ、平均μ及び共分散行列Σを受け取り、(44)式により、期待値E{j|c^}を求める(s204b、E−step)。
状態パラメータ算出部204cは、対数スペクトルの推定値ρ^と、期待値E{j|c^}と、スペクトル状態モデルΘθである平均μ及び共分散行列Σと、状態依存スペクトルモデルΘρである行列A、ベクトルb及び共分散行列Ξとを受け取り、(45)式により、MFCCである状態パラメータの推定値c^を求める(s204c、M−step)。
期待値算出部204bにおける処理をE−stepとし、状態パラメータ算出部204cにおける処理をM−stepとし、EMアルゴリズムに基づき、収束条件を満たすまでs204b及びs204cを繰り返す。そのため、収束判定部204eは、状態パラメータの推定値c^を受け取り、収束条件を満たすか否かを判定する(s204e)。収束条件を満たさない場合には、状態パラメータの推定値c^を期待値算出部204bに出力し、各部に対し、処理を繰り返すように制御信号を出力する。収束条件を満たす場合には、状態パラメータの推定値c^を対数尤度重み算出部204fに出力する。収束条件としては、例えば、(1)繰り返し回数が所定の回数を超えることや、(2)一つ前の繰り返し時に得られた状態パラメータの推定値と現在の繰り返し時に得られた状態パラメータの推定値との差分が閾値以下であること等が挙げられる。
対数尤度重み算出部204fは、状態パラメータの推定値c^を受け取り、式(46)により、対数尤度重みwcnを求め(s204f)、事後確率最大化スペクトル推定部106に出力する。
なお、事後確率最大化スペクトル推定部106は、対数尤度重みwcnと周波数信号xと状態依存スペクトルモデルΘρとを受け取り、(47)式を最大化する各周波数kにおける対数スペクトルρn,kを求め、対数スペクトルの推定値ρ^n,kを更新する。
なお、(47)式の最大化は、前述までの例と同様、(47)式を(19)式の形に書き換えてf(z)=0となるスカラー変数zを求めたのち、求めたスカラー変数zに対応する対数スペクトルρを求めることで実現できる。
最後に、事後確率最大化スペクトル推定部106のスペクトル算出部106fが、各周波数kにおけるスペクトルの推定値σ^n,kを、σ^n,k=exp(ρ^n,k)として求め、スペクトルの推定値σ^をスペクトル推定装置10の出力値として出力する。
<効果>
このような構成により、第一実施形態と同様の効果を奏する。
(シミュレーション結果)
この発明のスペクトル推定装置10を評価する目的で確認実験を行った。このため、非特許文献1に記載されている残響除去法のなかで、残響除去された周波数信号の推定値からスペクトルを推定する処理の部分で第一実施形態及び第二実施形態を用いた実験を行った。
非特許文献1による残響除去アルゴリズムは、以下になる。
1.残響除去された周波数信号の推定値x^を観測信号とする。
2.周波数信号の推定値x^からそのスペクトルの推定値σ^を最尤法により求める。
3.以下を収束するまで繰り返す。
(a)観測信号とスペクトルの推定値σ^から残響の予測係数を更新する。
(b)観測信号と残響の予測係数から残響除去した信号の周波数信号の推定値x^を求める。
(c)周波数信号の推定値x^からそのスペクトルの推定値σ^を最尤法により求める。
4.求められた周波数信号の推定値x^を時間領域信号に変換し、残響除去された信号として出力する。
本実験では、上記の3(c)の処理において、最尤法の代わりに、第一実施形態及び第二実施形態を用いる場合と用いない場合の比較を行った。図11は、その結果を示す。3つのグラフのそれぞれは、左から順に、長さの異なる3種類の観測信号(平均長さは、それぞれ1.15秒、2.3秒、4.6秒)を用いた場合の結果を示している。各グラフの横軸は、上記の残響除去アルゴリズムの繰り返し回数を表している。繰り返し回数0は、観測信号を表す。縦軸は、残響除去された信号のケプストラム歪(CD)を示す。二点鎖線が非特許文献1の残響除去法で、一点鎖線が第一実施形態の方法でスペクトル推定を行った場合、実線が第二実施形態の方法でスペクトル推定を行った場合を示す。全ての場合において、2回目以降の繰り返しにおいて、非特許文献1の残響除去法よりも第一実施形態及び第二実施形態によるスペクトル推定を用いた場合の方が、ケプストラム歪を小さくできている。なお、上記の残響除去アルゴリズムにおいて、第一実施形態及び第二実施形態により推定されたスペクトルに基づき残響除去が行われるのは、2回目以降の繰り返しにおいてである。このため、一回目の繰り返しでは、第一実施形態及び第二実施形態を用いる場合と用いない場合で、ケプストラム歪の値に差は生じない。
以上の結果より、第一実施形態及び第二実施形態により、潜在変数依存型ガウス分布を対数スペクトルの事前分布として導入し、対数スペクトルを事後確率最大化推定により求めることで、スペクトル推定精度を改善できることが確認された。
<その他の変形例>
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
上述したスペクトル推定装置は、コンピュータにより機能させることもできる。この場合はコンピュータに、目的とする装置(各種実施形態で図に示した機能ブロック図をもつ装置)として機能させるためのプログラム、またはその処理手順(各実施形態で示したもの)の各過程をコンピュータに実行させるためのプログラムを、CD−ROM、磁気ディスク、半導体記憶装置などの記録媒体から、あるいは通信回線を介してそのコンピュータ内にダウンロードし、そのプログラムを実行させればよい。
本発明は、各短時間フレームにおける周波数信号のスペクトル値を用いて行う様々な処理に利用することができる。
10 スペクトル推定装置
101 スペクトル状態モデル記憶部
102 状態依存スペクトルモデル記憶部
104 スペクトル状態推定部
104a 状態番号推定部
104b 設定部
106 事後確率最大化スペクトル推定部
106a 初期値設定部
106b スカラー定数算出部
106c スカラー変数算出部
106d 対数スペクトル算出部
106e 収束判定部
106f スペクトル算出部
204a 初期値算出部
204b 期待値算出部
204c 状態パラメータ算出部
204e 収束判定部
204f 算出部

Claims (9)

  1. 各短時間フレームnにおける周波数信号xのスペクトル値σを推定するスペクトル推定装置であって、
    前記周波数信号xの対数スペクトルρの状態を表す状態パラメータθの事前確率密度関数p(θ;Θθ)に関するモデルパラメータであるスペクトル状態モデルΘθと、前記状態パラメータθが既知の条件下での前記対数スペクトルρの条件付き確率密度関数p(ρ|θ;Θρ)に関するモデルパラメータである状態依存スペクトルモデルΘρとを記憶する記憶部と、
    前記対数スペクトルρ の推定値ρ^、前記スペクトル状態モデルΘθ及び前記状態依存スペクトルモデルΘρを用いて、対数尤度重みwθnを推定するスペクトル状態推定部と、
    前記周波数信号x、前記対数尤度重みwθn及び前記状態依存スペクトルモデルΘρを用いて、目的関数を最大化する対数スペクトルを前記推定値ρ^ として求める事後確率最大化スペクトル推定部とを含み、
    収束条件を満たすまで、前記スペクトル状態推定部及び事後確率最大化スペクトル推定部における処理を繰り返す、
    スペクトル推定装置。
  2. 請求項1記載のスペクトル推定装置であって、
    前記事後確率最大化スペクトル推定部が、一つのスカラー変数zとそのスカラー変数に関する指数関数exp(z)と一つのスカラー定数aとの和によって規定される非線形方程式に関して、各短時間フレームnにおける周波数k毎の周波数信号xn,kと前記対数尤度重みwθnと前記状態依存スペクトルモデルΘρに依存して前記スカラー定数aを定めるとともに、前記非線形方程式が0に一致する前記スカラー変数zの値を求め、その求めた前記スカラー変数zと前記周波数信号xn,kと前記対数尤度重みwθnと前記状態依存スペクトルモデルΘρとに基づき、前記推定値ρ^を更新する、
    スペクトル推定装置。
  3. 請求項1または請求項2記載のスペクトル推定装置であって、
    前記対数スペクトルρが取りうる値を規定する事前確率密度関数p(ρ;Θθ,Θρ)が混合ガウス分布に従い、前記状態パラメータθは短時間フレームnにおいてNθ個の有限状態の何れかの状態をとり、前記スペクトル状態モデルΘθは全ての状態iに関する混合比βからなり、前記状態依存スペクトルモデルΘρは全ての状態iに関する全ての周波数kに関する平均μ と分散ξ とからなるものとし、
    前記スペクトル状態推定部は、前記対数尤度重みw
    Figure 0005689844
    または、
    Figure 0005689844
    として推定する、
    スペクトル推定装置。
  4. 請求項1または請求項2記載のスペクトル推定装置であって、
    前記状態パラメータθを前記周波数信号に対応するメル周波数ケプストラム係数cとし、前記状態パラメータの事前確率密度関数p(c;Θθ)として前記メル周波数ケプストラム係数cの混合ガウス分布を用い、jをガウス分布の番号とし、前記スペクトル状態モデルΘθを全てのjに関する混合比γと平均μと共分散行列Σとの集合とし、前記メル周波数ケプストラム係数cから前記推定値ρ^への擬似逆変換を規定する行列A及びベクトルbと、逆変換誤差eがガウス分布に従うと仮定したときの共分散行列Ξとを前記状態依存スペクトルモデルΘρとし、
    前記スペクトル状態推定部は、
    前記メル周波数ケプストラム係数である状態パラメータの推定値c^と前記混合比γと前記平均μと前記共分散行列Σとを用いて、期待値E{j|c^}を
    Figure 0005689844
    として算出する期待値算出部と、
    前記推定値ρ^と前記期待値E{j|c^}と前記行列Aと前記ベクトルbと前記共分散行列Ξと前記平均μと前記共分散行列Σとを用いて、前記状態パラメータである前記メル周波数ケプストラム係数の推定値c^
    Figure 0005689844
    として更新する状態パラメータ更新部と、
    δをディラックデルタ関数とし、前記メル周波数ケプストラム係数である状態パラメータの推定値c^を用いて、前記メル周波数ケプストラム係数である前記状態パラメータの推定値c^に対する対数尤度重みwcn
    Figure 0005689844
    として算出する対数尤度重み算出部とを含み、
    収束条件を満たすまで、前記期待値算出部及び前記状態パラメータ更新部における処理を繰り返す、
    スペクトル推定装置。
  5. 各短時間フレームnにおける周波数信号xのスペクトル値σを推定するスペクトル推定方法であって、
    前記周波数信号xの対数スペクトルρの状態を表す状態パラメータθの事前確率密度関数p(θ;Θθ)に関するモデルパラメータであるスペクトル状態モデルΘθと、前記状態パラメータθが既知の条件下での前記対数スペクトルρの条件付き確率密度関数p(ρ|θ;Θρ)に関するモデルパラメータである状態依存スペクトルモデルΘρとを記憶しておき、
    前記対数スペクトルρ の推定値ρ^、前記スペクトル状態モデルΘθ及び前記状態依存スペクトルモデルΘρを用いて、対数尤度重みwθnを推定するスペクトル状態推定ステップと、
    前記周波数信号x、前記対数尤度重みwθn及び前記状態依存スペクトルモデルΘρを用いて、目的関数を最大化する対数スペクトルを前記推定値ρ^ として求める事後確率最大化スペクトル推定ステップとを含み、
    収束条件を満たすまで、前記スペクトル状態推定ステップ及び事後確率最大化スペクトル推定ステップにおける処理を繰り返す、
    スペクトル推定方法。
  6. 請求項5記載のスペクトル推定方法であって、
    前記事後確率最大化スペクトル推定ステップが、一つのスカラー変数zとそのスカラー変数に関する指数関数exp(z)と一つのスカラー定数aとの和によって規定される非線形方程式に関して、各短時間フレームnにおける周波数k毎の周波数信号xn,kと前記対数尤度重みwθnと前記状態依存スペクトルモデルΘρに依存して前記スカラー定数aを定めるとともに、前記非線形方程式が0に一致する前記スカラー変数zの値を求め、その求めた前記スカラー変数zと前記周波数信号xn,kと前記対数尤度重みwθnと前記状態依存スペクトルモデルΘρとに基づき、前記推定値ρ^を更新する、
    スペクトル推定方法。
  7. 請求項5または請求項6記載のスペクトル推定方法であって、
    前記対数スペクトルρが取りうる値を規定する事前確率密度関数p(ρ;Θθ,Θρ)が混合ガウス分布に従い、前記状態パラメータθは短時間フレームnにおいてNθ個の有限状態の何れかの状態をとり、前記スペクトル状態モデルΘθは全ての状態iに関する混合比βからなり、前記状態依存スペクトルモデルΘρは全ての状態iに関する全ての周波数kに関する平均μ と分散ξ とからなるものとし、
    前記スペクトル状態推定ステップにおいて、前記対数尤度重みw
    Figure 0005689844
    または、
    Figure 0005689844
    として推定する、
    スペクトル推定方法。
  8. 請求項5または請求項6記載のスペクトル推定方法であって、
    前記状態パラメータθを前記周波数信号に対応するメル周波数ケプストラム係数cとし、前記状態パラメータの事前確率密度関数p(c;Θθ)として前記メル周波数ケプストラム係数cの混合ガウス分布を用い、jをガウス分布の番号とし、前記スペクトル状態モデルΘθを全てのjに関する混合比γと平均μと共分散行列Σとの集合とし、前記メル周波数ケプストラム係数cから前記推定値ρ^への擬似逆変換を規定する行列A及びベクトルbと、逆変換誤差eがガウス分布に従うと仮定したときの共分散行列Ξとを前記状態依存スペクトルモデルΘρとし、
    前記スペクトル状態推定ステップは、
    前記メル周波数ケプストラム係数である状態パラメータの推定値c^と前記混合比γと前記平均μと前記共分散行列Σとを用いて、期待値E{j|c^}を
    Figure 0005689844
    として算出する期待値算出ステップと、
    前記推定値ρ^と前記期待値E{j|c^}と前記行列Aと前記ベクトルbと前記共分散行列Ξと前記平均μと前記共分散行列Σとを用いて、前記状態パラメータである前記メル周波数ケプストラム係数の推定値c^
    Figure 0005689844
    として更新する状態パラメータ更新ステップと、
    δをディラックデルタ関数とし、前記メル周波数ケプストラム係数である状態パラメータの推定値c^を用いて、前記メル周波数ケプストラム係数である前記状態パラメータの推定値c^に対する対数尤度重みwcn
    Figure 0005689844
    として算出する対数尤度重み算出ステップとを含み、
    収束条件を満たすまで、前記期待値算出ステップ及び前記状態パラメータ更新ステップにおける処理を繰り返す、
    スペクトル推定方法。
  9. 請求項1から請求項4の何れかに記載のスペクトル推定装置としてコンピュータを機能させるためのプログラム。
JP2012060159A 2012-03-16 2012-03-16 スペクトル推定装置、その方法及びプログラム Active JP5689844B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012060159A JP5689844B2 (ja) 2012-03-16 2012-03-16 スペクトル推定装置、その方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012060159A JP5689844B2 (ja) 2012-03-16 2012-03-16 スペクトル推定装置、その方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2013195511A JP2013195511A (ja) 2013-09-30
JP5689844B2 true JP5689844B2 (ja) 2015-03-25

Family

ID=49394578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012060159A Active JP5689844B2 (ja) 2012-03-16 2012-03-16 スペクトル推定装置、その方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5689844B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6392450B2 (ja) * 2015-04-13 2018-09-19 日本電信電話株式会社 マッチング装置、判定装置、これらの方法、プログラム及び記録媒体
CN113946955B (zh) * 2021-10-14 2023-08-08 西安电子科技大学 基于融合中心反馈信息的多目标贝叶斯波达方向估计方法
CN114444279B (zh) * 2022-01-14 2022-12-16 中国人民解放军国防科技大学 基于卫星低高精度数据关联参数联合估计的响应预测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0895592A (ja) * 1994-09-21 1996-04-12 Nippon Telegr & Teleph Corp <Ntt> パターン認識方法
JPH09198084A (ja) * 1996-01-16 1997-07-31 Nippon Telegr & Teleph Corp <Ntt> モデル更新を伴う話者認識方法及びその装置
JP4977062B2 (ja) * 2008-02-29 2012-07-18 日本電信電話株式会社 残響除去装置とその方法と、そのプログラムと記録媒体
CN101965613B (zh) * 2008-03-06 2013-01-02 日本电信电话株式会社 信号增强装置及方法

Also Published As

Publication number Publication date
JP2013195511A (ja) 2013-09-30

Similar Documents

Publication Publication Date Title
US9721202B2 (en) Non-negative matrix factorization regularized by recurrent neural networks for audio processing
Deng et al. Recursive estimation of nonstationary noise using iterative stochastic approximation for robust speech recognition
CN110914899A (zh) 掩模计算装置、簇权重学习装置、掩模计算神经网络学习装置、掩模计算方法、簇权重学习方法和掩模计算神经网络学习方法
Wang et al. Speaker and noise factorization for robust speech recognition
CN104685562B (zh) 用于从嘈杂输入信号中重构目标信号的方法和设备
US9754608B2 (en) Noise estimation apparatus, noise estimation method, noise estimation program, and recording medium
Deng Front-end, back-end, and hybrid techniques for noise-robust speech recognition
JP2017514249A (ja) 入力信号を変換する方法
Sadhu et al. Continual Learning in Automatic Speech Recognition.
JP4977062B2 (ja) 残響除去装置とその方法と、そのプログラムと記録媒体
CN104737229A (zh) 用于变换输入信号的方法
CN110998723B (zh) 使用神经网络的信号处理装置及信号处理方法、记录介质
JP2010078650A (ja) 音声認識装置及びその方法
Mohammadiha et al. A state-space approach to dynamic nonnegative matrix factorization
JP5689844B2 (ja) スペクトル推定装置、その方法及びプログラム
JPWO2009038013A1 (ja) 雑音除去システム、雑音除去方法および雑音除去プログラム
JP5881454B2 (ja) 音源ごとに信号のスペクトル形状特徴量を推定する装置、方法、目的信号のスペクトル特徴量を推定する装置、方法、プログラム
JPWO2019044401A1 (ja) Dnn音声合成の教師無し話者適応を実現するコンピュータシステム、そのコンピュータシステムにおいて実行される方法およびプログラム
Yao et al. Noise adaptive speech recognition based on sequential noise parameter estimation
JP6711765B2 (ja) 形成装置、形成方法および形成プログラム
Chung et al. Training and compensation of class-conditioned NMF bases for speech enhancement
Wang et al. An explicit independence constraint for factorised adaptation in speech recognition.
JP5172536B2 (ja) 残響除去装置、残響除去方法、コンピュータプログラムおよび記録媒体
Wang et al. Improving reverberant VTS for hands-free robust speech recognition
Sehr et al. Model-based dereverberation in the Logmelspec domain for robust distant-talking speech recognition

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141023

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141224

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150129

R150 Certificate of patent or registration of utility model

Ref document number: 5689844

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150