JP2012044609A - ステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラム - Google Patents

ステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラム Download PDF

Info

Publication number
JP2012044609A
JP2012044609A JP2010186374A JP2010186374A JP2012044609A JP 2012044609 A JP2012044609 A JP 2012044609A JP 2010186374 A JP2010186374 A JP 2010186374A JP 2010186374 A JP2010186374 A JP 2010186374A JP 2012044609 A JP2012044609 A JP 2012044609A
Authority
JP
Japan
Prior art keywords
signal
echo
error
simulation
error signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010186374A
Other languages
English (en)
Other versions
JP5438629B2 (ja
Inventor
Suehiro Shimauchi
末廣 島内
Yoichi Haneda
陽一 羽田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010186374A priority Critical patent/JP5438629B2/ja
Publication of JP2012044609A publication Critical patent/JP2012044609A/ja
Application granted granted Critical
Publication of JP5438629B2 publication Critical patent/JP5438629B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Abstract

【課題】2個のスピーカから再生される音響信号が混合されて一つのマイクロホンに収音される収音信号から、反響信号を精度よく消去する。
【解決手段】第一、第二再生信号を入力とし、第一、第二反響模擬信号を生成する第一、第二適応型模擬反響路101、102と、第一、第二反響模擬信号を加算する加算器103と、加算器103により加算された信号と、全ての収音信号とを入力とし、誤差信号を生成する減算器104と、誤差信号を入力とし、事後確率分布関数を用いて第一誤差信号を推定する第一優ガウスモデル誤差配分手段205と、誤差信号と、第一誤差信号とを入力とし、誤差信号から第一誤算信号を減算して第二誤差信号を生成する第二優ガウスモデル誤差配分手段と、第一、第二模擬特性と、第一、第二再生信号と、第一、第二誤差信号とを入力とし、第一、第二模擬特性を更新する第一、第二更新手段107、108とを有する。
【選択図】図3

Description

本発明は2個のスピーカから再生される音響信号が混合されて少なくとも一つのマイクロホンに収音される収音信号から反響信号を消去するステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラムに関する。
図1、図2を参照して、ステレオ音声などを再生可能な2つのスピーカから反響を消去する従来のステレオ反響消去装置100について説明する。従来のステレオ反響消去装置100は、第一適応型模擬反響路101と、第二適応型模擬反響路102と、加算器103と、減算器104と、第一信号電力加重誤差配分手段105と、第二信号電力加重誤差配分手段106と、第一更新手段107と、第二更新手段108とを備える。なお、図1は収音チャネルが1チャネルである場合のステレオ反響消去装置100の構成を図示している。収音チャネルが複数存在する場合には、ステレオ反響消去装置100は、各マイクロホンにつき1組ずつ101〜108を備えるものとする。第一適応型模擬反響路101は、第一スピーカ93とマイクロホン95間の第一反響路91のインパルス応答に相当する有限長のベクトルH1を模擬する第一模擬特性Hm1(k)を保持する。第二適応型模擬反響路102は、第二スピーカ94とマイクロホン95間の第二反響路92のインパルス応答に相当する有限長のベクトルH2を模擬する第二模擬特性Hm2(k)を保持する。ここで変数kを、離散時間を表す正の値として以後の説明に用いる。ただし変数kは、入出力信号が周波数分割され、分割された各周波数帯域信号が間引きされた場合は、間引きされた間隔における離散時間を表す。第一再生信号x1(k)は、第一反響路91を経由して、第一反響信号d1(k)として、マイクロホン95に収音される。第二再生信号x2(k)は、第二反響路92を経由して、第二反響信号d2(k)として、マイクロホン95に収音される。第一反響信号d1(k)と第二反響信号d2(k)とは、マイクロホン95に収音される際に混合される。第一適応型模擬反響路101は、第一再生信号x1(k)を入力として、入力された第一再生信号x1(k)と第一模擬特性Hm1(k)との畳み込みに相当する演算により、第一模擬反響信号dm1(k)を生成する(S101)。同様に、第二適応型模擬反響路102は、第二再生信号x2(k)を入力として、入力された第二再生信号x2(k)と第二模擬特性Hm2(k)との畳み込みに相当する演算により、第二模擬反響信号dm2(k)を生成する(S102)。加算器103は、第一模擬反響信号dm1(k)および第二模擬反響信号dm2(k)を入力とし、入力された第一模擬反響信号dm1(k)と第二模擬反響信号dm2(k)とを加算する(S103)。減算器104は、第一反響信号d1(k)および第二反響信号d2(k)を含むマイクロホン95の収音信号y(k)と第一模擬反響信号dm1(k)と第二模擬反響信号dm2(k)を入力とし、収音信号y(k)から第一模擬反響信号dm1(k)および第二模擬反響信号dm2(k)を減算して、誤差信号e(k)を生成する(S104)。なお、誤差信号e(k)はステレオ反響消去装置100の出力信号でもある。加算器103と減算器104は、加算器と減算器双方の機能を備える1の演算器にて代替することができる。第一信号電力加重誤差配分手段105は、第一再生信号x1(k)と、第二再生信号x2(k)と、誤差信号e(k)とを入力とし、後述の(式5)により第一誤差信号e1(k)を推定する(S105)。同様に、第二信号電力加重誤差配分手段106は、第一再生信号x1(k)と、第二再生信号x2(k)と、誤差信号e(k)とを入力とし、後述の(式6)により第二誤差信号e2(k)を推定する(S106)。第一更新手段107は、第一模擬特性Hm1(k)と、第一再生信号x1(k)と、第一誤差信号e1(k)とを入力とし、第二更新手段108は、第二模擬特性Hm2(k)と、第二再生信号x2(k)と、第二誤差信号e2(k)とを入力とし、離散時間k+1における第一模擬特性Hm1(k+1)、第二模擬特性Hm2(k+1)をそれぞれ
Figure 2012044609
と更新する(S107、S108)。ここで、X1(k)=[x1(k),x1(k−1),…,x1(k−L+1)]T、X2(k)=[x2(k),x2(k−1),…,x2(k−L+1)]Tであり、μは更新量を調整する正の数、||X||はベクトルXのノルム、自然数Lは有限長であるベクトルの長さ、Tはベクトルの転置を表す。以後、離散時間k+1,k+2,…において上述の処理が繰り返される(S109〜)。
第一誤差信号e1(k)および第二誤差信号e2(k)は、それぞれ
e1(k)=d1(k)-dm1(k) (式3)
e2(k)=d2(k)-dm2(k) (式4)
と与えるのが理想であるが、例えマイクロホン95の収音信号y(k)が反響信号以外の信号を含まなかったとしても,実際に観測できる信号は、d1(k)とd2(k)の混合信号であるy(k)=d1(k)+d2(k)であり、d1(k)とd2(k)を個別に観測することができず、(式3)、(式4)に基づき、第一誤差信号e1(k)、第二誤差信号e2(k)を直接的に計算することはできない。そこで、前述の第一信号電力加重誤差配分手段105および第二信号電力加重誤差配分手段106は、観測可能な観測誤差信号e(k)=y(k)−[dm1(k)+dm2(k)]から、e1(k)、e2(k)の推定値を求める。具体的には、第一信号電力加重誤差配分手段105および第二信号電力加重誤差配分手段106は、e1(k)、e2(k)の推定値をそれぞれ、
Figure 2012044609
として演算する。これは、第一再生信号x1(k)および第二再生信号x2(k)の電力に相当する量により重み付けを行い、e(k)をe1(k)、e2(k)に配分していることに相当する。ここで、分母の||X1(k)||2+||X2(k)||2に、零除算防止を目的とした小さい正の実数を加えることもできる。なお、このような特性更新は、特許文献1記載の方式における2チャンネルの場合の特性更新と等価である。
特開昭61−072420号公報
従来技術において(式5)(式6)により与えられる第一誤差信号e1(k)、第二誤差信号e2(k)は、誤差信号の振幅値の分布がガウス分布に従うものと仮定したとき最適な推定値であると統計学的に解釈できる。しかし、音声信号に基づく反響信号より得られる誤差信号の振幅値の分布はガウス分布よりも0近傍に鋭いピークを持つ優ガウス的な分布を取る場合が多い。このため、e1(k)、e2(k)の推定値を求める際に、e1(k)、e2(k)が優ガウス分布に従うものとして推定値を求めることが出来れば、e1(k)、e2(k)の推定精度が高くなると考えられる。言い換えればe1(k)、e2(k)の推定値の精度の向上は、推定値を与えるときに仮定した誤差信号の統計モデルと、実際の誤差信号の振る舞いが近似しているほど顕著となる。e1(k)、e2(k)の推定精度が高くなれば、第一模擬特性Hm1(k)および第二模擬特性Hm2(k)の模擬精度も向上し、その結果として、反響消去の性能が向上する。しかしながら、そもそも第一再生信号x1(k)と第二再生信号x2(k)には、共通の音源から得られたものである場合など強く固定の相互相関が存在している場合が多い。従って、この場合には第一誤差信号e1(k)と第二誤差信号e2(k)にも強い相互相関が存在する。従来、信号の統計モデルに着目して信号を分離するアプローチは、ステレオ反響消去の問題のように互いに相互相関の強い信号の分離には適さないと考えられていたが、理論的な前提との乖離がある場合の実用上の効果の有無については、これまで十分な議論がなされておらず、統計学的な視点からこの問題に取組むことの意義はまだ残されている。本発明は、ステレオ反響消去装置の反響消去性能を向上させることを目的とする。
本発明のステレオ反響消去装置は、第一適応型模擬反響路と、第二適応型模擬反響路と、加算器と、減算器と、第一優ガウスモデル誤差配分手段と、第二優ガウスモデル誤差配分手段と、第一更新手段と、第二更新手段とを備える。第一適応型模擬反響路は、第一反響路H1の模擬特性Hm1(k)を有し、第一再生信号x1(k)を入力とし、第一反響信号d1(k)を模擬する第一反響模擬信号dm1(k)を生成する。第二適応型模擬反響路は、第二反響路H2の模擬特性Hm2(k)を有し、第二再生信号x2(k)を入力とし、第二反響信号d2(k)を模擬する第二反響模擬信号dm2(k)を生成する。加算器は、第一反響模擬信号dm1(k)と、第二反響模擬信号dm2(k)とを加算する。減算器は、加算ステップにより加算された信号dm1(k)+dm2(k)と、全ての収音信号y(k)とを入力とし、全ての収音信号y(k)から加算された信号dm1(k)+dm2(k)を減算して誤差信号e(k)を生成する。第一優ガウスモデル誤差配分手段は、誤差信号e(k)を入力とし、e1(k)とe2(k)の事前確率分布が優ガウス分布であるとして得られるe1(k)の事後確率分布を用いて第一誤差信号e1(k)を推定する。第二優ガウスモデル誤差配分手段は、誤差信号e(k)を入力とし、e1(k)とe2(k)の事前確率分布を優ガウス分布として得られるe2(k)の事後確率分布を用いて第二誤差信号e2(k)を推定する。第一誤差信号e1(k)、第二誤差信号e2(k)のいずれかは、誤差信号e(k)から既に推定された他方(第一誤差信号e1(k)、第二誤差信号e2(k)のいずれか)を差し引くことにより、例えば、e2(k)=e(k)-e1(k)のように、生成してもよい。第一更新手段は、第一模擬特性Hm1(k)と、第一再生信号x1(k)と、第一誤差信号e1(k)とを入力とし、離散時間kにおける第一模擬特性Hm1(k)を離散時間k+1における第一模擬特性Hm1(k+1)に更新する。第二更新手段は、第二模擬特性Hm2(k)と、第二再生信号x2(k)と、第二誤差信号e2(k)とを入力とし、離散時間kにおける第二模擬特性Hm2(k)を離散時間k+1における第二模擬特性Hm2(k+1)に更新する。
本発明のステレオ反響消去装置によれば、観測誤差信号をe(k)とし、混合して観測される第一誤差信号をe1(k)、第二誤差信号をe2(k)としたときの第一誤差信号e1(k)がとる値の事後確率P(e1(k)|e(k))の分布を計算する際、第一誤差信号e1(k)および第二誤差信号e2(k)の事前確率分布が優ガウス分布に従うものとして推定することにより、第一誤差信号と第二誤差信号の推定精度が向上するため、第一模擬特性Hm1(k)および第二模擬特性Hm2(k)の模擬精度が向上し、音声通話時の反響消去の性能を高めることができる。
従来のステレオ反響消去装置の構成例を示すブロック図。 従来のステレオ反響消去装置の動作例を示すフローチャート。 本発明の実施例1に係るステレオ反響消去装置の構成例を示すブロック図。 本発明の実施例1に係るステレオ反響消去装置の動作例を示すフローチャート。 本発明の実施例1の変形例1に係るステレオ反響消去装置の動作例を示すフローチャート。 本発明の実施例1の変形例2に係るステレオ反響消去装置の動作例を示すフローチャート。 本発明の実施例1の変形例3に係るステレオ反響消去装置の動作例を示すフローチャート。 本発明の実施例2に係るステレオ反響消去装置の構成例を示すブロック図。 本発明の実施例2に係るステレオ反響消去装置の動作例を示すフローチャート。 本発明の実施例3に係るステレオ反響消去装置の構成例を示すブロック図。 本発明の実施例3に係るステレオ反響消去装置の動作例を示すフローチャート。 本発明の実施例4に係るステレオ反響消去装置の構成例を示すブロック図。 本発明の実施例4に係るステレオ反響消去装置の動作例を示すフローチャート。 本発明の実施例5に係るステレオ反響消去装置の構成例を示すブロック図。 本発明の実施例5に係るステレオ反響消去装置の動作例を示すフローチャート。 本発明の実施例6に係るステレオ反響消去装置の構成例を示すブロック図。 本発明の実施例6に係るステレオ反響消去装置の動作例を示すフローチャート。 本発明の実施例7に係るステレオ反響消去装置の構成例を示すブロック図。 本発明の実施例7に係るステレオ反響消去装置の動作例を示すフローチャート。 本発明の実施例8に係るステレオ反響消去装置の構成例を示すブロック図。 本発明の実施例8に係るステレオ反響消去装置の動作例を示すフローチャート。 従来のステレオ反響消去装置の収束特性と本発明の実施例1の変形例3におけるステレオ反響消去装置の収束特性を比較して示す図。 従来のステレオ反響消去装置の収束特性と本発明の実施例1の変形例3と実施例2とを組み合わせたステレオ反響消去装置の収束特性を比較して示す図。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
以下、図3、4を参照して本発明の実施例1に係るステレオ反響消去装置200について説明する。図3は、本発明の実施例1に係るステレオ反響消去装置200の構成例を示すブロック図である。図4は、本発明の実施例1に係るステレオ反響消去装置200の動作例を示すフローチャートである。本発明の実施例1にかかるステレオ反響消去装置200は、第一適応型模擬反響路101と、第二適応型模擬反響路102と、加算器103と、減算器104と、第一優ガウスモデル誤差配分手段205と、第二優ガウスモデル誤差配分手段206と、第一更新手段107と、第二更新手段108とを備える。第一適応型模擬反響路101、第二適応型模擬反響路102、加算器103、減算器104、第一更新手段107、第二更新手段108は図1に示す従来のステレオ反響消去装置100のそれらと同一の機能を有しているため説明を割愛し、第一優ガウスモデル誤差配分手段205と、第二優ガウスモデル誤差配分手段206のみを詳細に説明する。第一優ガウスモデル誤差配分手段205は、事後確率分布における最頻値から第一誤差信号e1(k)を推定することを特徴とする。
第一誤差信号e1(k)、第二誤差信号e2(k)が、音声信号等の優ガウス的な振幅分布に従うものとしたとき、それらの和信号である観測誤差信号e(k)(=e1(k)+e2(k))が観測されたとき、e1(k),e2(k)がとる値の事後確率をP(e1,e2|e)とすると、ベイズの公式より、
Figure 2012044609
なる関係が得られる。ここで、離散時間kの表記は省略した。なお、離散時間kについては数式を分かりやすく表現するため今後も適宜省略するものとする。また、e=e1+e2より、P(e-e1-e2)=P(0)=1とした。事前確率P(e1)、P(e2)は、それぞれ優ガウス的な確率分布に従うとして、
Figure 2012044609
と与える。ここで、p=2、q=2と置けば、e1,e2ともにそれらの振幅値の分布がガウス分布に従うことに相当する。本発明では、0<p<2、0<q<2の範囲で、p、qを選定することにより、優ガウス分布を仮定する。ここで、e=e1+e2なる関係があるため、e1、e2のどちらか一方の推定値が確定すれば、他方の推定値も必然的に与えられる。そこで、まず、e1について、上記の優ガウス分布モデルにおいて最適な推定値を導出することを考える。(式7)において、P(e1,e2|e)=P(e1|e)=P(e2|e)であることに注意すると、(式8)、(式9)を用いて、
Figure 2012044609
なる関係が得られる。(式10)は、eが観測されたという条件のもと、e1の値が取り得る確率を表す。適切なe1の推定値を得るために、実施例1では、事後確率P(e1|e)の分布における最頻値として与えられる値をe1の推定値とする。事後確率P(e1|e)の分布における最頻値を求めることは、(式10)の最大値を与えるe1を求めることに相当する。これは、(式10)の対数を取ることで、
Figure 2012044609
の最大値を与えるe1を求めることと等価である。
対象とする音声信号の振幅値のヒストグラムを事前に測定することにより、振幅値の分布形状に相応しいp,qの値を予め設定することで、f(e1)のe1についての微分f'(e1)=0を与えるe1の値として、(式11)の最大値を与えるe1(すなわち最頻値)を、解析的または数値演算的に計算できる。なお、e2については、e2=e-e1と計算できる。例えば、p=q=1の場合、a1>a2のときは、e1=e(すなわちe2=0)。a1<a2のときは、e1=0(すなわちe2=e)が最頻値に基づく推定値となる。従って、本発明の実施例1にかかるステレオ反響消去装置200の第一優ガウスモデル誤差配分手段205は、誤差信号e(k)を入力とし、0<p<2、0<q<2を満たすように予め定めたpとq、および予め定めたa1とa2により(式11)の最大値を求め、この最大値を最頻値としてe1を推定する(S205a)。第二優ガウスモデル誤差配分手段206は、誤差信号e(k)と、ステップ205aで求められた第一誤差信号e1(k)とを入力とし、e(k)からe1(k)を減算して第二誤差信号e2(k)を計算する(S206)。
[変形例1]
次に図3、図5を参照して本発明の実施例1の変形例1に係るステレオ反響消去装置200’について説明する。実施例1と変形例1とでは、第一優ガウスモデル誤差配分手段が行う計算のみが異なるため、変形例1の構成例を示すブロック図として図3のブロック図を流用し、第一優ガウスモデル誤差配分手段205’として説明を進める。図5は、変形例1に係るステレオ反響消去装置200’の動作例を示すフローチャートである。変形例1は第一優ガウスモデル誤差配分手段205’が事後確率P(e1|e)の分布における期待値からe1を推定することを特徴とする。
事後確率P(e1|e)の分布における期待値を求めることは、(式10)に基づき、
Figure 2012044609
を解析的または数値演算的に計算することに相当する。ここで得られたE[e1]がe1の推定値となる。例えば、p=q=1においては、解析的に、
Figure 2012044609
と求めることができる。また、このときのe2=e-e1と計算できる。従って、第一優ガウスモデル誤差配分手段205’は、誤差信号e(k)を入力とし、0<p<2、0<q<2を満たすように予め定めたpとq、および予め定めたa1とa2により(式12)を解析的または数値演算的に計算して、得られたE[e1]をe1の推定値とする(S205b)。
[変形例2]
次に図3、図6を参照して本発明の実施例1の変形例2に係るステレオ反響消去装置200’’について説明する。実施例1と変形例2とでは、第一優ガウスモデル誤差配分手段が行う計算のみが異なるため、変形例2の構成例を示すブロック図として図3のブロック図を流用し、第一優ガウスモデル誤差配分手段205’’として説明を進める。図6は、変形例1に係るステレオ反響消去装置200’’の動作例を示すフローチャートである。変形例2は第一優ガウスモデル誤差配分手段205’’が事後確率P(e1|e)の分布における中央値からe1を推定することを特徴とする。
事後確率P(e1|e)の分布における中央値を求めることは、(式10)に基づき、
Figure 2012044609
を満足するαの値を求めることに相当するため、αの値を解析的または数値演算的に求め、αをe1の推定値とする。
例えば、p=q=1においては、解析的に、
Figure 2012044609
と求めることができる。また、このときのe2=e-e1と計算できる。従って、第一優ガウスモデル誤差配分手段205’’は、誤差信号e(k)を入力とし、0<p<2、0<q<2を満たすように予め定めたpとq、および予め定めたa1とa2により(式15)を満足するαの値を解析的または数値演算的に計算して、得られたαをe1の推定値とする(S205c)。
[変形例3]
次に図3、図7を参照して本発明の実施例1の変形例3に係るステレオ反響消去装置200’’’について説明する。実施例1と変形例3とでは、第一優ガウスモデル誤差配分手段が行う計算のみが異なるため、変形例3の構成例を示すブロック図として図3のブロック図を流用し、第一優ガウスモデル誤差配分手段205’’’として説明を進める。図7は、変形例3に係るステレオ反響消去装置200’’’の動作例を示すフローチャートである。変形例3では第一優ガウスモデル誤差配分手段205’’’が第一再生信号x1(k)と第二再生信号x2(k)との相互相関に基づいて、事後確率P(e1|e)の分布における最頻値、期待値、中央値のいずれか一つを選択して第一誤差信号e1(k)の推定値とすることを特徴とする。
事後確率P(e1|e)の分布における最頻値として与えられるe1の値(便宜上e1Aと置く)と、期待値として与えられるe1の値(便宜上e1Bと置く)、中央値として与えられるe1の値(便宜上e1Cと置く)は、一般にそれぞれ異なる。e1Aの値は、e1B、e1Cの値と比較し、少ない演算量で計算できる利点がある一方、実際の信号と事前に与える統計モデルとの差異が大きい場合等での推定誤りが顕著となる欠点もある。例えば、再生信号x1とx2の相互相関が高く、e1とe2の独立性が低い場合、e1Aの推定誤りがe1B、e1Cと比べて顕著となる。そこで、再生信号x1とx2の相互相関等を計算することで、e1とe2の独立性を評価し、独立性が高い(例えば再生信号x1とx2の相互相関が低い)場合に、e1Aを推定値として採用し、独立性が低い(例えば再生信号x1とx2の相互相関が高い)場合に、e1Bまたはe1Cを推定値として採用することで、演算量と推定精度の両面からより適切な推定値を選定する。従って、第一優ガウスモデル誤差配分手段205’’’は、第一再生信号x1(k)と第二再生信号x2(k)との相互相関に基づいて、相互相関の大きさが小さい場合は、事後確率P(e1|e)の分布における最頻値を選択し、相互相関の値が大きくなるに従い、中央値、期待値の順に切り替えて選択して前記第一誤差信号e1(k)の推定値とする(S205d)
このように、実施例1、変形例1、変形例2、変形例3では事後確率P(e1|e)の分布から、第一誤差信号e1(k)を求める具体的な方法を例示したが、本発明ではこれに限られず事後確率P(e1|e)の分布から他の任意の統計学的手法により、第一誤差信号e1(k)を推定することが可能である。
<パラメータa1、a2の与え方>
次に、前述の(式10)などにおけるパラメータa1,a2の求め方について説明する。(式10)において、パラメータa1,a2の値は、事前に固定値を与えてもよいが、以下のように、第一再生信号x1(k)および第二再生信号x2(k)、第一模擬反響信号dm1(k)および第二模擬反響信号dm2(k)、観測誤差信号e(k)のうちの少なくともいずれかの値に基づき、遂次計算してもよい。
第一再生信号x1(k)および第二再生信号x2(k)に基づく計算方法としては、
Figure 2012044609
のように再生信号ベクトルのノルムを用いることができる。ここで、β1、β2は、正の定数としてあらかじめ与える調整係数である。
また、
Figure 2012044609
としてもよい。
第一模擬反響信号dm1(k)および第二模擬反響信号dm2(k)に基づく計算方法としては、
a1=γ1×|dm1(k)|p (式22)
a2=γ2×|dm2(k)|q (式23)
とするほか、
a1=γ1×smooth(|dm1(k)|p) (式24)
a2=γ2×smooth(|dm2(k)|q) (式25)
のように、短時間平均を実行するsmooth関数を適用してもよい。ここで、γ1、γ2は、正の定数としてあらかじめ与える調整係数である。
さらに、上記をまとめて組合せることで、
Figure 2012044609
としてもよい。ここで、調整係数のβ3、β5、γ3、γ5のうち、少なくとも1つは正の値をとり、残りの値は零を選ぶことができる。(式26)において1つの調整係数のみ正の値を与え、残り3つの調整係数を零とした場合は、(式18)、(式20)、(式22)、(式24)のいずれかの計算結果と等価であり、他方、複数の調整係数を非零にすることで、任意の複数の要素を任意の配分で組合せたりすることも可能である。また、β4、β6、γ4、γ6についても同様であるが、β3=0の場合はβ4=0、β5=0の場合はβ6=0、γ3=0の場合はγ4=0、γ5=0の場合はγ6=0とする。ゼロの係数が乗じられる要素については、その計算を省略することができる。
観測誤差信号e(k)の大きさを考慮して、(式18)から(式25)の計算を含む一般化された計算式である(式26)、(式27)について、(式26)により得られたa1の値をa1'、(式27)により得られたa2の値をa2'として、
Figure 2012044609
とパラメータを計算してもよい。
なお、理想的なa1、a2が、
a1=p×E[|e1|p] (式32)
a2=q×E[|e2|q] (式33)
に相当することから、調整係数β1〜β8、γ1〜γ6の値は、p=qの場合は、β1=β2、β3=β4、β5=β6、β7=β8、γ1=γ2、γ3=γ4、γ5=γ6とすべきであり、p≠qの場合は、β1=β2×(p/q)、β3=β4×(p/q)、β5=β6×(p/q)、β7=β8×(p/q)、γ1=γ2×(p/q)、γ3=γ4×(p/q)、γ5=γ6×(p/q)とすべきである。また、第一再生信号x1(k)および第二再生信号x2(k)、第一模擬反響信号dm1(k)および第二模擬反響信号dm2(k)、観測誤差信号e(k)の大きさと、第一誤差信号e1(k)、第二誤差信号e2(k)の大きさとのレベル差を補正するように与えることで、より精度の高いa1、a2を与えることが可能となるが、前述の実施例1における、p=q=1の場合のように、a1とa2の大小比較さえできればよい場合には、β1=β2、β3=β4、β5=β6、β7=β8、γ1=γ2、γ3=γ4、γ5=γ6の条件さえ満足されれば、それらの値の絶対的な大きさは任意である。
<パラメータa1、a2の与え方の説明終わり>
次に、図8、図9を参照して本発明の実施例2に係るステレオ反響消去装置300について説明する。図8は、実施例2に係るステレオ反響消去装置300の構成例を示すブロック図である。図9は実施例2に係るステレオ反響消去装置300の動作例を示すフローチャートである。実施例2のステレオ反響消去装置300は、線形変換手段309を備え、線形変換手段309の動作(S309)により、模擬反響信号を生成するステップ(S101)、(S102)および、誤差信号を推定するステップ(S205)、(S206)、模擬反響路を更新するステップ(S107)、(S108)等、再生信号x1(k)、x2(k)の値を必要とするステップにおいては、再生信号x1(k)、x2(k)の代わりに線形変換された再生信号x1'(k)、x2'(k)の値が用いられることを特徴とする。線形変換手段309を有し、ステップ309が行われることのみが実施例1のステレオ反響消去装置200との相違点である。線形変換手段309は、ステレオ反響消去装置に用いられる第一再生信号x1(k)と第二再生信号x2(k)とを予め線形変換することを特徴とする(S309)。
具体的には、再生信号x1(k)、x2(k)をベクトルとして[x1(k),x2(k)]Tとしたとき、m1*m4-m2*m3≠0の条件のもと、線形変換手段309において、
Figure 2012044609
という線形変換を与え、変換されたx1'(k)、x2'(k)に対応した第一模擬特性Hm1'(k)および第二模擬特性Hm2'(k)を
Figure 2012044609
として計算する。ただし、X1'(k)=[x1'(k),x1'(k-1),…,x1'(k-L+1)]T、X2'(k)=[x2'(k),x2'(k-1),…,x2'(k-L+1)]Tである。この場合、x1'(k)、x2'(k)に対応した第一模擬反響信号dm1'(k)および第二模擬反響信号dm2'(k)を
dm1'(k)=Hm1'(k)TX1'(k) (式37)
dm2'(k)=Hm2'(k)TX2'(k) (式38)
と計算し、マイクロホン収音信号y(k)からdm1'(k)とdm2'(k)を差し引くことで、反響消去を実現することができる。ここで、(式35)、(式36)で用いられる変換された第一誤差信号e1'(k)、第二誤差信号e2'(k)の推定値は、変換された第一再生信号x1'(k)および第二再生信号x2'(k)と、それらに基づき計算された第一模擬反響信号dm1'(k)および第二模擬反響信号dm2'(k)と、観測誤差信号e'(k)のうちの少なくともいずれかの値に基づき、上記の<パラメータa1、a2の与え方>に記載したようにa1、a2を計算した結果をもとに得ることができる。
次に、図10、図11を参照して本発明の実施例3に係るステレオ反響消去装置400について説明する。図10は、実施例3に係るステレオ反響消去装置400の構成例を示すブロック図である。図11は実施例3に係るステレオ反響消去装置400の動作例を示すフローチャートである。実施例3のステレオ反響消去装置400は、線形変換手段410を備え、線形変換手段410の動作(S410)が少なくとも誤差信号を推定するステップ(S205)、(S206)より以前に実行され、誤差信号を推定するステップ(S205)、(S206)および、模擬反響路を更新するステップ(S407)(S408)において、線形変換された再生信号x1'(k)、x2'(k)の値を利用可能としたことを特徴とする。ただし、模擬反響信号を生成するステップ(S101)、(S102)において、線形変換された再生信号x1'(k)、x2'(k)の値は用いず、線形変換されていない再生信号x1(k)、x2(k)の値を用いる。また、実施例3のステレオ反響消去装置400は、第一更新手段407と、第二更新手段408とを備えることを特徴とする。第一更新手段407、第二更新手段408、線形変換手段410を有し、ステップ407、408、410が行われることのみが実施例1のステレオ反響消去装置200との相違点である。線形変換手段410は、実施例1のステップ205の第一誤差信号e1'(k)の推定に用いられる第一再生信号x1(k)と第二再生信号x2(k)とを予め線形変換することを特徴とする(S410)。第一更新手段407と、第二更新手段408は、線形変換手段410がおこなう線形変換の影響も含めて模擬特性Hm1(k)、Hm2(k)を更新する(S407、S408)。
具体的には、第一更新手段407、第二更新手段408は(式35)、(式36)に基づき更新された第一模擬特性Hm1'(k)および第二模擬特性Hm2'(k)それぞれのi番目の要素を、hm1'(i)とhm2'(i)とおき、
Figure 2012044609
なる線形変換により与えられるhm1(i)とhm2(i)を、それぞれi番目の要素として第一模擬特性Hm1(k)および第二模擬特性Hm2(k)が持つように線形変換の影響も含めて模擬特性を更新する。あるいは、(式35)、(式36)に基づく第一模擬特性Hm1'(k)および第二模擬特性Hm2'(k)の更新を経ることなく、直接的に、
Figure 2012044609
と更新することによっても、線形変換の影響も含めて模擬特性の更新が可能である。
さらに、第一適応型模擬反響路101及び第二適応型模擬反響路102は、
dm1(k)=Hm1(k)TX1(k) (式40)
dm2(k)=Hm2(k)TX2(k) (式41)
と、線形変換されていない第一再生信号x1(k)、第二再生信号x2(k)に基づき、第一模擬反響信号dm1(k)および第二模擬反響信号dm2(k)を得(S101、S102)、マイクロホン収音信号y(k)からdm1(k)とdm2(k)を差し引く(S104)ことで、反響消去を実現することができる。
なお、図8の構成(実施例2)は、m1,m2,m3,m4の値が時不変の場合に適しており、図10の構成(実施例3)は、m1,m2,m3,m4の値が時変の場合に適している。線形変換行列の例としては、
Figure 2012044609
等があるが、一般には、m1*m4-m2*m3≠0を満足するいかなる線形変換を適用した場合でも、本発明による、第一誤差信号e1'(k)、第二誤差信号e2'(k)の推定精度が向上する効果が損なわれることはない。ただし、変換前の第一再生信号x1(k)、第二再生信号x2(k)の間の相互相関よりも、変換されたx1'(k)、x2'(k)の間の相互相関が小さくなるほど、推定精度改善の効果は高くなる。
なお、実施例2および実施例3において、線形変換されたことを示す記号「’」については以下の実施例の説明においては、図や説明を分かりやすくするため適宜省略するものとする。
次に、図12、図13を参照して本発明の実施例4に係るステレオ反響消去装置500について説明する。図12は、実施例4に係るステレオ反響消去装置500の構成例を示すブロック図である。図13は実施例4に係るステレオ反響消去装置500の動作例を示すフローチャートである。実施例4のステレオ反響消去装置500は、周波数分割手段511を備え、周波数分割手段511の動作(S511)が、再生信号x1(k)、x2(k)の値を必要とする全てのステップの前段に行われることを特徴とする。また、実施例4のステレオ反響消去装置500は、周波数分割手段512を備え、周波数分割手段512の動作(S512)が実施例1のステップ109より前に行われることを特徴とする。また、実施例4のステレオ反響消去装置500は、周波数合成手段513を備え、周波数合成手段513の動作(S513)が実施例1のステップ104より後に行われることを特徴とする。ただし、誤差信号を推定するステップ(S205)(S206)では、周波数合成されていない誤差信号e(k)の値を用い、周波数合成されていない第一誤差信号e1(k),第二誤差信号e2(k)の推定値を生成する。また、模擬反響路を更新するステップ(S107)(S108)においても、周波数合成されていない第一誤差信号e1(k),第二誤差信号e2(k)の推定値を用いて更新を行う。周波数分割手段511、周波数分割手段512、周波数合成手段513を有し、ステップ511、512、513が行われることのみが実施例1のステレオ反響消去装置200との相違点である。周波数分割手段511は、ステレオ反響消去装置500に用いられる第一再生信号x1(k)と第二再生信号x2(k)とを予め周波数帯域に分割することを特徴とする(S511)。周波数分割手段512は、収音信号y(k)を予め周波数帯域に分割することを特徴とする(S512)。周波数合成手段513は、周波数帯域の合成により、出力信号e(k)を生成することを特徴とする(S513)。
具体的には、本実施例においては第一誤差信号e1(k)、第二誤差信号e2(k)の推定は、FFTやフィルタバンク等の周波数分割手段を用いて、周波数帯域ω毎に分割して実行される。周波数分割手段511から、周波数帯域ω毎に再生信号x1(k,ω)、x2(k,ω)を受取り、周波数分割手段512から、周波数帯域毎にマイクロホン収音信号y(k,ω)を受取り、周波数ω毎に、上記と同様な、第一誤差信号と第二誤差信号の推定を行い、周波数毎に反響消去を行い、ステレオ反響消去装置の内部または外部における周波数合成手段513にて、出力信号e(k)を再構成することができる。なお、図12のブロック図、図13のフローチャートでは周波数帯域ωの表記を省略した。なお、周波数帯域ωについては今後も適宜省略するものとする。
次に、図14、図15を参照して本発明の実施例5に係るステレオ反響消去装置600について説明する。図14は、実施例5に係るステレオ反響消去装置600の構成例を示すブロック図である。図15は実施例5に係るステレオ反響消去装置600の動作例を示すフローチャートである。実施例5のステレオ反響消去装置600は、周波数分割手段511を備え、周波数分割手段511の動作(S511)により、模擬反響信号を生成するステップ(S101)、(S102)および、誤差信号を推定するステップ(S205)、(S206)、模擬反響路を更新するステップ(S107)、(S108)等、再生信号x1(k)、x2(k)の値を必要とするステップにおいては、再生信号x1(k)、x2(k)の代わりに、周波数分割手段により、周波数ω毎に分割された再生信号x1(k,ω)、x2(k,ω)の値が用いられることを特徴とする。また、実施例5のステレオ反響消去装置600は、周波数合成手段614を備え、周波数合成手段614の動作(S614)が実施例1のステップ104の前段であって、ステップ103の後段でdm1(k,ω)とdm2(k,ω)の加算結果を周波数合成して、dm1(k)+dm2(k)を得るか、ステップ101または102実行後、ステップ103の前段において、dm1(k,ω)、dm2(k,ω)を加算前に個別に周波数合成し、dm1(k)、dm2(k)を個別に得、その後、ステップ103を実行して、dm1(k)+dm2(k)を得るか、の何れかを実行することにより、ステップ104において、周波数合成された信号を用いて減算処理が行われることを特徴とする。また、実施例5のステレオ反響消去装置600は、周波数分割手段615を備え、周波数分割手段615の動作(S615)が実施例1のステップ205の前段であってかつステップ104の後段に行われることを特徴とする。周波数分割手段511、周波数合成手段614、周波数合成手段615を有し、ステップ511、614、615が行われることが実施例1のステレオ反響消去装置200との相違点である。周波数分割手段511は、ステレオ反響消去装置600に用いられる第一再生信号x1(k)と第二再生信号x2(k)とを予め周波数帯域に分割することを特徴とする(S511)。周波数合成手段614は、周波数帯域の合成により、第一模擬反響信号dm1(k)および第二模擬反響信号dm2(k)の加算信号を生成することを特徴とする(S614)。周波数分割手段615は、誤差信号e(k)を周波数帯域に分割することを特徴とする(S615)。周波数合成手段614により、周波数帯域毎に得られた模擬反響信号を、全帯域信号として再合成し、観測誤差信号e(k)を周波数分割前に計算し、周波数分割手段615により、周波数分割することで、第一誤差信号と第二誤差信号の推定を周波数帯域毎に実施することができる。
次に、図16、図17を参照して本発明の実施例6に係るステレオ反響消去装置700について説明する。図16は、実施例6に係るステレオ反響消去装置700の構成例を示すブロック図である。図17は実施例6に係るステレオ反響消去装置700の動作例を示すフローチャートである。実施例6に係るステレオ反響消去装置700は、実施例5の周波数分割(合成)手段を有する構成に実施例2の線形変換手段を組み合わせた例である。本実施例では実施例5と実施例2を組み合わせたが、実施例4と実施例2を組み合わせても良い。実施例6のステレオ反響消去装置700は、線形変換手段309と周波数分割手段511を備え、線形変換手段309の動作(S309)により、再生信号x1(k)、x2(k)の代わりに線形変換された再生信号x1'(k)、x2'(k)の値を以降のステップで用いる点のみが、実施例5のステレオ反響消去装置600との相違点である。この構成は、全ての周波数帯域において等しく時不変な特性の線形変換を適用する場合に適している。
次に、図18、図19を参照して本発明の実施例7に係るステレオ反響消去装置800について説明する。図18は、実施例7に係るステレオ反響消去装置800の構成例を示すブロック図である。図19は実施例7に係るステレオ反響消去装置800の動作例を示すフローチャートである。実施例7に係るステレオ反響消去装置800は、実施例5の周波数分割(合成)手段を有する構成に実施例2の線形変換手段を組み合わせた例である。本実施例では実施例5と実施例2を組み合わせたが、実施例4と実施例2を組み合わせても良い。実施例6との違いは、周波数分割手段511と線形変換手段309の位置が逆になっていることである。詳細には、実施例7のステレオ反響消去装置800は、周波数分割手段511と線形変換手段309を備え、周波数分割手段511の動作(S511)が全てのステップの前段に、線形変換手段309の動作(S309)が実施例1のステップ101の前段であってかつステップ511の後段に行われることを特徴とする。また、実施例7のステレオ反響消去装置800は、周波数合成手段614を備え、周波数合成手段614の動作(S614)が実施例1のステップ104の前段であってかつステップ103の後段に行われることを特徴とする。また、実施例7のステレオ反響消去装置800は、周波数分割手段615を備え、周波数分割手段615の動作(S615)が実施例1のステップ205の前段であってかつステップ104の後段に行われることを特徴とする。この構成は、周波数帯域毎に異なる時不変な特性の線形変換を適用する場合に適している。
次に、図20、図21を参照して本発明の実施例8に係るステレオ反響消去装置900について説明する。図20は、実施例8に係るステレオ反響消去装置900の構成例を示すブロック図である。図21は実施例8に係るステレオ反響消去装置900の動作例を示すフローチャートである。実施例8に係るステレオ反響消去装置900は、実施例5の周波数分割(合成)手段を有する構成に実施例3の線形変換手段を組み合わせた例である。本実施例では実施例5と実施例3を組み合わせたが、実施例4と実施例3を組み合わせても良い。実施例8のステレオ反響消去装置900は、周波数分割手段511と線形変換手段410を備え、周波数分割手段511の動作(S511)が全てのステップの前段に、線形変換手段410の動作(S410)が、S511以降で、かつ、誤差信号を推定するステップ(S205)、(S206)より以前に実行され、誤差信号を推定するステップ(S205)、(S206)および、模擬反響路を更新するステップ(S407)、(S408)において、各周波数ω毎に、線形変換された再生信号x1'(k,ω)、x2'(k,ω)の値を利用可能としたことを特徴とする。また、実施例8のステレオ反響消去装置900は、周波数合成手段614を備え、周波数合成手段614の動作(S614)が実施例1のステップ104の前段であってかつ実施例1のステップ103の後段に行われることを特徴とする。また、実施例8のステレオ反響消去装置900は、周波数分割手段615を備え、周波数分割手段615の動作(S615)が本実施例のステップ410の前段であってかつ実施例1のステップ104の後段に行われることを特徴とする。この構成は、周波数帯域毎に異なる時変な特性の線形変換を適用する場合に適している。
<本発明の各実施例が有する効果>
ステレオ反響消去装置が適用される音声通話時において、音声信号に基づく反響信号より得られる誤差信号の振幅値の分布は、ガウス分布よりも0近傍に鋭いピークを持つ優ガウス的な分布を取る場合が多い。本発明のステレオ反響消去装置によれば、音声信号の特徴により相応しい統計モデルに基づき、観測誤差信号e(k)とし、混合して観測される第一誤差信号をe1(k)、第二誤差信号をe2(k)としたときの第一誤差信号e1(k)がとる値の事後確率分布P(e1(k)|e(k))を、優ガウス分布に従うものとして推定することにより、第一模擬特性Hm1(k)および第二模擬特性Hm2(k)の模擬精度を向上させ、音声通話時の反響消去の性能を高めることができる。
本発明の実施例1に係るステレオ反響消去装置200は、観測誤差信号e(k)(=e1(k)+e2(k))が観測されたとき、第一誤差信号e1(k)の事後確率分布P(e1(k)|e(k))の最頻値を第一誤差信号e1(k)の推定値とするため、音声通話時の反響消去の性能が高まるという効果に加え、少ない演算量で第一誤差信号e1(k)の推定値を求めることが出来る。
本発明の実施例1の変形例1に係るステレオ反響消去装置200’は、第一誤差信号e1(k)の事後確率分布P(e1(k)|e(k))の期待値を第一誤差信号e1(k)の推定値とするため、音声通話時の反響消去の性能が高まるという効果に加え、x1(k)とx2(k)の相互相関が高く、e1(k)とe2(k)の独立性が低い場合の推定誤りを最頻値による予測と比較して減少させることが出来る。
本発明の実施例1の変形例2に係るステレオ反響消去装置200’’は、第一誤差信号e1(k)の事後確率分布P(e1(k)|e(k))の中央値を第一誤差信号e1(k)の推定値とするため、音声通話時の反響消去の性能が高まるという効果に加え、x1(k)とx2(k)の相互相関が高く、e1(k)とe2(k)の独立性が低い場合の推定誤りを最頻値による予測と比較して減少させることが出来る。
本発明の実施例1の変形例3に係るステレオ反響消去装置200’’’は、x1(k)とx2(k)の相互相関を計算してe1(k)とe2(k)の独立性を評価し、独立性が高い場合には第一誤差信号e1(k)の事後確率分布の最頻値をe1(k)の推定値とし、独立性が低い場合には期待値もしくは中央値をe1(k)の推定値とするため、演算量の少ない最頻値による推定や、推定精度の高い期待値、中央値による予測を適宜選択して、用いることが出来る。
本発明の実施例2に係るステレオ反響消去装置300は、線形変換手段309を備えているため、第一再生信号x1(k)、第二再生信号x2(k)に予め固定の線形変換を施すことができ、線形変換後のx1(k)とx2(k)の直交性を高め、線形変換後のx1(k)とx2(k)の相互相関を減少させることができ、さらなる反響消去性能の向上を図ることが出来る。
本発明の実施例3に係るステレオ反響消去装置400は、線形変換手段410を備えているため、第一再生信号x1(k)、第二再生信号x2(k)に時変の線形変換を施すことができ、線形変換後のx1(k)とx2(k)の時間変化に応じて、互い直交性を高め、線形変換後のx1(k)とx2(k)の相互相関を減少させることができ、なおかつ、線形変換が時変であっても、模擬反響路の特性が変動しないようにできるため、さらなる反響消去性能の向上を図ることが出来る。
本発明の実施例4に係るステレオ反響消去装置500は、周波数分割手段511と、周波数分割手段512と、周波数合成手段513とを備えているため、周波数毎に、異なる優ガウス特性を持つモデルを適用することができるため、さらなる反響消去性能の向上を図ることが出来る。
本発明の実施例5に係るステレオ反響消去装置600は、周波数分割手段511と、周波数合成手段614と、周波数分割手段615とを備えているため、周波数毎に、異なる優ガウス特性を持つモデルを適用することができるため、さらなる反響消去性能の向上を図ることが出来る。
本発明の実施例6に係るステレオ反響消去装置700は、線形変換手段309を備えているため、第一再生信号x1(k)、第二再生信号x2(k)に予め固定の線形変換を施すことができ、線形変換後のx1(k)とx2(k)の直交性を高め、線形変換後のx1(k)とx2(k)の相互相関を減少させることができ、さらに、周波数分割手段511と、周波数合成手段614と、周波数分割手段615とを備えているため、周波数毎に、異なる優ガウス特性を持つモデルを適用することができため、さらなる反響消去性能の向上を図ることが出来る。
本発明の実施例7に係るステレオ反響消去装置800は、周波数分割手段511と、線形変換手段309と、周波数合成手段614と、周波数分割手段615とを備えており、周波数分割手段511が線形変換手段309の前段に存在することにより、周波数毎に異なる固定の線形変換をx1(k,ω)とx2(k,ω)に施すことができるため、さらなる反響消去性能の向上を図ることが出来る。
本発明の実施例8に係るステレオ反響消去装置900は、周波数分割手段511と、線形変換手段410と、周波数合成手段614と、周波数分割手段615とを備えているため、周波数毎に異なる時変の線形変換をx1(k,ω)とx2(k,ω)に施すことができるため、さらなる反響消去性能の向上を図ることが出来る。
図22は従来のステレオ反響消去装置の収束特性と本発明の実施例1の変形例3におけるステレオ反響消去装置の収束特性を比較するグラフである。グラフの縦軸は、正規化係数誤差(Normalized CE)であり、下式により計算される。
Figure 2012044609
グラフの横軸は経過時間(sec)を表す。本収束特性の比較においては、遠端話者が時刻15(sec)にて交代している。時刻15(sec)におけるy軸に平行な破線は、この破線の左右において遠端話者が異なることを示している。従来技術におけるステレオ反響消去装置の正規化係数誤差の時間推移を実線で表す。本発明の実施例1の変形例3におけるステレオ反響消去装置の正規化係数誤差の時間推移を破線で表す。実線のグラフと破線のグラフを比較すると、破線のグラフは実線のグラフよりも同一時刻における正規化係数誤差の値が低い。従って、本発明の実施例1の変形例3におけるステレオ反響消去装置は従来のステレオ反響消去装置よりも収束特性が良い。図23は従来のステレオ反響消去装置の収束特性と本発明の実施例1の変形例3と実施例2とを組み合わせたステレオ反響消去装置の収束特性を比較するグラフである。グラフの縦軸は正規化係数誤差であり、横軸は経過時間(sec)であり、図22と同じである。図22の場合と同様に遠端話者が時刻15(sec)にて交代している。従来技術におけるステレオ反響消去装置の正規化係数誤差の時間推移を実線で表す。本発明の実施例1の変形例3と実施例2の線形変換手段を組み合わせたステレオ反響消去装置の正規化係数誤差の時間推移を破線で表す。実施例2の線形変換手段309を変形例3に組み合わせることにより、第一再生信号x1(k)、第二再生信号x2(k)に予め線形変換を施すことができ、線形変換後のx1(k)とx2(k)の直交性を高め、線形変換後のx1(k)とx2(k)の相互相関を減少させることができる。実線のグラフと破線のグラフを比較すると、破線のグラフは実線のグラフよりも同一時刻における正規化係数誤差の値が低い。従って、本発明の実施例1の変形例3と実施例2を組み合わせたステレオ反響消去装置は従来のステレオ反響消去装置よりも収束特性が向上している。さらに、図22と図23とを比較すれば、実施例2の線形変換手段をさらに備えることとすれば、収束特性がさらに向上することが分かる。
<本発明の各実施例が有する効果の説明終わり>
また、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (12)

  1. 第一反響路H1を、第一音響再生手段と前記第一音響再生手段と同一空間内にある収音手段との間の音響的な伝達経路であるものとし、
    第二反響路H2を、前記第一音響再生手段と同一空間内にある第二音響再生手段と前記収音手段との間の音響的な伝達経路であるものとし、
    前記第一反響路H1を介して前記第一音響再生手段で再生する第一再生信号x1(k)(kは離散時間を表す正の値)を前記収音手段で収音して得た第一反響信号d1(k)と、前記第二反響路H2を介して、前記第二音響再生手段で再生する第二再生信号x2(k)を前記収音手段で収音して得た第二反響信号d2(k)との混合信号を、前記収音手段で収音する全ての収音信号y(k)の中から消去または低減するステレオ反響消去方法において、
    前記第一反響路H1の模擬特性Hm1(k)を有し、前記第一再生信号x1(k)を入力とし、前記第一反響信号d1(k)を模擬する第一反響模擬信号dm1(k)を生成する第一適応型反響模擬ステップと、
    前記第二反響路H2の模擬特性Hm2(k)を有し、前記第二再生信号x2(k)を入力とし、前記第二反響信号d2(k)を模擬する第二反響模擬信号dm2(k)を生成する第二適応型反響模擬ステップと、
    前記第一反響模擬信号dm1(k)と、前記第二反響模擬信号dm2(k)とを、前記収音信号y(k)から減算して誤差信号e(k)を生成する減算ステップと、
    前記誤差信号e(k)を入力とし、d1(k)-dm1(k)に相当する第一誤差信号e1(k)と、d2(k)-dm2(k)に相当する第二誤差信号e2(k)の推定値を、0<p<2、0<q<2を満たすように予め定めたpとq、および予め定めたa1とa2により定まる、e1(k)の事後確率分布
    Figure 2012044609
    の少なくとも何れか一つを用いて、前記第一誤差信号e1(k)および前記第一誤差信号e2(k)の値をe(k)=e1(k)+e2(k)を満足するように推定する優ガウスモデル誤差配分ステップと、
    前記第一模擬特性Hm1(k)と、前記第一再生信号x1(k)と、前記第一誤差信号e1(k)とを入力とし、離散時間kにおける前記第一模擬特性Hm1(k)を離散時間k+1における第一模擬特性Hm1(k+1)に更新する第一更新ステップと、
    前記第二模擬特性Hm2(k)と、前記第二再生信号x2(k)と、前記第二誤差信号e2(k)とを入力とし、離散時間kにおける前記第二模擬特性Hm2(k)を離散時間k+1における第二模擬特性Hm2(k+1)に更新する第二更新ステップとを有すること
    を特徴とするステレオ反響消去方法。
  2. 請求項1に記載のステレオ反響消去方法であって、前記優ガウスモデル誤差配分ステップが前記事後確率分布P(e1(k)|e(k))およびP(e2(k)|e(k))の最頻値を前記第一誤差信号e1(k)および 前記第二誤差信号e2(k)の推定値とすること
    を特徴とするステレオ反響消去方法。
  3. 請求項1に記載のステレオ反響消去方法であって、前記優ガウスモデル誤差配分ステップが前記事後確率分布P(e1(k)|e(k)) およびP(e2(k)|e(k))の期待値を前記第一誤差信号e1(k) および 前記第二誤差信号e2(k)の推定値とすること
    を特徴とするステレオ反響消去方法。
  4. 請求項1に記載のステレオ反響消去方法であって、前記優ガウスモデル誤差配分ステップが前記事後確率分布P(e1(k)|e(k)) およびP(e2(k)|e(k))の中央値を前記第一誤差信号e1(k) および 前記第二誤差信号e2(k)の推定値とすること
    を特徴とするステレオ反響消去方法。
  5. 請求項1に記載のステレオ反響消去方法であって、前記優ガウスモデル誤差配分ステップが、前記第一再生信号x1(k)と前記第二再生信号x2(k)との相互相関に基づいて、前記事後確率分布P(e1(k)|e(k)) およびP(e2(k)|e(k))の最頻値、期待値、中央値のいずれか一つを選択して前記第一誤差信号e1(k) および 前記第二誤差信号e2(k)の推定値とすること
    を特徴とするステレオ反響消去方法。
  6. 請求項1から5の何れかに記載のステレオ反響消去方法であって、前記第一再生信号x1(k)と、前記第一模擬反響信号dm1(k)と、前記観測誤差信号e(k)のうちの少なくともいずれか一つを用いて前記a1を計算し、前記第二再生信号x2(k)と、前記第二模擬反響信号dm2(k)と、前記観測誤差信号e(k)のうちの少なくともいずれか一つを用いて前記a2を計算すること
    を特徴とするステレオ反響消去方法。
  7. 請求項1から6の何れかに記載のステレオ反響消去方法であって、前記第一再生信号x1(k)と前記第二再生信号x2(k)を用いる全てのステップにおいて、前記第一再生信号x1(k)と前記第二再生信号x2(k)の代わりに、それらを線形変換したx1'(k)およびx2'(k)を用いること
    を特徴とするステレオ反響消去方法。
  8. 請求項1から6の何れかに記載のステレオ反響消去方法であって、前記優ガウスモデル誤差配分ステップにおいて、前記第一再生信号x1(k)と前記第二再生信号x2(k)の代わりに、それらを線形変換したx1’(k)およびx2’(k)を用いることおよび、
    前記第一更新ステップおよび前記第二更新ステップにおいて、前記第一再生信号x1(k)と前記第二再生信号x2(k)の代わりに、それらを線形変換したx1’(k)およびx2’(k)を用い、さらに、前記第一再生信号x1(k)と前記第二再生信号x2(k)に施したものと等しい線形変換を第一模擬特性Hm1(k)および第一模擬特性Hm2(k)の更新結果にも施すことにより、Hm1(k+1)およびHm2(k+1)を得ること
    を特徴とするステレオ反響消去方法。
  9. 請求項1から6の何れかに記載のステレオ反響消去方法であって、
    前記第一再生信号x1(k)と前記第二再生信号x2(k)の代わりに、周波数分割された第一再生信号および周波数分割された第二再生信号を入力し、
    収音信号y(k)の代わりに、周波数分割された収音信号を入力し、
    分割された各周波数毎に、前記第一適応型反響模擬ステップ、前記第二適応型反響模擬ステップ、前記減算ステップ、前記優ガウスモデル誤差配分ステップ、前記第一更新ステップ、前記第二更新ステップを実行し、
    各周波数毎に生成された前記誤差信号を周波数合成して、前記反響消去信号e(k)を得ること
    を特徴とするステレオ反響消去方法。
  10. 請求項1から6の何れかに記載のステレオ反響消去方法であって、
    前記第一再生信号x1(k)と前記第二再生信号x2(k)の代わりに、周波数分割された第一再生信号および周波数分割された第二再生信号を入力し、
    分割された各周波数毎に、前記第一適応型反響模擬ステップ、前記第二適応型反響模擬ステップを実行し、各周波数毎に得られた前記第一反響模擬信号および第二反響模擬信号を周波数合成し、全周波数帯域信号に戻した後、前記収音信号y(k)から減算する前記減算ステップを実行し、得られた誤差信号e(k)を周波数分割し、各周波数毎に、前記優ガウスモデル誤差配分ステップ、前記第一更新ステップ、前記第二更新ステップを実行すること
    を特徴とするステレオ反響消去方法。
  11. 第一反響路H1を、第一音響再生手段と前記第一音響再生手段と同一空間内にある収音手段との間の音響的な伝達経路であるものとし、
    第二反響路H2を、前記第一音響再生手段と同一空間内にある第二音響再生手段と前記収音手段との間の音響的な伝達経路であるものとし、
    前記第一反響路H1を介して前記第一音響再生手段で再生する第一再生信号x1(k)(kは離散時間を表す正の値)を前記収音手段で収音して得た第一反響信号d1(k)と、前記第二反響路H2を介して、前記第二音響再生手段で再生する第二再生信号x2(k)を前記収音手段で収音して得た第二反響信号d2(k)との混合信号を、前記収音手段で収音する全ての収音信号y(k)の中から消去または低減するステレオ反響消去装置において、
    前記第一反響路H1の模擬特性Hm1(k)を有し、前記第一再生信号x1(k)を入力とし、前記第一反響信号d1(k)を模擬する第一反響模擬信号dm1(k)を生成する第一適応型模擬反響路と、
    前記第二反響路H2の模擬特性Hm2(k)を有し、前記第二再生信号x2(k)を入力とし、前記第二反響信号d2(k)を模擬する第二反響模擬信号dm2(k)を生成する第二適応型模擬反響路と、
    前記第一反響模擬信号dm1(k)と、前記第二反響模擬信号dm2(k)とを、前記収音信号y(k)から減算して誤差信号e(k)を生成する減算器と、
    前記誤差信号e(k)を入力とし、d1(k)-dm1(k)に相当する第一誤差信号e1(k)と、d2(k)-dm2(k)に相当する第二誤差信号e2(k)の推定値を、0<p<2、0<q<2を満たすように予め定めたpとq、および予め定めたa1とa2により定まる、e1(k)の事後確率分布
    Figure 2012044609

    の少なくとも何れか一つを用いて、前記第一誤差信号e1(k)および前記第一誤差信号e2(k)の値をe(k)=e1(k)+e2(k)を満足するように推定する優ガウスモデル誤差配分手段と、
    前記第一模擬特性Hm1(k)と、前記第一再生信号x1(k)と、前記第一誤差信号e1(k)とを入力とし、離散時間kにおける前記第一模擬特性Hm1(k)を離散時間k+1における第一模擬特性Hm1(k+1)に更新する第一更新手段と、
    前記第二模擬特性Hm2(k)と、前記第二再生信号x2(k)と、前記第二誤差信号e2(k)とを入力とし、離散時間kにおける前記第二模擬特性Hm2(k)を離散時間k+1における第二模擬特性Hm2(k+1)に更新する第二更新手段とを有すること
    を特徴とするステレオ反響消去装置。
  12. 請求項1から10の何れかに記載のステレオ反響消去方法を実行すべき指令をコンピュータに対してするプログラム。
JP2010186374A 2010-08-23 2010-08-23 ステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラム Expired - Fee Related JP5438629B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010186374A JP5438629B2 (ja) 2010-08-23 2010-08-23 ステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010186374A JP5438629B2 (ja) 2010-08-23 2010-08-23 ステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラム

Publications (2)

Publication Number Publication Date
JP2012044609A true JP2012044609A (ja) 2012-03-01
JP5438629B2 JP5438629B2 (ja) 2014-03-12

Family

ID=45900361

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010186374A Expired - Fee Related JP5438629B2 (ja) 2010-08-23 2010-08-23 ステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラム

Country Status (1)

Country Link
JP (1) JP5438629B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016048847A (ja) * 2014-08-27 2016-04-07 沖電気工業株式会社 ステレオエコー抑圧装置、エコー抑圧装置、ステレオエコー抑圧方法及びステレオエコー抑圧プログラム
JP2016219860A (ja) * 2015-05-14 2016-12-22 日本電信電話株式会社 未知伝達系推定装置、未知伝達系推定方法、およびプログラム
CN107563656A (zh) * 2017-09-11 2018-01-09 东北大学 金湿法冶金氰化浸出过程运行状态的评价方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11317695A (ja) * 1998-03-05 1999-11-16 Nippon Telegr & Teleph Corp <Ntt> 多チャネル音響エコ―消去方法、その装置及びこの方法を記録した記録媒体
JP2002057606A (ja) * 2000-06-26 2002-02-22 Lucent Technol Inc 音響およびネットワークエコーキャンセレーションにおいて用いるための耐誤差性の適応フィルタ
JP2006319925A (ja) * 2005-05-16 2006-11-24 Advanced Telecommunication Research Institute International 適応フィルタ
JP2007067855A (ja) * 2005-08-31 2007-03-15 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法、反響消去装置、プログラム、記録媒体
JP2010118751A (ja) * 2008-11-11 2010-05-27 Nippon Telegr & Teleph Corp <Ntt> 音響エコーキャンセラ装置とその方法と、プログラムと記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11317695A (ja) * 1998-03-05 1999-11-16 Nippon Telegr & Teleph Corp <Ntt> 多チャネル音響エコ―消去方法、その装置及びこの方法を記録した記録媒体
JP2002057606A (ja) * 2000-06-26 2002-02-22 Lucent Technol Inc 音響およびネットワークエコーキャンセレーションにおいて用いるための耐誤差性の適応フィルタ
JP2006319925A (ja) * 2005-05-16 2006-11-24 Advanced Telecommunication Research Institute International 適応フィルタ
JP2007067855A (ja) * 2005-08-31 2007-03-15 Nippon Telegr & Teleph Corp <Ntt> 反響消去方法、反響消去装置、プログラム、記録媒体
JP2010118751A (ja) * 2008-11-11 2010-05-27 Nippon Telegr & Teleph Corp <Ntt> 音響エコーキャンセラ装置とその方法と、プログラムと記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016048847A (ja) * 2014-08-27 2016-04-07 沖電気工業株式会社 ステレオエコー抑圧装置、エコー抑圧装置、ステレオエコー抑圧方法及びステレオエコー抑圧プログラム
JP2016219860A (ja) * 2015-05-14 2016-12-22 日本電信電話株式会社 未知伝達系推定装置、未知伝達系推定方法、およびプログラム
CN107563656A (zh) * 2017-09-11 2018-01-09 东北大学 金湿法冶金氰化浸出过程运行状态的评价方法

Also Published As

Publication number Publication date
JP5438629B2 (ja) 2014-03-12

Similar Documents

Publication Publication Date Title
JP5438629B2 (ja) ステレオ反響消去方法、ステレオ反響消去装置、ステレオ反響消去プログラム
JP5469564B2 (ja) 多チャネルエコー消去方法、多チャネルエコー消去装置及びそのプログラム
JP6094479B2 (ja) 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体
KR102076760B1 (ko) 다채널 마이크를 이용한 칼만필터 기반의 다채널 입출력 비선형 음향학적 반향 제거 방법
JP6517124B2 (ja) 雑音抑圧装置、雑音抑圧方法、およびプログラム
JP5942388B2 (ja) 雑音抑圧用係数設定装置、雑音抑圧装置および雑音抑圧用係数設定方法
JP2003250193A (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
JP3673727B2 (ja) 反響消去方法、その装置、そのプログラム及びその記録媒体
JP5583181B2 (ja) 縦続接続型伝達系パラメータ推定方法、縦続接続型伝達系パラメータ推定装置、プログラム
JP4504891B2 (ja) 反響消去方法、反響消去装置、プログラム、記録媒体
JP2017191992A (ja) エコー抑圧装置、その方法、プログラム、及び記録媒体
JPWO2012157783A1 (ja) 音声処理装置、音声処理方法および音声処理プログラムを記録した記録媒体
JP6790659B2 (ja) 音響処理装置および音響処理方法
JP4504892B2 (ja) 反響消去方法、反響消去装置、プログラム、記録媒体
JP2020148880A (ja) 雑音空間共分散行列推定装置、雑音空間共分散行列推定方法、およびプログラム
JP4559989B2 (ja) エコー抑圧方法、エコー抑圧プログラム、記録媒体
JP6075783B2 (ja) エコー消去装置、エコー消去方法及びプログラム
JP5325134B2 (ja) 反響消去方法、反響消去装置、そのプログラムおよび記録媒体
JP5925149B2 (ja) 音響結合量推定装置、エコー消去装置、その方法及びプログラム
Cifani et al. A PEM-AFROW based algorithm for acoustic feedback control in automotive speech reinforcement systems
JP5033109B2 (ja) 音響エコーキャンセラ装置とその方法と、プログラムと記録媒体
JP7173356B2 (ja) Psd最適化装置、psd最適化方法、プログラム
JP6356087B2 (ja) エコー消去装置、その方法及びプログラム
WO2019244535A1 (ja) エコー消去装置、エコー消去方法、プログラム
JP5889233B2 (ja) 音響結合量推定装置、エコー消去装置、その方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121004

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130917

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131015

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131203

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131213

R150 Certificate of patent or registration of utility model

Ref document number: 5438629

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees