JP2017503388A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2017503388A5 JP2017503388A5 JP2016534922A JP2016534922A JP2017503388A5 JP 2017503388 A5 JP2017503388 A5 JP 2017503388A5 JP 2016534922 A JP2016534922 A JP 2016534922A JP 2016534922 A JP2016534922 A JP 2016534922A JP 2017503388 A5 JP2017503388 A5 JP 2017503388A5
- Authority
- JP
- Japan
- Prior art keywords
- filter
- microphone
- sound
- diffuse sound
- diffuse
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001629 suppression Effects 0.000 claims description 59
- 239000011159 matrix material Substances 0.000 claims description 18
- 238000005457 optimization Methods 0.000 claims description 9
- 230000000875 corresponding Effects 0.000 claims description 5
- 238000009792 diffusion process Methods 0.000 claims description 5
- 230000003595 spectral Effects 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims 2
- 238000004590 computer program Methods 0.000 claims 1
- 238000005259 measurement Methods 0.000 claims 1
- 238000001228 spectrum Methods 0.000 claims 1
- 241000214474 Doa Species 0.000 description 16
- 239000000203 mixture Substances 0.000 description 3
- 230000002238 attenuated Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005290 field theory Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
Images
Description
拡散音フィルタのフィルタ係数に対する線形抑圧を規定することを含む方法が提供される。線形抑圧は、第1のマイクロホン信号内の第1の拡散音部分と、第2のマイクロホン信号内の第2の拡散音部分との間の空間コヒーレンスに基づく。第1のマイクロホン信号は、第1のマイクロホンによって捕捉され、第2のマイクロホン信号は、既知の様式で第1のマイクロホンから離間されている第2のマイクロホンによって捕捉される。方法はまた、少なくとも1つの直接音の到来する方向、第1のマイクロホン信号および第2のマイクロホン信号に関する信号統計、ならびに、第1のマイクロホン信号および第2のマイクロホン信号に関する雑音統計のうちの少なくとも1つを計算することも含む。方法は、フィルタ係数に対する線形抑圧を考慮しながら、少なくとも1つの直接音の到来する方向、信号統計および雑音統計の少なくとも1つに関する最適化問題を解くことによって、拡散音フィルタのフィルタ係数を決定することをさらに含む。
さらなる実施形態は、拡散音フィルタのフィルタ係数に対する線形抑圧を規定するように構成されている線形抑圧計算器を備える装置を提供する。線形抑圧は、第1のマイクロホン信号内の第1の拡散音部分と、第2のマイクロホン信号内の第2の拡散音部分との間の空間コヒーレンスに基づく。第1のマイクロホン信号は、第1のマイクロホンによって捕捉されるかまたは捕捉されており、第2のマイクロホン信号は、既知の様式で第1のマイクロホンから離間されている第2のマイクロホンによって捕捉されるかまたは捕捉されている。装置はまた、少なくとも1つの直接音の到来する方向、第1のマイクロホン信号および第2のマイクロホン信号に関する信号統計、ならびに、第1のマイクロホン信号および第2のマイクロホン信号および第2のマイクロホン信号に関する雑音統計のうちの少なくとも1つを計算するように構成されている統計計算器も含む。装置は、フィルタ係数に対する線形抑圧を考慮しながら、少なくとも1つの直接音の到来する方向、信号統計および雑音統計の少なくとも1つに関する最適化問題を解くことによって、拡散音フィルタのフィルタ係数を決定するように構成されているフィルタ係数計算器をさらに備える。
実施形態は、マイクロホン信号の拡散音部分に関係する少なくとも1つの線形抑圧を考慮に入れながら、拡散音フィルタを決定することができるという洞察に基づく。
適切なフィルタを求めるための単純な方法は、マイクロホン信号に含まれる定常雑音Xn(k,n,dm)が最小限に抑えられながらL個の平面波が抑制されるように、重みwmを計算することである。数学的に表現すると、フィルタ重みは、線形抑圧
を受けて
によって与えられる。
ここで、Φnは、定常雑音のPSD行列(パワースペクトル密度行列)、すなわち、
であり、これは、たとえば、拡散音または直接音が存在しないときに既知の手法を用いて推定することができる。その上、alはいわゆる伝搬ベクトルである。その要素は、m番目のマイクロホンから他のマイクロホンへの、l番目の平面波の相対伝達関数である。したがって、alは長さMの列ベクトルである(m番目のマイクロホンにおける拡散音のみが、M個のマイクロホン信号のwm、すなわち、重み付き線形結合によって推定され、他のマイクロホンにおける拡散音は、これらの信号がm番目のマイクロホンから他のマイクロホンへの相対伝達関数を介して関係付けられ、必要とされる場合にこのように計算され得るため、実質的に冗長であることを想起されたい)。alの要素は、l番目の平面波のDOAに依存する。これは、alがl番目の平面波のDOAの関数である、すなわち、al=f(nl)であることを意味する。alは直接音(すなわち、平面波)に依存するため、以下においては直接音抑圧と称される。この空間フィルタによって、実質的に、L個の平面波の方向に向かってゼロを有する集音パターンを有するビーム形成期が作成される。結果として、すべての平面波が抑制される。不都合なことに、上記最小化問題を解くことによって、ゼロ拘束しかなくなる、すなわち、拡散音を抽出することができないため、ゼロ重みwmがもたらされる。
結果としてもたらされる集音パターンの一例が図6に示されている。ここで、2つの直接音が、方位51°および97°から到来する。この図は、5cmのマイクロホン間隔で16個のマイクロホンを有する均一な線形アレイを使用したときに、2.8kHzの周波数において結果としてもたらされる集音パターンを示している。この集音パターンは、まさに51°および97°についてゼロを保持し、180°について高い利得を保持し、これは方向n0に対応する。その上、集音パターンは、ほぼすべての他の方向について、複数の他の空間的ゼロ値または低利得を有する。この集音パターンは、すべての方向から到来する拡散音を捕捉するのには適していない。ここでも、直接音抑圧alが直接音のDOAに直に関係することに留意されたい。このサブセクションにおける空間フィルタでは達成することができない所望の集音パターンが、図7に示されている。この集音パターンは、直接音のDOAについて2つの空間的ゼロ値を有するが、他の態様ではほぼ全指向性である。この集音パターンは、図7に関連して下記に説明する、提案されているフィルタを使用することによって達成される。
上記拘束を所与としてフィルタ重みwmを計算するための閉形式解を、[VanTrees2002]に見出すことができる。空間フィルタを計算するためには、L個の平面波のDOAを知らなければならない、すなわち、直接音抑圧alおよびa0を計算しなければならない。このDOA情報は、Root MUSICまたはESPRITのような、既知の狭帯域DOA推定器を用いて決定することができる。a0の要素は一般的に複素数であり、平面波のDOAは時間変動性が高いと仮定されなければならないため、a0は一般的に、各kおよびnについて計算し直される必要があることにさらに留意されたい。変動の多いa0は可聴アーティファクトをもたらす可能性がある。
提示されているマルチチャネルフィルタを用いて拡散音を抽出するための例示的なシステムが、図2に示されている。マイクロホン信号を時間周波数領域に変換した後、定常雑音およびL個の平面波のDOAを推定する。その後、DOA情報から、M+1個の線形直接音抑圧(alおよびa0)が得られる。この情報に基づいて、フィルタ重みを計算することができる。これらの重みをマイクロホン信号に適用することによって、拡散音の所望の推定値がもたらされる。この記述から、得られるフィルタは直接音(すなわち、それぞれ、DOAおよびマイクロホン間の平面波の対応する相対伝達関数)にのみ依存し、拡散音には依存しないことが明らかである。これは、フィルタが、たとえ拡散音の推定に使用されるとしても、拡散音に関する利用可能である可能性がある情報を考慮しないことを意味する。
以下において提案される重みベクトルwmが、特定のコスト関数を最小限に抑え、上述したマルチチャネルフィルタと同様に線形抑圧される。
しかしながら、上述したマルチチャネルフィルタとは対照的に、本発明では、直接音(すなわち、L個の平面波)に依存しない線形抑圧を使用することを提案する。より正確には、提案される新規の拘束は、それぞれ、平面波のDOAの関数またはマイクロホン間の平面波の対応する相対伝達関数ではない。
提案される空間フィルタは、拡散音に対する歪みのない拘束を満足しながら特定のコスト関数を最小限に抑えることによって得られる。この拘束は、マイクロホン間の拡散音の相対伝達関数に対応する。数学的に表現すると、フィルタは、線形抑圧
(数10)
wHbm(k,n)=1
を受けて
として計算される。
(数10)
wHbm(k,n)=1
を受けて
ここで、Jはフィルタによって最小化されるべきコスト関数である。コスト関数は、たとえば、フィルタ出力における定常雑音パワー、フィルタ出力における干渉エネルギー、または、推定拡散音の二乗誤差であり得る。Jの例を、これらの実施形態において与える。抑圧ベクトルbmは、bm(k,n)=[B1,m(k,n),B2,m(k,n),...,BM,m(k,n)]Tによって与えられる。m’番目の要素Bm’,mはマイクロホンmとm’との間の拡散音の相対伝達関数である。この相対伝達関数は以下によって与えられる。
これは、相対伝達関数γm’,mがマイクロホンmとm’との間の拡散音のいわゆる空間コヒーレンスに対応する。空間コヒーレンスは以下のように定義され、
式中、(・)*は複素共役を示す。この空間コヒーレンスは、周波数領域におけるマイクロホンmとm’との間の拡散音の相関を記述する。このコヒーレンスは、特定の拡散音場に依存する。コヒーレンスは、所与の部屋について前もって測定することができる。代替的に、コヒーレンスは、特定の拡散音場の理論から分かる[Elko2001]。たとえば、実際に仮定され得ることが多い球状等方性拡散音場について、以下のようになり、
式中、sincはシンク関数を示し、fは所与の周波数帯域kの音響周波数であり、cは音声の速度である。その上、γm’,mはマイクロホンmとm’との間の距離である。空間コヒーレンスを、マイクロホン間の拡散音の平均相対伝達関数を表す線形抑圧Bm’,mとして使用するとき、得られるフィルタは多くの線形抑圧される空間フィルタの合計と等価であり、これらのフィルタの各々が、歪みのないランダムな拡散音の異なる具現化を捕捉する。
上記で紹介した拡散音抑圧によって、すべての方向から等しく良好に拡散音を捕捉する空間フィルタが得られる。これは、主に1つの方向、すなわち、選択される伝搬ベクトルa0が対応する方向から音声を捕捉する、上述したマルチチャネルフィルタとは対照的である。
拡散音抑圧bmは、直接音抑圧alおよびa0とは概念的にかなり異なることに留意されたい。それゆえ、このセクションにおいて提案されている新規のフィルタは、上述したマルチチャネルフィルタと比較して、概念的にかなり異なる。
提案されている発明がブロック形式で図3に示されている。第1に、M個のマイクロホン信号がフィルタバンク(FB)を使用して時間周波数領域(または信号処理に適した別の領域)に変換される(101)。第2に、ブロック(102)において、線形拡散音抑圧ベクトルbmを計算する。拡散音抑圧ベクトルは、信号から推定されるか、または、たとえば、前述したような特定の仮定される拡散場の理論的空間コヒーレンスに対応するかのいずれかである。ブロック(104)において、マイクロホン信号から特定の統計(たとえば、雑音統計)を推定する。通常はPSD行列Φ(k,n)として表されるこの情報は、フィルタによって最小化されなければならないコスト関数Jを生成するために使用される。拡散音抑圧を受けてコスト関数を最小化するフィルタ重みがブロック(103)において計算される。最後に、重みがマイクロホン信号に適用されて、所望の拡散音推定値がもたらされる。本発明の特定の具現化を、以下の実施形態において提示する。
拡散音抑圧を満足する出力パワーの最小化
この実施形態では、拡散音抑圧を受けてフィルタの出力全体を最小化する空間フィルタを定義する。拡散音抑圧は、残りの信号部分(望ましくない定常雑音および平面波)が最小限に抑えられながら、拡散音が空間フィルタによって保持されることを保証する。フィルタ重みwmは、線形抑圧
(数17)
wHbm(k,n)=1
を受けて
として計算される。
この実施形態では、拡散音抑圧を受けてフィルタの出力全体を最小化する空間フィルタを定義する。拡散音抑圧は、残りの信号部分(望ましくない定常雑音および平面波)が最小限に抑えられながら、拡散音が空間フィルタによって保持されることを保証する。フィルタ重みwmは、線形抑圧
(数17)
wHbm(k,n)=1
を受けて
ここで、Φxはマイクロホン信号のPSD行列であり、これは
(数20)
Φx(k,n)=E{x(k,n)xH(k,n)}
として計算することができ、式中、x(k,n)はマイクロホン信号を含むベクトルである。実際には、この予測は、たとえば、時間平均によって近似される。その上、抑圧ベクトルbm(k,n)=[B1,m(k,n),B2,m(k,n),...,BM,m(k,n)]Tの要素は、マイクロホンmとm’との間の拡散音の空間コヒーレンス、すなわち、
(数21)
Bm’,m(k,n)=γm’,m(k,n)
に対応する。
(数20)
Φx(k,n)=E{x(k,n)xH(k,n)}
として計算することができ、式中、x(k,n)はマイクロホン信号を含むベクトルである。実際には、この予測は、たとえば、時間平均によって近似される。その上、抑圧ベクトルbm(k,n)=[B1,m(k,n),B2,m(k,n),...,BM,m(k,n)]Tの要素は、マイクロホンmとm’との間の拡散音の空間コヒーレンス、すなわち、
(数21)
Bm’,m(k,n)=γm’,m(k,n)
に対応する。
この実施形態は、図3にブロック形式で示されている。フィルタバンクを用いてマイクロホン信号を変換した後(101)、信号統計推定ブロック(104)において、信号PSD行列Φxを計算する。その上、ブロック(102)において、この信号から、または、特定の拡散音場を仮定した事前情報を使用してのいずれかで、線形拡散音抑圧ベクトルbmを計算する。その後、ブロック(103)においてフィルタ重みが計算される。これらの重みをマイクロホン信号と乗算することによって、拡散音の所望の推定値がもたらされる。
線形抑圧最小分散フィルタ
この実施形態は、図2に関連して上述したマルチチャネルフィルタの、新規の手法と現行の技術水準の手法との組み合わせを表す。この実施形態では、拡散拘束および追加の指向性拘束を受けてフィルタ出力における定常雑音を最小限に抑える線形抑圧空間フィルタを定義する。フィルタ重みwmは、線形抑圧
(数24)
wHbm(k,n)=1
および
を受けて
として計算される。
この実施形態は、図2に関連して上述したマルチチャネルフィルタの、新規の手法と現行の技術水準の手法との組み合わせを表す。この実施形態では、拡散拘束および追加の指向性拘束を受けてフィルタ出力における定常雑音を最小限に抑える線形抑圧空間フィルタを定義する。フィルタ重みwmは、線形抑圧
(数24)
wHbm(k,n)=1
および
明快に、フィルタは、出力において定常雑音のみを最小限に抑える。望ましくない平面波は、第2の線形抑圧(図2のマルチチャネルフィルタについて上記で説明したような)を用いて抑制される。図3による出力パワー最小化フィルタと比較して、これらの追加の拘束は、干渉平面波のさらにより強い抑制を保証する。結果としてもたらされるフィルタは、第1の線形抑圧に起因して依然として拡散音を保持する。実際に計算することができる、このフィルタに対する閉形式解は、以下によって与えられる。
ここで、ベクトルC=[bm,a1,a2,...,aL]は、上記で定義された線形抑圧を含む拘束行列であり、g=[1,O](Oは長さLの0ベクトルである)が対応する応答である。図2に示すマルチチャネルフィルタについて、ベクトルalは、Lの平面波のDOAに依存し、引用文献[VanTrees2002]から既知であるように計算することができる、対照的に、bmの要素は、マイクロホン間の拡散音の相関またはコヒーレンスを記述する。bmの要素は、図3に関連して説明したように計算される。その上、Φnは定常雑音のPSD行列である。このPSD行列は、たとえば、音声が中断している間に推定することができる。複数の異なるマイクロホンにおける定常雑音が相互に独立している場合、単純に、ΦnをM×Mサイズの恒等行列に置き換えることができる。
この実施形態は、図4にブロック形式で示されている。フィルタバンクを用いてマイクロホン信号を変換した後(101)、雑音統計推定ブロック(104)において、定常雑音のPSD行列Φnを計算する。その上、ブロック(102)において、この信号から、または、特定の拡散音場を仮定した事前情報を使用してのいずれかで、線形拡散音抑圧bmを計算する。ブロック(105)において、L個の平面波のDOAを推定する。この情報から、ブロック(106)において直接音抑圧alを計算する。計算された情報はフィルタ計算ブロック(103)に供給され、フィルタ計算ブロックは、上記で提示した閉形式解を用いてフィルタ重みwmを計算する。これらの重みをマイクロホン信号と乗算することによって、拡散音の所望の推定値がもたらされる。
この実施形態において計算されるフィルタは、他の空間フィルタ(たとえば、背景技術に記載されているフィルタ)と比較して、以下の利点を有する。
直接音抑圧に起因して平面波が強く減衰する。
拡散音を捕捉するために所望される、ほぼ全指向性の集音パターン。
直接音抑圧に起因して平面波が強く減衰する。
拡散音を捕捉するために所望される、ほぼ全指向性の集音パターン。
この実施形態は、図5にブロック形式で示されている。フィルタバンクを用いてマイクロホン信号を変換した後(101)、ブロック(104)において、マイクロホンPSD行列Φxおよび雑音PSD行列Φnを計算する。その上、ブロック(102)において、この信号から、または、特定の拡散音場を仮定した事前情報を使用してのいずれかで、線形拡散音抑圧bmを計算する。ブロック(105)において、L個の平面波のDOAを推定する。この情報から、ブロック(106)において直接音抑圧alを計算する。これらの拘束が(107)においてΦnとともに使用されて、重みw1が計算される。拡散音φdのパワーが、(108)においてw1およびΦnから計算される。その後、空間フィルタの最終的な重みwmを、(103)において、φd、Φx、およびbmを使用して計算することができる。パラメータαを用いて、空間フィルタを、MMSEフィルタとPMWFとの間でスケーリングすることができる。重みwmをマイクロホン信号と乗算することによって、拡散音の所望の推定値がもたらされる。
以下のリストは、上述した態様のいくつかの簡潔な通覧を与える。
少なくとも2つのマイクロホン信号を受信する。
マイクロホン信号を、時間周波数領域または別の適切な領域に変換する。
マイクロホン間の拡散音の相関またはコヒーレンスの関数としての線形拡散音抑圧を計算する。
信号統計および/または雑音統計を計算する。
少なくとも2つのマイクロホン信号を受信する。
マイクロホン信号を、時間周波数領域または別の適切な領域に変換する。
マイクロホン間の拡散音の相関またはコヒーレンスの関数としての線形拡散音抑圧を計算する。
信号統計および/または雑音統計を計算する。
いくつかの実施形態においては、直接音のDOAを推定し、マイクロホン間の直接音の相対伝達関数を表す直接音抑圧を計算する。
いくつかの実施形態においては、補助フィルタを計算し、拡散音のパワーを推定する。
拡散音抑圧を考慮することによって、得られた信号/雑音統計および任意選択の拡散音パワー情報を使用して拡散音を抽出するための空間フィルタの重みを計算する。
計算された空間フィルタの重みを使用してマイクロホン信号の線形結合を実施する。
拡散音抑圧を考慮することによって、得られた信号/雑音統計および任意選択の拡散音パワー情報を使用して拡散音を抽出するための空間フィルタの重みを計算する。
計算された空間フィルタの重みを使用してマイクロホン信号の線形結合を実施する。
Claims (15)
- 拡散音フィルタのためのフィルタ係数を取得する方法であって、
第1のマイクロホンによって捕捉される第1のマイクロホン信号内の第1の拡散音部分と、既知の様式で前記第1のマイクロホンから離間されている第2のマイクロホンによって捕捉される第2のマイクロホン信号内の第2の拡散音部分との間の空間コヒーレンスに基づいて、前記拡散音フィルタの前記フィルタ係数に対する線形抑圧を規定することと、
少なくとも1つの直接音の到来する方向、前記第1のマイクロホン信号および前記第2のマイクロホン信号に関する信号統計、ならびに、前記第1のマイクロホン信号および前記第2のマイクロホン信号に関する雑音統計のうちの少なくとも1つを計算することと、
前記フィルタ係数に対する前記線形抑圧を考慮しながら、前記少なくとも1つの直接音の前記到来する方向、前記信号統計および前記雑音統計の前記少なくとも1つに関する最適化問題を解くことによって、前記拡散音フィルタの前記フィルタ係数を決定することと
を含むことを特徴とする、拡散音フィルタのためのフィルタ係数を取得する方法。 - 前記第1のマイクロホンと前記第2のマイクロホンとの間の前記拡散音の相対伝達関数または相関に基づいて前記空間コヒーレンスを与えることをさらに含む、請求項1に記載の方法。
- 前記空間コヒーレンスは、所与の環境に直接音が存在しない期間の間の、前記環境の前記拡散音の相対伝達関数または相関の事前測定値に基づく、請求項1に記載の方法。
- 前記空間コヒーレンスは、前記拡散音に関する理論的関係に基づき、対応する、仮定される拡散音場は、前記第1のマイクロホンと前記第2のマイクロホンとの間の前記拡散音の相関に関する、仮定される理論的特性を有する、請求項1または2に記載の方法。
- 前記コスト関数J(w)は、雑音統計、雑音パワースペクトル密度(PSD)行列、信号統計、またはマイクロホンパワースペクトル密度(PSD)行列の1つに基づく、請求項5に記載の方法。
- 少なくとも1つの直接音の到来方向、または、前記第1のマイクロホンと前記第2のマイクロホンとの間の前記少なくとも1つの直接音の相対伝達関数の少なくとも1つを推定することと、
前記少なくとも1つの直接音の前記到来方向または前記相対伝達関数を使用して少なくとも1つの直接音抑圧を計算することであって、前記少なくとも1つの直接音抑圧の結果として、前記少なくとも1つの直接音が抑制されることになる、計算することと
をさらに含む、請求項1〜6のいずれか一項に記載の方法。 - 前記最適化問題に対する解は以下の通りであり、
wm(k,n)は前記m番目のマイクロホンにおけるマイクロホン信号の評価に基づく前記最適化問題の解であり、
bm(k,n)は推定空間コヒーレンスのベクトルであり、前記ベクトルの前記m’番目の要素は、前記m番目のマイクロホンと前記m’番目のマイクロホンとの間の前記拡散音の推定空間コヒーレンスであり、
α∈[0,1]は、それによって前記拡散音フィルタを、最小平均二乗誤差空間フィルタと、出力パワーを最小化するフィルタとの間でスケーリングすることができる、ユーザ定義の制御パラメータであり、
φdは拡散音パワーであり、
Φxは前記マイクロホン信号のパワースペクトル行列である、
請求項5〜7のいずれか一項に記載の方法。 - 補助拡散音フィルタに基づいて、前記拡散音パワーφdを推定することをさらに含む、請求項8に記載の方法。
- 前記拡散音フィルタの前記フィルタ係数を使用して、前記第1のマイクロホン信号と前記第2のマイクロホン信号との線形結合を実施することをさらに含む、請求項1〜10のいずれか一項に記載の方法。
- コンピュータまたは信号プロセッサ上で実行されるときに、請求項1〜11のいずれか一項に記載の方法を実施するための、コンピュータプログラムが格納されたコンピュータ可読媒体。
- 拡散音フィルタのためのフィルタ係数を取得する装置であって、
第1のマイクロホンによって捕捉される第1のマイクロホン信号内の第1の拡散音部分と、既知の様式で前記第1のマイクロホンから離間されている第2のマイクロホンによって捕捉される第2のマイクロホン信号内の第2の拡散音部分との間の空間コヒーレンスに基づいて、前記拡散音フィルタの前記フィルタ係数に対する線形抑圧を規定するように構成されている線形抑圧計算器と、
少なくとも1つの直接音の到来する方向、前記第1のマイクロホン信号および前記第2のマイクロホン信号に関する信号統計、ならびに、前記第1のマイクロホン信号および前記第2のマイクロホン信号に関する雑音統計のうちの少なくとも1つを計算するように構成されている計算器と、
前記フィルタ係数に対する前記線形抑圧を考慮しながら、前記少なくとも1つの直接音の前記到来する方向、前記信号統計および前記雑音統計の前記少なくとも1つに関する最適化問題を解くことによって、前記拡散音フィルタの前記フィルタ係数を決定するように構成されているフィルタ係数計算器と
を備えることを特徴とする、拡散音フィルタのためのフィルタ係数を取得する装置。 - 前記空間コヒーレンスは、前記第1のマイクロホンと前記第2のマイクロホンとの間の前記拡散音の相対伝達関数に基づく、請求項13に記載の装置。
- 前記装置は、
前記フィルタ係数計算器とは異なる、補助拡散音フィルタの補助フィルタ係数に対する線形抑圧を考慮しながら、異なる最適化問題を解くことによって、前記補助フィルタ係数を決定するように構成されている補助フィルタ係数計算器をさらに備え、
前記補助拡散音フィルタは、推定拡散音パワーを推定するように構成されており、
前記フィルタ係数計算器は、前記拡散音フィルタの前記フィルタ係数を決定するときに、前記推定拡散音パワーを考慮に入れるように構成されている、請求項13または14に記載の装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP13196672 | 2013-12-11 | ||
EP13196672.3 | 2013-12-11 | ||
EP14156014.4 | 2014-02-20 | ||
EP14156014.4A EP2884491A1 (en) | 2013-12-11 | 2014-02-20 | Extraction of reverberant sound using microphone arrays |
PCT/EP2014/076252 WO2015086377A1 (en) | 2013-12-11 | 2014-12-02 | Extraction of reverberant sound using microphone arrays |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017503388A JP2017503388A (ja) | 2017-01-26 |
JP2017503388A5 true JP2017503388A5 (ja) | 2017-12-07 |
JP6389259B2 JP6389259B2 (ja) | 2018-09-12 |
Family
ID=50230835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016534922A Active JP6389259B2 (ja) | 2013-12-11 | 2014-12-02 | マイクロホンアレイを使用した残響音の抽出 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9984702B2 (ja) |
EP (2) | EP2884491A1 (ja) |
JP (1) | JP6389259B2 (ja) |
CN (1) | CN105981404B (ja) |
RU (1) | RU2640742C1 (ja) |
WO (1) | WO2015086377A1 (ja) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2521649B (en) * | 2013-12-27 | 2018-12-12 | Nokia Technologies Oy | Method, apparatus, computer program code and storage medium for processing audio signals |
EP3113508B1 (en) * | 2014-02-28 | 2020-11-11 | Nippon Telegraph and Telephone Corporation | Signal-processing device, method, and program |
US10923132B2 (en) | 2016-02-19 | 2021-02-16 | Dolby Laboratories Licensing Corporation | Diffusivity based sound processing method and apparatus |
CN108886649B (zh) | 2016-03-15 | 2020-11-10 | 弗劳恩霍夫应用研究促进协会 | 用于生成声场描述的装置、方法或计算机程序 |
CN105869651B (zh) * | 2016-03-23 | 2019-05-31 | 北京大学深圳研究生院 | 基于噪声混合相干性的双通道波束形成语音增强方法 |
WO2018053050A1 (en) * | 2016-09-13 | 2018-03-22 | VisiSonics Corporation | Audio signal processor and generator |
US10187740B2 (en) * | 2016-09-23 | 2019-01-22 | Apple Inc. | Producing headphone driver signals in a digital audio signal processing binaural rendering environment |
US11528556B2 (en) | 2016-10-14 | 2022-12-13 | Nokia Technologies Oy | Method and apparatus for output signal equalization between microphones |
US9813833B1 (en) * | 2016-10-14 | 2017-11-07 | Nokia Technologies Oy | Method and apparatus for output signal equalization between microphones |
US10056091B2 (en) * | 2017-01-06 | 2018-08-21 | Bose Corporation | Microphone array beamforming |
US10219098B2 (en) * | 2017-03-03 | 2019-02-26 | GM Global Technology Operations LLC | Location estimation of active speaker |
CN106960672B (zh) * | 2017-03-30 | 2020-08-21 | 国家计算机网络与信息安全管理中心 | 一种立体声音频的带宽扩展方法与装置 |
GB2562518A (en) | 2017-05-18 | 2018-11-21 | Nokia Technologies Oy | Spatial audio processing |
EP3652735A1 (en) * | 2017-07-14 | 2020-05-20 | Fraunhofer Gesellschaft zur Förderung der Angewand | Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description |
EP3573058B1 (en) * | 2018-05-23 | 2021-02-24 | Harman Becker Automotive Systems GmbH | Dry sound and ambient sound separation |
JP7173356B2 (ja) * | 2019-08-08 | 2022-11-16 | 日本電信電話株式会社 | Psd最適化装置、psd最適化方法、プログラム |
JP7173355B2 (ja) * | 2019-08-08 | 2022-11-16 | 日本電信電話株式会社 | Psd最適化装置、psd最適化方法、プログラム |
CN112017684B (zh) * | 2020-08-27 | 2022-06-24 | 北京计算机技术及应用研究所 | 一种基于麦克风阵列的密闭空间混响消除方法 |
CN113257270B (zh) * | 2021-05-10 | 2022-07-15 | 中国科学技术大学 | 一种基于参考麦克风优化的多通道语音增强方法 |
CN115862665B (zh) * | 2023-02-27 | 2023-06-16 | 广州市迪声音响有限公司 | 一种回声混响效果参数的可视化曲线界面*** |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100493172B1 (ko) * | 2003-03-06 | 2005-06-02 | 삼성전자주식회사 | 마이크로폰 어레이 구조, 이를 이용한 일정한 지향성을갖는 빔 형성방법 및 장치와 음원방향 추정방법 및 장치 |
GB0321722D0 (en) * | 2003-09-16 | 2003-10-15 | Mitel Networks Corp | A method for optimal microphone array design under uniform acoustic coupling constraints |
GB0405455D0 (en) * | 2004-03-11 | 2004-04-21 | Mitel Networks Corp | High precision beamsteerer based on fixed beamforming approach beampatterns |
JP4177413B2 (ja) * | 2004-07-20 | 2008-11-05 | パイオニア株式会社 | 音響再生装置および音響再生システム |
US8036767B2 (en) * | 2006-09-20 | 2011-10-11 | Harman International Industries, Incorporated | System for extracting and changing the reverberant content of an audio input signal |
US9015051B2 (en) * | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
RU2343562C1 (ru) * | 2007-04-23 | 2009-01-10 | Федеральное государственное образовательное учреждение высшего профессионального образования "Санкт-Петербургский государственный университет кино и телевидения" "СПбГУКиТ" | Способ и электронное устройство оптимизации времени реверберации при передаче звуковых сигналов |
US8199942B2 (en) * | 2008-04-07 | 2012-06-12 | Sony Computer Entertainment Inc. | Targeted sound detection and generation for audio headset |
US8831936B2 (en) * | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
EP2539889B1 (en) * | 2010-02-24 | 2016-08-24 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus for generating an enhanced downmix signal, method for generating an enhanced downmix signal and computer program |
EP2375410B1 (en) * | 2010-03-29 | 2017-11-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal |
CN102859591B (zh) * | 2010-04-12 | 2015-02-18 | 瑞典爱立信有限公司 | 用于语音编码器中的噪声消除的方法和装置 |
US9100734B2 (en) * | 2010-10-22 | 2015-08-04 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation |
US9552840B2 (en) * | 2010-10-25 | 2017-01-24 | Qualcomm Incorporated | Three-dimensional sound capturing and reproducing with multi-microphones |
EP2444967A1 (en) * | 2010-10-25 | 2012-04-25 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Echo suppression comprising modeling of late reverberation components |
EP2708043B1 (en) * | 2011-05-11 | 2020-06-03 | Sennheiser Electronic GmbH & Co. KG | Method for efficient sound field control of a compact loudspeaker array |
JP5817366B2 (ja) | 2011-09-12 | 2015-11-18 | 沖電気工業株式会社 | 音声信号処理装置、方法及びプログラム |
JP5897343B2 (ja) * | 2012-02-17 | 2016-03-30 | 株式会社日立製作所 | 残響除去パラメータ推定装置及び方法、残響・エコー除去パラメータ推定装置、残響除去装置、残響・エコー除去装置、並びに、残響除去装置オンライン会議システム |
JP5738218B2 (ja) * | 2012-02-28 | 2015-06-17 | 日本電信電話株式会社 | 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム |
US9495591B2 (en) * | 2012-04-13 | 2016-11-15 | Qualcomm Incorporated | Object recognition using multi-modal matching scheme |
-
2014
- 2014-02-20 EP EP14156014.4A patent/EP2884491A1/en not_active Withdrawn
- 2014-12-02 WO PCT/EP2014/076252 patent/WO2015086377A1/en active Application Filing
- 2014-12-02 JP JP2016534922A patent/JP6389259B2/ja active Active
- 2014-12-02 CN CN201480066907.6A patent/CN105981404B/zh active Active
- 2014-12-02 RU RU2016127191A patent/RU2640742C1/ru active
- 2014-12-02 EP EP14805624.5A patent/EP3080806B1/en active Active
-
2016
- 2016-06-09 US US15/178,530 patent/US9984702B2/en active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2017503388A5 (ja) | ||
JP6389259B2 (ja) | マイクロホンアレイを使用した残響音の抽出 | |
EP2647221B1 (en) | Apparatus and method for spatially selective sound acquisition by acoustic triangulation | |
JP6636633B2 (ja) | 音響信号を向上させるための音響信号処理装置および方法 | |
TWI530201B (zh) | 經由自抵達方向估值提取幾何資訊之聲音擷取技術 | |
JP5814476B2 (ja) | 空間パワー密度に基づくマイクロフォン位置決め装置および方法 | |
RU2642353C2 (ru) | Устройство и способ для обеспечения информированной оценки вероятности и присутствия многоканальной речи | |
US8654990B2 (en) | Multiple microphone based directional sound filter | |
JP6547003B2 (ja) | サブバンド信号の適応混合 | |
JP6724905B2 (ja) | 信号処理装置、信号処理方法、およびプログラム | |
EP3275208B1 (en) | Sub-band mixing of multiple microphones | |
CN106031196B (zh) | 信号处理装置、方法以及程序 | |
JP4928382B2 (ja) | 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体 | |
JP2009020472A (ja) | 音処理装置およびプログラム | |
JP5815489B2 (ja) | 音源別音声強調装置、方法、プログラム | |
JP5698166B2 (ja) | 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム | |
JPWO2018167921A1 (ja) | 信号処理装置 | |
JP2015169901A (ja) | 音響処理装置 | |
Lawin-Ore et al. | Using statistical room acoustics for computing the spatially averaged performance of the multichannel Wiener filter based noise reduction | |
JP2014230085A (ja) | 音響処理装置 |