JP6113739B2 - 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 - Google Patents

音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 Download PDF

Info

Publication number
JP6113739B2
JP6113739B2 JP2014540396A JP2014540396A JP6113739B2 JP 6113739 B2 JP6113739 B2 JP 6113739B2 JP 2014540396 A JP2014540396 A JP 2014540396A JP 2014540396 A JP2014540396 A JP 2014540396A JP 6113739 B2 JP6113739 B2 JP 6113739B2
Authority
JP
Japan
Prior art keywords
noise
power
array
transfer function
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014540396A
Other languages
English (en)
Other versions
JP2014535232A (ja
JP2014535232A5 (ja
Inventor
コルドン,スベン
バトケ,ヨハン−マルクス
クルーガー,アレクサンダー
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2014535232A publication Critical patent/JP2014535232A/ja
Publication of JP2014535232A5 publication Critical patent/JP2014535232A5/ja
Application granted granted Critical
Publication of JP6113739B2 publication Critical patent/JP6113739B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/326Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • H04R29/005Microphone arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Stereophonic System (AREA)

Description

本発明は、音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置であって、逆マイクロホン・アレイ応答に等化フィルタが適用されるものに関する。
球状マイクロホン・アレイは、三次元音場を捕捉する能力をもたらす。音場を記憶し、処理する一つの方法は、アンビソニックス表現である。アンビソニックスは、スイートスポットとしても知られる原点のまわりの領域における音場を記述するために正規直交な球面関数を使う。有限個のアンビソニックス係数が音場を記述する場合、その記述の精度はアンビソニックス次数Nによって決定される。球状アレイの最大アンビソニックス次数はマイクロホン・カプセルの数によって制限され、その数はアンビソニックス係数の数O=(N+1)2以上である必要がある。
アンビソニックス表現の一つの利点は、音場の再生が、任意の所与のスピーカー配置に対して個々に適応されることができるということである。さらに、この表現は、ポストプロダクションにおいてビーム形成技法を使って、種々のマイクロホン特性のシミュレーションを可能にする。
Bフォーマットはアンビソニックスの一つの既知の例である。Bフォーマット・マイクロホンは、アンビソニックス次数1の音場を捕捉するために四面体上の四つのカプセルを必要とする。
1より大きい次数のアンビソニックスは高次アンビソニックス(HOA: Higher Order Ambisonics)と呼ばれ、HOAマイクロホンは典型的には剛体球上の球状マイクロホン・アレイ、たとえばmhAcousticsのアイゲンマイク(Eigenmike)である。アンビソニックス処理のためには、球の表面上の圧力分布がアレイのカプセルによってサンプリングされる。次いでサンプリングされた圧力がアンビソニックス表現に変換される。そのようなアンビソニックス表現は音場を表現するが、マイクロホン・アレイの影響を含む。捕捉される音場に対するマイクロホンの影響は、逆マイクロホン・アレイ応答を使って除去される。逆マイクロホン・アレイ応答は平面波の音場をマイクロホン・カプセルにおいて測定される圧力に変換する。それは、カプセルの指向性およびマイクロホン・アレイの音場との干渉をシミュレートする。
国際公開WO03/061336A1
M.A.Poletti、"Three-Dimensional Surround Sound Systems Based on Spherical Harmonics"、Journal Audio Engineering Society、vol.53, no.11, pp.1004-1025、2005年 Morag Agmon, Boaz Rafaely、"Beamforming for a Spherical-Aperture Microphone"、IEEE, pp.227-230、2008年 Johann-Markus Batke, Florian Keiler、"Using VBAP-Derived Panning Functions for 3D Ambisonics Decoding"、Proc. of the 2nd International Symposium on Ambisonics and Spherical Acoustics、6-7 May 2010、Paris, France Boaz Rafaely、"Plane-wave decomposition of the sound field on a sphere by spherical convolution"、J. Acoustical Society of America, vol.116, no.4, pp.2149-2157、2004年 mh acousticsのホームページ、オンライン(http://www.mhacoustics.com)、2007年2月1日アクセス F. Zotter、"Sampling Strategies for Acoustic Holography/Holophony on the Sphere"、Proceedings of the NAG-DAGA, 23-26 March 2009, Rotterdam J¨org Fliege, Ulrike Maier、"A Two-Stage Approach for Computing Cubature Formulae for the Sphere"、Technical report, 1996, Fachbereich Mathematik, Universit¨at Dortmund, Germany Y.Shefeng, S.Haohai, U.P.Svensson, M.Xiaochuan, J.M.Hovem、"Optimal Modal Beamforming for Spherical Microphone Arrays"、IEEE Transactions on Audio, Speech, and language processing, vol.19, no.2, pp.361-371, February 2011 M.Agmon, B.Rafaely, J.Tabrikian、"Maximum Directivity Beamformer for Spherical-Aperture Microphones", 2009 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics WASPAA '09, Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing, pp.153-156, 18-21 October 2009, New Paltz, NY, USA
球状マイクロホン・アレイによって捕捉される再構成されたアンビソニックス信号の歪められたスペクトル・パワーを等化するべきである。一方では、その歪みは、空間的なエイリアシング信号パワーによって引き起こされる。他方では、剛体球上の球状マイクロホン・アレイについてのノイズ削減のため、球面調和関数表現において高次係数が欠けており、これらの欠けている係数が、特にビーム形成アプリケーションについて、再構成される信号のスペクトル・パワー・スペクトル(spectral power spectrum)を不均衡化する。
本発明によって解決されるべき課題は、球状マイクロホン・アレイによって捕捉される再構成されたアンビソニックス信号のスペクトル・パワーの歪みを減らし、該スペクトル・パワーを等化することである。
この課題は、請求項1において開示される方法によって解決される。この方法を利用する装置が請求項2において開示される。
本発明の処理は、再構成されたアンビソニックス信号の周波数スペクトルを均衡化するフィルタを決定するはたらきをする。フィルタリングされ、再構成されたアンビソニックス信号の信号パワーが解析され、それにより平均空間的エイリアシング・パワーおよび欠けている高次アンビソニックス係数の影響が、アンビソニックス復号およびビーム形成のアプリケーションのために記述される。これらの結果から、再構成されたアンビソニックス信号の平均周波数スペクトルを均衡化する、使うのが簡単な等化フィルタが導出される:使用される復号係数および記録の信号対雑音比SNRに依存して、原点における平均パワーが推定される。等化フィルタは、以下から得られる:
・平均音場パワーとマイクロホン・アレイ・カプセルからのノイズ・パワーとの間の信号対雑音比の推定。
・拡散音場についての原点における平均空間的信号パワーの、波数k毎の計算。そのシミュレーションは、すべての信号パワー成分(参照、エイリアシングおよびノイズ)を含む。
・等化フィルタの周波数応答が所与の参照パワーと原点における計算された平均空間的信号パワーとの分数の平方根から形成される。
・適応された伝達関数Fn,array(k)を得るために、等化フィルタの周波数応答に(波数k毎に)、信号対雑音比推定から導出されるノイズ最小化フィルタの(離散的な有限波数kにおける各次数nについての)伝達関数およびマイクロホン・アレイの逆伝達関数を乗算。
結果として得られるフィルタは、記録された音場の球面調和関数表現に、あるいは再構成された信号に適用される。そのようなフィルタの設計はきわめて計算量が多い。有利には、研鑽量の多い処理は、一定のフィルタ設計パラメータの計算を使うことによって、削減できる。これらのパラメータは、所与のマイクロホン・アレイについては一定であり、ルックアップテーブルに格納することができる。これは、扱える程度の計算量で、時間変化する適応フィルタ設計を容易にする。有利には、フィルタは高周波数において持ち上げられた(raised)平均信号パワーを除去する。さらに、フィルタは、低周波数において球面調和関数表現でのビーム形成デコーダの周波数応答を均衡化する。本発明のフィルタを使うことなくしては、音を記録する球状マイクロホン・アレイからの再構成された音は不均衡である。記録された音場のパワーがすべての周波数サブバンドにおいては正しく再構成されないからである。
原理的には、本発明の方法は、剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号を処理するのに好適である。本方法は:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号を、球面調和関数またはアンビソニックス表現An m(t)に変換する段階と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算する段階と;
・参照、エイリアシングおよびノイズ信号パワー成分を使って、拡散音場について原点での平均空間的信号パワーを波数k毎に計算し、
等化フィルタの周波数応答を、所与の参照パワーと原点における前記平均空間的信号パワーとの分数の平方根から形成し、
適応された伝達関数Fn,array(k)を得るために、前記等化フィルタの前記周波数応答に、波数k毎に、前記信号対雑音比推定SNR(k)から導出されるノイズ最小化フィルタの、離散的な有限波数kにおける各次数nについての、伝達関数および前記マイクロホン・アレイの逆伝達関数を乗算する段階と;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数表現An m(t)に適用し、結果として適応された方向性係数dn m(t)を与える段階とを含む。
原理的には、本発明の装置は、剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号を処理するのに好適である。本装置は:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号を、球面調和関数またはアンビソニックス表現An m(t)に変換するよう適応されている手段と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算するよう適応されている手段と;
・参照、エイリアシングおよびノイズ信号パワー成分を使って、拡散音場について原点での平均空間的信号パワーを波数k毎に計算し、
等化フィルタの周波数応答を、所与の参照パワーと原点における前記平均空間的信号パワーとの分数の平方根から形成し、
適応された伝達関数Fn,array(k)を得るために、前記等化フィルタの前記周波数応答に、波数k毎に、前記信号対雑音比推定SNR(k)から導出されるノイズ最小化フィルタの、離散的な有限波数kにおける各次数nについての、伝達関数および前記マイクロホン・アレイの逆伝達関数を乗算する、よう適応されている手段と;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数表現An m(t)に適用し、結果として適応された方向性係数dn m(t)を与えるよう適応されている手段とを含む。
本発明の有利な追加的実施形態はそれぞれの従属請求項において開示される。
本発明の例示的な実施形態について、付属の図面を参照しつつ述べる。
剛体球上の32個のカプセルをもつマイクロホン・アレイについての結果として得られるスピーカー重みからの参照、エイリアシングおよびノイズ成分のパワーを示す図である。 SNR(k)=20dBについてのノイズ削減フィルタを示す図である。 通常のアンビソニックス・デコーダを使う、図2の最適化フィルタ後の重み成分の平均パワーを示す図である。 Dn ml)=Yn m[0,0]T)として、ビーム形成を使うノイズ最適化フィルタが適用されたのちの重み成分の平均パワーを示す図である。 通常のアンビソニックス・デコーダおよび20dBのSNR(k)について最適化されたアレイ応答を示す図である。 ビーム形成デコーダおよび20dBのSNR(k)について最適化されたアレイ応答を示す図である。 本発明に基づく適応アンビソニックス処理のブロック図である。 通常のアンビソニックス復号を使って、ノイズ最適化フィルタFn(k)およびフィルタFEQ(k)が適用されたのちの結果として得られる重みの平均パワーを示し、それにより最適化された重み、参照重みおよびノイズ重みのパワーが比較される図である。 Dn ml)=Yn m[0,0]T)として、ビーム形成デコーダを使って、ノイズ最適化フィルタFn(k)およびフィルタFEQ(k)が適用されたのちの結果として得られる重み成分の平均パワーを示し、それにより最適化された重み、参照重みおよびノイズ重みのパワーが比較される図である。
〈球状マイクロホン・アレイ処理――アンビソニックスの理論〉
アンビソニックス復号は、平面波の音場を放射しているスピーカーを仮定することによって定義される。非特許文献1参照:
Figure 0006113739
L個のスピーカーの配置はアンビソニックス係数dn m(k)に格納された三次元音場を再構成する。処理は、各波数
k=2πf/csound (2)
について別個に実行される。ここで、fは周波数、csoundは音速である。インデックスnは0から有限の次数Nまで走り、一方、インデックスmは各インデックスnについて−nからnまで走る。したがって、係数の総数はO=(N+1)2である。スピーカー位置は球面座標において方向ベクトルΩl=[Θll]Tによって定義され、[・]Tはベクトルの転置バージョンを表わす。
式(1)は、アンビソニックス係数dn m(k)のスピーカー重みw(Ωl,k)への変換を定義する。これらの重みはスピーカーの駆動関数である。すべてのスピーカー重みの重ね合わせが音場を再構成する。
復号係数Dn ml)は一般的なアンビソニックス復号処理を記述している。これは、非特許文献2のセクション3に示されるビーム・パターンの共役複素係数(ω* nm)および前述した非特許文献1のセクション3.2で与えられているモード・マッチング復号行列の諸行を含む。非特許文献3のセクション4に記載されている別の処理方法は、任意の三次元スピーカー配置について復号行列を計算するためにベクトル・ベースの振幅パン(amplitude panning)を使う。これらの行列の行要素も係数Dn ml)によって記述される。
アンビソニックス係数dn m(k)は、非特許文献4のセクション3に記載されているように、常に平面波の重ね合わせに分解されることができる。したがって、解析は方向Ωsから入射する平面波の係数:
Figure 0006113739
に限定されることができる。
平面波の係数dn m plane(k)は、平面波の音場を放射しているスピーカーという想定について定義される。原点における圧力は、波数kについてP0(k)によって定義される。共役複素球面調和関数Yn ms)*は平面波の方向性係数を表わす。上記非特許文献1で与えられている球面調和関数Yn ms)の定義を使う。
球面調和関数はアンビソニックス表現の正規直交基底関数であり、次式を満たす。
Figure 0006113739
球状マイクロホン・アレイは、球の表面上の圧力をサンプリングする。ここで、サンプリング点の数はアンビソニックス係数の数O=(N+1)2以上でなければならない。アンビソニックス次数Nについて。さらに、サンプリング点は球の表面上に一様に分布している必要がある。ここで、O個の点の最適な分布は次数N=1についてのみ厳密に知られている。より高い次数については、球のサンプリングのよい近似が存在する。非特許文献5、非特許文献6参照。
最適なサンプリング点Ωcについて、式(4)からの積分は、式(6)からの離散的な和と等価である。
Figure 0006113739
ここで、Cはカプセルの総数であり、C≧(N+1)2について、n'≦Nであり、n≦Nである。
非最適なサンプリング点について安定した結果を達成するために、共役複素球面調和関数は、擬似逆行列
Figure 0006113739
の諸列によって置換されることができる。この擬似逆行列は、L×Oの球面調和関数行列Yから得られる。ここで、球面調和関数Yn mc)のO個の係数がYの行要素である。前述したMoreau/Daniel/Bertetの論文のセクション3.2.2参照。
Figure 0006113739
以下では、この擬似逆行列の列要素がYn mc)と表わされると定義され、よって、式(6)からの正規直交条件も、
Figure 0006113739
なので、満たされる。ここで、C≧(N+1)2について、n'≦Nであり、n≦Nである。
球状マイクロホン・アレイが球の表面上にほぼ一様に分布したカプセルを有しており、カプセルの数がOより多いと仮定すると、
Figure 0006113739
が成り立つ。
〈球状マイクロホン・アレイ処理――処理のシミュレーション〉
剛体の(硬い、固定した)球上の球状マイクロホン・アレイについての完全なHOA処理チェーンは、カプセルにおける圧力の推定、HOA係数の計算およびスピーカー重みへの復号を含む。球面調和関数表現でのマイクロホン・アレイの記述は、所与のデコーダについて原点での平均スペクトル・パワーの推定を可能にする。モード・マッチング・アンビソニックス・デコーダおよび単純なビーム形成デコーダについてのパワーが評価される。スイートスポットにおける推定された平均パワーが、等化フィルタを設計するために使われる。
以下のセクションは、w(k)の参照重みwref(k)、空間的エイリアシング重みwalias(k)およびノイズ重みwnoise(k)への分解を記述する。エイリアシングは、有限次数Nについての連続的な音場のサンプリングによって引き起こされ、ノイズは、各カプセルについて導入される空間的に無相関な信号部分をシミュレートする。空間的エイリアシングは所与のマイクロホン・アレイについて除去できない。
〈球状マイクロホン・アレイ処理――カプセル信号のシミュレーション〉
剛体球の表面上のマイクロホン・アレイについての入射平面波の伝達関数は、上述した非特許文献1のセクション2.2、式(19)において定義されている:
Figure 0006113739
ここで、hn (1)(kr)は第一種ハンケル関数であり、半径rは球の半径Rに等しい。伝達関数は剛体球上の圧力を散乱させる物理的な原理から導出される。つまり、剛体球の表面上では動径方向速度が0になる。換言すれば、はいってくる音場と散乱される音場の動径微分(radial derivation)の重ね合わせが0である。書籍『Fourier Acoustics』のセクション6.10.3を参照。このように、Ωsから入射する平面波についての位置Ωにおける球の表面上の圧力は、Moreau/Daniel/Bertetの論文のセクション3.2.1の式(21)において、次によって与えられる。
Figure 0006113739
等方的ノイズ信号Pnoisec,k)はトランスデューサ・ノイズをシミュレートするために加えられる。ここで、「等方的」というのは、諸カプセルのノイズ信号が空間的に相関していないことを意味する。これは時間領域における相関は含まない。圧力は、マイクロホン・アレイの最大次数Nについて計算された圧力Prefc,kR)と、残りの次数からの圧力に分離することができる。上述したRafaelyの論文"Analysis and design…"におけるセクション7、式(24)参照。残りの次数からの圧力Paliasc,kR)は、マイクロホン・アレイの次数がこれらの信号成分を再構成するために十分でないので、空間的エイリアシング圧力と呼ばれる。よって、カプセルcにおいて記録される全圧力は次式によって定義される。
Figure 0006113739
〈球状マイクロホン・アレイ処理――アンビソニックス・エンコード〉
アンビソニックス係数dn m(k)は、式(13a)において与えられる式(11)の逆によって、カプセルにおける圧力から得られる。上述したMoreau/Daniel/Bertetの論文のセクション3.2.2の式(26)参照。球面調和関数Yn mc)は、式(8)を使ってYn mc)によって反転され、伝達関数bn(kR)はその逆数によって等化される:
Figure 0006113739
アンビソニックス係数dn m(k)は、式(13a)および(12a)を使って、式(13b)および(13c)に示されるように、参照係数dn m ref(k)、エイリアシング係数dn m alias(k)およびノイズ係数dn m noise(k)に分離されることができる。
〈球状マイクロホン・アレイ処理――アンビソニックス復号〉
最適化は、原点での結果として得られるスピーカー重みw(k)を使う。すべてのスピーカーは原点に対して同じ距離をもち、よってすべてのスピーカー重みの和がw(k)になることが想定される。式(14)は、式(1)および(13b)からw(k)を与える。ここで、Lはスピーカーの数である。
Figure 0006113739
式(14b)は、w(k)も三つの重みwref(k)、walias(k)およびwnoise(k)に分離されることができることを示している。簡単のため、上述したRafaelyの論文"Analysis and design…"のセクション7、式(24)で与えられている位置決め誤差はここでは考えていない。
復号では、参照係数は、次数nの合成的に生成される平面波が生成するであろう重みである。下記の式(15a)では、式(12b)からの参照圧力Prefc,kR)が式(14a)に代入されており、圧力信号Paliasc,kR)およびPnoisec,kR)は無視されている(すなわち0と置かれる)。
Figure 0006113739
c、n′およびm′についての和は式(8)を使って消去でき、よって式(15a)は式(3)からのアンビソニックス表現における平面波の重みの和に単純化できる。よって、エイリアシング信号およびノイズ信号が無視されるなら、次数Nの平面波の理論上の係数は、マイクロホン・アレイ記録から完璧に再構成されることができる。
ノイズ信号wnoise(k)の結果として得られる重みは、式(14a)から、また式(12b)からPnoisec,kR)のみを使って、次式によって与えられる。
Figure 0006113739
式(14a)において式(12b)からのPaliasc,kR)の項を代入し、他の圧力信号を無視すると、
Figure 0006113739
となる。
結果として得られるエイリアシング重みwalias(k)は式(8)からの正規直交条件によって単純化されることはできない。インデックスn′がNより大きいからである。
エイリアス重みのシミュレーションは、十分な精度をもってカプセル信号を表わすアンビソニックス次数を必要とする。上述したMoreau/Daniel/Bertetの論文のセクション2.2.2の式(14)では、アンビソニックス音場再構成についての打ち切り誤差の解析が与えられている。
Figure 0006113739
について、そこそこの精度の音場が得られると述べられている。ここで、
Figure 0006113739
は最も近い整数への切り上げを表わす。この精度は、シミュレーションの上限周波数fmaxについて使われる。よって、アンビソニックス次数
Figure 0006113739
が、各波数のエイリアシング圧力のシミュレーションのために使われる。これは、上記の上限周波数における受け容れられる精度を与え、低い周波数については精度は増しさえする。
〈球状マイクロホン・アレイ処理――スピーカー重みの解析〉
図1は、剛体球上の32個のカプセルをもつマイクロホン・アレイについて、方向Ωs=[0,0]Tからの平面波についての結果的なスピーカー重みからの重み成分a)wref(k)、b)wnoise(k)およびc)walias(k)のパワーを示している(上述した非特許文献2からのアイゲンマイクがシミュレーションのために使われた)。マイクロホン・カプセルは、正規直交条件が満たされるよう、R=4.2cmをもつ球の表面上に一様に分布している。このアレイによってサポートされる最大のアンビソニックス次数Nは4である。上述した非特許文献1において記述されるモード・マッチング処理が、非特許文献7に従って25個の一様に分布したスピーカー位置について復号係数Dn ml)を得るために使われる。ノード番号はhttp://www.mathematik.uni-dortmund.de/lsx/research/projects/fliege/nodes/nodes.htmlで示されている。
参照重みwref(k)のパワーは周波数範囲全体にわたって一定である。結果として得られるノイズ重みwnoise(k)は低周波で高いパワーを示し、より高い周波数で減少する。ノイズ信号またはパワーは、分散20dBをもつ(すなわち、上記平面波のパワーより20dB低い)、正規分布した偏りのない擬似ランダム・ノイズによってシミュレートされる。エイリアシング・ノイズwalias(k)は低周波では無視できるが、周波数の上昇とともに増大し、10kHzより上では参照パワーを超える。エイリアシング・パワー曲線の傾きは、平面波方向に依存する。しかしながら、平均傾向はすべての方向について一貫している。二つの誤差信号wnoise(k)およびwalias(k)は参照重みを、異なる周波数範囲において歪める。さらに、これらの誤差信号は互いに独立である。したがって、二段階の等化処理が提案される。第一段階では、ノイズ信号は、同じ出願人によって同日に出願され、同じ発明者をもつ部内参照番号PD110039をもつ欧州出願において記述される方法を使って補償される。第二段階では、全体的な信号パワーがエイリアシング信号および第一の処理段階の考慮のもとで、等化される。
第一段階では、参照重みと歪められた参照重みとの間の平均二乗誤差がすべての入射平面波方向について最小化される。エイリアシング信号からの重みwalias(k)は無視される。というのも、walias(k)は、アンビソニックス表現の次数によって空間的に帯域制限された後では補正できないからである。これは、サンプリングされ帯域制限された時間信号からエイリアシングが除去できない時間領域エイリアシングと等価である。第二段階では、すべての平面波方向について、再構成された重みの平均パワーが推定される。再構成された重みのパワーを参照重みのパワーに対してバランスさせるフィルタが下記で記述される。そのフィルタは、スイートスポットにおいてのみパワーを等化する。しかしながら、それでもエイリアシング誤差は高周波については音場表現を乱す。
マイクロホン・アレイの空間的周波数限界は、空間的エイリアシング周波数と呼ばれる。空間的エイリアシング周波数
Figure 0006113739
は諸カプセルの距離から計算される(特許文献1参照)。これは、4.2cmに等しい半径Rをもつアイゲンマイクについては約5594Hzである。
〈最適化――ノイズ削減〉
ノイズ削減は、上述した内部参照番号PD110039をもつ欧州出願において記述されている。そこでは、平均音場パワーとトランスデューサ・ノイズとの間の信号対雑音比SNR(k)が推定されている。推定されたSNR(k)から、次の最適化フィルタが設計されることができる:
Figure 0006113739
伝達関数Fn(k)のパラメータはマイクロホン・カプセルの数および波数kについての信号対雑音比に依存する。このフィルタは、アンビソニックス・デコーダとは独立である。これは、このフィルタが三次元アンビソニックス復号および方向性ビーム形成について有効であることを意味する。SNR(k)は、上述した内部参照番号PD110039をもつ欧州出願から得ることができる。このフィルタは、低周波についてのアンビソニックス表現の次数を制限する高域通過フィルタである。このフィルタのカットオフ周波数は、SNR(k)がより高くなると低下する。20dBのSNR(k)についてのこのフィルタの伝達関数Fn(k)が、アンビソニックス次数0から4についてそれぞれ図2のaからeに示されている。ここで、伝達関数は、各次数nについての高域通過特性をもつが、より高い次数ほどカットオフ周波数が増している。カットオフ周波数は、上述したMoreau/Daniel/Bertetの論文のセクション4.1.2に記述されている正規化パラメータλとともに低下する。したがって、低周波数についてより高い次数のアンビソニックス係数を得るには、大きなSNR(k)が必要とされる。
最適化された重みw'(k)は次式から計算される。
Figure 0006113739
結果として得られるw'noise(k)の平均パワーは次のセクションにおいて評価される。
〈最適化――スペクトル・パワー等化〉
最適化された重みw'(k)の平均パワーはその二乗された絶対値期待値から得られる。ノイズ重みw'noise(k)は重みw'ref(k)およびw'alias(k)と空間的に無相関であり、よってノイズ・パワーは式(23a)に示されるように独立して計算されることができる。参照およびエイリアシング重みのパワーは、式(23b)から導出される。式(22)(15a)および(17)の組み合わせにより式(23c)が得られるが、式(22)においてw'noise(k)は無視している。二乗された絶対値の展開は式(4)を使って式(23c)および(23d)を単純化する。
Figure 0006113739
最適化された誤差重みw'noise(k)のパワーは、式(23e)において与えられる。E{|w'noise(k)|2}の導出は、上述した内部参照番号PD110039をもつ欧州出願において記述されている。
結果的なパワーは、使用される復号処理に依存する。しかしながら、通常の三次元アンビソニックス復号(Ambisonics decoding)については、すべての方向がスピーカー配置によってカバーされることが想定される。この場合、0より大きい次数をもつ係数は、式(23)において与えられる復号係数Dn ml)の和によって消去される。つまり、原点における圧力は、0次信号と等価であり、よって低周波での欠けている高次係数はスイートスポットにおけるパワーを低下させない。
これは、アンビソニックス表現のビーム形成(beam forming)については異なる。というのも、特定の方向からの音のみが再構成されるからである。ここでは、Dn ml)のすべての係数が原点でのパワーに寄与するよう、一つのスピーカーが使われる。こうして、低周波についての軽減された高次係数が、高周波に比べて重みw'(k)のパワーを変えている。
このことは、式(24)において与えられる参照重みのパワーについて、次数Nを変えることによって完璧に説明できる。
Figure 0006113739
式(24)の導出は、上述した内部参照番号PD110039をもつ欧州出願において与えられている。パワーは、Dn ml)の二乗された絶対値の和と等価である。よって、一つのスピーカーlについて、パワーは次数Nとともに増大する。
しかしながら、アンビソニックス復号については、すべてのスピーカー復号係数Dn ml)の和は高次係数を除去し、よって0次係数のみがスイートスポットにおけるパワーに寄与する。こうして、低周波における欠けているHOA係数は、ビーム形成についてはw'(k)のパワーを変えるが、アンビソニックス復号についてはそうではない。
ノイズ最適化フィルタから得られるw'(k)の平均パワー成分が、通常のアンビソニックス復号について図3に示されている。図3のbは参照+エイリアス・パワーを示し、図3のcはノイズ・パワーを示し、図3のaは両者の和を示す。ノイズ・パワーは1kHzの周波数までは、−35dBに低下させられている。1kHzより上では、ノイズ・パワーは−10dBまで線形に増大する。結果として得られるノイズ・パワーは、周波数8kHzまではPnoisec,k)=−20dBより小さい。10kHzより上では全パワーは10dB上げられる。これはエイリアシング・パワーによって引き起こされる。10kHzより上では、マイクロホン・アレイのHOA次数は、Rに等しい半径をもつ球についての表面上の圧力分布を十分に記述しない。結果として、得られるアンビソニックス係数によって引き起こされる平均パワーは参照パワーより大きい。
図4は、L=1について復号係数Dn ml)=Yn m[0,0]T)についてw'(k)のパワー成分を示している。これは、上述した非特許文献2に示される、方向Ω=[0,0]Tにおけるビーム形成として解釈されることができる。図4のbは、参照+エイリアス・パワーを示し、図4のcはノイズ・パワーを示し、図4のaは両者の和を示す。パワーは低周波から高周波にかけて上昇し、3kHzから6kHzまでほぼ一定に留まり、それから再び著しく上昇する。最初の上昇は高次係数の軽減によって引き起こされる。というのも、3kHzはほぼ、図2のeに示される四次係数についてのFn(k)のカットオフ周波数であるからである。二番目の上昇は、アンビソニックス復号について論じた空間的エイリアシング・パワーによって引き起こされる。
ここで、w'(k)の平均パワーについての等化フィルタが決定される。このフィルタは、使用される復号係数Dn ml)に強く依存し、したがってこれらの復号係数Dn ml)がわかっている場合にのみ使用されることができる。
通常のアンビソニックス復号については、
Figure 0006113739
と想定できる。しかしながら、適用されるアンビソニックス・デコーダがほとんどその想定を満たすことが保証されるべきである。
実数値の等化フィルタFEQ(k)は式(26a)において与えられる。これは、w'(k)の平均パワーをwref(k)の参照パワーに補償する。式(26b)では、式(23e)および(27)が使われており、式(26b)においてFEQ(k)がSNR(k)の関数でもあることを示すために使われている。
Figure 0006113739
問題は、フィルタFEQ(k)はフィルタFn(k)に依存し、よってSNR(k)の各変化について、両方のフィルタを設計し直す必要があるということである。エイリアシングおよび参照誤差E{|w'ref(k)+w'alias(k)|2}のパワーをシミュレートするために使われる高いアンビソニックス次数のため、フィルタ設計の計算上の複雑さは大きい。適応フィルタリングについて、この複雑さは、所与のマイクロホン・アレイについての一定のフィルタ設計係数の組を生成するために計算量の大きい処理を一回のみ実行することによって軽減することができる。式(28)では、これらのフィルタ係数の導出が与えられる。
Figure 0006113739
式(28d)では、きわめて複雑なE{|w'ref(k)+w'alias(k)|2}の計算が0からNまでのnの和と、nからNまでのn″についての従属的な和とに分離できることが示されている。これらの和の各要素はフィルタFn(k)と、その共役複素値と、An'n m'とその共役複素値の積のn'およびm'についての無限和との乗算である。無限和はn'=Nmaxまでのその有限和によって近似される。これらの和の結果は、nおよびn″の各組み合わせについての一定のフィルタ設計係数を与える。これらの係数は、所与のアレイについて一度計算され、時間変化する信号対雑音比適応フィルタ設計のためにルックアップテーブルに格納しておくことができる。
〈最適化――最適化されたアンビソニックス処理〉
アンビソニックス・マイクロホン・アレイ処理の実際的な実装では、最適化されたアンビソニックス係数dn m opt(k)は
Figure 0006113739
から得られる。これは、カプセルcについての和と、各次数nおよび波数kについての適応伝達関数とを含んでいる。この和は、球の表面上のサンプリングされた圧力分布をアンビソニックス表現に変換し、広帯域信号については、時間領域で実行できる。この処理段階は、時間領域の圧力信号P(Ωc,t)を第一のアンビソニックス表現An m(t)に変換する。
第二の処理段階では、最適化された伝達関数
Figure 0006113739
が、第一のアンビソニックス表現An m(t)から方向情報項目を再構成する。伝達関数bn(kR)の逆数がAn m(t)を方向係数dn m(t)に変換する。ここで、サンプリングされた音場は、球の表面上で散乱された平面波の重ね合わせによって生成されると想定している。係数dn m(t)は上述した非特許文献4のセクション3、式(14)において記述される音場の平面波分解を表わしており、この表現が、基本的にはアンビソニックス信号の伝送のために使用される。SNR(k)に依存して、最適化伝達関数Fn(k)は、ノイズによって覆われるHOA係数を除去するために、高次係数の寄与を減らす。再構成された信号のパワーが既知のまたは想定されるデコーダ処理についてフィルタFEQ(k)によって等化される。
第二の処理段階の結果は、An m(t)の所望される時間領域フィルタとの畳み込みを与える。通常のアンビソニックス復号(Ambisonics decoding)についての結果として得られる最適化されたアレイ応答は図5に示されており、ビーム形成(beam forming)デコーダについての結果として得られる最適化されたアレイ応答は図6に示されている。いずれの図でも、伝達関数a)からe)はアンビソニックス次数0から4にそれぞれ対応する。
係数An m(t)の処理は、フィルタの伝達関数がFn,array(k)によって決定される線形フィルタリング演算と見なすことができる。これは、周波数領域でも時間領域でも実行できる。伝達関数Fn,array(k)の逐次乗算のための係数An m(t)の周波数領域への変換のために、FFTを使うことができる。その積の逆FFTが時間領域係数dn m(t)を与える。この伝達関数処理は、重複加算(overlap-add)または重複保存(overlap-save)法を使った高速畳み込みとしても知られる。あるいはまた、線形フィルタはFIRフィルタによって近似でき、該FIRフィルタの係数は伝達関数Fn,array(k)から、逆FFTでそれを時間領域に変換し、巡回シフトを実行し、結果として得られるフィルタ・インパルス応答に漸減する窓を適用して対応する伝達関数を平滑化することにより、計算できる。次いで線形フィルタリング・プロセスは時間領域で、nとmの各組み合わせについて伝達関数Fn,array(k)の時間領域係数と係数An m(t)との畳み込みによって実行される。
本発明の適応的なブロック・ベースのアンビソニックス処理は図7に描かれている。上の信号経路では、マイクロホン・カプセル信号の時間領域圧力信号P(Ωc,t)がステップまたは段階71において、式(13a)を使ってアンビソニックス表現An m(t)に変換される。ここではマイクロホン伝達関数bn(kR)による除算は実行されず(よってdn m(k)ではなくAn m(t)が計算される)、その代わりステップ/段階72において実行される。次いでステップ/段階72は、係数dn m(t)を得るために、記載された線形フィルタリング演算を時間領域または周波数領域において実行する。これにより、マイクロホン/アレイ応答がAn m(t)から除去される。第二の処理経路は、伝達関数Fn,array(k)の自動適応フィルタ設計のために使われる。ステップ/段階73は、考えられる時間期間(諸サンプルのブロック)について信号対雑音比SNR(k)の推定を実行する。この推定は、有限個の離散的な波数kについて周波数領域において実行される。よって、考慮される圧力信号P(Ωc,t)は、たとえばFFTを使って周波数領域に変換される必要がある。SNR(k)値は二つのパワー信号|Pnoise(k)|2および|P0(k)|2によって指定される。ノイズ信号のパワー|Pnoise(k)|2は所与のアレイについては一定で、カプセルによって生成されるノイズを表わす。平面波のパワー|P0(k)|2は圧力信号P(Ωc,t)から推定される。この推定はさらに、上述した内部参照番号PD110039をもつ欧州出願のセクション「SNR推定」において記述されている。推定されたSNR(k)から、n≦Nとして伝達関数Fn,array(k)がステップ/段階74において、周波数領域において、式(30)、(26c)、(21)および(10)を使って設計される。フィルタ設計は、ウィーナー・フィルタおよび逆アレイ応答または逆伝達関数1/bn(kR)を使うことができる。すると、フィルタ実装は、ステップ/段階72の時間または周波数領域における対応する線形フィルタ処理に適応される。
本発明の処理の結果について以下で論じる。よって、式(26c)からの等化フィルタFEQ(k)は期待値E{|w'(k)|2}に適用される。結果として得られるパワーE{|w'(k)|2}、参照パワーE{|wref(k)|2}および図3からの通常のアンビソニックス復号および図4からのビーム形成の例についての結果として得られるノイズ・パワーが論じられる。通常のアンビソニックス・デコーダについての結果として得られるパワー・スペクトルは図8に描かれており、ビーム形成デコーダの場合は図9に描かれている。ここで、曲線a)ないしc)はそれぞれ|wopt|2、|wref|2および|wnoise|2を示す。
参照(reference)および最適化された(optimised)重みのパワーは同一であり、よって、結果として得られる重みは均衡した周波数スペクトルをもつ。低周波数では、スイートスポットにおける結果として得られる信号対雑音比は、20dBの前記所与のSNR(k)に比べ、通常のアンビソニックス復号については増大しており、ビーム形成復号については減少している。高周波数では、信号対雑音比は両方のデコーダについて前記所与のSNR(k)に等しい。しかしながら、ビーム形成復号については、高周波数でのSNRは低周波数でのSNRより大きく、一方、アンビソニックス・デコーダについては、高周波数でのSNRは低周波数でのSNRに対して小さい。ビーム形成デコーダの低周波数でのより小さなSNRは、高次係数がないことによって引き起こされている。図9では、平均ノイズ・パワーが図1に比べ低下している。他方、〈最適化――スペクトル・パワー等化〉のセクションで論じたように、高次係数がないために、低周波数では信号パワーも低下している。結果として、信号とノイズ・パワーの間の距離はより小さくなっている。
さらに、結果として得られるSNRは使用される復号係数Dn ml)に強く依存する。例示的なビーム・パターンは、強い高次係数をもつ狭ビーム・パターンである。より幅広いビームをもつビーム・パターンを生じる復号係数はSNRを増大させうる。これらのビームは低次において強い係数をもつ。低周波数での限られた次数に適応するためいくつかの周波数帯域について異なる復号係数を使うことによって、よりよい結果を達成できる。
結果として得られるSNRを最小化する最適化されたビーム形成のための他の諸方法であって、特定のステアリング方向のための数値的な最適化によって復号係数Dn ml)が得られるものが存在する。非特許文献8で提示されている最適モード・ビーム形成および非特許文献9で論じられている最大指向性ビーム形成が、最適化されたビーム形成の二つの例である。
例示的なアンビソニックス・デコーダは、各スピーカー重みが、ビーム形成の例で使われた復号係数から計算される、モード・マッチング処理を使う。Ωcにおけるスピーカーについての復号係数は、スピーカーが球の表面上に一様分布しているので、
Figure 0006113739
によって定義される。スピーカー信号は、ビーム形成デコーダ例の場合と同じSNRをもつ。しかしながら、一方では、原点におけるスピーカー信号の重ね合わせは優れたSNRを与える。他方、聴取位置がスイートスポットから外れるとSNRは低くなる。
こうした結果は、記載される最適化が、通常のアンビソニックス・デコーダ(Ambisonics decoder)については原点において増大したSNRをもつ均衡した周波数スペクトルを生じることを示している。すなわち、本発明の時間変化する適応フィルタ設計はアンビソニックス記録のために有利である。本発明の処理は、記録のSNRが時間的に一定であると想定できる場合に時間不変なフィルタを設計するために使うこともできる。
ビーム形成デコーダ(beam forming decoder)については、本発明の処理は、結果として得られる周波数スペクトルを均衡させることができるが、低周波での低いSNRという欠点がある。SNRは、より幅広いビームを生じる適切な復号係数を選択することによって、あるいは異なる周波数サブバンドのアンビソニックス次数でビーム幅を適応させることによって高めることができる。
本発明は、原点における再生されるスペクトル・パワーがエイリアシングまたは欠けている球面調和係数のために均衡していないところの、球面調和関数表現におけるすべての球状マイクロホン記録に適用可能である。
いくつかの付記を記載しておく。
〔付記1〕
剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号(P(Ω c ,t))を処理する方法であって:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ω c ,t))を、球面調和関数またはアンビソニックス表現A n m (t)に変換する段階(71)と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P 0 (k)| 2 および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|P noise (k)| 2 を使って、前記マイクロホン・カプセル信号(P(Ω c ,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算する段階(73)と;
・参照、エイリアシングおよびノイズ信号パワー成分を使って、拡散音場について原点での平均空間的信号パワーを波数k毎に計算し、
等化フィルタの周波数応答を、所与の参照パワーと原点における前記平均空間的信号パワーとの分数の平方根から形成し、
適応された伝達関数F n,array (k)を得るために、前記等化フィルタの前記周波数応答に、波数k毎に、前記信号対雑音比推定SNR(k)から導出されるノイズ最小化フィルタの、離散的な有限波数kにおける各次数nについての伝達関数と、前記マイクロホン・アレイの逆伝達関数とを乗算する段階(74)と;
・前記適応された伝達関数F n,array (k)を、線形フィルタ処理を使って前記球面調和関数表現A n m (t)に適用し、結果として適応された方向性係数d n m (t)を与える段階(72)とを含む、
方法。
〔付記2〕
剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号(P(Ω c ,t))を処理する装置であって:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ω c ,t))を、球面調和関数またはアンビソニックス表現A n m (t)に変換するよう適応されている手段と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P 0 (k)| 2 および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|P noise (k)| 2 を使って、前記マイクロホン・カプセル信号(P(Ω c ,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算するよう適応されている手段と;
・参照、エイリアシングおよびノイズ信号パワー成分を使って、拡散音場について原点での平均空間的信号パワーを波数k毎に計算し、
等化フィルタの周波数応答を、所与の参照パワーと原点における前記平均空間的信号パワーとの分数の平方根から形成し、
適応された伝達関数F n,array (k)を得るために、前記等化フィルタの前記周波数応答に、波数k毎に、前記信号対雑音比推定SNR(k)から導出されるノイズ最小化フィルタの離散的な有限波数kにおける各次数nについての伝達関数と、前記マイクロホン・アレイの逆伝達関数とを乗算する、よう適応されている手段と;
・前記適応された伝達関数F n,array (k)を、線形フィルタ処理を使って前記球面調和関数表現A n m (t)に適用し、結果として適応された方向性係数d n m (t)を与えるよう適応されている手段とを含む、
装置。
〔付記3〕
前記ノイズ・パワー|P noise (k)| 2 が、|P 0 (k)| 2 =0であるような何の音源もない無音環境において得られる、付記1記載の方法または付記2記載の装置。
〔付記4〕
前記平均源パワー|P 0 (k)| 2 が、前記マイクロホン・カプセルにおいて測定された圧力P mic c ,k)から、前記マイクロホン・カプセルでの圧力の期待値と前記マイクロホン・カプセルでの測定された平均信号パワーとの比較によって、推定される、付記1または3記載の方法または付記2または3記載の装置。
〔付記5〕
前記アレイの前記伝達関数F n,array (k)が周波数領域において決定され:
・前記係数A n m (t)をFFTを使って周波数領域に変換し、続いて前記伝達関数F n,array (k)を乗算し;
・その積の逆FFTを実行して時間領域係数d n m (t)を得ることを含む、
あるいは、時間領域でのFIRフィルタによって近似され、
・逆FFTを実行し;
・巡回シフトを実行し;
・結果として得られるフィルタ・インパルス応答に、対応する伝達関数を平滑化するために漸減する窓を適用し;
・nおよびmの各組み合わせについて、結果として得られるフィルタ係数と前記係数A n m (t)との畳み込みを実行することを含む、
付記1、3および4のうちいずれか一項記載の方法または付記2ないし4のうちいずれか一項記載の装置。
〔付記6〕
前記等化フィルタの前記伝達関数が
Figure 0006113739

によって決定され、ここでEは期待値、w ref (k)は波数kについての参照重み;w' ref (k)は波数kについての最適化された参照重み;w' alias (k)は波数kについての最適化されたエイリアス重み、w' noise (k)は波数についての最適化されたノイズ重みであり、「最適化された」は前記球状マイクロホン・アレイにおいて生じるノイズに関して軽減されていることを意味する、
付記1および3ないし5のうちいずれか一項記載の方法または付記2ないし5のうちいずれか一項記載の装置。


Claims (10)

  1. 剛体球上の球状マイクロホン・アレイのマイクロホン・カプセルにおいて測定されたマイクロホン・カプセル信号(P(Ωc,t))を処理する方法であって:
    ・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ωc,t))を、方向性係数をもつ球面調和関数またはアンビソニックス表現An m(t)に変換する段階と;
    ・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号(P(Ωc,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算する段階と;
    ・参照、エイリアシングおよびノイズ信号パワー成分を使って、拡散音場について原点での平均空間的信号パワーを波数k毎に計算し、
    等化フィルタの周波数応答を、所与の参照パワーと原点における前記平均空間的信号パワーとの分数の平方根から形成し、
    適応された伝達関数Fn,array(k)を得るために、前記等化フィルタの前記周波数応答に、波数k毎に、信号対雑音比SNR(k)の前記推定から導出されるノイズ最小化フィルタの、離散的な有限波数kにおける各次数nについての伝達関数と、前記マイクロホン・アレイの逆伝達関数とを乗算する段階と;
    ・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数またはアンビソニックス表現An m(t)に適用し、結果として適応された方向性係数dn m(t)を与える段階とを含む、
    方法。
  2. 前記ノイズ・パワー|Pnoise(k)|2が、|P0(k)|2=0であるような何の音源もない無音環境において得られる、請求項1記載の方法。
  3. 前記平均源パワー|P0(k)|2が、前記マイクロホン・カプセルにおいて測定された圧力Pmicc,k)から、前記マイクロホン・カプセルでの圧力の期待値と前記マイクロホン・カプセルでの測定された平均信号パワーとの比較によって、推定される、請求項1または2記載の方法。
  4. 前記アレイの前記伝達関数Fn,array(k)が周波数領域において決定され:
    ・前記係数An m(t)をFFTを使って周波数領域に変換し、続いて前記伝達関数Fn,array(k)を乗算し;
    ・その積の逆FFTを実行して時間領域係数dn m(t)を得ることを含む、
    あるいは、時間領域でのFIRフィルタによって近似され、
    ・逆FFTを実行し;
    ・巡回シフトを実行し;
    ・結果として得られるフィルタ・インパルス応答に、対応する伝達関数を平滑化するために漸減する窓を適用し;
    ・nおよびmの各組み合わせについて、結果として得られるフィルタ係数と前記係数An m(t)との畳み込みを実行することを含む、
    請求項1ないし3のうちいずれか一項記載の方法。
  5. 前記等化フィルタの前記伝達関数が
    Figure 0006113739
    によって決定され、ここでEは期待値、wref(k)は波数kについての参照重み;w'ref(k)は波数kについての最適化された参照重み;w'alias(k)は波数kについての最適化されたエイリアス重み、w'noise(k)は波数についての最適化されたノイズ重みであり、「最適化された」は前記球状マイクロホン・アレイにおいて生じるノイズに関して軽減されていることを意味する、
    請求項1ないし4のうちいずれか一項記載の方法。
  6. 剛体球上の球状マイクロホン・アレイのマイクロホン・カプセルにおいて測定されたマイクロホン・カプセル信号(P(Ωc,t))を処理する装置であって:
    ・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ωc,t))を、方向性係数をもつ球面調和関数またはアンビソニックス表現An m(t)に変換するよう適応されている手段と;
    ・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号(P(Ωc,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算するよう適応されている手段と;
    ・参照、エイリアシングおよびノイズ信号パワー成分を使って、拡散音場について原点での平均空間的信号パワーを波数k毎に計算し、
    等化フィルタの周波数応答を、所与の参照パワーと原点における前記平均空間的信号パワーとの分数の平方根から形成し、
    適応された伝達関数Fn,array(k)を得るために、前記等化フィルタの前記周波数応答に、波数k毎に、信号対雑音比SNR(k)の前記推定から導出されるノイズ最小化フィルタの離散的な有限波数kにおける各次数nについての伝達関数と、前記マイクロホン・アレイの逆伝達関数とを乗算する、よう適応されている手段と;
    ・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数またはアンビソニックス表現An m(t)に適用し、結果として適応された方向性係数dn m(t)を与えるよう適応されている手段とを含む、
    装置。
  7. 前記ノイズ・パワー|Pnoise(k)|2が、|P0(k)|2=0であるような何の音源もない無音環境において得られる、請求項6記載の装置。
  8. 前記平均源パワー|P0(k)|2が、前記マイクロホン・カプセルにおいて測定された圧力Pmicc,k)から、前記マイクロホン・カプセルでの圧力の期待値と前記マイクロホン・カプセルでの測定された平均信号パワーとの比較によって、推定される、請求項6または7記載の装置。
  9. 前記アレイの前記伝達関数Fn,array(k)が周波数領域において決定され:
    ・前記係数An m(t)をFFTを使って周波数領域に変換し、続いて前記伝達関数Fn,array(k)を乗算し;
    ・その積の逆FFTを実行して時間領域係数dn m(t)を得ることを含む、
    あるいは、時間領域でのFIRフィルタによって近似され、
    ・逆FFTを実行し;
    ・巡回シフトを実行し;
    ・結果として得られるフィルタ・インパルス応答に、対応する伝達関数を平滑化するために漸減する窓を適用し;
    ・nおよびmの各組み合わせについて、結果として得られるフィルタ係数と前記係数An m(t)との畳み込みを実行することを含む、
    請求項6ないし8のうちいずれか一項記載の装置。
  10. 前記等化フィルタの前記伝達関数が
    Figure 0006113739
    によって決定され、ここでEは期待値、wref(k)は波数kについての参照重み;w'ref(k)は波数kについての最適化された参照重み;w'alias(k)は波数kについての最適化されたエイリアス重み、w'noise(k)は波数についての最適化されたノイズ重みであり、「最適化された」は前記球状マイクロホン・アレイにおいて生じるノイズに関して軽減されていることを意味する、
    請求項6ないし9のうちいずれか一項記載の装置。
JP2014540396A 2011-11-11 2012-10-31 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 Active JP6113739B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11306472.9 2011-11-11
EP11306472.9A EP2592846A1 (en) 2011-11-11 2011-11-11 Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field
PCT/EP2012/071537 WO2013068284A1 (en) 2011-11-11 2012-10-31 Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field

Publications (3)

Publication Number Publication Date
JP2014535232A JP2014535232A (ja) 2014-12-25
JP2014535232A5 JP2014535232A5 (ja) 2015-12-24
JP6113739B2 true JP6113739B2 (ja) 2017-04-12

Family

ID=47216219

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014540396A Active JP6113739B2 (ja) 2011-11-11 2012-10-31 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置

Country Status (6)

Country Link
US (1) US9420372B2 (ja)
EP (2) EP2592846A1 (ja)
JP (1) JP6113739B2 (ja)
KR (1) KR101957544B1 (ja)
CN (1) CN104041074B (ja)
WO (1) WO2013068284A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7190279B2 (ja) 2018-08-10 2022-12-15 三栄源エフ・エフ・アイ株式会社 チーズソース

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2592845A1 (en) * 2011-11-11 2013-05-15 Thomson Licensing Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field
US10021508B2 (en) 2011-11-11 2018-07-10 Dolby Laboratories Licensing Corporation Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field
US9883312B2 (en) 2013-05-29 2018-01-30 Qualcomm Incorporated Transformed higher order ambisonics audio data
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US10078006B2 (en) * 2013-07-22 2018-09-18 Brüel & Kjær Sound & Vibration Measurement A/S Wide-band acoustic holography
US20150127354A1 (en) * 2013-10-03 2015-05-07 Qualcomm Incorporated Near field compensation for decomposed representations of a sound field
EP2863654B1 (en) * 2013-10-17 2018-08-01 Oticon A/s A method for reproducing an acoustical sound field
EP2879408A1 (en) * 2013-11-28 2015-06-03 Thomson Licensing Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition
WO2015101915A2 (en) 2013-12-31 2015-07-09 Distran Gmbh Acoustic transducer array device
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US20150332682A1 (en) * 2014-05-16 2015-11-19 Qualcomm Incorporated Spatial relation coding for higher order ambisonic coefficients
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) * 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
EP2988527A1 (en) 2014-08-21 2016-02-24 Patents Factory Ltd. Sp. z o.o. System and method for detecting location of sound sources in a three-dimensional space
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
CN105072557B (zh) * 2015-08-11 2017-04-19 北京大学 一种三维环绕声重放***的扬声器环境自适应校准方法
JP6606784B2 (ja) * 2015-09-29 2019-11-20 本田技研工業株式会社 音声処理装置および音声処理方法
US10206040B2 (en) 2015-10-30 2019-02-12 Essential Products, Inc. Microphone array for generating virtual sound field
BR112018007276A2 (pt) 2016-03-15 2018-10-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. aparelho, método ou programa de computador para gerar uma descrição de campo de som
WO2018053050A1 (en) * 2016-09-13 2018-03-22 VisiSonics Corporation Audio signal processor and generator
WO2018064296A1 (en) * 2016-09-29 2018-04-05 Dolby Laboratories Licensing Corporation Method, systems and apparatus for determining audio representation(s) of one or more audio sources
FR3060830A1 (fr) * 2016-12-21 2018-06-22 Orange Traitement en sous-bandes d'un contenu ambisonique reel pour un decodage perfectionne
WO2018157098A1 (en) * 2017-02-27 2018-08-30 Essential Products, Inc. Microphone array for generating virtual sound field
US11277705B2 (en) 2017-05-15 2022-03-15 Dolby Laboratories Licensing Corporation Methods, systems and apparatus for conversion of spatial audio format(s) to speaker signals
CN109275084B (zh) * 2018-09-12 2021-01-01 北京小米智能科技有限公司 麦克风阵列的测试方法、装置、***、设备和存储介质
JP6969793B2 (ja) 2018-10-04 2021-11-24 株式会社ズーム アンビソニックスのためのa/bフォーマット変換装置、a/bフォーマット変換ソフトウェア、レコーダー、再生ソフトウェア
CN111193990B (zh) * 2020-01-06 2021-01-19 北京大学 一种抗高频空间混叠的3d音频***及实现方法
US11489505B2 (en) 2020-08-10 2022-11-01 Cirrus Logic, Inc. Methods and systems for equalization
CN113852903B (zh) * 2021-10-21 2022-05-31 杭州爱华智能科技有限公司 电容型测试传声器的声场特性转换方法与电容型测试传声器***

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7123727B2 (en) * 2001-07-18 2006-10-17 Agere Systems Inc. Adaptive close-talking differential microphone array
US20030147539A1 (en) * 2002-01-11 2003-08-07 Mh Acoustics, Llc, A Delaware Corporation Audio system based on at least second-order eigenbeams
US7558393B2 (en) * 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
EP1737271A1 (en) * 2005-06-23 2006-12-27 AKG Acoustics GmbH Array microphone
JP4671303B2 (ja) * 2005-09-02 2011-04-13 国立大学法人北陸先端科学技術大学院大学 マイクロホンアレイ用ポストフィルタ
GB0619825D0 (en) * 2006-10-06 2006-11-15 Craven Peter G Microphone array
GB0906269D0 (en) * 2009-04-09 2009-05-20 Ntnu Technology Transfer As Optimal modal beamformer for sensor arrays
EP2592845A1 (en) * 2011-11-11 2013-05-15 Thomson Licensing Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field
US9197962B2 (en) * 2013-03-15 2015-11-24 Mh Acoustics Llc Polyhedral audio system based on at least second-order eigenbeams

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7190279B2 (ja) 2018-08-10 2022-12-15 三栄源エフ・エフ・アイ株式会社 チーズソース

Also Published As

Publication number Publication date
WO2013068284A1 (en) 2013-05-16
JP2014535232A (ja) 2014-12-25
US9420372B2 (en) 2016-08-16
US20140307894A1 (en) 2014-10-16
KR20140089601A (ko) 2014-07-15
EP2777298B1 (en) 2016-03-16
EP2592846A1 (en) 2013-05-15
CN104041074A (zh) 2014-09-10
KR101957544B1 (ko) 2019-03-12
EP2777298A1 (en) 2014-09-17
CN104041074B (zh) 2017-04-12

Similar Documents

Publication Publication Date Title
JP6113739B2 (ja) 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置
JP6030660B2 (ja) 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置
EP3320692B1 (en) Spatial audio processing apparatus
US9113281B2 (en) Reconstruction of a recorded sound field
EP2905975B1 (en) Sound capture system
KR20140138907A (ko) 통합 또는 하이브리드 사운드-필드 제어 전략을 적용하는 방법
KR20130102566A (ko) 스피커를 통한 오디오에 대한 스펙트럼적으로 채색되지 않은 최적의 크로스토크 제거
EP1856948A1 (en) Position-independent microphone system
Tylka et al. Fundamentals of a parametric method for virtual navigation within an array of ambisonics microphones
Sakamoto et al. Sound-space recording and binaural presentation system based on a 252-channel microphone array
JP2019047478A (ja) 音響信号処理装置、音響信号処理方法および音響信号処理プログラム
Baumgartner et al. Practical implementation of radial filters for ambisonic recordings
US10021508B2 (en) Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field
TW202027517A (zh) 用於空間音訊信號之串音處理之頻譜缺陷補償
CN113766396A (zh) 扬声器控制
Pinto et al. Digital acoustics: processing wave fields in space and time using DSP tools
Marschall et al. Sound-field reconstruction performance of a mixed-order ambisonics microphone array
JP5826712B2 (ja) マルチチャネルエコー消去装置、マルチチャネルエコー消去方法、およびプログラム
Zotter et al. Higher-order ambisonic microphones and the wave equation (linear, lossless)
Zou et al. A broadband speech enhancement technique based on frequency invariant beamforming and GSC
Jin et al. SUPER-RESOLUTION SOUND FIELD ANALYSES

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151030

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151030

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160705

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20160826

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170221

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170315

R150 Certificate of patent or registration of utility model

Ref document number: 6113739

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250