JP6030660B2 - 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 - Google Patents

音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 Download PDF

Info

Publication number
JP6030660B2
JP6030660B2 JP2014540395A JP2014540395A JP6030660B2 JP 6030660 B2 JP6030660 B2 JP 6030660B2 JP 2014540395 A JP2014540395 A JP 2014540395A JP 2014540395 A JP2014540395 A JP 2014540395A JP 6030660 B2 JP6030660 B2 JP 6030660B2
Authority
JP
Japan
Prior art keywords
noise
signal
microphone
array
transfer function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014540395A
Other languages
English (en)
Other versions
JP2014535231A5 (ja
JP2014535231A (ja
Inventor
コルドン,スベン
バトケ,ヨハン−マルクス
クルーガー,アレクサンダー
Original Assignee
ドルビー・インターナショナル・アーベー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー・インターナショナル・アーベー filed Critical ドルビー・インターナショナル・アーベー
Publication of JP2014535231A publication Critical patent/JP2014535231A/ja
Publication of JP2014535231A5 publication Critical patent/JP2014535231A5/ja
Application granted granted Critical
Publication of JP6030660B2 publication Critical patent/JP6030660B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/027Spatial or constructional arrangements of microphones, e.g. in dummy heads
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/326Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements
    • H04R29/004Monitoring arrangements; Testing arrangements for microphones
    • H04R29/005Microphone arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Stereophonic System (AREA)

Description

本発明は、音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置であって、逆マイクロホン・アレイ応答に補正フィルタが適用されるものに関する。
球状マイクロホン・アレイは、三次元音場を捕捉する能力をもたらす。音場を記憶し、処理する一つの方法は、アンビソニックス表現である。アンビソニックスは、スイートスポットとしても知られる原点のまわりの領域における音場を記述するために正規直交な球面関数を使う。有限個のアンビソニックス係数が音場を記述する場合、その記述の精度はアンビソニックス次数Nによって決定される。球状アレイの最大アンビソニックス次数はマイクロホン・カプセルの数によって制限され、その数はアンビソニックス係数の数O=(N+1)2以上である必要がある。
アンビソニックス表現の一つの利点は、音場の再生が、任意の所与のスピーカー配置に対して個々に適応されることができるということである。さらに、この表現は、ポストプロダクションにおいてビーム形成技法を使って、種々のマイクロホン特性のシミュレーションを可能にする。
Bフォーマットはアンビソニックスの一つの既知の例である。Bフォーマット・マイクロホンは、アンビソニックス次数1の音場を捕捉するために四面体上の四つのカプセルを必要とする。
1より大きい次数のアンビソニックスは高次アンビソニックス(HOA: Higher Order Ambisonics)と呼ばれ、HOAマイクロホンは典型的には剛体球上の球状マイクロホン・アレイ、たとえばmhAcousticsのアイゲンマイク(Eigenmike)である。アンビソニックス処理のためには、球の表面上の圧力分布がアレイのカプセルによってサンプリングされる。次いでサンプリングされた圧力がアンビソニックス表現に変換される。そのようなアンビソニックス表現は音場を表現するが、マイクロホン・アレイの影響を含む。捕捉される音場に対するマイクロホンの影響は、逆マイクロホン・アレイ応答を使って除去される。逆マイクロホン・アレイ応答は平面波の音場をマイクロホン・カプセルにおいて測定される圧力に変換する。それは、カプセルの指向性およびマイクロホン・アレイの音場との干渉をシミュレートする。
S´ebastien Moreau, J´er^ome Daniel, St´ephanie Bertet、"3D Sound field Recording with Higher Order Ambisonics--Objective Measurements and Validation of a 4th Order Spherical Microphone"、Audio Engineering Society convention paper, 120th Convention 20-23 May 2006, Paris, France Boaz Rafaely、"Analysis and Design of Spherical Microphone Arrays"、IEEE Transactions on Speech and Audio Processing, vol.13, no.1, pp.135-143, 2005 M.A.Poletti、"Three-Dimensional Surround Sound Systems Based on Spherical Harmonics"、Journal Audio Engineering Society、vol.53, no.11, pp.1004-1025、2005年 Morag Agmon, Boaz Rafaely、"Beamforming for a Spherical-Aperture Microphone"、IEEE, pp.227-230、2008年 Johann-Markus Batke, Florian Keiler、"Using VBAP-Derived Panning Functions for 3D Ambisonics Decoding"、Proc. of the 2nd International Symposium on Ambisonics and Spherical Acoustics、6-7 May 2010、Paris, France Boaz Rafaely、"Plane-wave decomposition of the sound field on a sphere by spherical convolution"、J. Acoustical Society of America, vol.116, no.4, pp.2149-2157、2004年 mh acousticsのホームページ、オンライン(http://www.mhacoustics.com)、2007年2月1日アクセス F. Zotter、"Sampling Strategies for Acoustic Holography/Holophony on the Sphere"、Proceedings of the NAG-DAGA, 23-26 March 2009, Rotterdam J¨org Fliege, Ulrike Maier、"A Two-Stage Approach for Computing Cubature Formulae for the Sphere"、Technical report, 1996, Fachbereich Mathematik, Universit¨at Dortmund, Germany
マイクロホン・アレイの伝達関数の等化はHOA記録にとって大きな問題である。アレイ応答のアンビソニックス表現が既知であれば、影響はアンビソニックス表現に逆アレイ応答を乗算することで除去できる。しかしながら、伝達関数の逆数を使うことは、伝達関数の小さな値および0について大きな利得を引き起こしうる。したがって、マイクロホン・アレイは堅牢な逆伝達関数に鑑みて設計すべきである。たとえば、Bフォーマットのマイクロホンは、無指向性カプセルの伝達関数の零点を克服するためにカージオイド・カプセルを使う。
本発明は、剛体球上の球状マイクロホン・アレイに関する。剛体球のシェーディング(shading)効果は、アレイの直径に対して小さな波長をもつ周波数について良好な指向性を可能にする。他方、これらのマイクロホン・アレイのフィルタ応答は低周波数および高いアンビソニックス次数(すなわち1より大きい次数)について非常に小さな値をもつ。したがって、捕捉された圧力のアンビソニックス表現は小さい高次係数をもち、これはアレイのサイズに比べて長い波長についてはカプセルにおける小さな圧力差を表わす。圧力差は、よって高次係数も、トランスデューサ・ノイズによって影響される。よって、低周波数については、逆フィルタ応答は主として、高次アンビソニックス係数ではなくノイズを増幅する。
この問題を克服するある既知の技法は、低周波数について高次係数をフェードアウトする(または高域通過フィルタリングする)ことである(すなわち、低周波でフィルタ利得を制限する)。これは一方では低周波数についての空間分解能を低下させるが、他方では(高度に歪められた)HOA係数を除去し、それにより完全なアンビソニックス表現を損なう。ティホノフ正規化(Tikhonov regularisation)フィルタを使ってこの問題を解決しようとする対応する補償フィルタ設計が非特許文献1のセクション4に記載されている。ティホノフ正規化フィルタは、アンビソニックス次数の制限から帰結する二乗誤差を最小化する。しかしながら、ティホノフ・フィルタは、「試行錯誤」によって記録された信号の特性に手動で適応させる必要のある正規化パラメータを必要とし、このパラメータを定義する解析的な表現はない。非特許文献2の球状マイクロホン・アレイの解析に基づいて、本発明は、マイクロホン信号の信号統計からいかにして正規化パラメータを自動的に取得するかを示す。
本発明によって解決されるべき課題は、剛体球上に配置された球状マイクロホン・アレイの信号のアンビソニックス表現において、ノイズ、特に低周波ノイズを最小化することである。
この問題は、請求項1記載の方法によって解決される。この方法を利用する装置が請求項2に開示される。
本発明の処理は、平均音場パワーとマイクロホン・カプセルのノイズ・パワーとの信号対雑音比に依存して正規化ティホノフ・パラメータを計算するために使われる。すなわち、記録されたマイクロホン・アレイ信号の信号対雑音比から最適化パラメータが計算される。最適化または正規化パラメータの計算は以下の段階を含む:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号P(Ωc,t)を、球面調和関数(または等価なアンビソニックス)表現An m(t)に変換する段階;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号P(Ωc,t)の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算する段階;すなわち、参照信号およびノイズ信号を別個に計算することによって平均空間的パワーを計算することを含む。ここで、参照信号は使用されるマイクロホン・アレイを用いて生成されることのできる音場の表現であり、ノイズ信号はマイクロホン・アレイのアナログ処理によって生成される空間的に無相関のノイズである。
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数nについての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数1/bn(kR)を乗算する段階;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数表現An m(t)に適用し、結果として適応された方向性係数dn m(t)を与える段階。
フィルタ設計は、記録のSNRを得るために音場の平均パワーの推定を必要とする。推定は、球面調和関数表現での前記アレイのカプセルにおける平均信号パワーのシミュレーションから導出される。この推定は、球面調和関数でのカプセル信号の空間的コヒーレンスの計算を含む。平面波の連続的な表現から空間的コヒーレンスを計算することは知られているが、剛体球上の平面波の音場は連続表現では計算できないので、本発明によれば、空間的コヒーレンスは、剛体球上の球状アレイについて計算される。すなわち、本発明によれば、SNRはカプセル信号から推定される。
本発明は以下の利点を含む。
・アンビソニックス表現の次数が、各周波数サブバンドについて記録のSNRに最適に適合される。これは、アンビソニックス表現の再生時の可聴ノイズを軽減する。
・SNRの推定はフィルタ設計のために必要とされる。それは、ルックアップテーブルを使うことによって低計算量で実装できる。これは、扱える程度の計算努力で時間変化する適応フィルタ設計を容易にする。
・ノイズ削減により、低周波数について方向性情報が部分的に復元される。
原理的には、本発明の方法は、剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号を処理するのに好適である。本方法は:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号P(Ωc,t)を、球面調和関数またはアンビソニックス表現An m(t)に変換する段階と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号P(Ωc,t)の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算する段階と;
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数nについての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算する段階と;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数表現An m(t)に適用し、結果として適応された方向性係数dn m(t)を与える段階とを含む。
原理的には、本発明の装置は、剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号を処理するのに好適である。本装置は:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号P(Ωc,t)を、球面調和関数またはアンビソニックス表現An m(t)に変換するよう適応されている手段と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号P(Ωc,t)の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算するよう適応されている手段と;
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数nについての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算するよう適応されている手段と;
・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数表現An m(t)に適用し、結果として適応された方向性係数dn m(t)を与えるよう適応されている手段とを含む。
本発明の有利な追加的実施形態はそれぞれの従属請求項において開示される。
本発明の例示的な実施形態について、付属の図面を参照しつつ述べる。
剛体球上の32個のカプセルをもつマイクロホン・アレイについての結果として得られるスピーカー重みからの参照、エイリアシングおよびノイズ成分のパワーを示す図である。 SNR(k)=20dBについてのノイズ削減フィルタを示す図である。 ブロック・ベースの適応アンビソニックス処理のブロック図である。 図2の最適化フィルタ後の重み成分の平均パワーを示す図である。
以下のセクションでは、球状マイクロホン・アレイ処理が記述される。
〈アンビソニックスの理論〉
アンビソニックス復号は、平面波の音場を放射しているスピーカーを仮定することによって定義される。非特許文献3参照:
Figure 0006030660
L個のスピーカーの配置はアンビソニックス係数dn m(k)に格納された三次元音場を再構成する。処理は、各波数
k=2πf/csound (2)
について別個に実行される。ここで、fは周波数、csoundは音速である。インデックスnは0から有限の次数Nまで走り、一方、インデックスmは各インデックスnについて−nからnまで走る。したがって、係数の総数はO=(N+1)2である。スピーカー位置は球面座標において方向ベクトルΩl=[Θll]Tによって定義され、[・]Tはベクトルの転置バージョンを表わす。
式(1)は、アンビソニックス係数dn m(k)のスピーカー重みw(Ωl,k)への変換を定義する。これらの重みはスピーカーの駆動関数である。すべてのスピーカー重みの重ね合わせが音場を再構成する。
復号係数Dn ml)は一般的なアンビソニックス復号処理を記述している。これは、非特許文献4のセクション3に示されるビーム・パターンの共役複素係数(ω* nm)および前述した非特許文献3のセクション3.2で与えられているモード・マッチング復号行列の諸行を含む。非特許文献5のセクション4に記載されている別の処理方法は、任意の三次元スピーカー配置について復号行列を計算するためにベクトル・ベースの振幅パン(amplitude panning)を使う。これらの行列の行要素も係数Dn ml)によって記述される。
アンビソニックス係数dn m(k)は、非特許文献6のセクション3に記載されているように、常に平面波の重ね合わせに分解されることができる。したがって、解析は方向Ωsから入射する平面波の係数:
Figure 0006030660
に限定されることができる。
平面波の係数dn m plane(k)は、平面波の音場を放射しているスピーカーという想定について定義される。原点における圧力は、波数kについてP0(k)によって定義される。共役複素球面調和関数Yn ms)*は平面波の方向性係数を表わす。上記非特許文献3で与えられている球面調和関数Yn ms)の定義を使う。
球面調和関数はアンビソニックス表現の正規直交基底関数であり、次式を満たす。
Figure 0006030660
球状マイクロホン・アレイは、球の表面上の圧力をサンプリングする。ここで、サンプリング点の数はアンビソニックス係数の数O=(N+1)2以上でなければならない。アンビソニックス次数Nについて。さらに、サンプリング点は球の表面上に一様に分布している必要がある。ここで、O個の点の最適な分布は次数N=1についてのみ厳密に知られている。より高い次数については、球のサンプリングのよい近似が存在する。非特許文献7、非特許文献8参照。
最適なサンプリング点Ωcについて、式(4)からの積分は、式(6)からの離散的な和と等価である。
Figure 0006030660
ここで、Cはカプセルの総数であり、C≧(N+1)2について、n'≦Nであり、n≦Nである。
非最適なサンプリング点について安定した結果を達成するために、共役複素球面調和関数は、擬似逆行列
Figure 0006030660
の諸列によって置換されることができる。この擬似逆行列は、L×Oの球面調和関数行列Yから得られる。ここで、球面調和関数Yn mc)のO個の係数がYの行要素である。非特許文献1のセクション3.2.2参照:
Figure 0006030660
以下では、この擬似逆行列の列要素がYn mc)と表わされると定義され、よって、式(6)からの正規直交条件も、
Figure 0006030660
なので、満たされる。ここで、C≧(N+1)2について、n'≦Nであり、n≦Nである。
球状マイクロホン・アレイが球の表面上にほぼ一様に分布したカプセルを有しており、カプセルの数がOより多いと仮定すると、
Figure 0006030660
が成り立つ。
(9)を(8)に代入すると、正規直交条件
Figure 0006030660
が得られる。ここで、C≧(N+1)2について、n'≦Nであり、n≦Nである。これについて下記で考える。
〈処理のシミュレーション〉
剛体の(硬い、固定した)球上の球状マイクロホン・アレイについての完全なHOA処理チェーンは、カプセルにおける圧力の推定、HOA係数の計算およびスピーカー重みへの復号を含む。それは、平面波についてはマイクロホン・アレイからの再構成された重みw(k)は、式(3)で与えられる平面波の係数からの再構成された参照重みwref(k)に等しくなければならないことに基づいている。
以下のセクションは、w(k)の参照重みwref(k)、空間的エイリアシング重みwalias(k)およびノイズ重みwnoise(k)への分解を提示する。エイリアシングは、有限次数Nについての連続的な音場のサンプリングによって引き起こされ、ノイズは、各カプセルについて導入される空間的に無相関な信号部分をシミュレートする。空間的エイリアシングは所与のマイクロホン・アレイについて除去できない。
〈カプセル信号のシミュレーション〉
剛体球の表面上のマイクロホン・アレイについての入射平面波の伝達関数は、上述した非特許文献3のセクション2.2、式(19)において定義されている:
Figure 0006030660
ここで、hn (1)(kr)は第一種ハンケル関数であり、半径rは球の半径Rに等しい。伝達関数は剛体球上の圧力を散乱させる物理的な原理から導出される。つまり、剛体球の表面上では動径方向速度が0になる。換言すれば、はいってくる音場と散乱される音場の動径微分(radial derivation)の重ね合わせが0である。書籍『Fourier Acoustics』のセクション6.10.3を参照。このように、Ωsから入射する平面波についての位置Ωにおける球の表面上の圧力は、非特許文献1のセクション3.2.1の式(21)において、次によって与えられる。
Figure 0006030660
等方的ノイズ信号Pnoisec,k)はトランスデューサ・ノイズをシミュレートするために加えられる。ここで、「等方的」というのは、諸カプセルのノイズ信号が空間的に相関していないことを意味する。これは時間領域における相関は含まない。圧力は、マイクロホン・アレイの最大次数Nについて計算された圧力Prefc,kR)と、残りの次数からの圧力に分離することができる。非特許文献2におけるセクション7、式(24)参照。残りの次数からの圧力Paliasc,kR)は、マイクロホン・アレイの次数がこれらの信号成分を再構成するために十分でないので、空間的エイリアシング圧力と呼ばれる。よって、カプセルcにおいて記録される全圧力は次式によって定義される。
Figure 0006030660
〈アンビソニックス・エンコード〉
アンビソニックス係数dn m(k)は、式(14a)において与えられる式(12)の逆によって、カプセルにおける圧力から得られる。非特許文献1のセクション3.2.2の式(26)参照。球面調和関数Yn mc)は、式(8)を使ってYn mc)によって反転され、伝達関数bn(kR)はその逆数によって等化される:
Figure 0006030660
アンビソニックス係数dn m(k)は、式(14a)および(13a)を使って、式(14b)および(14c)に示されるように、参照係数dn m ref(k)、エイリアシング係数dn m alias(k)およびノイズ係数dn m noise(k)に分離されることができる。
〈アンビソニックス復号〉
最適化は、原点での結果として得られるスピーカー重みw(k)を使う。すべてのスピーカーは原点に対して同じ距離をもち、よってすべてのスピーカー重みの和がw(k)になることが想定される。式(15)は、式(1)および(14b)からw(k)を与える。ここで、Lはスピーカーの数である。
Figure 0006030660
式(15b)は、w(k)も三つの重みwref(k)、walias(k)およびwnoise(k)に分離されることができることを示している。簡単のため、非特許文献2のセクション7、式(24)で与えられている位置決め誤差はここでは考えていない。
復号では、参照係数は、次数nの合成的に生成される平面波が生成するであろう重みである。下記の式(16a)では、式(13b)からの参照圧力Prefc,kR)が式(15a)に代入されており、圧力信号Paliasc,kR)およびPnoisec,kR)は無視されている(すなわち0と置かれる)。
Figure 0006030660
c、n′およびm′についての和は式(8)を使って消去でき、よって式(16a)は式(3)からのアンビソニックス表現における平面波の重みの和に単純化できる。よって、エイリアシング信号およびノイズ信号が無視されるなら、次数Nの平面波の理論上の係数は、マイクロホン・アレイ記録から完璧に再構成されることができる。
ノイズ信号wnoise(k)の結果として得られる重みは、式(15a)から、また式(13b)からPnoisec,kR)のみを使って、次式によって与えられる。
Figure 0006030660
式(15a)において式(13b)からのPaliasc,kR)の項を代入し、他の圧力信号を無視すると、
Figure 0006030660
となる。
結果として得られるエイリアシング重みwalias(k)は式(8)からの正規直交条件によって単純化されることはできない。インデックスn′がNより大きいからである。
エイリアス重みのシミュレーションは、十分な精度をもってカプセル信号を表わすアンビソニックス次数を必要とする。非特許文献1のセクション2.2.2の式(14)では、アンビソニックス音場再構成についての打ち切り誤差の解析が与えられている。
Figure 0006030660
について、そこそこの精度の音場が得られると述べられている。ここで、
Figure 0006030660
は最も近い整数への切り上げを表わす。この精度は、シミュレーションの上限周波数fmaxについて使われる。よって、アンビソニックス次数
Figure 0006030660
が、各波数のエイリアシング圧力のシミュレーションのために使われる。これは、上記の上限周波数における受け容れられる精度を与え、低い周波数については精度は増しさえする。
〈スピーカー重みの解析〉
図1は、剛体球上の32個のカプセルをもつマイクロホン・アレイについて、方向Ωs=[0,0]Tからの平面波についての結果的なスピーカー重みからの重み成分a)wref(k)、b)wnoise(k)およびc)walias(k)のパワーを示している(上述した非特許文献4からのアイゲンマイクがシミュレーションのために使われた)。マイクロホン・カプセルは、正規直交条件が満たされるよう、R=4.2cmをもつ球の表面上に一様に分布している。このアレイによってサポートされる最大のアンビソニックス次数Nは4である。上述した非特許文献3において記述されるモード・マッチング処理が、非特許文献9に従って25個の一様に分布したスピーカー位置について復号係数Dn ml)を得るために使われる。ノード番号はhttp://www.mathematik.uni-dortmund.de/lsx/research/projects/fliege/nodes/nodes.htmlで示されている。
参照パワーwref(k)は周波数範囲全体にわたって一定である。結果として得られるノイズ重みwnoise(k)は低周波で高いパワーを示し、より高い周波数で減少する。ノイズ信号またはパワーは、分散20dBをもつ(すなわち、上記平面波のパワーより20dB低い)、正規分布した偏りのない擬似ランダム・ノイズによってシミュレートされる。エイリアシング・ノイズwalias(k)は低周波では無視できるが、周波数の上昇とともに増大し、10kHzより上では参照パワーを超える。エイリアシング・パワー曲線の傾きは、平面波方向に依存する。しかしながら、平均傾向はすべての方向について一貫している。
二つの誤差信号wnoise(k)およびwalias(k)は参照重みを、異なる周波数範囲において歪める。さらに、これらの誤差信号は互いに独立である。したがって、エイリアス信号を考慮に入れることなくノイズ信号を最小にすることが提案される。
参照重みと歪められた参照重みとの間の平均二乗誤差がすべての入射平面波方向について最小化される。エイリアシング信号からの重みwalias(k)は無視される。というのも、walias(k)は、アンビソニックス表現の次数によって空間的に帯域制限された後では補正できないからである。これは、サンプリングされ帯域制限された時間信号からエイリアシングが除去できない時間領域エイリアシングと等価である。
〈最適化――ノイズ削減〉
ノイズ削減は、ノイズ信号によって導入される平均二乗誤差を最小にする。ウィーナー・フィルタ処理が、各次数nについて補償フィルタの周波数応答を計算するために周波数領域において使われる。誤差信号は、各波数kについて、参照重みwref(k)とフィルタリングされ歪められた重みwref(k)+wnoise(k)から得られる。先述したように、エイリアシング誤差walias(k)はここでは無視される。歪められた重みは最適化伝達関数F(k)によってフィルタリングされる。ここで、処理は歪められた信号と伝達関数F(k)の乗算によって周波数領域で実行される。零位相伝達関数F(k)は、参照重みとフィルタリングされ歪められた重みとの間の二乗誤差の期待値を最小にすることによって導出される。
Figure 0006030660
ウィーナー・フィルタとしてよく知られている解は次式によって与えられる。
Figure 0006030660
二乗された重み絶対値の期待値Eは、重みの平均信号パワーを表わす。よって、wnoise(k)とwref(k)のパワーの分数は、各波数kについての再構成された重みの逆信号対雑音比を表わす。wnoise(k)とwref(k)のパワーの計算については次のセクションで説明する。
参照重みwref(k)のパワーは、上述した非特許文献2の付録セクションの式(34)に基づく式(16)から得られる。
Figure 0006030660
式(24c)は、パワーが、すべてのスピーカーについて足し合わせたHOA係数Dn ml)の絶対値の二乗の和に等しいことを示している。|P0(k)|2が平均音場エネルギーに等しく、P0(k)がすべてのΩsについて一定であることが想定されている。これは、wref(k)のパワーが各次数nのパワーの和に分離できることを意味している。これがwnoise(k)の期待値についても成り立つならば、グローバルな最小を得るために、誤差信号は、各次数nについて別個に式(21)から最小化されることができる。
wnoise(k)のパワーの導出は非特許文献2のセクション7、式(28)において与えられている。ノイズ信号は空間的に無相関なので、期待値は各カプセルについて独立に計算できる。ノイズ重みの期待されるパワーは式(17)から次式によって導出される。
Figure 0006030660
ノイズ・パワー重みの、各次数nについてのパワーの和からの分離を達成するために、いくつかの制約がなされる。スピーカーcについての和が式(10)に単純化できるならば、かかる分離が得られる。
したがって、式(9)の条件が満たされるよう、カプセル位置は球の表面上にほぼ等しく分離している必要がある。さらに、ノイズ圧力のパワーはすべてのカプセルについて一定である必要がある。すると、ノイズ・パワーはΩcとは独立になり、cについての和から除外することができる。このように、一定のノイズ・パワーはすべてのカプセルについて
Figure 0006030660
によって定義される。これらの制約を適用すると、式(25b)は次に帰着する。
Figure 0006030660
カプセル位置についての上記制約は普通、球状マイクロホン・アレイについては満たされている。アレイは球状の圧力を一様にサンプリングするべきだからである。各マイクロホン信号についてのアナログ処理(センサー・ノイズまたは増幅)およびアナログ‐デジタル変換によって生成されるノイズについては、常に一定のノイズ・パワーが想定されることができる。よって、上記制約は、普通の球状マイクロホン・アレイについては有効である。
式(21b)からの期待値は、参照パワーとノイズ・パワーの線形重ね合わせである。各重みのパワーは各次数nのパワーの和に分離できる。よって、式(21b)からの期待値も各次数nについての和に分離できる。つまり、各次数nの最小からグローバルな最小が導出されることができ、よって一つの最適化伝達関数Fn(k)が各次数nについて定義できる。
Figure 0006030660
伝達関数Fn(k)は、式(23)、(24)、(25)を組み合わせることによって、伝達関数F(k)から得られる。N+1個の最適化伝達関数は次式によって定義される。
Figure 0006030660
伝達関数Fn(k)はカプセルの数および波数kについての信号対雑音比に依存する:
Figure 0006030660
他方、伝達関数はアンビソニックス・デコーダからは独立である。つまり、これは三次元アンビソニックス復号にも方向性ビーム形成にも有効である。よって、伝達関数は、復号係数Dn ml)についての和を考慮に入れることなく、アンビソニックス係数dn m(k)の平均二乗誤差からも導出できる。パワー|P0(k)|2は時間とともに変化するので、記録された信号の現在のSNR(k)から適応伝達関数が設計されることができる。その伝達関数設計については〈最適化されたアンビソニックス処理〉のセクションでさらに述べる。
伝達関数Fn(k)と非特許文献1のセクション4,式(32)からのティホノフ正規化伝達関数
Figure 0006030660
を比較すると、正規化パラメータλが式(29c)から導出できることがわかる。ティホノフ正規化の対応するパラメータ
Figure 0006030660
は、所与のSNR(k)について、アンビソニックス記録の平均再構成誤差を最小化する。
伝達関数Fn(k)はそれぞれアンビソニックス次数0ないし4についての関数「a」ないし「e」として図2に示されている。ここで、伝達関数は、各次数nについて高域通過特性をもつが、より高い次数ほどカットオフ周波数が増している。この伝達関数設計のために20dBの一定のSNR(k)が使用された。カットオフ周波数は、上述した非特許文献1の論文のセクション4.1.2に記述されているように正規化パラメータλとともに低下する。したがって、低周波数についてより高い次数のアンビソニックス係数を得るには、大きなSNR(k)が必要とされる。
最適化された重みw'(k)は次式から計算される。
Figure 0006030660
〈最適化されたアンビソニックス処理〉
アンビソニックス・マイクロホン・アレイ処理の実際的な実装では、最適化されたアンビソニックス係数dn m opt(k)は
Figure 0006030660
から得られる。これは、カプセルcについての和と、各次数nおよび波数kについての適応伝達関数とを含んでいる。この和は、球の表面上のサンプリングされた圧力分布をアンビソニックス表現に変換し、広帯域信号については、時間領域で実行できる。この処理段階は、時間領域の圧力信号P(Ωc,t)を第一のアンビソニックス表現An m(t)に変換する。
第二の処理段階では、最適化された伝達関数
Figure 0006030660
が、第一のアンビソニックス表現An m(t)から方向情報項目を再構成する。伝達関数bn(kR)の逆数がAn m(t)を方向係数dn m(t)に変換する。ここで、サンプリングされた音場は、球の表面上で散乱された平面波の重ね合わせによって生成されると想定している。係数dn m(t)は上述した非特許文献6のセクション3、式(14)において記述される音場の平面波分解を表わしており、この表現が、基本的にはアンビソニックス信号の伝送のために使用される。SNR(k)に依存して、最適化伝達関数Fn(k)は、ノイズによって覆われるHOA係数を除去するために、高次係数の寄与を減らす。
係数An m(t)の処理は、フィルタの伝達関数がFn,array(k)によって決定される線形フィルタリング演算と見なすことができる。これは、周波数領域でも時間領域でも実行できる。伝達関数Fn,array(k)の逐次乗算のための係数An m(t)の周波数領域への変換のために、FFTを使うことができる。その積の逆FFTが時間領域係数dn m(t)を与える。この伝達関数処理は、重複加算(overlap-add)または重複保存(overlap-save)法を使った高速畳み込みとしても知られる。あるいはまた、線形フィルタはFIRフィルタによって近似でき、該FIRフィルタの係数は伝達関数Fn,array(k)から、逆FFTでそれを時間領域に変換し、巡回シフトを実行し、結果として得られるフィルタ・インパルス応答に漸減する窓を適用して対応する伝達関数を平滑化することにより、計算できる。次いで線形フィルタリング・プロセスは時間領域で、nとmの各組み合わせについて伝達関数Fn,array(k)の時間領域係数と係数An m(t)との畳み込みによって実行される。
本発明の適応的なブロック・ベースのアンビソニックス処理は図3に描かれている。上の信号経路では、マイクロホン・カプセル信号の時間領域圧力信号P(Ωc,t)がステップまたは段階31において、式(14a)を使ってアンビソニックス表現An m(t)に変換される。ここではマイクロホン伝達関数bn(kR)による除算は実行されず(よってdn m(k)ではなくAn m(t)が計算される)、その代わりステップ/段階32において実行される。次いでステップ/段階32は、係数dn m(t)を得るために、記載された線形フィルタリング演算を時間領域または周波数領域において実行する。第二の処理経路は、伝達関数Fn,array(k)の自動適応フィルタ設計のために使われる。ステップ/段階33は、考えられる時間期間(すなわち、諸サンプルのブロック)について信号対雑音比SNR(k)の推定を実行する。この推定は、有限個の離散的な波数kについて周波数領域において実行される。よって、考慮される圧力信号P(Ωc,t)は、たとえばFFTを使って周波数領域に変換される必要がある。SNR(k)値は二つのパワー信号|Pnoise(k)|2および|P0(k)|2によって指定される。ノイズ信号のパワー|Pnoise(k)|2は所与のアレイについては一定で、カプセルによって生成されるノイズを表わす。平面波のパワー|P0(k)|2は圧力信号P(Ωc,t)から推定される。この推定についてはさらに、セクション「SNR推定」において記述する。推定されたSNR(k)から、n≦Nとして伝達関数Fn,array(k)がステップ/段階34において設計される。フィルタ設計は、式(29c)で与えられるウィーナー・フィルタおよび逆アレイ応答または逆伝達関数1/bn(kR)を含む。有利なことに、ウィーナー・フィルタは逆アレイ応答の伝達関数の高い増幅を制限する。その結果、伝達関数Fn,array(k)の扱える程度の増幅となる。次いで、フィルタ実装は、ステップ/段階32の時間または周波数領域における対応する線形フィルタ処理に適応される。
〈SNR推定〉
SNR(k)値は記録されたカプセル信号から推定される:それは平面波の平均パワー|P0(k)|2および|Pnoise(k)|2のノイズ・パワーに依存する。
ノイズ・パワーは、|P0(k)|2=0と想定できる何の音源もない無音環境において式(26)から得られる。調整可能なマイクロホン増幅器については、ノイズ・パワーはいくつかの増幅器利得について測定されるべきである。すると、ノイズ・パワーは、いくつかの記録のために、使用される増幅器利得に適合されることができる。
平均源パワー|P0(k)|2は、カプセルにおいて測定された圧力Pmicc,k)から推定される。これは、式(13)からのカプセルにおける圧力の期待値と、次式によって定義される、カプセルにおける測定された平均信号パワーとの比較によって実行される。
Figure 0006030660
Psig(k)の期待値を得るためには、ノイズ・パワー|Pnoise(k)|2を測定されたパワーから減算する必要がある。
期待値Psig(k)は、次式によっても、式(13)から、カプセルにおける圧力のアンビソニックス表現について推定されることができる。
Figure 0006030660
式(36b)において、式(36c)を導くために、式(4)についての正規直交条件が絶対的な大きさの展開に適用されることができる。それにより、平均信号パワーが球面調和関数Yn mc)の相互相関から推定される。伝達関数bn(kR)との組み合わせにおいて、これはカプセル位置における圧力場のコヒーレンスを表わす。
式(35)と(36)の等しいと置くことで、記録された圧力信号Pmicc,k)および推定されたノイズ・パワー|Pnoise(k)|2からの|P0(k)|2の推定が得られる。それは式(37)において提示される。
Figure 0006030660
式(37)の分母は所与のマイクロホン・アレイについて各波数kについて一定である。したがって、これはアンビソニックス次数Nmaxについて一度計算されて、ルックアップテーブルまたは各波数kについてのストアに格納しておくことができる。
最後に、SNR(k)値はカプセル信号P(Ωc,kR)から次式によって得られる。
Figure 0006030660
所与のカプセル信号からの平均源パワーの推定は、線形マイクロホン・アレイ処理からも知られる。カプセル信号の相互相関は、音場の空間的コヒーレンスと呼ばれる。線形アレイ処理のためには、空間的コヒーレンスが、平面波の連続的表現から決定される。剛体球上の散乱された音場の記述は、アンビソニックス表現でのみ知られている。よって、SNR(k)の提示される推定は、剛体球の表面上の空間的コヒーレンスを決定する新しい処理に基づく。
結果として、図2の最適化フィルタから得られるw'(k)の平均パワー成分は、モード・マッチング・アンビソニックス・デコーダについて図4に示される。ノイズ・パワーは1kHzの周波数までは、−35dBに低下させられている。1kHzより上では、ノイズ・パワーは−10dBまで線形に増大する。結果として得られるノイズ・パワーは、周波数約8kHzまではPnoisec,k)=−20dBより小さい。10kHzより上では全パワーは10dB上げられる。これはエイリアシング・パワーによって引き起こされる。10kHzより上では、マイクロホン・アレイのHOA次数は、Rに等しい半径をもつ球についての表面上の圧力分布を十分に記述しない。よって、得られるアンビソニックス係数によって引き起こされる平均パワーは参照パワーより大きい。
いくつかの付記を記載しておく。
〔付記1〕
剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号(P(Ω c ,t))を処理する方法であって:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ω c ,t))を、球面調和関数またはアンビソニックス表現A n m (t)に変換する段階(31)と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P 0 (k)| 2 および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|P noise (k)| 2 を使って、前記マイクロホン・カプセル信号(P(Ω c ,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算する段階(33)と;
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数nについての時間変化するウィーナー・フィルタを使って、適応された伝達関数F n,array (k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算する段階(34)と;
・前記適応された伝達関数F n,array (k)を、線形フィルタ処理を使って前記球面調和関数表現A n m (t)に適用し、結果として適応された方向性係数d n m (t)を与える段階(32)とを含む、
方法。
〔付記2〕
剛体球上の球状マイクロホン・アレイのマイクロホン・カプセル信号(P(Ω c ,t))を処理する装置であって:
・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ω c ,t))を、球面調和関数またはアンビソニックス表現A n m (t)に変換するよう適応されている手段と;
・前記マイクロホン・アレイから記録された平面波の平均源パワー|P 0 (k)| 2 および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|P noise (k)| 2 を使って、前記マイクロホン・カプセル信号(P(Ω c ,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算するよう適応されている手段と;
・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数nについての時間変化するウィーナー・フィルタを使って、適応された伝達関数F n,array (k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算するよう適応されている手段と;
・前記適応された伝達関数F n,array (k)を、線形フィルタ処理を使って前記球面調和関数表現A n m (t)に適用し、結果として適応された方向性係数d n m (t)を与えるよう適応されている手段とを含む、
装置。
〔付記3〕
前記ノイズ・パワー|P noise (k)| 2 が、|P 0 (k)| 2 =0であるような何の音源もない無音環境において得られる、付記1記載の方法または付記2記載の装置。
〔付記4〕
前記平均源パワー|P 0 (k)| 2 が、前記マイクロホン・カプセルにおいて測定された圧力P mic c ,k)から、前記マイクロホン・カプセルでの圧力の期待値と前記マイクロホン・カプセルでの測定された平均信号パワーとの比較によって、推定される、付記1または3記載の方法または付記2または3記載の装置。
〔付記5〕
前記アレイの前記伝達関数F n,array (k)が周波数領域において決定され:
・前記係数Anm(t)をFFTを使って周波数領域に変換し、続いて前記伝達関数Fn,array(k)を乗算し;
・その積の逆FFTを実行して時間領域係数d n m (t)を得ることを含む、
あるいは、時間領域でのFIRフィルタによって近似され、
・逆FFTを実行し;
・巡回シフトを実行し;
・結果として得られるフィルタ・インパルス応答に、対応する伝達関数を平滑化するために漸減する窓を適用し;
・nとmの各組み合わせについて、結果として得られるフィルタ係数と前記係数A n m (t)との畳み込みを実行することを含む、
付記1、3および4のうちいずれか一項記載の方法または付記2ないし4のうちいずれか一項記載の装置。

Claims (6)

  1. 剛体球上の球状マイクロホン・アレイのマイクロホン・カプセルにおいて測定されたマイクロホン・カプセル信号(P(Ωc,t))を処理する方法であって:
    ・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ωc,t))を、次数Nおよび方向性係数をもつ球面調和関数またはアンビソニックス表現An m(t)に変換する段階と;
    ・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号(P(Ωc,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算する段階と;
    ・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数n(n=0……N)についての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算する段階と;
    ・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数またはアンビソニックス表現An m(t)に適用し、結果として適応された方向性係数dn m(t)を与える段階とを含む、
    方法。
  2. 前記ノイズ・パワー|Pnoise(k)|2が、|P0(k)|2=0であるような何の音源もない無音環境において得られる、請求項1記載の方法。
  3. 前記平均源パワー|P0(k)|2が、前記マイクロホン・カプセルにおいて測定された圧力Pmicc,k)から、前記マイクロホン・カプセルでの圧力の期待値と前記マイクロホン・カプセルでの測定された平均信号パワーとの比較によって、推定される、請求項1または2記載の方法。
  4. 剛体球上の球状マイクロホン・アレイのマイクロホン・カプセルにおいて測定されたマイクロホン・カプセル信号(P(Ωc,t))を処理する装置であって:
    ・前記マイクロホン・アレイの表面上の圧力を表わす前記マイクロホン・カプセル信号(P(Ωc,t))を、次数Nおよび方向性係数をもつ球面調和関数またはアンビソニックス表現An m(t)に変換するよう適応されている手段と;
    ・前記マイクロホン・アレイから記録された平面波の平均源パワー|P0(k)|2および前記マイクロホン・アレイにおけるアナログ処理によって生成される空間的に無相関のノイズを表わす対応するノイズ・パワー|Pnoise(k)|2を使って、前記マイクロホン・カプセル信号(P(Ωc,t))の時間変化する信号対雑音比SNR(k)の推定を波数k毎に計算するよう適応されている手段と;
    ・前記信号対雑音比推定SNR(k)からの離散的な有限波数kにおいて設計された各次数n(n=0……N)についての時間変化するウィーナー・フィルタを使って、適応された伝達関数Fn,array(k)を得るために、前記ウィーナー・フィルタの伝達関数に、前記マイクロホン・アレイの逆伝達関数を乗算するよう適応されている手段と;
    ・前記適応された伝達関数Fn,array(k)を、線形フィルタ処理を使って前記球面調和関数またはアンビソニックス表現An m(t)に適用し、結果として適応された方向性係数dn m(t)を与えるよう適応されている手段とを含む、
    装置。
  5. 前記ノイズ・パワー|Pnoise(k)|2が、|P0(k)|2=0であるような何の音源もない無音環境において得られる、請求項4記載の装置。
  6. 前記平均源パワー|P0(k)|2が、前記マイクロホン・カプセルにおいて測定された圧力Pmicc,k)から、前記マイクロホン・カプセルでの圧力の期待値と前記マイクロホン・カプセルでの測定された平均信号パワーとの比較によって、推定される、請求項4または5記載の装置。
JP2014540395A 2011-11-11 2012-10-31 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置 Active JP6030660B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11306471.1 2011-11-11
EP11306471.1A EP2592845A1 (en) 2011-11-11 2011-11-11 Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field
PCT/EP2012/071535 WO2013068283A1 (en) 2011-11-11 2012-10-31 Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field

Publications (3)

Publication Number Publication Date
JP2014535231A JP2014535231A (ja) 2014-12-25
JP2014535231A5 JP2014535231A5 (ja) 2015-12-24
JP6030660B2 true JP6030660B2 (ja) 2016-11-24

Family

ID=47143887

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014540395A Active JP6030660B2 (ja) 2011-11-11 2012-10-31 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置

Country Status (6)

Country Link
US (1) US9503818B2 (ja)
EP (2) EP2592845A1 (ja)
JP (1) JP6030660B2 (ja)
KR (1) KR101938925B1 (ja)
CN (1) CN103931211B (ja)
WO (1) WO2013068283A1 (ja)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2592846A1 (en) 2011-11-11 2013-05-15 Thomson Licensing Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field
US10021508B2 (en) * 2011-11-11 2018-07-10 Dolby Laboratories Licensing Corporation Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field
US9495968B2 (en) 2013-05-29 2016-11-15 Qualcomm Incorporated Identifying sources from which higher order ambisonic audio data is generated
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US20150127354A1 (en) * 2013-10-03 2015-05-07 Qualcomm Incorporated Near field compensation for decomposed representations of a sound field
EP2866475A1 (en) 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups
DE102013223201B3 (de) * 2013-11-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
EP2922057A1 (en) 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
KR20220113837A (ko) 2014-03-21 2022-08-16 돌비 인터네셔널 에이비 고차 앰비소닉스(hoa) 신호를 압축하는 방법, 압축된 hoa 신호를 압축 해제하는 방법, hoa 신호를 압축하기 위한 장치, 및 압축된 hoa 신호를 압축 해제하기 위한 장치
WO2015140292A1 (en) 2014-03-21 2015-09-24 Thomson Licensing Method for compressing a higher order ambisonics (hoa) signal, method for decompressing a compressed hoa signal, apparatus for compressing a hoa signal, and apparatus for decompressing a compressed hoa signal
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US20150332682A1 (en) * 2014-05-16 2015-11-19 Qualcomm Incorporated Spatial relation coding for higher order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9852737B2 (en) * 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9949033B2 (en) * 2014-07-23 2018-04-17 The Australian National University Planar sensor array
TWI584657B (zh) * 2014-08-20 2017-05-21 國立清華大學 一種立體聲場錄音以及重建的方法
KR101586364B1 (ko) * 2014-09-05 2016-01-18 한양대학교 산학협력단 공간 음향 분할을 통한 동적 방향성 임펄스 응답을 생성하기 위한 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US9560441B1 (en) * 2014-12-24 2017-01-31 Amazon Technologies, Inc. Determining speaker direction using a spherical microphone array
EP3073488A1 (en) 2015-03-24 2016-09-28 Thomson Licensing Method and apparatus for embedding and regaining watermarks in an ambisonics representation of a sound field
RU2687882C1 (ru) * 2016-03-15 2019-05-16 Фраунхофер-Гезеллшафт Цур Фёрдерунг Дер Ангевандтен Форшунг Е.В. Устройство, способ формирования характеристики звукового поля и машиночитаемый носитель информации
US10492000B2 (en) 2016-04-08 2019-11-26 Google Llc Cylindrical microphone array for efficient recording of 3D sound fields
WO2018053050A1 (en) * 2016-09-13 2018-03-22 VisiSonics Corporation Audio signal processor and generator
US10516962B2 (en) * 2017-07-06 2019-12-24 Huddly As Multi-channel binaural recording and dynamic playback
CN109963249B (zh) * 2017-12-25 2021-12-14 北京京东尚科信息技术有限公司 数据处理方法及其***、计算机***和计算机可读介质
CN112292870A (zh) 2018-08-14 2021-01-29 阿里巴巴集团控股有限公司 音频信号处理装置及方法
JP6969793B2 (ja) 2018-10-04 2021-11-24 株式会社ズーム アンビソニックスのためのa/bフォーマット変換装置、a/bフォーマット変換ソフトウェア、レコーダー、再生ソフトウェア
CN110133579B (zh) * 2019-04-11 2021-02-05 南京航空航天大学 适用于球面麦克风阵列声源定向的球谐波阶数自适应选择方法
KR102154553B1 (ko) * 2019-09-18 2020-09-10 한국표준과학연구원 지향성이 향상된 마이크로폰 어레이 및 이를 이용한 음장 취득 방법
CN112530445A (zh) * 2020-11-23 2021-03-19 雷欧尼斯(北京)信息技术有限公司 高阶Ambisonic音频的编解码方法及芯片
CN113395638B (zh) * 2021-05-25 2022-07-26 西北工业大学 一种基于等效源法的室内声场扬声器重放方法
CN113281900B (zh) * 2021-05-26 2022-03-18 复旦大学 一种基于汉克尔变换与波束传播法的光学建模与计算方法
US11349206B1 (en) 2021-07-28 2022-05-31 King Abdulaziz University Robust linearly constrained minimum power (LCMP) beamformer with limited snapshots

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7123727B2 (en) * 2001-07-18 2006-10-17 Agere Systems Inc. Adaptive close-talking differential microphone array
US20030147539A1 (en) * 2002-01-11 2003-08-07 Mh Acoustics, Llc, A Delaware Corporation Audio system based on at least second-order eigenbeams
US7558393B2 (en) * 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
FI20055261A0 (fi) * 2005-05-27 2005-05-27 Midas Studios Avoin Yhtioe Akustisten muuttajien kokoonpano, järjestelmä ja menetelmä akustisten signaalien vastaanottamista tai toistamista varten
EP1737271A1 (en) * 2005-06-23 2006-12-27 AKG Acoustics GmbH Array microphone
EP1931169A4 (en) * 2005-09-02 2009-12-16 Japan Adv Inst Science & Tech POST-FILTER FOR A MICROPHONE MATRIX
CN101627641A (zh) * 2007-03-05 2010-01-13 格特朗尼克斯公司 具有信号处理功能的小器件封装麦克风模块
GB0906269D0 (en) * 2009-04-09 2009-05-20 Ntnu Technology Transfer As Optimal modal beamformer for sensor arrays
EP2592846A1 (en) * 2011-11-11 2013-05-15 Thomson Licensing Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field
US9197962B2 (en) * 2013-03-15 2015-11-24 Mh Acoustics Llc Polyhedral audio system based on at least second-order eigenbeams

Also Published As

Publication number Publication date
US20140286493A1 (en) 2014-09-25
KR101938925B1 (ko) 2019-04-10
KR20140091578A (ko) 2014-07-21
JP2014535231A (ja) 2014-12-25
EP2777297B1 (en) 2016-06-08
EP2592845A1 (en) 2013-05-15
WO2013068283A1 (en) 2013-05-16
CN103931211B (zh) 2017-02-15
US9503818B2 (en) 2016-11-22
CN103931211A (zh) 2014-07-16
EP2777297A1 (en) 2014-09-17

Similar Documents

Publication Publication Date Title
JP6030660B2 (ja) 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置
JP6113739B2 (ja) 音場のアンビソニックス表現を生成するために使われる剛体球上の球状マイクロホン・アレイの信号を処理する方法および装置
CN106710601B (zh) 一种语音信号降噪拾音处理方法和装置及冰箱
JP6389259B2 (ja) マイクロホンアレイを使用した残響音の抽出
CN103856866B (zh) 低噪微分麦克风阵列
JP2014535231A5 (ja)
KR102573843B1 (ko) 음성 제어를 갖는 낮은 복잡도의 다중 채널 스마트 라우드스피커
EP2905975B1 (en) Sound capture system
US20150163577A1 (en) Low noise differential microphone arrays
JP2014535232A5 (ja)
KR20140138907A (ko) 통합 또는 하이브리드 사운드-필드 제어 전략을 적용하는 방법
Sakamoto et al. Sound-space recording and binaural presentation system based on a 252-channel microphone array
WO2015159731A1 (ja) 音場再現装置および方法、並びにプログラム
US10021508B2 (en) Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field
KR101587844B1 (ko) 마이크로폰의 신호 보상 장치 및 그 방법
EP2757811B1 (en) Modal beamforming
JP5826712B2 (ja) マルチチャネルエコー消去装置、マルチチャネルエコー消去方法、およびプログラム
Sadeghi et al. A proposed method to improve the WER of an ASR system in the noisy reverberant room
Kordon et al. Optimization of spherical microphone array recordings
Zou et al. A broadband speech enhancement technique based on frequency invariant beamforming and GSC
Pedamallu Microphone Array Wiener Beamforming with emphasis on Reverberation
Naylor Dereverberation

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151030

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151030

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160705

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20160826

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160902

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161004

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161020

R150 Certificate of patent or registration of utility model

Ref document number: 6030660

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250