JP2022008732A

JP2022008732A - 信号処理装置および方法、並びにプログラム

Info

Publication number: JP2022008732A
Application number: JP2018200618A
Authority: JP
Inventors: 直毅村田; Naoki Murata; 祐基光藤; Yuki Mitsufuji; 悠前野; Yu Maeno; ジーホイチャン; Jihui Zhang
Original assignee: Sony Group Corp
Current assignee: Sony Group Corp
Priority date: 2018-10-25
Filing date: 2018-10-25
Publication date: 2022-01-14
Also published as: US20210375256A1; WO2020085117A1

Abstract

【課題】省スペースかつ少ない演算量で空間ノイズキャンセリングを実現する。【解決手段】信号処理装置は、複数のマイクロホンからなる第１のマイクロホンアレイで収音することで得られた第１のマイクロホン信号に基づいて、所定領域外から所定領域へと伝搬する第１のマイクロホンアレイにより収音された音をキャンセルするための出力音のスピーカ駆動信号を生成し、スピーカ駆動信号に基づいて、少なくとも１つの高次スピーカからなるスピーカアレイから出力音を出力させる制御部を備える。本技術は信号処理装置に適用することができる。【選択図】図４

Description

本技術は、信号処理装置および方法、並びにプログラムに関し、特に、省スペースかつ少ない演算量で空間ノイズキャンセリングを実現することができるようにした信号処理装置および方法、並びにプログラムに関する。

従来、複数のスピーカを並べて構成されるスピーカアレイを用いて、目的とする領域におけるノイズキャンセリングを行う空間ノイズキャンセリングが知られている。

そのような空間ノイズキャンセリングに関する技術として、例えば波数領域信号処理を行うことで演算量を削減する技術が提案されている（例えば、非特許文献１参照）。この技術では、単一の指向性を有する複数のスピーカにより構成されるスピーカアレイが用いられて空間ノイズキャンセリングが実現される。

J.Zhang, T. D. Abhayapala, W. Zhang, P. N. Samarasinghe, and S. Jiang. Active noise control over space: A wave domain approach. IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP), 26(4):774-786, 2018.

しかしながら、上述した技術では省スペースかつ少ない演算量で、十分な性能の空間ノイズキャンセリングを実現することは困難であった。

例えば非特許文献１に記載の技術では、演算量を低減させることはできるが、ノイズとなる音を十分にキャンセルしようとするとスピーカアレイを構成するスピーカの数を多くしなければならず、スピーカアレイを配置するのに広いスペースが必要となる。

本技術は、このような状況に鑑みてなされたものであり、省スペースかつ少ない演算量で空間ノイズキャンセリングを実現することができるようにするものである。

本技術の一側面の信号処理装置は、複数のマイクロホンからなる第１のマイクロホンアレイで収音することで得られた第１のマイクロホン信号に基づいて、所定領域外から前記所定領域へと伝搬する前記第１のマイクロホンアレイにより収音された音をキャンセルするための出力音のスピーカ駆動信号を生成し、前記スピーカ駆動信号に基づいて、少なくとも１つの高次スピーカからなるスピーカアレイから前記出力音を出力させる制御部を備える。

本技術の一側面の信号処理方法またはプログラムは、複数のマイクロホンからなるマイクロホンアレイで収音することで得られたマイクロホン信号に基づいて、所定領域外から前記所定領域へと伝搬する前記マイクロホンアレイにより収音された音をキャンセルするための出力音のスピーカ駆動信号を生成し、前記スピーカ駆動信号に基づいて、少なくとも１つの高次スピーカからなるスピーカアレイから前記出力音を出力させるステップを含む。

本技術の一側面においては、複数のマイクロホンからなる第１のマイクロホンアレイで収音することで得られた第１のマイクロホン信号に基づいて、所定領域外から前記所定領域へと伝搬する前記第１のマイクロホンアレイにより収音された音をキャンセルするための出力音のスピーカ駆動信号が生成され、前記スピーカ駆動信号に基づいて、少なくとも１つの高次スピーカからなるスピーカアレイから前記出力音が出力される。

エラーマイクロホンアレイ、高次スピーカアレイ、および参照マイクロホンアレイの配置を示す図である。グローバルモード係数とローカルモード係数について説明する図である。 MIMO型の空間ノイズキャンセリングシステムの構成を示す図である。 MD-GM型の空間ノイズキャンセリングシステムの構成を示す図である。空間ノイズキャンセリング処理を説明するフローチャートである。 MD-LM型の空間ノイズキャンセリングシステムの構成を示す図である。空間ノイズキャンセリング処理を説明するフローチャートである。フィルタリング処理の演算量について説明する図である。フィルタ係数更新処理の演算量について説明する図である。コンピュータの構成例を示す図である。

以下、図面を参照して、本技術を適用した実施の形態について説明する。

〈第１の実施の形態〉
〈空間ノイズキャンセリングシステムについて〉
本技術は、高次スピーカを利用するとともに、波数領域、すなわちモードドメインにおいてフィルタ係数更新の演算やフィルタリングの演算を行うことで、省スペースかつ少ない演算量で空間ノイズキャンセリングを実現することができるようにするものである。

例えばスピーカとして高次スピーカを用いれば、単一の指向性のみを再現可能な通常のスピーカを用いる場合と比較して、省スペースで空間ノイズキャンセリングを実現できる。また、本技術では、少なくともフィルタ係数の更新を波数領域の演算により実現するようにしたので、演算量を削減することができる。高次スピーカは複数のスピーカから構成されているので、通常のスピーカを用いる場合における波数領域での演算処理を、そのまま高次スピーカを用いる場合に適用することはできない。そこで、本技術では、高次スピーカを用いる場合でも波数領域での演算を行うことができるようにした。

まず、本技術について説明する。以下では説明を簡単にするため、２次元音場を対象とした空間ノイズキャンセリングについて説明するが、３次元音場を対象とした空間ノイズキャンセリングも２次元音場を対象とする場合と同様にして実現可能である。すなわち、２次元音場を対象とした空間ノイズキャンセリングを、３次元音場を対象とした空間ノイズキャンセリングへと拡張することは容易に行うことができる。

本技術では、図１に示す配置でエラーマイクロホンアレイEMA11、高次スピーカアレイSP11、および参照マイクロホンアレイRMA11が配置されるものとして説明を行う。

なお、本技術におけるエラーマイクロホンアレイや、高次スピーカアレイ、参照マイクロホンアレイの配置は、エラーマイクロホンアレイと参照マイクロホンアレイの間に高次スピーカアレイが配置されていれば、図１に示す配置に限らず、どのような配置であってもよい。

また、エラーマイクロホンアレイや参照マイクロホンアレイは、環状マイクロホンアレイに限らず、直線マイクロホンアレイを組み合わせたものや球状マイクロホンアレイなど、どのようなものであってもよく、同様に高次スピーカアレイも環状のアレイに限らず、矩形状や球状など、どのような形状のアレイとされてもよい。

図１に示す例では、２次元空間上にエラーマイクロホンアレイEMA11、高次スピーカアレイSP11、および参照マイクロホンアレイRMA11が配置されて空間ノイズキャンセリングシステムが構成されている。

この例では、図中、中央にある円形状のターゲット領域R11が空間ノイズキャンセリングの対象となる領域とされている。例えばターゲット領域R11では、ターゲット領域R11外にあるノイズ源NS11-1やノイズ源NS11-2からターゲット領域R11内へと伝搬してくる音（以下、空間ノイズ音とも称する）が聞こえなくなるように、高次スピーカアレイSP11から音が出力される。すなわち、高次スピーカアレイSP11から出力される音によって、空間ノイズ音がキャンセルされる。

なお、以下、ノイズ源NS11-1およびノイズ源NS11-2を特に区別する必要のない場合、単にノイズ源NS11とも称することとする。

エラーマイクロホンアレイEMA11は、ターゲット領域R11を囲むように環状に配置された複数のマイクロホンからなる環状マイクロホンアレイであり、ターゲット領域R11における空間ノイズ音が十分にキャンセルされているかをモニタリングするために用いられる。なお、エラーマイクロホンアレイEMA11は、ターゲット領域R11内に配置されるようにしてもよい。

また、エラーマイクロホンアレイEMA11の外側には、そのエラーマイクロホンアレイEMA11を囲むように環状に配置された複数の高次スピーカからなる高次スピーカアレイSP11が配置されている。ここでは、高次スピーカアレイSP11は環状スピーカアレイとなっている。

高次スピーカアレイSP11を構成する高次スピーカは、例えば複数のスピーカを環状または球状に配置して得られる、自由に指向性を制御可能なスピーカアレイにより実現される。換言すれば、高次スピーカは任意の複数の指向性、つまり任意の複数の放射パターンを再現可能なスピーカである。

ここでは、高次スピーカは少なくとも１次以上の次数の放射パターン（指向性）を再現可能であるとする。この放射パターンの次数は調和関数、すなわちここでは環状調和関数の基底のインデックスである。なお、高次スピーカアレイが球状スピーカアレイである場合には、球面調和関数の基底のインデックスが放射パターンの次数に対応する。また、以下、高次スピーカを構成するスピーカをドライバとも称することとする。その他、高次スピーカに代えて多重極音源を用いてもよいし、高次スピーカアレイSP11に代えて１つの高次スピーカからなるスピーカアレイを用いてもよい。

このような高次スピーカにより構成される高次スピーカアレイSP11は、単一の指向性のみを再現可能な通常のスピーカからなるスピーカアレイよりも設置に必要となるスペースが小さくて済むことが知られている。したがって、高次スピーカアレイSP11を用いれば、省スペースで空間ノイズキャンセリングを実現することができる。

また、図１では高次スピーカアレイSP11の外側を囲むように環状に配置された複数のマイクロホンからなる参照マイクロホンアレイRMA11が配置されている。すなわち、図１では、エラーマイクロホンアレイEMA11が、高次スピーカアレイSP11に対して参照マイクロホンアレイRMA11とは反対側に配置されている。

ここでは、参照マイクロホンアレイRMA11は環状マイクロホンアレイであり、空間ノイズ音を含む周囲の音を収音し、ターゲット領域R11内において、どのような空間ノイズ音の波面が生じているかを推定するために用いられる。

このような空間ノイズキャンセリングシステムでは、参照マイクロホンアレイRMA11が収音することにより得られる参照マイクロホン信号と、エラーマイクロホンアレイEMA11が収音することにより得られるエラーマイクロホン信号とに基づいて、空間ノイズキャンセリングのためのフィルタ係数が生成（更新）される。

そして、生成されたフィルタ係数が用いられて参照マイクロホン信号に対するフィルタリングが行われてスピーカ駆動信号が生成され、高次スピーカアレイSP11がスピーカ駆動信号に基づいて音を出力することで、ターゲット領域R11におけるノイズ音、つまりノイズ源NS11からの空間ノイズ音が低減（キャンセル）される。

なお、参照マイクロホンアレイRMA11の外側を囲むように高次スピーカアレイSP11が配置され、さらにその高次スピーカアレイSP11の外側を囲むようにエラーマイクロホンアレイEMA11が配置されるようにしてもよい。そのような場合、エラーマイクロホンアレイEMA11の外側、つまり高次スピーカアレイSP11側とは反対側の領域が、空間ノイズキャンセリングの対象となるターゲット領域とされる。

以下では、参照マイクロホンアレイRMA11を構成するマイクロホンの数がN_r個であり、エラーマイクロホンアレイEMA11を構成するマイクロホンの数がN_e個であり、高次スピーカアレイSP11を構成する高次スピーカの数がN_l個であるとする。

また、高次スピーカアレイSP11を構成する１つの高次スピーカがQ個のドライバにより構成されるものとする。したがって、高次スピーカアレイSP11を構成するドライバの数はQN_l個となる。

さらに、以下では、参照マイクロホン信号をx(k)とも記し、エラーマイクロホン信号をe(k)とも記すこととする。

参照マイクロホン信号x(k)は、参照マイクロホンアレイRMA11を構成するN_r個の各マイクロホンで得られた信号を要素としてもつ、ある波数kについての複素ベクトルである。

同様に、エラーマイクロホン信号e(k)は、エラーマイクロホンアレイEMA11を構成するN_e個の各マイクロホンで得られた信号を要素としてもつ、ある波数kについての複素ベクトルである。

ここで、時間周波数の変数をf [Hz]とし、音速をc [m/s]とすると、波数kはk＝2πf/c [1/m]で定義される。

また、高次スピーカアレイSP11を構成するN_l個の高次スピーカのうちのn_l番目の高次スピーカのQ×1の複素ベクトルである駆動信号をy_{n_l}(k)＝[y_{n_l,1}(k),・・・,y_{n_l,Q}(k)]^Tとする。さらに、これらのN_l個の駆動信号y_{n_l}(k)を並べて得られる、次式（１）に示すQN_l×1の複素ベクトルをy(k)とする。このベクトルy(k)が高次スピーカアレイSP11のスピーカ駆動信号である。

なお、以下においては表記の都合上、波数を表すkを省略することがある。

〈グローバルモード係数について〉
次に、参照マイクロホンアレイRMA11やエラーマイクロホンアレイEMA11についてのモード係数について説明する。

空間ノイズキャンセリングをはじめとする空間音場制御技術において、複数の地点の音圧を制御するのではなく、空間的な音圧の分布をモードドメインと呼ばれる領域、すなわち波数領域の信号に変換したうえで制御する手法が数多く提案されている。

モードドメインの信号はモード係数と呼ばれており、音圧分布のモード係数への変換は、空間内の波動をいくつかの波動の基底を用いて展開することに対応しており、時間信号を複数の周波数の正弦波で展開するフーリエ変換と同様な処理である。

ここで、例としてエラーマイクロホンアレイEMA11で観測されるエラーマイクロホン信号e(k)のモード係数への変換について説明する。なお、参照マイクロホンアレイRMA11で観測される参照マイクロホン信号x(k)のモード係数への変換も、以下で説明するエラーマイクロホン信号e(k)における場合と同様であるので、その説明は省略する。

例えばエラーマイクロホンアレイEMA11を構成するN_e個の各マイクロホンのうちのn_e番目のマイクロホンで観測された信号、つまり観測された音圧をp_{n_e}とし、それらの音圧p_{n_e}を並べて得られる、次式（２）に示すN_e×1の複素ベクトルをpとする。なお、この複素ベクトルpがエラーマイクロホン信号e(k)である。

このとき、複素ベクトルpをモードドメインの信号に変換することで得られるモード係数p’は、以下のようにして求めることができる。ここで、モード係数p’は（2M_g+1）×1の複素ベクトルであり、p’＝[p_-Mg,・・・,p_Mg]^Tであるとする。

モード係数p’の要素は、虚数をjとし、エラーマイクロホンアレイEMA11の半径をR_eとして次式（３）により得ることができる。但し、m_g＝-M_g,・・・,M_gであり、M_gはモードの最大次数、すなわち後述するグローバルモード係数の最大次数を表している。

なお、式（３）においてJ_{_(m_g)}(・)は，（m_g）次の第１種ベッセル関数である。また、式（３）に示す変換については、例えば「M. A. Poletti. A unified theory of horizontal holographic sound systems. Journal of the audio Engineering Society, 48(12):1155-1182, 2000.」などに詳細に記載されている。

また、３次元音場における場合のモード係数への変換については、例えば「M. A. Poletti. Three-dimensional surround sound systems based on spherical harmonics. Journal of the Audio Engineering Society, 53(11):1004-1025, 2005.」などに詳細に記載されている。

このような式（３）による変換は線形変換である。そのため、式（３）は所定の（2M_g+1）×N_eの変換行列T_geを用いて次式（４）に示すように行列形式で記述することができる。

ここで、(・)m,nが行列の(m,n)要素を表すとすると、変換行列T_geの要素は、次式（５）に示すように表される。

式（４）で得られるモード係数p’は、空間上の所定の基準位置を原点とした、つまりグローバルな座標系の原点を基準としたモード係数であり、以下では、このようなモード係数を特にグローバルモード係数とも称することとする。

また、参照マイクロホンアレイRMA11の参照マイクロホン信号x(k)についても、式（４）と同様の演算により、グローバルモード係数を求めることができる。以下では、参照マイクロホン信号x(k)をグローバルモード係数に変換するための変換行列をT_grと記すこととする。

〈ローカルモード係数について〉
続いて、高次スピーカのローカルモード係数について説明する。特に、以下では高次スピーカの位置を基準（原点）とする、その高次スピーカについてのモード係数をローカルモード係数とも称することとする。ローカルモード係数は、グローバルモード係数における原点とは異なる位置を原点とするモード係数である。

例えば２次元空間において、高次スピーカが半径r_{_o}と角度φ_{_o}からなる極座標で表される位置R_{_o}＝(r_{_o},φ_{_o})に形成する音場p(R_{_o})は、以下の式（６）のように表すことができる。

式（６）において、H_{_(m_l)}(ka_{_(n_l,o)})e^{-j(m_l)θ_(n_l,o)}は高次スピーカの異なる各放射パターンを表しており、それらの放射パターンがモードと呼ばれている。また、式（６）においてβ_{_(m_l)}は、m_lに対応するモードの振幅の強さを表しており、このβ_{_(m_l)}が高次スピーカのローカルモード係数である。さらにM_lは最大ローカルモード次数、すなわちローカルモード係数の最大次数である。また、式（６）においてa_{_(n_l,o)}は高次スピーカの位置から位置R_{_o}までの距離を示しており、θ_{_(n_l,o)}は、高次スピーカの位置を始点とし、位置R_{_o}を終点とするベクトルと、高次スピーカの位置を始点とし、グローバルな座標系の原点を終点とするベクトルとのなす角度を示している。

式（６）から分かるように、１つの高次スピーカにより形成される音場p(R_{_o})は、複数の放射パターンを組み合わせたものとなっている。

したがって、高次スピーカから音を出力する際に、これらの各モードのローカルモード係数β_{_(m_l)}を適切に決定（制御）することで、様々な指向性を有する音を出力することができる。すなわち、任意の指向性を形成（再現）することができる。

ここで、高次スピーカアレイSP11を構成するN_l個の高次スピーカのうちのn_l番目の高次スピーカを構成するQ個のドライバの駆動信号がy_{n_l}であるとする。ここで、y_{n_l}は上述したQ×1の複素ベクトルである駆動信号y_{n_l}(k)における波数kの表記を省略したものである。

このとき、Q個のドライバについて得られるローカルモード係数β_{_(n_l)}は、（2M_l+1）×1の複素ベクトルとなり、次式（７）に示すように行列形式で記述することができる。

式（７）では（2M_l+1）×Qの行列であるT_lsが、駆動信号y_{n_l}をローカルモード係数β_{_(n_l)}へと変換する変換行列となる。なお、変換行列T_lsは解析的に求めることもできるし、計測によって求めることもできる。

〈グローバルモード係数とローカルモード係数の相互変換について〉
さらに、グローバルモード係数とローカルモード係数の相互変換について説明する。

上述したように、独立に駆動された高次スピーカの複数のドライバはローカルモード係数で表される指向性を形成する。ここで、注意すべきは、これらのローカルモード係数は、高次スピーカの原点に依存する係数であるということである。

一方で、空間ノイズキャンセリングを含む音場制御では、ある特定の対象の領域を考えることが多いため、その領域での音場制御をモードドメインで考える場合には、何らかの原点を設定し、その原点に依存するモード係数を制御することになる。このときの高次スピーカの位置、つまり高次スピーカの原点とは異なる位置を原点とするモード係数が、上述したグローバルモード係数である。

ここで、例えば図２に示すように所定の原点Ogを中心とする半径R_{_l}の円周上に高次スピーカアレイSP11を構成するN_l個の高次スピーカが等間隔で配置されている例について考える。なお、図２において図１における場合と対応する部分には同一の符号を付してあり、その説明は省略する。

図２では、高次スピーカアレイSP11を構成するN_l個の高次スピーカが原点Ogを中心として環状に配置されている。例えば矢印A11により示される１つの円が、高次スピーカアレイSP11を構成するn_l番目の高次スピーカを表している。

ここでは、n_l番目の高次スピーカの位置は、原点Ogからの距離である半径R_{_l}と、所定の軸に対する角度であるφ_{(n_l)}とが用いられて、極座標により（R_{_l},φ_{(n_l)}）と表される。また、高次スピーカの位置を始点とし、位置R_{_o}を終点とするベクトルをベクトルA_{_(n_l,o)}とすると、このベクトルA_{_(n_l,o)}の長さ（大きさ）が上述の式（６）におけるa_{_(n_l,o)}であり、高次スピーカの位置を始点とし、原点Ogを終点とするベクトルと、ベクトルA_{_(n_l,o)}とのなす角度が上述の式（６）におけるθ_{_(n_l,o)}である。

いま、原点Og近傍の音場を制御したいものとすると、N_l個の高次スピーカについて、高次スピーカを構成する各ドライバの駆動信号を制御することにより、各高次スピーカのローカルモード係数を適切に制御し、所望の音場を形成することができる。

しかしながら、制御対象となるのは原点Og近傍の音場である。すなわち、原点Ogを展開中心とするグローバルモード係数を制御する必要がある。そのため、ローカルモード係数をグローバルモード係数に変換する必要がある。

このようなローカルモード係数のグローバルモード係数への変換は、高次スピーカを用いた音場制御などで用いられている。

ここでは、図２に示す高次スピーカの配置に基づいて、各高次スピーカのローカルモード係数から、原点Ogを中心とするグローバルモード係数への変換について説明する。なお、本技術では高次スピーカアレイSP11を構成する高次スピーカの配置は、図２に示す例に限らず、どのような配置であってもよい。

例えば、原点Ogを中心として、その原点Og近傍にある位置R_{_o}の音場p(R_{_o})が以下の式（８）に示すように展開されているとする。なお、この音場p(R_{_o})の最大グローバルモード次数、すなわちモードの最大次数がM_gであるとする。

式（８）においてp_{_(m_g)}(R_{_o})は、音場p(R_{_o})をグローバルモードごとに展開したときの成分である。また、γ_{_(m_g)}は複素数であり、原点Ogを中心として音場p(R_{_o})を展開したときのグローバルモード係数である。さらに、m_gはグローバルモードのインデックスを表している。

ここで、位置（R_{_l},φ_{(n_l)}）にある高次スピーカの(m_l)次のモード成分が形成する音場p_{_(n_l),(m_l)}(R_{_o})は、以下の式（９）により表すことができる。但し、r_{_o}＜R_{_l}である。

したがって、高次スピーカアレイSP11を構成するn_l番目の高次スピーカの(m_l)次のモード（ローカルモード）の係数をα_{_(n_l),(m_l)}としたとき、高次スピーカアレイSP11全体により形成される音場p(R_{_o})は、次式（１０）に示すようになる。なお、このローカルモード係数α_{_(n_l),(m_l)}は、式（６）におけるローカルモード係数β_{_(m_l)}に対応する。

上述の式（８）および式（１０）から、グローバルモード係数γ_{_(m_g)}と、N_l個の高次スピーカのローカルモード係数α_{_(n_l),(m_l)}との関係は、次式（１１）に示すようになる。

また、次式（１２）に示すように、グローバルモード係数γ_{_(m_g)}を並べて得られる（2M_g+1）×1の複素ベクトルをγとする。

さらに、次式（１３）に示すように、高次スピーカアレイSP11を構成するN_l個の高次スピーカのローカルモード係数α_{_(n_l),(m_l)}を並べて得られる（2M_l+1）N_l×1の複素ベクトルをαとする。

このとき、これらの複素ベクトルγと複素ベクトルαの関係は、次式（１４）に示すようになる。

なお、式（１４）においてI(n_l,m_l)は、インデックスを求める関数であり、T_glは（2M_g+1）×（2M_l+1）N_lの変換行列である。この変換行列T_glが各高次スピーカのローカルモード係数を、原点を中心とする高次スピーカアレイSP11全体のグローバルモード係数へと変換する行列である。

〈MIMOについて〉
さらに、空間ノイズキャンセリングを実現する適応型ノイズキャンセリングアルゴリズムについて説明する。

本技術の空間ノイズキャンセリングのアルゴリズムは、FIR（Finite Impulse Response）型のフィルタのフィルタ係数を参照マイクロホン信号x(k)とエラーマイクロホン信号e(k)との関係から適応的に更新していくアルゴリズムであり、適応フィルタ手法の一種である。

適応フィルタ手法の一般的な手法としてFiltered-X LMS（Least Mean Square）アルゴリズムが知られている。Filtered-X LMSは、空間ノイズキャンセリングのような多チャンネルでの制御にも拡張されており、また制御対象の信号を異なるドメイン（領域）の信号に変換する手法も提案されている。

以下において説明する本技術を適用した空間ノイズキャンセリングの手法は、全てFiltered-X LMSアルゴリズムの構造を持つものである。

ここでは、まずMIMO（Multi Input Multi Output）型のFiltered-X LMSアルゴリズム（以下、単にMIMOとも称する）について説明する。そして、その後、ローカルモード適応アルゴリズム（以下、単にMD-LMとも称する）とグローバルモード適応アルゴリズム（以下、単にMD-GMとも称する）について説明する。

MIMO-Filtered-X LMSアルゴリズムは、１入力１出力Filtered-X LMSアルゴリズムの自然な拡張として導出される。

ここで、図１に示したアレイ配置においてFiltered-X LMSアルゴリズムを定式化することを考える。

まず、エラーマイクロホンアレイEMA11で観測されるノイズ（直接音）成分の信号、すなわち、ノイズ源NS11からエラーマイクロホンアレイEMA11へと伝搬してくる直接音の信号をdとする。この場合、エラーマイクロホンアレイEMA11で観測される周波数領域の信号eは、次式（１５）に示すようになる。ここで、周波数領域の信号eは、上述したエラーマイクロホン信号e(k)に対応する。また、直接音の信号dは、N_e×1の複素ベクトルである。

なお、式（１５）において、GはN_e×QN_lの行列であり、二次音源である高次スピーカアレイSP11の高次スピーカから、エラーマイクロホンアレイEMA11を構成するマイクロホンまでの伝達関数を要素としてもつ行列を示している。この伝達関数は二次経路と呼ばれる。

また、式（１５）においてWはQN_l×N_rの行列であり、FIRフィルタ、より詳細にはFIRフィルタを構成するフィルタ係数の周波数領域での値を示している。さらに式（１５）におけるxはN_r×1の複素ベクトルであり、上述の参照マイクロホン信号x(k)に対応する。

ここで、後の導出を簡単にするため、式（１５）を次式（１６）に示すように書き換える。

なお、式（１６）においてXは、次式（１７）に示すように、参照マイクロホン信号xとゼロベクトルzとを要素として構成されるQN_l×QN_lN_rの行列である。

また、式（１６）においてwは、次式（１８）に示すように、行列Wを構成する要素を並べて得られるQN_lN_r×1の行列（ベクトル）である。

さて、ここでの制御目標は、各周波数、つまり波数kで次式（１９）に示す二乗平均誤差Jを最小化することである。なお、式（１９）においてE[・]は期待値操作を表している。

この二乗平均誤差Jを式（１６）を用いて書き換えると、次式（２０）に示すようになる。

したがって、二乗平均誤差Jのフィルタ係数による勾配は、次式（２１）に示すようになる。

このようにして得られた二乗平均誤差Jの勾配に基づいて、フィルタである行列W、すなわちフィルタを構成するフィルタ係数であるwが更新される。その際、期待値計算は多くのサンプルが必要となり実現が難しいため、LMSアルゴリズムでは期待値計算の結果が瞬時値で置き換えられる。

したがって、LMSアルゴリズムに基づくフィルタの更新式は、次式（２２）に示すようになる。

なお、式（２２）において(i)は時間を示すインデックスを示している。例えばw⁽ⁱ⁾およびw⁽ⁱ⁺¹⁾はともにフィルタ係数wを示しているが、フィルタ係数w⁽ⁱ⁺¹⁾はフィルタ係数w⁽ⁱ⁾の更新後のものを示している。したがって(i)は、更新回数を示しているともいうことができる。

また、式（２２）においてμはステップサイズパラメータと呼ばれており、フィルタ係数wの更新量を調整するパラメータである。

例えばステップサイズパラメータμが大きいときにはフィルタ係数wの収束は早くなるが、一方で発散しやすくなる。逆にステップサイズパラメータμが小さいときにはフィルタ係数wの収束は遅くなる一方で発散しにくくなる。

さらに式（２２）において、G_estは式（１５）に示した行列Gの推定値、つまり推定された二次経路である。

〈MIMO型の空間ノイズキャンセリングシステムの構成例〉
以上において説明したMIMOにより空間ノイズキャンセリングを行うMIMO型の空間ノイズキャンセリングシステムは、例えば図３に示すように構成される。

図３に示す空間ノイズキャンセリングシステムは、参照マイクロホンアレイ１１、エラーマイクロホンアレイ１２、信号処理装置１３、および高次スピーカアレイ１４を有している。

なお、参照マイクロホンアレイ１１、エラーマイクロホンアレイ１２、および高次スピーカアレイ１４は、図１に示した参照マイクロホンアレイRMA11、エラーマイクロホンアレイEMA11、および高次スピーカアレイSP11に対応する。

また、それらの参照マイクロホンアレイ１１、エラーマイクロホンアレイ１２、および高次スピーカアレイ１４の配置も、図１に示した参照マイクロホンアレイRMA11、エラーマイクロホンアレイEMA11、および高次スピーカアレイSP11の配置と同様である。

信号処理装置１３は、参照マイクロホンアレイ１１から供給された参照マイクロホン信号と、エラーマイクロホンアレイ１２から供給されたエラーマイクロホン信号とに基づいてスピーカ駆動信号を生成し、高次スピーカアレイ１４に供給する。

なお、参照マイクロホンアレイ１１やエラーマイクロホンアレイ１２が信号処理装置１３に設けられるようにしてもよいし、高次スピーカアレイ１４が信号処理装置１３に設けられるようにしてもよい。

信号処理装置１３は、時間周波数変換部２１、時間周波数変換部２２、制御部２３、および時間周波数合成部２４を有している。

時間周波数変換部２１には、参照マイクロホンアレイ１１が周囲の音を収音することで得られた時間領域の参照マイクロホン信号が供給される。

時間周波数変換部２１は、参照マイクロホンアレイ１１から供給された参照マイクロホン信号に対して時間周波数変換を行い、その結果得られた時間周波数スペクトルである参照マイクロホン信号xを制御部２３に供給する。例えば時間周波数変換部２１は、時間周波数変換としてFFT（Fast Fourier Transform）を行うことで、参照マイクロホン信号を時間領域の信号から周波数領域の信号へと変換する。

時間周波数変換部２２には、エラーマイクロホンアレイ１２が周囲の音を収音することで得られた時間領域のエラーマイクロホン信号が供給される。

時間周波数変換部２２は、エラーマイクロホンアレイ１２から供給されたエラーマイクロホン信号に対して時間周波数変換を行い、その結果得られた時間周波数スペクトルであるエラーマイクロホン信号eを制御部２３に供給する。例えば時間周波数変換部２２は、時間周波数変換としてFFTを行うことで、エラーマイクロホン信号を時間領域の信号から周波数領域の信号へと変換する。

制御部２３は、時間周波数変換部２１から供給された参照マイクロホン信号x、および時間周波数変換部２２から供給されたエラーマイクロホン信号eに基づいて、周波数領域のスピーカ駆動信号を生成し、時間周波数合成部２４に供給する。

制御部２３は、フィルタリング部３１、伝達関数乗算部３２、およびフィルタ係数更新部３３を有している。

フィルタリング部３１は、時間周波数変換部２１から供給された参照マイクロホン信号xに基づいて、上述の式（１７）に示した行列Xを生成する。

また、フィルタリング部３１は、得られた行列Xと、フィルタ係数更新部３３から供給されたフィルタ係数wとに基づいてフィルタリング処理を行い、周波数領域のスピーカ駆動信号を生成し、時間周波数合成部２４に供給する。フィルタリング処理では、行列Xとフィルタ係数wとが畳み込まれて式（１６）に示したXwが求められる。これにより、上述したベクトルy(k)に対応するスピーカ駆動信号が得られる。

このようにしてフィルタリング部３１で生成されるスピーカ駆動信号は、点制御によりターゲット領域内の空間ノイズ音をキャンセルするためのものである。

伝達関数乗算部３２は、実際の測定等により予め求められた二次経路である行列G_estを保持している。この行列G_estは、高次スピーカアレイ１４を構成する高次スピーカから、エラーマイクロホンアレイ１２を構成するマイクロホンまでの伝達特性を示す伝達関数からなる。なお、行列G_estは、高次スピーカアレイ１４等の配置が変わるたびに更新されるようにすることができる。

伝達関数乗算部３２は、時間周波数変換部２１から供給された参照マイクロホン信号xから得られる行列Xと、保持している行列G_estとの積G_estXを求め、フィルタ係数更新部３３に供給する。このようにして得られる積G_estXは、参照マイクロホン信号に伝達関数を乗算することで得られるものである。

フィルタ係数更新部３３は、伝達関数乗算部３２から供給された積G_estXと、現時点におけるフィルタ係数wと、時間周波数変換部２２から供給されたエラーマイクロホン信号eとに基づいて式（２２）の計算を行い、フィルタ係数wを更新する。

フィルタ係数更新部３３は、更新後のフィルタ係数wをフィルタリング部３１に供給する。なお、フィルタ係数wの更新は常時行われる必要はなく、一定の時間間隔など、適切なタイミングで行うようにすることができる。

時間周波数合成部２４は、フィルタリング部３１から供給された周波数領域のスピーカ駆動信号に対して時間周波数合成を行い、その結果得られた時間領域のスピーカ駆動信号を高次スピーカアレイ１４に供給し、音を出力させる。

例えば時間周波数合成部２４は、時間周波数合成としてIFFT（Inverse Fast Fourier Transform）を行うことで、スピーカ駆動信号を周波数領域の信号から時間領域の信号へと変換する。

高次スピーカアレイ１４は、時間周波数合成部２４から供給されたスピーカ駆動信号に基づいて音を出力することで、ターゲット領域における空間ノイズ音をキャンセルし、ターゲット領域を対象とする空間ノイズキャンセリングを実現する。すなわち、複数の制御点において、高次スピーカアレイ１４から出力された音により、空間ノイズ音が打ち消される。

以上のようにフィルタ係数wの更新を適宜、行いながら高次スピーカアレイ１４から音を出力することで、空間ノイズキャンセリングが実現される。

特に、図３に示したMIMO型の空間ノイズキャンセリングシステムによれば、高次スピーカアレイ１４を用いることで、任意の指向性を有する音を出力することができるので、性能の高い空間ノイズキャンセリングを行うことができる。すなわち、より高い空間ノイズ低減効果を得ることができる。しかも、高次スピーカアレイ１４を用いることで、省スペースで空間ノイズキャンセリングを実現することができる。

なお、空間ノイズキャンセリングに高次スピーカアレイ１４を用いると説明したが、高次スピーカと、高次スピーカではない、単一の指向性のみを再現可能な通常のスピーカとを組み合わせて得られるスピーカアレイを用いるようにしてもよい。これは、MIMOに限らず、後述するMD-GMやMD-LMでも同様である。

そのような場合、少なくとも１つの高次スピーカと、通常のスピーカとからなるスピーカアレイは、時間周波数合成部２４から供給されたスピーカ駆動信号に基づいて音を出力することで、空間ノイズキャンセリングを実現する。

このとき、例えば高次スピーカよりも径が大きい通常のスピーカを空間ノイズ音の低域成分のキャンセルに用いるなど、高次スピーカと、通常のスピーカとを異なる周波数帯域のキャンセルに用いるようにすると、より効果的である。

ところで、図３に示したMIMO型の空間ノイズキャンセリングシステムでは、エラーマイクロホンアレイ１２を構成する各マイクロホンのある地点（位置）における信号、つまり空間ノイズ音の最小化が目的である。すなわち、点制御によりターゲット領域を対象とする空間ノイズキャンセリングが行われる。

そのため、図３に示したMIMO型の空間ノイズキャンセリングシステムでは、エラーマイクロホンアレイ１２を構成する各マイクロホンのある地点以外の場所での音圧の減少は保証されていない。

例えば「T. Nakashima and S. Ise. A theoretical study of the discretization of the boundary surface in the boundarysurface control principle. Acoustical science and technology, 27(4):199-205, 2006.」では、音の波長に比べて十分に小さい間隔で、エラーマイクロホンアレイ１２を構成するマイクロホンが並べられている場合には、それらのマイクロホンのある地点以外でも音圧が減少することが報告されている。

しかしながら、後述するMD-LMやMD-GM、つまりモードドメインで誤差を最小化する方法と比較すると、空間ノイズキャンセリングの性能が劣ってしまう。

また、図３に示したMIMO型の空間ノイズキャンセリングシステムでは、フィルタ係数wを更新しながらスピーカ駆動信号を生成する適応処理の演算量が多くなってしまう。

すなわち、図３の例では、空間ノイズキャンセリングシステム全体の処理は、主にフィルタ係数wを用いたフィルタリング処理と、そのフィルタ係数wを更新するフィルタ係数更新処理に分けられる。

フィルタリング処理は、式（１５）のWx、すなわち式（１６）のXwを求める処理であり、これはQN_l×N_r個の時間領域畳み込み処理に相当する。

また、フィルタ係数更新処理は、式（２２）に示した演算処理であり、このうちの最も演算量が多いのはG_estXを求める演算である。

行列G_estはN_e×QN_lであり、行列XはQN_l×QN_lN_rであるから、仮に行列Xのゼロ行列部分の計算を行わないとしても、G_estXを求める演算の演算量（計算量）は、周波数ごとにO(N_e(QN_l)²N_r)となる。

例としてN_e＝16、Q＝16、N_l＝6（すなわち総ドライバ数QN_l＝96）、N_r＝16、バッファサイズとフィルタ長を1024サンプル、サンプリング周波数を48kHzとしたとき、48000/1024×513×16×96²×16＝5.7×10¹⁰となる。

したがって、Cを定数としてC×5.7×10¹⁰回/秒の乗加算が必要となる。そのため、フィルタ係数wを更新する周波数を限定したり、更新の頻度を下げたりするなど、実際の演算量を減らす工夫はできるが、汎用のCPU（Central Processing Unit）といった通常のハードウェアにおいては空間ノイズキャンセリングの実現が困難となる。

〈MD-GMについて〉
そこで、本技術では高次スピーカアレイを用いるだけでなく、モードドメイン（波数領域）においてフィルタリング処理とフィルタ係数更新処理を行うことで、省スペースかつ少ない演算量で、十分な性能の空間ノイズキャンセリングを実現できるようにした。

このようにフィルタリング処理とフィルタ係数更新処理をモードドメインで行う手法が、グローバルモード適応アルゴリズム（MD-GM）である。

このMD-GMは、NWD-Mアルゴリズムにおいて高次スピーカを用いた状況下での自然な拡張である。なお、NWD-Mアルゴリズムについては、例えば「J. Zhang, T. D. Abhayapala, W. Zhang, P. N. Samarasinghe, and S. Jiang. Active noise control over space:A wave domain approach. IEEE/ACM Transactions on Audio, Speech and Language Processing (TASLP),26(4):774-786, 2018.」などに詳細に記載されている。

また、MIMOが点制御であるのに対して、MD-GMはターゲット領域全体で音圧を減少させるエリア制御の空間ノイズキャンセリングとなっている。すなわち、エリア制御では、ターゲット領域全体における音の波面が、複数の高次スピーカを用いた波面合成によって目的とする波面となるようにスピーカ駆動信号が生成される。ここでいう目的とする波面とは、空間ノイズ音の波面が打ち消されるような波面である。

まず、準備として以下の式（２３）および式（２４）に示す変換行列を定義する。

なお、式（２３）および式（２４）において、A⁺は行列Aの擬似逆行列を表している。

例えば式（１４）に示したように、変換行列T_glは高次スピーカのローカルモード係数をグローバルモード係数へと変換する行列であるから、変換行列T_lgはグローバルモード係数を高次スピーカのローカルモード係数へと変換する行列となる。

同様に、式（７）に示したように変換行列T_lsは高次スピーカの周波数領域の駆動信号y_{n_l}、すなわちスピーカ駆動信号を、高次スピーカの各ドライバのローカルモード係数に変換する行列である。したがって、変換行列T_slは高次スピーカの各ドライバのローカルモード係数を、高次スピーカの周波数領域のスピーカ駆動信号に変換する行列となる。

MD-GMでは、参照マイクロホン信号xが変換行列T_grによりグローバルなモードドメインの信号、つまりグローバルモード係数に変換される。

そして、得られたグローバルモード係数に対してフィルタ係数を用いたフィルタリング処理が行われ、そのフィルタ出力としてグローバルモード係数を得る。このときに得られるグローバルモード係数が、グローバルなモードドメインのスピーカ駆動信号である。

その後、モードドメインのスピーカ駆動信号として得られたグローバルモード係数が変換行列T_lgにより各高次スピーカのローカルモード係数に変換される。さらにそのローカルモード係数が変換行列T_slにより、高次スピーカの各ドライバの周波数領域のスピーカ駆動信号に変換される。

このとき、エラーマイクロホン信号eは、次式（２５）に示すように表すことができる。

なお、式（２５）において、dは式（１５）における場合と同様に直接音の信号であり、Gは高次スピーカアレイSP11の高次スピーカから、エラーマイクロホンアレイEMA11を構成するマイクロホンまでの伝達関数を要素としてもつN_e×QN_lの行列である。

また、式（２５）においてW_GMはフィルタ係数であり、(2M_g+1)×(2M_g+1)の対角行列である。以下では、導出のために行列W_GMを次式（２６）に示すように定義する。

ここで、エラーマイクロホン信号eのグローバルモード係数e’は、変換行列T_geとエラーマイクロホン信号eとから、次式（２７）により求めることができる。

なお、式（２７）において、d’＝T_gedであり、g’＝T_geGT_slT_lgであり、x’＝T_grxである。x’は参照マイクロホン信号xのグローバルモード係数である。高次スピーカが環状で等間隔に並べられた理想配置においては、T_geGT_slT_lgは対角行列に近似できる。よって、ここでは行列g’をT_geGT_slT_lgの対角成分だけを取り出した対角行列とする。

また、式（２７）においてX’は、グローバルモード係数x’の成分を対角に並べて得られる(2M_g+1)×(2M_g+1)の対角行列である。

さらに、w_GMは次式（２８）に示すように、行列W_GMの対角成分からなるベクトルであり、以下ではフィルタ係数w_GMとも称する。

ここで、グローバルモード係数e’の二乗平均誤差J_globalの最小化を考えると、次式（２９）に示すようになる。

したがって、二乗平均誤差J_globalのフィルタ係数w_GMに関する勾配は次式（３０）に示すようになるので、LMSアルゴリズムに基づくフィルタの更新式は以下の式（３１）に示すようになる。

なお、式（３１）において(i)は時間を示すインデックスを示している。例えばw_GM ⁽ⁱ⁾およびw_GM ⁽ⁱ⁺¹⁾はともにフィルタ係数w_GMを示しているが、フィルタ係数w_GM ⁽ⁱ⁺¹⁾はフィルタ係数w_GM ⁽ⁱ⁾の更新後のものを示している。したがって(i)は、更新回数を示しているともいうことができる。

また、式（３１）においてμは式（２２）における場合と同様のステップサイズパラメータである。さらに式（３１）において、g’_estは行列g’の推定値、つまり推定された二次経路（伝達関数）からなる行列である。

〈MD-GM型の空間ノイズキャンセリングシステムの構成例〉
以上において説明したMD-GMにより空間ノイズキャンセリングを行うMD-GM型の空間ノイズキャンセリングシステムは、例えば図４に示すように構成される。なお、図４において図３における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

図４に示す空間ノイズキャンセリングシステムは、参照マイクロホンアレイ１１、エラーマイクロホンアレイ１２、信号処理装置６１、および高次スピーカアレイ１４を有している。

信号処理装置６１は、時間周波数変換部２１、時間周波数変換部２２、制御部７１、および時間周波数合成部２４を有している。また、制御部７１は、モード変換部８１、フィルタリング部８２、駆動信号生成部８３、行列演算部８４、モード変換部８５、およびフィルタ係数更新部８６を有している。

モード変換部８１は、時間周波数変換部２１から供給された参照マイクロホン信号xと、予め保持している変換行列T_grとに基づいて、参照マイクロホン信号xをグローバルモード係数x’に変換し、フィルタリング部８２および行列演算部８４に供給する。

フィルタリング部８２は、モード変換部８１から供給されたグローバルモード係数x’と、フィルタ係数更新部８６から供給されたフィルタ係数w_GMとに基づいて、波数領域でのフィルタリング処理を行う。すなわち、フィルタリング部８２では、グローバルモード係数x’に対してフィルタ係数w_GMを用いたフィルタリング処理が行われてスピーカ駆動信号が生成される。

フィルタリング部８２は、フィルタリング処理により得られたグローバルなモードドメイン（波数領域）のスピーカ駆動信号を駆動信号生成部８３に供給する。このようにしてフィルタリング部８２で生成されるスピーカ駆動信号は、ターゲット領域へと伝搬する空間ノイズ音をエリア制御によりキャンセルするためのものである。

駆動信号生成部８３は、フィルタリング部８２から供給されたスピーカ駆動信号と、予め保持している変換行列T_lgおよび変換行列T_slに基づいて、周波数領域のスピーカ駆動信号、つまり高次スピーカの各ドライバの駆動信号を生成し、時間周波数合成部２４に供給する。

駆動信号生成部８３では、グローバルなモードドメインのスピーカ駆動信号、つまりグローバルモード係数を、変換行列T_lgによりローカルなモードドメインのスピーカ駆動信号、つまりローカルモード係数に変換する変換処理と、ローカルなモードドメインのスピーカ駆動信号を変換行列T_slにより周波数領域のスピーカ駆動信号に変換する変換処理とが行われる。

なお、駆動信号生成部８３では、これらの変換処理が順番に行われてもよいし、同時に行われてもよい。さらに、これらの変換処理と、時間周波数合成とが駆動信号生成部８３において同時に行われるようにしてもよい。

行列演算部８４は、予め求められた行列g’_estを保持している。この行列g’_estは、高次スピーカアレイ１４を構成する高次スピーカから、エラーマイクロホンアレイ１２を構成するマイクロホンまでの伝達特性（二次経路）の推定値を示している。なお、行列g’_estは、高次スピーカアレイ１４等の配置が変わるたびに更新されるようにすることができる。

行列演算部８４は、モード変換部８１から供給されたグローバルモード係数x’から得られる行列X’と、保持している行列g’_estとの積g’_estX’を求め、フィルタ係数更新部８６に供給する。

モード変換部８５は、時間周波数変換部２２から供給されたエラーマイクロホン信号eと、予め保持している変換行列T_geとに基づいて、エラーマイクロホン信号eをグローバルモード係数e’に変換し、フィルタ係数更新部８６に供給する。

フィルタ係数更新部８６は、行列演算部８４から供給された積g’_estX’と、現時点におけるフィルタ係数w_GMと、モード変換部８５から供給されたグローバルモード係数e’とに基づいてフィルタ係数w_GMを更新する。フィルタ係数更新部８６は、更新後のフィルタ係数w_GMをフィルタリング部８２に供給する。なお、フィルタ係数w_GMの更新は常時行われる必要はなく、一定の時間間隔など、適切なタイミングで行うようにすることができる。

ここでは、フィルタリング部８２、行列演算部８４、およびフィルタ係数更新部８６において行われる処理が波数領域処理、つまりモードドメインでの演算処理となっている。

〈空間ノイズキャンセリング処理の説明〉
続いて、図４に示したMD-GM型の空間ノイズキャンセリングシステムの動作について説明する。すなわち、以下、図５のフローチャートを参照して、空間ノイズキャンセリングシステムによる空間ノイズキャンセリング処理について説明する。

なお、空間ノイズキャンセリング処理が開始されると、参照マイクロホンアレイ１１は周囲の音を収音し、その結果得られた時間領域の参照マイクロホン信号を、逐次、時間周波数変換部２１へと供給する。また、エラーマイクロホンアレイ１２は、周囲の音を収音し、その結果得られた時間領域のエラーマイクロホン信号を、逐次、時間周波数変換部２２へと供給する。

ステップＳ１１において時間周波数変換部２１は、参照マイクロホンアレイ１１から供給された参照マイクロホン信号に対して時間周波数変換を行い、その結果得られた参照マイクロホン信号xをモード変換部８１に供給する。例えばステップＳ１１では、時間周波数変換としてFFTが行われる。

ステップＳ１２においてモード変換部８１は、時間周波数変換部２１から供給された参照マイクロホン信号xを変換行列T_grによりグローバルモード係数x’に変換し、フィルタリング部８２および行列演算部８４に供給する。すなわち、ステップＳ１２では変換行列T_grと参照マイクロホン信号xの積T_grxが求められ、グローバルモード係数x’とされる。

ステップＳ１３において時間周波数変換部２２は、エラーマイクロホンアレイ１２から供給されたエラーマイクロホン信号に対して時間周波数変換を行い、その結果得られたエラーマイクロホン信号eをモード変換部８５に供給する。例えばステップＳ１３では、時間周波数変換としてFFTが行われる。

ステップＳ１４においてモード変換部８５は、時間周波数変換部２２から供給されたエラーマイクロホン信号eを変換行列T_geによりグローバルモード係数e’に変換し、フィルタ係数更新部８６に供給する。すなわち、ステップＳ１４では変換行列T_geとエラーマイクロホン信号eの積T_geeが求められ、グローバルモード係数e’とされる。

ステップＳ１５においてフィルタリング部８２は、モード変換部８１から供給されたグローバルモード係数x’と、フィルタ係数更新部８６から供給されたフィルタ係数w_GMとに基づいて、波数領域（モードドメイン）でのフィルタリング処理を行う。

すなわち、フィルタリング部８２はグローバルモード係数x’に基づいて、上述の式（２７）に示した行列X’を生成し、その行列X’とフィルタ係数w_GMとの積X’w_GMを求めることで得られるグローバルモード係数を波数領域のスピーカ駆動信号とする。フィルタリング部８２は、このようにして得られたスピーカ駆動信号を駆動信号生成部８３に供給する。

フィルタリング部８２では、式（２７）に示したW_GMT_grx＝X’w_GMがスピーカ駆動信号として求められるが、フィルタ係数の行列W_GMは対角行列であるため、少ない演算量でスピーカ駆動信号を得ることができる。このような演算量の削減は、フィルタリング処理を波数領域（モードドメイン）で行うことにより実現できる。

ステップＳ１６において駆動信号生成部８３は、フィルタリング部８２から供給されたスピーカ駆動信号と、変換行列T_lgおよび変換行列T_slとに基づいて周波数領域のスピーカ駆動信号を生成し、時間周波数合成部２４に供給する。

すなわち、駆動信号生成部８３は、スピーカ駆動信号X’w_GM、変換行列T_lg、および変換行列T_slの積T_slT_lgX’w_GMを計算し、その計算結果を周波数領域のスピーカ駆動信号とする。

積T_slT_lgX’w_GMを求める計算（演算）時には、駆動信号生成部８３は少なくとも高次スピーカの１次以上の所定次数の放射パターンに対応する項、つまり環状調和関数の基底のインデックスに対応する項まで演算を行う。

ここでは、変換行列T_lgや変換行列T_slにおけるインデックス（m_l）が環状調和関数の基底のインデックスに対応している。したがって、例えば最大次数M_l＝1である場合には、高次スピーカの0次の放射パターンと、高次スピーカの1次の放射パターンとを組み合わせて得られる指向性の音の波面をターゲット領域に形成することができる。

同様に、最大次数M_l＝2である場合には、高次スピーカの0次の放射パターン乃至2次の放射パターンを組み合わせて得られる指向性の音の波面をターゲット領域に形成することができる。

駆動信号生成部８３では、最大次数M_lが1以上とされて周波数領域のスピーカ駆動信号が求められる。このようにすることで、より多くの放射パターンを組み合わせて適切な波面をターゲット領域に形成し、空間ノイズキャンセリングの性能を向上させることができる。

ステップＳ１７において時間周波数合成部２４は、駆動信号生成部８３から供給された周波数領域のスピーカ駆動信号に対して時間周波数合成を行い、その結果得られた時間領域のスピーカ駆動信号を高次スピーカアレイ１４に供給する。例えばステップＳ１７では、時間周波数合成としてIFFTが行われる。

ステップＳ１８において高次スピーカアレイ１４は、時間周波数合成部２４から供給されたスピーカ駆動信号に基づいて音を出力し、ターゲット領域に空間ノイズ音をキャンセルする音の波面を形成する。すなわち、空間ノイズ音をキャンセルする音が出力される。

これにより、高次スピーカアレイ１４により囲まれるターゲット領域では、外部から伝搬してきた音（空間ノイズ音）がキャンセルされて聞こえなくなる。

ステップＳ１９において制御部７１は、フィルタ係数w_GMを更新するか否かを判定する。

ステップＳ１９においてフィルタ係数w_GMを更新しないと判定された場合、ステップＳ２０およびステップＳ２１の処理は行われず、その後、処理はステップＳ２２へと進む。

これに対して、ステップＳ１９においてフィルタ係数w_GMを更新すると判定された場合、処理はステップＳ２０へと進む。

ステップＳ２０において行列演算部８４は、モード変換部８１から供給されたグローバルモード係数x’に対して、保持している行列g’_estに基づく行列演算を行う。すなわち、行列演算部８４は、グローバルモード係数x’に基づいて行列X’を生成し、その行列X’と行列g’_estとの積g’_estX’を求めてフィルタ係数更新部８６に供給する。

行列g’_estは対角行列であるから、行列演算部８４では少ない演算量でg’_estX’を求めることが可能である。特に、フィルタ係数を更新する処理では、フィルタ係数更新部８６での演算よりも行列演算部８４での演算の方が演算量が多いことから、行列演算部８４での演算量を削減することの効果は大きい。このような演算量の削減は、フィルタ係数更新処理を波数領域（モードドメイン）で行うことにより実現できる。

ステップＳ２１においてフィルタ係数更新部８６は、行列演算部８４から供給された積g’_estX’と、現時点におけるフィルタ係数w_GMと、モード変換部８５から供給されたグローバルモード係数e’とに基づいてフィルタ係数w_GMを更新する。

すなわち、フィルタ係数更新部８６は上述した式（３１）に示した更新式を計算することでフィルタ係数w_GMを更新し、更新後のフィルタ係数w_GMをフィルタリング部８２に供給する。フィルタ係数w_GMが更新されると、その後、処理はステップＳ２２へと進む。

ステップＳ２１の処理が行われたか、またはステップＳ１９においてフィルタ係数w_GMを更新しないと判定された場合、ステップＳ２２において制御部７１は、処理を終了するか否かを判定する。例えばステップＳ２２では、空間ノイズキャンセリングを終了する場合に処理を終了すると判定される。

ステップＳ２２においてまだ処理を終了しないと判定された場合、処理はステップＳ１１に戻り、上述した処理が繰り返し行われる。

これに対して、ステップＳ２２において処理を終了すると判定された場合、空間ノイズキャンセリングシステムの各部は行っている動作を停止させ、空間ノイズキャンセリング処理は終了する。

以上のようにして空間ノイズキャンセリングシステムは、波数領域でフィルタリング処理およびフィルタ係数更新処理を行いながら高次スピーカアレイ１４から音を出力する。

このように波数領域でフィルタリング処理およびフィルタ係数更新処理を行うことで、演算量を低減させることができ、また高次スピーカアレイ１４を用いることで省スペースで高性能な空間ノイズキャンセリングを実現することができる。すなわち、MD-GM型の空間ノイズキャンセリングシステムによれば、省スペースかつ少ない演算量で高性能な空間ノイズキャンセリングを実現することができる。

〈第２の実施の形態〉
〈MD-LMについて〉
ところで、MD-GMでは二次経路の推定値、すなわち行列g’の推定値として行列g’_estが用いられるが、行列g’を推定することは容易ではない。

通常、二次経路の推定はインパルス応答の測定によって行われるが、直接測定される値は行列Gである。したがって、アルゴリズムごとに行列Gを適切な二次経路の形式に変換する必要がある。つまり、MD-GMでは行列Gを行列g’_estへと変換する必要がある。

上述したように、MD-GMでは二次経路の推定値である行列g’_estはg’_est＝T_geGT_slT_lgで定義されているが、適切な行列g’_estを得ることは困難である。

すなわち、例えば測定雑音無しの自由空間、つまり理想環境では対角行列となる行列g’_est＝T_geGT_slT_lgが、実環境においては対角行列とはならないことがある。また、実測ができない変換行列T_glに理想環境からの誤差がある場合には、空間ノイズキャンセリングの性能低下が生じやすくなってしまう。

そこで、フィルタ係数更新処理のみ波数領域で行うようにすることで、MD-GMにおいて生じる二次経路推定の難しさを解決し、より高性能な空間ノイズキャンセリングを実現できるようにしてもよい。

ローカルモード適応アルゴリズム（MD-LM）は、フィルタ係数更新処理のみを波数領域で行うことで、より適切な二次経路を利用して、より高性能な空間ノイズキャンセリングを実現可能なアルゴリズムである。

まず、MD-LM導出の過程について説明する。

フィルタ係数からなる(2M_l+1)N_l×(2M_g+1)の行列をW_LMとすると、エラーマイクロホン信号eは次式（３２）に示すように表すことができる。なお、変換行列T_slと変換行列T_grは式（２５）における場合と同様である。

ここで、行列W_LMは、入力をグローバルモード係数とし、出力を高次スピーカのローカルモード係数とする線形システムである。エラーマイクロホン信号eのグローバルモード係数e’は次式（３３）により求めることができる。

なお、式（３３）において、d’＝T_gedであり、g’＝T_geGT_slT_lgであり、x’＝T_grxである。また、x’は参照マイクロホン信号xのグローバルモード係数である。

のちの導出を簡単にするため、X’とw_LMを以下の式（３４）および式（３５）に示すように定義する。なお、式（３４）においてzはゼロベクトルを表している。

MD-GMにおける場合と同様にグローバルモード係数e’の二乗平均誤差J_globalを計算すると、次式（３６）に示すようになる。

したがって、二乗平均誤差J_globalのフィルタ係数w_LMに関する勾配は次式（３７）に示すようになるので、LMSアルゴリズムに基づくフィルタの更新式は式（３８）に示すようになる。

なお、式（３８）において(i)は時間を示すインデックスを示している。例えばw_LM ⁽ⁱ⁾およびw_LM ⁽ⁱ⁺¹⁾はともにフィルタ係数w_LMを示しているが、フィルタ係数w_LM ⁽ⁱ⁺¹⁾はフィルタ係数w_LM ⁽ⁱ⁾の更新後のものを示している。したがって(i)は、更新回数を示しているともいうことができる。また、式（３８）においてμは式（２２）における場合と同様のステップサイズパラメータである。

さらに式（３８）においては、実測で得られる二次経路を用いることができる。

すなわち、MD-LMにおける二次経路は式（３３）からg’T_gl＝T_geGT_slであり、変換行列T_geおよび変換行列T_slはアルゴリズムを実行する際に自ら設定する定数行列であるので、正確な行列Gが得られていれば二次経路を正確に求めることができる。また、変換行列T_slは、その逆特性である変換行列T_lsが高次スピーカの各ドライバから周囲の環状マイクロホンアレイへのインパルス応答計測によって測定可能であるから、実測値を用いて計算することもできる。

〈MD-LM型の空間ノイズキャンセリングシステムの構成例〉
以上において説明したMD-LMにより空間ノイズキャンセリングを行うMD-LM型の空間ノイズキャンセリングシステムは、例えば図６に示すように構成される。なお、図６において図４における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

図６に示す空間ノイズキャンセリングシステムは、参照マイクロホンアレイ１１、エラーマイクロホンアレイ１２、信号処理装置１２１、および高次スピーカアレイ１４を有している。

信号処理装置１２１は、時間周波数変換部２１、時間周波数変換部２２、制御部１３１、および時間周波数合成部２４を有している。また、制御部１３１は、モード変換部８１、フィルタリング部１４１、駆動信号生成部１４２、行列演算部１４３、モード変換部８５、およびフィルタ係数更新部１４４を有している。

フィルタリング部１４１は、モード変換部８１から供給されたグローバルモード係数x’と、フィルタ係数更新部１４４から供給されたフィルタ係数w_LMとに基づいてフィルタリング処理を行う。すなわち、フィルタリング部１４１では、グローバルモード係数x’に対してフィルタ係数w_LMを用いたフィルタリング処理が行われてスピーカ駆動信号が生成される。

フィルタリング部１４１は、フィルタリング処理により得られたローカルなモードドメイン（波数領域）のスピーカ駆動信号、すなわち高次スピーカのローカルモード係数を駆動信号生成部１４２に供給する。このようにしてフィルタリング部１４１で生成されるスピーカ駆動信号は、ターゲット領域へと伝搬する空間ノイズ音をエリア制御によりキャンセルするためのものである。

駆動信号生成部１４２は、フィルタリング部１４１から供給されたスピーカ駆動信号と、予め保持している変換行列T_slに基づいて周波数領域のスピーカ駆動信号、つまり高次スピーカの各ドライバの駆動信号を生成し、時間周波数合成部２４に供給する。駆動信号生成部１４２では、ローカルなモードドメインのスピーカ駆動信号、つまりローカルモード係数を変換行列T_slにより周波数領域のスピーカ駆動信号に変換する変換処理が行われる。

行列演算部１４３は、実際の測定等により予め求められた行列g’_estT_glを保持している。この行列g’_estT_glは、高次スピーカアレイ１４を構成する高次スピーカから、エラーマイクロホンアレイ１２を構成するマイクロホンまでの伝達特性（二次経路）の推定値を示している。なお、行列g’_estT_glは、高次スピーカアレイ１４等の配置が変わるたびに更新されるようにすることができる。

行列演算部１４３は、モード変換部８１から供給されたグローバルモード係数x’から得られる行列X’と、保持している行列g’_estT_glとの積g’_estT_glX’を求め、フィルタ係数更新部１４４に供給する。

フィルタ係数更新部１４４は、行列演算部１４３から供給された積g’_estT_glX’と、現時点におけるフィルタ係数w_LMと、モード変換部８５から供給されたグローバルモード係数e’とに基づいてフィルタ係数w_LMを更新する。フィルタ係数更新部１４４は、更新後のフィルタ係数w_LMをフィルタリング部１４１に供給する。なお、フィルタ係数w_LMの更新は常時行われる必要はなく、一定の時間間隔など、適切なタイミングで行うようにすることができる。

ここでは、行列演算部１４３およびフィルタ係数更新部１４４において行われる処理が波数領域処理、つまりモードドメインでの演算処理となっている。

また、MD-LMでは高次スピーカアレイ１４を構成する高次スピーカの配置は環状配置に限らず、任意の配置とすることができる。すなわち、複数の高次スピーカを環状とは異なる任意の形状に並べて得られるスピーカアレイを高次スピーカアレイ１４として用いることができる。したがって、MD-LMでは、より自由度の高い高次スピーカアレイ１４配置を実現することができる。

〈空間ノイズキャンセリング処理の説明〉
続いて、図６に示したMD-LM型の空間ノイズキャンセリングシステムの動作について説明する。すなわち、以下、図７のフローチャートを参照して、空間ノイズキャンセリングシステムによる空間ノイズキャンセリング処理について説明する。

なお、ステップＳ５１乃至ステップＳ５４の処理は図５のステップＳ１１乃至ステップＳ１４の処理と同様であるので、その説明は省略する。

ステップＳ５５においてフィルタリング部１４１は、モード変換部８１から供給されたグローバルモード係数x’と、フィルタ係数更新部１４４から供給されたフィルタ係数w_LMとに基づいてフィルタリング処理を行う。

すなわち、フィルタリング部１４１は、グローバルモード係数x’に基づいて上述の式（３４）に示した行列X’を生成し、その行列X’とフィルタ係数w_LMとの積X’w_LMを求めることで得られるローカルモード係数をスピーカ駆動信号とする。フィルタリング部１４１は、このようにして得られたスピーカ駆動信号を駆動信号生成部１４２に供給する。

ステップＳ５６において駆動信号生成部１４２は、フィルタリング部１４１から供給されたスピーカ駆動信号と、変換行列T_slとに基づいて周波数領域のスピーカ駆動信号を生成し、時間周波数合成部２４に供給する。

すなわち、駆動信号生成部１４２は、スピーカ駆動信号X’w_LMと変換行列T_slの積T_slX’w_LMを計算し、その計算結果を周波数領域のスピーカ駆動信号とする。積T_slX’w_LMを求める計算（演算）時には、少なくとも高次スピーカの１次以上の所定次数の放射パターンに対応する項まで演算が行われる。

周波数領域のスピーカ駆動信号が生成されると、その後、ステップＳ５７およびステップＳ５８の処理が行われるが、これらの処理は図５のステップＳ１７およびステップＳ１８の処理と同様であるので、その説明は省略する。

ステップＳ５９において制御部１３１は、フィルタ係数w_LMを更新するか否かを判定する。

ステップＳ５９においてフィルタ係数w_LMを更新しないと判定された場合、ステップＳ６０およびステップＳ６１の処理は行われず、その後、処理はステップＳ６２へと進む。

これに対して、ステップＳ５９においてフィルタ係数w_LMを更新すると判定された場合、処理はステップＳ６０へと進む。

ステップＳ６０において行列演算部１４３は、モード変換部８１から供給されたグローバルモード係数x’に対して、保持している行列g’_estT_glに基づく行列演算を行う。すなわち、行列演算部１４３は、グローバルモード係数x’に基づいて行列X’を生成し、その行列X’と行列g’_estT_glとの積g’_estT_glX’を求めてフィルタ係数更新部１４４に供給する。

行列演算部１４３における行列演算も上述した行列演算部８４における行列演算と同様に、波数領域（モードドメイン）における演算であり、演算量を削減することができる。

ステップＳ６１においてフィルタ係数更新部１４４は、行列演算部１４３から供給された積g’_estT_glX’と、現時点におけるフィルタ係数w_LMと、モード変換部８５から供給されたグローバルモード係数e’とに基づいてフィルタ係数w_LMを更新する。

すなわち、フィルタ係数更新部１４４は上述した式（３８）に示した更新式と同様の計算を行うことでフィルタ係数w_LMを更新し、更新後のフィルタ係数w_LMをフィルタリング部１４１に供給する。フィルタ係数w_LMが更新されると、その後、処理はステップＳ６２へと進む。ステップＳ６０およびステップＳ６１では、MD-GMにおける場合と同様に、波数領域（モードドメイン）でフィルタ係数更新処理が行われる。

ステップＳ６１の処理が行われたか、またはステップＳ５９においてフィルタ係数w_LMを更新しないと判定された場合、ステップＳ６２において制御部１３１は、処理を終了するか否かを判定する。

ステップＳ６２においてまだ処理を終了しないと判定された場合、処理はステップＳ５１に戻り、上述した処理が繰り返し行われる。

これに対して、ステップＳ６２において処理を終了すると判定された場合、空間ノイズキャンセリングシステムの各部は行っている動作を停止させ、空間ノイズキャンセリング処理は終了する。

以上のようにして空間ノイズキャンセリングシステムは、波数領域でフィルタ係数更新処理を行いながら高次スピーカアレイ１４から音を出力する。このようにすることで演算量を低減させることができ、また高次スピーカアレイ１４を用いることで省スペースで高性能な空間ノイズキャンセリングを実現することができる。すなわち、MD-LM型の空間ノイズキャンセリングシステムによれば、省スペースかつ少ない演算量で高性能な空間ノイズキャンセリングを実現することができる。

〈演算量の比較について〉
以上においては、空間ノイズキャンセリングのアルゴリズムとして、MIMO、MD-GM、およびMD-LMについて説明した。ここで、これらのMIMO、MD-GM、およびMD-LMにおける演算量について説明する。

上述したように空間ノイズキャンセリング時の処理は、大きく分けてフィルタリング処理とフィルタ係数更新処理に分けられる。

フィルタリング処理では、高速かつ低遅延な処理が求められ、FPGA（Field Programmable Gate Array）やDSP（Digital Signal Processor）ボードを用いた実装を行う必要がある。一方で、フィルタ係数更新処理で許される遅延はフィルタリング処理に比べると大きく、汎用プロセッサによる実装も考えられる。

図８にMIMO、MD-GM、およびMD-LMについて、フィルタの形状（次元）とフィルタリング処理に要する１サンプルごとの演算量（計算量）を示す。

図８に示されるようにMIMOでは、フィルタの次元はQN_l×N_rであり、フィルタリング処理の演算量はO(N_tapQN_lN_r)である。また、MD-GMではフィルタの次元は(2M_g+1)×(2M_g+1)であり、フィルタリング処理の演算量はO(N_tap(2M_g+1))である。さらにMD-LMではフィルタの次元は(2M_g+1)×N_l(2M_l+1)であり、フィルタリング処理の演算量はO(N_tap(2M_g+1)(2M_l+1)N_l)である。ここでN_tapはフィルタ長である。

したがって、例えばフィルタ長N_tap＝1024、高次スピーカアレイ１４の総ドライバ数QN_l＝192、参照マイクロホンアレイ１１のマイクロホン数N_r＝48、グローバルモードの最大次数M_g＝14、ローカルモードの最大次数M_l＝2、および高次スピーカアレイ１４の高次スピーカ数N_l＝12とすると、各モードの演算量は以下のようになる。

すなわち、MIMOにおけるフィルタリング処理の演算量O(N_tapQN_lN_r)は約9.4×10⁶となる。これに対して、MD-GMにおけるフィルタリング処理の演算量O(N_tap(2M_g+1))は約3.0×10⁴となり、MD-LMにおけるフィルタリング処理の演算量O(N_tap(2M_g+1)(2M_l+1)N_l)は約1.8×10⁶となる。

このことから、MIMOと比較してMD-GMのフィルタリング処理の演算量は大幅に削減できていることが分かり、波数領域でのフィルタリング処理を行わないMD-LMでも演算量がMIMOにおける場合の約５分の１に削減されていることが分かる。

また、図９にMIMO、MD-GM、およびMD-LMについて、フィルタ係数更新処理に要する周波数ごとの演算量（計算量）を示す。

フィルタ係数更新処理では、最も演算量が多くなるのは濾波されたFiltered-Xを求める演算である。ここでは、MIMOにおけるG_estXを求める演算、MD-GMにおけるg’_estX’を求める演算、およびMD-LMにおけるg’_estT_glX’を求める演算が、それぞれFiltered-Xを求める演算となる。

図９に示すようにFiltered-X算出時の演算量は、MIMOではO(N_e(QN_l)²N_r)となり、MD-GMではO(2M_g+1)であり、MD-LMではO((2M_g+1)(2M_l+1)N_l)である。

したがって、図８における場合と同様に、高次スピーカアレイ１４の総ドライバ数QN_l＝192、参照マイクロホンアレイ１１のマイクロホン数N_r＝48、最大次数M_g＝14、最大次数M_l＝2、高次スピーカアレイ１４の高次スピーカ数N_l＝12、およびエラーマイクロホンアレイ１２のマイクロホン数N_e＝48とすると、各モードの演算量は以下のようになる。

すなわち、MIMOにおける演算量O(N_e(QN_l)²N_r)は約8.4×10⁷となる。これに対して、MD-GMにおける演算量O(2M_g+1)は約29となり、MD-LMにおける演算量O((2M_g+1)(2M_l+1)N_l)は約1.7×10³となる。

このことから、MIMOと比較してMD-GMやMD-LMでは大幅に演算量を削減できることが分かる。また、MD-GMとMD-LMとでは、演算量の観点からはMD-GMが優位であるが、二次経路を正確に求めて空間ノイズキャンセリングの性能低下が抑制できる点や、高次スピーカアレイ１４の配置の自由度が高い点ではMD-LMが優位である。

また、MD-GMやMD-LMは、MIMOと比較して適応処理の収束速度、つまりフィルタ係数の収束速度も速いので、ターゲット領域における受聴者の位置などの環境が変化したときでも、その変化に迅速に追従し、性能の高い空間ノイズキャンセリングを実現することができる。特にMD-LMよりもMD-GMにおいてフィルタ係数の収束速度が速くなる。

以上のように本技術を適用したMD-GMやMD-LMによれば、省スペースかつ少ない演算量で、十分な性能の空間ノイズキャンセリングを実現することができる。

〈コンピュータの構成例〉
ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

図１０は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

コンピュータにおいて、CPU５０１，ROM（Read Only Memory）５０２，RAM（Random Access Memory）５０３は、バス５０４により相互に接続されている。

バス５０４には、さらに、入出力インターフェース５０５が接続されている。入出力インターフェース５０５には、入力部５０６、出力部５０７、記録部５０８、通信部５０９、及びドライブ５１０が接続されている。

入力部５０６は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部５０７は、ディスプレイ、スピーカなどよりなる。記録部５０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部５０９は、ネットワークインターフェースなどよりなる。ドライブ５１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体５１１を駆動する。

以上のように構成されるコンピュータでは、CPU５０１が、例えば、記録部５０８に記録されているプログラムを、入出力インターフェース５０５及びバス５０４を介して、RAM５０３にロードして実行することにより、上述した一連の処理が行われる。

コンピュータ（CPU５０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体５１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

コンピュータでは、プログラムは、リムーバブル記録媒体５１１をドライブ５１０に装着することにより、入出力インターフェース５０５を介して、記録部５０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部５０９で受信し、記録部５０８にインストールすることができる。その他、プログラムは、ROM５０２や記録部５０８に、あらかじめインストールしておくことができる。

なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

さらに、本技術は、以下の構成とすることも可能である。

（１）
複数のマイクロホンからなる第１のマイクロホンアレイで収音することで得られた第１のマイクロホン信号に基づいて、所定領域外から前記所定領域へと伝搬する前記第１のマイクロホンアレイにより収音された音をキャンセルするための出力音のスピーカ駆動信号を生成し、前記スピーカ駆動信号に基づいて、少なくとも１つの高次スピーカからなるスピーカアレイから前記出力音を出力させる制御部を備える
信号処理装置。
（２）
前記制御部は、
前記第１のマイクロホン信号に対してフィルタ係数を用いたフィルタリング処理を行うことで前記スピーカ駆動信号を生成するフィルタリング部と、
前記第１のマイクロホン信号に基づいて前記フィルタ係数を更新するフィルタ係数更新部と
備える（１）に記載の信号処理装置。
（３）
前記フィルタリング部は、前記所定領域へと伝搬する音を点制御によりキャンセルするための前記スピーカ駆動信号を生成する
（２）に記載の信号処理装置。
（４）
前記フィルタリング部は、前記所定領域へと伝搬する音をエリア制御によりキャンセルするための前記スピーカ駆動信号を生成する
（２）に記載の信号処理装置。
（５）
前記フィルタ係数更新部は、波数領域で前記フィルタ係数を更新する
（４）に記載の信号処理装置。
（６）
前記フィルタリング部は、波数領域で前記フィルタリング処理を行う
（４）または（５）に記載の信号処理装置。
（７）
前記制御部は、前記高次スピーカの１次以上の所定次数の放射パターンに対応する項までの演算を行って前記スピーカ駆動信号を生成する
（４）乃至（６）の何れか一項に記載の信号処理装置。
（８）
前記フィルタリング部は、前記フィルタリング処理により、空間上の所定の基準位置を原点とするモード係数を前記スピーカ駆動信号として生成する
（６）に記載の信号処理装置。
（９）
前記基準位置は、前記高次スピーカの位置とは異なる位置である
（８）に記載の信号処理装置。
（１０）
前記フィルタリング部は、前記フィルタリング処理により、前記高次スピーカの位置を原点とする前記高次スピーカのモード係数を前記スピーカ駆動信号として生成する
（４）または（５）に記載の信号処理装置。
（１１）
前記スピーカアレイは、前記高次スピーカを含む複数のスピーカを環状とは異なる形状に並べて得られるスピーカアレイである
（１０）に記載の信号処理装置。
（１２）
前記フィルタ係数更新部は、前記スピーカアレイに対して前記第１のマイクロホンアレイとは反対側に配置された複数のマイクロホンからなる第２のマイクロホンアレイで収音することで得られた第２のマイクロホン信号と、前記第１のマイクロホン信号とに基づいて前記フィルタ係数を更新する
（２）乃至（１１）の何れか一項に記載の信号処理装置。
（１３）
信号処理装置が、
複数のマイクロホンからなるマイクロホンアレイで収音することで得られたマイクロホン信号に基づいて、所定領域外から前記所定領域へと伝搬する前記マイクロホンアレイにより収音された音をキャンセルするための出力音のスピーカ駆動信号を生成し、
前記スピーカ駆動信号に基づいて、少なくとも１つの高次スピーカからなるスピーカアレイから前記出力音を出力させる
信号処理方法。
（１４）
複数のマイクロホンからなるマイクロホンアレイで収音することで得られたマイクロホン信号に基づいて、所定領域外から前記所定領域へと伝搬する前記マイクロホンアレイにより収音された音をキャンセルするための出力音のスピーカ駆動信号を生成し、
前記スピーカ駆動信号に基づいて、少なくとも１つの高次スピーカからなるスピーカアレイから前記出力音を出力させる
ステップを含む処理をコンピュータに実行させるプログラム。

１１参照マイクロホンアレイ，１２エラーマイクロホンアレイ，１４高次スピーカアレイ，６１信号処理装置，２１時間周波数変換部，２２時間周波数変換部，７１制御部，８１モード変換部，８２フィルタリング部，８３駆動信号生成部，８４行列演算部，８５モード変換部，８６フィルタ係数更新部，１３１制御部

Claims

複数のマイクロホンからなる第１のマイクロホンアレイで収音することで得られた第１のマイクロホン信号に基づいて、所定領域外から前記所定領域へと伝搬する前記第１のマイクロホンアレイにより収音された音をキャンセルするための出力音のスピーカ駆動信号を生成し、前記スピーカ駆動信号に基づいて、少なくとも１つの高次スピーカからなるスピーカアレイから前記出力音を出力させる制御部を備える
信号処理装置。
前記制御部は、
前記第１のマイクロホン信号に対してフィルタ係数を用いたフィルタリング処理を行うことで前記スピーカ駆動信号を生成するフィルタリング部と、
前記第１のマイクロホン信号に基づいて前記フィルタ係数を更新するフィルタ係数更新部と
備える請求項１に記載の信号処理装置。
前記フィルタリング部は、前記所定領域へと伝搬する音を点制御によりキャンセルするための前記スピーカ駆動信号を生成する
請求項２に記載の信号処理装置。
前記フィルタリング部は、前記所定領域へと伝搬する音をエリア制御によりキャンセルするための前記スピーカ駆動信号を生成する
請求項２に記載の信号処理装置。
前記フィルタ係数更新部は、波数領域で前記フィルタ係数を更新する
請求項４に記載の信号処理装置。
前記フィルタリング部は、波数領域で前記フィルタリング処理を行う
請求項４に記載の信号処理装置。
前記制御部は、前記高次スピーカの１次以上の所定次数の放射パターンに対応する項までの演算を行って前記スピーカ駆動信号を生成する
請求項４に記載の信号処理装置。
前記フィルタリング部は、前記フィルタリング処理により、空間上の所定の基準位置を原点とするモード係数を前記スピーカ駆動信号として生成する
請求項６に記載の信号処理装置。
前記基準位置は、前記高次スピーカの位置とは異なる位置である
請求項８に記載の信号処理装置。
前記フィルタリング部は、前記フィルタリング処理により、前記高次スピーカの位置を原点とする前記高次スピーカのモード係数を前記スピーカ駆動信号として生成する
請求項４に記載の信号処理装置。
前記スピーカアレイは、前記高次スピーカを含む複数のスピーカを環状とは異なる形状に並べて得られるスピーカアレイである
請求項１０に記載の信号処理装置。
前記フィルタ係数更新部は、前記スピーカアレイに対して前記第１のマイクロホンアレイとは反対側に配置された複数のマイクロホンからなる第２のマイクロホンアレイで収音することで得られた第２のマイクロホン信号と、前記第１のマイクロホン信号とに基づいて前記フィルタ係数を更新する
請求項２に記載の信号処理装置。
信号処理装置が、
複数のマイクロホンからなるマイクロホンアレイで収音することで得られたマイクロホン信号に基づいて、所定領域外から前記所定領域へと伝搬する前記マイクロホンアレイにより収音された音をキャンセルするための出力音のスピーカ駆動信号を生成し、
前記スピーカ駆動信号に基づいて、少なくとも１つの高次スピーカからなるスピーカアレイから前記出力音を出力させる
信号処理方法。
複数のマイクロホンからなるマイクロホンアレイで収音することで得られたマイクロホン信号に基づいて、所定領域外から前記所定領域へと伝搬する前記マイクロホンアレイにより収音された音をキャンセルするための出力音のスピーカ駆動信号を生成し、
前記スピーカ駆動信号に基づいて、少なくとも１つの高次スピーカからなるスピーカアレイから前記出力音を出力させる
ステップを含む処理をコンピュータに実行させるプログラム。