CN104041074B

CN104041074B - 处理用于产生声场的高保真度立体声响复制表示的刚性球上的球形麦克风阵列的信号的方法和装置

Info

Publication number: CN104041074B
Application number: CN201280066109.4A
Authority: CN
Inventors: S.科顿; J-M.贝特克; A.克鲁格
Original assignee: Dolby International AB
Current assignee: Dolby International AB
Priority date: 2011-11-11
Filing date: 2012-10-31
Publication date: 2017-04-12
Anticipated expiration: 2032-10-31
Also published as: CN104041074A; KR20140089601A; JP6113739B2; JP2014535232A; US20140307894A1; EP2777298A1; US9420372B2; KR101957544B1; EP2592846A1; EP2777298B1; WO2013068284A1

Abstract

球形麦克风阵列捕获三维声场(P(Ω_c，t))，用于生成高保真度立体声响复制表示其中球体表面上的压力分布由该阵列的碳精盒采样。使用逆麦克风传递函数消除麦克风对所捕获的声场的影响。麦克风阵列的传递函数的均衡是一个很大的问题，因为该传递函数的倒数对于传递函数中的小的值引起高的增益，而这些小的值受变换器噪声影响。本发明估计(73)平均声场功率和来自麦克风阵列碳精盒的噪声功率之间的信噪比，为扩散声场计算(74)原点处的平均空间信号功率，并根据给定基准功率和原点处的模拟功率的分数的平方根设计频域中的均衡滤波器的频率响应。

Description

处理用于产生声场的高保真度立体声响复制表示的刚性球上的球形麦克风阵列的信号的方法和装置

技术领域

本发明涉及一种用于处理用于产生声场的高保真度立体声响复制表示的刚性球上的球形麦克风阵列的信号的方法和装置，其中均衡滤波器被应用到逆麦克风阵列响应。

背景技术

球形麦克风阵列提供捕获三维声场的能力。存储和处理声场的一种方法是高保真度立体声响复制表示。高保真度立体声响复制使用正交球面函数来描述围绕原点的区域(也被称为最佳听音位置)中的声场。该描述的精度是由高保真度立体声响复制的阶N确定的，其中有限数目的高保真度立体声响复制系数描述该声场。球形阵列的最大高保真度立体声响复制阶由麦克风碳精盒的数目限定，该数目必须等于或大于高保真度立体声响复制系数的数目O＝(N+1)²。

高保真度立体声响复制表示的一个优点是声场的再现可以单独适应于任何给定的扬声器布置。此外，该表示使得能够在后期制作时使用波束成形技术来模拟不同的麦克风特性。

B-格式是一种已知的高保真度立体声响复制的示例。B-格式麦克风需要在四面体上有四个碳精盒以在高保真度立体声响复制阶为一的情况下捕获声场。

阶数大于一的高保真度立体声响复制被称为高阶高保真度立体声响复制(HOA)，并且HOA麦克风通常是刚性球上的球形麦克风阵列，例如mhAcoustics的Eigenmike。对于高保真度立体声响复制处理，球体表面上的压力分布由该阵列的碳精盒进行采样。然后将采样的压力转换为高保真度立体声响复制表示。这样的高保真度立体声响复制表示描述声场，但包括麦克风阵列的影响。麦克风对所捕获的声场的影响使用逆麦克风阵列响应来消除，它将平面波的声场变换为在麦克风碳精盒处测得的压力。它模拟碳精盒的方向性和麦克风阵列对声场的干扰。

发明内容

由球形麦克风阵列捕获的重构的高保真度立体声响复制信号的失真频谱功率应被均衡。一方面，该失真是由空间混叠信号的功率所造成的。另一方面，由于刚性球上球形麦克风阵列的噪声降低，高阶系数在球面谐波表示中缺失，并且这些缺失的系数使重构信号的频谱功率谱失去平衡，尤其对波束成形应用。

本发明要解决的一个问题是减少由球面麦克风阵列捕获的重构的高保真度立体声响复制信号的频谱功率的失真，并且均衡频谱功率。

本发明的处理用作确定平衡重构的高保真度立体声响复制信号的频谱的滤波器。分析经滤波和重构的高保真度立体声响复制信号的信号功率，由此为高保真度立体声响复制解码和波束成形应用描述平均空间混叠功率和缺失的高阶高保真度立体声响复制系数的影响。从这些结果得出平衡重构的高保真度立体声响复制信号的平均频谱的容易使用的均衡滤波器：取决于所使用的解码系数和记录的信噪比SNR，估计原点处的平均功率。

从以下获得均衡滤波器：

-估计平均声场功率和来自麦克风阵列碳精盒的噪声功率之间的信噪比。

-对于每个波数k为扩散声场计算原点处的平均空间信号功率。该模拟包括所有的信号功率分量(基准、混叠和噪声)。

-均衡滤波器的频率响应从给定基准功率和所计算的原点处的平均空间信号功率的分数的平方根而形成。

-对于每个波数k将均衡滤波器的频率响应乘以得自信噪比估计的噪声最小化滤波器的传递函数(对于每个阶数n在离散有限波数k处)并乘以麦克风阵列的逆传递函数，以便得到适应的传递函数F_n，array(k)。

所得到的滤波器被应用到所记录的声场的球面谐波表示，或者被应用到重构的信号。这种滤波器的设计是计算上高度复杂的。有利地，该计算复杂的处理可以通过使用恒定滤波器设计参数的计算来减少。这些参数对于给定的麦克风阵列是常数，并且可以存储在查找表中。这便于以可管理的计算复杂度实现时变的自适应滤波器设计。有利地，该滤波器消除高频处增加的平均信号功率。此外，该滤波器平衡低频处球面谐波表示中波束形成解码器的频率响应。不使用本发明的滤波器，来自球面麦克风阵列记录的重构的声音听起来是不平衡的，因为所记录的声场的功率并没有在所有的频率子带中被正确地重构。

原则上，本发明的方法适合于处理刚性球上的球形麦克风阵列的麦克风碳精盒信号，所述方法包括以下步骤：

-将表示所述麦克风阵列的表面上的压力的所述麦克风碳精盒信号转换为球面谐波或高保真度立体声响复制表示

-使用从所述麦克风阵列记录的平面波的平均源功率|P₀(k)|²和表示由所述麦克风阵列中的模拟处理产生的空间上不相关的噪声的对应的噪声功率|P_noise(k)|²，对于每个波数k计算所述麦克风碳精盒信号的时变的信噪比SNR(k)的估计；

-使用基准、混叠和噪声信号功率分量对于每个波数k为扩散声场计算原点处的平均空间信号功率，以及根据将给定基准功率除以所述原点处的平均空间信号功率得出的值的平方根形成均衡滤波器的频率响应；

并且对于每个阶数n在离散有限波数k处，对于每个波数k将所述均衡滤波器的所述频率响应乘以得自所述时变的信噪比SNR(k)的估计的噪声最小化滤波器的传递函数，并乘以所述麦克风阵列的逆传递函数，以便得到适应的传递函数F_n，array(k)。

-使用线性滤波处理将所述适应的传递函数F_n，array(k)应用到所述球面谐波或高保真度立体声响复制表示从而得到适应的方向系数

其中，n表示高保真度立体声响复制的阶数并且索引n从0变化到有限阶N，而m表示度，并且对于每个索引n，索引m从-n变化到n，

并且其中，其中f是频率，并且c_sound是声音的速度。

原则上，本发明的装置适合于处理刚性球上的球形麦克风阵列的麦克风碳精盒信号，所述装置包括：

-适应于将表示所述麦克风阵列的表面上的压力的所述麦克风碳精盒信号转换为球面谐波或高保真度立体声响复制表示的部件；

-适应于使用从所述麦克风阵列记录的平面波的平均源功率|P₀(k)|²和表示由所述麦克风阵列中的模拟处理产生的空间上不相关的噪声的对应的噪声功率|P_noise(k)|²，对于每个波数k计算所述麦克风碳精盒信号的时变的信噪比SNR(k)的估计的部件；

-部件，适应于使用基准、混叠和噪声信号功率分量对于每个波数k为扩散声场计算原点处的平均空间信号功率，以及根据将给定基准功率除以所述原点处的平均空间信号功率得出的值的平方根形成均衡滤波器的频率响应；

并且对于每个阶数n在离散有限波数k处，对于每波数k将所述均衡滤波器的所述频率响应乘以得自所述时变的信噪比SNR(k)的估计的噪声最小化滤波器的传递函数，并乘以所述麦克风阵列的逆传递函数，以便得到适应的传递函数F_n，array(k)；

-适应于使用线性滤波处理将所述适应的传递函数F_n，array(k)应用到所述球面谐波或高保真度立体声响复制表示从而得到适应的方向系数的部件，

并且其中，其中f是频率，并且c_sound是声音的速度。

在本发明的上述方法或装置中，在一个实施例中，在没有任何声音源的安静环境中获得所述噪声功率|P_noise(k)|²以使得|P₀(k)|²＝0。在另一实施例中，通过比较麦克风碳精盒处的压力的期望值和麦克风碳精盒处测得的平均信号功率来从麦克风碳精盒处测得的压力p_mic(Ω_c，k)估计所述平均源功率|P₀(k)|²。在又一实施例中，所述阵列的传递函数F_n，array(k)在频域中确定，包含：使用FFT将所述球面谐波或高保真度立体声响复制表示变换到频域，之后乘以所述传递函数F_n，array(k)；对该乘积执行逆FFT以得到时域系数或者，通过时域中的FIR滤波器进行近似，包含：执行逆FFT；执行循环移位；对所得到的滤波器脉冲响应应用冲击窗以便平滑对应的传递函数；通过对于每个n和m的组合对所得到的滤波器系数和所述球面谐波或高保真度立体声响复制表示执行卷积。在又一实施例中，所述均衡滤波器的传递函数通过下式确定

其中，E表示期望值，w_ref(k)是波数k的基准权重，w′_ref(k)是波数k的优化的基准权重，w′_alias(k)是波数k的优化的混叠权重并且w′_noise(k)是波数k的优化的噪声权重，据此，优化的基准权重、优化的混叠权重和优化的噪声权重分别是指使得噪声相对于在所述球形麦克风阵列中出现的噪声降低的基准权重、混叠权重和噪声权重。

附图说明

参照附图描述本发明的示例性实施例，附图中：

图1示出对于刚性球上的具有32个碳精盒的麦克风阵列，来自得到的扬声器权重的基准、混叠和噪声分量的功率；

图2示出SNR(k)＝20dB的降噪滤波器；

图3示出使用传统高保真度立体声响复制解码器的跟随图2的优化滤波器的权重分量的平均功率；

图4示出使用波束成形应用了噪声优化滤波器之后的权重分量的平均功率，其中

图5示出传统高保真度立体声响复制解码器和20dB的SNR(k)的优化阵列响应；

图6示出波束成形解码器和20dB的SNR(k)的优化阵列响应；

图7示出根据本发明的自适应高保真度立体声响复制处理的框图；

图8示出使用传统高保真度立体声响复制解码应用了噪声优化滤波器F_n(k)和滤波器F_EQ(k)后所得到的权重的平均功率，从而比较优化的权重、基准权重和噪声权重的功率；

图9示出使用波束成形解码器应用了噪声优化滤波器F_n(k)和滤波器F_EQ(k)后权重分量的平均功率，其中从而比较优化的权重、基准权重和噪声权重的功率。

具体实施方式

球形麦克风阵列处理-高保真度立体声响复制理论

高保真度立体声响复制解码是通过假设正在辐射平面波的声场的扬声器来定义的。参见M.A.Poletti的《Three-Dimensional Surround Sound Systems Based onSpherical Harmonic》(音频工程学会杂志，2005年，53卷，第11期，第1004-1025页)：

L个扬声器的布置重构存储在高保真度立体声响复制系数中的三维声场。该处理对于每个波数是单独进行的，其中f是频率，并且c_sound是声音的速度。索引n从0变化到有限阶N，而索引m对于每一个索引n从-n变化到n。因此，系数的总数是O＝(N+1)²。扬声器位置由球面坐标系中的方向向量Ω_l＝[Θ_l，Φ_l]^T定义，并且[·]^T表示向量的转置形式。

等式(1)定义了高保真度立体声响复制系数到扬声器权重w(Ω_l，k)的转换。这些权重是扬声器的驱动函数。所有扬声器权重的叠加重构声场。

解码系数描述一般的高保真度立体声响复制解码处理。这包括波束图案的共轭复数系数，如Morag Agmon、Boaz Rafaely在《Beamform-ing for a Spherical-Aperture Microphone》(IEEEI，2008年，第227-230页)的第三节以及上述M.A.Poletti的文献在第3.2节中给出的模式匹配解码矩阵的行中所示。Johann-MarkusBatke、Florian Keiler的《Using VBAP-Derived Panning Functions for 3D AmbisonicsDecoding》(2010年5月6-7日，第二届高保真度立体声响复制和球面声学国际研讨会学报，法国巴黎)的第4节中描述的另一种不同的处理方式使用基于向量的幅度平移来计算任意三维扬声器布置的解码矩阵。这些矩阵的行元素也由系数描述。

如Boaz Rafaely的《Plane-wave decomposition of the sound field on asphere by spherical convolution》(美国J.声学学会，116卷，第4期，第2149-2157页，2004年)中第3节所描述，高保真度立体声响复制系数总是可以被分解成平面波的叠加。因此，分析可以被限制在从方向Ω_s入射的平面波的系数：

对于采用辐射平面波的声场的扬声器，定义平面波的系数在原点处的压力由波数k的P₀(k)定义。共轭复数球面谐波表示平面波的方向系数。使用在上述M.A.Poletti的文献中给出的球面谐波的定义。

球面谐波是高保真度立体声响复制表示的正交基函数，并且满足

其中是delta脉冲。 (5)

球形麦克风阵列对球体表面上的压力进行采样，其中对于阶N的高保真度立体声响复制，采样点的数目必须等于或大于高保真度立体声响复制系数的数目O＝(N+1)²。此外，采样点必须均匀地分布在球体表面上，其中仅对阶数N＝1准确示出O点的最优分布。对于更高的阶，存在球体采样的良好近似，参见2007年2月1日访问的mh声学首页http：//www.mhacoustics.com和F.Zotter的《Sampling Strategies for Acoustic Holography/Holophony on the Sphere》(NAG-DAGA学报，2009年3月23-26日，鹿特丹)。

对于最优采样点Ω_c，等式(4)的积分等效于等式(6)的离散总和：

其中对于C≥(N+1)²，n′≤N并且n≤N，C是碳精盒的总数。

为了对于非最优采样点达到稳定的结果，共轭复数球面谐波可以替换为伪逆矩阵的列，该伪逆矩阵是从L×O的球面谐波矩阵Y获得的，其中球面谐波的O系数是Y的行元素，参见上述Moreau/Daniel/

Bertet的文献的第3.2.2节：

在下面，定义的列元素表示为使得等式(6)的正交条件也满足

其中对于C≥(N+1)²，n′≤N并且n≤N。

如果假设球形麦克风阵列已经将碳精盒几乎均匀分布在球体的表面上，并且碳精盒的数量大于O，则

成为一个有效的表达式。

球形麦克风阵列处理-对处理的模拟

刚性(硬的，固定的)球上的球形麦克风阵列的完整的HOA处理链包括估计碳精盒处的压力，计算HOA系数和解码扬声器权重。球面谐波表示中麦克风阵列的描述使得能够对于给定的解码器估计原点处的平均频谱功率。评估模式匹配高保真度立体声响复制解码器和简单的波束成形解码器的功率。使用在最佳听音位置处的估计的平均功率来设计均衡滤波器。

下面的部分描述将w(k)分解成基准权重w_ref(k)，空间混叠权重w_alias(k)和噪音权重w_noise(k)。混叠是由对连续声场采样有限阶N引起的，并且噪声模拟对每个碳精盒引入的空间不相关的信号部分。对于给定的麦克风阵列，不能消除空间混叠。

球形麦克风阵列处理-对碳精盒信号的模拟

刚性球的表面上的麦克风阵列的入射平面波的传递函数定义在上述M.A.Poletti的文献的第2.2节，等式(19)中：

其中是第一类Hankel函数，并且半径r等于球体R的半径。传递函数是从将压力分散在刚性球上的物理原理(这意味着径向速度在刚性球的表面上消失)推导出的。换句话说，入射的和分散的声场的径向求导(radial derivation)的叠加是零，参见《Fourier Acoustics》一书的第6.10.3节。因此，对于从Ω_s入射的平面波，在位置Ω处的球体表面上的压力由Moreau/Daniel/Bertet的文献的第3.2.1节，等式(21)给出：

添加各向同性的噪声信号P_noise(Ω_c，k)以模拟转换器噪声，其中“各向同性”是指碳精盒的噪声信号在空间上是不相关的，其不包括在时域中的相关性。该压力可以被分成对于麦克风阵列的最大阶N计算出的压力P_ref(Ω_c，kR)和来自剩余阶的压力，参见上述Rafaely的文献《Analysis and design...》中第7节，等式(24)。来自剩余阶的压力P_alias(Ω_c，kR)被称为空间混叠压力，因为麦克风阵列的阶并不足以重构这些信号分量。因此，在碳精盒c处记录的总压力被定义为：

球形麦克风阵列处理-高保真度立体声响复制编码

通过在等式(13a)中给出的对等式(11)求逆来从碳精盒处的压力获得高保真度立体声响复制系数参见上述Moreau/Daniel/Bertet的文献的第3.2.2节，等式(26)。使用等式(8)通过对球面谐波进行求逆，并且传递函数b_n(kR)由它的逆进行均衡：

如等式(13b)和(13c)所示，使用等式(13a)和(12a)可以将高保真度立体声响复制系数分成基准系数混叠系数和噪声系数

球形麦克风阵列处理-高保真度立体声响复制解码

优化使用得到的原点处的扬声器权重w(k)。假设所有扬声器具有到原点的相同距离，使得在所有扬声器权重上求和得到w(k)。等式(14)从等式(1)和(13b)提供w(k)，其中L是扬声器数目。

等式(14b)示出w(k)也可被分成三个权重w_ref(k)、w_alias(k)和w_noise(k)。为简单起见，这里不考虑上述Rafaely的文献《Analysis and design...》的第7节，等式(24)给出的定位误差。

在解码时，基准系数是合成地生成的n阶平面波会创建的权重。在下面的等式(15a)中，来自等式(12b)的基准压力P_ref(Ω_c，kR)被代入等式(14a)，由此，忽略压力信号P_alias(Ω_c，kR)和P_noise(Ω_c，k)(即设置为零)：

使用等式(8)可以消除c、n′和m′上的总和，使得等式(15a)可以被简化为来自等式(3)的高保真度立体声响复制表示中的平面波的权重的总和。因此，如果忽略混叠和噪声信号，则阶数为N的平面波的理论系数可以完美地从麦克风阵列记录重构。

得到的噪声信号w_noise(k)的权重由等式(14a)并仅使用等式(12b)中的P_noise(Ω_c，k)来给出：

在等式(14a)中代入等式(12b)的项P_alias(Ω_c，kR)并且忽略其它压力信号，得到：

得到的混叠权重w_alias(k)不能由等式(8)的正交条件得到简化，因为索引n′大于N。

混叠权重的模拟需要以足够的精度表示碳精盒信号的高保真度立体声响复制阶。在上述Moreau/Daniel/Bertet的文献的2.2.2节，等式(14)给出了对于高保真度立体声响复制声场重构的截断误差的分析。据指出，对于

可以获得声场的合理的精度，其中表示四舍五入取整到最接近的整数。该精度被用作模拟的频率上限f_max。因此，高保真度立体声响复制阶

被用于每个波数的混叠压力的模拟。这将导致频率上限处的可接受的精度，并且该精度甚至对于低频也有所增加。

球形麦克风阵列处理-对扬声器权重的分析

图1示出对于刚性球上具有32个碳精盒的麦克风阵列，来自方向Ω_s＝[0，0]^T的平面波得到的扬声器权重的权重分量a)w_ref(k)、b)w_noise(k)和c)w_alias(k)的功率(来自上述Agmon/Rafaely的文献的E igenmike已被用于模拟)。麦克风碳精盒均匀地分布在R＝4.2厘米的球体表面上，使得正交条件得到满足。这个阵列所支持的最大高保真度立体声响复制阶数N为四。根据Fliege、Ulrike Maier的《A Two-Stage Approach for ComputingCubature Formulae for the Sphere》(技术报告，多特蒙德大学数学系，德国，1996年)，上述M.A.Poletti的文献中描述的模式匹配处理被用于获得与25个均匀分布的扬声器位置对应的解码系数节点序号显示在http：//www.mathematik.uni-dortmund.de/lsx/rese arch/projects/fliege/nodes/nodes.html。

在整个频率范围内，基准权重w_ref(k)的功率是恒定的。得到的噪音权重w_noise(k)在低频显示出高功率，并在较高的频率处降低。噪声信号或功率通过具有20dB的方差(即比平面波的功率低20dB)的正态分布无偏伪随机噪声进行模拟。混叠噪声w_alias(k)在低频处可被忽略，但随频率上升而增加，在10kHz以上会超过基准功率。混叠功率曲线的斜率取决于平面波的方向。然而，对于所有方向，平均趋势是一致的。两个误差信号w_noise(k)和w_alias(k)在不同的频率范围中使基准权重失真。此外，误差信号是相互独立的。因此，提出两步骤的均衡处理。在第一步骤中，使用同一申请人在同一天提交的、并具有相同发明人的内部编号为PD110039的欧洲专利申请中描述的方法补偿噪声信号。在第二步骤中，在考虑混叠信号和所述第一处理步骤的情况下均衡整体信号功率。

在第一步骤中，对于所有入射平面波方向，最小化基准权重和失真的基准权重之间的均方误差。混叠信号w_alias(k)的权重被忽略，因为在已经由高保真度立体声响复制表示的阶在空间上进行频带限制后，无法校正w_alias(k)。这等效于时域混叠，其中该混叠不能从采样的和频带限制的时间信号中消除。

在第二步骤中，对于所有平面波方向估计重构权重的平均功率。平衡重构权重的功率到基准权重的功率的滤波器在下面描述。该滤波器仅在最佳听音位置处均衡功率。然而，混淆误差仍然干扰高频的声场表示。

麦克风阵列的空间频率限制被称为空间混叠频率。空间混叠频率

计算自碳精盒的距离(参见WO 03/061336 A1)，对于具有半径R等于4.2厘米的Eigenmike，它约是5594Hz。

优化-降噪

降噪描述在上述内部编号为PD110039的欧洲专利申请中，其中估计平均声场功率和变换器噪声之间的信噪比SNR(k)。从所估计的SNR(k)可设计下列优化滤波器：

传递函数F_n(k)的参数取决于麦克风碳精盒的数目并取决于波数k的信噪比。该滤波器独立于高保真度立体声响复制解码器，这意味着它对于三维高保真度立体声响复制解码和定向波束成形是有效的。SNR(k)可从上述内部编号为PD110039的欧洲专利申请获得。该滤波器是高通滤波器，其限制低频高保真度立体声响复制表示的阶。该滤波器的截止频率对于更高的SNR(k)减小。高保真度立体声响复制阶从零到四的SNR(k)为20dB的滤波器的传递函数F_n(k)分别示于图2a-2e，其中所述传递函数对于每个阶数n具有高通特性，对于更高的阶，截止频率增加。如在上述Moreau/Daniel/Bertet的文献的第4.1.2节描述的那样，截止频率随着正则化参数λ衰减。因此，需要高的SNR(k)以对于低频获得高阶高保真度立体声响复制的系数。优化的权重w′(k)计算自：

将在下面的章节评估得到的w′_noise(k)的平均功率。

优化-频谱功率均衡

优化权重w′(k)的平均功率从它的幅值期望值的平方得到。噪声权重w′_noise(k)与权重w′_ref(k)和w′_alias(k)在空间上不相关，使得如在等式(23)中所示可以独立地计算噪声功率。基准和混叠权重的功率得自等式(23b)。等式(22)、(15a)和(17)的组合得到等式(23c)，其中在等式(22)中忽略w′_noise(k)。使用等式(4)，平方幅值的扩展简化等式(23c)及(23d)。

E{|w′(k)|²}＝E{|w′_ref(k)+w′_alias(k)|²}+E{|w′_noise(k)|²} (23a)

优化的误差权重w′_noise(k)的功率在等式(23e)中给出。在上述内部编号为PD110039的欧洲专利申请中描述E{|w′_noise(k)|²}的推导。

得到的功率取决于所使用的解码处理。然而，对于传统的三维高保真度立体声响复制解码，假设所有的方向都被扬声器布置覆盖。在这种情况下，具有大于零的阶的系数通过在等式(23)中给出的解码系数的和而消除。这意味着，在原点处的压力等效于零阶信号，使得低频缺失的高阶系数不降低在最佳听音位置处的功率。

这对于高保真度立体声响复制表示的波束成形是不同的，因为只重构来自特定方向的声音。这里使用一个扬声器，使得的所有系数都对原点处的功率有贡献。因此，低频减少的高阶系数相较于高频改变权重w′(k)的功率。

这可以通过改变阶数N对于等式(24)中给出的基准权重的功率进行完美的解释：

在上述内部编号为PD110039的欧洲专利申请中提供等式(24)的推导。该功率相当于的平方幅值的总和，使得对于一个扬声器l，该功率随阶数N增加。

然而，对于高保真度立体声响复制解码，所有扬声器解码系数之和消除了高阶系数，使得只有零阶系数对最佳听音位置处的功率有贡献。因此，低频缺失的HOA系数改变用于波束成形的w′(k)的功率，但不改变用于高保真度立体声响复制解码的w′(k)的功率。

从噪声优化滤波器得到的传统高保真度立体声响复制解码的w′(k)的平均功率分量示于图3。图3b示出了基准+混叠功率，图3c示出了噪声功率，图3a示出了两者的总和。噪声功率在高达1kHz的频率处减小到-35dB。在1kHz以上，噪声功率线性增加至-10dB。得到的噪声功率在高达8kHz的频率处小于P_noise(Ω_c，k)＝-20dB。在10kHz以上总功率提高10dB，这是由混叠功率引起的。在10kHz以上，麦克风阵列的HOA阶并不充分地描述半径等于R的所述球体表面上的压力分布。因此，由所获得的高保真度立体声响复制系数引起的平均功率大于基准功率。

图4示出对于L＝1解码系数的w′(k)的功率分量。如上述Agmon/Rafaely的文献中所示，这可以解释为在方向Ω＝[0，0]^T上的波束成形。图4b示出了基准+混叠功率，图4c示出了噪声功率，并且图4a示出了两者的总和。功率从低到高频增加，从3kHz至6kHz保持几乎恒定，然后再次显著增加。第一次增加是由高阶系数的减少引起的，因为3kHz大约是图2e所示的四阶系数的截止频率F_n(k)。第二次增加是由对高保真度立体声响复制解码所讨论的空间混叠功率引起的。

现在，确定平均功率为w′(k)的均衡滤波器。该滤波器在很大程度上取决于所使用的解码系数并且因此只有如果这些解码系数是已知的才被使用。

对于传统高保真度立体声响复制解码，可以做出假设

然而，要保证所应用的高保真度立体声响复制解码器将接近实现这一假设。

在等式(26a)中给出实数均衡滤波器F_EQ(k)。它将平均功率w′(k)补偿到基准功率w_ref(k)。在等式(26b)中使用等式(23e)和(27)来在等式(26b)显示F_EQ(k)也是SNR(k)的函数。

E{|w_ref(k)|²}＝E{|F_EQ(k)(w′_ref(k)+w′_alias(k))|²}+E{|F_EQ(k)w′_noise(k)|²}

|P₀(k)|²E{|w′(k)|²}＝E{|w(k)|²} (27)

问题是，该滤波器F_EQ(k)取决于滤波器F_n(k)，使得对于SNR(k)的每个变化，必须重新设计两个滤波器。由于用于模拟混叠和基准误差E{|w′_ref(k)+w′_alias(k)|²}的功率的高的高保真度立体声响复制阶数，因此滤波器设计的计算复杂度高。对于自适应滤波，这一复杂度可以通过仅执行计算复杂处理一次以便对于给定的麦克风阵列创建一组恒定的滤波器设计系数来降低。在等式(28)中提供了这些滤波器系数的推导。

在等式(28)中，示出E{|w′_ref(k)+w′_alias(k)|²}的高度复杂的计算可以被分成n从零到N的总和以及相关的n″从n到N的总和。这些总和的每个元素都是滤波器F_n(k)乘以它的共轭复数值、与它的共轭复数值的乘积在n′和m′上的无限总和。该无限总和通过达到n′＝N_max的有限总和进行近似。这些总和的结果给出n和n″的每一种组合的恒定滤波器设计系数。这些系数对一个给定的阵列计算一次，并且可以存储在用于时变信噪比自适应滤波器设计的查找表中。

优化-优化的高保真度立体声响复制处理

在高保真度立体声响复制麦克风阵列处理的实际实现中，优化的高保真度立体声响复制系数由(29)得到，其包括对于每个阶数n和波数k的自适应传递函数和碳精盒c的总和。该总和将球体表面上的采样的压力分布转换成高保真度立体声响复制表示，并且对于宽带信号它可以在时域中执行。该处理步骤将时间域压力信号P(Ω_c，t)转换为第一高保真度立体声响复制表示

在第二处理步骤中，优化的传递函数

从第一高保真度立体声响复制表示重构方向信息项。传递函数b_n(kR)的倒数将转换为方向系数其中，假设采样的声场是由分散在球体表面上的平面波的叠加创建的。系数表示在上述Rafaely的文献《Plane-wave decomposition...》的第3节，等式(14)中所描述的声场的平面波分解，并且该表示基本上被用于高保真度立体声响复制信号的传输。取决于SNR(k)，优化传递函数F_n(k)减小高阶系数的贡献以便消除由噪声所覆盖的HOA系数。对于已知的或假设的解码器处理，重构信号的功率由滤波器F_EQ(k)进行均衡。

第二处理步骤得到与设计的时域滤波器的卷积。传统高保真度立体声响复制解码的所产生的优化阵列响应示于图5，并且波束成形解码器示例的所产生的优化阵列响应示于图6。在这两个图中，传递函数a)至e)分别对应于高保真度立体声响复制阶0至4。

系数的处理可以被视为线性滤波操作，其中滤波器的传递函数由F_n，array(k)确定。这可以在频域以及时域中进行。FFT可被用于将系数变换到频域用于传递函数F_n，array(k)的连续乘法运算。该乘积的逆FFT得到时域系数该传递函数处理也被称为使用重叠相加或重叠保留方法的快速卷积。

可替换地，所述线性滤波器可以由FIR滤波器进行近似，其系数可以通过利用逆FFT将传递函数F_n，array(k)变换到时域、执行循环移位以及对所得到的滤波器脉冲响应应用冲击窗(tapering window)以平滑对应的传递函数来从传递函数F_n，array(k)计算。然后，通过对于每个n和m的组合，进行传递函数F_n，array(k)的时域系数和系数的卷积来在时域中执行线性滤波处理。

本发明的基于自适应块的高保真度立体声响复制处理描绘在图7中。在上部信号路径中，麦克风碳精盒信号的时域压力信号P(Ω_c，t)在步骤或阶段71中被使用公式(13a)转换为高保真度立体声响复制表示从而不执行被麦克风传递函数b_n(kR)除的除法(由此计算而不是)，而是代替地在步骤/阶段72中执行。随后步骤/阶段72在时域或频域执行所描述的线性滤波操作以便获得系数从而从中消除麦克风阵列响应。第二处理路径用于传递函数F_n，array(k)的自动自适应滤波器设计。步骤/阶段73执行对于所考虑的时间段(即，采样块)的信噪比SNR(k)的估计。该估计在频域对离散波数k的有限数量进行。因此，所关心的压力信号P(Ω_c，t)必须使用例如FFT变换到频域。通过两个功率信号|P_noise(k)|²和|P₀(k)|²指定SNR(k)值。噪声信号的功率|P_noise(k)|²对于给定的阵列是恒定的，并表示由碳精盒产生的噪声。平面波的功率|P₀(k)|²是从压力信号P(Ω_c，t)估计的。该估计进一步描述在上述内部编号为PD110039的欧洲专利申请中的“SNRestimation”小节。根据所估计的SNR(k)，在步骤/阶段74在频域中使用等式(30)、(26c)、(21)和(10)设计n≤N的传递函数F_n，array(k)。该滤波器设计可以使用Wiener滤波器和逆阵列响应或逆传递函数1/b_n(kR)。然后，滤波器实现适应于步骤/阶段72的时域或频域中的对应的线性滤波处理。

在下面讨论本发明的处理的结果。因此，来自等式(26c)的均衡滤波器F_EQ(k)被应用到期望值E{|w′(k)|²}。讨论图3的传统高保真度立体声响复制解码和图4的波束成形的示例的得到的功率E{|w′(k)|²}、基准功率E{|w_ref(k)|²}与得到的噪声功率。传统高保真度立体声响复制解码器的得到的功率谱描绘在图8中，而波束成形解码器的所得到的功率谱描绘在图9中，其中曲线a)至c)分别示出|w_opt|²、|w_ref|²和|w_noise|²。

基准和优化权重的功率是相同的，使得得到的权重具有平衡的频谱。相较于给定的20dB的SNR(k)，在低频处，在最佳听音位置处得到的信噪比对于传统高保真度立体声响复制解码增加，但对于波束成形解码下降。在高频处两个解码器的信噪比都等于给定的SNR(k)。然而，对于波束形成解码，高频下的信噪比相对于低频下的信噪比更大，而对于高保真度立体声响复制解码器，高频下的信噪比相对于低频下的信噪比更小。波束成形解码器在低频下较小的信噪比是由缺失高阶系数引起的。在图9中，平均噪声功率相比于图1中的平均噪声功率降低。另一方面，由于缺失的高阶系数，如在“优化-频谱功率均衡”小节讨论的那样，信号功率在低频下也降低。因此，信号与噪声功率之间的距离变得更小。

此外，得到的信噪比很大程度上取决于所使用的解码系数示例的波束图案是具有很强的高阶系数的窄波束图案。产生具有更宽的波束的波束图案的解码系数可以提高信噪比。这些波束在低阶中具有很强的系数。更好的结果可以通过对于若干频带使用不同的解码系数以便适应于低频处的有限阶来实现。

存在最小化所得到的信噪比的用于优化的波束成形的其它方法，其中解码系数通过对特定的导引方向进行数值优化来获得。在Y.Shefeng、S.Haohai、U.P.Svensson、M.Xiaochuan、J.M.Hovem的《Optimal Modal Beamforming for SphericalMicrophone Arrays》(IEEE Transactions on Audio，Speech，and language processing，第19卷，第2期，第361-371页，2011年2月)中提出的最佳模式波束成形和在M.Agmon、B.Rafaely、J.Tabrikian的《Maximum Directivity Beamformer for Spherical-ApertureMicrophones》(2009 IEEE Workshop on Applcations of Signal Processing to Audioand Acoustics WASPAA′09，Proc.IEEE International Conference on Acoustics，Speech，and Signal Processing，第253-156页，2009年10月18-21日，新帕尔兹，纽约，美国)中所讨论的最大方向性波束成形是优化的波束成形的两个示例。

该示例性的高保真度立体声响复制解码器使用模式匹配处理，其中，根据波束成形示例中使用的解码系数计算每个扬声器权重。Ω_c处扬声器的解码系数由定义，因为扬声器均匀分布在球体表面上。扬声器信号具有与用于波束成形解码器示例的相同的SNR。然而，一方面，原点处扬声器信号的叠加导致极好的SNR。另一方面，如果收听位置移出最佳听音位置，SNR变得更低。

该结果表明，所描述的优化对于传统高保真度立体声响复制解码器产生在原点具有增加的SNR的均衡频谱，即，本发明的时变自适应滤波器设计对于高保真度立体声响复制记录是有利的。如果记录的SNR可以假设为随时间恒定，本发明的处理也可用于设计不随时间变化的滤波器。

对于波束成形解码器，本发明的处理可以平衡得到的频谱，缺点是低频处的低SNR。可以通过选择产生更宽的波束的适当的解码系数，或通过在不同的频率子带的高保真度立体声响复制阶上调整波束宽度来提高该SNR。

本发明适用于球面谐波表示中的所有球形麦克风记录，其中在原点处再现的频谱功率由于混叠或缺失球面谐波系数而不平衡。

Claims

1.一种用于处理刚性球上的球形麦克风阵列的麦克风碳精盒信号(P(Ω_c，t))的方法，所述方法包括以下步骤：

-将表示在所述麦克风阵列的表面上的压力的所述麦克风碳精盒信号(P(Ω_c，t))转换(71)为球面谐波或高保真度立体声响复制表示

-使用从所述麦克风阵列记录的平面波的平均源功率|P₀(k)|²和表示由所述麦克风阵列中的模拟处理产生的空间上不相关的噪声的对应的噪声功率|P_noise(k)|²，对于每个波数k计算(73)所述麦克风碳精盒信号(P(Ω_c，t))的时变的信噪比SNR(k)的估计；

-使用基准、混叠和噪声信号功率分量对于每个波数k为扩散声场计算(74)原点处的平均空间信号功率，

以及根据将给定基准功率除以所述原点处的平均空间信号功率得出的值的平方根形成(74)均衡滤波器的频率响应，

并且对于每个阶数n在离散有限波数k处，对于每个波数k将所述均衡滤波器的所述频率响应乘以(74)得自所述时变的信噪比SNR(k)的估计的噪声最小化滤波器的传递函数，并乘以所述麦克风阵列的逆传递函数，以便得到适应的传递函数F_n，array(k)；

-使用线性滤波处理将所述适应的传递函数F_n，array(k)应用(72)到所述球面谐波或高保真度立体声响复制表示从而产生适应的方向系数

并且其中，其中f是频率，并且c_sound是声音的速度。

2.根据权利要求1所述的方法，其中在没有任何声音源的安静环境中获得所述噪声功率|P_noise(k)|²以使得|P₀(k)|²＝0。

3.根据权利要求1或2所述的方法，其中通过比较麦克风碳精盒处的压力的期望值和麦克风碳精盒处测得的平均信号功率来从麦克风碳精盒处测得的压力p_mic(Ω_c，k)估计所述平均源功率|P₀(k)|²。

4.根据权利要求1或2所述的方法，其中所述阵列的传递函数F_n，array(k) 在频域中确定，包含：

-使用FFT将所述球面谐波或高保真度立体声响复制表示变换到频域，之后乘以所述传递函数F_n，array(k)；

-对该乘积执行逆FFT以得到时域系数

或者，通过时域中的FIR滤波器进行近似，包含：

--执行逆FFT；

--执行循环移位；

--对所得到的滤波器脉冲响应应用冲击窗以便平滑对应的传递函数；

--通过对于每个n和m的组合对所得到的滤波器系数和所述球面谐波或高保真度立体声响复制表示执行卷积。

5.根据权利要求1或2所述的方法，其中所述均衡滤波器的传递函数通过下式确定：

，

6.一种用于处理刚性球上的球形麦克风阵列的麦克风碳精盒信号(P(Ω_c，t))的装置，所述装置包括：

-适应于将表示所述麦克风阵列的表面上的压力的所述麦克风碳精盒信号(P(Ω_c，t))转换为球面谐波或高保真度立体声响复制表示的部件(71)；

-适应于使用从所述麦克风阵列记录的平面波的平均源功率|P₀(k)|²和表示由所述麦克风阵列中的模拟处理产生的空间上不相关的噪声的对应的噪声功率|P_noise(k)|²，对于每个波数k计算所述麦克风碳精盒信号(P(Ω_c，t))的时变的信噪比SNR(k)的估计的部件(73)；

-部件(74)，适应于使用基准、混叠和噪声信号功率分量对于每个波数k为扩散声场计算原点处的平均空间信号功率，

以及根据将给定基准功率除以所述原点处的平均空间信号功率得出的值的平方根形成均衡滤波器的频率响应，

并且对于每个阶数n在离散有限波数k处，对于每个波数k将所述均衡滤波器的所述频率响应乘以得自所述时变的信噪比SNR(k)的估计的噪声最小化滤波器的传递函数，并乘以所述麦克风阵列的逆传递函数，以便得到适应的传递函数F_n，array(k)；

-适应于使用线性滤波处理将所述适应的传递函数F_n，array(k)应用到所述球面谐波或高保真度立体声响复制表示从而得到适应的方向系数的部件(72)，

其中，n表示高保真度立体声响复制的阶次并且索引n从0变化到有限阶N，而m表示度，并且对于每个索引n，索引m从-n变化到n，

并且其中，其中f是频率，并且c_sound是声音的速度。

7.根据权利要求6所述的装置，其中在没有任何声音源的安静环境中获得所述噪声功率|P_noise(k)|²以使得|P₀(k)|²＝0。

8.根据权利要求6或7所述的装置，其中通过比较麦克风碳精盒处的压力的期望值和麦克风碳精盒处测得的平均信号功率来从麦克风碳精盒处测得的压力p_mic(Ω_c，k)估计所述平均源功率|P₀(k)|²。

9.根据权利要求6或7所述的装置，其中所述阵列的传递函数F_n，array(k)在频域中确定，包含：

-对该乘积执行逆FFT以得到时域系数

或者，通过时域中的FIR滤波器进行近似，包含：

--执行逆FFT；

--执行循环移位；

--对每个n和m的组合，对所得到的滤波器系数和所述球面谐波或高保真度立体声响复制表示执行卷积。

10.根据权利要求6或7所述的装置，其中所述均衡滤波器的传递函数通过下式确定：

，