CN104041074B - 处理用于产生声场的高保真度立体声响复制表示的刚性球上的球形麦克风阵列的信号的方法和装置 - Google Patents
处理用于产生声场的高保真度立体声响复制表示的刚性球上的球形麦克风阵列的信号的方法和装置 Download PDFInfo
- Publication number
- CN104041074B CN104041074B CN201280066109.4A CN201280066109A CN104041074B CN 104041074 B CN104041074 B CN 104041074B CN 201280066109 A CN201280066109 A CN 201280066109A CN 104041074 B CN104041074 B CN 104041074B
- Authority
- CN
- China
- Prior art keywords
- noise
- array
- power
- weight
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/326—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only for microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/401—2D or 3D arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
- H04R29/005—Microphone arrays
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/027—Spatial or constructional arrangements of microphones, e.g. in dummy heads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
Landscapes
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Stereophonic System (AREA)
Abstract
球形麦克风阵列捕获三维声场(P(Ωc,t)),用于生成高保真度立体声响复制表示其中球体表面上的压力分布由该阵列的碳精盒采样。使用逆麦克风传递函数消除麦克风对所捕获的声场的影响。麦克风阵列的传递函数的均衡是一个很大的问题,因为该传递函数的倒数对于传递函数中的小的值引起高的增益,而这些小的值受变换器噪声影响。本发明估计(73)平均声场功率和来自麦克风阵列碳精盒的噪声功率之间的信噪比,为扩散声场计算(74)原点处的平均空间信号功率,并根据给定基准功率和原点处的模拟功率的分数的平方根设计频域中的均衡滤波器的频率响应。
Description
技术领域
本发明涉及一种用于处理用于产生声场的高保真度立体声响复制表示的刚性球上的球形麦克风阵列的信号的方法和装置,其中均衡滤波器被应用到逆麦克风阵列响应。
背景技术
球形麦克风阵列提供捕获三维声场的能力。存储和处理声场的一种方法是高保真度立体声响复制表示。高保真度立体声响复制使用正交球面函数来描述围绕原点的区域(也被称为最佳听音位置)中的声场。该描述的精度是由高保真度立体声响复制的阶N确定的,其中有限数目的高保真度立体声响复制系数描述该声场。球形阵列的最大高保真度立体声响复制阶由麦克风碳精盒的数目限定,该数目必须等于或大于高保真度立体声响复制系数的数目O=(N+1)2。
高保真度立体声响复制表示的一个优点是声场的再现可以单独适应于任何给定的扬声器布置。此外,该表示使得能够在后期制作时使用波束成形技术来模拟不同的麦克风特性。
B-格式是一种已知的高保真度立体声响复制的示例。B-格式麦克风需要在四面体上有四个碳精盒以在高保真度立体声响复制阶为一的情况下捕获声场。
阶数大于一的高保真度立体声响复制被称为高阶高保真度立体声响复制(HOA),并且HOA麦克风通常是刚性球上的球形麦克风阵列,例如mhAcoustics的Eigenmike。对于高保真度立体声响复制处理,球体表面上的压力分布由该阵列的碳精盒进行采样。然后将采样的压力转换为高保真度立体声响复制表示。这样的高保真度立体声响复制表示描述声场,但包括麦克风阵列的影响。麦克风对所捕获的声场的影响使用逆麦克风阵列响应来消除,它将平面波的声场变换为在麦克风碳精盒处测得的压力。它模拟碳精盒的方向性和麦克风阵列对声场的干扰。
发明内容
由球形麦克风阵列捕获的重构的高保真度立体声响复制信号的失真频谱功率应被均衡。一方面,该失真是由空间混叠信号的功率所造成的。另一方面,由于刚性球上球形麦克风阵列的噪声降低,高阶系数在球面谐波表示中缺失,并且这些缺失的系数使重构信号的频谱功率谱失去平衡,尤其对波束成形应用。
本发明要解决的一个问题是减少由球面麦克风阵列捕获的重构的高保真度立体声响复制信号的频谱功率的失真,并且均衡频谱功率。
本发明的处理用作确定平衡重构的高保真度立体声响复制信号的频谱的滤波器。分析经滤波和重构的高保真度立体声响复制信号的信号功率,由此为高保真度立体声响复制解码和波束成形应用描述平均空间混叠功率和缺失的高阶高保真度立体声响复制系数的影响。从这些结果得出平衡重构的高保真度立体声响复制信号的平均频谱的容易使用的均衡滤波器:取决于所使用的解码系数和记录的信噪比SNR,估计原点处的平均功率。
从以下获得均衡滤波器:
-估计平均声场功率和来自麦克风阵列碳精盒的噪声功率之间的信噪比。
-对于每个波数k为扩散声场计算原点处的平均空间信号功率。该模拟包括所有的信号功率分量(基准、混叠和噪声)。
-均衡滤波器的频率响应从给定基准功率和所计算的原点处的平均空间信号功率的分数的平方根而形成。
-对于每个波数k将均衡滤波器的频率响应乘以得自信噪比估计的噪声最小化滤波器的传递函数(对于每个阶数n在离散有限波数k处)并乘以麦克风阵列的逆传递函数,以便得到适应的传递函数Fn,array(k)。
所得到的滤波器被应用到所记录的声场的球面谐波表示,或者被应用到重构的信号。这种滤波器的设计是计算上高度复杂的。有利地,该计算复杂的处理可以通过使用恒定滤波器设计参数的计算来减少。这些参数对于给定的麦克风阵列是常数,并且可以存储在查找表中。这便于以可管理的计算复杂度实现时变的自适应滤波器设计。有利地,该滤波器消除高频处增加的平均信号功率。此外,该滤波器平衡低频处球面谐波表示中波束形成解码器的频率响应。不使用本发明的滤波器,来自球面麦克风阵列记录的重构的声音听起来是不平衡的,因为所记录的声场的功率并没有在所有的频率子带中被正确地重构。
原则上,本发明的方法适合于处理刚性球上的球形麦克风阵列的麦克风碳精盒信号,所述方法包括以下步骤:
-将表示所述麦克风阵列的表面上的压力的所述麦克风碳精盒信号转换为球面谐波或高保真度立体声响复制表示
-使用从所述麦克风阵列记录的平面波的平均源功率|P0(k)|2和表示由所述麦克风阵列中的模拟处理产生的空间上不相关的噪声的对应的噪声功率|Pnoise(k)|2,对于每个波数k计算所述麦克风碳精盒信号的时变的信噪比SNR(k)的估计;
-使用基准、混叠和噪声信号功率分量对于每个波数k为扩散声场计算原点处的平均空间信号功率,以及根据将给定基准功率除以所述原点处的平均空间信号功率得出的值的平方根形成均衡滤波器的频率响应;
并且对于每个阶数n在离散有限波数k处,对于每个波数k将所述均衡滤波器的所述频率响应乘以得自所述时变的信噪比SNR(k)的估计的噪声最小化滤波器的传递函数,并乘以所述麦克风阵列的逆传递函数,以便得到适应的传递函数Fn,array(k)。
-使用线性滤波处理将所述适应的传递函数Fn,array(k)应用到所述球面谐波或高保真度立体声响复制表示从而得到适应的方向系数
其中,n表示高保真度立体声响复制的阶数并且索引n从0变化到有限阶N,而m表示度,并且对于每个索引n,索引m从-n变化到n,
并且其中,其中f是频率,并且csound是声音的速度。
原则上,本发明的装置适合于处理刚性球上的球形麦克风阵列的麦克风碳精盒信号,所述装置包括:
-适应于将表示所述麦克风阵列的表面上的压力的所述麦克风碳精盒信号转换为球面谐波或高保真度立体声响复制表示的部件;
-适应于使用从所述麦克风阵列记录的平面波的平均源功率|P0(k)|2和表示由所述麦克风阵列中的模拟处理产生的空间上不相关的噪声的对应的噪声功率|Pnoise(k)|2,对于每个波数k计算所述麦克风碳精盒信号的时变的信噪比SNR(k)的估计的部件;
-部件,适应于使用基准、混叠和噪声信号功率分量对于每个波数k为扩散声场计算原点处的平均空间信号功率,以及根据将给定基准功率除以所述原点处的平均空间信号功率得出的值的平方根形成均衡滤波器的频率响应;
并且对于每个阶数n在离散有限波数k处,对于每波数k将所述均衡滤波器的所述频率响应乘以得自所述时变的信噪比SNR(k)的估计的噪声最小化滤波器的传递函数,并乘以所述麦克风阵列的逆传递函数,以便得到适应的传递函数Fn,array(k);
-适应于使用线性滤波处理将所述适应的传递函数Fn,array(k)应用到所述球面谐波或高保真度立体声响复制表示从而得到适应的方向系数的部件,
其中,n表示高保真度立体声响复制的阶数并且索引n从0变化到有限阶N,而m表示度,并且对于每个索引n,索引m从-n变化到n,
并且其中,其中f是频率,并且csound是声音的速度。
在本发明的上述方法或装置中,在一个实施例中,在没有任何声音源的安静环境中获得所述噪声功率|Pnoise(k)|2以使得|P0(k)|2=0。在另一实施例中,通过比较麦克风碳精盒处的压力的期望值和麦克风碳精盒处测得的平均信号功率来从麦克风碳精盒处测得的压力pmic(Ωc,k)估计所述平均源功率|P0(k)|2。在又一实施例中,所述阵列的传递函数Fn,array(k)在频域中确定,包含:使用FFT将所述球面谐波或高保真度立体声响复制表示变换到频域,之后乘以所述传递函数Fn,array(k);对该乘积执行逆FFT以得到时域系数或者,通过时域中的FIR滤波器进行近似,包含:执行逆FFT;执行循环移位;对所得到的滤波器脉冲响应应用冲击窗以便平滑对应的传递函数;通过对于每个n和m的组合对所得到的滤波器系数和所述球面谐波或高保真度立体声响复制表示执行卷积。在又一实施例中,所述均衡滤波器的传递函数通过下式确定
其中,E表示期望值,wref(k)是波数k的基准权重,w′ref(k)是波数k的优化的基准权重,w′alias(k)是波数k的优化的混叠权重并且w′noise(k)是波数k的优化的噪声权重,据此,优化的基准权重、优化的混叠权重和优化的噪声权重分别是指使得噪声相对于在所述球形麦克风阵列中出现的噪声降低的基准权重、混叠权重和噪声权重。
附图说明
参照附图描述本发明的示例性实施例,附图中:
图1示出对于刚性球上的具有32个碳精盒的麦克风阵列,来自得到的扬声器权重的基准、混叠和噪声分量的功率;
图2示出SNR(k)=20dB的降噪滤波器;
图3示出使用传统高保真度立体声响复制解码器的跟随图2的优化滤波器的权重分量的平均功率;
图4示出使用波束成形应用了噪声优化滤波器之后的权重分量的平均功率,其中
图5示出传统高保真度立体声响复制解码器和20dB的SNR(k)的优化阵列响应;
图6示出波束成形解码器和20dB的SNR(k)的优化阵列响应;
图7示出根据本发明的自适应高保真度立体声响复制处理的框图;
图8示出使用传统高保真度立体声响复制解码应用了噪声优化滤波器Fn(k)和滤波器FEQ(k)后所得到的权重的平均功率,从而比较优化的权重、基准权重和噪声权重的功率;
图9示出使用波束成形解码器应用了噪声优化滤波器Fn(k)和滤波器FEQ(k)后权重分量的平均功率,其中从而比较优化的权重、基准权重和噪声权重的功率。
具体实施方式
球形麦克风阵列处理-高保真度立体声响复制理论
高保真度立体声响复制解码是通过假设正在辐射平面波的声场的扬声器来定义的。参见M.A.Poletti的《Three-Dimensional Surround Sound Systems Based onSpherical Harmonic》(音频工程学会杂志,2005年,53卷,第11期,第1004-1025页):
L个扬声器的布置重构存储在高保真度立体声响复制系数中的三维声场。该处理对于每个波数是单独进行的,其中f是频率,并且csound是声音的速度。索引n从0变化到有限阶N,而索引m对于每一个索引n从-n变化到n。因此,系数的总数是O=(N+1)2。扬声器位置由球面坐标系中的方向向量Ωl=[Θl,Φl]T定义,并且[·]T表示向量的转置形式。
等式(1)定义了高保真度立体声响复制系数到扬声器权重w(Ωl,k)的转换。这些权重是扬声器的驱动函数。所有扬声器权重的叠加重构声场。
解码系数描述一般的高保真度立体声响复制解码处理。这包括波束图案的共轭复数系数,如Morag Agmon、Boaz Rafaely在《Beamform-ing for a Spherical-Aperture Microphone》(IEEEI,2008年,第227-230页)的第三节以及上述M.A.Poletti的文献在第3.2节中给出的模式匹配解码矩阵的行中所示。Johann-MarkusBatke、Florian Keiler的《Using VBAP-Derived Panning Functions for 3D AmbisonicsDecoding》(2010年5月6-7日,第二届高保真度立体声响复制和球面声学国际研讨会学报,法国巴黎)的第4节中描述的另一种不同的处理方式使用基于向量的幅度平移来计算任意三维扬声器布置的解码矩阵。这些矩阵的行元素也由系数描述。
如Boaz Rafaely的《Plane-wave decomposition of the sound field on asphere by spherical convolution》(美国J.声学学会,116卷,第4期,第2149-2157页,2004年)中第3节所描述,高保真度立体声响复制系数总是可以被分解成平面波的叠加。因此,分析可以被限制在从方向Ωs入射的平面波的系数:
对于采用辐射平面波的声场的扬声器,定义平面波的系数在原点处的压力由波数k的P0(k)定义。共轭复数球面谐波表示平面波的方向系数。使用在上述M.A.Poletti的文献中给出的球面谐波的定义。
球面谐波是高保真度立体声响复制表示的正交基函数,并且满足
其中是delta脉冲。 (5)
球形麦克风阵列对球体表面上的压力进行采样,其中对于阶N的高保真度立体声响复制,采样点的数目必须等于或大于高保真度立体声响复制系数的数目O=(N+1)2。此外,采样点必须均匀地分布在球体表面上,其中仅对阶数N=1准确示出O点的最优分布。对于更高的阶,存在球体采样的良好近似,参见2007年2月1日访问的mh声学首页http://www.mhacoustics.com和F.Zotter的《Sampling Strategies for Acoustic Holography/Holophony on the Sphere》(NAG-DAGA学报,2009年3月23-26日,鹿特丹)。
对于最优采样点Ωc,等式(4)的积分等效于等式(6)的离散总和:
其中对于C≥(N+1)2,n′≤N并且n≤N,C是碳精盒的总数。
为了对于非最优采样点达到稳定的结果,共轭复数球面谐波可以替换为伪逆矩阵的列,该伪逆矩阵是从L×O的球面谐波矩阵Y获得的,其中球面谐波的O系数是Y的行元素,参见上述Moreau/Daniel/
Bertet的文献的第3.2.2节:
在下面,定义的列元素表示为使得等式(6)的正交条件也满足
其中对于C≥(N+1)2,n′≤N并且n≤N。
如果假设球形麦克风阵列已经将碳精盒几乎均匀分布在球体的表面上,并且碳精盒的数量大于O,则
成为一个有效的表达式。
球形麦克风阵列处理-对处理的模拟
刚性(硬的,固定的)球上的球形麦克风阵列的完整的HOA处理链包括估计碳精盒处的压力,计算HOA系数和解码扬声器权重。球面谐波表示中麦克风阵列的描述使得能够对于给定的解码器估计原点处的平均频谱功率。评估模式匹配高保真度立体声响复制解码器和简单的波束成形解码器的功率。使用在最佳听音位置处的估计的平均功率来设计均衡滤波器。
下面的部分描述将w(k)分解成基准权重wref(k),空间混叠权重walias(k)和噪音权重wnoise(k)。混叠是由对连续声场采样有限阶N引起的,并且噪声模拟对每个碳精盒引入的空间不相关的信号部分。对于给定的麦克风阵列,不能消除空间混叠。
球形麦克风阵列处理-对碳精盒信号的模拟
刚性球的表面上的麦克风阵列的入射平面波的传递函数定义在上述M.A.Poletti的文献的第2.2节,等式(19)中:
其中是第一类Hankel函数,并且半径r等于球体R的半径。传递函数是从将压力分散在刚性球上的物理原理(这意味着径向速度在刚性球的表面上消失)推导出的。换句话说,入射的和分散的声场的径向求导(radial derivation)的叠加是零,参见《Fourier Acoustics》一书的第6.10.3节。因此,对于从Ωs入射的平面波,在位置Ω处的球体表面上的压力由Moreau/Daniel/Bertet的文献的第3.2.1节,等式(21)给出:
添加各向同性的噪声信号Pnoise(Ωc,k)以模拟转换器噪声,其中“各向同性”是指碳精盒的噪声信号在空间上是不相关的,其不包括在时域中的相关性。该压力可以被分成对于麦克风阵列的最大阶N计算出的压力Pref(Ωc,kR)和来自剩余阶的压力,参见上述Rafaely的文献《Analysis and design...》中第7节,等式(24)。来自剩余阶的压力Palias(Ωc,kR)被称为空间混叠压力,因为麦克风阵列的阶并不足以重构这些信号分量。因此,在碳精盒c处记录的总压力被定义为:
球形麦克风阵列处理-高保真度立体声响复制编码
通过在等式(13a)中给出的对等式(11)求逆来从碳精盒处的压力获得高保真度立体声响复制系数参见上述Moreau/Daniel/Bertet的文献的第3.2.2节,等式(26)。使用等式(8)通过对球面谐波进行求逆,并且传递函数bn(kR)由它的逆进行均衡:
如等式(13b)和(13c)所示,使用等式(13a)和(12a)可以将高保真度立体声响复制系数分成基准系数混叠系数和噪声系数
球形麦克风阵列处理-高保真度立体声响复制解码
优化使用得到的原点处的扬声器权重w(k)。假设所有扬声器具有到原点的相同距离,使得在所有扬声器权重上求和得到w(k)。等式(14)从等式(1)和(13b)提供w(k),其中L是扬声器数目。
等式(14b)示出w(k)也可被分成三个权重wref(k)、walias(k)和wnoise(k)。为简单起见,这里不考虑上述Rafaely的文献《Analysis and design...》的第7节,等式(24)给出的定位误差。
在解码时,基准系数是合成地生成的n阶平面波会创建的权重。在下面的等式(15a)中,来自等式(12b)的基准压力Pref(Ωc,kR)被代入等式(14a),由此,忽略压力信号Palias(Ωc,kR)和Pnoise(Ωc,k)(即设置为零):
使用等式(8)可以消除c、n′和m′上的总和,使得等式(15a)可以被简化为来自等式(3)的高保真度立体声响复制表示中的平面波的权重的总和。因此,如果忽略混叠和噪声信号,则阶数为N的平面波的理论系数可以完美地从麦克风阵列记录重构。
得到的噪声信号wnoise(k)的权重由等式(14a)并仅使用等式(12b)中的Pnoise(Ωc,k)来给出:
在等式(14a)中代入等式(12b)的项Palias(Ωc,kR)并且忽略其它压力信号,得到:
得到的混叠权重walias(k)不能由等式(8)的正交条件得到简化,因为索引n′大于N。
混叠权重的模拟需要以足够的精度表示碳精盒信号的高保真度立体声响复制阶。在上述Moreau/Daniel/Bertet的文献的2.2.2节,等式(14)给出了对于高保真度立体声响复制声场重构的截断误差的分析。据指出,对于
可以获得声场的合理的精度,其中表示四舍五入取整到最接近的整数。该精度被用作模拟的频率上限fmax。因此,高保真度立体声响复制阶
被用于每个波数的混叠压力的模拟。这将导致频率上限处的可接受的精度,并且该精度甚至对于低频也有所增加。
球形麦克风阵列处理-对扬声器权重的分析
图1示出对于刚性球上具有32个碳精盒的麦克风阵列,来自方向Ωs=[0,0]T的平面波得到的扬声器权重的权重分量a)wref(k)、b)wnoise(k)和c)walias(k)的功率(来自上述Agmon/Rafaely的文献的E igenmike已被用于模拟)。麦克风碳精盒均匀地分布在R=4.2厘米的球体表面上,使得正交条件得到满足。这个阵列所支持的最大高保真度立体声响复制阶数N为四。根据Fliege、Ulrike Maier的《A Two-Stage Approach for ComputingCubature Formulae for the Sphere》(技术报告,多特蒙德大学数学系,德国,1996年),上述M.A.Poletti的文献中描述的模式匹配处理被用于获得与25个均匀分布的扬声器位置对应的解码系数节点序号显示在http://www.mathematik.uni-dortmund.de/lsx/rese arch/projects/fliege/nodes/nodes.html。
在整个频率范围内,基准权重wref(k)的功率是恒定的。得到的噪音权重wnoise(k)在低频显示出高功率,并在较高的频率处降低。噪声信号或功率通过具有20dB的方差(即比平面波的功率低20dB)的正态分布无偏伪随机噪声进行模拟。混叠噪声walias(k)在低频处可被忽略,但随频率上升而增加,在10kHz以上会超过基准功率。混叠功率曲线的斜率取决于平面波的方向。然而,对于所有方向,平均趋势是一致的。两个误差信号wnoise(k)和walias(k)在不同的频率范围中使基准权重失真。此外,误差信号是相互独立的。因此,提出两步骤的均衡处理。在第一步骤中,使用同一申请人在同一天提交的、并具有相同发明人的内部编号为PD110039的欧洲专利申请中描述的方法补偿噪声信号。在第二步骤中,在考虑混叠信号和所述第一处理步骤的情况下均衡整体信号功率。
在第一步骤中,对于所有入射平面波方向,最小化基准权重和失真的基准权重之间的均方误差。混叠信号walias(k)的权重被忽略,因为在已经由高保真度立体声响复制表示的阶在空间上进行频带限制后,无法校正walias(k)。这等效于时域混叠,其中该混叠不能从采样的和频带限制的时间信号中消除。
在第二步骤中,对于所有平面波方向估计重构权重的平均功率。平衡重构权重的功率到基准权重的功率的滤波器在下面描述。该滤波器仅在最佳听音位置处均衡功率。然而,混淆误差仍然干扰高频的声场表示。
麦克风阵列的空间频率限制被称为空间混叠频率。空间混叠频率
计算自碳精盒的距离(参见WO 03/061336 A1),对于具有半径R等于4.2厘米的Eigenmike,它约是5594Hz。
优化-降噪
降噪描述在上述内部编号为PD110039的欧洲专利申请中,其中估计平均声场功率和变换器噪声之间的信噪比SNR(k)。从所估计的SNR(k)可设计下列优化滤波器:
传递函数Fn(k)的参数取决于麦克风碳精盒的数目并取决于波数k的信噪比。该滤波器独立于高保真度立体声响复制解码器,这意味着它对于三维高保真度立体声响复制解码和定向波束成形是有效的。SNR(k)可从上述内部编号为PD110039的欧洲专利申请获得。该滤波器是高通滤波器,其限制低频高保真度立体声响复制表示的阶。该滤波器的截止频率对于更高的SNR(k)减小。高保真度立体声响复制阶从零到四的SNR(k)为20dB的滤波器的传递函数Fn(k)分别示于图2a-2e,其中所述传递函数对于每个阶数n具有高通特性,对于更高的阶,截止频率增加。如在上述Moreau/Daniel/Bertet的文献的第4.1.2节描述的那样,截止频率随着正则化参数λ衰减。因此,需要高的SNR(k)以对于低频获得高阶高保真度立体声响复制的系数。优化的权重w′(k)计算自:
将在下面的章节评估得到的w′noise(k)的平均功率。
优化-频谱功率均衡
优化权重w′(k)的平均功率从它的幅值期望值的平方得到。噪声权重w′noise(k)与权重w′ref(k)和w′alias(k)在空间上不相关,使得如在等式(23)中所示可以独立地计算噪声功率。基准和混叠权重的功率得自等式(23b)。等式(22)、(15a)和(17)的组合得到等式(23c),其中在等式(22)中忽略w′noise(k)。使用等式(4),平方幅值的扩展简化等式(23c)及(23d)。
E{|w′(k)|2}=E{|w′ref(k)+w′alias(k)|2}+E{|w′noise(k)|2} (23a)
优化的误差权重w′noise(k)的功率在等式(23e)中给出。在上述内部编号为PD110039的欧洲专利申请中描述E{|w′noise(k)|2}的推导。
得到的功率取决于所使用的解码处理。然而,对于传统的三维高保真度立体声响复制解码,假设所有的方向都被扬声器布置覆盖。在这种情况下,具有大于零的阶的系数通过在等式(23)中给出的解码系数的和而消除。这意味着,在原点处的压力等效于零阶信号,使得低频缺失的高阶系数不降低在最佳听音位置处的功率。
这对于高保真度立体声响复制表示的波束成形是不同的,因为只重构来自特定方向的声音。这里使用一个扬声器,使得的所有系数都对原点处的功率有贡献。因此,低频减少的高阶系数相较于高频改变权重w′(k)的功率。
这可以通过改变阶数N对于等式(24)中给出的基准权重的功率进行完美的解释:
在上述内部编号为PD110039的欧洲专利申请中提供等式(24)的推导。该功率相当于的平方幅值的总和,使得对于一个扬声器l,该功率随阶数N增加。
然而,对于高保真度立体声响复制解码,所有扬声器解码系数之和消除了高阶系数,使得只有零阶系数对最佳听音位置处的功率有贡献。因此,低频缺失的HOA系数改变用于波束成形的w′(k)的功率,但不改变用于高保真度立体声响复制解码的w′(k)的功率。
从噪声优化滤波器得到的传统高保真度立体声响复制解码的w′(k)的平均功率分量示于图3。图3b示出了基准+混叠功率,图3c示出了噪声功率,图3a示出了两者的总和。噪声功率在高达1kHz的频率处减小到-35dB。在1kHz以上,噪声功率线性增加至-10dB。得到的噪声功率在高达8kHz的频率处小于Pnoise(Ωc,k)=-20dB。在10kHz以上总功率提高10dB,这是由混叠功率引起的。在10kHz以上,麦克风阵列的HOA阶并不充分地描述半径等于R的所述球体表面上的压力分布。因此,由所获得的高保真度立体声响复制系数引起的平均功率大于基准功率。
图4示出对于L=1解码系数的w′(k)的功率分量。如上述Agmon/Rafaely的文献中所示,这可以解释为在方向Ω=[0,0]T上的波束成形。图4b示出了基准+混叠功率,图4c示出了噪声功率,并且图4a示出了两者的总和。功率从低到高频增加,从3kHz至6kHz保持几乎恒定,然后再次显著增加。第一次增加是由高阶系数的减少引起的,因为3kHz大约是图2e所示的四阶系数的截止频率Fn(k)。第二次增加是由对高保真度立体声响复制解码所讨论的空间混叠功率引起的。
现在,确定平均功率为w′(k)的均衡滤波器。该滤波器在很大程度上取决于所使用的解码系数并且因此只有如果这些解码系数是已知的才被使用。
对于传统高保真度立体声响复制解码,可以做出假设
然而,要保证所应用的高保真度立体声响复制解码器将接近实现这一假设。
在等式(26a)中给出实数均衡滤波器FEQ(k)。它将平均功率w′(k)补偿到基准功率wref(k)。在等式(26b)中使用等式(23e)和(27)来在等式(26b)显示FEQ(k)也是SNR(k)的函数。
E{|wref(k)|2}=E{|FEQ(k)(w′ref(k)+w′alias(k))|2}+E{|FEQ(k)w′noise(k)|2}
|P0(k)|2E{|w′(k)|2}=E{|w(k)|2} (27)
问题是,该滤波器FEQ(k)取决于滤波器Fn(k),使得对于SNR(k)的每个变化,必须重新设计两个滤波器。由于用于模拟混叠和基准误差E{|w′ref(k)+w′alias(k)|2}的功率的高的高保真度立体声响复制阶数,因此滤波器设计的计算复杂度高。对于自适应滤波,这一复杂度可以通过仅执行计算复杂处理一次以便对于给定的麦克风阵列创建一组恒定的滤波器设计系数来降低。在等式(28)中提供了这些滤波器系数的推导。
在等式(28)中,示出E{|w′ref(k)+w′alias(k)|2}的高度复杂的计算可以被分成n从零到N的总和以及相关的n″从n到N的总和。这些总和的每个元素都是滤波器Fn(k)乘以它的共轭复数值、与它的共轭复数值的乘积在n′和m′上的无限总和。该无限总和通过达到n′=Nmax的有限总和进行近似。这些总和的结果给出n和n″的每一种组合的恒定滤波器设计系数。这些系数对一个给定的阵列计算一次,并且可以存储在用于时变信噪比自适应滤波器设计的查找表中。
优化-优化的高保真度立体声响复制处理
在高保真度立体声响复制麦克风阵列处理的实际实现中,优化的高保真度立体声响复制系数由(29)得到,其包括对于每个阶数n和波数k的自适应传递函数和碳精盒c的总和。该总和将球体表面上的采样的压力分布转换成高保真度立体声响复制表示,并且对于宽带信号它可以在时域中执行。该处理步骤将时间域压力信号P(Ωc,t)转换为第一高保真度立体声响复制表示
在第二处理步骤中,优化的传递函数
从第一高保真度立体声响复制表示重构方向信息项。传递函数bn(kR)的倒数将转换为方向系数其中,假设采样的声场是由分散在球体表面上的平面波的叠加创建的。系数表示在上述Rafaely的文献《Plane-wave decomposition...》的第3节,等式(14)中所描述的声场的平面波分解,并且该表示基本上被用于高保真度立体声响复制信号的传输。取决于SNR(k),优化传递函数Fn(k)减小高阶系数的贡献以便消除由噪声所覆盖的HOA系数。对于已知的或假设的解码器处理,重构信号的功率由滤波器FEQ(k)进行均衡。
第二处理步骤得到与设计的时域滤波器的卷积。传统高保真度立体声响复制解码的所产生的优化阵列响应示于图5,并且波束成形解码器示例的所产生的优化阵列响应示于图6。在这两个图中,传递函数a)至e)分别对应于高保真度立体声响复制阶0至4。
系数的处理可以被视为线性滤波操作,其中滤波器的传递函数由Fn,array(k)确定。这可以在频域以及时域中进行。FFT可被用于将系数变换到频域用于传递函数Fn,array(k)的连续乘法运算。该乘积的逆FFT得到时域系数该传递函数处理也被称为使用重叠相加或重叠保留方法的快速卷积。
可替换地,所述线性滤波器可以由FIR滤波器进行近似,其系数可以通过利用逆FFT将传递函数Fn,array(k)变换到时域、执行循环移位以及对所得到的滤波器脉冲响应应用冲击窗(tapering window)以平滑对应的传递函数来从传递函数Fn,array(k)计算。然后,通过对于每个n和m的组合,进行传递函数Fn,array(k)的时域系数和系数的卷积来在时域中执行线性滤波处理。
本发明的基于自适应块的高保真度立体声响复制处理描绘在图7中。在上部信号路径中,麦克风碳精盒信号的时域压力信号P(Ωc,t)在步骤或阶段71中被使用公式(13a)转换为高保真度立体声响复制表示从而不执行被麦克风传递函数bn(kR)除的除法(由此计算而不是),而是代替地在步骤/阶段72中执行。随后步骤/阶段72在时域或频域执行所描述的线性滤波操作以便获得系数从而从中消除麦克风阵列响应。第二处理路径用于传递函数Fn,array(k)的自动自适应滤波器设计。步骤/阶段73执行对于所考虑的时间段(即,采样块)的信噪比SNR(k)的估计。该估计在频域对离散波数k的有限数量进行。因此,所关心的压力信号P(Ωc,t)必须使用例如FFT变换到频域。通过两个功率信号|Pnoise(k)|2和|P0(k)|2指定SNR(k)值。噪声信号的功率|Pnoise(k)|2对于给定的阵列是恒定的,并表示由碳精盒产生的噪声。平面波的功率|P0(k)|2是从压力信号P(Ωc,t)估计的。该估计进一步描述在上述内部编号为PD110039的欧洲专利申请中的“SNRestimation”小节。根据所估计的SNR(k),在步骤/阶段74在频域中使用等式(30)、(26c)、(21)和(10)设计n≤N的传递函数Fn,array(k)。该滤波器设计可以使用Wiener滤波器和逆阵列响应或逆传递函数1/bn(kR)。然后,滤波器实现适应于步骤/阶段72的时域或频域中的对应的线性滤波处理。
在下面讨论本发明的处理的结果。因此,来自等式(26c)的均衡滤波器FEQ(k)被应用到期望值E{|w′(k)|2}。讨论图3的传统高保真度立体声响复制解码和图4的波束成形的示例的得到的功率E{|w′(k)|2}、基准功率E{|wref(k)|2}与得到的噪声功率。传统高保真度立体声响复制解码器的得到的功率谱描绘在图8中,而波束成形解码器的所得到的功率谱描绘在图9中,其中曲线a)至c)分别示出|wopt|2、|wref|2和|wnoise|2。
基准和优化权重的功率是相同的,使得得到的权重具有平衡的频谱。相较于给定的20dB的SNR(k),在低频处,在最佳听音位置处得到的信噪比对于传统高保真度立体声响复制解码增加,但对于波束成形解码下降。在高频处两个解码器的信噪比都等于给定的SNR(k)。然而,对于波束形成解码,高频下的信噪比相对于低频下的信噪比更大,而对于高保真度立体声响复制解码器,高频下的信噪比相对于低频下的信噪比更小。波束成形解码器在低频下较小的信噪比是由缺失高阶系数引起的。在图9中,平均噪声功率相比于图1中的平均噪声功率降低。另一方面,由于缺失的高阶系数,如在“优化-频谱功率均衡”小节讨论的那样,信号功率在低频下也降低。因此,信号与噪声功率之间的距离变得更小。
此外,得到的信噪比很大程度上取决于所使用的解码系数示例的波束图案是具有很强的高阶系数的窄波束图案。产生具有更宽的波束的波束图案的解码系数可以提高信噪比。这些波束在低阶中具有很强的系数。更好的结果可以通过对于若干频带使用不同的解码系数以便适应于低频处的有限阶来实现。
存在最小化所得到的信噪比的用于优化的波束成形的其它方法,其中解码系数通过对特定的导引方向进行数值优化来获得。在Y.Shefeng、S.Haohai、U.P.Svensson、M.Xiaochuan、J.M.Hovem的《Optimal Modal Beamforming for SphericalMicrophone Arrays》(IEEE Transactions on Audio,Speech,and language processing,第19卷,第2期,第361-371页,2011年2月)中提出的最佳模式波束成形和在M.Agmon、B.Rafaely、J.Tabrikian的《Maximum Directivity Beamformer for Spherical-ApertureMicrophones》(2009 IEEE Workshop on Applcations of Signal Processing to Audioand Acoustics WASPAA′09,Proc.IEEE International Conference on Acoustics,Speech,and Signal Processing,第253-156页,2009年10月18-21日,新帕尔兹,纽约,美国)中所讨论的最大方向性波束成形是优化的波束成形的两个示例。
该示例性的高保真度立体声响复制解码器使用模式匹配处理,其中,根据波束成形示例中使用的解码系数计算每个扬声器权重。Ωc处扬声器的解码系数由定义,因为扬声器均匀分布在球体表面上。扬声器信号具有与用于波束成形解码器示例的相同的SNR。然而,一方面,原点处扬声器信号的叠加导致极好的SNR。另一方面,如果收听位置移出最佳听音位置,SNR变得更低。
该结果表明,所描述的优化对于传统高保真度立体声响复制解码器产生在原点具有增加的SNR的均衡频谱,即,本发明的时变自适应滤波器设计对于高保真度立体声响复制记录是有利的。如果记录的SNR可以假设为随时间恒定,本发明的处理也可用于设计不随时间变化的滤波器。
对于波束成形解码器,本发明的处理可以平衡得到的频谱,缺点是低频处的低SNR。可以通过选择产生更宽的波束的适当的解码系数,或通过在不同的频率子带的高保真度立体声响复制阶上调整波束宽度来提高该SNR。
本发明适用于球面谐波表示中的所有球形麦克风记录,其中在原点处再现的频谱功率由于混叠或缺失球面谐波系数而不平衡。
Claims (10)
1.一种用于处理刚性球上的球形麦克风阵列的麦克风碳精盒信号(P(Ωc,t))的方法,所述方法包括以下步骤:
-将表示在所述麦克风阵列的表面上的压力的所述麦克风碳精盒信号(P(Ωc,t))转换(71)为球面谐波或高保真度立体声响复制表示
-使用从所述麦克风阵列记录的平面波的平均源功率|P0(k)|2和表示由所述麦克风阵列中的模拟处理产生的空间上不相关的噪声的对应的噪声功率|Pnoise(k)|2,对于每个波数k计算(73)所述麦克风碳精盒信号(P(Ωc,t))的时变的信噪比SNR(k)的估计;
-使用基准、混叠和噪声信号功率分量对于每个波数k为扩散声场计算(74)原点处的平均空间信号功率,
以及根据将给定基准功率除以所述原点处的平均空间信号功率得出的值的平方根形成(74)均衡滤波器的频率响应,
并且对于每个阶数n在离散有限波数k处,对于每个波数k将所述均衡滤波器的所述频率响应乘以(74)得自所述时变的信噪比SNR(k)的估计的噪声最小化滤波器的传递函数,并乘以所述麦克风阵列的逆传递函数,以便得到适应的传递函数Fn,array(k);
-使用线性滤波处理将所述适应的传递函数Fn,array(k)应用(72)到所述球面谐波或高保真度立体声响复制表示从而产生适应的方向系数
其中,n表示高保真度立体声响复制的阶数并且索引n从0变化到有限阶N,而m表示度,并且对于每个索引n,索引m从-n变化到n,
并且其中,其中f是频率,并且csound是声音的速度。
2.根据权利要求1所述的方法,其中在没有任何声音源的安静环境中获得所述噪声功率|Pnoise(k)|2以使得|P0(k)|2=0。
3.根据权利要求1或2所述的方法,其中通过比较麦克风碳精盒处的压力的期望值和麦克风碳精盒处测得的平均信号功率来从麦克风碳精盒处测得的压力pmic(Ωc,k)估计所述平均源功率|P0(k)|2。
4.根据权利要求1或2所述的方法,其中所述阵列的传递函数Fn,array(k) 在频域中确定,包含:
-使用FFT将所述球面谐波或高保真度立体声响复制表示变换到频域,之后乘以所述传递函数Fn,array(k);
-对该乘积执行逆FFT以得到时域系数
或者,通过时域中的FIR滤波器进行近似,包含:
--执行逆FFT;
--执行循环移位;
--对所得到的滤波器脉冲响应应用冲击窗以便平滑对应的传递函数;
--通过对于每个n和m的组合对所得到的滤波器系数和所述球面谐波或高保真度立体声响复制表示执行卷积。
5.根据权利要求1或2所述的方法,其中所述均衡滤波器的传递函数通过下式确定:
,
其中,E表示期望值,wref(k)是波数k的基准权重,w′ref(k)是波数k的优化的基准权重,w′alias(k)是波数k的优化的混叠权重并且w′noise(k)是波数k的优化的噪声权重,据此,优化的基准权重、优化的混叠权重和优化的噪声权重分别是指使得噪声相对于在所述球形麦克风阵列中出现的噪声降低的基准权重、混叠权重和噪声权重。
6.一种用于处理刚性球上的球形麦克风阵列的麦克风碳精盒信号(P(Ωc,t))的装置,所述装置包括:
-适应于将表示所述麦克风阵列的表面上的压力的所述麦克风碳精盒信号(P(Ωc,t))转换为球面谐波或高保真度立体声响复制表示的部件(71);
-适应于使用从所述麦克风阵列记录的平面波的平均源功率|P0(k)|2和表示由所述麦克风阵列中的模拟处理产生的空间上不相关的噪声的对应的噪声功率|Pnoise(k)|2,对于每个波数k计算所述麦克风碳精盒信号(P(Ωc,t))的时变的信噪比SNR(k)的估计的部件(73);
-部件(74),适应于使用基准、混叠和噪声信号功率分量对于每个波数k为扩散声场计算原点处的平均空间信号功率,
以及根据将给定基准功率除以所述原点处的平均空间信号功率得出的值的平方根形成均衡滤波器的频率响应,
并且对于每个阶数n在离散有限波数k处,对于每个波数k将所述均衡滤波器的所述频率响应乘以得自所述时变的信噪比SNR(k)的估计的噪声最小化滤波器的传递函数,并乘以所述麦克风阵列的逆传递函数,以便得到适应的传递函数Fn,array(k);
-适应于使用线性滤波处理将所述适应的传递函数Fn,array(k)应用到所述球面谐波或高保真度立体声响复制表示从而得到适应的方向系数的部件(72),
其中,n表示高保真度立体声响复制的阶次并且索引n从0变化到有限阶N,而m表示度,并且对于每个索引n,索引m从-n变化到n,
并且其中,其中f是频率,并且csound是声音的速度。
7.根据权利要求6所述的装置,其中在没有任何声音源的安静环境中获得所述噪声功率|Pnoise(k)|2以使得|P0(k)|2=0。
8.根据权利要求6或7所述的装置,其中通过比较麦克风碳精盒处的压力的期望值和麦克风碳精盒处测得的平均信号功率来从麦克风碳精盒处测得的压力pmic(Ωc,k)估计所述平均源功率|P0(k)|2。
9.根据权利要求6或7所述的装置,其中所述阵列的传递函数Fn,array(k)在频域中确定,包含:
-使用FFT将所述球面谐波或高保真度立体声响复制表示变换到频域,之后乘以所述传递函数Fn,array(k);
-对该乘积执行逆FFT以得到时域系数
或者,通过时域中的FIR滤波器进行近似,包含:
--执行逆FFT;
--执行循环移位;
--对所得到的滤波器脉冲响应应用冲击窗以便平滑对应的传递函数;
--对每个n和m的组合,对所得到的滤波器系数和所述球面谐波或高保真度立体声响复制表示执行卷积。
10.根据权利要求6或7所述的装置,其中所述均衡滤波器的传递函 数通过下式确定:
,
其中,E表示期望值,wref(k)是波数k的基准权重,w′ref(k)是波数k的优化的基准权重,w′alias(k)是波数k的优化的混叠权重并且w′noise(k)是波数k的优化的噪声权重,据此,优化的基准权重、优化的混叠权重和优化的噪声权重分别是指使得噪声相对于在所述球形麦克风阵列中出现的噪声降低的基准权重、混叠权重和噪声权重。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP11306472.9 | 2011-11-11 | ||
EP11306472.9A EP2592846A1 (en) | 2011-11-11 | 2011-11-11 | Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field |
PCT/EP2012/071537 WO2013068284A1 (en) | 2011-11-11 | 2012-10-31 | Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104041074A CN104041074A (zh) | 2014-09-10 |
CN104041074B true CN104041074B (zh) | 2017-04-12 |
Family
ID=47216219
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280066109.4A Active CN104041074B (zh) | 2011-11-11 | 2012-10-31 | 处理用于产生声场的高保真度立体声响复制表示的刚性球上的球形麦克风阵列的信号的方法和装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9420372B2 (zh) |
EP (2) | EP2592846A1 (zh) |
JP (1) | JP6113739B2 (zh) |
KR (1) | KR101957544B1 (zh) |
CN (1) | CN104041074B (zh) |
WO (1) | WO2013068284A1 (zh) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10021508B2 (en) | 2011-11-11 | 2018-07-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field |
EP2592845A1 (en) * | 2011-11-11 | 2013-05-15 | Thomson Licensing | Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field |
US9495968B2 (en) | 2013-05-29 | 2016-11-15 | Qualcomm Incorporated | Identifying sources from which higher order ambisonic audio data is generated |
US9466305B2 (en) | 2013-05-29 | 2016-10-11 | Qualcomm Incorporated | Performing positional analysis to code spherical harmonic coefficients |
US10078006B2 (en) * | 2013-07-22 | 2018-09-18 | Brüel & Kjær Sound & Vibration Measurement A/S | Wide-band acoustic holography |
US20150127354A1 (en) * | 2013-10-03 | 2015-05-07 | Qualcomm Incorporated | Near field compensation for decomposed representations of a sound field |
DK2863654T3 (en) * | 2013-10-17 | 2018-10-22 | Oticon As | Method for reproducing an acoustic sound field |
EP2879408A1 (en) * | 2013-11-28 | 2015-06-03 | Thomson Licensing | Method and apparatus for higher order ambisonics encoding and decoding using singular value decomposition |
WO2015101915A2 (en) | 2013-12-31 | 2015-07-09 | Distran Gmbh | Acoustic transducer array device |
US9489955B2 (en) | 2014-01-30 | 2016-11-08 | Qualcomm Incorporated | Indicating frame parameter reusability for coding vectors |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
US9852737B2 (en) * | 2014-05-16 | 2017-12-26 | Qualcomm Incorporated | Coding vectors decomposed from higher-order ambisonics audio signals |
US20150332682A1 (en) * | 2014-05-16 | 2015-11-19 | Qualcomm Incorporated | Spatial relation coding for higher order ambisonic coefficients |
US9620137B2 (en) | 2014-05-16 | 2017-04-11 | Qualcomm Incorporated | Determining between scalar and vector quantization in higher order ambisonic coefficients |
EP2988527A1 (en) | 2014-08-21 | 2016-02-24 | Patents Factory Ltd. Sp. z o.o. | System and method for detecting location of sound sources in a three-dimensional space |
US9747910B2 (en) | 2014-09-26 | 2017-08-29 | Qualcomm Incorporated | Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework |
CN105072557B (zh) * | 2015-08-11 | 2017-04-19 | 北京大学 | 一种三维环绕声重放***的扬声器环境自适应校准方法 |
JP6606784B2 (ja) * | 2015-09-29 | 2019-11-20 | 本田技研工業株式会社 | 音声処理装置および音声処理方法 |
US10206040B2 (en) | 2015-10-30 | 2019-02-12 | Essential Products, Inc. | Microphone array for generating virtual sound field |
RU2687882C1 (ru) | 2016-03-15 | 2019-05-16 | Фраунхофер-Гезеллшафт Цур Фёрдерунг Дер Ангевандтен Форшунг Е.В. | Устройство, способ формирования характеристики звукового поля и машиночитаемый носитель информации |
WO2018053050A1 (en) * | 2016-09-13 | 2018-03-22 | VisiSonics Corporation | Audio signal processor and generator |
EP3520437A1 (en) * | 2016-09-29 | 2019-08-07 | Dolby Laboratories Licensing Corporation | Method, systems and apparatus for determining audio representation(s) of one or more audio sources |
FR3060830A1 (fr) * | 2016-12-21 | 2018-06-22 | Orange | Traitement en sous-bandes d'un contenu ambisonique reel pour un decodage perfectionne |
WO2018157098A1 (en) * | 2017-02-27 | 2018-08-30 | Essential Products, Inc. | Microphone array for generating virtual sound field |
EP3625974B1 (en) | 2017-05-15 | 2020-12-23 | Dolby Laboratories Licensing Corporation | Methods, systems and apparatus for conversion of spatial audio format(s) to speaker signals |
JP7190279B2 (ja) | 2018-08-10 | 2022-12-15 | 三栄源エフ・エフ・アイ株式会社 | チーズソース |
CN109275084B (zh) * | 2018-09-12 | 2021-01-01 | 北京小米智能科技有限公司 | 麦克风阵列的测试方法、装置、***、设备和存储介质 |
JP6969793B2 (ja) | 2018-10-04 | 2021-11-24 | 株式会社ズーム | アンビソニックスのためのa/bフォーマット変換装置、a/bフォーマット変換ソフトウェア、レコーダー、再生ソフトウェア |
CN111193990B (zh) * | 2020-01-06 | 2021-01-19 | 北京大学 | 一种抗高频空间混叠的3d音频***及实现方法 |
US11489505B2 (en) | 2020-08-10 | 2022-11-01 | Cirrus Logic, Inc. | Methods and systems for equalization |
CN115002640A (zh) * | 2021-10-21 | 2022-09-02 | 杭州爱华智能科技有限公司 | 传声器的声场特性转换方法与电容型测试传声器*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1737271A1 (en) * | 2005-06-23 | 2006-12-27 | AKG Acoustics GmbH | Array microphone |
CN101548554A (zh) * | 2006-10-06 | 2009-09-30 | 彼得·G·克拉文 | 麦克风阵列 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7123727B2 (en) * | 2001-07-18 | 2006-10-17 | Agere Systems Inc. | Adaptive close-talking differential microphone array |
US20030147539A1 (en) | 2002-01-11 | 2003-08-07 | Mh Acoustics, Llc, A Delaware Corporation | Audio system based on at least second-order eigenbeams |
US7558393B2 (en) * | 2003-03-18 | 2009-07-07 | Miller Iii Robert E | System and method for compatible 2D/3D (full sphere with height) surround sound reproduction |
EP1931169A4 (en) * | 2005-09-02 | 2009-12-16 | Japan Adv Inst Science & Tech | POST-FILTER FOR A MICROPHONE MATRIX |
GB0906269D0 (en) * | 2009-04-09 | 2009-05-20 | Ntnu Technology Transfer As | Optimal modal beamformer for sensor arrays |
EP2592845A1 (en) | 2011-11-11 | 2013-05-15 | Thomson Licensing | Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field |
US9197962B2 (en) * | 2013-03-15 | 2015-11-24 | Mh Acoustics Llc | Polyhedral audio system based on at least second-order eigenbeams |
-
2011
- 2011-11-11 EP EP11306472.9A patent/EP2592846A1/en not_active Withdrawn
-
2012
- 2012-10-31 KR KR1020147015683A patent/KR101957544B1/ko active IP Right Grant
- 2012-10-31 JP JP2014540396A patent/JP6113739B2/ja active Active
- 2012-10-31 US US14/356,265 patent/US9420372B2/en active Active
- 2012-10-31 CN CN201280066109.4A patent/CN104041074B/zh active Active
- 2012-10-31 WO PCT/EP2012/071537 patent/WO2013068284A1/en active Application Filing
- 2012-10-31 EP EP12788472.4A patent/EP2777298B1/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1737271A1 (en) * | 2005-06-23 | 2006-12-27 | AKG Acoustics GmbH | Array microphone |
CN101548554A (zh) * | 2006-10-06 | 2009-09-30 | 彼得·G·克拉文 | 麦克风阵列 |
Also Published As
Publication number | Publication date |
---|---|
CN104041074A (zh) | 2014-09-10 |
KR20140089601A (ko) | 2014-07-15 |
JP6113739B2 (ja) | 2017-04-12 |
JP2014535232A (ja) | 2014-12-25 |
US20140307894A1 (en) | 2014-10-16 |
EP2777298A1 (en) | 2014-09-17 |
US9420372B2 (en) | 2016-08-16 |
KR101957544B1 (ko) | 2019-03-12 |
EP2592846A1 (en) | 2013-05-15 |
EP2777298B1 (en) | 2016-03-16 |
WO2013068284A1 (en) | 2013-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104041074B (zh) | 处理用于产生声场的高保真度立体声响复制表示的刚性球上的球形麦克风阵列的信号的方法和装置 | |
CN103931211B (zh) | 处理刚性球上的球面麦克风阵列的信号的方法及装置 | |
Betlehem et al. | Theory and design of sound field reproduction in reverberant rooms | |
Jin et al. | Design, optimization and evaluation of a dual-radius spherical microphone array | |
CN106658343A (zh) | 用于渲染音频声场表示以供音频回放的方法和设备 | |
CN103856866B (zh) | 低噪微分麦克风阵列 | |
KR20130102566A (ko) | 스피커를 통한 오디오에 대한 스펙트럼적으로 채색되지 않은 최적의 크로스토크 제거 | |
Tylka et al. | Fundamentals of a parametric method for virtual navigation within an array of ambisonics microphones | |
Sakamoto et al. | Sound-space recording and binaural presentation system based on a 252-channel microphone array | |
KR20140106545A (ko) | 컴퓨팅적으로 효율적인 광대역 필터-및-합계 어레이 포커싱 | |
US10021508B2 (en) | Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an ambisonics representation of the sound field | |
WO2018053050A1 (en) | Audio signal processor and generator | |
Støfringsdal et al. | Conversion of discretely sampled sound field data to auralization formats | |
EP2757811B1 (en) | Modal beamforming | |
Tuna et al. | Data-driven local average room transfer function estimation for multi-point equalization | |
Kordon et al. | Optimization of spherical microphone array recordings | |
Tenenbaum et al. | Virtual reality: A new approach to validate computer modeling auralizations by using articulation indexes | |
Morena | Sound source directivity interpolation with physics-informed neural networks | |
Routray et al. | Sparsity-driven loudspeaker gain optimization for sound field reconstruction with spherical microphone array | |
CN113766396A (zh) | 扬声器控制 | |
Lokki et al. | Spatial Sound and Virtual Acoustics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20160711 Address after: Amsterdam Applicant after: Dolby International AB Address before: I Si Eli Murli Nor, France Applicant before: Thomson Licensing SA |
|
GR01 | Patent grant | ||
GR01 | Patent grant |