CN101977349A - Ambisonic声重发***解码的优化改进方法 - Google Patents
Ambisonic声重发***解码的优化改进方法 Download PDFInfo
- Publication number
- CN101977349A CN101977349A CN2010102989354A CN201010298935A CN101977349A CN 101977349 A CN101977349 A CN 101977349A CN 2010102989354 A CN2010102989354 A CN 2010102989354A CN 201010298935 A CN201010298935 A CN 201010298935A CN 101977349 A CN101977349 A CN 101977349A
- Authority
- CN
- China
- Prior art keywords
- theta
- sigma
- phi
- function
- optimization
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Stereophonic System (AREA)
Abstract
本发明为Ambisonic声重发***解码的优化改进方法,根据声像定位原理,通过计算速度矢量和声能流矢量及虚拟声像的响度,分别建立方向优化目标函数、响度优化目标函数和清晰度优化目标函数,并在综合优化目标函数中引入控制虚拟传声器指向性的幅值优化目标函数;根据声重发扬声器阵列的布置,采用优化算法,通过迭代运算确定具有最优适应度值的综合优化目标函数,获得最优解码结果;控制虚拟传声器指向性的幅值优化目标函数的引入,可获得各扬声器信号同相的解码结果,最大程度地降低重发声音在空间方向上的混淆,且优化收敛速度加快,运算时间缩短;适用于任意阶、任意扬声器数量和布置方式的Ambisonic声重发***的解码过程。
Description
技术领域
本发明涉及Ambisonic多通路三维声重发***解码技术的改进,具体是指利用合成虚拟传声器及其指向性控制技术,对基于矢量合成原理的Ambisonic声重发***解码方法进行优化改进,提高虚拟声像的合成精度,改善Ambisonic***的声重发质量。
背景技术
平面波可由一系列正交球谐函数进行分解和重构。使用球谐函数对平面波进行分解和重构是Ambisonic声重发***的理论基础。球谐函数的阶数越高,分解或重构的精度就越高。使用球谐函数对s信号平面波S(θS,φS)进行采样,可得到原始Ambisonic编码信号
式中,m为球谐函数阶数,m≥0,0≤n≤m,σ=±1,θS和φS为平面波s的水平入射角和垂直入射角。利用一定数量的扬声器组成特定阵列,同时将Ambisonic编码信号分配以不同的权重并重新组合,输送给不同位置的扬声器,可在扬声器阵列中心处重构出平面波S(θS,φS)。输送给方位角度为(θj,φj)的第j个扬声器的重发信号gj可以由式(2)得到,其中是对应第j个扬声器的编码信号的权重系数组,且
其中,M为用于计算的球谐函数截止阶数。如何根据扬声器阵列的特定布置形式,来得到合适的使得在阵列中心处重构出的虚拟声像最接近原始平面波信号S(θS,φS)的过程,就是Ambisonic声重发***的解码过程。
Gerzon以人类听觉***对多声源合成虚拟声像的心理声学研究为基础提出的矢量合成原理,被应用于Ambisonic声重发***解码过程。不同方向入射的原始声信号,在人的听觉***中可产生不同方向的真实声像。Gerzon认为,只要这个虚拟声像与真实声像方向一致、响度相同且具有清晰的声像,即可认为是对原信号的精确重构。因此Ambisonic声重发***的关键是权重系数组的确定。为此,首先需针对特定的扬声器阵列,分别根据低频域和高频域合成虚拟声像的心理声学原理,计算出虚拟声像的方向、响度和清晰度等数据,进而利用***优化理论,建立优化目标函数,通过计算机优化程序来比较不同权重系数组的适应度值,最终获得优化的解码结果。
Craven和Wiggins曾基于该方法并使用4阶球谐函数分别对ITU格式的水平多扬声器重发***进行优化,前者使用共轭梯度优化方法,后者以前者的优化结果作为初始值,使用禁忌搜索法进行优化运算。Craven的解码结果显示,虚拟声像的质量除前方三扬声器之间的范围较为稳定和精确外,侧向和后方虚拟声像的稳定性较差,虚拟声像的方向也不太精确。相对而言,Wiggins的解码结果,在虚拟声像的稳定性和精确性方面均较好。但两者的研究都只针对IUT格式的水平面声重发***,没有对其他类型的***进行讨论。David Moore和P.W.M Tsang也公布了他们对如何改进搜索算法以改进1阶Ambisonic***优化的研究,但未见有高于1阶***的研究报道。且其对搜索算法本身的研究,并未涉及声音控制,且不能有效解决在优化过程中,由于高频域声能流矢量的引入所导致的非线性优化难以得到全局最优解,以及计算耗时长的问题。
发明内容
本发明的目的在于克服现有基于虚拟声像矢量合成原理的Ambisonic声重发***解码方法的不足,提供一种基于声音控制,利用虚拟传声器指向性控制技术的Ambisonic声重发***解码的优化改进方法,提高虚拟声像的合成精度,改善Ambisonic***的声重发质量。。
本发明采用以下技术方案来实现上述目的:
本Ambisonic声重发***解码的优化改进方法,包括以下步骤:
步骤1:根据声像定位原理,分别求出决定低频段和高频段虚拟声像定位质量的速度矢量rV和声能流矢量rE;
步骤2:根据声像定位原理,计算虚拟声像在低频段的响度VLi和高频段的响度VHi;
步骤3:理想情况下,Ambisonic***声重发时所产生的虚拟声像,应与对应方向的真实声像方向一致、响度相同,同时声像清晰。由此分别建立方向优化目标函数Afit、响度优化目标函数Lfit和清晰度优化目标函数Mfit;
步骤4:建立虚拟传声器指向性控制的优化目标函数Cfit;
步骤5:合成综合优化目标函数Tfit;
步骤6:结合Ambisonic声重发***中扬声器的位置,采用优化算法,通过迭代运算求出具有最优的综合优化目标函数Tfit适应度值,其所对应的球谐函数权重系数组即为最优解码结果。
与现有技术相比,本发明具有以下的优点及有益效果:
1)引入用于控制虚拟传声器指向性的幅值优化目标函数Cfit。具有没有旁瓣的单一瓣状指向性特征的虚拟传声器,可抑制来自与对应重发扬声器不同方向的声音,最大程度地降低重发声音在空间方向感上的混淆;
2)解码结果可使得各扬声器信号同相(in phase),这最大程度保证了声重发***的自然音色和最大可闻域,特别适合多人聆听,或头部有转动情况的声重发应用。
3)引入Cfit后,优化目标更为明确,优化目标函数的收敛速度加快,运算时间大大缩短。
4)新的优化改进方法对任意阶数、任意扬声器数量和布置方式的Ambisonic***均适用。其中,对于非对称扬声器布置方式的Ambisonic***,可通过独立调整非对称分布的重发扬声器所对应的不同合成虚拟传声器的指向性,引导优化程序以较快速度获取解码结果。
5)本发明所提出的由球谐函数合成虚拟传声器指向性控制方法,只与球谐函数本身有关,与采用何种声像定位判据无关。因此,本发明提出的合成虚拟传声器指向性控制方法亦可与其他任何声像定位判据理论,如基于人头传输函数的声像定位原理等相结合,对Ambisonic***进行解码。
6)本发明解决了现有技术在使用矢量合成原理进行Ambisonic解码过程中出现的非线性优化很难得到全局最优解的问题;克服了优化计算时虽然综合评价目标函数值较好,但合成虚拟传声器指向性不理想,从而导致声重发时前后声像混淆的物理性错误结果。
附图说明
图1是合成虚拟传声器的指向性参量示意图;
图2是本发明的流程图;
图3是优化流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
球谐函数可被看作是具有特定指向性的虚拟传声器。此时,Ambisonic***的编码过程可看作是使用多个球谐函数虚拟传声器对原始声波的捡拾过程。声重发时,馈给每个扬声器的重发信号可由这些虚拟传声器所拾取的信号按权重系数叠加得到,叠加后产生一个具有新指向性的合成虚拟传声器SVM,反相后对应于重发扬声器阵列中的一个扬声器。
如果某一合成虚拟传声器SVM的指向性不理想,则在声重发时,所捡拾到的各方向的声音都将被叠加并通过某一扬声器重发,在物理意义和主观感觉上都造成声音前后方向混淆的错误。若虚拟传声器SVM对其它方向,特别是后方声音的抑制能力很强,声重发时可在很大程度上解决声重发时容易出现的声音前后方向混淆的问题。因此,利用球谐函数虚拟传声器阵列来产生的合成虚拟传声器SVM,其指向性是否理想,将严重影响对原始声场进行空间捡拾的质量,同时影响声重发时的主观聆听效果。
本发明通过建立虚拟传声器指向性控制目标函数Cfit,有效地控制了合成虚拟传声器SVM的指向性。
如图1,假设虚拟传声器轴线指向的方位角为(θAim,φAim),其水平和垂直的有效覆盖角度为Δθ和Δφ,计算覆盖角的起始角度分别为θ1、θ2,和φ1、φ2,且θ1<θ2、φ1<φ2。则在理想状态下,该虚拟传声器对其有效覆盖范围外的声音应该有很好的抑制能力。传声器对某方向声音捡拾能力的强弱由幅值rM(θ,φ)表示,rM(θ,φ)≥0。虚拟传声器的指向性应在以下三个方面受到有效控制:
(1)虚拟传声器的轴线指向,即方位角(θAim,φAim);
(2)虚拟传声器的有效覆盖角度,即水平和垂直覆盖角度Δθ和Δφ;
(3)虚拟传声器有效覆盖范围外的声音接受能力应能受到最大程序的抑制。
为达到上述控制目标,应用幅值比较法,建立幅值比较优化目标函数Cfit,将传声器有效覆盖范围外的幅值之和,除以有效覆盖范围内的幅值之和,考虑到θ和φ在针对Ambisonic***的球坐标的定义,即-180°≤θ≤180°,-90°≤φ≤90°,有:
(1)在θ1<θAim<θ2,和Δφ≤180°情况下:
(2)在θ1<θAim<θ2,和Δφ≤180°情况下:
(3)在θAim<θ1或θAim>θ2,和Δφ≤180°情况下:
(4)在θAim<θ1或θAim>θ2,和Δφ≤180°情况下:
rM(θ,φ)相当于所有扬声器在方位角为(θ,φ)的方向上信号电平合值的绝对值,如下式:
式(7)中,k代表Ambisonic***中扬声器的总数,扬声器的重发信号gj可以由式(1)和(2)得到,函数为球谐函数,为球谐函数的权重系数组。显然,对采用任意m阶球谐函数进行编解码的m阶Ambisonic***,式(3)到式(7)均适用。
在任何情况下,都必须使得Cfit有最小值(理想状态下,Cfit=0),即在尽量减弱传声器对有效覆盖范围外声音捡拾能力的同时,将对有效覆盖范围内的声音的捡拾能力最大化,达到对虚拟传声器的指向性进行控制的目的,此时可获取较为理想的虚拟传声器指向特性。
本发明的实现步骤及具体方案如下(见附图2):
步骤1:根据声像定位原理,分别求出决定低频段和高频段虚拟声像定位质量的速度矢量rV和声能流矢量rE,以便进行虚拟声像与真实声像的对比。
rV和rE的方向,即虚拟声像的方向角,由θVi和φVi、θEi和φEi表示。其中,θVi和φVi为低频段虚拟声像的水平角和垂直角,θEi和φEi则为高频段虚拟声像的水平角和垂直角。rV和rE的幅值在物理意义上可代表虚拟声像的清晰度。以Gerzon的矢量合成声像定位原理为例,这些角度可由式(8)~(11)计算:
与某一空间方向上的真实声源相对应的低频段和高频段虚拟声像清晰度评价值rVi和rEi由式(12)~(13)求得
步骤2:根据声像定位原理,分别计算虚拟声像在低频段和高频段的响度参量VLi和VHi。以Gerzon的矢量合成声像定位原理为例,VLi和VHi可由式(14)~(15)计算:
用Ambisonic***声重发时,可通过同步调节Ambisonic***各扬声器输入信号的大小,控制虚拟声像的声级。
步骤3:理想情况下,Ambisonic***声重发时所产生的虚拟声像,与对应方向的真实声像在方向、响度和清晰度上相同,由此分别建立方向优化目标函数Afit、响度优化目标函数Lfit和清晰度优化目标函数Mfit。
定义空间方向上的真实声源的水平角度和垂直角度分别为θOi和φOi,以Gerzon的矢量合成声像定位原理为例,则有:
rVi=rEi=1 (16)
θVi=θEi=θOi (17)
φVi=φEi=φOi (18)
此外,当同一声音在不同的空间方向出现时,与其相对应的各个方向的虚拟声像的响度均应相同,由此有:
VLi=VL0 (19)
VHi=VH0 (20)
根据式(19)到(23),结合***优化理论,即可建立相关的方向优化目标函数Afit、响度优化目标函数Lfit和清晰度优化目标函数Mfit。
其中,n表示虚拟声像在空间不同方向采样数。。
步骤4:建立由式(3)到(7)所计算的虚拟传声器指向性控制的优化目标函数Cfit;
步骤5:合成综合优化目标函数Tfit;
综合优化目标函数Tfit为:
Tfit=b1·Afit+b2·Lfit+b3·Mfit+b4·Cfit (24)
式中,bj(j=1,2,3,4)为优化目标函数在总优化目标函数中所占的权重,且0≤bj≤1。当Tfit有最小值时,表明Ambisonic***所产生的虚拟声音与真实声音在主观感觉上最接近,此时***达到最优;
步骤6:结合综合优化目标函数Tfit以及具体的Ambisonic***重发扬声器阵列,采用优化算法,通过迭代运算计算最优优化目标函数Tfit的适应度值,其所对应的球谐函数权重系数组即为最优解码结果。优化计算流程如附图3所示。优化算法可以选用差分法、遗传算法、共轭梯度法、模拟退火法或禁忌搜索算法等。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (5)
1.Ambisonic声重发***解码的优化改进方法,其特征在于,包括以下步骤:
步骤1:根据声像定位原理,分别求出决定低频段和高频段虚拟声像定位质量的速度矢量rV和声能流矢量rE;
步骤2:根据声像定位原理,计算虚拟声像在低频段和高频段的响度控制参量VLi和VHi;
步骤3:理想情况下,Ambisonic***声重发时所产生的虚拟声像,与对应方向的真实声像在方向、响度和清晰度上相同。由此分别建立方向优化目标函数Afit、响度优化目标函数Lfit和清晰度优化目标函数Mfit;
步骤4:建立虚拟传声器指向性控制的优化目标函数Cfit;
步骤5:建立综合优化目标函数Tfit;
2.根据权利要求1所述的Ambisonic声重发***解码的优化改进方法,其特征在于,步骤3所述方向优化目标函数Afit、响度优化目标函数Lfit和清晰度优化目标函数Mfit分别为:
其中,n表示虚拟声像在空间不同方向采样数。
3.根据权利要求1所述的Ambisonic声重发***解码的优化改进方法,其特征在于,步骤5所述综合优化目标函数Tfit为:
Tfit=b1·Afit+b2·Lfit+b3·Mfit+b4·Cfit
其中,bj(j=1,2,3,4)是不同的优化目标函数在综合优化目标函数中所占的权重,且0≤bj≤1。
5.根据权利要求1所述的Ambisonic声重发***解码的优化改进方法,其特征在于,步骤6所述优化算法可采用差分法、遗传算法、共轭梯度法、模拟退火法或禁忌搜索算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102989354A CN101977349A (zh) | 2010-09-29 | 2010-09-29 | Ambisonic声重发***解码的优化改进方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102989354A CN101977349A (zh) | 2010-09-29 | 2010-09-29 | Ambisonic声重发***解码的优化改进方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101977349A true CN101977349A (zh) | 2011-02-16 |
Family
ID=43577187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102989354A Pending CN101977349A (zh) | 2010-09-29 | 2010-09-29 | Ambisonic声重发***解码的优化改进方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101977349A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2623886C2 (ru) * | 2012-12-12 | 2017-06-29 | Долби Интернэшнл Аб | Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля |
CN107147975A (zh) * | 2017-04-26 | 2017-09-08 | 北京大学 | 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法 |
US9838822B2 (en) | 2013-03-22 | 2017-12-05 | Dolby Laboratories Licensing Corporation | Method and apparatus for enhancing directivity of a 1st order ambisonics signal |
CN105340008B (zh) * | 2013-05-29 | 2019-06-14 | 高通股份有限公司 | 声场的经分解表示的压缩 |
CN110099351A (zh) * | 2019-04-01 | 2019-08-06 | 中车青岛四方机车车辆股份有限公司 | 一种声场回放方法、装置和*** |
US10499176B2 (en) | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
-
2010
- 2010-09-29 CN CN2010102989354A patent/CN101977349A/zh active Pending
Non-Patent Citations (1)
Title |
---|
《华南理工大学博士学位论文》 20091121 龚惠哲 Ambisonic声重发***的优化改进 第20-31页 1-5 , 2 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10609501B2 (en) | 2012-12-12 | 2020-03-31 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
CN109545235B (zh) * | 2012-12-12 | 2023-11-17 | 杜比国际公司 | 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备 |
US10038965B2 (en) | 2012-12-12 | 2018-07-31 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
CN109545235A (zh) * | 2012-12-12 | 2019-03-29 | 杜比国际公司 | 对声场的高阶立体混响表示进行压缩和解压缩的方法和设备 |
US10257635B2 (en) | 2012-12-12 | 2019-04-09 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
US11546712B2 (en) | 2012-12-12 | 2023-01-03 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
US11184730B2 (en) | 2012-12-12 | 2021-11-23 | Dolby Laboratories Licensing Corporation | Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field |
RU2623886C2 (ru) * | 2012-12-12 | 2017-06-29 | Долби Интернэшнл Аб | Способ и устройство для сжатия и восстановления представления системы амбисоник высшего порядка для звукового поля |
US9838822B2 (en) | 2013-03-22 | 2017-12-05 | Dolby Laboratories Licensing Corporation | Method and apparatus for enhancing directivity of a 1st order ambisonics signal |
US10499176B2 (en) | 2013-05-29 | 2019-12-03 | Qualcomm Incorporated | Identifying codebooks to use when coding spatial components of a sound field |
US11146903B2 (en) | 2013-05-29 | 2021-10-12 | Qualcomm Incorporated | Compression of decomposed representations of a sound field |
CN105340008B (zh) * | 2013-05-29 | 2019-06-14 | 高通股份有限公司 | 声场的经分解表示的压缩 |
US11962990B2 (en) | 2013-05-29 | 2024-04-16 | Qualcomm Incorporated | Reordering of foreground audio objects in the ambisonics domain |
US10770087B2 (en) | 2014-05-16 | 2020-09-08 | Qualcomm Incorporated | Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals |
CN107147975A (zh) * | 2017-04-26 | 2017-09-08 | 北京大学 | 一种面向不规则扬声器摆放的Ambisonics匹配投影解码方法 |
CN110099351B (zh) * | 2019-04-01 | 2020-11-03 | 中车青岛四方机车车辆股份有限公司 | 一种声场回放方法、装置和*** |
CN110099351A (zh) * | 2019-04-01 | 2019-08-06 | 中车青岛四方机车车辆股份有限公司 | 一种声场回放方法、装置和*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101977349A (zh) | Ambisonic声重发***解码的优化改进方法 | |
US11451918B2 (en) | Method for and apparatus for decoding/rendering an Ambisonics audio soundfield representation for audio playback using 2D setups | |
US9641929B2 (en) | Audio signal processing method and apparatus and differential beamforming method and apparatus | |
US8213623B2 (en) | Method to generate an output audio signal from two or more input audio signals | |
JP4987358B2 (ja) | マイクロフォンのモデリング | |
US9319794B2 (en) | Surround sound system | |
US10492000B2 (en) | Cylindrical microphone array for efficient recording of 3D sound fields | |
CN102790931A (zh) | 一种三维声场合成中的距离感合成方法 | |
CN104244164A (zh) | 生成环绕立体声声场 | |
Yan et al. | Time-domain implementation of broadband beamformer in spherical harmonics domain | |
CN107104720A (zh) | 基于协方差矩阵虚拟域离散化重建的互质阵列自适应波束成形方法 | |
CN110784799B (zh) | 一种声音定向传输方法及*** | |
CN100530350C (zh) | 一种面向目标的声辐射生成方法 | |
Epain et al. | Ambisonic decoding with constant angular spread | |
Bu et al. | Design of a planar first-order loudspeaker array for global active noise control | |
AU2024200911A1 (en) | Method and device for decoding an audio soundfield representation | |
CN108877828A (zh) | 语音增强方法/***、计算机可读存储介质及电子设备 | |
WO2022089073A1 (zh) | 波束赋形的处理方法、装置及可读存储介质 | |
EP2755405A1 (en) | Zonal sound distribution | |
Favrot et al. | Metrics for performance assessment of mixed-order Ambisonics spherical microphone arrays | |
Shi et al. | Design of a constant beamwidth beamformer for the parametric array loudspeaker | |
Poletti et al. | Creation of a single sound field for multiple listeners | |
Zhang et al. | Sound reproduction with a circular loudspeaker array using differential beamforming method | |
Poletti et al. | Analysis of 2D sound reproduction with fixed-directivity loudspeakers | |
CN108476371A (zh) | 声波场生成 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20110216 |