CN118250628A - 音频信号的处理方法、***、设备以及存储介质 - Google Patents

音频信号的处理方法、***、设备以及存储介质 Download PDF

Info

Publication number
CN118250628A
CN118250628A CN202410344719.0A CN202410344719A CN118250628A CN 118250628 A CN118250628 A CN 118250628A CN 202410344719 A CN202410344719 A CN 202410344719A CN 118250628 A CN118250628 A CN 118250628A
Authority
CN
China
Prior art keywords
acoustic characteristic
target
characteristic parameters
audio signal
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410344719.0A
Other languages
English (en)
Inventor
武庭照
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN202410344719.0A priority Critical patent/CN118250628A/zh
Publication of CN118250628A publication Critical patent/CN118250628A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Stereophonic System (AREA)

Abstract

本申请公开了一种音频信号的处理方法、***、设备以及存储介质,涉及音频领域。一种音频信号的处理方法,所述处理方法包括:基于环境中的第一设备和第二设备之间的多种位置组合确定多个声学特性参数,并建立包括多个所述声学特性参数的数据集;根据当前环境下所述第一设备的第一目标位置和所述第二设备的第二目标位置,在所述数据集中调取相对应的目标声学特性参数;根据所述第一设备与所述第二设备之间的相对位置,以及所述目标声学特性参数,进行空间音频渲染,生成双耳音频信号;以及根据所述双耳音频信号,控制输出渲染后的音频信号。本申请能够解决声学特性估计误差较大等问题。

Description

音频信号的处理方法、***、设备以及存储介质
技术领域
本申请属于音频技术领域,具体涉及一种音频信号的处理方法、***、设备以及存储介质。
背景技术
房间声学是音频信号处理中重要的技术内容,可用于音频渲染用于模拟该房间内声音的听感,该技术已经广泛应用于虚拟现实(Virtual Reality,VR)设备、增强现实(Augmented Reality,AR)设备,尤其是混合现实(Mixed Reality,MR)设备中,用于处理沉浸式设备播放的音频,使其听感像是来自于用户所处的真实环境。不同的房间类型具有不同的声学特性,例如,体育馆、音乐厅和会议室等不同类型的房间中的声音听起来是具有明显差异的。
相关技术中的一些房间声学特性检测及应用方法中,在一个听音点与对应的声源下估计整个房间声学特性,从而造成声学特性估计误差较大,影响用户体验。
发明内容
本申请实施例的目的是提供一种音频信号的处理方法、***、设备以及存储介质,能够解决声学特性估计误差较大等问题。
为了解决上述技术问题,本申请是这样实现的:
本申请实施例提供了一种音频信号的处理方法,所述处理方法包括:
基于环境中的第一设备和第二设备之间的多种位置组合确定多个声学特性参数,并建立包括多个所述声学特性参数的数据集;
根据当前环境下所述第一设备的第一目标位置和所述第二设备的第二目标位置,在所述数据集中调取相对应的目标声学特性参数;
根据当前环境下所述第一设备与所述第二设备之间的相对位置,以及所述目标声学特性参数,进行空间音频渲染,生成双耳音频信号;以及
根据所述双耳音频信号,控制输出渲染后的音频信号。
本申请实施例还提供了另一种音频信号的处理方法,所述处理方法包括:
根据环境中的第一设备和第二设备之间的多种位置组合所确定的多个声学特性参数建立数据集;
根据当前环境下所述第一设备的第一目标位置和所述第二设备的第二目标位置从所述数据集中获取相对应的目标声学特性参数;
根据当前环境下所述第一设备与所述第二设备之间的相对位置,以及所述目标声学特性参数,进行空间音频渲染,得到双耳音频信号。
本申请还提供了一种音频信号的处理***,所述处理***包括:
扬声器,用于发出音频信号;
麦克风,用于采集所述扬声器发出的所述音频信号;
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以使所述音频信号处理***:
基于环境中所述麦克风和所述扬声器之间的多种位置组合,确定多个声学特性参数,并建立包括多个所述声学特性参数的数据集;
根据当前环境下所述麦克风的第一目标位置和所述扬声器的第二目标位置,在所述数据集中调取相对应的目标声学特性参数;
根据当前环境下所述麦克风与所述扬声器的相对位置,以及所述目标声学特性参数,进行空间音频渲染,生成双耳音频信号;以及
根据所述双耳音频信号,控制输出渲染后的音频信号。
本申请还提供了一种音频处理设备,包括:存储器和处理器;
所述存储器中存储有计算机程序;
所述处理器执行所述计算机程序时实现上述音频信号的处理方法的步骤。
本申请还提供了一种计算机可读存储介质,用于存储计算机程序,所述计算机程序被处理器执行时实现上述音频信号的处理方法的步骤。
本申请实施例建立了包括环境中的第一设备和第二设备之间多种位置组合下的多个声学特性参数,并建立了包括多个声学特性参数的数据集,还可以从该数据集中检索目标声学特性参数,并根据第一设备与第二设备之间的相对位置以及目标声学特性参数进行空间音频渲染,生成双耳音频信号,最终在双耳音频信号驱动作用下使用户能够听到输出渲染后的音频信号。基于上述设置,本申请实施例中的处理方法可以更加准确地估计环境声学特性参数,并且更加真实地模拟当前环境,从而可以提高用户听觉体验,使用户具有如同身临其境的感觉,相比于相关技术中的方法,本申请实施例可以有效避免了以一点估计结果代替整个环境估计结果的情况,从而可以有效降低感知误差。
附图说明
图1为本申请实施例公开的一种音频信号的处理方法的流程图;
图2为本申请实施例公开的另一种音频信号的处理方法的流程图;
图3为本申请实施例公开的声学特性参数检测的流程图;
图4为本申请实施例公开的单次声学特性参数检测的流程图;
图5为本申请实施例公开的音频信号的处理方法的原理图;
图6为本申请实施例公开的房间声学特性应用示例的示意图;
图7为本申请实施例公开的位置检索的示意图;
图8为本申请实施例公开的音频信号的处理***的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例进行详细地说明。
本申请实施例公开了一种音频信号的处理方法,该处理方法可以应用于手机、平板、笔记本电脑、沉浸式设备(如,VR、AR、MR等)等终端设备中,用于渲染终端设备的输出音频,使其听感更接近用户当前所处的环境。
假设沉浸式设备中存在一个虚拟声源,用户想要让该声源听起来像是来自当前环境中虚拟声源所在的位置,可以将预先检测到的该位置下的环境声学特性参数结合HRTF技术,实现空间音频渲染,从而可以让虚拟声源听起来像是来自当前环境中的对应位置。
基于上述情况,如图1所示,所公开的一种处理方法包括:
S101:基于环境中的第一设备和第二设备之间的多种位置组合,确定多个声学特性参数,并建立包括多个声学特性参数的数据集。
第一设备的选定:可以从互联的设备列表中选择一个设备作为主设备,即,第一设备,该第一设备可以作为听音设备,用于采集音频信号,并且可以计算声学特性参数,另外,第一设备所在的位置即为听音位置。需要指出的是,第一设备可以满足如下条件:1、具有麦克风阵列;2、具备GPS、Camera等可以实现自定位的传感器;3、具备算力足够的处理器;4、通信模块等。
第二设备的选定:可以从互连的设备列表中选择第一设备之外的一个设备作为子设备,即,第二设备,第二设备可以作为发音设备,用于发出音频信号,另外,第二设备所在的位置即为声源位置。需要指出的是,第二设备可以满足如下条件:1、具备扬声器;2、具备通信模块等。
基于上述设置,第一设备可以采集第二设备发出的音频信号,并对音频信号进行处理;当然,第一设备与第二设备之间可以进行通信互联,以便于相互传递信号。
示例性地,第一设备可以为虚拟现实(Virtual Reality,VR)设备、增强现实(Augmented Reality,AR)设备、混合显示(Mixed Reality,MR)设备等,第二设备可以为扬声器、音箱、空调、电视、电脑、等设备。当然,第一设备和第二设备还可以为其他设备,此处不作具体限定。
在实际工况下,第一设备和第二设备可以位于同一环境下,如,均位于同一房间内,此种情况下,便可以根据第一设备和第二设备之间的多种位置组合来确定多个声学特性参数。
示例性地,如图6所示,房间内放置有声源A(如,音箱A)、声源B(如,音箱B)、笔记本、空调、冰箱等设备,这些设备均可以发出声音,使得这些设备均可以作为第二设备,即,声源;用户佩戴有MR设备,该MR设备可以作为第一设备,即,听音设备,其所处的位置即为听音点。在此场景下,可以采集到同一听音点下的5个不同声源位置对应的5组房间声学特性参数组成的数据集。当然,用户与MR设备还可以位于其他位置。
S102:根据当前环境下第一设备的第一目标位置和第二设备的第二目标位置,在数据集中调取相对应的目标声学特性参数。
其中,第一目标位置即为当前环境下的听音位置,也就是,第一设备当前所处的位置,如图6中人物所处的位置;第二目标位置即为当前环境下的声源位置,例如,图6中声源B所处的位置等。
在获知当前环境下第一目标位置和第二目标位置的情况下,则可以在数据集中调取与第一目标位置和第二目标位置相对应的目标声学特性参数。
S103:根据当前环境下第一设备与第二设备之间的相对位置、以及目标声学特性参数,进行空间音频渲染,生成双耳音频信号。
S104:根据双耳音频信号,控制输出渲染后的音频信号。
本申请实施例建立了包括环境中第一设备和第二设备之间多种位置组合下的多个声学特性参数,并建立了包括多个声学特性参数的数据集,还可以从该数据集中检索目标声学特性参数,并根据第一设备与第二设备之间的相对位置以及目标声学特性参数进行空间音频渲染,生成双耳音频信号,最终在双耳音频信号驱动作用下使用户能够听到输出渲染后的音频信号。
基于上述步骤,本申请实施例中的处理方法可以更加准确地估计环境声学特性参数,并且更加真实地模拟当前环境,从而可以提高用户听觉体验,使用户具有如同身临其境的感觉,相比于相关技术中的方法,本申请实施例可以有效避免了以一点估计结果代替整个环境估计结果的情况,从而可以有效降低感知误差。
可选地,基于环境中的第一设备和第二设备之间的多种位置组合确定多个声学特性参数,并建立多个声学特性参数的数据集,包括:
根据每种位置组合下的第一设备采集到的第二设备发出的音频信号,以及第二设备发送的原始音频信号进行声学特性评估,得到该种位置组合下的声学特性参数;
根据每种位置组合下的第一设备的位置、第二设备的位置以及相对应的声学特性参数,建立每种位置组合下的数据对;
根据多种位置下的多个所述数据对建立数据集。
本申请实施例中,声学特性的检测是指固定第一设备和第二设备后的单次检测处理。具体为,
第一设备通过通信互联来控制第二设备发出音频信号,且第一设备对第二设备发出的音频信号进行采集,用于检测;同时,第二设备还可以通过通信模块将原始音频信号发送至第一设备。由此,第一设备的处理器可以根据采集到的第二设备发出的音频信号和第二设备发送的原始音频信号进行声学特性估计,从而得到了该种对应位置组合下的声学特性参数。
其中,声学特性估计的方法可以是基于计算机学习的方法,也可以是基于信号处理的方法,如,频域滤波方法等,在此不作具体限定。
一些实施例中,基于环境中第一设备和第二设备之间的多种位置组合确定多个声学特性参数,包括:
基于环境中的一个第一设备与多个第二设备之间形成的多种位置组合,确定多个声学特性参数。此种情况下,需要判断是否已经遍历当前互联的设备列表中所有的第二设备。
具体为,遍历所有第二设备可以得到一个听音位置对应多个声源位置组合下的多个声学特性参数。
另一些实施例中,基于环境中第一设备和第二设备之间的多种位置组合确定多个声学特性参数,包括:
基于环境中的多个第一设备与多个第二设备排列组合形成的多种位置组合,确定多个声学特性参数。
此种情况下,需要判断是否已经遍历当前互联的设备列表中所有的第一设备,具体为:遍历所有第一设备可以得到多个听音位置分别对应多个声源位置组合下的多个声学特性参数,并按照位置标签存储为多个数据对,以形成完整的数据集。
一种较为典型的场景为,当前互联的设备列表中的多个设备都满足第一设备的条件,则可以将多个设备轮流作为第一设备而检测其他第二设备处的声学特性参数。
如图3所示,环境声学特性检测的步骤包括:
开始程序;
从设备列表中选定第一设备(即,主设备);
从设备列表中选定第二设备(即,子设备);
声学特性检测;
判断是否遍历所有第二设备,若否,则返回至选定第二设备的步骤;
若是,则判断是否遍历所有第一设备,若否,则返回至选定第一设备的步骤;
若是,则结束程序。
综上所述,循环采用上述声学特性参数的检测方法可以得到每种位置组合下的声学特性参数,从而可以建立多种位置组合下的数据对,最终由多组数据对组成数据集。
可选地,根据当前环境下第一设备的第一目标位置和第二设备的第二目标位置,在数据集中调取相对应的目标声学特性参数,包括:
在数据集中检索与第一目标位置最接近的第一设备的位置,以及检索与第二目标位置最接近的第二设备的位置;
在数据集中检索与最接近第一目标位置的第一设备的位置以及与最接近第二目标位置的第二设备的位置分别相对应的声学特性参数,并以该声学特性参数作为目标声学特性参数。
基于上述步骤可知,本申请实施例可以根据当前的听音位置和声源位置在数据集中检索到对应的声学特性参数。如图6所示,若想要在房间中重建虚拟声源,首先检索到听音位置,假设图6中用户的位置与检测声学特性参数时的听音位置相一致;然后检索声源位置,可以看出,与虚拟声源位置最接近的声源为声源B,由此,该听音位置下以声源B作为虚拟声源测得的声学特性参数即为重建虚拟声源所需要的声学特性参数。
可选地,获取当前环境下第一设备与第二设备之间的相对位置,包括:
根据当前环境下的第一目标位置、第二目标位置以及处于第一目标位置处的用户在听音时的面部朝向,得到当前环境下第二设备和第一设备之间的相对位置。
具体地,如图6所示,生成的音频要在MR设备中播放,基于虚拟声源的位置和用户佩戴MR设备所处的位置,以及当前状态下用户的面部朝向,计算出虚拟声源与用户之间的相对位置。
基于上述步骤,可以基于虚拟声源与用户之间的相对位置,并利用HRTF进行方向渲染;并且,根据该种相对位置关系下的声学特性参数即可进行环境渲染,从而可以重建输出音频在房间该相对位置关系下的感知效果。
可选地,基于第一定位模块对第一设备的定位信息,得到第一目标位置。此处需要说明的是,如前文所述,第一设备作为主设备,其具备的条件之一是需要具备GPS、Camera等实现定位的传感器,目的是第一设备可以根据自身定位的传感器来确定听音位置,并为第二设备的定位提供参考点。
可选地,基于第二定位模块对第二设备的定位信息,得到第二目标位置。此处需要说明的是,第二设备作为子设备,当其自身需要具有定位功能时,也可以采用GPS、Camera等实现定位的传感器进行定位,目的是第二设备可以根据自身定位的传感器来确定声源位置。
在其他实施例中,还可以根据第一设备的麦克风阵列信号对第二设备的位置进行估计,得到第二目标位置。需要说明的是,对于不具备定位功能的第二设备,其可以通过声源定位方法来定位。另外,对于通过声源定位得到的第二设备的位置,是其与第一设备的相对位置,需要根据第一设备的位置进行转换而得到第二设备的绝对位置。
上述声源定位方法可以基于机器学习的方法来实现,也可以基于信号处理方法实现,如,SRP-PHAT等,在此不作具体限定。
可选地,声学特性参数可以包括混响时间、直反比、环境脉冲响应中的至少一个参数。
本申请实施例中,可以对多种位置组合下的多个声学特性参数进行存储,以形成声学特性参数的数据集。如前文所述,声学特性参数与第一设备及第二设备各自的位置密切相关,由此,本申请实施例中,采集到的声学特性参数会将位置信息作为存储标签,如图4所示,位置Label-1包含了听音位置和声源位置,以及在该种位置组合下的参数data,该参数data即为该位置组合下检测到的声学特性参数。
综上可知,本申请实施例采用上述音频信号的处理方法,可以最大化地保留房间声学特性的丰富性和完备性,基于数据集对设备输出音频进行渲染处理即可模拟对应位置下的声学效果,例如,混响效果,也可以通过对应位置下的音频衰减和直反比特性感知出距离信息。
参考图5,本申请实施例中的音频信号的处理方法的具体流程为:
首先,根据听音位置(第一设备的第一目标位置)和声源位置(第二设备的第二目标位置)在声学特性参数的数据集中检索到对应该位置组合下的声学特性参数,其中,确定位置可用最小距离方法确定。
如图7所示,用户当前所在位置为听音位置,虚拟声源为目标重建位置,且数据集中包含两个听音位置,每个听音位置分别对应两个声源位置。先确认听音位置,根据最小距离可以检索到数据集中距离用户最接近的听音位置为听音点2(即,图7中黑色“+”的位置),则在数据集中听音点2所对应的声源位置中检索距离目标重建位置最接近的声源位置,易得为声源位置1(即,图7中黑色“▲”的位置),最后从数据集中读取对应的声学特性参数,输入音频渲染模块即可。
然后,进行空间渲染;先根据当前环境中的听音位置和声源位置计算相对角度,对输入音频进行方位渲染,再根据确定的声学特性参数进行环境渲染,并输出音频信号。
基于上述方法处理后的音频信号,可以重建房间内不同位置下的混响和直反比等信息,为用户提供更真实的听感。
本申请实施例还公开了另一种音频信号的处理方法,如图2所示,所公开的处理方法包括:
S201:根据环境中的第一设备和第二设备之间的多种位置组合所确定的多个声学特性参数建立数据集;
S202:根据当前环境下所述第一设备的第一目标位置和所述第二设备的第二目标位置从所述数据集中获取相对应的目标声学特性参数;
S203:根据当前环境下所述第一设备与所述第二设备之间的相对位置,以及所述目标声学特性参数,进行空间音频渲染,得到双耳音频信号。
本申请实施例建立了包括环境中第一设备和第二设备之间多种位置组合下的多个声学特性参数的数据集,并且可以从该数据集中检索目标声学特性参数,从而可以根据第一设备的第一目标位置与第二设备的第二目标位置之间的相对位置以及目标声学特性参数进行空间音频渲染,生成双耳音频信号,以便于输出双耳音频信号。
因此,本申请实施例中的处理方法可以更加准确地估计环境声学特性参数,并且更加真实地模拟当前环境,从而可以提高用户听觉体验,使用户具有如同身临其境的感觉,相比于相关技术中的方法,本申请实施例可以有效避免了以一点估计结果代替整个环境估计结果的情况,从而可以有效降低感知误差。
本申请实施例还公开了一种音频信号的处理***,对应于上述音频信号的处理方法,如图1至图8,所公开的处理***包括:
扬声器,用于发出音频信号;
麦克风,用于采集扬声器发出的音频信号;
存储器,用于存储计算机程序;
处理器,用于执行计算机程序,以使音频信号处理***:
基于环境中麦克风和扬声器之间的多种位置组合,确定多个声学特性参数,并建立包括多个声学特性参数的数据集;
根据当前环境下位于目标听音点处的麦克风的第一目标位置和作为目标声源的扬声器的第二目标位置,在数据集中调取相对应的目标声学参数;
根据当前环境下的麦克风与扬声器的相对位置,以及目标声学特性参数,进行空间音频渲染,生成双耳音频信号;以及,
根据双耳音频信号,控制输出渲染后的音频信号。
基于上述设置,本申请实施例中的处理***可以更加准确地估计环境声学特性参数,并且更加真实地模拟当前环境,从而可以提高用户听觉体验,使用户具有如同身临其境的感觉,相比于相关技术,本申请实施例可以有效避免了以一点估计结果代替整个环境估计结果的情况,从而可以有效降低感知误差。
在一些实施例中,处理***还可以包括通信互联的多个设备,多个设备包括第一设备和第二设备,其中,第一设备可以集成有麦克风、扬声器、存储器和处理器,用于接收音频信号并对音频信号进行处理,且第一设备用于供用户佩戴;第二设备可以集成有扬声器,用于发出音频信号。
可选地,处理***可以包括至少一个第一设备和多个第二设备,其中,每个第一设备与多个第二设备通信互联,以便于使每个第一设备与多个第二设备之间进行信号传输,当然,还可以对多个第二设备进行分别控制。
在一些实施例中,第一设备还可以集成有第一定位模块,第一定位模块用于获取第一设备的位置,由此,可以根据自身定位来确定听音位置,当然,还可以为扬声器的定位提供参考点。示例性地,第一定位模块可以包括GPS、Camera等实现定位的传感器。
第二设备可以集成有第二定位模块,该第二定位模块用于获取第二设备的位置,由此,可以根据自身定位来确定声源位置。
当然,处理器还可以用于根据麦克风检测到的集成于第二设备的扬声器发出的音频信号,确定第二设备的位置。需要说明的是,对于不具备定位功能的第二设备,其可以通过声源定位方法来定位。另外,对于通过声源定位得到的第二设备的位置,是其与第一设备的相对位置,需要根据第一设备的位置进行转换而得到第二设备的绝对位置。另外,此处的麦克风可以为麦克风阵列,当然,还可以为其他形式。
在一些实施例中,处理器用于根据每种位置组合下的麦克风采集到的扬声器发出的音频信号,以及扬声器发送的原始音频信号进行声学特性估计,得到该种位置组合下的声学特性参数;以及,
根据每种位置组合下的麦克风的位置、扬声器的位置以及相对应的声学特性参数,建立每种位置组合下的数据对;
根据多种位置下的多个数据对组成数据集。
基于上述设置,一方面可以通过麦克风采集扬声器发出的音频信号,另一方面,由于第一设备与第二设备之间通信互联,可以通过第二设备向第一设备发送的原始音频信号,由此,经过第一设备的处理器对采集的音频信号和原始音频信号进行分析、处理,从而可以对声学特性进行估计,以得到响应的声学特性参数。其中,声学特性估计的方法可以是基于计算机学习的方法,也可以是基于信号处理的方法,如,频域滤波方法等,在此不作具体限定。
如图4所示,在确定第一设备和第二设备之后,单次声学特性检测方法包括如下步骤:
根据麦克风采集到的音频信号和原始音频信号估计声学特性参数;
根据麦克风阵列信号估计扬声器的方位,得到扬声器的位置;
对第一设备进行定位;
存储声学特性参数的数据集。
在一些实施例中,处理器还可以用于基于环境中一个麦克风和多个扬声器之间形成的多种位置组合,确定多个声学特性参数。
在其他实施例中,处理器还可以用于基于环境中的多个麦克风与多个扬声器排列组合形成的多种位置组合,确定多个声学特性参数。
无论采用上述哪种方式,均可以得到当前环境下每种位置组合下的声学特性参数,以便于建立每种位置组合下的数据对,最终组成数据集,以供后续数据调取使用。
在一些实施例中,处理器还可以用于在数据集中检索与第一目标位置最接近的麦克风的位置,检索与第二目标位置最接近的扬声器的位置,以及在数据集中检索与最接近第一目标位置的麦克风的位置以及与最接近第二目标位置的扬声器的位置分别相对应的声学特性参数,并以该声学特性参数作为目标声学特性参数。
基于上述步骤,可以确定麦克风的第一目标位置、扬声器的第二目标位置,并且得到相应的目标声学特性参数。因此,以第一目标位置的麦克风作为听音点,第二目标位置的扬声器作为声源,测得的目标声学特性参数即为重建虚拟声源所需要的声学特性参数。
在一些实施例中,处理器还可以用于根据当前环境下麦克风的第一目标位置、扬声器的第二目标位置,以及处于第一目标位置处的用户在听音时的面部朝向,得到当前环境下麦克风与扬声器之间的相对位置。
如图6所示,生成的音频要在MR设备中播放,基于虚拟声源的位置和用户佩戴MR设备所处的位置,以及当前状态下用户的面部朝向,计算出虚拟声源与用户之间的相对位置。
本申请实施例还公开了一种音频处理设备,所公开的音频处理设备包括:存储器和处理器,其中,存储器中存储有计算机程序,处理器执行计算机程序时实现上述一种或另一种音频信号的处理方法的步骤。
本申请实施例还公开了一种计算机可读存储介质,用于存储计算机程序,其中,计算机程序被处理器执行时实现上述一种或另一种音频信号的处理方法的步骤。
综上所述,本申请实施例基于设备互联的方式,可以在测试设备中同时获取到原始音频信号和传播后被采集到的音频信号,并用于声学特性估计,相比于相关技术,可以提升单点声学特性检测的准确性;基于互联设备在环境中分布的随机性,可以实现多点检测,即可以测量到同一环境中不同的听音点与声源点之间组合对应的环境声学特性,且多点检测得到的数据集可以最大化地保留环境声学特性的丰富性和完备性;另外,还可以基于听音点位置与声源位置在数据集中检索到对应的声学特性参数,并用于渲染输出音频来模拟真实环境的听感,使用差异化的声学特性参数重现出同一环境中不同位置的声学特性差异,提升沉浸感和感知准确性。因此,本申请实施例可以更准确地检测环境声学特性,并用于更真实的环境模拟,以提升用户体验。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (18)

1.一种音频信号的处理方法,其特征在于,所述处理方法包括:
基于环境中的第一设备和第二设备之间的多种位置组合确定多个声学特性参数,并建立包括多个所述声学特性参数的数据集;
根据当前环境下所述第一设备的第一目标位置和所述第二设备的第二目标位置,在所述数据集中调取相对应的目标声学特性参数;
根据当前环境下所述第一设备与所述第二设备之间的相对位置,以及所述目标声学特性参数,进行空间音频渲染,生成双耳音频信号;以及
根据所述双耳音频信号,控制输出渲染后的音频信号。
2.根据权利要求1所述的处理方法,其特征在于,所述基于环境中的第一设备和第二设备之间的多种位置组合确定多个声学特性参数,并建立多个所述声学特性参数的数据集,包括:
根据每种位置组合下所述第一设备采集到的所述第二设备发出的音频信号以及所述第二设备发送的原始音频信号进行声学特性估计,得到该种位置组合下的声学特性参数;
根据每种位置组合下所述第一设备的位置、所述第二设备的位置以及相应的所述声学特性参数,建立每种位置组合下的数据对;
根据多种位置组合下的多个所述数据对建立所述数据集。
3.根据权利要求1或2所述的处理方法,其特征在于,所述基于环境中第一设备和第二设备之间的多种位置组合确定多个声学特性参数,包括:
基于环境中的一个所述第一设备与多个所述第二设备之间形成的多种位置组合,确定多个所述声学特性参数;
或者,基于环境中的多个所述第一设备与多个所述第二设备排列组合形成的多种位置组合,确定多个所述声学特性参数。
4.根据权利要求1所述的处理方法,其特征在于,所述根据当前环境下所述第一设备的第一目标位置和所述第二设备的第二目标位置,在所述数据集中调取相对应的目标声学特性参数,包括:
在所述数据集中检索与所述第一目标位置最接近的所述第一设备的位置,以及检索与所述第二目标位置最接近的所述第二设备的位置;
在所述数据集中检索与最接近所述第一目标位置的所述第一设备的位置以及与最接近所述第二目标位置的所述第二设备的位置分别相对应的所述声学特性参数,并以该声学特性参数作为所述目标声学特性参数。
5.根据权利要求1所述的处理方法,其特征在于,获取当前环境下所述第一设备与所述第二设备之间的相对位置,包括:
根据当前环境下的所述第一目标位置、所述第二目标位置以及处于所述第一目标位置处的用户在听音时的面部朝向,得到当前环境下所述第二设备和所述第一设备之间的相对位置。
6.根据权利要求5所述的处理方法,其特征在于,基于第一定位模块对所述第一设备的定位信息,得到所述第一目标位置;
基于第二定位模块对所述第二设备的定位信息,得到所述第二目标位置,或者,根据所述第一设备的麦克风阵列信号对所述第二设备的位置进行估计,得到所述第二目标位置。
7.根据权利要求1所述的处理方法,其特征在于,所述声学特性参数包括混响时间、直反比、环境脉冲响应中的至少一个参数。
8.一种音频信号的处理方法,其特征在于,所述处理方法包括:
根据环境中的第一设备和第二设备之间的多种位置组合所确定的多个声学特性参数建立数据集;
根据当前环境下所述第一设备的第一目标位置和所述第二设备的第二目标位置从所述数据集中获取相对应的目标声学特性参数;
根据当前环境下所述第一设备与所述第二设备之间的相对位置,以及所述目标声学特性参数,进行空间音频渲染,得到双耳音频信号。
9.一种音频信号的处理***,其特征在于,所述处理***包括:
扬声器,用于发出音频信号;
麦克风,用于采集所述扬声器发出的所述音频信号;
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序,以使所述音频信号处理***:
基于环境中所述麦克风和所述扬声器之间的多种位置组合,确定多个声学特性参数,并建立包括多个所述声学特性参数的数据集;
根据当前环境下所述麦克风的第一目标位置和所述扬声器的第二目标位置,在所述数据集中调取相对应的目标声学特性参数;
根据当前环境下所述麦克风与所述扬声器的相对位置,以及所述目标声学特性参数,进行空间音频渲染,生成双耳音频信号;以及
根据所述双耳音频信号,控制输出渲染后的音频信号。
10.根据权利要求9所述的处理***,其特征在于,所述处理器用于根据每种位置组合下所述麦克风采集到的所述扬声器发出的音频信号以及所述扬声器发送的原始音频信号进行声学特性估计,得到该种位置组合下的声学特性参数,以及,
根据每种位置组合下所述麦克风的位置、所述扬声器的位置以及相应的所述声学特性参数,建立每种位置组合下的数据对;
根据多种位置组合下的多个所述数据对组成所述数据集。
11.根据权利要求9所述的处理***,其特征在于,所述处理器还用于基于环境中的一个所述麦克风与多个所述扬声器之间形成的多种位置组合,确定多个所述声学特性参数;
或者,所述处理器用于基于环境中的多个所述麦克风与多个所述扬声器排列组合形成的多种位置组合,确定多个所述声学特性参数。
12.根据权利要求9所述的处理***,其特征在于,所述处理器还用于在所述数据集中检索与所述第一目标位置最接近的所述麦克风的位置,以及检索与所述第二目标位置最接近的所述扬声器的位置;
在所述数据集中检索与最接近所述第一目标位置的所述麦克风的位置以及与最接近所述第二目标位置的所述扬声器的位置分别相对应的所述声学特性参数,并以该声学特性参数作为所述目标声学特性参数。
13.根据权利要求9所述的处理***,其特征在于,所述处理器还用于根据当前环境下的所述第一目标位置、所述第二目标位置以及处于所述第一目标位置处的用户在听音时的面部朝向,得到当前环境下所述扬声器与所述麦克风之间的相对位置。
14.根据权利要求9至13中任意一项所述的处理***,其特征在于,所述处理***还包括通信互联的多个设备,所述多个设备包括第一设备和第二设备;
所述第一设备集成有所述麦克风、所述扬声器、所述存储器和所述处理器,且所述第一设备用于供用户佩戴;
所述第二设备集成有所述扬声器。
15.根据权利要求14所述的处理***,其特征在于,所述第一设备还集成有第一定位模块,所述第一定位模块用于获取所述第一设备的位置;
所述第二设备还集成有第二定位模块,所述第二定位模块用于获取所述第二设备的位置,或者,所述处理器用于根据所述第一设备的麦克风阵列信号对所述第二设备的位置进行估计,得到所述第二设备的位置。
16.根据权利要求14所述的处理***,其特征在于,所述处理***包括至少一个所述第一设备和多个所述第二设备;
每个所述第一设备与多个所述第二设备通信互联。
17.一种音频处理设备,其特征在于,包括:存储器和处理器;
所述存储器中存储有计算机程序;
所述处理器执行所述计算机程序时实现权利要求1至8中任意一项所述的音频信号的处理方法的步骤。
18.一种计算机可读存储介质,用于存储计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任意一项所述的音频信号的处理方法的步骤。
CN202410344719.0A 2024-03-25 2024-03-25 音频信号的处理方法、***、设备以及存储介质 Pending CN118250628A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410344719.0A CN118250628A (zh) 2024-03-25 2024-03-25 音频信号的处理方法、***、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410344719.0A CN118250628A (zh) 2024-03-25 2024-03-25 音频信号的处理方法、***、设备以及存储介质

Publications (1)

Publication Number Publication Date
CN118250628A true CN118250628A (zh) 2024-06-25

Family

ID=91555926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410344719.0A Pending CN118250628A (zh) 2024-03-25 2024-03-25 音频信号的处理方法、***、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN118250628A (zh)

Similar Documents

Publication Publication Date Title
US10939225B2 (en) Calibrating listening devices
CN105792090B (zh) 一种增加混响的方法与装置
KR102507476B1 (ko) 헤드셋을 통한 공간 오디오 렌더링을 위한 룸 특성 수정 시스템 및 방법
KR102008771B1 (ko) 청각-공간-최적화 전달 함수들의 결정 및 사용
Härmä et al. Augmented reality audio for mobile and wearable appliances
US7590248B1 (en) Head related transfer function filter generation
CN110249640A (zh) 用于虚拟现实(vr)、增强现实(ar)和混合现实(mr)***的分布式音频捕获技术
Jot et al. Augmented reality headphone environment rendering
Minnaar et al. Directional resolution of head-related transfer functions required in binaural synthesis
CN112005559B (zh) 改进环绕声的定位的方法
CN101483797A (zh) 一种针对耳机音响***的人脑音频变换函数(hrtf)的生成方法和设备
US20210375258A1 (en) An Apparatus and Method for Processing Volumetric Audio
TW202028929A (zh) 多音訊串流之空間重定位
Geronazzo et al. Applying a single-notch metric to image-guided head-related transfer function selection for improved vertical localization
CN110544532A (zh) 一种基于app的声源空间定位能力检测***
Thiemann et al. A multiple model high-resolution head-related impulse response database for aided and unaided ears
CN118250628A (zh) 音频信号的处理方法、***、设备以及存储介质
JP2018152834A (ja) 仮想聴覚環境において音声信号出力を制御する方法及び装置
Aspöck Auralization of interactive virtual scenes containing numerous sound sources
Anuar et al. A Conceptual Framework for Immersive Acoustic Auralisation: Investigating the Key Attributes
Storms NPSNET-3D sound server: an effective use of the auditory channel
WO2023085186A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
CN118301536A (zh) 音频的虚拟环绕处理方法、装置、电子设备和存储介质
Spagnol Individual Three-dimensional Spatial Auditory Displays for Immersive Virtual Environments
Dodds et al. Full Reviewed Paper at ICSA 2019

Legal Events

Date Code Title Description
PB01 Publication
SE01 Entry into force of request for substantive examination