CN103563401A

CN103563401A - 减少头部相关传递函数数据量

Info

Publication number: CN103563401A
Application number: CN201180071387.4A
Authority: CN
Inventors: M·奈斯特龙; S·斯麦拉吉科
Original assignee: Sony Ericsson Mobile Communications AB
Current assignee: Sony Mobile Communications AB
Priority date: 2011-06-09
Filing date: 2011-06-09
Publication date: 2014-02-05
Anticipated expiration: 2031-06-09
Also published as: US20130170679A1; WO2012168765A1; EP2719200A1; EP2719200B1; CN103563401B; US9118991B2

Abstract

一种装置可以存储用于对来自三维（3D）空间中的源（104）的立体声进行仿真的多个头部相关传递函数（HRTF）的子集，所述多个HRTF中的每一个HRTF都对应于一个方向，听到该立体声的用户（102）感知到所述立体声是从该方向抵达的。所述装置还可以获得第一方向（704），第一立体声被所述用户（102）感知到是以从该第一方向抵达的，并且确定所述多个HRTF的所述子集是否包括与所述第一方向（704）相对应的第一HRTF（HEM（f）），其中，所述多个HRTF包括所述第一HRTF（HEM（f））。而且，所述装置可以选择所述多个HRTF的所述子集中的两个HRTF（HA（f）,HB（f），其中，与所述两个HRTF（HA（f），HB（f）相关联的方向（702,706）与所述多个HRTF的所述子集中的其它HRTF的方向相比，更靠近所述第一方向。

Description

减少头部相关传递函数数据量

背景技术

在三维（3D）音频技术中，一对扬声器（例如，耳机、入耳式扬声器、耳甲内扬声器等）可以逼真地仿真位于不同位置的声源。数字信号处理器、数模转换器、放大器，和/或其它类型的装置可以被用于彼此独立地驱动每一个扬声器，以产生听觉立体声效果。

发明内容

一种***可以包括一装置。所述装置可以包括存储器，该存储器被设置成存储用于对来自三维（3D）空间中的源的立体声进行仿真的多个头部相关传递函数（HRTF）的子集，所述多个HRTF中的每一个HRTF都对应于所述立体声的被用户感知的方向。所述装置还可以包括输出接口，该输出接口用于接收来自处理器的音频信息，并且输出与所述音频信息相对应的信号。所述装置还可以包括所述处理器。所述处理器可以被设置成，获得要由听到仿真立体声的用户感知，以生成所述仿真立体声的方向，并且被设置成确定所述多个HRTF的所述子集是否包括与所述方向相对应的第一HRTF，其中，所述多个HRTF包括所述第一HRTF。在所述处理器确定所述多个HRTF的所述子集不包括所述第一HRTF时，所述处理器可以使用所述多个HRTF的所述子集中的两个HRTF来获得所述第一HRTF的所估计的HRTF。而且，所述处理器可以将所估计的HRTF应用至音频信号以生成所述音频信息。

另外，所述***还可以包括耳机，该耳机被设置成，接收所述信号，并且生成右耳声音和左耳声音。

另外，当所述耳机接收所述信号时，所述耳机可以通过无线通信链路来接收所述信号。

另外，所述耳机可以包括以下之一：头戴式受话器、耳塞、入耳式扬声器，或者耳甲内扬声器。

另外，所述装置可以包括以下之一：平板计算机、移动电话、个人数字助理、或游戏机。

另外，所述***还可以包括远程装置，该远程装置被设置成，生成所述多个HRTF的所述子集。

另外，所述多个HRTF可以包括作为所述多个HRTF的所述子集的镜像的HRTF。

另外，当所述处理器使用所述多个HRTF的所述子集中的所述两个HRTF来获得所估计的HRTF时，所述处理器可以被设置成，选择最靠近所述立体声的所述方向，并且其两个对应HRTF被包括在存储在所述存储器中的所述多个HRTF的所述子集中的两个方向。所述处理器还可以被设置成，从所述存储器获取所述两个HRTF，并且形成所获取的两个HRTF的线性组合，以获得所估计的HRTF。

另外，其中，当所述处理器形成所获取的两个HRTF的所述线性组合时，所述处理器还可以被设置成：获得第一系数和第二系数，获得所述第一系数和所获取的两个HRTF中的一个HRTF的第一乘积，获得所述第二系数和所获取的两个HRTF中的另一个HRTF的第二乘积；以及将所述第一乘积与所述第二乘积相加，以获得所估计的HRTF。

另外，当所述处理器确定所述多个HRTF的所述子集包括所述第一HRTF时，所述处理器还可以被设置成，从所述存储器获取所述第一HRTF。

根据另一方面，提供了一种方法，该方法可以包括以下步骤：存储用于对来自三维（3D）空间中的源的立体声进行仿真的多个头部相关传递函数（HRTF）的子集，所述多个HRTF中的每一个HRTF都对应于听到所述立体声的用户将感知所述立体声抵达的方向。所述方法还可以包括以下步骤：获得所述用户会感知到第一立体声抵达的第一方向，并且确定所述多个HRTF的所述子集是否包括与所述第一方向相对应的第一HRTF，其中，所述多个HRTF包括所述第一HRTF。所述方法还可以包括以下步骤：在所述多个HRTF的所述子集中选择第一所存储的HRTF和第二所存储的HRTF，其中，与所述第一所存储的HRTF和第二所存储的HRTF相关联的方向和所述多个HRTF的所述子集中的其它HRTF的方向相比，更靠近所述第一方向。所述方法还可以包括以下步骤：将所述第一所存储的HRTF应用至音频信号，以获得第一中间信号，将所述第二所存储的HRTF应用至所述音频信号，以获得第二中间信号，并且基于所述第一中间信号和所述第二中间信号来生成用于头戴式受话器的输出信号。

另外，所述方法还可以包括以下步骤：通过连接至所述头戴式受话器的线来发送用于所述头戴式受话器的所述输出信号。

另外，所述方法还可以包括以下步骤：从远程装置接收所述多个HRTF的所述子集。

另外，生成所述输出信号的步骤可以包括以下步骤：计算所述第一中间信号和所述第二中间信号的线性组合。

另外，所述方法还可以包括以下步骤：当所述多个HRTF的所述子集包括所述第一HRTF时，从所述存储器获取所述第一HRTF。

另外，所述方法还可以包括以下步骤：获得所述用户将感知所述第一立体声抵达的距离。

另外，所述方法还可以包括以下步骤：确定根据所述第一方向和所述距离确定的声音源的位置是否处于所述3D空间中的不能通过所述多个HRTF的所述子集中的一个或更多个HRTF来估计所述第一HRTF的区域内，并且当所述声音源的所述位置被确定处于所述区域内时，获取与所述声音源的位置相对应的HRTF，并且将所获取的HRTF应用至所述音频信号，以生成用于驱动所述头戴式受话器的所述输出信号。

根据又一方面，提供了一种计算机可读介质，该计算机可读介质可以包括用于设置一个或更多个处理器的计算机可读指令。所述一个或更多个处理器可以被设置成，存储用于对来自三维（3D）空间中的源的立体声进行仿真的多个头部相关传递函数（HRTF）的子集，所述多个HRTF中的每一个HRTF都对应于听到该立体声的用户感知所述立体声所抵达的距离和方向。所述一个或更多个处理器还可以被设置成，获得第一方向和第一距离，所述用户将会感知第一立体声是从第一方向和第一距离抵达的。所述一个或更多个处理器还可以被设置成，确定所述多个HRTF的所述子集是否包括与所述第一方向和所述第一距离相对应的第一HRTF，其中，所述多个HRTF包括所述第一HRTF。所述一个或更多个处理器还可以被设置成，选择所述多个HRTF的所述子集中的、与一个距离相对应的前两个HRTF，并且在所述多个HRTF的所述子集不包括所述第一HRTF时，使用所述多个HRTF的所述子集中的所述前两个HRTF来获得第一个所估计的HRTF。所述一个或更多个处理器还可以被设置成，选择所述多个HRTF的所述子集中的、与另一个距离相对应的再两个HRTF。所述一个或更多个处理器还可以被设置成，在所述多个HRTF的所述子集不包括所述第一HRTF时，使用所述多个HRTF的所述子集中的所述再两个HRTF来获得第二个所估计的HRTF，并且基于所述第一个所估计的HRTF和所述第二个所估计的HRTF来确定所述第一HRTF的第三个所估计的HRTF。所述一个或更多个处理器还可以被设置成，将所述第三个所估计的HRTF应用至音频信号以生成用于驱动头戴式受话器的输出信号，其中，所述第一距离处于所述一个距离与所述另一个距离之间。

另外，所述计算机可读介质还可以包括用于进一步设置所述处理器的计算机可执行指令，以通过无线通信链路发送用于所述头戴式受话器的所述输出信号。

附图说明

被并入并构成本说明书一部分的附图，例示了在此所述一个或或更多个实施方式，并与本描述一起说明这些实施方式。在图中：

图1A、1B、1C例示了本文描述的构思；

图2示出了其中本文描述的构思可以实现的示例性***；

图3A和3B是图2的示例性用户装置的正视图和后视图；

图4是图2的网络装置的示例性部件的框图；

图5是图2的用户装置的功能框图；

图6是图2的示例性头部相关传递函数（HRTF）装置的功能框图；

图7例示了根据一个实现的强度遥摄（intensity panning）；

图8例示了根据另一实现的强度遥摄；

图9例示了图7所示3D空间中的区域，其中，HRTF的数量可以或者不可以减少；

图10是用于生成用于强度遥摄的HRTF的示例性处理的流程图；

图11是用于基于HRTF来应用强度遥摄的示例性处理的流程图。

具体实施方式

下面的详细描述参照附图。不同图中的相同标号可以标识相同或详细部件。如在此使用的，术语“主体部分”可以包括一个或更多个主体部分（例如，手包括手指）。

下面，***可以根据头部相关传递函数（HRTF）来驱动多个扬声器，以产生逼真的立体声。该HRTF可以通过对预先计算的HRTF进行强度遥摄来确定。该强度遥摄允许针对该***预先计算较少的HRTF。

图1A、1B、1C例示了本文描述的构思。图1A示出了正在听从源106产生的声音104的用户102。如图所示，出于多种理由，用户102的左耳108-1和右耳108-2可以接收来自源106的声波的不同部分。例如，耳朵108-1和108-2可以处在相距源106不相等的距离处，从而，波前会在不同时间抵达耳朵108。再例如，抵达右耳108-2的声音104可能因物体的不同空间几何形状而行进了与左耳108-1处的对应声音相比不同的路径（例如，耳朵108-2指向的方向不同于耳朵108-1指向的方向、用户102的头部阻隔了耳朵108-2、不同的墙壁面对每一个耳朵108等）。更具体地说，例如，抵达右耳108-2的声音104的一部分可能在抵达耳朵108-2之前在头部102附近发生了衍射。

假定从源106至左耳108-1和右耳108-2的声学变换分别由头部相关传递函数（HRTF）G_L(f)和G_R(f)封装或汇总，其中，f表示频率。接着，假定源106处的声音104为X(f)，抵达耳朵108-1和108-2中的每一个的声音可以分别表达为G_L(f)·X(f)和G_R(f)·X(f)。

图1B示出了由声音***内的用户装置204控制的一对耳机110-1和110-2。假定用户装置204使耳机110-1和110-2分别产生信号H_L(f)·X(f)和H_R(f)·X(f)，其中，H_L(f)和H_R(f)是G_L(f)和G_R(f)的近似。通过生成H_L(f)·X(f)和H_R(f)·X(f)，用户装置204和耳机110-1和110-2可以仿真声源106和声音104的空间变换。H_L(f)和H_R(f)越精确地近似G_L(f)和G_R(f)，用户装置204和耳机110-1和110-2就可以越精确地仿真经由耳机110在耳朵108处察觉的声音104。

为生成H_L(f)·X(f)和H_R(f)·X(f)，该声音***需要存储的、预先计算的HRTFHL(f)和HR(f)（统称为H(f)）。声音***可以通过不同技术来预先计算并存储用于定位在三维（3D）空间中的声源的HRTF。例如，声音***可以例如经由有限元法（FEM）来数字上解决一个或更多个边界值问题。

在预先计算HRTF方面，***可以获得声源可以产生声音的方向或位置中的每一个的H(f)。由此，例如，要仿真移动声源的***可以针对该声源的路径上的每一个点来计算H(f)，在这些点上，***提供了声音的快照。所计算的HRTF以后可以被用于仿真声音。

图1C例示了按3D空间中的不同方向存储针对指定源的HRTF。如图所示，源可以位于环绕用户102的64个圆中的任一个处。每一个圆都与其相邻者隔开大约5.5度，并且与HRTF相关联。例如，圆121、122、123分别与H1(f)、H2(f)、H_W(f)相关联。如上所示，每一个HRTF都包括针对用户102的左耳的HRTF和针对右耳的HRTF。例如，图1C示出了H_W(f)由H_WL(f)H_WR(f)组成。利用H_WL(f)和H_WR(f)，用户装置204可以分别经由左耳机110-1和右耳机110-2生成X(f)H_WL(f)和X(f)H_WR(f)，以仿真已经在圆123处生成的声音。

在图1C中，为了使用户装置204仿真来自64个圆中的任一个处的声源的声音，用户装置204需要存储与这64个圆相关联的每一个HRTF。因为每一个HRTF都包括左耳HRTF和右耳HRTF，并且右耳/左耳HRTF都包括一组数字（例如，频率响应），所以用户装置204可能需要存储大量数据来表示所有HRTF。

如下所述，声学***或装置（例如，装置204）可以实现强度遥摄，以估计HRTF。这允许该***使用很少的存储HRTF，并由此减少HRTF所需的存储空间量。根据该实现，该声学***可以使用附加技术来减少存储HRTF的数量。

图2示出了本文描述的构思可以实现的示例性***200。如图所示，***200可以包括：网络202、用户装置204、HRTF装置206以及耳机（或头戴式受话器）110。

网络202可以包：蜂窝网络、公共交换电话网（PSTN）、局域网（LAN）、广域网（WAN），无线LAN、城域网（MAN）、个人区域网络（PAN）、长期演进（LTE）网络、企业内联网、因特网、基于卫星的网络、光纤网络（例如，无源光学网络（PON））、对等（ad hoc）网络、任何其它网络，或多个网络的组合。***200中的装置可以经由无线、有线，或光学通信链路连接至网络202。网络202可以允许装置204到208中的任一个彼此通信。尽管网络202可以包括其它类型的网络部件（如，路由器、桥接器、开关、网关、服务器等），但为简单起见，这些装置在图2中未例示。

用户装置204可以包括可以将耳机接合（例如，经由头戴式受话器插孔）至的下列装置中的任一个：个人计算机；平板计算机；蜂窝电话或移动电话；智能电话；膝上型计算机；可以组合具有数据处理、传真和/或数据通信能力的蜂窝电话的个人通信***（PCS）；包括电话机的个人数字助理（PDA）；游戏装置或控制台；***装置（例如，无线头戴式受话器）；数字摄像机；或者另一类型的计算或通信装置。

经由用户装置204，用户可以发出电话呼叫、向另一发送文本消息、发送电子邮件等。另外，用户装置204可以接收并存储来自HRTF装置206的所计算的HRTF。用户装置204可以使用HRTF来生成用于驱动耳机110的信号，以提供立体声。在生成该信号时，用户装置204可以基于存储在用户装置204上的HRTF来应用下面要描述的强度遥摄。

HRTF装置206可以基于虚拟声学环境内的特定边界条件来导出或生成HRTF。HRTF装置206可以向用户装置204发送该HRTF。

当用户装置204从HRTF装置206接收到HRTF时，用户装置204可以将它们存储在数据库或另一类型的存储器结构中。在某些配置中，当用户装置204（例如从用户或运行在用户装置204上的程序）接收到应用HRTF的请求时，用户装置204可以从数据库中选择特定的HRTF。用户装置204可以将所选HRTF应用至声源，以生成输出信号。按其它配置中，用户装置204可以提供常规音频信号处理（例如，均衡化），以生成输出信号。用户装置204可以将该输出信号提供给耳机110。

耳机/头戴式受话器110可以响应于从用户装置204接收的输出信号，来生成声波。耳机/头戴式受话器110可以包括不同类型的头戴式受话器，耳塞、入耳式扬声器，耳甲内扬声器等。耳机/头戴式受话器110可以经由无线通信链路或线缆传输通信链路从用户装置204接收信号。

取决于实现方式，与图2所示那些部件相比，***200可以包括附加的、更少的、不同的部件，和/或其不同排布结构。例如，在一个实现中，分离装置（例如，放大器、接收器状装置等）可以将由HRTF装置206生成的HRTF应用至音频信号，以生成输出信号。该装置可以该输出信号发生给耳机110。在另一个实现中，***200可以包括用于生成可以应用HRTF的音频信号的分离装置（例如，光盘播放器、数字视频盘（DVD）播放器、数字录像机（DVR）、无线电装置、电视机、置顶盒、计算机等）。在又一个实现中，用户装置204和HRTF装置206可以被实现为一个装置。

图3A和3B分别是根据一个实现的用户装置204的正视图和后视图。在该实现中，用户装置204可以为智能电话（例如，蜂窝电话）的形式。如图3A和3B所示，用户装置204可以包括：扬声器302、显示器304、麦克风306，传感器308、前摄像机310、后摄像机312、壳体314、音量控制按钮316、电源端口318以及扬声器插孔320。取决于实现方式，与图3A和3B所示那些部件相比，用户装置204可以包括附加的、更少的、不同的部件，或其不同排布结构。

扬声器302可以向用户装置204的用户提供可听信息。显示器304可以向用户提供可视信息，如呼叫方的图像、经由摄像机310/312或远程装置接收的视频图像等。另外，显示器304可以包括用户装置204接收用户输入的触摸屏。该触摸屏可以接收多触摸输入或单一触摸输入。

麦克风306可以接收来自用户和/或周围的可听信息。传感器308可以收集并向用户装置204提供被用于帮助用户拍摄图像的信息（例如，声学、红外等），或者提供其它类型信息（例如，用户装置204与物理对象之间的距离）。

前摄像机310和后摄像机312可以使得用户能够观看、拍摄、存储，以及处理用户装置204前/后的物体的图像。前摄像机310可以与位于用户装置204后部上的后摄像机312隔开。壳体314可以向用户装置204的部件提供包装，并且可以保护这些部件不受外部部件影响。

音量控制按钮316可以准许用户102增加或减小扬声器音量。电源端口318可以允许用户装置204从适配器（例如，交流电（AC）至直流电（DC）转换器）或者从另一装置（例如，计算机）接收电力。扬声器插孔320可以包括可以接合扬声器线（例如，头戴式受话器线）的插头，以使来自用户装置204的电信号可以驱动扬声器线从扬声器插孔320引出至的扬声器（例如，耳机110）。

图4是网络装置400的示例性部件的框图。网络装置400可以表示图2中的装置204到208中的任一个。如图4所示，网络装置400可以包括：处理器402、存储器404、存储单元406，输入部件408、输出部件410、网络接口412，以及通信路径414。

处理器402可以包括：处理器、微处理器、专用集成电路（ASIC）、现场可编程门阵列（FPGA），和/或能够处理信息和/或控制网络装置400的其它处理逻辑（例如，音频/视频处理器）。

存储器404可以包括用于存储数据和机器可读指令的静态存储器（如只读存储器（ROM）），和/或动态存储器（如随机存取存储器（RAM），或板载高速缓冲存储器。存储单元406可以包括存储装置，如软盘、CD ROM、CD读/写（R/W）盘、硬盘驱动器（HDD）、闪速存储器，以及其它类型存储装置。

输入部件408和输出部件410可以包括：显示屏、键盘、鼠标器、扬声器226、麦克风、数字视频盘（DVD）写入器、DVD读取器、通用串行总线（USB）端口，和/或用于将物理事件或现象转换成关于网络装置400的数字信号和/或根据该数字信号转换物理事件或现象的其它类型部件。

网络接口412可以包括使得网络装置400能够与其它装置和/或***通信的收发器。例如，网络接口412可以经由一网络通信，如因特网、陆基无线网络（例如，WLAN）、蜂窝网络、基于卫星的网络、无线个人区域网（WPAN））等。网络接口412可以包括调制解调器、针对LAN的以太网接口，和/或用于将网络装置400连接至其它装置（例如，蓝牙（Bluetooth）接口）的接口/连接部。

通信路径414可以提供网络装置400的部件可借以彼此通信的接口。

在不同实现中，与图4所示部件相比，网络装置400可以包括附加的、更少的，或者不同的部件。例如，网络装置400可以包括附加网络接口，如用于接收和发送数据包的接口。在另一个实施例中，网络装置400可以包括触觉输入装置。

图5是用户装置204的示例性功能部件的框图。如所示，用户装置204可以包括：HRTF数据库502、音频信号部件504以及信号处理器506。图5所示全部或些部件可以通过处理器402执行存储在用户装置204的存储器404中的指令来实现。

取决于实现方式，与图5所示那些部件相比，用户装置204可以包括附加的、更少的、不同的功能部件，或其不同排布结构。例如，用户装置204可以包括：操作***、应用、装置驱动器、图形用户接口部件、通信软件等。在另一个实施例中，取决于实现方式，音频信号部件504和/或信号处理器506可以是程序或应用（如游戏、文档编辑器/生成器、实用程序、多媒体程序、视频播放器、音频播放器，或另一类型应用）的一部分。

HRTF数据库502可以从另一部件或装置（例如，HRTF装置206）接收HRTF，并且存储该HRTF。给定一关键字（即，标识符），HRTF数据库502可以在其记录中搜索对应HRTF，并且返回全部或部分HRTF（例如，某一范围的数据）、右耳HRTF、左耳HRTF等）。在一些实现中，HRTF数据库502可以存储从用户装置204生成的HRTF，而非从另一装置接收的HRTF。

音频信号部件504可以包括音频播放器、无线电装置等。音频信号部件504可以生成音频信号（例如，X(f)），并将该信号提供给信号处理器506。在某些配置中，音频信号部件504可以提供信号处理器506可以对其应用HRTF和/或其它类型信号处理的音频信号。在其它配置中，音频信号部件504可以提供信号处理器506可以仅对其应用常规信号处理的音频信号。

信号处理器506可以将从HRTF数据库502获得的HRTF或其一部分应用至从音频信号部件504或者从远程装置接收的音频信号，以生成输出信号。在（例如，通过用户输入而选择的）一些配置中，信号处理器506还可以将其它类型的信号处理（例如，均衡化）（具有或没有HRTF）应用至音频信号。信号处理器506可以向另一装置（举例来说，如耳机110）提供输出信号。

图6是HRTF装置206的功能框图。如图所示，HRTF装置206可以包括HRTF生成器602。在某些实现中，HRTF生成器602可以通过处理器402执行存储在用户装置204的存储器404中的指令来实现。在其它实现中，HRTF生成器602可以按硬件来实现。

HRTF生成器602可以生成多个HRTF，从所生成多个HRTF中选择HRTF，或者基于从用户装置204接收的信息来获得表征了HRTF的参数。在HRTF生成器602选择HRTF的实现或配置中，HRTF生成器602可以包括预先计算出的HRTF。HRTF生成器602可以使用所接收的信息（例如，环境参数）来选择预先计算出的HRTF中的一个或更多个。例如，HRTF生成器602可以接收与声源实际上驻留的声环境的几何形状有关的信息。基于该信息，HRTF生成器602可以选择预先计算出的多个HRTF中的一个或更多个。

在一些配置或实现中，HRTF生成器602可以计算HRTF或HRTF相关参数。在这些实现中，HRTF生成器602例如可以利用3D模型来应用有限元法（FEM）、有限差法（FDM）、有限量法，和/或另一数字方法，以设置边界条件。

一旦HRTF生成器602生成或选择了HRTF，HRTF生成器602就可以向另一装置（例如，用户装置204）发送所生成/选择的HRTF（或者表征传递函数的参数（例如，有理函数的系数）），或者表征HRTF的频率响应的数据。

取决于实现方式，与图6所示那些部件相比，HRTF装置206可以包括附加的、更少的、不同的功能部件，或其不同排布结构。例如，HRTF装置206可以包括：操作***、应用、装置驱动器、图形用户接口部件、数据库（例如，HRTF的数据库）、通信软件等。

图7例示了根据一个实现的强度遥摄。强度遥摄能够减少需要在用户装置204处存储的HRTF数据的量。在图7中，填充/着色圆表示用户装置204已经在HRTF数据库402中存储了HRTF的声源位置。空圆表示用户装置204不需要存储HRTF的声源位置。尽管这些圆被示出为相距用户102的头部的中心近似等距，或者等间隔，但在实际实现中，不需要是这样。

在该实现中，通过加权与邻近填充圆相关联的HRTF来构造针对特定位置处的声源的HRTF。例如，在图7中，假定用户装置204要确定圆704处的HRTF H_EM(f)或HRTF的值（例如，该HRTF在特定频率下的值）。H_EM(f)可以表达为：

H_EM(f)=H_EML(f)l+HEMR(f)r （1）

在表达式（1）中，H_EML(f)和H_EMR(f)表示H_EM(f)的左耳分量和右耳分量。r和l表示针对右耳和左耳矢量空间的正交单位基本矢量。

类似的是，可以将与邻近圆702和706相关联的HRTF表达如下：

H_A(f)=H_AL(f)l+H_AR(f)r，（2）

H_B(f)=H_BL(f)l+H_BR(f)r。（3）

在该实现中，通过“遥摄”邻近HRTF H_A(f)和H_B(f)的强度作为它们相对于用户102的头部中心的方向（即，角度）的函数来获得期望HRTF。即：

H_EM(f)≈αH_A(f)+βH_B(f)。（4）

假定θ表示由点702、用户102的头部中心以及点704形成的角，假定η表示由点704、用户102的头部中心以及点706形成的角。于是，可以预先计算或选择α和β，以使α/β=θ/η。α和β可以针对不同圆/位置而不同。

利用（1）、（2）及（3），可以重写表达式（4）为：

H_EM(f)≈α(H_AL(f)l+H_AR(f)r)+β(H_BL(f)l+H_BR(f)r)=(αH_AL(f)+βH_BL(f))l+(αH_AR(f)+βH_BR(f))r （5）

经由该强度遥摄，可以根据表达式（4）和/或（5）来确定针对图7中的任一空圆（或两个圆之间的任何点）的HRTF。因此，用户装置204不需要存储图7中的空圆的HRTF的值。用户装置204仅需要存储与经由强度遥摄获得HRTF所需一样多的HRTF。在上文中，尽管表达式（4）和（5）将H_EM(f)示出为H_A(f)和H_B(f)的加权和，但在其它实现中，可以经由H_A(f)和H_B(f)的更复杂函数（例如，有理函数、多项式等）来计算或确定H_EM(f)。

图8例示了根据另一实现的强度遥摄。如图所示，HRTF被存储在用户装置204中的那些圆按相距用户102的头部中心不同的距离来定位。在该实现中，利用与邻近填充圆相关联的HRTF来构造位于特定位置处的声源的HRTF。

例如，在图8中，假定用户装置204要确定圆802处的HRTF H_EN(f)或HRTF的值（例如，HRTF在特定频率下的值）。HEN(f)可以表达为：

H_EN(f)=H_ENL(f)l+H_ENR(f)r （6）

与表达式（1）类似，在表达式（6）中，H_ENL(f)和H_ENR(f)表示H_EN(f)的左耳分量和右耳分量。类似的是，可以将针对邻近圆804和806的HRTF表达如下：

H_C(f)=H_CL(f)l+H_CR(f)r，（7）

H_D(f)=H_DL(f)l+H_DR(f)r。（8）

在该实现中，通过“遥摄”邻近HRTF的强度作为它们在指定角度下的距离的函数来获得期望HRTF。即：

H_EN(f)≈F(H_C(f)，H_D(f))。（9）

在表达式（9）中，F是H_C(f)、H_D(f)的已知函数。利用（6）、（7），以及（8），可以重写表达式（9）为：

H_EN(f)≈F(H_AL(f)l+H_AR(f)r，H_BL(f)l+H_BR(f)r)=ψ(H_CL(f)，H_DL(f))l+χ(H_CR(f)，H_DR(f))r （10）

在表达式（10）中，ψ和χ是已知函数。经由该强度遥摄，可以根据表达式（9）和/或（10）来确定两个填充圆之间的任何点的HRTF。因此，用户装置204不需要存储声源的所有可能位置的HRTF的值。用户装置204仅需要存储与获得该HRTF所需一样多的HRTF。与表达式（1）到（5）形成对比，表达式（6）到（10）可以或不可以描述线性函数。

图9例示了图7和图8所示3D空间中的区域，其中，HRTF不可以减少。在图9中，图7和图8所示3D空间被分成区域902和区域904。区域902和904分别具有近似半径r和R。在区域902中，因为用户102的头部相对大于用户102的头部与任何圆（即，声源的位置）之间的距离，所以强度遥摄可能没有提供良好的近似HRTF。因此，用户装置204可以不减少针对区域902存储的HRTF的数量。针对区域904，用户装置204可以存储可以被用于强度遥摄的HRTF。在区域902和904之外，根据指定位置的HRTF可以与其它HRTF近似的程度，用户装置204可以存储更少的HRTF。

在一些实现中，用户装置204可以基于声学环境的对称性来存储较少的HRTF。例如，在图7中，假定位于用户102的头部右侧的圆的位置与位于用户102的头部左侧的圆是对称的。在这种情况下，可能仅需要存储用户102的头部右侧的HRTF。如果位于用户102的头部右侧的HRTF用HR(f)指示，而镜像HRTF用HL(f)指示，则HR(f)和HL(f)可以表达为：

HR(f)=HR_L(f)l+HR_R(f)r，和（11）

HL(f)=HL_L(f)l+HL_R(f)r。（12）

由于对称性，HL_L(f)=HR_R(f)且HL_R(f)=HR_L(f)。换句话说，HR(f)是HL(f)的转置矩阵。这可以表达为：

HL(f)=HR(f)^T。（13）

图10是用于生成用于强度遥摄的HRTF的示例性处理1000的流程图。下面，处理1000将被描述为由HRTF装置206来执行，尽管处理1000还可以由用户装置204来执行。如图所示，处理1000可以通过确定3D空间中的区域R1（其中，HRTF可以被用于强度遥摄）和区域R2（其中，HRTF不被用于强度遥摄）而开始（框1002）。在区域R2中，对于HRTF装置206或用户装置204来说，可能必须获得用户装置204要仿真由声源在那里生成的声音的每一个位置的HRTF。

HRTF装置206可以设置区域R1内的、要计算HRTF的距离D的初始值（框1004）和初始角度A（框1006）。按D和A的当前值，HRTF装置206可以确定强度遥摄所需的HRTF（框1008）。如上所述，HRTF装置206可以使用不同技术（例如，FEM）来计算HRTF。

HRTF装置206可以确定是否已经计算出用于仿真来自不同角度（例如，在用户102的头部中心与一个轴相对地测量的角度）的声源的HRTF（框1010）。如果HRTF没有计算出（框1010：否），则HRTF装置206可以按预定量递增当前角度A（要计算HRTF的角度），并且进行到框1008，以计算/确定另一HRTF。否则（框1010：是），HRTF装置206可以修改要计算HRTF的当前距离（框1014）。

如果要仿真声源的相距用户102的头部的距离D的位置落在可以应用强度遥摄的区域R1内（框1016：是），则HRTF装置20e4可以进行至框1006。否则（框1016：否），处理1000可以终止。

图11是基于根据处理1000生成的HRTF来应用强度遥摄的示例性处理1100的流程图。处理1100可以包括获得用于选择声源或用户装置204要仿真该声源的特定位置的标识符（框1002）。取决于实现方式，用户装置204可以接收来自另一装置、来自安装在用户装置204上的程序，或来自用户的标识符。基于该标识符，用户装置204可以确定用户装置206可以仿真声源的角度C和/或距离D（框1104）。

一旦用户装置204确定了距离D，用户装置204就可以确定两个距离V和W，以使V≤D≤W，其中，V和W是最接近D的，HRTF数据库502包括可以被用于强度遥摄的HRTF集的距离（框1106）。接下来，用户装置204可以将强度遥摄距离（IPD）设置为V（框1108）。

给定IPD=V，用户装置204可以选择两个角度A和B，以使A≤C≤B，其中，A和B是最接近C的、HRTF数据库502包括可以被用于强度遥摄的两个对应HRTF（上面在框1106处提到的HRTF集/组当中）的角度（框1110）。通过应用与表达式（4）和（5）相似或相同的一个或更多个表达式，用户装置204可以获得针对IPD=V的HRTF（框1112）。

用户装置204可以设置IPD=W（框1114）。接下来，用户装置204可以选择两个新的角度A和B，以使A≤C≤B。如在框1110，A和B是最接近C的、HRTF数据库502包括可以被用于强度遥摄的两个对应HRTF（上面在框1106处提到的HRTF集当中）的角度（框1116）。通过应用与表达式（4）和（5）相似或相同的表达式，用户装置204可以获得针对IPD=W的HRTF（框1118）。

一旦用户装置204确定了IPD=V和W下的HRTF（将它们称作HRTFV和HRTFW），用户装置204就可以经由根据表达式（9）和（10）或其它相同或相似表达式的强度遥摄，而使用HRTFV和HRTFW来获得距离D下的HRTF。

在某些情况下，V=W且用户装置204可以仅使用框112的结果作为针对距离D和角度A处的源的HRTF。而且，在一些情况下，C=A（并且C=B）。在这种情况下，处理1100可以通过在HRTF数据库402中简单查寻针对角度A的HRTF来获得HRTF，并且将不会需要基于HRTF数据库402中的两个HRTF来执行强度遥摄。

处理1100应用以生成作为两个变量（例如，角度C和距离D）的函数的3D声音，并且可以涉及利用多达四对HRTF（参见框1112、1118以及1120）。在其它实现中，类似于处理1100的处理可以被实现以生成作为三个变量（例如，柱坐标系下的距离D、方位角C以及仰角E，球坐标***下的半径距离P、方位角C以及仰角G等）的函数的3D声音。在这种实现中，与如在图7中存储针对作为两个变量的函数的方位/位置的HRTF不同，用户装置204可以按作为3D空间中的三个变量的函数的方位/位置来存储HRTF（未示出）。

在这种实现中，确定总估计HRTF可以涉及利用多达八对HRTF（在包围声源实际上位于的位置的空间中，立方体状体积的角）。例如，一个仰角下的四对HRTF可以被用于生成第一估计HRTF（例如，经由处理1100），而另一仰角下的四对HRTF可以被用于生成第二估计HRTF（例如，经由处理1100）。对第一和第二估计HRTF进行强度遥摄就产生了总估计HRTF。

在用户装置204或另一装置基于所存储的HRTF来确定所估计的HRTF之后（例如，参见图11中的框1120），用户装置204接着可以将所得的估计HRTF应用至音频信号，以生成输出信号。例如，假定X(f)是音频信号，Y(f)是输出信号，而H_T(f)是所估计的HRTF，其中，H_T(f)根据下列表达式来确定：

H_T(f)=αH_A(f)+βH_B(f)。（11）

接着，用户装置204根据以下表达式来确定输出信号Y(f)：

Y(f)=X(f)H_T(f)。（12）

在一些实现中，所存储的HRTF可以首先应用至音频信号，以获得中间信号，并且该中间信号接着可以被用于生成输出信号。即，与根据表达式（12）确定Y(f)不同，用户装置204可以依靠以下表达式：

Y(f)=αX(f)H_A(f)+βX(f)H_B(f) （14）

即，在这些实现中，用户装置204可以首先估计αX(f)H_A(f)和βX(f)H_B(f)，接着将所得估计值求和，以获得Y(f)。表达式（14）是通过将表达式（11）代入表达式（12）中而获得的。

结论

如上所述，***可以根据头部相关传递函数（HRTF）来驱动多个扬声器，以产生逼真的立体声。该HRTF可以通过对预先计算的HRTF进行强度遥摄来确定。该强度遥摄允许针对该***预先计算较少的HRTF。

本实现的前述描述提供了例示，但不是旨在排它或将本实现限制成所公开的精确形式。根据上述教导，可以进行修改例和变型例，或者可以根据教导的实践来获得。

例如，在上文中，用户装置204被描述为将HRTF应用至音频信号。在一些实现中，用户装置204可以将这种计算转移至一个或更多个远程装置。所述一个或更多个远程装置接着可以向用户装置204发送要向耳机110中继的处理信号，或者，另选的是，直接向耳机110发送该处理信号。

在另一个实施例中，当用户装置204要仿真立体声的声学环境是对称时，用户装置204可以进一步减少所存储的HRTF的数量。例如，在图7中，假定该声学环境针对行经用户102的头部的中心的垂直轴对称，则仅需要存储该垂直轴一侧上的HRTF。如果需要处于该垂直轴的另一侧上的HRTF，则用户装置204可以经由表达式（13）来获得HRTF。所存储的HRTF的数量是否可以减少可以取决于存在于声学环境中的具体对称性（例如，与用户102的头部的中心相对的对称性、与屏幕相对的对称性等）。

在上文中，虽然参照示例性处理描述了一系列框，但这些框的次序可以在其它实现中修改。另外，非相关框可以表示可以与其它框并行执行的动作。而且，根据功能部件的实现，一些框可以从一个或更多个处理中省略。

应当明白，本文描述的方面可以在图中所示实现中按软件、固件以及硬件的许多不同形式来实现。用于实现多个方面的实际软件代码或专用控制硬件不限制本发明。由此，这些方面的操作和行为未参照具体软件代码来描述，其被理解成，软件和控制硬件可以被设计成基于在此的描述来实现这些方面。

应当强调的是，措辞“包括”当在本说明书中使用时被采取以指定存在规定特征、要件、步骤或部件，而非排除存在或增加一个或更多个其它特征、要件、步骤、部件，或其组合。

而且，本实现的特定部分已经被描述为执行一个或更多个功能的“逻辑”。该逻辑可以包括硬件（如处理器、微处理器、专用集成电路，或现场可编程门阵列）、软件，或硬件和软件的组合。

除非同样地明确描述，对于本文描述的实现来说，本申请中使用的任何部件、动作或指令都不应被解释为关键或必要的。而且，文中使用的未指明单复数的情况旨在包括一个或更多个项目。而且，除非另外明确地规定，短语“基于”意指“至少部分地基于”。

Claims

1.一种包括装置的***，该装置包括：

存储器，其被设置成存储用于对来自三维（3D）空间中的源的立体声进行仿真的多个头部相关传递函数（HRTF）的子集，所述多个HRTF中的每一个HRTF都对应于所述立体声的被用户感知到的方向；

输出接口，其用于接收来自处理器的音频信息，并且输出与所述音频信息相对应的信号；

该处理器被设置成：

获得要由听到仿真立体声的用户感知到的用于生成所述仿真立体声的方向；

确定所述多个HRTF的所述子集是否包括与所述方向相对应的第一HRTF，其中，所述多个HRTF包括所述第一HRTF；

当所述处理器确定所述多个HRTF的所述子集不包括所述第一HRTF时，使用所述多个HRTF的所述子集中的两个HRTF来获得所述第一HRTF的所估计的HRTF；以及

将所估计的HRTF应用至音频信号以生成所述音频信息。

2.根据权利要求1所述的***，所述***还包括：

耳机，其被设置成接收所述信号并生成右耳声音和左耳声音。

3.根据权利要求2所述的***，其中，当所述耳机接收所述信号时，所述耳机通过无线通信链路接收所述信号。

4.根据权利要求2所述的***，其中，所述耳机包括以下一种：

头戴式受话器；耳塞；入耳式扬声器；或者耳甲内扬声器。

5.根据权利要求1所述的***，其中，所述装置包括以下一种：

平板计算机；移动电话；个人数字助理；或者游戏机。

6.根据权利要求1所述的***，所述***还包括：

远程装置，其被设置成生成所述多个HRTF的所述子集。

7.根据权利要求1所述的***，其中，所述多个HRTF包括作为所述多个HRTF的所述子集的镜像的HRTF。

8.根据权利要求1所述的***，其中，当所述处理器使用所述多个HRTF的所述子集中的所述两个HRTF来获得所估计的HRTF时，所述处理器被设置成：

选择两个方向，这两个方向最靠近所述立体声的所述方向，并且这两个方向的两个对应HRTF被包括在存储于所述存储器中的所述多个HRTF的所述子集中；

从所述存储器获取所述两个HRTF；以及

形成所获取的两个HRTF的线性组合，以获得所估计的HRTF。

9.根据权利要求8所述的***，其中，当所述处理器形成所获取的两个HRTF的线性组合时，所述处理器被进一步设置成：

获得第一系数和第二系数；

获得所述第一系数与所获取的两个HRTF中的一个HRTF的第一乘积；

获得所述第二系数与所获取的两个HRTF中的另一个HRTF的第二乘积；以及

将所述第一乘积与所述第二乘积相加，以获得所估计的HRTF。

10.根据权利要求1所述的***，其中，当所述处理器确定所述多个HRTF的所述子集包括所述第一HRTF时，所述处理器被进一步设置成：

从所述存储器获取所述第一HRTF。

11.一种方法，该方法包括以下步骤：

存储用于对来自三维（3D）空间中的源的立体声进行仿真的多个头部相关传递函数（HRTF）的子集，所述多个HRTF中的每一个HRTF都对应于听到所述立体声的用户感知到所述立体声抵达的一个方向；

获得所述用户将感知到第一立体声抵达的第一方向；

在所述多个HRTF的所述子集中选择第一所存储的HRTF和第二所存储的HRTF，其中，与所述第一所存储的HRTF和第二所存储的HRTF相关联的方向相比于所述多个HRTF的所述子集中的其它HRTF的方向，更靠近所述第一方向；

将所述第一所存储的HRTF应用至音频信号，以获得第一中间信号；

将所述第二所存储的HRTF应用至所述音频信号，以获得第二中间信号；以及

基于所述第一中间信号和所述第二中间信号来生成用于头戴式受话器的输出信号。

12.根据权利要求11所述的方法，所述方法还包括以下步骤：

通过连接至所述头戴式受话器的线来发送用于所述头戴式受话器的所述输出信号。

13.根据权利要求11所述的方法，所述方法还包括以下步骤：

从远程装置接收所述多个HRTF的所述子集。

14.根据权利要求11所述的方法，其中，所述多个HRTF包括作为所述多个HRTF的所述子集的镜像的HRTF。

15.根据权利要求11所述的方法，其中，生成所述输出信号的步骤包括：

计算所述第一中间信号与所述第二中间信号的线性组合。

16.根据权利要求11所述的方法，所述方法还包括以下步骤：

当所述多个HRTF的所述子集包括所述第一HRTF时，从所述存储器获取所述第一HRTF。

17.根据权利要求11所述的方法，所述方法还包括以下步骤：

获得所述用户将感知到所述第一立体声抵达的距离。

18.根据权利要求17所述的方法，所述方法还包括以下步骤：

确定由所述第一方向和所述距离确定的声音源的位置是否处于所述3D空间中的、不能通过所述多个HRTF的所述子集中的一个或更多个HRTF来估计所述第一HRTF的区域内；以及

当所述声音源的位置被确定为处于所述区域内时，获取与所述声音源的位置相对应的HRTF，并将所获取的HRTF应用至所述音频信号以生成用于所述头戴式受话器的所述输出信号。

19.一种包括计算机可读指令的计算机可读介质，该计算机可读指令用于将一个或更多个处理器设置成：

存储用于对来自三维（3D）空间中的源的立体声进行仿真的多个头部相关传递函数（HRTF）的子集，所述多个HRTF中的每一个HRTF都对应于一个距离和方向，听到所述立体声的用户感知到所述立体声是从该距离和方向抵达的；

获得第一方向和第一距离，所述用户将会感知到第一立体声是从该第一方向和第一距离抵达的；

确定所述多个HRTF的所述子集是否包括与所述第一方向和所述第一距离相对应的第一HRTF，其中，所述多个HRTF包括所述第一HRTF；

选择所述多个HRTF的所述子集中的与一个距离相对应的前两个HRTF；

当所述多个HRTF的所述子集不包括所述第一HRTF时，使用所述多个HRTF的所述子集中的所述前两个HRTF来获得第一个所估计的HRTF；

选择所述多个HRTF的所述子集中的与另一个距离相对应的再两个HRTF；

当所述多个HRTF的所述子集不包括所述第一HRTF时，使用所述多个HRTF的所述子集中的所述再两个HRTF来获得第二个所估计的HRTF；

基于所述第一个所估计的HRTF和所述第二个所估计的HRTF来确定所述第一HRTF的第三个所估计的HRTF；以及

将所述第三个所估计的HRTF应用至音频信号以生成用于驱动头戴式受话器的输出信号，

其中，所述第一距离位于所述一个距离与所述另一个距离之间。

20.根据权利要求19所述的计算机可读介质，所述计算机可读介质还包括用于进一步设置所述处理器执行以下操作的计算机可执行指令：

通过无线通信链路来发送用于所述头戴式受话器的所述输出信号。