WO2022237851A1

WO2022237851A1 - 一种音频编码、解码方法及装置

Info

Publication number: WO2022237851A1
Application number: PCT/CN2022/092310
Authority: WO
Inventors: 刘帅; 高原; 王宾; 夏丙寅; 王喆
Original assignee: 华为技术有限公司
Priority date: 2021-05-14
Filing date: 2022-05-11
Publication date: 2022-11-17
Also published as: TW202248995A; US20240079016A1; EP4318470A1; CN115346537A

Abstract

一种音频编码、解码方法及装置，在对当前帧的音频通道信号编码时，先确定第一目标虚拟扬声器与当前帧的前一帧的音频通道信号对应的第二目标虚拟扬声器是否满足设定条件，在满足时，根据前一帧的音频通道信号的第二编码参数确定当前帧的音频通道信号的第一编码参数，从而根据第一编码参数对当前帧的音频通道信号进行编码获得编码结果并将编码结果写入码流。

Description

一种音频编码、解码方法及装置

相关申请的交叉引用

本申请要求在2021年05月14日提交中华人民共和国知识产权局、申请号为202110530309.1、申请名称为“一种音频编码、解码方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及编解码技术领域，尤其涉及一种音频编码、解码方法及装置。

背景技术

三维音频技术是对真实世界中的声音事件和三维声场信息进行获得、处理、传输和渲染回放的音频技术。三维音频技术使声音具有强烈的空间感、包围感及沉浸感，给人以“声临其境”的非凡听觉体验。高阶立体混响(higher order ambisonics，HOA)技术具有在录制、编码与回放阶段与扬声器布局无关的性质和HOA格式数据的可旋转回放特性，在进行三维音频回放时具有更高的灵活性，因而也获得了更为广泛的关注和研究。

为了实现更好的音频听觉效果，HOA技术需要大量的数据量用于记录更详细的声音场景的信息。虽然这种根据场景的三维音频信号采样和存储更加利于音频信号空间信息的保存和传输，但随着HOA阶数的增加，数据量也会增加，大量的数据造成传输和存储的困难，因此需要对HOA信号进行编解码。

待编码的HOA信号通过编码产生虚拟扬声器信号和残差信号，然后进一步对虚拟扬声器信号和残差信号进行编码后获得码流。通常情况下，在针对虚拟扬声器信号和残差信号进行编码时，针对每一帧的虚拟扬声器信号和残差信号进行编解码处理。但是只考虑了当前帧的信号间的相关性，对每一帧的虚拟扬声器信号和残差信号编码，导致计算复杂度较高，编码效率较低。

发明内容

本申请实施例提供一种音频编码、解码方法及装置，用以解决计算复杂度高的问题。

第一方面，本申请实施例提供一种音频编码方法，包括：获得当前帧的音频通道信号，所述当前帧的音频通道信号是通过第一目标虚拟扬声器对原始高阶立体混响HOA信号进行空间映射获得的；在确定所述第一目标虚拟扬声器与第二目标虚拟扬声器满足设定条件时，根据所述当前帧的前一帧的音频通道信号的第二编码参数确定所述当前帧的音频通道信号的第一编码参数，所述前一帧的音频通道信号与所述第二目标虚拟扬声器对应；根据所述第一编码参数对所述当前帧的音频通道信号进行编码；将所述当前帧的音频通道信号的编码结果写入码流。通过上述方法，在当前帧进行编码时，如果与前一帧匹配的虚拟扬声器之间的邻近时，可以根据前一帧的编码参数确定当前帧的编码参数，从而不需要再重新计算当前帧的编码参数，可以提高编码效率。

在一种可能的设计中，所述方法还包括：将所述第一编码参数写入码流。上述设计中，将根据前一帧的编码参数确定的编码参数作为当前帧的编码参数写入码流，实现对端获得编码参数的同时，提高编码效率。

在一种可能的设计中，所述第一编码参数包括通道间配对参数、通道间听觉空间参数或者通道间比特分配参数中的一项或者多项。

在一种可能的设计中，所述通道间听觉空间参数包括通道间声级差ILD、通道间时间差ITD或者通道间相位差IPD中的一项或者多项。

在一种可能的设计中，所述设定条件包括所述第一空间位置与所述第二空间位置重叠；所述根据所述前一帧的音频通道信号的第二编码参数确定当前帧的音频通道信号的第一编码参数，包括：将所述前一帧的音频通道信号的第二编码参数作为所述当前帧的音频通道信号的第一编码参数。通过上述设计，在前一帧的目标虚拟扬声器的空间位置与当前帧的目标虚拟扬声器的空间位置重叠时，复用前一帧的编码参数作为当前帧的编码参数，考虑到音频通道信号之间的帧间空间相关性，无需再计算当前帧的编码参数，可以提高编码效率。

在一种可能的设计中，所述方法还包括：将复用标识写入码流，所述复用标识的取值为第一值，所述第一值指示所述当前帧的音频通道信号的第一编码参数复用所述第二编码参数。上述设计中，通过将复用标识写入码流，来通知解码侧确定当前帧的编码参数的方式，简单且有效。

在一种可能的设计中，所述第一空间位置包括所述第一目标虚拟扬声器的第一坐标，所述第二空间位置包括所述第二目标虚拟扬声器的第二坐标，所述第一空间位置与所述第二空间位置重叠包括所述第一坐标与所述第二坐标相同；或所述第一空间位置包括所述第一目标虚拟扬声器的第一序号，所述第二空间位置包括所述第二目标虚拟扬声器的第二序号，所述第一空间位置与所述第二空间位置重叠包括所述第一序号与所述第二序号相同；或所述第一空间位置包括所述第一目标虚拟扬声器的第一HOA系数，所述第二空间位置包括所述第二目标虚拟扬声器的第二HOA系数，所述第一空间位置与所述第二空间位置重叠包括所述第一HOA系数与所述第二HOA系数相同。上述设计中，通过坐标、序号或者HOA系数来表征空间位置，用于确定前一帧的虚拟扬声器与当前帧的虚拟扬声器是否重叠，简单且有效。

在一种可能的设计中，所述第一目标虚拟扬声器包括M个虚拟扬声器，所述第二目标虚拟扬声器包括N个虚拟扬声器；所述设定条件包括所述第一目标虚拟扬声器的第一空间位置与所述第二目标虚拟扬声器的第二空间位置不重叠且所述第一目标虚拟扬声器包括的第m个虚拟扬声器位于以所述第二目标虚拟扬声器包括的第n个虚拟扬声器为中心的设定范围内，其中，m遍历小于或者等于M的正整数，n遍历小于或者等于N的正整数；所述根据所述前一帧的音频通道信号的第二编码参数确定当前帧的音频通道信号的第一编码参数，包括：按照设定比例调整所述第二编码参数获得所述第一编码参数。上述设计中，在前一帧的目标虚拟扬声器的空间位置与当前帧的目标虚拟扬声器的空间位置不重叠但邻近时，通过前一帧的编码参数调整当前帧的编码参数，考虑到音频通道信号之间的帧间空间相关性，无需再通过复杂的计算方式来计算当前帧的编码参数，可以提高编码效率。

其中，本发明实施例中，第一编码参数可以是一个编码参数也可以是多个编码参数，所述的调整可以是缩小，或者放大，或者部分缩小且另一部分不变，或者部分放大且另一部分不变，或者部分缩小且另一部分放大，或者部分缩小，部分不变且部分放大。

在一种可能的设计中，当所述第一空间位置包括所述第一目标虚拟扬声器的第一坐标，所述第二空间位置包括所述第二目标虚拟扬声器的第二坐标时，所述第m个虚拟扬声器是否位于以所述第n个虚拟扬声器为中心的设定范围内通过所述第m个虚拟扬声器与所述第n个虚拟扬声器之间的相关度确定，其中，所述相关度满足如下条件：

其中，R表示相关度，norm()表示归一化运算，M _H为当前帧的第一目标虚拟扬声器包括的虚拟扬声器的坐标组成的矩阵，

为前一帧的第二目标虚拟扬声器包括的虚拟扬声器的坐标组成的矩阵的转置；当所述相关度大于设定值时，所述第m个虚拟扬声器位于以所述第n个虚拟扬声器为中心的设定范围内。上述设计提供一种简单且有效的确定前一帧的虚拟扬声器与当前帧的虚拟扬声器的邻近关系。

在一种可能的设计中，所述方法还包括：将复用标识写入码流，所述复用标识的取值为第二值，所述第二值指示所述当前帧的音频通道信号的第一编码参数通过按照设定比例调整所述第二编码参数获得。

在一种可能的设计中，所述方法还包括：将所述设定比例写入所述码流。通过上述设计，将设定比例通过码流通知到解码侧，从而解码侧根据设定比例确定当前帧的编码参数，使得解码侧获得编码参数的同时，提高编码效率。

第二方面，本申请实施例提供了一种音频解码方法，包括：从码流中解析复用标识，所述复用标识指示当前帧的音频通道信号的第一编码参数通过所述当前帧的前一帧的音频通道信号的第二编码参数确定；根据所述前一帧的音频通道信号的第二编码参数确定所述第一编码参数；根据所述第一编码参数从所述码流中解码所述当前帧的音频通道信号。通过上述设计，解码侧无需在从码流解析编码参数，可以提高解码效率。

在一种可能的设计中，根据所述前一帧的音频通道信号的第二编码参数确定所述第一编码参数，包括：当所述复用标识的取值为第一值时，所述第一值指示所述第一编码参数复用所述第二编码参数，获得所述第二编码参数作为所述第一编码参数。通过上述设计，无需从码流中解码各个编码参数，仅需解码复用标识，可以提高解码效率。

在一种可能的设计中，根据所述前一帧的音频通道信号的第二编码参数确定所述第一编码参数，包括：当所述复用标识的取值为第二值时，所述第二值指示所述第一编码参数通过按照设定比例调整所述第二编码参数获得，按照设定比例调整所述第二编码参数获得所述第一编码参数。

在一种可能的设计中，所述方法还包括：当所述复用标识的取值为第二值时，从所述码流中解码获得所述设定比例。

在一种可能的设计中，所述音频通道信号的编码参数包括通道间配对参数、通道间听觉空间参数或者通道间比特分配参数中的一项或者多项。

第三方面，本申请实施例提供一种音频编码装置，有益效果可以参见第一方面的相关描述，此处不再赘述。音频编码装置包括用于实施第一方面的任意一种方法的若干个功能单元。举例来说，音频编码装置可以包括空间编码单元，用于获得当前帧的音频通道信号，所述当前帧的音频通道信号是通过第一目标虚拟扬声器对原始高阶立体混响HOA信号进行空间映射获得的；核心编码单元，用于在确定所述第一目标虚拟扬声器与第二目标虚拟扬声器满足设定条件时，根据所述当前帧的前一帧的音频通道信号的第二编码参数确定当前帧的音频通道信号的第一编码参数，所述前一帧的音频通道信号与所述第二目标虚拟扬声器对应；根据所述第一编码参数对所述当前帧的音频通道信号进行编码，并将所述当前帧的音频通道信号的编码结果写入码流。

在一种可能的设计中，所述核心编码单元，还用于将所述第一编码参数写入码流。

在一种可能的设计中，所述设定条件包括所述第一目标虚拟扬声器的第一空间位置与所述第二目标虚拟扬声器的第二空间位置重叠；所述核心编码单元，具体用于将所述前一帧的音频通道信号的第二编码参数作为所述当前帧的音频通道信号的第一编码参数。

在一种可能的设计中，所述核心编码单元，还用于将复用标识写入码流，所述复用标识的取值为第一值，所述第一值指示所述当前帧的音频通道信号的第一编码参数复用所述第二编码参数。

在一种可能的设计中，所述第一空间位置包括所述第一目标虚拟扬声器的第一坐标，所述第二空间位置包括所述第二目标虚拟扬声器的第二坐标，所述第一空间位置与所述第二空间位置重叠包括所述第一坐标与所述第二坐标相同；或所述第一空间位置包括所述第一目标虚拟扬声器的第一序号，所述第二空间位置包括所述第二目标虚拟扬声器的第二序号，所述第一空间位置与所述第二空间位置重叠包括所述第一序号与所述第二序号相同；或所述第一空间位置包括所述第一目标虚拟扬声器的第一HOA系数，所述第二空间位置包括所述第二目标虚拟扬声器的第二HOA系数，所述第一空间位置与所述第二空间位置重叠包括所述第一HOA系数与所述第二HOA系数相同。

在一种可能的设计中，所述第一目标虚拟扬声器包括M个虚拟扬声器，所述第二目标虚拟扬声器包括N个虚拟扬声器；所述设定条件包括所述第一目标虚拟扬声器的第一空间位置与所述第二目标虚拟扬声器的第二空间位置不重叠且所述第一目标虚拟扬声器包括的第m个虚拟扬声器位于以所述第二目标虚拟扬声器包括的第n个虚拟扬声器为中心的设定范围内，其中，m遍历小于或者等于M的正整数，n遍历小于或者等于N的正整数；所述核心编码单元，具体用于按照设定比例调整所述第二编码参数获得所述第一编码参数。

为前一帧的第二目标虚拟扬声器包括的虚拟扬声器的坐标组成的矩阵的转置；

当所述相关度大于设定值时，所述第m个虚拟扬声器位于以所述第n个虚拟扬声器为中心的设定范围内。

在一种可能的设计中，所述核心编码单元，还用于将复用标识写入码流，所述复用标识的取值为第二值，所述第二值指示所述当前帧的音频通道信号的第一编码参数通过按照设定比例调整所述第二编码参数获得。

在一种可能的设计中，所述核心编码单元，还用于将所述设定比例写入所述码流。

第四方面，本申请实施例提供一种音频解码装置，有益效果可以参见第二方面的相关描述，此处不再赘述。音频解码装置包括用于实施第三方面的任意一种方法的若干个功能单元。举例来说，音频解码装置可以包括：核心解码单元，用于从码流中解析复用标识，所述复用标识指示当前帧的音频通道信号的第一编码参数通过所述当前帧的前一帧的音频通道信号的第二编码参数确定；根据所述前一帧的音频通道信号的第二编码参数确定所述第一编码参数；根据所述第一编码参数从所述码流中解码所述当前帧的音频通道信号；空间解码单元，用于对所述音频通道信号进行空间解码获得高阶立体混响HOA信号。

在一种可能的设计中，所述核心解码单元，具体用于当所述复用标识的取值为第一值时，所述第一值指示所述第一编码参数复用所述第二编码参数，获得所述第二编码参数作为所述第一编码参数。

在一种可能的设计中，所述核心解码单元，具体用于当所述复用标识的取值为第二值时，所述第二值指示所述第一编码参数通过按照设定比例调整所述第二编码参数获得，按照设定比例调整所述第二编码参数获得所述第一编码参数。

在一种可能的设计中，所述核心解码单元，具体用于当所述复用标识的取值为第二值时，从所述码流中解码获得所述设定比例。

第五方面，本申请实施例提供一种音频编码器，所述视频编码器用于编码HOA信号。示例性的，音频编码器可以实现第一方面所述的方法。音频编码器可以包括第三方面中任一设计所述的装置。

第六方面，本申请实施例提供一种音频解码器，所述视频解码器用于从码流中解码HOA信号。示例性的，音频解码器可以实现第二方面的任一种设计所述的方法。音频解码器包括第四方面的任一设计所述的装置。

第七方面，本申请实施例提供一种音频编码设备，包括：相互耦合的非易失性存储器和处理器，所述处理器调用存储在所述存储器中的程序代码以执行第一方面或者第一方面的任一设计所述的方法。

第八方面，本申请实施例提供一种音频解码设备，包括：相互耦合的非易失性存储器和处理器，所述处理器调用存储在所述存储器中的程序代码以执行第二方面或者第二方面的任一设计所述的方法。

第九方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储了程序代码，其中，所述程序代码包括用于执行第一方面至第二方面的任意一种方法的部分或全部步骤的指令。

第十方面，本申请实施例提供一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机执行第一方面至第二方面的任意一种方法的部分或全部步骤。

第十一方面，本申请实施例提供一种计算机可读存储介质，包括第一方面的任意一种方法所获得的码流。

应当理解的是，本申请的第三至十方面的有益效果可以参见第一方面和第二方面的相关描述，不再赘述。

附图说明

图1A为本申请实施例中一种音频编码及解码***100的示意性框图；

图1B为本申请实施例中音频编码及解码流程的示意性框图；

图1C为本申请实施例中另一种音频编码及解码***示意性框图；

图1D为本申请实施例中又一种音频编码及解码***示意性框图；

图2A为本申请实施例中音频编码组件的结构示意图；

图2B为本申请实施例中音频解码组件的结构示意图；

图3A为本申请实施例中一种音频编码方法流程示意图；

图3B为本申请实施例中另一种音频编码方法流程示意图；

图4A为本申请实施例中一种音频编解码方法流程示意图；

图4B为本申请实施例中另一种音频编解码方法流程示意图；

图5为本申请实施例中音频编码流程示意性框图；

图6为本申请实施例中音频编码装置示意图；

图7为本申请实施例中音频解码装置示意图。

具体实施方式

下面结合本申请实施例中的附图对本申请实施例进行描述。以下描述中，参考形成本公开一部分并以说明之方式示出本申请实施例的具体方面或可使用本申请实施例的具体方面的附图。应理解，本申请实施例可在其它方面中使用，并可包括附图中未描绘的结构或逻辑变化。因此，以下详细描述不应以限制性的意义来理解，且本申请的范围由所附权利要求书界定。例如，应理解，结合所描述方法的揭示内容可以同样适用于执行所述方法的对应设备或***，且反之亦然。例如，如果描述一个或多个具体方法步骤，则对应的设备可以包含如功能单元等一个或多个单元，来执行所描述的一个或多个方法步骤(例如，一个单元执行一个或多个步骤，或多个单元，其中每个都执行多个步骤中的一个或多个)，即使附图中未明确描述或说明这种一个或多个单元。另一方面，例如，如果根据如功能单元等一个或多个单元描述具体装置，则对应的方法可以包含一个步骤来执行一个或多个单元的功能性(例如，一个步骤执行一个或多个单元的功能性，或多个步骤，其中每个执行多个单元中一个或多个单元的功能性)，即使附图中未明确描述或说明这种一个或多个步骤。进一步，应理解的是，除非另外明确提出，本文中所描述的各示例性实施例和/或方面的特征可以相互组合。

本文所提及的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性，而只是用来区分不同的组成部分。同样，“一个”或者“一”等类似词语也不表示数量限制，而是表示存在至少一个。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电性的连接，不管是直接的还是间接的。

在本文中提及的“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。

下面描述本申请实施例所应用的***架构。参见图1A所示，图1A示例性地给出了本申请实施例所应用的音频编码及解码***100的示意性框图。如图1A所示，音频编码及解码***100可以包括音频编码组件110和音频解码组件120。音频编码组件110用于对HOA信号(或者3D音频信号)进行音频编码。可选地，音频编码组件110可以通过软件实现，或者也可以通过硬件实现，或者还可以通过软硬件结合的形式实现，本申请实施例对此不作具体限定。

参见图1B所示，音频编码组件110对HOA信号(或者3D音频信号)进行编码可以包括如下几个步骤：

1)对获得到的HOA信号进行音频预处理(audio preprocessing)。预处理可以包括滤除掉HOA信号中的低频部分，比如，以20Hz或者50Hz为分界点，提取HOA信号中的方位信息。

HOA信号可以由音频采集组件采集到并发送至音频编码组件110。可选地，音频采集组件可以与音频编码组件110设置于同一设备中；或者，也可以与音频编码组件110设置于不同设备中。

2)对音频预处理后的信号进行编码处理(Audio encoding)打包(File/Segment encapsulation)获得码流。

3)音频编码组件110通过传输信道将码流发送(Delivery)到解码端的音频解码组件120。

音频解码组件120用于对音频编码组件110生成的码流进行解码获得HOA信号。

可选地，音频编码组件110与音频解码组件120之间可以通过有线或者无线的方式相连。音频解码组件120通过该连接获得音频编码组件110生成的码流；或者，音频编码组件110将生成的码流存储至存储器，音频解码组件120读取存储器中的码流。可选地，音频解码组件120可以通过软件实现；或者，也可以通过硬件实现；或者，还可以通过软硬件结合的形式实现，本申请实施例对此不作限定。

音频解码组件120对码流进行解码，获得HOA信号可包括以下几个步骤：

1)对码流进行解包(File/Segment decapsulation)处理。

2)对解包处理的信号进行音频解码(Audio decoding)处理获得解码信号。

3)对解码信号进行渲染(Audio rendering)处理。

4)渲染处理后的信号映射到收听者耳机(headphones)或者音箱上。收听者耳机可以为独立的耳机也可以是眼镜设备等终端设备上的耳机。

可选地，音频编码组件110和音频解码组件120可以设置在同一设备中；或者，也可以设置在不同设备中。设备可以为手机、平板电脑、膝上型便携计算机和台式计算机、蓝牙音箱、录音笔、可穿戴式设备等具有音频信号处理功能的移动终端，也可以是核心网、无线网中具有音频信号处理能力的网元，比如，媒体网关、转码设备、媒体资源服务器等，还可以是应用于虚拟现实(virtual reality，VR)流(streaming)服务中的音频编解码器，本申请实施例对此不作限定。

示意性地，参考图1C，本实施例以音频编码组件110设置于移动终端130中、音频解码组件120设置于移动终端140中，移动终端130与移动终端140是相互独立的具有音频信号处理能力的电子设备，且移动终端130与移动终端140之间通过无线或有线网络连接。

可选地，移动终端130包括音频采集组件131、音频编码组件110和信道编码组件132，其中，音频采集组件131与音频编码组件110相连，音频编码组件110与信道编码组件132相连。

可选地，移动终端140包括音频播放组件141、音频解码组件120和信道解码组件142，其中，音频播放组件141与音频解码组件120相连，音频解码组件120与信道编码组件132相连。移动终端130通过音频采集组件131采集到HOA信号后，通过音频编码组件110对该HOA信号进行编码，获得编码码流；然后，通过信道编码组件132对编码码流进行编码，获得传输信号。

移动终端130通过无线或有线网络将该传输信号发送至移动终端140，比如可以通过无线或者有线网络的通信设备将该传输信号发送至移动终端140中。移动终端130和移动终端140所属的有线或者无线网络的通信设备可以相同，也可以不同。

移动终端140接收到该传输信号后，通过信道解码组件142对传输信号进行解码获得编码码流(可以简称为码流)；通过音频解码组件120对编码码流进行解码获得HOA信号；通过音频播放组件播放该HOA信号。

示意性地，参考图1D，本申请实施例以音频编码组件110和音频解码组件120设置于同一核心网或无线网中具有音频信号处理能力的网元150中为例进行说明。

可选地，网元150包括信道解码组件151、音频解码组件120、音频编码组件110和信道编码组件152。其中，信道解码组件151与音频解码组件120相连，音频解码组件120与音频编码组件110相连，音频编码组件110与信道编码组件152相连。

信道解码组件151接收到其它设备发送的传输信号后，对该传输信号进行解码获得第一编码码流；通过音频解码组件120对第一编码码流进行解码获得HOA信号；通过音频编码组件110对该HOA信号进行编码，获得第二编码码流；通过信道编码组件152对该第二编码码流进行编码获得传输信号。

其中，其它设备可以是具有音频信号处理能力的移动终端；或者，也可以是具有音频信号处理能力的其它网元，本实施例对此不作限定。

可选地，网元中的音频编码组件110和音频解码组件120可以对移动终端发送的编码码流进行转码。

可选地，本实施例中将安装有音频编码组件110的设备称为音频编码设备，在实际实现时，该音频编码设备也可以具有音频解码功能，本申请实施例对此不作限定。将安装有音频解码组件120的设备可以称为音频解码设备。

示意性地，参见图2A所示，音频编码组件110可以包括空间编码器210和核心编码器220。待编码的HOA信号经过空间编码器210进行编码后获得音频信道信号，即待编码的HOA经过空间编码器210产生虚拟扬声器信号和残差信号；核心编码器220对音频信道信号进行编码后获得码流。

示意性地，参见图2B所示，音频解码组件120可以包括核心解码器230和空间解码器240。接收到码流后，通过核心解码器230对码流进行解码后获得音频信道信号；然后空间解码器240根据解码获得的音频信道信号(虚拟扬声器信号和残差信号)，可以获得重建的HOA信号。

作为一种举例，空间编码器210和核心编码器220可以是两个独立的处理单元。空间解码器240和核心解码器230可以是两个独立的处理单元。核心编码器220通常情况下将音频信道信号作为多个单通道信号或立体声通道信号或多通道信号进行编码处理。

核心编码器220会对每一帧的音频通道信号进行编码处理。一种可能的方式是，对每一帧的音频通道信号的编码参数进行计算，然后根据计算获得的编码参数对当前帧的音频通道信号进行编码后写入码流，并将编码参数写入码流。而这种方式仅考虑到音频通道信号间的相关性，忽略音频通道信号的帧间空间相关性，导致编码效率较低。

由于音频通道信号是通过目标虚拟扬声器在原始HOA信号上映射获得的，因此音频通道信号的帧间相关性与HOA信号的虚拟扬声器的选择存在一定联系，当各个虚拟扬声器的空间位置相同或邻近时，音频通道信号在帧间有较强相关性。根据此，考虑到音频通道信号的帧间相关性，本申请实施例提供一种编解码方式，通过当前帧对应的虚拟扬声器和前一帧对应的虚拟扬声器之间的邻近关系，如果邻近或者位置重叠，可以根据前一帧的编码参数确定当前帧的编码参数，从而不再通过各个编码参数的计算算法来计算当前帧的编码参数，可以提高编码效率。

在对本申请实施例提供的编解码方案进行详细描述之前，下面先对本申请实施例可能涉及的一些概念进行简单介绍。本申请的实施方式部分使用的术语仅用于对本申请的具体实施例进行解释，而非旨在限定本申请。

(1)HOA信号是声场的三维(3D)表示。HOA信号通常由多个球谐系数(spherical harmonic coefficient，SHC)或者其它层次元素表示。根据HOA理论，对于理想的具有特定方向的信号(比如，远场的点声源信号或者平面波信号)，其对应的HOA信号在各个通道之间只存在幅度上的差异，因此可以用单通道信号和各个通道分别对应的一组比例系数进行表示。HOA技术中通常会将HOA信号转为实际扬声器信号后进行回放，或者将HOA信号转为虚拟扬声器(virtual loudspeaker，VL)信号再映射到双耳对应的扬声器信号进行回放。其中(虚拟)扬声器的选择对重建信号质量至关重要。

(2)当前帧是指对音频信号采集获得的一定长度的样点，比如960点或者1024点。前一帧，是指当前帧的前一帧，比如，当前帧为第n帧，则前一帧为第n-1帧。前一帧也可以称为在先帧。

(3)音频通道信号，可以包括多通道的虚拟扬声器信号，或者包括多通道的虚拟扬声器信号和残差信号。比如，待编码的HOA信号经过多个虚拟扬声器映射获得多通道的虚拟扬声器信号和残差信号。虚拟扬声器的通道数据和残差信号的通道数可以是预先设定的。音频通道信号也可以称为传输通道，还可以采用的其它的名称，本申请对此不作具体限定。作为一种举例，虚拟扬声器信号的获得可以是根据匹配投影算法从虚拟扬声器集合中选择匹配待编码的当前帧HOA信号的目标虚拟扬声器，根据当前帧的HOA信号和选择的目标虚拟扬声器获得虚拟扬声器信号。残差信号可以是根据待编码HOA信号和虚拟扬声器信号获得的。

(4)编码参数。例如，编码参数可以包括通道间配对参数、通道间听觉空间参数或者通道间比特分配参数中的一项或者多项。

通道间配对参数用于表征音频通道信号包括的多个音频信号分别所属的通道之间的配对关系(或者称为分组关系)。通道间配对音频信号的各个传输通道之间通过相关性等准则进行配对，实现传输通道高效编码的一种计算方法。

作为一种示例，音频通道信号可以包括虚拟扬声器信号和残差信号。如下示例性地描述通道间配置参数的确定方式：

举例来说，音频通道信号可以被划分为两组，虚拟扬声器信号为一组，称为虚拟扬声器信号组，残差信号为一组，称为残差信号组。虚拟扬声器信号组包含M个由单通道组成的虚拟扬声器信号，M为大于2的正整数，残差信号组包含N个由单声道组成的残差信号，N为大于2的正整数。例如，M＝4，N＝4。通道间配对结果可以为两两通道配对，也可以为三个或更多通道配对，也可以为通道间不配对。以通道间两两配对为例，通道间配对参数指的是在每组内不同的信号组成一对的选择结果。以虚拟扬声器信号组为例，例如虚拟扬声器信号组包括4个通道，分别为通道1，通道2，通道3，通道4。例如，通道间配对参数可以为通道1和通道2配对，通道3和通道4配对，或通道1和通道3配对，通道2和通道4配对，或通道1和通道2配对，通道3和通道4不配对等情况。通道间配对参数确定的方式，本申请不作具体限定。作为一种举例，可以采用构建通道间相关矩阵W的方法确定通道间配对参数，例如，参见公式(1)：

其中，m11-m44均表示两个通道之间的相关性，进一步令矩阵对角元素值为0，以获得W’，参见公式(2)：

通道间配对的原则可以是W′中元素取得最大值时的序号，此时通道间配对参数可以为矩阵元素的序号。

通道间听觉空间参数用于表征人耳对听觉空间声像特性的感知程度。示例性地，通道间听觉空间参数可以包括通道间声级差(inter-channel level difference，ILD)(也可以称为声道间声级差)、通道间时间差(inter-channel time difference，ITD)(也可以称为声道间时间差)或者通道间相位差(inter-channel phase difference，IPD)(也可以称为声道间相位差)中的一项或者多项。

以ILD参数为例，ILD参数可以为音频通道信号中每个通道的信号能量相对于所有通道能量平均值的比值。作为一种举例，ILD参数可以由各通道的比值绝对值和调整方向值两个参数组成。本申请实施例对ILD、ITD或者IPD的确定方式不作具体限定。

以ITD参数为例，例如音频通道信号包括的两个通道的信号，分别为通道1和通道2，则ITD参数可以为音频通道信号中两个通道的时间差的比值。以IPD参数为例，例如音频通道信号包括的两个通道的信号，分别为通道1和通道2，则IPD参数可以为音频通道信号中两个通道的相位差的比值。

通道间比特分配参数用于表征音频通道信号包括的多个音频信号分别所属的通道在编码时的比特分配关系。示例性的，通道间比特分配时可以采用根据能量的通道间比特分配方式来实现。例如待分配比特的通道包括4个通道，分别为通道1，通道2，通道3，通道4。待分配比特通道可以是音频通道信号包括的多个音频信号所属的通道，也可以是经过对音频通道信号进行通道配对后的下混获得的多个通道，也可以是经过通道间ILD计算和通道间配对下混后获得的多个通道。通过通道间比特分配可以获得通道1、通道2、通道3和通道4的比特分配比值，该比特分配的比值即可作为通道间比特分配参数，例如通道1占用3/16、通道2占用5/16、通道3占用6/16和通道4占用2/16。通道间比特分配所采用的方式，本申请实施例中不作具体限定。

参见图3A和图3B所示，为本申请一个示例性实施例提供的编码方法的流程示意图。编码方法可以由音频编码设备来实现，或者由音频编码组件来实现，或者由核心编码器来实现。后续描述时，以由音频编码组件来实现为例。

301，获得当前帧的音频通道信号，所述当前帧的音频通道信号是通过第一目标虚拟扬声器对原始HOA信号进行空间映射获得的。

一种可能的示例中，第一目标虚拟扬声器可以包括一个或者多个虚拟扬声器，也可以包括一个或者多个虚拟扬声器组。每个扬声器组可以包括一个或者多个虚拟扬声器。不同的虚拟扬声器组包括的虚拟扬声器的数量可以相同，也可以不同。第一目标虚拟扬声器中的每个虚拟扬声器均对原始HOA信号进行空间映射获得音频通道信号。音频通道信号可以包括一个或者多个通道的音频信号。例如，一个虚拟扬声器对原始HOA信号进行空间映射获得一个通道的音频通道信号。

例如，第一目标虚拟扬声器包括M个虚拟扬声器，M为正整数。当前帧的音频通道信号可以包括M个通道的虚拟扬声器信号。M个通道的虚拟扬声器信号与M个虚拟扬声器一一对应。

第一目标虚拟扬声器包括的扬声器的数量可以与编码速率或者传输速率相关，也可以与音频编码组件的复杂度相关，也可以通过配置确定。例如，当编码速率较低时，比如等于128kbps时，M＝1，当编码速率中等时，比如等于384kbps时，M＝4，当编码速率较高时，例如等于768kbps时，M＝7。再例如，当编码器复杂度较低时，M＝1，当编码器复杂度中等时，M＝2，当编码器复杂度较高时，M＝6。又例如：当编码速率为128kbps时，且编码复杂度要求较低时，M＝1。

302，在确定所述第一目标虚拟扬声器与所述当前帧的前一帧的音频通道信号对应的第二目标虚拟扬声器满足设定条件时，根据所述前一帧的音频通道信号的第二编码参数确定当前帧的音频通道信号的第一编码参数。

示例性地，第一编码参数可以包括通道间配对参数、通道间听觉空间参数或者通道间比特分配参数中的一项或者多项。

例如，确定所述第一目标虚拟扬声器与所述当前帧的前一帧的音频通道信号对应的第二目标虚拟扬声器满足设定条件，可以理解为确定所述第一目标虚拟扬声器与所述当前帧的前一帧的音频通道信号对应的第二目标虚拟扬声器之间的邻近关系满足设定条件，或者理解为所述第一目标虚拟扬声器与所述当前帧的前一帧的音频通道信号对应的第二目标虚拟扬声器之间邻近。邻近关系可以理解为第一目标虚拟扬声器与第二目标虚拟扬声器之间的空间位置关系，或者可以通过第一目标虚拟扬声器与第二目标虚拟扬声器之间的空间相关性表征邻近关系。

作为一种举例，设定条件是否满足可以通过第一目标虚拟扬声器的空间位置与第二目标虚拟扬声器的空间位置来确定。为了便于区分，将第一目标虚拟扬声器的空间位置称为第一空间位置，第二目标虚拟扬声器的空间位置称为第二空间位置。可以理解的是，第一目标虚拟扬声器可以包括M个虚拟扬声器，则第一空间位置可以包括M个虚拟扬声器中每个虚拟扬声器的空间位置。第二目标虚拟扬声器可以包括N个虚拟扬声器，则第二空间位置可以包括N个虚拟扬声器中每个虚拟扬声器的空间位置。M和N均为大于1的正整数。M与N可以相同，也可以不同。示例性地，目标虚拟扬声器的空间位置可以通过坐标或者序号或者HOA系数来表征。可选地，M＝N。

一些可能的实施例中，所述第一目标虚拟扬声器与所述当前帧的前一帧的音频通道信号对应的第二目标虚拟扬声器满足设定条件，可以包括第一空间位置与第二空间位置重叠，也可以理解为邻近关系满足设定条件。第一空间位置与第二空间位置重叠时，可以复用第二编码参数作为第一编码参数，即将前一帧的音频通道信号的编码参数作为当前帧的音频通道信号的编码参数。

在第一目标虚拟扬声器和第二目标虚拟扬声器均包括多个虚拟扬声器时，第一目标虚拟扬声器和第二目标虚拟扬声器包括的虚拟扬声器的数量相同，第一空间位置与第二空间位置重叠，可以描述为第一目标虚拟扬声器包括的多个虚拟扬声器的空间位置与第二目标虚拟扬声器包括的多个虚拟扬声器的空间位置一一对应重叠。

比如，空间位置通过坐标来表征时，为了便于区分，将第一目标虚拟扬声器的坐标称为第一坐标，第二目标虚拟扬声器的坐标称为第二坐标，即第一空间位置包括第一目标虚拟扬声器的第一坐标，第二空间位置包括第二目标虚拟扬声器的第二坐标，则第一空间位置与第二空间位置重叠，即为第一坐标与第二坐标相同。应理解的是，当第一目标虚拟扬声器和第二目标虚拟扬声器均包括多个虚拟扬声器时，第一目标虚拟扬声器包括的多个虚拟扬声器的坐标与第二目标虚拟扬声器包括的多个虚拟扬声器的坐标一一对应相同。

再比如，空间位置通过虚拟扬声器的序号来表征时，为了便于区分，将第一目标虚拟扬声器的序号称为第一序号，第二目标虚拟扬声器的序号称为第二序号，即第一空间位置包括第一目标虚拟扬声器的第一序号，第二空间位置包括第二目标虚拟扬声器的第二序号，则第一空间位置与第二空间位置重叠，即为第一序号与第二序号相同。应理解的是，当第一目标虚拟扬声器和第二目标虚拟扬声器均包括多个虚拟扬声器时，第一目标虚拟扬声器包括的多个虚拟扬声器的序号与第二目标虚拟扬声器包括的多个虚拟扬声器的序号一一对应相同。

又比如，空间位置通过虚拟扬声器的HOA系数来表征时，为了便于区分，将第一目标虚拟扬声器的HOA系数称为第一HOA系数，第二目标虚拟扬声器的HOA系数称为第二HOA系数，即第一空间位置包括第一目标虚拟扬声器的第一HOA系数，第二空间位置包括第二目标虚拟扬声器的第二HOA系数，则第一空间位置与第二空间位置重叠，即为第一HOA系数与第二HOA系数相同。应理解的是，当第一目标虚拟扬声器和第二目标虚拟扬声器均包括多个虚拟扬声器时，第一目标虚拟扬声器包括的多个虚拟扬声器的HOA系数与第二目标虚拟扬声器包括的多个虚拟扬声器的HOA系数一一对应相同。

又一些可能的实施例中，所述第一目标虚拟扬声器与所述当前帧的前一帧的音频通道信号对应的第二目标虚拟扬声器满足设定条件，可以包括第一空间位置与第二空间位置不重叠且第一目标虚拟扬声器包括的多个虚拟扬声器一一对应位于以第二目标虚拟扬声器包括的多个虚拟扬声器为中心的设定范围内。也可以理解为邻近关系满足设定条件。例如，可以确定针对第一目标虚拟扬声器包括的第m个虚拟扬声器是否位于以第二目标虚拟扬声器包括的第n个虚拟扬声器为中心的设定范围内，m遍历小于或者等于M的正整数，n遍历小于或者等于N的正整数，以确定所述第一目标虚拟扬声器与所述当前帧的前一帧的音频通道信号对应的第二目标虚拟扬声器是否满足设定条件。比如，当第一空间位置与第二空间位置不重叠时，如果第一目标虚拟扬声器包括的多个虚拟扬声器一一对应位于以第二目标虚拟扬声器包括的多个虚拟扬声器为中心的设定范围内时，可以将按照设定比例调整前一帧的音频通道信号的第二编码参数获得当前帧的音频通道信号的第二编码参数。又比如，当第一空间位置与第二空间位置不重叠时，如果第一目标虚拟扬声器包括的多个虚拟扬声器一一对应位于以第二目标虚拟扬声器包括的多个虚拟扬声器为中心的设定范围内时，当前帧的音频通道信号可以部分复用前一帧的音频通道信号的第二编码参数。例如，当前帧的音频通道信号中虚拟扬声器信号的编码参数复用前一帧的音频通道信号中虚拟扬声器信号的编码参数，当前帧的音频通道信号中的残差信号的编码参数不复用前一帧的音频通道信号中的虚拟扬声器信号的编码参数。又例如，当前帧的音频通道信号中虚拟扬声器信号的编码参数复用前一帧的音频通道信号中虚拟扬声器信号的编码参数，当前帧的音频通道信号中的残差信号的编码参数由按照设定比例调整前一帧的音频通道信号中的虚拟扬声器信号的编码参数获得。

以当前帧的音频通道信号包括两个虚拟扬声器信号，分别为H1，H2为例，第一目标虚拟扬声器包括两个虚拟扬声器，分别为虚拟扬声器1-1和虚拟扬声器1-2。以前一帧的音频通道信号包括两个虚拟扬声器信号，分别为FH1，FH2为例，第二目标虚拟扬声器包括两个虚拟扬声器，分别为虚拟扬声器2-1和虚拟扬声器2-2。虚拟扬声器1-1位于以虚拟扬声器2-1为中心的设定范围内，虚拟扬声器1-2位于以虚拟扬声器2-2为中心的设定范围内，则第一目标虚拟扬声器与第二目标虚拟扬声器的邻近关系满足设定条件。

比如，以第一空间位置包括第一坐标，第二空间位置包括第二坐标为例，虚拟扬声器的坐标通过(水平角azi，俯仰角ele)表示。虚拟扬声器1-1的坐标为(H1_pos_aiz，H1_pos_ele)，虚拟扬声器1-2的坐标为(H2_pos_aiz，H2_pos_ele)。虚拟扬声器2-1的坐标为(FH1_pos_aiz，FH1_pos_ele)，虚拟扬声器2-2的坐标为(FH2_pos_aiz，FH2_pos_ele)。当H1_Pos_azi∈[HF1_Pos_azi±TH1]且H1_Pos_ele∈[HF1_Pos_ele±TH2]且H2_Pos_azi∈[HF2_Pos_azi±TH3]且H2_Pos_ele∈[HF1_Pos_ele±TH4]时，第一目标虚拟扬声器与第二目标虚拟扬声器的邻近关系满足设定条件，即第一目标虚拟扬声器包括的多个虚拟扬声器一一对应位于以第二目标虚拟扬声器包括的多个虚拟扬声器为中心的设定范围内。其中，TH1、TH2和TH3和TH4为用于表征设定范围的设定阈值。比如，TH1、TH2和TH3和TH4可以相同也可以不同，或者TH1＝TH3，TH2＝TH4。

比如，以第一空间位置包括第一序号，第二空间位置包括第二序号为例。虚拟扬声器1-1的序号为H1_Ind，虚拟扬声器1-2的序号为H2_Ind。虚拟扬声器2-1的序号为FH1_Ind，虚拟扬声器2-2的序号为FH2_Ind。当H1_Ind∈[FH1_Ind±TH5]且H2_Ind∈[FH2_Ind±TH6]时，第一目标虚拟扬声器与第二目标虚拟扬声器满足设定条件，即第一目标虚拟扬声器包括的多个虚拟扬声器一一对应位于以第二目标虚拟扬声器包括的多个虚拟扬声器为中心的设定范围内。其中，TH5、TH6为用于表征设定范围的设定阈值。可选地，TH5＝TH6。

比如，以第一空间位置包括第一HOA系数，第二空间位置包括第二HOA系数为例。虚拟扬声器1-1的HOA系数为H1_Coef，虚拟扬声器1-2的HOA系数为H2_Coef。虚拟扬声器2-1的HOA系数为FH1_Coef，虚拟扬声器2-2的HOA系数为FH2_Coef。当H1_Coef∈[FH1_Coef±TH7]且H2_Ind∈[HF2_Ind±TH8]时，第一目标虚拟扬声器与第二目标虚拟扬声器满足设定条件，即第一目标虚拟扬声器包括的多个虚拟扬声器一一对应位于以第二目标虚拟扬声器包括的多个虚拟扬声器为中心的设定范围内。其中，TH7、TH8为用于表征设定范围的设定阈值。可选地，TH7＝TH8。

在一些可能的实施例中，音频编码组件还可以通过确定第一目标虚拟扬声器与第二目标虚拟扬声器之间的相关度，确定第一目标虚拟扬声器与第二目标虚拟扬声器满足设定条件。

作为一种举例，音频编码组件可以根据第一目标虚拟扬声器的第一坐标与第二目标虚拟扬声器的第二坐标确定第一目标虚拟扬声器与第二目标虚拟扬声器之间的相关度。

比如，音频编码组件确定第一目标虚拟扬声器的第一坐标与第二目标虚拟扬声器的第二坐标相同时，相关度R＝1。在该情况下，第一编码参数可以复用第二编码参数。

又比如，当音频编码组件确定第一目标虚拟扬声器的第一坐标与第二目标虚拟扬声器的第二坐标不完全相同时，可以通过如下公式(3)确定相关度。

其中，R表示相关度，norm()表示归一化运算，S()表示确定距离的运算，H ^m表示所述第一目标虚拟扬声器中第m个虚拟扬声器的坐标，FH ⁿ表示所述第二目标虚拟扬声器中第n个虚拟扬声器的坐标。S(H ^m,FH ⁿ)表示确定第一目标虚拟扬声器包括的第m个虚拟扬声器与第二目标虚拟扬声器包括的第n个虚拟扬声器之间的距离。m遍历不大于N的正整数，n遍历不大于N的正整数。N为第一目标虚拟扬声器与第二目标虚拟扬声器包括的虚拟扬声器。

又比如，当音频编码组件确定第一目标虚拟扬声器的第一坐标与第二目标虚拟扬声器的第二坐标不完全相同时，可以通过如下公式(4)确定相关度。

当前帧的第一目标虚拟扬声器中包括N个虚拟扬声器，分别为：H1，H2，…HN，前一帧的第二目标虚拟扬声器包括N个虚拟扬声器，分别为FH1，FH2，…FHN。

其中，M _H为当前帧的第一目标虚拟扬声器包括的虚拟扬声器的坐标组成的矩阵，

为前一帧的第二目标虚拟扬声器包括的虚拟扬声器的坐标组成的矩阵的转置。

例如：

又比如，根据所述第一目标虚拟扬声器的第一坐标以及所述第二目标虚拟扬声器的第二坐标确定的所述第一目标虚拟扬声器与所述第二目标虚拟扬声器之间的相关度满足如下公式(5)所示的条件：

其中，R表示相关度，norm()表示归一化运算，max()表示括号内元素取最大值运算，

表示所述第一目标虚拟扬声器包括的第i个虚拟扬声器的水平角，

表示所述第二目标虚拟扬声器包括的第i个虚拟扬声器的水平角，

表示所述第一目标虚拟扬声器包括的第i个虚拟扬声器的俯仰角，

表示所述第一目标虚拟扬声器包括的第i个虚拟扬声器的俯仰角。

当相关度不等于1且大于设定值时，第一编码参数可以部分复用第二编码参数，或者第一编码参数由按照设定比例调整第二编码参数获得。例如，设定值为大于0.5且小于1的数。

303，根据所述第一编码参数对所述当前帧的音频通道信号进行编码并写入码流。也可以描述为，根据所述第一编码参数对所述当前帧的音频通道信号进行编码获得编码结果，并将编码结果写入码流。

一些可能的实施例中，在第一目标虚拟扬声器的第一空间位置与第二目标虚拟扬声器的第二空间位置重叠时，复用第二编码参数作为第一编码参数对当前帧的音频通道信号进行编码并写入码流。

另一些可能的实施例中，当第一空间位置与第二空间位置不重叠时，如果第一目标虚拟扬声器包括的多个虚拟扬声器一一对应位于以第二目标虚拟扬声器包括的多个虚拟扬声器为中心的设定范围内时，可以按照设定比例调整所述第二编码参数获得第一编码参数。

例如，设定比例通过α表示，当前帧的音频通道信号的第一编码参数＝α*前一帧的音频通道信号的第二编码参数，其中α取值范围为(0,1)。第一编码参数可以包括通道间配对参数、通道间听觉空间参数或者通道间比特分配参数中的一项或者多项。在一些示例中，不同的编码参数，α的取值可以不同。比如，通道间配对参数对应的α的取值为α1，通道间比特分配参数对应的α的取值为α2。

进一步地，音频编码组件还需要通过码流向音频解码组件通知当前帧的音频通道信号的第一编码参数。

一些实施例中，音频编码组件可以通过在码流中写入第一编码参数，以实现向音频解码组件通知当前帧的音频通道信号的第一编码参数。参见图3A所示，音频编码组件还执行304a，将第一编码参数写入码流。

结合图3A所述的编码方法，参见图4A所示，解码侧可以通过如下解码方法来解码。解码侧的方法可以由音频解码设备执行，也可以由音频解码组件执行，或者由核心编码器执行。后续以音频解码组件执行解码侧的方法为例。

405a，音频编码组件将码流发送到音频解码组件，从而音频解码组件接收到码流。

406a，音频解码组件从码流中解码获得第一编码参数。

407a，音频解码组件根据第一编码参数从码流中解码获得当前帧的音频通道信号。

另一些实施例中，音频编码组件可以通过在码流中写入复用标识，通过复用标识的不同取值来指示当前帧的音频通道信号的第一编码参数如何获得。参见图3B所示，音频编码组件还执行304b，将复用标识编入码流。复用标识用于指示当前帧的音频通道信号的第一编码参数通过前一帧的音频通道信号的第二编码参数确定。

一种可能的方式中，在第一目标虚拟扬声器的第一空间位置与第二目标虚拟扬声器的第二空间位置重叠时，复用标识为第一值，以指示所述当前帧的音频通道信号的第一编码参数复用所述第二编码参数。可选地，在该方式下，可以不再码流中写入该第一编码参数，减少资源占用，提高传输效率。可选地，在第一目标虚拟扬声器的第一空间位置与第二目标虚拟扬声器的第二空间位置不重叠时，复用标识为第三值，以指示当前帧的音频通道信号的第一编码参数不复用第二编码参数，可以在码流中写入确定的第一编码参数。该第一编码参数可以是根据第二编码参数确定的，也可以是通过计算获得的。比如，当第一空间位置与第二空间位置不重叠时，如果第一目标虚拟扬声器包括的多个虚拟扬声器一一对应位于以第二目标虚拟扬声器包括的多个虚拟扬声器为中心的设定范围内时，可以按照设定比例调整所述第二编码参数获得第一编码参数，然后将获得的第一编码参数写入码流以及将取值为第三值的复用标识写入码流。再比如，当第一目标虚拟扬声器与第二目标虚拟扬声器不满足设定条件时，可以计算当前帧的音频通道信号的第一编码参数，将第一编码参数写入码流，以及将取值为第三值的复用标识写入码流。例如，第一值为0，第三值为1，或者第一值为1，第三值为0。当然第一值、第三值还可以是其它的取值，本申请实施例对此不作限定。

另一种可能的方式中，在第一目标虚拟扬声器的第一空间位置与第二目标虚拟扬声器的第二空间位置重叠时，将复用标识写入码流，复用标识为第一值，以指示所述当前帧的音频通道信号的第一编码参数复用所述第二编码参数。按照设定比例调整所述第二编码参数获得所述第一编码参数，并将复用标识写入码流中，复用标识取值为第二值，以指示所述当前帧的音频通道信号的第一编码参数通过按照设定比例调整所述第二编码参数获得。可选地，音频编码组件还可以将所述设定比例写入所述码流。在一些示例中，当第一目标虚拟扬声器与第二目标虚拟扬声器不满足设定条件时，可以计算当前帧的音频通道信号的第一编码参数，将第一编码参数写入码流，以及将取值为第三值的复用标识写入码流。例如，第一值为11，第二值为01，第三值为00。当然第一值、第二值、第三值还可以是其它的取值，本申请实施例对此不作限定。

结合图3B对应编码方法，参见图4B所示，解码侧可以通过如下解码方法来解码。解码侧的方法可以由音频解码设备执行，也可以由音频解码组件执行，或者由核心编码器执行。后续以音频解码组件执行解码侧的方法为例。

405b，音频编码组件将码流发送到音频解码组件，从而音频解码组件接收到码流。

406b，音频解码组件从码流中解码获得复用标识。

407b，当复用标识指示当前帧的音频通道信号的第一编码参数通过前一帧的音频通道信号的第二编码参数确定时，音频解码组件根据第二编码参数确定第一编码参数。

408b，根据第一编码参数从码流中解码获得当前帧的音频通道信号。

在一些场景中，复用标识可以包括两种取值，比如，复用标识的取值为第一值，以指示当前帧的音频通道信号的第一编码参数复用第二编码参数。复用标识的取值为第三值，指示当前帧的音频通道的第一编码参数不复用第二编码参数。音频解码组件从码流中解码获得复用标识，当复用标识的取值为第一值时，复用第二编码参数作为第一编码参数，根据复用的第二编码参数从码流中解码获得当前帧的音频通道信号。当复用标识的取值为第三值时，从码流中解码获得当前帧的音频通道信号的第一编码参数，然后根据解码获得的第一编码参数从码流中解码获得当前帧的音频通道信号。

在另一些场景中，复用标识可以包括两种以上取值，复用标识为第一值，以指示所述当前帧的音频通道信号的第一编码参数复用所述第二编码参数。复用标识取值为第二值，以指示按照设定比例调整所述第二编码参数获得所述第一编码参数。复用标识取值为第三值，指示从码流中解码获得第一编码参数。音频解码组件从码流中解码获得复用标识，当复用标识的取值为第一值时，复用第二编码参数作为第一编码参数，根据复用的第二编码参数从码流中解码获得当前帧的音频通道信号。当复用标识的取值为第二值时，根据设定比例调整第二编码参数获得第一编码参数，然后根据获得的第一编码参数从码流中解码获得当前帧的音频通道信号。可选地，设定比例可以是预先配置与音频解码组件中的，音频解码组件可以获得配置的设定比例，从而根据设定比例调整第二编码参数获得第一编码参数。设定比例可以由音频编码组件写入码流，音频解码组件可以从码流中解码获得设定比例。当复用标识的取值为第三值时，从码流中解码获得当前帧的音频通道信号的第一编码参数，然后根据解码获得的第一编码参数从码流中解码获得当前帧的音频通道信号。

在一些可能的实施例中，第一编码参数包括通道间配对参数、通道间听觉空间参数或者通道间比特分配参数中的一项或者多项。

在第一编码参数包括多个参数时，针对不同参数可以采用一个复用标识，还可以针对多个参数采用不同的复用标识。

针对不同参数可以采用相同的复用标识为例，当复用标识为第一值时，指示第一编码参数包括参数均复用前一帧的音频通道信号的第二编码参数。

下面针对不同的参数可以采用不同的复用标识进行描述。

作为一种举例，第一编码参数包括通道间配对参数。比如，通过复用标识Flag_1来指示当前帧的音频通道信号的通道间配对参数是否复用前一帧的音频通道信号的通道间配对参数。例如，Flag_1＝1时，指示当前帧的音频通道信号的通道间配对参数复用前一帧的音频通道信号的通道间配对参数；Flag_1＝0时，指示当前帧的音频通道信号的通道间配对参数不复用前一帧的音频通道信号的通道间配对参数。又例如，Flag_1＝11时，指示当前帧的音频通道信号的通道间配对参数复用前一帧的音频通道信号的通道间配对参数；Flag_1＝00时，指示当前帧的音频通道信号的通道间配对参数不复用前一帧的音频通道信号的通道间配对参数；Flag_1＝01(或者10)，指示当前帧的音频通道信号的通道间配对参数由按照设定比例调整前一帧的音频通道信号的通道间配对参数获得，或者指示当前帧的音频通道信号的通道间配对参数部分复用前一帧的音频通道信号的通道间配对参数。

作为另一种举例，第一编码参数包括通道间听觉空间参数。通道间听觉空间参数中包括ILD、IPD或者ITD中的一项或者多项。

一种可能的方式中，通道间听觉空间参数包括多项参数时，一个复用标识可以指示当前帧的音频通道信号的通道间听觉空间参数包括的多个参数是否复用前一帧的音频通道信号的通道间听觉空间参数。

比如，以通道间听觉空间参数包括ILD、IPD和ITD为例。通过复用标识Flag_2来指示当前帧的音频通道信号的通道间听觉空间参数(包括ILD、IPD和ITD)是否复用前一帧的音频通道信号的通道间听觉空间参数。例如，Flag_2＝1时，指示当前帧的音频通道信号的通道间听觉空间参数复用前一帧的音频通道信号的通道间听觉空间参数；Flag_2＝0时，指示当前帧的音频通道信号的通道间听觉空间参数不复用前一帧的音频通道信号的通道间听觉空间参数。又例如，Flag_2＝11时，指示当前帧的音频通道信号的通道间听觉空间参数复用前一帧的音频通道信号的通道间听觉空间参数；Flag_2＝00时，指示当前帧的音频通道信号的通道间听觉空间参数不复用前一帧的音频通道信号的通道间听觉空间参数；Flag_2＝01(或者10)，指示当前帧的音频通道信号的通道间听觉空间参数由按照设定比例调整前一帧的音频通道信号的通道间听觉空间参数获得，或者指示当前帧的音频通道信号的通道间听觉空间参数部分复用前一帧的音频通道信号的通道间听觉空间参数。

另一种可能的方式中，通道间听觉空间参数包括多项参数时，不同的参数采用不同的复用标识。以通道间听觉空间参数包括ILD、IPD和ITD为例。通过复用标识Flag_2-1来指示当前帧的音频通道信号的ILD是否复用前一帧的音频通道信号的ILD。通过复用标识Flag_2-2来指示当前帧的音频通道信号的ITD是否复用前一帧的音频通道信号的ITD。通过复用标识Flag_2-3来指示当前帧的音频通道信号的IPD是否复用前一帧的音频通道信号的IPD。

作为又一种举例，第一编码参数包括通道间比特分配参数。比如，通过复用标识Flag_3来指示当前帧的音频通道信号的通道间比特分配参数是否复用前一帧的音频通道信号的通道间比特分配参数。例如，Flag_3＝1时，指示当前帧的音频通道信号的通道间比特分配参数复用前一帧的音频通道信号的通道间比特分配参数；Flag_3＝0时，指示当前帧的音频通道信号的通道间比特分配参数不复用前一帧的音频通道信号的通道间比特分配参数。又例如，Flag_3＝11时，指示当前帧的音频通道信号的通道间比特分配参数复用前一帧的音频通道信号的通道间比特分配参数；Flag_3＝00时，指示当前帧的音频通道信号的通道间比特分配参数不复用前一帧的音频通道信号的通道间比特分配参数；Flag_3＝01(或者10)，指示当前帧的音频通道信号的通道间比特分配参数由按照设定比例调整前一帧的音频通道信号的通道间比特分配参数获得，或者指示当前帧的音频通道信号的通道间比特分配参数部分复用前一帧的音频通道信号的通道间比特分配参数。

如下对本申请实施例涉及的虚拟扬声器的HOA系数的生成过程进行示例性地说明。虚拟扬声器的HOA系数的生成还可以采用其它的方式，本申请实施例对此不作具体限定。

以声波在理想介质中传播为例，波数为k＝w/c,角频率w＝2πf,f为声波频率，c为声速。则声压p满足如下公式(6)，其中

为拉普拉斯算子：

在球坐标下求解公式(6)所示的方程中的p，在无源球形区域内，该方程的解p可以表达为如下公式(7)：

在上述公式(7)中，r表示球半径，θ表示水平角，

表示俯仰角，k表示波数，s为理想平面波的幅度，m为HOA阶数的序号，

是球贝塞尔函数，又称径向基函数,

中第一个j表示虚数单位。

部分不随角度变化。

即为θ,

方向的球谐函数，

是声源方向的球谐函数。

其Ambisonics系数可以表示为公式(8)：

根据公式(8)进一步获得公式(7)对应的展开形式如公式(9)所示：

公式(9)表明声场可以在球面上按球谐函数展开，使用系数

进行表示。或者，已知系数

可以根据

重建声场。将上式截断到第N项，以系数

作为对声场的近似描述，则称为N阶的HOA系数，该HOA系数也可以称为Ambisonics系数。P阶Ambisonics系数共有(P+1) ²个通道。其中，一阶以上的Ambisonics信号也称为HOA信号。在一种可能的配置下，HOA阶数可以为2至10阶。将球谐函数按照HOA信号一个采样点对应的系数进行叠加，就能实现该采样点对应的时刻空间声场的重构。

根据上述描述可以生成虚拟扬声器的HOA系数。将公式(8)中的θ _s和

设置为虚拟扬声器的坐标，即水平角(θ _s)和俯仰角

根据公式(8)可以获得该扬声器的HOA系数，也称作Ambisonics系数。

对于3阶HOA信号，令理想平面波的幅度s＝1，其对应的16通道HOA系数可以通过球谐函数

获得，3阶HOA信号对应的16通道HOA系数计算公式具体如表1所示。

表1

其中表1中，θ表示扬声器水平角，

表示扬声器的仰角。l表示HOA阶数，l＝0,1…P；m表示每一阶中的方向参数，m＝-l,…,l。按照表1中极坐标中的表达式，可以根据扬声器位置坐标，获得3阶HOA信号对应的16通道系数。

下面对当前帧的目标虚拟扬声器的确定方法以及音频通道信号的生成方法进行示例性地说明。当前帧的目标虚拟扬声器的确定以及音频通道信号的生成还可以采用其它的方式，本申请实施例对此不作具体限定。

A1，音频编码组件确定第一目标虚拟扬声器包括的虚拟扬声器的个数和音频通道信号包括的虚拟扬声器信号的个数。

第一目标虚拟扬声器的个数M不能超过虚拟扬声器总个数，比如，虚拟扬声器集合包括1024个虚拟扬声器，虚拟扬声器信号的个数K(编码器要传输的虚拟扬声器信号)不能超过第一目标虚拟扬声器个数M。

其中，第一目标虚拟扬声器包括的虚拟扬声器的个数M可以与编码速率相关，也可以与编码器复杂度相关，也可以通过用户指定。例如，当速率较低时，例如等于128kbps时，M＝1，当速率中等时，例如等于384kbps时，M＝4，当速率较高时，例如等于768kbps时，M＝7；当编码器复杂度较低时，M＝1，当编码器复杂度中等时，M＝2，当编码器复杂度较高时，M＝6。又例如：当编码速率为128kbps时，且编码复杂度要求较低时，M＝1。

可选地，第一目标虚拟扬声器的个数M也可以通过场景信号类型参数获得。例如，场景信号类型参数可以是对当前帧的待编码HOA信号进行SVD分解后的特征值。通过场景信号类型参数可以获得声场中包含不同方向的声源个数d，第一目标虚拟扬声器的个数M满足1≤N≤d。

A2，根据待编码的HOA信号、候选虚拟扬声器集合确定第一目标虚拟扬声器中的虚拟扬声器。

首先，计算待编码HOA信号第j个频点的第i轮次的扬声器投票值P _jil，确定第j个频点的第i轮次的匹配扬声器序号g _j,i及其对应的投票值

可以先根据当前帧的待编码HOA信号确定代表点，然后根据待编码HOA信号的代表点计算扬声器投票值。也可以直接根据当前帧的待编码HOA信号的每一个点计算扬声器投票值。代表点可以是时域上的代表样点也可以频域上的代表频点。

第i轮次中扬声器集合可以是虚拟扬声器集合，包含Q个虚拟扬声器；也可以按照预先设定的规律从虚拟扬声器集合中选出的子集。不同轮次中使用的扬声器集合可以相同也可以不同。

本实施例以采用待编码HOA信号的L’个代表频点、使用虚拟扬声器集合作为每一轮计算投票值的扬声器为例，给出一种扬声器投票值计算方法：扬声器投票值通过待编码信号的HOA系数与扬声器的HOA系数的投影获得。

具体的步骤包括：

(1)计算待编码信号第j个频点的HOA系数与第l个扬声器的HOA系数的投影值，获得第i轮第l个扬声器的投票值P _jil，l＝1,2…Q。

以下给出一种求取投影值的实施方法：

P _jil＝log(E _jil)或P _jil＝E _jil；

其中θ为方位角和

为俯仰角，

为待编码信号第j个频点的HOA系数，

为第l个扬声器的HOA系数，l＝1,2…Q，Q为扬声器总个数。

(2)根据投票值P _jil，l＝1,2…Q,获得第j个频点对应的第i轮投票的匹配扬声器g _j,i。

例如，第j个频点对应的第i轮投票的匹配扬声器g _j,i的选取准则为从第j个频点对应的第i轮投票的Q个扬声器对应的投票值中选取投票值的绝对值最大的扬声器为第j个频点第i轮投票的匹配扬声器，其序号为g _j,i当l＝g _j,i时，取得

(3)若i小于投票轮次数I，则从待编码的第j个频点的HOA信号中减去第j个频点的第i轮投票选中的扬声器的HOA系数，作为第j个频点下一轮次计算扬声器投票值所需的待编码HOA信号：

其中E _jig为第j个频点第i轮投票的匹配扬声器的投票值，上述

公式右侧的

为用于第j个频点对应的第i轮投票的待编码信号的HOA系数,公式左侧的

为用于第j个频点对应的第i+1轮投票的待编码信号的HOA系数，w为权值，可以预先设定的值满足0≤w≤1，除此之外给出一种自适应权值计算方法：

其中norm为求取二范数运算，

为第j个频点第i轮投票的匹配扬声器的HOA系数。

(4)重复(1)至(3)，直到计算出第j个样点的各个轮次匹配扬声器的投票值

i＝1,2,…,I。

(5)重复(1)至(4)，直到计算出所有频点的匹配扬声器的投票值

i＝1,2,…,I，j＝1,2,…,L’。

其次，根据各个代表频点在各个轮次的匹配扬声器序号g _j,i及其对应的投票值

计算各个匹配扬声器的总投票值VOTE _g：VOTE _g＝∑P _jig或VOTE _g＝VOTE _g+P _jig。

具体实现为对匹配扬声器的序号相等的所有匹配扬声器的投票值

进行累加以获得该匹配扬声器对应的总投票值。例如：

根据匹配扬声器的总投票值确定最佳匹配扬声器集合。具体地可以是，对所有匹配扬声器的总投票值VOTE _g进行选择，根据总投票值VOTE _g的大小选出C个投票胜出的匹配扬声器作为最佳匹配扬声器集合，进而获得最佳匹配扬声器集合的位置坐标

A3，根据最佳匹配扬声器集合的位置坐标，计算最佳匹配扬声器集合的HOA系数矩阵A[f _g1,f _g2,…,f _gC]。

A4，根据最佳匹配扬声器集合的HOA系数矩阵和，计算虚拟扬声器信号H：H＝A ^-1X。

其中，A ^-1代表矩阵A的逆矩阵，矩阵A的大小为(M×C)，C为投票胜出扬声器个数，M为N阶的HOA系数的声道个数M＝(N+1) ²，a表示最佳匹配扬声器的HOA系数，例如，

其中，X代表待编码信号的HOA系数，矩阵X的大小为(M×L)，M为N阶的HOA系数的声道个数，L为频点个数，x表示待编码信号的HOA系数，例如，

下面结合具体场景，对本申请实施例提供的编码方法流程进行描述。以音频编码组件包括空间编码器和核心编码器为例。

B1，空间编码器针对待编码的HOA信号进行空间编码处理获得当前帧的音频通道信号和当前帧的音频通道的第一目标虚拟扬声器的属性信息，并传输给核心编码器。第一目标虚拟扬声器的属性信息包括第一目标虚拟扬声器的坐标、序号或者HOA系数中的一项或者多项。

B2，核心编码器针对音频通道信号进行核心编码处理获得码流。

核心编码处理可以包括且不限于变换、心理声学模型处理、下混处理、带宽扩展、量化和熵编码等，核心编码处理可以对频域的音频通道信号进行处理也可以对时域的音频通道信号进行处理，此处不做限定。

下混处理采用的编码参数可以包括通道间配对参数、通道间听觉空间参数或者通道间比特分配参数的一项或者多项。即在进行下混处理时，可以包括通道间配对处理、通道信号调整处理、通道间比特分配处理等。

示例性地，参见图5所示，为一种可能的编码流程示意图。

待编码的HOA信号经过空间编码器处理后输出当前帧的音频通道信号和当前帧的音频通道的第一目标虚拟扬声器的属性信息。以音频通道信号为时域信号为例。核心编码器对音频通道信号进行暂态检测，然后对暂态检测后的信号进行加窗变换获得频域信号。进一步针对频域信号进行噪声整形处理获得整形后的音频通道信号。然后对噪声整形处理后的音频通道信号进行下混处理，可以包括通道间配对操作、通道信号调整、通道间信号比特分配操作。本申请实施例不对通道间配对操作、通道信号调整、通道间信号比特分配操作的处理先后顺序进行具体限定。参见图5所示，以先执行通道间配对处理，具体根据通道间配对参数来执行通道间配对处理，并将通道间配对参数和/或复用标识编入码流。通道间配对参数可以根据当前帧的第一目标虚拟扬声器的属性信息(第一目标虚拟扬声器的坐标、序号或者HOA系数)以及前一帧的第二目标虚拟扬声器的属性信息(第二目标虚拟扬声器的坐标、序号或者HOA系数)确定当前帧的通道间配对参数是否复用前一帧的通道间配对参数。根据确定的当前帧的通道间配对参数对当前帧的噪声整形处理后的音频通道信号进行通道间配对处理获得配对后的音频通道信号。然后针对配对后的音频通道信号进行通道信号调整，比如可以根据通道间听觉空间参数对配对后的音频通道信号进行通道信号调整获得调整后的音频通道信号，并将通道间听觉空间参数和/或复用标识编入码流。通道间听觉空间参数可以根据当前帧的第一目标虚拟扬声器的属性信息(第一目标虚拟扬声器的坐标、序号或者HOA系数)以及前一帧的第二目标虚拟扬声器的属性信息(第二目标虚拟扬声器的坐标、序号或者HOA系数)确定当前帧的通道间听觉空间参数是否复用前一帧的通道间听觉空间参数。进一步地，根据通道间比特分配参数对调整后的音频通道信号进行通道间比特分配处理，并将通道间比特分配参数和/或复用标识编入码流。通道间比特分配参数可以根据当前帧的第一目标虚拟扬声器的属性信息(第一目标虚拟扬声器的坐标、序号或者HOA系数)以及前一帧的第二目标虚拟扬声器的属性信息(第二目标虚拟扬声器的坐标、序号或者HOA系数)确定当前帧的通道间比特分配参数是否复用前一帧的通道间比特分配参数。经过通道间比特分配处理后，可以进一步执行量化、熵编码以及带宽调整获得码流。

根据与上述方法相同的发明构思，本申请实施例提供一种音频编码装置。参见图6所示，音频编码装置可以包括空间编码单元601，用于获得当前帧的音频通道信号，所述当前帧的音频通道信号是通过第一目标虚拟扬声器对原始高阶立体混响HOA信号进行空间映射获得的；核心编码单元602，用于在确定所述第一目标虚拟扬声器与所述当前帧的前一帧的音频通道信号对应的第二目标虚拟扬声器满足设定条件时，根据所述前一帧的音频通道信号的第二编码参数确定当前帧的音频通道信号的第一编码参数；根据所述第一编码参数对所述当前帧的音频通道信号进行编码并写入码流。

在一种可能的设计中，所述核心编码单元602，还用于将所述第一编码参数写入码流。

在一种可能的设计中，所述设定条件包括所述第一空间位置与所述第二空间位置重叠；所述核心编码单元602，具体用于将所述前一帧的音频通道信号的第二编码参数作为所述当前帧的音频通道信号的第一编码参数。

在一种可能的设计中，所述核心编码单元602，还用于将复用标识写入码流，所述复用标识的取值为第一值，所述第一值指示所述当前帧的音频通道信号的第一编码参数复用所述第二编码参数。

在一种可能的设计中，所述第一目标虚拟扬声器包括M个虚拟扬声器，所述第二目标虚拟扬声器包括N个虚拟扬声器；设定条件包括所述第一空间位置与所述第二空间位置不重叠且所述第一目标虚拟扬声器包括的第m个虚拟扬声器位于以所述第二目标虚拟扬声器包括的第n个虚拟扬声器为中心的设定范围内，其中，m遍历小于或者等于M的正整数，n遍历小于或者等于N的正整数；所述核心编码单元602，具体用于按照设定比例调整所述第二编码参数获得所述第一编码参数。

当所述相关度大于设定值时，所述第m个虚拟扬声器位于以所述第n个虚拟扬声器为中心的设定范围内，其中，m遍历小于或者等于M的正整数，n遍历小于或者等于N的正整数。

在一种可能的设计中，所述核心编码单元602，还用于将复用标识写入码流，所述复用标识的取值为第二值，所述第二值指示所述当前帧的音频通道信号的第一编码参数通过按照设定比例调整所述第二编码参数获得。

根据与上述方法相同的发明构思，本申请实施例提供一种音频解码装置。参见图7所示，音频解码装置可以包括核心解码单元701，用于从码流中解析复用标识，所述复用标识指示当前帧的音频通道信号的第一编码参数通过所述当前帧的前一帧的音频通道信号的第二编码参数确定；根据所述前一帧的音频通道信号的第二编码参数确定所述第一编码参数；根据所述第一编码参数从所述码流中解码所述当前帧的音频通道信号；空间解码单元702，用于对所述音频通道信号进行空间解码获得高阶立体混响HOA信号。

在一种可能的设计中，所述核心解码单元701，具体用于当所述复用标识的取值为第一值时，所述第一值指示所述第一编码参数复用所述第二编码参数，获得所述第二编码参数作为所述第一编码参数。

在一种可能的设计中，所述核心解码单元701，具体用于当所述复用标识的取值为第二值时，所述第二值指示所述第一编码参数通过按照设定比例调整所述第二编码参数获得，按照设定比例调整所述第二编码参数获得所述第一编码参数。

在一种可能的设计中，所述核心解码单元701，具体用于当所述复用标识的取值为第二值时，从所述码流中解码获得所述设定比例。

示例性地，在解码端，图7中，核心解码单元701的位置对应于图2B中核心解码器230的位置，换言之，核心解码单元701的功能的具体实现可以参见图2B中的核心解码器230的具体细节。空间解码单元702的位置对应于图2B中空间解码器240的位置，换言之，空间解码单元702的功能的具体实现可以参见图2B中空间解码器240的具体细节。

示例性地，在编码端，图6中，空间编码单元601的位置对应于图2A中空间编码器210的位置，换言之，空间编码单元601的功能的具体实现可以参见图2A中空间编码器210的具体细节。核心编码单元602的位置对应于图2A中核心编码器220的位置，换言之，核心编码单元602的功能的具体实现可以参见图2A中核心编码器220的具体细节。

还需要说明的是，核心编码单元602、核心编码单元602的具体实现过程可参考图3A、图3B或者图5实施例的详细描述，为了说明书的简洁，这里不再赘述。

本领域技术人员能够领会，结合本文公开描述的各种说明性逻辑框、模块和算法步骤所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件来实施，那么各种说明性逻辑框、模块、和步骤描述的功能可作为一或多个指令或代码在计算机可读媒体上存储或传输，且由根据硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体，其对应于有形媒体，例如数据存储媒体，或包括任何促进将计算机程序从一处传送到另一处的媒体(例如，根据通信协议)的通信媒体。以此方式，计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体，或(2)通信媒体，例如信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本申请中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。

作为实例而非限制，此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM 或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来存储指令或数据结构的形式的所要程序代码并且可由计算机存取的任何其它媒体。并且，任何连接被恰当地称作计算机可读媒体。举例来说，如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令，那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。但是，应理解，所述计算机可读存储媒体和数据存储媒体并不包括连接、载波、信号或其它暂时媒体，而是实际上针对于非暂时性有形存储媒体。如本文中所使用，磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)和蓝光光盘，其中磁盘通常以磁性方式再现数据，而光盘利用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。

可通过例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一或多个处理器来执行指令。因此，如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外，在一些方面中，本文中所描述的各种说明性逻辑框、模块、和步骤所描述的功能可以提供于经配置以用于编码和解码的专用硬件和/或软件模块内，或者并入在组合编解码器中。而且，所述技术可完全实施于一或多个电路或逻辑元件中。

本申请的技术可在各种各样的装置或设备中实施，包含无线手持机、集成电路(IC)或一组IC(例如，芯片组)。本申请中描述各种组件、模块或单元是为了强调用于执行所揭示的技术的装置的功能方面，但未必需要由不同硬件单元实现。实际上，如上文所描述，各种单元可结合合适的软件和/或固件组合在编码解码器硬件单元中，或者通过互操作硬件单元(包含如上文所描述的一或多个处理器)来提供。

在上述实施例中，对各个实施例的描述各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

以上所述，仅为本申请示例性的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

一种音频编码方法，其特征在于，包括：

获得当前帧的音频通道信号，所述当前帧的音频通道信号是通过第一目标虚拟扬声器对原始高阶立体混响HOA信号进行空间映射获得的；

在确定所述第一目标虚拟扬声器与第二目标虚拟扬声器满足设定条件时，根据所述当前帧的前一帧的音频通道信号的第二编码参数确定所述当前帧的音频通道信号的第一编码参数，所述前一帧的音频通道信号与所述第二目标虚拟扬声器对应；

根据所述第一编码参数对所述当前帧的音频通道信号进行编码；

将所述当前帧的音频通道信号的编码结果写入码流。
如权利要求1所述的方法，其特征在于，所述方法还包括：

将所述第一编码参数写入码流。
如权利要求1或2所述的方法，其特征在于，所述第一编码参数包括通道间配对参数、通道间听觉空间参数或者通道间比特分配参数中的一项或者多项。
如权利要求1-3任一项所述的方法，其特征在于，所述设定条件包括所述第一目标虚拟扬声器的第一空间位置与所述第二目标虚拟扬声器的第二空间位置重叠；

所述根据所述前一帧的音频通道信号的第二编码参数确定当前帧的音频通道信号的第一编码参数，包括：

将所述前一帧的音频通道信号的第二编码参数作为所述当前帧的音频通道信号的第一编码参数。
如权利要求4所述的方法，其特征在于，所述方法还包括：

将复用标识写入码流，所述复用标识的取值为第一值，所述第一值指示所述当前帧的音频通道信号的第一编码参数复用所述第二编码参数。
如权利要求4或5所述的方法，其特征在于，所述第一空间位置包括所述第一目标虚拟扬声器的第一坐标，所述第二空间位置包括所述第二目标虚拟扬声器的第二坐标，所述第一空间位置与所述第二空间位置重叠包括所述第一坐标与所述第二坐标相同；

或

所述第一空间位置包括所述第一目标虚拟扬声器的第一序号，所述第二空间位置包括所述第二目标虚拟扬声器的第二序号，所述第一空间位置与所述第二空间位置重叠包括所述第一序号与所述第二序号相同；

或

所述第一空间位置包括所述第一目标虚拟扬声器的第一HOA系数，所述第二空间位置包括所述第二目标虚拟扬声器的第二HOA系数，所述第一空间位置与所述第二空间位置重叠包括所述第一HOA系数与所述第二HOA系数相同。
如权利要求1-6任一项所述的方法，其特征在于，所述第一目标虚拟扬声器包括M个虚拟扬声器，所述第二目标虚拟扬声器包括N个虚拟扬声器；

所述设定条件包括：所述第一目标虚拟扬声器的第一空间位置与所述第二目标虚拟扬声器的第二空间位置不重叠，且所述第一目标虚拟扬声器包括的第m个虚拟扬声器位于以所述第二目标虚拟扬声器包括的第n个虚拟扬声器为中心的设定范围内，其中，m遍历小于或者等于M的正整数，n遍历小于或者等于N的正整数；

所述根据所述前一帧的音频通道信号的第二编码参数确定当前帧的音频通道信号的第一编码参数，包括：

按照设定比例调整所述第二编码参数获得所述第一编码参数。
如权利要求7所述的方法，其特征在于，当所述第一空间位置包括所述第一目标虚拟扬声器的第一坐标，所述第二空间位置包括所述第二目标虚拟扬声器的第二坐标时，所述第m个虚拟扬声器是否位于以所述第n个虚拟扬声器为中心的设定范围内通过所述第m个虚拟扬声器与所述第n个虚拟扬声器之间的相关度确定，其中，所述相关度满足如下条件：

其中，R表示相关度，norm()表示归一化运算，M _H为当前帧的第一目标虚拟扬声器包括的虚拟扬声器的坐标组成的矩阵，
为前一帧的第二目标虚拟扬声器包括的虚拟扬声器的坐标组成的矩阵的转置；

当所述相关度大于设定值时，所述第m个虚拟扬声器位于以所述第n个虚拟扬声器为中心的设定范围内。
如权利要求7或8所述的方法，其特征在于，所述方法还包括：

将复用标识写入码流，所述复用标识的取值为第二值，所述第二值指示所述当前帧的音频通道信号的第一编码参数通过按照设定比例调整所述第二编码参数获得。
如权利要求7-9任一项所述的方法，其特征在于，所述方法还包括：将所述设定比例写入所述码流。
一种音频解码方法，其特征在于，包括：

从码流中解析复用标识，所述复用标识指示当前帧的音频通道信号的第一编码参数通过所述当前帧的前一帧的音频通道信号的第二编码参数确定；

根据所述前一帧的音频通道信号的第二编码参数确定所述第一编码参数；

根据所述第一编码参数从所述码流中解码所述当前帧的音频通道信号。
如权利要求11所述的方法，其特征在于，根据所述前一帧的音频通道信号的第二编码参数确定所述第一编码参数，包括：

当所述复用标识的取值为第一值时，所述第一值指示所述第一编码参数复用所述第二编码参数，获得所述第二编码参数作为所述第一编码参数。
如权利要求11或12所述的方法，其特征在于，根据所述前一帧的音频通道信号的第二编码参数确定所述第一编码参数，包括：

当所述复用标识的取值为第二值时，所述第二值指示所述第一编码参数通过按照设定比例调整所述第二编码参数获得，按照设定比例调整所述第二编码参数获得所述第一编码参数。
如权利要求13所述的方法，其特征在于，所述方法还包括：

当所述复用标识的取值为第二值时，从所述码流中解码获得所述设定比例。
如权利要求11-14任一项所述的方法，其特征在于，所述音频通道信号的编码参数包括通道间配对参数、通道间听觉空间参数或者通道间比特分配参数中的一项或者多项。
一种音频编码装置，其特征在于，包括：

空间编码单元，用于获得当前帧的音频通道信号，所述当前帧的音频通道信号是通过第一目标虚拟扬声器对原始高阶立体混响HOA信号进行空间映射获得的；

核心编码单元，用于在确定所述第一目标虚拟扬声器与第二目标虚拟扬声器满足设定条件时，根据所述当前帧的前一帧的音频通道信号的第二编码参数确定当前帧的音频通道信号的第一编码参数，所述前一帧的音频通道信号与所述第二目标虚拟扬声器对应；根据所述第一编码参数对所述当前帧的音频通道信号进行编码，并将所述当前帧的音频通道信号的编码结果写入码流。
如权利要求16所述的装置，其特征在于，所述核心编码单元，还用于将所述第一编码参数写入码流。
如权利要求16或17所述的装置，其特征在于，所述第一编码参数包括通道间配对参数、通道间听觉空间参数或者通道间比特分配参数中的一项或者多项。
如权利要求16-18任一项所述的装置，其特征在于，所述设定条件包括所述第一目标虚拟扬声器的第一空间位置与所述第二目标虚拟扬声器的第二空间位置重叠；

所述核心编码单元，具体用于将所述前一帧的音频通道信号的第二编码参数作为所述当前帧的音频通道信号的第一编码参数。
如权利要求19所述的装置，其特征在于，所述核心编码单元，还用于将复用标识写入码流，所述复用标识的取值为第一值，所述第一值指示所述当前帧的音频通道信号的第一编码参数复用所述第二编码参数。
如权利要求19或20所述的装置，其特征在于，所述第一空间位置包括所述第一目标虚拟扬声器的第一坐标，所述第二空间位置包括所述第二目标虚拟扬声器的第二坐标，所述第一空间位置与所述第二空间位置重叠包括所述第一坐标与所述第二坐标相同；

或

所述第一空间位置包括所述第一目标虚拟扬声器的第一序号，所述第二空间位置包括所述第二目标虚拟扬声器的第二序号，所述第一空间位置与所述第二空间位置重叠包括所述第一序号与所述第二序号相同；

或

所述第一空间位置包括所述第一目标虚拟扬声器的第一HOA系数，所述第二空间位置包括所述第二目标虚拟扬声器的第二HOA系数，所述第一空间位置与所述第二空间位置重叠包括所述第一HOA系数与所述第二HOA系数相同。
如权利要求16-21任一项所述的装置，其特征在于，所述第一目标虚拟扬声器包括M个虚拟扬声器，所述第二目标虚拟扬声器包括N个虚拟扬声器；

所述设定条件包括所述第一目标虚拟扬声器的第一空间位置与所述第二目标虚拟扬声器的第二空间位置不重叠且所述第一目标虚拟扬声器包括的第m个虚拟扬声器位于以所述第二目标虚拟扬声器包括的第n个虚拟扬声器为中心的设定范围内，其中，m遍历小于或者等于M的正整数，n遍历小于或者等于N的正整数；

所述核心编码单元，具体用于按照设定比例调整所述第二编码参数获得所述第一编码参数。
如权利要求22所述的装置，其特征在于，当所述第一空间位置包括所述第一目标虚拟扬声器的第一坐标，所述第二空间位置包括所述第二目标虚拟扬声器的第二坐标时，所述第m个虚拟扬声器是否位于以所述第n个虚拟扬声器为中心的设定范围内通过所述第m个虚拟扬声器与所述第n个虚拟扬声器之间的相关度确定，其中，所述相关度满足如下条件：

其中，R表示相关度，norm()表示归一化运算，M _H为当前帧的第一目标虚拟扬声器包括的虚拟扬声器的坐标组成的矩阵，
为前一帧的第二目标虚拟扬声器包括的虚拟扬声器的坐标组成的矩阵的转置；

当所述相关度大于设定值时，所述第m个虚拟扬声器位于以所述第n个虚拟扬声器为中心的设定范围内。
如权利要求22或23所述的装置，其特征在于，所述核心编码单元，还用于将复用标识写入码流，所述复用标识的取值为第二值，所述第二值指示所述当前帧的音频通道信号的第一编码参数通过按照设定比例调整所述第二编码参数获得。
如权利要求22-24任一项所述的装置，其特征在于，所述核心编码单元，还用于将所述设定比例写入所述码流。
一种音频解码装置，其特征在于，包括：

核心解码单元，用于从码流中解析复用标识，所述复用标识指示当前帧的音频通道信号的第一编码参数通过所述当前帧的前一帧的音频通道信号的第二编码参数确定；根据所述前一帧的音频通道信号的第二编码参数确定所述第一编码参数；根据所述第一编码参数从所述码流中解码所述当前帧的音频通道信号；

空间解码单元，用于对所述音频通道信号进行空间解码获得高阶立体混响HOA信号。
如权利要求26所述的装置，其特征在于，所述核心解码单元，具体用于当所述复用标识的取值为第一值时，所述第一值指示所述第一编码参数复用所述第二编码参数，获得所述第二编码参数作为所述第一编码参数。
如权利要求26或27所述的装置，其特征在于，所述核心解码单元，具体用于当所述复用标识的取值为第二值时，所述第二值指示所述第一编码参数通过按照设定比例调整所述第二编码参数获得，按照设定比例调整所述第二编码参数获得所述第一编码参数。
如权利要求28所述的装置，其特征在于，所述核心解码单元，具体用于当所述复用标识的取值为第二值时，从所述码流中解码获得所述设定比例。
如权利要求26-29任一项所述的装置，其特征在于，所述音频通道信号的编码参数包括通道间配对参数、通道间听觉空间参数或者通道间比特分配参数中的一项或者多项。
一种音频编码设备，其特征在于，包括：相互耦合的非易失性存储器和处理器，所述处理器调用存储在所述存储器中的程序代码以执行如权利要求1-10任一项所述的方法。
一种音频解码设备，其特征在于，包括：相互耦合的非易失性存储器和处理器，所述处理器调用存储在所述存储器中的程序代码以执行如权利要求11-15任一项所述的方法。
一种计算机存储介质，其特征在于，所述计算机可读存储介质存储了程序代码，所述程序代码包括用于执行如权利要求1-15任一项所述的方法的指令。