CN117158031B

CN117158031B - 能力确定方法、上报方法、装置、设备及存储介质

Info

Publication number: CN117158031B
Application number: CN202280001087.7A
Authority: CN
Inventors: 高硕�
Original assignee: Beijing Xiaomi Mobile Software Co Ltd
Current assignee: Beijing Xiaomi Mobile Software Co Ltd
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2024-04-23
Anticipated expiration: 2042-03-31
Also published as: WO2023184383A1; CN117158031A

Abstract

本申请公开了一种能力确定方法、上报方法、装置、设备及存储介质，涉及通信技术领域。所述能力确定方法应用于核心网网元，包括：接收第一标识符集合，以及接收第二标识符集合，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式，第一标识符集合由第一终端上报，第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式，第二标识符集合由第二终端上报；根据第一标识符集合和第二标识符集合，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。本申请提供了一种确定终端之间的实时通信服务的方法，使得核心网网元能够根据第一终端和第二终端上报的标识符集合协商确定出音频输入信号格式。

Description

能力确定方法、上报方法、装置、设备及存储介质

技术领域

本申请涉及通信技术领域，特别涉及一种能力确定方法、上报方法、装置、设备及存储介质。

背景技术

移动通信中，核心网网元需要获知各个终端的音频编解码能力。在第一终端和第二终端建立通信链接时，核心网网元为其协商确定出一种所使用的音频编解码器。

由于终端设备的软件和/或硬件限制，可能存在终端设备无法支持某一编解码器的所有工作模式的情况下，比如，终端设备无法支持沉浸式语音和音频服务(ImmersiveVoice andAudio Services，IVAS)编解码器的所有工作模式。

此时，在确定出音频编解码器后，由于核心网网元无法获取到第一终端和第二终端所支持的编解码器的工作模式，将导致核心网网元无法协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

发明内容

本申请实施例提供了一种能力确定方法、上报方法、装置、设备及存储介质，根据第一终端和第二终端上报的标识符集合，核心网网元能够协商确定出两个终端在建立通信链接时所使用的音频输入信号格式。所述技术方案如下：

根据本申请的一个方面，提供了一种能力确定方法，应用于核心网网元中，所述方法包括：

接收第一标识符集合，以及接收第二标识符集合，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式，第一标识符集合由第一终端上报，第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式，第二标识符集合由第二终端上报；

根据第一标识符集合和第二标识符集合，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

根据本申请的一个方面，提供了一种能力上报方法，应用于第一终端中，所述方法包括：

向核心网网元上报第一标识符集合，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式；

其中，第一标识符集合用于结合第二标识符集合，以确定第一设备和第二设备在建立通信链接时所使用的音频输入信号格式，第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式，第二标识符集合由第二终端向核心网网元上报。

根据本申请的一个方面，提供了一种能力确定装置，所述装置包括：

根据本申请的一个方面，提供了一种能力上报装置，所述装置包括：

根据本申请的一个方面，提供了一种核心网网元，所述核心网网元包括收发器和处理器；

收发器，用于接收第一标识符集合，以及接收第二标识符集合，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式，第一标识符集合由第一终端上报，第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式，第二标识符集合由第二终端上报；

处理器，用于根据第一标识符集合和第二标识符集合，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

根据本申请的一个方面，提供了一种第一终端，所述第一终端包括收发器；

收发器，用于向核心网网元上报第一标识符集合，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式；

根据本申请的一个方面，提供了一种计算机可读存储介质，所述存储介质中存储有计算机程序，所述计算机程序用于被处理器执行，以实现如上所述的能力确定方法或能力上报方法。

根据本申请的一个方面，提供了一种芯片，所述芯片包括可编程逻辑电路和/或程序指令，当芯片运行时，用于实现如上所述的能力确定方法或能力上报方法。

根据本申请的一个方面，提供了一种计算机程序产品，所述计算机程序产品包括计算机指令，计算机指令存储在计算机可读存储介质中，处理器从计算机可读存储介质读取并执行计算机指令，以实现如上所述的能力确定方法或能力上报方法。

本申请实施例提供的技术方案至少包括如下有益效果：

通过终端在接入网络时上报标识符集合，使得核心网网元获知终端支持的音频输入信号格式，核心网网元根据第一终端和第二终端上报的标识符集合，能够协商确定出两个终端在建立通信链接时所使用的音频输入信号格式，从而建立两个终端之间的实时通信服务。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的通信***的示意图；

图2是本申请一个示例性实施例提供的能力确定方法的流程图；

图3是本申请一个示例性实施例提供的能力确定方法的流程图；

图4是本申请一个示例性实施例提供的能力确定方法的流程图；

图5是本申请一个示例性实施例提供的能力确定方法的流程图；

图6是本申请一个示例性实施例提供的能力确定和上报方法的流程图；

图7是本申请一个示例性实施例提供的终端设备的示意图；

图8是本申请一个示例性实施例提供的能力上报方法的流程图；

图9是本申请一个示例性实施例提供的能力确定装置的示意图；

图10是本申请一个示例性实施例提供的能力上报装置的示意图；

图11是本申请一个示例性实施例提供的通信设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

第一代移动通信技术(1G)开始于20世纪80年代，1G是第一代无线蜂窝技术，属于模拟移动通信网。

1G升级到2G时将终端设备从模拟通信转移到数字通信，我国采用全球移动通信***(Global System forMobile communication，GSM)网络制式，语音编码器采用自适应多速率编解码器(Adaptive Multi-Rate，AMR)、增强型全速率编解码器(EnhancedFull Rate，EFR)、全速率编解码器(Full Rate，FR)和半速率编解码器(HalfRate，HR)，通信提供单通道窄带语音服务。

3G移动通信***是国际电信联盟(InternationalTelecommunicationUnion，ITU)为2000年国际移动通信而提出的，***、电信和联通采用宽带自适应多速率编解码器(Adaptive Multi-RateWideband，AMR-WB)提供单通道宽带语音服务。

4G是在3G技术上的一次更好的改良，数据和话音都采用全网络协议(InternetProtocol，IP)的方式，提供语音音频的实时服务，采用的编解码器兼顾语音和音频的高质量压缩。

以上提供的语音和音频通信服务从窄带信号扩展到超宽带甚至是全带服务，但还都是单声道服务，人们对高质量音频的需求不断增加，与单声道音频相比，立体声音频对于每个声源具有取向感和分布感，并且可以提高清晰度。

随着传输带宽的增加以及终端设备信号采集设备的升级，信号处理器性能的提升，以及终端回放设备的升级，基于声道的多通道信号、基于对象的信号、基于场景的信号三种信号格式可以提供三维音频服务，沉浸式语音和音频服务(Immersive VoiceandAudio Services，IVAS)编解码器能支持上述三种信号格式的编解码需求。能够支持三维音频服务的终端设备有手机、电脑、平板、会议***设备、增强现实(Augmented Reality，AR)设备、虚拟现实技术(Virtual Reality，VR)设备、汽车等。

受限于终端设备的结构和大小，终端设备上麦克风的数量受到限制。目前终端设备上常见的麦克风数量为1-4个，同时麦克风之间的空间布局也受限在一定的空间范围内。不同的终端设备，由于麦克风数量和空间布局的不同，使得其利用采集的音频信号转化获得音频输入信号格式的能力有所差异。因此当两个终端设备之间建立通信时，核心网网元需要根据两个终端设备所能支持的音频输入信号格式协商出建立通信所要使用的音频输入信号格式。

图1示出了本申请一个示例性实施例提供的通信***的示意图。其中，第一终端110和第二终端120通过核心网网元130进行通信。

核心网网元130首先获取第一终端110和第二终端120所支持的音频编解码能力；在两个终端协商建立通信链接时，核心网网元130根据第一终端110和第二终端120所支持的音频编解码能力和网络状态，协商确定出一种建立通信链接时所使用的音频编解码器。

以第一终端110支持AMR和AMR-WB两种编解码器，第二终端120支持AMR、AMR-WB和增强型语音通话服务(EnhancedVoice calling Service，EVS)三种编解码器为例。

比如，在第一终端110和第二终端120所处的网络环境较优的情况下，核心网网元130协商选择AMR-WB作为第一终端110和第二终端120建立通信使用的编解码器，第一终端110和第二终端120使用AMR-WB来建立宽带音频通信链接。

又如，在第一终端110和第二终端120所处的网络环境较差的情况下核心网网元130协商选择AMR作为第一终端110和第二终端120建立通信使用的编解码器，第一终端110和第二终端120使用AMR来建立窄带音频通信链接。

但是对于一些音频编解码器来说，终端往往并不能支持其全部的工作模式，比如，在一种可选的实现场景下，核心网网元130为第一终端110和第二终端120协商使用IVAS音频编解码，第一终端110和第二终端120无法支持IVAS的所有工作模式。此时，由于核心网网元130无法获取到第一终端110和第二终端120所支持的音频输入信号格式，将无法确定第一终端110和第二终端120在建立通信链接时所使用的音频输入信号格式。

如何确定第一终端110和第二终端120在建立通信链接时所使用的音频输入信号格式，尚需讨论。

图2示出了本申请一个示例性实施例提供的能力确定方法的流程图，该方法应用于图1中示出的核心网网元130中，包括如下步骤：

步骤102：接收第一标识符集合，以及接收第二标识符集合。

示意性的，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式，第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式。

其中，第一标识符集合由第一终端上报，第二标识符集合由第二终端上报。

根据前述内容，终端设备受限于软件和/或硬件，采集音频输入信号格式的能力有所不同，导致其所支持的音频输入信号格式也不同。

以第一终端为例，第一终端所连接的麦克风的配置结构有多种实现方式。比如，第一终端内置单个或多个麦克风；又如，第一终端外接音频信号采集设备；又如，第一终端内置单个或多个麦克风，且外接音频信号采集设备。

在第一终端内置单个麦克风的情况下，第一终端所能支持的音频输入信号格式包括单声道信号和对象信号中的至少一个。其中，对象信号包括单声道音频信号和单通道的元数据(metadata)信号。

在第一终端内置多个麦克风的情况下，或者，在第一终端外接音频信号采集设备的情况下，第一终端所能支持的音频输入信号格式包括如下中的至少一种：单声道信号；双声道信号；多声道信号；对象信号；基于元数据的空间音频(Metadata-AssistedSpatialAudio，MASA)格式信号；空间音频(Spatial audio)信号。其中，对象信号包括至少一个声道音频信号和一个通道的元数据信号；空间音频信号包括至少一个声道信号、以及背景信号和元数据信号中的至少一种。

在第一终端内置一个或多个麦克风，且外接音频信号采集设备的情况下，第一终端所能支持的音频输入信号格式包括如下中的至少一种：单声道信号；双声道信号；多声道信号；对象信号；空间音频信号。其中，对象信号包括至少一个声道音频信号和一个通道的元数据信号；空间音频信号包括至少一个声道信号、以及背景信号和元数据信号中的至少一种。

示意性的，每种音频输入信号格式对应有唯一确定的标识符。比如，单声道信号的标识符为1，立体声信号的标识符是2。应当理解的是，每种音频输入信号格式对应的标识符可根据实际需要设定。

参考下表，本申请实施例给出如下一种可选的实现方式：

输入信号格式	标识符
		单声道信号	1
立体声信号	2
		双耳信号	3
5.1多声道信号	4
		5.1+4多声道信号	5
7.1多声道信号	6
		7.1+4多声道信号	7
对象信号	8
		FOA信号	9
2ndHOA信号	10
		3rdHOA信号	11
MASA信号	12
		其它空间音频信号	13

其中，多麦克风信号转化为立体声信号或者5.1、7.1、5.1+4、7.1+4多声道信号采用传统波束形成算法，多麦克风信号通过参数分析的算法生成MASA信号或者其它形式的空间音频信号。

可选的，第一标识符集合是第一终端在接入网络时上报的；和/或，第二标识符集合是第二终端在接入网络时上报的。

根据每种音频输入信号格式对应的标识符，第一终端和第二终端能够确定自身所支持的至少一种音频输入信号格式对应的每个标识符，以得到第一标识符集合和第二标识符集合。比如，第一终端支持单声道信号和MASA信号两种音频输入信号格式，则第一标识符集合包括标识符1和12。

随后，第一终端将第一标识符集合上报给核心网网元，第二终端将第二标识符集合也上报给核心网网元。其中，第一标识符集合和/或第二标识符集合上报的时机，可以是第一终端和/或第二终端接入网络时。

步骤104：根据第一标识符集合和第二标识符集合，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

在获取到第一终端上报的第一标识符集合和第二终端上报的第二标识符集合后，核心网网元能够确定第一终端和第二终端分别支持的至少一种音频输入信号格式。随后，核心网网元可根据协商策略确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

综上所述，本申请实施例提供的能力确定方法中，通过接收第一终端上报的第一标识符集合和第二终端上报的第二标识符集合，核心网网元能够根据第一标识符集合和第二标识符集合能够协商确定出两个终端在建立通信链接时所使用的音频输入信号格式，从而建立两个终端之间的实时通信服务。

根据前述内容，核心网网元根据协商策略确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式有多种实现方式，本申请实施例给出如下三种可选的实现方式：

1、协商确定同一种音频输入信号格式。

参考图2，图3示出了本申请一个示例性实施例提供的能力确定方法的流程图，步骤104可实现为步骤1041，具体如下：

步骤1041：在第一标识符集合和第二标识符集合均包括第一候选标识符的情况下，将第一候选标识符对应的音频输入信号格式，确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

其中，第一标识符集合和第二标识符集合的相关描述可参考前述内容，不再赘述。

示意性的，第一候选标识符是第一标识符集合中的一个标识符，也是第二标识符集合中的一个标识符。在第一标识符集合和第二标识符集合均包括第一候选标识符的情况下，第一终端和第二终端均支持第一候选标识符对应的音频输入信号格式。

比如，第一标识符集合包括标识符1、7和12，第二标识符集合包括标识符5和12，第一候选标识符是标识符12。核心网网元在获取到第一标识符集合和第二标识符集合之后，能够确定第一终端和第二终端均支持标识符12对应的MASA信号。

随后，核心网网元将标识符12对应的MASA信号确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

2、根据网络状况协商确定。

参考图2，图4示出了本申请一个示例性实施例提供的能力确定方法的流程图，步骤104可实现为步骤1042，具体如下：

步骤1042：根据第一标识符集合、第二标识符集合和网络状况，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

示意性的，网络状况用于指示第一终端和第二终端在建立通信链接时的网络的优良程度。根据不同的网络状况，核心网网元可为第一终端和第二终端协商确定不同的音频输入信号格式。

可选的，在第一标识符集合和第二标识符集合均包括第一候选标识符和第二候选标识符的情况下，步骤1042可实现为如下：

在网络状况处于第一状况条件的情况下，将第一候选标识符对应的音频输入信号格式，确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式；

在网络状况处于第二状况条件的情况下，将第二候选标识符对应的音频输入信号格式，确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式；

其中，处于第一状况条件时的网络优于处于第二状况条件时的网络。

示意性的，第一候选标识符和第二候选标识符对应于不同的音频输入信号格式。在网络状况处于不同的状况条件下，确定的音频输入信号格式可根据实际需要设定。

根据前述内容，标识符1-13分别对应于不同的音频输入信号格式。

在一种可选的实施场景下，第一标识符集合和第二标识符集合可能包括两个或两个以上的相同的候选标识符。比如，第一标识符集合和第二标识符集合均包括标识符1和12。此时，核心网网元可结合网络状况，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

以第一标识符集合和第二标识符集合均包括标识符1和12，处于第一状况条件时的网络的状况优良，处于第二状况条件时的网络的状况较差为例。核心网网元在获取到第一标识符集合和第二标识符集合之后，能够确定第一终端和第二终端均支持单声道信号和MASA信号。

随后，在网络处于第一状况条件的情况下，核心网网元将标识符12对应的MASA信号协商确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式；在网络处于第二状况条件的情况下，核心网网元将标识符1对应的单声道信号协商确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

3、协商确定不同的音频输入信号格式。

参考图2，图5示出了本申请一个示例性实施例提供的能力确定方法的流程图，步骤104可实现为步骤1043，具体如下：

步骤1043：在第一标识符集合包括第三候选标识符，第二标识符集合包括第四候选标识符的情况下，将第三候选标识符对应的音频输入信号格式确定为第一终端在建立通信链接时所使用的音频输入信号格式，将第四候选标识符对应的音频输入信号格式确定为第二终端在建立通信链接时所使用的音频输入信号格式。

其中，第三候选标识符和第四候选标识符不同；第一标识符集合和第二标识符集合的相关描述可参考前述内容，不再赘述。

根据前述内容，在第一终端和第二终端拟建立通信链接时，核心网网元可为第一终端和第二终端协商确定使用不同的音频输入信号格式，以实现两个终端设备之间的实时通信服务。

以第一标识符集合和第二标识符集合均包括标识符1、7和12为例，核心网网元在获取到第一标识符集合和第二标识符集合之后，能够确定第一终端和第二终端均支持单声道信号、7.1+4多声道信号和MASA信号。随后，核心网网元可为第一终端和第二终端分别确定不同的音频输入信号格式。

比如，第三候选标识符是标识符1，第四候选标识符是7。则核心网网元将标识符1对应的单声道信号确定为第一终端在建立通信链接时所使用的音频输入信号格式，将标识符7对应的7.1+4多声道信号确定为第二终端在建立通信链接时所使用的音频输入信号格式。

可选的，核心网网元在为第一终端和第二终端协商确定所使用的音频输入信号格式之前，还需要确定第三候选标识符和第四候选标识符。

在一种可选的实施场景下，第一终端和第二终端分别向核心网网元上报各自具备的音频回放格式能力。

可选的，本申请实施例提供的能力确定方法中，还包括：

根据第一终端所具备的音频回放格式能力，确定第四候选标识符；

根据第二终端所具备的音频回放格式能力，确定第三候选标识符。

其中，音频回放格式包括如下中的至少一种：耳机信号格式；扬声器信号格式。

可选的，耳机信号格式包括如下中的至少一种：单声道信号格式；立体声信号(Stereo signal)格式；双耳信号(Binaural signal)格式。

立体声信号和双耳信号均为两声道信号。其中，立体声信号是常规的两声道信号；双耳信号是指采用人工头模型或者真人双耳录制的双声道信号。

可选的，扬声器信号格式包括如下中的至少一种：单声道信号格式；多声道信号格式。

应当理解的是，单声道信号可以通过耳机播放，也可以通过扬声器播放；立体声信号和双耳信号通过耳机播放；多声道信号通过扬声器播放。

可选的，多声道信号格式包括如下格式中的至少一种：双声道信号格式(2.0)，六声道信号格式(5.1)，八声道信号格式(7.1)，十声道信号格式(5.1+4)，十二声道信号格式(7.1+4)。

仍然以第一标识符集合和第二标识符集合均包括标识符1、7和12为例。

假设第一终端具备回放7.1+4多声道信号的音频信号格式的能力，第二终端具备回放立体声信号的音频信号格式。随后，在第一终端和第二终端建立通信链接时，核心网网元将标识符12对应的MASA信号确定为第一终端所使用的音频输入信号格式，将标识符7对应的7.1+4多声道信号确定为第二终端所使用的音频输入信号格式。

在一种可选的实施场景下，与第一标识符集合和第二标识符集合均包括两种或两种以上标识符类似，第一终端和第二终端可能具备两种或两种以上的音频回放格式能力。此时，核心网网元可结合网络状况，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

其中，核心网网元结合网络状况协商确定音频输入信号格式的过程与前述内容类似，可作参考，不再赘述；结合网络状况协商确定的音频输入信号格式可根据实际需要设定，本申请不做限定。

综上所述，本申请实施例提供的能力确定方法中，给出了三种协商确定音频输入信号格式的实现方式。

可选的，在第一标识符集合和第二标识符集合包括相同的标识符的情况下，为第一终端和第二终端协商确定相同的音频输入信号格式。

可选的，根据第一标识符集合、第二标识符集合和网络状况，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

可选的，在第一标识符集合和第二标识符集合包括不同的标识符的情况下，为第一终端和第二终端协商确定不同的音频输入信号格式。

应当理解的是，本申请实施例提供的三种实现方式可组合使用，本申请在此不做限定。

比如，在第一标识符集合和第二标识符集合包括两个或两个以上的相同的标识符的情况下，核心网网元根据第一标识符集合、第二标识符集合和网络状况协商确定音频输入信号格式。

又如，在第一终端和第二终端均支持两种或两种以上的音频回放格式能力的情况下，核心网网元根据第一标识符集合、第二标识符集合和网络状况协商确定音频输入信号格式。

图6示出了本申请一个示例性实施例提供的能力确定和上报方法的流程图，应用于图1示出的通信***中。其中，能力确定方法由图1中的核心网网元130执行，能力上报方法由图1中的第一终端110和第二终端120执行，能力确定和上报包括如下步骤：

步骤201：第一终端向核心网网元上报第一标识符集合。

示意性的，第一终端在接入网络时，向核心网网元上报第一标识符集合。

示意性的，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式。

图7示出了本申请一个示例性实施例提供的终端设备的示意图。

根据前述内容，第一终端所连接的麦克风的配置结构有多种实现方式。

比如，第一终端内置单个麦克风，如图7中的(a)所示，单个麦克风设置于黑点所在的位置上；又如，第一终端内置多个麦克风，如图7中的(b)所示，多个麦克风分别设置于黑点所在的位置上；又如，第一终端外接音频信号采集设备；又如，第一终端内置单个或多个麦克风，且外接音频信号采集设备，如图7中的(c)所示。

可选的，外接的音频信号采集设备包括如下中的至少一种：音频信号采集球；麦克风音频采集阵列；线控耳机。其中，音频信号采集球可以是一阶环绕声(First-OrderAmbisonics，FOA)音频信号采集球，也可以是高阶环绕声(Higher-OrderAmbisonics，HOA)音频信号采集球。

在第一终端内置单个麦克风的情况下，第一终端所能支持的音频输入信号格式包括单声道信号和对象信号中的至少一个。其中，对象信号包括单声道音频信号和单通道的元数(metadata)据信号。

在第一终端内置一个或多个麦克风，且第一终端外接音频信号采集设备的情况下，第一终端所能支持的音频输入信号格式包括如下中的至少一种：单声道信号；双声道信号；多声道信号；对象信号；空间音频信号。其中，对象信号包括至少一个声道音频信号和一个通道的元数据信号；空间音频信号包括至少一个声道信号、以及背景信号和元数据信号中的至少一种。

根据前述内容，每种音频输入信号格式对应有唯一确定的标识符。

第一终端可根据自身所支持的音频输入信号格式确定对应的标识符，随后根据标识符确定第一标识符集合，并将第一标识符集合发送给核心网网元。

可选的，第一标识符集合的上报时机可以是第一终端接入网络时，步骤201可实现为如下：

第一终端在接入网络时向核心网网元上报第一标识符集合。

步骤202：核心网网元接收第一终端上报的第一标识符集合。

示意性的，第一标识符集合用于结合第二标识符集合，以确定第一设备和第二设备在建立通信链接时所使用的音频输入信号格式，第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式，第二标识符集合由第二终端向核心网网元上报。

步骤203：第二终端向核心网网元上报第二标识符集合。

示意性的，第二终端在接入网络时，向核心网网元上报第二标识符集合。

示意性的，第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式。

其中，第二终端所支持的音频输入信号格式对应的标识符的确定，与第一终端所支持的音频输入信号格式对应的标识符的确定类似；第二标识符集合的确定与第一标识符集合的确定类似，可作参考。

可选的，第二标识符集合的上报时机可以是第二终端接入网络时，步骤203可实现为如下：

第二终端在接入网络时向核心网网元上报第二标识符集合。

步骤204：核心网网元接收第二终端上报的第二标识符集合。

其中，第二标识符集合的相关描述可参考前述内容，不再赘述。

步骤205：核心网网元根据第一标识符集合和第二标识符集合，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

示意性的，步骤205与步骤104类似，可作参考，不再赘述。

综上所述，本申请实施例提供的能力确定方法由核心网网元执行，能力上报方法由第一终端和第二终端执行。在第一终端上报第一标识符集合，第二终端上报第二标识符集合之后，核心网网元能够获取到第一终端和第二终端所支持的至少一种音频输入信号格式；并根据第一标识符集合和第二标识符集合，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

图8示出了本申请一个示例性实施例提供的能力上报方法的流程图，可应用于图1中示出的第一终端110中，该方法包括如下：

步骤301：确定第一终端所支持的音频输入信号格式。

根据前述内容，受限于终端设备的软件和/或硬件，终端设备所支持的音频输入信号格式也不同。应当理解的是，本申请实施例仅以第一终端为例，第二终端确定所支持的音频输入信号格式的过程与第一终端类似，不再赘述。

可选的，步骤301可实现为如下：

根据第一终端所连接的音频采集设备和具备的软件处理算法能力，确定第一终端所支持的音频输入信号格式。

其中，第一终端所连接的音频采集设备可以是内置的，也可以是外接的；第一终端具备的软件处理算法能力根据不同的音频采集设备有所不同。

可选的，音频采集设备包括如下中的至少一种：内置的单个麦克风；内置的多个麦克风；外接的音频信号采集设备。

可选的，外接的音频信号采集设备包括如下中的至少一种：音频信号采集球；麦克风音频采集阵列；线控耳机。

可选的，软件处理算法能力包括如下中的至少一种：

将内置的多麦克风采集的信号转换为立体声信号、对象信号和空间音频信号中的一种；

将外接的音频信号采集球采集的信号转换为空间音频信号；

将内置的多麦克风采集的信号和外接的音频信号采集设备采集的信号转换为立体声信号、对象信号和空间音频信号中的一种；

将内置的多麦克风采集的信号通过参数分析转换为MASA信号或其它形式的空间音频信号。

步骤302：为每种音频输入信号格式确定唯一对应的标识符。

根据前述内容，每种音频输入信号格式对应有唯一确定的标识符，一个音频输入信号格式对应一个标识符。在确定所支持的音频输入信号格式后，第一终端可为每种音频输入信号格式确定对应的标识符。

应当理解的是，本申请实施例仅以第一终端为例，第二终端确定标识符的过程与第一终端类似，不再赘述。

步骤303：向核心网网元上报第一标识符集合，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式。

示意性的，步骤303与步骤201相同，可作参考，不再赘述。

可选的，在核心网网元根据第一终端和第二终端所具备的音频回放格式能力，来为第一终端和第二终端协商确定不同的音频输入信号格式的情况下，第一终端和第二终端还需要上报自身所具备的音频回放格式能力。

以第一终端为例，本申请实施例提供的能力上报方法还包括：

向核心网网元上报第一终端所具备的音频回放格式能力。

可选的，音频回放格式包括如下中的至少一种：耳机信号格式；扬声器信号格式。

可选的，耳机信号格式包括如下中的至少一种：单声道信号格式；立体声信号格式；双耳信号格式。

可选的，多声道信号格式包括如下格式中的至少一种：双声道信号格式(2.0)，声道信号格式(5.1)，八声道信号格式(7.1)，十声道信号格式(5.1+4)，十二声道信号格式(7.1+4)。

其中，耳机信号格式和扬声器信号格式相关描述可参考前述内容，不再赘述。

综上所述，本申请实施例提供的能力上报方法中，给出了第一终端确定所支持的音频输入信号格式对应的标识符的确定过程，并在接入网络时上报标识符集合，使得核心网网元能够获知终端设备支持的音频输入信号格式，进而实现与其他终端进行通信。

可选的，本申请实施例还给出了第一终端上报自身所具备的音频回放格式能力的过程。

根据前述内容，本申请实施例给出如下一种能力上报和确定的具体过程，用于核心网网元为第一终端和第二终端协商确定在建立通信链接时所使用的音频输入信号格式。

1、第一终端和第二终端分别确定自身所能支持的音频输入信号格式，并为所支持的音频输入信号格式确定唯一的标识符。

可选的，第一终端和第二终端确定自身所能支持的音频输入信号格式可实现为如下：

根据第一终端所连接的音频采集设备和具备的软件处理算法能力，确定第一终端所支持的音频输入信号格式；

根据第二终端所连接的音频采集设备和具备的软件处理算法能力，确定第二终端所支持的音频输入信号格式。

可选的，外接的音频信号采集设备包括如下中的至少一种：音频信号采集球；麦克风音频采集阵列；线控耳机。其中，音频信号采集球可以是FOA音频信号采集球或HOA音频信号采集球，麦克风音频采集阵列的形状可根据实际需要确定，本申请不做限定。

可选的，软件处理算法能力包括如下中的至少一种：

将外接的音频信号采集球采集的信号转换为空间音频信号；

其中，标识符的确定过程可参考前述内容，不再赘述。

2、第一终端向核心网网元上报第一标识符集合，第二终端向核心网网元上报第二标识符集合。

第一终端在接入网络时，第一终端和第二终端向核心网网元上报第一标识符集合和第二标识符集合。

其中，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式，第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式，第一标识符集合和第二标识符集合中包括至少一个候选标识符。

核心网网元在接收到第一标识符集合和第二标识符集合后，可以确定第一终端和第二终端所支持的音频输入信号格式。

可选的，第一终端在接入网络时向核心网网元上报第一标识符集合，第二终端在接入网络时向核心网网元上报第二标识符集合。

3、根据第一标识符集合和第二标识符集合，核心网网元协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

其中，核心网网元在协商确定音频输入信号格式时，可以协商为相同的音频输入信号格式，也可以为不同的音频输入信号格式。

可选的，在第一标识符集合和第二标识符集合均包括第一候选标识符的情况下，将第一候选标识符对应的音频输入信号格式，确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

根据网络状况的不同，核心网网元为第一终端和第二终端协商确定的音频输入信号格式也不同。

可选的，在网络状况处于第一状况条件的情况下，将第一候选标识符对应的音频输入信号格式，确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式；在网络状况处于第二状况条件的情况下，将第二候选标识符对应的音频输入信号格式，确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式；其中，处于第一状况条件时的网络优于处于第二状况条件时的网络。

可选的，在第一标识符集合包括第三候选标识符，第二标识符集合包括第四候选标识符的情况下，将第三候选标识符对应的音频输入信号格式确定为第一终端在建立通信链接时所使用的音频输入信号格式，将第四候选标识符对应的音频输入信号格式确定为第二终端在建立通信链接时所使用的音频输入信号格式；第三候选标识符和第四候选标识符不同。

在核心网网元为第一终端和第二终端协商确定所使用的音频输入信号格式之前，还需要确定第三候选标识符和第四候选标识符。可选的，根据第一终端所具备的音频回放格式能力，确定第四候选标识符；根据第二终端所具备的音频回放格式能力，确定第三候选标识符。

可选的，第一终端和第二终端所具备的音频回放格式能力包括如下中的至少一种：耳机信号格式；扬声器信号格式。

以下为本申请的装置实施例，对于装置实施例中未详细描述的细节，可以结合参考上述方法实施例中相应的记载，本文不再赘述。

图9示出了本申请一个示例性实施例提供的能力确定装置的结构图，该装置包括：

接收模块920，用于接收第一标识符集合，以及接收第二标识符集合，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式，第一标识符集合由第一终端上报，第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式，第二标识符集合由第二终端上报；

协商模块940，用于根据第一标识符集合和第二标识符集合，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

可选的，协商模块940，用于：在第一标识符集合和第二标识符集合均包括第一候选标识符的情况下，将第一候选标识符对应的音频输入信号格式，确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

可选的，协商模块940，用于：根据第一标识符集合、第二标识符集合和网络状况，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

可选的，第一标识符集合和第二标识符集合均包括第一候选标识符和第二候选标识符；根协商模块940，用于：在网络状况处于第一状况条件的情况下，将第一候选标识符对应的音频输入信号格式，确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式；在网络状况处于第二状况条件的情况下，将第二候选标识符对应的音频输入信号格式，确定为第一终端和第二终端在建立通信链接时所使用的音频输入信号格式；其中，处于第一状况条件时的网络优于处于第二状况条件时的网络。

可选的，根协商模块940，用于：在第一标识符集合包括第三候选标识符，第二标识符集合包括第四候选标识符的情况下，将第三候选标识符对应的音频输入信号格式确定为第一终端在建立通信链接时所使用的音频输入信号格式，将第四候选标识符对应的音频输入信号格式确定为第二终端在建立通信链接时所使用的音频输入信号格式；第三候选标识符和第四候选标识符不同。

可选的，装置还包括确定模块960，用于：根据第一终端所具备的音频回放格式能力，确定第四候选标识符；根据第二终端所具备的音频回放格式能力，确定第三候选标识符。

图10示出了本申请一个示例性实施例提供的能力上报装置的示意图，该装置包括：

上报模块1020，用于向核心网网元上报第一标识符集合，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式；

可选的，上报模块1020，用于：在接入网络时向核心网网元上报第一标识符集合。

可选的，装置还包括确定模块1040；用于：确定第一终端所支持的音频输入信号格式；为每种音频输入信号格式确定唯一对应的标识符。

可选的，确定模块1040，用于：根据第一终端所连接的音频采集设备和具备的软件处理算法能力，确定第一终端所支持的音频输入信号格式。

可选的，软件处理算法能力包括如下中的至少一种：将内置的多麦克风采集的信号转换为立体声信号、对象信号和空间音频信号中的一种；将外接的音频信号采集球采集的信号转换为空间音频信号；将内置的多麦克风采集的信号和外接的音频信号采集设备采集的信号转换为立体声信号、对象信号和空间音频信号中的一种；将内置的多麦克风采集的信号通过参数分析转换为MASA信号或其它形式的空间音频信号。

可选的，上报模块1020，还用于：向核心网网元上报第一终端所具备的音频回放格式能力。

可选的，在第一终端内置单个麦克风的情况下，第一终端所支持的音频输入信号格式包括如下中的至少一种：单声道信号；对象信号。

可选的，对象信号包含单声道音频信号和单通道的元数据信号。

可选的，在第一终端内置多个麦克风的情况下，或者，在第一终端外接音频信号采集设备的情况下，第一终端所支持的音频输入信号格式包括如下中的至少一种：单声道信号；双声道信号；多声道信号；对象信号；MASA格式信号；空间音频信号。

可选的，在第一终端内置一个或多个麦克风，且第一终端外接音频信号采集设备的情况下，第一终端所支持的音频输入信号格式包括如下中的至少一种：单声道信号；双声道信号；多声道信号；对象信号；空间音频信号。

可选的，对象信号包含至少一个声道音频信号和一个通道的元数据信号。

可选的，空间音频信号包括如下中的至少一种：至少一个声道信号；背景信号；元数据信号。

图11示出了本申请一个示例性实施例提供的通信设备(终端或网络设备)的结构示意图，该通信设备包括：处理器1101、接收器1102、发射器1103、存储器1104和总线1105。

处理器1101包括一个或者一个以上处理核心，处理器1101通过运行软件程序以及模块，从而执行各种功能应用以及信息处理。

接收器1102和发射器1103可以实现为一个通信组件，该通信组件可以是一块通信芯片。

存储器1104通过总线1105与处理器1101相连。

存储器1104可用于存储至少一个指令，处理器1101用于执行该至少一个指令，以实现上述方法实施例中提到的能力确定方法或能力上报方法中的各个步骤。

此外，存储器1104可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，易失性或非易失性存储设备包括但不限于：磁盘或光盘，电可擦除可编程只读存储器(Electrically-Erasable Programmable Read Only Memory，EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)，静态随时存取存储器(Static Random Access Memory，SRAM)，只读存储器(Read-Only Memory，ROM)，磁存储器，快闪存储器，可编程只读存储器(Programmable Read-OnlyMemory，PROM)。

本申请实施例还提供了一种核心网网元，核心网网元包括收发器和处理器；收发器，用于接收第一标识符集合，以及接收第二标识符集合，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式，第一标识符集合由第一终端上报，第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式，第二标识符集合由第二终端上报；处理器，用于根据第一标识符集合和第二标识符集合，协商确定第一终端和第二终端在建立通信链接时所使用的音频输入信号格式。

本申请实施例还提供了一种第一终端，第一终端包括收发器；收发器，用于向核心网网元上报第一标识符集合，第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式；

本申请实施例还提供了一种计算机可读存储介质，存储介质中存储有计算机程序，计算机程序用于被处理器执行，以实现如上所述的能力确定方法或能力上报方法。

本申请实施例还提供了一种芯片，芯片包括可编程逻辑电路和/或程序指令，当芯片运行时，用于实现如上所述的能力确定方法或能力上报方法。

本申请实施例还提供了一种计算机程序产品或计算机程序，计算机程序产品或计算机程序包括计算机指令，计算机指令存储在计算机可读存储介质中，处理器从计算机可读存储介质读取并执行计算机指令，以实现如上所述的能力确定方法或能力上报方法。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种能力确定方法，其特征在于，应用于核心网网元，所述方法包括：

接收第一标识符集合，以及接收第二标识符集合，所述第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式，所述第一标识符集合由所述第一终端上报，所述第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式，所述第二标识符集合由所述第二终端上报；

根据所述第二终端所具备的音频回放格式能力，确定第三候选标识符；

根据所述第一终端所具备的音频回放格式能力，确定第四候选标识符；

在所述第一标识符集合包括所述第三候选标识符，所述第二标识符集合包括所述第四候选标识符的情况下，将所述第三候选标识符对应的音频输入信号格式确定为所述第一终端在建立通信链接时所使用的音频输入信号格式，将所述第四候选标识符对应的音频输入信号格式确定为所述第二终端在建立通信链接时所使用的音频输入信号格式；

所述第三候选标识符和所述第四候选标识符不同。

2.根据权利要求1所述的方法，其特征在于，

所述第一标识符集合是所述第一终端在接入网络时上报的；

和/或，所述第二标识符集合是所述第二终端在接入网络时上报的。

3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

在所述第一标识符集合和所述第二标识符集合均包括第一候选标识符的情况下，将所述第一候选标识符对应的音频输入信号格式，确定为所述第一终端和所述第二终端在建立通信链接时所使用的音频输入信号格式。

4.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

根据所述第一标识符集合、所述第二标识符集合和网络状况，协商确定所述第一终端和所述第二终端在建立通信链接时所使用的音频输入信号格式。

5.根据权利要求4所述的方法，其特征在于，所述第一标识符集合和所述第二标识符集合均包括第一候选标识符和第二候选标识符；

所述根据所述第一标识符集合、所述第二标识符集合和网络状况，协商确定所述第一终端和所述第二终端在建立通信链接时所使用的音频输入信号格式，包括：

在所述网络状况处于第一状况条件的情况下，将所述第一候选标识符对应的音频输入信号格式，确定为所述第一终端和所述第二终端在建立通信链接时所使用的音频输入信号格式；

在所述网络状况处于第二状况条件的情况下，将所述第二候选标识符对应的音频输入信号格式，确定为所述第一终端和所述第二终端在建立通信链接时所使用的音频输入信号格式；

其中，处于所述第一状况条件时的网络优于处于所述第二状况条件时的网络。

6.根据权利要求1所述的方法，其特征在于，音频回放格式包括如下中的至少一种：

耳机信号格式；

扬声器信号格式。

7.根据权利要求6所述的方法，其特征在于，所述耳机信号格式包括如下中的至少一种：

单声道信号格式；

立体声信号格式；

双耳信号格式。

8.根据权利要求6所述的方法，其特征在于，所述扬声器信号格式包括如下中的至少一种：

单声道信号格式；

多声道信号格式。

9.一种能力上报方法，其特征在于，应用于第一终端，所述方法包括：

向核心网网元上报第一标识符集合，所述第一标识符集合用于指示所述第一终端所支持的至少一种音频输入信号格式；

其中，所述第一标识符集合用于结合第二标识符集合，以确定所述第一终端和第二终端在建立通信链接时所使用的音频输入信号格式，所述第二标识符集合用于指示所述第二终端所支持的至少一种音频输入信号格式，所述第二标识符集合由所述第二终端向所述核心网网元上报；

在所述第一标识符集合包括第三候选标识符，所述第二标识符集合包括第四候选标识符的情况下，所述第三候选标识符对应的音频输入信号格式被确定为所述第一终端在建立通信链接时所使用的音频输入信号格式，所述第四候选标识符对应的音频输入信号格式被确定为所述第二终端在建立通信链接时所使用的音频输入信号格式；

所述第三候选标识符和所述第四候选标识符不同，所述第三候选标识符根据所述第二终端所具备的音频回放格式能力确定，所述第四候选标识符根据所述第一终端所具备的音频回放格式能力确定。

10.根据权利要求9所述的方法，其特征在于，所述向核心网网元上报第一标识符集合，包括：

在接入网络时向所述核心网网元上报所述第一标识符集合。

11.根据权利要求9或10所述的方法，其特征在于，所述方法还包括：

确定所述第一终端所支持的音频输入信号格式；

为每种音频输入信号格式确定唯一对应的标识符。

12.根据权利要求11所述的方法，其特征在于，所述确定所述第一终端所支持的音频输入信号格式，包括：

根据所述第一终端所连接的音频采集设备和具备的软件处理算法能力，确定所述第一终端所支持的音频输入信号格式。

13.根据权利要求12所述的方法，其特征在于，所述音频采集设备包括如下中的至少一种：

内置的单个麦克风；

内置的多个麦克风；

外接的音频信号采集设备。

14.根据权利要求13所述的方法，其特征在于，所述外接的音频信号采集设备包括如下中的至少一种：

音频信号采集球；

麦克风音频采集阵列；

线控耳机。

15.根据权利要求12所述的方法，其特征在于，所述软件处理算法能力包括如下中的至少一种：

将外接的音频信号采集球采集的信号转换为空间音频信号；

16.根据权利要求9或10所述的方法，其特征在于，所述方法还包括：

向核心网网元上报所述第一终端所具备的所述音频回放格式能力。

17.根据权利要求16所述的方法，其特征在于，音频回放格式包括如下中的至少一种：

耳机信号格式；

扬声器信号格式。

18.根据权利要求17所述的方法，其特征在于，所述耳机信号格式包括如下中的至少一种：

单声道信号格式；

立体声信号格式；

双耳信号格式。

19.根据权利要求17所述的方法，其特征在于，所述扬声器信号格式包括如下中的至少一种：

单声道信号格式；

多声道信号格式。

20.根据权利要求9所述的方法，其特征在于，在所述第一终端内置单个麦克风的情况下，所述第一终端所支持的音频输入信号格式包括如下中的至少一种：

单声道信号；

对象信号。

21.根据权利要求20所述的方法，其特征在于，所述对象信号包含单声道音频信号和单通道的元数据信号。

22.根据权利要求9所述的方法，其特征在于，在所述第一终端内置多个麦克风的情况下，或者，在所述第一终端外接音频信号采集设备的情况下，所述第一终端所支持的音频输入信号格式包括如下中的至少一种：

单声道信号；

双声道信号；

多声道信号；

对象信号；

MASA格式信号；

空间音频信号。

23.根据权利要求9所述的方法，其特征在于，在所述第一终端内置一个或多个麦克风，且所述第一终端外接音频信号采集设备的情况下，所述第一终端所支持的音频输入信号格式包括如下中的至少一种：

单声道信号；

双声道信号；

多声道信号；

对象信号；

空间音频信号。

24.根据权利要求22或23所述的方法，其特征在于，所述对象信号包含至少一个声道音频信号和一个通道的元数据信号。

25.根据权利要求22或23所述的方法，其特征在于，所述空间音频信号包括如下中的至少一种：

至少一个声道信号；

背景信号；

元数据信号。

26.一种能力确定装置，其特征在于，所述装置包括：

接收模块，用于接收第一标识符集合，以及接收第二标识符集合，所述第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式，所述第一标识符集合由所述第一终端上报，所述第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式，所述第二标识符集合由所述第二终端上报；

确定模块，用于根据所述第二终端所具备的音频回放格式能力，确定第三候选标识符；根据所述第一终端所具备的音频回放格式能力，确定第四候选标识符；

协商模块，用于在所述第一标识符集合包括所述第三候选标识符，所述第二标识符集合包括所述第四候选标识符的情况下，将所述第三候选标识符对应的音频输入信号格式确定为所述第一终端在建立通信链接时所使用的音频输入信号格式，将所述第四候选标识符对应的音频输入信号格式确定为所述第二终端在建立通信链接时所使用的音频输入信号格式；

所述第三候选标识符和所述第四候选标识符不同。

27.根据权利要求26所述的装置，其特征在于，

所述第一标识符集合是所述第一终端在接入网络时上报的；

28.根据权利要求26或27所述的装置，其特征在于，所述协商模块，还用于：

29.根据权利要求26或27所述的装置，其特征在于，所述协商模块，还用于：

30.根据权利要求29所述的装置，其特征在于，所述第一标识符集合和所述第二标识符集合均包括第一候选标识符和第二候选标识符；

所述协商模块，还用于：

31.根据权利要求26所述的装置，其特征在于，音频回放格式包括如下中的至少一种：

耳机信号格式；

扬声器信号格式。

32.根据权利要求31所述的装置，其特征在于，所述耳机信号格式包括如下中的至少一种：

单声道信号格式；

立体声信号格式；

双耳信号格式。

33.根据权利要求31所述的装置，其特征在于，所述扬声器信号格式包括如下中的至少一种：

单声道信号格式；

多声道信号格式。

34.一种能力上报装置，其特征在于，所述装置包括：

上报模块，用于向核心网网元上报第一标识符集合，所述第一标识符集合用于指示所述装置所支持的至少一种音频输入信号格式；

其中，所述第一标识符集合用于结合第二标识符集合，以确定所述装置和第二终端在建立通信链接时所使用的音频输入信号格式，所述第二标识符集合用于指示所述第二终端所支持的至少一种音频输入信号格式，所述第二标识符集合由所述第二终端向所述核心网网元上报；

在所述第一标识符集合包括第三候选标识符，所述第二标识符集合包括第四候选标识符的情况下，所述第三候选标识符对应的音频输入信号格式被确定为所述装置在建立通信链接时所使用的音频输入信号格式，所述第四候选标识符对应的音频输入信号格式被确定为所述第二终端在建立通信链接时所使用的音频输入信号格式；

所述第三候选标识符和所述第四候选标识符不同，所述第三候选标识符根据所述第二终端所具备的音频回放格式能力确定，所述第四候选标识符根据所述装置所具备的音频回放格式能力确定。

35.根据权利要求34所述的装置，其特征在于，所述上报模块，还用于：

在接入网络时向所述核心网网元上报所述第一标识符集合。

36.根据权利要求34或35所述的装置，其特征在于，所述装置还包括确定模块，用于：

确定所述装置所支持的音频输入信号格式；

为每种音频输入信号格式确定唯一对应的标识符。

37.根据权利要求36所述的装置，其特征在于，所述确定模块，还用于：

根据所述装置所连接的音频采集设备和具备的软件处理算法能力，确定所述装置所支持的音频输入信号格式。

38.根据权利要求37所述的装置，其特征在于，所述音频采集设备包括如下中的至少一种：

内置的单个麦克风；

内置的多个麦克风；

外接的音频信号采集设备。

39.根据权利要求38所述的装置，其特征在于，所述外接的音频信号采集设备包括如下中的至少一种：

音频信号采集球；

麦克风音频采集阵列；

线控耳机。

40.根据权利要求37所述的装置，其特征在于，所述软件处理算法能力包括如下中的至少一种：

将外接的音频信号采集球采集的信号转换为空间音频信号；

41.根据权利要求34或35所述的装置，其特征在于，所述上报模块，还用于：

向核心网网元上报所述装置所具备的音频回放格式能力。

42.根据权利要求41所述的装置，其特征在于，音频回放格式包括如下中的至少一种：

耳机信号格式；

扬声器信号格式。

43.根据权利要求42所述的装置，其特征在于，所述耳机信号格式包括如下中的至少一种：

单声道信号格式；

立体声信号格式；

双耳信号格式。

44.根据权利要求42所述的装置，其特征在于，所述扬声器信号格式包括如下中的至少一种：

单声道信号格式；

多声道信号格式。

45.根据权利要求34所述的装置，其特征在于，在所述装置内置单个麦克风的情况下，所述装置所支持的音频输入信号格式包括如下中的至少一种：

单声道信号；

对象信号。

46.根据权利要求45所述的装置，其特征在于，所述对象信号包含单声道音频信号和单通道的元数据信号。

47.根据权利要求34所述的装置，其特征在于，在所述装置内置多个麦克风的情况下，或者，在所述装置外接音频信号采集设备的情况下，所述装置所支持的音频输入信号格式包括如下中的至少一种：

单声道信号；

双声道信号；

多声道信号；

对象信号；

MASA格式信号；

空间音频信号。

48.根据权利要求34所述的装置，其特征在于，在所述装置内置一个或多个麦克风，且所述装置外接音频信号采集设备的情况下，所述装置所支持的音频输入信号格式包括如下中的至少一种：

单声道信号；

双声道信号；

多声道信号；

对象信号；

空间音频信号。

49.根据权利要求47或48所述的装置，其特征在于，所述对象信号包含至少一个声道音频信号和一个通道的元数据信号。

50.根据权利要求47或48所述的装置，其特征在于，所述空间音频信号包括如下中的至少一种：

至少一个声道信号；

背景信号；

元数据信号。

51.一种核心网网元，其特征在于，所述核心网网元包括收发器和处理器；

所述收发器，用于接收第一标识符集合，以及接收第二标识符集合，所述第一标识符集合用于指示第一终端所支持的至少一种音频输入信号格式，所述第一标识符集合由所述第一终端上报，所述第二标识符集合用于指示第二终端所支持的至少一种音频输入信号格式，所述第二标识符集合由所述第二终端上报；

所述处理器，用于根据所述第二终端所具备的音频回放格式能力，确定第三候选标识符；

所述第三候选标识符和所述第四候选标识符不同。

52.一种第一终端，其特征在于，所述第一终端包括收发器；

所述收发器，用于向核心网网元上报第一标识符集合，所述第一标识符集合用于指示所述第一终端所支持的至少一种音频输入信号格式；

53.一种计算机可读存储介质，其特征在于，所述存储介质中存储有计算机程序，所述计算机程序用于被处理器执行，以实现如权利要求1至8中任一项所述的能力确定方法，或者，权利要求9至25中任一项所述的能力上报方法。

54.一种芯片，其特征在于，所述芯片包括可编程逻辑电路和/或程序指令，当所述芯片运行时，用于实现如权利要求1至8中任一项所述的能力确定方法，或者，权利要求9至25中任一项所述的能力上报方法。

55.一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机指令，所述计算机指令存储在计算机可读存储介质中，处理器从所述计算机可读存储介质读取并执行所述计算机指令，以实现如权利要求1至8中任一项所述的能力确定方法，或者，权利要求9至25中任一项所述的能力上报方法。