WO2024119946A1

WO2024119946A1 - 音频控制方法、音频控制装置、介质与电子设备

Info

Publication number: WO2024119946A1
Application number: PCT/CN2023/118788
Authority: WO
Inventors: 白金; 严锋贵; 林松; 李鸿; 姚津
Original assignee: Oppo广东移动通信有限公司
Priority date: 2022-12-08
Filing date: 2023-09-14
Publication date: 2024-06-13
Also published as: CN118170339A

Abstract

一种音频控制方法，包括：在音频设置界面中提供声像设置控件(S110)；响应于通过所述声像设置控件进行的声像设置操作，根据所述声像设置操作确定目标音频类型的声像信息(S120)；当播放所述目标音频类型下的待播放音频时，基于所述目标音频类型的声像信息对所述待播放音频进行渲染(S130)。

Description

音频控制方法、音频控制装置、介质与电子设备

相关申请的交叉引用

本申请要求于2022年12月08日提交中国专利局、申请号为202211574970.3、发明名称为“音频控制方法、音频控制装置、介质与电子设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本公开涉及音频处理技术领域，尤其涉及一种音频控制方法、音频控制装置、计算机可读存储介质与电子设备。

背景技术

声像，是指听音者对声音位置的感觉印象。现有技术中，音频的声像通常为固定的，例如大部分音频都不具有空间声音特效，其声像默认是在用户的左右两侧或较近范围内。

发明内容

根据本公开的各种实施例提供一种音频控制方法、音频控制装置、计算机可读存储介质与电子设备。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开的第一方面，提供一种音频控制方法，包括：在音频设置界面中提供声像设置控件；响应于通过所述声像设置控件进行的声像设置操作，根据所述声像设置操作确定目标音频类型的声像信息；当播放所述目标音频类型下的待播放音频时，基于所述目标音频类型的声像信息对所述待播放音频进行渲染。

根据本公开的第二方面，提供一种音频控制装置，包括：控件提供模块，用于在音频设置界面中提供声像设置控件；信息确定模块，用于响应于通过所述声像设置控件进行的声像设置操作，根据所述声像设置操作确定目标音频类型的声像信息；音频渲染模块，用于当播放所述目标音频类型下的待播放音频时，基于所述目标音频类型的声像信息对所述待播放音频进行渲染。

根据本公开的第三方面，提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面的音频控制方法及其可能的实现方式。

根据本公开的第四方面，提供一种电子设备，包括：处理器；存储器，用于存储所述处理器的可执行指令。其中，所述处理器配置为经由执行所述可执行指令，来执行上述第一方面的音频控制方法及其可能的实现方式。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出本示例性实施方式中一种音频控制方法的流程图。

图2示出本示例性实施方式中一种音频设置界面的示意图。

图3示出本示例性实施方式中一种虚拟声音空间的示意图。

图4示出本示例性实施方式中另一种音频设置界面的示意图。

图5示出本示例性实施方式中另一种虚拟声音空间的示意图。

图6示出本示例性实施方式中前置模式的界面示意图。

图7示出本示例性实施方式中后置模式的界面示意图。

图8示出本示例性实施方式中空间平铺模式的界面示意图。

图9示出本示例性实施方式中一种音频控制方法的底层架构流程图。

图10示出本示例性实施方式中一种音频播放效果的示意图。

图11示出本示例性实施方式中一种音频控制装置的结构框图。

图12示出本示例性实施方式中一种电子设备的结构图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中，提供许多具体细节从而给出对本公开的实施方式的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而省略特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、操作等。在其它情况下，不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。

此外，附图仅为本公开的示意性图解，并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分，因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体，不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

图1示出了音频控制方法的示例性流程，包括以下操作S110至S130：

操作S110，在音频设置界面中提供声像设置控件。

音频设置界面是指用于与用户进行交互，以对音频进行设置的可视化界面，其中，可以包括待控制的音频类型、音频或声像设置控件等。声像设置控件是指用于对音频进行声像设置的模块控件，通过声像设置控件，可以对音频在播放时的声像分布进行控制和调整。声像设置控件可以是选择控件，用户通过选择操作即可以确定声像信息，声像设置控件也可以是交互控件，用户通过信息输入来确定声像信息等。

在本示例性实施例中，用户可以通过预设操作唤出音频设置界面以触发声像设置控件的显示，例如用户可以通过语音操作，唤出声像设置控件；或者在应用程序中对音频设置的快捷选项进行点击操作，以触发跳转音频设置界面，显示声像设置控件等。

操作S220，响应于通过声像设置控件进行的声像设置操作，根据声像设置操作确定目标音频类型的声像信息。

通常，终端设备可以播放多种不同类型的音频。例如游戏程序中的游戏音、用户进行网络视频或语音时的语音、音乐播放程序的音乐以及终端为用户提供的具有提示功能的通知音等。本示例性实施例可以对上述一种或多种音频类型下的音频进行音频控制，具体的，用户可以在音频设置界面中对声像设置控件进行声像设置操作，先确定目标音频类型的声像信息，其中，目标音频类型是指当前需要进行音频控制的音频类型，音频设置界面中可以提供多种音频类型，以供用户从中确定出目标音频类型。声像信息是指音频在播放时的声像布局信息，该声像布局信息可以是音频对应的声源在声音虚拟空间中的具***置信息，也可以是声像布局的类型名称，例如前置模式，对应声音虚拟空间中前置模式下的声源位置等。用户通过声像设置控件进行声像设置操作，可以确定对哪一种音频类型进行控制，以及对该音频类型下的音频进行怎样的声像布局的控制。

声像设置操作可以是用户在声像设置控件中进行单击、双击、长按、滑动等一种操作或多种组合操作等，例如在确定目标音频类型后，可以通过在音频设置界面中进行滑动的声像设置操作，确定目标音频类型的声像信息；或者用户也可以先通过单击操作从多种音频类型中选择目标音频类型，再通过单击操作选择声像模式，以确定对目标音频类型进行怎样的声像调整，即确定目标音频类型的声像信息等。

图2示出了一种音频设置界面的示意图，音频设置界面中可以显示模拟用户在虚拟声音空间中的模拟位置，音频设置界面中还可以包括多种待选的音频类型选项210，以及声像设置控件220，用户可以通过在音频设置界面中进行声像设置操作，从多种待选的音频类型选项210中确定目标音频类型，并在声像设置控件220中确定目标音频类型对应的声像信息。

操作S230，当播放目标音频类型下的待播放音频时，基于目标音频类型的声像信息对待播放音频进行渲染。

在本示例性实施例中，目标音频类型下可以包括多个音频，例如音乐音频类型下可以包括不同的音乐音频，在确定目标音频类型的声像信息后，本示例性实施例可以将该声像信息应用于该目标音频类型下的所有音频。待播放音频即为当前需要播放的音频，基于目标音频类型的声像信息可以对待播放音频进行渲染，例如在确定游戏音频类型的声像信息后，当需要播放A游戏程序中的音频时，可以基于游戏音频类型的声像信息对A游戏程序中的音频进行渲染。

对待播放音频进行渲染是指根据声像信息中音频在虚拟声音空间中的方位信息进行的音频处理过程，以使待播放音频在播放时，可以呈现出待播放音频的声源位于虚拟声音空间中的特定声源方位的声音效果。其中，虚拟声音空间是指基于人耳的构造、声音在空气中的传播特性等物理规律，模拟的虚拟空间，该虚拟空间具有与物理空间匹配的空间特征。当声源位于虚拟声音空间中的不同位置时，可以模拟出不同的真实声源的声音效果，使用户感受到声音似乎是从三维空间中的虚拟位置发出的。声源是虚拟空间中虚拟出来的一个发声点位置。在本示例性实施例中，虚拟空间中可以包括多个声源位置，一个或多个声源位置可以构成一种声像布局，不同音频类型可以设置不同的声像布局，以实现不同音频类型的音频在同时播放时，互相不干扰的听音效果。

现有技术中，音频的声像非常单调，且不便于用户辨识，当同时播放多种类型的音频时，往往由于其声像相同，导致互相干扰。因此，如何根据用户的实际需求，设置音频类型的声像信息，以进行声像渲染，提高用户的听音体验，是现有技术亟待解决的问题。

综上，本示例性实施方式中，在音频设置界面中提供声像设置控件；响应于通过声像设置控件进行的声像设置操作，根据声像设置操作确定目标音频类型的声像信息；当播放目标音频类型下的待播放音频时，基于目标音频类型的声像信息对待播放音频进行渲染。一方面，本示例性实施例通过对声像设置控件进行声像设置操作，可以根据声像设置操作对目标音频类型进行声像信息的设置，即本示例性实施例提供了一种能够对不同音频类型设置对应声像信息的方式，基于该声像信息进行音频渲染，可以使音频能够根据设置的声像信息进行播放，避免了现有技术中由于音频声像信息单一且固定，导致播放时互相干扰的问题；另一方面，在本示例性实施例中，用户可以通过对声像设置控件进行声像设置操作，即能够实现对目标音频类型声像信息的设置，操作过程简单、便捷，还能够满足用户对音频声像的个性化需求，具有较广的适用范围。

在一示例性实施例中，上述目标音频类型的声像信息包括目标音频类型的空间声源方位；上述操作S230，可以包括：

将待播放音频的音频数据映射至虚拟声音空间中位于空间声源方位的声音对象；

基于声音对象的音频数据进行声像渲染。

目标音频类型的空间声源方位是指，目标音频类型下的音频在声音虚拟空间中对应声源的方位信息，可以包括目标音频类型的声源在虚拟声音空间中的位置、朝向以及距离等信息，其中，位置可以是声源的固定坐标，如三维坐标，或者坐标集合等；朝向是指音频在播放时的主要的传播方向，在声音虚拟空间中相对终端设备的朝向与相背终端设备的朝向，其声音效果也会具有较大的差别，具体的朝向可以通过虚拟空间中声源与终端设备的相对角度表示；距离可以是声源距离声音虚拟空间中模拟用户的距离，或者与其他声源的距离等等。声音对象是指在声音虚拟空间中预先定义的虚拟声音对象，不同的声音对象可以位于虚拟声音空间中的不同位置。例如图3示出了虚拟声音空间300中位于不同空间声源方位的声音对象，可以包括S₁～S₆ 6个固定位置的声音对象，以及3个非固定位置的声音对象，分别对应音乐M、游戏音G和语音V，根据实际需要，终端在出厂设置时，还可以预先配置其他数量的具有固定方位或非固定方位的声音对象，具体可以根据实际场景需求进行设置，本公开对此不做具体限定，例如可以设置S₁～S₉ 9个固定位置的声音对象，以及6个非固定位置的声音对象，如音乐M_L、音乐M_R、游戏音G_L、游戏音G_R、语音V_L、语音V_R，其中，音乐M_L、音乐M_R可以分别对应音乐左声道与音乐右声道的声音对象等。

本示例性实施例可以将待播放音频的音频数据映射至虚拟空间中位于空间声源方位的声音对象，以将未渲染的音频数据与声音对象相关联，基于声音对象的音频数据对待播放音频的音频数据进行声像渲染，可以使得渲染后的音频数据呈现声音对象对应的声像效果。

在一示例性实施例中，上述声像设置控件包括声像模式选择控件；响应于通过声像设置控件进行的声像设置操作，根据声像设置操作确定目标音频类型的声像信息，包括：

响应于通过声像模式选择控件在目标音频类型的多个声像模式中进行选择的操作，根据用户选择的声像模式确定目标音频类型的空间声源方位。

其中，声像模式是指用于确定声像布局样式的选项模式，其可以是预先配置好的具有特定声像布局的模式，也可以是用户自定义的模式。在本示例性实施例中，声像模式可以包括多种，不同的声像模式可以具有不同的音频播放效果。声像设置控件可以包括声像模式选择控件，用户可以通过简单的单击、双击或长按操作等在多个声像模式中进行选择，以确定当前目标音频类型对应的空间声源方位，例如图2所示的声像设置控件220即为一种声像模式选择控件，其中包括前置模式、后置模式、空间平铺以及自定义等多种声像模式。

在一示例性实施例中，上述根据用户选择的声像模式确定目标音频类型的空间声源方位，包括：

响应于用户选择自定义模式，根据目标音频类型的声像布置控件的位置确定目标音频类型的空间声源方位；声像布置控件可被移动。

其中，声像布置控件是指音频设置界面中，用于为用户提供可视化声像布局效果的控件，声像布置控件在音频设置界面中的位置，可以在一定程度上反映声像布置控件表征的声音对象在虚拟声音空间中的空间声源方位。用户可以通过拖动声像布置控件的方式，来确定目标音频类型的空间声源方位，以实现目标音频类型下音频数据的个性化渲染。

图4示出了一种音频设置界面的示意图，显示了模拟用户410在虚拟声音空间中的模拟位置以及空间中前、后、左、右的方向标识，当用户在声像模式选择控件420中选择自定义模式后，可以通过点击或滑动操作拖动游戏音的声像布置控件430、语音的声像布置控件440或音乐的声像布置控件450 在显示界面中进行移动，其移动到的位置对应其在虚拟声音空间中的空间声源方位。图4仅为示意性说明，根据实际需要，除了音乐、游戏音及语音外，还可以有其他音频类型，本公开对此不做具体限定。

响应于用户在多个声像模式中选择前置模式，确定目标音频类型的空间声源方位包括左前方、右前方、正前方。

其中，前置模式为一种声源方位在用户前方区域的声像分布模式，类似于前置喇叭的效果，当用户在多个声像模式中选择前置模式时，如图5所示，则确定目标音频类型的空间声源方位可以包括左前方510、右前方530以及正前方520中的一个或多个。

在本示例性实施例中，当用户选择前置模式时，如图6所示，音频设置界面中可以将自定义模式对应的声像布置控件620、630和640置在右下角，或进行变暗、变小或不显示等其他的弱化显示处理，并突出显示当前前置模式对应的标识610，以可视化的呈现当前目标音频类型对应进行前置模式的声像控制。

在一示例性实施例中，将待播放音频的音频数据映射至虚拟声音空间中位于空间声源方位的声音对象，包括：

将待播放音频的左声道音频数据映射至左前方的声音对象，将待播放音频的右声道音频数据映射至右前方的声音对象，将待播放音频的单声道音频数据映射至正前方的声音对象；单声道音频数据由左声道音频数据和右声道音频数据合并得到。

进一步的，可以按照前置模式下的声音对象的方位进行音频数据的映射，如图5所示，可以将待播放音频的左声道音频数据映射至左前方的声音对象S₁，将待播放音频的右声道音频数据映射至右前方的声音对象S₃，为了使音频能够有更好的播放效果，本示例性实施例还可以根据左右声道的音频数据进行混音处理，得到一单声道音频数据，映射至正前方的声音对象S₂。

在一示例性实施例中，根据用户选择的声像模式确定目标音频类型的空间声源方位，包括：

响应于用户在多个声像模式中选择后置模式，确定目标音频类型的空间声源方位包括左后方、右后方、正后方。

其中，后置模式为一种声源方位在用户后方区域的声像分布模式，类似于后置环绕的效果，当用户在多个声像模式中选择后置模式时，如图5所示，则确定目标音频类型的空间声源方位可以包括左后方560、右后方540以及正后方550中的一个或多个。

在本示例性实施例中，当用户选择后置模式时，如图7所示，音频设置界面中可以突出显示当前后置模式对应的标识710，以可视化的呈现当前目标音频类型对应进行后置模式的声像控制。

将待播放音频的左声道音频数据映射至左后方的声音对象，将待播放音频的右声道音频数据映射至右后方的声音对象，将待播放音频的单声道音频数据映射至正后方的声音对象；单声道音频数据由左声道音频数据和右声道音频数据合并得到。

进一步的，可以按照后置模式下的声音对象的方位进行音频数据的映射，如图5所示，可以将待播放音频的左声道音频数据映射至左后方的声音对象S₆，将待播放音频的右声道音频数据映射至右后方的声音对象S₄，为了使音频能够有更好的播放效果，本示例性实施例还可以根据左右声道的音频数据进行混音处理，得到一单声道音频数据，映射至正后方的声音对象S₅。

响应于用户在多个声像模式中选择空间平铺模式，确定目标音频类型的空间声源方位包括左前方、右前方、正前方、左后方、右后方、正后方。

其中，空间平铺模式为一种声源方位在用户周围区域的声像分布模式，当用户在多个声像模式中选择空间平铺模式时，如图5所示，则可以确定目标音频类型的空间声源方位包括左前方510、右前方530、正前方520、左后方560、右后方540、正后方550中的一个或多个。

在本示例性实施例中，当用户选择空间平铺时，如图8所示，音频设置界面中可以突出显示当前空间平铺模式对应的标识810，以可视化的呈现当前目标音频类型对应进行空间平铺模式的声像控制。

将待播放音频的单声道音频数据施加延时后映射至左前方的声音对象、右前方的声音对象、正前方的声音对象、左后方的声音对象、右后方的声音对象、正后方的声音对象。

进一步的，可以按照空间平铺模式下的声音对象的方位进行音频数据的映射，在本示例性实施例中，为了能够得到更好的立体环绕空间平铺音效，可以先将待播放音频进行混音处理得到一单声道音频数据，然后对其施加延时，再将其映射至如图5所示的左前方的声音对象S₁、右前方的声音对象S₃、正前方的声音对象S₂、左后方的声音对象S₆、右后方的声音对象S₄、正后方的声音对象S₅。

图9示出了本示例性实施例中一种音频控制方法的底层架构流程图，具体可以包括：

操作S910，获取待播放音频，并接收用户对声像模式的选择操作；

当用户选择前置模式时，可以执行

操作S9110，将待播放音频的左声道音频数据L₁映射至左前方的声音对象S₁；

操作S9120，将待播放音频的右声道音频数据R₁映射至右前方的声音对象S₃；

操作S9130，根据待播放音频的左声道音频数据L₁和待播放音频的右声道音频数据R₁，确定待播放音频的单声道音频数据Mono₁；

操作S9140，将待播放音频的单声道音频数据Mono₁映射至正前方的声音对象S₂；

当用户选择空间平铺模式时，可以执行

操作S9210，根据待播放音频的左声道音频数据L₂和右声道音频数据R₂，确定单声道音频Mono₂；

操作S9220，将单声道音频数据Mono₂施加延时后映射至左前方的声音对象S₁、右前方的声音对象S₃、正前方的声音对象S₂、左后方的声音对象、右后方的声音对象、正后方的声音对象；

当用户选择后置模式时，可以执行

操作S9310，将待播放音频的左声道音频数据L₃映射至左后方的声音对象S₆；

操作S9320，将待播放音频的右声道音频数据R₃映射至右后方的声音对象S₄；

操作S9330，根据待播放音频的左声道音频数据L₃和待播放音频的右声道音频数据R₃，确定待播放音频的单声道音频数据Mono₃；

操作S9340，将待播放音频的单声道音频数据Mono₃映射至正后方的声音对象S₅；

当也用户选择自定义模式时，可以执行

操作S9410，根据待播放音频的左声道音频数据L₄和右声道音频数据R₄，确定单声道音频Mono₄；

操作S9420，判断待播放音频的音频类型；

当待播放音频为游戏音时，执行

操作S9430，将待播放音频的单声道音频数据Mono₄映射至游戏音的声音对象G；

当待播放音频为语音时，执行

操作S9440，将待播放音频的单声道音频数据Mono₄映射至语音的声音对象V；

当待播放音频为音乐时，执行

操作S9450，将待播放音频的单声道音频数据Mono₄映射至音乐的声音对象M；

操作S920，基于声音对象的音频数据进行声像渲染；

操作S930，确定信号输出方式；

操作S940，通过耳机信号输出；

操作S950，通过扬声器信号输出。

在一示例性实施例中，上述声像设置控件用于设置多种音频类型的声像信息，以支持对不同音频类型设置不同的声像信息。

在本示例性实施例中，声像设置控件可以对多种音频类型的声像信息进行控制，即音频设置界面中可以包括多种音频类型，根据用户对声像设置控件的操作，可以对这多种音频类型分别进行声像设置操作，以支持对不同音频类型设置不同的声像信息，从而实现在同时播放不同音频类型的音频时，可以呈现出不同的声像效果。例如图10示出了一种不同音频类型对应不同的声像信息的示意图，用户可以对游戏音设置前置模式，以使游戏音可以基于位于虚拟声音空间区域1010的声音对象进行声像渲染；对音乐设置后置模式，以使音乐可以基于位于虚拟声音空间区域1020的声音对象进行声像渲染；对语音设置自定义模式，以使语音可以基于位于虚拟声音空间自定义位置1030的声音对象进行声像渲染，从而使得在同时播放游戏音、音乐和语音时，具有特定且互不干扰的声音效果，以提高用户的听音感受。

在一示例性实施例中，上述音频控制方法还可以包括：

在混音模式开启的状态下，阻止任一种音频类型对音频焦点的请求。

其中，音频焦点是指终端设备专注播放一种类型音频的机制，例如当用户收听音乐时，音乐焦点为播放当前播放的音乐；当用户在收听音乐时，同时打开游戏程序，则会播放游戏音，而停止音乐，此时音频焦点由播放音乐转变为播放游戏音。混音模式是指终端设备可以同时播放多种类型音频的模式，当终端设备处于非混音模式下，存在音频焦点，将根据实际情况播放一种类型的音频；当终端设备处于混音模式下，将会阻止任意一种音频类型对音频焦点的请求，使得所有类型的待播放音频都可以进行播放。

在一示例性实施例中，上述音频控制方法还可以包括：

在音频设置界面中提供音量设置控件，以用于设置目标音频类型的音量。

其中，音量设置控件是指用于对音频的音量进行调整的选项模块，通过音量设置控件，可以自定义调整待播放音频的音量大小。音量设置控件对目标音频类型的音量的控制可以包括多种方式，例如音量设置控件可以包括多个音量档位，通过对目标音量档位的选择，可以将目标音频类型的音量调整至该音量档位，音量设置控件也可以是以滑块的形式，当用户对滑块进行拖动时，音量可以平滑升高或降低。在图2所示的音频设置界面中，示出了其包括待选的音频类型选项210、声像模式选择控件220，以及音量设置控件230的示意图，用户可以通过对音频类型选项210的选择确定目标音频类型，对声像模式选择控件220的选择，确定目标音频类型的声像模式，对音量设置控件230的操作，确定目标音频类型下音频的音量大小。

本公开的示例性实施方式还提供一种音频控制装置。如图11所示，该音频控制装置1100可以包括：控件提供模块，用于在音频设置界面中提供声像设置控件；信息确定模块，用于响应于通过声像设置控件进行的声像设置操作，根据声像设置操作确定目标音频类型的声像信息；音频渲染模块，用于当播放目标音频类型下的待播放音频时，基于目标音频类型的声像信息对待播放音频进行渲染。

在一示例性实施例中，目标音频类型的声像信息包括目标音频类型的空间声源方位；音频渲染模块，包括：映射单元，用于将待播放音频的音频数据映射至虚拟声音空间中位于空间声源方位的声音对象；渲染单元，用于基于声音对象的音频数据进行声像渲染。

在一示例性实施例中，信息确定模块，包括：选择单元，用于响应于通过声像模式选择控件在目标音频类型的多个声像模式中进行选择的操作，根据用户选择的声像模式确定目标音频类型的空间声源方位。

在一示例性实施例中，选择单元，包括：第一选择子单元，用于响应于用户选择自定义模式，根据目标音频类型的声像布置控件的位置确定目标音频类型的空间声源方位；声像布置控件可被移动。

在一示例性实施例中，选择单元，包括：第二选择子单元，用于响应于用户在多个声像模式中选择前置模式，确定目标音频类型的空间声源方位包括左前方、右前方、正前方。

在一示例性实施例中，映射单元，包括：第一映射子单元，用于将待播放音频的左声道音频数据映射至左前方的声音对象，将待播放音频的右声道音频数据映射至右前方的声音对象，将待播放音频的单声道音频数据映射至正前方的声音对象；单声道音频数据由左声道音频数据和右声道音频数据合并得到。

在一示例性实施例中，选择单元，包括：第三选择子单元，用于响应于用户在多个声像模式中选择后置模式，确定目标音频类型的空间声源方位包括左后方、右后方、正后方。

在一示例性实施例中，映射单元，包括：第二映射子单元，用于将待播放音频的左声道音频数据映射至左后方的声音对象，将待播放音频的右声道音频数据映射至右后方的声音对象，将待播放音频的单声道音频数据映射至正后方的声音对象；单声道音频数据由左声道音频数据和右声道音频数据合并得到。

在一示例性实施例中，选择单元，包括：第四选择子单元，用于响应于用户在多个声像模式中选择空间平铺模式，则确定目标音频类型的空间声源方位包括左前方、右前方、正前方、左后方、右后方、正后方。

在一示例性实施例中，映射单元，包括：第三映射子单元，用于将待播放音频的单声道音频数据施加延时后映射至左前方的声音对象、右前方的声音对象、正前方的声音对象、左后方的声音对象、右后方的声音对象、正后方的声音对象。

在一示例性实施例中，声像设置控件用于设置多种音频类型的声像信息，以支持对不同音频类型设置不同的声像信息。

在一示例性实施例中，上述音频控制装置还包括：请求阻止模块，用于在混音模式开启的状态下，阻止任一种音频类型对音频焦点的请求。

在一示例性实施例中，上述音频控制装置还包括：音量控制模块，用于在音频设置界面中提供音量设置控件，以用于设置目标音频类型的音量。

上述装置中各部分的具体细节在方法部分实施方式中已经详细说明，因而不再赘述。

本公开的示例性实施方式还提供了一种计算机可读存储介质，可以实现为程序产品的形式，包括程序代码，当程序产品在终端设备上运行时，程序代码用于使终端设备执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的操作，例如可以执行图1或图10中任意一个或多个操作。该程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在终端设备，例如个人电脑上运行。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络，包括局域网(LAN)或广域网(WAN)，连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

本公开的示例性实施方式还提供一种电子设备。该电子设备可以包括处理器与存储器，存储器用于存储处理器的可执行指令，处理器配置为经由执行可执行指令来执行上述用于畸变校正的图像处理方法。

下面以图12中的移动终端1200为例，对该电子设备的构造进行示例性说明。本领域技术人员应当理解，除了特别用于移动目的的部件之外，图12中的构造也能够应用于固定类型的设备。

如图12所示，移动终端1200具体可以包括：处理器1201、存储器 1202、总线1203、移动通信模块1204、天线1、无线通信模块1205、天线2、显示屏1206、摄像模块1207、音频模块1208、电源模块1209与传感器模块1210。

处理器1201可以包括一个或多个处理单元，例如：处理器1201可以包括AP(Application Processor，应用处理器)、调制解调处理器、GPU(Graphics Processing Unit，图形处理器)、ISP(Image Signal Processor，图像信号处理器)、控制器、编码器、解码器、DSP(Digital Signal Processor，数字信号处理器)、基带处理器和/或NPU(Neural-Network Processing Unit，神经网络处理器)等。

编码器可以对图像或视频进行编码(即压缩)，以减小数据大小，便于存储或发送。解码器可以对图像或视频的编码数据进行解码(即解压缩)，以还原出图像或视频数据。

处理器1201可以通过总线1203与存储器1202或其他部件形成连接。

存储器1202可以用于存储计算机可执行程序代码，可执行程序代码包括指令。处理器1201通过运行存储在存储器1202的指令，执行移动终端1200的各种功能应用以及数据处理。存储器1202还可以存储应用数据，例如存储图像，视频等文件。

移动终端1200的通信功能可以通过移动通信模块1204、天线1、无线通信模块1205、天线2、调制解调处理器以及基带处理器等实现。天线1和天线2用于发射和接收电磁波信号。移动通信模块1204可以提供应用在移动终端1200上3G、4G、5G等移动通信解决方案。无线通信模块1205可以提供应用在移动终端1200上的无线局域网、蓝牙、近场通信等无线通信解决方案。

显示屏1206用于实现显示功能，如显示用户界面、图像、视频等。摄像模块1207用于实现拍摄功能，如拍摄图像、视频等。音频模块1208用于实现音频功能，如播放音频，采集语音等。电源模块1209用于实现电源管理功能，如为电池充电、为设备供电、监测电池状态等。传感器模块1210可以包括一种或多种传感器，用于实现相应的感应检测功能。

所属技术领域的技术人员能够理解，本公开的各个方面可以实现为***、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“***”。本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施方式。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施方式仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限定。

Claims

一种音频控制方法，其特征在于，包括：

在音频设置界面中提供声像设置控件；

响应于通过所述声像设置控件进行的声像设置操作，根据所述声像设置操作确定目标音频类型的声像信息；及

当播放所述目标音频类型下的待播放音频时，基于所述目标音频类型的声像信息对所述待播放音频进行渲染。
根据权利要求1所述的方法，其特征在于，所述目标音频类型的声像信息包括所述目标音频类型的空间声源方位；所述基于所述目标音频类型的声像信息对所述待播放音频进行渲染，包括：

将所述待播放音频的音频数据映射至虚拟声音空间中位于所述空间声源方位的声音对象；及

基于所述声音对象的音频数据进行声像渲染。
根据权利要求2所述的方法，其特征在于，所述声像设置控件包括声像模式选择控件；所述响应于通过所述声像设置控件进行的声像设置操作，根据所述声像设置操作确定目标音频类型的声像信息，包括：

响应于通过所述声像模式选择控件在所述目标音频类型的多个声像模式中进行选择的操作，根据用户选择的声像模式确定所述目标音频类型的空间声源方位。
根据权利要求3所述的方法，其特征在于，所述根据用户选择的声像模式确定所述目标音频类型的空间声源方位，包括：

响应于用户选择自定义模式，根据所述目标音频类型的声像布置控件的位置确定所述目标音频类型的空间声源方位；所述声像布置控件可被移动。
根据权利要求3所述的方法，其特征在于，所述根据用户选择的声像模式确定所述目标音频类型的空间声源方位，包括：

响应于用户在所述多个声像模式中选择前置模式，确定所述目标音频类型的空间声源方位包括左前方、右前方、正前方。
根据权利要求5所述的方法，其特征在于，所述将所述待播放音频的音频数据映射至虚拟声音空间中位于所述空间声源方位的声音对象，包括：

将所述待播放音频的左声道音频数据映射至左前方的声音对象，将所述待播放音频的右声道音频数据映射至右前方的声音对象，将所述待播放音频的单声道音频数据映射至正前方的声音对象；所述单声道音频数据由所述左声道音频数据和所述右声道音频数据合并得到。
根据权利要求3所述的方法，其特征在于，所述根据用户选择的声像模式确定所述目标音频类型的空间声源方位，包括：

响应于用户在所述多个声像模式中选择后置模式，确定所述目标音频类型的空间声源方位包括左后方、右后方、正后方。
根据权利要求7所述的方法，其特征在于，所述将所述待播放音频的音频数据映射至虚拟声音空间中位于所述空间声源方位的声音对象，包括：

将所述待播放音频的左声道音频数据映射至左后方的声音对象，将所述待播放音频的右声道音频数据映射至右后方的声音对象，将所述待播放音频的单声道音频数据映射至正后方的声音对象；所述单声道音频数据由所述左声道音频数据和所述右声道音频数据合并得到。
根据权利要求3所述的方法，其特征在于，所述根据用户选择的声像模式确定所述目标音频类型的空间声源方位，包括：

响应于用户在所述多个声像模式中选择空间平铺模式，确定所述目标音频类型的空间声源方位包括左前方、右前方、正前方、左后方、右后方、正后方。
根据权利要求9所述的方法，其特征在于，所述将所述待播放音频的音频数据映射至虚拟声音空间中位于所述空间声源方位的声音对象，包括：

将所述待播放音频的单声道音频数据施加延时后映射至左前方的声音对象、右前方的声音对象、正前方的声音对象、左后方的声音对象、右后方的声音对象、正后方的声音对象。
根据权利要求1所述的方法，其特征在于，所述声像设置控件用于设置多种音频类型的声像信息，以支持对不同音频类型设置不同的声像信息。
根据权利要求11所述的方法，其特征在于，所述方法还包括：

在混音模式开启的状态下，阻止任一种所述音频类型对音频焦点的请求。
根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述音频设置界面中提供音量设置控件，以用于设置所述目标音频类型的音量。
一种音频控制装置，其特征在于，包括：

控件提供模块，用于在音频设置界面中提供声像设置控件；

信息确定模块，用于响应于通过所述声像设置控件进行的声像设置操作，根据所述声像设置操作确定目标音频类型的声像信息；及

音频渲染模块，用于当播放所述目标音频类型下的待播放音频时，基于所述目标音频类型的声像信息对所述待播放音频进行渲染。
根据权利要求14所述的装置，其特征在于，所述目标音频类型的声像信息包括所述目标音频类型的空间声源方位；所述音频渲染模块包括映射单元，所述映射单元用于将所述待播放音频的音频数据映射至虚拟声音空间中位于所述空间声源方位的声音对象；及基于所述声音对象的音频数据进行声像渲染。
根据权利要求15所述的装置，其特征在于，所述声像设置控件包括声像模式选择控件；所述信息确定模块包括选择单元，所述选择单元用于响应于通过所述声像模式选择控件在所述目标音频类型的多个声像模式中进行选择的操作，根据用户选择的声像模式确定所述目标音频类型的空间声源方位。
根据权利要求16所述的装置，其特征在于，所述选择单元包括第一选择子单元，所述第一选择子单元用于响应于用户选择自定义模式，根据所述目标音频类型的声像布置控件的位置确定所述目标音频类型的空间声源方位；所述声像布置控件可被移动。
根据权利要求16所述的装置，其特征在于，所述选择单元包括第二选择子单元，所述第二选择子单元用于响应于用户在所述多个声像模式中选择前置模式，确定所述目标音频类型的空间声源方位包括左前方、右前方、正前方。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至13任一项所述的方法。
一种电子设备，其特征在于，包括：

处理器；

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至13任一项所述的方法。