CN113347553A - 音频输出方法、音频输出装置及多媒体服务器 - Google Patents
音频输出方法、音频输出装置及多媒体服务器 Download PDFInfo
- Publication number
- CN113347553A CN113347553A CN202110589164.2A CN202110589164A CN113347553A CN 113347553 A CN113347553 A CN 113347553A CN 202110589164 A CN202110589164 A CN 202110589164A CN 113347553 A CN113347553 A CN 113347553A
- Authority
- CN
- China
- Prior art keywords
- audio
- audio output
- target
- parameter group
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
Abstract
本发明实施例公开了一种音频输出方法、一种音频输出装置和一种多媒体服务器。音频输出方法包括:解析多路音频源得到与所述多路音频源一一对应的多个音频源参数组;获取音频输出配置参数组;解码所述多路音频源的音频帧得到与所述多路音频源一一对应的多帧音频数据;根据所述多个音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据;以及输出所述多帧处理后音频数据。本发明可以实现多路音频源对应的多个音频源参数组同时进行原声播放,保证多路音频源的播放音质。
Description
技术领域
本发明涉及通信技术领域,特别涉及一种音频输出方法、一种音频输出装置以及一种多媒体服务器。
背景技术
在演艺现场,常常会出现一个节目包含了多个素材例如音频、视频等,而且同一个节目所包含的多个音频、视频素材通常会带有音频数据,在节目播放过程中,需要保证每一个素材(音频、视频)都能按其录制、保存时的声音效果播放出来。然而,在多路音频源中每一路音频源的音频源参数有所不同情况下,这些多路音频源在同时播放时难以保证音频源的音质效果。
发明内容
本发明的主要目的是针对现有技术的缺陷和不足,提供一种音频输出方法、一种音频输出装置以及一种多媒体服务器,使多路音频源在音频源参数不同的情况下能够实现同时进行高音质播放。
一方面,本发明的一个实施例公开一种音频输出方法,包括:解析多路音频源得到与所述多路音频源一一对应的多个音频源参数组;获取音频输出配置参数组;解码所述多路音频源的音频帧得到与所述多路音频源一一对应的多帧音频数据;根据所述多个音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据;以及输出所述多帧处理后音频数据。
上述实施例通过采用解析音频源以获取音频源参数组、获取音频输出配置参数组、并根据音频源参数组和音频输出配置参数组对解码后的音频帧数据进行处理后输出,实现多路音频源对应的多个音频源参数组同时进行原声播放,保证多路音频源的播放音质。
在本发明的一个实施例中,每个音频源参数组和所述音频输出配置参数组分别包括:采样频率;所述根据所述多音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据,包括:将所述多个音频源参数组中的多个采样频率分别和所述音频输出配置参数组中的采样频率进行比对;当所述多个音频源参数组中的目标音频源参数组的采样频率与所述音频输出配置参数组中的采样频率不一致时,根据所述目标音频源参数组的采样频率、所述音频输出配置参数组的采样频率以及与所述目标音频源参数组对应的目标音频源的目标音频帧的采样点数确定所述目标音频帧的重采样点数,以根据所述重采样点数对所述目标帧进行重采样得到所述多帧处理后音频数据中与所述目标音频源的所述目标帧对应的目标帧处理后音频数据。
在本发明的一个实施例中,每个音频源参数组和所述音频输出配置参数组分别包括:采样精度;所述根据所述多音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据,包括:将所述多个音频源参数组中的多个采样精度分别和所述音频输出配置参数组中的采样精度进行比对;以及当所述多个音频源参数组中的目标音频源参数组的采样精度与所述音频输出配置参数组中的采样精度不一致时,根据所述目标音频源参数组的采样精度、所述音频输出配置参数组的采样精度,转换与所述目标音频源参数组对应的目标音频源的目标音频帧的所述目标帧音频数据,得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
在本发明的一个实施例中,每个音频源参数组和所述音频输出配置参数组分别包括:输出通道数;所述根据所述多音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据,包括:将所述多个音频源参数组中的多个输出通道数分别和所述音频输出配置参数组中的输出通道数进行比对;以及当所述多个音频源参数组中的目标音频源参数组的输出通道数大于所述音频输出配置参数组中的输出通道数时,根据所述音频输出配置参数组中的输出通道数获取与所述目标音频源参数组中的输出通道数对应的音频数据,得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
在本发明的一个实施例中,每个音频源参数组和所述音频输出配置参数组分别包括:通道布局;所述根据所述多音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据,包括:将所述多个音频源参数组中的多种通道布局分别和所述音频输出配置参数组中的通道布局进行比对;以及当所述多个音频源参数组中的目标音频源参数组的通道布局与所述音频输出配置参数组中的通道布局不一致时,根据所述音频输出配置参数组中的通道布局获取与所述目标音频源参数组中的通道布局对应的音频数据,得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
在本发明的一个实施例中,所述获取音频输出配置参数组之前,包括:获取初始音频输出参数组;以及根据所述初始音频输出参数组开启音频输出设备并确定所述音频输出配置参数组。
在本发明的一个实施例中,每个音频源参数组和所述初始音频输出参数组分别包括:输出通道数、采样频率、采样精度、通道布局;所述获取初始音频输出参数组,包括:比对所述多个音频源参数组中的多个输出通道数、多个采样频率、多个采样精度,分别选取所述多个输出通道数中的最大值、多个采样频率中的最大值、多个采样精度中的最大值作为所述初始音频输出参数组的输出通道数、采样频率、采样精度;以及比对所述多个音频源参数组中的多个通道布局,选取所述多个通道布局中的布局方位最多的通道布局作为所述初始音频输出参数组的通道布局。
在本发明的一个实施例中,所述根据所述初始音频输出参数组开启音频输出设备并确定所述音频输出配置参数组包括:当所述音频输出设备支持所述初始音频输出参数组时,开启所述音频输出设备、并将所述初始音频输出参数组作为所述音频输出配置参数组;当所述音频输出设备不支持所述初始音频输出参数组时,调整所述初始音频输出参数组得到调整后音频输出参数组、根据所述调整后音频输出参数组开启所述音频输出设备、并将所述调整后音频输出参数组作为所述音频输出配置参数组。
另一方面,本发明实施例还公开了一种音频输出装置,包括:解析模块、获取模块、解码模块、处理模块和输出模块。其中,所述解析模块,用于解析多路音频源得到与所述多路音频源一一对应的多组音频源参数,其中,所述多组音频源参数不完全相同;所述获取模块,用于获取音频输出配置参数;所述解码模块,用于解码所述多路音频源的音频帧得到与所述多路音频源一一对应的多帧音频数据;所述处理模块,用于根据所述多组音频源参数和所述音频输出配置参数,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据;以及所述输出模块,用于输出所述多帧处理后音频数据。
又一方面,本发明实施例还公开了一种多媒体服务器,包括:输入接口、处理器、存储器和声卡,其中,所述处理器连接所述输入接口;所述存储器连接所述处理器;所述声卡连接所述存储器;其中,所述处理器用于:通过所述输入接口接收多路音频源、解析多路音频源得到与所述多路音频源一一对应的多个音频源参数组;获取音频输出配置参数组;解码所述多路音频源的音频帧得到与所述多路音频源一一对应的多帧音频数据;根据所述多个音频源参数组和所述音频输出配置参数组分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据;存储所述多帧处理后音频数据至所述存储器,以供所述声卡从所述存储器中获取并输出所述多帧处理后音频数据。
上述至少一个技术方案具有如下优点或有益效果:
本发明实施例通过采用解析音频源以获取音频源参数组、获取音频输出配置参数组、并通过音频源参数组和音频输出配置参数组对解码后的音频帧进行处理后输出,实现多路音频源对应的多个音频源参数组同时进行原声播放,保证多路音频源的播放音质。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明第一实施例公开的一种音频输出方法的流程示意图。
图2为图1中的步骤S20之前的详细流程示意图。
图3为图2中的步骤S18的详细流程示意图。
图4为图2中的步骤S19的详细流程示意图。
图5a为图1中的步骤S40的一种详细流程示意图。
图5b为图1中的步骤S40的另一种详细流程示意图。
图5c为图1中的步骤S40的又一种详细流程示意图。
图5d为图1中的步骤S40的再一种详细流程示意图。
图6为本发明第一实施例公开的一种多媒体服务器的结构示意图。
图7为本发明第二实施例公开的一种音频输出装置的结构示意图。
图8为本发明第三实施例公开的一种音频输出***的结构示意图。
图9为本发明第四实施例公开的一种计算机可读存储介质的结构示意图。
具体实施方式
以下结合附图和具体实施,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互结合。
【第一实施例】
如图1所示,本发明第一实施例提供的一种音频输出方法,例如包括如下步骤:
S10:解析多路音频源得到与所述多路音频源一一对应的多个音频源参数组;
S20:获取音频输出配置参数组;
S30:解码所述多路音频源的音频帧得到与所述多路音频源一一对应的多帧音频数据;
S40:根据所述多个音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据;以及
S50:输出所述多帧处理后音频数据。
具体地,步骤S10中提到的多个音频源参数组中的每个音频源参数组例如包括:采样频率、采样精度、输出通道数和通道布局。其中,提到的采样频率例如也称为采样速度或者采样率,指每秒从连续信号中提取并组成离散信号的采样个数,通常用赫兹(Hz)来表示,以音频源参数中采样频率为48000Hz为例,即指计算机或多媒体设备每秒钟在音频数据中采集48000个采样点即声音样本。提到的采样精度例如也称为位深,是指通过采集声音的动态范围来反映度量声音波形幅度的精度,数值越大,分辨率也就越高,采样精度以位(Bit)为单位,以音频源参数中采样精度为16Bit为例,计算机或多媒体设备采集的每个声音样本用16Bit表示,测得的声音样本值是在0~65535的范围里,它的精度就是输入信号的1/65536。提到的输出通道数例如为声音的通道的数目。提到的通道布局例如为音频输出通道的方位布局。此处值得一提的是,提到的多路音频源的多个音频源参数组中两两中的采样频率、采样精度、输出通道数和通道布局等各参数例如不完全相同或完全不同。
具体地,步骤S20中提到的音频输出配置参数组也例如包括:采样频率、采样精度、输出通道数和通道布局。
如图2所示,在步骤S20之前例如包括:
S18:获取初始音频输出参数组;以及
S19:根据所述初始音频输出参数组开启音频输出设备并确定所述音频输出配置参数组。
具体地,步骤S18中提到的初始音频输出参数组也例如包括:采样频率、采样精度、输出通道数和通道布局。
如图3所示,步骤S18例如具体包括:
S181:比对所述多个音频源参数组中的多个输出通道数、多个采样频率、多个采样精度,分别选取所述多个输出通道数中的最大值、多个采样频率中的最大值、多个采样精度中的最大值作为所述初始音频输出参数组的输出通道数、采样频率、采样精度;以及
S182:比对所述多组音频源参数组中的多个通道布局,选取所述多个通道布局中的布局方位最多的通道布局作为所述初始音频输出参数组的通道布局。
值得一提的是,本发明实施例并不限制步骤S181和步骤S182的执行先后顺序,既可以先执行步骤S181,也可以先执行步骤S182。
其中,以5.1声道音频源和双声道音频源为例,5.1声道音频源的通道布局为前方左声道、前方右声道、后方左声道、后方右声道、中间声道以及一个可选的低音声道,双声道音频源的通道布局为左声道和右声道。当多个音频源参数组中的通道布局中既包括5.1声道音频源的通道布局,又包括双声道音频源的通道布局,那么选取多个通道布局中的布局方位最多的通道布局即为5.1声道音频源的通道布局。
如图4所示,步骤S19例如包括:
S191:当所述音频输出设备支持所述初始音频输出参数组时,开启所述音频输出设备、并将所述初始音频输出参数组作为所述音频输出配置参数组;
S192:当所述音频输出设备不支持所述初始音频输出参数组时,调整所述初始音频输出参数组得到调整后音频输出参数组、根据所述调整后音频输出参数组开启所述音频输出设备、并将所述调整后音频输出参数组作为所述音频输出配置参数组。
值得一提的是,步骤S191和步骤S192为步骤S19的两种具体执行情况,因而步骤S191和步骤S192并无执行先后顺序。
其中,提到的调整例如基于人机交互技术执行,多媒体服务器响应用户调整操作得到所述调整后音频输出参数组,当然也可以由多媒体服务器基于预设调整规则执行调整操作得到所述调整后音频输出参数组。提到的调整规则例如为基于现有音频输出设备的配置参数中诸如48000Hz、44100Hz、220500Hz等采样频率依次降低,每调整一次后,多媒体服务器根据调整后音频输出参数组去开启所述音频输出设备、并将所述调整后音频输出参数组作为所述音频输出配置参数组。
具体地,步骤S30中提到的多帧音频数据例如包括:采样点数和播放采样点所需时间。
每个音频源参数组和所述音频输出配置参数组分别包括:采样频率。如图5a所示,步骤S40例如包括:
S41a:将所述多个音频源参数组中的多个采样频率分别和所述音频输出配置参数组中的采样频率进行比对;
S42a:当所述多个音频源参数组中的目标音频源参数组的采样频率与所述音频输出配置参数组中的采样频率不一致时,根据所述目标音频源参数组的采样频率、所述音频输出配置参数组的采样频率以及与所述目标音频源参数组对应的目标音频源的目标音频帧的采样点数确定所述目标音频帧的重采样点数;
S43a:根据所述重采样点数对所述目标帧进行重采样得到所述多帧处理后音频数据中与所述目标音频源的所述目标帧对应的目标帧处理后音频数据。
其中,得到的处理后音频数据例如为以一定的频率对连续的模拟音频信号进行模数转换得到的数字化的声音数据。此处值得一提的是,当两者的采样频率一致时,则无需对所述目标帧进行重采样得到所述多帧处理后音频数据中与所述目标音频源的所述目标帧对应的目标帧处理后音频数据,而直接输出目标帧的音频数据。
其中,所述目标音频帧的重采样点数例如通过提到的音频输出配置参数组中的采样频率和所述目标音频帧的采样点数的乘积与所述目标音频源参数的采样频率相除得到(即重采样点数=音频输出配置参数组中的采样频率*目标音频帧的采样点数/目标音频源参数的采样频率)。
其中,每个音频源参数组和所述音频输出配置参数组分别包括:采样精度。如图5b所示,步骤S40例如还包括:
S41b:将所述多个音频源参数组中的多个采样精度分别和所述音频输出配置参数组中的采样精度进行比对;以及
S42b:当所述多个音频源参数组中的目标音频源参数组的采样精度与所述音频输出配置参数组中的采样精度不一致时,根据所述目标音频源参数组的采样精度、所述音频输出配置参数组的采样精度,转换与所述目标音频源参数组对应的目标音频源的目标音频帧的所述目标帧音频数据,得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
此处值得一提的是,当两者的采样精度一致时,则无需对所述目标帧进行转换得到所述多帧处理后音频数据中与所述目标音频源的所述目标帧对应的目标帧处理后音频数据,而直接输出目标帧的音频数据。
其中,每个音频源参数组和所述音频输出配置参数组分别包括:输出通道数。如图5c所示,步骤S40例如还包括:
S41c:将所述多个音频源参数组中的多个输出通道数分别和所述音频输出配置参数组中的输出通道数进行比对;
S42c:当所述多个音频源参数组中的目标音频源参数组的输出通道数大于所述音频输出配置参数组中的输出通道数时,根据所述音频输出参数组中的输出通道数获取与所述目标音频源参数组中的输出通道数对应的音频数据得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
此处值得一提的是,当所述多个音频源参数组中的目标音频源参数组的输出通道数小于或等于所述音频输出配置参数组中的输出通道数时,可直接匹配所述音频输出配置参数组中对应的输出通道以获取与所述目标音频源参数组中的输出通道数对应的音频数据得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
其中,每个音频源参数组和所述音频输出配置参数组分别包括:通道布局。如图5d所示,步骤S40例如还包括:
S41d:将所述多个音频源参数组中的多种通道布局分别和所述音频输出配置参数组中的通道布局进行比对;
S42d:当所述多个音频源参数组中的目标音频源参数组的通道布局与所述音频输出配置参数组中的通道布局不一致时,根据所述音频输出配置参数组中的通道布局获取与所述目标音频源参数组中的通道布局对应的音频数据得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
此处值得一提的是,当两者的通道布局一致时,则无需根据所述音频输出配置参数组中的通道布局获取与所述目标音频源参数组中的通道布局对应的音频数据得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据,而直接输出目标帧的音频数据。
具体地,步骤S50例如包括:输出所述多帧处理后音频数据至音频输出设备进行播放。其中,提到的音频输出设备例如为声卡,当然本发明实施例并不限制音频输出设备的具体种类,具体可以根据实际需要进行设计。
通过上述方法可以实现多路音频源对应的多个音频源参数组在不完全相同的情况下同时进行原声播放,保证多路音频源的播放音质。
为了便于理解,下面对本发明实施例公开的音频输出方法进行举例说明。
如图6所示,本发明实施例公开的音频输出方法例如应用于多媒体服务器200上,提到的多媒体服务器200可例如包括:输入接口210、处理器220、存储器230和声卡240。其中,提到的处理器220连接所述输入接口210;提到的存储器230连接所述处理器220;提到的声卡240连接所述存储器230。当然此处的多媒体服务器也可以为PC机、工控机等具有数据处理功能的电子设备,本发明不以此为限。
具体地,输入接口210可例如为AES/EBU(Audio Engineering Society/EuropeanBroadcast Union,音频工程师协会/欧洲广播联盟)接口,当然本发明实施例并不以此为限,具体地可依据实际应用进行设计。处理器220例如为ARM处理器或者中央处理器(CPU),当然本发明实施例并不以此为限,例如还可以是MIPS处理器等。存储器230例如为易失性存储器或非易失性存储器。具体地,存储器230例如RAM(Random Access Memory,随机存取存储器),闪存(FLASH)等,具体可依据实际应用进行设计。声卡可例如为集成式声卡,具有成本低廉、兼容性好的优点,当然例如还可以是板卡式声卡等,具体地可依据实际应用进行设计。
举例而言,通过输入接口210接收多路音频源。多路音频源例如包括5.1声道音频源和双声道音频源。处理器220解析5.1声道音频源得到与5.1声道音频源一一对应的多个5.1声道音频源参数组;以及解析双声道音频源得到与双声道音频源一一对应的多个双声道音频源参数组。
具体地,5.1声道是指前方左声道、前方右声道、后方左声道、后方右声道、中间声道,及一个可选的低音声道即0.1声道重低音声道。一套***总共可连接6个喇叭。其中“0.1”声道,则是一个专门设计的超低音声道,这一声道可以产生频响范围20~120Hz的超低音。提到的5.1声道音频源则是包含5.1声道的声音单元。双声道是指左右两个声音通道,其原理为人们听到声音时可以根据左耳和右耳相对声音相位差来判断声源的具***置。提到的双声道音频源则是包含双声道的声音单元。其中,解析5.1声道音频源获取对应的5.1声道音频源参数组例如包括:输出通道数为6、通道布局、采样频率为48000Hz、采样精度为16bit等。解析双声道音频源获取对应的双声道音频源参数组例如包括:输出通道数为2、通道布局、采样频率为48000Hz、采样精度为16bit等。当然本发明并不以此为限,具体可根据实际音频源进行解析获取。
进一步地,处理器220获取初始音频输出参数;以及根据初始音频输出参数开启音频输出设备并确定音频输出配置参数组。此处的初始音频输出参数可例如为用户设定的一组音频输出参数。
当然,初始音频输出参数也可以根据多个音频源参数组确定。具体地,根据解析5.1声道音频源获取的5.1声道音频源参数组:输出通道数为6、通道布局、采样频率为48000Hz、采样精度为16bit等以及解析双声道音频源获取的双声道音频源参数组:输出通道数为2、通道布局、采样频率为48000Hz、采样精度为16bit等,比对5.1声道音频源参数组和双声道音频源参数组中的输出通道数、采样频率、采样精度,分别选取输出通道数的最大值、采样频率的最大值、采样精度的最大值作为初始音频输出参数的输出通道数、采样频率、采样精度,即选取输出通道数为6、采样频率为48000Hz、采样精度为16bit。比对5.1声道音频源参数组和双声道音频源参数组中的通道布局,选取通道布局中的布局方位最多的通道布局作为初始音频输出参数的通道布局,即5.1声道音频源的通道布局:前方左通道、前方右通道、后方左通道、后方右通道、中间通道以及一个可选的低音通道。
具体地,当音频输出设备支持初始音频输出参数组时,开启音频输出设备、并将初始音频输出参数组作为音频输出配置参数组。当音频输出设备不支持初始音频输出参数组时,调整初始音频输出参数组得到调整后音频输出参数组、根据调整后音频输出参数组开启音频输出设备、并将调整后音频输出参数组作为音频输出配置参数组。举例而言,获取的初始音频输出参数中的采样频率例如为48000Hz,遍历多个音频输出设备,而所有的音频输出设备全都不支持初始音频输出参数组中的采样频率,则可以降低期望值,设置调整后音频输出参数组,例如设置调整后音频输出参数组中的采样频率为44100Hz,再重复执行遍历多个音频输出设备,依次根据重设音频输出参数组打开音频输出设备,直到成功开启目标音频输出设备停止。而成功打开目标音频输出设备的调整后音频输出参数组即为音频输出配置参数组。
进一步地,处理器220对5.1声道音频源的5.1声道音频帧和双声道音频源的双声道音频帧分别进行解码处理以获取5.1声道音频帧数据和双声道音频帧数据。具体地,提到的5.1声道音频帧数据和提到的双声道音频帧数据例如分别包括采样点数和播放采样点所需时间等数据。
进一步地,处理器220根据5.1声道音频源参数组、双声道音频源参数组和音频输出配置参数组,分别对5.1声道音频帧数据和双声道音频帧数据进行处理得到与5.1声道音频源和双声道音频源一一对应的处理后5.1声道音频帧数据和处理后双声道音频帧数据。
具体地,分别比对5.1声道音频源参数和双声道音频源参数中的采样频率和音频输出配置参数组中的采样频率、5.1声道音频源参数和双声道音频源参数中的采样精度和音频输出配置参数组的采样精度、5.1声道音频源参数和双声道音频源参数中的输出通道数和音频输出配置参数组中的输出通道数以及5.1声道音频源参数和双声道音频源参数中的通道布局和音频输出配置参数组的通道布局。其中,当5.1声道音频源参数和双声道音频源参数与音频输出配置参数组比对一致时,可将5.1声道音频源和双声道音频源解码后的5.1声道音频帧数据和双声道音频帧数据直接输出。
其中,当5.1声道音频源参数组和双声道音频源参数组中的目标音频源参数组的采样频率与音频输出配置参数组中的采样频率不一致时,根据目标音频源参数的采样频率、音频输出配置参数组的采样频率以及与目标音频源参数组对应的目标音频源的目标音频帧的采样点数,确定目标音频帧的重采样点数以对目标帧进行重采样得到目标帧的目标帧处理后音频数据。
具体地,假设目标音频帧的重采样点数记为out_count,音频输出配置参数组中的采样频率记为out_frequency,目标音频帧的采样点数记为in_count,以及目标音频源参数组的采样频率记为in_frequency。目标音频帧的重采样点数例如通过音频输出配置参数组中的采样频率和目标音频帧的采样点数的乘积与目标音频源参数组的采样频率相除得到。(即out_count=out_frequency×in_count/in_frequency)。
值得一提的是,每一帧音频帧的播放采样点所需时间即播放时长在重采样前后保持一致,也就是,假设将每一帧音频帧的播放采样点所需时间即播放时长记为in_duration,则in_duration=in_frequency×in_count=out_frequency×out_count。
其中,当5.1声道音频源参数组和双声道音频源参数组中的目标音频源参数组的采样精度与音频输出配置参数组中的采样精度不一致时,根据5.1声道音频源参数组和双声道音频源参数组中的目标音频源参数组的采样精度、音频输出配置参数组中的采样精度,转换与5.1声道音频源参数组和双声道音频源参数组中的目标音频源参数组对应的目标音频源的目标音频帧的目标帧音频数据得到多帧处理后音频数据中与目标音频帧对应的目标帧处理后音频数据。
其中,当5.1声道音频源参数组和双声道音频源参数组中的目标音频源参数组的输出通道数大于音频输出配置参数组中的输出通道数时,根据音频输出配置参数组中的输出通道数获取与目标音频源参数组中的输出通道数对应的音频数据得到多帧处理后音频数据中与目标音频帧对应的目标帧处理后音频数据。
其中,当5.1声道音频源参数组和双声道音频源参数组中的目标音频源参数组的通道布局与音频输出配置参数组中的通道布局不一致时,根据音频输出配置参数组中的通道布局获取与目标音频源参数组中的输出通道数对应的音频数据得到多帧处理后音频数据中与目标音频帧对应的目标帧处理后音频数据。
值得一提的是,处理器220将目标帧处理后音频数据存储至所述存储器230,以供声卡240从存储器230中获取并输出目标帧处理后音频数据。输出的目标帧处理后音频数据例如通过混音输出,提到的混音输出例如为现有技术中的混音输出方式,在此不再赘述。
综上所述,本发明实施例通过采用解析音频源以获取音频源参数组、获取音频输出配置参数组、并根据音频源参数组和音频输出配置参数组对解码后的音频帧数据进行处理后输出,实现多路音频源对应的多个音频源参数组同时进行原声播放,保证多路音频源的播放音质。尤其是在多个音频源参数组不完全相同或者完成不同的情况下,其更可确保多个不同的音频源的正常播放,并保证播放音质。
【第二实施例】
如图7所示,本发明第二实施例还提供了一种音频输出装置100,例如包括:解析模块110、获取模块120、解码模块130、处理模块140和输出模块150。
其中,解析模块110例如用于解析多路音频源得到与所述多路音频源一一对应的多个音频源参数组;获取模块120例如用于获取音频输出配置参数组;解码模块130例如用于解码所述多路音频源的音频帧得到与所述多路音频源一一对应的多帧音频数据;处理模块140例如用于根据所述多个音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据;以及输出模块150例如用于输出所述多帧处理后音频数据。
具体地,提到的音频源参数组和提到的音频输出配置参数组分别包括:采样频率、采样精度、输出通道数和通道布局。提到的处理模块140例如具体用于将所述多个音频源参数组中的多个采样频率分别和所述音频输出配置参数组中的采样频率进行比对、将所述多个音频源参数组中的多个采样精度分别和所述音频输出配置参数组中的采样精度进行比对、将所述多个音频源参数组中的多个输出通道数分别和所述音频输出配置参数组中的输出通道数进行比对、以及将所述多个音频源参数组中的多种通道布局分别和所述音频输出配置参数组中的通道布局进行比对。
其中,当所述多个音频源参数组中的目标音频源参数组的采样频率与所述音频输出参数组中的采样频率不一致时,处理模块140根据所述目标音频源参数组的采样频率、所述音频输出配置参数组的采样频率以及与所述目标音频源参数组对应的目标音频源的目标音频帧的采样点数确定所述目标音频帧的重采样点数,以根据所述重采样点数对所述目标帧进行重采样,得到所述多帧处理后音频数据中与所述目标音频源的所述目标帧对应的目标帧处理后音频数据。
其中,当所述多个音频源参数组中的目标音频源参数组的采样精度与所述音频输出配置参数组中的采样精度不一致时,处理模块140根据所述目标音频源参数组的采样精度、所述音频输出配置参数组的采样精度,转换与所述目标音频源参数组对应的目标音频源的目标音频帧的所述目标帧音频数据,得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
其中,当所述多个音频源参数组中的目标音频源参数组的输出通道数大于所述音频输出配置参数组中的输出通道数时,处理模块140根据所述音频输出配置参数组中的输出通道数获取与所述目标音频源参数组中的输出通道数对应的音频数据,得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
其中,当所述多个音频源参数组中的目标音频源参数组的通道布局与所述音频输出配置参数组中的通道布局不一致时,处理模块140根据所述音频输出配置参数组中的通道布局获取与所述目标音频源参数组中的通道布局对应的音频数据,得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
具体地,提到的获取模块120在获取音频输出配置参数组之前例如还用于获取初始音频输出参数组;以及根据所述初始音频输出参数组开启音频输出设备并确定所述音频输出配置参数组。其中,获取模块120比对所述多个音频源参数组中的多个输出通道数、多个采样频率、多个采样精度,分别选取所述多个输出通道数中的最大值、多个采样频率中的最大值、多个采样精度中的最大值作为所述初始音频输出参数组的输出通道数、采样频率、采样精度;以及比对所述多个音频源参数组中的多个通道布局,选取所述多个通道布局中的布局方位最多的通道布局作为所述初始音频输出参数组的通道布局。此外,当所述音频输出设备支持所述初始音频输出参数组时,获取模块120开启所述音频输出设备、并将所述初始音频输出参数组作为所述音频输出配置参数组。当所述音频输出设备不支持所述初始音频输出参数组时,获取模块120调整所述初始音频输出参数组得到调整后音频输出参数组、根据所述调整后音频输出参数组开启所述音频输出设备、并将所述调整后音频输出参数组作为所述音频输出配置参数组。
【第三实施例】
如图8所示,本发明第三实施例还提供了一种音频输出***300。音频输出***300例如包括处理器310和与处理器310连接的存储器320。存储器320例如为非易失性存储器,其上存储有计算机程序321。处理器310例如为中央处理器等。处理器310运行计算机程序321时执行前述实施例提供的音频输出方法。本实施例中的音频输出***300的具体工作过程和技术效果参见前述实施例对音频输出方法的描述,在此不再赘述。
【第四实施例】
如图9所示,本发明第四实施例还提供一种计算机可读存储介质400,存储有计算机可执行指令410。计算机可执行指令410用于执行如前述实施例的音频输出方法。计算机可读存储介质400例如为非易失性存储器,如包括:磁介质(如硬盘、软盘和磁带),光介质(如CDROM盘和DVD),磁光介质(如光盘)以及专门构造为用于存储和执行计算机可执行指令410的硬件装置(如只读存储器(ROM)、随机存取存储器(RAM)、闪存等)。计算机可读存储介质400可由一个或多个处理器或处理装置来执行计算机可执行指令410,以实现如前述实施例提供的音频输出方法。
综上所述,本发明实施例公开的音频输出方法通过采用解析音频源以获取音频源参数组、获取音频输出配置参数组、并通过音频源参数组和音频输出配置参数组对解码后的音频帧进行处理后输出,实现多路音频源对应的多个音频源参数组同时进行原声播放,保证多路音频源的播放音质。
在本发明所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多路单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多路网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。本发明陈述的多个单元或装置也可以由一个单元或装置通过软件或硬件来实现。“第一”、“第二”等用来表示名称,并不表示任何特定顺序。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (10)
1.一种音频输出方法,其特征在于,包括:
解析多路音频源得到与所述多路音频源一一对应的多个音频源参数组;
获取音频输出配置参数组;
解码所述多路音频源的音频帧得到与所述多路音频源一一对应的多帧音频数据;
根据所述多个音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据;以及
输出所述多帧处理后音频数据。
2.根据权利要求1所述的音频输出方法,其特征在于,每个音频源参数组和所述音频输出配置参数组分别包括:采样频率;所述根据所述多音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据,包括:
将所述多个音频源参数组中的多个采样频率分别和所述音频输出配置参数组中的采样频率进行比对;
当所述多个音频源参数组中的目标音频源参数组的采样频率与所述音频输出配置参数组中的采样频率不一致时,根据所述目标音频源参数组的采样频率、所述音频输出配置参数组的采样频率以及与所述目标音频源参数组对应的目标音频源的目标音频帧的采样点数确定所述目标音频帧的重采样点数,以根据所述重采样点数对所述目标帧进行重采样,得到所述多帧处理后音频数据中与所述目标音频源的所述目标帧对应的目标帧处理后音频数据。
3.根据权利要求1所述的音频输出方法,其特征在于,每个音频源参数组和所述音频输出配置参数组分别包括:采样精度;所述根据所述多音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据,包括:
将所述多个音频源参数组中的多个采样精度分别和所述音频输出配置参数组中的采样精度进行比对;以及
当所述多个音频源参数组中的目标音频源参数组的采样精度与所述音频输出配置参数组中的采样精度不一致时,根据所述目标音频源参数组的采样精度、所述音频输出配置参数组的采样精度,转换与所述目标音频源参数组对应的目标音频源的目标音频帧的目标帧音频数据,得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
4.根据权利要求1所述的音频输出方法,其特征在于,每个音频源参数组和所述音频输出配置参数组分别包括:输出通道数;所述根据所述多音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据,包括:
将所述多个音频源参数组中的多个输出通道数分别和所述音频输出配置参数组中的输出通道数进行比对;以及
当所述多个音频源参数组中的目标音频源参数组的输出通道数大于所述音频输出配置参数组中的输出通道数时,根据所述音频输出配置参数组中的输出通道数获取与所述目标音频源参数组中的输出通道数对应的音频数据,得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
5.根据权利要求1所述的音频输出方法,其特征在于,每个音频源参数组和所述音频输出配置参数组分别包括:通道布局;所述根据所述多音频源参数组和所述音频输出配置参数组,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据,包括:
将所述多个音频源参数组中的多种通道布局分别和所述音频输出配置参数组中的通道布局进行比对;以及
当所述多个音频源参数组中的目标音频源参数组的通道布局与所述音频输出配置参数组中的通道布局不一致时,根据所述音频输出配置参数组中的通道布局获取与所述目标音频源参数组中的通道布局对应的音频数据,得到所述多帧处理后音频数据中与所述目标音频帧对应的目标帧处理后音频数据。
6.根据权利要求1所述的音频输出方法,其特征在于,所述获取音频输出配置参数组之前,包括:
获取初始音频输出参数组;以及
根据所述初始音频输出参数组开启音频输出设备并确定所述音频输出配置参数组。
7.根据权利要求6所述的音频输出方法,其特征在于,每个音频源参数组和所述初始音频输出参数组分别包括:输出通道数、采样频率、采样精度、通道布局;所述获取初始音频输出参数组,包括:
比对所述多个音频源参数组中的多个输出通道数、多个采样频率、多个采样精度,分别选取所述多个输出通道数中的最大值、多个采样频率中的最大值、多个采样精度中的最大值作为所述初始音频输出参数组的输出通道数、采样频率、采样精度;以及
比对所述多个音频源参数组中的多个通道布局,选取所述多个通道布局中的布局方位最多的通道布局作为所述初始音频输出参数组的通道布局。
8.根据权利要求6所述的音频输出方法,其特征在于,所述根据所述初始音频输出参数组开启音频输出设备并确定所述音频输出配置参数组包括:
当所述音频输出设备支持所述初始音频输出参数组时,开启所述音频输出设备、并将所述初始音频输出参数组作为所述音频输出配置参数组;
当所述音频输出设备不支持所述初始音频输出参数组时,调整所述初始音频输出参数组得到调整后音频输出参数组、根据所述调整后音频输出参数组开启所述音频输出设备、并将所述调整后音频输出参数组作为所述音频输出配置参数组。
9.一种音频输出装置,其特征在于,包括:
解析模块,用于解析多路音频源得到与所述多路音频源一一对应的多组音频源参数;
获取模块,用于获取音频输出配置参数;
解码模块,用于解码所述多路音频源的音频帧得到与所述多路音频源一一对应的多帧音频数据;
处理模块,用于根据所述多组音频源参数和所述音频输出配置参数,分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据;以及
输出模块,用于输出所述多帧处理后音频数据。
10.一种多媒体服务器,其特征在于,包括:
输入接口;
处理器,连接所述输入接口;
存储器,连接所述处理器;
声卡,连接所述存储器;
其中,所述处理器用于:通过所述输入接口接收多路音频源、解析多路音频源得到与所述多路音频源一一对应的多个音频源参数组;获取音频输出配置参数组;解码所述多路音频源的音频帧得到与所述多路音频源一一对应的多帧音频数据;根据所述多个音频源参数组和所述音频输出配置参数组分别对所述多帧音频数据进行处理得到与所述多路音频源一一对应的多帧处理后音频数据;存储所述多帧处理后音频数据至所述存储器,以供所述声卡从所述存储器中获取并输出所述多帧处理后音频数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110589164.2A CN113347553B (zh) | 2021-05-28 | 2021-05-28 | 音频输出方法、音频输出装置及多媒体服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110589164.2A CN113347553B (zh) | 2021-05-28 | 2021-05-28 | 音频输出方法、音频输出装置及多媒体服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113347553A true CN113347553A (zh) | 2021-09-03 |
CN113347553B CN113347553B (zh) | 2023-02-17 |
Family
ID=77472554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110589164.2A Active CN113347553B (zh) | 2021-05-28 | 2021-05-28 | 音频输出方法、音频输出装置及多媒体服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113347553B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101053152A (zh) * | 2005-07-29 | 2007-10-10 | 哈曼国际工业有限公司 | 音频调谐*** |
CN101212830A (zh) * | 2006-12-30 | 2008-07-02 | 上海乐金广电电子有限公司 | 音频***的音相扩展装置 |
JP2017192024A (ja) * | 2016-04-13 | 2017-10-19 | 日本放送協会 | チャンネル数変換装置、放送受信機およびプログラム |
-
2021
- 2021-05-28 CN CN202110589164.2A patent/CN113347553B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101053152A (zh) * | 2005-07-29 | 2007-10-10 | 哈曼国际工业有限公司 | 音频调谐*** |
CN101212830A (zh) * | 2006-12-30 | 2008-07-02 | 上海乐金广电电子有限公司 | 音频***的音相扩展装置 |
JP2017192024A (ja) * | 2016-04-13 | 2017-10-19 | 日本放送協会 | チャンネル数変換装置、放送受信機およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN113347553B (zh) | 2023-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106486128B (zh) | 一种双音源音频数据的处理方法及装置 | |
KR101021076B1 (ko) | 신호 합성 | |
Berg et al. | Systematic evaluation of perceived spatial quality | |
CN109348274B (zh) | 一种直播互动方法、装置及存储介质 | |
CN111316353B (zh) | 确定空间音频参数编码和相关联的解码 | |
JP2010014960A (ja) | 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム | |
Engel et al. | Perceptual implications of different Ambisonics-based methods for binaural reverberation | |
CN104636111A (zh) | 信息处理方法及电子设备 | |
US20070297624A1 (en) | Digital audio encoding | |
Nowak et al. | Perception and prediction of apparent source width and listener envelopment in binaural spherical microphone array auralizations | |
US20230254655A1 (en) | Signal processing apparatus and method, and program | |
CN113347553B (zh) | 音频输出方法、音频输出装置及多媒体服务器 | |
US6839675B2 (en) | Real-time monitoring system for codec-effect sampling during digital processing of a sound source | |
US20220101821A1 (en) | Device, method and computer program for blind source separation and remixing | |
Martens et al. | Multidimensional perceptual unfolding of spatially processed speech I: Deriving stimulus space using INDSCAL | |
CN114339297B (zh) | 音频处理方法、装置、电子设备和计算机可读存储介质 | |
JP3226711B2 (ja) | 圧縮情報再生装置および圧縮情報再生方法 | |
CN112433697B (zh) | 一种资源展示方法、装置、电子设备及存储介质 | |
Farina | Auralization software for the evaluation of the results obtained by a pyramid tracing code: results of subjective listening tests | |
CN113747337A (zh) | 音频处理方法、介质、装置和计算设备 | |
CN102867514A (zh) | 一种混音方法和混音装置 | |
CN111601157B (zh) | 一种音频输出方法及显示设备 | |
CN113096674B (zh) | 一种音频处理方法、装置及电子设备 | |
Tomasetti et al. | Latency of spatial audio plugins: a comparative study | |
US20080279266A1 (en) | Determining Transmission Latency |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |