CN109120983B

CN109120983B - 一种音频处理方法和装置

Info

Publication number: CN109120983B
Application number: CN201811143071.1A
Authority: CN
Inventors: 陈一鸣; 袁浩东; 贺继
Original assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Current assignee: Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date: 2018-09-28
Filing date: 2018-09-28
Publication date: 2021-07-27
Anticipated expiration: 2038-09-28
Also published as: CN109120983A

Abstract

本发明实施例公开了一种音频数据处理方法和装置，所述方法应用于智能设备，所述智能设备包括屏幕，所述方法包括：获取音频数据，并将所述音频数据转换成频域数据集；根据所述频域数据集中的每个频域数据，生成能量数组，所述能量数组中的每个能量数据分别由对应的所述频域数据集中的每个频域数据计算得到；从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源；根据所述目标数据源生成与所述音频数据对应的频谱图像，并在所述屏幕显示所述频谱图像。采用本发明，可以提高音频数据在播放过程中显示信息的多样性，以丰富界面的展示效果。

Description

一种音频处理方法和装置

技术领域

本发明涉及多媒体信息技术，尤其涉及一种音频数据处理方法和装置。

背景技术

随着多媒体技术的不断发展，用户通过终端收听音乐、广播等多媒体信息的频率日益增加，已经成为一项基本的用户需求。

目前，在终端设备上安装客户端能够向用户提供各种与音频信息相关的功能，例如音频信息的播放功能、音频信息的检索功能等。现有技术中，客户端在播放音频信息的过程中，在客户端的播放界面上可以显示正在播放的音频数据的名称，对应的歌词，唱片的封面图片、演唱者的写真图片或者动态图像等。由此可知，客户端在播放音频数据时，播放界面上显示的信息缺乏变化，进而导致界面展示不够丰富。

发明内容

本发明实施例提供了一种音频数据处理方法和装置，可以提高音频数据在播放过程中显示信息的多样性，以丰富界面的展示效果。

本发明实施例一方面提供了一种音频数据处理方法，所述方法应用于智能设备，所述智能设备包括屏幕，包括：

获取音频数据，并将所述音频数据转换成频域数据集；

根据所述频域数据集中的每个频域数据，生成能量数组，所述能量数组中的每个能量数据分别由对应的所述频域数据集中的每个频域数据计算得到；

从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源；

根据所述目标数据源生成与所述音频数据对应的频谱图像，并在所述屏幕显示所述频谱图像。

其中，所述获取音频数据，并将所述音频数据转换成频域数据集，包括：

获取音频数据，将所述音频数据进行模数转换处理，得到数字化的音频数据；

将所述数字化的音频数据从时域转换到频域，得到频域数据集。

其中，所述根据所述频域数据集中的每个频域数据，生成能量数组，包括：

根据所述频域数据集中的每个频域数据的虚部参数和实部参数，生成所述每个频域数据分别对应的振幅；

将所述振幅转换成百分比值，将所述百分比值确定为能量数据；

将所述每个频域数据分别对应的能量数据构成能量数组。

其中，所述从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源，包括：

从所述能量数组中选取目标频率范围内的能量数据，作为目标能量数据；

若所述目标能量数据大于第一阈值，则对所述目标能量数据进行线性放大处理，将线性放大处理后的目标能量数据确定为所述目标数据源；

若所述目标能量数据小于第一阈值，则对所述目标能量数据进行线性缩小处理，将线性缩小处理后的目标能量数据确定为所述目标数据源。

其中，所述根据所述目标数据源生成与所述音频数据对应的频谱图像，并在所述屏幕显示所述频谱图像，包括：

在每相邻两个所述目标数据源之间***过渡数据源，根据所述目标数据源与所述过渡数据源确定柱状高度，并生成第一柱状图；

对所述第一柱状图进行镜像操作，得到背景柱状图；

在所述屏幕显示包含所述第一柱状图与所述背景柱状图的频谱图像。

根据所述目标数据源确定矩形柱状高度，生成矩形柱状图；

生成随机运动的背景图像；

在所述屏幕显示包含所述矩形柱状图与所述背景图形的频谱图像。

根据所述目标数据源确定柱状高度，生成第二柱状图，并根据所述第二柱状图中每根柱子的顶点，生成连接折线，获得包含所述第二柱状图与所述连接折线的目标子频谱；

对所述目标子频谱进行平移操作，得到背景子频谱；

在所述屏幕显示包含所述目标子频谱与所述背景子频谱的频谱图像。

根据所述目标数据源确定目标曲线；

对所述目标曲线进行镜像操作，得到背景曲线；

在所述屏幕显示包含所述目标曲线与所述背景曲线的频谱图像。

本发明实施例另一方面提供了一种音频数据处理装置，所述装置应用于智能设备，所述智能设备包括屏幕，包括：

数据转换模块，用于获取音频数据，并将所述音频数据转换成频域数据集；

数据处理模块，用于根据所述频域数据集中的每个频域数据，生成能量数组，所述能量数组中的每个能量数据分别由对应的所述频域数据集中的每个频域数据计算得到；

数据选取模块，用于从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源；

数据显示模块，用于根据所述目标数据源生成与所述音频数据对应的频谱图像，并在所述屏幕显示所述频谱图像。

本发明实施例另一方面提供了一种音频数据处理装置，包括：处理器和存储器；

所述处理器和存储器相连，其中，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行如本发明实施例中一方面中的方法。

本发明实施例另一方面提供了一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时，执行如本发明实施例中一方面中的方法。

本发明实施例获取音频数据，并将所述音频数据转换成频域数据集；根据所述频域数据集中的每个频域数据，生成能量数组，所述能量数组中的每个能量数据分别由对应的所述频域数据集中的每个频域数据计算得到；从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源；根据所述目标数据源生成与所述音频数据对应的频谱图像，并在屏幕显示所述频谱图像。由此可见，通过对音频数据的处理，使得在客户端音频数据播放界面上的显示信息更加丰富，从而提高显示信息的多样性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种音频数据处理方法的场景示意图；

图2是本发明实施例提供的一种音频数据处理方法的流程示意图；

图2a-图2d是本发明实施例提供的一种频谱图像显示界面示意图；

图3是本发明实施例提供的另一种音频数据处理方法的流程示意图；

图4是本发明实施例提供的一种音频数据处理装置的结构示意图；

图5是本发明实施例提供的另一种音频数据处理装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参见图1，图1是本发明实施例提供的一种音频数据处理方法的场景示意图。如图1所示，用户可以从终端设备100a中打开播放音频数据的客户端200a(例如，音乐播放客户端，广播收听客户端等)，从客户端200a中选择一首音乐300a作为需要进行处理的音频数据，当然用户也可以打开广播收听客户端200a，调到自身感兴趣的音乐频道，将实时收听到的音乐300a作为需要进行处理的音频数据。可以利用快速傅里叶变换将音频数据从时域转换到频域，得到一个频域数据集，该频域数据集中包括多个频域数据，且每一个频域数据均对应着一个频率点，频率范围均处于0-22kHz内，可以通过选取低频率范围内的部分频域数据，得到32个数据源，也就是得到32个数据值，随后将上述32个数据源传递到客户端200a的音频数据播放界面上，绘制成频谱，并在播放界面上以频谱图像的形式显示出来。频谱图像会跟着音乐的节奏不断变化。在客户端的播放界面上，可以显示背景图(包括播放音乐的演唱者图片、播放音乐所属的唱片图片或与播放音乐相关的其余图片等)、歌词、音乐名称以及演唱者姓名等信息，还可以显示随着音乐运动的频谱图像。以使用户在听音乐的同时，可以融入音乐的节奏感。上述终端设备100a可以包括手机、平板电脑、笔记本电脑、掌上电脑、移动互联网设备(mobile internet device,MID)、可穿戴设备(例如智能手表、智能手环等)等智能设备，每个终端设备都可以安装播放音乐或收听音乐的客户端。

其中，对音频数据进行处理的具体流程可以参见图2与图3所对应的实施例。

进一步地，请参见图2，图2是本发明实施例提供的一种音频数据处理方法的流程示意图。如图2所示，该方法可以包括：

步骤S101，获取音频数据，并将所述音频数据转换成频域数据集；

具体的，客户端可以将该客户端上待播放的音频信号或正在播放的音频信号作为需要进行处理的音频数据，随后，可以利用快速傅里叶变换将需要进行处理的音频数据从时域转换到频域，得到一个频域数据集，该频域数据集包括多个频域数据。假设对音频数据的采样频率为1024Hz，采样点数为1024，则该频域数据经过快速傅里叶变换后可以得到1024个频域数据，上述1024个频域数据均为复数，包括实部和虚部，此时上述频域数据集包括1024个频域数据。其中，客户端可以包括各种音频数据播放器或音频数据播放网页，上述音频数据既可以是一首完整的音乐也可以是任意一个音乐片段。

步骤S102，根据所述频域数据集中的每个频域数据，生成能量数组，所述能量数组中的每个能量数据分别由对应的所述频域数据集中的每个频域数据计算得到；

具体的，将音频数据转换成频域数据集后，上述频域数据集中的每个频域数据均处于0-22kHz的频率范围内，且均以复数的形式表示。在频域中，频域数据集中的每个频域数据均对应着一个频率点，且每个频域数据在频率上是均匀分布的。可以通过计算上述每个频域数据的模值，也就是每个频域数据在其对应的频率值下的振幅特性，并将计算得到的每个频域数据对应的振幅转化成百分比能量值，也可以将该百分比能量值确定为能量数据，上述百分比能量值的取值范围为0-1，随后将得到的每一个能量数据添加至能量数组，直至频域数据集中的全部频域数据均通过计算获得对应的能量数据，且全部添加至能量数组为止。假设频域数据集包括1024个频域数据，则能量数组也包括1024个能量数据。

步骤S103，从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源；

具体的，得到能量数组后，因频域数据集中的每个频域数据均对应一个频率点，因此由上述每个频域数据分别计算得到的对应的能量数据也均对应一个频率点，通过确定一个频率范围，将该频率范围内的每一个能量数据，确定为目标数据源。其中，能量数组中的每个能量数据均处于0-20kHz频率范围内，在高频范围内，上述能量数组中的能量数据变化较小，且在现实生活中，音频数据中的人声或者非人声(乐器的声音)频段主要位于20Hz-700Hz范围，因此可以选择20Hz-700Hz频率范围内的能量数据，并将该范围内的每一个能量数据确定为目标数据源。假设能量数组中包括1024个能量数据，则20Hz-700Hz频率范围内包括32个能量数据，则上述32个能量数据均可以作为目标数据源。

步骤S104，根据所述目标数据源生成与所述音频数据对应的频谱图像，并在屏幕显示所述频谱图像。

具体的，可以将上述得到的目标数据源传递至客户端的界面层，根据上述目标数据源绘制与上述音频数据对应的频谱图像，并在客户端播放音频数据的界面上显示上述频谱图像，也就是在终端设备的屏幕上显示上述频谱图像。其中，客户端可以根据播放的音频数据的风格或流派绘制四款不同的频谱图像，可以包括默认频谱图像、电子频谱图像、HipHop(嘻哈)频谱图像以及R&B(Rhythm and Blues)频谱图像。

其中，若上述频谱图像为默认频谱图像，则根据上述目标数据源生成与上述音频数据对应的频谱图像的实现过程为：在每相邻两个所述目标数据源之间***过渡数据源，根据所述目标数据源与所述过渡数据源确定柱状高度，并生成第一柱状图；对所述第一柱状图进行镜像操作，得到背景柱状图；显示包含所述第一柱状图与所述背景柱状图的频谱图像。在不同的终端设备上，生成默认频谱图像的方式也有所不同，下面主要针对IOS端和Android端两种情况进行说明。对于IOS端而言，可以采用sin三角函数在每相邻两个目标数据源之间***中间值，也就是过渡数据源，根据上述目标数据源与***的过渡数据源确定柱状高度，并生成第一柱状图，对上述第一柱状图进行镜像操作，得到背景柱状图，在IOS端的客户端播放界面上显示包含上述第一柱状图与上述背景柱状图的默认频谱图像。例如，假设有相邻两个目标数据源0.5，0.866，采用sin三角函数可以计算得到两个目标数据源之间的中间值为0.707，这里的0.707即为***的过渡数据源。对于Android端而言，可以对每相邻两个目标数据源进行线性差值处理，也就是在每相邻两个目标数据源之间***中间值(等同于上述过渡数据源)，根据上述目标数据源与***的中间值确定柱状高度，并生成第一柱状图，对上述第一柱状图进行镜像操作，得到背景柱状图，在Android端的客户端播放界面上显示包含上述第一柱状图与上述背景柱状图的默认频谱图像。例如，假设有相邻两个目标数据源0.5，0.866，进行线性差值处理可以求得中间值为0.683，这里得到的0.683即为***的过度数据源。基于上述方式生成音频数据的默认频谱图像，该默认频谱图像由许多根柱子构成，柱子的高度就是上述目标数据源与过渡数据源的值，在客户端播放音频数据的界面上显示上述默认频谱图像。请参见图2a，是本发明实施例提供的一种频谱图像显示界面示意图。如图2a所示，终端设备100a的客户端200a播放界面上显示正在播放的音频数据的相关信息，若音频数据是一首正在播放的歌曲，则播放界面的显示信息包括：正在播放音乐的歌词显示400a、歌曲信息500a(如包括歌曲名称和歌曲演唱者的名字)及歌曲的默认频谱图像等信息。其中，默认频谱图像中，包括目标数据源600a、目标数据源600b，这2个目标数据源分别表示频谱图像中柱状图的其中一根柱子，均可以由一个数据源来确定，目标数据源600a与目标数据源600b可以分别由两个相邻的目标数据源来确定，根据上述两个相邻的目标数据源可以计算得到一个过渡数据源600c，进而可以将过渡数据源600c所表示的柱子设置在目标数据源600a、目标数据源600b分别表示的柱子之间。

其中，若上述频谱图像为电子频谱图像，则根据上述目标数据源生成与上述音频数据对应的频谱图像的实现过程为：根据所述目标数据源确定矩形柱状高度，生成矩形柱状图；生成随机运动的背景图像；显示包含所述矩形柱状图与所述背景图形的频谱图像。例如，有32个目标数据源，将这32个目标数据源的值作为矩形柱状的高度，其中，每两个矩形柱状作为一个整体，由一个目标数据源来确定高度，也就是说32个目标数据源会生成包含64个矩形柱状的矩形柱状图，同时，为了视觉效果，会在随机位置生成向上运动的背景图形(例如方块图形等)，为了避免生成太多的背景图形，可以控制同一时刻最多出现的背景图形个数，或控制每个背景图形出现的速度与时间，其中，上述背景图形的运动与音频节奏无关，在客户端播放音频数据的界面上显示包含上述矩形柱状图与上述背景图形的电子频谱图像。请参见图2b，是本发明实施例提供的一种频谱图像显示界面示意图。如图2b所示，终端设备100a的客户端200a播放界面上显示正在播放的音频数据的相关信息，若音频数据是一首正在播放的歌曲，则播放界面的显示信息包括：正在播放音乐的歌词显示400b、歌曲信息500b(如包括歌曲名称和歌曲演唱者的名字)以及歌曲的电子频谱图像等信息。其中，在电子频谱图像中，每两个矩形柱状作为一个整体，由一个目标数据源确定，同时，在矩形柱状的上方，会产生随机运动的背景图像，例如具有数量上限(如整个播放界面不超过10个)的方块图形，方块图形可以在不同时刻生成，且可以在播放界面上随机运动。

其中，若上述频谱图像为HipHop频谱图像，则根据上述目标数据源生成与上述音频数据对应的频谱图像的实现过程为：根据所述目标数据源确定柱状高度，生成第二柱状图，并根据所述第二柱状图中每根柱子的顶点，生成连接折线，获得包含所述第二柱状图与所述连接折线的目标子频谱；对所述目标子频谱进行平移操作，得到背景子频谱；显示包含所述目标子频谱与所述背景子频谱的频谱图像。例如，有32个目标数据源，将这32个目标数据源的值作为柱状高度，也就是说32个目标数据源可以生成包含32根柱子的第二柱状图，连接这32根柱子的顶点，得到连接折线，可以形成至少一个尖峰形状，将上述第二柱状图与上述连接折线构成目标子频谱，对上述目标子频谱进行稍微的水平位置的偏移，得到两个背景子频谱，其中，上述目标子频谱可以用白色表示，两个背景子频谱一个用蓝色表示，一个用红色表示，在客户端播放音频数据的界面上显示包含上述目标子频谱与上述两个背景子频谱的HipHop频谱图像。请参见图2c，是本发明实施例提供的一种频谱图像显示界面示意图。如图2c所示，终端设备100a的客户端200a播放界面上显示正在播放的音频数据的相关信息，若音频数据为正在播放的歌曲，则播放界面的显示信息包括：正在播放音乐的歌词显示400c、歌曲信息500c(如包括歌曲名称和歌曲演唱者的名字)以及歌曲的HipHop频谱图像等信息。其中，HipHop频谱图像中，可以通过得到的32个目标数据源确定32根柱子，生成第二柱状图，连接每根柱子的顶点，得到连接折线，因而HipHop频谱图像可以由上述第二柱状图与连接折线构成(假设得到的目标数据源为32个)。

其中，若上述频谱图像为R&B频谱图像，则根据上述目标数据源生成与上述音频数据对应的频谱图像的实现过程为：根据所述目标数据源确定目标曲线；对所述目标曲线进行镜像操作，得到背景曲线；显示包含所述目标曲线与所述背景曲线的频谱图像。例如，有32个目标数据源，将这32个目标数据源作为关键点进行曲线绘制，使用贝塞尔曲线对32个关键点进行连线，每两个关键点之间使用贝塞尔曲线进行弯曲，可以使连线更加光滑，得到目标曲线，其中贝塞尔曲线是一种矢量绘图工具，可以根据很少的点就可以生成复杂平滑的曲线，对上述目标曲线进行镜像操作，也就是左右颠倒得到背景曲线，其中，上述目标曲线的颜色可以比上述背景曲线的颜色深一些，例如目标曲线用黑色表示，背景曲线用浅灰色表示，在客户端播放音频数据的界面上显示包含上述目标曲线与上述背景曲线的R&B频谱图像。请参见图2d，是本发明实施例提供的一种频谱图像显示界面示意图。如图2d所示，终端设备100a的客户端200a播放界面上显示正在播放的音频数据的相关信息，若音频数据为正在播放的歌曲，则播放界面的显示信息包括：正在播放音乐的歌词显示400d、歌曲信息500d(如包括歌曲名称和歌曲演唱者的名字)以及歌曲的R&B频谱图像等信息。其中，R&B频谱图像可以包括目标曲线和背景曲线，上述目标曲线可以通过将得到的目标数据源作为关键点进行绘制，背景曲线由上述目标曲线进行镜像得到，也就是每一个目标数据源可以确定一个关键点，然后使用贝塞尔曲线对确定的关键点进行平滑绘制，得到目标曲线。

可选的，若客户端播放的音频数据(例如歌曲)属于电子乐，则在客户端的播放界面上显示电子频谱图像；若客户端播放的歌曲属于HipHop，则在客户端的播放界面上显示HipHop频谱图像；若客户端播放的歌曲属于R&B，则在客户端的播放界面上显示R&B频谱图像；若客户端播放的歌曲属于除电子乐、HipHop及R&B之外的音乐流派，则在客户端的播放界面上显示默认频谱图像。

举例来说，在客户端播放的音频数据为歌曲“贝加尔湖畔”，则在客户端的播放界面的中间位置可以实时显示歌曲“贝加尔湖畔”的歌词，在界面的偏左下角显示歌曲名字“贝加尔湖畔”，在歌曲名字的下面位置显示歌曲演唱者的名字“李健”，在界面的最下端实时显示该歌曲的频谱图像，通过判断该歌曲的风格及流派，该歌曲显示的频谱图像类型为默认频谱图像，上述默认频谱图像可以跟着音乐的节奏抖动，整个播放界面的背景可以是该歌曲的MV，或者该歌曲演唱者的动态图形，或者其他与该歌曲相关的图像等。

本发明实施例获取音频数据，并将所述音频数据转换成频域数据集；根据所述频域数据集中的每个频域数据，生成能量数组，所述能量数组中的每个能量数据分别由对应的所述频域数据集中的每个频域数据计算得到；从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源；根据所述目标数据源生成与所述音频数据对应的频谱图像，并在屏幕显示所述频谱图像。由此可见，在对音频数据的处理过程中，只需选取目标频率范围内的能量数据作为目标数据源，并对目标数据源进行数据放大处理，即低能量数据更低，高能量数据更高，就能生成与音频数据对应的频谱图像，并在终端设备的客户端显示生成的频谱图像，不仅可以使客户端播放界面上的显示信息更加丰富，还可以保证频谱图像中的变化更贴合音频数据的特性，而且仅仅获取目标数据源，减少了数据传输时间，从而提高了音频数据的处理效率。客户端还可以根据音频数据的不同流派与风格，显示不同类型的频谱图像，提高了界面显示信息的多样性。

进一步的，请参见图3，图3是本发明实施例提供的另一种音频数据处理方法的流程示意图。如图所示，该方法可以包括如下步骤：

步骤S201，获取音频数据，将所述音频数据进行模数转换处理，得到数字化的音频数据；

具体的，客户端可以将该客户端上待播放的音频信号或正在播放的音频信号作为需要进行处理的音频数据，上述音频数据可以是连续变化的模拟化音频数据，客户端可以但不限于利用脉冲编码调制(PulseCode Modulation,PCM)技术，对上述模拟化的音频数据进行模数转换处理，得到数字化的音频数据。其中，PCM技术可以用一个固定的频率对模拟化音频数据进行采样，采样后的音频数据在波形上看就像是一串连续的幅值不同的脉冲，把这些脉冲的幅值按一定精度进行量化，将量化后的数值连续输出，可产生数字化的音频数据。为方便描述，将利用PCM技术得到的数字化的音频数据称之为PCM音频数据。

步骤S202，将所述数字化的音频数据从时域转换到频域，得到频域数据集；

具体的，对上述PCM音频数据进行采样，确定采样频率Fs，采样点数N，利用快速傅里叶变换得到N个频域数据，也就是频域数据集，其中N通常取2的整数次方。例如，对PCM音频数据进行快速傅里叶变换时，假设采样频率Fs为1024Hz，采样点数N为1024，那么进行快速傅里叶变换后可以得到1024个频域数据，上述1024个频域数据均为复数，每一个频域数据对应一个频率点，此时的1024个频域数据构成一个频域数据集。

步骤S203，根据所述频域数据集中的每个频域数据的虚部参数和实部参数，生成所述每个频域数据分别对应的振幅；

具体的，所述频域数据集中的每个频域数据均为复数，复数包括实部参数和虚部参数，根据实部参数和虚部参数可以计算每个频域数据对应的振幅。假设某一个频域数据用复数a+bi表示，则该频域数据的振幅可以通过数学表达式

计算得到。

步骤S204，将所述振幅转换成百分比值，将所述百分比值确定为能量数据；

具体的，将上述计算得到的每个频域数据对应的振幅转换成取值范围为0-1的百分比能量值，并将该百分比能量值确定为能量数据。每计算出一个音频数据对应的振幅，就将其确认为能量数据。

步骤S205，将所述每个频域数据分别对应的能量数据构成能量数组；

具体的，将上述已经确认为能量数据的百分比能量值添加至能量数组，直至频域数据集中的所有频域数据分别对应的能量数据均添加至能量数组。因此，能量数组中能量数据的数目与上述频域数据集中频域数据的个数是相同的，且上述能量数据与上述频域数据是一一对应的关系。

步骤S206，从所述能量数组中选取目标频率范围内的能量数据，作为目标能量数据；

具体的，确定一个目标频率范围，从上述得到的能量数组中选择该目标频率范围内的能量数据，作为目标能量数据，在该目标频率范围内，按频率从小到大的顺序，每选择出一个能量数据，就将其作为目标能量数据。其中，目标频率范围是根据现实生活中的实际情况来确定的，人的耳朵可以感觉到的最高频率为20kHz，因此频域数据集中的全部频域数据的频率取值范围为0-20kHz，但实际上，在高频范围内，数据的变化是很小的，且人的声音与乐器的声音基本上位于20Hz-700Hz频率范围内，因此可以确定20Hz-700Hz为目标频率范围，在该频率范围内的每一个能量数据，均可作为一个目标能量数据。

步骤S207，若所述目标能量数据大于第一阈值，则对所述目标能量数据进行线性放大处理，将线性放大处理后的目标能量数据确定为所述目标数据源；

具体的，对上述选取出来的每一个目标能量数据进行特殊处理，先确定一个阈值，比较每一个目标能量数据与阈值的大小，来确定对该目标能量数据的处理方式，若该目标能量数据大于确定的阈值，则对该目标能量数据进行线性放大处理，并将放大后的目标能量数据确定为目标数据源。同时，为了避免能量数据过渡放大，加上了峰值限制处理，即规定了进行线性放大的目标能量数据的最大值。其中，阈值可以根据人声与非人声百分比能量值之间的差异来确定。例如上述音频数据中的主体声音(例如人声)得到的能量数据较大，其余的声音(例如乐器的和声)得到的能量数据较小，则可以根据上述音频数据中主体声音与其余声音的大致大小分布确定一个中间值，将该中间值作为阈值。这样就意味着将主体声音进行了线性放大处理，突出了上述音频数据中主体声音的特点。

可选的，阈值也可以根据人声与非人声所处频率范围的差异来确定。举例来说，假设在一音频数据中，人声所处的频率范围为200Hz-700Hz，非人声所处的频率范围为20Hz-200Hz，则可以将200Hz作为阈值，当目标能量数据对应的频率点大于200Hz，则对该目标能量数据进行线性放大处理，并将放大后的目标能量数据确定为目标数据源。

步骤S208，若所述目标能量数据小于第一阈值，则对所述目标能量数据进行线性缩小处理，将线性缩小处理后的目标能量数据确定为所述目标数据源。

具体的，通过比较目标能量数据与阈值的大小，若目标能量数据小于确定的阈值，则对该目标能量数据进行线性缩小处理，并将缩小后的目标能量数据确定为目标数据源，同时，为了避免目标能量数据被过渡缩小导致该目标能量数据接近于0，可以对线性缩小处理的缩小系数做限制。

可选的，若阈值是根据上述音频数据中人声与非人声所处频率范围的差异来确定的，那么当目标能量数据所对应的频率点小于阈值时，对该目标能量数据进行线性缩小处理，将缩小后的目标能量数据确定为目标数据源，同样地，可以对线性缩小的缩小系数进行限制。

步骤209，根据所述目标数据源生成与所述音频数据对应的频谱图像，并在屏幕显示所述频谱图像。

其中，步骤209的具体实现过程可以参见上述图2所对应实施例中对步骤S104的描述，这里将不再继续进行赘述。

本发明实施例通过获取音频数据，将所述音频数据进行模数转换，得到数字化的音频数据，并将数字化的音频数据转换成频域数据集；根据所述频域数据集中的每个频域数据，生成能量数组，所述能量数组中的每个能量数据分别由对应的所述频域数据集中的每个频域数据计算得到；从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源；根据所述目标数据源生成与所述音频数据对应的频谱图像，并在屏幕显示所述频谱图像。由此可见，在对音频数据的处理过程中，只需选取目标频率范围内的能量数据作为目标数据源，并对目标数据源进行数据放大处理，即低能量数据更低，高能量数据更高，就能生成与音频数据对应的频谱图像，并在客户端显示生成的频谱图像，不仅可以使客户端播放界面上的显示信息更加丰富，还可以保证频谱图像中的变化更贴合音频数据的特性，而且仅仅获取目标数据源，减少了数据传输时间，从而提高了音频数据的处理效率。客户端还可以根据音频数据的不同流派与风格，显示不同类型的频谱图像，提高了界面显示信息的多样性。

进一步地，请参见图4，图4是本发明实施例提供的一种音频数据处理装置的结构示意图，如图4所示，上述音频数据处理装置1可以应用于智能设备，所述智能设备可包括屏幕，上述音频数据处理装置1可以包括：数据转换模块10，数据处理模块20，数据选取模块30和数据显示模块40；

数据转换模块10，用于获取音频数据，并将所述音频数据转换成频域数据集；

数据处理模块20，用于根据所述频域数据集中的每个频域数据，生成能量数组，所述能量数组中的每个能量数据分别由对应的所述频域数据集中的每个频域数据计算得到；

数据选取模块30，用于从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源；

数据显示模块40，用于根据所述目标数据源生成与所述音频数据对应的频谱图像，并在所述屏幕显示所述频谱图像。

其中，数据转换模块10，数据处理模块20，数据选取模块30和数据显示模块40的具体功能实现方式可以参见上述图2对应实施例中的步骤S101-步骤S104，这里不再进行赘述。

进一步地，如图4所示，上述数据转换模块10包括：模数转换单元101、时域频域转换单元102；

模数转换单元101，用于获取音频数据，将所述音频数据进行模数转换处理，得到数字化的音频数据；

时域频域转换单元102，用于将所述数字化的音频数据从时域转换到频域，得到频域数据集。

其中，上述模数转换单元101、时域频域转换单元102的具体功能实现方式可以参见上述图3对应实施例中的步骤S201和步骤S102，这里不再进行赘述。

进一步地，如图4所示，上述数据处理模块20包括：计算单元201、确定单元202、集合单元203；

计算单元201，用于根据所述频域数据集中的每个频域数据的虚部参数和实部参数，生成所述每个频域数据分别对应的振幅；

确定单元202，用于将所述振幅转换成百分比值，将所述百分比值确定为能量数据；

集合单元203，用于将所述每个频域数据分别对应的能量数据构成能量数组。

其中，上述计算单元201、确定单元202、集合单元203的具体功能实现方式可以参见上述图3对应实施例中的步骤S203-步骤S205，这里不再进行赘述。

进一步地，如图4所示，上述数据选取模块30包括：选择单元301、线性放大处理单元302、线性缩小处理单元303；

选择单元301，用于从所述能量数组中选取目标频率范围内的能量数据，作为目标能量数据；

线性放大处理单元302，用于若所述目标能量数据大于第一阈值，则对所述目标能量数据进行线性放大处理，将线性放大处理后的目标能量数据确定为所述目标数据源；

线性缩小处理单元303，用于若所述目标能量数据小于第一阈值，则对所述目标能量数据进行线性缩小处理，将线性缩小处理后的目标能量数据确定为所述目标数据源。

其中，上述选择单元301、线性放大处理单元302、线性缩小处理单元303的具体功能实现方式可以参见上述图3所对应实施例中的步骤S206-步骤S208，这里不在进行赘述。

进一步地，如图4所示，上述数据显示模块40包括：第一生成单元401、第一镜像操作单元402、第一显示单元403、第二生成单元404、背景图像生成单元405、第二显示单元406、第三生成单元407、平移操作单元408、第三显示单元409、第四生成单元410、第二镜像操作单元411、第四显示单元412；

第一生成单元401，用于在每相邻两个所述目标数据源之间***过渡数据源，根据所述目标数据源与所述过渡数据源确定柱状高度，并生成第一柱状图；

第一镜像操作单元402，用于对所述第一柱状图进行镜像操作，得到背景柱状图；

第一显示单元403，用于在所述屏幕显示包含所述第一柱状图与所述背景柱状图的频谱图像。

第二生成单元404，用于根据所述目标数据源确定矩形柱状高度，生成矩形柱状图；

背景图像生成单元405，用于生成随机运动的背景图像；

第二显示单元406，用于在所述屏幕显示包含所述矩形柱状图与所述背景图形的频谱图像。

第三生成单元407，用于根据所述目标数据源确定柱状高度，生成第二柱状图，并根据所述第二柱状图中每根柱子的顶点，生成连接折线，获得包含所述第二柱状图与所述连接折线的目标子频谱；

平移操作单元408，用于对所述目标子频谱进行平移操作，得到背景子频谱；

第三显示单元409，用于在所述屏幕显示包含所述目标子频谱与所述背景子频谱的频谱图像。

第四生成单元410，用于根据所述目标数据源确定目标曲线；

第二镜像操作单元411，用于对所述目标曲线进行镜像操作，得到背景曲线；

第四显示单元412，用于在所述屏幕显示包含所述目标曲线与所述背景曲线的频谱图像。

其中，上述第一生成单元401、第一镜像操作单元402、第一显示单元403、第二生成单元404、背景图像生成单元405、第二显示单元406、第三生成单元407、平移操作单元408、第三显示单元409、第四生成单元410、第二镜像操作单元411、第四显示单元412的具体功能实现方式可以参见上述图2对应实施例中的步骤S104，这里不再进行赘述。其中，当第一生成单元401、第一镜像操作单元402、第一显示单元403在执行相应操作时，第二生成单元404、背景图像生成单元405、第二显示单元406、第三生成单元407、平移操作单元408、第三显示单元409、第四生成单元410、第二镜像操作单元411、第四显示单元412均暂停执行操作。当第二生成单元404、背景图像生成单元405、第二显示单元406在执行相应操作时，第一生成单元401、第一镜像操作单元402、第一显示单元403、第三生成单元407、平移操作单元408、第三显示单元409、第四生成单元410、第二镜像操作单元411、第四显示单元412均暂停执行操作。当第三生成单元407、平移操作单元408、第三显示单元409在执行相应操作时，第一生成单元401、第一镜像操作单元402、第一显示单元403、第二生成单元404、背景图像生成单元405、第二显示单元406、第四生成单元410、第二镜像操作单元411、第四显示单元412均暂停执行操作。当第四生成单元410、第二镜像操作单元411、第四显示单元412在执行相应操作时，第一生成单元401、第一镜像操作单元402、第一显示单元403、第二生成单元404、背景图像生成单元405、第二显示单元406、第三生成单元407、平移操作单元408、第三显示单元409均暂停执行操作。其中，第一显示单元403、第二显示单元406、第三显示单元409、第四显示单元412可以合并成同一个显示单元。

本发明实施例通过获取音频数据，将所述音频数据进行模数转换，得到数字化的音频数据，并将数字化的音频数据转换成频域数据集；根据所述频域数据集中的每个频域数据，生成能量数组，所述能量数组中的每个能量数据分别由对应的所述频域数据集中的每个频域数据计算得到；从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源；根据所述目标数据源生成与所述音频数据对应的频谱图像，并在屏幕显示所述频谱图像。由此可见，在对音频数据的处理过程中，只需选取目标频率范围内的能量数据作为目标数据源，并对目标数据源进行数据放大处理，即低能量数据更低，高能量数据更高，就能生成与音频数据对应的频谱图像，并在客户端显示生成的频谱图像，不仅可以使客户端播放界面上的显示信息更加丰富，还可以保证频谱图像中的变化更贴合音频数据的特性，而且仅仅获取目标数据源，减少了数据传输时间，从而提高了音频数据的处理效率。客户端还可以根据音频数据的不同流派与风格，显示不同类型的频谱图像，提高了显示信息的多样性。

请参见图5，图5是本发明实施例提供的另一种音频数据处理装置的结构示意图。如图5所示，上述音频数据处理装置1000可以应用于上述图2对应实施例中的终端设备，上述音频数据处理装置1000可以包括：处理器1001，网络接口1004和存储器1005，此外，上述音频数据处理装置1000还可以包括：用户接口1003，和至少一个通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。其中，用户接口1003可以包括显示屏(Display)、键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个位于远离前述处理器1001的存储装置。如图5所示，作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及设备控制应用程序。

在图5所示的音频数据处理装置1000中，网络接口1004可提供网络通讯功能；而用户接口1003主要用于为用户提供输入的接口；而处理器1001可以用于调用存储器1005中存储的设备控制应用程序，以实现：

获取音频数据，并将所述音频数据转换成频域数据集；

在一个实施例中，上述处理器1001在执行上述获取音频数据，并将所述音频数据转换成频域数据集时，具体执行一下步骤：

在一个实施例中，上述处理器1001在执行上述根据所述频域数据集中的每个频域数据，生成能量数组时，具体执行一下步骤：

将所述每个频域数据分别对应的能量数据构成能量数组。

在一个实施例中，上述处理器1001在执行上述从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源时，具体执行一下步骤：

在一个实施例中，上述处理器1001在执行上述根据所述目标数据源生成与所述音频数据对应的频谱图像，并在所述屏幕显示所述频谱图像时，具体执行一下步骤：

对所述第一柱状图进行镜像操作，得到背景柱状图；

根据所述目标数据源确定矩形柱状高度，生成矩形柱状图；

生成随机运动的背景图像；

对所述目标子频谱进行平移操作，得到背景子频谱；

根据所述目标数据源确定目标曲线；

对所述目标曲线进行镜像操作，得到背景曲线；

本发明实施例通过获取音频数据，将所述音频数据进行模数转换，得到数字化的音频数据，并将数字化的音频数据转换成频域数据集；根据所述频域数据集中的每个频域数据，生成能量数组，所述能量数组中的每个能量数据分别由对应的所述频域数据集中的每个频域数据计算得到；从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源；根据所述目标数据源生成与所述音频数据对应的频谱图像，并在屏幕显示所述频谱图像。由此可见，在对音频数据的处理过程中，只需选取目标频率范围内的能量数据作为目标数据源，并对目标数据源进行数据放大处理，即低能量数据更低，高能量数据更高，就能生成与音频数据对应的频谱图像，并在客户端显示生成的频谱图像，不仅可以使客户端播放界面上的显示信息更加丰富，还可以保证频谱图像中的变化更贴合音频数据的特性，而且仅仅获取目标数据源，减少了数据传输时间，从而提高了音频数据的数据源。客户端还可以根据音频数据的不同流派与风格，显示不同类型的频谱图像，提高了显示信息的多样性。

应当理解，本发明实施例中所描述的音频数据处理装置1000可执行前文图2或图3任一个所对应实施例中对上述音频数据处理方法的描述，也可执行前文图4所对应实施例中对上述音频数据处理装置1的描述，在此不再赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。

此外，这里需要指出的是：本发明实施例还提供了一种计算机存储介质，且所述计算机存储介质中存储有前文提及的音频数据处理装置1所执行的计算机程序，且所述计算机程序包括程序指令，当所述处理器执行所述程序指令时，能够执行前文图2或图3任一个所对应实施例中对所述音频数据处理方法的描述，因此，这里将不再进行赘述。另外，对采用相同方法的有益效果描述，也不再进行赘述。对于本发明所涉及的计算机存储介质实施例中未披露的技术细节，请参照本发明方法实施例的描述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种音频数据处理方法，所述方法应用于智能设备，所述智能设备包括屏幕，其特征在于，包括：

获取音频数据，并将所述音频数据转换成频域数据集；

从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源，包括：从所述能量数组中选取目标频率范围内的能量数据，作为目标能量数据，若所述目标能量数据大于第一阈值，则对所述目标能量数据进行线性放大处理，将线性放大处理后的目标能量数据确定为所述目标数据源，若所述目标能量数据小于第一阈值，则对所述目标能量数据进行线性缩小处理，将线性缩小处理后的目标能量数据确定为所述目标数据源；

2.根据权利要求1所述的方法，其特征在于，所述获取音频数据，并将所述音频数据转换成频域数据集，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述频域数据集中的每个频域数据，生成能量数组，包括：

将所述每个频域数据分别对应的能量数据构成能量数组。

4.根据权利要求1所述的方法，其特征在于，所述根据所述目标数据源生成与所述音频数据对应的频谱图像，并在所述屏幕显示所述频谱图像，包括：

对所述第一柱状图进行镜像操作，得到背景柱状图；

5.根据权利要求1所述的方法，其特征在于，所述根据所述目标数据源生成与所述音频数据对应的频谱图像，并在所述屏幕显示所述频谱图像，包括：

根据所述目标数据源确定矩形柱状高度，生成矩形柱状图；

生成随机运动的背景图像；

在所述屏幕显示包含所述矩形柱状图与所述背景图像的频谱图像。

6.根据权利要求1所述的方法，其特征在于，所述根据所述目标数据源生成与所述音频数据对应的频谱图像，并在所述屏幕显示所述频谱图像，包括：

对所述目标子频谱进行平移操作，得到背景子频谱；

7.根据权利要求1所述的方法，其特征在于，所述根据所述目标数据源生成与所述音频数据对应的频谱图像，并在所述屏幕显示所述频谱图像，包括：

根据所述目标数据源确定目标曲线；

对所述目标曲线进行镜像操作，得到背景曲线；

8.一种音频数据处理装置，所述装置应用于智能设备，所述智能设备包括屏幕，其特征在于，包括：

数据选取模块，用于从所述能量数组中选取目标频率范围内的能量数据，作为目标数据源，所述数据选取模块还用于，从所述能量数组中选取目标频率范围内的能量数据，作为目标能量数据，若所述目标能量数据大于第一阈值，则对所述目标能量数据进行线性放大处理，将线性放大处理后的目标能量数据确定为所述目标数据源，若所述目标能量数据小于第一阈值，则对所述目标能量数据进行线性缩小处理，将线性缩小处理后的目标能量数据确定为所述目标数据源；

9.一种音频数据处理装置，其特征在于，包括：处理器和存储器；

所述处理器和存储器相连，其中，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，以执行如权利要求1-7任一项所述的方法。

10.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时，执行如权利要求1-7任一项所述的方法。