CN105632523A - 调节音频数据的音量输出值的方法和装置及终端 - Google Patents

调节音频数据的音量输出值的方法和装置及终端 Download PDF

Info

Publication number
CN105632523A
CN105632523A CN201511000762.2A CN201511000762A CN105632523A CN 105632523 A CN105632523 A CN 105632523A CN 201511000762 A CN201511000762 A CN 201511000762A CN 105632523 A CN105632523 A CN 105632523A
Authority
CN
China
Prior art keywords
audio frequency
data
audio
played
frequency data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201511000762.2A
Other languages
English (en)
Other versions
CN105632523B (zh
Inventor
王文熹
郑美玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meizu Technology Co Ltd
Original Assignee
Meizu Technology China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meizu Technology China Co Ltd filed Critical Meizu Technology China Co Ltd
Priority to CN201511000762.2A priority Critical patent/CN105632523B/zh
Publication of CN105632523A publication Critical patent/CN105632523A/zh
Application granted granted Critical
Publication of CN105632523B publication Critical patent/CN105632523B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B19/00Driving, starting, stopping record carriers not specifically of filamentary or web form, or of supports therefor; Control thereof; Control of operating function ; Driving both disc and head
    • G11B19/02Control of operating function, e.g. switching from recording to reproducing

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供了一种调节音频数据的音量输出值的方法和装置,其方法包括:读取待播放音频数据和当前播放音频数据;提取所述待播放音频数据和当前播放音频数据的曲风特征信息;比对所述待播放音频数据与当前播放音频数据的曲风特征信息;根据所述比对的结果,确定所述待播放音频数据相对于所述当前播放音频数据的曲风类型;根据确定的所述曲风类型,计算相对于所述当前播放音频数据的音量输出值的音量增益值,在结束播放当前播放音频数据后根据所述音量增益值调节所述待播放音频数据的音量输出值。本发明解决了如何自动调节不同类型音频文件的音量输出问题,可以根据当前播放音乐的实际情况调节音频文件的输出音量。

Description

调节音频数据的音量输出值的方法和装置及终端
技术领域
本发明涉及一种音量管理方法及***,特别是涉及一种与当前播放音频进行比较之后调节音频数据的音量输出值的方法和装置及终端。
背景技术
现有的移动终端或多媒体播放器在播放音乐时,用户在收听时一般使用耳机或扬声器,但是由于每个音乐的类型不同,例如用户收听音乐,前后两首乐曲的曲风不同,前一首柔和而后一首高亢,如果保持不变的音量,则会对用户的听力造成损伤,给用户带来不好的体验。
现有技术在解决这类问题时采用了以下方法:通过获取每一音频文件对应的标签数据,比如MP3文件的标签被称为ID3,该标签中会存储该音频文档的标题、演唱(奏)者、作曲(词)者、歌词、音频类型等信息,上述音频类型包括摇滚、爵士、乡村、古典等。不同的类型的音频文档(如摇滚、乡村)的输出信号具有不同的振幅、音调和频率,通过读取该标签(如ID3),获知该音乐对应的音频类型,从而查找预设的不同音频类型对应的音量输出值,从而达到自动调节音乐输出音量的目的。然而,这种方法如果遇到音频文件标签没有表示音频类型、或者音频文件实际无法完美匹配预设的音量输出值时,就无法使预设的音量输出值准确的匹配音频文件。
发明内容
基于此,有必要针对如何自动调节不同类型音频文件的音量输出问题,提供了一种调节音频数据的音量输出值的方法和装置。
一种调节音频数据的音量输出值的方法,其包括:
读取待播放音频数据和当前播放音频数据;
提取所述待播放音频数据和当前播放音频数据的曲风特征信息并进行比对,获得比对结果;
根据比对结果,计算相对于所述当前播放音频的音量输出值的音量增益值,在结束播放当前播放音频数据后根据所述音量增益值调节所述待播放音频数据的音量输出值。
在其中一个实施例中,所述曲风特征信息包含:表征音频数据中高低频切换次数的频率值、表征音符震动强弱的音频幅值、反映音频帧信号内基本频带的质心值、反映音频信号的频谱数据、在开头或结尾带有的特定模型中的一个或两个以上的组合。
在其中一个实施例中,所述待播放音频数据和当前播放音频数据为分别取自流媒体播放列表中的下一个流媒体文件中提取的音频数据和当前正在播放的流媒体数据中提取的音频数据;或者是分别取自同一个流媒体文件中下一段待播放部分和当前正在播放部分对应的音频数据。
在其中一个实施例中,所述比对所述待播放音频数据与当前播放音频数据曲风特征信息的步骤包括:
首先基于单个音频帧提取的曲风特征信息,逐帧比对所述待播放音频数据与当前播放音频数据的相似度;然后,基于所述预设采样区间内提取的表征的曲风特征信息的参数值,比较所述待播放音频数据与当前播放音频数据在所述预设采样区间内相应参数值的大小;
或者,基于所述预设采样区间内提取的表征的曲风特征信息的参数值,比较所述待播放音频数据与当前播放音频数据在所述预设采样区间内相应参数值的大小。
在其中一个实施例中,所述预设采样区间为预先设置的一时间范围、音频数据中音频幅值最高部分所在的时间区间、或高低频切换次数最多的部分音频数据所在的时间区间。
在其中一个实施例中,所述基于单个音频帧提取的曲风特征信息、逐帧比对所述待播放音频数据与当前播放音频数据相似度的判定步骤包括:
基于从所述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征所述曲风特征参数信息的参数值,利用加权欧氏距离计算公式分别计算各个音频帧对应的参数值的欧氏距离;
对计算出的各个音频帧相应的欧氏距离值排序;
找出最小的欧氏距离值,判断所述最小的欧氏距离值是否小于一阈值,若是,则输出所述待播放音频数据与当前播放音频数据相似的判定结果;反之,则输出所述待播放音频数据与当前播放音频数据不相似的判定结果。
在其中一个实施例中,所述比较所述待播放音频数据与当前播放音频数据在所述预设采样区间内相应参数值大小的方法包括:
基于从所述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征所述曲风特征参数信息的参数值,选择位于所述预设采样区间内音频帧对应的所述参数值作为样本;
采用样本均值估计法获得所述预设采样区间内曲风特征参数信息的趋势估计值;
比较所述待播放音频数据与当前播放音频数据对应的趋势估计值的大小。
基于上述方法,本发明还提供了一种调节音频数据的音量输出值的装置,其包括:
音频数据提取模块,用于读取待播放音频数据和当前播放音频数据;
特征信息提取模块,用于提取所述待播放音频数据和当前播放音频数据的曲风特征信息;
特征信息比对模块,用于比对所述待播放音频数据与当前播放音频数据的曲风特征信息,获得比对结果;及
输出模块,用于根据所述比对结果,输出相对于当前音量输出的音量增益值,在播放待播放音频数据时根据所述音量增益值调节当前音量输出值。
在其中一个实施例中,所述特征信息比对模块包括:
欧氏距离计算单元,用于基于从所述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征所述曲风特征参数信息的参数值,利用加权欧氏距离计算公式分别计算各个音频帧对应的参数值的欧氏距离;
排序单元,用于对计算出的各个音频帧相应的欧氏距离值排序;及
判断单元,用于找出最小的欧氏距离值,判断所述最小的欧氏距离值是否小于一阈值,若是,则输出所述待播放音频数据与当前播放音频数据相似的判定结果;反之,则输出所述待播放音频数据与当前播放音频数据不相似的判定结果。
在其中一个实施例中,所述特征信息比对模块包括:
样本提取单元,用于基于从所述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征所述曲风特征参数信息的参数值,选择位于所述预设采样区间内音频帧对应的所述参数值作为样本;
估计单元,用于采用样本均值估计法获得所述预设采样区间内曲风特征参数信息的趋势估计值;及
比较单元,用于比较所述待播放音频数据与当前播放音频数据对应的趋势估计值的大小。
一种终端,其包括:
可从外部网络获取音频数据的通讯模块;
用于存储音频数据的存储设备;
音频播放模块,用于播放所述存储设备中的音频数据获得电信号,并读取待播放音频数据和当前播放音频数据,提取所述待播放音频数据和当前播放音频数据的曲风特征信息并进行比对,获得比对结果,根据所述比对结果,计算相对于所述当前播放音频的音量输出值的音量增益值,在结束播放当前播放音频数据后根据所述音量增益值调节所述待播放音频数据的音量输出值,根据此音量输出值调整所述电信号;以及,
音频输出模块,包括用于输出所述电信号的接口、或将所述电信号转化为声信号的换能器。
上述调节音频数据的音量输出值的方法和装置及终端,基于将待播放音频数据与当前播放音频数据的曲风特征信息进行比对,以求获得一个基于当前播放音频数据所对应的曲风类型评价结果,然后按照该实时获得的曲风类型评价结果,确定音量输出的增益值,这样做能够更加精确的评价曲风类型,在针对当前播放音频数据输出音量输出值的基础上给出一个更加贴合不同用户视听需求的音量输出值。
附图说明
图1为调节音频数据的音量输出值的方法流程示意图;
图2为本发明一实施例的流程示意图;
图3为本发明另一实施例的流程示意图;
图4为图1中音量增益值获取方法的流程示意图;
图5为图2中相似度判定方法的流程示意图;
图6为欧氏距离计算示意图;
图7为本发明调节音频数据的音量输出值的装置的结构示意图。
具体实施方式
基于将待播放音频数据与当前播放音频数据的曲风特征信息比对技术,本发明提供了一种调节音频数据的音量输出值的方法和装置。利用本发明的方法和装置,可以使用户正在听音乐时,若当前播放的歌曲属于柔和的曲风,用户所使用的音量较大;则在当前歌曲播放至临近结尾时,预检测到即将播放的下一首音乐的曲风比较高亢,则在结束当前音乐播放后,在下一首音乐播放前,自动调低音量至合适人耳的音量,以防止用户的听力受损。以下结合各个实施例详细说明本发明的技术内容。
如图1所示,本实施例提供的一种调节音频数据的音量输出值的方法,其包括:
步骤110:读取待播放音频数据和当前播放音频数据;
步骤120:提取上述待播放音频数据和当前播放音频数据的曲风特征信息;
步骤130:比对上述待播放音频数据与当前播放音频数据的曲风特征信息;
步骤140:根据上述比对的结果,可以用于确定上述待播放音频数据相对于上述当前播放音频数据的曲风类型。基于曲风的比对结果,计算相对于当前播放音频数据的音量输出值的音量增益值,在结束播放当前播放音频数据后根据上述音量增益值调节待播放音频数据的音量输出值。这里的音量增益值可以用分贝值来衡量,也可以用百分比来表示。
在上述方法步骤中,可以增加获取当前播放音频数据的当前音量输出值的步骤。如果在当前播放音频文件时,用户已自行调节了音量输出值,则利用上述方法后即可以在用户已调节的音量输出值得基础上根据所获得音量增益值进行调节,而无需重新定义相应类型的音量分贝值输出范围。因此利用本发明的上述方法可以根据实际用户的耳朵受听能力,比如有的人喜欢大声,有的人喜欢小声,则可以根据用户的实际情况更加人性的调节音量输出。
在上述方法步骤140中,在播放待播放音频数据时根据上述音量增益值调节当前音量输出值的具体方法,可以参见如下步骤所示:
逐次在获得的当前音量输出值的基础上增加或减少上述音量增益值,这里可以是每次增加1~5分贝的音量增益值或者减少1~5分贝的音量增益值,也可以是每次增加1~5%的音量增益值或者减少1~5%的音量增益值;
判断是否接收到外部确认指令,若是,则停止调节,反之继续在当前音量输出值的基础上增加或减少上述音量增益值。
通过以上方法可以逐次递进调节音量输出,缓和音量突然变大或者突然变小的情况,为用户提供最好的音效输出体验。
上述步骤110中的待播放音频数据和当前播放音频数据可以是分别取自流媒体播放列表中的下一个流媒体文件中提取的音频数据和当前正在播放的流媒体数据中提取的音频数据;或者可以是分别取自同一个流媒体文件中下一段待播放部分和当前正在播放部分对应的音频数据。这里的流媒体包括纯音乐压缩数据、视频压缩数据等。若为纯音乐数据,则上述待播放音频数据和当前播放音频数据可以分别为音乐播放列表中的下一首音乐和当前正在播放的音乐;或者可以是当前正在播放的一首音乐中的下一段待播放内容和当前正在播放的内容。利用本实施例的方法可以自动调节同一播放列表中前后两首音乐或者两个视频文件的播放音量。
上述步骤120中的曲风特征信息包含:表征音频数据中高低频切换次数的频率值(其可以用通过采样一段时间周期内高低频的切换次数来表示)、表征音符震动强弱的音频幅值、反映音频帧信号内基本频带的质心值、表征声音强度变化的声音动态范围(是指最强音和最弱音的强度差)、反映音频信号的频谱数据、在开头或结尾带有的特定模型中的一个或两个以上的组合。比如反映音频帧信号内基本频带的质心值采用以下计算方式:设一个音频序列的采样频率为fs,采样声道数为Sd,采样位数为Ws,每个子带的数据个数为k(=fsSdWs*20/(8000*32)),每一个音频帧的数据个数为Num(Num=k*32),x(n)(n∈[1...Num])为帧音频数据集,si(j)(j∈[1...32])为第i帧第j子带的音频数据集,计算第i音频帧的曲风特征参数如下:
每一个音频帧对应的反映音频帧信号内基本频带的质心值Ci为:
C i = Σ j 32 jM j Σ j 32 M j , 其中, M j = Σ j 32 s i 2 ( j ) k
每一个音频帧对应的表征音符震动强弱的音频幅值Ri,用均方根来表示,具体为:
R i = Σ j 32 M j 2 32
在上述实施例的基础上,上述步骤130中,比对上述待播放音频数据与当前播放音频数据曲风特征信息的步骤包括:基于上述预设采样区间内提取的用于表征曲风特征信息的参数值,比较上述待播放音频数据与当前播放音频数据在上述预设采样区间内相应参数值的大小,然后在步骤140中基于参数值的大小比较结果,来判定上述待播放音频数据相对于上述当前播放音频数据的曲风类型,获得比对结果。例如,如图3所示,若上述待播放音频数据大于当前播放音频数据的相应参数值,则执行步骤142判断曲风较为高亢;若上述待播放音频数据小于当前播放音频数据的相应参数值,则执行步骤143判断曲风较为柔和;若上述待播放音频数据等于当前播放音频数据的相应参数值,则执行步骤141判定为曲风相似。
当然,还可以进行二次判定,以减少单词音频数据处理时的复杂度,并且提供精确的曲风相似度检测。例如,首先,基于单个音频帧提取的曲风特征信息,逐帧比对上述待播放音频数据与当前播放音频数据的相似度,进行相似度的初次判定;然后,在上述待播放音频数据与当前播放音频数据非相似时,再基于上述预设采样区间内提取的用于表征曲风特征信息的参数值,比较上述待播放音频数据与当前播放音频数据在上述预设采样区间内相应参数值的大小。
本实施例通过相似度和/或值大小比较来共同确定待播放音频数据相对于当前播放音频数据的曲风类型,比如待播放音频数据相对于当前播放音频数据是高亢、柔和还是相似的比较结果,相对于现有技术中仅利用音频文件标签来判定音频数据的曲风特性,本实施例方式更为准确,更加符合用户所播放的音频文件的实际情况。上述预设采样区间为预先设置的一时间范围、音频数据中音频幅值最高部分所在的时间区间、或高低频切换次数最多的部分音频数据所在的时间区间。本文中的曲风类型在于两个音频的数据是否相似、高亢或者柔和。
上述步骤130具体可以采用以下两种方式实现。
第一种方式:如图2所示,基于上述实施例在执行完步骤120之后,首先,执行步骤131:基于单个音频帧提取的曲风特征信息,逐帧比对上述待播放音频数据与当前播放音频数据的相似度;若相似,则执行步骤141判定为曲风相似;若不相似,则再执行步骤132:基于上述预设采样区间内提取的表征的曲风特征信息的参数值,比较上述待播放音频数据与当前播放音频数据在上述预设采样区间内相应参数值的大小;若上述待播放音频数据大于当前播放音频数据的相应参数值,则执行步骤142判断曲风较为高亢;若上述待播放音频数据小于当前播放音频数据的相应参数值,则执行步骤143判断曲风较为柔和。
第二种方式,如图3所示,基于上述实施例在执行完步骤120之后,仅执行步骤132:基于上述预设采样区间内提取的表征的曲风特征信息的参数值,比较上述待播放音频数据与当前播放音频数据在上述预设采样区间内相应参数值的大小;若上述待播放音频数据大于当前播放音频数据的相应参数值,则执行步骤142判断曲风较为高亢;若上述待播放音频数据小于当前播放音频数据的相应参数值,则执行步骤143判断曲风较为柔和;若上述待播放音频数据等于当前播放音频数据的相应参数值,则执行步骤141判定为曲风相似。
当按照上述各个步骤给出步骤130的比对结果后,相应地就能在步骤140中确定待播放音频数据相对于当前播放音频数据的曲风类型,如果通过图2或图3的步骤判定为曲风相似,则执行步骤151:获取的音量增益值为零,在结束播放当前播放音频数据后,维持当前音量输出值不变;如果通过图2或图3的步骤判断曲风较为高亢,则执行步骤152:获取的音量增益值为预设分贝值或者预设分贝区间内的任意一值,在结束播放当前播放音频数据后,在当前音量输出值得基础上减去上述音量增益值,用以调低待播放音频数据对应的当前音量输出值;如果通过图2或图3的步骤判断曲风较为柔和,则执行步骤153:获取的音量增益值为预设分贝值或者预设分贝区间内的任意一值,在结束播放当前播放音频数据后,在当前音量输出值得基础上增加所述音量增益值,用以调高待播放音频数据对应的当前音量输出值。
在上述实施例的基础上,在执行完步骤110至步骤140之后,上述步骤140中,可以通过以下步骤获得音量增益值,如图4所示:
首先,执行步骤154:根据确定的上述曲风类型,查找关联记录曲风类型与音量增益值的二维动态数组结构,比如曲风相似对应的音量增益值为零,曲风较为高亢对应的音量增益值为第一分贝值或者在第一分贝区间内的任意一值,曲风较为柔和对应的音量增益值为第二分贝值或者在第二分贝区间内的任意一值。
然后,执行步骤155:获得相应曲风类型对应的音量增益值;
其次,执行步骤156:获取当前播放音频数据对应的音量输出值;
再次,执行步骤157:在播放待播放音频数据时,在上述音量输出值的基础上叠加所获得的音量增益值。而上述第一分贝值或者在第一分贝区间为负数或负区间范围,上述第二分贝值或者在第二分贝区间为正区间范围。
基于上述各个实施例,本实施例的逐帧比对上述待播放音频数据与当前播放音频数据相似度的方法按照图5中的步骤133至138来实现。在本实施例中,步骤120中,从上述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征上述曲风特征参数信息的参数值;
步骤133:利用加权欧氏距离计算公式分别计算各个音频帧对应的参数值的欧氏距离;
步骤134:对计算出的各个音频帧相应的欧氏距离值排序;
步骤135:找出最小的欧氏距离值;
步骤136:判断上述最小的欧氏距离值是否小于一阈值,若是,则执行步骤137:输出上述待播放音频数据与当前播放音频数据相似的判定结果;反之,则执行步骤138:输出上述待播放音频数据与当前播放音频数据不相似的判定结果。
以下以每一个音频帧对应的反映音频帧信号内基本频带的质心值Ci和每一个音频帧对应的表征音符震动强弱的音频幅值Ri为例,详细说明上述相似度判定的具体过程。
利用加权欧氏距离计算公式,按照附图6所示的方式分别计算质心值Ci和音频幅值Ri的欧氏距离Wk和Gk,对计算出的k个欧氏距离排序,找出最小的欧氏距离值,分别判定Wkmin≤ε1和Gkmin≤ε2是否成立,如果成立则表明前播放音频数据与待播放音频数据相似,否则不相似。这里的ε1和ε2为设定的阈值。
W k = Σ i N d ( C i - C i ( k ) ) 2 ( C i 2 - C i ( k ) 2 ) 2 , k = N d - N b
G k = Σ i N d ( R i - R i ( k ) ) 2 ( R i 2 - R i ( k ) 2 ) 2 , k = N d - N b
其中,Ci表示待播放音频数据第i帧的质心,表示前播放音频数据第i帧的质心,Nd表示待播放音频数据的音频帧数,Nb表示前播放音频数据的音频帧数,Ri表示待播放音频数据第i帧的音频幅值,表示前播放音频数据第i帧的音频幅值。
基于上述各个实施例,上述步骤130中基于上述预设采样区间内提取的表征的曲风特征信息的参数值,比较上述待播放音频数据与当前播放音频数据在上述预设采样区间内相应参数值大小的方法包括以下步骤:
基于在步骤120中从上述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征上述曲风特征参数信息的参数值,选择位于上述预设采样区间内音频帧对应的上述参数值作为样本,这里的预设采样区间为预先设置的一时间范围、音频数据中音频幅值最高部分所在的时间区间、或高低频切换次数最多的部分音频数据所在的时间区间;
采用样本均值估计法获得上述预设采样区间内曲风特征参数信息的趋势估计值;
比较上述待播放音频数据与当前播放音频数据对应的趋势估计值的大小。
以下以每一个音频帧对应的反映音频帧信号内基本频带的质心值Ci和每一个音频帧对应的表征音符震动强弱的音频幅值Ri为例,详细说明上述参数值比较的具体过程。
将音频数据中音频幅值最高部分所在的时间区间确定为预设采样区间x,然后选择该区间内的每个帧对应的质心值Ci和音频幅值Ri,利用样本均值估计法计算预设采样区间内各个音频帧对应参数值得均值,使其定为趋势估计值,用以评价音频幅值最高部分所在区间的一个基本频带和幅值的大致情况。
μ c = Σ i N d ( x ) C i ′ N d ( x ) , μ c ( k ) = Σ i N b ( x ) C i ′ ( k ) N b ( x ) ;
μ R = Σ i N d ( x ) R i ′ N d ( x ) , μ R ( k ) = Σ i N b ( x ) R i ′ ( k ) N b ( x ) ;
其中,C′i表示待播放音频数据中预设采样区间x内第i帧的质心,表示前播放音频数据中预设采样区间x内第i帧的质心,Nd(x)表示待播放音频数据中预设采样区间x内的音频帧数,Nb(x)表示前播放音频数据中预设采样区间x内的音频帧数,R′i表示待播放音频数据中预设采样区间x内第i帧的音频幅值,表示前播放音频数据中预设采样区间x内第i帧的音频幅值。
基于上述方法的各个实施例,本实施例还包括以下步骤:
存储各个待播放音频数据音量输出值的调节结果,并与音频数据关联记录;
根据上述调节结果的大小、将音频数据交错排列,或者将上述调节结果在预设区间范围内的音频数据汇总排列,形成播放列表。这样做的目的在于可根据用户需求,收听某一分贝值范围内的音频数据,也就是收听同一曲风音乐内容的,或者交错收听不同曲风的音乐内容。
在上述方法的基础上还可以包括:提供一参数调节接口,用于按照用户需求更新上述有关调节结果的预设区间范围,使得播放列表的选择更加人性、更加智能化。
基于上述方法,如图7所示,本实施例提供了一种调节音频数据的音量输出值的装置,其包括
音频数据提取模块1,用于读取待播放音频数据和当前播放音频数据;
特征信息提取模块2,用于提取上述待播放音频数据和当前播放音频数据的曲风特征信息;
特征信息比对模块3,用于比对上述待播放音频数据与当前播放音频数据的曲风特征信息,获得比对结果;以及
输出模块5,用于根据上述比对结果,计算相对于所述当前播放音频数据的音量输出值的音量增益值,在结束播放当前播放音频数据后根据所述音量增益值调节所述待播放音频数据的音量输出值。
上述音频数据提取模块1、特征信息提取模块2、特征信息比对模块3、输出模块5分别用于实现上述步骤110至步骤140,因此其相关具体实现细节可参照前文的相关说明,在此不再累述。
基于上述图2和图3的方法,上述特征信息比对模块3包括以下两个功能模块:
相似度判定模块,用于基于单个音频帧提取的曲风特征信息,逐帧比对上述待播放音频数据与当前播放音频数据的相似度,进行相似度初判;
比较模块,用于在非相似时再基于上述预设采样区间内提取的表征的曲风特征信息的参数值,比较上述待播放音频数据与当前播放音频数据在上述预设采样区间内相应参数值的大小。
基于图5的方法,上述特征信息比对模块3中相似度判定模块可以由以下单元组成:
欧氏距离计算单元,用于基于从上述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征上述曲风特征参数信息的参数值,利用加权欧氏距离计算公式分别计算各个音频帧对应的参数值的欧氏距离;
排序单元,用于对计算出的各个音频帧相应的欧氏距离值排序;及
判断单元,用于找出最小的欧氏距离值,判断上述最小的欧氏距离值是否小于一阈值,若是,则输出上述待播放音频数据与当前播放音频数据相似的判定结果;反之,则输出上述待播放音频数据与当前播放音频数据不相似的判定结果。
基于上述方法,上述特征信息比对模块3中比较模块可以包括:
样本提取单元,用于基于从上述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征上述曲风特征参数信息的参数值,选择位于上述预设采样区间内音频帧对应的上述参数值作为样本;
估计单元,用于采用样本均值估计法获得上述预设采样区间内曲风特征参数信息的趋势估计值;及
比较单元,用于比较上述待播放音频数据与当前播放音频数据对应的趋势估计值的大小。
基于上述方法和***,可以根据音乐等的曲风自动调高或调低音量,避免损害用户的听觉,同时用户不需要进行手动的音量调节,提升了用户体验。
此外,基于上述调节音频数据的音量输出值的方法及装置,还可以应用于一种终端,该终端可以是手机、电子玩具、耳机、计算机、IPAD等带有音频播放器的终端。此终端中包括以下几个元件:
1、可从外部网络获取音频数据的通讯模块;此通讯模块可以是满足4G、5G、TDMA等通讯协议的通讯模块。
2、用于存储音频数据的存储设备;此存储设备可以是闪存、硬盘、USD、SD卡等内置终端或外置于终端的各种类型的存储设备。
3、音频播放模块,用于播放所述存储设备中的音频数据获得电信号,并读取待播放音频数据和当前播放音频数据,提取所述待播放音频数据和当前播放音频数据的曲风特征信息并进行比对,获得比对结果,根据所述比对结果,计算相对于所述当前播放音频的音量输出值的音量增益值,在结束播放当前播放音频数据后根据所述音量增益值调节所述待播放音频数据的音量输出值,根据此音量输出值调整所述电信号。此音频播放模块主要是用于实现对音频数据的播放,即将音频数据输出形成电信号,并基于上述步骤110至步骤140所述步骤的内容实现对电信号的调节。例如,根据音量输出值调整上述电信号的幅值。有关音频播放模块的具体实现细节可参见前文中的相关说明。本实施例中的音频播放模块可以是终端中内置的音频播放器。
4、音频输出模块,包括用于输出所述电信号的音频输出接口、或将所述电信号转化为声信号的换能器。音频输出模块可以是一种可接入扬声器、耳机等设备的音频输出接口,例如,若终端为计算机,则只需要提供音频输出接口,并通过扬声器来将电信号转化为人类可以听见的声音。又例如,音频输出模块可以是内置于终端中的用于电信号转化为声信号的换能器,例如音频输出模块可以是终端中自带的外放设备,那么,终端可以自带外放功能。
以上所述实施例的各技术特征或技术方案可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (11)

1.一种调节音频数据的音量输出值的方法,其特征在于,所述方法包括:
读取待播放音频数据和当前播放音频数据;
提取所述待播放音频数据和当前播放音频数据的曲风特征信息并进行比对,获得比对结果;
根据比对结果,计算相对于所述当前播放音频数据的音量输出值的音量增益值,在结束播放当前播放音频数据后根据所述音量增益值调节所述待播放音频数据的音量输出值。
2.根据权利要求1所述的调节音频数据的音量输出值的方法,其特征在于,所述曲风特征信息包含:表征音频数据中高低频切换次数的频率值、表征音符震动强弱的音频幅值、反映音频帧信号内基本频带的质心值、反映音频信号的频谱数据、在开头或结尾带有的预设模型中的一个或两个以上的组合。
3.根据权利要求1所述的调节音频数据的音量输出值的方法,其特征在于,所述待播放音频数据和当前播放音频数据为分别取自流媒体播放列表中的下一个流媒体文件中提取的音频数据和当前正在播放的流媒体数据中提取的音频数据;或者是分别取自同一个流媒体文件中下一段待播放部分和当前正在播放部分对应的音频数据。
4.根据权利要求1所述的调节音频数据的音量输出值的方法,其特征在于,所述比对所述待播放音频数据与当前播放音频数据曲风特征信息的步骤包括:
基于单个音频帧提取的曲风特征信息,逐帧比对所述待播放音频数据与当前播放音频数据的相似度,进行相似度初判,在非相似时再基于预设采样区间内提取的用于表征曲风特征信息的参数值,比较所述待播放音频数据与当前播放音频数据在所述预设采样区间内相应参数值的大小;
或者,基于预设采样区间内提取的用于表征曲风特征信息的参数值,比较所述待播放音频数据与当前播放音频数据在所述预设采样区间内相应参数值的大小。
5.根据权利要求4所述的调节音频数据的音量输出值的方法,其特征在于,所述预设采样区间为预先设置的一时间范围、音频数据中音频幅值最高部分所在的时间区间、或高低频切换次数最多的部分音频数据所在的时间区间。
6.根据权利要求4所述的调节音频数据的音量输出值的方法,其特征在于,所述基于单个音频帧提取的曲风特征信息、逐帧比对所述待播放音频数据与当前播放音频数据相似度的判定步骤包括:
基于从所述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征所述曲风特征参数信息的参数值,利用加权欧氏距离计算公式分别计算各个音频帧对应的参数值的欧氏距离;
对计算出的各个音频帧相应的欧氏距离值排序;
找出最小的欧氏距离值,判断所述最小的欧氏距离值是否小于一阈值,若是,则输出所述待播放音频数据与当前播放音频数据相似的判定结果;反之,则输出所述待播放音频数据与当前播放音频数据不相似的判定结果。
7.根据权利要求4所述的调节音频数据的音量输出值的方法,其特征在于,所述比较所述待播放音频数据与当前播放音频数据在所述预设采样区间内相应参数值大小的方法包括:
基于从所述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征所述曲风特征参数信息的参数值,选择位于所述预设采样区间内音频帧对应的所述参数值作为样本;
采用样本均值估计法获得所述预设采样区间内曲风特征参数信息的趋势估计值;
比较所述待播放音频数据与当前播放音频数据对应的趋势估计值的大小。
8.一种调节音频数据的音量输出值的装置,其特征在于:所述装置包括:
音频数据提取模块,用于读取待播放音频数据和当前播放音频数据;
特征信息提取模块,用于提取所述待播放音频数据和当前播放音频数据的曲风特征信息;
特征信息比对模块,用于比对所述待播放音频数据与当前播放音频数据的曲风特征信息,获得比对结果;及
输出模块,用于根据所述比对结果,计算相对于所述当前播放音频数据的音量输出值的音量增益值,在结束播放当前播放音频数据后根据所述音量增益值调节所述待播放音频数据的音量输出值。
9.根据权利要求8所述的调节音频数据的音量输出值的装置,其特征在于,所述特征信息比对模块包括:
欧氏距离计算单元,用于基于从所述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征所述曲风特征参数信息的参数值,利用加权欧氏距离计算公式分别计算各个音频帧对应的参数值的欧氏距离;
排序单元,用于对计算出的各个音频帧相应的欧氏距离值排序;及
判断单元,用于找出最小的欧氏距离值,判断所述最小的欧氏距离值是否小于一阈值,若是,则输出所述待播放音频数据与当前播放音频数据相似的判定结果;反之,则输出所述待播放音频数据与当前播放音频数据不相似的判定结果。
10.根据权利要求8所述的调节音频数据的音量输出值的装置,其特征在于,所述特征信息比对模块包括:
样本提取单元,用于基于从所述待播放音频数据和当前播放音频数据中、提取的每一个音频帧对应的表征所述曲风特征参数信息的参数值,选择位于所述预设采样区间内音频帧对应的所述参数值作为样本;
估计单元,用于采用样本均值估计法获得所述预设采样区间内曲风特征参数信息的趋势估计值;及
比较单元,用于比较所述待播放音频数据与当前播放音频数据对应的趋势估计值的大小。
11.一种终端,其特征在于,包括:
可从外部网络获取音频数据的通讯模块;
用于存储音频数据的存储设备;
音频播放模块,用于播放所述存储设备中的音频数据获得电信号,并读取待播放音频数据和当前播放音频数据,提取所述待播放音频数据和当前播放音频数据的曲风特征信息并进行比对,获得比对结果,根据所述比对结果,计算相对于所述当前播放音频的音量输出值的音量增益值,在结束播放当前播放音频数据后根据所述音量增益值调节所述待播放音频数据的音量输出值,根据此音量输出值调整所述电信号;以及,
音频输出模块,包括用于输出所述电信号的接口、或将所述电信号转化为声信号的换能器。
CN201511000762.2A 2015-12-24 2015-12-24 调节音频数据的音量输出值的方法和装置及终端 Active CN105632523B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511000762.2A CN105632523B (zh) 2015-12-24 2015-12-24 调节音频数据的音量输出值的方法和装置及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511000762.2A CN105632523B (zh) 2015-12-24 2015-12-24 调节音频数据的音量输出值的方法和装置及终端

Publications (2)

Publication Number Publication Date
CN105632523A true CN105632523A (zh) 2016-06-01
CN105632523B CN105632523B (zh) 2018-07-20

Family

ID=56047360

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511000762.2A Active CN105632523B (zh) 2015-12-24 2015-12-24 调节音频数据的音量输出值的方法和装置及终端

Country Status (1)

Country Link
CN (1) CN105632523B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107566652A (zh) * 2017-09-20 2018-01-09 惠州Tcl移动通信有限公司 一种自动调节音量大小的方法、移动终端及存储介质
WO2019033921A1 (en) * 2017-08-18 2019-02-21 Guangdong Oppo Mobile Telecommunications Corp., Ltd. METHOD AND APPARATUS FOR VOLUME ADJUSTMENT, TERMINAL DEVICE, AND STORAGE MEDIUM
CN110677774A (zh) * 2019-08-21 2020-01-10 中国平安财产保险股份有限公司 一种音量自适应调节方法、装置和计算机设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6144627A (en) * 1996-03-08 2000-11-07 Sony Corporation Data recording and reproducing apparatus and method with phase error detection
CN104485121A (zh) * 2014-11-24 2015-04-01 惠州Tcl移动通信有限公司 一种自动设置音效参数的方法及***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6144627A (en) * 1996-03-08 2000-11-07 Sony Corporation Data recording and reproducing apparatus and method with phase error detection
CN104485121A (zh) * 2014-11-24 2015-04-01 惠州Tcl移动通信有限公司 一种自动设置音效参数的方法及***

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019033921A1 (en) * 2017-08-18 2019-02-21 Guangdong Oppo Mobile Telecommunications Corp., Ltd. METHOD AND APPARATUS FOR VOLUME ADJUSTMENT, TERMINAL DEVICE, AND STORAGE MEDIUM
US10440464B2 (en) 2017-08-18 2019-10-08 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method and apparatus for adjusting volume, terminal device and storage medium
CN107566652A (zh) * 2017-09-20 2018-01-09 惠州Tcl移动通信有限公司 一种自动调节音量大小的方法、移动终端及存储介质
CN110677774A (zh) * 2019-08-21 2020-01-10 中国平安财产保险股份有限公司 一种音量自适应调节方法、装置和计算机设备及存储介质
CN110677774B (zh) * 2019-08-21 2022-06-10 中国平安财产保险股份有限公司 一种音量自适应调节方法、装置和计算机设备及存储介质

Also Published As

Publication number Publication date
CN105632523B (zh) 2018-07-20

Similar Documents

Publication Publication Date Title
WO2019233358A1 (zh) 一种基于深度学习的音质特性处理方法及***
CN105074822B (zh) 用于音频分类和处理的装置和方法
US8311821B2 (en) Parameterized temporal feature analysis
CN105405439B (zh) 语音播放方法及装置
KR102084931B1 (ko) 볼륨 레벨러 제어기 및 제어 방법
CN101023469B (zh) 数字滤波方法和装置
US20210158832A1 (en) Method and device for evaluating performance of speech enhancement algorithm, and computer-readable storage medium
CN101625868A (zh) 音量调节设备和音量调节方法
WO2020155490A1 (zh) 基于语音分析的管理音乐的方法、装置和计算机设备
JP2010020133A (ja) 再生装置、表示方法および表示プログラム
CN102486920A (zh) 音频事件检测方法和装置
CN101569092A (zh) 用于处理音频数据的***
CN103152668A (zh) 输出音频调节方法及其***
JP2007534995A (ja) 音声信号を分類する方法及びシステム
CN103354445A (zh) 一种环境自适应音乐播放装置及方法
WO2015114216A2 (en) Audio signal analysis
CN108615536A (zh) 基于麦克风阵列的时频联合特征乐器音质评价***及方法
CN105632523A (zh) 调节音频数据的音量输出值的方法和装置及终端
CN106980487A (zh) 音频控制方法和音频控制装置
JP3757719B2 (ja) 音響データ分析方法及びその装置
Kendrick et al. Perceived audio quality of sounds degraded by non-linear distortions and single-ended assessment using HASQI
Wilson et al. Perception & evaluation of audio quality in music production
JP4770194B2 (ja) 音響信号に対する情報の埋め込み装置および方法
KR101382356B1 (ko) 오디오파일의 위변조 검출장치
CN111767083B (zh) 误唤醒音频数据的收集方法、播放设备、电子设备、介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 519085 Guangdong Zhuhai science and technology innovation coastal Meizu Technology Building

Patentee after: MEIZU TECHNOLOGY Co.,Ltd.

Address before: 519000 technology innovation coastal Meizu science and technology building, Zhuhai, Guangdong

Patentee before: Meizu Technology (China) Co.,Ltd.