CN105989853A - 一种音频质量评测方法及*** - Google Patents

一种音频质量评测方法及*** Download PDF

Info

Publication number
CN105989853A
CN105989853A CN201510091491.XA CN201510091491A CN105989853A CN 105989853 A CN105989853 A CN 105989853A CN 201510091491 A CN201510091491 A CN 201510091491A CN 105989853 A CN105989853 A CN 105989853A
Authority
CN
China
Prior art keywords
audio
frequency
audio quality
upper limiting
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510091491.XA
Other languages
English (en)
Other versions
CN105989853B (zh
Inventor
杨将
杨溥
吴维昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
iFlytek Co Ltd
Original Assignee
iFlytek Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by iFlytek Co Ltd filed Critical iFlytek Co Ltd
Priority to CN201510091491.XA priority Critical patent/CN105989853B/zh
Publication of CN105989853A publication Critical patent/CN105989853A/zh
Application granted granted Critical
Publication of CN105989853B publication Critical patent/CN105989853B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明公开了一种音频质量评测方法及***,属于语音信号处理技术领域。该音频质量评测方法包括:接收用户输入的音频数据;对所述音频数据进行转码处理,得到多个音频采样点数据;分别计算所述音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率;根据所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分。该音频质量评测方法,综合多项音频质量参数对音频质量进行评测,评测结果普适性较强,能够满足多数应用场合的需要。

Description

一种音频质量评测方法及***
技术领域
本发明涉及语音信号处理技术领域,特别涉及一种音频质量评测方法及***。
背景技术
随着数字音频处理技术的不断发展,对音频质量的要求越来越高。如何确定合适的评测标准对音频质量进行评测,从而得到符合要求的音频,成为当前的重要课题。
在音频技术发展的初期,由于没有客观的评测标准,通常组织大量的音频试听人员通过人工试听各种音频,来对音频质量进行评测、打分。该种方式由于需要大量的人员参与,经济成本高、实验周期长,并且基于每个评测人员的喜好、标准具有主观性、难以统一,从而无法保证评测结果的客观性和准确性。
随着技术的发展,人们通过对音频质量影响较大的指标加以总结,形成音频质量参数作为音频质量的客观评测标准。其中,典型的音频质量参数主要有:截幅、响度、信噪比和噪声能量。在实际应用中,根据音频使用场合的不同,选择其中一项音频质量参数,对该场合下的音频质量进行评测。该种评测方式由于仅考虑音频质量的某项指标,评测结果只对特定场合具有参考意义,而无法适用于其他场合,普适性较差。
发明内容
本发明实施例提供了一种音频质量评测方法及***,综合多项音频质量参数对音频质量进行评测,评测结果普适性较强,能够满足多数应用场合的需要。
本发明实施例提供的技术方案如下:
一方面,提供了一种音频质量评测方法,包括:
接收用户输入的音频数据;
对所述音频数据进行转码处理,得到多个音频采样点数据;
分别计算所述音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率;
根据所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分。
优选地,所述计算频谱上限频率包括:
对所述音频采样点数据进行分帧处理;
计算每帧音频数据的频谱上限频率;
统计所述频谱上限频率在全频带内的次数直方图,从频谱上限频率最大的次数直方图开始选取预设宽度的频带范围;
确定所述预设宽度的频带范围内的每个所述次数直方图的中心频率点,并统计所述中心频率点出现的次数;
将所述次数作为加权系数,计算所述中心频率点的加权平均值;
将所述加权平均值作为所述频谱上限频率。
优选地,所述计算平均响度包括:
对所述音频采样点数据的振幅绝对值提取一层包络,得到一层包络音频振幅绝对值数据;
对所述一层包络音频振幅绝对值数据再提取一层包络,得到二层包络音频振幅绝对值数据;
计算所述一层包络音频振幅绝对值数据和所述二层包络音频振幅绝对值数据的平均振幅值;
将所述平均振幅值作为所述平均响度。
优选地,所述根据所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分包括:
获取预设的初始音频质量得分;
分别根据计算得到的所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,确定这五个音频质量参数异常情况的累计扣分;
计算所述初始音频质量得分与所述累计扣分的差值;
将所述差值作为所述音频质量得分。
优选地,所述方法还包括:
根据所述音频质量得分确定音频质量等级;
将所述音频质量等级作为评测结果。
另一方面,提供了一种音频质量评测***,包括:
接收模块,用于接收用户输入的音频数据;
转码模块,用于对所述音频数据进行转码处理,得到多个音频采样点数据;
第一计算模块,用于分别计算所述音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率;
第二计算模块,用于根据所述第一计算模块计算得到的所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分。
优选地,所述第一计算模块包括第一计算子模块,用于计算频谱上限频率;所述第一计算子模块,包括:
分帧单元,用于对所述音频采样点数据进行分帧处理;
第一计算单元,用于计算每帧音频数据的频谱上限频率;
第一统计单元,用于统计所述频谱上限频率在全频带内的次数直方图;
选择单元,用于从所述第一统计单元统计的频谱上限频率最大的次数直方图开始选取预设宽度的频带范围;
确定单元,用于确定所述预设宽度的频带范围内的每个所述次数直方图的中心频率点;
第二统计单元,用于统计所述确定单元确定的所述中心频率点出现的次数;
第二计算单元,用于将所述第二统计单元统计的所述中心频率点出现的次数作为加权系数,计算所述中心频率点的加权平均值,并将所述加权平均值作为所述频谱上限频率。
优选地,所述第一计算模块还包括第二计算子模块,用于计算所述平均响度;所述第二计算子模块,包括:
第一提取单元,用于对所述音频采样点数据的振幅绝对值提取一层包络,得到一层包络音频振幅绝对值数据;
第二提取单元,用于对所述一层包络音频振幅绝对值数据再提取一层包络,得到二层包络音频振幅绝对值数据;
第三计算单元,用于计算所述一层包络音频振幅绝对值数据和所述二层包络音频振幅绝对值数据的平均振幅值,并将所述平均振幅值作为所述平均响度。
优选地,所述第二计算模块包括:
获取单元,用于获取预设的初始音频质量得分;
第四计算单元,用于分别根据计算得到的所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,确定这五个音频质量参数异常情况的累计扣分;
第五计算单元,用于计算所述初始音频质量得分与所述累计扣分的差值,并将所述差值作为所述音频质量得分。
优选地,所述***还包括:确定模块,用于根据所述音频质量得分确定音频质量等级,并将所述音频质量等级作为评测结果。
本发明实施例提供的音频质量评测方法及***,对用户输入的音频数据转码后得到多个音频采样点数据,通过计算音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率五个音频质量参数,进而根据音频质量参数计算得到音频质量得分。该音频质量评测方法及***,由于综合了多项音频质量参数对音频质量进行评测,评测结果普适性较强,能够满足多数应用场合的需求。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种音频质量评测方法的流程图;
图2是本发明实施例提供的一种频谱上限频率的计算方法流程图;
图3是本发明实施例提供的一种平均响度的计算方法流程图;
图4是本发明实施例提供的一种音频质量得分的计算方法流程图;
图5是本发明实施例提供的另外一种音频质量评测方法的流程图;
图6是本发明实施例提供的一种音频质量评测***的结构示意图;
图7是本发明实施例提供的第二种音频质量评测***的结构示意图;
图8是本发明实施例提供的第三种音频质量评测***的结构示意图;
图9是本发明实施例提供的第四种音频质量评测***的结构示意图;
图10是本发明实施例提供的第五种音频质量评测***的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例的方案,下面结合附图和实施方式对本发明实施例作进一步的详细说明。
本发明实施例提供了一种音频质量评测方法,如图1所示,包括:
步骤101:接收用户输入的音频数据。
步骤102:对音频数据进行转码处理,得到多个音频采样点数据。
具体地,可以根据对输出音频数据的格式要求及用户输入音频数据中携带的编码信息进行转码工具的选择,采用转码工具对音频数据进行转码处理。例如可以选择ffmpeg作为转码工具对音频数据进行转码处理,转码后的音频格式为单通道,采样率为16k,采样精度为16bit的wav格式。由于ffmpeg转码工具能够自动分析原始音频的格式信息,因此,可以支持任意格式的输入音频数据。在使用中可以预先确定所要输出的音频格式,采用ffmpeg能够将输入的音频数据转换为所确定的音频格式进行输出。
步骤103:分别计算音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率。
其中,爆音截幅点比例指音频采样点数据中振幅值超过振幅截幅门限值的采样点数目与全部采样点数目的比值。爆音截幅点比例越小,音频质量越高。预先设置音频振幅截幅门限值η(例如,设置η=3000),统计步骤102得到的音频采样点数据中振幅值超过振幅截幅门限值η的采样点数目为sum1,全部采样点数目为sum,则爆音截幅点比例α=sum1/sum。
响度,指人耳感觉到的声音强弱,即声音的响亮程度。响度的大小主要依赖于声强,也与声音的频率有关。在本发明实施例中,采用振幅值来表征响度的大小,更具体地,采用平均振幅值来表征平均响度的大小,其中,可以通过对音频采样点数据的振幅绝对值提取包络,进行平均响度值的计算。
如图3所示,为本发明实施例提供的一种平均响度的计算方法的流程图,包括以下步骤:
步骤301:对音频采样点数据的振幅绝对值提取一层包络,得到一层包络音频振幅绝对值数据。
其中,一层包络音频振幅绝对值数据为采样点极大值的集成,例如采用β1表示,在对平均响度的计算精度要求不高的场合,可以将一层包络音频振幅绝对值数据直接作为平均响度。
步骤302:对一层包络音频振幅绝对值数据再提取一层包络,得到二层包络音频振幅绝对值数据。
为了提高平均响度的计算精度,可以对一层包络音频振幅绝对值数据进一步提取一层包络,得到二层包络音频振幅绝对值数据,例如采用β2表示。
步骤303:计算一层包络音频振幅绝对值数据和二层包络音频振幅绝对值数据的平均振幅值,并将平均振幅值作为平均响度。
通过计算一层包络音频振幅绝对值数据β1和二层包络音频振幅绝对值数据β2的平均振幅值β,即β=(β1+β2)/2,将β作为平均响度,能够确保平均响度的计算精度。
信噪比(signal-to-noise ratio)是描述信号中有效成分与噪声成分的比例关系参数,以γ表示,信噪比越大,噪声越小。由于噪声以波的形式存在,具有一定的能量,因此,可以通过噪声能量来作为衡量音频质量的参数之一,其中,噪声能量可以采用E表示。本领域技术人员通过常用计算工具,例如speex工具,能够方便地计算出信噪比γ和噪声能量E。
频谱指频率的分布曲线。音频信号的频谱按照频率的高低覆盖一定宽度的频带范围。由于音频信号并非在所有的频带范围内都有效,例如,对于常规的未经处理的音频信号而言,通常在较窄范围内的低音频段内的音频信号有效,而对于覆盖频带范围较宽的高音频段内的音频信号无效。也即,在音频频谱中存在一个频率值,该频率值为音频频谱中实际有效的最高频率值,我们称之为频谱上限频率。通过频谱上限频率能够将音频频谱划分为有效音频和无效音频两部分,具体而言,高于频谱上限频率的音频信号无效,而低于该频谱上限频率的音频信号值才有效,体现在频谱图上,将高于频谱上限频率的音频信号用暗色表示,而将低于频谱上限频率的音频信号采用亮色表示。其中,将音频信号区分为有效音频和无效音频并非指音频信号绝对的有效或无效,而是根据其对音频质量的影响大小而言,我们认为无效音频对音频质量影响较小,可以忽略不计,而有效音频对音频质量影响较大,需要在音频质量评测中重点给予评测。在未引入频谱上限频率的概念之前,在对音频信号进行音频质量评测时,需要对全频带内的音频信号按照相同的采样频率进行采样、分析,由于在全频带范围内无效频带所覆盖的范围往往宽于有效频带范围,因此,导致采样数据中有较大一部分为无效频带内的数据,从而导致花费大量精力进行分析的数据对实际音频质量基本无参考意义,也即,多做了很多的无用功。此外,由于音频信号的全频带范围较宽,从而导致在处理同样数据量的情况下,采样精度较低,从而影响整体计算精度,并且在对大量无效频带中的数据进行处理过程中,容易发生错误,从而引发整体评测结果出错。引入频谱上限频率后,将全频带范围分为有效音频和无效音频,只对音频信号中的有效音频进行采样、分析,而对无效音频不予处理,由于无效音频覆盖的频带宽度远大于有效音频宽度,从而大大减小了数据处理量,并且减小了对无效音频处理出错的概率,此外,由于处理带宽较小,可以大幅提高采样精度,从而保证评测结果更加准确。例如,音频信号的频带范围为0~20kHz,其中,频谱上限频率为4kHz,也即,0~4kHz为有效频带,而4k~16kHz为无效频带,则引入频谱上限频率后,相当于截取宽度为0~4kHz的频带进行音频质量评测,明显比对0~20kHz的频带进行音频质量评测所需要处理的数据量减少,因此,可以对0~4kHz频宽范围内采用较高的采样频率进行采样,从而使得处理结果更加精确。
如图2所示,为本发明实施例提供的一种频谱上限频率的计算方法的流程图,包括:
步骤201:对音频采样点数据进行分帧处理。
具体可以采用常规方式进行分帧处理,例如采用Matlab提供的分帧处理函数对音频采样点数据进行分帧处理,从而能够得到多帧音频数据。
步骤202:计算每帧音频数据的频谱上限频率。
对音频采样点数据进行分帧处理,得到多帧音频数据后,可以分别计算每帧音频数据的频谱上限频率fi。假设频谱的频率范围是0~PHz,那么每帧音频数据在频率范围上存在一个最大频率点THz,使得该帧音频数据在T~PHz范围内的频谱值都小于等于一个门限值ξ,其中,ξ是一个接近于0的值。具体计算方法是做N点的FFT,,对应16kHz采样率,频谱的频率范围是0~8kHz,表现为以8k/N为频带宽度的N个中心频率为的频带的频谱幅度值,即 F n = 4 k N , 4 k N + 8 k N , 4 k N + 8 k N * 2 , 4 k N + 8 k N * 3 , . . . , 4 k N + 8 k N * ( N - 1 ) . 根据频谱上限频率的定义,按照频带中心频率从大到小的顺序计算出第一个频谱幅度值大于某个设定门限值,例如ξ=0.3的频带的中心频率,即为该帧音频数据的上限频率fi
步骤203:统计频谱上限频率在全频带内的次数直方图,从频谱上限频率最大的次数直方图开始选取预设宽度的频带范围。
根据计算出的每帧数据的上限频率fi(i=0,1,…M),其中,M为总帧数,在N个频带上统计上限频率fi=Fn出现的次数Cn(n=0,1…,N),制作全频带范围内的次数直方图,从最大上限频率的次数直方图开始选取预设宽度的频带范围,例如,从8kHz处往下取宽度为SHz的频带,一般地,通过音频测试集上的参数调优,优选将频带宽度选择为S=1k。
步骤204:确定预设宽度的频带范围内的每个次数直方图的中心频率点,并统计中心频率点出现的次数。
对于每个次数直方图而言,容易确定其中心频率点Fn,从而容易统计出该预设宽度频带范围内的上限频率fi=Fn出现的总次数To
步骤205:将次数作为加权系数,计算中心频率点的加权平均值,将加权平均值作为频谱上限频率。
以S=1kHz宽度为频带从高频部分往低频部分平滑,平滑长度为8k/N Hz,计算出新的频带内上限频率fi=Fn出现的总次数T1,依次计算Tj(j=0,1,…W),由于频带是从0~1kHz开始,保证频带的宽度为1kHz不变,频带开始频率依次增加8k/N的平滑长度,最终的频带是7kHz~8kHz,频带的开始频率组成一个起始值为0,终值为7k,步长为8k/N的等差数列,因此,计算Tmax=max{Tj|(j=0,1,...,W)}对应的频带中所有宽度为8k/N的最小频带的中心频率Fn的加权平均,权重系数为对应的Cn,其结果即为最终的音频数据的频谱上限频率f。
步骤104:根据爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率,计算音频质量得分。
如图4所示,为本发明实施例提供的一种音频质量得分的计算方法流程图,包括:
步骤401:获取预设的初始音频质量得分。
其中,初始音频质量得分可以根据评分规则事先设置好,例如在采用百分制评分规则的情况下,可以将初始音频质量得分设置为100分。
步骤402:分别根据计算得到的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率,确定这五个音频质量参数异常情况的累计扣分。
根据上述步骤103计算得到的爆音截幅点比例α、平均响度β、信噪比γ、噪声能量E和频谱上限频率f五个音频质量参数后,根据事先设置的扣分规则,能够分别确定这五个音频质量参数异常情况下的扣分情况,从而计算出五个音频质量参数异常情况下的累计扣分。
具体可以通过采集大量的音频数据作为样本进行统计、分析,得出音频质量在各种不同使用场合下的得分情况,然后综合得出各音频质量参数异常情况下的扣分情况(音频质量参数正常情况下扣分为0),从而保证评分结果能够适用于多数场合的应用需求。为了保证评测结果更加精确,可以将每个音频质量参数在不同数值范围时,所对应的扣分设置为不同值。
例如:(1)当α≤0.006时,将扣分设置为0;当0.006<α<0.01时,将扣分设置为A[1];当α≥0.01时,将扣分设置为A[2],其中,A[1]<A[2];
(2)当β>1200时,将扣分设置为0;当1000≤β≤1200时,将扣分设置为B[1];当β<1000时,将扣分设置为B[2],其中,B[1]<B[2];
(3)当γ>16.8时,将扣分设置为0;15.5≤γ≤16.8时,将扣分设置为C[1];13.5≤γ<15.5时,将扣分设置为C[2];当γ<13.5时,将扣分设置为C[3],其中,C[1]<C[2]<C[3];
(4)当E<43.43时,将扣分设置为0;当E≥43.43且γ<52.55时,将扣分设置为D[1];当E≥43.43且52.55≤γ<54.55时,将扣分设置为D[2];当E≥43.43,且γ≥54.55时,将扣分设置为D[3],其中,D[1]<D[2]<D[3];
(5)当f<6000或f≥7000时,将扣分设置为0;当6000≤f<7000且γ≥6000时,将扣分设置为E[1];当6000≤f<7000且5000≤γ<6000时,将扣分设置为E[2];当6000≤f<7000且γ<5000时,将扣分设置为E[3],其中,E[1]<E[2]<E[3]。
上述扣分A[1]、A[2]、B[1]、B[2]、C[1]、C[2]、C[3]、D[1]、D[2]、D[3]、E[1]、E[2]和E[3]分别根据统计数据得出,事先设置好,根据各音频质量参数的数值选择不同的扣分,其中,A[2]+B[2]+C[3]+D[3]+E[3]≤预设的初始质量得分,从而保证最终计算得到的音频质量得分≥0。
根据各音频质量参数对音频质量的影响大小,分别将信噪比γ作为单独的评测参数进行评测,又将信噪比γ与噪声能量E结合、将信噪比γ与频谱上限频率f相结合作为评测参数对音频质量进行评测,当信噪比γ同时满足(3)、(4)和(5)中的条件时,需要分别对各项单独进行扣分。
根据上述爆音截幅点比例α、平均响度β、信噪比γ、噪声能量E和频谱上限频率f五个音频质量参数,能够分别计算出各项参数对应的扣分,将各项扣分求和,能够计算出五个音频质量参数异常情况下的累计扣分。
步骤403:计算初始音频质量得分与累计扣分的差值,并将差值作为音频质量得分。
在本发明实施例中,将初始音频质量得分与各音频质量参数异常情况下的累计扣分的差值作为音频质量得分,由于充分考虑了爆音截幅点比例α、平均响度β、信噪比γ、噪声能量E和频谱上限频率f五个音频质量参数对音频质量的影响,能够保证评测结果满足多数场合的应用需求。
如图5所示,上述音频质量评测方法还可以包括:
步骤105:根据音频质量得分确定音频质量等级,并将音频质量等级作为评测结果。
可以预先设置评级标准,在计算出音频质量得分score后,进一步根据音频质量得分score确定所属的音频质量等级level,将音频质量等级作为最终的评测结果反馈给用户。
例如,将音频质量等级设置为五级,当0≤score≤20时,对应的音频质量等级level为一级;当20<score≤40时,对应的音频质量等级level为二级;当40<score≤60时,对应的音频质量等级level为三级;当60<score≤80时,对应的音频质量等级level为四级;当80<score≤100时,对应的音频质量等级level为五级。其中,level越高代表用户的唱歌水平越高。
本发明实施例提供的音频质量评测方法,对用户输入的音频数据转码后得到多个音频采样点数据,通过计算音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率五个音频质量参数据在频率范围上存在一个最大频率点THz,使得该帧音频数据在T~PHz范围内的频谱值都数,进而根据音频质量参数计算得到音频质量得分。该音频质量评测方法及***,由于综合了多项音频质量参数对音频质量进行评测,评测结果普适性较强,能够满足多数应用场合的需求。
相应地,本发明实施例还提供了一种音频质量评测***,如图6所示,包括:
接收模块501,用于接收用户输入的音频数据;
转码模块502,用于对音频数据进行转码处理,得到多个音频采样点数据;
第一计算模块503,用于分别计算音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率;
第二计算模块504,用于根据第一计算模块503计算得到的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率,计算音频质量得分。
如图7所示,上述第一计算模块503包括第一计算子模块601,用于计算频谱上限频率;其中,第一计算子模块601的一种具体结构包括:
分帧单元701,用于对音频采样点数据进行分帧处理;
第一计算单元702,用于计算每帧音频数据的频谱上限频率;
第一统计单元703,用于统计频谱上限频率在全频带内的次数直方图;
选择单元704,用于从第一统计单元703统计的频谱上限频率最大的次数直方图开始选取预设宽度的频带范围;
确定单元705,用于确定预设宽度的频带范围内的每个次数直方图的中心频率点;
第二统计单元706,用于统计确定单元705确定的中心频率点出现的次数;
第二计算单元707,用于将第二统计单元706统计的中心频率点出现的次数作为加权系数,计算中心频率点的加权平均值,并将加权平均值作为频谱上限频率。
如图8所示,上述第一计算模块503还包括第二计算子模块602,用于计算平均响度;其中,第二计算子模块602的一种具体结构包括:
第一提取单元708,用于对音频采样点数据的振幅绝对值提取一层包络,得到一层包络音频振幅绝对值数据;
第二提取单元709,用于对一层包络音频振幅绝对值数据再提取一层包络,得到二层包络音频振幅绝对值数据;
第三计算单元710,用于计算一层包络音频振幅绝对值数据和二层包络音频振幅绝对值数据的平均振幅值,并将平均振幅值作为平均响度。
如图9所示,上述第二计算模块504包括:
获取单元801,用于获取预设的初始音频质量得分;
第四计算单元802,用于分别根据计算得到的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率,确定这五个音频质量参数异常情况的累计扣分;
第五计算单元803,用于计算初始音频质量得分与累计扣分的差值,并将差值作为音频质量得分。
如图10所示,上述音频质量评测***进一步包括:
确定模块505,用于根据音频质量得分确定音频质量等级,并将音频质量等级作为评测结果。
本发明实施例提供的音频质量评测***,对用户输入的音频数据转码后得到多个音频采样点数据,通过计算音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率五个音频质量参数,进而根据音频质量参数计算得到音频质量得分。该音频质量评测方法及***,由于综合了多项音频质量参数对音频质量进行评测,评测结果普适性较强,能够满足多数应用场合的需求。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的***实施例仅仅是示意性的,其中所述作为分离部件说明的模块或单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种音频质量评测方法,其特征在于,包括:
接收用户输入的音频数据;
对所述音频数据进行转码处理,得到多个音频采样点数据;
分别计算所述音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率;
根据所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分。
2.根据权利要求1所述的音频质量评测方法,其特征在于,所述计算频谱上限频率包括:
对所述音频采样点数据进行分帧处理;
计算每帧音频数据的频谱上限频率;
统计所述频谱上限频率在全频带内的次数直方图,从频谱上限频率最大的次数直方图开始选取预设宽度的频带范围;
确定所述预设宽度的频带范围内的每个所述次数直方图的中心频率点,并统计所述中心频率点出现的次数;
将所述次数作为加权系数,计算所述中心频率点的加权平均值;
将所述加权平均值作为所述频谱上限频率。
3.根据权利要求1所述的音频质量评测方法,其特征在于,所述计算平均响度包括:
对所述音频采样点数据的振幅绝对值提取一层包络,得到一层包络音频振幅绝对值数据;
对所述一层包络音频振幅绝对值数据再提取一层包络,得到二层包络音频振幅绝对值数据;
计算所述一层包络音频振幅绝对值数据和所述二层包络音频振幅绝对值数据的平均振幅值;
将所述平均振幅值作为所述平均响度。
4.根据权利要求1所述的音频质量评测方法,其特征在于,所述根据所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分包括:
获取预设的初始音频质量得分;
分别根据计算得到的所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,确定这五个音频质量参数异常情况的累计扣分;
计算所述初始音频质量得分与所述累计扣分的差值;
将所述差值作为所述音频质量得分。
5.根据权利要求1至4任一项所述的音频质量评测方法,其特征在于,所述方法还包括:
根据所述音频质量得分确定音频质量等级;
将所述音频质量等级作为评测结果。
6.一种音频质量评测***,其特征在于,包括:
接收模块,用于接收用户输入的音频数据;
转码模块,用于对所述音频数据进行转码处理,得到多个音频采样点数据;
第一计算模块,用于分别计算所述音频采样点数据的爆音截幅点比例、平均响度、信噪比、噪声能量和频谱上限频率;
第二计算模块,用于根据所述第一计算模块计算得到的所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,计算音频质量得分。
7.根据权利要求6所述的音频质量评测***,其特征在于,所述第一计算模块包括第一计算子模块,用于计算频谱上限频率;所述第一计算子模块,包括:
分帧单元,用于对所述音频采样点数据进行分帧处理;
第一计算单元,用于计算每帧音频数据的频谱上限频率;
第一统计单元,用于统计所述频谱上限频率在全频带内的次数直方图;
选择单元,用于从所述第一统计单元统计的频谱上限频率最大的次数直方图开始选取预设宽度的频带范围;
确定单元,用于确定所述预设宽度的频带范围内的每个所述次数直方图的中心频率点;
第二统计单元,用于统计所述确定单元确定的所述中心频率点出现的次数;
第二计算单元,用于将所述第二统计单元统计的所述中心频率点出现的次数作为加权系数,计算所述中心频率点的加权平均值,并将所述加权平均值作为所述频谱上限频率。
8.根据权利要求6所述的音频质量评测***,其特征在于,所述第一计算模块还包括第二计算子模块,用于计算所述平均响度;所述第二计算子模块,包括:
第一提取单元,用于对所述音频采样点数据的振幅绝对值提取一层包络,得到一层包络音频振幅绝对值数据;
第二提取单元,用于对所述一层包络音频振幅绝对值数据再提取一层包络,得到二层包络音频振幅绝对值数据;
第三计算单元,用于计算所述一层包络音频振幅绝对值数据和所述二层包络音频振幅绝对值数据的平均振幅值,并将所述平均振幅值作为所述平均响度。
9.根据权利要求6所述的音频质量评测***,其特征在于,所述第二计算模块包括:
获取单元,用于获取预设的初始音频质量得分;
第四计算单元,用于分别根据计算得到的所述爆音截幅点比例、所述平均响度、所述信噪比、所述噪声能量和所述频谱上限频率,确定这五个音频质量参数异常情况的累计扣分;
第五计算单元,用于计算所述初始音频质量得分与所述累计扣分的差值,并将所述差值作为所述音频质量得分。
10.根据权利要求6至9任一项所述的音频质量评测***,其特征在于,所述***还包括:确定模块,用于根据所述音频质量得分确定音频质量等级,并将所述音频质量等级作为评测结果。
CN201510091491.XA 2015-02-28 2015-02-28 一种音频质量评测方法及*** Active CN105989853B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510091491.XA CN105989853B (zh) 2015-02-28 2015-02-28 一种音频质量评测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510091491.XA CN105989853B (zh) 2015-02-28 2015-02-28 一种音频质量评测方法及***

Publications (2)

Publication Number Publication Date
CN105989853A true CN105989853A (zh) 2016-10-05
CN105989853B CN105989853B (zh) 2020-08-18

Family

ID=57039274

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510091491.XA Active CN105989853B (zh) 2015-02-28 2015-02-28 一种音频质量评测方法及***

Country Status (1)

Country Link
CN (1) CN105989853B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106792346A (zh) * 2016-11-14 2017-05-31 广东小天才科技有限公司 一种教学视频中的音频调整方法及装置
CN107221343A (zh) * 2017-05-19 2017-09-29 北京市农林科学院 一种数据质量的评估方法及评估***
CN107509153A (zh) * 2017-08-18 2017-12-22 广东欧珀移动通信有限公司 声音播放器件的检测方法、装置、存储介质及终端
CN108111908A (zh) * 2017-12-25 2018-06-01 深圳Tcl新技术有限公司 音频品质确定方法、设备及计算机可读存储介质
CN108540904A (zh) * 2018-04-24 2018-09-14 深圳市战音科技有限公司 一种改善音箱音效的方法和装置
CN109147765A (zh) * 2018-11-16 2019-01-04 安徽听见科技有限公司 音频质量综合评测方法及***
CN109903775A (zh) * 2017-12-07 2019-06-18 北京雷石天地电子技术有限公司 一种音频爆音检测方法和装置
CN109979487A (zh) * 2019-03-07 2019-07-05 百度在线网络技术(北京)有限公司 语音信号检测方法和装置
CN110033784A (zh) * 2019-04-10 2019-07-19 北京达佳互联信息技术有限公司 一种音频质量的检测方法、装置、电子设备及存储介质
CN110111811A (zh) * 2019-04-18 2019-08-09 腾讯音乐娱乐科技(深圳)有限公司 音频信号检测方法、装置和存储介质
CN110265064A (zh) * 2019-06-12 2019-09-20 腾讯音乐娱乐科技(深圳)有限公司 音频爆音检测方法、装置和存储介质
CN110931021A (zh) * 2019-10-29 2020-03-27 平安科技(深圳)有限公司 一种音频信号处理方法及装置
CN111816207A (zh) * 2020-08-31 2020-10-23 广州汽车集团股份有限公司 声音分析方法、***、汽车及存储介质
CN113052138A (zh) * 2021-04-25 2021-06-29 广海艺术科创(深圳)有限公司 一种舞蹈与运动动作的智能对比矫正的方法
CN113077821A (zh) * 2021-03-23 2021-07-06 平安科技(深圳)有限公司 音频质量检测方法、装置、电子设备及存储介质
CN113190508A (zh) * 2021-04-26 2021-07-30 重庆市规划和自然资源信息中心 一种面向管理的自然语言识别方法
CN113448514A (zh) * 2021-06-02 2021-09-28 合肥群音信息服务有限公司 一种多源语音数据的自动处理***
CN114400022A (zh) * 2022-03-25 2022-04-26 荣耀终端有限公司 音质比对的方法、设备和存储介质
CN117711435A (zh) * 2023-12-20 2024-03-15 书行科技(北京)有限公司 音频处理方法及装置、电子设备及计算机可读存储介质

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1538667A (zh) * 2003-10-24 2004-10-20 武汉大学 一种宽频带语音质量客观评价方法
CN1655230A (zh) * 2005-01-18 2005-08-17 中国电子科技集团公司第三十研究所 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法
CN101436879A (zh) * 2008-12-17 2009-05-20 北京航空航天大学 环境噪声下干扰信号幅度的提取方法
CN101859560A (zh) * 2009-04-07 2010-10-13 林文信 卡拉ok歌曲伴唱自动评分方法
CN103077727A (zh) * 2013-01-04 2013-05-01 华为技术有限公司 一种用于语音质量监测和提示的方法和装置
JP2013205831A (ja) * 2012-03-29 2013-10-07 Nippon Telegr & Teleph Corp <Ntt> 音声品質客観評価装置及び方法
EP2660814A1 (en) * 2012-05-04 2013-11-06 QNX Software Systems Limited Adaptive equalization system
CN103632679A (zh) * 2012-08-21 2014-03-12 华为技术有限公司 音频流质量评估方法及装置
CN103632682A (zh) * 2013-11-20 2014-03-12 安徽科大讯飞信息科技股份有限公司 一种音频特征检测的方法
CN103716470A (zh) * 2012-09-29 2014-04-09 华为技术有限公司 语音质量监控的方法和装置
CN103730131A (zh) * 2012-10-12 2014-04-16 华为技术有限公司 语音质量评估的方法和装置
CN103971674A (zh) * 2014-05-22 2014-08-06 天格科技(杭州)有限公司 一种评分准确、用户体验好的演唱实时评分方法
CN104050964A (zh) * 2014-06-17 2014-09-17 公安部第三研究所 音频信号还原度检测方法及***
CN104064180A (zh) * 2014-06-06 2014-09-24 百度在线网络技术(北京)有限公司 演唱评分方法及装置
CN104143341A (zh) * 2013-05-23 2014-11-12 腾讯科技(深圳)有限公司 爆音检测方法和装置
CN104246877A (zh) * 2012-04-23 2014-12-24 高通股份有限公司 用于音频信号处理的***和方法
CN104254887A (zh) * 2012-09-24 2014-12-31 希特兰布公司 用于评估卡拉ok用户的方法和***
CN104307100A (zh) * 2014-10-10 2015-01-28 深圳大学 一种提高人工耳蜗音高感知能力的方法及***
JP2015031729A (ja) * 2013-07-31 2015-02-16 ブラザー工業株式会社 情報処理装置、及びプログラム
CN104575520A (zh) * 2014-12-16 2015-04-29 中国农业大学 一种结合心理声学评价的声波监测装置及方法

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1538667A (zh) * 2003-10-24 2004-10-20 武汉大学 一种宽频带语音质量客观评价方法
CN1655230A (zh) * 2005-01-18 2005-08-17 中国电子科技集团公司第三十研究所 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法
CN101436879A (zh) * 2008-12-17 2009-05-20 北京航空航天大学 环境噪声下干扰信号幅度的提取方法
CN101859560A (zh) * 2009-04-07 2010-10-13 林文信 卡拉ok歌曲伴唱自动评分方法
JP2013205831A (ja) * 2012-03-29 2013-10-07 Nippon Telegr & Teleph Corp <Ntt> 音声品質客観評価装置及び方法
CN104246877A (zh) * 2012-04-23 2014-12-24 高通股份有限公司 用于音频信号处理的***和方法
EP2660814A1 (en) * 2012-05-04 2013-11-06 QNX Software Systems Limited Adaptive equalization system
CN103632679A (zh) * 2012-08-21 2014-03-12 华为技术有限公司 音频流质量评估方法及装置
CN104254887A (zh) * 2012-09-24 2014-12-31 希特兰布公司 用于评估卡拉ok用户的方法和***
CN103716470A (zh) * 2012-09-29 2014-04-09 华为技术有限公司 语音质量监控的方法和装置
CN103730131A (zh) * 2012-10-12 2014-04-16 华为技术有限公司 语音质量评估的方法和装置
CN103077727A (zh) * 2013-01-04 2013-05-01 华为技术有限公司 一种用于语音质量监测和提示的方法和装置
CN104143341A (zh) * 2013-05-23 2014-11-12 腾讯科技(深圳)有限公司 爆音检测方法和装置
JP2015031729A (ja) * 2013-07-31 2015-02-16 ブラザー工業株式会社 情報処理装置、及びプログラム
CN103632682A (zh) * 2013-11-20 2014-03-12 安徽科大讯飞信息科技股份有限公司 一种音频特征检测的方法
CN103971674A (zh) * 2014-05-22 2014-08-06 天格科技(杭州)有限公司 一种评分准确、用户体验好的演唱实时评分方法
CN104064180A (zh) * 2014-06-06 2014-09-24 百度在线网络技术(北京)有限公司 演唱评分方法及装置
CN104050964A (zh) * 2014-06-17 2014-09-17 公安部第三研究所 音频信号还原度检测方法及***
CN104307100A (zh) * 2014-10-10 2015-01-28 深圳大学 一种提高人工耳蜗音高感知能力的方法及***
CN104575520A (zh) * 2014-12-16 2015-04-29 中国农业大学 一种结合心理声学评价的声波监测装置及方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
刘春花: "音频信号截幅失真的监测与修复", 《声学技术》 *
曹祥: "《现代歌舞厅灯光 音响 视频设计》", 28 February 1999 *
李燕临: "《数字媒体设计与艺术》", 31 July 2012, 国防工业出版社 *
杨奎河: "《电脑常见问题和故障处理》", 31 March 2013, 金盾出版社 *
沈㠙: "《音频 工程基础》", 28 February 2002, 北京工业大学 *
王修信: "几种声学参数在艺术嗓音客观评价中的应用", 《广西物理》 *
郝春远: "语音质量客观评价***的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106792346A (zh) * 2016-11-14 2017-05-31 广东小天才科技有限公司 一种教学视频中的音频调整方法及装置
CN107221343A (zh) * 2017-05-19 2017-09-29 北京市农林科学院 一种数据质量的评估方法及评估***
CN107221343B (zh) * 2017-05-19 2020-05-19 北京市农林科学院 一种数据质量的评估方法及评估***
CN107509153B (zh) * 2017-08-18 2020-01-14 Oppo广东移动通信有限公司 声音播放器件的检测方法、装置、存储介质及终端
CN107509153A (zh) * 2017-08-18 2017-12-22 广东欧珀移动通信有限公司 声音播放器件的检测方法、装置、存储介质及终端
CN109903775A (zh) * 2017-12-07 2019-06-18 北京雷石天地电子技术有限公司 一种音频爆音检测方法和装置
CN109903775B (zh) * 2017-12-07 2020-09-25 北京雷石天地电子技术有限公司 一种音频爆音检测方法和装置
CN108111908A (zh) * 2017-12-25 2018-06-01 深圳Tcl新技术有限公司 音频品质确定方法、设备及计算机可读存储介质
CN108540904A (zh) * 2018-04-24 2018-09-14 深圳市战音科技有限公司 一种改善音箱音效的方法和装置
CN108540904B (zh) * 2018-04-24 2020-10-09 深圳市战音科技有限公司 一种改善音箱音效的方法和装置
CN109147765A (zh) * 2018-11-16 2019-01-04 安徽听见科技有限公司 音频质量综合评测方法及***
CN109979487A (zh) * 2019-03-07 2019-07-05 百度在线网络技术(北京)有限公司 语音信号检测方法和装置
CN110033784A (zh) * 2019-04-10 2019-07-19 北京达佳互联信息技术有限公司 一种音频质量的检测方法、装置、电子设备及存储介质
CN110111811A (zh) * 2019-04-18 2019-08-09 腾讯音乐娱乐科技(深圳)有限公司 音频信号检测方法、装置和存储介质
CN110111811B (zh) * 2019-04-18 2021-06-01 腾讯音乐娱乐科技(深圳)有限公司 音频信号检测方法、装置和存储介质
CN110265064A (zh) * 2019-06-12 2019-09-20 腾讯音乐娱乐科技(深圳)有限公司 音频爆音检测方法、装置和存储介质
CN110931021A (zh) * 2019-10-29 2020-03-27 平安科技(深圳)有限公司 一种音频信号处理方法及装置
WO2021082083A1 (zh) * 2019-10-29 2021-05-06 平安科技(深圳)有限公司 音频信号处理方法及装置
CN110931021B (zh) * 2019-10-29 2023-10-13 平安科技(深圳)有限公司 一种音频信号处理方法及装置
CN111816207A (zh) * 2020-08-31 2020-10-23 广州汽车集团股份有限公司 声音分析方法、***、汽车及存储介质
CN113077821A (zh) * 2021-03-23 2021-07-06 平安科技(深圳)有限公司 音频质量检测方法、装置、电子设备及存储介质
CN113052138A (zh) * 2021-04-25 2021-06-29 广海艺术科创(深圳)有限公司 一种舞蹈与运动动作的智能对比矫正的方法
CN113052138B (zh) * 2021-04-25 2024-03-15 广海艺术科创(深圳)有限公司 一种舞蹈与运动动作的智能对比矫正的方法
CN113190508A (zh) * 2021-04-26 2021-07-30 重庆市规划和自然资源信息中心 一种面向管理的自然语言识别方法
CN113190508B (zh) * 2021-04-26 2023-05-05 重庆市规划和自然资源信息中心 一种面向管理的自然语言识别方法
CN113448514A (zh) * 2021-06-02 2021-09-28 合肥群音信息服务有限公司 一种多源语音数据的自动处理***
CN113448514B (zh) * 2021-06-02 2022-03-15 合肥群音信息服务有限公司 一种多源语音数据的自动处理***
CN114400022A (zh) * 2022-03-25 2022-04-26 荣耀终端有限公司 音质比对的方法、设备和存储介质
CN114400022B (zh) * 2022-03-25 2022-08-23 北京荣耀终端有限公司 音质比对的方法、设备和存储介质
CN117711435A (zh) * 2023-12-20 2024-03-15 书行科技(北京)有限公司 音频处理方法及装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN105989853B (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
CN105989853A (zh) 一种音频质量评测方法及***
US20200118571A1 (en) Voiceprint Recognition Method, Device, Terminal Apparatus and Storage Medium
Torcoli et al. Objective measures of perceptual audio quality reviewed: An evaluation of their application domain dependence
US8972255B2 (en) Method and device for classifying background noise contained in an audio signal
JP4307557B2 (ja) 音声活性度検出器
US8886529B2 (en) Method and device for the objective evaluation of the voice quality of a speech signal taking into account the classification of the background noise contained in the signal
Cano et al. Evaluation of quality of sound source separation algorithms: Human perception vs quantitative metrics
CN105261375B (zh) 激活音检测的方法及装置
CN104424956A (zh) 激活音检测方法和装置
CA2633685A1 (en) Non-intrusive signal quality assessment
Zhang et al. Effects of telephone transmission on the performance of formant-trajectory-based forensic voice comparison–female voices
JP2007041593A (ja) 音声信号のハーモニック成分を用いた有声音/無声音分離情報を抽出する方法及び装置
CN105405448A (zh) 一种音效处理方法及装置
Tang et al. Glimpse-based metrics for predicting speech intelligibility in additive noise conditions
CN102549657A (zh) 用于确定音频***的感知质量的方法和***
CN102054480A (zh) 一种基于分数阶傅立叶变换的单声道混叠语音分离方法
CN101896965A (zh) 用于音频传输***的语音可懂度测量的方法和***
CN101452698A (zh) 一种自动嗓音谐噪比分析方法
CN103050128B (zh) 基于抖动失真的语音频客观质量评价方法及***
Taktakishvili et al. Objective Assessment of the Quality of Transmission and Informativeness of a Speech Signal According to Statistical Parameters
US20090161882A1 (en) Method of Measuring an Audio Signal Perceived Quality Degraded by a Noise Presence
CN113593604A (zh) 检测音频质量方法、装置及存储介质
CN111816208A (zh) 一种语音分离质量评估方法、装置及计算机存储介质
US20070272022A1 (en) Method of Objectively Determining Subjective Properties of a Binaural Sound Signal
CN102231279A (zh) 基于听觉关注度的音频质量客观评价***及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Yang Jiang

Inventor after: Zhang Jidong

Inventor after: Wu Weihao

Inventor before: Yang Jiang

Inventor before: Yang Bu

Inventor before: Wu Weihao

GR01 Patent grant
GR01 Patent grant