CN103578479A - 基于听觉掩蔽效应的语音可懂度测量方法 - Google Patents

基于听觉掩蔽效应的语音可懂度测量方法 Download PDF

Info

Publication number
CN103578479A
CN103578479A CN201310430429.XA CN201310430429A CN103578479A CN 103578479 A CN103578479 A CN 103578479A CN 201310430429 A CN201310430429 A CN 201310430429A CN 103578479 A CN103578479 A CN 103578479A
Authority
CN
China
Prior art keywords
signal
perception
intelligibility
component
output signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310430429.XA
Other languages
English (en)
Other versions
CN103578479B (zh
Inventor
储飞黄
孙战先
李昂
路后兵
吴微露
瞿洋
南旭东
许士敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ELECTRONIC ENGINEERING COLLEGE PLA
Original Assignee
ELECTRONIC ENGINEERING COLLEGE PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ELECTRONIC ENGINEERING COLLEGE PLA filed Critical ELECTRONIC ENGINEERING COLLEGE PLA
Priority to CN201310430429.XA priority Critical patent/CN103578479B/zh
Publication of CN103578479A publication Critical patent/CN103578479A/zh
Application granted granted Critical
Publication of CN103578479B publication Critical patent/CN103578479B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明公开了一种基于听觉掩蔽效应的语音可懂度测量方法,其特征是:通过对参考信号及其通过通信或语音传输***后的输出信号进行分帧,并以帧为基本单元,根据ISO/IEC11172-3标准中的心理声学模型,分别估计参考与输出信号的听觉掩蔽门限;根据听觉掩蔽门限提取参考与输出信号中的可听分量;根据ISO226-2003标准等响度级曲线,分别将参考信号可听分量、输出信号可听分量的幅度转换为响度,计算每帧信号的感知相似度、语音信息保真度和感知信噪比,进而得到输出信号失真度;根据失真度与可懂度关系曲线,对输出信号进行可懂度预测。与目前常用语音可懂度客观测量方法相比,本发明方法测量精度更高。

Description

基于听觉掩蔽效应的语音可懂度测量方法
技术领域
本发明涉及一种基于输入/输出的语音可懂度客观测量方法,特别是一种基于听觉掩蔽效应的语音可懂度测量方法。
背景技术
可懂度是语音信号的重要品质因数,广泛应用于厅堂设计、医学研究(如助听器、人工耳蜗、听觉障碍等)、语音增强、扩声***和通信***性能测试等领域。
根据评价主体不同,可懂度测量有主客观之分。主观可懂度测量通过听音人直接对语音信号进行主观评价,是可懂度评价最基本、最常用的手段。但是,由于组织严格的听力测试需要耗费大量的人力和物力,测试结果易受主观因素的影响,难以实时应用。客观可懂度测量用机器代替人依据客观参数进行评价,具有应用灵活、不受条件限制和主观因素影响、不同时间和不同场合的测试结果可比较等特点。
根据是否需要***输入作为参照,可懂度客观测量方法也可分为基于输入/输出的测量方法和基于输出的测量法,前者以纯净语音作参考计算失真语音的失真度,并以失真度作为可懂度预测的依据,与主观可懂度相关度高,是条件许可(能提供参考信号)情况下的首选方法。
语音可懂度指数法(Speech Intelligibility Index,SII)和语言传递指数法(SpeechTransmission Index,STI)是目前最常用的语音可懂度客观测量方法。SII的实质是一种频带加权信噪比方法,没有考虑人耳的听觉特性,仅适用于一些简单的线性失真信号,应用范围有限;STI以人工合成信号为激励,虽能适应非线性失真信号,但其实质是***性能测试,且计算量大。就总体而言,SII和STI的测量精度都不是很高。
发明内容
本发明的目的在于提供一种基于听觉掩蔽效应的语音可懂度测量方法,通过充分考虑人耳对声音大小、频率的感知特性,使输出信号失真度参数能更好地反映人耳感知失真度,从而获得更高的可懂度测量精度。
本发明为解决技术问题采用如下技术方案:
本发明基于听觉掩蔽效应的语音可懂度测量方法的特点是按如下步骤进行:
步骤一:分别对参考信号及所述参考信号通过通信或语音传输***后的输出信号进行分帧,帧长取值为25ms~64ms,每帧前后各重叠1/8~1/3帧长;
步骤二:以帧为基本分析单元,根据ISO/IEC11172-3标准中的心理声学模型,分别估计参考信号与输出信号的听觉掩蔽门限,将能量大于听觉掩蔽门限的功率谱分量定义为信号可听分量,检查输出信号可听分量的各频率成份,如果对应参考信号的相应频率成份是参考信号可听分量,则定义为输出有效语音信息分量,否则定义为输出无效语音信息分量;
步骤三:根据ISO226-2003标准等响度级曲线,分别将参考信号可听分量、包括输出有效语音信息分量和输出无效语音信息分量的输出信号可听分量的幅度转换为响度;
步骤四:根据参考信号可听分量、输出信号可听分量和输出有效语音信息分量的响度,计算每帧输出信号的感知相似度、语音信息保真度和感知信噪比;根据输出每帧信号的感知相似度、语音信息保真度和感知信噪比计算输出信号失真度;
步骤五:根据输出信号失真度与可懂度的关系曲线,进行可懂度预测。
本发明基于听觉掩蔽效应的语音可懂度测量方法的特点也在于:
所述步骤四中,感知相似度定义为参考信号可听分量与输出信号可听分量之间的皮尔逊相关系数;语音信息保真度定义为参考信号的可听分量与输出有效语音信息分量之间的皮尔逊相关系数;感知信噪比定义为输出有效语音信息分量响度之和与输出无效语言信息分量响度之和的比值。
所述步骤四中输出信号失真度按如下步骤计算获得:
a、分别对感知相似度、语音信息保真度和感知信噪比的参数取值范围进行约束,并归一化到[0,1]区间;所述参数取值范围约束的方法是:分别对感知相似度、语音信息保真度和感知信噪比设置高门限和低门限,当参数值大于高门限时取值为高门限,当参数值小于低门限时取值为低门限,否则保持参数值大小不变;
b、根据加权系数计算输出信号感知相似度、语音信息保真度和感知信噪比的加权和,并将常数1.0与所述加权和的差值定义为局部失真度;
c、计算输出信号所有局部失真度的均值,并将所述均值定义为输出信号失真度。
所述步骤a中,高门限的获取方法为:任意选取不少于20个主观可懂度介于0.99和1之间的输出信号作为高门限训练样本,计算所有高门限训练样本的感知相似度均值、语音信息保真度均值、感知信噪比均值,分别作为感知相似度的高门限、语音信息保真度的高门限和感知信噪比的高门限;低门限的获取方法为:任意选取不少于20个主观可懂度介于0和0.01之间的输出信号作为低门限训练样本,计算所有低门限训练样本的感知相似度均值、语音信息保真度均值、感知信噪比均值,分别作为感知相似度的低门限、语音信息保真度的低门限和感知信噪比的低门限。
所述步骤b的加权系数的获取方法为:选取不少于40个主观可懂度在[0,1]区间均匀分布的输出信号作为加权系数训练样本,计算每个加权系数训练样本的感知相似度均值、语音信息保真度均值和感知信噪比均值;对每个加权系数训练样本进行主观可懂度测试,并分别计算感知相似度均值、语音信息保真度均值和感知信噪比均值与主观可懂度之间的皮尔逊相关系数,分别记为ra、rb和rc;分别将ra、rb、rc与ra+rb+rc的比值作为感知相似度、语音信息保真度和感知信噪比的加权系数。
本发明基于听觉掩蔽效应的语音可懂度测量方法的特点还在于:所述步骤五中失真度与可懂度关系曲线的获取方法为:选取不少于40个主观可懂度在[0,1]区间均匀分布的输出信号作为关系曲线训练样本,在按照权利要求1中步骤一至步骤四计算输出信号失真度的同时,对输出信号进行主观可懂度测试,得到一一对应的失真度与主观可懂度数据,采用最小二乘法进行多项式拟合,得出失真度与可懂度的关系曲线。
与已有技术相比,本发明有益效果体现在:
本发明方法基于人耳听觉掩蔽效应进行可懂度测量,在计算输出信号失真度时,主要分析人耳可感知信号分量的失真情况,通过将信号的物理特性(声压级)转换为人耳的主观感知特性(响度),充分考虑人耳对声音大小、频率的感知特性,使输出信号失真度参数能更好地反映人耳感知失真度。因此,与语音可懂度指数法和语言传递指数法相比,本发明方法与主观可懂度测量的相关度更高,即测量精度更高。
附图说明
图1为本发明方法原理框图。
图2为为说明本发明方法的某帧参考信号举例。
图3为图2所示波形受噪声污染后的输出信号波形。
图4为图2所示参考信号的功率谱及听觉掩蔽门限。
图5为图3所示输出信号的功率谱及听觉掩蔽门限。
图6为图2所示参考信号帧的可听分量。
图7为图3所示输出有效语音信息分量。
图8为图3所示输出信号帧的可听分量。
图9为采用本发明方法获得的失真度与主观可懂度关系曲线的举例。
具体实施方式
参见图1,本实施例中基于听觉掩蔽效应的语音可懂度客观测量方法流程为:
步骤一:分别对参考信号x(n)及参考信号通过通信或语音传输***后的输出信号y(n)进行分帧,帧长取值范围为25ms~64ms,每帧前后各重叠1/8~1/3帧长,并将第m帧参考信号与输出信号分别表示为xm(n)和ym(n)。图2所示信号波形是为说明本发明方法而列举的参考信号实例xm(n),图3为图2所示信号通过通信或语音传输***后的输出信号帧ym(n)。
步骤二:以帧为基本分析单元,分别对每一帧参考信号和输出信号进行短时功率谱估计(幅度用声压级表示),将第m帧参考信号与输出信号的功率谱分别记为Xm(k)和Ym(k);根据ISO/IEC11172-3标准中的心理声学模型,分别对第m帧参考信号和输出信号进行听觉掩蔽门限估计,将听觉掩蔽门限分别记为TXm(k)和TYm(k);将参考信号中能量大于听觉掩蔽门限TXm(k)的功率谱分量定义为参考信号可听分量X'm(k),将输出信号中能量大于听觉掩蔽门限TYm(k)的功率谱分量定义为输出信号可听分量Y'm(k);进一步检查输出信号可听分量的各频率成份,如果对应参考信号的相应频率成份是参考信号可听分量,则定义为输出有效语音信息分量Y''m(k),否则定义为输出无效语音信息分量。参考信号可听分量X'm(k)、输出信号可听分量Y'm(k)以及输出有效语音信息分量Y''m(k)可由式(1)、(2)和(3)获得:
X m ′ ( k ) = X m ( k ) , X m ( k ) > TX m ( k ) 0 , else - - - ( 1 )
Y m ′ ( k ) = Y m ( k ) , Y m ( k ) > TY m ( k ) 0 , else - - - ( 1 )
Y m ′ ′ ( k ) = Y m ′ ( k ) , X m ( k ) > TX m ( k ) 0 , else - - - ( 3 )
图4为图2所示参考信号帧xm(n)的功率谱Xm(k)及听觉掩蔽门限TXm(k),图5为图3所示输出信号帧ym(n)的功率谱Ym(k)及听觉掩蔽门限TYm(k),图6为图2所示参考信号帧xm(n)的可听分量X'm(k),图7为图3所示输出有效语音信息分量Y''m(k),图8为图3所示输出信号帧的可听分量Y'm(k)。
步骤三:根据ISO226-2003标准等响度级曲线,将参考信号可听分量X'm(k)、输出信号可听分量Y'm(k)(包括输出有效语音信息分量和输出无效语音信息分量)、输出有效语音信息分量Y''m(k)的幅度转换为响度,分别记为LX'm(k)、LY'm(k)和LY''m(k)。
步骤四:根据参考信号可听分量、输出信号可听分量和输出有效语音信息分量的响度,计算每帧输出信号的感知相似度rps(m)、语音信息保真度rpf(m)和感知信噪比SNRp(m);基于rps(m)、rpf(m)和SNRp(m)计算输出信号的帧失真度dxy(m),并将输出信号帧失真度的算术平均值定义为输出信号的失真度Dxy
步骤五:根据输出信号失真度与可懂度的关系曲线SI(Dxy),进行可懂度预测。
本实施例的步骤四中,感知相似度rps(m)定义为参考信号可听分量与输出信号可听分量的皮尔逊相关系数,用公式(4)表示为:
r ps ( m ) = Σ k ( LY ′ m ( k ) - LY ′ m ( k ) ‾ ) ( LX ′ m ( k ) - LX ′ m ( k ) ‾ ) Σ k ( LX ′ m ( k ) - LX ′ m ( k ) ) 2 Σ k ( LY ′ m ( k ) - LY ′ m ( k ) ‾ ) 2 - - - ( 4 )
语音信息保真度rpf(m)定义为参考信号可听分量与输出有效语音信息分量的皮尔逊相关系数,用公式(5)表示为:
r ps ( m ) = Σ k ( LY ′ ′ m ( k ) - LY ′ ′ m ( k ) ‾ ) ( LX ′ m ( k ) - LX ′ m ( k ) ‾ ) Σ k ( LX ′ m ( k ) - LX ′ m ( k ) ) 2 Σ k ( LY ′ ′ m ( k ) - LY ′ ′ m ( k ) ‾ ) 2 - - - ( 4 )
感知信噪比SNRp(m)定义为输出有效信息分量响度之和与输出无效信息分量响度之和的比值。其中,输出无效信息分量响度之和可用输出可听分量响度之和与输出有效信息分量响度之和的差值表示,用公式(6)表示为:
SNP p ( m ) = 10 log 10 Σ k LY m ′ ′ ( k ) Σ k LY ′ m ( k ) - Σ k LY m ′ ′ ( k ) - - - ( 6 )
本实施例的步骤四中输出信号失真度的计算方法为:首选,分别对感知相似度rps(m)、语音信息保真度rpf(m)和感知信噪比SNRp(m)进行参数取值范围约束和归一化处理,得到归一化到[0,1]区间的归一化感知相似度rps'(m)、归一化语音信息保真度rpf'(m)和归一化感知信噪比SNRp'(m);所述参数取值范围约束的方法是:分别对感知相似度、语音信息保真度和感知信噪比设置高门限和低门限,当参数值大于高门限时取值为高门限,当参数值小于低门限时取值为低门限,否则保持参数值大小不变;参数范围约束及归一化公式可用式(7)、(8)、(9)表示为:
r ps ′ ( m ) = min { max ( r ps ( m ) , RL ps ) , RH ps } - RL ps RH ps - RL ps - - - ( 7 )
r pf ′ ( m ) = min { max ( r pf ( m ) , RL pf ) , RH pf } - RL pf RH pf - RL pf - - - ( 8 )
SNr p ′ ( m ) = min { max ( SNR p ( m ) , SNRL p ) , SNRH p } - SNRL p SNRH p - SNRL p - - - ( 9 )
其中,max为取大值函数,min为取小值函数,RHps、RLps为感知相似度的高、低门限,RHpf、RLpf为语音信息保真度的高、低门限,SNRHp、SNRLp为感知信噪比的高、低门限,所述门限通过算法训练得到。
然后,计算输出信号感知相似度、语音信息保真度和感知信噪比的加权和,并将常数1.0与所述加权和的差值定义为局部失真度,第m帧信号的局部失真度dxy(m)可用公式(10)表示为:
d xy ( m ) = 1.0 - { w 1 r ps ′ ( m ) + w 2 r pf ′ ( m ) + w 3 SNR p ′ ( m ) } - - - ( 10 )
其中,w1、w2和w3为加权系数,通过算法训练得到。
最后,将所有帧的局部失真度的算术平均值定义为输出信号的失真度Dxy,用公式(11)表示为:
D xy = 1 M Σ m = 1 M d m ( x , y ) - - - ( 11 )
其中,M表示总帧数。
本实施例中参数范围约束的高、低门限通过算法训练得到,具体获取方法分别为:高门限的获取方法为:任意选取不少于20个主观可懂度介于0.99和1之间的输出信号作为高门限训练样本,计算所有高门限训练样本的感知相似度均值、语音信息保真度均值、感知信噪比均值,分别作为感知相似度的高门限、语音信息保真度的高门限、感知信噪比的高门限;低门限的获取方法为:任意选取不少于20个主观可懂度介于0和0.01之间的输出信号作为低门限训练样本,计算所有低门限训练样本的感知相似度均值、语音信息保真度均值、感知信噪比均值,分别作为感知相似度的低门限、语音信息保真度的低门限、感知信噪比的低门限。
本实施例中计算局部失真度的加权系数的获取方法为:选取不少于40个主观可懂度在[0,1]区间均匀分布的输出信号作为加权系数训练样本,计算每个加权系数训练样本的感知相似度均值、语音信息保真度均值和感知信噪比均值,同时对每个加权系数训练样本进行主观可懂度测试;然后,分别计算感知相似度均值、语音信息保真度均值和感知信噪比均值与主观可懂度之间的皮尔逊相关系数,分别记为ra、rb和rc;最后,分别将ra、rb和rc与ra+rb+rc的比值作为感知相似度的加权系数w1、语音信息保真度的加权系数w2和感知信噪比的加权系数w3
本实施例中步骤五中失真度与可懂度关系曲线的获取方法为:选取不少于40个主观可懂度在[0,1]区间均匀分布的输出信号作为关系曲线训练样本,在按照步骤一至步骤四所述方法计算输出信号失真度的同时,对输出信号进行主观可懂度测试,得到一一对应的失真度与主观可懂度数据,然后用最小二乘法进行多项式拟合,得出失真度与可懂度的关系曲线SI(Dxy)。图9为采用本发明方法获得的失真度与主观可懂度关系曲线的举例。

Claims (6)

1.一种基于听觉掩蔽效应的语音可懂度测量方法,其特征是按如下步骤进行:
步骤一:分别对参考信号及所述参考信号通过通信或语音传输***后的输出信号进行分帧,帧长取值为25ms~64ms,每帧前后各重叠1/8~1/3帧长;
步骤二:以帧为基本分析单元,根据ISO/IEC11172-3标准中的心理声学模型,分别估计参考信号与输出信号的听觉掩蔽门限,将能量大于听觉掩蔽门限的功率谱分量定义为信号可听分量,检查输出信号可听分量的各频率成份,如果对应参考信号的相应频率成份是参考信号可听分量,则定义为输出有效语音信息分量,否则定义为输出无效语音信息分量;
步骤三:根据ISO226-2003标准等响度级曲线,分别将参考信号可听分量、包括输出有效语音信息分量和输出无效语音信息分量的输出信号可听分量的幅度转换为响度;
步骤四:根据参考信号可听分量、输出信号可听分量和输出有效语音信息分量的响度,计算每帧输出信号的感知相似度、语音信息保真度和感知信噪比;根据输出每帧信号的感知相似度、语音信息保真度和感知信噪比计算输出信号失真度;
步骤五:根据输出信号失真度与可懂度的关系曲线,进行可懂度预测。
2.根据权利要求1所述的基于听觉掩蔽效应的语音可懂度测量方法,其特征是:所述步骤四中,感知相似度定义为参考信号可听分量与输出信号可听分量之间的皮尔逊相关系数;语音信息保真度定义为参考信号的可听分量与输出有效语音信息分量之间的皮尔逊相关系数;感知信噪比定义为输出有效语音信息分量响度之和与输出无效语言信息分量响度之和的比值。
3.根据权利要求1所述的基于听觉掩蔽效应的语音可懂度测量方法,其特征是:所述步骤四中输出信号失真度按如下步骤计算获得:
a、分别对感知相似度、语音信息保真度和感知信噪比的参数取值范围进行约束,并归一化到[0,1]区间;所述参数取值范围约束的方法是:分别对感知相似度、语音信息保真度和感知信噪比设置高门限和低门限,当参数值大于高门限时取值为高门限,当参数值小于低门限时取值为低门限,否则保持参数值大小不变;
b、根据加权系数计算输出信号感知相似度、语音信息保真度和感知信噪比的加权和,并将常数1.0与所述加权和的差值定义为局部失真度;
c、计算输出信号所有局部失真度的均值,并将所述均值定义为输出信号失真度。
4.根据权利要求3所述的基于听觉掩蔽效应的语音可懂度测量方法,其特征是:所述步骤a中,高门限的获取方法为:任意选取不少于20个主观可懂度介于0.99和1之间的输出信号作为高门限训练样本,计算所有高门限训练样本的感知相似度均值、语音信息保真度均值、感知信噪比均值,分别作为感知相似度的高门限、语音信息保真度的高门限和感知信噪比的高门限;低门限的获取方法为:任意选取不少于20个主观可懂度介于0和0.01之间的输出信号作为低门限训练样本,计算所有低门限训练样本的感知相似度均值、语音信息保真度均值、感知信噪比均值,分别作为感知相似度的低门限、语音信息保真度的低门限和感知信噪比的低门限。
5.根据权利要求3所述的基于听觉掩蔽效应的语音可懂度测量方法,其特征在于:所述步骤b的加权系数的获取方法为:选取不少于40个主观可懂度在[0,1]区间均匀分布的输出信号作为加权系数训练样本,计算每个加权系数训练样本的感知相似度均值、语音信息保真度均值和感知信噪比均值;对每个加权系数训练样本进行主观可懂度测试,并分别计算感知相似度均值、语音信息保真度均值和感知信噪比均值与主观可懂度之间的皮尔逊相关系数,分别记为ra、rb和rc;分别将ra、rb、rc与ra+rb+rc的比值作为感知相似度、语音信息保真度和感知信噪比的加权系数。
6.根据权利要求1所述的基于听觉掩蔽效应的语音可懂度测量方法,其特征在于:所述步骤五中失真度与可懂度关系曲线的获取方法为:选取不少于40个主观可懂度在[0,1]区间均匀分布的输出信号作为关系曲线训练样本,在按照权利要求1中步骤一至步骤四计算输出信号失真度的同时,对输出信号进行主观可懂度测试,得到一一对应的失真度与主观可懂度数据,采用最小二乘法进行多项式拟合,得出失真度与可懂度的关系曲线。
CN201310430429.XA 2013-09-18 2013-09-18 基于听觉掩蔽效应的语音可懂度测量方法 Expired - Fee Related CN103578479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310430429.XA CN103578479B (zh) 2013-09-18 2013-09-18 基于听觉掩蔽效应的语音可懂度测量方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310430429.XA CN103578479B (zh) 2013-09-18 2013-09-18 基于听觉掩蔽效应的语音可懂度测量方法

Publications (2)

Publication Number Publication Date
CN103578479A true CN103578479A (zh) 2014-02-12
CN103578479B CN103578479B (zh) 2016-05-25

Family

ID=50050132

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310430429.XA Expired - Fee Related CN103578479B (zh) 2013-09-18 2013-09-18 基于听觉掩蔽效应的语音可懂度测量方法

Country Status (1)

Country Link
CN (1) CN103578479B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105139860A (zh) * 2014-06-05 2015-12-09 宝马股份公司 通信设备及其运行方法
CN105280195A (zh) * 2015-11-04 2016-01-27 腾讯科技(深圳)有限公司 语音信号的处理方法及装置
CN105869656A (zh) * 2016-06-01 2016-08-17 南方科技大学 一种语音信号清晰度的确定方法及装置
CN106504771A (zh) * 2016-11-17 2017-03-15 中国传媒大学 一种适用于噪声环境的汉语语音清晰度评测算法
CN111179957A (zh) * 2020-01-07 2020-05-19 腾讯科技(深圳)有限公司 一种语音通话的处理方法以及相关装置
CN111370017A (zh) * 2020-03-18 2020-07-03 苏宁云计算有限公司 一种语音增强方法、装置、***
CN113450780A (zh) * 2021-06-16 2021-09-28 武汉大学 一种听觉感知响度空间Lombard效应分类方法
US11615801B1 (en) * 2019-09-20 2023-03-28 Apple Inc. System and method of enhancing intelligibility of audio playback

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1315032A (zh) * 1998-06-26 2001-09-26 阿斯科姆股份公司 用于执行音频信号的传输质量的机器支持的评估的方法
CN1655230A (zh) * 2005-01-18 2005-08-17 中国电子科技集团公司第三十研究所 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法
EP2595145A1 (en) * 2011-11-17 2013-05-22 Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating intelligibility of a degraded speech signal
CN103151049A (zh) * 2013-01-29 2013-06-12 武汉大学 一种面向移动音频的服务质量保障方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1315032A (zh) * 1998-06-26 2001-09-26 阿斯科姆股份公司 用于执行音频信号的传输质量的机器支持的评估的方法
CN1655230A (zh) * 2005-01-18 2005-08-17 中国电子科技集团公司第三十研究所 客观音质评价中基于噪声掩蔽门限算法的巴克谱失真测度方法
EP2595145A1 (en) * 2011-11-17 2013-05-22 Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating intelligibility of a degraded speech signal
CN103151049A (zh) * 2013-01-29 2013-06-12 武汉大学 一种面向移动音频的服务质量保障方法及***

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105139860B (zh) * 2014-06-05 2020-12-01 宝马股份公司 通信设备及其运行方法
CN105139860A (zh) * 2014-06-05 2015-12-09 宝马股份公司 通信设备及其运行方法
CN105280195A (zh) * 2015-11-04 2016-01-27 腾讯科技(深圳)有限公司 语音信号的处理方法及装置
CN105280195B (zh) * 2015-11-04 2018-12-28 腾讯科技(深圳)有限公司 语音信号的处理方法及装置
US10586551B2 (en) 2015-11-04 2020-03-10 Tencent Technology (Shenzhen) Company Limited Speech signal processing method and apparatus
US10924614B2 (en) 2015-11-04 2021-02-16 Tencent Technology (Shenzhen) Company Limited Speech signal processing method and apparatus
CN105869656A (zh) * 2016-06-01 2016-08-17 南方科技大学 一种语音信号清晰度的确定方法及装置
CN106504771A (zh) * 2016-11-17 2017-03-15 中国传媒大学 一种适用于噪声环境的汉语语音清晰度评测算法
US11615801B1 (en) * 2019-09-20 2023-03-28 Apple Inc. System and method of enhancing intelligibility of audio playback
CN111179957A (zh) * 2020-01-07 2020-05-19 腾讯科技(深圳)有限公司 一种语音通话的处理方法以及相关装置
CN111179957B (zh) * 2020-01-07 2023-05-12 腾讯科技(深圳)有限公司 一种语音通话的处理方法以及相关装置
CN111370017A (zh) * 2020-03-18 2020-07-03 苏宁云计算有限公司 一种语音增强方法、装置、***
CN111370017B (zh) * 2020-03-18 2023-04-14 苏宁云计算有限公司 一种语音增强方法、装置、***
CN113450780A (zh) * 2021-06-16 2021-09-28 武汉大学 一种听觉感知响度空间Lombard效应分类方法
CN113450780B (zh) * 2021-06-16 2023-02-24 武汉大学 一种听觉感知响度空间Lombard效应分类方法

Also Published As

Publication number Publication date
CN103578479B (zh) 2016-05-25

Similar Documents

Publication Publication Date Title
CN103578479B (zh) 基于听觉掩蔽效应的语音可懂度测量方法
CN102881289B (zh) 一种基于听觉感知特性的语音质量客观评价方法
CN103546853A (zh) 一种基于短时傅里叶变换的扬声器异常音检测方法
WO2017092216A1 (zh) 一种语音质量评估方法、装置及设备
EP2352145B1 (en) Transient speech signal encoding method and device, decoding method and device, processing system and computer-readable storage medium
CN103531204B (zh) 语音增强方法
TW445724B (en) Method for making a machine-aided assessment of the transmission quality of audio signals
EP1750251A2 (en) Method and apparatus for extracting voiced/unvoiced classification information using harmonic component of voice signal
CN105044478B (zh) 一种输电线路可听噪声的多通道信号提取方法
CN102144258B (zh) 促进确定信号边界频率的方法和装置
CN103440869A (zh) 一种音频混响的抑制装置及其抑制方法
ATE458528T1 (de) System und verfahren für die geräuschmessung einer implantierbaren kardialen vorrichtung
CN104424956A (zh) 激活音检测方法和装置
CN103093759A (zh) 一种基于移动终端的嗓音检测评估装置及方法
Schwerin et al. An improved speech transmission index for intelligibility prediction
Falk et al. A non-intrusive quality measure of dereverberated speech
EP1611571B1 (en) Method and system for speech quality prediction of an audio transmission system
CN104269180A (zh) 一种用于语音质量客观评价的准干净语音构造方法
CN103632682A (zh) 一种音频特征检测的方法
CN104102803A (zh) 一种车辆噪声声品质的粗糙度信息处理方法
CN107170468A (zh) 一种基于两层模型的多声道音频质量评价方法
CN102314883B (zh) 一种判断音乐噪声的方法以及语音消噪方法
CN101313849A (zh) 耳声发射听力检测仪
Gomez et al. Improving objective intelligibility prediction by combining correlation and coherence based methods with a measure based on the negative distortion ratio
Wu et al. A pitch-based method for the estimation of short reverberation time

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160525

Termination date: 20190918