CN107093432B

CN107093432B - 一种用于通信的语音质量评价

Info

Publication number: CN107093432B
Application number: CN201710359666.XA
Authority: CN
Inventors: 不公告发明人
Original assignee: Jiangsu Baiying Information Technology Co Ltd
Current assignee: Jiangsu Baiying Information Technology Co Ltd
Priority date: 2017-05-19
Filing date: 2017-05-19
Publication date: 2019-12-13
Anticipated expiration: 2037-05-19
Also published as: CN107093432A

Abstract

本发明提供了一种用于通信***的语音质量评价***，包括主观评估模块、客观评估模块和性能评价模块，所述主观评估模块对失真语音质量进行主观评估，获取主观评估得分，所述客观评估模块对失真语音质量进行客观评估，获取客观评估得分，所述性能评价模块对所述主观评估模块和客观评估模块的性能进行评价。本发明的有益效果为：实现了通信***中语音质量的准确评价。

Description

一种用于通信***的语音质量评价***

技术领域

本发明涉及语音质量评估技术领域，具体涉及一种用于通信***的语音质量评价***。

背景技术

随着通信技术的飞速发展，现代通信***提供了广泛的语音服务，语音通信已经成为生活中不可或缺的交流方式。评判语音通信***性能优劣的指标是多方面的，其中最重要的一个标志是***输出语音的质量。由于语音质量直接地影响着用户的体验，如何准确有效的评价语音质量就显得尤为重要。

发明内容

针对上述问题，本发明旨在提供一种用于通信***的语音质量评价***。

本发明的目的采用以下技术方案来实现：

提供了一种用于通信***的语音质量评价***，包括主观评估模块、客观评估模块和性能评价模块，所述主观评估模块对失真语音质量进行主观评估，获取主观评估得分，所述客观评估模块对失真语音质量进行客观评估，获取客观评估得分，所述性能评价模块对所述主观评估模块和客观评估模块的性能进行评价。

本发明的有益效果为：实现了通信***中语音质量的准确评价。

附图说明

利用附图对本发明作进一步说明，但附图中的实施例不构成对本发明的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。

图1是本发明的结构示意图；

附图标记：

主观评估模块1、客观评估模块2、性能评价模块3。

具体实施方式

结合以下实施例对本发明作进一步描述。

参见图1，本实施例的一种用于通信***的语音质量评价***，包括主观评估模块1、客观评估模块2和性能评价模块3，所述主观评估模块1对失真语音质量进行主观评估，获取主观评估得分，所述客观评估模块2对失真语音质量进行客观评估，获取客观评估得分，所述性能评价模块3对所述主观评估模块1和客观评估模块2的性能进行评价。

本实施例实现了通信***中语音质量的准确评价。

优选的，所述对失真语音质量进行主观评估，采用以下方式进行：

a、将测试人员分为两组，两组测试人员人数相同；

b、其中一组测试人员直接听取经过通信***后的失真语音，不同测试人员给出失真语音的绝对分值，绝对分值采用五分制，分值越高，语音质量越好，计算组内绝对分值的平均值a₁；另一组测试人员首先听取一遍原始语音，然后听取失真语音，不同测试人员给出失真语音相对原始语音的参考分值，参考分值采用五分制，分值越高，失真语音相对原始语音的失真越小，计算组内参考分值的平均值a₂；

c、计算主观评估得分：式中，δ₁和δ₂分别表示权重，

本优选实施例主观评估模块采用多人进行测试取平均值，克服了主观评价受个人影响大的缺陷，得到了可信度高的主观评估得分，将测试人员分为两组对语音质量进行评价，同时获取了待评价的绝对分值和参考分值，克服了从单一角度进行主观评价的缺陷，主观评估得分更为全面。

优选的，所述客观评估模块2对失真语音质量进行客观评估，包括第一客观评估子模块、第二客观评估子模块和客观评估得分获取子模块，所述第一客观评估子模块用于计算失真语音质量的第一客观评估因子，所述第二客观评估子模块用于计算失真语音质量的第二客观评估因子，所述客观评估因子获取子模块用于计算失真语音质量的客观评估得分。

所述计算失真语音质量的第一客观评估因子，采用以下方式进行：

a、将原始语音信号Y(t)和失真语音信号S(t)的电平调整到统一的增益上，对原始语音信号和失真语音信号进行FFT变换，然后进行滤波，原始语音信号和失真语音信号经过滤波处理后，输出原始语音信号和失真语音信号为Y(n)和S(n)；

b、对信号Y(n)和S(n)进行加窗处理，再对其进行短时傅里叶变换，在变换的过程中，使相邻的帧之间有30％的重叠，计算原始语音信号和失真语音信号的每帧的频域功率谱密度Y(f)_n和S(f)_n，其中，n表示帧序号，将赫兹尺度功率谱密度变换到相应Bark尺度上的功率谱密度BY(j)_n和BS(j)_n；

对失真语音信号的功率谱密度进行补偿，具体为：

式中，BS(j)_n表示补偿前的失真语音信号的功率谱密度，BS(j)_n′表示补偿后的失真语音信号的功率谱密度，PBS(j)表示失真语音信号的平均Bark谱，PBY(j)表示原始语音信号的平均Bark谱,XBS(j)表示失真语音信号超过听觉阈值部分的Bark谱密度和，XBY(j)表示原始语音信号超过听觉阈值部分的Bark谱密度和；

c、根据Bark功率谱密度采用兹维克尔定律计算原始语音信号和失真语音信号的响度密度XY(f)_n和XS(f)_n；

d、计算第一客观评估因子：式中，N表示信号的帧数。

所述计算失真语音质量的第二客观评估因子，采用以下方式进行：

a、失真语音质量包含多个主要影响因素，失真语音质量的主要影响因素集表示为

H{H₁，…，H_n}，其中，n表示主要影响因素数目，每个主要影响因素包含多个主要影响参数，主要影响因素H_k对应的主要影响参数集表示为G_k＝{G_k1,…,G_kj}，其中，k∈[1,n]，j表示主要影响因素H_k包含的主要影响参数的数目，其中，主要影响参数均为正向参数，值越大表明失真语音质量越好；

b、通过测量获取失真语音质量的主要影响参数值，对主要影响参数值采用以下方式处理，得到处理后的主要影响参数值：

式中，W_max和W_min分别表示主要影响参数值的上限制和下限值，W表示处理前的主要影响参数值，W′表示处理后的主要影响参数值；

c、计算第二客观评估因子：

式中，W′_kl表示处理后的第k个主要影响因素的第l个主要影响参数值，β_l为主要影响参数值对应的权重，γ_k为主要影响因素对应的权重，将E归一化到[0,5，得到E′；

计算失真语音质量的客观评估得分C：C＝0.5D+E′)。

本优选实施例客观评估模块通过第一客观评估因子和第二客观评估因子结合的方式确定客观评估得分，对环境噪声有很好的鲁棒性，具体的，将赫兹尺度功率谱密度变换到相应Bark尺度上的功率谱密度，更符合人类的听觉特性，采用对失真语音信号进行补偿，得到了更为准确的失真信号功率谱密度，对语音信号的所有帧进行评价，获取了更为准确的第一客观评估因子，考虑多影响因素，获取了更为准确的第二客观评估因子，在实际应用计算中。

优选的，所述性能评价模块3对主观评估模块1和客观评估模块2的性能进行评价，获取综合评价值Z：

式中，M表示待评价失真语音的数量，A_i表示第i个失真语音的主观评估得分，C_i表示第i个失真语音的客观评估得分，综合评价值越小，表明主观评估模块和客观评估模块对失真语音质量评估越准确。

本优选实施例对主观评估模块和客观评估模块的性能进行评价，有助于对主观评估模块和客观评估模块不断进行改进，获取更为准确的语音质量评价结果。

采用本发明用于通信***的语音质量评价***对失真语音质量进行评估，当和取不同值时，对评估准确性和评估时间进行统计，同未采用本发明相比，产生的有益效果如下表所示：

最后应当说明的是，以上实施例仅用以说明本发明的技术方案，而非对本发明保护范围的限制，尽管参照较佳实施例对本发明作了详细地说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的实质和范围。

Claims

1.一种用于通信***的语音质量评价***，其特征在于，包括主观评估模块、客观评估模块和性能评价模块，所述主观评估模块对失真语音质量进行主观评估，获取主观评估得分，所述客观评估模块对失真语音质量进行客观评估，获取客观评估得分，所述性能评价模块对所述主观评估模块和客观评估模块的性能进行评价；

所述对失真语音质量进行主观评估，采用以下方式进行：

a、将测试人员分为两组，两组测试人员人数相同；

c、计算主观评估得分：式中，δ₁和δ₂分别表示权重

所述客观评估模块对失真语音质量进行客观评估，包括第一客观评估子模块、第二客观评估子模块和客观评估得分获取子模块，所述第一客观评估子模块用于计算失真语音质量的第一客观评估因子，所述第二客观评估子模块用于计算失真语音质量的第二客观评估因子，所述客观评估因子获取子模块用于计算失真语音质量的客观评估得分。

2.根据权利要求1所述的用于通信***的语音质量评价***，其特征在于，所述计算失真语音质量的第一客观评估因子，采用以下方式进行：

对失真语音信号的功率谱密度进行补偿，具体为：

c、根据Bark功率谱密度采用兹维克尔定律计算原始语音信号和失真语音信号的响度密度XY(f)n和XS(f)n；

d、计算第一客观评估因子：式中，N表示信号的帧数。

3.根据权利要求2所述的用于通信***的语音质量评价***，其特征在于，所述计算失真语音质量的第二客观评估因子，采用以下方式进行：

a、失真语音质量包含多个主要影响因素，失真语音质量的主要影响因素集表示为H＝{H₁,…,H_n}，其中，n表示主要影响因素数目，每个主要影响因素包含多个主要影响参数，主要影响因素H_k对应的主要影响参数集表示为G_k＝{G_k1,…,G_kj}，其中，k∈[1,n]，j表示主要影响因素Hk包含的主要影响参数的数目，其中，主要影响参数均为正向参数，值越大表明失真语音质量越好；

c、计算第二客观评估因子：

式中，W′_kl表示处理后的第k个主要影响因素的第l个主要影响参数值，β_l为主要影响参数值对应的权重，γk为主要影响因素对应的权重，将E归一化到[0,5]，得到E′；

计算失真语音质量的客观评估得分C：C＝0.5(D+E′)。

4.根据权利要求3所述的用于通信***的语音质量评价***，其特征在于，所述性能评价模块对主观评估模块和客观评估模块的性能进行评价，获取综合评价值Z：