CN107093432B - 一种用于通信***的语音质量评价*** - Google Patents
一种用于通信***的语音质量评价*** Download PDFInfo
- Publication number
- CN107093432B CN107093432B CN201710359666.XA CN201710359666A CN107093432B CN 107093432 B CN107093432 B CN 107093432B CN 201710359666 A CN201710359666 A CN 201710359666A CN 107093432 B CN107093432 B CN 107093432B
- Authority
- CN
- China
- Prior art keywords
- distorted
- objective
- voice
- evaluation
- evaluation module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004891 communication Methods 0.000 title claims abstract description 20
- 238000013441 quality evaluation Methods 0.000 title claims abstract description 10
- 238000011156 evaluation Methods 0.000 claims abstract description 111
- 206010013952 Dysphonia Diseases 0.000 claims abstract description 57
- 230000003595 spectral effect Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 10
- 238000000034 method Methods 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 238000001303 quality assessment method Methods 0.000 claims 2
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 230000007547 defect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供了一种用于通信***的语音质量评价***,包括主观评估模块、客观评估模块和性能评价模块,所述主观评估模块对失真语音质量进行主观评估,获取主观评估得分,所述客观评估模块对失真语音质量进行客观评估,获取客观评估得分,所述性能评价模块对所述主观评估模块和客观评估模块的性能进行评价。本发明的有益效果为:实现了通信***中语音质量的准确评价。
Description
技术领域
本发明涉及语音质量评估技术领域,具体涉及一种用于通信***的语音质量评价***。
背景技术
随着通信技术的飞速发展,现代通信***提供了广泛的语音服务,语音通信已经成为生活中不可或缺的交流方式。评判语音通信***性能优劣的指标是多方面的,其中最重要的一个标志是***输出语音的质量。由于语音质量直接地影响着用户的体验,如何准确有效的评价语音质量就显得尤为重要。
发明内容
针对上述问题,本发明旨在提供一种用于通信***的语音质量评价***。
本发明的目的采用以下技术方案来实现:
提供了一种用于通信***的语音质量评价***,包括主观评估模块、客观评估模块和性能评价模块,所述主观评估模块对失真语音质量进行主观评估,获取主观评估得分,所述客观评估模块对失真语音质量进行客观评估,获取客观评估得分,所述性能评价模块对所述主观评估模块和客观评估模块的性能进行评价。
本发明的有益效果为:实现了通信***中语音质量的准确评价。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是本发明的结构示意图;
附图标记:
主观评估模块1、客观评估模块2、性能评价模块3。
具体实施方式
结合以下实施例对本发明作进一步描述。
参见图1,本实施例的一种用于通信***的语音质量评价***,包括主观评估模块1、客观评估模块2和性能评价模块3,所述主观评估模块1对失真语音质量进行主观评估,获取主观评估得分,所述客观评估模块2对失真语音质量进行客观评估,获取客观评估得分,所述性能评价模块3对所述主观评估模块1和客观评估模块2的性能进行评价。
本实施例实现了通信***中语音质量的准确评价。
优选的,所述对失真语音质量进行主观评估,采用以下方式进行:
a、将测试人员分为两组,两组测试人员人数相同;
b、其中一组测试人员直接听取经过通信***后的失真语音,不同测试人员给出失真语音的绝对分值,绝对分值采用五分制,分值越高,语音质量越好,计算组内绝对分值的平均值a1;另一组测试人员首先听取一遍原始语音,然后听取失真语音,不同测试人员给出失真语音相对原始语音的参考分值,参考分值采用五分制,分值越高,失真语音相对原始语音的失真越小,计算组内参考分值的平均值a2;
c、计算主观评估得分:式中,δ1和δ2分别表示权重,
本优选实施例主观评估模块采用多人进行测试取平均值,克服了主观评价受个人影响大的缺陷,得到了可信度高的主观评估得分,将测试人员分为两组对语音质量进行评价,同时获取了待评价的绝对分值和参考分值,克服了从单一角度进行主观评价的缺陷,主观评估得分更为全面。
优选的,所述客观评估模块2对失真语音质量进行客观评估,包括第一客观评估子模块、第二客观评估子模块和客观评估得分获取子模块,所述第一客观评估子模块用于计算失真语音质量的第一客观评估因子,所述第二客观评估子模块用于计算失真语音质量的第二客观评估因子,所述客观评估因子获取子模块用于计算失真语音质量的客观评估得分。
所述计算失真语音质量的第一客观评估因子,采用以下方式进行:
a、将原始语音信号Y(t)和失真语音信号S(t)的电平调整到统一的增益上,对原始语音信号和失真语音信号进行FFT变换,然后进行滤波,原始语音信号和失真语音信号经过滤波处理后,输出原始语音信号和失真语音信号为Y(n)和S(n);
b、对信号Y(n)和S(n)进行加窗处理,再对其进行短时傅里叶变换,在变换的过程中,使相邻的帧之间有30%的重叠,计算原始语音信号和失真语音信号的每帧的频域功率谱密度Y(f)n和S(f)n,其中,n表示帧序号,将赫兹尺度功率谱密度变换到相应Bark尺度上的功率谱密度BY(j)n和BS(j)n;
对失真语音信号的功率谱密度进行补偿,具体为:
式中,BS(j)n表示补偿前的失真语音信号的功率谱密度,BS(j)n′表示补偿后的失真语音信号的功率谱密度,PBS(j)表示失真语音信号的平均Bark谱,PBY(j)表示原始语音信号的平均Bark谱,XBS(j)表示失真语音信号超过听觉阈值部分的Bark谱密度和,XBY(j)表示原始语音信号超过听觉阈值部分的Bark谱密度和;
c、根据Bark功率谱密度采用兹维克尔定律计算原始语音信号和失真语音信号的响度密度XY(f)n和XS(f)n;
d、计算第一客观评估因子:式中,N表示信号的帧数。
所述计算失真语音质量的第二客观评估因子,采用以下方式进行:
a、失真语音质量包含多个主要影响因素,失真语音质量的主要影响因素集表示为
H{H1,…,Hn},其中,n表示主要影响因素数目,每个主要影响因素包含多个主要影响参数,主要影响因素Hk对应的主要影响参数集表示为Gk={Gk1,…,Gkj},其中,k∈[1,n],j表示主要影响因素Hk包含的主要影响参数的数目,其中,主要影响参数均为正向参数,值越大表明失真语音质量越好;
b、通过测量获取失真语音质量的主要影响参数值,对主要影响参数值采用以下方式处理,得到处理后的主要影响参数值:
式中,Wmax和Wmin分别表示主要影响参数值的上限制和下限值,W表示处理前的主要影响参数值,W′表示处理后的主要影响参数值;
c、计算第二客观评估因子:
式中,W′kl表示处理后的第k个主要影响因素的第l个主要影响参数值,βl为主要影响参数值对应的权重,γk为主要影响因素对应的权重,将E归一化到[0,5,得到E′;
计算失真语音质量的客观评估得分C:C=0.5D+E′)。
本优选实施例客观评估模块通过第一客观评估因子和第二客观评估因子结合的方式确定客观评估得分,对环境噪声有很好的鲁棒性,具体的,将赫兹尺度功率谱密度变换到相应Bark尺度上的功率谱密度,更符合人类的听觉特性,采用对失真语音信号进行补偿,得到了更为准确的失真信号功率谱密度,对语音信号的所有帧进行评价,获取了更为准确的第一客观评估因子,考虑多影响因素,获取了更为准确的第二客观评估因子,在实际应用计算中。
优选的,所述性能评价模块3对主观评估模块1和客观评估模块2的性能进行评价,获取综合评价值Z:
式中,M表示待评价失真语音的数量,Ai表示第i个失真语音的主观评估得分,Ci表示第i个失真语音的客观评估得分,综合评价值越小,表明主观评估模块和客观评估模块对失真语音质量评估越准确。
本优选实施例对主观评估模块和客观评估模块的性能进行评价,有助于对主观评估模块和客观评估模块不断进行改进,获取更为准确的语音质量评价结果。
采用本发明用于通信***的语音质量评价***对失真语音质量进行评估,当和取不同值时,对评估准确性和评估时间进行统计,同未采用本发明相比,产生的有益效果如下表所示:
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (4)
1.一种用于通信***的语音质量评价***,其特征在于,包括主观评估模块、客观评估模块和性能评价模块,所述主观评估模块对失真语音质量进行主观评估,获取主观评估得分,所述客观评估模块对失真语音质量进行客观评估,获取客观评估得分,所述性能评价模块对所述主观评估模块和客观评估模块的性能进行评价;
所述对失真语音质量进行主观评估,采用以下方式进行:
a、将测试人员分为两组,两组测试人员人数相同;
b、其中一组测试人员直接听取经过通信***后的失真语音,不同测试人员给出失真语音的绝对分值,绝对分值采用五分制,分值越高,语音质量越好,计算组内绝对分值的平均值a1;另一组测试人员首先听取一遍原始语音,然后听取失真语音,不同测试人员给出失真语音相对原始语音的参考分值,参考分值采用五分制,分值越高,失真语音相对原始语音的失真越小,计算组内参考分值的平均值a2;
c、计算主观评估得分:式中,δ1和δ2分别表示权重
所述客观评估模块对失真语音质量进行客观评估,包括第一客观评估子模块、第二客观评估子模块和客观评估得分获取子模块,所述第一客观评估子模块用于计算失真语音质量的第一客观评估因子,所述第二客观评估子模块用于计算失真语音质量的第二客观评估因子,所述客观评估因子获取子模块用于计算失真语音质量的客观评估得分。
2.根据权利要求1所述的用于通信***的语音质量评价***,其特征在于,所述计算失真语音质量的第一客观评估因子,采用以下方式进行:
a、将原始语音信号Y(t)和失真语音信号S(t)的电平调整到统一的增益上,对原始语音信号和失真语音信号进行FFT变换,然后进行滤波,原始语音信号和失真语音信号经过滤波处理后,输出原始语音信号和失真语音信号为Y(n)和S(n);
b、对信号Y(n)和S(n)进行加窗处理,再对其进行短时傅里叶变换,在变换的过程中,使相邻的帧之间有30%的重叠,计算原始语音信号和失真语音信号的每帧的频域功率谱密度Y(f)n和S(f)n,其中,n表示帧序号,将赫兹尺度功率谱密度变换到相应Bark尺度上的功率谱密度BY(j)n和BS(j)n;
对失真语音信号的功率谱密度进行补偿,具体为:
式中,BS(j)n表示补偿前的失真语音信号的功率谱密度,BS(j)n′表示补偿后的失真语音信号的功率谱密度,PBS(j)表示失真语音信号的平均Bark谱,PBY(j)表示原始语音信号的平均Bark谱,XBS(j)表示失真语音信号超过听觉阈值部分的Bark谱密度和,XBY(j)表示原始语音信号超过听觉阈值部分的Bark谱密度和;
c、根据Bark功率谱密度采用兹维克尔定律计算原始语音信号和失真语音信号的响度密度XY(f)n和XS(f)n;
d、计算第一客观评估因子:式中,N表示信号的帧数。
3.根据权利要求2所述的用于通信***的语音质量评价***,其特征在于,所述计算失真语音质量的第二客观评估因子,采用以下方式进行:
a、失真语音质量包含多个主要影响因素,失真语音质量的主要影响因素集表示为H={H1,…,Hn},其中,n表示主要影响因素数目,每个主要影响因素包含多个主要影响参数,主要影响因素Hk对应的主要影响参数集表示为Gk={Gk1,…,Gkj},其中,k∈[1,n],j表示主要影响因素Hk包含的主要影响参数的数目,其中,主要影响参数均为正向参数,值越大表明失真语音质量越好;
b、通过测量获取失真语音质量的主要影响参数值,对主要影响参数值采用以下方式处理,得到处理后的主要影响参数值:
式中,Wmax和Wmin分别表示主要影响参数值的上限制和下限值,W表示处理前的主要影响参数值,W′表示处理后的主要影响参数值;
c、计算第二客观评估因子:
式中,W′kl表示处理后的第k个主要影响因素的第l个主要影响参数值,βl为主要影响参数值对应的权重,γk为主要影响因素对应的权重,将E归一化到[0,5],得到E′;
计算失真语音质量的客观评估得分C:C=0.5(D+E′)。
4.根据权利要求3所述的用于通信***的语音质量评价***,其特征在于,所述性能评价模块对主观评估模块和客观评估模块的性能进行评价,获取综合评价值Z:
式中,M表示待评价失真语音的数量,Ai表示第i个失真语音的主观评估得分,Ci表示第i个失真语音的客观评估得分,综合评价值越小,表明主观评估模块和客观评估模块对失真语音质量评估越准确。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710359666.XA CN107093432B (zh) | 2017-05-19 | 2017-05-19 | 一种用于通信***的语音质量评价*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710359666.XA CN107093432B (zh) | 2017-05-19 | 2017-05-19 | 一种用于通信***的语音质量评价*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107093432A CN107093432A (zh) | 2017-08-25 |
CN107093432B true CN107093432B (zh) | 2019-12-13 |
Family
ID=59638989
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710359666.XA Expired - Fee Related CN107093432B (zh) | 2017-05-19 | 2017-05-19 | 一种用于通信***的语音质量评价*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107093432B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108471602A (zh) * | 2018-03-06 | 2018-08-31 | 深圳市创艺工业技术有限公司 | 一种实时土壤环境质量评价*** |
CN111816208B (zh) * | 2020-06-17 | 2023-05-05 | 厦门快商通科技股份有限公司 | 一种语音分离质量评估方法、装置及计算机存储介质 |
CN117690458A (zh) * | 2024-01-15 | 2024-03-12 | 国能宁夏供热有限公司 | 一种基于电话通信的智能语音质检***及其质检方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1645475A (zh) * | 2005-01-18 | 2005-07-27 | 中国电子科技集团公司第三十研究所 | 客观音质评价归一化主客观统计相关模型的建立方法 |
CN102881289A (zh) * | 2012-09-11 | 2013-01-16 | 重庆大学 | 一种基于听觉感知特性的语音质量客观评价方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2944640A1 (fr) * | 2009-04-17 | 2010-10-22 | France Telecom | Procede et dispositif d'evaluation objective de la qualite vocale d'un signal de parole prenant en compte la classification du bruit de fond contenu dans le signal. |
-
2017
- 2017-05-19 CN CN201710359666.XA patent/CN107093432B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1645475A (zh) * | 2005-01-18 | 2005-07-27 | 中国电子科技集团公司第三十研究所 | 客观音质评价归一化主客观统计相关模型的建立方法 |
CN102881289A (zh) * | 2012-09-11 | 2013-01-16 | 重庆大学 | 一种基于听觉感知特性的语音质量客观评价方法 |
Non-Patent Citations (1)
Title |
---|
通信***中语音质量评价的研究;张伟伟;《中国博士学位论文全文数据库 信息科技辑》;20150415;第9-19页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107093432A (zh) | 2017-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101148671B1 (ko) | 오디오 전송 시스템의 음성 명료도 측정 방법 및 시스템 | |
CN107093432B (zh) | 一种用于通信***的语音质量评价*** | |
US8467893B2 (en) | Objective measurement of audio quality | |
CN1132152C (zh) | 用于执行音频信号的传输质量的机器支持的评估的方法 | |
CN102054480B (zh) | 一种基于分数阶傅立叶变换的单声道混叠语音分离方法 | |
CN104485114B (zh) | 一种基于听觉感知特性的语音质量客观评估的方法 | |
CN105261359B (zh) | 手机麦克风的消噪***和消噪方法 | |
CN103440869A (zh) | 一种音频混响的抑制装置及其抑制方法 | |
CN103544961B (zh) | 语音信号处理方法及装置 | |
JP4570609B2 (ja) | 音声伝送システムの音声品質予測方法及びシステム | |
JP4263620B2 (ja) | システムの伝送品質を測定する方法及びシステム | |
CN110751959A (zh) | 一种汽车噪声不舒适度评价方法 | |
CN107170468A (zh) | 一种基于两层模型的多声道音频质量评价方法 | |
CN104616665B (zh) | 基于语音类似度的混音方法 | |
DE60306884D1 (de) | Werkzeug zur nicht invasiven Bestimmung der Qualität eines Sprachsignals | |
CN111816208A (zh) | 一种语音分离质量评估方法、装置及计算机存储介质 | |
Mu et al. | An objective analysis method for perceptual quality of a virtual bass system | |
CN105357619B (zh) | 一种数字助听器频率分辨力增强方法 | |
CN106993257A (zh) | 一种具有感应功能的音频播放器 | |
JP4309749B2 (ja) | 帯域制限を考慮した音声品質客観評価装置 | |
Rund et al. | Objective quality assessment for the acoustic zoom | |
CN107895579A (zh) | 一种语音识别方法及*** | |
KR20190019468A (ko) | 음성 부호화 시스템의 후처리 장치 및 방법 | |
Miyazaki et al. | Musical-noise-free blind speech extraction using ICA-based noise estimation with channel selection | |
Reimes | Instrumental assessment of near-end perceived listening effort |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20191120 Address after: No.81 Canglang Road, Yangjiang Town, Gaochun District, Nanjing City, Jiangsu Province Applicant after: Jiangsu Baiying Information Technology Co., Ltd Address before: 518000 5th Floor, No. 1124 Nanshan Avenue, Nanshan Street, Nanshan District, Shenzhen City, Guangdong Province Applicant before: Shenzhen Li Li Power Technology Co., Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191213 Termination date: 20210519 |
|
CF01 | Termination of patent right due to non-payment of annual fee |