CN111816207B - 声音分析方法、***、汽车及存储介质 - Google Patents

声音分析方法、***、汽车及存储介质 Download PDF

Info

Publication number
CN111816207B
CN111816207B CN202010891961.1A CN202010891961A CN111816207B CN 111816207 B CN111816207 B CN 111816207B CN 202010891961 A CN202010891961 A CN 202010891961A CN 111816207 B CN111816207 B CN 111816207B
Authority
CN
China
Prior art keywords
sound
frequency
quality
band
formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010891961.1A
Other languages
English (en)
Other versions
CN111816207A (zh
Inventor
李志勇
刘昱
胥国文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Automobile Group Co Ltd
Original Assignee
Guangzhou Automobile Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Automobile Group Co Ltd filed Critical Guangzhou Automobile Group Co Ltd
Priority to CN202010891961.1A priority Critical patent/CN111816207B/zh
Publication of CN111816207A publication Critical patent/CN111816207A/zh
Application granted granted Critical
Publication of CN111816207B publication Critical patent/CN111816207B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

本发明涉及声音分析领域。本发明公开了一种声音分析方法、***、汽车及存储介质,其方法包括:在指定环境下,通过一组处于预设距离范围内的传声器采集一组声音信号;根据该组声音信号生成声音均值信号;通过预设声音分析关系解析声音均值信号,获得声音均值信号的声品质特征;根据声品质特征确定声音均值信号的评价数据。本发明提高了对小空间环境内声源声音品质的分析能力,提高评价数据的准确性,减少评价成本。

Description

声音分析方法、***、汽车及存储介质
技术领域
本发明涉及声音分析领域,尤其涉及一种声音分析方法、***、汽车及存储介质。
背景技术
一些小空间环境,如汽车内部,对声音信号具有高反射、高吸收的特点。此类环境下,由于混响时间短和多模态耦合,声压空间分布复杂,在某一位置点采集到的声音信号往往存在较多的峰谷值。存在较多的峰谷值的声音信号与人耳听到的真实声音信号往往存在差异。当该声音信号用于分析声音评价值时,这种差异会对分析出的声音评价值产生较大影响,影响声音评价值的分析准确性。
因而,需要寻找一种声音分析方法,以获取小空间环境内声源声音品质的评价数据,并确保该评价数据具有较高的准确性。
发明内容
基于此,有必要针对上述技术问题,提供一种声音分析方法、***、汽车及存储介质,以解决小空间环境内声源声音的信号差异影响声音评价,导致声音评价数据分析准确性低的问题。
一种声音分析方法,包括:
在指定环境下,通过一组处于预设距离范围内的传声器采集一组声音信号;
根据该组声音信号生成声音均值信号;
通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,所述声品质特征包括低频延展参数、低频比值、高频延展参数、高频质量参数、窄带偏差、频谱平坦度和中频谐波失真参数中的至少一个;
根据所述声品质特征确定所述声音均值信号的评价数据。
一种声音分析***,包括依次电性连接的传声器、多通道分析仪、进阶音质分析仪和音质得分计算器;
所述传声器,用于采集指定环境下的声音信号,所述传声器的数量为多个,且任意两个传声器之间的距离小于预设距离;所有所述传声器与所述多通道分析仪并联;
所述多通道分析仪,用于从各个所述传声器接收所述声音信号,根据所有所述声音信号生成声音均值信号;
所述进阶音质分析仪,用于从所述多通道分析仪接收所述声音均值信号,并通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征;
所述音质得分计算器,用于从进阶音质分析仪接收所述声品质特征,根据所述声品质特征确定所述声音均值信号的评价数据。
一种汽车,包括采用所述声音分析方法进行音质分析的汽车音响。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现上述声音分析方法。
上述声音分析方法、***、汽车及存储介质,在指定环境下,通过一组处于预设距离范围内的传声器采集一组声音信号,以保证声音信号的同时性。根据该组声音信号生成声音均值信号,以减少声学干涉和衍射效应的影响,声音均值信号符合听音者听音位置不确定的情况。通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,以提取出与人听感密切相关的听觉指标。根据所述声品质特征确定所述声音均值信号的评价数据,以获得与主观评价接近的音质得分,减少声音评价成本。本发明可以解决小空间环境内声源声音存在信号差异的问题,有效地提高了评价数据的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中声音分析方法的一流程示意图;
图2 是本发明一实施例中声音分析***的一结构示意图;
图3是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在一实施例中,如图1所示,提供一种声音分析方法,包括如下步骤:
S10、在指定环境下,通过一组处于预设距离范围内的传声器采集一组声音信号。
在此处,指定环境可以指空间较小、相对密闭的环境,如汽车内部环境、列车内部环境、飞机机舱环境、迷你K歌房等。预设距离范围一般是一个较小的距离的范围,可以根据实际需要进行设置。一组传声器包括多个传声器,一组传声器中的传声器的数量可以根据需求设置,比如7个;在一示例中,预设距离范围可设置为:令一组传声器中的其中一个传声器作为中心点,其他传声器环绕该中心点设置,且距离不超过5cm。
本实施例使用的传声器可以是通用型测量级传声器,如1/2英寸自由场传声器。在采集声音信号之前,需要对传声器进行校准。校准传声器的校准器可以是通用型校准器。通用型校准器包括声级计和用于校准的便携式声源。可采用现有的声音校准方法对传声器进行校准,在此不再赘述。
在校准传声器之后,可以在该指定环境下播放一段待评价的音频片段,由各个传声器采集声音信号。每个传声器可以采集到一个声音信号。一组声音信号包括若干个声音信号。各个传声器处于预设距离范围内,因而采集到的声音信号具有同时性。
S20、根据该组声音信号生成声音均值信号。
本实施例中,声音均值信号可以指一组传声器获取的所有声音信号中各个声音信号的平均值。声音均值信号可以减少声学干涉和衍射效应的影响,更符合实际中听音者听音位置不确定的情况(指的是听音者在听音过程中,头部位置会产生一定程度的变化)。生成的声音均值信号包括频谱信息,也包含失真度信息(谐波失真)。
S30、通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,所述声品质特征包括低频延展参数、低频比值、高频延展参数、高频质量参数、窄带偏差、频谱平坦度和中频谐波失真参数中的至少一个。
声品质特征可以指基于分析声音均值信号(也可以是声音信号)确定声品质(即评价数据)需要所设置的指标。声品质特征一般为多个。声品质特征可以在某个方面或某个频段反映声音均值信号的声品质,声品质特征包括但不限于低频延展参数、低频比值、高频延展参数、高频质量参数、窄带偏差、频谱平坦度和中频谐波失真参数。对应地,预设声音分析关系则可以是用于从声音均值信号中提取声品质特征的计算公式,如低频延展公式、低频比值公式、高频延展公式等。
S40、根据所述声品质特征确定所述声音均值信号的评价数据。
在获得多个声品质特征后,可以基于获得的声品质特征计算出声音均值信号的评价数据。评价数据可以是各个声品质特征的加权平均和。不同的声品质特征具有不同的权值。在实际应用时,可以构建声学评价模型,接着通过具体的主观评价试验获取初始评价数据,然后进行线性拟合,获得不同声品质特征的权值,进而根据权值对各个声品质特征求加权平均和,获取评价数据。当声学评价模型用于评价新的声音样本(测试环境与构建声学评价模型的环境相同)时,可以直接使用本实施例提供的步骤S10-S40进行分析,获得相应的评价数据。在进行评价数据的计算时,声品质特征的权值为已知值。
步骤S10-S40中,在指定环境下,通过一组处于预设距离范围内的传声器采集一组声音信号,以保证声音信号的同时性。根据该组声音信号生成声音均值信号,以减少声学干涉和衍射效应的影响,声音均值信号符合听音者听音位置不确定的情况。通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,以提取出与人听感密切相关的听觉指标。根据所述声品质特征确定所述声音均值信号的评价数据,以获得与主观评价接近的音质得分,减少声音评价成本。
在一示例中,采用留一法交叉验证,对本发明实施例涉及的声学评价模型进行验证。从6个样本中选择1个样本作为测试样本,其余5个样本作为训练样本,得到声学评价模型,分析声学评价模型对测试样本的预测效果。重复选择测试样本,直到每个样本都用作测试样本。验证数据如表1所示。
表1 回归模型的验证数据
测试样本 主观评分实测得分 模型预测值 预测误差 预测相对误差
样本1 5.05 5.46 -0.42 -8.26%
样本2 7.24 6.47 0.77 10.69%
样本3 4.76 4.58 0.18 3.82%
样本4 7.50 6.44 1.06 14.19%
样本5 6.41 5.93 0.48 7.43%
样本6 8.86 7.51 1.34 15.17%
在表1中,预测相对误差基本在15%以内。平均绝对相对误差为9.93%,小于10%。均方根误差RMSE为0.81,小于0.9,说明声学评价模型有一定预测效果。
可选的,所述声品质特征包括低频延展参数,步骤S30,即所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过低频延展公式计算所述低频延展参数,所述低频延展公式为:
Figure 321575DEST_PATH_IMAGE001
其中,
Figure 938501DEST_PATH_IMAGE002
为低频延展参数,
Figure 133728DEST_PATH_IMAGE003
为第一参考幅度,所述第一参考幅度为第一参考频段内音频的平均幅度与预设指定值之和;所述第一参考频段的频率范围为300 Hz -10 kHz;
Figure 545117DEST_PATH_IMAGE004
表示在低于300Hz的频段中,第一个幅度低于
Figure 310948DEST_PATH_IMAGE005
值6dB的频率。
本实施例中,
Figure 200407DEST_PATH_IMAGE004
指的是幅度低于
Figure 17184DEST_PATH_IMAGE005
值6dB,小于且最接近300Hz的频率。也就是说,
Figure 130634DEST_PATH_IMAGE004
是在低于300Hz的频段,所有幅度低于
Figure 524706DEST_PATH_IMAGE005
值6dB的频率中,频率值最高的频率。在计算低频延展参数时,通过取对数,便于在声学评价模型中构建主观数据与客观数据之间线性映射关系。由于车内音响均衡器对低频的提升,在第一参考频段内的平均幅度的基础上增加预设指定值。预设指定值为经验值,一般为+10dB。第一参考频段一般可以选择300 Hz ~10 kHz。用于评价车内声场时,第一参考频段可以设置为300 Hz ~3kHz。
可选的,所述声品质特征包括低频比值,步骤S30,即所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过低频比值公式计算所述低频比值,所述低频比值公式为:
Figure 342489DEST_PATH_IMAGE006
其中,
Figure 138407DEST_PATH_IMAGE007
为低频比值;
Figure 999921DEST_PATH_IMAGE008
表示第n1个倍频程带对应的平均幅度;
Figure 881290DEST_PATH_IMAGE009
表示声音均值信号低频部分的上限频率。
在一示例中,
Figure 237185DEST_PATH_IMAGE009
取值为100Hz。低频比值可以反映低频部分幅值在全频带中所占的比重。
可选的,所述声品质特征包括高频延展参数,步骤S30,即所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过高频延展公式计算所述高频延展参数,所述高频延展公式为:
Figure 887609DEST_PATH_IMAGE010
其中,
Figure 608440DEST_PATH_IMAGE011
为高频延展参数,
Figure 852471DEST_PATH_IMAGE012
为第二参考幅度,所述第二参考幅度为第二参考频段内音频的平均幅度,所述第二参考频段为300 ~ 3kHz;
Figure 887423DEST_PATH_IMAGE013
表示在5kHz以上的频段中,第一个幅度低于
Figure 516988DEST_PATH_IMAGE012
值6dB的频率。
本实施例中,
Figure 346403DEST_PATH_IMAGE013
指的是幅度低于
Figure 599703DEST_PATH_IMAGE012
值6dB,大于且最接近5kHz的频率。也就是说,
Figure 172766DEST_PATH_IMAGE013
是在高于5kHz的频段,所有幅度低于
Figure 922417DEST_PATH_IMAGE012
值6dB的频率中,频率值最低的频率。在计算高频延展参数(HFX)时,通过取对数,便于在回归模型中构建主观评价数据与客观数据之间线性映射关系。HFX 理论上与主观评价得分呈正相关。
可选的,所述声品质特征包括高频质量参数,步骤S30,即所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过高频质量公式计算所述高频质量参数,所述高频质量公式为:
Figure 985051DEST_PATH_IMAGE014
其中,
Figure 62728DEST_PATH_IMAGE015
为高频质量参数(dB指分贝),N1是5 kHz到HFX定义的最高频率之间的1/20倍频程带的总数;
Figure 580428DEST_PATH_IMAGE016
表示第n2个倍频程带对应的平均幅度,n2为整数,且
Figure 794372DEST_PATH_IMAGE017
本实施例中,HFX定义的最高频率可以是声音数据最高的采样频率。如,若声音数据最高的采样频率为30kHz,则HFX定义的最高频率为30kHz。高频质量参数(HFQ)用于量化5kHz到高频截止频率之间的高音区域的幅度响应偏差。在此处,HFX与HFQ参数与主观评价的明亮度相关。
可选的,所述声品质特征包括窄带偏差,步骤S30,即所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过窄带偏差公式计算所述窄带偏差,所述窄带偏差公式包括:
Figure 355803DEST_PATH_IMAGE018
其中,N 2是100 Hz到12 kHz之间的1/2倍频程带的总数,
Figure 920777DEST_PATH_IMAGE019
是第n 3个1/2倍频程带内的平均幅度值,
Figure 209544DEST_PATH_IMAGE020
是第n 3个1/2倍频程带内的频段
Figure 809153DEST_PATH_IMAGE021
的幅度值,n3为整数,且
Figure 213590DEST_PATH_IMAGE022
本实施例中,在计算窄带偏差时,每个1/2倍频程带内的平均绝对偏差基于倍频程带内的10个等对数间隔采样的幅度数据点。NBD值越高,表示窄带内幅度偏差越大。在此处,NBD与主观评价分数呈负相关。
可选的,所述声品质特征包括频谱平坦度,步骤S30,即所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过频谱平坦度公式计算所述频谱平坦度,所述频谱平坦度公式为:
Figure 390493DEST_PATH_IMAGE023
其中,
Figure 109050DEST_PATH_IMAGE024
为信号幅度谱在频率点
Figure 438532DEST_PATH_IMAGE025
上的值,
Figure 951553DEST_PATH_IMAGE026
为预设频段范围的上限频率,所述预设频段范围包括300Hz ~20kHz。
频谱平坦度(SPF),即信号功率谱的几何平均值与算术平均值的比值。该比值在0到1之间,对于一个白噪声其计算结果为1;对于一个纯音信号,计算结果为0。SPF越接近1,表明平坦度越高。取对数扩大取值范围,取对数后结果越大(越接近于0),平坦度越高。SPF的预设频段范围为300Hz – 20kHz。SPF与主观评价分数呈正相关,其特征值与被评测的人声相关(也即是,人的发音不同,SPF也不相同)。
可选的,所述声品质特征包括中频谐波失真参数,步骤S30,即所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过中频谐波失真公式计算所述中频谐波失真参数,所述中频谐波失真公式为:
Figure 615752DEST_PATH_IMAGE027
其中,
Figure 138000DEST_PATH_IMAGE028
为在300Hz~3000Hz频段中进行测量的频率点的总数,
Figure 243360DEST_PATH_IMAGE029
为第n4个频率点对应的频率值,
Figure 566762DEST_PATH_IMAGE030
为与
Figure 328045DEST_PATH_IMAGE029
对应的谐波失真参数。
中频谐波失真参数可以是在中频段(300Hz~3000Hz)中的所有总谐波失真(THD)的均值。n4的值可以根据需要进行设置。
在一示例中,所述声品质特征包括低频谐波失真参数,步骤S30,即所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过低频谐波失真公式计算所述低频谐波失真参数,所述低频谐波失真公式为:
Figure 778618DEST_PATH_IMAGE031
其中,
Figure 676167DEST_PATH_IMAGE032
为在50 Hz~300Hz的频率范围内测量的频率点的总数,
Figure 671936DEST_PATH_IMAGE033
为第n5个频率点对应的频率值, n5为整数,且
Figure 186094DEST_PATH_IMAGE034
Figure 174778DEST_PATH_IMAGE035
为与
Figure 989150DEST_PATH_IMAGE033
对应的谐波失真参数。
在此处,低频谐波失真参数可以是在低频段(50-300Hz)中的所有总谐波失真(THD)的均值。n5的值可以根据需要进行设置,示意性的,可以每隔10Hz进行一次采样。总谐波失真(THD)指音频信号源通过功率放大器时,由于非线性元件所引起的输出信号比输入信号多出的额外谐波成分。
可选的,所述声品质特征包括低频延展参数、低频比值、高频延展参数、高频质量参数、窄带偏差、频谱平坦度和中频谐波失真参数;
步骤S40,即所述根据所述声品质特征确定所述声音均值信号的评价数据,包括:
通过音质评价公式处理所述声品质特征,获得所述评价数据,所述音质评价公式包括:
Figure 732984DEST_PATH_IMAGE036
其中,S为评价数据;
LFX为低频延展参数,a=-1~1;
Figure 62335DEST_PATH_IMAGE037
为低频比值,b=0.1~0.3;
Figure 307240DEST_PATH_IMAGE038
为高频质量参数,c=-1~1;
Figure 304015DEST_PATH_IMAGE039
为高频延展参数,d=0.1~3;
Figure 31799DEST_PATH_IMAGE040
为窄带偏差,e=-1~1;
Figure 864757DEST_PATH_IMAGE041
为频谱平坦度,f=0.1~0.2;
Figure 336190DEST_PATH_IMAGE042
为中频谐波失真参数,g=0.1~0.2。
在此处,评价数据S为各个声品质特征的加权和。在实际应用时,可以构建声学评价模型,接着通过具体的主观评价试验获取初始评价数据,将初始评价数据代入音质评价公式中,可以求解出相应的权重值。在此处,a、b、c、d、e、f、g均为常数系数。示意性的,a的推荐取值范围为-1~1;b的推荐取值范围为0.1~0.3;c的推荐取值范围为-1~1;d的推荐取值范围为0.1~3;e的推荐取值范围为-1~1;f的推荐取值范围为0.1~0.2;g的推荐取值范围为0.1~0.2。
可选的,所述预设距离范围是指:一组传声器中的任意两个传声器之间的距离均小于10cm;
一组传声器中的传声器数量大于或等于4个。
本实施例中,不同传声器之间的距离不宜过远,否则会影响声音均值信号的真实性。经试验,在车内环境中,任意两个传声器的距离应小于10cm,即距离最远的两个传声器之间的距离小于10cm。
为了更好地减少声学干涉和衍射效应的影响,传声器的推荐数量不少于4个。在一示例中,传声器的数量可以是7个,其中一个设置在中心位置,其它传声器分别沿三维坐标的X、Y、Z轴对称设置。处于中心位置的传声器与处于轴线位置的传声器的距离均为4cm。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种声音分析***,该声音分析***与上述实施例中声音分析方法一一对应。如图2所示,该声音分析***包括依次电性连接的传声器200、多通道分析仪300、进阶音质分析仪400和音质得分计算器500;
传声器200,用于采集指定环境下的声音信号,传声器200的数量为多个,且任意两个传声器200之间的距离小于预设距离;所有传声器200与多通道分析仪300并联;
多通道分析仪300,用于从各个传声器200接收声音信号,根据所有声音信号生成声音均值信号;
进阶音质分析仪400,用于从多通道分析仪300接收声音均值信号,并通过预设声音分析关系解析声音均值信号,获得声音均值信号的声品质特征;
音质得分计算器500,用于从进阶音质分析仪400接收声品质特征,根据声品质特征确定声音均值信号的评价数据。
在本实施例中,声音分析***包括传声器200、多通道分析仪300、进阶音质分析仪400和音质得分计算器500。其中,传声器200用于采集声音信号。多通道分析仪300用于将多路声音信号合成声音均值信号。声音均值信号包括频谱信息和失真度信息。进阶音质分析仪400用于将声音均值信号处理为不同的声品质特征。在此处,声品质特征包括但不限于低频延展参数、低频比值、高频延展参数、高频质量参数、窄带偏差、频谱平坦度和中频谐波失真参数。音质得分计算器500可以根据接收到的声品质特征计算出最终的评价数据。评价数据可用于评价声源播放设备的扬声效果。
在一示例中,通过传声器支架100固定传声器200的位置。传声器支架100可以方便测量,同时减少由摆放位置引起的测量误差。
可选的,所述声品质特征包括低频延展参数,进阶音质分析仪400包括:
低频延展单元,用于通过低频延展公式计算所述低频延展参数,所述低频延展公式为:
Figure 453051DEST_PATH_IMAGE001
其中,
Figure 882895DEST_PATH_IMAGE005
为第一参考幅度,所述第一参考幅度为第一参考频段内音频的平均幅度与预设指定值之和;所述第一参考频段的频率范围为300 Hz - 10 kHz;
Figure 593362DEST_PATH_IMAGE004
表示在低于300Hz的频段中,第一个幅度低于
Figure 976808DEST_PATH_IMAGE005
值6dB的频率。
可选的,所述声品质特征包括低频比值,进阶音质分析仪400包括:
低频比值单元,用于通过低频比值公式计算所述低频比值,所述低频比值公式为:
Figure 557962DEST_PATH_IMAGE006
其中,
Figure 752183DEST_PATH_IMAGE008
表示第n1个倍频程带对应的平均幅度,
Figure 684367DEST_PATH_IMAGE009
表示声音均值信号低频部分的上限频率。
可选的,所述声品质特征包括高频延展参数,进阶音质分析仪400包括:
高频延展单元,用于通过高频延展公式计算所述高频延展参数,所述高频延展公式为:
Figure 372968DEST_PATH_IMAGE010
其中,
Figure 339787DEST_PATH_IMAGE012
为第二参考幅度,所述第二参考幅度为第二参考频段内音频的平均幅度,所述第二参考频段为300 ~ 3kHz;
Figure 111434DEST_PATH_IMAGE013
表示在5 kHz以上的频段中,第一个幅度低于
Figure 921127DEST_PATH_IMAGE012
值6dB的频率。
可选的,所述声品质特征包括高频质量参数,进阶音质分析仪400包括:
高频质量单元,用于通过高频质量公式计算所述高频质量参数,所述高频质量公式为:
Figure 272474DEST_PATH_IMAGE043
其中,N1是5 kHz到HFX定义的最高频率之间的1/20倍频程带的总数;
Figure 467701DEST_PATH_IMAGE016
表示第n2个倍频程带对应的平均幅度,n2为整数,且
Figure 347932DEST_PATH_IMAGE022
可选的,所述声品质特征包括窄带偏差,进阶音质分析仪400包括:
窄带偏差单元,用于通过窄带偏差公式计算所述窄带偏差,所述窄带偏差公式包括:
Figure 379342DEST_PATH_IMAGE044
其中,N 2是100 Hz到12 kHz之间的1/2倍频程带的总数,
Figure 534380DEST_PATH_IMAGE019
是第n 3个1/2倍频程带内的平均幅度值,
Figure 85578DEST_PATH_IMAGE020
是第n 3个1/2倍频程带内的频段
Figure 117469DEST_PATH_IMAGE021
的幅度值,n3为整数,且
Figure 855749DEST_PATH_IMAGE022
可选的,所述声品质特征包括频谱平坦度,进阶音质分析仪400包括:
频谱平坦度单元,用于通过频谱平坦度公式计算所述频谱平坦度,所述频谱平坦度公式为:
Figure 876795DEST_PATH_IMAGE023
其中,
Figure 312193DEST_PATH_IMAGE024
为信号幅度谱在频率点
Figure 65385DEST_PATH_IMAGE025
上的值,
Figure 9071DEST_PATH_IMAGE026
为预设频段范围的上限频率,所述预设频段范围包括300Hz ~20kHz。
可选的,所述声品质特征包括中频谐波失真参数,进阶音质分析仪400包括:
中频谐波失真单元,用于通过中频谐波失真公式计算所述中频谐波失真参数,所述中频谐波失真公式为:
Figure 302649DEST_PATH_IMAGE045
其中,
Figure 828439DEST_PATH_IMAGE028
为在300Hz~3000Hz频段中进行测量的频率点的总数,
Figure 752533DEST_PATH_IMAGE029
为第n4个频率点对应的频率值,
Figure 245831DEST_PATH_IMAGE030
为与
Figure 15204DEST_PATH_IMAGE029
对应的谐波失真参数。
可选的,所述声品质特征包括低频延展参数、低频比值、高频延展参数、高频质量参数、窄带偏差、频谱平坦度和中频谐波失真参数;
音质得分计算器500包括:
评价数据计算单元,用于通过音质评价公式处理所述声品质特征,获得所述评价数据,所述音质评价公式包括:
Figure 894036DEST_PATH_IMAGE046
其中,S为评价数据;
LFX为低频延展参数,a=-1~1;
Figure 989031DEST_PATH_IMAGE037
为低频比值,b=0.1~0.3;
Figure 704046DEST_PATH_IMAGE038
为高频质量参数,c=-1~1;
Figure 542689DEST_PATH_IMAGE039
为高频延展参数,d=0.1~3;
Figure 712246DEST_PATH_IMAGE040
为窄带偏差,e=-1~1;
Figure 641976DEST_PATH_IMAGE041
为频谱平坦度,f=0.1~0.2;
Figure 578708DEST_PATH_IMAGE042
为中频谐波失真参数,g=0.1~0.2。
可选的,任意两个传声器之间的距离均小于10cm;
一组传声器中的传声器数量大于或等于4个。
关于声音分析***的具体限定可以参见上文中对于声音分析方法的限定,在此不再赘述。上述声音分析***中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
本发明实施例还提供了一种汽车,包括采用上述声音分析方法进行音质分析的汽车音响。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图3所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机可读指令。该内存储器为非易失性存储介质中的操作***和计算机可读指令的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机可读指令被处理器执行时以实现一种声音分析方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令,处理器执行计算机可读指令时实现以下步骤:
在指定环境下,通过一组处于预设距离范围内的传声器采集一组声音信号;
根据该组声音信号生成声音均值信号;
通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征;
根据所述声品质特征确定所述声音均值信号的评价数据。
在一个实施例中,提供了一个或多个存储有计算机可读指令的计算机可读存储介质,本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。可读存储介质上存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时实现以下步骤:
在指定环境下,通过一组处于预设距离范围内的传声器采集一组声音信号;
根据该组声音信号生成声音均值信号;
通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征;
根据所述声品质特征确定所述声音均值信号的评价数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (13)

1.一种声音分析方法,其特征在于,包括:
在指定环境下,通过一组处于预设距离范围内的传声器采集一组声音信号;
根据该组声音信号生成声音均值信号;
通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,所述声品质特征包括低频延展参数、低频比值、高频延展参数、高频质量参数、窄带偏差、频谱平坦度和中频谐波失真参数中的至少一个;
根据所述声品质特征确定所述声音均值信号的评价数据。
2.如权利要求1所述的声音分析方法,其特征在于,所述声品质特征包括低频延展参数,所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过低频延展公式计算所述低频延展参数,所述低频延展公式为:
Figure DEST_PATH_IMAGE002AA
其中,
Figure DEST_PATH_IMAGE004AA
表示低频延展参数;
Figure DEST_PATH_IMAGE006AAA
为第一参考幅度,所述第一参考幅度为第一参考频段内音频的平均幅度与预设指定值之和;所述第一参考频段的频率范围为
Figure DEST_PATH_IMAGE008AA
表示在低于300Hz的频段中,第一个幅度低于
Figure DEST_PATH_IMAGE006AAAA
值6dB的频率。
3.如权利要求1所述的声音分析方法,其特征在于,所述声品质特征包括低频比值,所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过低频比值公式计算所述低频比值,所述低频比值公式为:
Figure DEST_PATH_IMAGE010AA
其中,
Figure DEST_PATH_IMAGE012AAA
为低频比值;
Figure DEST_PATH_IMAGE014AA
表示第n1个倍频程带对应的平均幅度;
Figure DEST_PATH_IMAGE016AA
表示声音均值信号低频部分的上限频率,Band表示频段。
4.如权利要求1所述的声音分析方法,其特征在于,所述声品质特征包括高频延展参数,所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过高频延展公式计算所述高频延展参数,所述高频延展公式为:
Figure DEST_PATH_IMAGE018AA
其中,HFX表示高频延展参数;
Figure DEST_PATH_IMAGE020AA
为第二参考幅度,所述第二参考幅度为第二参考频段内音频的平均幅度,所述第二参考频段为300 Hz~3kHz;
Figure DEST_PATH_IMAGE022AA
表示在5 kHz以上的频段中,第一个幅度低于
Figure DEST_PATH_IMAGE020AAA
值6dB的频率。
5.如权利要求4所述的声音分析方法,其特征在于,所述声品质特征包括高频质量参数,所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过高频质量公式计算所述高频质量参数,所述高频质量公式为:
Figure DEST_PATH_IMAGE024A
其中,
Figure DEST_PATH_IMAGE026A
表示高频质量参数;dB表示分贝; Band表示频段;N1是5 kHz到HFX定义的最高频率之间的1/20倍频程带的总数;
Figure DEST_PATH_IMAGE028A
表示第n2个倍频程带对应的平均幅度,n2为整数,且0<n2≤N1
6.如权利要求1所述的声音分析方法,其特征在于,所述声品质特征包括窄带偏差,所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过窄带偏差公式计算所述窄带偏差,所述窄带偏差公式包括:
Figure DEST_PATH_IMAGE030A
其中,
Figure DEST_PATH_IMAGE032A
表示窄带偏差;dB表示分贝; Band表示频段;N 2是100 Hz到12 kHz之间的1/2倍频程带的总数,
Figure DEST_PATH_IMAGE034A
是第n 3个1/2倍频程带内的平均幅度值,b f 表示频段,
Figure DEST_PATH_IMAGE036A
是第n 3个1/2倍频程带内的频段b f 的幅度值,n3为整数,且0<n3≤N2
7.如权利要求1所述的声音分析方法,其特征在于,所述声品质特征包括频谱平坦度,所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过频谱平坦度公式计算所述频谱平坦度,所述频谱平坦度公式为:
Figure DEST_PATH_IMAGE038A
其中,
Figure DEST_PATH_IMAGE040A
表示频谱平坦度;
Figure DEST_PATH_IMAGE042A
为信号幅度谱在频率点k上的值,K为预设频段范围的上限频率,所述预设频段范围包括300Hz ~20kHz。
8.如权利要求1所述的声音分析方法,其特征在于,所述声品质特征包括中频谐波失真参数,所述通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征,包括:
通过中频谐波失真公式计算所述中频谐波失真参数,所述中频谐波失真公式为:
Figure DEST_PATH_IMAGE044A
其中,
Figure DEST_PATH_IMAGE046A
表示中频谐波失真参数;
Figure DEST_PATH_IMAGE048A
为在300Hz~3000Hz频段中进行测量的频率点的总数,
Figure DEST_PATH_IMAGE050A
为第n4个频率点对应的频率值,
Figure DEST_PATH_IMAGE052A
为与
Figure DEST_PATH_IMAGE050AA
对应的谐波失真参数,nf=3000Hz表示3000Hz的频率所在的频率点,nf=300Hz表示300Hz的频率所在的频率点。
9.如权利要求1所述的声音分析方法,其特征在于,所述根据所述声品质特征确定所述声音均值信号的评价数据,包括:
通过音质评价公式处理所述声品质特征,获得所述评价数据,所述音质评价公式包括:
Figure DEST_PATH_IMAGE054A
其中,S为评价数据;
LFX为低频延展参数,a=-1~1;
Figure DEST_PATH_IMAGE012AAAA
为低频比值,b=0.1~0.3;
Figure DEST_PATH_IMAGE026AA
为高频质量参数,c=-1~1;
Figure DEST_PATH_IMAGE056A
为高频延展参数,d=0.1~3;
Figure DEST_PATH_IMAGE032AA
为窄带偏差,e=-1~1;
Figure DEST_PATH_IMAGE040AA
为频谱平坦度,f=0.1~0.2;
Figure DEST_PATH_IMAGE046AA
为中频谐波失真参数,g=0.1~0.2。
10.如权利要求1所述的声音分析方法,其特征在于,所述预设距离范围是指:一组传声器中的任意两个传声器之间的距离均小于10cm;
一组传声器中的传声器数量大于或等于4个。
11.一种声音分析***,其特征在于,包括依次电性连接的传声器、多通道分析仪、进阶音质分析仪和音质得分计算器;
所述传声器,用于采集指定环境下的声音信号,所述传声器的数量为多个,且任意两个传声器之间的距离小于预设距离;所有所述传声器与所述多通道分析仪并联;
所述多通道分析仪,用于从各个所述传声器接收所述声音信号,根据所有所述声音信号生成声音均值信号;
所述进阶音质分析仪,用于从所述多通道分析仪接收所述声音均值信号,并通过预设声音分析关系解析所述声音均值信号,获得所述声音均值信号的声品质特征;
所述音质得分计算器,用于从进阶音质分析仪接收所述声品质特征,根据所述声品质特征确定所述声音均值信号的评价数据。
12.一种汽车,其特征在于,包括采用如权利要求1至10中任一项所述声音分析方法进行音质分析的汽车音响。
13.一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至10中任一项所述声音分析方法。
CN202010891961.1A 2020-08-31 2020-08-31 声音分析方法、***、汽车及存储介质 Active CN111816207B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010891961.1A CN111816207B (zh) 2020-08-31 2020-08-31 声音分析方法、***、汽车及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010891961.1A CN111816207B (zh) 2020-08-31 2020-08-31 声音分析方法、***、汽车及存储介质

Publications (2)

Publication Number Publication Date
CN111816207A CN111816207A (zh) 2020-10-23
CN111816207B true CN111816207B (zh) 2021-01-26

Family

ID=72859775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010891961.1A Active CN111816207B (zh) 2020-08-31 2020-08-31 声音分析方法、***、汽车及存储介质

Country Status (1)

Country Link
CN (1) CN111816207B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102021116577A1 (de) 2021-06-28 2022-12-29 Audi Aktiengesellschaft Kraftfahrzeug mit einem Mikrofonarray und Verfahren zum Anpassen eines Strahlformungsverfahrens

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20080111290A (ko) * 2007-06-18 2008-12-23 삼성전자주식회사 원거리 음성 인식을 위한 음성 성능을 평가하는 시스템 및방법
JP6098422B2 (ja) * 2013-07-31 2017-03-22 ブラザー工業株式会社 情報処理装置、及びプログラム
CN105989853B (zh) * 2015-02-28 2020-08-18 科大讯飞股份有限公司 一种音频质量评测方法及***
CN108615536B (zh) * 2018-04-09 2020-12-22 华南理工大学 基于麦克风阵列的时频联合特征乐器音质评价***及方法
CN108597498B (zh) * 2018-04-10 2020-09-01 广州势必可赢网络科技有限公司 一种多麦克风语音采集方法及装置
CN109545242A (zh) * 2018-12-07 2019-03-29 广州势必可赢网络科技有限公司 一种音频数据处理方法、***、装置及可读存储介质
CN111326169B (zh) * 2018-12-17 2023-11-10 ***通信集团北京有限公司 一种语音质量的评价方法及装置
CN110390954B (zh) * 2019-08-06 2022-05-13 京东方科技集团股份有限公司 语音产品质量的评价方法和装置

Also Published As

Publication number Publication date
CN111816207A (zh) 2020-10-23

Similar Documents

Publication Publication Date Title
KR101106948B1 (ko) 스펙트럼 수정들에 의한 라우드니스 측정
US9025781B2 (en) Sound quality evaluation apparatus and method thereof
US20050244011A1 (en) Method and apparatus to measure sound quality
WO2020037555A1 (zh) 评估麦克风阵列一致性的方法、设备、装置和***
CN101411213A (zh) 音频***中的校准方法和装置
US6675114B2 (en) Method for evaluating sound and system for carrying out the same
JP5542206B2 (ja) オーディオ・システムの知覚品質を判定する方法およびシステム
CN105530565A (zh) 自动声音均衡装置
US10753965B2 (en) Spectral-dynamics of an audio signal
JP2011501206A (ja) オーディオ送信システムの音声理解度測定方法およびシステム
CN111816207B (zh) 声音分析方法、***、汽车及存储介质
US20040179696A1 (en) Sound field control system and sound field controlling method, as well as sound field space characteristic decision system and sound field space characteristic deciding method
CN111757235A (zh) 一种具有教室语言清晰度测量功能的扩声***
CN116684806A (zh) 扬声器异音测试方法
CN115512718A (zh) 用于存量语音文件的语音质量评价方法、装置及***
WO2019063547A1 (en) METHOD AND ELECTRONIC DEVICE FOR ATTENUATION / AMPLIFICATION OF FORMER
JP4590545B2 (ja) 音響評価方法およびそのシステム
CN114067841A (zh) 声品质评价方法、计算机设备及存储介质
Rund et al. Objective quality assessment for the acoustic zoom
Lee et al. Development of a clarity parameter using a time-varying loudness model
Schäfer A system for instrumental evaluation of audio quality
CN114125686B (zh) 音源装置的音频特性取得方法、***及存储介质
CN115460527A (zh) 基于心理声学的耳机失真测量方法、存储介质、耳机
JPH09325791A (ja) 音質診断装置
CN114203197A (zh) 车内音响音质的客观评价方法、***、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant