CN117746905A - 基于时频持续性分析的人类活动影响评估方法及*** - Google Patents
基于时频持续性分析的人类活动影响评估方法及*** Download PDFInfo
- Publication number
- CN117746905A CN117746905A CN202410179329.2A CN202410179329A CN117746905A CN 117746905 A CN117746905 A CN 117746905A CN 202410179329 A CN202410179329 A CN 202410179329A CN 117746905 A CN117746905 A CN 117746905A
- Authority
- CN
- China
- Prior art keywords
- signal
- signal frame
- frequency
- energy
- effective
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000694 effects Effects 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000002688 persistence Effects 0.000 title claims abstract description 34
- 238000004458 analytical method Methods 0.000 title claims abstract description 31
- 230000005236 sound signal Effects 0.000 claims abstract description 32
- 239000013598 vector Substances 0.000 claims abstract description 12
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 11
- 238000009432 framing Methods 0.000 claims abstract description 5
- 238000012544 monitoring process Methods 0.000 claims description 49
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000010586 diagram Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000001360 synchronised effect Effects 0.000 claims description 4
- 238000001514 detection method Methods 0.000 abstract description 10
- 238000011156 evaluation Methods 0.000 abstract description 6
- 238000012545 processing Methods 0.000 abstract description 4
- 230000007547 defect Effects 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000739 chaotic effect Effects 0.000 description 1
- 230000030808 detection of mechanical stimulus involved in sensory perception of sound Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- VEMKTZHHVJILDY-UHFFFAOYSA-N resmethrin Chemical compound CC1(C)C(C=C(C)C)C1C(=O)OCC1=COC(CC=2C=CC=CC=2)=C1 VEMKTZHHVJILDY-UHFFFAOYSA-N 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明涉及语音分析处理技术领域,具体涉及基于时频持续性分析的人类活动影响评估方法及***,该方法包括:采集音频信号并进行分帧处理得到各信号帧,构建信号周期的振幅特征组;计算各信号帧的活跃显著因子;根据各信号帧的活跃显著因子、对应振幅的信息熵以及各信号周期的振幅特征组得到各信号帧的有效稳态因子;构建各信号帧的有效置信权重,并结合频域中各频率分量的信号衰减率计算信号帧的高能有效因子;将短时能量及高能有效因子组成有效二维向量;计算各信号帧的高能效持续系数以提取各活动帧,基于活动帧对人类活动影响进行评估。从而实现对人类活动影像进行准确评估,避免传统VAD端点检测算法难以准确判定活动帧的弊端。
Description
技术领域
本发明涉及语音分析处理技术领域,具体涉及基于时频持续性分析的人类活动影响评估方法及***。
背景技术
随着可持续发展理念的深入人心以及科学技术的不断进步,自然资源的合理利用与保护得到广泛的提倡与发展。人类活动对于自然环境和生态******有着深远而广泛的影响,人类活动影响评估的目的是衡量人类活动对于生态***的影响变化程度,以便后续相关人员采取相应的管理和保护措施;而盗伐是指人类活动中非法砍伐和非授权采伐森林资源的行为,严重破坏了生态***的平衡和可持续利用。通过监测生态***中的声音信号能够实现对环境中人类盗伐行为的监测和评估,促进生态环境的可持续发展和保护。
由于生态***环境较为复杂,各种环境音与噪音掺杂,而传统的VAD端点检测算法(Voice Activity Detection)仅通过短时能量以及过零率来确定活动帧阈值,导致在分析自然生态***声音时难以准确的判定活动帧,进而无法排除无声段和非目标声音段的干扰,影响后续评估人类活动影响。
发明内容
为了解决上述技术问题,本发明的目的在于提供基于时频持续性分析的人类活动影响评估方法及***,所采用的技术方案具体如下:
第一方面,本发明实施例提供了基于时频持续性分析的人类活动影响评估方法,该方法包括以下步骤:
采集自然生态***的音频信号并进行分帧处理得到各信号帧;将每个信号帧对应的声音信号绘制相应的时域波形图;
根据信号帧的时域波形图中各周期的振幅最大值、最小值构建信号周期的振幅特征组;根据各信号帧在频域中各频率分量对应的主频率能量及信号帧的过零率得到各信号帧的活跃显著因子;根据各信号帧的活跃显著因子、对应振幅的信息熵以及各信号周期的振幅特征组之间的余弦相似度得到各信号帧的有效稳态因子;根据各信号帧的有效稳态因子、信号帧在频域内各频率分量的3dB带宽得到各信号帧的有效置信权重;计算信号帧在频域中各频率分量的信号衰减率,根据各信号帧的有效置信权重以及频域中各频率分量的信号衰减率的分布情况得到各信号帧的高能有效因子;将各信号帧的短时能量及高能有效因子组成各信号帧的有效二维向量;根据各信号帧的短时能量、高能有效因子以及各信号帧与其他信号帧的有效二维向量之间的皮尔逊相关系数构建各信号帧的高能效持续系数;
结合监测区间内各信号帧的高能效持续系数结合大津法得到各活动帧,基于活动帧对人类活动影响进行评估。
进一步地,所述根据信号帧的时域波形图中各周期的振幅最大值、最小值构建信号周期的振幅特征组,包括:将振幅最大值和最小值组成对应信号周期的振幅特征组。
进一步地,所述根据各信号帧在频域中各频率分量对应的主频率能量及信号帧的过零率得到各信号帧的活跃显著因子,包括:
将信号帧的过零率作为以自然常数为底数的指数函数的指数;
统计信号帧在频率内所有频率分量中的最大主频率能量值,计算所述最大主频率能量值与各频率分量的主频能量差值的和值;
将所述和值的倒数与所述指数函数的乘积的结果作为信号帧的活跃显著因子。
进一步地,所述根据各信号帧的活跃显著因子、对应振幅的信息熵以及各信号周期的振幅特征组之间的余弦相似度得到各信号帧的有效稳态因子,包括:
计算信号帧所包含的所有振幅的信息熵,获取信号帧的活跃显著因子与所述信息熵的比值;计算信号帧所有任意两个信号周期的振幅特征组的余弦相似度的和值,将所述比值与所述和值的乘积作为信号帧的有效稳态因子。
进一步地,所述根据各信号帧的有效稳态因子、信号帧在频域内各频率分量的3dB带宽得到各信号帧的有效置信权重,包括:
计算信号帧所有频率分量的3dB带宽的均值,获取信号帧在频域内各频率分量的3dB带宽与所述均值的差值绝对值,获取信号帧在频域内所有频率分量的所述差值绝对值的和值的倒数;
将信号帧的有效稳态因子与所述倒数的乘积作为信号帧的有效置信权重。
进一步地,所述计算信号帧在频域中各频率分量的信号衰减率,包括:将各频率分量的主频率能量与各频率分量的3dB带宽的比值作为各频率分量的信号衰减率。
进一步地,所述根据各信号帧的有效置信权重以及频域中各频率分量的信号衰减率的分布情况得到各信号帧的高能有效因子,包括:
计算信号帧中所有频率分量的信号衰减率的均值,获取信号帧在频域中所有频率分量的信号衰减率与所述均值的差值绝对值的和值,将信号帧的有效置信权重与所述和值的倒数的乘积作为信号帧的高能有效因子。
进一步地,所述根据各信号帧的短时能量、高能有效因子以及各信号帧与其他信号帧的有效二维向量之间的皮尔逊相关系数构建各信号帧的高能效持续系数,具体包括:
对于各信号帧,计算信号帧与其他信号帧的有效二维向量之间的皮尔逊相关系数的和值,将所述和值作为以自然常数为底数的指数函数的指数;
计算信号帧的高能有效因子与所有信号帧高能有效因子的均值的差值绝对值,获取信号帧的短时能量与所述差值绝对值的比值,将所述比值与所述指数函数的计算结果的乘积作为信号帧的高能效持续系数。
进一步地,所述结合监测区间内各信号帧的高能效持续系数结合大津法得到各活动帧,基于活动帧对人类活动影响进行评估,包括:
预设监测区间的时长,采用大津法计算监测区间内所有信号帧的高能效持续系数的分割阈值,当信号帧的高能效持续系数大于等于分割阈值时,则判定为活动帧;
将监测区间内所有活动帧作为输入,使用PSOLA基音同步叠加算法获取监测区间内所有活动帧拼接形成语音段;当生态区域在监测区间内的语音段持续时长大于等于预设时间阈值时,人类活动对自然生态***存在影响,反之,不存在影响。
第二方面,本发明实施例还提供了基于时频持续性分析的人类活动影响评估***,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述方法的步骤。
本发明至少具有如下有益效果:
本发明根据监测区间内的信号特征构建信号帧的有效置信权重,综合考虑了监测区间内各信号帧中信号的时域、频域特征以及信号活跃稳定特征,后续结合信号帧内声音信号受噪声的干扰程度以及信号持续规律特征获得高能效持续系数,能够更为准确的衡量信号帧中包含持续规律的有效信号程度,根据高能效持续系数构建高能效持续系数序列获得分割阈值,通过分割阈值判断信号帧是否属于活动帧,避免了传统VAD端点检测算法难以准确的判定活动帧的弊端,同时根据本发明判断后的活动帧能够较好的反映检测区间内生态区域中的人类活动状况,后续通过活动帧语音段总时长对人类活动影响进行评估,实现结合声音时频持续性分析的人类活动影响的精确评估。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明一个实施例提供的基于时频持续性分析的人类活动影响评估方法的步骤流程图;
图2为自然生态***中声音信号的时域波形图示意图;
图3为自然生态***中声音信号的时域频谱图示意图;
图4为自然生态***中声音信号的频谱幅度图示意图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于时频持续性分析的人类活动影响评估方法及***,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一个或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于时频持续性分析的人类活动影响评估方法及***的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于时频持续性分析的人类活动影响评估方法的步骤流程图,该方法包括以下步骤:
步骤S001,对自然生态***中的声音信号进行采集获取,并对获取的音频信号进行预处理。
使用单声道声音传感器对自然生态***中的声音信号进行连续采集,本发明中使用的声音传感器有效监测范围为以传感器为中心的20m范围,按照所有声音传感器在自然生态***中的安放位置以及传感器的有效监测范围对生态***进行区域划分(即将每一个传感器的监测范围作为一个生态区域),本实施例中声音传感器的信号采样率为22.05kHz,声音传感器的数量为,设置每10min为一个监测区间,本实施例中/>为625,实施者可根据实际情况自行设定。
为方便后续对各个生态区域中声音信号进行特征分析,还需对上述声音信号进行分帧预处理,本发明的分帧预处理操作中,将声音信号帧长设置为20ms,帧移选择帧长的,为后续更精确的分析自然生态***中声音信号的频域特征,选择汉明窗对每一帧的声音信号进行加窗操作,前一帧与当前帧的重叠比例为50%,由于分帧处理为公知技术,本实施例不再过多赘述。
至此,可获得监测区间内各个生态区域的各信号帧。
步骤S002,根据监测区间内的信号特征构建信号帧的有效置信权重,通过有效置信权重结合信号帧受噪声干扰程度以及信号持续规律特征获得高能效持续系数,根据信号帧的高能效持续系数构建高能效持续系数序列,通过分割阈值判断信号帧是否属于活动帧,实现监测区间内各个生态区域中声音信号的端点检测。
由于人类盗伐活动涉及机械设备如电锯等工具的使用,这些工具在操作时会产生振动和高频噪声,导致声音信号具有较高的过零率以及较高的能量,且人类盗伐活动会保持一定的持续时间,致使人类盗伐活动产生的声音信号也具有较强的规律性;由于生态区域中的自然环境音(包括但不限于风声、水声)具有更广泛的频谱特征,因此其具备较低的过零率以及信号能量,而自然环境音中的动物叫声通常属于高频信息,具有较高的能量以及过零率,但由于动物叫声信号的自身特性,其信号稳定性相比较人类盗伐声音信号来说较差。自然生态***中声音信号的时域波形图如图2所示,图2中横坐标为时间,纵坐标为波形的振幅;自然生态***中声音信号的时域频谱图如图3所示,图3中横坐标为频率,纵坐标为幅值;自然生态***中声音信号的频谱幅度图如图4所示,图4中,横坐标为离散频率,纵坐标为幅值。
现以一个生态区域为例进行分析,根据每个信号帧对应的声音信号振幅值绘制相应的时域波形图,将信号帧对应声音信号的振幅按照时间先后顺序构建该信号帧的振幅序列。通过傅里叶变换将每个信号帧中的声音信号转换到频域中,确定信号帧对应频谱中的基频包络,将基频包络中最大能量值对应的频率作为基频频率,通过对基频频率求倒数获得信号周期大小t,根据信号周期大小对信号帧进行周期划分。需要说明的是,信号帧的周期获取实施者可选取其他现有技术进行计算,信号周期的获取方法有很多,且为现有技术,本实施例对此不做特殊限制。将第j个信号帧中第t个信号周期的振幅最大值以及振幅最小值构建该信号周期的振幅特征组记为,其中/>、分别为第j个信号帧中第t个信号周期内的振幅最大、最小值。
将信号帧在频域中每个频率分量(即每个信号包络)中的能量最大值作为该频率分量的主频率能量,将信号帧在频域中所有频率分量的主频率能量按照频率分量在频谱图中的先后顺序构建该信号帧的能量极值序列记为d,同时计算信号帧内每个频率分量的3dB带宽记为Wb,由于频率分量的3dB带宽计算为公知技术,此处不再过多赘述。
基于上述分析,将信号帧对应声音段中存在的人类盗伐行为声音信号记为有效信号,之后构建每个信号帧的有效置信权重,用于表征各个信号帧对应声音段内包含有效信号的可能性大小,计算过程具体如下:
其中,为第j个信号帧的活跃显著因子;/>为第j个信号帧在频域中的频率分量总数;/>、/>分别为第j个信号帧在频域内所有频率分量中的最大主频率能量值以及第j个信号帧对应频域内第k个频率分量的主频率能量;/>为第j个信号帧中的声音信号过零率,由于信号帧的过零率计算为公知技术,此处不再赘述计算过程。/>为调整参数,经验值为1,防止计算过程中出现分母为0的情况,/>的取值实施者可自行设定。
当第j个信号帧中的基频能量值与所述信号帧中每个频率分量的主频率能量之间的差值之和越小时,即越小,表示该信号帧对应频域中的基频与各个频率分量之间的能量分布越集中,即该信号帧中的声音成分越明显;同时当该信号帧中的声音信号过零率越大时,即/>越大,表示该信号帧中的声音信号波形变化速度越快,该信号帧中的声音成分越活跃,即活跃显著因子/>越大。
为第j个信号帧的有效稳态因子;/>为第j个信号帧的活跃显著因子;/>为第j个信号帧对应振幅序列的信息熵,也即第j个信号帧所包含的所有振幅的信息熵;/>为第j个信号帧中的信号周期总个数;/>、/>分别为第j个信号帧中第t、v个信号周期的振幅特征组;/>为振幅特征组/>与/>之间的余弦相似度。
当第j个信号帧的活跃显著因子越大时,即越大,表示该信号帧中的声音成分越活跃;同时当第j个信号帧对应振幅序列的信息熵越小时,即/>越小,表示该信号帧对应振幅序列的混乱波动程度越小;同时当第j个信号帧中所有信号周期对应的振幅特征组之间的余弦相似度之和越大时,即/>越大,表示该信号帧中所有信号周期对应的振幅特征组之间的相似程度越大,该信号帧中的声音成分在越活跃的基础上稳定性越强,即有效稳态因子/>越大。
为第j个信号帧的有效置信权重;/>为第j个信号帧的有效稳态因子;/>为第j个信号帧在频域中的频率分量总数;/>、/>分别为第j个信号帧对应频域内第n个频率分量的3dB带宽以及第j个信号帧中所有频率分量的3dB带宽均值;/>分母加/>是为了避免分母为零的情况。
当第j个信号帧的有效稳态因子越大时,即越大,表示该信号帧中的声音成分在越活跃的基础上稳定性越强;同时当第j个信号帧对应频域中所有频率分量的3dB带宽与所述信号帧中所有频率分量的3dB带宽均值之间的差值绝对值之和越小时,即越小,表示该信号帧中不同频率分量之间存在的频率间隔越模糊,即该信号帧中的声音成分具有更集中的频率分布,该信号帧对应的声音段中存在有效信号的可能性越大,有效置信权重/>越大。
通过上述方式可获得生态区域各个信号帧的有效置信权重,直接将信号帧的有效置信权重作为活动帧的判定条件时,并没有考虑到信号帧中有效信号受噪声的干扰程度以及有效信号持续规律程度,可能会导致后续活动帧的漏判,影响最终评估结果。
基于上述分析,本发明构建每个信号帧的高能效持续系数,用于表征信号帧中包含持续规律的有效信号程度:
其中,为第j个信号帧的高能有效因子;/>为第j个信号帧在频域中的频率分量总数;/>、/>分别为第j个信号帧对应频域中第k个频率分量的信号衰减率以及第j个信号帧对应频域中所有频率分量信号衰减率均值,频率分量的信号衰减率计算过程为:该频率分量的主频率能量与所述频率分量的3dB带宽之比;/>为第j个信号帧的有效置信权重。
当第j个信号帧对应频域内每个频率分量的信号衰减率与所有频率分量信号衰减率均值之间的差值绝对值之和越小时,即越小,表示该信号帧对应的声音信号受到噪声干扰的情况越轻微;同时当第j个信号帧的有效置信权重越大时,表示该信号帧中存在有效信号的可能性越大,即高能有效因子/>越大。
获取第j个信号帧的短时能量记为,本实施例中通过信号帧对应所有时域信号的振幅平方求和获得;根据信号帧的短时能量以及高能有效因子构建该信号帧的有效二维向量记为/>。进一步,就散各信号帧的高能效持续系数,表达式为:
为第j个信号帧的高能效持续系数;/>为第j个信号帧的短时能量,由于信号帧的短时能量计算过程为公知技术,本实施例不再过多赘述;/>、/>分别为第j个信号帧的高能有效因子以及第j个信号帧所处监测区间中所有信号帧高能有效因子均值;/>为监测区间中的信号帧总个数;/>、/>分别为第j、z个信号帧的有效二维向量;为有效二维向量/>、/>之间的皮尔逊相关系数;/>为调整参数,经验值为1,防止计算过程中出现分母为0的情况,具体取值实施者亦可自行设定。
当第j个信号帧的短时能量越大时,即越大,表示该信号帧中越包含较为明显的声音成分;同时当第j个信息帧的高能有效因子与所述监测区间内所有信息帧高能有效因子均值之间的差值绝对值越小时,即/>越小,表示该信号帧中有效信号受噪声干扰状况以及有效信号存在可能性与该信号帧所处监测区间内所有信号帧的有效信号平均受干扰状况以及平均存在可能性之间的差异较小;同时当第j个信号帧与监测区间内其余所有信号帧对应的有效二维向量之间的皮尔逊相关系数之和越大时,即越大,表示该信号帧中的短时能量与高能有效因子与监测区间内其余信号帧之间的正相关性越高,在监测区间内该信号帧中的有效信号持续状况越显著,该信号帧越应该被判定为活动帧,即高能效持续系数/>越大。
至此,可获得监测区间内各个信号帧的高能效持续系数。根据监测区间内所有信号帧的高能效持续系数按照时间先后顺序构建高能效持续序列,通过OTSU大津法获得高能效持续序列中的分割阈值,OTSU大津法的输入为基于监测区间的高能效持续序列,算法输出为分割阈值。
当信号帧的高能效持续系数大于等于分割阈值时,将该信号帧判定为活动帧;反之将该信号帧判定为非活动帧。将监测区间内所有活动帧作为输入,使用PSOLA(PitchSynchronous Overlap Add)基音同步叠加算法获取监测区间内所有活动帧拼接形成的语音段,PSOLA算法为公知技术,具体获取过程不再赘述。
至此,可获得监测区间内所有相邻活动帧拼接形成的语音段,记录每一个语音段的起始点与终止点,并将其作为VAD端点检测算法的输出,实现对监测区间内该生态区域声音信号的端点检测。由于OTSU大津法与VAD端点检测算法均为公知技术,本发明不再过多赘述。
根据上述方式可实现对生态区域中声音信号的端点检测,用于后续对人类活动对于自然生态***的影响进行评估。
步骤S003,通过所获取的监测区间内各个生态区域的活动帧语音段总时长对人类活动影响进行评估。
根据上述方式可获得监测区间内各个生态区域包含的每个活动帧拼接语音段总时长,当监测区间内生态区域包含的所有活动帧语音段的持续时间大于等于预设时间阈值时,判定该生态区域在此监测区间中人类活动对于自然生态***存在影响;反之,当监测区间内生态区域包含的所有活动帧语音段的持续时间小于预设时间阈值时,判定该生态区域在此监测区间中人类活动对于自然生态***不存在影响。其中,预设时间阈值实施者自行设定,本实施例对此不做特殊限制,本实施例中预设时间阈值设定为监测区间时长的。
至此,可通过上述方式实现基于时频持续性分析的人类活动影响评估方法。
基于与上述方法相同的发明构思,本发明实施例还提供了基于时频持续性分析的人类活动影响评估***,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于时频持续性分析的人类活动影响评估方法中任意一项所述方法的步骤。
综上所述,本发明实施例根据监测区间内的信号特征构建信号帧的有效置信权重,综合考虑了监测区间内各信号帧中信号的时域、频域特征以及信号活跃稳定特征,后续结合信号帧内声音信号受噪声的干扰程度以及信号持续规律特征获得高能效持续系数,能够更为准确的衡量信号帧中包含持续规律的有效信号程度,根据高能效持续系数构建高能效持续系数序列获得分割阈值,通过分割阈值判断信号帧是否属于活动帧,避免了传统VAD端点检测算法难以准确的判定活动帧的弊端,同时根据本发明实施例所判定的活动帧能够较好的反映检测区间内生态区域中的人类活动状况,后续通过活动帧语音段总时长对人类活动影响进行准确评估。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于时频持续性分析的人类活动影响评估方法,其特征在于,该方法包括以下步骤:
采集自然生态***的音频信号并进行分帧处理得到各信号帧;将每个信号帧对应的声音信号绘制相应的时域波形图;
根据信号帧的时域波形图中各周期的振幅最大值、最小值构建信号周期的振幅特征组;根据各信号帧在频域中各频率分量对应的主频率能量及信号帧的过零率得到各信号帧的活跃显著因子;根据各信号帧的活跃显著因子、对应振幅的信息熵以及各信号周期的振幅特征组之间的余弦相似度得到各信号帧的有效稳态因子;根据各信号帧的有效稳态因子、信号帧在频域内各频率分量的3dB带宽得到各信号帧的有效置信权重;计算信号帧在频域中各频率分量的信号衰减率,根据各信号帧的有效置信权重以及频域中各频率分量的信号衰减率的分布情况得到各信号帧的高能有效因子;将各信号帧的短时能量及高能有效因子组成各信号帧的有效二维向量;根据各信号帧的短时能量、高能有效因子以及各信号帧与其他信号帧的有效二维向量之间的皮尔逊相关系数构建各信号帧的高能效持续系数;
结合监测区间内各信号帧的高能效持续系数结合大津法得到各活动帧,基于活动帧对人类活动影响进行评估。
2.如权利要求1所述的基于时频持续性分析的人类活动影响评估方法,其特征在于,所述根据信号帧的时域波形图中各周期的振幅最大值、最小值构建信号周期的振幅特征组,包括:将振幅最大值和最小值组成对应信号周期的振幅特征组。
3.如权利要求1所述的基于时频持续性分析的人类活动影响评估方法,其特征在于,所述根据各信号帧在频域中各频率分量对应的主频率能量及信号帧的过零率得到各信号帧的活跃显著因子,包括:
将信号帧的过零率作为以自然常数为底数的指数函数的指数;
统计信号帧在频率内所有频率分量中的最大主频率能量值,计算所述最大主频率能量值与各频率分量的主频能量差值的和值;
将所述和值的倒数与所述指数函数的乘积的结果作为信号帧的活跃显著因子。
4.如权利要求2所述的基于时频持续性分析的人类活动影响评估方法,其特征在于,所述根据各信号帧的活跃显著因子、对应振幅的信息熵以及各信号周期的振幅特征组之间的余弦相似度得到各信号帧的有效稳态因子,包括:
计算信号帧所包含的所有振幅的信息熵,获取信号帧的活跃显著因子与所述信息熵的比值;计算信号帧所有任意两个信号周期的振幅特征组的余弦相似度的和值,将所述比值与所述和值的乘积作为信号帧的有效稳态因子。
5.如权利要求1所述的基于时频持续性分析的人类活动影响评估方法,其特征在于,所述根据各信号帧的有效稳态因子、信号帧在频域内各频率分量的3dB带宽得到各信号帧的有效置信权重,包括:
计算信号帧所有频率分量的3dB带宽的均值,获取信号帧在频域内各频率分量的3dB带宽与所述均值的差值绝对值,获取信号帧在频域内所有频率分量的所述差值绝对值的和值的倒数;
将信号帧的有效稳态因子与所述倒数的乘积作为信号帧的有效置信权重。
6.如权利要求1所述的基于时频持续性分析的人类活动影响评估方法,其特征在于,所述计算信号帧在频域中各频率分量的信号衰减率,包括:将各频率分量的主频率能量与各频率分量的3dB带宽的比值作为各频率分量的信号衰减率。
7.如权利要求6所述的基于时频持续性分析的人类活动影响评估方法,其特征在于,所述根据各信号帧的有效置信权重以及频域中各频率分量的信号衰减率的分布情况得到各信号帧的高能有效因子,包括:
计算信号帧中所有频率分量的信号衰减率的均值,获取信号帧在频域中所有频率分量的信号衰减率与所述均值的差值绝对值的和值,将信号帧的有效置信权重与所述和值的倒数的乘积作为信号帧的高能有效因子。
8.如权利要求1所述的基于时频持续性分析的人类活动影响评估方法,其特征在于,所述根据各信号帧的短时能量、高能有效因子以及各信号帧与其他信号帧的有效二维向量之间的皮尔逊相关系数构建各信号帧的高能效持续系数,具体包括:
对于各信号帧,计算信号帧与其他信号帧的有效二维向量之间的皮尔逊相关系数的和值,将所述和值作为以自然常数为底数的指数函数的指数;
计算信号帧的高能有效因子与所有信号帧高能有效因子的均值的差值绝对值,获取信号帧的短时能量与所述差值绝对值的比值,将所述比值与所述指数函数的计算结果的乘积作为信号帧的高能效持续系数。
9.如权利要求8所述的基于时频持续性分析的人类活动影响评估方法,其特征在于,所述结合监测区间内各信号帧的高能效持续系数结合大津法得到各活动帧,基于活动帧对人类活动影响进行评估,包括:
预设监测区间的时长,采用大津法计算监测区间内所有信号帧的高能效持续系数的分割阈值,当信号帧的高能效持续系数大于等于分割阈值时,则判定为活动帧;
将监测区间内所有活动帧作为输入,使用PSOLA基音同步叠加算法获取监测区间内所有活动帧拼接形成语音段;当生态区域在监测区间内的语音段持续时长大于等于预设时间阈值时,人类活动对自然生态***存在影响,反之,不存在影响。
10.基于时频持续性分析的人类活动影响评估***,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410179329.2A CN117746905B (zh) | 2024-02-18 | 2024-02-18 | 基于时频持续性分析的人类活动影响评估方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410179329.2A CN117746905B (zh) | 2024-02-18 | 2024-02-18 | 基于时频持续性分析的人类活动影响评估方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117746905A true CN117746905A (zh) | 2024-03-22 |
CN117746905B CN117746905B (zh) | 2024-04-19 |
Family
ID=90278080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410179329.2A Active CN117746905B (zh) | 2024-02-18 | 2024-02-18 | 基于时频持续性分析的人类活动影响评估方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117746905B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118173100A (zh) * | 2024-05-15 | 2024-06-11 | 百鸟数据科技(北京)有限责任公司 | 基于声音的盗伐监测方法及设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5876899A (ja) * | 1981-10-31 | 1983-05-10 | 株式会社東芝 | 音声区間検出装置 |
US20060002566A1 (en) * | 2004-06-28 | 2006-01-05 | Samsung Electronics Co., Ltd. | System and method for estimating speaker's location in non-stationary noise environment |
WO2015139452A1 (zh) * | 2014-03-17 | 2015-09-24 | 华为技术有限公司 | 根据频域能量对语音信号进行处理的方法和装置 |
US20170301207A1 (en) * | 2016-04-19 | 2017-10-19 | University Of South Carolina | Impact Force Estimation And Event Localization |
WO2018011794A1 (en) * | 2016-07-10 | 2018-01-18 | B.G. Negev Technologies And Applications Ltd., At Ben-Gurion University | Methods and systems for estimation of obstructive sleep apnea severity in wake subjects by multiple speech analyses |
US20200251129A1 (en) * | 2019-02-04 | 2020-08-06 | Fujitsu Limited | Voice processing method and voice processing apparatus |
CN116884431A (zh) * | 2023-08-03 | 2023-10-13 | 西华大学 | 基于cfcc特征的鲁棒音频复制粘贴篡改检测方法及装置 |
CN116992219A (zh) * | 2023-09-07 | 2023-11-03 | 博睿康科技(常州)股份有限公司 | 基于噪声检测指标的信号质量表征单元、噪声源定位方法 |
-
2024
- 2024-02-18 CN CN202410179329.2A patent/CN117746905B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5876899A (ja) * | 1981-10-31 | 1983-05-10 | 株式会社東芝 | 音声区間検出装置 |
US20060002566A1 (en) * | 2004-06-28 | 2006-01-05 | Samsung Electronics Co., Ltd. | System and method for estimating speaker's location in non-stationary noise environment |
WO2015139452A1 (zh) * | 2014-03-17 | 2015-09-24 | 华为技术有限公司 | 根据频域能量对语音信号进行处理的方法和装置 |
US20170301207A1 (en) * | 2016-04-19 | 2017-10-19 | University Of South Carolina | Impact Force Estimation And Event Localization |
WO2018011794A1 (en) * | 2016-07-10 | 2018-01-18 | B.G. Negev Technologies And Applications Ltd., At Ben-Gurion University | Methods and systems for estimation of obstructive sleep apnea severity in wake subjects by multiple speech analyses |
US20200251129A1 (en) * | 2019-02-04 | 2020-08-06 | Fujitsu Limited | Voice processing method and voice processing apparatus |
CN116884431A (zh) * | 2023-08-03 | 2023-10-13 | 西华大学 | 基于cfcc特征的鲁棒音频复制粘贴篡改检测方法及装置 |
CN116992219A (zh) * | 2023-09-07 | 2023-11-03 | 博睿康科技(常州)股份有限公司 | 基于噪声检测指标的信号质量表征单元、噪声源定位方法 |
Non-Patent Citations (1)
Title |
---|
郝雪: "多媒体直播场景下实时语音活动检测算法研究与实现", 中国优秀硕士学位论文全文数据库信息科技辑, no. 01, 15 January 2024 (2024-01-15) * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118173100A (zh) * | 2024-05-15 | 2024-06-11 | 百鸟数据科技(北京)有限责任公司 | 基于声音的盗伐监测方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN117746905B (zh) | 2024-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111816218B (zh) | 语音端点检测方法、装置、设备及存储介质 | |
CN117746905B (zh) | 基于时频持续性分析的人类活动影响评估方法及*** | |
EP2788980B1 (en) | Harmonicity-based single-channel speech quality estimation | |
CN103236260B (zh) | 语音识别*** | |
CN106504763A (zh) | 基于盲源分离与谱减法的麦克风阵列多目标语音增强方法 | |
CN104464722B (zh) | 基于时域和频域的语音活性检测方法和设备 | |
CN105788603A (zh) | 一种基于经验模态分解的音频识别方法及*** | |
CN106885971B (zh) | 一种用于电缆故障检测定点仪的智能背景降噪方法 | |
CN111429932A (zh) | 语音降噪方法、装置、设备及介质 | |
CN106157967A (zh) | 脉冲噪声抑制 | |
CN110265065B (zh) | 一种构建语音端点检测模型的方法及语音端点检测*** | |
CN103189916A (zh) | 估计信号模式的方法和设备 | |
CN112786059A (zh) | 一种基于人工智能的声纹特征提取方法及装置 | |
CN111785288A (zh) | 语音增强方法、装置、设备及存储介质 | |
CN112750461B (zh) | 语音通信优化方法、装置、电子设备及可读存储介质 | |
CN107393549A (zh) | 时延估计方法及装置 | |
Hidayat et al. | A Modified MFCC for Improved Wavelet-Based Denoising on Robust Speech Recognition. | |
CN115223583A (zh) | 一种语音增强方法、装置、设备及介质 | |
Labied et al. | An overview of automatic speech recognition preprocessing techniques | |
CN112735466B (zh) | 一种音频检测方法及装置 | |
CN106356076A (zh) | 基于人工智能的语音活动性检测方法和装置 | |
CN112712818A (zh) | 语音增强方法、装置、设备 | |
CN106128480B (zh) | 一种对带噪语音进行语音活动检测的方法 | |
CN105791530A (zh) | 输出音量调节方法和装置 | |
CN110875037A (zh) | 语音数据处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |