CN114171057A - 基于声纹的变压器事件检测方法及*** - Google Patents
基于声纹的变压器事件检测方法及*** Download PDFInfo
- Publication number
- CN114171057A CN114171057A CN202111466590.3A CN202111466590A CN114171057A CN 114171057 A CN114171057 A CN 114171057A CN 202111466590 A CN202111466590 A CN 202111466590A CN 114171057 A CN114171057 A CN 114171057A
- Authority
- CN
- China
- Prior art keywords
- data
- sound event
- transformer
- event
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 56
- 239000011159 matrix material Substances 0.000 claims abstract description 69
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000012216 screening Methods 0.000 claims description 72
- 238000007405 data analysis Methods 0.000 claims description 29
- 238000001228 spectrum Methods 0.000 claims description 7
- 230000004927 fusion Effects 0.000 claims description 6
- 238000004458 analytical method Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 238000013467 fragmentation Methods 0.000 claims description 3
- 238000006062 fragmentation reaction Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于声纹的变压器事件检测方法及***,该方法包括:基于待检测变压器音频数据进行分片并获取音频帧;基于音频帧数据输入预设声音事件识别模型获取所述待检测变压器音频数据中存在每类声音事件的概率,所述预设声音事件识别模型的输出为二维矩阵,其中矩阵的第i行第j列的数值表征第j帧音频数据中存在第i类变压器事件的概率值;在输出矩阵的矩阵元素数值大于所述矩阵元素所表征的变压器事件的预设阈值时,确定所述矩阵元素所表征的音频帧中存在所述矩阵元素所表征的变压器事件。本发明对每类声音事件存在的概率进行预测,可以同时确定代检测音频数据中存在的多个不同类别的声音事件。
Description
技术领域
本发明涉及变压器检测技术领域,具体涉及基于声纹的变压器事件检测方法及***。
背景技术
基于声音的变压器事件检测主要是通过录制的音频来预测变压器是否正常工作以及变压器周围的各种事件,比如人声、敲击声、电钻声等。这些事件的检测不仅可以时刻观测变压器的运行状态,还能对潜在的危险事件进行预警。
现有技术中,音频事件检测的一般做法是:首先,提取有效刻画复杂音频事件之间差异的区分性特征;然后,训练分类器对各类音频事件建模;最后,对音频流逐帧或逐窗识别。但是在提取区分性特征的时候,传统音频特征并不一定能有效区分各类复杂音频事件,而且特征提取过程中计算量大,耗费时间长,导致音频事件检测效率低。
发明内容
针对上述现有技术存在的问题,本发明提供了一种基于声纹的变压器事件检测方法及***,该技术方案如下:
第一方面,提供了一种基于声纹的变压器事件检测方法,包括如下步骤:
基于待检测变压器音频数据进行分片并获取音频帧;
基于音频帧数据输入预设声音事件识别模型获取所述待检测变压器音频数据中存在每类声音事件的概率,所述预设声音事件识别模型的输出为二维矩阵,其中矩阵的第i行第j列的数值表征第j帧音频数据中存在第i类变压器事件的概率值;
在输出矩阵的矩阵元素数值大于所述矩阵元素所表征的变压器事件的预设阈值时,确定所述矩阵元素所表征的音频帧中存在所述矩阵元素所表征的变压器事件。
在一种可能的实现方式中,所述预设声音事件识别模型包括数据分析层和级联的m个子声音事件筛选层;
(21)所述第i个子声音事件筛选层用于基于该层的输入数据提取与该层对应的第i类声音事件数据并将提取数据从第二输出端输出到数据分析层,i=1,2,...,m;
(22)所述数据分析层用于接收第i个子声音事件筛选层第二输出端输出的第i类声音事件数据,并判断所述接收的第i类声音事件数据是真实第i类声音事件数据的概率Pi;
(23)在所述数据分析层确定所述Pi小于第i类声音事件的预设阈值时,第i个子声音事件筛选层直接将该层的输入数据通过第一输出端传递到下一个子声音事件筛选层的输入端;
在所述数据分析层确定所述Pi大于第i类声音事件的预设阈值时,第i个子声音事件筛选层将该层基于输入数据提取第i类声音事件数据之后的数据通过第一输出端传递到下一个子声音事件筛选层的输入端。
在一种可能的实现方式中,在基于音频帧数据输入预设声音事件识别模型之前,还包括:
基于音频帧数据提取音频频谱分布数据;
基于音频频谱分布数据获取音频帧数据的能量分布特征数据;
所述第i个子声音事件筛选层基于该层的输入数据提取与该层对应的第i类声音事件数据,包括:
基于输入第i个子声音事件筛选层的待检测音频帧数据的第一能量分布特征数据,与该层预先存储的预设目标第二能量分布特征数据进行计算,判断第一能量分布特征数据是否存在与所述第二能量分布特征数据相似度符合预设条件的部分能量分布特征数据,将所述相似度符合预设条件的部分能量分布特征数据记为第三能量分布特征数据;
若是,则基于所述第三能量分布特征数据提取待检测变压器音频数据中的第i类子声音事件,否则,确定待检测变压器音频数据中不存在第i类子声音事件。
在一种可能的实现方式中,所述级联的m个子声音事件筛选层中,按照m类子声音事件的预设目标第二能量分布特征数据的分布范围大小确定m个子声音事件筛选层的级联先后顺序。
在一种可能的实现方式中,所述变压器事件的类型包括:鸟叫、知了、撞击声、电钻声、说话声、正常声和风声。
在一种可能的实现方式中,基于声纹的变压器事件检测方法还包括:
在输出矩阵的同一列矩阵元素数值均小于所述矩阵元素所表征的变压器事件的预设阈值时,确定所述列矩阵元素所表征的音频帧中存在未知类别的变压器事件。
在一种可能的实现方式中,所述步骤(23)中,在所述数据分析层确定所述Pi大于第i类声音事件的预设阈值时,还包括:
第i个子声音事件筛选层将该层基于输入数据提取的第i类声音事件数据通过第三输出端输出到所述预设声音事件识别模型的输出端,或者数据分析层将接收到的第i个子声音事件筛选层第二输出端输出的第i类声音事件数据输出到所述预设声音事件识别模型的输出端;
所述预设声音事件识别模型输出二维矩阵之后,还包括:
对每帧音频数据中提取的第i类声音事件数据进行融合重构,基于重构之后的融合数据与该帧音频数据的原始数据进行比较,判断所述误差值是否小于预设损失阈值,若是,确定所述预设声音事件识别模型输出的二维矩阵表征的判断结果正确。
第二方面,提供了一种基于声纹的变压器事件检测***,包括:
待检测数据预处理模块,用于基于待检测变压器音频数据进行分片并获取音频帧;
检测分析模块,用于基于音频帧数据输入预设声音事件识别模型获取所述待检测变压器音频数据中存在每类声音事件的概率,所述预设声音事件识别模型的输出为二维矩阵,其中矩阵的第i行第j列的数值表征第j帧音频数据中存在第i类变压器事件的概率值;
检测结果确定模块,用于在输出矩阵的矩阵元素数值大于所述矩阵元素所表征的变压器事件的预设阈值时,确定所述矩阵元素所表征的音频帧中存在所述矩阵元素所表征的变压器事件。
第三方面,提供了一种变压器事件检测设备,所述设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如第一方面所述的变压器事件检测方法。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被处理器执行时实现如第一方面所述变压器事件检测方法的步骤。
本发明的一种基于声纹的变压器事件检测方法及***,具备如下有益效果:
1、本发明中,对每类声音事件存在的概率进行预测,可以同时确定代检测音频数据中存在的多个不同类别的声音事件,比如人声、敲击声、电钻声等,基于这些声音事件类型的检测可以时刻观测变压器的运行状态,同时可以应用于后续对潜在的危险事件进行识别预警的过程。
2、本发明中,预设声音事件识别模型包括数据分析层和级联的m个子声音事件筛选层,通过在每个子声音事件筛选层预先存储该类型的子声音事件的频域能量分布数据,对输入到该层的数据进行对比筛选,并进一步提取待检测变压器音频数据中的对应类型的子声音事件数据,基于数据分析层对该提取的子声音事件数据进行单一类型的子声音事件识别,确定存在该类型子声音事件数据的概率,数据分析层在对混合了多种类型声音事件的待检测变压器音频数据进行声音事件类型数量和声音事件类型识别检测过程中,每次只需要对提取的单一的子声音事件数据进单一类型的子声音事件识别,简化了识别检测过程。
3、本发明中,对于预设声音事件识别模型的识别结果进行再次判断识别正确性,对识别结果中确认存在的子声音事件类型,基于提取的各个子声音事件进行重构,经过与原始待检测变压器音频数据中的对应音频帧数据进行对比,确定原始待检测变压器音频数据中的对应音频帧数据确实同时存在检测结果中存在的子声音事件类型,确保最终对待检测音频帧数据中存在的子声音事件类型数据和子声音事件类型的识别检测结果的准确性。
附图说明
图1是本申请实施例中基于声纹的变压器事件检测方法流程图;
图2是本申请实施例中预设声音事件识别模型的结构框图;
图3是本申请实施例中基于声纹的变压器事件检测***的结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本申请实施例提供了一种基于声纹的变压器事件检测方法,包括如下步骤:
S1:基于待检测变压器音频数据进行分片并获取音频帧;
S2:基于音频帧数据输入预设声音事件识别模型获取所述待检测变压器音频数据中存在每类声音事件的概率,所述预设声音事件识别模型的输出为二维矩阵,其中矩阵的第i行第j列的数值表征第j帧音频数据中存在第i类变压器事件的概率值;
S3:在输出矩阵的矩阵元素数值大于所述矩阵元素所表征的变压器事件的预设阈值时,确定所述矩阵元素所表征的音频帧中存在所述矩阵元素所表征的变压器事件。
本申请实施例中,对每类声音事件存在的概率进行预测,可以同时确定代检测音频数据中存在的多个不同类别的声音事件,比如人声、敲击声、电钻声等,基于这些声音事件类型的检测可以时刻观测变压器的运行状态,同时可以应用于后续对潜在的危险事件进行识别预警的过程。
本申请实施例中,变压器事件的类型包括:鸟叫、知了、撞击声、电钻声、说话声、正常声和风声。
本申请实施例中,数据库中各类声音事件时长不均衡,变压器的正常工作声音的时长要远多于其他事件,同时说话声和知了声样本数量较少,虽然讲话声相对其他类别较少,但考虑到其对变压器的异常情况的预警比较重要,故保留说话声。
其中,不同声音事件对应的概率预设阈值不同,比如鸟叫、知了、撞击声、电钻声、说话声的概率阈值设置0.5,正常声和风声对应的概率预设阈值设置为0.9,即当二维矩阵中的矩阵元素表征第j帧音频数据中存在风声变压器声音事件的概率值大于0.9时,确定第j帧音频数据中存在风声变压器声音事件。
进一步的,上述S2中的预设声音事件识别模型包括数据分析层和级联的m个子声音事件筛选层;
(21)所述第i个子声音事件筛选层用于基于该层的输入数据提取与该层对应的第i类声音事件数据并将提取数据从第二输出端输出到数据分析层,i=1,2,...,m;
(22)所述数据分析层用于接收第i个子声音事件筛选层第二输出端输出的第i类声音事件数据,并判断所述接收的第i类声音事件数据是真实第i类声音事件数据的概率Pi;
(23)在所述数据分析层确定所述Pi小于第i类声音事件的预设阈值时,第i个子声音事件筛选层直接将该层的输入数据通过第一输出端传递到下一个子声音事件筛选层的输入端;
在所述数据分析层确定所述Pi大于第i类声音事件的预设阈值时,第i个子声音事件筛选层将该层基于输入数据提取第i类声音事件数据之后的数据通过第一输出端传递到下一个子声音事件筛选层的输入端。
本申请实施例中,假设m=7,分别有鸟叫、知了、撞击声、电钻声、说话声、正常声和风声7种类型的声音事件,则预设声音事件识别模型的结构关系的一个实施方式如图2所示,假设在i=3时,声音事件类型为电钻声,则在第3个子声音事件筛选层,对输入到该层的输入数据提取电钻声音数据,提取的电钻声音关联数据通过B输出端传输到数据分析层,数据分析层基于该提取的电钻声音数据判断是真实电钻声音的概率,进而确定输入到该层的输入数据中是否表征存在电钻声音事件,若确定存在,则将提取的电钻声音数据通过C输出端输出到模型的输出端,同时将输入到该层的输入数据过滤掉提取的电钻声音数据之后从A输出端传输给第4个子声音事件筛选层,若确定输入到第3层的输入数据中不存在电钻声音事件,则第3层确定提取的电钻声音数据无效,不将提取的电钻声音数据通过C输出端输出到模型的输出端,同时将输入到第3层的输入数据直接从A输出端传输给第4个子声音事件筛选层。在每一个子声音事件筛选层执行过程与上述第3个子声音事件筛选层类似。
进一步的,上述步骤S2,在基于音频帧数据输入预设声音事件识别模型之前,还包括:
基于音频帧数据提取音频频谱分布数据;
基于音频频谱分布数据获取音频帧数据的能量分布特征数据;
在此基础上,上述第i个子声音事件筛选层基于该层的输入数据提取与该层对应的第i类声音事件数据,包括:
基于输入第i个子声音事件筛选层的待检测音频帧数据的第一能量分布特征数据,与该层预先存储的预设目标第二能量分布特征数据进行计算,判断第一能量分布特征数据是否存在与所述第二能量分布特征数据相似度符合预设条件的部分能量分布特征数据,将所述相似度符合预设条件的部分能量分布特征数据记为第三能量分布特征数据;
若是,则基于所述第三能量分布特征数据提取待检测变压器音频数据中的第i类子声音事件,否则,确定待检测变压器音频数据中不存在第i类子声音事件。
本申请实施例中,基于音频帧数据提取音频频谱分布数据优选基于小波分解算法提取,具体的,在采用小波分解过程中同时对高频分量和低频分量进行分解,即同时保留高频分量和低频分量,基于小波分解得到的频域分布数据获取音频帧数据的能量分布特征数据,变压器声音事件中不同类型的声音在频域能量分布上不同,通过在每个子声音事件筛选层预先存储该类型的子声音事件的频域能量分布数据,对输入到该层的数据进行对比筛选,并进一步提取待检测变压器音频数据中的对应类型的子声音事件数据,基于数据分析层对该提取的子声音事件数据进行单一类型的子声音事件识别,确定存在该类型子声音事件数据的概率,在本申请实施例中,数据分析层在对混合了多种类型声音事件的待检测变压器音频数据进行声音事件类型数量和声音事件类型识别检测过程中,每次只需要对提取的单一的子声音事件数据进单一类型的子声音事件识别,简化了识别检测过程。当然,在每个子声音事件筛选层在对输入到该层的数据进行对比筛选时,也有可能会判定待检测变压器音频数据中不存在第i类子声音事件。
进一步的,上述级联的m个子声音事件筛选层中,按照m类子声音事件的预设目标第二能量分布特征数据的分布范围大小确定m个子声音事件筛选层的级联先后顺序。
具体的,第i类子声音事件的预设目标第二能量分布特征数据的分布范围越大,在级联结构中越靠后,例如,若第1类子声音事件的预设目标第二能量分布特征数据的分布范围小于第2类子声音事件,则在预设声音事件识别模型中,第1类子声音事件对应的第1个子声音事件筛选层在先,先对第1类子声音事件进行识别判断,若确定存在第1类子声音事件,则在后的子声音事件筛选层的输入数据中过滤了该第1类子声音事件的音频(特征)数据,不影响后续对第2类子声音事件的识别判断,若在对第1类子声音事件进行识别判断时,确定不存在第1类子声音事件,也可实现避免后续对第2类子声音事件的识别判断,确保对待检测变压器音频数据中存在的声音事件类型数量及声音事件类型的准确识别检测。
当然,若存在若干个子声音事件的预设目标第二能量分布特征数据的分布范围完全不存在交集,则对该若干个子声音事件对应的声音事件筛选层的先后顺序不做具体限定。
进一步的,本申请实施例中,基于声纹的变压器事件检测方法还包括:
在输出矩阵的同一列矩阵元素数值均小于所述矩阵元素所表征的变压器事件的预设阈值时,确定所述列矩阵元素所表征的音频帧中存在未知类别的变压器事件。
本申请实施例中,在数据分析层对每一类的子声音事件检测结果的概率值均小于对应的概率预设阈值时,级联的m个子声音事件筛选层中的最后一个子声音事件筛选层会输出与第1个子声音事件筛选层的输入数据相同的数据,即m个子声音事件筛选层均未进行有效的子声音事件数据提取,此时确定识别的音频帧数据中存在未知类别的子声音事件。
进一步,在上述步骤(23)中,在所述数据分析层确定所述Pi大于第i类声音事件的预设阈值时,还包括:
第i个子声音事件筛选层将该层基于输入数据提取的第i类声音事件数据通过第三输出端输出到所述预设声音事件识别模型的输出端,或者数据分析层将接收到的第i个子声音事件筛选层第二输出端输出的第i类声音事件数据输出到所述预设声音事件识别模型的输出端;
所述预设声音事件识别模型输出二维矩阵之后,还包括:
对每帧音频数据中提取的第i类声音事件数据进行融合重构,基于重构之后的融合数据与该帧音频数据的原始数据进行比较,判断所述误差值是否小于预设损失阈值,若是,确定所述预设声音事件识别模型输出的二维矩阵表征的判断结果正确。
本申请实施例中,为了确保最终对待检测音频帧数据中存在的子声音事件类型数据和子声音事件类型的识别检测结果的准确性,基于识别结果,对识别结果中确认存在的子声音事件类型,基于提取的各个子声音事件进行重构,经过与原始待检测变压器音频数据中的对应音频帧数据进行对比,确定原始待检测变压器音频数据中的对应音频帧数据确实同时存在检测结果中存在的子声音事件类型。
图3是根据一示例性实施例示出的一种基于声纹的变压器事件检测***的框图,参照图3,该变压器事件检测***包括:
待检测数据预处理模块,用于基于待检测变压器音频数据进行分片并获取音频帧;
检测分析模块,用于基于音频帧数据输入预设声音事件识别模型获取所述待检测变压器音频数据中存在每类声音事件的概率,所述预设声音事件识别模型的输出为二维矩阵,其中矩阵的第i行第j列的数值表征第j帧音频数据中存在第i类变压器事件的概率值;
检测结果确定模块,用于在输出矩阵的矩阵元素数值大于所述矩阵元素所表征的变压器事件的预设阈值时,确定所述矩阵元素所表征的音频帧中存在所述矩阵元素所表征的变压器事件。
关于上述实施例中的变压器事件检测***,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本申请实施例中还提供了一种变压器事件检测设备,该设备可以包括:处理器,用于存储处理器可执行指令的存储器,其中,所述处理器通过运行所述可执行指令以实现如上述的基于声纹的变压器事件检测方法。该电子设备还可以包括多媒体组件,输入/输出(I/O)接口,以及通信组件中的一者或多者。
其中,处理器用于控制该变压器事件检测设备的整体操作,以完成上述的变压器事件检测方法中的全部或部分步骤。存储器用于存储各种类型的数据以支持在该电子设备的操作。
在一示例性实施例中,还提供一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被处理器执行时实现如上述的基于声纹的变压器事件检测方法的步骤。
本发明不局限于上述具体的实施方式,本领域的普通技术人员从上述构思出发,不经过创造性的劳动,所做出的种种变换,均落在本发明的保护范围之内。
Claims (10)
1.基于声纹的变压器事件检测方法,其特征在于,包括:
基于待检测变压器音频数据进行分片并获取音频帧;
基于音频帧数据输入预设声音事件识别模型获取所述待检测变压器音频数据中存在每类声音事件的概率,所述预设声音事件识别模型的输出为二维矩阵,其中矩阵的第i行第j列的数值表征第j帧音频数据中存在第i类变压器事件的概率值;
在输出矩阵的矩阵元素数值大于所述矩阵元素所表征的变压器事件的预设阈值时,确定所述矩阵元素所表征的音频帧中存在所述矩阵元素所表征的变压器事件。
2.根据权利要求1所述的基于声纹的变压器事件检测方法,其特征在于,所述预设声音事件识别模型包括数据分析层和级联的m个子声音事件筛选层;
(21)所述第i个子声音事件筛选层用于基于该层的输入数据提取与该层对应的第i类声音事件数据并将提取数据从第二输出端输出到数据分析层,i=1,2,...,m;
(22)所述数据分析层用于接收第i个子声音事件筛选层第二输出端输出的第i类声音事件数据,并判断所述接收的第i类声音事件数据是真实第i类声音事件数据的概率Pi;
(23)在所述数据分析层确定所述Pi小于第i类声音事件的预设阈值时,第i个子声音事件筛选层直接将该层的输入数据通过第一输出端传递到下一个子声音事件筛选层的输入端;
在所述数据分析层确定所述Pi大于第i类声音事件的预设阈值时,第i个子声音事件筛选层将该层基于输入数据提取第i类声音事件数据之后的数据通过第一输出端传递到下一个子声音事件筛选层的输入端。
3.根据权利要求2所述的基于声纹的变压器事件检测方法,其特征在于,在基于音频帧数据输入预设声音事件识别模型之前,还包括:
基于音频帧数据提取音频频谱分布数据;
基于音频频谱分布数据获取音频帧数据的能量分布特征数据;
所述第i个子声音事件筛选层基于该层的输入数据提取与该层对应的第i类声音事件数据,包括:
基于输入第i个子声音事件筛选层的待检测音频帧数据的第一能量分布特征数据,与该层预先存储的预设目标第二能量分布特征数据进行计算,判断第一能量分布特征数据是否存在与所述第二能量分布特征数据相似度符合预设条件的部分能量分布特征数据,将所述相似度符合预设条件的部分能量分布特征数据记为第三能量分布特征数据;
若是,则基于所述第三能量分布特征数据提取待检测变压器音频数据中的第i类子声音事件,否则,确定待检测变压器音频数据中不存在第i类子声音事件。
4.根据权利要求3所述的基于声纹的变压器事件检测方法,其特征在于,所述级联的m个子声音事件筛选层中,按照m类子声音事件的预设目标第二能量分布特征数据的分布范围大小确定m个子声音事件筛选层的级联先后顺序。
5.根据权利要求1所述的基于声纹的变压器事件检测方法,其特征在于,所述变压器事件的类型包括:鸟叫、知了、撞击声、电钻声、说话声、正常声和风声。
6.根据权利要求1所述的基于声纹的变压器事件检测方法,其特征在于,还包括:
在输出矩阵的同一列矩阵元素数值均小于所述矩阵元素所表征的变压器事件的预设阈值时,确定所述列矩阵元素所表征的音频帧中存在未知类别的变压器事件。
7.根据权利要求2所述的基于声纹的变压器事件检测方法,其特征在于,所述步骤(23)中,在所述数据分析层确定所述Pi大于第i类声音事件的预设阈值时,还包括:
第i个子声音事件筛选层将该层基于输入数据提取的第i类声音事件数据通过第三输出端输出到所述预设声音事件识别模型的输出端,或者数据分析层将接收到的第i个子声音事件筛选层第二输出端输出的第i类声音事件数据输出到所述预设声音事件识别模型的输出端;
所述预设声音事件识别模型输出二维矩阵之后,还包括:
对每帧音频数据中提取的第i类声音事件数据进行融合重构,基于重构之后的融合数据与该帧音频数据的原始数据进行比较,判断所述误差值是否小于预设损失阈值,若是,确定所述预设声音事件识别模型输出的二维矩阵表征的判断结果正确。
8.基于声纹的变压器事件检测***,其特征在于,包括:
待检测数据预处理模块,用于基于待检测变压器音频数据进行分片并获取音频帧;
检测分析模块,用于基于音频帧数据输入预设声音事件识别模型获取所述待检测变压器音频数据中存在每类声音事件的概率,所述预设声音事件识别模型的输出为二维矩阵,其中矩阵的第i行第j列的数值表征第j帧音频数据中存在第i类变压器事件的概率值;
检测结果确定模块,用于在输出矩阵的矩阵元素数值大于所述矩阵元素所表征的变压器事件的预设阈值时,确定所述矩阵元素所表征的音频帧中存在所述矩阵元素所表征的变压器事件。
9.一种变压器事件检测设备,其特征在于,所述设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1-7中任一项所述的变压器事件检测方法。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述指令被处理器执行时实现如权利要求1-7中任一项所述变压器事件检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111466590.3A CN114171057A (zh) | 2021-12-03 | 2021-12-03 | 基于声纹的变压器事件检测方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111466590.3A CN114171057A (zh) | 2021-12-03 | 2021-12-03 | 基于声纹的变压器事件检测方法及*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114171057A true CN114171057A (zh) | 2022-03-11 |
Family
ID=80483131
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111466590.3A Pending CN114171057A (zh) | 2021-12-03 | 2021-12-03 | 基于声纹的变压器事件检测方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114171057A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117572134A (zh) * | 2024-01-15 | 2024-02-20 | 武汉大学 | 一种基于声音采集阵列检测的变压器故障分析方法及*** |
-
2021
- 2021-12-03 CN CN202111466590.3A patent/CN114171057A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117572134A (zh) * | 2024-01-15 | 2024-02-20 | 武汉大学 | 一种基于声音采集阵列检测的变压器故障分析方法及*** |
CN117572134B (zh) * | 2024-01-15 | 2024-04-05 | 武汉大学 | 一种基于声音采集阵列检测的变压器故障分析方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108648748B (zh) | 医院噪声环境下的声学事件检测方法 | |
EP4078918B1 (en) | Real-time voice phishing detection | |
CN112289323B (zh) | 语音数据处理方法、装置、计算机设备和存储介质 | |
CN109599117A (zh) | 一种音频数据识别方法及人声语音防重放识别*** | |
CN109309675A (zh) | 一种基于卷积神经网络的网络入侵检测方法 | |
CN109087667B (zh) | 语音流利度识别方法、装置、计算机设备及可读存储介质 | |
Duan et al. | Timed probabilistic automaton: a bridge between raven and song scope for automatic species recognition | |
CN113077821A (zh) | 音频质量检测方法、装置、电子设备及存储介质 | |
CN114171057A (zh) | 基于声纹的变压器事件检测方法及*** | |
CN115100739A (zh) | 人机行为检测方法、***、终端设备及存储介质 | |
CN110738080A (zh) | 一种识别改装机动车的方法、装置和电子设备 | |
Naranjo-Alcazar et al. | On the performance of residual block design alternatives in convolutional neural networks for end-to-end audio classification | |
CN111476102A (zh) | 一种安全防护方法、中控设备及计算机存储介质 | |
CN112562727B (zh) | 应用于音频监控的音频场景分类方法、装置以及设备 | |
CN113282920A (zh) | 日志异常检测方法、装置、计算机设备和存储介质 | |
CN112420056A (zh) | 基于变分自编码器的说话人身份鉴别方法、***及无人机 | |
CN111933180B (zh) | 音频拼接检测方法、***、移动终端及存储介质 | |
CN113362854A (zh) | 基于稀疏自注意力机制的声学事件检测方法、***、存储介质及设备 | |
CN112349298A (zh) | 声音事件识别方法、装置、设备和存储介质 | |
CN113178196B (zh) | 音频数据提取方法、装置、计算机设备和存储介质 | |
CN112019786B (zh) | 智能教学录屏方法和*** | |
Zhou et al. | Environmental sound classification of western black-crowned gibbon habitat based on subspace method and DenseNet121 | |
CN113571085B (zh) | 语音分离方法、***、装置和存储介质 | |
CN115378702B (zh) | 一种基于Linux***调用的攻击检测*** | |
CN111179546B (zh) | 一种自适应分布式音频报警方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |