CN113707159A

CN113707159A - 一种基于Mel语图与深度学习的电网涉鸟故障鸟种识别方法

Info

Publication number: CN113707159A
Application number: CN202110878327.9A
Authority: CN
Inventors: 邱志斌; 卢祖文; 廖才波; 王海祥
Original assignee: Nanchang University
Current assignee: Nanchang University
Priority date: 2021-08-02
Filing date: 2021-08-02
Publication date: 2021-11-26
Anticipated expiration: 2041-08-02
Also published as: CN113707159B

Abstract

本发明公开了一种基于Mel语图与深度学习的电网涉鸟故障鸟种识别方法。首先建立电网涉鸟故障相关鸟种的鸣声样本数据库，对鸟鸣信号进行预处理操作后，计算每帧信号在各个Mel滤波器中的能量，得到包含信号能量大小信息的M×N矩阵，将能量大小与颜色深浅程度一一映射，得到鸟鸣信号的Mel语图。通过Mel语图训练卷积神经网络，执行卷积‑池化过程不断地抓取学习鸟鸣信号的Mel语图特征，通过多次迭代训练调整网络内部参数，当网络的预测输出值与实际值之间的损失达到最小时结束训练，最终实现对测试鸟种的预测识别。该方法能够有效区分不同鸟种鸣声之间的特征并实现鸟种识别，可为开展电网涉鸟故障差异化防治提供参考。

Description

一种基于Mel语图与深度学习的电网涉鸟故障鸟种识别方法

技术领域

本发明涉及输电线路领域，具体涉及一种基于Mel语图与深度学习的电网涉鸟故障鸟种识别方法。

背景技术

鸟类活动是引起架空输电线路故障的重要原因之一，虽然各类防鸟装置已经得到广泛应用，但仍存在较大的盲目性，未能有效抑制涉鸟故障的上升趋势，因防鸟装置失效引起的线路跳闸故障也时有发生。此外，由于涉鸟故障具有瞬时性，故障发生后，运维人员往往难以判断引起故障的鸟种，缺乏智能化的鸟种识别及故障原因判定方法，难以针对性地采取涉鸟故障防治措施。因此，有必要开展架空输电线路涉鸟故障相关鸟种智能识别研究，为线路运维人员正确识鸟提供依据。

目前较为传统的鸟鸣识别方法是提取声音信号的线性预测倒谱系数(LPCC)、Mel倒谱系数(MFCC)、功率谱密度等特征，结合随机森林(RF)、支持向量机(SVM)、隐马尔科夫模型(HMM)、高斯混合模型(GMM)等分类算法开展分类预测，这些传统的方法特征提取困难，识别准确率不高。

发明内容

针对现有技术存在的问题，本发明的目的在于提供一种基于Mel语图与深度学习的电网涉鸟故障鸟种识别方法，根据鸟鸣信号识别出鸟种所属类别，为输电线路开展针对性与差异化防鸟提供依据。

为达到此发明目的，本发明采用以下技术方案，包括如下步骤：

S1：依据统计的电网涉鸟故障主要鸟种并结合电网的实际情况，建立相关鸟种鸣声数据库；

S2：针对鸣声数据库中的样本，进行去噪、分帧、加窗预处理，采用多窗谱估计的改进谱减法去除鸟鸣信号中的杂音，通过设置帧长和帧移的大小，对鸟鸣信号进行分帧，再乘以一个窗函数以增加帧两端的连续性；

S3：通过计算每一帧鸟鸣信号在各个Mel滤波器中的能量，计算得到鸣声样本的Mel能量，得到包含信号能量大小信息的M×N阶矩阵，将能量大小与颜色深浅程度一一映射，得到鸟鸣信号的Mel语图，并将其划分为训练集、验证集和测试集；

S4：搭建卷积神经网络分类模型，以训练集的Mel语图作为输入进行多次迭代训练，训练过程中对验证集进行测试以调整模型的参数，当网络的预测输出值与实际值之间的损失达到最小时结束训练；

S5：利用训练好的网络对测试集鸟种进行预测识别，输出对应的鸟种类别。

进一步地，S3中所述Mel语图的计算过程如下：对于一段M帧的鸟鸣信号，设置N个Mel滤波器，经Mel能量计算得到一个M×N的矩阵，按照能量大小进行着色得到Mel语图，Mel语图中横纵坐标分别为帧数和滤波器个数，仅需计算M×N个数据量，简化输出的同时减少计算时间。

进一步地，S4中所述卷积神经网络包含多个用于抓取Mel语图特征的卷积-池化过程，调整网络参数和网络迭代次数对训练集进行训练，每当模型训练完一定轮次，模型即对验证集开展一次预测并根据验证集预测结果对参数作出相应调整，往预测准确率高的方向修正，直至网络的损失函数值降至最低，网络训练结束。

本发明的有益效果是：

本发明提供的基于Mel语图与深度学习的电网涉鸟故障鸟种识别方法，克服了传统语音特征提取技术特征冗杂、数据量大、区分度不够的局限性，进一步促进了精准识鸟，从而为差异化防鸟提供指导，提高输电线路和变电站涉鸟故障防治的精准性和有效性。

附图说明

附图1是本发明中的一种基于Mel语图与深度学习的电网涉鸟故障鸟种识别方法实施流程图；

附图2是本发明实施例中的鸟鸣信号去噪效果图；

附图3是本发明实施例中的部分鸟鸣信号波形及其Mel语图；

附图4是本发明实施例中的卷积神经网络结构示意图。

具体实施方式

下面结合实施例对本发明做进一步的描述，有必要在此指出的是以下实施例只是用于对本发明进行进一步的说明，不能理解为对本发明保护范围的限制，该领域的技术熟练人员根据上述发明内容所做出的一些非本质的改进和调整，仍属于本发明的保护范围。

随着深度学习的快速发展，新兴的语音识别方法倾向于将声音信号转换为线性调频谱图、傅里叶频谱图等语谱图作为深度学习模型的特征输入。本发明采用一种将鸟鸣声音信号转化为Mel语图再结合卷积神经网络进行分类识别的方法对输电线路涉鸟故障相关鸟种进行预测分类。

以下对输电线路涉鸟故障相关典型鸟种的鸣声信号处理、Mel语图计算和卷积神经网络训练过程进行详细阐述，如图1所示，包括以下步骤：

S1：依据统计的电网涉鸟故障主要鸟种并结合电网的实际情况，建立相关鸟种鸣声数据库。

本实施例中，依据某省电网运维人员统计的输电线路涉鸟故障主要鸟种并结合电网的实际情况，挑选了引起鸟巢类、鸟粪类、鸟体短接类和鸟啄类四种故障类型的40种典型鸟类作为研究对象，包括乌鸫、凤头麦鸡、喜鹊、四声杜鹃、夜鹭、大嘴乌鸦、大天鹅、大杜鹃、家燕、小嘴乌鸦、崖沙燕、戴胜、斑鱼狗、普通燕鸥、松鸦、池鹭、灰头绿啄木鸟、灰椋鸟、灰雁、灰鹤、环颈斑鸠、白头鹎、白鹭、秃鼻乌鸦、红嘴鸥、红尾伯劳、红角鸮、红隼、纵纹腹小鸮、翘鼻麻鸭、翠鸟、苍鹭、苍鹰、赤麻鸭、银鸥、雕鸮、骨顶鸡、鹌鹑、鹗、鹰鸮，从公开数据集中获取其鸣声信号建立样本库。

S2：针对鸣声数据库中的样本，进行去噪、分帧、加窗等预处理，采用多窗谱估计的改进谱减法去除鸟鸣信号中的杂音，通过设置帧长和帧移的大小，对鸟鸣信号进行分帧，再乘以一个窗函数以增加帧两端的连续性。

本实施例中，对所有鸟鸣音频信号进行格式统一、去噪、分帧、加窗等预处理操作，利用GoldWave和Sox软件将所有音频的采样频率设为16000Hz，声道设为单声道，并将音频长度统一裁剪为1秒的长度，以.wav格式保存；对音频进行分帧，分别将帧长和帧移设置为0.025秒和0.01秒，将每一个音频样本分割成98帧；再选用汉明窗进行加窗操作，以增加帧两端的连续性；采用多窗谱估计的改进谱减法对语音进行去噪，去噪效果示例如图2所示，(a)为含噪声的大杜鹃语音，(b)为去噪后的大杜鹃语音。

S3：通过计算每一帧鸟鸣信号在各个Mel滤波器中的能量，计算得到鸣声样本的Mel能量，得到包含信号能量大小信息的M×N阶矩阵，将能量大小与颜色深浅程度一一映射，得到鸟鸣信号的Mel语图，并将其划分为训练集、验证集和测试集。

Mel语图是鸟鸣信号的图像表现形式，不同鸟种形成的Mel语图具有差异。在本实施例中，鸟鸣信号被分为98帧，设置了40个Mel滤波器，经Mel能量计算得到一个98×40的数据矩阵，按照能量大小进行着色便可得到鸟鸣信号的Mel语图，Mel语图中横纵坐标分别为帧数和滤波器个数，仅需计算98×40个数据量，简化输出的同时减少了计算时间。图3为部分鸟鸣信号波形及其对应的Mel语图，(a)、(b)、(c)分别为大杜鹃、红角鸮、红嘴鸥的语音波形，(d)、(e)、(f)分别为大杜鹃、红角鸮、红嘴鸥的Mel语图，其用帧数结合Mel滤波器个数的形式来描述一段鸟鸣信号，可区分不同鸟种的鸣声。

本实施例中，将获取的Mel语图按照8∶1∶1比例划分为训练集、验证集和测试集。

S4：搭建卷积神经网络分类模型，以训练集的Mel语图作为输入进行多次迭代训练，训练过程中对验证集进行测试以调整模型的参数，当网络的预测输出值与实际值之间的损失达到最小时结束训练。

本实施例中，搭建一个24层的卷积神经网络模型，如图4所示，以训练集作为输入进行训练，卷积神经网络包含多个用于抓取Mel语图特征的卷积-池化过程，设置0.01的初始学习率对训练集进行训练，并在训练完30轮之后将学习率降低为原来的1/10，每当模型训练完一定轮次，模型即对验证集开展一次预测并根据验证集预测结果对网络内参数作出相应调整，往预测准确率高的方向修正。卷积神经网络的训练实质上是一个最小化损失函数的过程，通过不断地迭代优化寻求网络预测输出值与实际值之间最小的损失，达到学习图像特征匹配最佳类别的目的。本实施例中卷积神经网络使用的损失函数是交叉熵函数，表达式为：

m为样本总数，k为样本的类别数，1{y_i＝j}为示性函数，当括号内值为真时输出为1，反之为0，

表示第i个样本预测为第j类的概率。当网络的损失函数值降至最低时，网络训练结束。

本实施例中，由于训练和测试样本都是随机选取的，为了避免分类结果的偶然性，共开展3组不同训练样本集下的分类测试，平均预测准确率为96.7％。可见，采用鸣声信号的Mel语图作为特征量，使用多窗谱估计的改进谱减法对语音进行去噪，利用卷积神经网络建立深度学习模型，可以较准确地识别出对输电线路安全运行造成威胁的相关鸟种，进而为差异化防鸟提供指导。

应当理解的是，本说明书未详细阐述的部分均属于现有技术。

虽然以上结合附图描述了本发明的具体实施方式，但是本领域普通技术人员应当理解，这些仅是举例说明，可以对这些实施方式做出多种变形或修改，而不背离本发明的原理和实质。本发明的范围仅由所附权利要求书限定。

Claims

1.一种基于Mel语图与深度学习的电网涉鸟故障鸟种识别方法，其特征在于：包括如下步骤：

2.如权利要求1所述的一种基于Mel语图与深度学习的电网涉鸟故障鸟种识别方法，其特征在于：S3中所述Mel语图的计算过程如下：对于一段M帧的鸟鸣信号，设置N个Mel滤波器，经Mel能量计算得到一个M×N的矩阵，按照能量大小进行着色得到Mel语图，Mel语图中横纵坐标分别为帧数和滤波器个数，仅需计算M×N个数据量，简化输出的同时减少计算时间。

3.如权利要求1所述的一种基于Mel语图与深度学习的电网涉鸟故障鸟种识别方法，其特征在于：S4中所述卷积神经网络包含多个用于抓取Mel语图特征的卷积-池化过程，调整网络参数和网络迭代次数对训练集进行训练，每当模型训练完一定轮次，模型即对验证集开展一次预测并根据验证集预测结果对参数作出相应调整，往预测准确率高的方向修正，直至网络的损失函数值降至最低，网络训练结束。