CN116229380B - 一种变电站涉鸟故障相关鸟种识别方法 - Google Patents

一种变电站涉鸟故障相关鸟种识别方法 Download PDF

Info

Publication number
CN116229380B
CN116229380B CN202310518425.0A CN202310518425A CN116229380B CN 116229380 B CN116229380 B CN 116229380B CN 202310518425 A CN202310518425 A CN 202310518425A CN 116229380 B CN116229380 B CN 116229380B
Authority
CN
China
Prior art keywords
module
bird
feature
layer
cbs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310518425.0A
Other languages
English (en)
Other versions
CN116229380A (zh
Inventor
李帆
杜修明
邱志斌
饶斌斌
彭诗怡
周志彪
陈文豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Nanchang University
Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Nanchang University
Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Nanchang University, Electric Power Research Institute of State Grid Jiangxi Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202310518425.0A priority Critical patent/CN116229380B/zh
Publication of CN116229380A publication Critical patent/CN116229380A/zh
Application granted granted Critical
Publication of CN116229380B publication Critical patent/CN116229380B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Testing Of Short-Circuits, Discontinuities, Leakage, Or Incorrect Line Connections (AREA)

Abstract

本发明公开了一种变电站涉鸟故障相关鸟种识别方法,该方法基于YOLOv8目标检测算法,引入三重注意力机制、可变形卷积对YOLOv8进行改进,构建改进YOLOv8目标检测模型,通过训练好的改进YOLOv8目标检测模型进行变电站涉鸟故障相关鸟种识别。本发明可为变电站涉鸟故障相关鸟种识别研究提供参考。本发明通过增强特征采集模块的特征提取能力、加强特征融合模块的融合效果和改进检测模块的损失函数,最终增强模型的检测精度和泛化能力以及鲁棒性能。

Description

一种变电站涉鸟故障相关鸟种识别方法
技术领域
本发明属于变电站监测图像数据处理技术领域,具体涉及一种变电站涉鸟故障相关鸟种识别方法。
背景技术
变电站在电力***中起着变电、集中、配电的重要作用。近年来,鸟类活动引起的变电站设备故障事件逐年增多,带来了严重的经济损失和社会影响。变电站分布广且大多数地处人群集中度较小的市郊,独特的地理条件成为鸟类驻足的最佳选择。鸟害主要包括了鸟巢、鸟粪、鸟体短接等故障情况,鸟巢材料在阴雨潮湿天气或雷电等天气,容易导致变电站内导体的短路事故,鸟粪掉落在绝缘子、套管等,降低其绝缘性能,导致闪络引起短路跳闸。频繁的鸟类筑巢、排粪等活动导致变电站内鸟害发生的概率逐渐上升,严重威胁电网的安全稳定运行。现有鸟害防治方法都是利用巡检人员的经验与防鸟装置进行鸟害防治,但是长期运行中鸟类对防鸟装置的适应性,导致其失效并浪费资源。在实际工作中,巡检人员缺乏鸟类相关的专业知识,难以及时识别鸟类种类,导致难以了解其相关活动规律,因此亟需研究一种辅助巡检人员识别鸟类的工具。
随着深度学习的快速发展,深度学习已经突破了传统目标检测算法的瓶颈成为了主流算法。目前流行的目标检测算法有两类。一类是二阶目标检测算法,主要思想是利用选择性搜索方法生成候选区域,然后在候选区域内进行回归分类。但二阶目标检测算法的主要缺点是速度较慢和计算成本较高,二阶目标检测算法需要更多的计算和时间来处理图像中的目标。此外,二阶目标检测算法还需要处理更多的参数和特征,这也会增加计算成本。另外,由于二阶目标检测算法需要处理更多的信息,因此对于小目标或低分辨率图像的检测效果可能会受到影响。另一类是一阶目标检测算法,该算法将检测问题简化为回归问题,只需要卷积神经网络就可以直接获得目标的类别概率和位置坐标,比其他算法速度快,对小目标检测中表现出优异的检测能力。因此,需将一阶目标检测算法应用于变电站涉鸟故障相关鸟种识别中,具有检测速度快和精度高等优点,可为巡检人员提供有效的识鸟工具,进一步提升变电站涉鸟故障的差异化防治效果。
发明内容
鉴于此,本发明的目的在于提供一种变电站涉鸟故障相关鸟种识别方法,用于准确识别出变电站涉鸟故障相关鸟种,为巡检人员提供有效的识鸟工具,进一步提升变电站涉鸟故障的差异化防治效果。
为实现上述目的,本发明提供如下技术方案:一种变电站涉鸟故障相关鸟种识别方法,基于YOLOv8目标检测算法,引入三重注意力机制(triplet attention)、可变形卷积(DCNv2)对YOLOv8进行改进,构建改进YOLOv8目标检测模型,通过训练好的改进YOLOv8目标检测模型进行变电站涉鸟故障相关鸟种识别;所述改进YOLOv8目标检测模型包括特征采集模块、特征融合模块和检测模块;特征采集模块共有14层,第1、2、5、8、11层为DBS模块,第3、6、9、12层为C2F模块,第4、7、10、13层为三重注意力机制,第14层为SPPF模块,并分别从第6层,第9层和第14层提取出特征作为特征融合模块的输入,第6层,第9层和第14层的输出分别为提取特征F1、提取特征F2、提取特征F3;特征融合模块的处理过程为:提取特征F3经过上采样和三重注意力机制后与提取特征F2进行融合获得增强特征F4,增强特征F4经过C2F1模块后获得增强特征F5,增强特征F5依次经过上采样和三重注意力机制后与提取特征F1进行融合获得增强特征F6,增强特征F6经过C2F2模块后获得增强特征F7,增强特征F7依次经过DBS1模块和三重注意力机制后和增强特征F5进行融合获得增强特征F8,增强特征F8经过C2F3模块后获得增强特征F9,增强特征F9依次经过DBS2模块和三重注意力机制后和提取特征F3进行融合获得增强特征F10,增强特征F10经过C2F4模块后获得增强特征F11,最终将增强特征F7、增强特征F9、增强特征F11作为特征融合模块的输出;DBS1模块、DBS2模块的结构与DBS模块相同,所述DBS模块依次由可变形卷积层、BN层和SiLU激活函数构成;检测模块包括三个相同解耦头,将增强特征F7、增强特征F9、增强特征F11分别输入至三个解耦头中。
进一步优选,C2F1模块、C2F2模块、C2F3模块、C2F4模块的结构均与C2F模块相同,C2F模块包括4个分支,第1个分支由CBS1模块组成,第2个分支由CBS1模块和分离模块组成,第3个分支由CBS1模块、分离模块和瓶颈模块组成,第4个分支由CBS1模块、分离模块和两个重复的瓶颈模块组成,4个分支进行融合,由CBS2模块进行特征整合后作为输出,第2、3、4个分支中经过的分离模块为同一个,第3个分支中的瓶颈模块同样作为第4个分支中的第一个瓶颈模块。
进一步优选,SPPF模块包括4个分支,第1个分支由CBS3模块和第一最大池化层组成,第2个分支由CBS3模块、第一最大池化层和第二最大池化层组成,第3个分支由CBS3模块、第一最大池化层、第二最大池化层和第三最大池化层组成,第4个分支由CBS3模块组成,将4个分支进行融合,最后由CBS4模块进行特征整合后作为输出。
具体地,CBS1模块、CBS2模块、CBS3模块、CBS4模块的结构与CBS模块相同,所述 CBS模块依次由普通卷积(conv)、BN层和SiLU激活函数构成。
具体地,所述瓶颈模块由2个CBS模块堆叠组成,并在输入与输出之间添加残差连接,而特征融合模块中使用瓶颈模块(Bottleneck)时则去除残差连接。
进一步优选,所述解耦头拥有两个相同的分支,分支均由2个CBS模块和一个普通卷积(conv)组成,一个分支负责预测框的预测,另一个分支负责种类的预测。
进一步优选,所述解耦头采用Wise-IOU损失函数。
进一步优选,构建变电站涉鸟故障相关鸟种图像数据库,并划分训练集、测试验证集,分别用于改进YOLOv8目标检测模型的训练和验证。
进一步优选,采集变电站运维人员现场拍摄的相关鸟种图像作为原始图像样本集,对原始图像样本集进行扩充,形成变电站涉鸟故障相关鸟种图像数据库,并对变电站涉鸟故障相关鸟种图像数据库的样本集进行标签制作和按照一定比例划分为训练集和测试验证集,再将测试验证集划分为测试集和验证集。
进一步优选,采用改进的DCGAN算法对原始图像样本集进行扩充,所述改进的DCGAN算法主要由生成器G和判别器D两个模块构成;所述生成器G总共有10层,第1层为全连接层,第2层为ECANet注意力机制,第3~8层为卷积层,第9层为CA注意力机制,第10层为256×256卷积层,第3~8层卷积层都添加了BN层和ReLU激活函数,第10层卷积层的激活函数为Tanh函数;判别器D总共有10层,第1层为256×256卷积层,第2层为CA注意力机制,第3~8层为卷积层,第9层为ECANet注意力机制,第10层为全连接层,第3~8层的卷积层都添加了BN层和Leaky_ReLU激活函数,第10层的全连接层激活函数为Sigmoid函数。
进一步优选,采用公开的鸟种图像大规模数据集对改进YOLOv8目标检测模型进行预训练,获得预训练权重,加载预训练权重,再利用训练集的鸟种图像对改进YOLOv8目标检测模型进行重新训练,并在训练过程中使用Mosaic数据增强,获得最优权重;
进一步优选,加载最优权重,将测试集的鸟种图像输入改进YOLOv8目标检测模型中进行检测,检测结果中采用非极大值抑制NMS剔除重合度高于设定值和置信度得分低于设定值的预测框。
与现有技术相比,本发明有益效果:首先,通过改进的DCGAN算法对鸟种图像进行增广,构建变电站涉鸟故障相关鸟种图像数据库,旨在解决图像数据样本小问题;然后引入三重注意力机制、可变形卷积、Wise-IOU对YOLOv8目标检测算法进行改进,增强特征采集模块的特征提取能力、加强特征融合模块的融合效果和改进检测模块的损失函数,最终增强模型的检测精度和泛化能力以及鲁棒性能;最后,使用训练后的改进YOLOv8鸟种目标检测模型对鸟种图像进行检测,能够实现变电站涉鸟故障相关鸟种的准确识别。本发明提出的技术方案在保持较高准确率的同时保证了检测速度,可为巡检人员提供有效的识鸟工具,进一步提升变电站涉鸟故障的差异化防治效果。
附图说明
图1为本发明的方法流程图。
图2为改进的DCGAN算法生成器G示意图。
图3为改进的DCGAN算法判别器D示意图。
图4为改进YOLOv8目标检测算法示意图。
图5为C2F模块示意图。
图6为瓶颈模块示意图。
图7为SPPF模块示意图。
图8为DBS模块示意图。
图9为CBS模块示意图。
具体实施方式
下面结合实施例对本发明做进一步的描述,有必要在此指出的是以下实施例只是用于对本发明进行进一步的说明,不能理解为对本发明保护范围的限制,该领域的技术熟练人员根据上述发明内容所做出的一些非本质的改进和调整,仍属于本发明保护范围。
参照图1,一种变电站涉鸟故障相关鸟种识别方法,包括以下步骤:
S1:构建变电站涉鸟故障相关鸟种图像数据库。采集变电站运维人员现场拍摄的相关鸟种图像作为原始图像样本集,采用改进的DCGAN算法对原始图像样本集进行扩充,并对扩充后的样本集进行标签制作和按照一定比例划分为训练集、验证集和测试集;
本实施例中,选取了喜鹊、八哥、珠颈斑鸠、白头鹎和家燕5种鸟作为研究对象,并根据运维人员现场拍摄的相关鸟种图像,每一种鸟种图像的数量为180张,共计900张鸟种图像作为原始图像样本集。采用改进的DCGAN算法对原始图像样本集进行扩充,每种鸟种扩充70张,因此每种鸟种共计250张图像,总共1250张鸟种图像样本。然后,对扩充后的样本集采用Labelimg标签制作软件进行处理,制作成VOC格式的数据集,并按照9:1的比例划分为训练集和测试验证集(验证集+测试集),再将测试验证集按照9:1的比例划分为测试集和验证集,即训练集为1125张、测试集为113张和验证集为12张。
构建改进的DCGAN算法,改进的DCGAN算法主要由生成器G和判别器D两个模块构成,分别如图2和图3所示,并在两个模块中引入CA注意力机制和ECANet注意力机制,具体结构为:生成器G总共有10层,第1层为全连接层,第2层为ECANet注意力机制,第3~8层为卷积层(依次为4×4卷积层、8×8卷积层、16×16卷积层、32×32卷积层、64×64卷积层、128×128卷积层),第9层为CA注意力机制,第10层为256×256卷积层,第3~8层卷积层都添加了BN层和ReLU激活函数,第10层卷积层的激活函数为Tanh函数;判别器D总共有10层,第1层为256×256卷积层,第2层为CA注意力机制,第3~8层为卷积层(依次为128×128卷积层、64×64卷积层、32×32卷积层、16×16卷积层、8×8卷积层、4×4卷积层),第9层为ECANet注意力机制,第10层为全连接层,第3~8层的卷积层都添加了BN层和Leaky_ReLU激活函数,第10层的全连接层激活函数为Sigmoid函数。训练时,采用800张真实鸟种图像作为网络输入进行训练,训练批次设置为64、生成器G和判别器D的学习率均设置为1×10-4,训练迭代次数为2500轮,并采用SGDM优化器和随机梯度下降法对判别器D进行参数更新及优化。
S2:基于YOLOv8目标检测算法,引入三重注意力机制(triplet attention)、可变形卷积(DCNv2)对YOLOv8进行改进,构建改进YOLOv8目标检测模型。改进YOLOv8目标检测模型包括特征采集模块、特征融合模块和检测模块,如图4所示。
特征采集模块共有14层,第1、2、5、8、11层为DBS模块,第3、6、9、12层为C2F模块,第4、7、10、13层为三重注意力机制,第14层为SPPF模块,其中DBS模块可对输入数据进行卷积操作,提取出其中的特征,再利用激活函数会对卷积层的输出进行非线性变换,增强网络的表达能力,并添加BN层对卷积层的输出进行归一化,提高网络的稳定性和泛化能力;C2F模块对输入的数据进行进一步的特征提取并进行融合和增强特征表达,其结构在保证轻量化的同时获得更加丰富的梯度流信息;SPPF模块对输入特征图进行不同尺度的池化,可以在不改变特征图大小的情况下,提取不同尺度的特征信息,从而适应不同大小的目标,可以减少特征图的大小,降低计算量,同时可以提高检测精度,使得模型更加准确地检测出目标。并分别从第6层,第9层和第14层提取出特征作为特征融合模块的输入,第6层,第9层和第14层的输出分别为提取特征F1、提取特征F2、提取特征F3
特征融合模块具体为,提取特征F3经过上采样和三重注意力机制后与提取特征F2进行融合获得增强特征F4,增强特征F4经过C2F1模块后获得增强特征F5,增强特征F5依次经过上采样和三重注意力机制后与提取特征F1进行融合获得增强特征F6,增强特征F6经过C2F2模块后获得增强特征F7,增强特征F7依次经过DBS1模块和三重注意力机制后和增强特征F5进行融合获得增强特征F8,增强特征F8经过C2F3模块后获得增强特征F9,增强特征F9依次经过DBS2模块和三重注意力机制后和提取特征F3进行融合获得增强特征F10,增强特征F10经过C2F4模块后获得增强特征F11,最终将增强特征F7、增强特征F9、增强特征F11作为特征融合模块的输出。
检测模块具体为:将增强特征F7、增强特征F9、增强特征F11分别输入至三个相同解耦头中,解耦头拥有两个相同的分支,分支均由2个CBS模块和一个普通卷积(conv)组成,一个分支负责预测框的预测,另一个分支负责种类的预测,并利用Wise-IOU损失函数替换原有YOLOv8的CIoU损失函数,其中CBS模块可以提取图像中的特征,规范化输入数据,增加网络的非线性性,从而提高网络的表达能力和训练速度。
本实施例构建的C2F1模块、C2F2模块、C2F3模块、C2F4模块的结构均与C2F模块相同,C2F模块是由CBS1模块、CBS2模块、分离模块(Split)和瓶颈模块(Bottleneck)组成,其中分离模块(Split)可将输入数据分成不同的通道,每个通道对应着不同的特征,为了增强网络的表达能力,使得网络能够更好地捕捉输入数据的不同维度的特征,在通过分离模块之后,每个通道都会被送入不同的卷积层或其他的神经网络层中进行处理,从而得到更加丰富的特征表示,瓶颈模块(Bottleneck)可以减少网络中的参数数量和计算量,并且可以提高网络的精度和泛化能力,如图5所示,C2F模块包括4个分支,第1个分支由CBS1模块组成,第2个分支由CBS1模块和分离模块组成,第3个分支由CBS1模块、分离模块和瓶颈模块组成,第4个分支由CBS1模块、分离模块和两个重复的瓶颈模块组成,4个分支进行融合,由CBS2模块进行特征整合后作为输出,第2、3、4个分支中经过的分离模块为同一个,第3个分支中的瓶颈模块同样作为第4个分支中的第一个瓶颈模块。
DBS1模块、DBS2模块的结构与DBS模块相同,如图8所示,DBS模块依次由可变形卷积层(DCNv2)、BN层和SiLU激活函数构成。
SPPF模块包括4个分支,如图7所示,第1个分支由CBS3模块和第一最大池化层(MaxPool )组成,第2个分支由CBS3模块、第一最大池化层和第二最大池化层组成,第3个分支由CBS3模块、第一最大池化层、第二最大池化层和第三最大池化层组成,第4个分支由CBS3模块组成,将4个分支进行融合,最后由CBS4模块进行特征整合后作为输出。CBS1模块、CBS2模块、CBS3模块、CBS4模块的结构与CBS模块相同,如图9所示,CBS模块依次由普通卷积(conv)、BN层和SiLU激活函数构成。瓶颈模块(Bottleneck)由2个CBS模块堆叠组成,如图6所示,并在输入与输出之间添加残差连接,而特征融合模块中使用瓶颈模块(Bottleneck)时则去除残差连接。
相比于普通卷积引入可变形卷积(DCNv2),可变形卷积能够通过可学习的形变参数使得卷积核具有更加灵活的形状和位置,从而更加准确地适应目标物体的形态和位置,进而进一步提高了深度学习模型的性能;三重注意力机制通过旋转操作和残差变换来建立维度间的依存关系,相比于其他注意力机制,采用了更加轻量级的计算结构,能够在保持较高精度的同时,降低计算量并具有较好的可解释性;Wise-IOU(动态非单调聚焦机制的边界框损失)通过引入置信度信息,能够更加准确地评估目标框与真实框之间的匹配程度和定位精度,在某些特定场景下能够显著提高模型的性能,因此所构建的改进YOLOv8目标检测算法,具有良好的检测能力和鲁棒性能;
S3:训练改进YOLOv8目标检测模型。采用公开的鸟种图像大规模数据集对改进YOLOv8目标检测模型进行预训练,获得预训练权重,加载预训练权重再利用训练集的鸟种图像对改进YOLOv8目标检测模型进行重新训练,并在训练过程中使用Mosaic数据增强,获得最优权重;
本实施例采用公开的鸟种图像大规模数据集对改进YOLOv8目标检测模型进行预训练,获得预训练权重;基于迁移学习思想,以预训练权重作为基础,加载预训练权重再利用训练集的鸟种图像对改进YOLOv8目标检测模型进行重新训练,并设置在训练轮数的前10%使用Mosaic数据增强,训练过程中设置训练轮数为150轮,批量大小为16,起始学习率设置为1×10-3
S4:通过训练好的改进YOLOv8目标检测模型进行变电站涉鸟故障相关鸟种识别。加载最优权重,将测试集的鸟种图像输入改进YOLOv8目标检测模型中进行检测验证模型有效性,检测结果中采用非极大值抑制NMS剔除重合度高于设定值和置信度得分低于设定值的预测框,重合度设定值为0.3,置信度设定值为0.5,通过训练好的改进YOLOv8目标检测模型进行变电站涉鸟故障相关鸟种识别。
本实施例是在CPU为Intel Core i5-8300H、主频2.90GHz、GPU为Nvidia GeForceGTX 2060、cuda10、cudnn7.4.1.5、python、Windows10操作***的软件环境下完成。本实施例引用平均精度均值(mean average precision,mAP)来评价改进YOLOv8鸟种目标检测模型。实验结果表明,113张测试图片的mAP值达97.522%,验证了本实施例提出方法的有效性,可为巡检人员提供有效的识鸟工具,进一步提升变电站涉鸟故障的差异化防治效果。
以上所述仅表达了本发明的优选实施方式,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的内容加以更改或改型为等同变化的等效实施例。但是,凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

Claims (9)

1.一种变电站涉鸟故障相关鸟种识别方法,其特征在于,构建变电站涉鸟故障相关鸟种图像数据库,并划分训练集和测试验证集,分别用于改进YOLOv8目标检测模型的训练和验证;基于YOLOv8目标检测算法,引入三重注意力机制、可变形卷积对YOLOv8进行改进,构建改进YOLOv8目标检测模型;采用公开的鸟种图像大规模数据集对改进YOLOv8目标检测模型进行预训练,获得预训练权重,加载预训练权重,再利用训练集的鸟种图像对改进YOLOv8目标检测模型进行重新训练,并在训练过程中使用Mosaic数据增强,获得最优权重;通过训练好的改进YOLOv8目标检测模型进行变电站涉鸟故障相关鸟种识别;所述改进YOLOv8目标检测模型包括特征采集模块、特征融合模块和检测模块;特征采集模块共有14层,第1、2、5、8、11层为DBS模块,第3、6、9、12层为C2F模块,第4、7、10、13层为三重注意力机制,第14层为SPPF模块,并分别从第6层,第9层和第14层提取出特征作为特征融合模块的输入,第6层,第9层和第14层的输出分别为提取特征F1、提取特征F2、提取特征F3;特征融合模块的处理过程为:提取特征F3经过上采样和三重注意力机制后与提取特征F2进行融合获得增强特征F4,增强特征F4经过C2F1模块后获得增强特征F5,增强特征F5依次经过上采样和三重注意力机制后与提取特征F1进行融合获得增强特征F6,增强特征F6经过C2F2模块后获得增强特征F7,增强特征F7依次经过DBS1模块和三重注意力机制后和增强特征F5进行融合获得增强特征F8,增强特征F8经过C2F3模块后获得增强特征F9,增强特征F9依次经过DBS2模块和三重注意力机制后和提取特征F3进行融合获得增强特征F10,增强特征F10经过C2F4模块后获得增强特征F11,最终将增强特征F7、增强特征F9、增强特征F11作为特征融合模块的输出;DBS1模块、DBS2模块的结构与DBS模块相同,所述DBS模块依次由可变形卷积层、BN层和SiLU激活函数构成;检测模块包括三个相同解耦头,将增强特征F7、增强特征F9、增强特征F11分别输入至三个解耦头中。
2.根据权利要求1所述的变电站涉鸟故障相关鸟种识别方法,其特征在于,C2F1模块、C2F2模块、C2F3模块、C2F4模块的结构均与C2F模块相同,C2F模块包括4个分支,第1个分支由CBS1模块组成,第2个分支由CBS1模块和分离模块组成,第3个分支由CBS1模块、分离模块和瓶颈模块组成,第4个分支由CBS1模块、分离模块和两个重复的瓶颈模块组成,4个分支进行融合,由CBS2模块进行特征整合后作为输出,第2、3、4个分支中经过的分离模块为同一个,第3个分支中的瓶颈模块同样作为第4个分支中的第一个瓶颈模块。
3.根据权利要求2所述的变电站涉鸟故障相关鸟种识别方法,其特征在于,SPPF模块包括4个分支,第1个分支由CBS3模块和第一最大池化层组成,第2个分支由CBS3模块、第一最大池化层和第二最大池化层组成,第3个分支由CBS3模块、第一最大池化层、第二最大池化层和第三最大池化层组成,第4个分支由CBS3模块组成,将4个分支进行融合,最后由CBS4模块进行特征整合后作为输出。
4.根据权利要求3所述的变电站涉鸟故障相关鸟种识别方法,其特征在于,具体地,CBS1模块、CBS2模块、CBS3模块、CBS4模块的结构与CBS模块相同,所述 CBS模块依次由普通卷积、BN层和SiLU激活函数构成。
5.根据权利要求2所述的变电站涉鸟故障相关鸟种识别方法,其特征在于,所述瓶颈模块由2个CBS模块堆叠组成,并在输入与输出之间添加残差连接,而特征融合模块中使用瓶颈模块时则去除残差连接。
6.根据权利要求1所述的变电站涉鸟故障相关鸟种识别方法,其特征在于,所述解耦头拥有两个相同的分支,两个分支均由2个CBS模块和一个普通卷积组成,一个分支负责预测框的预测,另一个分支负责种类的预测;所述解耦头采用Wise-IOU损失函数。
7.根据权利要求1所述的变电站涉鸟故障相关鸟种识别方法,其特征在于,采集变电站运维人员现场拍摄的相关鸟种图像作为原始图像样本集,对原始图像样本集进行扩充,形成变电站涉鸟故障相关鸟种图像数据库,并对变电站涉鸟故障相关鸟种图像数据库的样本集进行标签制作和按照比例划分为训练集和测试验证集,再将测试验证集划分为测试集和验证集。
8.根据权利要求7所述的变电站涉鸟故障相关鸟种识别方法,其特征在于,采用改进的DCGAN算法对原始图像样本集进行扩充,所述改进的DCGAN算法由生成器G和判别器D两个模块构成;所述生成器G总共有10层,第1层为全连接层,第2层为ECANet注意力机制,第3~8层为卷积层,第9层为CA注意力机制,第10层为256×256卷积层,第3~8层卷积层都添加了BN层和ReLU激活函数,第10层卷积层的激活函数为Tanh函数;判别器D总共有10层,第1层为256×256卷积层,第2层为CA注意力机制,第3~8层为卷积层,第9层为ECANet注意力机制,第10层为全连接层,第3~8层的卷积层都添加了BN层和Leaky_ReLU激活函数,第10层的全连接层激活函数为Sigmoid函数。
9.根据权利要求1所述的变电站涉鸟故障相关鸟种识别方法,其特征在于,加载最优权重,将测试集鸟种图像输入改进YOLOv8目标检测模型中进行检测,检测结果中采用非极大值抑制NMS剔除重合度高于设定值和置信度得分低于设定值的预测框。
CN202310518425.0A 2023-05-10 2023-05-10 一种变电站涉鸟故障相关鸟种识别方法 Active CN116229380B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310518425.0A CN116229380B (zh) 2023-05-10 2023-05-10 一种变电站涉鸟故障相关鸟种识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310518425.0A CN116229380B (zh) 2023-05-10 2023-05-10 一种变电站涉鸟故障相关鸟种识别方法

Publications (2)

Publication Number Publication Date
CN116229380A CN116229380A (zh) 2023-06-06
CN116229380B true CN116229380B (zh) 2023-09-12

Family

ID=86589635

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310518425.0A Active CN116229380B (zh) 2023-05-10 2023-05-10 一种变电站涉鸟故障相关鸟种识别方法

Country Status (1)

Country Link
CN (1) CN116229380B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116994287B (zh) * 2023-07-04 2024-05-24 北京市农林科学院 动物盘点方法、装置及动物盘点设备
CN116935473A (zh) * 2023-07-28 2023-10-24 山东智和创信息技术有限公司 基于改进YOLO v7的复杂背景下安全帽佩戴实时检测方法及***
CN117113066B (zh) * 2023-10-25 2024-03-29 南昌大学 一种基于计算机视觉的输电线路绝缘子缺陷检测方法
CN117994253B (zh) * 2024-04-03 2024-06-11 国网山东省电力公司东营供电公司 一种高压配电线路接地故障识别方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115240012A (zh) * 2022-08-19 2022-10-25 国网四川省电力公司电力科学研究院 基于改进YOLOv5的输电线路鸟类检测方法及***
CN115620107A (zh) * 2022-11-07 2023-01-17 国网江西省电力有限公司电力科学研究院 一种基于深度学习的变电站涉鸟故障相关鸟种识别方法
CN115862073A (zh) * 2023-02-27 2023-03-28 国网江西省电力有限公司电力科学研究院 一种基于机器视觉的变电站危害鸟种目标检测和识别方法
CN115937655A (zh) * 2023-02-24 2023-04-07 城云科技(中国)有限公司 多阶特征交互的目标检测模型及其构建方法、装置及应用
CN115984172A (zh) * 2022-11-29 2023-04-18 上海师范大学 一种基于增强特征提取的小目标检测方法
CN116052207A (zh) * 2022-12-07 2023-05-02 国网四川省电力公司阿坝供电公司 基于改进YOLOv7的鸟类识别方法、***及介质
CN116071667A (zh) * 2023-04-07 2023-05-05 北京理工大学 基于历史数据的指定区域内异常飞机目标检测方法及***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10909424B2 (en) * 2018-10-13 2021-02-02 Applied Research, LLC Method and system for object tracking and recognition using low power compressive sensing camera in real-time applications
US11109586B2 (en) * 2019-11-13 2021-09-07 Bird Control Group, Bv System and methods for automated wildlife detection, monitoring and control

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115240012A (zh) * 2022-08-19 2022-10-25 国网四川省电力公司电力科学研究院 基于改进YOLOv5的输电线路鸟类检测方法及***
CN115620107A (zh) * 2022-11-07 2023-01-17 国网江西省电力有限公司电力科学研究院 一种基于深度学习的变电站涉鸟故障相关鸟种识别方法
CN115984172A (zh) * 2022-11-29 2023-04-18 上海师范大学 一种基于增强特征提取的小目标检测方法
CN116052207A (zh) * 2022-12-07 2023-05-02 国网四川省电力公司阿坝供电公司 基于改进YOLOv7的鸟类识别方法、***及介质
CN115937655A (zh) * 2023-02-24 2023-04-07 城云科技(中国)有限公司 多阶特征交互的目标检测模型及其构建方法、装置及应用
CN115862073A (zh) * 2023-02-27 2023-03-28 国网江西省电力有限公司电力科学研究院 一种基于机器视觉的变电站危害鸟种目标检测和识别方法
CN116071667A (zh) * 2023-04-07 2023-05-05 北京理工大学 基于历史数据的指定区域内异常飞机目标检测方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邱志斌等.基于深度迁移学习的输电线路涉鸟故障危害鸟种图像识别.《高电压技术》.2021,第47卷(第11期),全文. *

Also Published As

Publication number Publication date
CN116229380A (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
CN116229380B (zh) 一种变电站涉鸟故障相关鸟种识别方法
CN109873610B (zh) 基于iv特性和深度残差网络的光伏阵列故障诊断方法
CN111680706B (zh) 一种基于编码和解码结构的双通道输出轮廓检测方法
CN114092832B (zh) 一种基于并联混合卷积网络的高分辨率遥感影像分类方法
CN107564025A (zh) 一种基于深度神经网络的电力设备红外图像语义分割方法
CN114067368B (zh) 基于深度卷积特征的电网危害鸟种分类识别方法
CN109635928A (zh) 一种基于深度学习模型融合的电压暂降原因识别方法
CN110427846A (zh) 一种利用卷积神经网络对不平衡小样本的人脸识别方法
CN109934222A (zh) 一种基于迁移学习的绝缘子串自爆识别方法
CN106920007A (zh) 基于二阶自组织模糊神经网络的pm2.5智能预测方法
CN110969194B (zh) 基于改进型卷积神经网络的电缆早期故障定位方法
CN111652835A (zh) 基于深度学习与聚类的输电线路绝缘子缺失的检测方法
CN111369057A (zh) 一种基于深度学习的空气质量预测优化方法及***
CN115994325B (zh) 基于TimeGAN深度学习方法的风机覆冰发电功率数据增强方法
CN113255661B (zh) 一种输电线路涉鸟故障相关鸟种图像识别方法
CN114842208A (zh) 一种基于深度学习的电网危害鸟种目标检测方法
CN112215279B (zh) 一种基于免疫rbf神经网络的电网故障诊断方法
CN116612098B (zh) 一种基于图像处理的绝缘子rtv喷涂质量评价方法和装置
CN113589100A (zh) 基于双向长短期记忆和注意力机制的异常放电识别方法
CN114519293A (zh) 基于小样本机器学习模型的电缆本体故障识别方法
CN110726813B (zh) 基于双层集成神经网络的电子鼻预测方法
CN116611580A (zh) 一种基于多源数据与深度学习的海洋赤潮预测方法
CN116561692A (zh) 一种动态更新的实时量测数据检测方法
CN110543675A (zh) 一种输电线路故障识别方法
Colak et al. Automatic sunspot classification for real-time forecasting of solar activities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant