CN114022432B - 基于改进的yolov5的绝缘子缺陷检测方法 - Google Patents

基于改进的yolov5的绝缘子缺陷检测方法 Download PDF

Info

Publication number
CN114022432B
CN114022432B CN202111261977.5A CN202111261977A CN114022432B CN 114022432 B CN114022432 B CN 114022432B CN 202111261977 A CN202111261977 A CN 202111261977A CN 114022432 B CN114022432 B CN 114022432B
Authority
CN
China
Prior art keywords
yolov
network
training
insulator
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111261977.5A
Other languages
English (en)
Other versions
CN114022432A (zh
Inventor
唐靓
余明慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN202111261977.5A priority Critical patent/CN114022432B/zh
Publication of CN114022432A publication Critical patent/CN114022432A/zh
Application granted granted Critical
Publication of CN114022432B publication Critical patent/CN114022432B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/0008Industrial image inspection checking presence/absence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30164Workpiece; Machine component

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及绝缘子缺陷检测技术,具体涉及基于改进的yolov5的绝缘子缺陷检测方法,包括采集绝缘子图像形成数据集;使用LabelImg标注工具对数据集进行标注;对所采集的图像进行数据增强处理;在YOLOv5的骨干网络中引入triplet attention模块;优化损失函数;将CIoU作为改进YOLOv5算法的bounding‑box损失函数LossCIoU;训练改进后的网络;将绝缘子图像数据集输入训练好的YOLOv5网络,得到输入图片中是否存在有缺陷的绝缘子以及该缺陷所在位置。该方法减少了漏检,消除了通道与权值之间的间接对应,以较小的计算开销达到了提高准确率的效果,提高了模型预测框架的精确定位能力。

Description

基于改进的yolov5的绝缘子缺陷检测方法
技术领域
本发明属于绝缘子缺陷检测技术领域,特别涉及基于改进的yolov5的绝缘子缺陷检测方法。
背景技术
电是使世界转动的最基本的元素之一,高、低压电的传输对它的实际应用是非常重要的。在高压电的传输中,绝缘子用来支撑和分离电导体而不让电流通过。低压配电线路则是从配电网向最终用户输送电能的一种配电方式。一次配电***的一个重要方面是电力的持续供应及其设备的高效性能。绝缘子串在一次架空配电线路中起绝缘和提供机械强度的作用。总而言之,绝缘子在电力***中是必不可少的设备。通常情况下,绝缘子暴露在强电场的恶劣环境中,以及各种恶劣的天气条件,如烈日、台风或飓风、雷暴、冻雨、暴风雪等。这种恶劣的环境会使绝缘子容易被损坏,进而威胁电网***的安全及电力的使用。这样重要的部件一旦损坏,对电力供应和公共安全都会造成严重问题。例如:在每年的雨季,都会有人由于暴露在电线杆下而触电丧生。因此,有必要研究有效的绝缘子缺陷检测方法,以确保电力传输的安全可靠。
目前的缺陷检测方法可分为物理方法、传统的基于视觉的方法以及基于深度学习的方法三类。物理方法主要包括基于人工操作的超声波法和紫外线脉冲法。在基于视觉的绝缘子缺陷检测方法中,最常用的是HOG+SVM和Haar+AdaBoost。传统的检测算法主要是利用滑动窗口选择感兴趣的区域,提取每个窗口的特征,然后对特征样本进行分类,得到检测结果。此外,还有基于轮廓特征和灰度相似度匹配的方法对完好的和有缺陷的绝缘子进行分类。在基于视觉的绝缘子缺陷检测方法中,最常用的是HOG+SVM和Haar+AdaBoost。这些方法通常是基于积累的经验来提取图像特征,效率低,精度有限,耗时长。随着计算机性能的不断提高,基于深度学习框架的检测方法得到了广泛的应用。该方法可以有效补偿人工图像特征提取过程中特征信息的丢失,提高故障检测的效率。目前已经提出了许多有效的目标检测算法,如Faster R-CNN(Faster region-based convolutional neural network)、Yolo(you only look once)、SSD(single shot multibox detector)、DCNN(dynamicconvolutional neural network)等。由于绝缘子的细长形状特性和不同的缺陷变化导致缺陷在图像中的表现形式多样而复杂以及采集的绝缘子图像中包含了大量的无关背景信息,因此,现有的绝缘子检测方法的准确性及速度还有待提高。
发明内容
针对绝缘子检测方法的准确性及速度存在的问题,本发明提供一种基于改进YOLOv5算法的绝缘子缺陷检测方法。
为解决上述技术问题,本发明采用如下技术方案:基于改进的yolov5的绝缘子缺陷检测方法,包括如下步骤:
步骤1、采集绝缘子图像形成数据集;
步骤2、使用LabelImg标注工具对数据集进行标注,标注类别为绝缘子和缺陷;
步骤3、对所采集的图像进行数据增强处理,以扩充数据集;
步骤4、在YOLOv5的骨干网络中引入triplet attention模块;
步骤5、优化损失函数;将CIoU作为改进YOLOv5算法的bounding-box损失函数LossCIoU
CIoU定义为:
其中,为权重函数,ν是用来测量长宽比一致性的参数,c代表能够包含预测框和真实框的最小封闭区域的对角线距离,ρ2(b,bgt)代表预测框和真实框的中心点之间的欧氏距离,hgt、ωgt分别代表真实框的高度和宽度,hp、ωp分别代表预测框的高度和宽度;
步骤6、对处理最终结果的非极大值抑制NMS方法进行优化;将Soft-NMS作为处理最终结果的方法:
Soft-NMS的得分函数表达式为:
其中,Si为预测框Bi的得分,BM为得分最高的预测框,Nt为重叠阈值,高斯惩罚函数,σ为一个根据经验选择超参数;
步骤7、训练改进后的网络;设置学习率、学习率动量、批次大小、训练总轮次小、权重衰减和最大迭代次数作为训练参数,对改进的YOLOv5网络进行训练;
步骤8、将收集的绝缘子图像数据集输入训练好的YOLOv5网络,得到输入图片中是否存在有缺陷的绝缘子以及该缺陷所在位置。
在上述基于改进的yolov5的绝缘子缺陷检测方法中,triplet attention模块采用三个平行的分支结构,其中两个用于提取两个空间维度与通道维C之间的相互依赖关系,另一个提取空间特征依赖关系;在前两个分支中,triplet attention将原始输入旋转张量χ分别沿H轴和W轴逆时针旋转90°,并且将张量的形状由C×H×W转换为W×H×C和H×C×W;在第三个分支中,张量以其原始形状C×H×W输入,通过Z-pool层将C维度的张量缩减到2维,并将该维上的平均汇集特征和最大汇集特征连接起来;
Z-pool定义为:Z-Pool(χ)=[MaxPool0d(χ),AvgPpool0d(χ)]
其中,0d是最大池化操作和平均池化操作发生的第0维;
将简化后的张量通过核大小为K的标准卷积层和批归一化层,将由Sigmoid激活函数生成的相应维数的注意权重加到旋转张量中;在最终输出时,第一个分支的输出沿H轴顺时针旋转90°,第二个分支的输出沿W轴顺时针旋转90°,以保证与输入的形状相同;最后,将三个分支的输出平均地聚合为输出;
输出张量定义为:
其中,σ为Sigmoid激活函数,ψ1、ψ2、ψ3分别代表triplet attention的三个分支中由核大小K定义的标准二维卷积层,分别表示triplet attention前两个分支中经过旋转后的张量,/>分别表示triplet attention三个分支中经过Z-pool层之后的张量。
在上述基于改进的yolov5的绝缘子缺陷检测方法中,采用Soft-NMS代替NMS来处理最后的检测结果流程如下;
1)先对预测框进行排序,然后将得分最高的预测框BM移到最终检测列表D中,并将其余所有预测框分配同一个标识Bi
2)当某个预测框Bi与BM的重叠面积大于一定阈值Nt时,Soft-NMS将重新计算该预测框的得分Si,并将其与一定置信阈值Ot相比较,当该预测框的得分Si大于一定置信阈值Ot时,将该预测框移到最终检测列表D中,反之,则删除该预测框;
3)对其余的框Bi重复上述过程,直到初始列表为空。
在上述基于改进的yolov5的绝缘子缺陷检测方法中,训练改进的YOLOv5网络包括以下步骤:
a、网络训练时,将数据集统一缩放到640×640大小,在depth_multipl=0.33,width_multiple=0.50的改进后的YOLOv5s网络模型上进行训练;
b、参数更新方式为随机梯度下降SGD方法,初始学习率为0.01,动量项为0.937,权值衰减系数为0.0005,将模型训练的批大小设置为16,每次由BN层进行正则化,更新模型的权值;
c、色相H、饱和度S和亮度V的增强系数分别设为0.015、0.7和0.4;训练总轮次设置为300次;
d、训练完成后,将得到的识别模型的权值文件保存,并利用测试集对模型的性能进行评价;
e、网络的最终输出识别出绝缘子及其缺陷的位置框和属于特定类别的概率。
与现有技术相比,本发明在骨干网络中加入triplet attention模块以提取不同维度之间的语义依赖,消除通道与权值之间的间接对应,从而以较小的计算开销达到了提高准确率的效果。将DIoU损失函数修改为CIoU损失函数,以提高模型预测框架的精确定位能力,增强模型的收敛效果。采用Soft-NMS代替NMS(Non-Maximum Suppression,非极大值抑制)来处理检测结果,解决了被遮挡的检测物容易被忽视的问题,减少了漏检。
附图说明
图1为本发明一个实施例基于改进的yolov5的绝缘子缺陷检测方法流程图;
图2为本发明一个实施例改进的yolov5网络结构图;
图3为本发明一个实施例triplet attention模块网络结构图;
图4为本发明一个实施例Soft-NMS算法流程图。
具体实施方式
下面将结合本发明实施例对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
下面结合具体实施例对本发明作进一步说明,但不作为本发明的限定。
为了解决现有绝缘子检测方法在准确度和速度上不平衡的问题,本实施例在现有YOLOv5算法上进行改进,使得在绝缘子缺陷的检测方面能够取得更好的效果。本实施例具体流程如图1所示,首先将所收集的数据集训练原始网络,得到原始网络的实验效果。然后,对数据集进行扩展,同时对网络进行改进,主要修改了网络的损失函数,骨干网络以及结果处理方法。其次,将扩展后的数据集对改进后的网络进行训练。最后,根据实验结果调整网络参数。
本实施例是通过以下技术方案来实现的,基于改进的yolov5的绝缘子缺陷检测方法,包括以下步骤:
1、采集绝缘子图像数据集(包含有缺陷的绝缘子图像和完整绝缘子图像)。
2、使用LabelImg标注工具对数据集进行标注,标注类别为绝缘子和缺陷。
3、对所采集的图像进行数据增强处理,以扩充数据集。
4、在YOLOv5的骨干网络中引入triplet attention模块。
由于注意机制能够建立通道或空间位置之间的相互依赖关系,近年来被广泛地应用于各种计算机视觉任务中。注意机制能够通过直接构建通道之间的依赖关系或空间注意的加权空间掩模来改进标准卷积层生成的特征表示。学习注意力权重的目的是,允许网络有能力学习在哪里关注和进一步关注目标对象。与一些需要大量额外学习参数的注意力方法不同,triplet attention是基于如何构建计算量小但有效的注意力,但同时保持相似或提供更好的性能而提出的。triplet attention通过旋转操作和剩余变换建立不同维度间的依赖关系,消除了通道与权值之间的间接对应,以较小的计算开销达到了提高准确率的效果。所以将triplet attention模块引入yolov5骨干网络中。
5、优化损失函数。
将CIoU作为改进YOLOv5算法的bounding-box损失函数LossCIoU。CIOU将真实框与预测框之间的距离、重叠率、尺度以及惩罚项都考虑进去,使得预测框回归变得更加稳定,不会像其他损失函数一样出现训练过程中发散等问题,而惩罚因子把预测框长宽比拟合目标框的长宽比考虑进去,从而使模型能够更快更好的收敛。
CIoU定义为:
其中,为权重函数,ν是用来测量长宽比一致性的参数,c代表能够包含预测框和真实框的最小封闭区域的对角线距离,ρ2(b,bgt)代表预测框和真实框的中心点之间的欧氏距离,hgt、ωgt分别代表真实框的高度和宽度,hp、ωp分别代表预测框的高度和宽度。
6、对处理最终结果的非极大值抑制方法进行优化。
非极大值抑制(NMS)是目标检测过程中不可分割的一部分。首先,它根据分数对所有预测框进行排序。选择得分最大的预测框BM,并抑制与BM有显著重叠(使用预定义阈值)的所有其他预测框。这个过程递归地应用于其余的框。根据算法的设计,如果一个对象位于预定义的重叠阈值内,就会导致漏检。为此,本发明将Soft-NMS作为处理最终结果的方法。Soft-NMS的核心思想是将所有其他目标的检测分数衰减为它们与BM重叠的连续函数。因此,在这个过程中没有对象被消除,从而减少漏检。
Soft-NMS的得分函数表达式为:
其中,Si为预测框Bi的得分,BM为得分最高的预测框,Nt为重叠阈值,高斯惩罚函数,σ为一个根据经验选择超参数。
7、训练改进后的网络。设置学习率、学习率动量、批次大小、训练总轮次小、权重衰减和最大迭代次数等训练参数,对改进的YOLOv5网络进行训练。
8、将收集的绝缘子图像数据集输入训练好的YOLOv5网络,得到输入图片中是否存在有缺陷的绝缘子以及该缺陷所在位置。
基于改进的yolov5的绝缘子缺陷检测方法的具体实施包括以下步骤:
一、首先,采集绝缘子图像形成数据集,在数据集进入网络模型训练前对其进行标注,得到符合Pascal VOC数据格式的xml文件,xml文件内容包括图像名称、图像路径、图像的高/宽度以及真实框中心点位置与宽/高等信息。然后,通过自适应对比度、旋转、随机灰度变化、平移、裁剪、颜色通道标准化、Mosaic等方法对数据集进行扩充。其中,Mosaic是分别对四张图片进行翻转、缩放、色域变化等,并且按照四个方向位置摆好,然后组成一张图片,增强模型检测小目标的能力。本发明构建的数据集共包含1268张图像,以供深度学习、训练模型及满足检测需求。
二、如图2所示,改进的YOLOv5网络由骨干网络、颈部网络和检测网络组成。骨干网络由Focus、Convolution with Batch normalization and LeakyRelu(CBL)、MixConvolution(MixConv)、Cross-Stage Partial Network(CSP)、Spatial Pyramid Pooling(SPP)和triplet attention组成。颈部由CBL、CSP、Upsampling和AFF组成。为了检测目标的位置和类别,需要从图像中提取特征,并利用骨干网络进行定位和分类来捕获特征;颈部网络通过骨干网络的初始输出特征,融合特征,适应大小,从而提高体系结构的整体性能;检测网络接收颈部网络的三个输出,输出每个特征映射输出层的包围盒位置、对象置信度和对象类别的预测。
Focus模块用于对特征图进行切片操作,可以保留更完整的图像降采样数据,用于后续的特征提取;CBL模块用于提取切片后的特征图中的特征信息;CSP网络的主要思想是为输入产生两条路径,主路径有CBL或ResUnit,另一条路径执行卷积功能,将两条路径的结果合并。CSP模块在保证精度的同时减少了计算成本;SPP模块用于实现局部特征与全局特征的融合,从而提高特征图的表示能力。因为绝缘子缺陷的形状是不同的背景图像中的对象,提高绝缘子缺陷检测的准确性。而视觉注意力机制是人类视觉所特有的大脑信号处理机制。人类视觉通过快速扫描全局图像,获得需要重点关注的目标区域,也就是一般所说的注意力焦点,而后对这一区域投入更多注意力资源,以获取更多所需要关注目标的细节信息,而抑制其他无用信息。因此,在YOLOv5网络的骨干网络中加入tripletattention模块以提取不同维度之间的语义依赖,消除通道与权值之间的间接对应,从而以较小的计算开销达到了提高准确率的效果。
颈部网络的AFF模块用于融合来自同一层或交叉层的基于注意力的特征,包括短跳连接和长跳连接,甚至在自身内部进行初始融合。
三、以YOLOv5网络作为基础框架,以在其中加入triplet attention模块、将损失函数修改为CIoU损失函数、采用Soft-NMS代替NMS为改进依据,搭建改进的绝缘子缺陷检测网络模型。
(1)triplet attention的基本结构如图3所示。triplet attention采用三个平行的分支结构,其中两个用于提取两个空间维度与通道维C之间的相互依赖关系,另一个提取空间特征依赖关系。在前两个分支中,triplet attention将原始输入旋转张量χ分别沿H轴和W轴逆时针旋转90°,并且将张量的形状由C×H×W转换为W×H×C和H×C×W.在第三个分支中,张量以其原始形状C×H×W输入,然后,通过Z-pool层将C维度的张量缩减到2维,并将该维上的平均汇集特征和最大汇集特征连接起来,这使得该层在保留实际张量的丰富表示的同时能够缩小其深度以使进一步的计算量更轻。
Z-pool定义为:Z-Pool(χ)=[MaxPool0d(χ),AvgPpool0d(χ)]
其中,0d是最大池化操作和平均池化操作发生的第0维。例如,张量形状为C×H×W的Z-Pool结果为2×H×W。
然后将简化后的张量通过核大小为K的标准卷积层和批归一化层,最后将由Sigmoid激活函数生成的相应维数的注意权重加到旋转张量中。在最终输出时,第一个分支的输出沿H轴顺时针旋转90°,第二个分支的输出沿W轴顺时针旋转90°,以确保与输入的形状相同。最后,将三个分支的输出平均地聚合为输出。
输出张量定义为:
其中,σ为Sigmoid激活函数,ψ1、ψ2、ψ3分别代表triplet attention的三个分支中由核大小K定义的标准二维卷积层,分别表示triplet attention前两个分支中经过旋转后的张量,/>分别表示triplet attention三个分支中经过Z-pool层之后的张量。
在YOLOv5网络的骨干网络中加入triplet attention模块以提取不同维度之间的语义依赖,消除通道与权值之间的间接对应,从而以较小的计算开销达到了提高准确率的效果。
(2)优化损失函数。IoU为交并比,是目标检测中常用的指标,其主要功能是确定正样本和负样本并计算预测框与真实框之间的距离。但IoU的定义本身存在一个问题。如果两个预测框和真实框不相交,即IoU为0。同时,由于0损失,没有坡度后退;因此,不能进行学习和培训练。为了解决这些问题,GIoU思想被提出。
GIoU的原理为:
然而,该算法在训练过程中仍存在目标框回归不稳定、容易发散等问题。目标检测的某些框不重叠导致GIoU回归策略可能退化为IoU回归策略。因此,为了直接最小化预测框与真实框之间的归一化距离,以达到更快的收敛速度,使回归在与真实框重叠甚至包含真实框时更加准确和快速,DIoU被提出。
DIoU的原理为:
其中,b、bgt分别表示预测框和真实框的中心点。但DIoU计算不考虑宽高比,只考虑边界盒的重叠面积和b与bgt的中心点距离。但是,预测框与真实框之间的w和h比值的一致性也具有很高的显著性。在此基础上,CIoU loss被提出。CIoU的惩罚项是基于DIoU的惩罚项加上影响因子α、ν,该因子考虑了预测框的长宽比来拟合真实框。
CIoU的原理为:
其中,为权重函数,ν是用来测量长宽比一致性的参数,c代表能够包含预测框和真实框的最小封闭区域的对角线距离,ρ2(b,bgt)代表预测框和真实框的中心点之间的欧氏距离,hgt、ωgt分别代表真实框的高度和宽度,hp、ωp分别代表预测框的高度和宽度。
因此,本实施例将DIoU损失函数修改为CIoU损失函数,以提高模型预测框架的精确定位能力,增强模型的收敛效果。
(3)为了进一步提高算法对被遮挡目标的检测,还将对非极大值抑制(Non-Maximum Suppression,NMS)进行优化。NMS应用于大多数最先进的检测器,以获得最终结果,因为它大大减少了误报的数量。NMS算法流程大致描述如下
首先,根据置信度对列表中的所有预测框进行排序;其次,将得分最高的预测框BM移至最终检测列表D,其余预测框分配唯一标识Bi;第三,去除与BM重叠面积大于一定阈值Nt的任何预测框Bi;对其余的框Bi重复此过程,直到初始列表为空。由于在NMS中,设置了一个确定的阈值来决定BM域中哪些框应该保留,哪些框应该删除。然而,如果一个对象确实存在,但与BM的重叠率大于Nt,则其检测将被忽略。
NMS的得分函数表达式为:
Soft-NMS的核心思想则是使用惩罚函数来衰减与BM重叠的预测框的分数,而不是将这些分数设置为零。因此本发明采用Soft-NMS代替NMS来处理最后的检测结果。
Soft-NMS算法流程图如图4所示,也是先对预测框进行排序,然后将得分最高的预测框BM移到最终检测列表D中,并将其余所有预测框分配同一个标识Bi;但当某个预测框Bi与BM的重叠面积大于一定阈值Nt时,Soft-NMS并不是将该预测框删除,而是将重新计算该预测框的得分Si,并将其与一定置信阈值Ot相比较,当该预测框的得分Si大于一定置信阈值Ot时,将该预测框移到最终检测列表D中,反之,则删除该预测框;对其余的框Bi重复上述过程,直到初始列表为空。由此可以得出,使用Soft-NMS算法时与BM重叠较大的预测框得分会大大降低,而距离BM较远的预测框则不会受到影响。因此,可以大大降低网络的漏检率。
Soft-NMS的得分函数表达式为:
其中,Si为预测框Bi的得分,BM为得分最高的预测框,Nt为重叠阈值,高斯惩罚函数,σ为一个根据经验选择超参数。
(4)训练改进的YOLOv5网络。网络训练时,将数据集统一缩放到640×640大小,在depth_multipl=0.33,width_multiple=0.50的改进后的YOLOv5s网络模型上进行训练。参数更新方式为随机梯度下降(SGD)方法,初始学习率为0.01,动量项为0.937,权值衰减系数为0.0005,将模型训练的批大小设置为16,每次由BN层进行正则化,更新模型的权值。色相(H)、饱和度(S)和亮度(V)的增强系数分别设为0.015、0.7和0.4。训练总轮次设置为300次。训练完成后,将得到的识别模型的权值文件保存下来,并利用测试集对模型的性能进行评价。网络的最终输出是识别出绝缘子及其缺陷的位置框和属于特定类别的概率。
以上仅为本发明较佳的实施例,并非因此限制本发明的实施方式及保护范围,对于本领域技术人员而言,应当能够意识到凡运用本发明说明书内容所作出的等同替换和显而易见的变化所得到的方案,均应当包含在本发明的保护范围内。

Claims (3)

1.基于改进的yolov5的绝缘子缺陷检测方法,其特征在于:包括如下步骤:
步骤1、采集绝缘子图像形成数据集;
步骤2、使用LabelImg标注工具对数据集进行标注,标注类别为绝缘子和缺陷;
步骤3、对所采集的图像进行数据增强处理,以扩充数据集;
步骤4、在YOLOv5的骨干网络中引入triplet attention模块;
步骤5、优化损失函数;将CIoU作为改进YOLOv5算法的bounding-box损失函数LossCIoU;
CIoU定义为:
其中,α为权重函数,ν是用来测量长宽比一致性的参数,c代表能够包含预测框和真实框的最小封闭区域的对角线距离,ρ2(b,bgt)代表预测框和真实框的中心点之间的欧氏距离,hgt、ωgt分别代表真实框的高度和宽度,hp、ωp分别代表预测框的高度和宽度;
步骤6、对处理最终结果的非极大值抑制NMS方法进行优化;将Soft-NMS作为处理最终结果的方法:
Soft-NMS的得分函数表达式为:
其中,Si为预测框Bi的得分,BM为得分最高的预测框,Nt为重叠阈值,高斯惩罚函数,σ为一个根据经验选择超参数;
步骤7、训练改进后的网络;设置学习率、学习率动量、批次大小、训练总轮次小、权重衰减和最大迭代次数作为训练参数,对改进的YOLOv5网络进行训练;
步骤8、将收集的绝缘子图像数据集输入训练好的YOLOv5网络,得到输入图片中是否存在有缺陷的绝缘子以及该缺陷所在位置;
所述triplet attention模块采用三个平行的分支结构,其中两个用于提取两个空间维度与通道维C之间的相互依赖关系,另一个提取空间特征依赖关系;在前两个分支中,triplet attention将原始输入旋转张量χ分别沿H轴和W轴逆时针旋转90°,并且将张量的形状由C×H×W转换为W×H×C和H×C×W;在第三个分支中,张量以其原始形状C×H×W输入,通过Z-pool层将C维度的张量缩减到2维,并将该维上的平均汇集特征和最大汇集特征连接起来;
Z-pool定义为:Z-Pool(χ)=[MaxPool0d(χ),AvgPpool0d(χ)]
其中,0d是最大池化操作和平均池化操作发生的第0维;
将简化后的张量通过核大小为K的标准卷积层和批归一化层,将由Sigmoid激活函数生成的相应维数的注意权重加到旋转张量中;在最终输出时,第一个分支的输出沿H轴顺时针旋转90°,第二个分支的输出沿W轴顺时针旋转90°,以保证与输入的形状相同;最后,将三个分支的输出平均地聚合为输出;
输出张量定义为:
其中,σ为Sigmoid激活函数,ψ1、ψ2、ψ3分别代表triplet attention的三个分支中由核大小K定义的标准二维卷积层,分别表示triplet attention前两个分支中经过旋转后的张量,/>分别表示triplet attention三个分支中经过Z-pool层之后的张量。
2.根据权利要求1所述基于改进的yolov5的绝缘子缺陷检测方法,其特征在于:采用Soft-NMS代替NMS来处理最后的检测结果流程如下;
1)先对预测框进行排序,然后将得分最高的预测框BM移到最终检测列表D中,并将其余所有预测框分配同一个标识Bi
2)当某个预测框Bi与BM的重叠面积大于一定阈值Nt时,Soft-NMS将重新计算该预测框的得分Si,并将其与一定置信阈值Ot相比较,当该预测框的得分Si大于一定置信阈值Ot时,将该预测框移到最终检测列表D中,反之,则删除该预测框;
3)对其余的框Bi重复上述过程,直到初始列表为空。
3.根据权利要求1所述基于改进的yolov5的绝缘子缺陷检测方法,其特征在于:训练改进的YOLOv5网络包括以下步骤:
a、网络训练时,将数据集统一缩放到640×640大小,在depth_multipl=0.33,width_multiple=0.50的改进后的YOLOv5s网络模型上进行训练;
b、参数更新方式为随机梯度下降SGD方法,初始学习率为0.01,动量项为0.937,权值衰减系数为0.0005,将模型训练的批大小设置为16,每次由BN层进行正则化,更新模型的权值;
c、色相H、饱和度S和亮度V的增强系数分别设为0.015、0.7和0.4;训练总轮次设置为300次;
d、训练完成后,将得到的识别模型的权值文件保存,并利用测试集对模型的性能进行评价;
e、网络的最终输出识别出绝缘子及其缺陷的位置框和属于特定类别的概率。
CN202111261977.5A 2021-10-28 2021-10-28 基于改进的yolov5的绝缘子缺陷检测方法 Active CN114022432B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111261977.5A CN114022432B (zh) 2021-10-28 2021-10-28 基于改进的yolov5的绝缘子缺陷检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111261977.5A CN114022432B (zh) 2021-10-28 2021-10-28 基于改进的yolov5的绝缘子缺陷检测方法

Publications (2)

Publication Number Publication Date
CN114022432A CN114022432A (zh) 2022-02-08
CN114022432B true CN114022432B (zh) 2024-04-30

Family

ID=80058216

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111261977.5A Active CN114022432B (zh) 2021-10-28 2021-10-28 基于改进的yolov5的绝缘子缺陷检测方法

Country Status (1)

Country Link
CN (1) CN114022432B (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114677362B (zh) * 2022-04-08 2023-09-12 四川大学 基于改进YOLOv5的表面缺陷检测方法
CN114529546A (zh) * 2022-04-24 2022-05-24 科大天工智能装备技术(天津)有限公司 一种屋面板缺陷检测方法和***
CN114882410B (zh) * 2022-05-11 2023-09-12 华东交通大学 基于改进定位损失函数的隧道顶灯故障检测方法及***
CN114972261A (zh) * 2022-05-27 2022-08-30 东北大学 一种板带钢表面质量缺陷的识别方法
CN115311542B (zh) * 2022-08-25 2023-06-02 杭州恒胜电子科技有限公司 一种目标检测方法、装置、设备和介质
CN115410060B (zh) * 2022-11-01 2023-02-28 山东省人工智能研究院 面向公共安全视频的全局感知小目标智能检测方法
CN115619778A (zh) * 2022-12-06 2023-01-17 南京迈能能源科技有限公司 一种电力设备缺陷识别方法、***、可读存储介质及设备
CN116311077B (zh) * 2023-04-10 2023-11-07 东北大学 一种基于显著性图的多光谱融合的行人检测方法及装置
CN116468730B (zh) * 2023-06-20 2023-09-05 齐鲁工业大学(山东省科学院) 基于YOLOv5算法的航拍绝缘子图像缺陷检测方法
CN117036363B (zh) * 2023-10-10 2024-01-30 国网四川省电力公司信息通信公司 一种基于多特征融合的遮挡绝缘子检测方法

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018165753A1 (en) * 2017-03-14 2018-09-20 University Of Manitoba Structure defect detection using machine learning algorithms
CN108961235A (zh) * 2018-06-29 2018-12-07 山东大学 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法
CN111311597A (zh) * 2020-03-27 2020-06-19 国网福建省电力有限公司龙岩供电公司 一种缺陷绝缘子的无人机巡检方法与***
CN111583198A (zh) * 2020-04-23 2020-08-25 浙江大学 结合FasterR-CNN+ResNet101+FPN的绝缘子图片缺陷检测方法
CN112184654A (zh) * 2020-09-24 2021-01-05 上海电力大学 一种基于生成对抗网络的高压线路绝缘子缺陷检测方法
CN112819804A (zh) * 2021-02-23 2021-05-18 西北工业大学 一种基于改进YOLOv5卷积神经网络的绝缘子缺陷检测方法
WO2021139069A1 (zh) * 2020-01-09 2021-07-15 南京信息工程大学 自适应注意力指导机制的一般性目标检测方法
CN113205505A (zh) * 2021-05-14 2021-08-03 湖北工业大学 基于改进ResNeSt-RPN的绝缘子缺陷检测方法
CN113297996A (zh) * 2021-05-31 2021-08-24 贵州电网有限责任公司 一种基于YoloV3的无人机航拍绝缘子目标检测方法
CN113379699A (zh) * 2021-06-08 2021-09-10 上海电机学院 基于深度学习的输电线路绝缘子缺陷检测方法
CN113506290A (zh) * 2021-07-29 2021-10-15 广东电网有限责任公司 一种线路绝缘子缺陷检测方法及装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018165753A1 (en) * 2017-03-14 2018-09-20 University Of Manitoba Structure defect detection using machine learning algorithms
CN108961235A (zh) * 2018-06-29 2018-12-07 山东大学 一种基于YOLOv3网络和粒子滤波算法的缺陷绝缘子识别方法
WO2021139069A1 (zh) * 2020-01-09 2021-07-15 南京信息工程大学 自适应注意力指导机制的一般性目标检测方法
CN111311597A (zh) * 2020-03-27 2020-06-19 国网福建省电力有限公司龙岩供电公司 一种缺陷绝缘子的无人机巡检方法与***
CN111583198A (zh) * 2020-04-23 2020-08-25 浙江大学 结合FasterR-CNN+ResNet101+FPN的绝缘子图片缺陷检测方法
CN112184654A (zh) * 2020-09-24 2021-01-05 上海电力大学 一种基于生成对抗网络的高压线路绝缘子缺陷检测方法
CN112819804A (zh) * 2021-02-23 2021-05-18 西北工业大学 一种基于改进YOLOv5卷积神经网络的绝缘子缺陷检测方法
CN113205505A (zh) * 2021-05-14 2021-08-03 湖北工业大学 基于改进ResNeSt-RPN的绝缘子缺陷检测方法
CN113297996A (zh) * 2021-05-31 2021-08-24 贵州电网有限责任公司 一种基于YoloV3的无人机航拍绝缘子目标检测方法
CN113379699A (zh) * 2021-06-08 2021-09-10 上海电机学院 基于深度学习的输电线路绝缘子缺陷检测方法
CN113506290A (zh) * 2021-07-29 2021-10-15 广东电网有限责任公司 一种线路绝缘子缺陷检测方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于深度学习的输电线路绝缘子缺陷检测研究;丘灵华;朱铮涛;;计算机应用研究;20200630(S1);全文 *
基于红外图像匹配的零值绝缘子检测;张晓春等;《电测与仪表》;20191231;第43卷(第03期);全文 *

Also Published As

Publication number Publication date
CN114022432A (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
CN114022432B (zh) 基于改进的yolov5的绝缘子缺陷检测方法
CN111126472B (zh) 一种基于ssd改进的目标检测方法
CN108647655B (zh) 基于轻型卷积神经网络的低空航拍影像电力线异物检测方法
CN109241982B (zh) 基于深浅层卷积神经网络的目标检测方法
CN107145889B (zh) 基于具有RoI池化的双CNN网络的目标识别方法
CN108229550B (zh) 一种基于多粒度级联森林网络的云图分类方法
CN112348036A (zh) 基于轻量化残差学习和反卷积级联的自适应目标检测方法
CN111898432B (zh) 一种基于改进YOLOv3算法的行人检测***及方法
CN111160407A (zh) 一种深度学习目标检测方法及***
CN110222636B (zh) 基于背景抑制的行人属性识别方法
CN115620081B (zh) 一种目标检测模型的训练方法及目标检测方法、装置
CN114627269A (zh) 一种基于深度学***台
CN111915558A (zh) 一种高压输电线销钉状态检测方法
CN115830535A (zh) 一种变电站周边区域积水检测方法、***、设备及介质
CN114359167A (zh) 一种复杂场景下基于轻量化YOLOv4的绝缘子缺陷检测方法
CN111126155A (zh) 一种基于语义约束生成对抗网络的行人再识别方法
CN111027542A (zh) 一种基于Faster RCNN算法改进的目标检测方法
CN114511627A (zh) 一种目标果实定位分割方法及***
CN117830835A (zh) 一种基于深度学习的卫星遥感图像分割方法
CN110348311B (zh) 一种基于深度学习的道路交叉口识别***及方法
CN115761453B (zh) 基于特征匹配的轻量化单样本目标检测方法
Rao et al. Roads detection of aerial image with FCN-CRF model
Zhang Faster R-CNN transmission line multi-target detection based on BAM
CN112396126B (zh) 一种基于检测主干与局部特征优化的目标检测方法及***
CN115187906A (zh) 一种行人检测与重识别方法、装置和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant