CN116363364B

CN116363364B - 一种基于改进DSD-LinkNet的电力安全带分割方法

Info

Publication number: CN116363364B
Application number: CN202310306193.2A
Authority: CN
Inventors: 薛晓岑; 王向群; 朱悦; 桑顺; 黄杰杰; 刀承毅
Original assignee: Nantong University
Current assignee: Nantong University
Priority date: 2023-03-27
Filing date: 2023-03-27
Publication date: 2023-09-26
Anticipated expiration: 2043-03-27
Also published as: CN116363364A

Abstract

本发明涉及一种基于改进DSD‑LinkNet的电力安全带分割方法。本发明包括以下步骤：S1：使用YOLOv2目标检测网络将电力安全带检出，并将其送入电力安全带分割网络中，分割网络的输入为安全带的最小外接矩形截出的图片块；S2：电力分割网络对输入图片进行编码，建立5种不同分辨率等级的卷积层，并使用它们进行两倍下采样；S3：基于两倍下采样后的特征图，将其中深层特征图的分辨率经两倍上采样后拼接，再经5个反卷积层进行多倍上采样，还原到原输入图像大小；S4：对还原后的图像直接拼接，再经过最后一层3×3反卷积层后得到输出特征图；S5：根据最后一层反卷积的输出特征图，预测出原图腰带、安全绳和背景像素对应类别的概率，输出安全带的分割图像。

Description

一种基于改进DSD-LinkNet的电力安全带分割方法

技术领域

本发明属于视觉算法技术领域，具体涉及一种基于改进DSD-LinkNet的电力安全带分割方法。

背景技术

电力安全带分割属于图像分割问题，实质是将输入图像中的像素进行分类，分类标准为腰带像素、安全绳像素和背景像素。有监督方法是图像分割算法的主要类别之一。有监督方法需要对样本进行标注，通过给网络施加强监督信息，迫使网络自动学习到更好的数据分布，分割准确率较高。DSD-LinkNet电力安全带分割方法属于有监督方法。DSD-LinkNet电力安全带分割方法采用卷积神经网络，通过提取浅层卷积层的细节信息和深层卷积层的抽象信息，对图像特征进行分类。它的网络结构图分为三部分，分别为编码模块、解码模块和预测模块。编码模块中有多个卷积层提取图像特征，解码模块中使用多个反卷积层对小分辨率特征图进行上采样，将特征图的分辨率逐步还原到输入图像大小，预测模块根据最后的输出特征图，预测出原图各个像素对应类别的概率，最终输出安全带的分割图像。

然而，现有基于DSD-LinkNet的电力安全带分割方法存在如下问题：

(1)D-Linknet电力安全带分割方法最后一层的激活函数采用的是Sigmoid函数，可应用于二分类问题。但在安全带分割任务中，标签图中每一个像素属于腰带、安全绳和背景中的一种，属于多分类问题。

(2)D-Linknet电力安全带分割方法的深度网络训练容易消失且收敛速度过慢，网络中间隐藏层特征不明显，网络学习能力较差。

(3)D-Linknet电力安全带分割方法的数据集中，各个类别的像素数量是极度不均衡的，导致像素数量多的类别对损失函数影响大，而像素数量小的类别对损失函数影响小，从而容易引发网络过拟合。

发明内容

为解决上述现有技术存在的技术问题，本发明提出了一种基于改进DSD-LinkNet的电力安全带分割方法。本发明的目的是为了解决原始D-Linknet电力安全带分割方法最后一层的激活函数不能解决多分类的问题；此外，还要解决深度网络训练消失和收敛速度过慢的问题，优化网络中间隐藏层特征，提高网络学习能力；另一方面，针对训练样本像素点不均衡的问题，对损失函数进行改进，防止网络过拟合。

本发明为实现上述发明目的，采取的技术方案如下：

一种基于改进DSD-LinkNet的电力安全带分割方法，包括以下步骤：

S1：使用YOLOv2目标检测网络将电力安全带检出，并将其送入电力安全带分割网络中，分割网络的输入为安全带的最小外接矩形截出的图片块；

S2：电力分割网络对输入图片进行编码，建立5种不同分辨率等级的卷积层，并使用它们进行两倍下采样；

S3：基于两倍下采样后的特征图，将其中深层特征图的分辨率经两倍上采样后拼接，再经5个反卷积层进行多倍上采样，还原到原输入图像大小；

S4：对还原后的图像直接拼接，再经过最后一层3×3反卷积层后得到输出特征图；

S5：根据最后一层反卷积的输出特征图，预测出原图腰带、安全绳和背景像素对应类别的概率，输出安全带的分割图像。

进一步的作为本发明的优选技术方案，所述S2中，进行编码的为编码模块，该编码模块的卷积神经网络共有37个卷积层，包括浅层的卷积层和深层的卷积层，浅层的卷积层提取更多细节信息，深层的卷积层提取更加抽象的信息；5种不同分辨率等级的卷积层的分辨率分别为原图分辨率的1/2、1/4、1/8、1/16与1/32。

进一步的作为本发明的优选技术方案，所述S3引入深度监督机制，在深度卷积神经网络的中间隐藏层加上辅助分类器作为网络分支对主网络进行监督，直接为隐藏层提供伴随监督信息；同时，采用上采样的方式将不同分辨率特征图放大，将放大后的不同分辨率特征图进行融合，经5个反卷积层进行多倍上采样，还原到原输入图像大小；

在融合浅层特征与深层特征时采用跳跃连接方式，将浅层特征的输出作为深层特征的输入；多倍上采样的方式为反卷积方式，在输入图像的每两个像素之间增加大小为步长的空像素，进行转置卷积。

进一步的作为本发明的优选技术方案，引入深度监督机制时，需要将编码模块中3种小分辨率特征图直接反卷积回原输入图像分辨率，同时需要取消对原图分辨率1/32的最小分辨率特征图的深度监督。

进一步的作为本发明的优选技术方案，所述S4中，最后一层输出的激活层采用归一化指数函数Softmax作为激活函数，每一个像素对应的输出为一个1乘以3的矢量，矢量的每个维度代表的是一种类别。

进一步的作为本发明的优选技术方案，所述S4中，通过引入不同类别的损失权重来平衡不同类别对损失函数总体的影响；在数据集中，各个类别的像素数量是不均衡的，像素数量多的类别对损失函数影响大，像素数量少的类别对损失函数影响小；在安全带分割的任务中，最后一层的输出特征图通道数为3，需要在网络原始损失函数的基础上计算3个通道损失之和，改进后的损失函数为：

公式(1)中，W和H分别为最后一层特征图的宽和高，P_i和T_i分别表示特征图中第i个像素所对应的预测值和真实值，N表示一次迭代所用到的图片数量，c表示第c个通道，G_i表示第i个像素所对应的损失权重，计算公式如下：

G_i＝3(1-S_i) (2)

公式(2)中，S_i表示训练集中第i个类别像素数量占总图像像素数量的比例。

本发明所述的一种基于改进DSD-LinkNet的电力安全带分割方法，采用以上技术方案与现有技术相比，具有以下技术效果：

(1)本发明在D-LinkNet的基础上，针对方法在电力安全带分割的实际应用，对其进行改进，通过引入深度监督机制，为隐藏层引入伴随目标函数来提供梯度信息，改进原始网络结构，提高网络学习能力。

(2)本发明为防止引入的深度监督机制导致网络过拟合，使用带权重交叉熵损失代替原网络中的交叉熵损失，平衡不同目标类别对损失函数值的影响。

(3)本发明通过统计训练样本中腰带、安全绳和背景的像素比例作为交叉熵损失的类别权重，使得各个类别产生的总体损失相对平衡，从而改善网络学习效果，减少图像像素不均衡的影响。

附图说明

图1为本发明实施例电力安全带分割检测的网络结构图；

图2为本发明实施例基于改进DSD-LinkNet的电力安全带分割方法流程图；

图3为本发明实施例深度监督机制的原理图；

图4为本发明实施例与其他方法效果对比图。

具体实施方式

下面结合附图详细的描述本发明的作进一步的解释说明，以使本领域的技术人员可以更深入地理解本发明并能够实施，但下面通过参考实例仅用于解释本发明，不作为本发明的限定。

如图1与图2所示，一种基于改进DSD-LinkNet的电力安全带分割方法，包括以下步骤：

S2中，进行编码的为编码模块，该编码模块的卷积神经网络共有37个卷积层，包括浅层的卷积层和深层的卷积层，浅层的卷积层提取更多细节信息，深层的卷积层提取更加抽象的信息；5种不同分辨率等级的卷积层的分辨率分别为原图分辨率的1/2、1/4、1/8、1/16与1/32。

如图3所示，S3引入深度监督机制，在深度卷积神经网络的中间隐藏层加上辅助分类器作为网络分支对主网络进行监督，直接为隐藏层提供伴随监督信息；同时，采用上采样的方式将不同分辨率特征图放大，将放大后的不同分辨率特征图进行融合，经5个反卷积层进行多倍上采样，还原到原输入图像大小；

引入深度监督机制时，需要将编码模块中3种小分辨率特征图直接反卷积回原输入图像分辨率，同时需要取消对原图分辨率1/32的最小分辨率特征图的深度监督。

S4中，最后一层输出的激活层采用归一化指数函数Softmax作为激活函数，每一个像素对应的输出为一个1乘以3的矢量，矢量的每个维度代表的是一种类别。

S4中，通过引入不同类别的损失权重来平衡不同类别对损失函数总体的影响；在数据集中，各个类别的像素数量是不均衡的，像素数量多的类别对损失函数影响大，像素数量少的类别对损失函数影响小；在安全带分割的任务中，最后一层的输出特征图通道数为3，需要在网络原始损失函数的基础上计算3个通道损失之和，改进后的损失函数为：

G_i＝3(1-S_i) (2)

如图4所示，本发明方法与其他方法效果对比图，Unet偏向于把背景分割为安全绳，DeepLab偏向于把背景分割为腰带，而本发明对腰带和安全带的总体分割效果更好，同时背景点的误分割少。同时，从图4第三列可以看出，本方法对于背光场景同样有较强的分割能力，拥有较强的鲁棒性。

表1改进算法结果对比

实验序号	D-LinkNet	深度监督	带权重损失	mF1	mIoU
						1	√	×	×	0.72	0.56
2	√	√	×	0.73	0.57
						3	√	√	√	0.76	0.61

请参阅表1，改进算法结果对比，评价指标使用平均F1分数(即mF1)和平均IoU(即mIoU)衡量分割结果，原始D-LinkNet网络的mF1分数和mIoU都是最小的，对比实验1和实验3，深度监督和带权重损失从一定程度上增加了分割方法的分割精确度，mF1和mIoU分别提高了0.040和0.049。同时对比实验2和3，引入不同类别的损失权重可以有效解决样本不均衡所带来的网络过拟合问题，使用带权重损失的卷积可提高网络的学习能力，mF1和mIoU分别提高了0.028和0.049。

本发明对原始D-Linknet电力安全带分割方法进行改进，在其最后一层输出的激活层采用归一化指数函数Softmax作为激活函数，以解决标签多分类问题；在D-LinkNet的基础上加入深度监督机制，为隐藏层引入伴随目标函数来提供梯度信息，优化网络中间隐藏层特征，提高网络学***衡不同目标类别对损失函数值的影响，防止网络过拟合。

以上所述的具体实施方案，对本发明的目的、技术方案和有益效果进行了进一步的详细说明，所应理解的是，以上所述仅为本发明的具体实施方案而已，并非用以限定本发明的范围，任何本领域的技术人员，在不脱离本发明的构思和原则的前提下所做出的等同变化与修改，均应属于本发明保护的范围。

Claims

1.一种基于改进DSD-LinkNet的电力安全带分割方法，其特征在于，包括以下步骤：

S5：根据最后一层反卷积的输出特征图，预测出原图腰带、安全绳和背景像素对应类别的概率，输出安全带的分割图像；

所述S2中，进行编码的为编码模块，该编码模块的卷积神经网络共有37个卷积层，包括浅层的卷积层和深层的卷积层，浅层的卷积层提取更多细节信息，深层的卷积层提取更加抽象的信息；5种不同分辨率等级的卷积层的分辨率分别为原图分辨率的1/2、1/4、1/8、1/16与1/32；

所述S3引入深度监督机制，在深度卷积神经网络的中间隐藏层加上辅助分类器作为网络分支对主网络进行监督，直接为隐藏层提供伴随监督信息；同时，采用上采样的方式将不同分辨率特征图放大，将放大后的不同分辨率特征图进行融合，经5个反卷积层进行多倍上采样，还原到原输入图像大小；

在融合浅层特征与深层特征时采用跳跃连接方式，将浅层特征的输出作为深层特征的输入；多倍上采样的方式为反卷积方式，在输入图像的每两个像素之间增加大小为步长的空像素，进行转置卷积；

所述S4中，最后一层输出的激活层采用归一化指数函数Softmax作为激活函数，每一个像素对应的输出为一个1乘以3的矢量，矢量的每个维度代表的是一种类别；

所述S4中，通过引入不同类别的损失权重来平衡不同类别对损失函数总体的影响；在数据集中，各个类别的像素数量是不均衡的，像素数量多的类别对损失函数影响大，像素数量少的类别对损失函数影响小；在安全带分割的任务中，最后一层的输出特征图通道数为3，需要在网络原始损失函数的基础上计算3个通道损失之和，改进后的损失函数为：

G_i＝3(1-S_i) (2)

2.根据权利要求1所述的一种基于改进DSD-LinkNet的电力安全带分割方法，其特征在于，