CN114241247A

CN114241247A - 一种基于深度残差网络的变电站安全帽识别方法及***

Info

Publication number: CN114241247A
Application number: CN202111626217.XA
Authority: CN
Inventors: 韩睿; 姜雄伟; 张弛; 梅冰笑; 刘黎; 王文浩; 史文彬; 戴哲仁; 温典; 姜凯华; 申剑; 钱少锋; 梁苏宁
Original assignee: Electric Power Research Institute of State Grid Zhejiang Electric Power Co Ltd
Current assignee: Electric Power Research Institute of State Grid Zhejiang Electric Power Co Ltd
Priority date: 2021-12-28
Filing date: 2021-12-28
Publication date: 2022-03-25
Anticipated expiration: 2041-12-28
Also published as: CN114241247B

Abstract

本发明公开了一种基于深度残差网络的变电站安全帽识别方法及***，属于变电站技术领域。本发明通过构建具有4个残差块的深度残差网络对变电站安全帽进行识别，有效提高了检测识别准确率，同时使得训练深度网络变得更加容易，有效避免出现传统卷积网络随着深度增加存在的梯度***和梯度消失等问题。进而，本发明构建的深度残差网络采用Dropout层，以一定概率使随机的神经元不工作，能够有效防止过拟合现象。同时，本发明在训练时通过Softmax函数和交叉熵函数相结合的方式来计算损失函数值，提高了训练效率，减缓了训练得到的深度残差网络训练模型的性能退化，从而可以提取到更全面、更准确的特征，方案详尽，切实可行。

Description

一种基于深度残差网络的变电站安全帽识别方法及***

技术领域

本发明涉及一种基于深度残差网络的变电站安全帽识别方法及***，属于变电站技术领域。

背景技术

随着技术和设备的不断更迭突破，深度学习被广泛应用于机器视觉领域。通过大量数据集的输入，并使用含有大量隐藏层的先进模型，深度学习拥有了提取关键特征的特性，这使得分类和预测更容易。

进一步，中国专利(公开号：CN110728223A)公开了一种基于深度学***均识别率；e).安全帽佩戴实时检测。上述发明的基于深度学习的安全帽佩戴识别方法，通过卷积神经网络处理图片特征，获得神经网络模型，对模型进行不断训练，最终准确度较高得网络模型，为安全帽佩戴识别提供可靠的依据；降低了损失值从而优化了网络。

但上述的卷积神经网络采用传统的神经网络，参数量巨大，导致整个识别过程计算量庞大，并且随着网络的深度增加会存在梯度***和梯度消失等问题，使得识别模型变得越来越难以训练，进而影响变电站安全帽识别的准确性。

发明内容

针对现有技术的缺陷，本发明的目的在于提供一种通过构建具有4个残差块的深度残差网络对变电站安全帽进行识别，有效提高了检测识别准确率，同时使得训练深度网络变得更加容易；同时构建的深度残差网络采用Dropout层，以一定概率使随机的神经元不工作，能够有效防止过拟合现象；并且训练时通过Softmax函数和交叉熵函数相结合的方式来计算损失函数值，提高了训练效率，有效减缓训练得到的深度残差网络训练模型的性能退化的基于深度残差网络的变电站安全帽识别方法及***。

为实现上述目的，本发明的一种技术方案为：

一种基于深度残差网络的变电站安全帽识别方法，

包括以下步骤：

步骤1：在变电站场景下获取N张安全帽图像，将N张安全帽图像及安全帽图像对应的安全帽检测标签图像构成训练集，

步骤2：构建深度残差网络；

所述深度残差网络具有输入层、隐藏层、输出层；

所述隐藏层至少包括一个改进卷积层、一个最大池化层、四个残差块、一个Dropout层、一个全连接层；

输出层至少包括一个Softmax回归分类器；

步骤3：将步骤1中的训练集输入到步骤2中的深度残差网络中，对训练集中的安全帽图像进行训练，其训练方法如下：

第一步，在Softmax回归分类器的输出端输出安全帽图像的概率分布及对应的安全帽检测标签图像的概率分布；

第二步，根据第一步中的安全帽图像的概率分布与安全帽检测标签图像的概率分布，并通过Softmax函数和交叉熵函数，计算两个概率分布之间的损失函数值；

步骤4：重复执行步骤3共M次，训练得到深度残差网络训练模型，并得到N×M个损失函数值；然后从所有损失函数值中找出值最小的损失函数值；

接着将值最小的损失函数值对应的权值矢量和偏置项对应作为深度残差网络训练模型的最优权值矢量和最优偏置项；其中，M＞1；

步骤5：任意选取一张宽度为K且高度为G的安全帽图像作为测试图像；然后将测试图像输入到深度残差网络训练模型中进行预测，预测得到测试图像的分类结果，并将预测的分类结果与安全帽图像实际情况进行对比，验证深度残差网络训练模型预测结果是否准确；

如果深度残差网络训练模型测试结果准确，则进行步骤6；

否则返回到步骤4；

步骤6：将待预测的安全帽图像输入到步骤5中的深度残差网络训练模型中进行预测，预测得到待预测的安全帽图像的分类结果；

所述分类结果为工人规范佩戴安全帽或工人未规范佩戴安全帽。

本发明经过不断探索以及试验，通过构建具有4个残差块的深度残差网络对变电站安全帽进行识别，有效提高变电站安全帽识别准确率，同时使得训练深度网络变得更加容易，有效避免出现传统卷积网络随着深度增加存在的梯度***和梯度消失等问题。

进而，本发明构建的深度残差网络采用Dropout层，以一定概率使随机的神经元不工作，能够有效防止过拟合现象。

同时，本发明在训练时通过Softmax函数和交叉熵函数相结合的方式来计算损失函数值，提高了训练效率，减缓了训练得到的深度残差网络训练模型的性能退化。

进一步，本发明构建的深度残差网络中的4个残差块可均由两种不同的残差单元即恒等残差单元和卷积残差单元堆叠而成，从而可以提取到更全面、更准确的特征，方案详尽，切实可行。

作为优选技术措施：

所述步骤1，训练集中包括有N₁张工人规范佩戴安全帽的安全帽图像和N₂张工人未规范佩戴安全帽的安全帽图像，对应作为正类图像和负类图像；

然后将训练集中的第n张安全帽图像及其对应的安全帽检测标签图像对应记为Dⁿ及Fⁿ _true；

其中，安全帽图像和安全帽检测标签图像为RGB图像，N≥200，N₁+N₂＝N，N₁和N₂至少为N的三分之一，1≤n≤N，n的初始值为1，Dⁿ、Fⁿ _true的宽度为K且高度为G，且K和G均能够被2整除。

作为优选技术措施：

所述步骤2，对于输入层，其输入端接收一张RGB图像，其输出端输出RGB图像给隐藏层；

其中，要求RGB图像的宽度为K且高度为G；

对于隐藏层，改进卷积层的输入端接收输入层的输出端输出的RGB图像，改进卷积层的输出端输出64幅宽度为

且高度为

的特征图，将改进卷积层的输出端输出的所有特征图构成的集合记为A₁；

最大池化层的输入端接收A₁中的所有特征图，最大池化层的输出端输出64幅宽度为

且高度为

的特征图，将最大池化层的输出端输出的所有特征图构成的集合记为A₂；

第1个残差块的输入端接收A₂中的所有特征图，第1个残差块的输出端输出64幅宽度为

且高度为

的特征图，将第1个残差块的输出端输出的所有特征图构成的集合记为A₃；

第2个残差块的输入端接收A₃中的所有特征图，第2个残差块的输出端输出64幅宽度为

且高度为

的特征图，将第2个残差块的输出端输出的所有特征图构成的集合记为A₄；

第3个残差块的输入端接收A₄中的所有特征图，第3个残差块的输出端输出64幅宽度为

且高度为

的特征图，将第3个残差块的输出端输出的所有特征图构成的集合记为A₅；

第4个残差块的输入端接收A₅中的所有特征图，第4个残差块的输出端输出64幅宽度为

且高度为

的特征图，将第4个残差块的输出端输出的所有特征图构成的集合记为A₆；

Dropout层的输入端接收A₆中的所有特征图，Dropout层的输出端输出64幅宽度为

且高度为

的特征图，将Dropout层的输出端输出的所有特征图构成的集合记为A₇；

全连接层的输入端接收A₇中的所有特征图，全连接层的输出端输出一维向量；

其中，最大池化层的步长为2，全连接层的输入维度为64，全连接层的输出维度为1024；

对于输出层，Softmax回归分类器的输入端接收全连接层的输出端输出的一维向量，Softmax回归分类器的输出端输出概率分布。

作为优选技术措施：

所述改进卷积层包括依次连接的第一卷积层、第二卷积层、第三卷积层；

第一卷积层的输入端作为改进卷积层的输入端，第一卷积层的输入端接收输入层的输出端输出的RGB图像，第一卷积层的输出端输出64幅宽度为K且高度为G的特征图；

第二卷积层的输入端接收第一卷积层的输出端输出的所有特征图，第二卷积层的输出端输出128幅宽度为K且高度为G的特征图；

第三卷积层的输入端接收第二卷积层的输出端输出的所有特征图，第三卷积层的输出端输出64幅宽度为

且高度为

的特征图，第三卷积层的输出端作为改进卷积层的输出端；

其中，第一卷积层的卷积核的大小为3×3、卷积核的个数为64、填充为1、步长为1，第二卷积层的卷积核的大小为3×3、卷积核的个数为128、填充为1、步长为1，第三卷积层的卷积核的大小为3×3、卷积核的个数为64、填充为1、步长为2。

作为优选技术措施：

所述第1个残差块和第4个残差块的结构相同，其由两个恒等残差单元和一个卷积残差单元组成；

第1个恒等残差单元、卷积残差单元和第2个恒等残差单元依次连接；

第1个恒等残差单元的输入端作为其所在残差块的输入端，第1个恒等残差单元的输出端输出64幅宽度为

且高度为

的特征图，卷积残差单元的输入端接收第1个恒等残差单元的输出端输出的所有特征图，卷积残差单元的输出端输出64幅宽度为

且高度为

的特征图，第2个恒等残差单元的输入端接收卷积残差单元的输出端输出的所有特征图，第2个恒等残差单元的输出端输出64幅宽度为

且高度为

的特征图，第2个恒等残差单元的输出端作为其所在残差块的输出端；

第2个残差块由两个恒等残差单元和两个卷积残差单元组成；

第1个恒等残差单元、第1个卷积残差单元、第2个恒等残差单元、第2个卷积残差单元依次连接；

第1个恒等残差单元的输入端作为第2个残差块的输入端，第1个恒等残差单元的输出端输出64幅宽度为

且高度为

的特征图，第1个卷积残差单元的输入端接收第1个恒等残差单元的输出端输出的所有特征图，第1个卷积残差单元的输出端输出64幅宽度为

且高度为

的特征图，第2个恒等残差单元的输入端接收第1个卷积残差单元的输出端输出的所有特征图，第2个恒等残差单元的输出端输出64幅宽度为

且高度为

的特征图，第2个卷积残差单元的输入端接收第2个恒等残差单元的输出端输出的所有特征图，第2个卷积残差单元的输出端输出64幅宽度为

且高度为

的特征图，第2个卷积残差单元的输出端作为第2个残差块的输出端；

第3个残差块由三个恒等残差单元和三个卷积残差单元组成；

第1个恒等残差单元、第1个卷积残差单元、第2个恒等残差单元、第2个卷积残差单元、第3个恒等残差单元、第3个卷积残差单元依次连接；

第1个恒等残差单元的输入端作为第3个残差块的输入端，第1个恒等残差单元的输出端输出64幅宽度为

且高度为

的特征图；

第1个卷积残差单元的输入端接收第1个恒等残差单元的输出端输出的所有特征图，第1个卷积残差单元的输出端输出64幅宽度为

且高度为

的特征图；

第2个恒等残差单元的输入端接收第1个卷积残差单元的输出端输出的所有特征图；第2个恒等残差单元的输出端输出64幅宽度为

且高度为

的特征图；

第2个卷积残差单元的输入端接收第2个恒等残差单元的输出端输出的所有特征图；第2个卷积残差单元的输出端输出64幅宽度为

且高度为

的特征图；

第3个恒等残差单元的输入端接收第2个卷积残差单元的输出端输出的所有特征图；第3个恒等残差单元的输出端输出64幅宽度为

且高度为

的特征图；

第3个卷积残差单元的输入端接收第3个恒等残差单元的输出端输出的所有特征图，第3个卷积残差单元的输出端输出64幅宽度为

且高度为

的特征图；第3个卷积残差单元的输出端作为第3个残差块的输出端。

作为优选技术措施：

四个残差块中的所有恒等残差单元的结构相同，其包括第四卷积层、第一批标准化层、第五卷积层、第二批标准化层、第六卷积层、第三批标准化层；

第四卷积层的输入端作为其所在的恒等残差单元的输入端，第四卷积层的输出端输出16幅宽度为

且高度为

的特征图；

第一批标准化层的输入端接收第四卷积层的输出端输出的所有特征图，第一批标准化层的输出端输出16幅宽度为

且高度为

的特征图，将第一批标准化层的输出端输出的所有特征图经第1个ReLu激活函数后得到的所有特征图输入到第五卷积层的输入端；

第五卷积层的输出端输出16幅宽度为

且高度为

的特征图；

第二批标准化层的输入端接收第五卷积层的输出端输出的所有特征图，第二批标准化层的输出端输出16幅宽度为

且高度为

的特征图，将第二批标准化层的输出端输出的所有特征图经第2个ReLu激活函数后得到的所有特征图输入到第六卷积层的输入端，第六卷积层的输出端输出64幅宽度为

且高度为

的特征图；

第三批标准化层的输入端接收第六卷积层的输出端输出的所有特征图，第三批标准化层的输出端输出64幅宽度为

且高度为

的特征图，将第三批标准化层的输出端输出的所有特征图经第3个ReLu激活函数后得到的所有特征图与输入到第四卷积层的输入端的所有特征图进行像素相加操作，将像素相加操作后得到的所有特征图构成的集合作为所在的恒等残差单元的输出端输出的所有特征图构成的集合。

作为优选技术措施：

第四卷积层的卷积核的大小为1×1、卷积核的个数为16、填充为0、步长为1；

第五卷积层的卷积核的大小为3×3、卷积核的个数为16、填充为1、步长为1；

第六卷积层的卷积核的大小为1×1、卷积核的个数为64、填充为0、步长为1；

第一批标准化层、第二批标准化层、第三批标准化层的参数均采用默认值。

作为优选技术措施：

四个残差块中的所有卷积残差单元的结构相同，其包括第七卷积层、第四批标准化层、第八卷积层、第五批标准化层、第九卷积层、第六批标准化层、第十卷积层、第七批标准化层；

第七卷积层的输入端和第十卷积层的输入端作为其所在的卷积残差单元的输入端，第七卷积层的输出端输出16幅宽度为

且高度为

的特征图；

第四批标准化层的输入端接收第七卷积层的输出端输出的所有特征图，第四批标准化层的输出端输出16幅宽度为

且高度为

的特征图，将第四批标准化层的输出端输出的所有特征图经第4个ReLu激活函数后得到的所有特征图输入到第八卷积层的输入端；

第八卷积层的输出端输出16幅宽度为

且高度为

的特征图；

第五批标准化层的输入端接收第八卷积层的输出端输出的所有特征图，第五批标准化层的输出端输出16幅宽度为

且高度为

的特征图，将第五批标准化层的输出端输出的所有特征图经第5个ReLu激活函数后得到的所有特征图输入到第九卷积层的输入端；

第九卷积层的输出端输出64幅宽度为

且高度为

的特征图；

第六批标准化层的输入端接收第九卷积层的输出端输出的所有特征图，第六批标准化层的输出端输出64幅宽度为

且高度为

的特征图；

第十卷积层的输出端输出64幅宽度为

且高度为

的特征图；

第七批标准化层的输入端接收第十卷积层的输出端输出的所有特征图，第七批标准化层的输出端输出64幅宽度为

且高度为

的特征图，将第六批标准化层的输出端输出的所有特征图经第6个ReLu激活函数后得到的所有特征图与第七批标准化层的输出端输出的所有特征图经第7个ReLu激活函数后得到的所有特征图进行像素相加操作，将像素相加操作后得到的所有特征图构成的集合作为所在的卷积残差单元的输出端输出的所有特征图构成的集合。

作为优选技术措施：

第七卷积层的卷积核的大小为1×1、卷积核的个数为16、填充为0、步长为1；

第八卷积层的卷积核的大小为3×3、卷积核的个数为16、填充为1、步长为1；

第九卷积层的卷积核的大小为1×1、卷积核的个数为64、填充为0、步长为1；

第十卷积层的卷积核的大小为1×1、卷积核的个数为64、填充为0、步长为1；

第四批标准化层、第五批标准化层、第六批标准化层、第七批标准化层的参数均采用默认值；Dropout层的保留率设为0.5。

为实现上述目的，本发明的另一种技术方案为：

一种基于深度残差网络的变电站安全帽识别***，

其包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如上述的一种基于深度残差网络的变电站安全帽识别方法。

与现有技术相比，本发明具有以下有益效果：

本发明经过不断探索以及试验，通过构建具有4个残差块的深度残差网络对变电站安全帽进行识别，有效提高了安全帽识别准确率，同时使得训练深度网络变得更加容易，有效避免出现传统卷积网络随着深度增加存在的梯度***和梯度消失等问题。

附图说明

图1为本发明方法中构建的深度残差网络的组成结构示意图；

图2为本发明方法中构建的深度残差网络中的改进卷积层的组成结构示意图；

图3为本发明方法中构建的深度残差网络中的第1个残差块和第4个残差块的组成结构示意图；

图4为本发明方法中构建的深度残差网络中的第2个残差块的组成结构示意图；

图5为本发明方法中构建的深度残差网络中的第3个残差块的组成结构示意图；

图6为本发明方法中构建的深度残差网络中的4个残差块中的恒等残差单元的组成结构示意图；

图7为本发明方法中构建的深度残差网络中的4个残差块中的卷积残差单元的组成结构示意图；

图8a为变电站场景下的安全帽图像一；

图8b为变电站场景下的安全帽图像二；

图8c为变电站场景下的安全帽图像三；

图8d为变电站场景下的安全帽图像四。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

相反，本发明涵盖任何由权利要求定义的在本发明的精髓和范围上做的替代、修改、等效方法以及方案。进一步，为了使公众对本发明有更好的了解，在下文对本发明的细节描述中，详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。

本发明识别方法的一种具体实施例：

一种基于深度残差网络的变电站安全帽识别方法，

包括以下步骤：

步骤2：构建深度残差网络；

所述深度残差网络具有输入层、隐藏层、输出层；

输出层至少包括一个Softmax回归分类器；

所述安全帽图像为Dⁿ，安全帽检测标签图像为Fⁿ _true，将Dⁿ的概率分布与Fⁿ _true的概率分布之间的损失函数值记为Lossⁿ，Lossⁿ通过Softmax函数和交叉熵函数相结合计算得到；

如果深度残差网络训练模型测试结果准确，则进行步骤6；

否则返回到步骤4；

本发明识别方法的一种最佳实施例：

一种基于深度残差网络的变电站安全帽识别方法，其包括以下步骤：

步骤1：在变电站场景下获取N张安全帽图像，将N张安全帽图像及每张安全帽图像对应的安全帽检测标签图像构成训练集，训练集中包括有N₁张工人规范佩戴安全帽的安全帽图像和N₂张工人未规范佩戴安全帽的安全帽图像，对应作为正类(wear)图像和负类(not_wear)图像；然后将训练集中的第n张安全帽图像及其对应的安全帽检测标签图像对应记为Dⁿ及Fⁿ _true；其中，安全帽图像和安全帽检测标签图像为RGB图，N≥200，N₁+N₂＝N，N₁和N₂至少为N的三分之一，工人未规范佩戴安全帽包括但不限于将安全帽放在一边、拿在手里、半扣在头顶等行为，1≤n≤N，n的初始值为1，Dⁿ、Fⁿ _true的宽度为K且高度为G，且K和G均能够被2整除。

步骤2：构建深度残差网络：如图1所示，该深度残差网络具有输入层、隐藏层、输出层，隐藏层包括一个改进卷积层、一个最大池化层、四个残差块、一个Dropout层、一个全连接层，输出层包括一个Softmax回归分类器。

对于输入层，其输入端接收一张RGB图像，其输出端输出RGB图像给隐藏层；其中，要求RGB图像的宽度为K且高度为G。

且高度为

的特征图，将改进卷积层的输出端输出的所有特征图构成的集合记为A₁；最大池化层的输入端接收A₁中的所有特征图，最大池化层的输出端输出64幅宽度为

且高度为

的特征图，将最大池化层的输出端输出的所有特征图构成的集合记为A₂；第1个残差块的输入端接收A₂中的所有特征图，第1个残差块的输出端输出64幅宽度为

且高度为

的特征图，将第1个残差块的输出端输出的所有特征图构成的集合记为A₃；第2个残差块的输入端接收A₃中的所有特征图，第2个残差块的输出端输出64幅宽度为

且高度为

的特征图，将第2个残差块的输出端输出的所有特征图构成的集合记为A₄；第3个残差块的输入端接收A₄中的所有特征图，第3个残差块的输出端输出64幅宽度为

且高度为

的特征图，将第3个残差块的输出端输出的所有特征图构成的集合记为A₅；第4个残差块的输入端接收A₅中的所有特征图，第4个残差块的输出端输出64幅宽度为

且高度为

的特征图，将第4个残差块的输出端输出的所有特征图构成的集合记为A₆；Dropout层的输入端接收A₆中的所有特征图，Dropout层的输出端输出64幅宽度为

且高度为

的特征图，将Dropout层的输出端输出的所有特征图构成的集合记为A₇，Dropout层实际对特征图并不处理；全连接层的输入端接收A₇中的所有特征图，全连接层的输出端输出一维向量；其中，最大池化层的步长为2，全连接层的输入维度为64，全连接层的输出维度为1024。

在本实施例中，如图2所示，改进卷积层由依次连接的第一卷积层、第二卷积层、第三卷积层组成，第一卷积层的输入端作为改进卷积层的输入端，第一卷积层的输入端接收输入层的输出端输出的RGB图像，第一卷积层的输出端输出64幅宽度为K且高度为G的特征图，第二卷积层的输入端接收第一卷积层的输出端输出的所有特征图，第二卷积层的输出端输出128幅宽度为K且高度为G的特征图，第三卷积层的输入端接收第二卷积层的输出端输出的所有特征图，第三卷积层的输出端输出64幅宽度为

且高度为

的特征图，第三卷积层的输出端作为改进卷积层的输出端；其中，第一卷积层的卷积核的大小为3×3、卷积核的个数为64、填充为1、步长为1，第二卷积层的卷积核的大小为3×3、卷积核的个数为128、填充为1、步长为1，第三卷积层的卷积核的大小为3×3、卷积核的个数为64、填充为1、步长为2。

在本实施例中，第1个残差块和第4个残差块的结构相同，如图3所示，其由两个恒等残差单元和一个卷积残差单元组成，第1个恒等残差单元、卷积残差单元和第2个恒等残差单元依次连接，第1个恒等残差单元的输入端作为其所在残差块的输入端，即第1个残差块中的第1个恒等残差单元的输入端接收A₂中的所有特征图，第4个残差块中的第1个恒等残差单元的输入端接收A₅中的所有特征图，第1个恒等残差单元的输出端输出64幅宽度为

且高度为

且高度为

且高度为

的特征图，第2个恒等残差单元的输出端作为其所在残差块的输出端，即第1个残差块中的第2个恒等残差单元的输出端输出的所有特征图构成的集合即为A₃，第4个残差块中的第2个恒等残差单元的输出端输出的所有特征图构成的集合即为A₆。如图4所示，第2个残差块由两个恒等残差单元和两个卷积残差单元组成，第1个恒等残差单元、第1个卷积残差单元、第2个恒等残差单元、第2个卷积残差单元依次连接，第1个恒等残差单元的输入端作为第2个残差块的输入端，即第2个残差块中的第1个恒等残差单元的输入端接收A₃中的所有特征图，第1个恒等残差单元的输出端输出64幅宽度为

且高度为

且高度为

且高度为

且高度为

的特征图，第2个卷积残差单元的输出端作为第2个残差块的输出端，即第2个残差块中的第2个卷积残差单元的输出端输出的所有特征图构成的集合即为A₄。如图5所示，第3个残差块由三个恒等残差单元和三个卷积残差单元组成，第1个恒等残差单元、第1个卷积残差单元、第2个恒等残差单元、第2个卷积残差单元、第3个恒等残差单元、第3个卷积残差单元依次连接，第1个恒等残差单元的输入端作为第3个残差块的输入端，即第3个残差块中的第1个恒等残差单元的输入端接收A₄中的所有特征图，第1个恒等残差单元的输出端输出64幅宽度为

且高度为

且高度为

且高度为

且高度为

的特征图，第3个恒等残差单元的输入端接收第2个卷积残差单元的输出端输出的所有特征图，第3个恒等残差单元的输出端输出64幅宽度为

且高度为

的特征图，第3个卷积残差单元的输入端接收第3个恒等残差单元的输出端输出的所有特征图，第3个卷积残差单元的输出端输出64幅宽度为

且高度为

的特征图，第3个卷积残差单元的输出端作为第3个残差块的输出端，即第3个残差块中的第3个卷积残差单元的输出端输出的所有特征图构成的集合即为A₅。

在本实施例中，四个残差块中的所有恒等残差单元的结构相同，如图6所示，其包括第四卷积层、第一批标准化(BN)层、第五卷积层、第二批标准化层、第六卷积层、第三批标准化层，第四卷积层的输入端作为其所在的恒等残差单元的输入端，第四卷积层的输出端输出16幅宽度为

且高度为

的特征图，第一批标准化层的输入端接收第四卷积层的输出端输出的所有特征图，第一批标准化层的输出端输出16幅宽度为

且高度为

的特征图，将第一批标准化层的输出端输出的所有特征图经第1个ReLu激活函数后得到的所有特征图输入到第五卷积层的输入端，第五卷积层的输出端输出16幅宽度为

且高度为

的特征图，第二批标准化层的输入端接收第五卷积层的输出端输出的所有特征图，第二批标准化层的输出端输出16幅宽度为

且高度为

且高度为

的特征图，第三批标准化层的输入端接收第六卷积层的输出端输出的所有特征图，第三批标准化层的输出端输出64幅宽度为

且高度为

的特征图，将第三批标准化层的输出端输出的所有特征图经第3个ReLu激活函数后得到的所有特征图与输入到第四卷积层的输入端的所有特征图进行像素相加操作(像素相加操作为常规技术手段，即相对应的两张特征图中对应位置的像素的值相加)，将像素相加操作后得到的所有特征图构成的集合作为所在的恒等残差单元的输出端输出的所有特征图构成的集合；其中，第四卷积层的卷积核的大小为1×1、卷积核的个数为16、填充为0、步长为1，第五卷积层的卷积核的大小为3×3、卷积核的个数为16、填充为1、步长为1，第六卷积层的卷积核的大小为1×1、卷积核的个数为64、填充为0、步长为1，第一批标准化层、第二批标准化层、第三批标准化层的参数均采用默认值。

在本实施例中，四个残差块中的所有卷积残差单元的结构相同，如图7所示，其包括第七卷积层、第四批标准化层、第八卷积层、第五批标准化层、第九卷积层、第六批标准化层、第十卷积层、第七批标准化层，第七卷积层的输入端和第十卷积层的输入端作为其所在的卷积残差单元的输入端，第七卷积层的输出端输出16幅宽度为

且高度为

的特征图，第四批标准化层的输入端接收第七卷积层的输出端输出的所有特征图，第四批标准化层的输出端输出16幅宽度为

且高度为

的特征图，将第四批标准化层的输出端输出的所有特征图经第4个ReLu激活函数后得到的所有特征图输入到第八卷积层的输入端，第八卷积层的输出端输出16幅宽度为

且高度为

的特征图，第五批标准化层的输入端接收第八卷积层的输出端输出的所有特征图，第五批标准化层的输出端输出16幅宽度为

且高度为

的特征图，将第五批标准化层的输出端输出的所有特征图经第5个ReLu激活函数后得到的所有特征图输入到第九卷积层的输入端，第九卷积层的输出端输出64幅宽度为

且高度为

的特征图，第六批标准化层的输入端接收第九卷积层的输出端输出的所有特征图，第六批标准化层的输出端输出64幅宽度为

且高度为

的特征图，第十卷积层的输出端输出64幅宽度为

且高度为

的特征图，第七批标准化层的输入端接收第十卷积层的输出端输出的所有特征图，第七批标准化层的输出端输出64幅宽度为

且高度为

的特征图，将第六批标准化层的输出端输出的所有特征图经第6个ReLu激活函数后得到的所有特征图与第七批标准化层的输出端输出的所有特征图经第7个ReLu激活函数后得到的所有特征图进行像素相加操作(像素相加操作为常规技术手段，即相对应的两张特征图中对应位置的像素的值相加)，将像素相加操作后得到的所有特征图构成的集合作为所在的卷积残差单元的输出端输出的所有特征图构成的集合；其中，第七卷积层的卷积核的大小为1×1、卷积核的个数为16、填充为0、步长为1，第八卷积层的卷积核的大小为3×3、卷积核的个数为16、填充为1、步长为1，第九卷积层的卷积核的大小为1×1、卷积核的个数为64、填充为0、步长为1，第十卷积层的卷积核的大小为1×1、卷积核的个数为64、填充为0、步长为1，第四批标准化层、第五批标准化层、第六批标准化层、第七批标准化层的参数均采用默认值。

在卷积残差单元中添加第十卷积层作为残差边。在恒等残差单元和卷积残差单元中，各个批标准化层归一化地将数据分布拉回标准正态分布，使得梯度一直处于比较大的状态，在批标准化层实现过程中，增加了平移和缩放参数，保留了非线性；ReLu激活函数(即线性整流激活函数)，相比于传统的神经网络中最常见的两个激活函数Sigmoid和Tanh函数，线性整流激活函数具有单向抑制，它可以很好地使一部分神经元的输出为0，减少了梯度弥散造成的权重更新缓慢影响，加快了反向传播过程训练神经元的收敛速度。

步骤3：将训练集中的每张安全帽图像及其对应的安全帽检测标签图像输入到深度残差网络中，对训练集中的每张安全帽图像进行训练，在Softmax回归分类器的输出端输出训练集中的每张安全帽图像的概率分布及对应的安全帽检测标签图像的概率分布后，计算训练集中的每张安全帽图像的概率分布与对应的安全帽检测标签图像的概率分布之间的损失函数值，将Dⁿ的概率分布与Fⁿ _true的概率分布之间的损失函数值记为Lossⁿ，Lossⁿ通过Softmax函数和交叉熵函数相结合计算得到。

步骤4：重复执行步骤3共M次，训练得到深度残差网络训练模型，并得到N×M个损失函数值；然后从所有损失函数值中找出值最小的损失函数值；接着将值最小的损失函数值对应的权值矢量和偏置项对应作为深度残差网络训练模型的最优权值矢量和最优偏置项；其中，M＞1。

步骤5：任意选取一张宽度为K且高度为G的安全帽图像作为测试图像；然后将测试图像输入到深度残差网络训练模型中进行预测，预测得到测试图像的分类结果，分类结果为工人规范佩戴安全帽或工人未规范佩戴安全帽。

在本实施例中，步骤2中，Dropout层的保留率设为0.5。设置Dropout层的保留率p时，考虑了0.1、0.2、0.5、0.8和1.0总共五种情况。当p为0.1时训练误差和测试误差下降速度很快，但是测试误差一直比训练误差大，出现了过拟合的情况；当p为0.2时，损失函数值下降到0.5左右开始收敛，但是测试误差和训练误差距离远，出现了过拟合的情况；当p为0.5时，损失函数值下降很明显，且在下降至1.0后深度残差网络出现收敛，测试误差和训练误差距离近；当p为0.8时，损失函数值下降速度快，在下降至1.0后深度残差网络收敛，但测试误差一直低于训练误差，距离较远，说明出现欠拟合的情况；当p为1.0时，即不使用Dropout层时，损失函数值下降明显，但测试误差一直不稳定，与训练误差相距最远，出现过拟合的情况。比较可得出p为0.5时查准率最高，因此Dropout层的保留率设为0.5。

为验证本发明方法的性能，对本发明方法进行实验。

在本实验中训练和测试均通过GPU加速，大大提高了训练与测试的速度，且使用Pytorch框架，具备灵活、易用、快速的特点。

在训练的时候分为两步：第一步选择合适的Dropout层的保留率，将Dropout层的保留率设置为0.5，Dropout层随机丢弃深度残差网络中的神经元，以防止深度残差网络发生过拟合问题；第二步选择合适的损失函数，用以对深度残差网络进行训练。在训练的时候将batch size设定为128，时间间隔设置为1个epoch，最大训练轮数设为300个epoch，初始学习率设为0.01。

从变电站场景下的监控摄像头中截取3段共7分21秒的视频流，将视频流中的截图按帧保存，从中随机选取出500张安全帽图像，将这500张安全帽图像作为测试图像输入到训练得到的深度残差网络训练模型中进行预测。由于这500张安全帽图像为现场收集，因此具有优异的质量和泛化性，实验结果更可靠，有说服力。

利用本发明方法中的深度残差网络训练模型与现有的三种主流网络结构分别对500张安全帽图像进行预测，表1给出了查准率的比较，从而来判断本发明方法中的深度残差网络训练模型的优越性。

表1利用本发明方法中的深度残差网络训练模型与现有的三种主流网络结构分别对500张安全帽图像进行预测的查准率

网络模型	查准率
		ResNet-50	80.23％
VGG-16	84.13％
		YOLOv3	88.25％
本发明方法中的深度残差网络训练模型	88.48％

从表1中可以看出，本发明方法中的深度残差网络训练模型具有更高的查准率。

表2给出了500张安全帽图像在本发明方法中的深度残差网络训练模型下的识别效果。表2中，TP表示被深度残差网络训练模型预测为正类的正样本，FP表示被深度残差网络训练模型预测为正类的负样本，FN表示被深度残差网络训练模型预测为负类的正样本，查准率为正样本占被深度残差网络训练模型预测为正类的比例，查全率为正样本中被深度残差网络训练模型预测为正类所占的比例，wear表示工人规范佩戴安全帽，not_wear表示工人未规范佩戴安全帽。

表2 500张安全帽图像在本发明方法中的深度残差网络训练模型下的识别效果

	TP	FP	FN	查准率	查全率
						wear	296	29	38	91.07％	88.62％
not_wear	225	32	47	87.54％	82.72％

从表2所列的数据可知，工人规范佩戴安全帽的查准率达到91.07％，查全率达到88.62％；工人未规范佩戴安全帽的查准率达到87.54％，查全率达到82.72％。

实验结果证明，本发明方法训练得到的深度残差网络训练模型可以在复杂的变电站场景下比较精确地识别出工人是否规范佩戴安全帽，能够满足变电站工作环境的安全监测要求。

图8a、图8b、图8c、图8d分别给出了其中4张测试图像的识别结果，从图中可以看出有效地识别出了工人是否规范佩戴安全帽，并框出了安全帽区域。

应用本发明方法的一种***实施例：

一种基于深度残差网络的变电站安全帽识别***，其包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现上述的一种基于深度残差网络的变电站安全帽识别方法。

本领域内的技术人员应明白，本申请的实施例可提供为方法、***、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

最后应当说明的是：以上实施例仅用以说明本发明的技术方案而非对其限制，尽管参照上述实施例对本发明进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本发明的具体实施方式进行修改或者等同替换，而未脱离本发明精神和范围的任何修改或者等同替换，其均应涵盖在本发明的权利要求保护范围之内。