CN114997279A

CN114997279A - 一种基于改进Yolov5模型的建筑工人危险区域入侵检测方法

Info

Publication number: CN114997279A
Application number: CN202210510739.1A
Authority: CN
Inventors: 万华平; 张文杰; 葛荟斌; 赵哲杰; 王梓; 肖佳文
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2022-05-11
Filing date: 2022-05-11
Publication date: 2022-09-02

Abstract

一种基于改进Yolov5模型的建筑工人危险区域入侵检测方法，采用数据集标注方法解决目标遮挡问题；在检测阶段引入卷积注意力模块(CBAM)、空洞空间金字塔池化(ASPP)和特征重组上采样算子(CARAFE)，提高Yolov5模型的准确率，具体实施步骤为：①采集并标注工地图像，构建数据集；②构建并训练基于Yolov5模型改进的Helmet‑Yolov5s安全帽检测模型；③输入实时采集的现场数据，根据安全帽颜色判断工人权限，识别是否存在入侵行为。本发明公开的方法能在遮挡情况下实现多尺度目标工人危险区域入侵行为的准确检测，为工地管理提供技术支持。

Description

一种基于改进Yolov5模型的建筑工人危险区域入侵检测方法

技术领域

本发明涉及一种建筑工地人员安全检测方法，具体为基于改进的Yolov5模型对建筑工地工人危险区域入侵行为进行检测的方法，属建筑施工管理领域。

背景技术

建筑施工现场人员密集、环境复杂、危险区域众多，工人在没有相应权限的情况下进入工地的危险区域，会带来较大的安全隐患。因此，及时发现并预警施工现场工人的区域入侵行为，对于实现工地的安全管理而言至关重要。

传统的区域入侵检测方法主要采用各类传感器，包括超声波、红外***、射频识别***(RFID)、物联网(IoT)技术等。基于传感器的检测方法依靠定位***和无线传输技术来实现工人区域入侵的检测。然而，这类方法仍存在无线设备的续航能力差、互联网覆盖范围有限等局限性，导致基于传感器的检测技术难以广泛应用。

新兴的区域入侵检测方法基于计算机视觉技术，具有精度高和无接触的特点，已开始得到了研究者与施工管理人员的广泛关注，尤其是目标检测和人脸识别技术。然而，目标检测技术在检测区域入侵行为方面仍然存在一定的不足，其检测的准确率受到了建筑工地中各类因素的干扰，例如遮挡物、检测距离、光照条件等；而人脸识别算法要求必须从工人的正面捕捉图像数据，这在复杂的工地环境中也难以实现。

发明内容

针对现有技术的不足，本发明提出一种基于改进Yolov5算法的建筑工地工人危险区域入侵检测方法，以提升在复杂环境下算法的检测精度。其具体内容包括：

一种基于改进Yolov5模型的建筑工人危险区域入侵检测方法，包括以下步骤：

A.构建数据集；

A1.从施工现场获取佩戴安全帽工人的图像数据；

A2.标注图像数据，标注的矩形边界框中只包含工人头部及其安全帽区域，从而减少背景像素的引入，降低遮挡对检测的影响。图像数据和标注文件共同构成一个大型的图像数据集；

B.构建基于Yolov5改进的工人安全帽检测模型Helmet-Yolov5s；

B1.将CBAM添加在主干特征提取网络的每个标准卷积层，赋予目标区域更多的特征权重；

B2.引入空洞空间金字塔池化(ASPP)替换空间金字塔池化(SPP)，减少图像细节信息的损失；

B3.使用特征重组上采样算子(CARAFE)进行图像上采样，使上采样过程能够充分利用全图的语义信息；

C.将数据集输入改进后的Helmet-Yolov5s模型进行训练，并检测模型性能；

D.使用训练后的Helmet-Yolov5s模型处理施工现场采集的图像或视频数据，获得工人位置及相应安全帽颜色；

E.通过工人所佩戴的安全帽颜色识别工人工种，进一步判断其是否具有进入当前区域的权限。

进一步地，所述步骤B1中的CBAM包括通道注意力模块和空间注意力模块。

进一步地，所述的通道注意力模块包括：输入特征图在空间维度上分别通过最大值池化和平均值池化后，输入到多层感知机(MLP)，然后通过Sigmoid函数激活获得通道注意力权重，原输入乘上该权重得到通道注意力模块的输出特征，上述过程可描述为：

M_c(x)＝σ{MLP[AvgPool(x)]+MLP[MaxPool(x)]} (1)

其中，x为通道注意力模块的输入特征图；AvgPool和MaxPool分别代表平均值池化和最大值池化；σ为Sigmoid激活函数；

进一步地，所述的空间注意力模块包括：将通道注意力模块的输出特征图作为输入，在通道维度上分别通过最大值池化和平均值池化后，将特征图降至一维，然后通过Sigmoid函数激活获得空间注意力权重，此阶段输入乘上该权重得到CBAM模块的输出特征，上述过程可描述为：

M_s(x)＝σ{Conv[AvgPool(x)；MaxPool(x)]} (2)

其中，x为空间注意力模块的输入特征图；AvgPool和MaxPool分别代表平均值池化和最大值池化；σ为Sigmoid激活函数；Conv为卷积层。

进一步地，所述步骤B2中的ASPP结构由四个并行分支组成，由骨干网络生成的输入特征图通过一个标准卷积模块；然后通过空洞率分别为4、8和12的空洞卷积层，输出的特征和与最初的输入相叠加；最后通过另一个标准卷积模块得到ASPP结构的输出。

进一步地，所述步骤B3中的CARAFE包括上采样核预测和特征重组两部分；

进一步地，所述的上采样核预测包括：输入特征图通过标准卷积层后输出大小为H×W×σ²×k²的特征图，调整该特征图的大小得到尺寸为σH×σW×k²的上采样核，通过SoftMax函数对上采样核进行归一化，使其权重之和为1；

进一步地，所述的特征重组包括：取出以输入特征图中某个点为中心k×k的区域，与预测出的上采样核对应位置的权重作点积，得到该点最终输出值，其函数可表示为：

其中，O_CARAFE表示CARAFE的输出特征图，W_x(m,n)表示预测上采样核的权重，I(i+m,j+n)表示该点k×k区域内的输入特征图的值。

进一步地，所述步骤E中识别的安全帽颜色包括“red”、“blue”、“yellow”、“white”和“none”，分别代表代表管理人员、技术操作人员、普通工人、领导和未佩戴安全帽人员。

与现有的方法相比，本方法有以下几个优点：

(1)本文采用了新的图像标注方法构建数据集。这种只标记工人头部和安全帽区域的标注方法可以较少地引入背景像素，提高模型的检测效果，同时也使得模型对遮挡情况下的目标具有更高的鲁棒性。

(2)与原Yolov5s模型相比，本文提出的Helmet-Yolov5s模型在检测区域入侵的行为上具有更高的准确性。此外，它还在黑暗环境中表现出较好的检测性能，同时也克服了原Yolov5s模型存在的误判问题。

(3)与其它先进的目标检测模型(即SSD、Faster R-CNN、Yolov3和Yolov4)相比，Helmet-Yolov5s模型的平均准确率达到了84.9％，是所有模型中最高的。此外，除去检测精度最低的SSD模型，Helmet-Yolov5s模型的检测速度也优于其他模型。

附图说明

图1是本发明方法的流程图；

图2是本发明的数据集图片实例；

图3是本发明的图像标注实例；

图4是本发明的Helmet-Yolov5s结构图；

图5是本发明的CBAM模块的示意图；

图6是本发明的ASPP结构的示意图；

图7是本发明的CARAFE算子的结构图；

图8是本发明的安全帽检测结果图；

图9是本发明的工人入侵检测实例图。

图中，1为标注的矩形边界框；2为空洞空间金字塔池化；3为卷积层；4为叠加层；5为CSP残差结构；6为特征重组上采样；7为模型预测结果；8为CBAM模块输入特征图；9为MaxPool和AvgPool；10为多层感知机；11为CBAM模块输出特征图；12为ASPP输入特征图；13为ASPP结构输入特征图；14为CARAFE算子模块的输入特征图；15为预测的上采样核；16为点x处范围k内的特征值；17为点x处范围k内的权重；18为CARAFE算子模块的输出特征图。

具体实施方式

下面结合附图对本发明一种基于改进Yolov5模型的建筑工人危险区域入侵检测方法做进一步的详细说明。本发明的实施方法如图1所示，具体包含以下步骤：

A.构建数据集。

A1.采集施工现场佩戴安全帽工人的图像数据，如图2所示，本实例共采集到3259张图片，其中包括训练数据2605张，验证数据456张和测试数据199张；

A2.选择LabelImg作为标注工具，如图3所示，用矩形边界框标注图像数据中工人头部及其安全帽区域，获得相应的label文件并存储为Yolo格式，label文件与原始图像共同构成图像数据集。

B.搭建改进的Helmet-Yolov5s目标检测模型，如图4所示。

B1.在Yolov5网络主干特征提取网络中的卷积层后添加CBAM，使网络聚焦于图像的目标区域。CBAM模块原理如图5所示；

B2.将Yolov5网络的SPP结构替换为ASPP结构，通过使用空洞卷积来减少图像细节信息的丢失，扩大特征的感受野。ASPP结构如图6所示；

B3.将Yolov5网络金字塔结构中的上采样层改进为CARAFE算子，使上采样过程能够充分利用全图的语义信息，以进行后续多尺度的特征融合。CARAFE算子结构如图7所示；

C.将所有训练数据集的图片输入改进后的模型中进行训练，用测试数据集检测模型性能，其结果如表1所示：

表1 Helmet-Yolov5s模型性能

将Helmet-Yolov5s模型与其他主流目标检测模型进行对比，得到的结果如表2所示：

表2模型性能对比表

由此可见，所提出的改进模型具有较高的检测精度；

D.将实时采集的施工现场监控图像数据输入Helmet-Yolov5s检测模型中，输出工人的位置与佩戴安全帽的颜色，检测结果如图8所示；

E.根据安全帽颜色，获得目标工人身份与相应权限，判断是否存在入侵行为，结果如图9所示。

本说明书实施案例所述的内容仅仅是对发明构思的实现形式的列举，本发明的保护范围不应当被视为仅限于实施案例所陈述的具体形式，本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。

Claims

1.一种基于改进Yolov5模型的建筑工人危险区域入侵检测方法，其特征在于，包括以下步骤：

A.构建数据集；

A1.从施工现场获取佩戴安全帽工人的图像数据；

B.构建基于Yolov5改进的工人安全帽检测模型Helmet-Yolov5s；

B2.引入空洞空间金字塔池化ASPP替换空间金字塔池化SPP，减少图像细节信息的损失；

B3.使用特征重组上采样算子CARAFE进行图像上采样，使上采样过程能够充分利用全图的语义信息；

2.根据权利要求1所述的一种基于改进Yolov5模型的建筑工人危险区域入侵检测方法，其特征在于：所述步骤B1中的CBAM包括通道注意力模块和空间注意力模块；

所述的通道注意力模块包括：输入特征图在空间维度上分别通过最大值池化和平均值池化后，输入到多层感知机(MLP)，然后通过Sigmoid函数激活获得通道注意力权重，原输入乘上该权重得到通道注意力模块的输出特征，上述过程可描述为：

M_c(x)＝σ{MLP[AvgPool(x)]+MLP[MaxPool(x)]} (1)

所述的空间注意力模块包括：将通道注意力模块的输出特征图作为输入，在通道维度上分别通过最大值池化和平均值池化后，将特征图降至一维，然后通过Sigmoid函数激活获得空间注意力权重，此阶段输入乘上该权重得到CBAM模块的输出特征，上述过程可描述为：

M_s(x)＝σ{Conv[AvgPool(x)；MaxPool(x)]} (2)

3.根据权利要求1所述的一种基于改进Yolov5模型的建筑工人危险区域入侵检测方法，其特征在于：所述步骤B2中的ASPP结构由四个并行分支组成，由骨干网络生成的输入特征图通过一个标准卷积模块；然后通过空洞率分别为4、8和12的空洞卷积层，输出的特征和与最初的输入相叠加；最后通过另一个标准卷积模块得到ASPP结构的输出。

4.根据权利要求1所述的一种基于改进Yolov5模型的建筑工人危险区域入侵检测方法，其特征在于：所述步骤B3中的CARAFE包括上采样核预测和特征重组两部分；

所述的上采样核预测包括：输入特征图通过标准卷积层后输出大小为H×W×σ²×k²的特征图，调整该特征图的大小得到尺寸为σH×σW×k²的上采样核，通过SoftMax函数对上采样核进行归一化，使其权重之和为1；

所述的特征重组包括：取出以输入特征图中某个点为中心k×k的区域，与预测出的上采样核对应位置的权重作点积，得到该点最终输出值，其函数可表示为

5.根据权利要求1所述的一种基于改进Yolov5模型的建筑工人危险区域入侵检测方法，其特征在于：所述步骤E中识别的安全帽颜色包括“red”、“blue”、“yellow”、“white”和“none”，分别代表代表管理人员、技术操作人员、普通工人、领导和未佩戴安全帽人员。