CN112633308A

CN112633308A - 一种电厂作业人员是否佩戴安全带的检测方法及检测***

Info

Publication number: CN112633308A
Application number: CN202010965975.3A
Authority: CN
Inventors: 李政谦; 刘曙元; 李志强
Original assignee: Beijing Huadian Tianren Power Controlling Technology Co Ltd
Current assignee: Beijing Huadian Tianren Power Controlling Technology Co Ltd
Priority date: 2020-09-15
Filing date: 2020-09-15
Publication date: 2021-04-09

Abstract

本发明公开了一种安全带检测方法，包括获取监控区域的历史视频图片，形成安全带检测数据集；对安全带检测数据集进行标注，并将其随机划分为训练集与测试集；根据获得的安全带检测数据集生成其对应的适用于监控区域的锚框；使用训练集训练深度学习模型，得到安全带检测模型；调整安全带检测模型的模型置信度；基于深度学习的安全带检测模型对监控区域内安全带情况进行实时检测。本发明基于深度学习模型实现安全带实时检测，可适应实际复杂场景并提高了安全带检测的mAP，有助于提高相关人员安全意识，帮助工作有序开展。

Description

一种电厂作业人员是否佩戴安全带的检测方法及检测***

技术领域

本发明属于智能视频监控安全技术领域，更具体地，涉及一种安全带检测方法。

背景技术

安全带是一项防止脑部损伤的措施。研究表明，在工作事故中，有接近60％的脑损伤是因为没有正确地安全带引起，对相关人员的安全带进行检测，可有效降低相关事故发生率。

早期通常会有专责的安全监督人员对驾驶员的安全带情况进行检测，但这种方式难以全方位监督，无法保证监督的有效性。因此，需要能够实时监督施工及巡检现场并降低监督成本的安全带检测方法。

一般的目标检测方法仅需在图片上判断是否存在检测目标，并获得目标数量，标记目标位置。对于安全带检测算法，在此基础上还要求针对动态视频实时识别、深度优化，达到较高的识别跟踪精度；对光线、阴天等不同环境适应性强，且不受人员眼镜、胡须、发型、表情等遮挡影响；也不受到人员正面、背面、侧面、跑动、低头等不同姿态影响。

近年来，研究人员在基于传感器与基于图像处理等两种检测方式上对安全带检测做了很多具有创新性的研究工作。但由于定位精度不高、测速度慢、准确率低等问题使得其不适用于复杂性较高的实际场景，无法达到安全带检测实际需求，基于卷积神经网络的检测算法依靠其网络简单、检测速度快准确性高等特点超过传统检测算法，成为当前安全带检测方面的主流算法。

但对于现场具体场景，卷积神经网络模型不能达到很高的检测效果，需要针对场景制定对应的模型及检测策略。

发明内容

为解决现有技术中存在的不足，本发明的目的在于，提供一种全带检测方法，能够检测现场视频信息中人员是否安全带，并有效减少因为人员行进速度快、物体遮挡、光线昏暗等复杂情况造成的漏检错检问题。

本发明采用如下的技术方案。一种电厂作业人员是否佩戴安全带的检测方法，其包括以下步骤：

步骤1，从监控区域内的视频监控设备获取历史视频数据，将其转化为图片，形成安全带检测数据集；

步骤2，对安全带检测数据集图片中人员是否佩戴安全带进行标注，并将其按照设定的比例随机划分为训练集与测试集；

步骤3，根据步骤1获得的安全带检测数据集生成其对应的适用于监控区域的锚框；

步骤4，使用训练集训练卷积神经网络模型，使用测试集检测每一代训练后改进的卷积神经网络模型，筛选获得安全带检测模型；

步骤5，从监控区域内的视频监控设备获取实时视频数据，基于步骤4得到的安全带检测模型对监控区域内安全带佩戴情况进行实时检测。

优选地，步骤2具体包括：

步骤2.1，对安全带检测数据集中人物是否佩戴安全带逐一标注，其中被标注部分作为正样本，未标注部分作为负样本；

步骤2.2，获取每个标注对象的类别及检测框，形成标注对象文件；

步骤2.3，生成安全带检测数据集对应的文件路径，并存储在数据集文件中；

步骤2.4，随机分配步骤2.3中存储在数据集文件内的存有标注内容的标注对象文件，将其以设定的比例分为训练集与测试集。

优选地，步骤3中，使用聚类方法生成锚框，聚类中距离度量方法为重叠度距离，以如下公式表示预测框与真实框的距离D，

D＝1-IoU(box,clusters)

式中：

D为预测框与真实框的距离，

IoU(·)表示重叠度函数，

box为标注框，

clusters为聚类数目。

优选地，步骤4中具体包括：

步骤4.1，将训练集中的图片统一调整到640*640；

步骤4.2，对经过步骤4.1调整尺寸后的图片进行图像增强处理；

步骤4.3，设定迭代次数，每一批图像的数量，初始学习率，学习率更新条件；

步骤4.4，使用图像增强处理后的图片训练卷积神经网络模型；

步骤4.5，使用测试集检测每一代训练后卷积神经网络模型的mAP，选取其中mAP最高的卷积神经网络模型作为安全带检测模型。

优选地，步骤4中，卷积神经网络模型分为1个类别，未安全带的标为none；卷积神经网络模型，其输入图片尺寸为640*640；卷积神经网络模型两输出层锚框数分别为4个和5个，用于检测普通目标、小目标，普通目标的尺寸大于32*32，小目标的尺寸小于或等于32*32；卷积神经网络模型两输出层的特征图尺寸分别为5*5和40*40。

优选地，步骤4中，卷积神经网络模型对图片的处理过程包括：

i.输入尺寸640*640，通过多个卷积核，获得特征图大小变为40*40；连续三次通过一个1*1的步长为1填充为0特征图数量为256的卷积核，一个3*3的步长为2填充为1特征图数量为512的卷积核，一个残差块的组合，得到第一个检测结果，并与上采样后的输出相连；

ii.第一个检测结果再通过多个卷积核，获得特征图大小变为5*5；连续四次通过一个1*1的步长为1填充为0特征图数量为512的卷积核，一个3*3的步长为2填充为1特征图数量为1024的卷积核，一个残差块的组合，得到第二个检测结果；

iii.第二个检测结果经过连续三次1*1的步长为1填充为0和3*3的步长为2填充为1的卷积组合和一个1*1的步长为1填充为0的卷积获得大小为5*5第三个检测结果作为输出；

iv.第二个检测结果经过连续两次1*1的步长为1填充为0和3*3的步长为2填充为1的卷积组合和一个1*1的步长为1填充为0的卷积并经过三次上采样后与第一个检测结果相加后经过连续两次1*1的步长为1填充为0和3*3的步长为2填充为1的卷积组合和一个1*1的步长为1填充为0的卷积获得大小为40*40的第四个检测结果作为输出。

优选地，步骤4中，采用FOCAL LOSS作为损失函数，以如下公式表示损失函数，

FL(p_t)＝-α_t(1-p_t)^γlg p_t

式中：

p_t表示预测的概率，

α与γ均为超参数。

优选地，步骤4中，采用Swish作为激活函数，激活函数公式为，

式中：

X表示输入图像的tensor张量，

e表示自然常数。

优选地，步骤5具体包括：

步骤5.1，实时从监控区域内的视频监控设备获取视频数据，将其转化为图片；

步骤5.2，安全带检测模型判断采集的视频图片中是否存目标；

步骤5.3，对存在作业的视频图片进行人物及背景分割，获取锚框位置并判断人员是否佩戴安全带；

步骤5.4，若发现未佩戴安全带的目标，使用红色矩形框标注，并标有none字样，标注后图像进行保存处理。

本发明还提供了一种利用所述检测方法的电厂作业人员是否佩戴安全带的检测***，包括：视频监控设备，设置在电厂监控区域内，用于采集视频数据；监控主机，包括视频模块处理模块和安全带检测模块，用于将视频监控设备的视频数据转化为图片，并使用安全带检测模型判断电厂作业人员是否佩戴安全带；通信网络，与视频监控设备和监控主机相连接，用于在视频监控设备与监控主机之间传输视频数据；显示与警示模块，与监控主机相连接，用于显示视频数据和是否佩戴安全带检测结果，若发现未佩戴安全带，发出警示。

本发明通过采集监控区域内视频图片获得安全带检测数据集并进行标注，通过使用聚类算法获得该安全带检测数据集对应的适用于该监控区域的锚框，通过多个卷积层、池化层、激活层分别得到检测框大小为5*5及40*40的两个输出，多个输出能够更加准确的对不同距离人员进行检测；使用FOCAL LOSS作为损失函数解决了类别不平衡问题，使用Swish作为激活函数避免了数值过大的饱和问题。通过以上改进使模型适应现场的复杂场景并提高了模型应用的准确率、召回率及mAP(mean Average Precision，平均准确率均值)，有助于相关人员安全意识，帮助工作有序开展。

附图说明

图1是本发明一种安全带检测方法的流程图；

图2是本发明卷积神经网络模型的网络结构图；

图3是基于安全带检测模型对监控区域内安全带情况进行实时检测的流程图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。

可以理解的是，本发明中的安全带是指电厂工人进行作业时所佩戴的安全带。

如图1所示，本发明提供了一种安全带检测方法，包括以下步骤：

步骤1，从监控区域内的视频监控设备获取历史视频数据，将其转化为图片，形成安全带检测数据集。

一个优选但非限制性的实施方式为，通过工作监测摄像头获取监控区域视频，使用OpenCV将视频转化为对应图片后，形成安全带检测数据集。获取的历史视频图片不限于尺度、光照、样式、颜色及是否存在遮挡。

值得注意的是，本发明的检测方法是同时检测一张图片内的多个目标的，由于人物行进速度较慢且进行安全带检测时摄像头与检测目标距离通常较远，因此无需使用类似于高速运动物体检测的轻量级模型，例如电厂中皮带撕裂检测的轻量级模型，因此本发明的模型设计较深，检测时间较长，每秒钟检测10张图片，检测准确率较高。

同时，可以理解的是，相对于皮带撕裂只能从上方进行检测，安全带的检测位置具有多样性，即可从目标上方、侧上方、水平等方向进行检测，也可以在目标侧下放进行检测。检测方向的多样性促使我们能够获得更多的样本图像，而样本图像的样式增加则能有效提高模型的泛化性，使其能够识别更多场景下安全带样式，避免因为光线不足、遮挡等问题引起的错检漏检。

步骤2，对安全带检测数据集图片中人员是否佩戴安全带进行标注，并将其按照8：2的比例随机划分为训练集与测试集。步骤2具体包括：

步骤2.1，对安全带检测数据集中人物是否佩戴安全带人工逐一标注，其中被标注部分作为正样本，未标注部分作为负样本，即背景类，获得xml格式文件。可以理解的是，可以使用任意图像标注软件对对安全带检测数据集中人物是否安全带人工逐一标注，例如但不限于，Labelme、labelImg或Yolo_mark。

步骤2.2，获取xml格式文件中每个标注对象的类别及检测框，即bounding box并生成对应的txt格式文件。

步骤2.3，生成安全带检测数据集对应的所有txt格式文件路径，并存储在dataset.txt文件中。

步骤2.4，随机分配步骤2.3中存储在dataset.txt文件内的存有标注内容的txt文件，将其以8：2的比例分为训练集与测试集。

可以理解的是，txt作为生成的文件格式、存储文件路径的文件格式，以及训练集和测试集的划分比例仅是一种优选但非限制性的实施方式，所属领域技术人员可以任意配置文件格式以及训练集和测试集的比例。

步骤3，根据步骤1获得的安全带检测数据集生成其对应的适用于监控区域的锚框，用于更好地适配当前检测环境，获得更高的检测准确率。步骤3具体包括：

步骤3中，使用聚类方法生成锚框，聚类中距离度量方法为IoU距离(Intersectionover Union，重叠度)，以如下公式表示预测框与真实框的距离D，

D＝1-IoU(box,clusters)

式中：

D为预测框与真实框的距离，

IoU(·)表示重叠度函数，

box为标注框，

clusters为聚类数目。

所述步骤3中锚框数量根据现场实际场景自行设定，根据数据集得到锚框，该锚框值更加适合现场场景，在本实施例中，设定锚框数目为9个，在输入为640*640的模型中具体为，[4,5]，[5,7]，[8,11]，[10,13]，[17,19]，[29,38]，[39,47]，[48,61]，[53,71]。其中[4,5]代表宽度为4，长度为5的矩形框，其他类推。

步骤4，使用训练集训练卷积神经网络模型，使用测试集检测每一代训练后卷积神经网络模型，筛选获得安全带检测模型。值得注意的是，本发明中安全带检测由于目标距离摄像头较远，检测难度较大，因此我们设计了一个深度较深的模型以更好的辨别图像中的语义信息，采用了残差网络用来传递更多的位置信息。同时在模型中引出一条支路来检测40*40像素的物体，这个尺度主要是针对正常距离的目标设置的。

所述卷积神经网络模型分为1个类别，未安全带的标为none。如图2所示，卷积神经网络模型对图片的处理过程具体为，首先输入尺寸640*640，然后通过一个3*3的步长为1填充为1特征图数量为32的卷积核，一个3*3的步长为2填充为1特征图数量为64的卷积核，获得特征图大小变为320*320。

然后连续两次通过一个1*1的步长为1填充为0特征图数量为32的卷积核，一个3*3的步长为2填充为1特征图数量为64的卷积核，一个残差块的组合。再通过一个3*3的步长为2填充为1特征图数量为128的卷积核，获得特征图大小变为160*160。

然后连续三次通过一个1*1的步长为1填充为0特征图数量为64的卷积核，一个3*3的步长为2填充为1特征图数量为128的卷积核，一个残差块的组合。再通过一个3*3的步长为2填充为1特征图数量为256的卷积核，获得特征图大小变为80*80。

然后连续三次通过一个1*1的步长为1填充为0特征图数量为128的卷积核，一个3*3的步长为2填充为1特征图数量为256的卷积核，一个残差块的组合。再通过一个3*3的步长为2填充为1特征图数量为512的卷积核，获得特征图大小变为40*40。

然后连续三次通过一个1*1的步长为1填充为0特征图数量为256的卷积核，一个3*3的步长为2填充为1特征图数量为512的卷积核，一个残差块的组合。得到结果1与上采样后的输出相连。

所述结果1再通过一个3*3的步长为2填充为1特征图数量为768的卷积核，获得特征图大小变为20*20。

然后连续三次通过一个1*1的步长为1填充为0特征图数量为512的卷积核，一个3*3的步长为2填充为1特征图数量为768的卷积核，一个残差块的组合。再通过一个3*3的步长为2填充为1特征图数量为1024的卷积核，获得特征图大小变为10*10。

然后连续四次通过一个1*1的步长为1填充为0特征图数量为512的卷积核，一个3*3的步长为2填充为1特征图数量为768的卷积核，一个残差块的组合。再通过一个3*3的步长为2填充为1特征图数量为1024的卷积核，获得特征图大小变为5*5。

然后连续四次通过一个1*1的步长为1填充为0特征图数量为512的卷积核，一个3*3的步长为2填充为1特征图数量为1024的卷积核，一个残差块的组合。得到结果2经过连续三次1*1的步长为1填充为0和3*3的步长为2填充为1的卷积组合和一个1*1的步长为1填充为0的卷积获得大小为5*5检测结果3。

所述结果2经过连续两次1*1的步长为1填充为0和3*3的步长为2填充为1的卷积组合和一个1*1的步长为1填充为0的卷积并经过三次上采样后与所述结果1相加后经过连续两次1*1的步长为1填充为0和3*3的步长为2填充为1的卷积组合和一个1*1的步长为1填充为0的卷积获得大小为40*40的检测结果4。

在训练时采用FOCAL LOSS作为损失函数，以如下公式表示损失函数，

FL(p_t)＝-α_t(1-p_t)^γlg p_t

式中：

p_t表示预测的概率，

α与γ均为超参数。

采用Swish作为激活函数，激活函数公式为，

式中：

X表示输入图像的tensor张量，

e表示自然常数。

使用FOCAL LOSS作为损失函数解决了类别不平衡问题，使用Swish作为激活函数避免了数值过大的饱和问题。通过以上改进使模型适应现场的复杂场景并提高了模型应用的准确率、召回率及mAP。

卷积神经网络模型的训练过程为，输入图片-图片预处理为指定尺寸输入模型，模型中有卷积层、池化层、BN正则化层、激活函数等等，经过模型后获得若干坐标中心点，以此点为基础生成锚框并根据NMS(Non Maximum Suppression，非极大值抑制)得到对应结果，即预测的图片中各目标的分类及对应位置，即预测框-预测的分类及位置与真实的分类及位置，即标注框进行对比，通过损失函数获得损失值-寻找梯度最大方向进行反向传播-更新模型参数。

步骤4具体包括：

步骤4.1，将训练集中的图片统一调整到640*640。

步骤4.2，对经过步骤4.1调整尺寸后的图片进行图像增强处理；可以理解的是，所属领域技术人员可以使用图像翻转、裁剪、变化颜色、修改亮度、对比度、饱和度等方式进行图像增强处理。

步骤4.3，设定迭代次数(epoch)为10000次，每一批(bitch_size)32张图像，初始学习率为0.001，连续200次没有更优结果则将学习率更新为原学习率的0.1倍。

步骤4.4，使用图像增强处理后的图片训练卷积神经网络模型。

步骤5，基于步骤4得到的安全带检测模型对监控区域内安全带情况进行实时检测。

实时检测过程为，获得视频-预处理-模型判断是否存在目标，也是获得中心点，应用锚框后及NMS(Non Maximum Suppression，非极大值抑制)后得到结果-模型通过分类判断目标是否安全带-模型回归获得预测框的坐标点并进行绘制-在监视器显示绘制后的图像。

如图3所示，步骤5具体包括以下步骤，

步骤5.1，实时从监控区域内的视频监控设备获取视频数据，将其转化为图片。

步骤5.2，安全带检测模型判断采集的视频图片中是否存在作业人员，即目标。

步骤5.3，对存在作业人员的视频图片进行人物及背景分割，获取锚框位置并判断作业人员是否佩戴安全带；即检测模型会进行分类与回归，分类是将图片分为正样本还是负样本，即背景类，回归是获得预测点的位置。

前面提到特征图尺寸分别为5*5和40*40，在模型中预测的中心坐标落在哪个格子，就由该格子根据对应的锚框大小生成相应的预测框，选取置信度最高的作为预测框。

步骤5.4，若发现未佩戴安全带的目标，使用红色矩形框标注，并标有none字样。标注后图像进行保存处理。

本发明通过采集监控区域内视频图片获得安全带检测数据集并进行标注，通过使用聚类算法获得该安全带检测数据集对应的适用于该监控区域的锚框，通过多个卷积层、池化层、激活层分别得到检测框大小为5*5及40*40的两个输出，多个输出能够更加准确的对不同距离人员进行检测；使用FOCAL LOSS作为损失函数解决了类别不平衡问题，使用Swish作为激活函数避免了数值过大的饱和问题。通过以上改进使模型适应现场的复杂场景并提高了模型应用的准确率、召回率及mAP，有助于相关人员安全意识，帮助工作有序开展。

本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述，但是本领域技术人员应该理解，以上实施示例仅为本发明的优选实施方案，详尽的说明只是为了帮助读者更好地理解本发明精神，而并非对本发明保护范围的限制，相反，任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

Claims

1.一种电厂作业人员是否佩戴安全带的检测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的电厂作业人员是否佩戴安全带的检测方法，其特征在于：

步骤2具体包括：

3.根据权利要求1所述的电厂作业人员是否佩戴安全带的检测方法，其特征在于：

步骤3中，使用聚类方法生成锚框，聚类中距离度量方法为重叠度距离，以如下公式表示预测框与真实框的距离D，

D＝1-IoU(box,clusters)

式中：

D为预测框与真实框的距离，

IoU(·)表示重叠度函数，

box为标注框，

clusters为聚类数目。

4.根据权利要求1至3中任一项所述的电厂作业人员是否佩戴安全带的检测方法，其特征在于：

步骤4中具体包括：

步骤4.1，将训练集中的图片统一调整到640*640；

5.根据权利要求4所述的电厂作业人员是否佩戴安全带的检测方法，其特征在于：

步骤4中，卷积神经网络模型分为1个类别，未安全带的标为none；卷积神经网络模型，其输入图片尺寸为640*640；卷积神经网络模型两输出层锚框数分别为4个和5个，用于检测普通目标、小目标，普通目标的尺寸大于32*32，小目标的尺寸小于或等于32*32；卷积神经网络模型两输出层的特征图尺寸分别为5*5和40*40。

6.根据权利要求5所述的电厂作业人员是否佩戴安全带的检测方法，其特征在于：

步骤4中，卷积神经网络模型对图片的处理过程包括：

7.根据权利要求1至7中任一项所述的电厂作业人员是否佩戴安全带的检测方法，其特征在于：

步骤4中，采用FOCAL LOSS作为损失函数，以如下公式表示损失函数，

FL(p_t)＝-α_t(1-p_t)^γlgp_t

式中：

p_t表示预测的概率，

α与γ均为超参数。

8.根据权利要求【】所述的电厂作业人员是否佩戴安全带的检测方法，其特征在于：

步骤4中，采用Swish作为激活函数，激活函数公式为，

式中：

X表示输入图像的tensor张量，

e表示自然常数。

9.根据权利要求1至8中任一项所述的电厂作业人员是否佩戴安全带的检测方法，其特征在于：

步骤5具体包括：

10.一种利用权利要求1至9任一项所述检测方法的电厂作业人员是否佩戴安全带的检测***，其特征在于，包括：

视频监控设备，设置在电厂监控区域内，用于采集视频数据；

监控主机，包括视频模块处理模块和安全带检测模块，用于将视频监控设备的视频数据转化为图片，并使用安全带检测模型判断电厂作业人员是否佩戴安全带；

通信网络，与视频监控设备和监控主机相连接，用于在视频监控设备与监控主机之间传输视频数据；

显示与警示模块，与监控主机相连接，用于显示视频数据和是否佩戴安全带检测结果，若发现未佩戴安全带，发出警示。