CN117593689A

CN117593689A - 一种基于计算机视觉的矿山人员危险行为识别方法及***

Info

Publication number: CN117593689A
Application number: CN202311374064.3A
Authority: CN
Inventors: 王斌; 袁国智; 盛津芳
Original assignee: Central South University
Current assignee: Central South University
Priority date: 2023-10-20
Filing date: 2023-10-20
Publication date: 2024-02-23

Abstract

本发明公开了一种基于计算机视觉的矿山人员危险行为识别方法，包括以下步骤：S1、采集包含危险行为的危险行为视频数据，将危险行为视频数据上传至数据构建子***进行预处理和危险行为预标注，得到危险行为数据集；数据构建子***将危险行为数据集发送至行为识别子***；S2、行为识别子***根据危险行为数据集，对行为识别模块中的行为识别算法进行训练，得到危险行为识别模型；S3、通过目标检测模块对矿山视频数据进行目标检测，得到第一信息；通过危险行为识别模型对第一信息进行危险行为识别。本发明还公开了一种基于计算机视觉的矿山人员危险行为识别***。

Description

一种基于计算机视觉的矿山人员危险行为识别方法及***

技术领域

本发明涉及安全监察领域，尤其涉及一种基于计算机视觉的矿山人员危险行为识别方法及***。

背景技术

随着矿山开采业的快速发展，矿山安全问题已成为一个日益严重的社会问题。为了保障矿山工人的生命安全，实现对矿山安全的有效管控，矿山危险行为识别研究显得尤为重要。矿山安全风险高发，主要原因是矿山开采过程中存在大量的危险因素，如矿井瓦斯***、矿井突水、矿井坍塌等，这些危险因素往往是由于矿山工人的危险行为导致的。因此，对矿山危险行为进行识别，并根据识别到的危险行为对人员进行管控，是防止矿山事故发生的关键。矿山危险行为识别研究旨在通过对矿山工人的行为进行监控和分析，识别出可能导致事故发生的危险行为，从而采取相应的措施进行预防和控制。

随着矿山作业自动化程度的提高，对作业现场的***提出了更高的要求。矿山危险行为识别的准确性对于预防事故和降低损失具有重要意义。然而，现如今的矿山***工作中，通常为人工对矿山工人的危险行为进行监管和识别，人工监管识别不仅需要投入大量的人力，还容易受到环境干扰、监管人员疲劳等因素的影响，监管效果通常不尽如人意，无法实时和准确地对矿山工人的危险行为进行识别。

因此，亟需一种能够解决传统的矿山安全人工监察识别方法无法实时和准确地对矿山人员的危险行为进行识别的技术问题的方案。

发明内容

本发明提供了一种基于计算机视觉的矿山人员危险行为识别方法及***，用以解决传统的矿山安全人工监察识别方法无法实时和准确地对矿山人员的危险行为进行识别的技术问题。

为实现上述目的，本发明提供了一种基于计算机视觉的矿山人员危险行为识别方法，用于基于计算机视觉的矿山人员危险行为识别***，***包括数据集构建子***和行为识别子******，数据集构建子***和行为识别子***之间通信连接，行为识别子***包括目标检测模块和行为识别模块，方法包括以下步骤：

S1、采集包含危险行为的危险行为视频数据，将危险行为视频数据上传至数据构建子***进行预处理和危险行为预标注，得到危险行为数据集；数据构建子***将危险行为数据集发送至行为识别子***；

S2、行为识别子***根据危险行为数据集，对行为识别模块中的行为识别算法进行训练，得到危险行为识别模型；

S3、通过目标检测模块对矿山视频数据进行目标检测，得到第一信息；通过危险行为识别模型对第一信息进行危险行为识别。

优选的，将危险行为视频数据上传至数据构建子***进行预处理和危险行为预标注包括：

通过数据集构建子***将危险行为视频数据进行裁剪和分帧；得到危险行为视频帧；

通过数据集构建子***将危险行为视频帧进行预标注得到危险行为数据集，危险行为数据集包括视频名称、视频帧序数、人员的锚框坐标、行为序号标签和人员序号标签。

优选的，通过数据集构建子***将危险行为视频帧进行预标注得到危险行为数据集包括：

对经过预标注的结果进行满足预设要求的锚框位置和大小的人工微调，得到第一数据集；将第一数据集转换为行为识别子***能够识别的数据集格式，得到危险行为数据集。

优选的，第一信息包括矿山人员的锚选坐标信息和视频信息；通过危险行为识别模型对第一信息进行危险行为识别后，若识别到危险行为，通过行为识别子***发出危险警告信息、记录危险行为信息。

优选的，人工采集危险行为视频数据包括：

通过使用视频采集设备采集具备预设视频质量和视频时长的视频数据，且视频数据中包含体现危险行为类别的第二信息，第二信息用于数据构建子***进行预处理和危险行为预标注。

优选的，危险行为预标注中采用Faster-RCNN算法对人员进行检测定位，包括以下步骤：

步骤一：通过一个经过预训练的深度卷积神经网络对输入的第二信息中原始图像进行特征提取；

步骤二：通过RPN网络将特征生成区域候选；

步骤三：将候选区域进行RoI池化，转换成统一的大小；

步骤四：将经过RoI池化后的特征送入用于判断候选区域的物体类别和用于精细调整候选区域的位置和尺寸的两个全连接网络，完成对第二信息中人员的位置定位。

优选的，在S3中，通过目标检测模块对矿山视频数据进行目标检测包括：

通过部署在矿山各区域的视频监控设备采集视频信息，发送至目标检测模块；目标检测模块采用Faster-RCNN算法进行人员目标检测，得到第一信息。

优选的，行为识别算法包括SlowFast行为识别算法；行为识别子***根据危险行为数据集，对行为识别模块中的SlowFast行为识别算法进行训练，得到危险行为识别模型；

通过危险行为识别模型对第一信息进行危险行为识别，包括以下步骤：

步骤一：将第一信息的视频帧输入到危险行为识别模型的慢路径和快路径两个路径中；

步骤二：在慢路径和快路径两个路径上都进行3D卷积操作，捕获视频帧内物体的空间信息和时间信息；

步骤三：选取快路径网络的一部分输出特征图，然后经过时间维度的降采样和卷积操作，将其与慢路径中相应层级的特征图结合起来；

步骤四：将慢路径和快路径的特征进行融合，得到融合的特征；

步骤五：将融合的特征输入分类器，将特征进行分类，输出视频帧中的行为预测结果，识别出危险行为。

优选的，通过危险行为识别模型对第一信息进行危险行为识别，还包括：

使用交叉熵损失函数来持续优化危险行为识别模型的参数，使危险行为识别模型的预测行为类别与实际行为类别的差距缩小。

本发明还提供了一种基于计算机视觉的矿山人员危险行为识别***，包括数据集构建子***和行为识别子***，数据集构建子***和行为识别子***之间通信连接；

数据集构建子***用于将人工采集的危险行为视频数据进行预处理和危险行为预标注，得到危险行为数据集；并将危险行为数据集发送至行为识别子***；

行为识别子***包括目标检测模块和行为识别模块；行为识别子***用于根据危险行为数据集对行为识别模块中的行为识别算法进行训练，得到危险行为识别模型；目标检测模块用于对矿山视频数据进行目标检测，得到第一信息；行为识别模块用于对第一信息进行危险行为识别。

本发明具有以下有益效果：

本发明的基于计算机视觉的矿山人员危险行为识别方法，通过使用经过预处理和危险行为预标注的危险行为数据集对行为识别算法进行训练，得到危险行为识别模型，使得本发明的算法在训练时能够能快地达到识别危险行为的效果；首先通过目标检测模块检测出目标，再将本发明的危险行为识别模型用于检测出的目标，对目标进行危险行为的识别，使得目标危险行为的检测效率和速度大大提升，能够实时且准确地对矿山人员的危险行为进行识别。

在行为识别的过程中，先采用目标检测算法进行目标检测，再采用行为识别算法进行行为识别，相比于直接利用行为识别算法，目标检测算法可以优先得到人类的精确地锚框信息，为行为识别提供关注点，使本发明可以得到人员锚框信息以及更精准的行为识别。

本发明的基于计算机视觉的矿山人员危险行为识别***用于本发明的方法，与本发明的方法有着相同的有益效果。

除了上面所描述的目的、特征和优点之外，本发明还有其它的目的、特征和优点。下面将参照附图，对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明优选实施例1的危险行为识别流程图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明，但是本发明可以由权利要求限定和覆盖的多种不同方式实施。

参见图1，本发明优选实施例中，提供了一种基于计算机视觉的矿山人员危险行为识别方法，用于数据集构建子***和行为识别子***互相协作的***中，数据集构建子***和行为识别子***之间通信连接，行为识别子***包括目标检测模块和行为识别模块；方法包括以下步骤：

S1、人工采集危险行为视频数据，将危险行为视频数据上传至数据构建子***进行预处理和危险行为预标注，得到危险行为数据集；数据构建子***将危险行为数据集发送至行为识别子***；

人工采集危险行为视频数据包括：

本发明优选实施例中，通过使用视频采集设备采集具备预设视频质量和视频时长的视频数据，防止本方法后续处理过程中裁剪不出有效内容充足的视频数据，为数据提供有效的支撑效果。

将危险行为视频数据上传至数据构建子***进行预处理和危险行为预标注包括：

通过数据集构建子***将危险行为视频数据进行预处理，预处理包括视频数据的裁剪和分帧；危险行为视频数据经过预处理得到危险行为视频帧；

本发明优选实施例中，预处理使用开源、跨平台的多媒体处理工具FFmpeg对视频中有效的行为数据进行裁剪，以及对视频数据进行分帧操作。

危险行为预标注中采用Faster-RCNN算法对人员进行检测定位，包括以下步骤：

步骤一：通过一个经过预训练的深度卷积神经网络对输入的第二信息中原始图像进行特征提取。

本发明优选实施例中，Faster RCNN算法作为一种CNN网络目标检测方法，首先使用一组基础的卷积层、relu激活函数、池化层层提取图片的特征图，该特征图被共享用于后续RPN层和全连接层，这样可以将原始图像转换为特征图；特征图包含了图像的重要信息，但是具有更小的空间维度。

步骤二：通过RPN网络(区域提议网络)将特征生成区域候选。

本发明优选实施例中，通过softmax判断锚框属于正类或者负类，再利用boundingbox回归修正锚框获得精确的候选。Faster RCNN则抛弃了传统的滑动窗口和SS方法，直接使用RPN生成检测框，这也是Faster R-CNN的巨大优势，能极大提升检测框的生成速度。

步骤三：将候选区域进行RoI池化，转换成统一的大小。

本发明优选实施例中，由于候选区域的大小和形状各不相同，所以需要将它们转换成统一的大小，以便输入到后续的分类和定位网络中。这个过程称为RoI池化。RoI池化可以对每个候选区域进行最大池化，使得无论区域的大小如何，都能得到固定大小的输出特征。

本发明优选实施例中，RoI池化后得到的特征会被送入两个全连接的网络：一个是用于分类的网络，用于判断候选区域的物体类别；另一个是用于回归的网络，用于精细调整候选区域的位置和尺寸，使其更准确地覆盖到真正的物体。经过以上步骤，Faster-RCNN通过这些步骤完成对人员的位置定位，可以将位置区域信息用作对人员的锚框坐标的预标注，输出格式为JSON格式，用于人工微调。

本发明优选实施例中，通过数据集构建子***将危险行为视频帧进行预标注得到危险行为数据集包括：

对经过预标注的结果进行锚框位置和大小的人工微调，得到第一数据集；将第一数据集转换为行为识别子***能够识别的数据集格式，得到危险行为数据集。

本发明优选实施例中，对于预标注的结果，开发人员使用via3工具进行查看和微调。主要内容为调整锚框的大小和位置，以更好标注人员锚框坐标信息。

本发明优选实施例中，将标注信息微调之后，重新上传至数据集构建子***，子***将标注文件的via格式转化为AVA格式，包括有两个步骤：首先，根据via标注文件将会生成训练集和测试集的标注文件(包含视频名称、视频帧ID，人员位置信息，人员ID，危险行为标签)和对应的压缩文件，生成设定的危险行为列表和字典，生成不包含危险行为的视频帧标注文件；其次，数据集构建子***将修改统一视频帧文件的名称，用于进行行为识别算法的训练，危险行为数据集的构建过程结束。

本发明优选实施例中，采用Slowfast网络作为行为识别算法。Slowfast网络可以被描述为一个在两个不同帧率下运行的单一流架构。通用架构有一个缓慢的路径和一个快速的路径，通过横向连接融合到一个网络中。

对行为识别模块中的行为识别算法进行训练，得到危险行为识别模型具体包括：

从随机初始化开始进行训练的，不进行任何预训练，并使用同步的SGD(梯度下降法)训练。在时间域，算法网络从危险行为数据集中随机抽取一个视频片段(αT×τ帧)，其中算法网络的慢路径和快路径的输入分别为T帧和αT帧；对于空间域，我们从危险行为数据集的视频中随机裁剪224×224像素，或其水平翻转，在[256,320]像素中随机进行较短的边采样。

第一信息包括矿山人员的锚选坐标信息和视频信息；通过危险行为识别模型对第一信息进行危险行为识别后，若识别到危险行为，通过行为识别子***发出危险警告信息、记录危险行为信息。

在S3中，通过目标检测模块对矿山视频数据进行目标检测包括：

本发明优选实施例中，目标检测模块所采用的Faster-RCNN算法与危险行为预标注中采用Faster-RCNN算法相同，所采用的Faster-RCNN算法均在ImageNet和COCO的人类关键点图像数据集上进行了预训练，并对AVA数据集上目标检测算法进行了微调。采用经过上述处理掉的Faster-RCNN算法进行人员目标检测，能够精准提取人员的锚框位置信息，用于后续对危险行为识别的任务。

行为识别算法包括SlowFast行为识别算法；即行为识别子***根据危险行为数据集，对行为识别模块中的SlowFast行为识别算法进行训练，得到危险行为识别模型；

步骤一：将第一信息的视频帧输入到慢路径和快路径两个路径中；

步骤五：将融合的特征输入分类器，如softmax分类器，将特征进行分类，输出视频帧中的行为预测结果，识别出危险行为。

通过危险行为识别模型对第一信息进行危险行为识别，还包括：

使用交叉熵损失函数来持续优化危险行为识别模型的参数，使危险行为识别模型的预测行为类别越来越接近实际行为类别；并使用预设的验证集来验证危险行为识别模型的准确度。

本发明优选实施例中，在验证集的mAP(平均精度均值)达到较为理想的数值(一般在29左右)后，停止危险行为识别模型的优化。

本发明优选实施例中，还可以采用各种优化器(如Adam、SGD等)和学习率策略来调整模型的。

本发明优选实施例中，在行为识别的过程中，先采用目标检测算法进行目标检测，再采用行为识别算法进行行为识别，相比于直接利用行为识别算法，目标检测算法可以优先得到人类的精确地锚框信息，为行为识别提供关注点，使本发明可以得到人员锚框信息以及更精准的行为识别。

本发明优选实施例的基于计算机视觉的矿山人员危险行为识别方法，通过使用经过预处理和危险行为预标注的危险行为数据集对行为识别算法进行训练，得到危险行为识别模型，使得本发明的算法在训练时能够能快地达到识别危险行为的效果；首先通过目标检测模块检测出目标，再将本发明的危险行为识别模型用于检测出的目标，对目标进行危险行为的识别，使得目标危险行为的检测效率和速度大大提升，能够实时且准确地对矿山人员的危险行为进行识别。本发明的方法将计算机视觉应用到如今的生产生活中去，能解放人力提高效率，减少安全事故的产生，让生产者更安心于现有工作，管理人员也更好的对工地全局进行管控，让生产安全得到更好的保障。

本发明优选实施例中，还提供了一种基于计算机视觉的矿山人员危险行为识别***，包括数据集构建子***和行为识别子***，数据集构建子***和行为识别子***之间通信连接；

以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于计算机视觉的矿山人员危险行为识别方法，用于基于计算机视觉的矿山人员危险行为识别***，所述***包括数据集构建子***和行为识别子******，所述数据集构建子***和行为识别子***之间通信连接，所述行为识别子***包括目标检测模块和行为识别模块，其特征在于，所述方法包括以下步骤：

S1、采集包含危险行为的危险行为视频数据，将所述危险行为视频数据上传至所述数据构建子***进行预处理和危险行为预标注，得到危险行为数据集；所述数据构建子***将所述危险行为数据集发送至所述行为识别子***；

S2、所述行为识别子***根据所述危险行为数据集，对所述行为识别模块中的行为识别算法进行训练，得到危险行为识别模型；

S3、通过所述目标检测模块对矿山视频数据进行目标检测，得到第一信息；通过所述危险行为识别模型对所述第一信息进行危险行为识别。

2.根据权利要求1所述的基于计算机视觉的矿山人员危险行为识别方法，其特征在于，将所述危险行为视频数据上传至所述数据构建子***进行预处理和危险行为预标注包括：

通过数据集构建子***将所述危险行为视频数据进行裁剪和分帧；得到危险行为视频帧；

通过数据集构建子***将所述危险行为视频帧进行预标注得到危险行为数据集，所述危险行为数据集包括视频名称、视频帧序数、人员的锚框坐标、行为序号标签和人员序号标签。

3.根据权利要求2所述的基于计算机视觉的矿山人员危险行为识别方法，其特征在于，通过数据集构建子***将所述危险行为视频帧进行预标注得到危险行为数据集包括：

对经过预标注的结果进行满足预设要求的锚框位置和大小的人工微调，得到第一数据集；将所述第一数据集转换为所述行为识别子***能够识别的数据集格式，得到危险行为数据集。

4.根据权利要求3所述的基于计算机视觉的矿山人员危险行为识别方法，其特征在于，所述第一信息包括矿山人员的锚选坐标信息和视频信息；通过所述危险行为识别模型对所述第一信息进行危险行为识别后，若识别到危险行为，通过所述行为识别子***发出危险警告信息、记录危险行为信息。

5.根据权利要求4所述的基于计算机视觉的矿山人员危险行为识别方法，其特征在于，所述人工采集危险行为视频数据包括：

通过使用视频采集设备采集具备预设视频质量和视频时长的视频数据，且所述视频数据中包含体现危险行为类别的第二信息，所述第二信息用于所述数据构建子***进行预处理和危险行为预标注。

6.根据权利要求5所述的基于计算机视觉的矿山人员危险行为识别方法，其特征在于，所述危险行为预标注中采用Faster-RCNN算法对人员进行检测定位，包括以下步骤：

步骤二：通过RPN网络将所述特征生成区域候选；

步骤三：将所述候选区域进行RoI池化，转换成统一的大小；

7.根据权利要求1所述的基于计算机视觉的矿山人员危险行为识别方法，其特征在于，在S3中，通过所述目标检测模块对矿山视频数据进行目标检测包括：

通过部署在矿山各区域的视频监控设备采集视频信息，发送至所述目标检测模块；所述目标检测模块采用Faster-RCNN算法进行人员目标检测，得到第一信息。

8.根据权利要求1所述的基于计算机视觉的矿山人员危险行为识别方法，其特征在于，所述行为识别算法包括SlowFast行为识别算法；所述行为识别子***根据所述危险行为数据集，对所述行为识别模块中的SlowFast行为识别算法进行训练，得到危险行为识别模型；

通过所述危险行为识别模型对所述第一信息进行危险行为识别，包括以下步骤：

步骤一：将所述第一信息的视频帧输入到危险行为识别模型的慢路径和快路径两个路径中；

步骤五：将所述融合的特征输入分类器，将特征进行分类，输出视频帧中的行为预测结果，识别出危险行为。

9.根据权利要求8所述的基于计算机视觉的矿山人员危险行为识别方法，其特征在于，通过所述危险行为识别模型对所述第一信息进行危险行为识别，还包括：

使用交叉熵损失函数来持续优化所述危险行为识别模型的参数，使所述危险行为识别模型的预测行为类别与实际行为类别的差距缩小。

10.一种基于计算机视觉的矿山人员危险行为识别***，其特征在于，包括数据集构建子***和行为识别子***，所述数据集构建子***和行为识别子***之间通信连接；

所述数据集构建子***用于将人工采集的危险行为视频数据进行预处理和危险行为预标注，得到危险行为数据集；并将所述危险行为数据集发送至所述行为识别子***；

所述行为识别子***包括目标检测模块和行为识别模块；所述行为识别子***用于根据所述危险行为数据集对所述行为识别模块中的行为识别算法进行训练，得到危险行为识别模型；所述目标检测模块用于对矿山视频数据进行目标检测，得到第一信息；所述行为识别模块用于对所述第一信息进行危险行为识别。