CN111738117B

CN111738117B - 基于深度学习的电铲斗齿视频关键帧的检测方法

Info

Publication number: CN111738117B
Application number: CN202010533835.9A
Authority: CN
Inventors: 解治宇; 徐连生; 孙健; 邓卓夫; 柳小波
Original assignee: Angang Group Mining Co Ltd
Current assignee: Angang Group Mining Co Ltd
Priority date: 2020-06-12
Filing date: 2020-06-12
Publication date: 2023-12-19
Anticipated expiration: 2040-06-12
Also published as: CN111738117A

Abstract

本发明公开了一种基于深度学习的电铲斗齿视频关键帧的检测方法，该方法包括电铲斗齿监控视频的采集部分，斗齿视频数据处理部分和基于深度学习的电铲斗齿视频关键帧获取部分以及后续利用本方法获取的关键帧的其他应用部分。本发明主要通过利用深度学习的方式解决了以往的对于关键帧选取错误从而导致选取的视频关键帧图像不具备代表性和实时性差以及计算量大的传统方案的缺点。

Description

基于深度学习的电铲斗齿视频关键帧的检测方法

技术领域

本发明涉及一种基于深度学习的电铲斗齿视频关键帧的检测方法。

背景技术

从监控设备中获取的视频中有很多是冗余数据，从这些视频数据中获取其中的关键帧图像是一个难题。过去有通过以K-means聚类方法并设定初始阈值来提取视频中的关键帧、基于抽样的关键帧提取以及基于镜头边界以及颜色还有纹理特征的方式对视频流中的关键帧图像提取等。通过聚类的方式会受到由于阈值设定的不合理的影响而导致提取的关键帧图像效果不理想。通过抽样的方式则是从视频帧图像中随机抽取机帧当作斗齿关键帧，但是这些关键帧图像并不具备代表性，显然不合理。通过镜头边界和颜色特征法则是根据视频中的镜头变换及颜色特征变换来确定斗齿关键帧图像。这些方法通过针对图像的整体信息变化来确定关键帧的,就很容易造成关键帧选取错误、不理想、代表性差，同时增加计算量。

发明内容

针对现有技术存在的不足，本发明利用现有的深度学习技术提供了一种基于深度学习的电铲斗齿视频关键帧的检测方法，主要应用于从矿山中的电铲斗齿监控视频图像中找到所需要的电铲斗齿关键帧图像并保存。

本发明提出的方法是这样实现的。

本发明的一种基于深度学习的电铲斗齿视频关键帧的检测方法，其特征在于：电铲斗齿监控视频的采集部分，斗齿视频数据处理部分和基于深度学习的电铲斗齿视频关键帧获取部分以及后续利用本方法获取的关键帧的其他应用部分。包括以下主要步骤：

步骤1：关于电铲斗齿的监控视频数据的采集——从安放在电铲上方的监控摄像头中采集电铲斗齿监控视频数据，将其作为后续提取电铲斗齿的视频关键帧图像的输入；

步骤2：对电铲斗齿监控视频数据进行视频数据预处理；

步骤3：搭建电铲斗齿视频关键帧图像提取器；

步骤3.1：搭建初始的电铲斗齿视频关键帧图像提取卷积神经网络，并在此基础上进行修改；

步骤3.2：经过多次实验，在原来的SegNet网络的基础上中加上深度残差子结构，并且在每次池化之前加上1*1的卷积核实现跨通道的信息交互和信息整合，之后再反卷积成原始分辨率大小的效果更好；

步骤4：将步骤2中经过预处理的视频作为电铲斗齿视频关键帧图像提取卷积神经网络的输入；

步骤4.1：通过电铲斗齿视频关键帧图像提取器对电铲斗齿监控视频进行显著性特征检测,继而得到电铲斗齿监控视频中的关键帧图像；

步骤4.2：通过对电铲斗齿监控视频进行显著性检测，就可以得到电铲斗齿监控视频中关于电铲斗齿的显著性特征图像，也就是监控视频中的关于电铲斗齿的图像；

步骤5：对得到的电铲斗齿显著性特征图像，继续进行图像处理；

步骤6：获取电铲斗齿监控视频中的关键帧图像之后，就可将之用于后续的电铲斗齿的缺失检测。

作为本发明的进一步优化，所述步骤2：视频流数据预处理包括：1)对获取的电铲斗齿监控视频图像进行视频预处理，如视频灰度转换或二值转换，能进一步刨除监控视频中由于这些噪声带来各种影响。

作为本发明的进一步优化，所述步骤4对得到的斗齿关键帧图像继续进行图像处理：1)对得到的斗齿关键帧图像再进行进一步的膨胀腐蚀处理。2)再将处理后的斗齿关键帧图像进行二次筛选：利用OpenCV判断图像中的最大连通区域的面积大小，如果该连通区域的面积大小大于设定的阈值，就能确定更加有效的斗齿关键帧图像。

本发明的效果是：通过提出的基于深度学习的电铲斗齿视频关键帧的检测方法，能够有效的将矿山电铲工作时的斗齿关键帧图像给提取出来，并用于后续的电铲斗齿的缺失检测之中。并且提取的视频关键帧图像具有一定的代表性。

说明书附图

图1为基于深度学习的电铲斗齿视频关键帧的检测方法流程。

图2为基于深度学习的电铲斗齿视频关键帧的检测方法的关键帧提取网络。

具体实施方式

以下是对本发明的实施方式作更详细的说明。但本发明的实施方式及实施案例是为了解释目的的一个方案，并不是对本发明的限制。

本实施方式中采用的基于深度学习的电铲斗齿视频关键帧的检测方法，如图1和图2所示。

具体实施步骤如下：

步骤1：从安放在电铲上方的监控摄像头采集视频数据，将其作为后续提取斗齿关键帧图像的输入；

步骤2：将视频数据进行视频灰度化转换或者是二值转换预处理；

步骤3：将步骤2中经过预处理的视频作为电铲斗齿关键帧图像提取卷积神经网络的输入，进行斗齿视频关键帧的显著性检测,得到斗齿的关键帧图像；具体方法如下：斗齿的关键帧图像经过多次实验，斗齿关键帧提取网络在全卷积网络中加上深度残差子结构，且在每次池化之前都加上1*1的卷积核实现跨通道的信息交互和信息整合，之后再反卷积成原始分辨率大小，通过这样得到斗齿视频关键帧图像的就具有很强的代表性。斗齿视频关键帧图像提取卷积神经网络结构如图2所示。

步骤4：然后对得到的斗齿显著性特征图像再进行进一步的膨胀腐蚀处理操作；

步骤5：对处理过后的斗齿显著性特征图像进行二次筛选：计算其中的最大连通区域面积计算，如果大于设定的阈值就判断其为该视频的斗齿关键帧图像；获取斗齿关键帧图像之后，就能将这些关键帧图像用于之后的电铲斗齿缺失检测应用程序之中。

本发明通过深度学习的方式解决了以往的对于关键帧选取错误从而导致不具备代表性以及计算量大的传统方案的缺点，能有效的将矿山电铲工作时的电铲斗齿关键帧图像给抽取出来，并用于后续的电铲斗齿的缺失检测之中。

Claims

1.基于深度学习的电铲监控视频中的斗齿关键帧的检测方法，其特征在于：分为电铲斗齿监控视频的采集部分，视频数据预处理部分，基于深度学习的电铲监控视频的电铲斗齿关键帧获取部分以及后续利用本方法获取的关键帧的应用部分；包括以下主要步骤：

步骤2：对电铲斗齿监控视频数据进行视频数据预处理；

步骤3：搭建电铲斗齿视频关键帧图像提取器；

步骤4.1：通过电铲斗齿视频关键帧图像提取器对电铲斗齿监控视频进行显著性特征检测, 继而得到电铲斗齿监控视频中的关键帧图像；

所述的步骤5中，对得到的电铲斗齿显著性特征图像继续进行图像处理；包括：1）对得到的斗齿显著性特征图像再进行进一步的膨胀腐蚀处理；2）再将处理后的斗齿显著性特征图像进行二次筛选：利用OpenCV判断图像中的最大连通区域的面积大小，如果该连通区域的面积大小大于设定的阈值，就能确定有效的斗齿关键帧图像；

2.据权利要求1中所述的基于深度学习的电铲监控视频中的斗齿关键帧的检测方法，其特征在于：所述步骤2：监控视频流数据预处理包括：对获取的电铲斗齿监控视频图像进行视频灰度转换或二值转换，降低色彩带来的影响。

3.根据权利要求1中所述的基于深度学习的电铲监控视频中的斗齿关键帧的检测方法，其特征在于：所述的步骤3中对于电铲斗齿视频关键帧图像提取是经过多次实验，在全卷积网络中再加上深度残差子结构，并且在每次池化之前加上1*1的卷积核实现跨通道的信息交互和信息整合，之后再反卷积成原始分辨率大小，找到视频中的斗齿关键帧图像。