CN113158829A

CN113158829A - 一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***

Info

Publication number: CN113158829A
Application number: CN202110343840.8A
Authority: CN
Inventors: 段章领; 周行云; 盛一帆; 朱明杰; 徐岳; 杨富超; 胡倩凝; 汪志敏; 马腾; 张馨雨; 周明祎; 熊天乐; 潘悦靓
Original assignee: Anhui University
Current assignee: Anhui University
Priority date: 2021-03-31
Filing date: 2021-03-31
Publication date: 2021-07-23

Abstract

本发明公开了一种基于EfficientDet网络的深度学习矿石测量方法及应用***，其中包括：通过高帧率摄像头获取流动皮带上的矿石图像；预处理矿石图像：标记图像中所有矿石，去除异常数据，对图像进行数据增强；将标记后的样本按7：2：1分为训练集，验证集和测试集；使用EfficientDet网络进行训练得到网络模型；在测试的时候使用EfficientDet网络模型得到的预测框定位出矿石的位置并通过摄像头的焦距以及图像像素大小计算出矿石的大小；根据***预设阈值，发现有矿石大小超过***阈值时发出提醒。本发明可以的高效的检测矿石的大小，相对于其他网络模型，使用更少的参数，有更快的检测速度，极大地降低了对人工的依赖。

Description

一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***

技术领域

本发明涉及一种图像目标识别方法，一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***。

背景技术

矿产资源指经过地质成矿作用，使埋藏于地下或出露于地表、并具有开发利用价值的矿物或有用元素的含量达到具有工业利用价值的集合体。矿产资源是重要的自然资源，是社会生产发展的重要物质基础，现代社会人们的生产和生活都离不开矿产资源。矿产资源属于不可再生资源，其储量是有限的。要加大对矿产资源的利用的广度和深度。按其特点和用途，通常分为金属矿产、非金属矿产和能源矿产三大类。金属矿石的采掘以***形式进行，不均匀的矿石经过皮带机运输到一级破碎机时，如果矿石大小太大容易损伤破碎机机体。目前主要人工进行监控，再筛选大块矿石，以降低对破碎机机体的损害。而人工筛选的问题主要有两点：首先是安全问题，提升井皮带机环境恶劣，粉尘和噪声严重，长时间对工人身体造成损伤;其次是人工监测长时间工作会出现视觉疲劳，容易出现漏检情况，导致损伤破碎机机体。国外一些发达国家，已经将机器视觉的相关知识应用到矿石的开采中，以提高效率，而国内现在使用机器视觉相关知识的还比较少。本专利采用深度学习领域机器视觉相关知识，构建EfficientDet检测网络，实现所有的矿石块的实时检测，定位其位置，识别其大小，并在遇到超过***阈值大小的矿石块时进行实时预警，告知皮带控制***相关情况，使皮带及时停止。于此同时将异常信号传输给执行机构，执行机构拨出大块矿石。大量减少了人工的使用，保障工人安全的同时提高了检测效率，极大地降低漏检的情况。模型效率在计算机视觉中十分重要， EfficientDet网络相较于之前的深度学习网络如MaskR-CNN等，可以使用更少的参数和更低的运算量达到更高的精度，以提高检测的效率。

综上所述，传统的矿石大小检测需要大量的人工进行手工操作问题，基于神经网络的模型的检测参数量过大，需要强大的算力的技术问题，本专利使用EfficientDet进行矿石大小检测和预警，大量减少了人工的使用，提高了检测效率。

发明内容

对于上述现有技术存在的问题，提出了一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，目的是为了解决矿石大小检测中存在的极大地依赖人工，效率低，准确率低，模型参数量过大，需要强大的算力的技术问题。具体包括：通过高帧率摄像头捕捉皮带上运输矿石的视频流，将视频流转换为图片;将图像进行手工标注，并剔除异常的矿石图片；将获取到的矿石图片按7：2：1分为训练图片、验证图片和测试图片；对矿石图片进行数据增强提高泛化能力;使用EfficientNet网络作为骨干，创建EfficientDet目标检测网络，使用训练数据集得到网络模型;使用训练完成的EfficientDet网络模型进行测试，将得到的预测框用于定位出矿石的位置并通过摄像头的焦距以及图像像素大小计算出矿石的大小。根据***预设阈值，发现有矿石大小超过***阈值时发出预警，同时将异常信号传输给执行机构，执行机构拨出大块矿石。

本发明采用如下技术方案解决技术问题：一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，用在矿业中检测矿石大小，并对超过阈值大小的矿石块进行智能化处理，具体步骤如下：

S1、数据获取阶段：通过高速摄像头拍摄流动皮带上矿石，将视频流的关键帧存储为图片;

S2、数据预处理阶段：将图像进行手工标注，检测并剔除异常的矿石图片；将获取到的矿石图片按7：2：1分为训练图片、验证图片和测试图片；对矿石图片进行数据增强提高泛化能力;

S3、创建与训练网络阶段：使用EfficientNet网络作为骨干网络，BiFPN(bi-directional feature pyramid network)作为特征提取网络，选择EfficientD0至D7中的一个来创建EfficientDet目标检测网络，设置参数如学习率、Batch size、训练的轮数、优化器等，使用矿石训练数据集得到网络模型；

S4、测试阶段：使用训练完成的EfficientDet网络模型进行测试，将得到的预测框用于定位出矿石的位置并通过摄像头的焦距以及图像大小计算出矿石的大小；

S5、提醒阶段：根据***预设阈值，发现有矿石大小超过***阈值时发出预警，同时将异常信号传输给执行机构，执行机构拨出大块矿石。

对上述方案的进行进一步描述：

所述步骤S1中数据获取，由以下步骤组成：

(1)、通过安装在皮带附近的多个不同角度的高帧率摄像头获取矿石图片视频流；

(2)、从已经获取到的图片视频流中截取关键帧作为图像数据；

所述步骤S2中数据预处理，由以下步骤组成：

(i)使用图像标注工具Lableme对获取到的图片数据中矿石位置、大小进行标记，矿石的大小并不规整，需要进行多边形标记；

(ii)检测出不符合要求的矿石图片数据，并将其剔除；主要是检测标注的数据是否超过图片的边界的异常情况以及坐标位置颠倒的情况;

(iii)对训练图片进行数据增强：对矿石图片随机进行不同角度的水平和竖直反转；对矿石图片进行缩放；通过直方图均衡调整图像的像素值使得其值变为均匀分布；添加随机噪声；将图像从RGB色彩空间转换为HSV色彩空间调整图片亮度，将图像进行正规化操作，以及对噪声进行处理；以此来提高网络的泛化能力。

所述步骤S3中创建与训练网络阶段，由以下步骤组成：

(Ⅰ)使用EfficientNet网络作为骨干网络，采用BiFPN网路对EfficientNet提取到的网络特征进行融合，EfficientDet的Head对提取到的特征进行分类和回归预测；

(Ⅱ)整个EfficientNet有B0-B7多个版本，其中EfficientNet-B0由1个Conv(3×3)、1个MBConv1(3×3)、2个MBConv6(3×3)、2个MBConv6(5×5)、3个MBConv6(3×3)、3个MBConv6(5×5)、4个MBConv6(5×5)、一个MBConv6(3×3)、一个Conv(1×1)、一个Pooling层，一个FC层。其中MBConv包含残差结构。先使用1×1的卷积进行升维操作，再进行3×3或5×5的卷积，此后增加关于通道的注意力机制，在使用1×1的卷积进行降维操作，再与残差结构进行堆叠。MBConv的激活函数使用的是Swish函数，并使用Batch Normalization进行标准化；

Swish函数的定义为

其中

是一个常数或可训练的参数；

函数表达式如下：

于此同时EfficientNet-B0将网络的宽度(depth)、深度(width)和分辨率 (resolution)按照公式X(TODO)的要求，使用系数

进行复合缩放。其中，α、β、γ是可以通过网格搜索确定的常数。在

和

的约束下， EfficientNet-B0的最佳值为

=1.2，

=1.1，

=1.15。

所述步骤S3中创建BiFPN，由以下步骤组成：

(A) BiFPN网络可以学习来自不同输入特征的重要性，同时重复应用自顶向下和自底向上的多大小特征融合。加强提取网络由多个BiFPN构成，其中EfficientDet-D0到D7分别由3、4、5、6、7、7、8、8个BiFPN构成；

(B)EfficientDet包含EfficientNet主干提取网络和BiFPN加强提取网络，以及 Efficient Head将提取到的特征转化为预测结果。首先EfficientNet将输入的图片不断进行下采样，原始的EfficientNet的下采样次数是5次，通过EfficientNet可以获得

、

，

是输入图片长和宽压缩一次的结果，

是输入图片长和宽压缩两次的结果，

是输入图片长和宽压缩三次的结果，以此类推。由于

和

并不具有较高的语义信息，因此在加强提取网络BiFPN中并不会用到

、

具有比较高的语义信息，因此在加强提取网络BiFPN中使用到，作为5个有效特征层中的三个。对P5进行两次下采样，获得具有更高语义的信息的

、

。获得5个有效特征层

、

；

(C)将这5个特征层，传入加强提取网络BiFPN进行进一步的特征提取，其中

表示分辨率为输入图像

的特征级别。例如，如果输入分辨率为640x640，

代表分辨率为 80x80的特征级别3(640/

= 80)，而

代表代表分辨率为5x5的7级特征级别；具体如下：

①进行通道数的调整，获得

，

，

，

，

，如果是第一次进入BiFPN，将

通过减少通道数转化为

_1和

_2，

通过减少通道转化为

_1和

_2；

②在获得

、

_1、

_2、

_1、

_2、

、

之后需要对

进行上采样，上采样后与

采用注意力机制，用来判断是更关注

还是

，再用swish函数进行激活，再进行卷积从而获得

；

③对

进行上采样，上采样后与

_1采用注意力机制，用来判断是更关注

还是

_1，再用swish函数进行激活，再进行卷积从而获得

；

④对

进行上采样，上采样后与

_1采用注意力机制，用来判断是更关注

还是

_1，再用swish函数进行激活，再进行卷积从而获得

；

⑤对

进行上采样，上采样后与

采用注意力机制，用来判断是更关注

还是

，再用swish函数进行激活，再进行卷积从而获得

；

⑥在获得

、

、

_2、

、

_2、

、

、

之后，需要对

进行下采样，下采样后与

、

_2采用注意力机制，用来判断是更关注

、

还是

_2，再用swish函数进行激活，再进行卷积从而获得

；

⑦对

进行下采样，下采样后与

、

_2采用注意力机制，用来判断是更关注

、

还是

_2，再用swish函数进行激活，再进行卷积从而获得

；之后对

进行下采样，下采样后与

、

采用注意力机制，用来判断是更关注

、

还是

，再用swish 函数进行激活，再进行卷积从而获得

；之后对

进行下采样，下采样后与

采用注意力机制，用来判断是更关注

、还是

，再用swish函数进行激活，再进行卷积从而获得

；

⑧将获得的

、

、

、

、

作为

、

、

、

、

，重复之前步骤进行堆叠即可，对于EffiicientDet-B0，还需要重复2次，此时

_1和

_2不需要分开了，

_1和

_2也不需要分开。以上融合特征在第6层可以简述为：

其中

代表第

层的特征，其中

是自上而下路径上第6级的中间特征，而

是自下而上路径中第6级的输出特征；

当融合不同分辨率的特征时，一种常见的方法是首先将它们调整到相同的分辨率，然后对它们进行求和，以前的方法一视同仁地对待所有输入特征；

由于不同的输入特征具有不同的分辨率，它们对输出特征的贡献通常是不相等的；

BiFPN每个输入添加额外的权重，并让网络了解每个输入特征的重要性。BiFPN使用Fast normalized fusion(快速归一化融合)：

是一个可学习的权重，可以是标量(每个特征)、矢量(每个通道)或多维张量(每个像素)。为了避免数值不稳定，

设置为一个较小的值

=0.0001；

BiFPN的宽度和深度使用以下公式缩放：

其中1.35作为BiFPN宽度缩放因子，

是控制所有其他比例维度的复合系数。预测网络的宽度和BiFPN相同：

预测网络的深度使用等式进行线性增加：

所述步骤S3中构建损失函数，由以下步骤组成：

(P1)使用如下损失函数计算网络结果与真实值之间的差异：

其中

是分类的loss，

是回归的loss。

使用的是是Smooth-L1 loss函数。Smooth-L1 loss函数如下所示：

(P2)一张图像有很多候选框，其中包含目标的是正样本，不包含目标的是负样本。如果样本一属于类别一的概率为0.9，样本二属于类别一的概率为0.6，前者是容易分类的样本，后者是难分类的样本。EfficientDet中的分类loss是Focal loss。Focal loss可以控制正负样本的权重，同时可以控制容易分类和难分类样本的权重；

(P3) Focal loss源自于交叉熵损失函数，二分类的交叉熵函数损失为：

使用

简化交叉熵损失函数：

控制正负样本的权重，可以在交叉熵损失函数前增加一个系数

：

控制容易分类和难分类样本的权重；

称为调制系数(modulating factor)。当γ=0的时候，focal loss就是交叉熵损失函数，可以通过调整

实现调制系数的改变。两种权重进行合并可得：

其中

= 0.25和

= 1.5。

所述步骤S4中测试阶段，由以下步骤组成：

(Q1)为了和普通特征层区分，我们称之为BiFPN提取到的特征层称为有效特征层，将这五个有效的特征层传入ClassNet(分类预测网络)和BoxNet(回归预测网络)即可获得预测结果；

(Q2)对于Efficientdet-B0来说，ClassNet采用3次64通道的深度可分离卷积和1次该特征层所拥有的先验框数量乘以网络共有多少类的目标的卷积，先验框数量默认为9。BoxNet采用3次64通道的卷积和1次该特征层所拥有的先验框数量乘以四的卷积，四指的是先验框的调整情况，调增中心位置和宽高。EfficientDet默认有9个先验框，可按照实际情况对先验框的长宽比例进行调整，以适合检测的目标。EfficientDet会判定先验框中的物体以及物体的种类，并且会对先验框进行调整，使用非极大抑制(soft-NMS)筛选出在一定区域属于同一种类置信度最大的框，获得最终的预测框；

(Q3) 将预先的保留的矿石测试图片传入EfficientDet网络进行预测，得到图片中矿石的预测框，并计算出预测框的大小，再通过预测框的大小和误差计算出真实矿石的大小；

(Q4) 根据摄像头的安装角度、摄像头到皮带的距离以及网络模型预测框的大小和图像的像素计算出其真实大小：

是摄像头与皮带垂线的夹角，

表示矿石的真实大小，

表示摄像头与皮带间的垂直距离，

表示摄像头的焦距，

表示EfficientDet网络模型预测框的大小。

所述步骤S5中提醒阶段，由以下步骤组成：

(T1)设置***阈值为矿石大小报警阈值与误差阈值之和，将计算得到的矿石真实大小与***阈值进行比较；

(T2) 发现有矿石大小超过***阈值时发出预警，同时将异常信号传输给执行机构，执行机构拨出大块矿石。

所述预警***，由以下部分组成：

(D1) 用户模块，负责用户的注册、登录、管理，显示个人的用户信息，提供超级用户的管理权限；

(D2) 矿石视频流采集模块，通过安装在矿石流动皮带附近各个角度的摄像头采集矿石视频流，并将采集到的图像发送给实时预警模块；

(D3) 实时预警模块，接受矿石视频流采集模块发送的矿石图像，并矿石图像传入到经过训练的EfficientDet网络中，得到矿石的位置及大小，将计算得到的矿石真实大小与***阈值进行比较。如果其真实大小比***阈值更大，则将异常信息显示到页面上，并将异常信息写入数据库；

(D4) 设置模块，设置***相关参数以及日志相关参数，如报警矿石块大小等；

(D5)日志模块，接受实时预警***的异常记录并显示该异常，并将异常记录同步到云端服务器。

所述预警***Web端的用户模块，由以下部分组成：

(U1) 对新的管理人员提供注册、登录功能，可以操作并使用整个***，将其信息保存至云端服务器，并赋予相应的权限;

(U2) 对权限高的超级管理员提供操作***的高级权限，操作并使用整个***的同时管理其他用户。

所述预警***Web端的实时预警模块，由以下部分组成：

(R1)添加、删除、修改对应的工控机设备；

(R2)实时显示已经添加的工控机设备的皮带转动画面；支持启动和停止显示该工控机设备的皮带转动画面；

(R3)当检测到某工控机矿石真实大小大于***阈值时，显示异常信息，用户可以根据异常信息选择是否停止该工控机的运转，并将异常记录的工控机信息、发生异常的时间和图片保存至数据库中，同时写入日志模块；每隔一段时间将数据库中的异常记录同步至云端服务器。

所述预警***Web端的设置模块，由以下部分组成：

设置预警***的相关信息，主要有设置***预警的矿石块大小，设置***误差的大小以及设置相机的焦距、云端服务器端口等。

所述预警***Web端的日志模块，由以下部分组成：

(Z1)接受实时告警***的异常记录，实时显示在页面上，并将记录写入数据库；

(Z2)选择是否将日志同步到云端服务器;

(Z3)提供搜索功能，可能根据工控机设备、时间、阈值等信息搜索告警记录。

所述预警***APP端的用户模块，由以下部分组成：

(M1)与Web端的数据库保持同步，对新的管理人员提供注册、登录功能，可以操作并使用整个***，将其信息保存至云端服务器，并赋予相应的权限;

(M2)权限高的超级管理员提供操作***的高级权限，操作并使用整个***的同时管理其他用户。

所述预警***APP端的实时预警模块，由以下部分组成：

(X1)同步数据库中的工控机设备内容，可以添加、删除、修改对应的工控机设备；

(X2)实时显示已经添加的工控机设备的皮带转动画面；支持启动和停止显示该工控机设备的皮带转动画面；

(X3)当检测到某工控机矿石真实大小大于***阈值时，显示异常信息，用户可以根据异常信息选择是否停止该工控机的运转，并将异常记录的工控机信息、发生异常的时间和图片保存至数据库中，同时写入日志模块；每隔一段时间将数据库中的异常记录同步至云端服务器。

所述预警***APP端的日志模块，由以下部分组成：

(Y1)实时查询数据库，将异常信息显示在页面上；

(Y2)提供搜索功能，可能根据工控机设备、时间、阈值等信息搜索告警记录。

如上所述，本发明提出了一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，通过EfficientDet网络模型解决矿石大小检测中存在的极度依赖人工、效率低、准确率低、模型参数量过大等问题。

附图说明

图1为本发明的矿石大小测量方法步骤示意图；

图2为本发明的的EfficientDet骨架网络EfficientNet的架构示意图；

图3为本发明的的EfficientDet特征提取网络BiFPN的架构示意图；

图4显示为本发明的EfficientDet网络的整体结构示意图；

图5显示为图1中步骤S1在一实施例中的具体流程图；

图6显示为图1中步骤S2在一实施例中的具体流程图；

图7显示为图1中步骤S3在一实施例中的具体流程图；

图8显示为图1中步骤S4在一实施例中的具体流程图；

图9显示为图1中步骤S5在一实施例中的具体流程图；

图10显示为本发明一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***模块示意图；

图11显示为图10中用户模块M3在一实施例中的具体模块图；

图12显示为图10中实时预警模块M2在一实施例中的具体模块图；

图13显示为图10中设置模块M4在一实施例中的具体模块图；

图14显示为图10中日志模块M5在一实施例中的具体模块图；

附图标记：M1、视频流采集模块；M2实时预警模块；M21APP端；M22Web端；M3用户模块；M4设置模块；M5日志模块；M6数据库模块；S1～S5为方法步骤；S11～S14为方法步骤；S21～S25为方法步骤；S31～S36为方法步骤；S41～S43为方法步骤；S51～S54为方法步骤。

具体实施方式

根据图1、图2和图3，为本发明的矿石大小测量方法步骤示意图、EfficientDet骨架网络EfficientNet的架构示意图和特征提取网络BiFPN的架构示意图；本发明旨在通过EfficientDet网络模型解决矿石大小检测中存在的极度依赖人工、效率低、准确率低、模型参数量过大等问题。EfficientDet有EfficientDet-D0至EfficientDet-D7共8个版本，随着版本号的提升模型参数和运算量都有提升，同时精度也在提升。选择合适的网络版本以适应不同的应用场景，接下来以EfficientDet-D0为例。包括以下方法步骤：

S1、数据获取阶段：通过高速摄像头拍摄流动皮带上矿石，将视频流的关键帧存储为图片；

S2、数据预处理阶段：将图像进行手工标注，检测并剔除异常的矿石图片；将获取到的矿石图片按7：2：1分为训练图片、验证图片和测试图片；对矿石图片进行数据增强提高泛化能力；

S3、创建与训练网络阶段：使用EfficientNet网络作为骨干，创建EfficientDet目标检测网络，使用训练数据集得到网络模型；

S4、测试阶段：使用训练完成的EfficientDet网络模型进行测试，将得到的预测框用于定位出矿石的位置并通过摄像头的焦距、摄像头距离皮带的距离以及图像大小计算出矿石的大小；

S5、提醒阶段：根据***预设阈值，发现有矿石大小超过***阈值时发出提醒。

根据图5，其为S1的具体实施步骤，包括以下步骤：

S11、将摄像头安装在流动皮带上方高垂直高度L处的位置，使得摄像头的拍摄范围，能够覆盖流动皮带的横向宽度，以获得完整的矿石视频流；

S12、设置摄像头参数数据，包括分辨率、帧率、色彩空间等参数，以获取更为清晰的矿石视频；

S13、选择适当的视频采集数据的存放格式，将视频存储为视频流，本发明采用的是MJPEG格式；

S14、将视频流中的关键帧数据截取出来，用作接下来训练、验证、测试的矿石图片。

根据图6，其为S2的具体实施步骤，包括以下步骤：

S21、使用图像标注工具Lableme对获取到的图片数据中矿石位置、大小进行标记，矿石的尺度并不规整，需要进行多边形标记，保存的json文件。json文件名与标记的名字相同，图片的存储格式为Base64编码；

S22、根据标注的数据对矿石图片进行处理，检测出不符合要求的图片，删除其图片；

S23、将获取到的矿石图片按7：2：1分为训练图片、验证图片和测试图片；

S24、对训练图片进行数据增强：对矿石图片进行水平和竖直反转、对矿石图片进行缩放的同时更改相应的标注位置；

S25、添加随机噪声；将图像从RGB色彩空间转换为HSV色彩空间调整图片亮度，以适应不同的光照变化，以及将图像进行正规化操作，提高训练的效果。

根据图7，其为S3的具体实施步骤，包括以下步骤：

S31、选择EfficientNet-B0网络的骨干类型，设置训练网络的超参数，学习率、Batch size、训练的轮数(Epochs)、优化器(如SGD、Adam)等。EfficientNet-B0由1个Conv(3×3)、1个MBConv1(3×3)、2个MBConv6(3×3)、2个MBConv6(5×5)、3个MBConv6(3×3)、3个MBConv6(5×5)、4个MBConv6(5×5)、一个MBConv6(3×3)、一个Conv(1×1)、一个Pooling层，一个FC层。其中MBConv包含残差结构。先使用1×1的卷积进行升维操作，再进行3×3或5×5的卷积，此后增加关于通道的注意力机制，在使用1×1的卷积进行降维操作，再与残差结构进行堆叠。MBConv的激活函数使用的是Swish函数，并使用Batch Normalization进行标准化；

Swish函数的定义为：

其中

是一个常数或可训练的参数；

函数表达式如下：

进行网络缩放，确定EfficientNet-B0缩放的最佳值为α=1.2，β=1.1，γ=1.15；

S32、BiFPN网络可以学习来自不同输入特征的重要性，同时重复应用自顶向下和自底向上的多大小特征融合。加强提取网络由多个BiFPN构成，其中EfficientDet-D0由3个BiFPN构成；

根据图4，EfficientDet包含EfficientNet主干提取网络和BiFPN加强提取网络，以及Efficient Head将提取到的特征转化为预测结果。首先EfficientNet将输入的图片不断进行下采样，原始的EfficientNet的下采样次数是5次，通过EfficientNet可以获得

、

，

是输入图片长和宽压缩一次的结果，

是输入图片长和宽压缩两次的结果，

是输入图片长和宽压缩三次的结果，以此类推。由于

和

、

。获得5个有效特征层

、

；

将这5个特征层，传入加强提取网络BiFPN进行进一步的特征提取，其中

表示分辨率为输入图像

的特征级别。例如，如果输入分辨率为640x640，

代表分辨率为 80x80的特征级别3(640/

= 80)，而

代表代表分辨率为5x5的7级特征级别；

图3所示的两个融合特征在第6层的情况：

其中

代表第

层的特征，其中

是自上而下路径上第6级的中间特征，而

是自下而上路径中第6级的输出特征；

BiFPN每个输入添加额外的权重，并让网络了解每个输入特征的重要性。BiFPN使用Fast normalized fusion(快速归一化融合)

设置为一个较小的值

=0.0001；

BiFPN的宽度和深度使用以下公式缩放：

其中1.35作为BiFPN宽度缩放因子，

是控制所有其他比例维度的复合系数；

预测网络的宽度和BiFPN相同：

预测网络的深度使用等式进行线性增加：

S33、使用如下损失函数计算网络结果与真实值之间的差异：

其中

是分类的loss，

是回归的loss。

使用的是是Smooth-L1 loss函数。Smooth-L1 loss函数如下所示：

使用的是Focal loss，如下所示

实现调制系数的改变。两种权重进行合并可得：

其中

= 0.25和

= 1.5

S34、对整个训练过程进行可视化，通过判断EfficientDet-D0网络在训练集和验证集的表现，判断网络是否欠拟合或者过拟合，针对性的对参数进行调整，如调整学习率、增加训练的轮数、更换优化器、调整anchor的大小等；

S35、根据loss函数以及网络的表现，选择是否提前结束训练；

S36、至此结束训练，获得EfficientDet-D0网络模型。

根据图8，其为S4的具体实施步骤，包括以下步骤：

S41、将预先保留的测试图片，使用之前训练得来的EfficientDet-D0网络模型进行预测；

S42、得到图片中矿石的预测框，计算出预测框的大小；

S43、根据摄像头的安装角度、摄像头到皮带的距离以及网络模型预测框的大小和图像的像素计算出其真实大小：

是摄像头与皮带垂线的夹角，

表示矿石的真实大小，

表示摄像头与皮带间的垂直距离，

表示摄像头的焦距，

表示EfficientDet-D0网络模型预测框的大小。

根据图9，其为S5的具体实施步骤，包括以下步骤：

S51、再***的Web端设置矿石大小报警阈值以及误差阈值，***阈值为矿石大小报警阈值与误差阈值之和；

S52、计算***计算得到的矿石真实大小与***阈值进行比较；

S53、当检测到某工控机矿石真实大小大于***阈值时，显示异常信息；

S54、用户可以根据异常信息选择是否停止该工控机的运转，并将异常记录的工控机信息、发生异常的时间和图片保存至数据库中。

根据图10，由以下模块组成：

视频流采集模块(M1)，实时采集视频流，并将视频流中的关键帧给实时预警模块，由实施预警模块镜像判断是否发出预警；实时预警模块(M2)，包括Web端和App端，更加方便用户的使用，Web端包括用户模块、实时预警模块、设置模块、日志模块。App包括用户模块、实时预警模块、日志模块。其中Web端主要是基于Django框架实现。根据图11用户模块(M3)主要包括：1、注册功能2、登录功能3、权限管理功能；根据图12实时预警模块(M4)主要包括：1、工控机设备添加、删除、修改、列出2、实时显示工控机设备皮带对应画面3、启动或停止显示工控机画面4、显示并且发送异常信息给执行机构5、将异常信息的记录保存到数据库中。根据图13设置模块主要包括：1、设置***预警的矿石块大小2、设置***的误差大小3、设置要同步的云端服务器端口4、设置相机的参数信息。根据图14日志模块(M5)主要包括：1、查询日志2、导出日志3、显示最近异常记录4、选择是否将日志从本机同步到云端服务器。数据库模块(M6)：可以将本地数据同步到云端数据库，以及将云端数据库中的数据记录下载到本地。

Claims

1.一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，用在矿业中检测矿石尺度，并对超过阈值大小的矿石块进行智能化处理，其特征的具体步骤如下：

S4、测试阶段：使用训练完成的EfficientDet网络模型进行测试，将得到的预测框用于定位出矿石的位置并通过摄像头的焦距、摄像头距离皮带的距离以及图像大小计算出矿石的尺度；

S5、提醒阶段：根据***预设阈值，发现有矿石尺度超过***阈值时发出提醒。

2.根据权利要求1所述一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，其特征是所述数据获取阶段，具体包括：

(1)、通过安装在皮带附近的多个不同角度的摄像头获取矿石图片的视频数据流;

(2)、从已经获取到的视频数据流中截取关键帧作为矿石图片数据。

3.根据权利要求1所述一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，其特征是所述数据预处理阶段，具体包括：

(i)、使用图像标注工具Lableme对获取到的图片数据中矿石位置、大小进行标记，矿石的尺度并不规整，需要进行多边形标记；

(ii)、检测出不符合要求的矿石图片数据，并将其剔除；

(iii)、对训练图片进行数据增强：对矿石图片随机进行不同角度的水平和竖直反转；对矿石图片进行缩放；通过直方图均衡调整图像的像素值使得其值变为均匀分布；添加随机噪声；将图像从RGB色彩空间转换为HSV色彩空间调整图片亮度，将图像进行正规化操作，以及对噪声进行处理。

4.根据权利要求1所述一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，其特征是所述创建与训练网络阶段，具体包括：

(Ⅰ)、使用EfficientNet网络作为骨干网络，采用BiFPN网路对EfficientNet提取到的网络特征进行融合，EfficientDet的Head对提取到的特征进行分类和回归预测；

(Ⅱ)、整个EfficientNet有B0-B7多个版本，其中EfficientNet-B0由1个Conv(3×3)、1个MBConv1(3×3)、2个MBConv6(3×3)、2个MBConv6(5×5)、3个MBConv6(3×3)、3个MBConv6(5×5)、4个MBConv6(5×5)、一个MBConv6(3×3)、一个Conv(1×1)、一个Pooling层，一个FC层；

其中MBConv包含残差结构；

先使用1×1的卷积进行升维操作，再进行3×3或5×5的卷积，此后增加关于通道的注意力机制，在使用1×1的卷积进行降维操作，再与残差结构进行堆叠；

MBConv的激活函数使用的是Swish函数，并使用Batch Normalization进行标准化；

Swish函数的定义为：

其中

是一个常数或可训练的参数；

函数表达式如下：

于此同时Efficient-B0将网络的宽度(depth)、深度(width)和分辨率(resolution)按照公式(3)用系数

进行复合缩放；

其中，α、β、γ是可以通过网格搜索确定的常数；

在

和

的约束下，EfficientNet-B0的最佳值为

=1.2，

=1.1，

=1.15；

。

5.根据权利要求1所述一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，其特征是构建BiFPN，具体包括：

(A)、BiFPN(bi-directional feature pyramid network)网路可学习的权重来学习不同输入特征的重要性，同时重复应用自顶向下和自底向上的多尺度特征融合；

加强提取网络由多个BiFPN构成，其中EfficientDet有D0-D7八个版本，这八个版本分别由3、4、5、6、7、7、8、8个BiFPN构成；

(B)、EfficientDet包含EfficientNet主干提取网络和BiFPN加强提取网络，以及Efficient Head将提取到的特征转化为预测结果；

首先EfficientNet将输入的图片不断进行下采样，原始的EfficientNet的下采样次数是5次，通过EfficientNet可以获得

、

，

是输入图片长和宽压缩一次的结果，

是输入图片长和宽压缩两次的结果，

是输入图片长和宽压缩三次的结果，以此类推；

由于

和

、

具有比较高的语义信息，因此在加强提取网络BiFPN中使用到，作为5个有效特征层中的三个；

对P5进行两次下采样，获得具有更高语义的信息的

、

；

获得5个有效特征层

、

；

表示分辨率为输入图像

的特征级别；

例如，如果输入分辨率为640x640，

代表分辨率为80x80的特征级别3(640/

= 80)，而

代表代表分辨率为5x5的7级特征级别；

具体如下：

①进行通道数的调整，获得

，

，

，

，

，如果是第一次进入BiFPN，将

通过减少通道数转化为

_1和

，

通过减少通道转化为

1和

_2；

②在获得

、

_1、

_2、

_1、

_2、

、

之后需要对

进行上采样，上采样后与

采用注意力机制，用来判断是更关注

还是

，再用swish函数进行激活，再进行卷积从而获得；

③对

进行上采样，上采样后与

_1采用注意力机制，用来判断是更关注

还是

_1，再用swish函数进行激活，再进行卷积从而获得

；

④对

进行上采样，上采样后与

_1采用注意力机制，用来判断是更关注

还是

_1，再用swish函数进行激活，再进行卷积从而获得

；

⑤对

进行上采样，上采样后与

采用注意力机制，用来判断是更关注

还是

，再用swish函数进行激活，再进行卷积从而获得

；

⑥在获得

、

、

_2、

、

_2、

、

、

之后，需要对

进行下采样，下采样后与

、

_2采用注意力机制，用来判断是更关注

、

还是

_2，再用swish函数进行激活，再进行卷积从而获得

；

⑦对

进行下采样，下采样后与

、

_2采用注意力机制，用来判断是更关注

、

还是

_2，再用swish函数进行激活，再进行卷积从而获得

；之后对

进行下采样，下采样后与

、

采用注意力机制，用来判断是更关注

、

还是

，再用swish函数进行激活，再进行卷积从而获得

；之后对

进行下采样，下采样后与

采用注意力机制，用来判断是更关注

、还是

，再用swish函数进行激活，再进行卷积从而获得

；

⑧将获得的

、

、

、

、

作为

、

、

、

、

_1和

_2不需要分开了，

_1和

_2也不需要分开；

例如，以上融合特征在第6层可以简述为：

其中

代表第

层的特征，其中

是自上而下路径上第6级的中间特征，而

是自下而上路径中第6级的输出特征；

BiFPN的宽度和深度使用以下公式缩放：

其中1.35作为BiFPN宽度缩放因子，

是控制所有其他比例维度的复合系数：

预测网络的宽度和BiFPN相同：

预测网络的深度使用等式(9)行线性增加：

。

6.根据权利要求1所述一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，其特征是构建损失函数，具体包括：

(P1)使用如下损失函数计算网络结果与真实值之间的差异：

)

其中

是分类的loss，

是回归的loss；

使用的是是Smooth-L1 loss函数；

Smooth-L1 loss函数如下所示：

)

(P2)一张图像有很多候选框，其中包含目标的是正样本，不包含目标的是负样本；

如果样本一属于类别一的概率为0.9，样本二属于类别一的概率为0.6，前者是容易分类的样本，后者是难分类的样本；

EfficientDet中的分类loss是Focal loss；

Focal loss可以控制正负样本的权重，同时可以控制容易分类和难分类样本的权重；

(P3)Focal loss源自于交叉熵损失函数，二分类的交叉熵函数损失为：

)

使用

简化交叉熵损失函数：

)

：

控制容易分类和难分类样本的权重：

)

称为调制系数(modulating factor)；

当γ=0的时候，focal loss就是交叉熵损失函数，可以通过调整

实现调制系数的改变；

两种权重进行合并可得：

)

其中

= 0.25和

= 1.5。

7.根据权利要求1所述一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，其特征是预测结果，具体包括：

(Q2)对于Efficientdet-B0来说，ClassNet采用3次64通道的深度可分离卷积和1次该特征层所拥有的先验框数量乘以网络共有多少类的目标的卷积，先验框数量默认为9；

BoxNet采用3次64通道的卷积和1次该特征层所拥有的先验框数量乘以四的卷积，四指的是先验框的调整情况，调增中心位置和宽高；

EfficientDet默认有9个先验框，可按照实际情况对先验框的长宽比例进行调整，以适合检测的目标；

EfficientDet会判定先验框中的物体以及物体的种类，并且会对先验框进行调整，使用非极大抑制(soft-NMS)筛选出在一定区域属于同一种类置信度最大的框，获得最终的预测框。

8.根据权利要求1所述一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，其特征是进行网络模型测试，具体包括：

(T1)将预先的保留的矿石测试图片传入EfficientDet网络进行预测，得到图片中矿石的预测框，并计算出预测框的大小，再通过预测框的大小和误差计算出真实矿石的大小；

(T2)根据摄像头的安装角度、摄像头到皮带的距离以及网络模型预测框的大小和图像的像素计算出其真实尺寸：

是摄像头与皮带垂线的夹角，

表示矿石的真实大小，

表示摄像头与皮带间的垂直距离，

表示摄像头的焦距，

表示EfficientDet网络模型预测框的大小。

9.根据权利要求1所述一种基于EfficientDet网络的深度学习矿石大小测量方法及预警***，其特征是矿石大小超过***阈值时发出提醒，具体包括：

设置矿石大小报警阈值，并将***阈值大小置为报警阈值与误差阈值之和，将计算得到的矿石真实大小与***阈值进行比较；

如果其真实大小比阈值更大，则产生异常信息，并将异常信息发送给实时告警模块，

根据权力所述告警***，其特征具体包括：

(D1)用户模块，负责用户的注册、登录、管理，显示个人的用户信息，提供超级用户的管理权限；

(D2)矿石视频流采集模块，通过安装在矿石流动皮带附近各个角度的摄像头采集矿石视频流，并将采集到的图像发送给实时告警模块；

(D3)实时告警模块，接受矿石视频流采集模块发送的矿石图像，并矿石图像传入到经过训练的EfficientDet网络中，得到矿石的位置及大小，将计算得到的矿石真实大小与***阈值进行比较；

如果其真实大小比***阈值更大，则将异常信息显示到页面上，并将异常信息写入数据库；

(D4)设置模块，设置***相关参数以及日志相关参数，如报警矿石块大小等；

(D5)日志模块，接受实时告警***的异常记录并显示该异常，并将异常记录同步到云端服务器；

告警***的用户模块，具体包括：

(U1)对新的管理人员提供注册、登录功能，可以操作并使用整个***，将其信息保存至云端服务器，并赋予相应的权限;

(U2)对权限高的超级管理员提供操作***的高级权限，操作并使用整个***的同时管理其他用户；

告警***的实时告警模块，具体包括：

(R1)工控机设备管理，包括添加、删除、修改、列出对应的工控机设备；

(Ｒ3)当检测到某工控机矿石真实大小大于***阈值时，显示异常信息，用户可以根据异常信息选择是否停止该工控机的运转，并将异常记录的工控机信息、发生异常的时间和图片保存至数据库中，同时写入日志模块；每隔一段时间将数据库中的异常记录同步至云端服务器；

告警***的设置模块，具体包括：

设置告警***的相关信息，主要有设置***预警的矿石块大小，设置***误差的大小以及设置相机的焦距、云端服务器端口等；

告警***的日志模块，具体包括：

(Z2)选择是否将日志同步到云端服务器;