CN111310831B

CN111310831B - 一种基于深度学习的小目标检测网络逐层训练方法

Info

Publication number: CN111310831B
Application number: CN202010100845.3A
Authority: CN
Inventors: 李琪; 陈忠碧; 张建林
Original assignee: Institute of Optics and Electronics of CAS
Current assignee: Institute of Optics and Electronics of CAS
Priority date: 2020-02-19
Filing date: 2020-02-19
Publication date: 2022-10-21
Anticipated expiration: 2040-02-19
Also published as: CN111310831A

Abstract

本发明公开了一种基于深度学***衡的损失函数进行训练；用逐层冻结方法使用小目标数据集对检测网络进行微调等步骤。其显著效果是：不仅提高了基于深度学习的目标检测网络对于小目标检测的召回率和精度；并且实现了已训练网络特定性能的稳定逐步提升。

Description

一种基于深度学习的小目标检测网络逐层训练方法

技术领域

本发明涉及图像目标检测的技术领域，具体涉及一种基于深度学习的小目标检测网络逐层训练方法。

背景技术

图像目标检测(也称对象检测)是从图像中定位并识别特定类别的物体的方法，是机器自动化处理中重要的一环，其作用在于定位待查找目标的位置并识别目标类别以辅助机器进行进一步处理，目标检测方法广泛应用于医学、交通、互联网、数据统计、军事等领域，成功实现自动相机聚焦、人脸检测、车辆检测、无人机检测、楼房检测等。由于检测目标尺寸的多样性，小目标检测作为目标检测中的一环有着同样重要的现实需求。不仅如此，小目标检测在远距离目标图像、大视场目标图像、目标密集图像等常见图像中比重大、精度需求高，因此其精度决定了总体目标检测精度，如遥感影像目标检测、无人机航拍目标检测、行人目标检测。除此之外，重要特殊目标检测也多为小目标检测，如交通标志、车牌检测识别等。普通相机拍摄图像中也常常出现小目标，比如风景照中的鸟类、远处的飞机、桌面上的水杯等等。由此可见，小目标检测不仅仅是目标检测研究的一部分，更是目标检测中极为广泛和重要的一部分。

在目标检测需求的推动下，目标检测方法逐步发展，在深度学***均精度(mAP)全面超过传统方法检测精度，深度学***均精度(mAP)，多数据集训练精度已经达到92.3％均值平均精度(mAP)。VOC2012数据集大部分图像较清晰、目标较大、光线较好、识别类别总数少，因此图片质量高、检测难度低。相比之下，MS COCO数据集类别总数更多，图片环境相对复杂，内容较丰富。目前在MS COCO数据集的小目标识别精度上，同样是深度学习方法效果更优，但COCO数据集上小目标检测精度仍有较大提升空间。

小目标由于其分辨率低、图像模糊、携带信息少、在图像中比重小导致特征能力表达弱、检测难度高，因此无论是传统方法还是深度学***衡、深度网络丢失特征等原因导致检测精度较低，因此仍需对网络结构、损失函数、数据增强等方面进行研究以加强小目标检测的效果。由于通用小目标检测方法中深度学***均精度(mAP)，在检测精度超过40均值平均精度(mAP)的情况下检测速度无法达到20帧每秒(FPS)，即无法满足实时要求，因此仍需对小目标检测方法进行进一步的研究改进。

发明内容

针对现有技术的不足，本发明的目的是提供一种基于深度学习的小目标检测网络逐层训练方法，能够实现对目标检测网络进一步的训练优化，提高网络对小目标检测的精度和召回率，实现更高的小目标检测准确率。

为达到上述目的，本发明采用的技术方案如下：

一种基于深度学习的小目标检测网络逐层训练方法，包括如下步骤：

步骤1：搭建深度学习的小目标检测网络；

步骤2：检测网络骨架部分采用图像识别数据集进行预训练；

步骤3：检测网络采用目标检测数据集进行整体训练；

步骤4：修改损失函数，使得训练过程中识别与检测的训练更平衡；

步骤5：采用逐层冻结方法，用目标检测数据集中的小目标对检测网络进行微调；

步骤6：重复训练使得网络收敛，所得网络权重为最终所需小目标检测网络权重。

进一步地，步骤1中所述小目标检测网络搭建过程如下：

步骤1.1：根据需求采用残差网络ResNet50或ResNet101搭建网络骨架，其中ResNet50速度更快而使得最终网络检测精度更低，ResNet101速度慢但最终网络检测精度更高；

步骤1.2：搭建区域生成网络，在骨架网络的多层特征图上预设候选框，并作为区域生成网络的输入；

步骤1.3：在骨架与区域生成网络后并行搭建目标定位网络与目标识别网络。

进一步地，步骤2中所述检测网络骨架预训练过程如下：

步骤2.1：提取网络的骨架部分；

步骤2.2：使用图像识别数据集训练网络的骨架部分；

步骤2.3：记录训练过程中网络对验证集图像识别的正确率，据此判断训练过程是否收敛，记录收敛后网络的权重作为目标检测网络骨架部分权重。

进一步地，步骤3中所述检测网络整体训练过程如下：

步骤3.1：使用目标检测数据集训练网络，该网络骨架部分权重为预训练的骨架权重，其他部分初始化为随机权重；

步骤3.2：记录训练过程中网络对验证集目标检测的精度，据此判断训练过程是否收敛，记录收敛后网络的权重作为目标检测网络的权重。

进一步地，步骤5中所述的用目标检测数据集中的小目标对检测网络进行逐层冻结微调的方法为：

步骤5.1：处理目标检测数据集的标注文件，提取其中的小目标对应的标注信息，去除其他目标的检测信息；

步骤5.2：使用修改后标注文件以及对应的小目标数据集对目标检测网络进行训练；

步骤5.3：冻结已训练的目标检测网络的前四层，使用指定数据集训练其他层权重；

步骤5.4：冻结已训练的目标检测网络的前三层，使用指定数据集训练其他层权重；

步骤5.5：冻结已训练的目标检测网络的前两层，使用指定数据集训练其他层权重；

步骤5.6：保留最后所得权重，作为网络最终的权重。

更进一步地，所述的训练过程中使用的损失函数为Loss＝W_cls·L_cls+W_box·L_box，其中W_cls取2，W_box取1。

进一步地，所述的判断目标检测网络收敛方法为：记录训练过程中网络对验证集目标检测的精度，当其在训练1000个回合中精度浮动变化不超过0.03均值平均精度(mAP)则可认为网络已经收敛。

进一步地，所述的冻结目标检测网络前n层方法为：在训练网络的过程中按随机梯度下降法计算反向传播各层权重所需的变换量；未冻结层的权重根据所求变化量进行调整，冻结层的权重不进行变化。

本发明的显著效果是：首先搭建目标检测网络，利用图像识别数据集进行预训练，然后利用目标检测数据集进行整体的训练，然后利用目标检测数据集中的小目标，采用逐层冻结方法并使用改进的损失函数对网络进行进一步的微调。本发明优化了目标检测网络的训练方法，不仅实现了在已有网络结构上进行进一步稳定调整训练；并且提高了网络对于小目标检测的精度和召回率。本发明在目标检测对象发生变化时能够更稳定、更快地调整网络，能够有效地进行特定目标检测与模型迁移。

附图说明

图1是本发明一种基于深度学习的小目标检测网络逐层训练方法的流程图；

图2是ResNet50与ResNet101的结构图；

图3是小目标检测网络的结构图；

具体实施方式

下面结合附图对本发明的具体实施方式以及工作原理作进一步详细说明。

如图1所示，一种基于深度学习的小目标检测网络逐层训练方法，具体步骤如下：

步骤1：搭建深度学习的目标检测网络；

所述小目标检测网络的搭建过程如下：

所述的残差网络ResNet50或ResNet101如图2所示，搭建的深度学习目标检测网络结构如图3所示。

步骤2：检测网络骨架部分采用图像识别数据集进行预训练；

所述的检测网络骨架预训练过程如下：

步骤2.1：提取网络的骨架部分；

步骤2.2：使用图像识别数据集训练网络的骨架部分；

步骤3：检测网络采用目标检测数据集进行整体训练；

所述检测网络整体训练过程如下：

所述的训练过程中使用的损失函数为Loss＝W_cls·L_cls+W_box·L_box，其中W_cls取2，W_box取1。

所述的用目标检测数据集中的小目标对检测网络进行逐层冻结微调的方法具体如下：

步骤5.6：保留最后所得权重，作为网络最终的权重。

所述的冻结目标检测网络前n层方法为：在训练网络的过程中按随机梯度下降法计算反向传播各层权重所需的变换量；未冻结层的权重根据所求变化量进行调整，冻结层的权重不进行变化。

所述的判断目标检测网络收敛方法为：记录训练过程中网络对验证集目标检测的精度，当其在训练1000个回合中精度浮动变化不超过0.03mAP则可认为网络已经收敛。

在本实施例中，应用训练次数为60000次所得的小目标检测网络，针对MSCOCO数据集表示八十种不同目标的共5000个测试图像进行了目标检测，最终获得小目标识别精度为0.213mAP，小目标召回率达到0.327，不难看出，本发明有效提高了小目标识别的精度和召回率，创新性地成功实现了提高目标检测网络对小目标检测的能力。

Claims

1.一种基于深度学习的小目标检测网络逐层训练方法，其特征在于，包括如下步骤：

步骤1：搭建深度学习的目标检测网络；

步骤2：检测网络骨架部分采用图像识别数据集进行预训练；

步骤3：检测网络采用目标检测数据集进行整体训练；

步骤4中所述修改损失函数方法为：将常用损失函数Loss＝L_cls+L_box修改为Loss＝W_cls·L_cls+W_box·L_box，其中W_cls取2，W_box取1；

步骤5中所属的用目标检测数据集中的小目标对检测网络进行微调的方法为：

步骤5中所述的逐层冻结方法为：

步骤5.6：保留最后所得权重，作为网络最终的权重；

所述的逐层冻结方法，步骤5.3、步骤5.4、步骤5.5中的冻结目标检测网络前n层方法为：在训练网络的过程中按随机梯度下降法计算反向传播各层权重所需的变换量；未冻结层的权重根据所求变化量进行调整，冻结层的权重不进行变化；

2.根据权利要求1所述的基于深度学习的小目标检测网络逐层训练方法，其特征在于：步骤1中所述目标检测网络搭建过程如下：

3.根据权利要求1所述的基于深度学习的小目标检测网络逐层训练方法，其特征在于：步骤2中所述检测网络骨架预训练过程如下：

步骤2.1：提取网络的骨架部分；

步骤2.2：使用图像识别数据集训练网络的骨架部分；

4.根据权利要求1所述的基于深度学习的小目标检测网络逐层训练方法，其特征在于：步骤3中所述检测网络整体训练过程如下：

5.根据权利要求1所述的基于深度学***均精度(mAP)则可认为网络已经收敛。