CN116012719B

CN116012719B - 一种基于多实例学习的弱监督旋转目标检测方法

Info

Publication number: CN116012719B
Application number: CN202310300442.7A
Authority: CN
Inventors: 张晓男; 蒲鹏宇; 段研; 陈金勇; 耿虎军; 朱进; 王港
Original assignee: CETC 54 Research Institute; Beijing Institute of Astronautical Systems Engineering; Beijing Institute of Near Space Vehicles System Engineering
Current assignee: CETC 54 Research Institute; Beijing Institute of Astronautical Systems Engineering; Beijing Institute of Near Space Vehicles System Engineering
Priority date: 2023-03-27
Filing date: 2023-03-27
Publication date: 2023-06-09
Anticipated expiration: 2043-03-27
Also published as: CN116012719A

Abstract

本发明提供一种基于多实例学习的弱监督旋转目标检测方法，属于遥感图像处理领域，首先使用旋转候选框推荐算法对只有矩形框标注的遥感影像进行旋转候选框推荐；其次采用可变形卷积搭建多层卷积神经网络，提取遥感影像的角度敏感的图像特征；然后生成类别置信度和推荐框贡献度及检测结果；接着训练特征提取网络的权重参数；最后采用训练收敛的网络模型对输入进行前向运算，生成检测结果。相较于以往的旋转目标检测方法，本发明只利用矩形框标注信息，就能够训练出旋转目标检测算法。

Description

一种基于多实例学习的弱监督旋转目标检测方法

技术领域

本发明属于遥感图像处理领域，更具体地涉及一种基于多实例学习的弱监督旋转目标检测方法。

背景技术

随着深度学习技术的发展，基于人工神经网络的目标检测算法性能得到大幅提升，其中基于遥感影像的旋转目标检测算法能够获取遥感影像中任意旋转目标的类别信息和紧致边界信息，能够为情报获取、战场感知、应急减灾等领域提供关键目标信息。

为获得高精度的目标检测结果，需要大量的数据样本和人工标注标签，人工标注的时间成本和经济成本巨大，旋转框目标的标注相比矩形框标注需要的人工成本和时间开销更高。目前，研究者们发布了xView、DIOR等大型遥感目标检测数据集，包含上万幅影像和几十万个遥感目标，但是该类数据集采用的是矩形框标注方式，为了充分利用大型矩形框标注数据集的标注信息，训练出能够进行紧致边界框预测的旋转目标检测算法，亟需一种基于弱监督学习的旋转目标检测方法。

发明内容

本发明的目的是利用大型矩形框标注数据集的标注信息，训练出能够进行紧致边界框预测的旋转目标检测算法，提出了一种基于多实例学习的弱监督旋转目标检测方法。

本发明采用的技术方案为：

一种基于多实例学习的弱监督旋转目标检测方法，包括以下步骤：

步骤1，使用旋转候选框推荐算法对只有矩形框标注的遥感影像进行旋转候选框推荐，生成推荐旋转框；

步骤2，采用可变形卷积搭建多层卷积神经网络，构建旋转目标特征提取网络，提取遥感影像的角度敏感的图像特征；

步骤3，将推荐旋转框引入到旋转目标特征提取网络提取的图像特征张量中，并经过1×1卷积层进行降维度，以及通过两个softmax层归一化，分别生成类别置信度矩阵和推荐框贡献度矩阵；

步骤4，对类别置信度矩阵和推荐框贡献度矩阵进行逐元素相乘，得到检测结果；

步骤5，建立损失函数，对检测结果的旋转框进行矩形化处理，计算矩形化之后的检测结果与影像矩形框标注真值之间的损失，并通过优化算法最小化损失函数对旋转目标特征提取网络和1×1卷积层的权重参数进行更新，直到收敛；

步骤6，将未参与训练的遥感影像及矩形框标注作为输入，采用训练收敛的旋转目标特征提取网络对输入进行前向运算，生成检测结果。

进一步的，步骤1中所述的旋转候选框推荐算法具体为：

提取每个矩形标注框内图像的边缘特征、纹理特征和灰度特征并进行超像素分割和邻域相似度计算，依照邻域相似度对超像素进行聚类合并，对合并后的区域提取最小外接旋转矩形作为旋转候选框。

进一步的，步骤2中所述的旋转目标特征提取网络包括18个卷积层、5个池化层和3个残差结构，所述的卷积层采用可变形卷积，可变形卷积的卷积核包含特征提取卷积核和偏移量卷积核两部分，卷积核大小均为21×21，池化层采用可变形感兴趣区域池化。

进一步的，步骤3中所述的类别置信度矩阵是推荐旋转框所包围的图像区域属于特定目标类别的可信程度，置信度介于0-1之间；所述的推荐框贡献度矩阵是推荐旋转框所包围的图像区域对所在矩形框所包围的图像内容的贡献度，贡献度介于0-1之间。

进一步的，步骤5中所述的损失函数包含类别损失和位置损失两部分，类别损失采用Smooth L1损失，位置损失函数采用SIOU损失，SIOU损失包含角度损失、距离损失、形状损失和IOU损失；所述矩形化处理是通过minAreaRect算法获得旋转框的最小外接矩形；所述优化算法采用RMSProp优化器，学***滑参数设置为0.99，权重衰减系数设置为0.001。

进一步的，步骤6中所述的前向运算过程包括格式转换和量化校准，格式转换是对网络模型进行onnx格式转换，量化校准是使用TensorRT对网络参数进行Int8量化和精度校准。

本发明相对于现有技术的优点为：

(1)本发明只利用矩形框标注信息，就能训练出能够进行紧致边界框预测的旋转目标检测算法；

(2)本发明采用旋转候选框推荐算法，为半监督学习的旋转目标检测算法提供了候选框推荐；

(3)本发明利用1×1卷积、格式转换和量化校准等方式，对前向运算过程进行加速，提高了旋转目标检测的速度。

附图说明

图1为本发明提出的旋转候选框推荐结果示意图。

图2为本发明提出的弱监督旋转目标检测方法的结构图。

具体实施方式

本发明提出了一种基于多实例学习的弱监督旋转目标检测方法，下面结合附图对本发明的具体实施方式和基本原理做进一步说明。如图2所示，具体包括以下过程：

步骤1，使用旋转候选框推荐算法对只有矩形框标注的遥感影像进行旋转候选框推荐，通过提取每个标注框内图像的边缘特征、纹理特征和灰度特征并进行超像素分割和邻域相似度计算，依照邻域相似度对超像素进行聚类合并，对合并后的区域提取最小外接旋转矩形作为旋转候选框，生成推荐旋转框，如图1所示；

步骤2，采用可变形卷积搭建多层卷积神经网络，构建旋转目标特征提取网络，包括18个卷积层、5个池化层和3个残差结构，所述的卷积层采用可变形卷积，可变形卷积的卷积核包含特征提取卷积核和偏移量卷积核两部分，卷积核大小均为21×21，为特征提取网络提供超大感受野，池化层采用可变形感兴趣区域池化，以此提取遥感影像的角度敏感的图像特征；

步骤3，将推荐旋转框引入到旋转目标特征提取网络提取的图像特征张量中，并经过1×1卷积层进行降维度，以及通过两个softmax层归一化，分别生成类别置信度矩阵和推荐框贡献度矩阵；所述的类别置信度矩阵是推荐旋转框所包围的图像区域属于特定目标类别的可信程度，置信度介于0-1之间，置信度越大，可信程度越高，属于特定类别的概率越高，所述的推荐框贡献度矩阵是推荐旋转框所包围的图像区域对所在矩形框所包围的图像内容的贡献度，贡献度介于0-1之间，贡献度越大，推荐旋转框的边界越准确；

步骤5，建立损失函数，损失函数包含类别损失和位置损失两部分，类别损失采用Smooth L1损失，位置损失函数采用SIOU损失，SIOU损失包含角度损失、距离损失、形状损失和IOU损失四部分，对检测结果的旋转框进行矩形化处理，通过minAreaRect算法获得选装框的最小外接矩形,计算矩形化之后的检测结果与影像矩形框标注真值之间的损失，优化算法采用RMSProp优化器，学***滑参数设置为0.99，权重衰减系数设置为0.001，通过优化算法最小化损失函数对旋转目标特征提取网络和1×1卷积层的权重参数进行更新，直到收敛；

步骤6，将未参与训练的遥感影像及矩形框标注作为输入，采用训练收敛的旋转目标特征提取网络对输入进行前向运算，前向运算过程包括格式转换和量化校准，格式转换是对网络模型进行onnx格式转换，量化校准是使用TensorRT对网络参数进行Int8量化和精度校准，进而生成检测结果。

Claims

1.一种基于多实例学习的弱监督旋转目标检测方法，其特征在于，包括以下步骤：

步骤6，将未参与训练的遥感影像及矩形框标注作为输入，采用训练收敛的旋转目标特征提取网络对输入进行前向运算，生成检测结果；

其中，步骤1中所述的旋转候选框推荐算法具体为：

提取每个矩形标注框内图像的边缘特征、纹理特征和灰度特征并进行超像素分割和邻域相似度计算，依照邻域相似度对超像素进行聚类合并，对合并后的区域提取最小外接旋转矩形作为旋转候选框；

其中，步骤5中所述的损失函数包含类别损失和位置损失两部分，类别损失采用SmoothL1损失，位置损失函数采用SIOU损失，SIOU损失包含角度损失、距离损失、形状损失和IOU损失；所述矩形化处理是通过minAreaRect算法获得旋转框的最小外接矩形；所述优化算法采用RMSProp优化器，学***滑参数设置为0.99，权重衰减系数设置为0.001。

2.根据权利要求1所述的一种基于多实例学习的弱监督旋转目标检测方法，其特征在于，步骤2中所述的旋转目标特征提取网络包括18个卷积层、5个池化层和3个残差结构，所述的卷积层采用可变形卷积，可变形卷积的卷积核包含特征提取卷积核和偏移量卷积核两部分，卷积核大小均为21×21，池化层采用可变形感兴趣区域池化。

3.根据权利要求1所述的一种基于多实例学习的弱监督旋转目标检测方法，其特征在于，步骤3中所述的类别置信度矩阵是推荐旋转框所包围的图像区域属于特定目标类别的可信程度，置信度介于0-1之间；所述的推荐框贡献度矩阵是推荐旋转框所包围的图像区域对所在矩形框所包围的图像内容的贡献度，贡献度介于0-1之间。

4.根据权利要求1所述的一种基于多实例学习的弱监督旋转目标检测方法，其特征在于，步骤6中所述的前向运算过程包括格式转换和量化校准，格式转换是对网络模型进行onnx格式转换，量化校准是使用TensorRT对网络参数进行Int8量化和精度校准。