CN112364931B

CN112364931B - 一种基于元特征和权重调整的少样本目标检测方法及网络***

Info

Publication number: CN112364931B
Application number: CN202011309906.3A
Authority: CN
Inventors: 夏利锋; 王绍丽; 肖和龙; 邓建猛; 黄�俊; 李凌荣; 蒋晓鹏; 刘文灿; 雷一鸣
Original assignee: Changsha Junmin Advanced Technology Research Co ltd
Current assignee: Changsha Junmin Advanced Technology Research Co ltd
Priority date: 2020-11-20
Filing date: 2020-11-20
Publication date: 2024-03-19
Anticipated expiration: 2040-11-20
Also published as: CN112364931A

Abstract

本发明公开了一种基于元特征和权重调整的少样本目标检测方法及网络模型，所述方法如下：S1、构建检测网络模型并对图像进行预处理；S2、提取base类图像的元特征和权重向量；S3、结合提取的元特征和权重向量获取多维特征图，并将其输入分类回归模块中计算出损失函数；S4、根据损失函数和梯度下降调整网络参数，实现base类图像对检测网络模型的训练；S5、提取base类和new类联合图像的元特征和权重向量；S6、重复步骤S3和步骤S4，完成new类和base类联合图像对检测网络模型的训练；S7、利用训练好的检测网络模型对测试图像进行检测。本发明中检测网络模型的训练利用大量数据的样本提取元特征，并借助少样本数据进行微调，提升了少量标记样本目标检测的准确率。

Description

一种基于元特征和权重调整的少样本目标检测方法及网络 ***

技术领域

本发明属于计算机视觉检测技术领域，主要涉及深度学习目标检测，具体来说就是提出了一种基于元特征和权重调整的微调小样本目标检测方法，可以用来实现对只有少量样本的目标进行分类和定位。

背景技术

目前，计算机视觉领域的目标检测任务在工业生产及智能监控等领域中都得到了广泛的应用。目标检测是从图像分类基础上延伸而来的，其主要包括识别图像中所包含的目标，以及标定出目标的位置。在以前，由于计算机的处理速度和内存的限制，研究人员一般使用传统非卷积神经网络的检测方法来检测目标，但随着计算机处理速度和内存的急速发展，使深度学习变成了可行方法。并且，基于深度神经网络的目标检测方法在检测效率以及准确率上均优于传统的目标检测方法。

基于深度学习的目标检测方法主要分为两种：需要候选框的双阶段目标检测和不需要候选框的单阶段目标检测。RCNN、SPPNet、Fast-RCNN及Faster RCNN系列属于前一种方法，RCNN通过对每一个候选框进行卷积进而得到各自的特征图，再根据所得到的特征图进行分类和定位；SPPNet和Fast-RCNN首先通过对整张图进行卷积得到整的特征图，然后再通过RoIPooling提取各个候选框的特征，从而改进了RCNN系列；Faster RCNN则是改进了候选框的提取方法，使用了一个RPN网络来提取候选框，改善了候选框的产生效率。相反，YOLO属于后一种方法，它直接使用一个神经网络来进行分类和边界框预测。在速度和准确率上，两种检测方法各有优势，通常说来，双阶段目标检测在检测精度上高于单阶段目标检测，而单阶段目标检测由于其不需要产生候选框，从而在检测速度上优于双阶段目标检测，但是两种检测方法中的目标检测任务严重依赖于大量带有标记的数据集进行训练，但在实际应用中，有些物体的数据本身很少，或者很难去获取。当带有标记的数据缺乏时，将产生严重的过拟合和非常差的泛化能力，从而导致检测精度很低或者根本无法检测。

发明内容

本发明的目的是提供一种基于元特征和权重调整的少样本目标检测方法及网络模型，所述目标检测方法能够提升少量标记样本的目标检测准确率。

为解决上述技术问题，本发明提供一种基于元特征和权重调整的少样本目标检测方法，所述方法包括以下步骤：

S1、构建检测网络模型并对输入的base类训练图像、new类训练图像和测试图像均进行预处理；

S2、将预处理后的base类训练图像输入检测网络模型中的元特征提取模块和权重调整模块进行卷积以提取对应的元特征图和权重向量；

S3、将各自卷积提取的元特征图和权重向量进行结合并获取对应的多维特征图，然后将获取的多维特征图输入分类回归模块的分类器和回归器中进行分类和回归，根据分类回归模块的当前目标输出结果与目标的真实类别及目标框位置计算出目标损失函数；

S4、根据所计算的目标损失函数和梯度下降不断调整网络参数，完成base类图像对检测网络模型的训练；

S5、将预处理后的new类训练图像和base类训练图像联合输入检测网络模型中的元特征提取模块和权重调整模块进行卷积以提取其对应的元特征图和权重向量；

S6、重复步骤S3，并根据所计算的目标损失函数和梯度下降不断调整网络参数，从而完成new类和base类联合图像对检测网络模型的训练；

S7、利用步骤S6中完成的训练检测网络模型对预处理后的测试图像进行检测，进而输出测试图像中目标的检测结果。

优选地，所述步骤S1的具体实现方式为：将输入的base类训练图像、new类训练图像和测试图像尺寸利用双线性插值法缩放至416×416，然后归一化至[0，1]区间。

优选地，所述步骤S2的具体实现方式包括：

S21、将预处理后的base类的Query图像输入元特征提取模块进行卷积，提取不同目标类别的元特征图；

S22、将预处理后的base类Support图像输入权重调整模块进行卷积，提取各个目标类别的权重向量。

优选地，所述步骤S3的具体实现方式包括：

S31、将各自卷积所提取的元特征图和权重向量通过一个1×1的卷积进行结合，然后获取其对应的多维特征图；

S32、将所获取的多维特征图输入分类回归模块的分类器和回归器中进行分类和回归，从而输出当前目标属于每一个类别的概率及其对应坐标；

S33、根据分类回归模块输出当前目标属于每一个类别的概率及其对应坐标与当前目标的真实类别及目标框位置计算出目标损失函数。

优选地，所述步骤S32中的将所获取的多维特征图进行分类和回归可用公式表示为：

式(1)中，i表示不同的类，i＝1，...，N，N为自然数，o表示锚点anchor的目标度评分，(x,y,h,w)表示定位框bbox的位置偏移量，x,y表示定位框的左上角位置坐标，h表示定位框的高度，w表示定位框的宽度，c表示分类分数，p表示预测模型，F_i表示类i的特定特征，其中F＝D(I)表示输入图像I对应的元特征图，D表示对输入图像I卷积，w_i＝M(I_i,Q_i)表示类i特定的权重向量，Q_i表示输入图像相关的边界框注释。

优选地，所述步骤S33中目标损失函数的计算公式可表示为：

L＝L_c+L_bbx+L_obj (2)

式(2)中，L_c表示分类损失，其中/>1(·,i)表示当前锚框是否属于类i的指示函数；L_bbx表示定位偏置损失，其中/>表示第k个定位框是否存在对象的函数，λ_coord表示权重系数，/>表示第r个定位框的标签与预测值之差；L_obj表示置信度损失，，λ_obj表示调整置信度权重系数，/>表示第k个定位框的标签和预测概率之差。

优选地，所述步骤S4的具体实现方式为：利用目标损失函数并根据分类回归模块的当前目标输出结果与目标标签的真实结果计算出两者之间的损失，然后通过随机梯度下降法对网络模型每一层进行反向求导，不断更新调整网络模型的每一层参数。

一种基于元特征和权重调整的少样本目标检测网络模型，包括元特征提取模块、权重调整模块和分类回归模块，其中：

元特征提取模块，用于提取输入图像的元特征图，其输入端与外部图像预处理单元连接，其输出端与分类回归模块输入端连接；

权重调整模块，用于提取输入图像的权重向量，其输入端与外部图像预处理单元连接，其输出端与分类回归模块输入端连接；

分类回归模块，用于接收所提取的元特征图和权重向量并进行结合以获取结合后的多维特征图，然后将结合后的多维特征图进行分类和回归以输出每个类的预测概率及对应坐标，并根据输出的预测结果计算出其目标损失函数，利用其目标损失函数和梯度下降不断调整网络参数，从而输出检测结果。

优选地，所述元特征提取模块内部网络结构为改进型的DarkNet19网络结构，权重调整模块采用轻量级的卷积神经网络。

优选地，所述分类回归模块通过无候选框单阶段网络结构将每一个的多维特征图进行分类和回归。

与现有技术比较，本发明提出了一种基于元特征和权重调整的少样本目标检测方法及网络模型，所述目标检测方法利用已有大量数据标记的样本提取元特征并将所提取的特征输入分类回归模块中得到目标的分类别和位置，进而完成检测网络模型的训练，然后借助需检测的少样本少量数据对所训练的网络参数进行微调，使得所提取的元特征能够对少样本少量数据进行有效反映，从而提升了只有少量标记样本的目标检测准确率。

附图说明

图1是本发明一种基于元特征和权重调整的少样本目标检测方法的步骤流程图，

图2是本发明中元特征图和权重向量的提取方法的步骤流程图，

图3是本发明中获取每一个类目标损失函数的步骤流程图，

图4是本发明中基于元特征和权重调整的少样本目标检测网络模型的示意图，

图5是DarkNet19网络的结构图，

图6是本发明中改进后的DarkNet19网络的结构图。

图中：1.元特征提取模块，2.权重调整模块，3.分类回归模块。

具体实施方式

为了使本技术领域的人员更好地理解本发明的技术方案，下面结合附图对本发明作进一步的详细说明。

如图1-图6所示，一种基于元特征和权重调整的少样本目标检测方法，所述方法包括以下步骤：

S7、利用步骤S6中训练好的检测网络模型对预处理后的测试图像进行检测，进而输出测试图像中目标的检测结果。

本实施例中，所述检测网络模型的构建方法与现有技术中网络模型的构建方法相同，即分别构建元特征提取模块、权重调整模块和分类回归模块，此处不再一一赘述。首先对训练图片进行预处理，利用构建好的检测网络模型中的元特征提取模块和权重调整模块提取含有大量数据和对应标签的base类图像的元特征图和权重向量，并将所提取的元特征图和权重向量输入分类回归模块中进行相应处理实现了base类图像对检测网络模型的训练，然后将base类图像与少样本少量数据的new类图像进行联合并提取联合后图像的元特征图和权重向量进行处理，通过计算出其目标损失函数，并根据目标损失函数和梯度下降以对网络模型的参数进行微调，实现base类和new类联合图像对检测网络模型的训练，因此能够使new类图像中所提取的元特征很好的反映出少样本少量数据中的目标，从而提升了少量标记样本的目标检测准确率。

其中，所述步骤S1的具体实现方式为：将输入的base类训练图像、new类训练图像和测试图像尺寸利用双线性插值法缩放至416×416，然后归一化至[0，1]区间。

本实施例中，首先将base类和novel类训练图像的尺寸通过双线性插值法缩放至416x416，随后将像素值归一化至[0-1]区间，考虑到很多情况下待检测物体的中心点容易出现在图像的中央，所以使用416x416经过5次降采样之后生成的Feature Map的尺寸是13x13，这种奇数尺寸的Feature Map获得的中心点的特征向量更准确。

如图2、图4所示，所述步骤S2的具体实现方式包括：

如图3、图4所示，所述步骤S3的具体实现方式包括：

S33、根据分类回归模块输出的当前目标属于每一个类别的概率及其对应坐标与当前目标的真实类别及目标框位置计算出目标损失函数。

其中，所述步骤S32中的将所获取的多维特征图进行分类和回归可用公式表示为：

(o_i,x_i,y_i,h_i,w_i,c_i)＝p(F_i) (1)

式(1)中，i表示不同的类，i＝1，...，N，N为自然数，o表示锚点anchor的目标度评分，(x,y,h,w)表示定位框(bbox，bounding boxes)的位置偏移量，x,y表示定位框的左上角位置坐标，h表示定位框的高度，w表示定位框的宽度，c表示分类分数，p表示预测模型，F_i表示类i的特定特征，其中F＝D(I)表示输入图像I对应的元特征图，D表示对输入图像I卷积，w_i＝M(I_i,Q_i)表示类i特定的权重向量，Q_i表示输入图像相关的边界框注释。

其中，所述步骤S33中目标损失函数的计算公式可表示为：

L＝L_c+L_bbx+L_obj (2)

式(2)中，L_c表示分类损失，其中/>1(·,i)表示当前锚框是否属于类i的指示函数；L_bbx表示定位偏置损失，

其中/>表示第k个定位框是否存在对象的函数，若存在对象，则函数值为1，若不存在对象，则函数值为0，λ_coord表示权重系数，/>表示第r个定位框的标签与预测值之差；L_obj表示置信度损失，/>λ_obj表示调整置信度权重系数，/>表示第k个定位框的标签和预测概率之差。

需要说明的是，本发明中将所输入的每张图像均分成S×S的网格，S表示网格数量，每个网格预测两个定位框，所述锚框指的是每个网格中两个定位框的长与宽。

本实施例中，所述元特征提取模块是通过对Query图像进行卷积得到图像的元特征图，这些提取到的元特征图可以扩展到检测不同的目标类别，元特征提取模块的内部使用一个基于单阶段的YOLO v2网络的改版网络提取特征；权重调整模块是通过对Support图像进行卷积提取各类别的权重向量，权重向量可以反应出各元特征图对目标类别的表达程度，再将利用一个1×1的卷积将所提取的元特征图和权重向量结合起来，并获取其对应的多维特征图，卷积层所学习的多维特征图会被传输到分类回归模块中的分类器和回归器中，从而预测边界框的坐标和类别标签，最后根据分类回归模块输出的预测结果与其对应坐标与真实的类别和目标框位置可以计算出目标损失函数。

其中，所述步骤S4的具体实现方式为：利用目标损失函数并根据分类回归模块的当前目标输出结果与目标标签的真实结果计算出两者之间的损失，然后通过随机梯度下降法对网络模型每一层进行反向求导，不断更新调整网络模型的每一层参数。

本实施例中，利用目标损失函数并根据分类回归模块的当前目标输出结果与目标标签的真实结果计算出两者之间的损失，然后通过随机梯度下降法对网络模型每一层进行反向求导，不断更新调整网络模型的每一层参数，从而使得从少量标记样本中所提取的元特征图也能够很好的反映出少样本少量数据中的目标，提升了少量标记样本的目标检测准确率。

如图4、图5、图6所示，一种基于元特征和权重调整的少样本目标检测网络模型，包括元特征提取模块1、权重调整模块2和分类回归模块3，其中：

元特征提取模块1，用于提取输入图像的元特征图，其输入端与外部图像预处理单元连接，其输出端与分类回归模块3输入端连接；

权重调整模块2，用于提取输入图像的权重向量，其输入端与外部图像预处理单元连接，其输出端与分类回归模块3输入端连接；

分类回归模块3，用于接收所提取的元特征图和权重向量并进行结合以获取结合后的多维特征图，然后将结合后的多维特征图进行分类和回归以输出每个类的预测概率及对应坐标，并根据输出的预测结果计算出其目标损失函数，利用其目标损失函数和梯度下降不断调整网络参数，从而输出检测结果。

其中，所述元特征提取模块1内部网络结构为改进型的DarkNet19网络结构，权重调整模块2采用轻量级的卷积神经网络。

其中，所述分类回归模块3通过无候选框单阶段网络结构将每一个的多维特征图进行分类和回归。

本实施例中，元特征提取模块1的内部网络结构是基于YOLO v2中的DarkNet19网络进行改进的，其中DarkNet19网络的结构如图5所示，改进后的DarkNet19网络的结构如图6所示，元特征提取模块1在darknet19网络的基础上移除了softmax和所有的平均池化层，使用步幅为2的卷积层对特征图进行下采样，移除平均池化是为了有助于防止通常由池化导致的低级特征丢失，在3x3卷积中间添加了1x1卷积，Feature Map之间的一层非线性变化提升了模型的表现能力，改进后的DarkNet19网络进行了5次降采样，为了获得更高分辨率的Feature Map(元特征图)，在最后一层卷积不进行降采样。

其中，所述权重调整模块2采用了一个轻量级的卷积神经网络，这样既可以提高效率，又可以方便学习。权重调整模块2是将support set(支持集)中的N类样本映射到N个重加权向量，每个重权重向量负责调整元特征来检测其对应类别，权重调整模块2输入是Support图片，support图片中存在唯一1个mask(不管有多少个目标，只选其中一个)，为了区分背景和前景，权重调整模块2沿着通道方向进行合并(H*W*4)，包括RGB+Mask(即将RGB与Mask进行结合)，借助Support图片和权重调整模块2对特征提取器的元特征进行调整，具体而言，权重调整模块2作为1×1depth-wise(深度)卷积核权重用来卷积元特征，当有N个新的类别时，权重调整模块2会产生N个重加权向量,每一个都负责检测一个新的类别。

其中，所述分类回归模块3采用二元交叉熵损失函数，该函数容易输出冗余检测结果，因此在后面我们使用一个softmax层来校正不同类的分类分数，自适应的降低对错误类的分类分数。分类回归模块3主要是对每个类别均预测出一个概率以及该类别的对应坐标，其中每个类都有6个变量，包括种类(一个变量)、分类分数(一个变量)以及位置坐标(四个变量)，故分类回归模块3输出结果相当于是N个类的N个6维向量。

本实施例中，首先通过元特征提取模块1和权重调整模块2提取含有大量数据和对应标签的base类图像的元特征图和权重向量，并对所提取的元特征图和权重向量进行相应处理以实现base类图像对检测网络模型的训练，然后将base类图像与少样本少量数据的new类图像进行联合并提取联合后图像的元特征图和权重向量进行处理，计算出其目标损失函数，再根据目标损失函数和梯度下降以对网络模型的参数进行微调，以实现base类和new类联合图像对检测网络模型的训练，从而使得new类图像中所提取的元特征能够很好的反映出少样本少量数据中的目标，最后利用联合图像训练好的检测网络模型对检测图像进行检测，即可输出测试图像中目标的检测结果，能够有效提升少量标记样本的目标检测准确率。

以上对本发明所提供的一种基于元特征和权重调整的少样本目标检测方法及网络模型进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以对本发明进行若干改进和修饰，这些改进和修饰也落入本发明权利要求的保护范围内。

Claims

1.基于元特征和权重调整的少样本目标检测方法，其特征在于，所述方法包括以下步骤：

S4、根据所计算的目标损失函数和梯度下降不断调整网络参数，完成base类图像训练检测网络模型；

S6、重复步骤S3，并根据所计算的目标损失函数和梯度下降不断调整网络参数，从而完成new类和base类联合图像训练检测网络模型；

2.如权利要求1所述的基于元特征和权重调整的少样本目标检测方法，其特征在于，所述步骤S1的具体实现方式为：将输入的base类训练图像、new类训练图像和测试图像尺寸利用双线性插值法缩放至416×416，然后归一化至[0，1]区间。

3.如权利要求2所述的基于元特征和权重调整的少样本目标检测方法，其特征在于，所述步骤S2的具体实现方式包括：

S21、将预处理后的base类Query图像输入元特征提取模块进行卷积，提取不同目标类别的元特征图；

4.如权利要求3所述的基于元特征和权重调整的少样本目标检测方法，其特征在于，所述步骤S3的具体实现方式包括：

5.如权利要求4所述的基于元特征和权重调整的少样本目标检测方法，其特征在于，所述步骤S32中的将所获取的多维特征图进行分类和回归可用公式表示为：

(o_i，x_i，y_i，h_i，w_i，c_i)＝p(F_i) (1)

式(1)中，i表示不同的类，i＝1，...，N，N为自然数，o表示锚点anchor的目标度评分，(x，y，h，w)表示定位框bbox的位置偏移量，x，y表示定位框的左上角位置坐标，h表示定位框的高度，w表示定位框的宽度，c表示分类分数，p表示预测模型，F_i表示类i的特定特征，其中F＝D(I)表示输入图像I对应的元特征图，D表示对输入图像I卷积，w_i＝M(I_i，Q_i)表示类i特定的权重向量，Q_i表示输入图像相关的边界框注释。

6.如权利要求5所述的基于元特征和权重调整的少样本目标检测方法，其特征在于，所述步骤S33中目标损失函数的计算公式可表示为：

L＝L_c+L_bbx+L_obj (2)

式(2)中，L_c表示分类损失，其中/>1(·，i)表示当前锚框是否属于类i的指示函数；L_bbx表示定位偏置损失，/>其中/>表示第k个定位框是否存在对象的函数，λ_coord表示权重系数，/>表示第r个定位框的标签与预测值之差；L_obj表示置信度损失，/>λ_obj表示调整置信度权重系数，/>表示第k个定位框的标签和预测概率之差。

7.如权利要求6所述的基于元特征和权重调整的少样本目标检测方法，其特征在于，所述步骤S4的具体实现方式为：利用目标损失函数并根据分类回归模块的当前目标输出结果与目标标签的真实结果计算出两者之间的损失，然后通过随机梯度下降法对网络模型每一层进行反向求导，不断更新调整网络模型的每一层参数。

8.一种基于元特征和权重调整的少样本目标检测网络***，其特征在于，所述的基于元特征和权重调整的少样本目标检测网络***用于执行权利要求1至7任一项所述的基于元特征和权重调整的少样本目标检测方法，包括元特征提取模块(1)、权重调整模块(2)和分类回归模块(3)，其中：

元特征提取模块(1)，用于提取输入图像的元特征图，其输入端与外部图像预处理单元连接，其输出端与分类回归模块(3)输入端连接；

权重调整模块(2)，用于提取输入图像的权重向量，其输入端与外部图像预处理单元连接，其输出端与分类回归模块(3)输入端连接；

分类回归模块(3)，用于接收所提取的元特征图和权重向量并进行结合以获取结合后的多维特征图，然后将结合后的多维特征图进行分类和回归以输出每个类的预测概率及对应坐标，并根据输出的预测结果计算出其目标损失函数，利用其目标损失函数和梯度下降不断调整网络参数，从而输出检测结果。

9.如权利要求8所述的基于元特征和权重调整的少样本目标检测网络***，其特征在于，所述元特征提取模块(1)内部网络结构为改进型的DarkNet19网络结构，权重调整模块(2)采用轻量级的卷积神经网络。

10.如权利要求9所述的基于元特征和权重调整的少样本目标检测网络***，其特征在于，所述分类回归模块(3)通过无候选框单阶段网络结构将每一个的多维特征图进行分类和回归。