CN114266846B

CN114266846B - 一种用于目标检测模型的自学习填充方法

Info

Publication number: CN114266846B
Application number: CN202111604881.4A
Authority: CN
Inventors: 柯逍; 林心茹; 蒋培龙
Original assignee: Fuzhou University
Current assignee: Fuzhou University
Priority date: 2021-12-25
Filing date: 2021-12-25
Publication date: 2024-06-14
Anticipated expiration: 2041-12-25
Also published as: CN114266846A

Abstract

本发明涉及一种用于目标检测模型的自学习填充方法，包括以下步骤：步骤S1:获取图像数据集，并进行数据增强扩充数据集；步骤S2:构建可根据网络需要自动调整填充值的特征填充模块；步骤S3:将特征填充模块用于CenterNet骨干网络中，并且使用模糊池化优化下采样层，构建基于自学习填充的目标检测模型；步骤S4:基于扩充后的数据集对基于自学习填充的目标检测模型进行训练，通过随机梯度下降方法，优化自学习填充模块参数，得到训练后的目标检测模型；步骤S5:将测试图像输入训练好的目标检测模型，获取目标检测结果。本发明能够有效地减少边缘小目标的漏检。

Description

一种用于目标检测模型的自学习填充方法

技术领域

本发明涉及模式识别与计算机视觉领域，具体涉及一种用于目标检测模型的自学习填充方法。

背景技术

近些年来，目标检测算法在各个公开基准数据集上不断刷新纪录，并且许多落地产品被应用于各个领域。基于深度学习的通用目标检测方法已经取得了非常大的进步，但在真实环境中还面临着许多挑战，小目标检测一直是个困难问题。小目标检测的主要难点在于输入图像中小目标只占很少的像素点，因此在进行特征提取时很难获得小目标的信息。目前解决小目标问题的方法主要是通过改善输入特征质量来对小目标的检测结果，但是在进行多次特征提取的中间过程也存在信息的损失，零填充引入了和输入相关性弱的信息，导致了边缘信息弱化，对此可以通过减少损失保留更多的特征信息来提升对于小目标的检测精度。

发明内容

有鉴于此，本发明的目的在于提供一种用于目标检测模型的自学习填充方法，能够有效地减少边缘小目标的漏检。

为实现上述目的，本发明采用如下技术方案：

一种用于目标检测模型的自学习填充方法，包括以下步骤：

步骤S1:获取图像数据集，并进行数据增强扩充数据集；

步骤S2:构建可根据网络需要自动调整填充值的特征填充模块；

步骤S3:将特征填充模块用于CenterNet骨干网络中，并且使用模糊池化优化下采样层，构建基于自学习填充的目标检测模型；

步骤S4:基于扩充后的数据集对基于自学习填充的目标检测模型进行训练，通过随机梯度下降方法，优化自学习填充模块参数，得到训练后的目标检测模型；

步骤S5:将测试图像输入训练好的目标检测模型，获取目标检测结果。

进一步的，所述步骤S1，具体为:

步骤S11:获取目标检测通用数据集COCO的训练集，根据数据集标签文件中提供的真实框的位置信息截取图像中对应位置的真实框图像，对尺度小于预设像素的真实框图像构建粘贴库；

步骤S12:抽取训练集中预设比例的图像数据，使用抽取的这部分数据作为数据增强的扩展对象，制作扩展数据集；

步骤S13:将S12中制作的扩展数据集和S12抽取后剩余的数据组成新的训练集。

进一步的，所述制作扩展数据集，具体为：对抽取的图像数据顺序处理，在图像范围内随机生成五个横纵坐标，以随机生成的坐标点作为粘贴图像的中心点，从步骤S1中生成的粘贴库中随机抽取五个真实框图像粘贴到对应中心点的位置上覆盖原来的图像信息,制作扩展数据集。

进一步的，所述特征填充模块具体为：

特征填充模块的输入包含输入特征图和填充大小两部分内容，设输入特征图为f⁽ⁱⁿ⁾，输入特征图的尺度为N×C×H×W，其中N表示Batch Size，C为通道数，H和W为高和宽，填充大小为p；

截取输入特征图上、下、左、右四个方向的四个边缘信息和左上、左下、右上、右下四个角点信息，四个角点信息尺度为N×C×p×p；

特征填充模块中包含两个尺度为p×1卷积核记为g₁，g₂，两个尺度为1×p的卷积核记为g₃，g₄，四个尺度为p×p的卷积核记为g₅，g₆，g₇，g₈；卷积核g₁，g₂，g₃，g₄，g₅，g₆，g₇，g₈的初始权值为0，使用这八种卷积对步骤S21中获得的八种边缘信息P₁，P₂，P₃，P₄，P₅，P₆，P₇，P₈进行卷积操作，设*为卷积操作，则经过卷积操作后的输出结果记为P′_i，计算公式如下：

P′_i＝P_i*g_i，i∈1，2，3，…，7，8

将获得的四条边和四个角点的填充块P′_i(i∈1，2，3，…，7，8)与输入图进行拼接操作，拼接操作将两个不同的特征图按照一个维度方向进行拼接，拼接操作记为CAT(Z₁，Z₂，Z₃，dim)，其中Z₁，Z₂，Z₃为三个输入特征图，dim为对应的拼接维度，按照三个特征图输入的相对位置进行拼接，三个特征图的只能有一个维度大小不同。

进一步的，所述边缘信息和角点信息，具体设置如下：以图像的左上角为(0,0)原点，上方的边缘信息截取图像高度从0到p-1宽度为W的部分特征记为P₁，下方的边缘信息截取图像高度H-p到H-1宽度为W的部分特征记为P₂，上下边缘信息的尺度N×C×p×W；左边的边缘信息截取图像宽度从0到p-1高度为H的部分特征记为P₃，右边的边缘信息截取图像宽度W-p到W-1高度为H的部分特征P₄，左右边缘信息的尺度N×C×H×p；左上方角点信息截取图像宽度和高度0到p-1个像素的部分特征记为P₅，右上方角点信息截取图像宽度W-p到W-1和高度0到p-1个像素的部分特征记为P₆，左下方角点信息截取图像宽度W-p到W-1和高度0到p-1个像素的部分特征记为P₇，右下方角点信息截取图像宽度W-p到W-1和高度H-p到H-1个像素的部分特征记为P₈。

进一步的，所述步骤S3具体为：

步骤S31：选定一个单阶段或是两阶段的目标检测模型，修改目标检测模型骨干网络中所有的卷积层，使用步骤S2中特征填充模块替换原始的填充方法，构建可以获得自学习填充边界的卷积层；

步骤S32：用步骤S31中构建可获得自学习填充边界的卷积层替换目标检测模型中的所有传统卷积层，获得可自适应扩展边缘的目标检测模型；替换后的卷积层每次执行两个操作，首先使用步骤S2中构造的特征填充模块获得f^in-Pad，然后对f^in-Pad使用常规卷积操作，设常规卷积为g，输入图像经过自学习的填充之后进行卷积操作，输出图像f^(out)对应x位置上的结果f^(out)[x]为：

其中是卷积核的范围，以3×3卷积为例/>若/>则g[y]为卷积核对应位置的权值，/>是f^in-Pad图像的范围，从零到像素的宽度和高度，f^in-Pad[x+y]则表示在x+y位置对应值；

步骤S33：对步骤S32中得到的可自适应扩展边缘的目标检测模型进行进一步优化，使用模糊池化替换目标检测模型骨干网络中的所有下采样层，从而构建基于自学习填充的目标检测模型。

进一步的，所述骨干网络中的下采样方法包括最大池化和跨步卷积，最大池化看作两步，先取最大值再进行下采样，模糊池化在这两步中间加入抗锯齿模糊操作，参数设置不变，因此直接使用模糊池化替换最大池化；当网络中使用跨步卷积进行下采样，不是直接使用模糊池化替换，而是在模糊池化后加上尺度不变卷积。

进一步的，所述步骤S4，具体为：

步骤S41：训练基于自学习填充的目标检测模型，对可获得自学习填充边界的卷积层中的常规卷积参数使用随机初始化，特征模块中的卷积参数固定初始值为0，通过随机梯度下降方法，优化自学习填充模块参数；

步骤S42：步骤S41训练好的模型中g_i(i∈1，2，3，…，7，8)值在训练中得到优化，训练过程中根据数据特征和特征学习的自动调整值，包含了多种传统的填充方法，当卷积g_i(i∈1，2，3，…，7，8)的权值都等于0时，P′_i(i∈1，2，3，…，7，8)也为0，等价于零填充，如果都等于1的时，P′_i(i∈1，2，3，…，7，8)和P_i(i∈1，2，3，…，7，8)相等，则是重复填充。

进一步的，所述步骤S5，具体为：将待预测图像输入S41训练好的基于自学习填充的目标检测模型进行预测，待预测图像通过训练好的特征填充模块扩展边缘，并且使用模糊池化进行下采样，生成多个预测框，设置阈值，并根据预测概率选出符合要求预测框。

本发明与现有技术相比具有以下有益效果：

1、本发明，能够基于图像的边缘信息自适应学习填充值，可以缓解边缘信息的弱化，保证了填充值和输入信息的相关性。对于目标检测任务，可以减少对落在物体边缘的小特征和关键特征的漏检，从而提高模型的准确性；

2、本发明使用复制-粘贴的数据增强方法提升模型对小目标的检测能力。

附图说明

图1是本发明方法流程图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

请参照图1，本发明提供一种用于目标检测模型的自学习填充方法，包括以下步骤：

步骤S1:获取图像数据集，并进行数据增强扩充数据集；

在本实施例中，步骤S1具体包括以下步骤：

步骤S11：获取目标检测通用数据集COCO的训练集，根据数据集标签文件中提供的真实框的位置信息截取图像中对应位置的真实框图像，对尺度小于32×32像素的真实框图像构建粘贴库。

步骤S12：抽取训练集中50％的图像数据，使用抽取的这部分数据作为数据增强的扩展对象。对抽取的图像数据顺序处理，在图像范围内随机生成五个横纵坐标，以随机生成的坐标点作为粘贴图像的中心点，从步骤S1中生成的粘贴库中随机抽取五个真实框图像粘贴到对应中心点的位置上覆盖原来的图像信息，制作扩展数据集。

步骤S13：将S12中制作的扩展数据集和S12抽取后剩余的50％数据组成新的训练集。

在本实施例中，步骤S2具体包括以下步骤：

步骤S21：特征填充模块的输入包含输入特征图和填充大小两部分内容，设输入特征图为f⁽ⁱⁿ⁾，输入特征图的尺度为N×C×H×W，其中N表示Batch Size，C为通道数，H和W为高和宽，填充大小为p。截取输入特征图上、下、左、右四个方向的四个边缘信息和左上、左下、右上、右下四个角点信息。以图像的左上角为(0,0)原点，上方的边缘信息截取图像高度从0到p-1宽度为W的部分特征记为P₁，下方的边缘信息截取图像高度H-p到H-1宽度为W的部分特征记为P₂，上下边缘信息的尺度N×C×p×W。左边的边缘信息截取图像宽度从0到p-1高度为H的部分特征记为P₃，右边的边缘信息截取图像宽度W-p到W-1高度为H的部分特征P₄，左右边缘信息的尺度N×C×H×p。左上方角点信息截取图像宽度和高度0到p-1个像素的部分特征记为P₅，右上方角点信息截取图像宽度W-p到W-1和高度0到p-1个像素的部分特征记为P₆，左下方角点信息截取图像宽度W-p到W-1和高度0到p-1个像素的部分特征记为P₇，右下方角点信息截取图像宽度W-p到W-1和高度H-p到H-1个像素的部分特征记为P₈，四个角点信息尺度为N×C×p×p。

步骤S22：特征填充模块中包含两个尺度为p×1卷积核记为g₁，g₂，两个尺度为1×p的卷积核记为g₃，g₄，四个尺度为p×p的卷积核记为g₅，g₆，g₇，g₈。卷积核g₁，g₂，g₃，g₄，g₅，g₆，g₇，g₈的初始权值为0，使用这八种卷积对步骤S21中获得的八种边缘信息P₁，P₂，P₃，P₄，P₅，P₆，P₇，P₈进行卷积操作，设*为卷积操作，则经过卷积操作后的输出结果记为P′_i，计算公式如下：

P′_i＝Pi*g_i，i∈1，2，3，…，7，8

将获得的四条边和四个角点的填充块P′_i(i∈1，2，3，…，7，8)与输入图进行拼接操作，拼接操作将两个不同的特征图按照一个维度方向进行拼接，拼接操作记为CAT(Z₁，Z₂，Z₃，dim)，其中Z₁，Z₂，Z₃为三个输入特征图，dim为对应的拼接维度(从左到右从零开始)，按照三个特征图输入的相对位置进行拼接，三个特征图的只能有一个维度大小不同，例如Z₁，Z₂，Z₃尺度为N×C×H×p、N×C×H×H与N×C×H×p，只有最后一维度大小不同，则dim＝3，按照顺序Z₁在左边Z₂在中间Z₃在右边，拼接后的尺度为N×C×H×(p+H+p)，拼接后得到特征填充模块按照Z₁Z₂Z₃对应顺序，则将获得的四条边和四个角点的填充块P′_i(i∈1，2，3，…，7，8)与输入图f⁽ⁱⁿ⁾进行拼接操作的输出值记为f^in-Pad，具体计算公式如下：

f^in-Pad

＝CAT((CAT(P′₅，P′₁，P′₆，3)，CAT(P′₃，f⁽ⁱⁿ⁾，P′₄，3)，CAT(P′₇，P′₂，P′₈，3)，2)

在本实施例中，步骤S3具体包括以下步骤：

步骤S31：选定一个单阶段或是两阶段的目标检测模型，修改目标检测模型骨干网络中所有的卷积层，不使用传统的填充方法，使用步骤S2中设计的特征填充模块替换原始的填充方法，构建可以获得自学习填充边界的卷积层。

步骤S32：用步骤S31中构建可获得自学习填充边界的卷积层替换目标检测模型中的所有传统卷积层，获得可自适应扩展边缘的目标检测模型。替换后的卷积层每次执行两个操作，首先使用步骤S2中构造的特征填充模块获得f^in-Pad，然后对f^in-Pad使用常规卷积操作，设常规卷积为g，输入图像经过自学习的填充之后进行卷积操作，输出图像f^(out)对应x位置上的结果f^(out)[x]为：

其中是卷积核的范围，以3×3卷积为例/>若/>则g[y]为卷积核对应位置的权值，/>是f^in-Pad图像的范围，从零到像素的宽度和高度，f^in-Pad[x+y]则表示在x+y位置对应值。

步骤S33：对步骤S32中得到的可自适应扩展边缘的目标检测模型进行进一步优化，使用模糊池化替换目标检测模型骨干网络中的所有下采样层，从而构建基于自学习填充的目标检测模型。骨干网络中的下采样方法包括最大池化和跨步卷积。最大池化可以看作两步，先取最大值再进行下采样，模糊池化在这两步中间加入抗锯齿模糊操作，参数设置不变，因此直接使用模糊池化替换最大池化。当网络中使用跨步卷积进行下采样，不是直接使用模糊池化替换，而是在模糊池化后加上尺度不变卷积。

在本实施例中，步骤S4具体包括以下步骤：

步骤S41：训练S33构建的基于自学习填充的目标检测模型，对可获得自学习填充边界的卷积层中的常规卷积参数使用随机初始化，特征模块中的卷积参数固定初始值为0，通过随机梯度下降方法，优化自学习填充模块参数。

步骤S42：步骤S41训练好的模型中g_i(i∈1，2，3，…，7，8)值在训练中得到优化，训练过程中根据数据特征和特征学习的需要自动调整值，包含了多种传统的填充方法，当卷积g_i(i∈1，2，3，…，7，8)的权值都等于0时，P′_i(i∈1，2，3，…，7，8)也为0，等价于零填充，如果都等于1的时，P′_i(i∈1，2，3，…，7，8)和P_i(i∈1，2，3，…，7，8)相等，则是重复填充。

在本实施例中，步骤S5具体为：将待预测图像输入S41训练好的基于自学习填充的目标检测模型进行预测，待预测图像通过训练好的特征填充模块扩展边缘，并且使用模糊池化进行下采样，生成多个预测框，设置阈值为0.5到0.95，根据预测概率选出符合要求预测框。

以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所做的均等变化与修饰，皆应属本发明的涵盖范围。

Claims

1.一种用于目标检测模型的自学习填充方法，其特征在于，包括以下步骤：

步骤S1:获取图像数据集，并进行数据增强扩充数据集；

步骤S5:将测试图像输入训练好的目标检测模型，获取目标检测结果；

所述特征填充模块具体为：

截取输入特征图上、下、左、右四个方向的四个边缘信息和左上、左下、右上、右下四个角点信息，以图像的左上角为(0,0)原点，上方的边缘信息截取图像高度从0到p-1宽度为W的部分特征记为P₁，下方的边缘信息截取图像高度H-p到H-1宽度为W的部分特征记为P₂，上下边缘信息的尺度N×C×p×W，左边的边缘信息截取图像宽度从0到p-1高度为H的部分特征记为P₃，右边的边缘信息截取图像宽度W-p到W-1高度为H的部分特征P₄，左右边缘信息的尺度N×C×H×p，左上方角点信息截取图像宽度和高度0到p-1个像素的部分特征记为P₅，右上方角点信息截取图像宽度W-p到W-1和高度0到p-1个像素的部分特征记为P₆，左下方角点信息截取图像宽度W-p到W-1和高度0到p-1个像素的部分特征记为P₇，右下方角点信息截取图像宽度W-p到W-1和高度H-p到H-1个像素的部分特征记为P₈，四个角点信息尺度为N×C×p×p；

特征填充模块中包含两个尺度为p×1卷积核记为g₁,g₂，两个尺度为1×p的卷积核记为g₃,g₄，四个尺度为p×p的卷积核记为g₅,g₆,g₇,g₈；卷积核g₁,g₂,g₃,g₄,g₅,g₆,g₇,g₈的初始权值为0，使用这八种卷积对八种边缘信息P₁,P₂,P₃,P₄,P₅,P₆,P₇,P₈进行卷积操作，设*为卷积操作，则经过卷积操作后的输出结果记为P'_i，计算公式如下：

P′_i＝P_i*g_i,i∈1,2,3,…,7,8

将获得的四条边和四个角点的填充块P'_i(i∈1,2,3,…,7,8)与输入图进行拼接操作，拼接操作将两个不同的特征图按照一个维度方向进行拼接，拼接操作记为CAT(Z₁,Z₂,Z₃,dim)，其中Z₁,Z₂,Z₃为三个输入特征图，dim为对应的拼接维度，按照三个特征图输入的相对位置进行拼接，三个特征图的只能有一个维度大小不同；

所述步骤S3具体为：

2.根据权利要求1所述的一种用于目标检测模型的自学习填充方法，其特征在于，所述步骤S1，具体为:

3.根据权利要求2所述的一种用于目标检测模型的自学习填充方法，其特征在于，所述制作扩展数据集，具体为：对抽取的图像数据顺序处理，在图像范围内随机生成五个横纵坐标，以随机生成的坐标点作为粘贴图像的中心点，从步骤S1中生成的粘贴库中随机抽取五个真实框图像粘贴到对应中心点的位置上覆盖原来的图像信息,制作扩展数据集。

4.根据权利要求1所述的一种用于目标检测模型的自学习填充方法，其特征在于，所述边缘信息和角点信息，具体设置如下：以图像的左上角为(0,0)原点，上方的边缘信息截取图像高度从0到p-1宽度为W的部分特征记为P₁，下方的边缘信息截取图像高度H-p到H-1宽度为W的部分特征记为P₂，上下边缘信息的尺度N×C×p×W；左边的边缘信息截取图像宽度从0到p-1高度为H的部分特征记为P₃，右边的边缘信息截取图像宽度W-p到W-1高度为H的部分特征P₄，左右边缘信息的尺度N×C×H×p；左上方角点信息截取图像宽度和高度0到p-1个像素的部分特征记为P₅，右上方角点信息截取图像宽度W-p到W-1和高度0到p-1个像素的部分特征记为P₆，左下方角点信息截取图像宽度W-p到W-1和高度0到p-1个像素的部分特征记为P₇，右下方角点信息截取图像宽度W-p到W-1和高度H-p到H-1个像素的部分特征记为P₈。

5.根据权利要求1所述的一种用于目标检测模型的自学习填充方法，其特征在于，所述骨干网络中的下采样方法包括最大池化和跨步卷积，最大池化看作两步，先取最大值再进行下采样，模糊池化在这两步中间加入抗锯齿模糊操作，参数设置不变，因此直接使用模糊池化替换最大池化；当网络中使用跨步卷积进行下采样，不是直接使用模糊池化替换，而是在模糊池化后加上尺度不变卷积。

6.根据权利要求1所述的一种用于目标检测模型的自学习填充方法，其特征在于，所述步骤S4，具体为：

步骤S42：步骤S41训练好的模型中g_i(i∈1,2,3,…,7,8)值在训练中得到优化，训练过程中根据数据特征和特征学习的自动调整值，包含了多种传统的填充方法，当卷积g_i(i∈1,2,3,…,7,8)的权值都等于0时，P'_i(i∈1,2,3,…,7,8)也为0，等价于零填充，如果都等于1的时，P'_i(i∈1,2,3,…,7,8)和P_i(i∈1,2,3,…,7,8)相等，则是重复填充。

7.根据权利要求1所述的一种用于目标检测模型的自学习填充方法，其特征在于，所述步骤S5，具体为：将待预测图像输入S41训练好的基于自学习填充的目标检测模型进行预测，待预测图像通过训练好的特征填充模块扩展边缘，并且使用模糊池化进行下采样，生成多个预测框，设置阈值，并根据预测概率选出符合要求预测框。