CN112861720B - 基于原型卷积神经网络的遥感图像小样本目标检测方法 - Google Patents

基于原型卷积神经网络的遥感图像小样本目标检测方法 Download PDF

Info

Publication number
CN112861720B
CN112861720B CN202110172985.6A CN202110172985A CN112861720B CN 112861720 B CN112861720 B CN 112861720B CN 202110172985 A CN202110172985 A CN 202110172985A CN 112861720 B CN112861720 B CN 112861720B
Authority
CN
China
Prior art keywords
image
prototype
category
target detection
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110172985.6A
Other languages
English (en)
Other versions
CN112861720A (zh
Inventor
程塨
施佩珍
闫博唯
姚西文
韩军伟
郭雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwestern Polytechnical University
Original Assignee
Northwestern Polytechnical University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwestern Polytechnical University filed Critical Northwestern Polytechnical University
Priority to CN202110172985.6A priority Critical patent/CN112861720B/zh
Publication of CN112861720A publication Critical patent/CN112861720A/zh
Application granted granted Critical
Publication of CN112861720B publication Critical patent/CN112861720B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种基于原型卷积神经网络的遥感图像小样本目标检测方法。构建了主要包括特征提取与类别原型获取模块、原型引导RPN模块、重定向特征图模块和检测器模块的目标检测网络,并先在包含大量标注样本的基类数据集上进行网络模型基础学***衡的子数据集上对网络模型进行微调,最后经过非极大值抑制等后处理操作实现小样本遥感图像的多类目标检测。本发明能够利用少量新类标注数据从复杂背景的光学遥感图像中快速、准确地检测出不同类型的目标,具有较高的检测精度和较快的检测速度。

Description

基于原型卷积神经网络的遥感图像小样本目标检测方法
技术领域
本发明属遥感图像处理技术领域,具体涉及一种基于原型卷积神经网络的遥感图像小样本目标检测方法,可以应用于标注样本数据极少的小样本情况下的遥感图像目标检测。
背景技术
随着卫星遥感技术的不断发展,海量的遥感图像的获取已经变得越来越容易。然而,遥感图像的标注工作需要耗费大量的人力和财力。此外,有些类别的目标比较稀有,存在数据难以获取的问题。因此,如何利用少量标注样本,实现遥感图像的目标检测成为目前亟待解决的问题之一。
目前已有的小样本目标检测方法,概括起来可以分为基于元学***衡的数据集对初始模型的参数进行微调,从而实现小样本目标检测。然而,遥感图像除了存在尺度变化大、密集排布等特点外,还受到光照、云层、目标形态以及复杂的背景环境的影响,使得遥感图像和自然场景图像有较大的差异。这些问题给光学遥感图像的小样本目标检测任务带来了巨大的挑战。目前已有的小样本目标检测方法难以直接应用于遥感图像。
发明内容
为了克服现有技术的不足,本发明提供一种基于原型卷积神经网络的遥感图像小样本目标检测方法。构建了主要包括特征提取与类别原型获取模块、原型引导RPN模块、重定向特征图模块和检测器模块的目标检测网络,其中,特征提取与类别原型获取模块利用参数共享的深度卷积神经网络分别提取支持集图像和查询集图像特征,并对支持集图像的特征图进行全局平均池化操作获取类别原型;原型引导RPN模块利用获取到的类别原型对区域建议网络生成的感兴趣区域的过程进行引导;重定向特征图模块采用通道注意力机制对前景目标候选框特征的通道信息进行重新建模;检测模块利用分类网络和回归网络对重建模后的特征进行检测,输出得到包含目标预测类别和位置的检测框。本发明首先在基类数据集上进行网络模型基础学***衡的子数据集上对网络模型进行微调,该子数据集同时包含基类和新类样本,最后经过非极大值抑制等后处理操作实现小样本遥感图像的多类目标检测。本发明能够利用少量新类标注数据从复杂背景的光学遥感图像中快速、准确地检测出不同类型的目标,具有较高的检测精度和较快的检测速度。
一种基于原型卷积神经网络的遥感图像小样本目标检测方法,其特征在于步骤如下:
步骤1,基类训练数据准备:以基类训练图像数据集Dbase中所有类别的目标实例图像构成支持集图像,其中,目标实例图像为图像中目标实例包围框内的图像块;从基类训练图像数据集Dbase中随机抽取包含任意类别和数量目标实例的整幅图像作为查询集图像;然后,对所有支持集图像和查询集图像进行预处理操作,预处理后的图像作为训练数据;所述的预处理操作包括对所有图像进行归一化处理、将支持集中的图像的长宽调整为M×M、将查询集中的图像的长宽调整为M′×M′;M′的取值为基类训练图像尺寸的0.8倍至1.2倍,M的取值为M′的0.28倍;所述的基类训练图像数据集为遥感图像目标检测DIOR数据集;
步骤2,构建目标检测网络:目标检测网络主要包括特征提取与类别原型获取模块、原型引导RPN模块、重定向特征图模块和检测器模块;
所述的特征提取与类别原型获取模块的具体实现过程为:首先,输入支持集图像和查询集图像,利用特征提取骨干网络B分别对其进行特征提取,得到其对应的特征图,记支持集图像的特征图为{Fs,1,Fs,2,...,Fs,C},查询集图像的特征图为Fq,其中,特征提取骨干网络B采用的是ResNet-101网络的前四个阶段的卷积层,Fs,i表示第i个类别的支持图像的特征图,i=1,2,…,C,C为类别数;然后,对支持集图像的特征图{Fs,1,Fs,2,...,Fs,C}进行全局平均池化操作,得到每个类别的原型向量{p1,p2,...,pC},pi表示第i个类别的原型向量,i=1,2,…,C;
所述的原型引导RPN模块用于生成可能包含目标的感兴趣区域,具体实现过程为:将特征提取与类别原型获取模块得到的类别原型向量{p1,p2,...,pC}输入到一个三层的全连接网络,输出一个长度和RPN分类器所有卷积核展开后长度相同的向量,将该向量按照和RPN分类器的卷积核相同的形状进行重组,构成一组新的卷积核参数,以该参数作为辅助分类器的参数,利用辅助分类器和RPN分类器分别对查询集图像的特征图中的锚点进行前-背景打分,并将得到的两个分数相加作为锚点的前景目标得分;然后,按照RPN的锚点划分规则确定每个锚点的标签,包括前景类别、背景类别和忽略样例;将前景目标得分从高到低排序,利用RPN回归器对得分较高的r个锚点进行调整,得到r个感兴趣区域;
所述的重定向特征图模块利用Mask R-CNN网络的RoI Align操作对原型引导RPN模块得到的感兴趣区域进行特征提取,得到感兴趣区域的特征图{F1,F2,...,Fr},其中,Fi表示第i个感兴趣区域的特征图,i=1,2,…,r,r为感兴趣区域的数量;然后,将类别原型向量和感兴趣区域的特征图进行逐通道相乘,得到重定向的特征图;
所述的检测器模块利用Faster R-CNN网络的第二阶段检测器对重定向特征图模块输出的重定向特征图进行检测操作,输出包含目标预测类别和位置的检测框;其中,检测器模块的分类损失采用交叉熵损失函数,检测器模块的回归损失采用SmoothL1损失函数;
步骤3,训练目标检测网络:将步骤1得到的预处理后的支持集图像和查询集图像输入到步骤2构建的目标检测网络进行训练,得到经过基类数据集训练后的目标检测网络;
步骤4,微调训练数据准备:首先,从基类训练图像数据集Dbase中随机抽取每个类别的标注样本图像3N个,将其和新类训练图像数据集Dnovel合并,构成微调训练图像数据集Dfew;所述的新类图像数据集包含的标注样本数量不超过30个,N为其每个类别的标注样本数量;
然后,将微调训练图像数据集Dfew代替基类训练图像数据集Dbase执行步骤1中的处理,得到微调训练数据;
步骤5,进行目标检测网络微调:将步骤4得到的微调训练数据的支持集图像和查询集图像输入到步骤3得到的训练后的目标检测网络,再次对网络进行训练,得到经过微调数据集训练后的目标检测网络;
然后,将步骤4构建的数据集Dfew中的每类标注样本分别输入到训练后的特征提取骨干网络B,再经由全局平均池化操作,得到其特征代表向量,计算所有特征代表向量的平均向量作为该类别的原型向量;如此处理,每个类别获得一个原型向量,得到Cfew个原型向量,Cfew为数据集Dfew中包含的图像类别数;
步骤6,目标检测:将预处理后的待检测数据作为查询集图像输入到步骤5训练后的特征提取骨干网络B,得到其查询集图像特征,将步骤5得到的Cfew个类别原型向量和该查询集图像特征输入到训练后的原型引导RPN模块,再经训练后的重定向特征图模块、检测器模块,得到包含目标预测类别和位置的检测框,采用非极大值抑制的方法过滤掉冗余的检测框,剩余检测框即为待检测数据最终的目标检测结果。
本发明的有益效果是:由于采用了共享骨干网络的特征提取与类别原型获取模块,能够有效缓解过拟合问题同时节约内存,提高计算速度;由于采用了原型引导RPN,使得获取的感兴趣区域的质量更高,有助于后续检测器的检测;由于采用了对特征重定向的处理方式,可以进一步提高检测精度;由于分别依次采用基类训练数据和微调训练数据对目标检测网络进行训练,使得目标检测网络能够在只含少量新类标签样本的情况下,实现复杂背景遥感图像目标检测任务,具有较高的检测精度和较好的鲁棒性。
附图说明
图1是本发明的基于原型卷积神经网络的遥感图像小样本目标检测方法流程图;
图2是本发明方法的两阶段训练示意图;
图3是本发明方法的检测结果示例图。
具体实施方式
下面结合附图和实施例对本发明进一步说明,本发明包括但不仅限于下述实施例。
用于实施的硬件环境是:Intel(R)Core(TM)i3-8100 CPU计算机、8.0GB内存,运行的软件环境是:Ubuntu16.04.5LTS和Pycharm2018。本实验使用大规模遥感图像公开数据库DIOR Dataset,该数据集共有23463幅图像,其中,5862幅图像被划分到训练集,5863幅图像被划分到验证集,剩余的11738幅图像划分到测试集。涵盖20类常见的遥感图像目标。每个类别包含大约1200张图像,图像大小为800×800像素,空间分辨率范围从0.5米/像素到30米/像素。为了验证上述提出方案的有效性,将棒球场、篮球场、桥梁、烟囱、船舶、飞机、机场、高速公路收费站、码头、田径场、水坝、高尔夫球场、储油罐、网球场和车辆作为基类,将高速公路服务区、立交桥、体育场、火车站和风车作为新类。将训练集和验证集的11725幅图像用于训练,根据基类和新类的划分,将11725幅图像中包含新类的图像去除,剩余的8573幅图像作为基类训练数据集Dbase。新类的标注样本数目为每类10个,将这些新类标注样本连同基类中每类随机抽取的10个标注样本共同构造小样本数据集Dfew。最后,将剩余的11738幅图像用作测试集进行测试。
如图1所示,本发明的基于原型卷积神经网络的遥感图像小样本目标检测方法具体实现过程如下:
1、基类训练数据准备
首先,以基类训练图像数据集Dbase为基础,分别构建得到支持集图像和查询集图像。其中,查询集图像直接从Dbase中随机抽取得到,即随机抽取包含任意类别和数量目标实例的整幅图像作为查询集图像。支持集图像由基类训练图像数据集Dbase中所有类别的目标实例图像构成,其中,目标实例图像为图像中目标实例包围框内的图像块,可以利用图像的真实标签框将目标实例从整张遥感图像中抠取出来得到。
然后,分别对支持集图像和查询集图像进行预处理,包括:(1)利用每张图像RGB三个通道分量的均值Rmean、Gmean、Bmean和标准差Rstd、Gstd、Bstd,对图像进行归一化处理:
其中,Ip,c表示归一化处理前图像的c通道分量,I'p,c表示归一化处理后图像的c通道分量,Meanc代表图像c通道的均值,Stdc代表图像c通道的标准差。
(2)将支持集中的图像的长宽调整为M×M、将查询集中的图像的长宽调整为M′×M′,其中,M′的取值为Dbase中原始图像尺寸的0.8倍至1.2倍,M的取值为M′的0.28倍。
2、构建目标检测网络
目标检测网络主要包括特征提取与类别原型获取模块、原型引导RPN模块、重定向特征图模块和检测器模块。
(1)特征提取与类别原型获取模块
本发明采用ResNet-101网络的前四个阶段的卷积层作为特征提取骨干网络B。所述的ResNet-101网络结构记载在文献“K.He,X.Zhang,S.Ren,and J.Sun,"Deep residuallearning for image recognition,"in Proceedings of the IEEE conference oncomputer vision and pattern recognition,2016,pp.770-778.”中。
首先,输入支持集图像和查询集图像,利用特征提取骨干网络B分别对其进行特征提取,得到其对应的特征图,记支持集图像的特征图为{Fs,1,Fs,2,...,Fs,C},查询集图像的特征图为Fq,其中,Fs,i表示第i个类别的支持图像的特征图,i=1,2,…,C,C为支持集图像包含的类别数;然后,对支持集图像的特征图{Fs,1,Fs,2,...,Fs,C}进行全局平均池化操作,得到每个类别的原型向量{p1,p2,...,pC},pi表示第i个类别的原型向量,i=1,2,…,C。
(2)原型引导RPN模块
原型引导RPN模块用于生成可能包含目标的感兴趣区域,具体实现过程为:将特征提取与类别原型获取模块得到的类别原型向量{p1,p2,...,pC}输入到一个三层的全连接网络,输出一个长度和RPN分类器所有卷积核展开后长度相同的向量,将该向量按照和RPN分类器的卷积核相同的形状进行重组,构成一组新的卷积核参数,以该参数作为辅助分类器的参数,利用辅助分类器和RPN分类器分别对查询集图像的特征图中的锚点进行前-背景打分,并将得到的两个分数相加作为锚点的前景目标得分;然后,按照RPN的锚点划分规则确定每个锚点的标签,包括前景类别、背景类别和忽略样例;将前景目标得分从高到低排序,利用RPN回归器对得分较高的r个锚点进行调整,得到r个感兴趣区域,本实施例中r为256。
其中,RPN方法记载在文献“S.Ren,R.Girshick,R.Girshick,and J.Sun,"FasterR-CNN:Towards Real-Time Object Detection with Region Proposal Networks,"IEEETransactions on Pattern Analysis&Machine Intelligence,vol.39,no.6,pp.1137-1149,2017.”中。
(3)重定向特征图模块
重定向特征图模块首先利用Kaiming He在2017年所提出的Mask R-CNN网络中提出的RoI Align操作对上述原型引导RPN模块得到的感兴趣区域进行特征提取,得到感兴趣区域的特征图{F1,F2,...,Fr},其中,Fi表示第i个感兴趣区域的特征图,i=1,2,…,r,r为感兴趣区域的数量;然后,将类别原型向量和感兴趣区域的特征图进行逐通道相乘,得到重定向的特征图{F1c1,F1c2,...,F1c,F2c1,F2c2,...,F2c,...,Frc1,Frc2...,Frc},其中,Fi,j表示第i个感兴趣区域的特征图与类别为j的原型向量进行逐通道乘法的重定向特征图。
(4)检测器模块
利用Faster R-CNN网络的第二阶段检测器对重定向特征图模块输出的重定向特征图进行检测操作,输出包含目标预测类别和位置的检测框;其中,检测器模块的分类损失采用交叉熵损失函数,检测器模块的回归损失采用SmoothL1损失函数。
所述的Faster R-CNN记载在文献“S.Ren,R.Girshick,R.Girshick,and J.Sun,"Faster R-CNN:Towards Real-Time Object Detection with Region ProposalNetworks,"IEEE Transactions on Pattern Analysis&Machine Intelligence,vol.39,no.6,pp.1137-1149,2017.7.”中。
3、训练目标检测网络
将步骤1得到的预处理后的支持集图像和查询集图像输入到步骤2构建的目标检测网络进行训练,得到经过基类数据集训练后的目标检测网络。
4、微调训练数据准备
构建一个同时包含基类标注样本和新类标注样本的数据集Dfew,即:从基类训练图像数据集Dbase中随机抽取每个类别的标注样本图像3N个,将其和新类训练图像数据集Dnovel合并,构成微调训练图像数据集Dfew;所述的新类图像数据集包含少的标注样本,其标注样本数量不超过30个,N为其每个类别的标注样本数量,在本实施例中,N=10。
然后,将微调训练图像数据集Dfew代替基类训练图像数据集Dbase执行步骤1中的处理,得到微调训练数据。
5、对目标检测网络进行微调
经过步骤4处理得到微调训练数据也包括预处理后的支持集图像和查询集图像,分别将其输入到步骤3得到的在基类数据集上训练后的目标检测网络,再次对网络进行训练,以进行网络微调,得到经过微调数据集训练后的目标检测网络。如图2所示。
然后,将数据集Dfew中的每类标注样本分别输入到再次训练后的特征提取骨干网络B,再经由全局平均池化操作,得到其特征代表向量,计算所有特征代表向量的平均向量作为该类别的原型向量;如此处理,每个类别获得一个原型向量,得到Cfew个原型向量,Cfew为数据集Dfew中包含的图像类别数,本实施例中Cfew为20。
6、目标检测
将按照步骤1方法预处理后的待检测数据作为查询集图像送入经再次训练后的骨干网络B,再结合步骤5得到的20个类别原型向量,通过经再次训练后的原型引导RPN模块、重定向特征图模块、检测器模块,得到预测查询集图像中目标的类别和位置的检测框。采用非极大值抑制的方法来过滤掉冗余的检测框,给出每张图片最终的检测结果,其中,设置得分阈值为0.3,使用NMS重合阈值为0.5来过滤冗余的检测框。
所述的NMS方法记载在文献“A.Neubeck and L.Gool,“Efficient Non-MaximumSuppression.”18th International Conference on Pattern Recognition,2006,pp.850-855.”中。
图3给出了采用本发明得到的检测结果示例图。同时,为了验证本发明方法的有效性,选用mAP值对检测结果进行衡量,其值在0至1之间,数值越大,说明检测效果越好。mAP的计算方法记载在文献“M.Everingham,SMA.Eslami and L Van Gool,"The pascal visualobject classes challenge:A retrospective."International journal of computervision,2015,pp.98-136.”中。
将本发明所得的检测结果与小样本目标检测方法Meta R-CNN方法进行了对比,对比结果如表1所示,可以看出本发明方法在基类和新类上都具有更高的mAP值,具有更高的检测精度。
表1
基类mAP 新类mAP
Meta R-CNN方法 52.3% 17.0%
本发明方法 52.6% 18.6%

Claims (1)

1.一种基于原型卷积神经网络的遥感图像小样本目标检测方法,其特征在于步骤如下:
步骤1,基类训练数据准备:以基类训练图像数据集Dbase中所有类别的目标实例图像构成支持集图像,其中,目标实例图像为图像中目标实例包围框内的图像块;从基类训练图像数据集Dbase中随机抽取包含任意类别和数量目标实例的整幅图像作为查询集图像;然后,对所有支持集图像和查询集图像进行预处理操作,预处理后的图像作为训练数据;所述的预处理操作包括对所有图像进行归一化处理、将支持集中的图像的长宽调整为M×M、将查询集中的图像的长宽调整为M′×M′;M′的取值为基类训练图像尺寸的0.8倍至1.2倍,M的取值为M′的0.28倍;所述的基类训练图像数据集为遥感图像目标检测DIOR数据集;
步骤2,构建目标检测网络:目标检测网络主要包括特征提取与类别原型获取模块、原型引导RPN模块、重定向特征图模块和检测器模块;
所述的特征提取与类别原型获取模块的具体实现过程为:首先,输入支持集图像和查询集图像,利用特征提取骨干网络B分别对其进行特征提取,得到其对应的特征图,记支持集图像的特征图为{Fs,1,Fs,2,...,Fs,C},查询集图像的特征图为Fq,其中,特征提取骨干网络B采用的是ResNet-101网络的前四个阶段的卷积层,Fs,i表示第i个类别的支持图像的特征图,i=1,2,…,C,C为类别数;然后,对支持集图像的特征图{Fs,1,Fs,2,...,Fs,C}进行全局平均池化操作,得到每个类别的原型向量{p1,p2,...,pC},pi表示第i个类别的原型向量,i=1,2,…,C;
所述的原型引导RPN模块用于生成可能包含目标的感兴趣区域,具体实现过程为:将特征提取与类别原型获取模块得到的类别原型向量{p1,p2,...,pC}输入到一个三层的全连接网络,输出一个长度和RPN分类器所有卷积核展开后长度相同的向量,将该向量按照和RPN分类器的卷积核相同的形状进行重组,构成一组新的卷积核参数,以该参数作为辅助分类器的参数,利用辅助分类器和RPN分类器分别对查询集图像的特征图中的锚点进行前-背景打分,并将得到的两个分数相加作为锚点的前景目标得分;然后,按照RPN的锚点划分规则确定每个锚点的标签,包括前景类别、背景类别和忽略样例;将前景目标得分从高到低排序,利用RPN回归器对得分较高的r个锚点进行调整,得到r个感兴趣区域;
所述的重定向特征图模块利用Mask R-CNN网络的RoI Align操作对原型引导RPN模块得到的感兴趣区域进行特征提取,得到感兴趣区域的特征图{F1,F2,...,Fr},其中,Fi表示第i个感兴趣区域的特征图,i=1,2,…,r,r为感兴趣区域的数量;然后,将类别原型向量和感兴趣区域的特征图进行逐通道相乘,得到重定向的特征图;
所述的检测器模块利用Faster R-CNN网络的第二阶段检测器对重定向特征图模块输出的重定向特征图进行检测操作,输出包含目标预测类别和位置的检测框;其中,检测器模块的分类损失采用交叉熵损失函数,检测器模块的回归损失采用SmoothL1损失函数;
步骤3,训练目标检测网络:将步骤1得到的预处理后的支持集图像和查询集图像输入到步骤2构建的目标检测网络进行训练,得到经过基类数据集训练后的目标检测网络;
步骤4,微调训练数据准备:首先,从基类训练图像数据集Dbase中随机抽取每个类别的标注样本图像3N个,将其和新类训练图像数据集Dnovel合并,构成微调训练图像数据集Dfew;所述的新类图像数据集包含的标注样本数量不超过30个,N为其每个类别的标注样本数量;
然后,将微调训练图像数据集Dfew代替基类训练图像数据集Dbase执行步骤1中的处理,得到微调训练数据;
步骤5,进行目标检测网络微调:将步骤4得到的微调训练数据的支持集图像和查询集图像输入到步骤3得到的训练后的目标检测网络,再次对网络进行训练,得到经过微调数据集训练后的目标检测网络;
然后,将步骤4构建的数据集Dfew中的每类标注样本分别输入到训练后的特征提取骨干网络B,再经由全局平均池化操作,得到其特征代表向量,计算所有特征代表向量的平均向量作为该类别的原型向量;如此处理,每个类别获得一个原型向量,得到Cfew个原型向量,Cfew为数据集Dfew中包含的图像类别数;
步骤6,目标检测:将预处理后的待检测数据作为查询集图像输入到步骤5训练后的特征提取骨干网络B,得到其查询集图像特征,将步骤5得到的Cfew个类别原型向量和该查询集图像特征输入到训练后的原型引导RPN模块,再经训练后的重定向特征图模块、检测器模块,得到包含目标预测类别和位置的检测框,采用非极大值抑制的方法过滤掉冗余的检测框,剩余检测框即为待检测数据最终的目标检测结果。
CN202110172985.6A 2021-02-08 2021-02-08 基于原型卷积神经网络的遥感图像小样本目标检测方法 Active CN112861720B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110172985.6A CN112861720B (zh) 2021-02-08 2021-02-08 基于原型卷积神经网络的遥感图像小样本目标检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110172985.6A CN112861720B (zh) 2021-02-08 2021-02-08 基于原型卷积神经网络的遥感图像小样本目标检测方法

Publications (2)

Publication Number Publication Date
CN112861720A CN112861720A (zh) 2021-05-28
CN112861720B true CN112861720B (zh) 2024-05-14

Family

ID=75989205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110172985.6A Active CN112861720B (zh) 2021-02-08 2021-02-08 基于原型卷积神经网络的遥感图像小样本目标检测方法

Country Status (1)

Country Link
CN (1) CN112861720B (zh)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113283513B (zh) * 2021-05-31 2022-12-13 西安电子科技大学 基于目标互换和度量学习的小样本目标检测方法及***
CN113378936B (zh) * 2021-06-11 2024-03-08 长沙军民先进技术研究有限公司 一种基于Faster RCNN的少样本目标检测方法
CN113408546B (zh) * 2021-06-21 2023-03-07 武汉工程大学 基于相互全局上下文注意力机制的单样本目标检测方法
CN113780272A (zh) * 2021-07-02 2021-12-10 北京建筑大学 Sar图像舰船检测方法、装置、电子设备及存储介质
CN113743455A (zh) * 2021-07-23 2021-12-03 北京迈格威科技有限公司 目标检索方法、装置、电子设备及存储介质
CN113642574B (zh) * 2021-07-30 2022-11-29 中国人民解放军军事科学院国防科技创新研究院 基于特征加权与网络微调的小样本目标检测方法
CN113705570B (zh) * 2021-08-31 2023-12-08 长沙理工大学 一种基于深度学习的少样本目标检测方法
CN114124437B (zh) * 2021-09-28 2022-09-23 西安电子科技大学 基于原型卷积网络的加密流量识别方法
CN113822368B (zh) * 2021-09-29 2023-06-20 成都信息工程大学 一种基于无锚的增量式目标检测方法
CN114169442B (zh) * 2021-12-08 2022-12-09 中国电子科技集团公司第五十四研究所 基于双原型网络的遥感图像小样本场景分类方法
CN114399644A (zh) * 2021-12-15 2022-04-26 北京邮电大学 一种基于小样本目标检测方法及装置
CN114219804B (zh) * 2022-02-22 2022-05-24 汉斯夫(杭州)医学科技有限公司 一种基于原型分割网络的小样本牙齿检测方法及存储介质
CN114743045B (zh) * 2022-03-31 2023-09-26 电子科技大学 一种基于双分支区域建议网络的小样本目标检测方法
CN115049870A (zh) * 2022-05-07 2022-09-13 电子科技大学 一种基于小样本的目标检测方法
CN115049944B (zh) * 2022-06-02 2024-05-28 北京航空航天大学 一种基于多任务优化的小样本遥感图像目标检测方法
CN114861842B (zh) * 2022-07-08 2022-10-28 中国科学院自动化研究所 少样本目标检测方法、装置和电子设备
CN115100532B (zh) * 2022-08-02 2023-04-07 北京卫星信息工程研究所 小样本遥感图像目标检测方法和***
CN115115898B (zh) * 2022-08-31 2022-11-15 南京航空航天大学 一种基于无监督特征重构的小样本目标检测方法
CN115984621B (zh) * 2023-01-09 2023-07-11 宁波拾烨智能科技有限公司 一种基于限制性原型对比网络的小样本遥感图像分类方法
CN116310894B (zh) * 2023-02-22 2024-04-16 中交第二公路勘察设计研究院有限公司 一种基于无人机遥感的小样本小目标藏羚羊智能识别方法
CN116129226B (zh) * 2023-04-10 2023-07-25 之江实验室 一种基于多原型混合模块的少样本目标检测方法及装置
CN117409250B (zh) * 2023-10-27 2024-04-30 北京信息科技大学 小样本目标检测方法、装置及介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063594A (zh) * 2018-07-13 2018-12-21 吉林大学 基于YOLOv2的遥感图像快速目标检测方法
CN109919108A (zh) * 2019-03-11 2019-06-21 西安电子科技大学 基于深度哈希辅助网络的遥感图像快速目标检测方法
CN110189304A (zh) * 2019-05-07 2019-08-30 南京理工大学 基于人工智能的光学遥感图像目标在线快速检测方法
CN111160249A (zh) * 2019-12-30 2020-05-15 西北工业大学深圳研究院 基于跨尺度特征融合的光学遥感图像多类目标检测方法
CN111666836A (zh) * 2020-05-22 2020-09-15 北京工业大学 M-f-y型轻量化卷积神经网络的高分辨率遥感影像目标检测方法
CN111797676A (zh) * 2020-04-30 2020-10-20 南京理工大学 一种高分辨率遥感图像目标在轨轻量化快速检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063594A (zh) * 2018-07-13 2018-12-21 吉林大学 基于YOLOv2的遥感图像快速目标检测方法
CN109919108A (zh) * 2019-03-11 2019-06-21 西安电子科技大学 基于深度哈希辅助网络的遥感图像快速目标检测方法
CN110189304A (zh) * 2019-05-07 2019-08-30 南京理工大学 基于人工智能的光学遥感图像目标在线快速检测方法
CN111160249A (zh) * 2019-12-30 2020-05-15 西北工业大学深圳研究院 基于跨尺度特征融合的光学遥感图像多类目标检测方法
CN111797676A (zh) * 2020-04-30 2020-10-20 南京理工大学 一种高分辨率遥感图像目标在轨轻量化快速检测方法
CN111666836A (zh) * 2020-05-22 2020-09-15 北京工业大学 M-f-y型轻量化卷积神经网络的高分辨率遥感影像目标检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于特征融合与分类器在线学习的目标跟踪算法;胡秀华;郭雷;李晖晖;;控制与决策(第09期);全文 *

Also Published As

Publication number Publication date
CN112861720A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
CN112861720B (zh) 基于原型卷积神经网络的遥感图像小样本目标检测方法
CN110363122B (zh) 一种基于多层特征对齐的跨域目标检测方法
CN106778595B (zh) 基于高斯混合模型的人群中异常行为的检测方法
CN108596055B (zh) 一种复杂背景下高分辨遥感图像的机场目标检测方法
CN111160249A (zh) 基于跨尺度特征融合的光学遥感图像多类目标检测方法
CN111709416B (zh) 车牌定位方法、装置、***及存储介质
CN110163213B (zh) 基于视差图和多尺度深度网络模型的遥感图像分割方法
CN111353395A (zh) 一种基于长短期记忆网络的换脸视频检测方法
CN111738055B (zh) 多类别文本检测***和基于该***的票据表单检测方法
CN110082821B (zh) 一种无标签框微地震信号检测方法及装置
CN113111727B (zh) 一种基于特征对齐的遥感场景下旋转目标检测方法
CN111460980B (zh) 基于多语义特征融合的小目标行人的多尺度检测方法
CN104036284A (zh) 基于Adaboost算法的多尺度行人检测方法
CN112016605A (zh) 一种基于边界框角点对齐和边界匹配的目标检测方法
CN109584206B (zh) 零件表面瑕疵检测中神经网络的训练样本的合成方法
CN114495010A (zh) 一种基于多特征学习的跨模态行人重识别方法及***
CN114360030A (zh) 一种基于卷积神经网络的人脸识别方法
CN111401113A (zh) 一种基于人体姿态估计的行人重识别方法
CN114332473A (zh) 目标检测方法、装置、计算机设备、存储介质及程序产品
CN110826411A (zh) 一种基于无人机图像的车辆目标快速识别方法
CN114266805A (zh) 一种用于无人机目标跟踪的孪生区域建议网络模型
CN112446305A (zh) 一种基于分类权重等距分布损失模型的行人重识别方法
Xia et al. Abnormal event detection method in surveillance video based on temporal CNN and sparse optical flow
Zeng et al. Masanet: Multi-angle self-attention network for semantic segmentation of remote sensing images
CN114494893B (zh) 基于语义重用上下文特征金字塔的遥感图像特征提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant