CN115376007A - 目标检测方法、装置、设备、介质及计算机程序产品 - Google Patents

目标检测方法、装置、设备、介质及计算机程序产品 Download PDF

Info

Publication number
CN115376007A
CN115376007A CN202210957790.7A CN202210957790A CN115376007A CN 115376007 A CN115376007 A CN 115376007A CN 202210957790 A CN202210957790 A CN 202210957790A CN 115376007 A CN115376007 A CN 115376007A
Authority
CN
China
Prior art keywords
preset
target
detection
frame
horizontal anchor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210957790.7A
Other languages
English (en)
Inventor
陈婧
后兴海
毕福昆
鞠浩然
车志豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China University of Technology
Original Assignee
North China University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China University of Technology filed Critical North China University of Technology
Priority to CN202210957790.7A priority Critical patent/CN115376007A/zh
Publication of CN115376007A publication Critical patent/CN115376007A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种目标检测方法、装置、设备、介质及计算机程序产品,该方法包括:在训练阶段,将待检测图像输入深度残差网络得到提取特征,将提取特征输入预设特征融合模块,在特征融合模块的各层输出特征上预设目标水平锚框;计算待检测图像对应的真实目标框与各预设目标水平锚框的匹配度;根据匹配度从各目标水平锚框中筛选出正负样本,将正负样本输入检测回归网络,并通过预设回归损失函数训练检测回归网络;在测试阶段,将待检测图像对应的特征融合模块的输出输入训练后的检测回归网络,根据预设非极大抑制阈值确定目标检测结果。本发明提高了遥感图像的目标检测精度。

Description

目标检测方法、装置、设备、介质及计算机程序产品
技术领域
本发明涉及目标检测技术领域,尤其涉及一种目标检测方法、装置、设备、介质及计算机程序产品。
背景技术
遥感图像目标检测技术是遥感信息自动获取的重要构成部分,其主要目的是从遥感图像中鉴别并定位出某些目标,伴随着人工智能的迅速发展,以卷积神经网络为基础的深度学习目标检测实现已成为遥感目标检测中的主导。卷积神经网络借助庞大的目标标注数据,不但能够获取到目标的纹理、边缘等底层特性,还能够获得目标的深度的语义信息,并依据获得的特征对目标实施定位和分类,大大改善了遥感目标检测性能。
由于光学遥感图像俯视视角的特点,遥感目标往往存在密集排布和方向任意等问题,如停车场密集停放的车辆和港口密集停泊的船舶等,而现有基于深度学习的目标检测方法会带来背景噪声以及邻域物体信息,干扰检测模型的训练,导致目标误检和漏检,造成目标检测的精度降低。
发明内容
本发明提供一种目标检测方法、装置、设备、存储介质及计算机程序产品,用以解决现有遥感目标检测精度低的技术问题。
本发明提供一种目标检测方法,包括:
在训练阶段,将待检测图像输入深度残差网络得到提取特征,将所述提取特征输入预设特征融合模块,在所述特征融合模块的各层输出特征上预设目标水平锚框;
计算所述待检测图像对应的真实目标框与各所述预设目标水平锚框的匹配度;
根据所述匹配度从各所述预设目标水平锚框中筛选出正负样本,将所述正负样本输入检测回归网络,并通过预设回归损失函数训练所述检测回归网络;
在测试阶段,将所述待检测图像对应的所述特征融合模块的输出输入训练后的检测回归网络,根据预设非极大抑制阈值确定目标检测结果。
根据本发明提供的一种目标检测方法,所述在所述特征融合模块的各层输出特征上预设目标水平锚框的步骤包括:
根据预设尺寸、预设长宽比和预设尺度,在所述特征融合模块的各层输出特征上预设目标水平锚框,其中,所述预设尺寸的类型数与所述输出特征的层数相同。
根据本发明提供的一种目标检测方法,所述计算所述待检测图像对应的真实目标框与各所述目标水平锚框的匹配度的步骤包括:
确定所述深度残差网络运行后通过筛选的预设目标水平锚框调整位置和方向得到的检测框,计算所述检测框与所述真实目标框的第一交并比;
获取预设超参数,计算所述真实目标框与各所述预设目标水平锚框的第二交并比;
根据所述预设超参数、所述第一交并比以及所述第二交并比,计算所述待检测图像对应的真实目标框与各所述预设目标水平锚框的匹配度。
根据本发明提供的一种目标检测方法,所述获取预设超参数的步骤包括:
获取所述深度残差网络的当前更新次数以及预设迭代总次数;
根据所述当前更新次数与所述预设迭代总次数的比值,计算得到预设超参数。
根据本发明提供的一种目标检测方法,所述根据所述匹配度从各所述目标水平锚框中筛选出正负样本,将所述正负样本输入检测回归网络,并通过预设回归损失函数训练所述检测回归网络的步骤之前包括:
将匹配度大于预设阈值的目标水平锚框作为正样本,将其余目标水平锚框作为负样本;
根据所述第一交并比、所述正样本、预设回归损失权重、预测偏移矢量、所述真实目标框的目标矢量和第一中心坐标、所述检测框的第二中心坐标,以及根据所述真实目标框和所述检测框确定的对角线距离,确定预设回归损失函数。
根据本发明提供的一种目标检测方法,所述将所述待检测图像对应的所述特征融合模块的输出输入训练后的检测回归网络,根据预设非极大抑制阈值确定目标检测结果的步骤包括:
筛选各所述检测框中的第一检测框和第二检测框;
计算所述第一检测框和所述第二检测框的第三交并比,中间点距离以及最远点距离;
根据所述第三交并比,所述中间点距离,所述最远点距离以及预设非极大抑制阈值确定目标检测结果。
本发明还提供一种目标检测装置,包括:
目标水平锚框预设模块,用于在训练阶段,将待检测图像输入深度残差网络得到提取特征,将所述提取特征输入预设特征融合模块,在所述特征融合模块的各层输出特征上预设目标水平锚框;
匹配度计算模块,用于计算所述待检测图像对应的真实目标框与各所述目标水平锚框的匹配度;
检测回归网络训练模块,用于根据所述匹配度从各所述目标水平锚框中筛选出正负样本,将所述正负样本输入检测回归网络,并通过预设回归损失函数训练所述检测回归网络;
检测结果确定模块,用于在测试阶段,将所述待检测图像对应的所述特征融合模块的输出输入训练后的检测回归网络,根据预设非极大抑制阈值确定目标检测结果。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述目标检测方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述目标检测方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述目标检测方法。
本发明提供的目标检测方法、装置、设备、存储介质及计算机程序产品,在训练阶段,将待检测图像输入深度残差网络得到提取特征,将提取特征输入预设特征融合模块,在特征融合模块的各层输出特征上预设目标水平锚框;计算待检测图像对应的真实目标框与各目标水平锚框的匹配度;根据匹配度从各目标水平锚框中筛选出正负样本,将正负样本输入检测回归网络,并通过预设回归损失函数训练检测回归网络;在测试阶段,将待检测图像对应的特征融合模块的输出输入训练后的检测回归网络,根据预设非极大抑制阈值确定目标检测结果,通过在预设特征融合模块每一层输出上仅设置水平锚框,在训练阶段通过计算水平锚框与真实目标框的匹配度,筛选出正负样本,同时基于预设回归损失函数进行检测回归网络训练,提高了图像的定向目标检测精度。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的目标检测方法的流程示意图之一;
图2是本发明提供的目标检测方法的流程示意图之二;
图3是本发明提供的目标检测装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图2描述本发明的目标检测方法。
请参照图1,本发明提供一种目标检测方法,包括:
步骤S100,在训练阶段,将待检测图像输入深度残差网络得到提取特征,将所述提取特征输入预设特征融合模块,在所述特征融合模块的各层输出特征上预设目标水平锚框;
具体地,本实施例中的待检测图像中包含密集定向小目标,在待检测图像的特征提取阶段,通过ResNet101(5种深度的残差网络)提取待检测图像的特征,将提取到的特征通过FPN(Feature Pyramid Networks,特征图金字塔网络),即本实施例中的预设特征融合模块,预设特征融合模块能够深度融合待检测图像的浅层纹理信息及高层语义信息,在预设特征融合模块输出的5层(P3-P7)的特征上设置预定义的水平锚框,即本实施例中的目标水平锚框。在FPN的5个输出层中分别设置尺寸为[25,26,27,28,29]的目标水平锚框,同时针对5个输出层中每一个特征层上的目标水平锚框,又设置{1:2,1:1,2:1}三种长宽比,以及
Figure BDA0003792048130000061
三种尺度,每层每个特征点共9个目标水平锚框,各个输出层实现了输入图像32~813pix(像素单位)的覆盖。
步骤S200,计算所述待检测图像对应的真实目标框与各所述目标水平锚框的匹配度;
具体地,本实施例通过以下公式:md=αsa+(1-α)fa-uγ计算待检测图像对应的真实目标框与各预设目标水平锚框的匹配度,其中,待检测图像对应的真实目标框是预先标记的目标框,上述md为匹配度,α为平衡sa影响的超参数;sa表示空间对齐的先验,其值相当于目标水平锚框与真实目标框的交并比,首先,得到目标水平锚框与真实目标框的交点集,并将一个框包含于另一个框的顶点加入交点集,再计算交点集的交集区域面积,再计算目标水平锚框与真实目标框的并点集,计算交点集与并点集之比得到目标水平锚框与真实目标框的交并比;fa为真实目标框与深度残差网络预测的回归框之间的交并比;u=|sa-fa|,为惩罚项,表示深度残差网络训练阶段的回归不稳定性,γ为对u影响进行加权的超参数。
步骤S300,根据所述匹配度从各所述目标水平锚框中筛选出正负样本,将所述正负样本输入检测回归网络,并通过预设回归损失函数训练所述检测回归网络;
针对现有定向目标回归框中存在的突变问题,本实施例提供的目标检测方法通过定向检测框回归损失函数(即本实施例中的预设回归损失函数)解决了现有回归导致与评估指标错位造成的检测精度偏低,因引入方向信息导致边界突变的问题,定向检测框回归损失函数为:
Figure BDA0003792048130000071
其中,Lreg为定向框回归损失,λ1为回归损失权重,Np为通过匹配度筛选得到的正样本,其中,将匹配度高于一定阈值的目标水平锚框作为正样本,其余作为负样本,对于未匹配到任何目标水平锚框的真实目标框,将与其匹配度最高的目标水平锚框作为候选正样本,lsm-l为Smooth L1 loss(现有的一种损失函数),t′i为预测的偏移矢量,ti为真实目标框的目标矢量,skewIOU为预测定向框与真实目标框的交并比,b为预测定向框的中心坐标,bgt为真实目标框的中心坐标,ρ2(b,bgt)为预测定向框的中心坐标与真实目标框的中心坐标之间的欧式距离的平方,c为预测定向框与真实目标框的最小外界矩形的对角线距离,每一个目标水平锚框都对应五维{x,y,w,h,θ}的位置回归向量,通过预设回归损失函数计算回归网络每次预测得到的回归框的损失,进而将正负样本输入检测回归网络,并通过预设回归损失函数训练检测回归网络。
步骤S400,在测试阶段,将所述待检测图像对应的所述特征融合模块的输出输入训练后的检测回归网络,根据预设非极大抑制阈值确定目标检测结果。
具体地,在目标检测后处理阶段,本实施例提供的目标检测方法构建了后处理模块,通过公式
Figure BDA0003792048130000072
确定待检测图像的目标检测结果,其中,si为检测回归网络的分类得分,skewIOU为两个定向检测框之间的交并比,ρ2(c,cgt)为两个定向检测框的中点间的欧式距离的平方,d为两个定向检测框距离最远点间的距离。当si≥ε时,分类得分为0;当si<ε时,分类得分为si。ε为本实施例中的预设非极大抑制阈值,将检测结果输入调整后检测结果筛选模块(RDIOU-NMS非极大值抑制模块),根据预设非极大抑制阈值确定目标检测结果。
本实施例中,在训练阶段,将待检测图像输入深度残差网络得到提取特征,将提取特征输入预设特征融合模块,在特征融合模块的各层输出特征上预设目标水平锚框;计算待检测图像对应的真实目标框与各目标水平锚框的匹配度;根据匹配度从各目标水平锚框中筛选出正负样本,将正负样本输入检测回归网络,并通过预设回归损失函数训练检测回归网络;在测试阶段,将待检测图像对应的特征融合模块的输出输入训练后的检测回归网络,根据预设非极大抑制阈值确定目标检测结果,通过在预设特征融合模块每一层输出上仅设置水平锚框,在训练阶段通过计算水平锚框与真实目标框的匹配度,筛选出正负样本,同时基于预设回归损失函数进行检测回归网络训练,提高了图像的定向目标检测精度。
在一个实施例中,本申请实施例提供的目标检测方法,还可以包括:
步骤S110,根据预设尺寸、预设长宽比和预设尺度,在所述特征融合模块的各层输出特征上设置目标水平锚框,其中,所述预设尺寸的类型数与所述输出特征的层数相同。
具体地,通过5种深度的残差网络ResNet101提取待检测图像的特征,将提取到的特征通过预设特征融合模块,在预设特征融合模块输出的5层的特征上设置目标水平锚框。在预设特征融合模块的5个输出层中分别设置五种尺寸(即本实施例中的预设尺寸)为[25,26,27,28,29]的目标水平锚框,其中,预设尺寸的类型数与预设特征融合模块输出的特征的层数相同,同时针对5个输出层中每一个特征层上的目标水平锚框,又设置{1:2,1:1,2:1}三种长宽比(即本实施例中的预设长宽比),以及
Figure BDA0003792048130000091
三种尺度(即本实施例中的预设尺度),每层每个特征点共9个目标水平锚框。
本实施例通过在预设特征融合模块输出的各层的特征上设置预定义的水平锚框,通过动态锚框匹配策略,提取高质量的正样本锚框。
在一个实施例中,本申请实施例提供的目标检测方法,还可以包括:
步骤S210,确定所述深度残差网络运行后通过筛选的目标水平锚框调整位置和方向得到的检测框,计算所述检测框与所述真实目标框的第一交并比;
步骤S220,获取预设超参数,计算所述真实目标框与各所述目标水平锚框的第二交并比;
步骤S230,根据所述预设超参数、所述第一交并比以及所述第二交并比,计算所述待检测图像对应的真实目标框与各所述目标水平锚框的匹配度。
具体地,本实施例通过以下公式:md=αsa+(1-α)fa-uγ计算待检测图像对应的真实目标框与各目标水平锚框的匹配度,其中,待检测图像对应的真实目标框是预先标记的目标框,上述md为匹配度,α为平衡sa影响的超参数;sa表示空间对齐的先验,其值相当于目标水平锚框与真实目标框的交并比,首先,得到目标水平锚框与真实目标框的交点集,并将一个框包含于另一个框的顶点加入交点集,再计算交点集的交集区域面积,再计算目标水平锚框与真实目标框的并点集,计算交点集与并点集之比得到目标水平锚框与真实目标框的交并比;fa为真实目标框与深度残差网络预测的回归框(即本实施例中的检测框)之间的交并比(即本实施例中的第一交并比),其中,检测框为检测回归网络运行后筛选出的目标水平锚框经调整位置和方向后得到的,因此,各目标水平锚框中存在检测框对应的水平锚框;u=|sa-fa|,为惩罚项,表示检测回归网络训练阶段的回归不稳定性,γ为对u影响进行加权的超参数,其中,α和γ是本实施例中的预设超参数。
本实施例通过真实目标框、目标水平锚框以及检测框相关的计算数据,得到真实目标框与各目标水平锚框的匹配度,以便进一步通过匹配度筛选各目标水平锚框中的正负样本,提高图像的目标检测精度。
在一个实施例中,本申请实施例提供的目标检测方法,还可以包括:
步骤S221,获取所述深度残差网络的当前更新次数以及预设迭代总次数;
步骤S222,根据所述当前更新次数与所述预设迭代总次数的比值,计算得到预设超参数。
具体地,上述实施例中的α在训练过程中是不断变化的,
Figure BDA0003792048130000101
其中,α的值与t有关,i为检测回归网络当前的更新次数(即本实施例中的当前更新次数),x为预设的训练迭代总次数(即本实施例中的预设迭代总次数),以下举例说明α值与t的关系,当t<0.1时,α=1;当0.1≤t<0.3时,α=1.35-3.5t;当0.3≤t时,α=0.3。根据当前更新次数与预设迭代总次数的比值(即上述t),计算得到预设超参数α。
本实施例通过深度残差网络的当前更新次数与预设迭代总次数的比值。计算预设超参数α,进而得到真实目标框与各目标水平锚框的匹配度,以便进一步通过匹配度筛选各目标水平锚框中的正负样本,提高图像的目标检测精度。
请参照图2,在一个实施例中,本申请实施例提供的目标检测方法,还可以包括:
步骤S310,将匹配度大于预设阈值的目标水平锚框作为正样本,将其余目标水平锚框作为负样本;
步骤S320,根据所述第一交并比、所述正样本、预设回归损失权重、预测偏移矢量、所述真实目标框的目标矢量和第一中心坐标、所述检测框的第二中心坐标,以及根据所述真实目标框和所述检测框确定的对角线距离,确定预设回归损失函数。
本实施例提供的目标检测方法通过上述预设回归损失函数解决了现有回归函数导致的与评估指标错位造成的检测精度偏低的问题,因引入方向信息导致边界突变的问题,预设回归损失函数为:
Figure BDA0003792048130000111
其中,Lreg为定向框回归损失,λ1为回归损失权重,Np为通过匹配度筛选得到的正样本(即本实施例中目标水平锚框中匹配度大于预设阈值的第一水平锚框),lsm-l为Smooth L1 loss,t′i为预测的偏移矢量(即本实施例中的预测偏移矢量),ti为真实目标框的目标矢量,skewIOU为预测定向框与真实目标框的交并比,b为预测定向框的中心坐标(即本实施例中的第二中心坐标),bgt为真实目标框的中心坐标(即本实施例中的第一中心坐标),ρ2(b,bgt)为预测定向框的中心坐标与真实目标框的中心坐标之间的欧式距离的平方,c为预测定向框与真实目标框的最小外界矩形的对角线距离,每一个目标水平锚框都对应五维{x,y,w,h,θ}的位置回归向量,通过预设回归损失函数计算检测回归网络每次预测得到的回归框的损失,进而将正负样本输入检测回归网络,并通过预设回归损失函数训练检测回归网络。
本实施例通过预设回归损失函数调整检测回归网络的相关参数,以使检测回归网络不断向着准确预测的方向调整,提高图像的目标检测精度。
在一个实施例中,本申请实施例提供的目标检测方法,还可以包括:
步骤S410,筛选各所述检测框中的第一检测框和第二检测框;
步骤S420,计算所述第一检测框和所述第二检测框的第三交并比,中间点距离以及最远点距离;
步骤S430,根据所述第三交并比,所述中间点距离,所述最远点距离以及预设非极大抑制阈值确定目标检测结果。
具体地,在目标检测后处理阶段,本实施例提供的目标检测方法构建了后处理模块,通过公式
Figure BDA0003792048130000121
确定待检测图像的目标检测结果,其中,si为深度残差网络的分类得分,skewIOU为两个定向检测框(即本实施例中的第一检测框和第二检测框)之间的交并比(即本实施例中的第三交并比),ρ(c,cgt)为两个定向检测框的中点间的欧式距离(即本实施例中的中间点距离),d为两个定向检测框距离最远点间的距离(即本实施例中的最远点距离)。当si≥ε时,分类得分为0;当si<ε时,分类得分为si。ε为本实施例中的预设非极大抑制阈值,将待检测图像输入调整后的深度残差网络,根据预设非极大抑制阈值确定目标检测结果。
本实施例通过定向检测框之间的交并比以及预设非极大抑制阈值,确定待检测图像的目标检测结果,提高图像的目标检测精度。
下面对本发明提供的目标检测装置进行描述,下文描述的目标检测装置与上文描述的目标检测方法可相互对应参照。
请参照图3,本发明还提供一种目标检测装置,包括:
目标水平锚框预设模块301,用于在训练阶段,将待检测图像输入深度残差网络得到提取特征,将所述提取特征输入预设特征融合模块,在所述特征融合模块的各层输出特征上预设目标水平锚框;
匹配度计算模块302,用于计算所述待检测图像对应的真实目标框与各所述预设目标水平锚框的匹配度;
检测回归网络训练模块303,用于根据所述匹配度从各所述目标水平锚框中筛选出正负样本,将所述正负样本输入检测回归网络,并通过预设回归损失函数训练所述检测回归网络;
检测结果确定模块304,用于在测试阶段,将所述待检测图像对应的所述特征融合模块的输出输入训练后的检测回归网络,根据预设非极大抑制阈值确定目标检测结果。
可选地,所述目标水平锚框预设模块,包括:
目标水平锚框预设单元,用于根据预设尺寸、预设长宽比和预设尺度,在所述特征融合模块的各层输出特征上预设目标水平锚框,其中,所述预设尺寸的类型数与所述输出特征的层数相同。
可选地,所述匹配度计算模块,包括:
第一交并比计算单元,用于确定所述深度残差网络运行后通过筛选的目标水平锚框调整位置和方向得到的检测框,计算所述检测框与所述真实目标框的第一交并比;
第二交并比计算单元,用于获取预设超参数,计算所述真实目标框与各所述目标水平锚框的第二交并比;
匹配度计算单元,用于根据所述预设超参数、所述第一交并比以及所述第二交并比,计算所述待检测图像对应的真实目标框与各所述目标水平锚框的匹配度。
可选地,所述第二交并比计算单元,包括:
第一获取单元,用于获取所述深度残差网络的当前更新次数以及预设迭代总次数;
预设超参数计算单元,用于根据所述当前更新次数与所述预设迭代总次数的比值,计算得到预设超参数。
可选地,所述目标检测装置,还包括:
正负样本筛选模块,用于将匹配度大于预设阈值的目标水平锚框作为正样本,将其余目标水平锚框作为负样本;
预设回归损失函数确定模块,用于根据所述第一交并比、所述正样本、预设回归损失权重、预测偏移矢量、所述真实目标框的目标矢量和第一中心坐标、所述检测框的第二中心坐标,以及根据所述真实目标框和所述检测框确定的对角线距离,确定预设回归损失函数。
可选地,所述检测结果确定模块,包括:
检测框筛选单元,用于筛选各所述检测框中的第一检测框和第二检测框;
计算单元,用于计算所述第一检测框和所述第二检测框的第三交并比,中间点距离以及最远点距离;
检测结果确定单元,用于根据所述第三交并比,所述中间点距离,所述最远点距离以及预设非极大抑制阈值确定目标检测结果。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行目标检测方法。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的目标检测方法。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的目标检测方法。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种目标检测方法,其特征在于,包括:
在训练阶段,将待检测图像输入深度残差网络得到提取特征,将所述提取特征输入预设特征融合模块,在所述特征融合模块的各层输出特征上预设目标水平锚框;
计算所述待检测图像对应的真实目标框与各所述预设目标水平锚框的匹配度;
根据所述匹配度从各所述目标水平锚框中筛选出正负样本,将所述正负样本输入检测回归网络,并通过预设回归损失函数训练所述检测回归网络;
在测试阶段,将所述待检测图像对应的所述特征融合模块的输出输入训练后的检测回归网络,根据预设非极大抑制阈值确定目标检测结果。
2.根据权利要求1所述的目标检测方法,其特征在于,所述在所述特征融合模块的各层输出特征上预设目标水平锚框的步骤包括:
根据预设尺寸、预设长宽比和预设尺度,在所述特征融合模块的各层输出特征上预设目标水平锚框,其中,所述预设尺寸的类型数与所述输出特征的层数相同。
3.根据权利要求1所述的目标检测方法,其特征在于,所述计算所述待检测图像对应的真实目标框与各所述目标水平锚框的匹配度的步骤包括:
确定所述深度残差网络运行后通过筛选的目标水平锚框调整位置和方向得到的检测框,计算所述检测框与所述真实目标框的第一交并比;
获取预设超参数,计算所述真实目标框与各所述预设目标水平锚框的第二交并比;
根据所述预设超参数、所述第一交并比以及所述第二交并比,计算所述待检测图像对应的真实目标框与各所述预设目标水平锚框的匹配度。
4.根据权利要求3所述的目标检测方法,其特征在于,所述获取预设超参数的步骤包括:
获取所述训练阶段的当前更新次数以及预设迭代总次数;
根据所述当前更新次数与所述预设迭代总次数的比值,计算得到预设超参数。
5.根据权利要求3所述的目标检测方法,其特征在于,所述根据所述匹配度从各所述预设目标水平锚框中筛选出正负样本,将所述正负样本输入检测回归网络,并通过预设回归损失函数训练所述检测回归网络的步骤之前包括:
将匹配度大于预设阈值的目标水平锚框作为正样本,将其余目标水平锚框作为负样本;
根据所述第一交并比、所述正样本、预设回归损失权重、预测偏移矢量、所述真实目标框的目标矢量和第一中心坐标、所述检测框的第二中心坐标,以及根据所述真实目标框和所述检测框确定的对角线距离,确定预设回归损失函数。
6.根据权利要求3所述的目标检测方法,其特征在于,所述将所述待检测图像对应的所述特征融合模块的输出输入训练后的检测回归网络,根据预设非极大抑制阈值确定目标检测结果的步骤包括:
筛选各所述检测框中的第一检测框和第二检测框;
计算所述第一检测框和所述第二检测框的第三交并比、中间点距离以及最远点距离;
根据所述第三交并比,所述中间点距离,所述最远点距离以及预设非极大抑制阈值确定目标检测结果。
7.一种目标检测装置,其特征在于,包括:
目标水平锚框预设模块,用于在训练阶段,将待检测图像输入深度残差网络得到提取特征,将所述提取特征输入预设特征融合模块,在所述特征融合模块的各层输出特征上预设目标水平锚框;
匹配度计算模块,用于计算所述待检测图像对应的真实目标框与各所述预设目标水平锚框的匹配度;
检测回归网络训练模块,用于根据所述匹配度从各所述预设目标水平锚框中筛选出正负样本,将所述正负样本输入检测回归网络,并通过预设回归损失函数训练所述检测回归网络;
检测结果确定模块,用于在测试阶段,将所述待检测图像对应的所述特征融合模块的输出输入训练后的检测回归网络,根据预设非极大抑制阈值确定目标检测结果。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述目标检测方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述目标检测方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述目标检测方法。
CN202210957790.7A 2022-08-10 2022-08-10 目标检测方法、装置、设备、介质及计算机程序产品 Pending CN115376007A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210957790.7A CN115376007A (zh) 2022-08-10 2022-08-10 目标检测方法、装置、设备、介质及计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210957790.7A CN115376007A (zh) 2022-08-10 2022-08-10 目标检测方法、装置、设备、介质及计算机程序产品

Publications (1)

Publication Number Publication Date
CN115376007A true CN115376007A (zh) 2022-11-22

Family

ID=84065320

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210957790.7A Pending CN115376007A (zh) 2022-08-10 2022-08-10 目标检测方法、装置、设备、介质及计算机程序产品

Country Status (1)

Country Link
CN (1) CN115376007A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116452580A (zh) * 2023-06-13 2023-07-18 山东古天电子科技有限公司 一种笔记本外观质量检测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116452580A (zh) * 2023-06-13 2023-07-18 山东古天电子科技有限公司 一种笔记本外观质量检测方法
CN116452580B (zh) * 2023-06-13 2023-09-01 山东古天电子科技有限公司 一种笔记本外观质量检测方法

Similar Documents

Publication Publication Date Title
CN111563473B (zh) 基于密集特征融合和像素级注意力的遥感舰船识别方法
CN111881918B (zh) 一种多尺度旋转船舶目标检测算法
CN113362329B (zh) 病灶检测模型的训练方法及识别图像中的病灶的方法
CN113920107A (zh) 一种基于改进yolov5算法的绝缘子破损检测方法
CN110716792B (zh) 一种目标检测器及其构建方法和应用
CN111126278A (zh) 针对少类别场景的目标检测模型优化与加速的方法
CN116539619B (zh) 产品缺陷检测方法、***、装置及存储介质
CN110889399A (zh) 基于深度学习的高分辨率遥感影像弱小目标检测方法
CN111325738A (zh) 一种用于横穿孔周边裂纹的智能检测方法及***
CN115376007A (zh) 目标检测方法、装置、设备、介质及计算机程序产品
CN112560614A (zh) 一种基于候选框特征修正的遥感图像目标检测方法及***
CN116152209A (zh) 一种耳机罩缺陷检测方法、装置、设备及存储介质
CN113487600A (zh) 一种特征增强尺度自适应感知船舶检测方法
CN116740758A (zh) 一种防止误判的鸟类图像识别方法及***
CN116543171A (zh) 目标检测方法、装置和电子设备
CN113128518B (zh) 基于孪生卷积网络和特征混合的sift误匹配检测方法
CN114565824A (zh) 基于全卷积网络的单阶段旋转舰船检测方法
CN113298007A (zh) 一种小样本sar图像目标识别方法
CN115690100B (zh) 半监督信号点检测模型训练方法、信号点检测方法和装置
CN113191996A (zh) 一种遥感影像变化检测方法、装置及其电子设备
CN111797940A (zh) 一种基于海洋搜救的图像识别方法及相关装置
CN115457391A (zh) 一种管道的漏磁内检测方法、***及相关组件
CN116012288A (zh) 一种用于支持辅助生殖决策的信息处理***
CN113344905B (zh) 一种带材跑偏量检测方法及***
CN115761606A (zh) 基于图像处理的箱体电能表识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination