CN109978043A - 一种目标检测方法及装置 - Google Patents

一种目标检测方法及装置 Download PDF

Info

Publication number
CN109978043A
CN109978043A CN201910209571.9A CN201910209571A CN109978043A CN 109978043 A CN109978043 A CN 109978043A CN 201910209571 A CN201910209571 A CN 201910209571A CN 109978043 A CN109978043 A CN 109978043A
Authority
CN
China
Prior art keywords
feature vector
dimension
sample
target
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910209571.9A
Other languages
English (en)
Other versions
CN109978043B (zh
Inventor
刘萌萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Technologies Co Ltd
Original Assignee
New H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Technologies Co Ltd filed Critical New H3C Technologies Co Ltd
Priority to CN201910209571.9A priority Critical patent/CN109978043B/zh
Publication of CN109978043A publication Critical patent/CN109978043A/zh
Application granted granted Critical
Publication of CN109978043B publication Critical patent/CN109978043B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/2163Partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种目标检测方法及装置;该方法包括:获取待检测图像的多个不同的第一特征向量以及第二特征向量;基于第一目标检测模型得到各个第一特征向量对应的第一目标检测结果,基于第二目标检测模型得到各个第二特征向量对应的第二目标检测结果;根据第一目标检测结果以及第二目标检测结果确定待检测图像的目标检测结果。由于第一特征向量对应的图像切割框的第一尺寸和与匹配的第二特征向量对应的图像切割框的第二尺寸不同,且维度尺寸最小的第一特征向量对应的第一尺寸与维度尺寸最小的第二特征向量对应的第二尺寸之间的差值小于设定阈值,使得第一目标检测结果和第二目标检测结果形成互补关系,从而提高目标检测结果的精度。

Description

一种目标检测方法及装置
技术领域
本申请涉及机器视觉技术领域,具体而言,涉及一种目标检测方法及装置。
背景技术
YOLO目标检测模型将目标检测作为回归问题求解,并基于一个单独的端到端(end-to-end)神经网络,完成从待检测图像的输入到目标位置和类别的输出。YOLO在对待检测图像中的目标进行检测的时候,会按照一定的图像切割框大小,将待检测图像切割成多个网格(grid cell),如果某个目标的中心落在某个grid cell中,就由该grid cell预测该目标。每个grid cell都会基于多个的大小不同的先验框,预测与先验框数量一致的回归框(bounding box),bounding box所对应的坐标,即为目标在待检测图像中的坐标。
但是YOLO对待检测图像切割成多个网格后,若某些目标的中心点落于网格的边缘位置,会造成漏检的问题,进而造成对待检测图像进行目标检测的结果存在一定误差。
发明内容
有鉴于此,本申请实施例的目的在于提供一种目标检测方法及装置,能够减少由于网格边缘部分漏检所造成的待检测图像的目标检测结果存在较大误差的问题,以提高目标检测的精度。
第一方面,本申请实施例提供了一种目标检测方法,包括:
获取待检测图像的多个不同的第一特征向量,以及与各个第一特征向量分别匹配的第二特征向量;其中,所述第一特征向量所对应的图像切割框的第一尺寸和与该第一特征向量匹配的第二特征向量所对应的图像切割框的第二尺寸不同,且多个第一特征向量中的维度尺寸最小的第一特征向量对应的第一尺寸与多个第二特征向量中的维度尺寸最小的第二特征向量对应的第二尺寸之间的差值小于设定阈值;所述维度尺寸是指目标维度对应的元素数量;
针对每个第一特征向量,基于与该第一特征向量对应的第一目标检测模型、与该第一特征向量对应的图像切割框、以及与该第一目标检测模型对应的先验框,对所述待检测图像进行目标检测,得到与该第一特征向量对应的第一目标检测结果,以及,
针对每个第二特征向量,基于与该第二特征向量对应的第二目标检测模型、与该第二特征向量对应的图像切割框、以及与该第二目标检测模型对应的先验框,对所述待检测图像进行目标检测,得到与该第二特征向量对应的第二目标检测结果;
根据所述第一目标检测结果以及所述第二目标检测结果,确定所述待检测图像的目标检测结果。
第二方面,本申请实施例还提供一种目标检测装置,该装置包括:
获取模块,用于获取待检测图像的多个不同的第一特征向量,以及与各个第一特征向量分别匹配的第二特征向量;其中,所述第一特征向量所对应的图像切割框的第一尺寸和与该第一特征向量匹配的第二特征向量所对应的图像切割框的第二尺寸不同,且多个第一特征向量中的维度维度尺寸最小的第一特征向量对应的第一尺寸与多个第二特征向量中的维度维度尺寸最小的第二特征向量对应的第二尺寸之间的差值小于设定阈值;所述维度维度尺寸是指目标维度对应的元素数量;
第一识别模块,用于针对每个第一特征向量,基于与该第一特征向量对应的第一目标检测模型、与该第一特征向量对应的图像切割框、以及与该第一目标检测模型对应的先验框,对所述待检测图像进行目标检测,得到与该第一特征向量对应的第一目标检测结果,以及,
第二识别模块,用于针对每个第二特征向量,基于与该第二特征向量对应的第二目标检测模型、与该第二特征向量对应的图像切割框、以及与该第二目标检测模型对应的先验框,对所述待检测图像进行目标检测,得到与该第二特征向量对应的第二目标检测结果;
第三识别模块,用于根据所述第一目标检测结果以及所述第二目标检测结果,确定所述待检测图像的目标检测结果。
第三方面,本申请实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
本公开实施例提供的目标检测方法中,在获取待检测图像的多个不同的第一特征向量,以及与各个第一特征向量匹配的第二特征向量后,使用第一目标检测模型、与第一特征向量对应的图像切割框,以及与该第一目标检测模型对应的先验框对待检测图像进行目标检测,得到第一目标检测结果;还使用第二目标检测模型、与第二特征向量对应的图像切割框以及与该第二目标检测模型对应的先验框对待检测图像进行目标检测,得到第二目标检测结果。由于第一特征向量所对应的图像切割框的第一尺寸和与该第一特征向量匹配的第二特征向量所对应的图像切割框的第二尺寸不同,且多个第一特征向量中的维度尺寸最小的第一特征向量对应的第一尺寸与多个第二特征向量中的维度尺寸最小的第二特征向量对应的第二尺寸之间的差值小于设定阈值,所以若某目标的中心落于第一网格的边缘位置,则其会落在第二网格中除边缘位置的其他位置,即使第一目标检测模型漏检了该目标,也会被第二目标检测模型检测到;若某目标的中心落于第二网格的边缘位置,则其会落在第一网络中除边缘位置的其他位置,即使第二目标检测模型漏检了该目标,也会被第一目标检测模型检测到;第一目标检测结果和第二目标检测结果形成互补关系,从而提高目标检测结果的精度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本申请实施例所提供的一种目标检测方法的流程图;
图2示出了本申请实施例所提供的目标检测方法中,获取第一特征向量的具体方法的流程图;
图3示出了本申请实施例所提供的目标检测方法中,一种获取第一特征向量和第二特征向量的神经网络的结构图;
图4示出了本申请实施例所提供的目标检测方法中,另一种获取第一特征向量和第二特征向量的神经网络的结构图;
图5示出了本申请实施例所提供的目标检测方法中,得到第一目标检测模型和第二目标检测模型的具体方法的流程图;
图6示出了本申请实施例所提供的目标检测装置的示意图;
图7示出了本申请实施例所提供的一种计算机设备的示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面将结合本申请中附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种目标检测方法进行详细介绍,本申请实施例所提供的目标检测方法的执行主体一般为具有运算能力的计算机设备。另外,本申请实施例中的第一目标检测模型和第二目标检测模型,可以是YOLO,也可以是其他类型的目标检测模型。这些模型具有以下特点:使用图像切割框对待处理图像进行切割,形成多个网格,并基于每个网格以及预设的先验框,回归得到目标在待检测图像中的位置信息。
实施例一
参见图1所示,为本申请实施例一提供的目标检测方法的流程图,方法包括步骤S101~S104,其中:
S101:获取待检测图像的多个不同的第一特征向量,以及与各个第一特征向量分别匹配的第二特征向量。
其中,所述第一特征向量所对应的图像切割框的第一尺寸和与该第一特征向量匹配的第二特征向量所对应的图像切割框的第二尺寸不同,且多个第一特征向量中的维度尺寸最小的第一特征向量对应的第一尺寸与多个第二特征向量中的维度尺寸最小的第二特征向量对应的第二尺寸之间的差值小于设定阈值;所述维度尺寸是指目标维度对应的元素数量。
在具体实施中,多个不同的第一特征向量,是指不同第一特征向量的第一维度的维度尺寸不同,且第二维度的维度尺寸也不同。
示例性的,第一特征向量有三个,三个第一特征向量在第一维度上的维度尺寸分别为:13、26和52;三个第一特征向量在第二维度上的维度尺寸分别为:13、26和52。则三个第一特征向量分别为:13*13*75、26*26*75、52*52*75。
类似的,不同的第二特征向量,是指不同第二特征向量的第一维度的维度尺寸不同,且第二维度的维度尺寸也不同。
示例性的,第二特征向量有三个,三个第二特征向量在第一维度上的维度尺寸分别为:14、28和56;三个第一特征向量在第二维度上的维度尺寸分别为:14、28和56。则三个第一特征向量分别为:14*14*75、28*28*75、56*56*75。
可以通过特征提取网络获取待检测图像的第一特征向量和第二特征向量。
具体地,待检测图像能够被表示为一个图向量;若待检测图像是二通道图像,例如二值图等,对应的图像量为二维向量;若待检测图像是三通道图像,则对应的图像量为三维向量。本申请实施例以图像量为三维向量为例对本申请实施例提供的目标检测方法加以说明。上述目标维度在本申请实施例中包括第一维度和第二维度。
特征提取网络中包括多个特征提取层,在将待检测图像的图向量输入至特征提取网络中后,针对特征提取层为特征提取网络中的第一层特征提取层的情况,该特征提取层对待检测图像的图向量进行卷积运算,得到与该特征提取层对应的特征向量,并将与该特征提取层对应的特征向量传递给下一层特征提取层。
针对特征向量提取层并非特征提取网络中的第一层特征提取层的情况,该特征提取层基于上一层特征提取层传递的特征向量进行卷积运算,得到与该特征提取层对应的特征向量;若该特征提取层并非最后一层特征提取层,则将得到的特征向量向下一层特征提取层传递。
将特征提取网络中的N个特征提取层作为目标特征提取层,每层目标特征提取层所对应的特征向量为中间特征向量。目标特征提取层的数量与第一特征向量的数量一致,且每个中间特征向量对应一个第一特征向量,且各个中间特征向量在第一维度和第二维度的维度尺寸,按照目标特征提取层的前后顺序递减。
例如,目标特征提取层有三层,按照目标特征提取层的前后顺序,分别对应的中间特征向量为:52*52*256、26*26*512、13*13*512。
在从每个目标特征提取层得到与各个目标特征提取层分别对应的中间特征向量后,根据各个中间特征向量确定与各个中间特征向量对应的第一特征向量和第二特征向量。
这里,第一特征向量和其匹配的第二特征向量可以基于同一中间特征向量得到的。这是由于,中间特征向量中实际上携带了待处理图像中的特征信息,且中间特征向量不同,所携带的待处理图像中的特征信息有所差异。为了降低该差异对第一目标检测结果和第二目标检测结果造成的影响,基于第一特征向量和匹配的第二特征向量形成第一目标检测结果和第二目标检测结果之间的互补关系,因此使用同一中间特征向量得到第一特征向量和其匹配的第二特征向量,使得得到的第一特征向量和匹配的第二特征向量所携带的特征信息也是较为接近的。
另外,基于同一中间特征向量得到第一特征向量和其匹配的第二特征向量,也可以减少特征提取层的运算,提升运算速度,并降低模型训练难度。
需要注意的是,第一特征向量和其匹配的第二特征向量可以基于不同的中间特征向量得到的。此时,可以设置两个特征提取网络,分别提取与第一特征向量对应的中间特征向量,以及与第二特征向量对应的中间特征向量。或者使用同一特征提取网络分别为第一特征向量和其匹配的第二特征向量分别提取不同的中间特征向量;此时,第一特征向量和其匹配的第二特征向量分别对应不同的目标特征提取层。
本申请仅针对于同一中间特征向量得到第一特征向量和其匹配的第二特征向量加以说明。
为了基于同一中间特征向量得到第一特征向量和第二特征向量,降低运算的复杂度,中间特征向量的第一维度和对应的第一特征向量的第一维度的维度尺寸相同,中间特征向量的第二维度和对应的第一中间特征向量的第二维度的维度尺寸相同;或者,中间特征向量的第一维度和对应的第二特征向量的第一维度的维度尺寸相同,中间特征向量的第二维度和对应的第二中间特征向量的第二维度的维度尺寸相同。
针对中间特征向量的第一维度和对应的第一特征向量的第一维度的维度尺寸相同,中间特征向量的第二维度和对应的第一中间特征向量的第二维度的维度尺寸相同的情况,可以采用下述方式得到第一特征向量:
(1):针对最后一层目标特征提取层M1对应的中间特征向量A1,根据该中间特征向量A1,获取与该中间特征向量对应的第一特征向量B1
此处,由于中间特征向量的第一维度和对应第一特征向量的第一维度的维度尺寸相同,中间特征向量的第二维度和对应的第一特征向量的第二维度的维度尺寸相同,因此只需要使用至少一个卷积层对最后一层目标特征提取层M1对应的中间特征向量A1进行卷积运算,实现对中间特征向量A1的第三维度维度尺寸的变换,得到与该中间特征向量A1对应的第一特征向量B1
(2)针对非最后一层的第i个目标特征提取层Mi得到的中间特征向量Ai,根据该中间特征向量Ai,以及该非最后一层目标特征提取层Mi之后的其他目标特征提取层M1~M(i-1)得到的中间特征向量A1~A(i-1),获取与该中间特征向量Ai对应的第一特征向量Bi
这里,目标特征提取层Mi是指从与特征提取网络中的最后一层目标特征提取层开始的第i个目标特征提取层,且i为大于1的整数。
此处,根据目标特征提取层Mi对应的中间特征向量Ai,以及目标特征提取层Mi之后的其他目标特征提取层M1~M(i-1)得到的中间特征向量A1~A(i-1),获取与该中间特征向量Ai对应的第一特征向量Bi,可以采用但不限于如下I和Ⅱ中任意一种。
I:基于当前的目标特征提取层(任意一层非最后一层的目标特征提取层)得到的中间特征向量,以及当前的目标提取层之后的其他目标特征提取层得到的中间特征向量,得到该当前的目标特征提取层的中间特征向量对应的第一特征向量时,建立当前的目标特征提取层的中间特征向量,以及当前的目标提取层之后的其他各个目标特征提取层得到的中间特征向量的直接关系。
示例性的,将目标特征提取层Mi之后的其他目标特征提取层M1~M(i-1)得到的中间特征向量A1~A(i-1),分别使用不同的卷积层进行维度变换,使得维度变换后得到特征向量A’1~A’(i-1)的第一维度的维度尺寸和第二维度的维度尺寸,分别与目标特征提取层Mi得到的中间特征向量Ai的第一维度的维度尺寸和第二维度的维度尺寸相同,然后将中间特征向量Ai以及特征向量A’1~A’(i-1)进行叠加,得到与该中间特征向量Ai对应的第一特征向量Bi
Ⅱ:基于当前的目标特征提取层得到的中间特征向量,以及当前的目标提取层之后的其他目标特征提取层得到的中间特征向量,得到该当前的目标特征提取层的中间特征向量对应的第一特征向量时,建立当前的目标特征提取层的中间特征向量,以及未和其具有相邻关系的其他目标特征提取层对应的中间特征向量之间的间接关系;并建立当前的目标特征提取层的中间特征向量,以及和其具有相邻关系的下一层目标特征提取层对应的中间特征向量之间的直接关系。
示例性的,参见图2所示,本申请实施例提供一种获取各个第一特征向量的神经网络,包括:特征提取网络、维度变换网络。
假设特征提取网络中的目标特征提取层包括:M1~M3,M1~M3在第一维度和第二维度的维度尺寸递增。目标特征提取层M1~M3对应的中间特征向量分别A1~A3。将目标特征提取层M1~M3对应的中间特征向量分别A1~A3。
M1为最后一层目标特征提取层,使用两个卷积层N11和N12对其进行卷积运算,得到与A1对应的第一特征向量B1。其中,卷积层N1对中间特征向量进行卷积运算得到的特征向量C1。
为了得到与中间特征向量A2对应的第一特征向量B2,首先将特征向量C1进行上采样,得到特征向量C1的变换特征向量C’1,此时,变换特征向量C’1的第一维度和第二维度的维度尺寸,分别与中间特征向量A2的第一维度和第二维度的维度尺寸相同。然后将中间特征向量A2与变换特征向量C’1进行叠加(叠加层P1),得到特征向量D2,并使用两个卷积层N21和N22对叠加后形成的特征向量D2进行卷积运算,得到与中间特征向量A2对应的第一特征向量B2。其中,卷积层N21对特征向量D2进行卷积运算得到特征向量C2。
为了得到与中间特征向量A3对应的第一特征向量B3,首先将特征向量C2进行上采样,得到特征向量C2的变换特征向量C’2,此时,变换特征向量C’2的第一维度和第二维度的维度尺寸,分别与中间特征向量A2的第一维度和第二维度的维度尺寸相同。然后将中间特征向量A3与变换特征向量C’2进行叠加(叠加层P2),得到特征向量D3,并使用两个卷积层N31和N32对叠加后形成的特征向量D3进行卷积运算,得到与中间特征向量A3对应的第一特征向量B3。
得到的第一特征向量B1、第一特征向量B2以及第一特征向量B3分别送入三个第一目标检测模型Q1~Q3,得到与第一目标检测模型Q1~Q3分别对应的第一目标检测结果。
这里需要注意的是,也可以根据实际的需要设计其他结构的特征提取网络以及维度变换网络。例如增加卷积层的数量,或者增加目标提取层的数量以及对应第一特征向量和第一目标检测模型的数量等。
针对中间特征向量的第一维度和对应的第一特征向量的第一维度的维度尺寸相同,中间特征向量的第二维度和对应的第一中间特征向量的第二维度的维度尺寸相同的情况,可以采用下述方式得到第二特征向量:
(1)可以采用与得到第一特征向量的方式得到与各个第一特征向量匹配的第二特征向量。
示例性的,可以参见下述图3所示,提供一种获取第一特征向量和第二特征向量的神经网络,包括:特征提取网络,第一维度变换网络、以及第二维度变换网络。
具体通过第一维度变换网络和第二维度变换网络得到第一特征向量和第二特征向量的过程与上述图2对应的实施例类似,在此不再赘述。
(2)由于第一特征向量所对应的图像切割框的第一尺寸和与该第一特征向量匹配的第二特征向量所对应的图像切割框的第二尺寸不同,且多个第一特征向量中的维度维度尺寸最小的第一特征向量对应的第一尺寸与多个第二特征向量中的维度维度尺寸最小的第二特征向量对应的第二尺寸之间的差值小于设定阈值。因此,在另外一种情况下,是不能直接由中间特征向量直接得到第二特征向量的。
为了能够由中间特征向量得到第二特征向量,需要首先将中间特征向量的各个维度进行填充操作,生成与各个中间特征向量分别对应的目标中间特征向量;
根据各个目标中间特征向量,生成与各个目标中间特征向量对应的第二特征向量;
目标中间特征向量与对应第二特征向量的第一维度和第二维度的维度尺寸均相同。
示例性的,可以参见下述图4所示,提供另一种获取第一特征向量和第二特征向量的神经网络,包括:特征提取网络,第一维度变换网络、以及第二维度变换网络以及维度填充网络。
其中,维度填充网络中,包括多个进行维度填充的维度填充模块。维度填充模块的与中间特征向量具有一一对应关系。各个中间特征向量在进入到对应的维度填充模块后,完成维度填充,得到与每个中间特征向量对应的目标中间特征向量;各个目标中间特征向量再进入第二维度变换网络,得到与各个第二目标检测网络分别对应的第二特征向量。
具体地,可以采用下述方式得到填充维度尺寸。
假设中间特征向量的维度尺寸为W*H,卷积核的维度尺寸为:F1*F2,顶部填充维度尺寸为:UP,底部填充维度尺寸为DP,左侧填充维度尺寸为LP,右侧填充维度尺寸为RP,卷积核的移动步长为S,待检测图像被卷积之后的维度尺寸Wnew*Hnew满足下述关系式:
基于上述两个公式,假设特征提取网络得到的三个中间与特征向量在第一维度和第二维度的维度尺寸大小分别为:13*13、26*26以及52*52。分别得到的第二特征向量在第一维度和第二维度的维度尺寸大小分别为:14*14、28*18以及56*56。假设卷积核的维度尺寸为3*3*f,步长为1,将对应数值代入上述公式中,得到的三个填充维度尺寸分别为:
LP+RP=UP+DP=4;
LP+RP=UP+DP=5;
LP+RP=UP+DP=7。
承接上述S101,本申请实施例提供的目标检测方法,在得到第一特征向量和第二特征向量后,还包括:
S102:针对每个第一特征向量,基于与该第一特征向量对应的第一目标检测模型、与该第一特征向量对应的图像切割框、以及与该第一目标检测模型对应的先验框,对待检测图像进行目标检测,得到与该第一特征向量对应的第一目标检测结果。
S103:针对每个第二特征向量,基于与该第二特征向量对应的第二目标检测模型、与该第二特征向量对应的图像切割框、以及与该第二目标检测模型对应的先验框,对待检测图像进行目标检测,得到与该第二特征向量对应的第二目标检测结果。
其中,上述S102和S103并无执行的先后顺序;可以同步执行也可以异步执行,但下述S104要在S102和S103均执行完毕之后执行。
具体地,本申请以将YOLO作为第一目标检测模型为例,对得到第一目标检测结果和第二目标检测结果的过程分别加以说明。
得到第一目标检测结果的过程包括:
a1:通过上述S101,得到三个第一特征向量,分别为:F11(feature map1):13*13*75;F2:26*26*75;F3:52*52*75。
这里需要注意的是,各个第一特征向量在各个维度的维度尺寸可以根据实际的需要进行调整,只要保证三个特征向量在第一维度和第二维度的维度尺寸规律从F11~F13依次为:n*n、2n*2n、4n*4n即可。各个第一特征向量在第三维度的维度尺寸均相同。
b1:针对第一特征向量F11,执行:将该第一特征向量F11,输入至与该第一特征向量F11对应的第一目标检测模型中,该第一目标检测模型按照对应的图像切割框的第一尺寸,将待检测图像分割成多个网格,网格的数量为:13*13;每个网格负责以一组大维度尺寸的先验框回归得到目标中心点落于该网格的目标信息。回归结果包括目标在待检测图像中的位置坐标以及目标的分类,也即与该第一特征向量F11对应的第一目标检测结果。
c1:针对第一特征向量F12,执行:将该第一特征向量F12,输入至与该第一特征向量F12对应的第一目标检测模型中,该第一目标检测模型按照对应的图像切割框的第一尺寸,将待检测图像分割成多个网格,网格的数量为:26*26;每个网格负责以一组中维度尺寸的先验框回归得到目标中心点落于该网格的目标信息。回归结果包括目标在待检测图像中的位置坐标以及目标的分类,也即与该第一特征向量F12对应的第一目标检测结果。
d1:针对第一特征向量F13,执行:将该第一特征向量F13,输入至与该第一特征向量F13对应的第一目标检测模型中,该第一目标检测模型按照对应的图像切割框的第一尺寸,将待检测图像分割成多个网格,网格的数量为:52*52;每个网格负责以一组小维度尺寸的先验框回归得到目标中心点落于该网格的目标信息。回归结果包括目标在待检测图像中的位置坐标以及目标的分类,也即与该第一特征向量F13对应的第一目标检测结果。
其中,上述b1~d1并无先后的执行顺序。
另外,在上述b1~d1中,大维度尺寸、中维度尺寸和小维度尺寸是三者相对而言。且在具体执行过程中,图像切割框的维度尺寸并非是预先设定的,但是根据图像切割框将待检测图像切分成多个网格的数量是预先设定的。网格的数量,与对应第一特征向量的第一维和第二维的维度尺寸数值的乘积一致。且在切分时,按照与对应第一特征向量的第一维和第二维的维度尺寸数值来进行切分。例如若第一特征向量的维度尺寸为13*13*75,则对应的网格数量为13*13;若一特征向量的维度尺寸为17*17*90,则对应的网格数量为17*17。对应的网格数量越少,则网格对应的面积也就越大,因此能够以更大维度尺寸的先验框回归得到第一目标检测结果。下述b2~d2情况类似,因此不再赘述。
得到第二目标检测结果的过程包括:
a2:通过上述S101,得到三个第一特征向量,分别为:F21(feature map 1):14*14*75;F2:28*28*75;F3:56*56*75。
这里需要注意的是,各个第二特征向量在各个维度的维度尺寸也可以根据实际的需要进行调整,只要保证三个第二特征向量在第一维度和第二维度的维度尺寸规律从F21~F23依次为:(n+m)*(n+m)、2(n+m)*2(n+m)、4(n+m)*4(n+m)即可。各个第二特征向量在第三维度的维度尺寸均相同。其中,m小于预设的阈值。
b2:针对第二特征向量F21,执行:将该第二特征向量F21,输入至与该第二特征向量F21对应的第二目标检测模型中,该第二目标检测模型按照对应的图像切割框的第二尺寸,将待检测图像分割成多个网格,网格的数量为:14*14;每个网格负责以一组大维度尺寸的先验框回归得到目标中心点落于该网格的目标信息。回归结果包括目标在待检测图像中的位置坐标以及目标的分类,也即与该第二特征向量F21对应的第二目标检测结果。
c2:针对第二特征向量F22,执行:将该第二特征向量F22,输入至与该第二特征向量F22对应的第二目标检测模型中,该第二目标检测模型按照对应的图像切割框的第二尺寸,将待检测图像分割成多个网格,网格的数量为:28*28;每个网格负责以一组中维度尺寸的先验框回归得到目标中心点落于该网格的目标信息。回归结果包括目标在待检测图像中的位置坐标以及目标的分类,也即与该第二特征向量F22对应的第二目标检测结果。
d2:针对第二特征向量F23,执行:将该第二特征向量F23,输入至与该第二特征向量F3对应的第二目标检测模型中,该第二目标检测模型按照对应的图像切割框的第二尺寸,将待检测图像分割成多个网格,网格的数量为:56*56;每个网格负责以一组小维度尺寸的先验框回归得到目标中心点落于该网格的目标信息。回归结果包括目标在待检测图像中的位置坐标以及目标的分类,也即与该第二特征向量F3对应的第二目标检测结果。
上述b2~d2并无先后的执行顺序。
此处,需要注意的是,m为维度维度尺寸最小的第一特征向量对应的第一尺寸与维度维度尺寸最小的第二特征向量对应的第二尺寸之间的差值,该差值可以根据实际的需要进行设定,除了可以设为1,还可以设为如0.5、1.6、2、2.3等。
在具体执行中,第一特征向量与匹配的第二特征向量所对应的先验框相同。另外,也可以将第一特征向量与匹配的第二特征向量所对应的先验框设置为不同,但是由于维度维度尺寸最小的第一特征向量对应的第一尺寸与维度维度尺寸最小的第二特征向量对应的第二尺寸之间的差值小于设定阈值,则意味着第一特征向量与匹配的第二特征向量对应的网格维度尺寸是比较接近的,因此也可以将将第一特征向量与匹配的第二特征向量所对应的先验框维度尺寸设置为接近。
承接上述S102和S103,在得到第一目标检测结果和第二目标检测结果后,本申请实施例提供的目标检测方法还包括:
S104:根据第一目标检测结果以及第二目标检测结果,确定待检测图像的目标检测结果。
在具体实施中,可以采用对第一目标检测结果和第二目标哦十倍结果进行查重优选的方式,得到待检测图像中正确且无重复的所有目标的目标检测结果。该目标检测结果包括:目标在待检测图像中的位置坐标以及目标的名称或者类别。
本公开实施例提供的目标检测方法中,在获取待检测图像的多个不同的第一特征向量,以及与各个第一特征向量匹配的第二特征向量后,使用第一目标检测模型、与第一特征向量对应的图像切割框,以及与该第一目标检测模型对应的先验框对待检测图像进行目标检测,得到第一目标检测结果;还使用第二目标检测模型、与第二特征向量对应的图像切割框以及与该第二目标检测模型对应的先验框对待检测图像进行目标检测,得到第二目标检测结果。由于第一特征向量所对应的图像切割框的第一尺寸和与该第一特征向量匹配的第二特征向量所对应的图像切割框的第二尺寸不同,且多个第一特征向量中的维度尺寸最小的第一特征向量对应的第一尺寸与多个第二特征向量中的维度尺寸最小的第二特征向量对应的第二尺寸之间的差值小于设定阈值,所以若某目标的中心落于第一网格的边缘位置,则其会落在第二网格中除边缘位置的其他位置,即使第一目标检测模型漏检了该目标,也会被第二目标检测模型检测到;若某目标的中心落于第二网格的边缘位置,则其会落在第一网络中除边缘位置的其他位置,即使第二目标检测模型漏检了该目标,也会被第一目标检测模型检测到;第一目标检测结果和第二目标检测结果形成互补关系,从而提高目标检测结果的精度。
实施例二
参见图5所示,本申请实施例还提供一种得到第一目标检测模型以及第二目标检测模型的具体方法,该方法包括:
S501:获取多张样本图像,以及与每张样本图像对应的目标标注信息。
其中,目标标注信息为人为为样本图像标注的目标的位置,以及与目标对应的名称或者分类。
S502:针对每张样本图像,获取该样本图像的多个不同的第一样本特征向量,以及与各个第一样本特征向量分别匹配的第二样本特征向量;其中,所述第一样本特征向量所对应的图像切割框的第一样本尺寸和与该第一样本特征向量匹配的第二样本特征向量所对应的图像切割框的第二样本尺寸不同,且多个第一样本特征向量中的维度尺寸最小的第一样本特征向量对应的第一样本尺寸与多个第二样本特征向量中的维度维度尺寸最小的第二样本特征向量对应的第二样本尺寸之间的差值小于所述设定阈值。
此处,可以采用下述方式获得第一样本特征向量以及与各个第一样本特征向量分别匹配的第二样本特征向量:
将待检测图像输入至基础特征提取网络中,从基础特征提取网络中的多个目标特征提取层,获取与各个目标特征提取层对应的样本中间特征向量;各个样本中间特征向量在第一维度和第二维度的维度尺寸,按照目标特征提取层的前后顺序递减;
根据各个样本中间特征向量,确定与各个样本中间特征向量对应的第一样本特征向量和第二样本特征向量;其中,第一样本特征向量和匹配的第二样本特征向量对应同一目标特征提取层;
样本中间特征向量与对应第一样本特征向量的第一维度和第二维度的维度尺寸均相同;或者,样本中间特征向量与对应的第二样本特征向量的第一维度和第二维度的维度尺寸均相同。
第一样本特征向量和第二样本特征向量的更加详细的获取方式,与第一特征向量和第二特征向量的具体获取方式类似,具体请参见上述实施例一的描述,在此不再赘述。
S503:针对每个第一样本特征向量,基于与该第一样本特征向量对应的第一基础检测模型、与该第一样本特征向量对应的图像切割框、以及与该第一基础检测模型对应的先验框,对样本图像进行目标检测,得到与该第一样本特征向量对应的第一样本目标检测结果。
此处,第一样本目标检测结果的具体获取方式与第一目标检测结果的获取方式相似,具体请参见上述实施例一的描述,在此不再赘述。
S504:针对每个第二样本特征向量,基于与该第二样本特征向量对应的第二基础检测模型、与该第二样本特征向量对应的图像切割框、以及与该第二基础检测模型对应的先验框,对样本图像进行目标检测,得到与该第二样本特征向量对应的第二样本目标检测结果。
此处,第二样本目标检测结果的具体获取方式与第二目标检测结果的获取方式相似,具体请参见上述实施例一的描述,在此不再赘述。
其中,上述S503和S504并无执行的先后顺序。
S505:根据第一样本目标检测结果以及第二样本目标检测结果,确定样本图像的样本目标检测结果。
此处,此处,样本目标检测结果的具体获取方式与目标检测结果的获取方式相似,具体请参见上述实施例一的描述,在此不再赘述。
S506:根据每张样本图像对应的样本目标检测结果以及目标标注信息,对第一基础检测模型以及第二基础检测模型进行训练,得到第一目标检测模型以及第二目标检测模型。
在具体实施中,根据每张样本图像对应的样本目标检测结果以及目标标注信息,对第一基础检测模型以及第二基础检测模型进行训练,就是要根据每张样本图像对应的样本目标检测结果以及目标标注信息之间的误差,对第一基础检测模型和第二基础检测模型的参数进行调整的过程,该调整过程在整体趋势上而言,是要使得每张样本图像对应的样本目标检测结果以及目标标注信息之间的误差越来越小,也即使得每张样本图像对应的样本目标检测结果越来越趋向于目标标注信息一致。
另外,该实施例还包括:根据每张样本图像对应的样本目标检测结果以及目标标注信息,对基础特征提取网络进行训练,得到特征提取网络。
此处,第一目标检测模型、第二目标检测模型以及特征提取网络是同步训练得到的。
另外,该实施例还包括:根据每张样本图像对应的样本目标检测结果以及目标标注信息,对基础维度变换网络进行训练,得到与上述实施例一中对应的基础维度变换网络。
通过上述模型训练过程,得到本申请实施例中的第一目标检测模型、第二目标检测模型、特征提取网络以及维度变换网络。
另外,维度变换网络和特征提取网络也可以是预先训练得到的。
将该第一目标检测模型、第二目标检测模型、特征提取网络以及基础维度变换网络构成目标检测模型,能够行提高目标检测结果的精度。
基于同一发明构思,本申请实施例中还提供了与目标检测方法对应的目标检测装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述目标检测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
实施例三
参照图6所示,为本申请实施例五提供的一种目标检测装置的示意图,所述装置包括:获取模块61、第一识别模块62、第二识别模块63以及第三识别模块64;其中,
所述获取模块61,用于获取待检测图像的多个不同的第一特征向量,以及与各个第一特征向量分别匹配的第二特征向量;其中,所述第一特征向量所对应的图像切割框的第一尺寸和与该第一特征向量匹配的第二特征向量所对应的图像切割框的第二尺寸不同,且多个第一特征向量中的维度尺寸最小的第一特征向量对应的第一尺寸与多个第二特征向量中的维度尺寸最小的第二特征向量对应的第二尺寸之间的差值小于设定阈值;所述维度尺寸是指目标维度对应的元素数量;
第一识别模块62,用于针对每个第一特征向量,基于与该第一特征向量对应的第一目标检测模型、与该第一特征向量对应的图像切割框、以及与该第一目标检测模型对应的先验框,对所述待检测图像进行目标检测,得到与该第一特征向量对应的第一目标检测结果,以及
第二识别模块63,用于针对每个第二特征向量,基于与该第二特征向量对应的第二目标检测模型、与该第二特征向量对应的图像切割框、以及与该第二目标检测模型对应的先验框,对所述待检测图像进行目标检测,得到与该第二特征向量对应的第二目标检测结果;
第三识别模块64,用于根据所述第一目标检测结果以及所述第二目标检测结果,确定所述待检测图像的目标检测结果。
一种可选实施方式中,所述第一特征向量与匹配的第二特征向量所对应的先验框相同。
一种可选实施方式中,所述目标维度包括第一维度和第二维度;所述获取模块61,用于采用下述方式获取待检测图像的多个不同的第一特征向量,以及与各个第一特征向量分别匹配的第二特征向量:
将所述待检测图像输入至预先训练的特征提取网络中,从所述特征提取网络中的多个目标特征提取层,获取与各个所述目标特征提取层对应的中间特征向量;各个所述中间特征向量在第一维度和第二维度的维度尺寸,按照所述目标特征提取层的前后顺序递减;
根据各个所述中间特征向量,确定与各个所述中间特征向量对应的所述第一特征向量和第二特征向量;其中,第一特征向量和匹配的第二特征向量对应同一目标特征提取层;
所述中间特征向量与对应第一特征向量的第一维度和第二维度的维度尺寸均相同;或者,所述中间特征向量与对应的第二特征向量的第一维度和第二维度的维度尺寸均相同。
一种可选实施方式中,针对所述中间特征向量与对应第一特征向量的第一维度和第二维度的维度尺寸均相同的情况,所述获取模块61,用于采用下述方式确定与各个所述中间特征向量对应的所述第一特征向量,包括:
针对最后一层所述目标特征提取层对应的中间特征向量,根据该中间特征向量,获取与该中间特征向量对应的第一特征向量;
针对非最后一层所述目标特征提取层得到的中间特征向量,根据该中间特征向量,以及该非最后一层所述目标特征提取层之后的其他目标特征提取层得到的中间特征向量,获取与该中间特征向量对应的第一特征向量。
一种可选实施方式中,针对所述中间特征向量与对应第一特征向量的第一维度和第二维度的维度尺寸均相同的情况,所述获取模块61,用于采用下述方式获取与各个所述中间特征向量对应的第二特征向量:
对各个所述中间特征向量进行填充操作,生成与各个所述中间特征向量分别对应的目标中间特征向量;
根据各个所述目标中间特征向量,生成与各个所述目标中间特征向量对应的所述第二特征向量;
所述目标中间特征向量与对应第二特征向量的第一维度和第二维度的维度尺寸均相同。
一种可选实施方式中,所述第一目标检测模型和所述第二目标检测模型均为YOLO目标检测模型。
一种可选实施方式中,还包括:模型训练模块65,用于采用下述方式得到第一目标检测模型以及第二目标检测模型:
获取多张样本图像,以及与每张所述样本图像对应的目标标注信息;
针对每张样本图像,获取该样本图像的多个不同的第一样本特征向量,以及与各个第一样本特征向量分别匹配的第二样本特征向量;其中,所述第一样本特征向量所对应的图像切割框的第一样本尺寸和与该第一样本特征向量匹配的第二样本特征向量所对应的图像切割框的第二样本尺寸不同,且多个第一样本特征向量中的维度尺寸最小的第一样本特征向量对应的第一样本尺寸与多个第二样本特征向量中的维度维度尺寸最小的第二样本特征向量对应的第二样本尺寸之间的差值小于所述设定阈值;
针对每个第一样本特征向量,基于与该第一样本特征向量对应的第一基础检测模型、与该第一样本特征向量对应的图像切割框、以及与该第一基础检测模型对应的先验框,对所述样本图像进行目标检测,得到与该第一样本特征向量对应的第一样本目标检测结果,以及
针对每个第二样本特征向量,基于与该第二样本特征向量对应的第二基础检测模型、与该第二样本特征向量对应的图像切割框、以及与该第二基础检测模型对应的先验框,对所述样本图像进行目标检测,得到与该第二样本特征向量对应的第二样本目标检测结果;
根据所述第一样本目标检测结果以及所述第二样本目标检测结果,确定所述样本图像的样本目标检测结果;
根据每张所述样本图像对应的样本目标检测结果以及目标标注信息,对所述第一基础检测模型以及所述第二基础检测模型进行训练,得到第一目标检测模型以及所述第二目标检测模型。
一种可选实施方式中,所述模型训练模块65,用于采用下述方式针对每张样本图像,获取该样本图像的多个不同的第一样本特征向量,以及与各个第一样本特征向量分别匹配的第二样本特征向量:
将所述待检测图像输入至基础特征提取网络中,从所述基础特征提取网络中的多个目标特征提取层,获取与各个所述目标特征提取层对应的样本中间特征向量;各个所述样本中间特征向量在第一维度和第二维度的维度尺寸,按照所述目标特征提取层的前后顺序递减;
根据各个所述样本中间特征向量,确定与各个所述样本中间特征向量对应的所述第一样本特征向量和第二样本特征向量;其中,第一样本特征向量和匹配的第二样本特征向量对应同一目标特征提取层;
所述样本中间特征向量与对应第一样本特征向量的第一维度和第二维度的维度尺寸均相同;或者,所述样本中间特征向量与对应的第二样本特征向量的第一维度和第二维度的维度尺寸均相同。
一种可选实施方式中,所述模型训练模块65,还用于:根据每张所述样本图像对应的样本目标检测结果以及目标标注信息,对所述基础特征提取网络进行训练,得到所述特征提取网络。
实施例四
本申请实施例还提供了一种计算机设备700,如图7所示,为本申请实施例提供的计算机设备700结构示意图,包括:
处理器71、存储器72、和总线73;存储器72用于存储执行指令,包括内存721和外部存储器722;这里的内存721也称内存储器,用于暂时存放处理器71中的运算数据,以及与硬盘等外部存储器722交换的数据,处理器71通过内存721与外部存储器722进行数据交换,当所述计算机设备700运行时,所述处理器71与所述存储器72之间通过总线73通信,使得所述处理器71在用户态执行以下指令:
获取待检测图像的多个不同的第一特征向量,以及与各个第一特征向量分别匹配的第二特征向量;其中,所述第一特征向量所对应的图像切割框的第一尺寸和与该第一特征向量匹配的第二特征向量所对应的图像切割框的第二尺寸不同,且多个第一特征向量中的维度尺寸最小的第一特征向量对应的第一尺寸与多个第二特征向量中的维度尺寸最小的第二特征向量对应的第二尺寸之间的差值小于设定阈值;所述维度尺寸是指目标维度对应的元素数量;
针对每个第一特征向量,基于与该第一特征向量对应的第一目标检测模型、与该第一特征向量对应的图像切割框、以及与该第一目标检测模型对应的先验框,对所述待检测图像进行目标检测,得到与该第一特征向量对应的第一目标检测结果,以及
针对每个第二特征向量,基于与该第二特征向量对应的第二目标检测模型、与该第二特征向量对应的图像切割框、以及与该第二目标检测模型对应的先验框,对所述待检测图像进行目标检测,得到与该第二特征向量对应的第二目标检测结果;
根据所述第一目标检测结果以及所述第二目标检测结果,确定所述待检测图像的目标检测结果。
一种可能的实施方式中,处理器71执行的指令中,所述第一特征向量与匹配的第二特征向量所对应的先验框相同。
一种可能的实施方式中,处理器71执行的指令中,所述目标维度包括第一维度和第二维度;获取待检测图像的多个不同的第一特征向量,以及与各个第一特征向量分别匹配的第二特征向量,包括:
将所述待检测图像输入至预先训练的特征提取网络中,从所述特征提取网络中的多个目标特征提取层,获取与各个所述目标特征提取层对应的中间特征向量;各个所述中间特征向量在第一维度和第二维度的维度尺寸,按照所述目标特征提取层的前后顺序递减;
根据各个所述中间特征向量,确定与各个所述中间特征向量对应的所述第一特征向量和第二特征向量;其中,第一特征向量和匹配的第二特征向量对应同一目标特征提取层;
所述中间特征向量与对应第一特征向量的第一维度和第二维度的维度尺寸均相同;或者,所述中间特征向量与对应的第二特征向量的第一维度和第二维度的维度尺寸均相同。
一种可能的实施方式中,处理器71执行的指令中,针对所述中间特征向量与对应第一特征向量的第一维度和第二维度的维度尺寸均相同的情况,根据各个所述中间特征向量,确定与各个所述中间特征向量对应的所述第一特征向量,包括:
针对最后一层所述目标特征提取层对应的中间特征向量,根据该中间特征向量,获取与该中间特征向量对应的第一特征向量;
针对非最后一层所述目标特征提取层得到的中间特征向量,根据该中间特征向量,以及该非最后一层所述目标特征提取层之后的其他目标特征提取层得到的中间特征向量,获取与该中间特征向量对应的第一特征向量。
一种可能的实施方式中,处理器71执行的指令中,针对所述中间特征向量与对应第一特征向量的第一维度和第二维度的维度尺寸均相同的情况,根据各个所述中间特征向量,获取与各个所述中间特征向量对应的第二特征向量,包括:
对各个所述中间特征向量进行填充操作,生成与各个所述中间特征向量分别对应的目标中间特征向量;
根据各个所述目标中间特征向量,生成与各个所述目标中间特征向量对应的所述第二特征向量;
所述目标中间特征向量与对应第二特征向量的第一维度和第二维度的维度尺寸均相同。
一种可能的实施方式中,处理器71执行的指令中,所述第一目标检测模型和所述第二目标检测模型均为YOLO目标检测模型。
一种可能的实施方式中,处理器71执行的指令中,采用下述方式得到第一目标检测模型以及第二目标检测模型:
获取多张样本图像,以及与每张所述样本图像对应的目标标注信息;
针对每张样本图像,获取该样本图像的多个不同的第一样本特征向量,以及与各个第一样本特征向量分别匹配的第二样本特征向量;其中,所述第一样本特征向量所对应的图像切割框的第一样本尺寸和与该第一样本特征向量匹配的第二样本特征向量所对应的图像切割框的第二样本尺寸不同,且维度维度尺寸最小的第一样本特征向量对应的第二样本尺寸与维度维度尺寸最小的第二样本特征向量对应的第二样本尺寸之间的差值小于所述设定阈值;
针对每个第一样本特征向量,基于与该第一样本特征向量对应的第一基础检测模型、与该第一样本特征向量对应的图像切割框、以及与该第一基础检测模型对应的先验框,对所述样本图像进行目标检测,得到与该第一样本特征向量对应的第一样本目标检测结果,以及
针对每个第二样本特征向量,基于与该第二样本特征向量对应的第二基础检测模型、与该第二样本特征向量对应的图像切割框、以及与该第二基础检测模型对应的先验框,对所述样本图像进行目标检测,得到与该第二样本特征向量对应的第二样本目标检测结果;
根据所述第一样本目标检测结果以及所述第二样本目标检测结果,确定所述样本图像的样本目标检测结果;
根据每张所述样本图像对应的样本目标检测结果以及目标标注信息,对所述第一基础检测模型以及所述第二基础检测模型进行训练,得到第一目标检测模型以及所述第二目标检测模型。
一种可能的实施方式中,处理器71执行的指令中,所述针对每张样本图像,获取该样本图像的多个不同的第一样本特征向量,以及与各个第一样本特征向量分别匹配的第二样本特征向量,包括:
将所述待检测图像输入至基础特征提取网络中,从所述基础特征提取网络中的多个目标特征提取层,获取与各个所述目标特征提取层对应的样本中间特征向量;各个所述样本中间特征向量在第一维度和第二维度的维度尺寸,按照所述目标特征提取层的前后顺序递减;
根据各个所述样本中间特征向量,确定与各个所述样本中间特征向量对应的所述第一样本特征向量和第二样本特征向量;其中,第一样本特征向量和匹配的第二样本特征向量对应同一目标特征提取层;
所述样本中间特征向量与对应第一样本特征向量的第一维度和第二维度的维度尺寸均相同;或者,所述样本中间特征向量与对应的第二样本特征向量的第一维度和第二维度的维度尺寸均相同。
一种可能的实施方式中,处理器71执行的指令中,该方法还包括:根据每张所述样本图像对应的样本目标检测结果以及目标标注信息,对所述基础特征提取网络进行训练,得到所述特征提取网络。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器71运行时执行上述目标检测方法的步骤。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘等,该存储介质上的计算机程序被运行时,能够执行上述目标检测方法,能够减少由于网格边缘部分漏检所造成的待检测图像的目标检测结果存在较大误差的问题,以提高目标检测的精度。
本申请实施例所提供的目标检测方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (11)

1.一种目标检测方法,其特征在于,包括:
获取待检测图像的多个不同的第一特征向量,以及与各个第一特征向量分别匹配的第二特征向量;其中,所述第一特征向量所对应的图像切割框的第一尺寸和与该第一特征向量匹配的第二特征向量所对应的图像切割框的第二尺寸不同,且多个第一特征向量中的维度尺寸最小的第一特征向量对应的第一尺寸与多个第二特征向量中的维度尺寸最小的第二特征向量对应的第二尺寸之间的差值小于设定阈值;所述维度尺寸是指目标维度对应的元素数量;
针对每个第一特征向量,基于与该第一特征向量对应的第一目标检测模型、与该第一特征向量对应的图像切割框、以及与该第一目标检测模型对应的先验框,对所述待检测图像进行目标检测,得到与该第一特征向量对应的第一目标检测结果,以及
针对每个第二特征向量,基于与该第二特征向量对应的第二目标检测模型、与该第二特征向量对应的图像切割框、以及与该第二目标检测模型对应的先验框,对所述待检测图像进行目标检测,得到与该第二特征向量对应的第二目标检测结果;
根据所述第一目标检测结果以及所述第二目标检测结果,确定所述待检测图像的目标检测结果。
2.根据权利要求1所述的目标检测方法,其特征在于,所述第一特征向量与匹配的第二特征向量所对应的先验框相同。
3.根据权利要求1所述的目标检测方法,其特征在于,所述目标维度包括第一维度和第二维度;所述获取待检测图像的多个不同的第一特征向量,以及与各个第一特征向量分别匹配的第二特征向量,包括:
将所述待检测图像输入至预先训练的特征提取网络中,从所述特征提取网络中的多个目标特征提取层,获取与各个所述目标特征提取层对应的中间特征向量;各个所述中间特征向量在第一维度和第二维度的维度尺寸,按照所述目标特征提取层的前后顺序递减;
根据各个所述中间特征向量,确定与各个所述中间特征向量对应的所述第一特征向量和匹配的第二特征向量;其中,第一特征向量和匹配的第二特征向量对应同一目标特征提取层;
所述中间特征向量与对应第一特征向量的第一维度和第二维度的维度尺寸均相同;或者,所述中间特征向量与对应的第二特征向量的第一维度和第二维度的维度尺寸均相同。
4.根据权利要求3所述的目标检测方法,其特征在于,针对所述中间特征向量与对应第一特征向量的第一维度和第二维度的维度尺寸均相同的情况,根据各个所述中间特征向量,确定与各个所述中间特征向量对应的所述第一特征向量,包括:
针对最后一层所述目标特征提取层对应的中间特征向量,根据该中间特征向量,获取与该中间特征向量对应的第一特征向量;
针对非最后一层所述目标特征提取层得到的中间特征向量,根据该中间特征向量,以及该非最后一层所述目标特征提取层之后的其他目标特征提取层得到的中间特征向量,获取与该中间特征向量对应的第一特征向量。
5.根据权利要求3所述的目标检测方法,其特征在于,针对所述中间特征向量与对应第一特征向量的第一维度和第二维度的维度尺寸均相同的情况,根据各个所述中间特征向量,获取与各个所述中间特征向量对应的第二特征向量,包括:
对各个所述中间特征向量进行填充操作,生成与各个所述中间特征向量分别对应的目标中间特征向量;
根据各个所述目标中间特征向量,生成与各个所述目标中间特征向量对应的所述第二特征向量;
所述目标中间特征向量与对应第二特征向量的第一维度和第二维度的维度尺寸均相同。
6.根据权利要求1所述的目标检测方法,其特征在于,所述第一目标检测模型和所述第二目标检测模型均为YOLO目标检测模型。
7.根据权利要求1所述的目标检测方法,其特征在于,采用下述方式得到第一目标检测模型以及第二目标检测模型:
获取多张样本图像,以及与每张所述样本图像对应的目标标注信息;
针对每张样本图像,获取该样本图像的多个不同的第一样本特征向量,以及与各个第一样本特征向量分别匹配的第二样本特征向量;其中,所述第一样本特征向量所对应的图像切割框的第一样本尺寸和与该第一样本特征向量匹配的第二样本特征向量所对应的图像切割框的第二样本尺寸不同,且多个第一样本特征向量中的维度尺寸最小的第一样本特征向量对应的第一样本尺寸与多个第二样本特征向量中的维度维度尺寸最小的第二样本特征向量对应的第二样本尺寸之间的差值小于所述设定阈值;
针对每个第一样本特征向量,基于与该第一样本特征向量对应的第一基础检测模型、与该第一样本特征向量对应的图像切割框、以及与该第一基础检测模型对应的先验框,对所述样本图像进行目标检测,得到与该第一样本特征向量对应的第一样本目标检测结果,以及
针对每个第二样本特征向量,基于与该第二样本特征向量对应的第二基础检测模型、与该第二样本特征向量对应的图像切割框、以及与该第二基础检测模型对应的先验框,对所述样本图像进行目标检测,得到与该第二样本特征向量对应的第二样本目标检测结果;
根据所述第一样本目标检测结果以及所述第二样本目标检测结果,确定所述样本图像的样本目标检测结果;
根据每张所述样本图像对应的样本目标检测结果以及目标标注信息,对所述第一基础检测模型以及所述第二基础检测模型进行训练,得到第一目标检测模型以及所述第二目标检测模型。
8.根据权利要求7所述的目标检测方法,其特征在于,所述目标维度包括第一维度和第二维度;所述针对每张样本图像,获取该样本图像的多个不同的第一样本特征向量,以及与各个第一样本特征向量分别匹配的第二样本特征向量,包括:
将所述待检测图像输入至基础特征提取网络中,从所述基础特征提取网络中的多个目标特征提取层,获取与各个所述目标特征提取层对应的样本中间特征向量;各个所述样本中间特征向量在第一维度和第二维度的维度尺寸,按照所述目标特征提取层的前后顺序递减;
根据各个所述样本中间特征向量,确定与各个所述样本中间特征向量对应的所述第一样本特征向量和匹配的第二样本特征向量;其中,第一样本特征向量和匹配的第二样本特征向量对应同一目标特征提取层;
所述样本中间特征向量与对应第一样本特征向量的第一维度和第二维度的维度尺寸均相同;或者,所述样本中间特征向量与对应的第二样本特征向量的第一维度和第二维度的维度尺寸均相同。
9.根据权利要求8所述的目标检测方法,其特征在于,该方法还包括:
根据每张所述样本图像对应的样本目标检测结果以及目标标注信息,对所述基础特征提取网络进行训练,得到所述特征提取网络。
10.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至9任一所述的目标检测方法的步骤。
11.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至9任意一项所述的目标检测方法的步骤。
CN201910209571.9A 2019-03-19 2019-03-19 一种目标检测方法及装置 Active CN109978043B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910209571.9A CN109978043B (zh) 2019-03-19 2019-03-19 一种目标检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910209571.9A CN109978043B (zh) 2019-03-19 2019-03-19 一种目标检测方法及装置

Publications (2)

Publication Number Publication Date
CN109978043A true CN109978043A (zh) 2019-07-05
CN109978043B CN109978043B (zh) 2020-11-10

Family

ID=67079564

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910209571.9A Active CN109978043B (zh) 2019-03-19 2019-03-19 一种目标检测方法及装置

Country Status (1)

Country Link
CN (1) CN109978043B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609794A (zh) * 2019-09-12 2019-12-24 中国联合网络通信集团有限公司 页面检测方法及装置
CN112989992A (zh) * 2021-03-09 2021-06-18 北京百度网讯科技有限公司 目标检测方法、装置、路侧设备和云控平台

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170147905A1 (en) * 2015-11-25 2017-05-25 Baidu Usa Llc Systems and methods for end-to-end object detection
CN106971178A (zh) * 2017-05-11 2017-07-21 北京旷视科技有限公司 行人检测和再识别的方法及装置
CN107529665A (zh) * 2017-07-06 2018-01-02 新华三技术有限公司 车辆追踪方法及装置
CN107563392A (zh) * 2017-09-07 2018-01-09 西安电子科技大学 使用OpenCL加速的YOLO目标检测方法
CN108875763A (zh) * 2017-05-17 2018-11-23 北京旷视科技有限公司 目标检测方法和目标检测装置
CN108875600A (zh) * 2018-05-31 2018-11-23 银江股份有限公司 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质
CN109325504A (zh) * 2018-09-07 2019-02-12 中国农业大学 一种水下海参识别方法及***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170147905A1 (en) * 2015-11-25 2017-05-25 Baidu Usa Llc Systems and methods for end-to-end object detection
CN106971178A (zh) * 2017-05-11 2017-07-21 北京旷视科技有限公司 行人检测和再识别的方法及装置
CN108875763A (zh) * 2017-05-17 2018-11-23 北京旷视科技有限公司 目标检测方法和目标检测装置
CN107529665A (zh) * 2017-07-06 2018-01-02 新华三技术有限公司 车辆追踪方法及装置
CN107563392A (zh) * 2017-09-07 2018-01-09 西安电子科技大学 使用OpenCL加速的YOLO目标检测方法
CN108875600A (zh) * 2018-05-31 2018-11-23 银江股份有限公司 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质
CN109325504A (zh) * 2018-09-07 2019-02-12 中国农业大学 一种水下海参识别方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WALEED ALI, SHERIF ABDELKARIM: ""YOLO3D: End-to-end real-time 3D Oriented Object Bounding Box Detection from LiDAR Point Cloud"", 《ARXIV》 *
施辉,陈先桥,杨英: ""改进YOLO v3的安全帽佩戴检测方法"", 《计算机工程与应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110609794A (zh) * 2019-09-12 2019-12-24 中国联合网络通信集团有限公司 页面检测方法及装置
CN110609794B (zh) * 2019-09-12 2023-04-28 中国联合网络通信集团有限公司 页面检测方法及装置
CN112989992A (zh) * 2021-03-09 2021-06-18 北京百度网讯科技有限公司 目标检测方法、装置、路侧设备和云控平台
CN112989992B (zh) * 2021-03-09 2023-12-15 阿波罗智联(北京)科技有限公司 目标检测方法、装置、路侧设备和云控平台

Also Published As

Publication number Publication date
CN109978043B (zh) 2020-11-10

Similar Documents

Publication Publication Date Title
CN109816012B (zh) 一种融合上下文信息的多尺度目标检测方法
Wang et al. G2DeNet: Global Gaussian distribution embedding network and its application to visual recognition
EP2811424B1 (en) Method and apparatus for training an estimator for estimating a pose of an articulated object
CN112801169B (zh) 一种基于改进yolo算法的伪装目标检测方法、***、装置及存储介质
CN108596053A (zh) 一种基于ssd和车辆姿态分类的车辆检测方法和***
CN110674741B (zh) 一种基于双通道特征融合的机器视觉中手势识别方法
CN109583483A (zh) 一种基于卷积神经网络的目标检测方法和***
CN111625667A (zh) 一种基于复杂背景图像的三维模型跨域检索方法及***
US9390320B2 (en) Performing hand gesture recognition using 2D image data
Sahillioglu et al. 3d shape correspondence by isometry-driven greedy optimization
Jiang et al. Dual attention mobdensenet (damdnet) for robust 3d face alignment
EP3905194A1 (en) Pose estimation method and apparatus
CN113096234A (zh) 利用多张彩色图片生成三维网格模型的方法及装置
CN110223298A (zh) 基于点云局部结构的语义分割改进算法
CN106295613A (zh) 一种无人机目标定位方法及***
CN108182449A (zh) 一种高光谱图像分类方法
CN111967464B (zh) 一种基于深度学习的弱监督目标定位方法
Byrod et al. Improving numerical accuracy of gröbner basis polynomial equation solvers
CN105005760A (zh) 一种基于有限混合模型的行人再识别方法
CN106127179A (zh) 基于自适应分层多尺度的高光谱遥感图像分类方法
CN110503113A (zh) 一种基于低秩矩阵恢复的图像显著性目标检测方法
CN107016319A (zh) 一种关键点定位方法和装置
CN107301643A (zh) 基于鲁棒稀疏表示与拉普拉斯正则项的显著目标检测方法
CN109978043A (zh) 一种目标检测方法及装置
CN114067075A (zh) 基于生成对抗网络的点云补全方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant