CN111178126A - 目标检测方法、装置、计算机设备和存储介质 - Google Patents
目标检测方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN111178126A CN111178126A CN201911138793.2A CN201911138793A CN111178126A CN 111178126 A CN111178126 A CN 111178126A CN 201911138793 A CN201911138793 A CN 201911138793A CN 111178126 A CN111178126 A CN 111178126A
- Authority
- CN
- China
- Prior art keywords
- target
- detection
- detection frame
- detected
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/07—Target detection
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Traffic Control Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种目标检测方法、装置、计算机设备和存储介质。所述方法包括:将包括待检测目标的目标图像输入至第一检测模型,确定所述待检测目标所对应的第一检测框和所述待检测目标的目标部位所对应的第二检测框;将所述目标图像输入至第二检测模型,确定所述待检测目标所对应的第三检测框;对所述第一检测框和所述第三检测框进行匹配,确定目标检测框;将关联后的所述目标检测框和所述第二检测框确定为所述待检测目标的检测结果。通过本发明实施例,提高了检测精度,可以避免检测框位置不准的问题。
Description
技术领域
本申请涉及目标检测技术领域,特别是涉及一种目标检测方法、装置、计算机设备和存储介质。
背景技术
随着人工智能技术的发展,计算机视觉(Computer Vision,CV)取得了显著进步。其中,目标检测(Object Detection)是计算机视觉的一个主要研究方向。
目标检测主要用于确定图像中的某个区域是否含有要识别的目标。其中,可以确定图像中某个区域是否含有待检测目标和待检测目标的目标部位,如果含有待检测目标和待检测目标的目标部位,则显示包括待检测目标的第一检测框和包括待检测目标的目标部位的第二检测框。比如,显示人脸框和行人框。
但是,有时会出现第一检测框的位置不准的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高检测精度,避免检测框位置不准的目标检测方法、装置、计算机设备和存储介质。
第一方面,本发明实施例提供了一种目标检测方法,该方法包括:
将包括待检测目标的目标图像输入至第一检测模型,确定待检测目标所对应的第一检测框和待检测目标的目标部位所对应的第二检测框;
将目标图像输入至第二检测模型,确定待检测目标所对应的第三检测框;
对第一检测框和第三检测框进行匹配,确定目标检测框;
将关联后的目标检测框和第二检测框确定为待检测目标的检测结果。
在其中一个实施例中,上述对第一检测框和第三检测框进行匹配,确定目标检测框,包括:
确定第一检测框与第三检测框之间的交并比;
当交并比大于预设阈值时,将第三检测框确定为目标检测框;
当交并比不大于预设阈值时,将第一检测框确定为目标检测框。
在其中一个实施例中,上述将包括待检测目标的目标图像输入至第一检测模型,确定待检测目标所对应的第一检测框和待检测目标的目标部位所对应的第二检测框,包括:
将目标图像输入到第一检测模型中,得到第一检测模型输出的对应待检测目标的第一偏移量和对应待检测目标的目标部位的第二偏移量;
根据第一锚框和第一偏移量确定第一检测框;
根据第一锚框和第二偏移量确定第二检测框。
在其中一个实施例中,上述将包括待检测目标的目标图像输入至第二检测模型,确定待检测目标所对应的第三检测框,包括:
将目标图像输入到第二检测模型中,得到第二检测模型输出的对应待检测目标的第三偏移量;
根据第二锚框和第三偏移量确定第三检测框。
在其中一个实施例中,在上述将包括待检测目标的目标图像输入至第一检测模型之前,该方法还包括:
获取第一训练样本集;第一训练样本集中包括多个第一样本图像和各第一样本图像对应的第一样本偏移量和第二样本偏移量;
基于第一训练样本集进行检测模型的训练,得到第一检测模型。
在其中一个实施例中,在上述将包括待检测目标的目标图像输入至第二检测模型之前,该方法还包括:
获取第二训练样本集;第二训练样本集中包括多个第二样本图像和各第二样本图像对应的第三样本偏移量;
基于第二训练样本集进行检测模型的训练,得到第二检测模型。
在其中一个实施例中,待检测目标为行人;待检测目标的目标部位为所述行人的人脸。
第二方面,本发明实施例提供了一种目标检测装置,装置包括:
第一检测框确定模块,用于将包括待检测目标的目标图像输入至第一检测模型,确定待检测目标所对应的第一检测框和待检测目标的目标部位所对应的第二检测框;
第三检测框确定模块,用于将目标图像输入至第二检测模型,确定待检测目标所对应的第三检测框;
目标检测框确定模块,用于对第一检测框和第三检测框进行匹配,确定目标检测框;
检测结果输出模块,用于将关联后的目标检测框和第二检测框确定为待检测目标的检测结果。
在其中一个实施例中,上述目标检测框确定模块,具体用于确定第一检测框与第三检测框之间的交并比;当交并比大于预设阈值时,将第三检测框确定为目标检测框;当交并比不大于预设阈值时,将第一检测框确定为目标检测框。
在其中一个实施例中,上述第一检测框确定模块,具体用于将目标图像输入到第一检测模型中,得到第一检测模型输出的对应待检测目标的第一偏移量和对应待检测目标的目标部位的第二偏移量;根据第一锚框和第一偏移量确定第一检测框;根据第一锚框和第二偏移量确定第二检测框。
在其中一个实施例中,上述第三检测框确定模块,具体用于将目标图像输入到第二检测模型中,得到第二检测模型输出的对应待检测目标的第三偏移量;根据第二锚框和第三偏移量确定第三检测框。
在其中一个实施例中,该装置还包括:
第一训练样本集获取模块,用于获取第一训练样本集;第一训练样本集中包括多个第一样本图像和各第一样本图像对应的第一样本偏移量和第二样本偏移量;
第一检测模型训练模块,用于基于第一训练样本集进行检测模型的训练,得到第一检测模型。
在其中一个实施例中,该装置还包括:
第二训练样本集获取模块,用于获取第二训练样本集;第二训练样本集中包括多个第二样本图像和各第二样本图像对应的第三样本偏移量;
第二检测模型训练模块,用于基于第二训练样本集进行检测模型的训练,得到第二检测模型。
在其中一个实施例中,待检测目标为行人;待检测目标的目标部位为所述行人的人脸。
第三方面,本发明实施例提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现如上述方法中的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上述方法中的步骤。
上述目标检测方法、装置、计算机设备和存储介质,将包括待检测目标的目标图像输入至第一检测模型,确定待检测目标所对应的第一检测框和待检测目标的目标部位所对应的第二检测框;将目标图像输入至第二检测模型,确定待检测目标所对应的第三检测框;对第一检测框和第三检测框进行匹配,确定目标检测框;将关联后的目标检测框和第二检测框确定为待检测目标的检测结果。通过本发明实施例,根据第一检测模型的输出结果获取包括待检测目标的第一检测框,根据第二检测模型的输出结果获取到包括待检测目标的第三检测框,从第一检测框和第三检测框中选取出更精确包括待检测目标的目标检测框,提高了检测精度,可以避免检测框位置不准的问题。
附图说明
图1为一个实施例中目标检测方法的应用环境图;
图2为一个实施例中目标检测方法的流程示意图;
图3为一个实施例中对第一检测框和第三检测框进行匹配,确定目标检测框步骤的流程示意图;
图4为另一个实施例中目标检测方法的流程示意图;
图5为一个实施例中目标检测装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的目标检测方法,可以应用于如图1所示的应用环境中。其中,该应用环境包括终端101和服务器102,终端101和服务器102通过网络进行通信。其中,终端101可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器102可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种目标检测方法,该方法可应用于图1中的服务器中,也可以应用于图1中的终端中,本申请实施例对此不作限定。下面以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤201,将包括待检测目标的目标图像输入至第一检测模型,确定待检测目标所对应的第一检测框和待检测目标的目标部位所对应的第二检测框。
本实施例中,预先训练第一检测模型,在进行目标检测时,将目标图像输入到第一检测模型中,第一检测模型根据目标图像输出相应的结果。然后,根据同一个锚框和第一检测模型的输出结果确定包括待检测目标的第一检测框和包括待检测目标的目标部位的第二检测框,其中待检测目标和待检测目标的目标部位具有位置关联性。
例如,待检测目标为行人,待检测目标的目标部位为所述行人的人脸,人脸和行人具有位置关联性。将目标图像A输入到第一检测模型中,然后根据第一检测模型的输出结果获取到包括行人的第一检测框和包括人脸的第二检测框,该第一检测框和该第二检测框具有关联性,对应了目标图像A中同一个行人的人***置和行人的人脸位置。
步骤202,将目标图像输入至第二检测模型,确定待检测目标所对应的第三检测框。
本实施例中,预先训练第二检测模型,将上述目标图像输入到第二检测模型中,第二检测模型根据目标图像输出相应的结果。然后,根据另一个锚框和第二检测模型的输出结果确定包括待检测目标的第三检测框。
例如,将目标图像A输入到第二检测模型中,根据第二检测模型的输出结果获取到包括行人的第三检测框。
本发明实施例对步骤201和步骤202的顺序不作详细限定,可以根据实际情况进行设置。并且,目标图像也可以是特征图,具体可以根据第一检测模型和第二检测模型进行设置。
步骤203,对第一检测框和第三检测框进行匹配,确定目标检测框。
本实施例中,对第一检测框和第三检测框进行比较,从第一检测框和第三检测框中选择出一个检测框作为目标检测框,即采用第三检测框对第一检测框进行修正,得到的目标检测框是更精确地包括待检测目标的检测框。
例如,从包括行人的第一检测框和第三检测框中选取出第三检测框作为目标检测框。
步骤204,将关联后的目标检测框和第二检测框确定为待检测目标的检测结果。
本实施例中,将目标检测框和第二检测框进行关联,并输出。例如,将包括行人的第三检测框与包括人脸的第二检测框确定为对应于同一行人的人体框和人脸框,将二者关联为对应于同一行人的检测结果输出。
上述目标检测方法中,将包括待检测目标的目标图像输入至第一检测模型,确定待检测目标所对应的第一检测框和待检测目标的目标部位所对应的第二检测框;将目标图像输入至第二检测模型,确定待检测目标所对应的第三检测框;对第一检测框和第三检测框进行匹配,确定目标检测框;将关联后的目标检测框和第二检测框确定为待检测目标的检测结果。通过本发明实施例,根据第一检测模型的输出结果获取包括待检测目标的第一检测框,根据第二检测模型的输出结果获取到包括待检测目标的第三检测框,从第一检测框和第三检测框中选取出更精确包括待检测目标的目标检测框,提高了检测精度,可以避免检测框位置不准的问题。
在另一个实施例中,如图3所示,本实施例涉及的是对第一检测框和第三检测框进行匹配,确定目标检测框的一种可选的过程。在上述图2所示实施例的基础上,上述步骤203具体可以包括以下步骤:
步骤301,确定第一检测框与第三检测框之间的交并比。
本实施例中,确定第一检测框与第三检测框的交集,以及第一检测框和第三检测框的并集,计算交集和并集的比值,得到第一检测框与第三检测框之间的交并比。
例如,第一检测框与第三检测框的交集为M,第一检测框和第三检测框的并集为N,计算交并比IOU=M/N。
步骤302,当交并比大于预设阈值时,将第三检测框确定为目标检测框。
本实施例中,预先设置交并比的阈值,如果交并比大于预设阈值,说明第三检测框更准确,则将第三检测框确定为目标检测框。例如,预设阈值为P,如果M/N大于P,则将第三检测框确定为目标检测框。
步骤303,当交并比不大于预设阈值时,将第一检测框确定为目标检测框。
本实施例中,如果交并比不大于预设阈值,说明第一检测框更准确,则将第一检测框确定为目标检测框。例如,如果M/N不大于P,则将第一检测框确定为目标检测框。
上述对第一检测框和第三检测框进行匹配,确定目标检测框的步骤中,确定第一检测框与第三检测框之间的交并比;当交并比大于预设阈值时,将第三检测框确定为目标检测框;当交并比不大于预设阈值时,将第一检测框确定为目标检测框。通过本发明实施例,可以根据交并比从第一检测框和第三检测框中选取出更精确包括待检测目标的目标检测框,从而提高检测精度,避免检测框位置不准的问题。
在另一个实施例中,如图4所示,本实施例涉及的是目标检测方法的一种可选的过程。在上述图2所示实施例的基础上,具体可以包括以下步骤:
步骤401,获取第一训练样本集;第一训练样本集中包括多个第一样本图像和各第一样本图像对应的第一样本偏移量和第二样本偏移量;基于第一训练样本集进行检测模型的训练,得到第一检测模型。
本实施例中,服务器获取多个第一样本图像,以及各第一样本图像对应的第一样本偏移量和第二样本偏移量,将多个第一样本图像和各第一样本图像对应的第一样本偏移量和第二样本偏移量组合成第一训练样本集。在训练第一检测模型时,以第一样本图像为输入,以第一样本偏移量和第二样本偏移量为监督进行检测模型的训练,得到第一检测模型。
例如,将第一样本图像a1、a2……a100作为检测模型的输入,将第一偏移量b1、b2……b100和第二偏移量c1、c2……c100作为监督进行检测模型的训练,得到第一检测模型。
步骤402,获取第二训练样本集;第二训练样本集中包括多个第二样本图像和各第二样本图像对应的第三样本偏移量;基于第二训练样本集进行检测模型的训练,得到第二检测模型。
本实施例中,服务器获取多个第二样本图像,以及各第二样本图像对应的第三样本偏移量,将多个第二样本图像和各第二样本图像对应的第三样本偏移量组合成第二训练样本集。在训练第二检测模型时,以第二样本图像为输入,以第三样本偏移量为监督进行检测模型的训练,得到第二检测模型。
例如,将第二样本图像d1、d2……d100作为检测模型的输入,将第三偏移量e1、e2……e100作为监督进行检测模型的训练,得到第二检测模型。
上述检测模型可以是RPN(Region Proposal Network,区域推荐网络),本发明实施例对此不作详细限定,可以根据实际情况进行设置。
步骤403,将目标图像输入到第一检测模型中,第一检测模型输出对应待检测目标的第一偏移量和对应待检测目标的目标部位的第二偏移量;根据第一锚框和第一偏移量确定第一检测框;根据第一锚框和第二偏移量确定第二检测框。
本实施例中,在得到的目标图像后,将目标图像输入到步骤401训练的第一检测模型中,第一检测模型输出第一偏移量和第二偏移量,其中第一偏移量对应待检测目标,第二偏移量对应待检测目标的目标部位,待检测目标和待检测目标的目标部位具有位置关联性。
其中,第一偏移量用于指示第一锚框与待检测目标之间的位置差异值,第二偏移量用于指示第一锚框与待检测目标的目标部位之间的位置差异值。在一实施例中,在得到第一偏移量和第二偏移量之后,可以根据第一偏移量调整第一锚框的位置得到第一检测框,根据第二偏移量调整第一锚框的位置得到第二检测框。
在其中一个实施例中,待检测目标为行人;待检测目标的目标部位为所述行人的人脸。
步骤404,将目标图像输入到第二检测模型中,得到第二检测模型输出的对应待检测目标的第三偏移量;根据第二锚框和第三偏移量确定第三检测框。
本实施例中,将目标图像输入到步骤402训练的第二检测模型中,第二检测模型输出对应待检测目标的第三偏移量。其中,第三偏移量用于指示第二锚框与待检测目标之间的位置差异值,因此在得到第三偏移量之后,可以根据第三偏移量调整第二锚框的位置得到第三检测框。
上述第一锚框与第二锚框为不同的锚框,根据第一锚框得到第一检测框与根据第二锚框得到的第三检测框位置可能相同或者不同。
本实施例对步骤401和步骤402的顺序,以及步骤403和步骤404的顺序不作详细限定,可以根据实际情况进行设置。
步骤405,对第一检测框和第三检测框进行匹配,确定目标检测框。
在其中一个实施例中,确定第一检测框与第三检测框之间的交并比;当交并比大于预设阈值时,将第三检测框确定为目标检测框;当交并比不大于预设阈值时,将第一检测框确定为目标检测框。
步骤406,将关联后的目标检测框和第二检测框确定为待检测目标的检测结果。
本实施例中,服务器建立目标检测框和第二检测框之间的关联关系,并将关联后的目标检测框和第二检测框输出到终端,终端在目标图像上显示目标检测框和第二检测框。
上述目标检测方法中,预先训练第一检测模型和第二检测模型,其中第一检测模型根据目标图像输出对应待检测目标的第一偏移量和对应待检测目标的目标部位的第二偏移量,第二检测模型根据目标图像输出对应待检测目标的第三偏移量。根据预先设置的第一锚框和第一偏移量可以得到对应待检测目标的第一检测框;根据第一锚框和第二偏移量可以得到对应待检测目标的目标部位的第二检测框;根据预先设置的第二锚框和第三偏移量可以得到对应待检测目标的第三检测框,由于采用两个检测模型和两个锚框,因此得到的第一偏移量和第三偏移量不同,得到的第一检测框和第三检测框位置不同,进而可以采用第三检测框对第一检测框进行修正,从而提高检测精度,避免检测框位置不准确的问题。
应该理解的是,虽然图2-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图5所示,提供了一种目标检测装置,包括:
第一检测框确定模块501,用于将包括待检测目标的目标图像输入至第一检测模型,确定待检测目标所对应的第一检测框和待检测目标的目标部位所对应的第二检测框;
第三检测框确定模块502,用于将目标图像输入至第二检测模型,确定待检测目标所对应的第三检测框;
目标检测框确定模块503,用于对第一检测框和第三检测框进行匹配,确定目标检测框;
检测结果输出模块504,用于将关联后的目标检测框和第二检测框确定为待检测目标的检测结果。
在其中一个实施例中,上述目标检测框确定模块503,具体用于确定第一检测框与第三检测框之间的交并比;当交并比大于预设阈值时,将第三检测框确定为目标检测框;当交并比不大于预设阈值时,将第一检测框确定为目标检测框。
在其中一个实施例中,上述第一检测框确定模块501,具体用于将目标图像输入到第一检测模型中,得到第一检测模型输出的对应待检测目标的第一偏移量和对应待检测目标的目标部位的第二偏移量;根据第一锚框和第一偏移量确定第一检测框;根据第一锚框和第二偏移量确定第二检测框。
在其中一个实施例中,上述第三检测框确定模块502,具体用于将目标图像输入到第二检测模型中,得到第二检测模型输出的对应待检测目标的第三偏移量;根据第二锚框和第三偏移量确定第三检测框。
在其中一个实施例中,该装置还包括:
第一训练样本集获取模块,用于获取第一训练样本集;第一训练样本集中包括多个第一样本图像和各第一样本图像对应的第一样本偏移量和第二样本偏移量;
第一检测模型训练模块,用于基于第一训练样本集进行检测模型的训练,得到第一检测模型。
在其中一个实施例中,该装置还包括:
第二训练样本集获取模块,用于获取第二训练样本集;第二训练样本集中包括多个第二样本图像和各第二样本图像对应的第三样本偏移量;
第二检测模型训练模块,用于基于第二训练样本集进行检测模型的训练,得到第二检测模型。
在其中一个实施例中,待检测目标为行人;待检测目标的目标部位为所述行人的人脸。
关于目标检测装置的具体限定可以参见上文中对于目标检测方法的限定,在此不再赘述。上述目标检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标检测数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标检测方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
将包括待检测目标的目标图像输入至第一检测模型,确定待检测目标所对应的第一检测框和待检测目标的目标部位所对应的第二检测框;
将目标图像输入至第二检测模型,确定待检测目标所对应的第三检测框;
对第一检测框和第三检测框进行匹配,确定目标检测框;
将关联后的目标检测框和第二检测框确定为待检测目标的检测结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
确定第一检测框与第三检测框之间的交并比;
当交并比大于预设阈值时,将第三检测框确定为目标检测框;
当交并比不大于预设阈值时,将第一检测框确定为目标检测框。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将目标图像输入到第一检测模型中,得到第一检测模型输出的对应待检测目标的第一偏移量和对应待检测目标的目标部位的第二偏移量;
根据第一锚框和第一偏移量确定第一检测框;
根据第一锚框和第二偏移量确定第二检测框。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将目标图像输入到第二检测模型中,得到第二检测模型输出的对应待检测目标的第三偏移量;
根据第二锚框和第三偏移量确定第三检测框。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取第一训练样本集;第一训练样本集中包括多个第一样本图像和各第一样本图像对应的第一样本偏移量和第二样本偏移量;
基于第一训练样本集进行检测模型的训练,得到第一检测模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取第二训练样本集;第二训练样本集中包括多个第二样本图像和各第二样本图像对应的第三样本偏移量;
基于第二训练样本集进行检测模型的训练,得到第二检测模型。
在一个实施例中,待检测目标为行人;待检测目标的目标部位为所述行人的人脸。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
将包括待检测目标的目标图像输入至第一检测模型,确定待检测目标所对应的第一检测框和待检测目标的目标部位所对应的第二检测框;
将目标图像输入至第二检测模型,确定待检测目标所对应的第三检测框;
对第一检测框和第三检测框进行匹配,确定目标检测框;
将关联后的目标检测框和第二检测框确定为待检测目标的检测结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
确定第一检测框与第三检测框之间的交并比;
当交并比大于预设阈值时,将第三检测框确定为目标检测框;
当交并比不大于预设阈值时,将第一检测框确定为目标检测框。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将目标图像输入到第一检测模型中,得到第一检测模型输出的对应待检测目标的第一偏移量和对应待检测目标的目标部位的第二偏移量;
根据第一锚框和第一偏移量确定第一检测框;
根据第一锚框和第二偏移量确定第二检测框。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将目标图像输入到第二检测模型中,得到第二检测模型输出的对应待检测目标的第三偏移量;
根据第二锚框和第三偏移量确定第三检测框。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取第一训练样本集;第一训练样本集中包括多个第一样本图像和各第一样本图像对应的第一样本偏移量和第二样本偏移量;
基于第一训练样本集进行检测模型的训练,得到第一检测模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取第二训练样本集;第二训练样本集中包括多个第二样本图像和各第二样本图像对应的第三样本偏移量;
基于第二训练样本集进行检测模型的训练,得到第二检测模型。
在一个实施例中,待检测目标为行人;待检测目标的目标部位为所述行人的人脸。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种目标检测方法,其特征在于,所述方法包括:
将包括待检测目标的目标图像输入至第一检测模型,确定所述待检测目标所对应的第一检测框和所述待检测目标的目标部位所对应的第二检测框;
将所述目标图像输入至第二检测模型,确定所述待检测目标所对应的第三检测框;
对所述第一检测框和所述第三检测框进行匹配,确定目标检测框;
将关联后的所述目标检测框和所述第二检测框确定为所述待检测目标的检测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一检测框和所述第三检测框进行匹配,确定目标检测框,包括:
确定所述第一检测框与所述第三检测框之间的交并比;
当所述交并比大于预设阈值时,将所述第三检测框确定为所述目标检测框;
当所述交并比不大于所述预设阈值时,将所述第一检测框确定为所述目标检测框。
3.根据权利要求1所述的方法,其特征在于,所述将包括待检测目标的目标图像输入至第一检测模型,确定所述待检测目标所对应的第一检测框和所述待检测目标的目标部位所对应的第二检测框,包括:
将所述目标图像输入到所述第一检测模型中,得到所述第一检测模型输出的对应所述待检测目标的第一偏移量和对应所述待检测目标的目标部位的第二偏移量;
根据第一锚框和所述第一偏移量确定所述第一检测框;
根据所述第一锚框和所述第二偏移量确定所述第二检测框。
4.根据权利要求1所述的方法,其特征在于,所述将所述目标图像输入至第二检测模型,确定所述待检测目标所对应的第三检测框,包括:
将所述目标图像输入到所述第二检测模型中,得到所述第二检测模型输出的对应所述待检测目标的第三偏移量;
根据第二锚框和所述第三偏移量确定所述第三检测框。
5.根据权利要求1-4任一项所述的方法,其特征在于,在所述将包括待检测目标的目标图像输入至第一检测模型之前,所述方法还包括:
获取第一训练样本集;所述第一训练样本集中包括多个第一样本图像和各所述第一样本图像对应的第一样本偏移量和第二样本偏移量;
基于所述第一训练样本集进行检测模型的训练,得到所述第一检测模型。
6.根据权利要求1-4任一项所述的方法,其特征在于,在所述将包括待检测目标的目标图像输入至第二检测模型之前,所述方法还包括:
获取第二训练样本集;所述第二训练样本集中包括多个第二样本图像和各所述第二样本图像对应的第三样本偏移量;
基于所述第二训练样本集进行检测模型的训练,得到所述第二检测模型。
7.根据权利要求1-4任一项所述的方法,其特征在于,所述待检测目标为行人;所述待检测目标的目标部位为所述行人的人脸。
8.一种目标检测装置,其特征在于,所述装置包括:
第一检测框确定模块,用于将包括待检测目标的目标图像输入至第一检测模型,确定所述待检测目标所对应的第一检测框和所述待检测目标的目标部位所对应的第二检测框;
第三检测框确定模块,用于将所述目标图像输入至第二检测模型,确定所述待检测目标所对应的第三检测框;
目标检测框确定模块,用于对所述第一检测框和所述第三检测框进行匹配,确定目标检测框;
检测结果输出模块,用于将关联后的所述目标检测框和所述第二检测框确定为所述待检测目标的检测结果。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911138793.2A CN111178126A (zh) | 2019-11-20 | 2019-11-20 | 目标检测方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911138793.2A CN111178126A (zh) | 2019-11-20 | 2019-11-20 | 目标检测方法、装置、计算机设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111178126A true CN111178126A (zh) | 2020-05-19 |
Family
ID=70646172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911138793.2A Pending CN111178126A (zh) | 2019-11-20 | 2019-11-20 | 目标检测方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111178126A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814612A (zh) * | 2020-06-24 | 2020-10-23 | 浙江大华技术股份有限公司 | 目标的脸部检测方法及其相关装置 |
CN113392720A (zh) * | 2021-05-24 | 2021-09-14 | 浙江大华技术股份有限公司 | 人脸人体的关联方法、设备、电子装置和存储介质 |
CN113632097A (zh) * | 2021-03-17 | 2021-11-09 | 商汤国际私人有限公司 | 对象间的关联性的预测方法、装置、设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150363636A1 (en) * | 2014-06-12 | 2015-12-17 | Canon Kabushiki Kaisha | Image recognition system, image recognition apparatus, image recognition method, and computer program |
CN109614990A (zh) * | 2018-11-20 | 2019-04-12 | 成都通甲优博科技有限责任公司 | 一种目标检测装置 |
CN109711274A (zh) * | 2018-12-05 | 2019-05-03 | 斑马网络技术有限公司 | 车辆检测方法、装置、设备和存储介质 |
CN109784293A (zh) * | 2019-01-24 | 2019-05-21 | 苏州科达科技股份有限公司 | 多类目标对象检测方法、装置、电子设备、存储介质 |
WO2019101021A1 (zh) * | 2017-11-23 | 2019-05-31 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置及电子设备 |
CN110059547A (zh) * | 2019-03-08 | 2019-07-26 | 北京旷视科技有限公司 | 目标检测方法及装置 |
CN110334612A (zh) * | 2019-06-19 | 2019-10-15 | 上海交通大学 | 具有自学习能力的电力巡检图像目标检测方法 |
CN110400332A (zh) * | 2018-04-25 | 2019-11-01 | 杭州海康威视数字技术股份有限公司 | 一种目标检测跟踪方法、装置及计算机设备 |
CN110427905A (zh) * | 2019-08-08 | 2019-11-08 | 北京百度网讯科技有限公司 | 行人跟踪方法、装置以及终端 |
-
2019
- 2019-11-20 CN CN201911138793.2A patent/CN111178126A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150363636A1 (en) * | 2014-06-12 | 2015-12-17 | Canon Kabushiki Kaisha | Image recognition system, image recognition apparatus, image recognition method, and computer program |
WO2019101021A1 (zh) * | 2017-11-23 | 2019-05-31 | 腾讯科技(深圳)有限公司 | 图像识别方法、装置及电子设备 |
CN110400332A (zh) * | 2018-04-25 | 2019-11-01 | 杭州海康威视数字技术股份有限公司 | 一种目标检测跟踪方法、装置及计算机设备 |
CN109614990A (zh) * | 2018-11-20 | 2019-04-12 | 成都通甲优博科技有限责任公司 | 一种目标检测装置 |
CN109711274A (zh) * | 2018-12-05 | 2019-05-03 | 斑马网络技术有限公司 | 车辆检测方法、装置、设备和存储介质 |
CN109784293A (zh) * | 2019-01-24 | 2019-05-21 | 苏州科达科技股份有限公司 | 多类目标对象检测方法、装置、电子设备、存储介质 |
CN110059547A (zh) * | 2019-03-08 | 2019-07-26 | 北京旷视科技有限公司 | 目标检测方法及装置 |
CN110334612A (zh) * | 2019-06-19 | 2019-10-15 | 上海交通大学 | 具有自学习能力的电力巡检图像目标检测方法 |
CN110427905A (zh) * | 2019-08-08 | 2019-11-08 | 北京百度网讯科技有限公司 | 行人跟踪方法、装置以及终端 |
Non-Patent Citations (1)
Title |
---|
郑树泉,王倩,武智霞,徐侃: "《工业智能技术与应用》", 上海:上海科学技术出版社, pages: 171 - 173 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111814612A (zh) * | 2020-06-24 | 2020-10-23 | 浙江大华技术股份有限公司 | 目标的脸部检测方法及其相关装置 |
CN113632097A (zh) * | 2021-03-17 | 2021-11-09 | 商汤国际私人有限公司 | 对象间的关联性的预测方法、装置、设备和存储介质 |
US11941838B2 (en) | 2021-03-17 | 2024-03-26 | Sensetime International Pte. Ltd. | Methods, apparatuses, devices and storage medium for predicting correlation between objects |
CN113392720A (zh) * | 2021-05-24 | 2021-09-14 | 浙江大华技术股份有限公司 | 人脸人体的关联方法、设备、电子装置和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109389030B (zh) | 人脸特征点检测方法、装置、计算机设备及存储介质 | |
CN110163344B (zh) | 神经网络训练方法、装置、设备和存储介质 | |
CN109472213B (zh) | 掌纹识别方法、装置、计算机设备和存储介质 | |
CN111178126A (zh) | 目标检测方法、装置、计算机设备和存储介质 | |
CN110751149B (zh) | 目标对象标注方法、装置、计算机设备和存储介质 | |
WO2020252911A1 (zh) | 失踪人脸识别方法、装置、计算机设备和存储介质 | |
CN109934262B (zh) | 图片差异性判断方法、装置、计算机设备和存储介质 | |
CN110334702B (zh) | 基于配置平台的数据传输方法、装置和计算机设备 | |
CN109711381B (zh) | 遥感图像的目标识别方法、装置和计算机设备 | |
CN108304243B (zh) | 界面生成方法、装置、计算机设备和存储介质 | |
CN111161202A (zh) | 车辆行为信息获取方法、装置、计算机设备和存储介质 | |
CN111191800B (zh) | 设备模型核查方法、装置、计算机设备和存储介质 | |
CN111144398A (zh) | 目标检测方法、装置、计算机设备和存储介质 | |
CN111062324A (zh) | 人脸检测方法、装置、计算机设备和存储介质 | |
CN108200087B (zh) | web入侵检测方法、装置、计算机设备和存储介质 | |
CN113705685A (zh) | 疾病特征识别模型训练、疾病特征识别方法、装置及设备 | |
CN111026742A (zh) | 数据质量评估方法、装置、计算机设备和存储介质 | |
CN112115860A (zh) | 人脸关键点定位方法、装置、计算机设备和存储介质 | |
CN110222752B (zh) | 图像处理方法、***、计算机设备、存储介质和芯片 | |
CN109102549B (zh) | 图像光源颜色的检测方法、装置、计算机设备及存储介质 | |
CN112163110B (zh) | 图像分类方法、装置、电子设备和计算机可读存储介质 | |
CN111738126B (zh) | 基于贝叶斯网络和hmm的驾驶员疲劳检测方法和装置 | |
CN110766653B (zh) | 图像分割方法、装置、计算机设备和存储介质 | |
CN110824496B (zh) | 运动估计方法、装置、计算机设备和存储介质 | |
CN109063601B (zh) | 唇纹检测方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |