CN111753625B - 一种行人检测方法、装置、设备及介质 - Google Patents
一种行人检测方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN111753625B CN111753625B CN202010192213.4A CN202010192213A CN111753625B CN 111753625 B CN111753625 B CN 111753625B CN 202010192213 A CN202010192213 A CN 202010192213A CN 111753625 B CN111753625 B CN 111753625B
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- detection
- original
- image
- head
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 315
- 238000012549 training Methods 0.000 claims abstract description 56
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000005070 sampling Methods 0.000 claims description 29
- 238000002372 labelling Methods 0.000 claims description 20
- 238000010586 diagram Methods 0.000 claims description 13
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000000605 extraction Methods 0.000 description 3
- 239000013307 optical fiber Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 101100400452 Caenorhabditis elegans map-2 gene Proteins 0.000 description 1
- 101150064138 MAP1 gene Proteins 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/103—Static body considered as a whole, e.g. static pedestrian or occupant recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例公开了一种行人检测方法、装置、设备及介质,所述方法包括:获取待检测图像;将待检测图像输入至训练好的单次目标检测器中,获取单次目标检测器的输出信息;根据单次目标检测器的输出信息,确定对待检测图像的行人检测结果;其中,单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的。本发明实施例提供的行人检测方法通过使用预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的单次目标检测器进行行人检测,实现在保证单次目标检测器的行人检测速度的基础上提高行人检测精度。
Description
技术领域
本发明实施例涉及目标检测领域,尤其涉及一种行人检测方法、装置、设备及介质。
背景技术
行人检测在计算机视觉领域中具有许多应用场景,比如安防监控、自动驾驶、机器人等。目前主流的行人检测方法大都基于深度学习,比如基于候选区域的目标检测器Faster RCNN,或者单次目标检测器SSD、YOLO等。基于候选区域的目标检测器分为两部分,一部分是区域候选Region Proposal Networks,RPN)网络,一部分是基于区域的卷积(FastR-CNN)网络。使用时,先由RPN粗略地提取前景框的候选区域,再由Fast R-CNN对候选区域进行精调,回归最终的物体坐标以及物体分类结果。单次目标检测器没有RPN网络,直接回归物体坐标以及物体分类结果。
在实现本发明的过程中,发明人发现现有技术中至少存在以下技术问题:上述方法在标准的行人检测数据上已经取得了较好的结果,但在遮挡场景中(包括类内遮挡,人与人的遮挡,以及类间遮挡,人与物的遮挡等),还未取得令人满意的结果。目前,为提高遮挡场景下的行人识别精度,提出了一些应用在基于候选区域的目标检测器的优化方法,但是基于候选区域的目标检测器虽然精度高,但是速度较慢,而单次目标检测器的速度较快,因此如何在保证单次目标检测器的行人检测速度的基础上提高行人检测精度是一个亟待解决的技术问题。
发明内容
本发明实施例提供了一种行人检测方法、装置、设备及介质,以实现在保证单次目标检测器的行人检测速度的基础上提高行人检测精度。
第一方面,本发明实施例提供了一种行人检测方法,包括:
获取待检测图像;
将所述待检测图像输入至训练好的单次目标检测器中,获取所述单次目标检测器的输出信息;
根据所述单次目标检测器的输出信息,确定对所述待检测图像的行人检测结果;
其中,所述单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的。
第二方面,本发明实施例还提供了一种行人检测装置,包括:
待检测图像获取模块,用于获取待检测图像;
图像行人检测模块,用于将所述待检测图像输入至训练好的单次目标检测器中,获取所述单次目标检测器的输出信息,其中,所述单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的;
检测结果确定模块,用于根据所述单次目标检测器的输出信息,确定对所述待检测图像的行人检测结果。
第三方面,本发明实施例还提供了一种计算机设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例所提供的行人检测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的行人检测方法。
本发明实施例通过获取待检测图像;将待检测图像输入至训练好的单次目标检测器中,获取单次目标检测器的输出信息;根据单次目标检测器的输出信息,确定对待检测图像的行人检测结果;其中,单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的,通过使用预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的单次目标检测器进行行人检测,实现在保证单次目标检测器的行人检测速度的基础上提高行人检测精度。
附图说明
图1是本发明实施例一所提供的一种行人检测方法的流程图;
图2是本发明实施例二所提供的一种行人检测方法的流程图;
图3a是本发明实施例三所提供的一种行人检测方法的流程图;
图3b是本发明实施例三提供的一种原始检测模型的网络架构示意图;
图4是本发明实施例四所提供的一种行人检测装置的结构示意图;
图5是本发明实施例五所提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1是本发明实施例一所提供的一种行人检测方法的流程图。本实施例可适用于进行行人检测时的情形。该方法可以由行人检测装置执行,该行人检测装置可以采用软件和/或硬件的方式实现,例如,该行人检测装置可配置于计算机设备中。如图1所示,所述方法包括:
S110、获取待检测图像。
在本实施例中,待检测图像可以为需要进行行人检测的图像。其中,待检测图像的获取方式在此不做限定。可选的,可以直接获取摄像头拍摄的视频帧作为待检测图像,也可以对已有视频进行处理,得到用于行人检测的待检测图像。
S120、将待检测图像输入至训练好的单次目标检测器中,获取单次目标检测器的输出信息,其中,单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的。
获取待检测图像后,使用预先训练好的单次目标检测器对待检测图像进行检测,获取单次目标检测器的输出信息,以依据单次目标检测器的输出信息确定行人检测结果。其中,单次目标检测器可以为单次多框检测器(Single Shot MultiBox Detector,SSD)、YOLO(You Only Live Once)、RetinaNet等检测器。可选的,单次目标检测器的输出信息可以为识别出的待检测图像中的行人框,以及各行人框的分值。
需要说明的是,单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的。为了解决现有技术中单次目标检测器在遮挡场景下检测结果不准确的技术问题,在对单次目标检测器进行训练时,将头部检测网络和单次目标检测器结合训练,结合头部检测网络的检测结果以及单次目标检测器的检测结果,调整单次目标检测器中的设置参数,实现对单次目标检测器中参数的优化,使得训练出的单次目标检测器识别结果更加准确。
S130、根据单次目标检测器的输出信息,确定待检测图像的行人检测结果。
在本实施例中,得到单次目标检测器对待检测图像进行检测后的输出信息后,根据单次目标检测器的输出信息确定待检测图像的行人检测结果。可选的,待检测图像的行人检测结果可以根据检测需求设定。示例性的,若检测需求为检测待检测图像中包含行人的数量,则统计单次目标检测器输出的行人框数量作为待检测图像的行人检测结果;若检测需求为检测待检测图像中的行人位置,则根据单次目标检测器输出的行人框位置确定待检测图像中的行人位置。
本发明实施例通过获取待检测图像;将待检测图像输入至训练好的单次目标检测器中,获取单次目标检测器的输出信息;根据单次目标检测器的输出信息,确定对待检测图像的行人检测结果;其中,单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的。通过使用预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的单次目标检测器进行行人检测,实现在保证单次目标检测器的行人检测速度的基础上提高行人检测精度。
实施例二
图2是本发明实施例二所提供的一种行人检测方法的流程图。本实施例在上述实施例的基础上,对单次目标检测器的训练进行了具体化。如图2所示,所述方法包括:
S210、获取样本图像、样本图像对应的行人框标注结果以及样本图像对应的行人头部标注结果。
在本实施例中,样本图像可以为包含有行人的图像,优选的,可以为包含有被遮挡了的行人的图像。对样本图像进行人工标注,标注出样本图像中行人框以及行人头部,得到样本图像以及样本图像对应的行人框标注结果以及样本图像对应的行人头部标注结果。
S220、基于样本图像、样本图像对应的行人框标注结果以及样本图像对应的行人头部标注结果生成训练样本对,使用训练样本对对预先构建的原始检测模型进行训练,得到训练好的原始检测模型。
对样本图像标注完成后,基于样本图像、样本图像对应的行人框标注结果以及样本图像对应的行人头部标注结果生成训练样本对,使用训练样本对对预先构建的原始检测模型进行训练,得到训练好的原始检测模型。其中,预先构建的原始检测模型中可以包括单次目标检测器和至少一个头部检测网络。单次目标检测器中每个原始特征网络层的输出端与头部检测网络的输入端相连。
在本发明的一种实施方式中,使用训练样本对对预先构建的原始检测模型进行训练,得到训练好的原始检测模型,包括:将样本图像输入至初始构建的单次目标检测器中,获得单次目标检测器输出的原始特征图、行人框检测结果以及行人框检测结果对应的检测分值;根据检测分值对行人框检测结果进行排序,根据排序结果获取预设数量的目标行人框检测结果;将原始特征图以及目标行人框检测结果输入至头部检测网络中,获得头部检测网络输出的行人头部检测结果;根据行人框检测结果以及行人框标注结果确定第一损失值,根据行人头部检测结果以及行人头部标注结果确定第二损失值,根据第一损失值和第二损失值确定目标损失值;以目标损失值达到收敛条件为目标,对原始检测模型进行训练。
具体的,使用训练样本对对预先构建的原始检测模型进行训练可以为:将样本图像输入至初始构建的单次目标检测器中,获得单次目标检测器输出的行人框检测结果,以及各行人框检测结果对应的检测分值,根据检测分值对行人框检测结果进行逆序排序,取排序前预设数量的行人框检测结果作为目标行人框检测结果;将目标行人框检测结果以及各原始特征网络层输出的原始特征图输入至头部检测网络中,获得头部检测网络输出的行人头部检测结果。然后基于设定的行人框损失函数、行人框检测结果以及行人框标注结果计算行人框检测结果对应的第一损失值,基于设定的行人头部损失函数、行人头部检测结果以及行人头部标注结果计算行人头部检测结果对应的第二损失值,根据第一损失值以及第二损失值计算目标损失值。当目标损失值不满足收敛条件时,调整头部检测网络中的参数以及单次目标检测器中的参数,基于调整后的参数对样本图像再次预测,直到目标损失值满足收敛条件,得到训练好的原始检测模型。其中,行人框损失函数与行人头部损失函数可以相同,也可以不同。
可选的,根据第一损失值以及第二损失值计算目标损失值可以为:将第一损失值与第二损失值的和作为目标损失值。目标损失值满足收敛条件可以为:迭代次数满足设定次数或相邻两次的目标损失值之差小于设定阈值。
可选的,头部检测网络可以包括区域提取模块和头部标记模块,区域提取模块用于从原始特征图中提取出目标行人框检测结果对应的头部特征图,头部标记模块用于对头部特征图进行标记,得到行人头部检测结果。
在上述方案的基础上,单次目标检测器中包括多个原始特征网络层,原始检测模型中的目标特征网络层与头部检测网络之间还包括上采样模块,所述方法还包括:根据各原始特征网络层输出的原始特征图的图像大小,选取至少一个原始特征网络层作为目标特征网络层;在目标特征网络层后添加上采样模块,在上采样模块后添加头部检测网络。
可选的,考虑到单次目标检测器中部分原始特征网络层输出的原始特征图较小,基于原始特征图进行的头部检测特征提取会导致行人信息损失,影响行人头部检测结果。在本实施例中,根据原始特征图的图像大小,从原始特征网络层中选取目标特征网络层,在目标原始特征网络层后添加上采样模块,在上采样模块后添加头部检测网络,使用上采样后的原始特征图进行头部检测,提高行人头部检测结果。
可选的,根据各原始特征网络层输出的原始特征图的图像大小,选取至少一个原始特征网络层作为目标特征网络层,包括:将图像大小小于设定阈值的原始特征图对应的原始特征网络层作为目标特征网络层。一个实施例中,可以预先设定图像大小阈值,将图像大小小于图像大小阈值的原始特征图对应的原始特征网络层作为目标特征网络层。在本实施例中,对上采样模块不做限定,只要能够实现将原始特征图上采样为图像大小不小于设定图像大小阈值的上采样特征图即可。示例性的,上采样模块可以为转置卷积模块。
在本发明的一种实施方式中,在将原始特征图以及目标行人框检测结果输入至头部检测网络中,获得头部检测网络输出的行人头部检测结果之前,还包括:获取目标特征网络层输出的目标原始特征图,将目标原始特征图输入至上采样模块中,得到上采样模块输出的上采样特征图;相应的,将原始特征图以及目标行人框检测结果输入至头部检测网络中,获得头部检测网络输出的行人头部检测结果,包括:将原始特征网络层中除目标特征网络层以外的其他原始特征网络层输出的原始特征图、上采样特征图以及目标行人框检测结果输入至头部检测网络中,获得头部检测网络输出的行人头部检测结果。
在目标网络特征层与头部检测网络之间添加上采样模块后,相应的,在进行行人头部的预测时,先由上采样模块将目标网络特征层输出的目标原始特征图进行上采样,得上采样特征图,然后再将上采样特征图以及原始特征网络层中除目标特征网络层之外的其他原始网络特征层输出的原始特征图作为头部检测网络的输入,使用头部检测网络进行行人头部的检测,得到头部检测网络输出的行人头部检测结果。将目标原始特征图进行上采样后通过头部检测网络进行检测,能够保留原始特征图中的行人信息,避免行人信息丢失对行人头部检测造成影响。
S230、将训练好的原始检测模型中的单次目标检测器作为训练好的单次目标检测器。
在本实施例中,得到训练好的原始检测模型后,将训练好的原始检测模型中的单次目标检测器作为训练好的单次目标检测器,使用训练好的单次目标检测器进行行人检测。在检测时仅使用了单次目标检测器进行检测的流程,实现了在保证单次目标检测器的检测速度的基础上,提高了单次目标检测器的检测精度。
S240、获取待检测图像。
S250、将待检测图像输入至训练好的单次目标检测器中,获取单次目标检测器的输出信息。
S260、根据单次目标检测器的输出信息,确定对待检测图像的行人检测结果。
本发明实施例对单次目标检测器的训练进行了具体化,通过获取样本图像、样本图像对应的行人框标注结果以及样本图像对应的行人头部标注结果;基于样本图像、样本图像对应的行人框标注结果以及样本图像对应的行人头部标注结果生成训练样本对,使用训练样本对对预先构建的原始检测模型进行训练,得到训练好的原始检测模型;将训练好的原始检测模型中的单次目标检测器作为训练好的单次目标检测器,通过增加行人头部特征作为训练特征,提高了单次目标检测器的训练准确度,从而提高了单次目标检测器的行人检测结果精度。
实施例三
图3a是本发明实施例三所提供的一种行人检测方法的流程图。本实施例在上述实施例的基础上,提供了一种优选实施例。如图3a所示,所述方法包括:
S310、基于单次目标检测器构建待训练的原始检测模型。
本实施例在单次目标检测器的基础上,加入头部的预测,得到构建好的原始检测模型。整个原始检测模型在训练过程中即预测行人框,也预测行人头部的标记,利用头部检测任务辅助提升行人检测准确率。其中,单次目标检测器可以为SSD、YOLO、RetinaNet等检测器。
图3b是本发明实施例三提供的一种原始检测模型的网络架构示意图,图3b中示意性的示出了以SSD网络为基础的原始检测网络模型。如图3b所示,原始检测模型中包括SSD网络310、上采样模块320以及头部检测模块330。
其中,SSD网络310部分包含图像输入层、基础网络层、特征网络层和检测层,特征网络层包括特征层1、特征层2和特征层3。SSD网络310的输入是待检测的图片,输出是检测到的行人框以及三个特征图。输入图像经过基础网络层和特征网络层后得到不同尺度的特征图,得到的特征图经过检测层后得到行人框的预测结果,包括行人框坐标以及行人框的分数。
上采样模块320包括目标特征网络层以及上采样层,其中,目标特征网络层为图像大小小于设定图像大小阈值的特征图对应的特征网络层。上采样模块320的输入是SSD中小尺度的特征图,输出是经过上采样后的特征图。小尺度(图像大小小于设定阈值)的特征图(即图3b中特征层3输出的特征图)通过转置卷积上采样为大的特征图,避免原始特征图较小时,从原始特征图提取出头部特征图造成的信息丢失。示例性的,假设原始特征图的大小为8*8,通过转置卷积后得到上采样特征图的大小为64*64。
头部检测模块330部分包含ROIAlign和标记层。头部检测模块330的输入是SSD中特征层1输出的特征图1、特征层2输出的特征图2、行人检测结果以及上采样层输出的获得的上采样特征图3,输出是行人头部检测结果。该部分首先按分值将行人框排序,然后提取排序前100名的行人框,接着通过ROIAlign上述前100名行人框对应位置的头部特征图,并通过尺寸调整缩放,统一输出为设定大小(如28*28)的头部特征图,最后在头部特征图上进行行人头部检测。
S320、获取样本数据,基于获取的样本数据对原始检测模型进行训练,得到训练好的原始检测模型。
具体的,获取样本数据(样本图像)后,对样本数据进行标注,得到训练样本对,其中,训练样本对数据中需要包含样本图像、行人框的标注以及行人头部的标注,行人框的标注作为行人检测的标准数据,行人头部的标注作为行人头部标注的标准数据。在对原始检测模型进行训练时,将样本图像输入至单次目标检测器中,获取单次目标检测器输出的行人框的预测结果,同时计算行人框检测损失值。然后根据各行人框的分值对行人框进行排序,获得前100个行人框检测结果,以及上述行人框检测结果对应的特征图。然后使用上采样模块将小尺度的特征图进行放大,得到上采样特征图。通过ROIAlign从尺度符合设定尺寸需求的原始特征图以及上采样特征图中提取出前100个行人框对应的头部特征图,并在提取出的头部特征图上进行标记,得到行人头部检测结果,将行人头部检测结果与行人头部标注进行对比,得到行人头部检测损失值。然后将行人框检测损失值与行人头部检测损失值相加,作为整体损失,以整体损失收敛为目标,训练原始检测模型,得到训练好的原始检测模型。通过在单次目标检测器中引入头部预测,提高了遮挡场景下的行人检测准确率。
S330、将训练好的原始检测模型中的单次目标检测器作为待测试单次目标检测器,对待测试单次目标检测器进行测试。
得到训练好的原始检测模型后,提取出训练好的原始检测模型中的单次目标检测器,将其作为待测试单次目标检测器,使用测试数据对待测试单次目标检测器进行测试,得到测试结果。
S340、待测试单次目标检测器测试通过后,使用测试通过的单次目标检测器进行行人检测。
当待测试单次目标检测器测试通过时,可直接使用测试通过的单次目标检测器进行行人检测。当待测试单次目标检测器测试不通过时,重新获取训练数据对原始检测模型进行训练,直到训练好的原始检测模型中的单次目标检测器测试通过。
本发明实施例在单次目标检测器上,加入行人头部标记检测分支,同时加入上采样模块,增大小尺度的特征图,使其也能参与到行人头部标记检测中,提升了基于单次目标检测器的遮挡场景下的行人检测准确率。
实施例四
图4是本发明实施例四所提供的一种行人检测装置的结构示意图。该行人检测装置可以采用软件和/或硬件的方式实现,例如该行人检测装置可以配置于计算机设备中。如图4所示,所述装置包括待检测图像获取模块410、图像行人检测模块420和检测结果确定模块430,其中:
待检测图像获取模块410,用于获取待检测图像;
图像行人检测模块420,用于将所述待检测图像输入至训练好的单次目标检测器中,获取所述单次目标检测器的输出信息,其中,所述单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的;
检测结果确定模块430,用于根据所述单次目标检测器的输出信息,确定对所述待检测图像的行人检测结果。
本发明实施例通过待检测图像获取模块获取待检测图像;图像行人检测模块将所述待检测图像输入至训练好的单次目标检测器中,获取所述单次目标检测器的输出信息;检测结果确定模块根据所述单次目标检测器的输出信息,确定对所述待检测图像的行人检测结果;其中,所述单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的。通过使用预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的单次目标检测器进行行人检测,实现在保证单次目标检测器的行人检测速度的基础上提高行人检测精度。
可选的,在上述方案的基础上,所述装置还包括单次目标检测器确定模块,用于:
获取样本图像、所述样本图像对应的行人框标注结果以及所述样本图像对应的行人头部标注结果;
基于所述样本图像、所述样本图像对应的行人框标注结果以及所述样本图像对应的行人头部标注结果生成训练样本对,使用训练样本对对预先构建的原始检测模型进行训练,得到训练好的原始检测模型;
将训练好的原始检测模型中的单次目标检测器作为训练好的单次目标检测器。
可选的,在上述方案的基础上,所述单次目标检测器确定模块包括:
行人框检测单元,用于将所述样本图像输入至初始构建的单次目标检测器中,获得所述单次目标检测器输出的原始特征图、行人框检测结果以及所述行人框检测结果对应的检测分值;
目标行人框确定单元,用于根据所述检测分值对所述行人框检测结果进行排序,根据排序结果获取预设数量的目标行人框检测结果;
行人头部检测单元,用于将所述原始特征图以及所述目标行人框检测结果输入至所述头部检测网络中,获得所述头部检测网络输出的行人头部检测结果;
损失值确定单元,用于根据所述行人框检测结果以及所述行人框标注结果确定第一损失值,根据所述行人头部检测结果以及所述行人头部标注结果确定第二损失值,根据所述第一损失值和所述第二损失值确定目标损失值;
原始检测模型训练单元,用于以所述目标损失值达到收敛条件为目标,对所述原始检测模型进行训练。
可选的,在上述方案的基础上,所述单次目标检测器中包括多个原始特征网络层,所述原始检测模型中的目标特征网络层与所述头部检测网络之间还包括上采样模块,所述装置还包括原始检测模型构建模块,用于:
根据各所述原始特征网络层输出的原始特征图的图像大小,选取至少一个所述原始特征网络层作为目标特征网络层;
在所述目标特征网络层后添加上采样模块,在所述上采样模块后添加所述头部检测网络。
可选的,在上述方案的基础上,所述原始检测模型构建模块具体用于:
将所述图像大小小于设定阈值的原始特征图对应的原始特征网络层作为所述目标特征网络层。
可选的,在上述方案的基础上,所述单次目标检测器确定模块还包括上采样单元,用于:
获取所述目标特征网络层输出的目标原始特征图,将所述目标原始特征图输入至所述上采样模块中,得到所述上采样模块输出的上采样特征图;
相应的,所述行人头部检测单元具体用于:
将所述原始特征网络层中除目标特征网络层以外的其他原始特征网络层输出的原始特征图、所述上采样特征图以及所述目标行人框检测结果输入至所述头部检测网络中,获得所述头部检测网络输出的行人头部检测结果。
可选的,在上述方案的基础上,所述上采样模块为转置卷积模块。
本发明实施例所提供的行人检测装置可执行本发明任意实施例所提供的行人检测方法,具备执行方法相应的功能模块和有益效果。
实施例五
图5是本发明实施例五所提供的一种计算机设备的结构示意图。图5示出了适于用来实现本发明实施方式的示例性计算机设备512的框图。图5显示的计算机设备512仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机设备512以通用计算设备的形式表现。计算机设备512的组件可以包括但不限于:一个或者多个处理器516,***存储器528,连接不同***组件(包括***存储器528和处理器516)的总线518。
总线518表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器516或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
计算机设备512典型地包括多种计算机***可读介质。这些介质可以是任何能够被计算机设备512访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
***存储器528可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)530和/或高速缓存存储器532。计算机设备512可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储装置534可以用于读写不可移动的、非易失性磁介质(图5未显示,通常称为“硬盘驱动器”)。尽管图5中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线518相连。存储器528可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块542的程序/实用工具540,可以存储在例如存储器528中,这样的程序模块542包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块542通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备512也可以与一个或多个外部设备514(例如键盘、指向设备、显示器524等)通信,还可与一个或者多个使得用户能与该计算机设备512交互的设备通信,和/或与使得该计算机设备512能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口522进行。并且,计算机设备512还可以通过网络适配器520与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器520通过总线518与计算机设备512的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备512使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理器516通过运行存储在***存储器528中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的行人检测方法,该方法包括:
获取待检测图像;
将所述待检测图像输入至训练好的单次目标检测器中,获取所述单次目标检测器的输出信息;
根据所述单次目标检测器的输出信息,确定对所述待检测图像的行人检测结果;
其中,所述单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的。
当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的行人检测方法的技术方案。
实施例六
本发明实施例六还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例所提供的行人检测方法,该方法包括:
获取待检测图像;
将所述待检测图像输入至训练好的单次目标检测器中,获取所述单次目标检测器的输出信息;
根据所述单次目标检测器的输出信息,确定对所述待检测图像的行人检测结果;
其中,所述单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的。
当然,本发明实施例所提供的一种计算机可读存储介质,其上存储的计算机程序不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的行人检测方法的相关操作。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (9)
1.一种行人检测方法,其特征在于,包括:
获取待检测图像;
将所述待检测图像输入至训练好的单次目标检测器中,获取所述单次目标检测器的输出信息;
根据所述单次目标检测器的输出信息,确定对所述待检测图像的行人检测结果;
其中,所述单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的;
其中,在将所述待检测图像输入至训练好的单次目标检测器中之前,还包括:
获取样本图像、所述样本图像对应的行人框标注结果以及所述样本图像对应的行人头部标注结果;
基于所述样本图像、所述样本图像对应的行人框标注结果以及所述样本图像对应的行人头部标注结果生成训练样本对,使用训练样本对对预先构建的原始检测模型进行训练,得到训练好的原始检测模型;
将训练好的原始检测模型中的单次目标检测器作为训练好的单次目标检测器。
2.根据权利要求1所述的方法,其特征在于,所述使用训练样本对对预先构建的原始检测模型进行训练,得到训练好的原始检测模型,包括:
将所述样本图像输入至初始构建的单次目标检测器中,获得所述单次目标检测器输出的原始特征图、行人框检测结果以及所述行人框检测结果对应的检测分值;
根据所述检测分值对所述行人框检测结果进行排序,根据排序结果获取预设数量的目标行人框检测结果;
将所述原始特征图以及所述目标行人框检测结果输入至所述头部检测网络中,获得所述头部检测网络输出的行人头部检测结果;
根据所述行人框检测结果以及所述行人框标注结果确定第一损失值,根据所述行人头部检测结果以及所述行人头部标注结果确定第二损失值,根据所述第一损失值和所述第二损失值确定目标损失值;
以所述目标损失值达到收敛条件为目标,对所述原始检测模型进行训练。
3.根据权利要求2所述的方法,其特征在于,所述单次目标检测器中包括多个原始特征网络层,所述原始检测模型中的目标特征网络层与所述头部检测网络之间还包括上采样模块,所述方法还包括:
根据各所述原始特征网络层输出的原始特征图的图像大小,选取至少一个所述原始特征网络层作为目标特征网络层;
在所述目标特征网络层后添加上采样模块,在所述上采样模块后添加所述头部检测网络。
4.根据权利要求3所述的方法,其特征在于,所述根据各所述原始特征网络层输出的原始特征图的图像大小,选取至少一个所述原始特征网络层作为目标特征网络层,包括:
将所述图像大小小于设定阈值的原始特征图对应的原始特征网络层作为所述目标特征网络层。
5.根据权利要求4所述的方法,其特征在于,在将所述原始特征图以及所述目标行人框检测结果输入至所述头部检测网络中,获得所述头部检测网络输出的行人头部检测结果之前,还包括:
获取所述目标特征网络层输出的目标原始特征图,将所述目标原始特征图输入至所述上采样模块中,得到所述上采样模块输出的上采样特征图;
相应的,所述将所述原始特征图以及所述目标行人框检测结果输入至所述头部检测网络中,获得所述头部检测网络输出的行人头部检测结果,包括:
将所述原始特征网络层中除目标特征网络层以外的其他原始特征网络层输出的原始特征图、所述上采样特征图以及所述目标行人框检测结果输入至所述头部检测网络中,获得所述头部检测网络输出的行人头部检测结果。
6.根据权利要求3所述的方法,其特征在于,所述上采样模块为转置卷积模块。
7.一种行人检测装置,其特征在于,包括:
待检测图像获取模块,用于获取待检测图像;
图像行人检测模块,用于将所述待检测图像输入至训练好的单次目标检测器中,获取所述单次目标检测器的输出信息,其中,所述单次目标检测器是预先对包含初始构建的单次目标检测器和头部检测网络的原始检测模型,进行训练得到的;
检测结果确定模块,用于根据所述单次目标检测器的输出信息,确定对所述待检测图像的行人检测结果;
装置还包括单次目标检测器确定模块,用于:
在将所述待检测图像输入至训练好的单次目标检测器中之前,获取样本图像、所述样本图像对应的行人框标注结果以及所述样本图像对应的行人头部标注结果;
基于所述样本图像、所述样本图像对应的行人框标注结果以及所述样本图像对应的行人头部标注结果生成训练样本对,使用训练样本对对预先构建的原始检测模型进行训练,得到训练好的原始检测模型;
将训练好的原始检测模型中的单次目标检测器作为训练好的单次目标检测器。
8.一种计算机设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的行人检测方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一所述的行人检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010192213.4A CN111753625B (zh) | 2020-03-18 | 2020-03-18 | 一种行人检测方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010192213.4A CN111753625B (zh) | 2020-03-18 | 2020-03-18 | 一种行人检测方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111753625A CN111753625A (zh) | 2020-10-09 |
CN111753625B true CN111753625B (zh) | 2024-04-09 |
Family
ID=72673046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010192213.4A Active CN111753625B (zh) | 2020-03-18 | 2020-03-18 | 一种行人检测方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111753625B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109961009A (zh) * | 2019-02-15 | 2019-07-02 | 平安科技(深圳)有限公司 | 基于深度学习的行人检测方法、***、装置及存储介质 |
CN110070074A (zh) * | 2019-05-07 | 2019-07-30 | 安徽工业大学 | 一种构建行人检测模型的方法 |
WO2019144575A1 (zh) * | 2018-01-24 | 2019-08-01 | 中山大学 | 一种快速行人检测方法及装置 |
-
2020
- 2020-03-18 CN CN202010192213.4A patent/CN111753625B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019144575A1 (zh) * | 2018-01-24 | 2019-08-01 | 中山大学 | 一种快速行人检测方法及装置 |
CN109961009A (zh) * | 2019-02-15 | 2019-07-02 | 平安科技(深圳)有限公司 | 基于深度学习的行人检测方法、***、装置及存储介质 |
CN110070074A (zh) * | 2019-05-07 | 2019-07-30 | 安徽工业大学 | 一种构建行人检测模型的方法 |
Non-Patent Citations (1)
Title |
---|
油田安防领域基于改进的深度残差网络行人检测模型;杨其睿;;计算机测量与控制;20181125(11);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111753625A (zh) | 2020-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109145680B (zh) | 一种获取障碍物信息的方法、装置、设备和计算机存储介质 | |
CN109117831B (zh) | 物体检测网络的训练方法和装置 | |
CN109977191B (zh) | 问题地图检测方法、装置、电子设备和介质 | |
CN110378966B (zh) | 车路协同相机外参标定方法、装置、设备及存储介质 | |
CN108230292A (zh) | 物体检测方法和神经网络的训练方法、装置及电子设备 | |
CN111104925B (zh) | 图像处理方法、装置、存储介质和电子设备 | |
CN113012200B (zh) | 一种运动物体的定位方法、装置、电子设备及存储介质 | |
CN111046971A (zh) | 图像识别方法、装置、设备及计算机可读存储介质 | |
CN110647886A (zh) | 兴趣点标注方法、装置、计算机设备和存储介质 | |
CN109544516B (zh) | 图像检测方法及装置 | |
CN110727816A (zh) | 兴趣点类别确定方法和装置 | |
CN111242922A (zh) | 一种蛋白质图像分类方法、装置、设备及介质 | |
CN111369524B (zh) | 结节识别模型训练方法、结节识别方法及装置 | |
CN110298302B (zh) | 一种人体目标检测方法及相关设备 | |
CN116964588A (zh) | 一种目标检测方法、目标检测模型训练方法及装置 | |
CN113989616A (zh) | 一种目标检测方法、装置、设备和存储介质 | |
CN108229281B (zh) | 神经网络的生成方法和人脸检测方法、装置及电子设备 | |
CN113537026B (zh) | 建筑平面图中的图元检测方法、装置、设备及介质 | |
CN109934185B (zh) | 数据处理方法及装置、介质和计算设备 | |
CN113762455A (zh) | 检测模型训练方法、单字检测方法、装置、设备及介质 | |
CN111753625B (zh) | 一种行人检测方法、装置、设备及介质 | |
CN116091481A (zh) | 一种小穗计数方法、装置、设备和存储介质 | |
CN112446231A (zh) | 一种人行横道检测方法、装置、计算机设备及存储介质 | |
CN111488776A (zh) | 对象检测方法、对象检测装置和电子设备 | |
CN109815307B (zh) | 位置确定方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |