CN112215163B - 一种应用于人脸检测预测框的加权后处理方法 - Google Patents
一种应用于人脸检测预测框的加权后处理方法 Download PDFInfo
- Publication number
- CN112215163B CN112215163B CN202011092870.8A CN202011092870A CN112215163B CN 112215163 B CN112215163 B CN 112215163B CN 202011092870 A CN202011092870 A CN 202011092870A CN 112215163 B CN112215163 B CN 112215163B
- Authority
- CN
- China
- Prior art keywords
- prediction
- confidence
- conf
- weighted
- prediction frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及人脸检测领域,公开了一种应用于人脸检测预测框的加权后处理方法,包括利用人脸检测器对待测图片进行人脸检测;删除置信度低于第一置信度阈值的预测框;计算当前置信度最高的预测框分别与更新后的若干个预测框之间的广义交并比;从更新后的若干个预测框中筛选出广义交并比大于交并比阈值的n个预测框;获得与当前置信度最高的预测框相对应的加权预测框;删除n个预测框;获得人脸检测器的加权后处理结果。本发明利用了更多人脸检测器的有效预测数据,使得被删除的预测框的位置信息和置信度信息同时得到了有效利用,输出的预测框的位置得到了更好的修正,且引入了广义交并比,提升了人脸检测器最终输出的位置精度。
Description
技术领域
本发明涉及人脸检测领域,具体地涉及一种应用于人脸检测预测框的加权后处理方法。
背景技术
随着深度学习技术的广泛应用,人脸识别、人脸美颜等技术也越来越成熟,而人脸检测是这些应用场景中的第一步,其精度对后续其他算法的精度有着较大的影响。在人脸检测算法中,模型会预测出很多有可能是人脸框的坐标以及对应的置信度,这些预测框往往并不能作为最终的输出,需要将重复的预测框和置信度较低的预测框滤除。
现有方法中大多采用非极大值抑制(NMS)的方法,首先计算模型预测框中置信度最高的预测框和其他的预测框的交并比(IoU),IoU大于设定阈值的预测框会直接被删除,然后选择剩下置信度最高的预测框和其他预测框计算的IoU,再次删除IoU大于设定阈值的预测框,如此往复直到处理完所有预测框。这种计算方式仅考虑了当前图片置信度最高的预测框,删除了通过IoU计算与其重合度较高的其他预测框,这些被删除的预测框同样包含了人脸的位置信息,导致了较多有效数据的丢失。并且IoU在作为重合度的计算方式时无法区分两个预测框之间不同的对齐方式,无法精准地反应两个预测框的重合程度。这种方式的最终输出结果中一张人脸仅使用了一个预测框的信息,较多有效数据没有被利用,最终输出的人脸框位置精度不高。
发明内容
本发明提供一种应用于人脸检测预测框的加权后处理方法,从而解决现有技术的上述问题。
一种应用于人脸检测预测框的加权后处理方法,包括以下步骤:
S1)采集待测图片,利用人脸检测器对待测图片进行人脸检测,获得与待测图片相对应的所有预测框,每一个预测框对应有一个置信度;
S2)设定第一置信度阈值conf_thresh1,从所有预测框中删除置信度低于第一置信度阈值conf_thresh1的预测框,获得若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框;
S3)对若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框进行更新,获取更新后的若干个预测框,按置信度从高到低的顺序对更新后的若干个预测框进行排序,获取更新后的若干个预测框中当前置信度最高的预测框,当前置信度最高的预测框的置信度为Max_conf,计算当前置信度最高的预测框分别与更新后的若干个预测框之间的广义交并比;
S4)设定交并比阈值iou_thresh,从更新后的若干个预测框中筛选出广义交并比大于交并比阈值iou_thresh的n个预测框,获得n个预测框的位置信息和置信度;
S5)根据n个预测框的位置信息和置信度获得与当前置信度最高的预测框相对应的加权预测框,对加权预测框的信息进行保存,加权预测框的信息包括加权预测框的位置信息以及加权预测框的置信度;
S6)从若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框中删除n个预测框;
S7)判断若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框是否全部被删除,若是,则进入步骤S8);若否,则返回步骤S3);
S8)获得若干个加权预测框,设定第二置信度阈值conf_thresh2,根据第二置信度阈值conf_thresh2获得人脸检测器的加权后处理结果。
在步骤S7)中,如果若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框没有全部被删除,则返回步骤S3),对若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框进行更新,即将删除了n个预测框后的若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框作为更新后的若干个预测框,循环步骤S3)至步骤S7),对若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框不断更新,获取加权预测框的同时会删除部分预测框,最终将若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框全部删除,同时获得若干个加权预测框。
进一步的,在步骤S3)中,计算当前置信度最高的预测框分别与更新后的若干个预测框之间的广义交并比,包括以下步骤:
S31)将当前置信度最高的预测框记为A,更新后的若干个预测框中的第i个预测框记为Bi;
S32)计算当前置信度最高的预测框A与第i个预测框Bi之间的交集面积A∩Bi;
S33)计算当前置信度最高的预测框A与第i个预测框Bi之间的并集面积A∪Bi;
进一步的,在步骤S5)中,根据n个预测框的位置信息和置信度获得与当前置信度最高的预测框相对应的加权预测框,对加权预测框的信息进行保存,加权预测框的信息包括加权预测框的位置信息以及加权预测框的置信度,包括以下步骤:
S51)将n个预测框的位置信息与n个预测框的置信度对应相乘,获得乘上置信度后的n个预测框的位置信息矩阵第n个预测框的位置信息为[X1nY1n X2n Y2n],X1n、Y1n分别为第n个预测框的左上角x坐标值和左上角y坐标值,X2n、Y2n分别为第n个预测框的右下角x坐标值和右下角y坐标值;confn为第n个预测框的置信度;
S52)将步骤S51)中乘上置信度后的n个预测框的位置信息矩阵按行相加,获得按行相加后的预测框位置信息[X1 Y1 X2 Y2],按行相加后的预测框的左上角x坐标值X1=conf1*X11+conf2*X12+...+confn*X1n,按行相加后的预测框的左上角y坐标值Y1=conf1*Y11+conf2*Y12+...+confn*Y1n,按行相加后的预测框的右下角x坐标值X2=conf1*X21+conf2*X22+...+confn*X2n,按行相加后的预测框的右下角y坐标值Y2=conf1*Y21+conf2*Y22+...+confn*Y2n;
S53)计算n个预测框的置信度总和conf=conf1+conf2+...+confn;
S54)获得与当前置信度最高的预测框相对应的加权预测框,保存加权预测框的信息将当前置信度最高的预测框的置信度Max_conf作为与当前置信度最高的预测框相对应的加权预测框的置信度,加权预测框的信息包括加权预测框的位置信息以及加权预测框的置信度Max_conf。
进一步的,在步骤S8)中,人脸检测器的加权后处理结果为若干个置信度大于第二置信度阈值conf_thresh2的加权预测框以及若干个置信度大于第二置信度阈值conf_thresh2的加权预测框的位置信息和置信度。
本发明的有益效果是:本发明相较于NMS算法利用了更多人脸检测器的有效预测数据,使用了与当前置信度最高的预测框重合度高于一定置信度阈值的所有预测框加权作为与当前置信度最高的预测框相对应的最终输出(即加权预测框),而不是仅使用一个最高置信度的预测框并删除其他重合预测框的做法,本发明使得这些被删除的预测框的位置信息得到了有效利用;同时进行预测框加权处理时,每个预测框的位置信息与其置信度做乘积,预测框的置信度信息也得到有效利用,输出的预测框的位置得到了更好的修正;并且引入了更能精准评价两预测框重合度的广义交并比GIoU,将广义交并比GIoU作为当前置信度最高的预测框和其他预测框重合度的计算方式,选取的数据更加精准,进一步提升了人脸检测器最终输出的位置精度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本实施例一提供的应用于人脸检测预测框的加权后处理方法流程示意图。
图2为本实施例一提供的最小外包矩形面积的示意图。
图3为本实施例一提供的与其他多种人脸检测算法进行对比的测试结果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
实施例一,一种应用于人脸检测预测框的加权后处理方法,如图1所示,包括以下步骤:
S1)采集待测图片,利用人脸检测器对待测图片进行人脸检测,获得与待测图片相对应的所有预测框,每一个预测框对应有一个置信度;
S2)设定第一置信度阈值conf_thresh1,从所有预测框中删除置信度低于第一置信度阈值conf_thresh1的预测框,获得若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框;
S3)对若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框进行更新,获取更新后的若干个预测框,按置信度从高到低的顺序对更新后的若干个预测框进行排序,获取更新后的若干个预测框中当前置信度最高的预测框,当前置信度最高的预测框的置信度为Max_conf,计算当前置信度最高的预测框分别与更新后的若干个预测框之间的广义交并比,包括以下步骤:
S31)将当前置信度最高的预测框记为A,其他预测框中的第i个预测框记为Bi;
S32)计算当前置信度最高的预测框A与第i个预测框Bi之间的交集面积A∩Bi;
S33)计算当前置信度最高的预测框A与第i个预测框Bi之间的并集面积A∪Bi;
S4)设定交并比阈值iou_thresh,从更新后的若干个预测框中筛选出广义交并比大于交并比阈值iou_thresh的n个预测框,获得n个预测框的位置信息和置信度;
S5)根据n个预测框的位置信息和置信度获得与当前置信度最高的预测框相对应的加权预测框,对加权预测框的信息进行保存,加权预测框的信息包括加权预测框的位置信息以及加权预测框的置信度,包括以下步骤:
S51)将n个预测框的位置信息与n个预测框的置信度对应相乘,获得乘上置信度后的n个预测框的位置信息矩阵第n个预测框的位置信息为[X1nY1n X2n Y2n],X1n、Y1n分别为第n个预测框的左上角x坐标值和左上角y坐标值,X2n、Y2n分别为第n个预测框的右下角x坐标值和右下角y坐标值;confn为第n个预测框的置信度;
S52)将S51)中乘上置信度后的n个预测框的位置信息矩阵按行相加,获得按行相加后的预测框位置信息[X1 Y1 X2 Y2],按行相加后的预测框的左上角x坐标值X1=conf1*X11+conf2*X12+...+confn*X1n,按行相加后的预测框的左上角y坐标值Y1=conf1*Y11+conf2*Y12+...+confn*Y1n,按行相加后的预测框的右下角x坐标值X2=conf1*X21+conf2*X22+...+confn*X2n,按行相加后的预测框的右下角y坐标值Y2=conf1*Y21+conf2*Y22+...+confn*Y2n;
S53)计算n个预测框的置信度总和conf=conf1+conf2+...+confn;
S54)获得与当前置信度最高的预测框相对应的加权预测框,保存所述加权预测框的信息将当前置信度最高的预测框的置信度Max_conf作为与当前置信度最高的预测框相对应的加权预测框的置信度,加权预测框的信息包括加权预测框的位置信息以及加权预测框的置信度Max_conf。
S6)从若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框中删除n个预测框;
S7)判断若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框是否全部被删除,若是,则进入步骤S8);若否,则返回步骤S3);
S8)获得若干个加权预测框,设定第二置信度阈值conf_thresh2,根据第二置信度阈值conf_thresh2获得人脸检测器的加权后处理结果。
在步骤S8)中,人脸检测器的加权后处理结果为若干个置信度大于第二置信度阈值conf_thresh2的加权预测框以及若干个置信度大于第二置信度阈值conf_thresh2的加权预测框的位置信息和置信度。
将本实施例采用的技术方案与其他多种人脸检测算法进行对比,本实施例采用的技术方案在准确度达到了最优,在运行耗时上增加较少,具体测试结果见图3。图3中,其他多种人脸检测算法包括NMS算法、soft-NMS算法、and-NMS算法、and-NMS(GIoU)算法、and-NMS(DIoU)算法、加权-NMS算法、加权-NMS(GIoU)算法、加权-NMS(DIoU)算法、DIoU-NMS算法和GIoU-NMS算法;除soft-NMS算法外其他人脸检测算法的交并比阈值iou_thresh均取0.5;置信度阈值2为第二置信度阈值conf_thresh2;AP(平均精度)反应了预测框的准确度,数字越大准确度越高。本发明使用的技术方案为加权-NMS(GIoU)算法,可以看出,在不同置信度阈值下本发明采用的技术方案(即加权-NMS(GIoU)算法)的AP均为最高,相较NMS算法提升最大。
通过采用本发明公开的上述技术方案,得到了如下有益的效果:
本发明相较于NMS算法利用了更多人脸检测器的有效预测数据,使用了与当前置信度最高的预测框重合度高于一定置信度阈值的所有预测框加权作为与当前置信度最高的预测框相对应的最终输出(即加权预测框),而不是仅使用一个最高置信度的预测框并删除其他重合预测框的做法,本发明使得这些被删除的预测框的位置信息得到了有效利用;同时进行预测框加权处理时,每个预测框的位置信息与其置信度做乘积,预测框的置信度信息也得到有效利用,输出的预测框的位置得到了更好的修正;并且引入了更能精准评价两预测框重合度的广义交并比GIoU,将广义交并比GIoU作为当前置信度最高的预测框和其他预测框重合度的计算方式,选取的数据更加精准,进一步提升了人脸检测器最终输出的位置精度。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
Claims (3)
1.一种应用于人脸检测预测框的加权后处理方法,其特征在于,包括以下步骤:
S1)采集待测图片,利用人脸检测器对所述待测图片进行人脸检测,获得与所述待测图片相对应的所有预测框,每一个预测框对应有一个置信度;
S2)设定第一置信度阈值conf_thresh1,从所有预测框中删除置信度低于所述第一置信度阈值conf_thresh1的预测框,获得若干个置信度高于或等于所述第一置信度阈值conf_thresh1的预测框;
S3)对若干个置信度高于或等于所述第一置信度阈值conf_thresh1的预测框进行更新,获取更新后的若干个预测框,按置信度从高到低的顺序对更新后的若干个预测框进行排序,获取更新后的若干个预测框中当前置信度最高的预测框,当前置信度最高的预测框的置信度为Max_conf,计算所述当前置信度最高的预测框分别与所述更新后的若干个预测框之间的广义交并比;
S4)设定交并比阈值iou_thresh,从所述更新后的若干个预测框中筛选出广义交并比大于交并比阈值iou_thresh的n个预测框,获取所述n个预测框的位置信息和置信度;
S5)根据所述n个预测框的位置信息和置信度获得与当前置信度最高的预测框相对应的加权预测框,对所述加权预测框的信息进行保存,所述加权预测框的信息包括加权预测框的位置信息以及所述加权预测框的置信度;包括以下步骤:
S51)将所述n个预测框的位置信息与所述n个预测框的置信度对应相乘,获得乘上置信度后的n个预测框的位置信息矩阵第n个预测框的位置信息为[X1n Y1nX2n Y2n],X1n、Y1n分别为第n个预测框的左上角x坐标值和左上角y坐标值,X2n、Y2n分别为第n个预测框的右下角x坐标值和右下角y坐标值;confn为第n个预测框的置信度;
S52)将步骤S51)中乘上置信度后的n个预测框的位置信息矩阵按行相加,获得按行相加后的预测框位置信息[X1 Y1 X2 Y2],按行相加后的预测框的左上角x坐标值X1=conf1*X11+conf2*X12+...+confn*X1n,按行相加后的预测框的左上角y坐标值Y1=conf1*Y11+conf2*Y12+...+confn*Y1n,按行相加后的预测框的右下角x坐标值X2=conf1*X21+conf2*X22+...+confn*X2n,按行相加后的预测框的右下角y坐标值Y2=conf1*Y21+conf2*Y22+...+confn*Y2n;
S53)计算n个预测框的置信度总和conf=conf1+conf2+...+confn;
S54)获得与当前置信度最高的预测框相对应的加权预测框,保存所述加权预测框的信息将当前置信度最高的预测框的置信度Max_conf作为与当前置信度最高的预测框相对应的加权预测框的置信度,所述加权预测框的信息包括加权预测框的位置信息以及加权预测框的置信度Max_conf;
S6)从若干个置信度高于或等于所述第一置信度阈值conf_thresh1的预测框中删除所述n个预测框;
S7)判断所述若干个置信度高于或等于所述第一置信度阈值conf_thresh1的预测框是否全部被删除,若是,则进入步骤S8);若否,则返回步骤S3);
S8)获得若干个加权预测框,设定第二置信度阈值conf_thresh2,根据所述第二置信度阈值conf_thresh2获得人脸检测器的加权后处理结果。
2.根据权利要求1所述的应用于人脸检测预测框的加权后处理方法,其特征在于,在步骤S3)中,计算所述当前置信度最高的预测框分别与所述更新后的若干个预测框之间的广义交并比,包括以下步骤:
S31)将当前置信度最高的预测框记为A,更新后的若干个预测框中的第i个预测框记为Bi;
S32)计算当前置信度最高的预测框A与第i个预测框Bi之间的交集面积A∪Bi;
S33)计算当前置信度最高的预测框A与第i个预测框Bi之间的并集面积A∪Bi;
3.根据权利要求1所述的应用于人脸检测预测框的加权后处理方法,其特征在于,在步骤S8)中,所述人脸检测器的加权后处理结果为若干个置信度大于所述第二置信度阈值conf_thresh2的加权预测框以及若干个置信度大于所述第二置信度阈值conf_thresh2的加权预测框的位置信息和置信度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011092870.8A CN112215163B (zh) | 2020-10-13 | 2020-10-13 | 一种应用于人脸检测预测框的加权后处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011092870.8A CN112215163B (zh) | 2020-10-13 | 2020-10-13 | 一种应用于人脸检测预测框的加权后处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112215163A CN112215163A (zh) | 2021-01-12 |
CN112215163B true CN112215163B (zh) | 2021-05-25 |
Family
ID=74053965
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011092870.8A Active CN112215163B (zh) | 2020-10-13 | 2020-10-13 | 一种应用于人脸检测预测框的加权后处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112215163B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679469A (zh) * | 2017-09-22 | 2018-02-09 | 东南大学—无锡集成电路技术研究所 | 一种基于深度学习的非极大值抑制方法 |
CN109886128A (zh) * | 2019-01-24 | 2019-06-14 | 南京航空航天大学 | 一种低分辨率下的人脸检测方法 |
CN110580445A (zh) * | 2019-07-12 | 2019-12-17 | 西北工业大学 | 一种基于GIoU和加权NMS改进的人脸关键点检测方法 |
CN110688994A (zh) * | 2019-12-10 | 2020-01-14 | 南京甄视智能科技有限公司 | 基于交并比的多模型融合的人脸检测方法、装置与计算机可读取存储介质 |
CN111626990A (zh) * | 2020-05-06 | 2020-09-04 | 北京字节跳动网络技术有限公司 | 目标检测框处理方法、装置及电子设备 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8824808B2 (en) * | 2011-08-19 | 2014-09-02 | Adobe Systems Incorporated | Methods and apparatus for automated facial feature localization |
CN106327469B (zh) * | 2015-06-29 | 2019-06-18 | 北京航空航天大学 | 一种语义标签引导的视频对象分割方法 |
US9875429B2 (en) * | 2015-10-06 | 2018-01-23 | Adobe Systems Incorporated | Font attributes for font recognition and similarity |
CN111091551A (zh) * | 2019-12-12 | 2020-05-01 | 哈尔滨市科佳通用机电股份有限公司 | 一种铁路货车制动梁支柱开口销丢失故障检测方法 |
CN111476817A (zh) * | 2020-02-27 | 2020-07-31 | 浙江工业大学 | 一种基于yolov3的多目标行人检测跟踪方法 |
-
2020
- 2020-10-13 CN CN202011092870.8A patent/CN112215163B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107679469A (zh) * | 2017-09-22 | 2018-02-09 | 东南大学—无锡集成电路技术研究所 | 一种基于深度学习的非极大值抑制方法 |
CN109886128A (zh) * | 2019-01-24 | 2019-06-14 | 南京航空航天大学 | 一种低分辨率下的人脸检测方法 |
CN110580445A (zh) * | 2019-07-12 | 2019-12-17 | 西北工业大学 | 一种基于GIoU和加权NMS改进的人脸关键点检测方法 |
CN110688994A (zh) * | 2019-12-10 | 2020-01-14 | 南京甄视智能科技有限公司 | 基于交并比的多模型融合的人脸检测方法、装置与计算机可读取存储介质 |
CN111626990A (zh) * | 2020-05-06 | 2020-09-04 | 北京字节跳动网络技术有限公司 | 目标检测框处理方法、装置及电子设备 |
Non-Patent Citations (2)
Title |
---|
Improving Object DetectionWith One Line of Code;Navaneeth Bodla et al.;《arXiv》;20170808;第1-9页 * |
雾霾天气车辆检测的改进YOLOv3 算法;黄开启 等;《重庆大学学报》;20200911;第1-9页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112215163A (zh) | 2021-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11450146B2 (en) | Gesture recognition method, apparatus, and device | |
US11263434B2 (en) | Fast side-face interference resistant face detection method | |
US8755623B2 (en) | Image enhancement method, image enhancement device, object detection method, and object detection device | |
WO2023082882A1 (zh) | 一种基于姿态估计的行人摔倒动作识别方法及设备 | |
CN103093212B (zh) | 基于人脸检测和跟踪截取人脸图像的方法和装置 | |
US20040213460A1 (en) | Method of human figure contour outlining in images | |
US9262672B2 (en) | Pattern recognition apparatus and pattern recognition method that reduce effects on recognition accuracy, and storage medium | |
CN108320306B (zh) | 融合tld和kcf的视频目标跟踪方法 | |
CN111553425B (zh) | 一种用于视觉定位的模板匹配lsp算法、介质和设备 | |
CN101470809A (zh) | 一种基于扩展混合高斯模型的运动目标检测方法 | |
US20020122593A1 (en) | Pattern recognition method and apparatus | |
US12002254B2 (en) | Method and apparatus of training object detection network and object detection method and apparatus | |
CN110188780B (zh) | 用于定位多目标特征点的深度学习模型的构建方法及装置 | |
CN113205138B (zh) | 人脸人体匹配方法、设备和存储介质 | |
CN109447006A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN110738688A (zh) | 一种新的红外超弱运动目标检测方法 | |
CN111178261A (zh) | 一种基于视频编码技术的人脸检测加速方法 | |
CN110349070B (zh) | 一种短视频水印检测方法 | |
US20110222759A1 (en) | Information processing apparatus, information processing method, and program | |
CN113255648B (zh) | 一种基于图像识别的滑动窗口框选方法及终端 | |
CN112802104B (zh) | 一种基于rgb-d相机的回环检测方法 | |
CN112215163B (zh) | 一种应用于人脸检测预测框的加权后处理方法 | |
US20230368397A1 (en) | Method and system for detecting moving object | |
CN110738082B (zh) | 人脸关键点的定位方法、装置、设备及介质 | |
CN112508168B (zh) | 基于预测框自动修正的边框回归神经网络构建方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |