CN112215163B

CN112215163B - 一种应用于人脸检测预测框的加权后处理方法

Info

Publication number: CN112215163B
Application number: CN202011092870.8A
Authority: CN
Inventors: 朱海明; 瞿洪桂; 孙家乐
Original assignee: Beijing Sinonet Science and Technology Co Ltd
Current assignee: Beijing Sinonet Science and Technology Co Ltd
Priority date: 2020-10-13
Filing date: 2020-10-13
Publication date: 2021-05-25
Anticipated expiration: 2040-10-13
Also published as: CN112215163A

Abstract

本发明涉及人脸检测领域，公开了一种应用于人脸检测预测框的加权后处理方法，包括利用人脸检测器对待测图片进行人脸检测；删除置信度低于第一置信度阈值的预测框；计算当前置信度最高的预测框分别与更新后的若干个预测框之间的广义交并比；从更新后的若干个预测框中筛选出广义交并比大于交并比阈值的n个预测框；获得与当前置信度最高的预测框相对应的加权预测框；删除n个预测框；获得人脸检测器的加权后处理结果。本发明利用了更多人脸检测器的有效预测数据，使得被删除的预测框的位置信息和置信度信息同时得到了有效利用，输出的预测框的位置得到了更好的修正，且引入了广义交并比，提升了人脸检测器最终输出的位置精度。

Description

一种应用于人脸检测预测框的加权后处理方法

技术领域

本发明涉及人脸检测领域，具体地涉及一种应用于人脸检测预测框的加权后处理方法。

背景技术

随着深度学习技术的广泛应用，人脸识别、人脸美颜等技术也越来越成熟，而人脸检测是这些应用场景中的第一步，其精度对后续其他算法的精度有着较大的影响。在人脸检测算法中，模型会预测出很多有可能是人脸框的坐标以及对应的置信度，这些预测框往往并不能作为最终的输出，需要将重复的预测框和置信度较低的预测框滤除。

现有方法中大多采用非极大值抑制(NMS)的方法，首先计算模型预测框中置信度最高的预测框和其他的预测框的交并比(IoU)，IoU大于设定阈值的预测框会直接被删除，然后选择剩下置信度最高的预测框和其他预测框计算的IoU，再次删除IoU大于设定阈值的预测框，如此往复直到处理完所有预测框。这种计算方式仅考虑了当前图片置信度最高的预测框，删除了通过IoU计算与其重合度较高的其他预测框，这些被删除的预测框同样包含了人脸的位置信息，导致了较多有效数据的丢失。并且IoU在作为重合度的计算方式时无法区分两个预测框之间不同的对齐方式，无法精准地反应两个预测框的重合程度。这种方式的最终输出结果中一张人脸仅使用了一个预测框的信息，较多有效数据没有被利用，最终输出的人脸框位置精度不高。

发明内容

本发明提供一种应用于人脸检测预测框的加权后处理方法，从而解决现有技术的上述问题。

一种应用于人脸检测预测框的加权后处理方法，包括以下步骤：

S1)采集待测图片，利用人脸检测器对待测图片进行人脸检测，获得与待测图片相对应的所有预测框，每一个预测框对应有一个置信度；

S2)设定第一置信度阈值conf_thresh1，从所有预测框中删除置信度低于第一置信度阈值conf_thresh1的预测框，获得若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框；

S3)对若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框进行更新，获取更新后的若干个预测框，按置信度从高到低的顺序对更新后的若干个预测框进行排序，获取更新后的若干个预测框中当前置信度最高的预测框，当前置信度最高的预测框的置信度为Max_conf,计算当前置信度最高的预测框分别与更新后的若干个预测框之间的广义交并比；

S4)设定交并比阈值iou_thresh，从更新后的若干个预测框中筛选出广义交并比大于交并比阈值iou_thresh的n个预测框，获得n个预测框的位置信息和置信度；

S5)根据n个预测框的位置信息和置信度获得与当前置信度最高的预测框相对应的加权预测框，对加权预测框的信息进行保存，加权预测框的信息包括加权预测框的位置信息以及加权预测框的置信度；

S6)从若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框中删除n个预测框；

S7)判断若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框是否全部被删除，若是，则进入步骤S8)；若否，则返回步骤S3)；

S8)获得若干个加权预测框，设定第二置信度阈值conf_thresh2，根据第二置信度阈值conf_thresh2获得人脸检测器的加权后处理结果。

在步骤S7)中，如果若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框没有全部被删除，则返回步骤S3)，对若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框进行更新，即将删除了n个预测框后的若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框作为更新后的若干个预测框，循环步骤S3)至步骤S7)，对若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框不断更新，获取加权预测框的同时会删除部分预测框，最终将若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框全部删除，同时获得若干个加权预测框。

进一步的，在步骤S3)中，计算当前置信度最高的预测框分别与更新后的若干个预测框之间的广义交并比，包括以下步骤：

S31)将当前置信度最高的预测框记为A，更新后的若干个预测框中的第i个预测框记为B_i；

S32)计算当前置信度最高的预测框A与第i个预测框B_i之间的交集面积A∩B_i；

S33)计算当前置信度最高的预测框A与第i个预测框B_i之间的并集面积A∪B_i；

S34)根据交集面积A∩B_i和并集面积A∪B_i获得当前置信度最高的预测框A与第i个预测框B_i之间的广义交并比

C表示当前置信度最高的预测框A与第i个预测框B_i的最小外包矩形面积。

进一步的，在步骤S5)中，根据n个预测框的位置信息和置信度获得与当前置信度最高的预测框相对应的加权预测框，对加权预测框的信息进行保存，加权预测框的信息包括加权预测框的位置信息以及加权预测框的置信度，包括以下步骤：

S51)将n个预测框的位置信息

与n个预测框的置信度对应相乘，获得乘上置信度后的n个预测框的位置信息矩阵

第n个预测框的位置信息为[X1_nY1_n X2_n Y2_n]，X1_n、Y1_n分别为第n个预测框的左上角x坐标值和左上角y坐标值，X2_n、Y2_n分别为第n个预测框的右下角x坐标值和右下角y坐标值；conf_n为第n个预测框的置信度；

S52)将步骤S51)中乘上置信度后的n个预测框的位置信息矩阵按行相加，获得按行相加后的预测框位置信息[X1 Y1 X2 Y2]，按行相加后的预测框的左上角x坐标值X1＝conf₁*X1₁+conf₂*X1₂+...+conf_n*X1_n，按行相加后的预测框的左上角y坐标值Y1＝conf₁*Y1₁+conf₂*Y1₂+...+conf_n*Y1_n，按行相加后的预测框的右下角x坐标值X2＝conf₁*X2₁+conf₂*X2₂+...+conf_n*X2_n，按行相加后的预测框的右下角y坐标值Y2＝conf₁*Y2₁+conf₂*Y2₂+...+conf_n*Y2_n；

S53)计算n个预测框的置信度总和conf＝conf₁+conf₂+...+conf_n；

S54)获得与当前置信度最高的预测框相对应的加权预测框，保存加权预测框的信息

将当前置信度最高的预测框的置信度Max_conf作为与当前置信度最高的预测框相对应的加权预测框的置信度，加权预测框的信息包括加权预测框的位置信息

以及加权预测框的置信度Max_conf。

进一步的，在步骤S8)中，人脸检测器的加权后处理结果为若干个置信度大于第二置信度阈值conf_thresh2的加权预测框以及若干个置信度大于第二置信度阈值conf_thresh2的加权预测框的位置信息和置信度。

本发明的有益效果是：本发明相较于NMS算法利用了更多人脸检测器的有效预测数据，使用了与当前置信度最高的预测框重合度高于一定置信度阈值的所有预测框加权作为与当前置信度最高的预测框相对应的最终输出(即加权预测框)，而不是仅使用一个最高置信度的预测框并删除其他重合预测框的做法，本发明使得这些被删除的预测框的位置信息得到了有效利用；同时进行预测框加权处理时，每个预测框的位置信息与其置信度做乘积，预测框的置信度信息也得到有效利用，输出的预测框的位置得到了更好的修正；并且引入了更能精准评价两预测框重合度的广义交并比GIoU，将广义交并比GIoU作为当前置信度最高的预测框和其他预测框重合度的计算方式，选取的数据更加精准，进一步提升了人脸检测器最终输出的位置精度。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本实施例一提供的应用于人脸检测预测框的加权后处理方法流程示意图。

图2为本实施例一提供的最小外包矩形面积的示意图。

图3为本实施例一提供的与其他多种人脸检测算法进行对比的测试结果图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不用于限定本发明。

实施例一，一种应用于人脸检测预测框的加权后处理方法，如图1所示，包括以下步骤：

S3)对若干个置信度高于或等于第一置信度阈值conf_thresh1的预测框进行更新，获取更新后的若干个预测框，按置信度从高到低的顺序对更新后的若干个预测框进行排序，获取更新后的若干个预测框中当前置信度最高的预测框，当前置信度最高的预测框的置信度为Max_conf,计算当前置信度最高的预测框分别与更新后的若干个预测框之间的广义交并比，包括以下步骤：

S31)将当前置信度最高的预测框记为A，其他预测框中的第i个预测框记为B_i；

C表示当前置信度最高的预测框A与第i个预测框B_i的最小外包矩形面积(见图2)。

S5)根据n个预测框的位置信息和置信度获得与当前置信度最高的预测框相对应的加权预测框，对加权预测框的信息进行保存，加权预测框的信息包括加权预测框的位置信息以及加权预测框的置信度，包括以下步骤：

S51)将n个预测框的位置信息

S52)将S51)中乘上置信度后的n个预测框的位置信息矩阵按行相加，获得按行相加后的预测框位置信息[X1 Y1 X2 Y2]，按行相加后的预测框的左上角x坐标值X1＝conf₁*X1₁+conf₂*X1₂+...+conf_n*X1_n，按行相加后的预测框的左上角y坐标值Y1＝conf₁*Y1₁+conf₂*Y1₂+...+conf_n*Y1_n，按行相加后的预测框的右下角x坐标值X2＝conf₁*X2₁+conf₂*X2₂+...+conf_n*X2_n，按行相加后的预测框的右下角y坐标值Y2＝conf₁*Y2₁+conf₂*Y2₂+...+conf_n*Y2_n；

S53)计算n个预测框的置信度总和conf＝conf₁+conf₂+...+conf_n；

S54)获得与当前置信度最高的预测框相对应的加权预测框，保存所述加权预测框的信息

以及加权预测框的置信度Max_conf。

在步骤S8)中，人脸检测器的加权后处理结果为若干个置信度大于第二置信度阈值conf_thresh2的加权预测框以及若干个置信度大于第二置信度阈值conf_thresh2的加权预测框的位置信息和置信度。

将本实施例采用的技术方案与其他多种人脸检测算法进行对比，本实施例采用的技术方案在准确度达到了最优，在运行耗时上增加较少，具体测试结果见图3。图3中，其他多种人脸检测算法包括NMS算法、soft-NMS算法、and-NMS算法、and-NMS(GIoU)算法、and-NMS(DIoU)算法、加权-NMS算法、加权-NMS(GIoU)算法、加权-NMS(DIoU)算法、DIoU-NMS算法和GIoU-NMS算法；除soft-NMS算法外其他人脸检测算法的交并比阈值iou_thresh均取0.5；置信度阈值2为第二置信度阈值conf_thresh2；AP(平均精度)反应了预测框的准确度，数字越大准确度越高。本发明使用的技术方案为加权-NMS(GIoU)算法，可以看出，在不同置信度阈值下本发明采用的技术方案(即加权-NMS(GIoU)算法)的AP均为最高，相较NMS算法提升最大。

通过采用本发明公开的上述技术方案，得到了如下有益的效果：

本发明相较于NMS算法利用了更多人脸检测器的有效预测数据，使用了与当前置信度最高的预测框重合度高于一定置信度阈值的所有预测框加权作为与当前置信度最高的预测框相对应的最终输出(即加权预测框)，而不是仅使用一个最高置信度的预测框并删除其他重合预测框的做法，本发明使得这些被删除的预测框的位置信息得到了有效利用；同时进行预测框加权处理时，每个预测框的位置信息与其置信度做乘积，预测框的置信度信息也得到有效利用，输出的预测框的位置得到了更好的修正；并且引入了更能精准评价两预测框重合度的广义交并比GIoU，将广义交并比GIoU作为当前置信度最高的预测框和其他预测框重合度的计算方式，选取的数据更加精准，进一步提升了人脸检测器最终输出的位置精度。

以上仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视本发明的保护范围。

Claims

1.一种应用于人脸检测预测框的加权后处理方法，其特征在于，包括以下步骤：

S1)采集待测图片，利用人脸检测器对所述待测图片进行人脸检测，获得与所述待测图片相对应的所有预测框，每一个预测框对应有一个置信度；

S2)设定第一置信度阈值conf_thresh1，从所有预测框中删除置信度低于所述第一置信度阈值conf_thresh1的预测框，获得若干个置信度高于或等于所述第一置信度阈值conf_thresh1的预测框；

S3)对若干个置信度高于或等于所述第一置信度阈值conf_thresh1的预测框进行更新，获取更新后的若干个预测框，按置信度从高到低的顺序对更新后的若干个预测框进行排序，获取更新后的若干个预测框中当前置信度最高的预测框，当前置信度最高的预测框的置信度为Max_conf,计算所述当前置信度最高的预测框分别与所述更新后的若干个预测框之间的广义交并比；

S4)设定交并比阈值iou_thresh，从所述更新后的若干个预测框中筛选出广义交并比大于交并比阈值iou_thresh的n个预测框，获取所述n个预测框的位置信息和置信度；

S5)根据所述n个预测框的位置信息和置信度获得与当前置信度最高的预测框相对应的加权预测框，对所述加权预测框的信息进行保存，所述加权预测框的信息包括加权预测框的位置信息以及所述加权预测框的置信度；包括以下步骤：

S51)将所述n个预测框的位置信息

与所述n个预测框的置信度对应相乘，获得乘上置信度后的n个预测框的位置信息矩阵

第n个预测框的位置信息为[X1_n Y1_nX2_n Y2_n]，X1_n、Y1_n分别为第n个预测框的左上角x坐标值和左上角y坐标值，X2_n、Y2_n分别为第n个预测框的右下角x坐标值和右下角y坐标值；conf_n为第n个预测框的置信度；

S53)计算n个预测框的置信度总和conf＝conf₁+conf₂+...+conf_n；

将当前置信度最高的预测框的置信度Max_conf作为与当前置信度最高的预测框相对应的加权预测框的置信度，所述加权预测框的信息包括加权预测框的位置信息

以及加权预测框的置信度Max_conf；

S6)从若干个置信度高于或等于所述第一置信度阈值conf_thresh1的预测框中删除所述n个预测框；

S7)判断所述若干个置信度高于或等于所述第一置信度阈值conf_thresh1的预测框是否全部被删除，若是，则进入步骤S8)；若否，则返回步骤S3)；

S8)获得若干个加权预测框，设定第二置信度阈值conf_thresh2，根据所述第二置信度阈值conf_thresh2获得人脸检测器的加权后处理结果。

2.根据权利要求1所述的应用于人脸检测预测框的加权后处理方法，其特征在于，在步骤S3)中，计算所述当前置信度最高的预测框分别与所述更新后的若干个预测框之间的广义交并比，包括以下步骤：

S32)计算当前置信度最高的预测框A与第i个预测框B_i之间的交集面积A∪B_i；

S34)根据交集面积A∪B_i和并集面积A∪B_i获得当前置信度最高的预测框A与第i个预测框B_i之间的广义交并比

3.根据权利要求1所述的应用于人脸检测预测框的加权后处理方法，其特征在于，在步骤S8)中，所述人脸检测器的加权后处理结果为若干个置信度大于所述第二置信度阈值conf_thresh2的加权预测框以及若干个置信度大于所述第二置信度阈值conf_thresh2的加权预测框的位置信息和置信度。