WO2020140772A1

WO2020140772A1 - 一种人脸检测方法、装置、设备以及存储介质

Info

Publication number: WO2020140772A1
Application number: PCT/CN2019/127003
Authority: WO
Inventors: 武文琦; 叶泽雄; 肖万鹏
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2019-01-02
Filing date: 2019-12-20
Publication date: 2020-07-09
Also published as: EP3910551A4; US20210326574A1; EP3910551A1; CN109753927A; US12046012B2

Abstract

本申请实施例公开了一种人脸检测方法、装置、设备和存储介质，根据包括多层卷积网络的人脸检测模型确定待检测图像中的人脸候选区域，根据人脸候选区域的尺寸参数确定人脸候选区域是对应的小尺度人脸时，通过第一检测模型对人脸候选区域进行人脸检测，在对人脸候选区域进行人脸检测中，获取人脸候选区域在人脸检测模型中至少两层卷积网络所输出特征图上的投影特征，将第一卷积网络的投影特征与第二卷积网络的投影特征融合得到的融合特征作为第一卷积网络的投影特征并根据至少两层卷积网络的投影特征对人脸候选区域进行人脸检测。

Description

一种人脸检测方法、装置、设备以及存储介质

本申请要求于2019年1月2日提交国家知识产权局、申请号为201910002499.2，申请名称为“一种人脸检测方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像处理领域，特别是涉及一种人脸检测方法、装置、设备以及存储介质。

背景技术

人脸检测是计算机视觉领域的一个重要的研究热点问题，它的主要任务是从图像中检测到图像中存在的人脸。

目前有不少传统的人脸检测方式，可从不同角度提高人脸检测的精度和速度。

发明内容

本申请实施例提供了一种人脸检测方法，由计算设备执行，所述方法包括：

根据人脸检测模型确定待检测图像中的人脸候选区域；所述人脸检测模型包括多层卷积网络；

若所述人脸候选区域的尺寸参数小于第一比例条件，确定所述人脸候选区域对应小尺度人脸；

通过对应所述小尺度人脸的第一检测模型获取所述人脸候选区域在所述人脸检测模型中至少两层卷积网络所输出特征图上的投影特征；所述至少两层卷积网络包括第一卷积网络和第二卷积网络，所述第一卷积网络所输出特征图的特征分辨率适用于所述尺寸参数，所述第一卷积网络的相邻层卷积网络为所述第二卷积网络，所述第二卷积网络所输出特征图的特征分辨率低于所述第一卷积网络所输出特征图的特征分辨率；

将所述第一卷积网络的投影特征与所述第二卷积网络的投影特征融合得到的融合特征作为所述第一卷积网络的投影特征；

根据所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测。

根据人脸检测模型确定待检测图像中的人脸候选区域；

根据所述人脸候选区域的尺寸参数与比例条件的大小关系，确定所述人脸候选区域所对应人脸的目标尺度，所述目标尺度为多个尺度中的一个，不同尺度的人脸对应不同的检测模型；

根据所述目标尺度的人脸对应的检测模型，对所述人脸候选区域进行人脸检测。

本申请实施例提供了一种人脸检测装置，所述装置包括：

第一确定单元，用于根据人脸检测模型确定待检测图像中的人脸候选区域；所述人脸检测模型包括多层卷积网络；

第二确定单元，用于若所述人脸候选区域的尺寸参数小于第一比例条件，确定所述人脸候选区域对应小尺度人脸；

第一检测单元，用于：

本申请实施例提供了一种人脸检测装置，所述装置包括：

第一确定模块，用于根据人脸检测模型确定待检测图像中的人脸候选区域；

第二确定模块，用于根据所述人脸候选区域的尺寸参数与比例条件的大小关系，确定所述人脸候选区域所对应人脸的目标尺度，所述目标尺度为多个尺度中的一个，不同尺度的人脸对应不同的检测模型；

检测模块，用于根据所述目标尺度的人脸对应的检测模型，对所述人脸候选区域进行人脸检测。

本申请实施例提供了一种人脸检测设备，所述设备包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行以上所述的人脸检测方法。

本申请实施例提供了一种计算机可读存储介质，所述存储介质中存储有程序代码，所述程序代码可以被处理器执行以实现以上所述的人脸检测方法。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1a为本申请实施例提供的待检测图像的示意图；

图1b为本申请实施例提供的人脸检测方法的实施环境示意图；

图2为本申请实施例提供的一种示例性场景示意图；

图3为本申请实施例提供的一种人脸检测方法的流程示意图；

图4为本申请实施例提供的一种利用第一检测模型进行人脸检测的方法的流程示意图；

图5为本申请实施例提供的一种确定第一卷积网络的投影特征的方法的流程示意图；

图6为本申请实施例提供的一种确定人脸候选区域的方法的流程示意图；

图7为本申请实施例提供的一个应用场景示意图；

图8为本申请实施例提供的一种人脸检测模型的结果示意图；

图9为本申请实施例提供的一种检测模型的结构示意图；

图10a为本申请实施例提供的一种precision-recall曲线图；

图10b为本申请实施例提供的又一种precision-recall曲线图；

图11为本申请实施例提供的人脸检测的方法的检测效果示意图；

图12为本申请实施例提供的一种人脸检测方法的流程示意图；

图13a为本申请实施例提供的一种人脸检测装置的结构示意图；

图13b为本申请实施例提供的一种人脸检测装置的结构示意图；

图14a为本申请实施例提供的一种人脸检测装置的结构示意图；

图14b为本申请实施例提供的一种人脸检测装置的结构示意图；

图15为本申请实施例提供的一种人脸检测设备的结构示意图；

图16为本申请实施例提供的一种人脸检测设备的结构示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述。

相关技术中，针对图像中小尺度人脸的检测精度仍然不高，例如在图1所示的图像中，传统方式难以检测到图1中看台处的小尺度人脸。

可见，在人脸检测中，对图像中小尺度人脸的检测是目前亟需解决的问题。

本发明的发明人在研究中发现，在传统的人脸检测方式中，可以利用多层卷积网络来提取人脸候选区域的特征，并基于最后一层卷积网络输出的特征进行人脸识别。由于采用多层卷积网络提取人脸候选区域的特征时，一般是采用逐层提取的方式，后一层卷积网络基于前一层卷积网络所输出的特征继续提取，以得到携带更多的语义信息的特征。而后一层卷积网络在前一层卷积网络所输出的特征的基础上继续提取特征的过程，实际上是对前一层卷积网络所输出的特征进行降采样。因此，后一层卷积网络所输出的特征对应的特征分辨率，低于所述前一层卷积网络所输出的特征对应的特征分辨率。这就导致了最后一层卷积网络所输出的特征对应的特征分辨率，在所述多层卷积网络所输出的特征对应的特征分辨率中，是最低的。而对小尺度人脸进行识别时，对特征分辨率的要求比较高，而最后一层卷积网络输出的特征对应的特征分辨率往往不高。也就是说，最后一层卷积网络输出的特征分辨率，往往不能满足小尺度人脸进行识别时的特征分辨率要求。因此，采用传统的方式往往不能很好地识别出小尺度的人脸。

由于多层卷积网络在提取特征时是采用上述逐层提取的方式，因此，利用多层卷积网络来提取人脸候选区域的特征时，一般低层卷积网络所输出的特征对应的特征分辨率比较高，但携带的语义信息比较少；而高层卷积网络所输出的特征对应的特征分辨率相对比较低，但携带的语义信息比较多。

关于低层卷积网络和高层低层卷积网络，需要说明的是，此处提及的低层和高层是一个相对的概念。例如，第一层卷积网络首先提取人脸候选区域的特征，第二层卷积网络基于第一层卷积网络输出的特征，继续提取人脸候选区域的特征，第一层卷积网络相对于第二层卷积网络来讲是低层卷积网络，第二层卷积网络相对于第一层卷积网络来讲是高层卷积网络。

鉴于此，在本申请实施例中，考虑到相邻层卷积网络所输出的特征的相关度比较高，因此可以利用至少两层相邻层卷积网络所输出的人脸候选区域的特征，来进行小尺度人脸的检测。具体地，可以对所述至少两层相邻层卷积网络输出的人脸候选区域的特征进行特征融合，将融合后得到的融合特征作为所述低层卷积网络的输出特征，再结合所述至少两层相邻层卷积网络的输出特征对所述人脸候选区域进行人脸检测。由于融合得到的融合特征不仅具有低层卷积网络所提取的特征所体现的较高的特征分辨率，而且携带有高层卷积网络所提取的特征所携带的语义信息，故而有助于检测小尺度人脸。

图1b为本申请实施例提供的人脸检测方法的实施环境示意图。其中，终端设备10与服务器设备20之间通过网络30通信连接，所述网络30可以是有线网络，也可以是无线网络。在终端设备10与服务器设备20上集成有本申请任一实施例提供的人脸检测装置，用于实现本申请任一实施例提供的人脸检测方法。具体地，终端设备10可直接执行本申请任一实施例提供的人脸检测方法；或者，终端设备10可将待检测图像发送给服务器设备20，由服务器设备20执行本申请任一实施例提供的人脸检测方法，并将检测结果返回给终端设备10。

以下结合图2所示的场景，对本申请实施例提供的人脸检测方法进行介绍。

在图2所示的场景中，可以利用人脸检测模型202确定待检测图像201中的人脸候选区域203。

在本申请实施例中，所述人脸检测模型202可以配置于人脸检测设备例如可以用于检测人脸的服务器等计算设备上。

本申请实施例中提及的人脸候选区域，是指待检测图像中可能包含人脸的区域。可以理解的是，一个待检测图像201中可以包括若干个人脸候选区域203。一个人脸候选区域203可以对应一个人脸。

本申请实施例中提及的人脸检测模型202，包括多层卷积网络，本申请实施例不具体限定所述人脸检测模型202所包含的卷积神经网络的层数。图2中以3层为例进行说明，但这并不构成对本申请实施例的限定。所述人脸检测模型202所包含的卷积网络的层数也可以为其它数目，例如，所述人脸检测模型202可以如VGG16网络一样，包括5层卷积网络。

本申请实施例不具体限定所述人脸检测模型202确定待检测图像201中的人脸候选区域的具体实现方式。作为一种示例，所述人脸检测模型202可以提取所述待检测图像201的图像特征，并利用所述图像特征确定所述人脸候选区域203。

一般来讲，人脸候选区域203的尺寸参数，与该人脸候选区域203中可能包含的人脸的尺寸参数差别不大，因此，所述人脸候选区域203的尺寸参数，在一定程度上可以表征人脸候选区域203中包含的人脸的尺寸参数。鉴于此，在本申请实施例中，确定人脸候选区域203之后，可以根据所述人脸候选区域的尺寸参数，确定所述人脸候选区域203是否对应于小尺度人脸。本申请实施例不具体限定所述尺寸参数，所述尺寸参数例如可以为所述人脸候选区域203的面积，所述尺寸参数又例如可以为所述人脸候选区域203所包含的像素数目与所述人脸检测模型202所输出的特征图所包含的像素数目的比值。

本申请实施例中提及的小尺度人脸，指的是尺寸参数小于第一比例条件。与传统人脸检测方法可以检测的大尺度人脸是相对的概念。所述小尺度人脸是传统人脸检测方法可以检测的大尺度人脸之外的其它尺度的人脸的统称。

在本申请实施例中，确定所述人脸候选区域203对应小尺度人脸之后，则利用第一检测模型204对所述人脸候选区域203进行人脸检测。

可以理解的是，所述人脸检测模型202在确定待检测图像201中的人脸候选区域的时候，该人脸检测模型202的各层卷积网络，可以提取所述待检测图像的图像特征，并对应输出相应的特征图。而在对人脸候选区域203进行人脸检测时，也需要结合所述人脸候选区域203的特征。因此，在本申请实施例中，所述第一检测模型204在对所述人脸候选区域203进行人脸识别时，可以结合所述人脸检测模型202识别所述待检测图像201中的人脸候选区域时，所提取的所述人脸候选区域203中的特征，对所述人脸候选区域203进行人脸识别。

具体地，在图2所示的场景中，所述第一检测模型204可以将所述人脸候选区域203投影到所述人脸检测模型202的第一卷积网络所输出的特征图上，得到第一投影特征205，将所述人脸候选区域203投影到所述人脸检测模型202的第二卷积网络所输出的特征图上，得到第二投影特征206。然后利用所述第一投影特征205和所述第二投影特征206对所述人脸候选区域203进行人脸识别。可以理解的是，所述第一投影特征即为所述第一卷积网络提取的所述人脸候选区域203的特征，所述第二投影特征即为所述第二卷积网络提取的所述人脸候选区域203的特征。

在本申请实施例中，第一卷积网络与第二卷积网络为相邻层卷积网络。所述第一卷积网络所输出特征图的特征分辨率适用于所述人脸候选区域203的尺寸参数。也就是说，利用所述第一投影特征，可以满足对所述人脸候选区域203进行人脸识别的分辨率要求。所述第二卷积网络所输出特征图的特征分辨率低于所述第一卷积网络所输出特征图的特征分辨率。换言之，所述第二卷积网络相对于第一卷积网络而言，为高层卷积网络。相应地，所述第二卷积网络所输出特征图携带的语义信息，高于所述第一卷积网络所输出特征图携带的语义信息。利用所述第二投影特征，在一定程度上可以满足对所述人脸候选区域203进行人脸识别的语义信息要求。

第一检测模型204利用所述第一投影特征205和第二投影特征206对所述人脸候选区域203进行人脸识别时，为了能够更加准确的识别出所述人脸，将第一投影特征205和第二投影特征206进行特征融合，得到既具有较高的特征分辨率，又携带较多的语义信息的融合特征207，并利用融合特征207和第二投影特征206对所述人脸候选区域203进行人脸检测。相对于传统技术检测小尺度人脸的方式，提高对所述人脸候选区域203的人脸检测精度，即提高了小尺度人脸的检测精度。

本申请实施例不具体限定利用融合特征207和第二投影特征206对所述人脸候选区域203进行人脸检测的具体实现方式。作为一种示例，可以将所述融合特征207和第二投影特征206作为感兴趣区域池化(英文：ROI pooling)层的输入，从而得到相应的检测结果。

以下通过具体实施例对本申请提供的人脸检测方法进行介绍。

参见图3，该图为本申请实施例提供的一种人脸检测方法的流程示意图。

本申请实施例提供的人脸检测方法，例如可以通过如下步骤 S301-S303实现。

步骤S301：根据人脸检测模型确定待检测图像中的人脸候选区域，所述人脸检测模型包括多层卷积网络。

关于所述人脸检测模型以及确定人脸候选区域的描述，可以参考上文中相关内容的描述，此处不再赘述。

步骤S302：若所述人脸候选区域的尺寸参数小于第一比例条件，确定所述人脸候选区域对应小尺度人脸。

本申请实施例不具体限定所述第一比例条件，所述第一比例条件例如可以为第一比例阈值。如前文所述，所述尺寸参数又如可以为所述人脸候选区域所包含的像素数目与所述人脸检测模型所输出的特征图所包含的像素数目的比值。相应地，所述人脸候选区域的尺寸参数小于第一比例条件，例如可以为所述人脸候选区域的尺寸参数小于第一比例阈值。

举例说明，所述尺寸参数小于第一比例条件，例如可以为所述人脸候选区域所包含的像素数目w _p*h _p与所述人脸检测模型所输出的特征图所包含的像素数目w _oi*h _oi的比值，小于1/10，即

其中，人脸候选区域可以看成一个长方形区域，w _p为所述人脸候选区域的宽包括的像素数目，h _p为所述人脸候选区域的高包括的像素数目。w _oi为所述人脸检测模型所输出的特征图的宽包括的像素数目，h _oi为所述人脸检测模型所输出的特征图的高包括的像素数目。

步骤S303：通过对应所述小尺度人脸的第一检测模型对所述人脸候选区域进行人脸检测。

一方面，考虑到传统技术中无法准确地检测出小尺度人脸，是因为用于检测小尺度人脸的特征对应的特征分辨率比较低的原因。因此，在本申请实施例中，在对小尺度人脸进行识别时，要利用特征分辨率适用于所述人脸候选区域的尺寸参数的卷积网络的投影特征。

另一方面，为了准确地检测出人脸，不仅要求用于进行人脸识别的特征对应的特征分辨率满足要求，还要求用于进行人脸识别的特征所携带的语义信息满足要求。而对于小尺度人脸而言，特征分辨率适用于所述人脸候选区域的卷积网络的投影特征，往往携带的语义信息不太多。因此，若仅利用所述特征分辨率适用于所述人脸候选区域的卷积网络的投影特征，可能并不能准确地识别出所述小尺度人脸。

再一方面，在所述人脸检测模型包括的多层卷积神经网络中，越高层的卷积神经网络的投影特征所携带的语义信息越高。但是考虑到相邻层卷积网络所输出的特征之间的相关性比较高，因此，利用相邻层卷积网络所输出的特征来对所述人脸候选区域进行人脸识别，能够更加准确地识别出人脸。

故而在本申请实施例中，可以结合至少两层卷积网络的投影特征，来对所述人脸候选区域进行人脸检测。在所述至少两层卷积网络中，包括能够满足对所述人脸候选区域进行人脸检测的分辨率要求的第一卷积网络的投影特征，以及对能够满足对所述人脸候选区域进行人脸检测的语义信息要求的第二卷积网络的投影特征，来对所述人脸候选区域进行人脸检测。其中，第一卷积网络和第二卷积网络为相邻层卷积网络。

本申请实施例对所述至少两层卷积网络中除所述第一卷积网络和所述第二卷积网络之外的其它卷积网络不做限定，作为一种示例，所述其它卷积网络例如可以为与第二卷积网络相邻的高层卷积网络。

步骤S303在具体实现时，可以通过图4所述的人脸检测方法实现。具体地，可以通过如下步骤S401-S403实现。

步骤S401：通过第一检测模型获取所述人脸候选区域在所述人脸检测模型中至少两层卷积网络所输出特征图上的投影特征。所述至少两层卷积网络包括第一卷积网络和第二卷积网络，所述第一卷积网络所输出特征图的特征分辨率适用于所述尺寸参数，所述第一卷积网络的相邻层卷积网络为所述第二卷积网络，所述第二卷积网络所输出特征图的特征分辨率低于所述第一卷积网络。

在本申请实施例中，所述第一卷积网络所输出特征图的特征分辨率适用于所述尺寸参数，则表示所述第一卷积网络所述输出特征图的特征分辨率，满足对所述人脸候选区域进行人脸识别的分辨率要求。

可以理解的是，所述尺寸参数不同，其适用的特征分辨率也不同，相应地，所述尺寸参数对应的第一卷积网络在所述多层卷积网络中的层数也不同。因此在本申请实施例中，可以根据所述人脸候选区域的尺寸参数，确定所述第一卷积网络具体为所述多层卷积网络中的第几层卷积网络。例如，可以根据尺寸参数范围与卷积网络层数之间的对应关系，确定所述尺寸范围对应的第一卷积网络。举例说明，所述人脸检测模型包括5层卷积网络，其中，该5层卷积网络由低层到高层依次为第1层卷积网络至第5层卷积网络。当所述尺寸参数为一个比较小的尺寸参数例如第一尺寸参数时，考虑到所述第一尺寸参数对分辨率的要求比较高，因此可以将所述5层卷积网络中的低层卷积网络例如第3层卷积网络确定为所述第一卷积网络；当所述尺寸参数为一个比所述第一尺寸参数大的尺寸参数例如为第二尺寸参数时，则所述第二尺寸参数对分辨率的要求低于第一尺寸参数对分辨率的要求，因此可以将所述5层卷积网络中比第3层卷积网络高层的卷积网络例如第4层卷积网络确定为所述第一卷积网络。

如前文所述，高层卷积网络输出的特征携带的语义信息，比低层卷积网络输出的特征携带的语义信息多。而高层卷积网络输出的特征对应的特征分辨率，比低层卷积网络输出的特征对应的特征分辨率低。因此，所述第二卷积网络所输出特征图的特征分辨率低于所述第一卷积网络所输出特征图的特征分辨率，可以表征所述第二卷积网络为所述第一卷积网络的高层卷积网络，所述第二卷积网络所输出特征携带的语义信息，比第一卷积网络所输出特征携带的语义信息多。相应地，可以表征所述第二卷积网络所输出特征携带的语义信息，能够满足对人脸候选区域进行人脸识别的语义信息要求。

可以理解的是，所述人脸检测模型中的卷积神经网络所输出的特征图，不仅包括所述人脸候选区域所对应的特征，还包括所述待检测图像中其它部分对应的特征，而在对所述人脸候选区域进行人脸检测时，要结合所述人脸候选区域对应的特征进行人脸检测。鉴于此，在本申请实施例中，可以将所述人脸候选区域投影到所述卷积网络所输出的特征图上，以获取所述人脸候选区域在所述人脸检测模型中的卷积网络所输出特征图上的投影特征，该投影特征即为所述人脸候选区域对应的特征。

步骤S402：将所述第一卷积网络的投影特征与所述第二卷积网络的投影特征融合得到的融合特征作为所述第一卷积网络的投影特征。

本申请实施例中提及的第一卷积网络的投影特征，可以理解为所述第一卷积网络所输出的特征图中，所述人脸候选区域投影区域对应的特征；所述第二卷积网络的投影特征，可以理解为所述第二卷积网络所输出的特征图中，所述人脸候选区域投影区域对应的特征。可以理解的是，所述第一卷积网络的投影特征对应的特征分辨率比较高，所述第二卷积网络的投影特征携带的语义信息比较多。因此，若对第一卷积网络的投影特征与所述第二卷积网络的投影特征进行融合处理，则可以得到既具有较高的特征分辨率，又携带较多的语义信息的融合特征。

可以理解的是，由于所述第一卷积网络和所述第二卷积网络为相邻层卷积网络，因此，第一卷积网络的投影特征和第二卷积网络的投影特征之间的特征相关性比较高，从而使得对所述第一卷积网络的投影特征与所述第二卷积网络的投影特征融合处理的处理效果更好，从而更有利于准确的检测出所述人脸候选区域中的小尺度人脸。

步骤S403：根据所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测。

可以理解的是，由于在步骤S403中，将所述融合特征作为所述第一卷积网络的投影特征，因此，与将所述人脸候选区域投影到第一卷积网络所输出的特征图上得到的投影特征相比，除了具有比较高的特征分辨率之外，还携带有比较高的语义信息。因此，将所述融合特征作为所述第一卷积网络的投影特征之后，再利用所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测，可以准确的检测出所述人脸候选区域的人脸。

在本申请实施例的一种实现方式中，前述小尺度人脸可以划分成若干种不同尺度的小尺度人脸。具体地，可以以所述尺寸参数所处的参数范围区间作为对所述小尺度人脸进行划分的依据。对于一个参数范围区间，位于该参数范围区间内的尺寸参数，其所适用的特征分辨率均为所述多层卷积网络中第N层卷积网络输出特征图的特征分辨率。例如，以前述包括5层卷积网络的人脸检测模型为例，所述尺寸参数在第一参数范围区间内，第一参数范围区间中的参数最大值为一个比较小的值，则所述人脸候选区域对应小尺度人脸中的较小尺度人脸，其所适用的特征分辨率为第3层卷积网络输出特征图的特征分辨率；若所述尺度范围在第二参数范围区间内，第二参数范围区间与第一参数范围区间不重叠，且第二参数范围区间中的参数最小值，大于第一参数范围区间中的参数最大值。则所述人脸候选区域对应小尺度人脸中的较大尺度人脸例如中尺度人脸，其所适用的特征分辨率为第4层卷积网络输出特征图的特征分辨率。

相应地，所述若干种不同尺度的小尺度人脸分别具有各自对应的第一检测模型，以实现对所述若干种尺度的小尺度人脸的人脸检测。例如，前述小尺度人脸中的较小尺度人脸对应一种第一检测模型，该第一检测模型的网络结构可以参见图9(a)所示；前述小尺度人脸中较大尺度人脸例如中尺度人脸对应一种第一检测模型，该第一检测模型的网络结构可以参见图9(b)所示。关于所述小尺度人脸中的较小尺度人脸对应的第一检测模型的网络结构的具体描述可以参考下文对于图9的描述部分，此处不再赘述。

举例说明，在本申请实施例中，所述小尺度人脸可以划分成两种尺度的人脸，其中一种尺度的人脸对应第一参数范围区间，例如所述尺寸参数

位于第一参数范围区间[0，1/100]；另外一种尺度的人脸可以对应第二参数范围区间，例如所述尺寸参数

位于第二参数范围区间(1/100，1/10)。关于所述尺寸参数

的描述，可以参考上文步骤S302中相关内容的描述，此处不再赘述。

由此可见，在本申请实施例中，是基于人脸候选区域的尺寸参数，确定对应的检测模型对所述人脸候选区域进行人脸检测。即根据人脸候选区域的尺寸参数，确定其对应的第一检测模型对所述人脸候选区域进行人脸检测。也就是说，在本申请实施例中，对于待检测图像中包括的若干个人脸候选区域，可以根据各个人脸候选区域的尺寸参数，自适应的选择与该尺寸参数对应的检测模型有针对性的对该人脸候选区域进行人脸检测，提高了针对不同尺度人脸的检测精度，准确有效的检测出各种尺度的人脸。而不是如传统技术中那样，利用同一个检测模型检测所有的人脸候选区域，导致小尺度人脸不能被准确的识别出来。

在本申请实施例中，不仅可以实现小尺度人脸的人脸检测，也可以实现大尺度人脸的人脸检测。具体地，在本申请实施例的一个示例中，当所述尺寸参数大于第二比例条件时，还可以确定所述人脸候选区域对应大尺度人脸。

本申请实施例不具体限定所述第二比例条件，所述第二比例条件可以根据实际情况确定。

举例说明，所述尺寸参数大于第二比例条件，例如可以为所述人脸候选区域所包含的像素数目w _p*h _p与所述人脸检测模型所输出的特征图所包含的像素数目w _oi*h _oi的比值，大于1/10，即

关于所述尺寸参数

在本申请实施例中，当确定所述人脸候选区域对应大尺度人脸之后，可以通过对应所述大尺度人脸的第二检测模型对所述人脸候选区域进行人脸检测。第二检测模型对所述人脸候选区域进行人脸检测在具体实现时，可以通过如下步骤A-B实现。

步骤A：通过所述第二检测模型获取所述人脸候选区域在所述人脸检测模型中至少两层卷积网络所输出特征图上的投影特征；所述至少两层卷积网络包括第三卷积网络，所述第三卷积网络所输出特征图的特征分辨率适用于所述尺寸参数。

步骤B：根据所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测。

需要说明的是，关于所述第三卷积网络所输出特征图的特征分辨率适用于所述尺寸参数，由于与前述“第一卷积网络所输出特征图的特征分辨率适用于所述尺寸参数”类似，故相关内容可以参考上文关于“第一卷积网络所输出特征图的特征分辨率适用于所述尺寸参数”的描述部分，此处不再赘述。

关于步骤A和步骤B所述对应于大尺度人脸的人脸检测的方法，与前述步骤S301-S303所述对应于对小尺度人脸的人脸检测的方法相比，既有相同点，也有不同点。

其相同点在于，两者均是采用所述人脸检测模型中至少两层卷积网络所输出的特征图上的投影特征来进行人脸检测。关于两者相同的部分(步骤B)，可以参考上文步骤S301-S303的描述，此处不再赘述。

两者的不同点在于，由于在对小尺度人脸对应的人脸候选区域进行人脸检测时，由于其对应的尺寸参数比较小，故所述第一卷积网络的投影特征所携带的语义信息可能比较少。因此，将第一卷积网络的投影特征与所述第二卷积网络的投影特征融合得到的融合特征作为所述第一卷积网络的投影特征，以弥补所述第一卷积网络的投影特征携带语义信息不多的缺陷。而在对大尺度人脸对应的人脸候选区域进行人脸检测时，由于其对应的尺寸参数比较大。因此，所述第三卷积网络很有可能是所述人脸检测模型包含的多层卷积网络中的高层卷积网络。也就是说，所述第三卷积网络，不仅可以满足对大尺度人脸进行识别的特征分辨率要求，其本身也携带有比较多的语义信息。因此，在对所述大尺度人脸对应的人脸候选区域进行人脸检测时，无需对所述第三卷积网络的投影特征进行处理，而是直接根据所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测。

可以理解的是，在实际应用中，待检测图像中可能包含多个人脸候选区域，所述多个人脸候选区域所对应的人脸尺度也可能不同。在传统的人脸检测方式中，对于多个人脸候选区域，只包含一个人脸检测模型，利用这一个人脸检测模型对各个尺度人脸对应的人脸候选区域进行人脸检测。而在本申请实施例中，由于包括第一检测模型和第二检测模型，因此，确定人脸候选区域对应的人脸尺度之后，可以选择对应的检测模型进行人脸检测，而且，第一检测模型和第二检测模型可以并行检测，从而提升了检测待检测图像中的人脸的效率。例如，所述待检测图像中包括两个人脸候选区域，其中第一人脸候选区域对应小尺度人脸，第二人脸候选区域对应大尺度人脸，则可以利用第一检测模型对第一人脸候选区域进行人脸进行检测，利用第二检测模型对第二人脸候选区域进行检测，实现了对不同尺度的人脸的识别。而且，二者可以同时执行，从而提升了对这两个人脸候选区域进行人脸检测的效率。

考虑到在对所述人脸候选区域进行人脸检测的过程中，所述至少两层卷积网络所输出特征图上的投影特征的重要程度不同。若在进行人脸检测时增加所述重要程度高的投影特征的比重，更有利于准确的检测出所述人脸候选区域的人脸。鉴于此，在本申请实施例的一种实现方式中，所述至少两层卷积网络的投影特征设置有权重系数，用于体现各卷积网络的投影特征在人脸检测中的重要程度。

可以理解的是，对于前述第一检测模型检测小尺度人脸的各个投影特征中，所述第一卷积网络的投影特征为融合特征，相较于其它卷积网络的投影特征而言，其既具有较适于小尺度人脸尺寸的特征分辨率，又携带有较多的语义信息。因此，第一卷积网络的投影特征在对所述小尺度人脸进行检测时的重要程度，比其它卷积网络的投影特征的重要程度高。

相应地，对于前述第二检测模型检测大尺度人脸的各个投影特征中，所述第三卷积网络的投影特征既具有较适于大尺度人脸尺寸的特征分辨率，又携带有较多的语义信息。因此，第三卷积网络的投影特征在对所述大尺度人脸进行检测时的重要程度，比其它卷积网络的投影特征的重要程度高。

如前文所述，所述第一卷积网络为特征分辨率适用于小尺度人脸对应的人脸候选区域的尺寸参数，所述第三卷积网络为特征分辨率适用于大尺度人脸对应的人脸候选区域的尺寸参数。因此，在本申请实施例中，在设置权重系数时，特征分辨率适用于所述尺寸参数的卷积网络的权重系数大于其它卷积网络的权重系数，以表征所述特征分辨率适用于所述尺寸参数的卷积网络的投影特征的重要性最高。从而使得在对所述人脸候选区域进行人脸检测的特征中，重要的特征所占的比重更大，更有助于准确的识别出所述人脸候选区域中的人脸。

具体地，对于步骤S301-S303所述的对小尺度人脸对应的人脸候选区域进行人脸检测时，所述第一卷积网络的投影特征的权重系数高于其它卷积网络例如第二卷积网络的投影特征的权重系数。对于步骤A-B所述的对大尺度人脸对应的人脸候选区域进行人脸检测时，所述第三卷积网络的投影特征的权重系数高于其它卷积网络的投影特征的权重系数。

本申请实施例不具体限定所述至少两层卷积网络的投影特征分别对应的权重系数的具体取值，所述至少两层卷积网络的投影特征分别对应的权重系数的具体取值可以根据实际情况确定。

为所述至少两层卷积网络的投影特征设置有权重系数之后，步骤S303和步骤B所述的“根据所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测”在具体实现时，即可根据所述至少两层卷积网络所输出特征图上的投影特征，以及分别对应的权重系数对所述人脸候选区域进行人脸检测。

本申请实施例不具体限定根据所述至少两层卷积网络所输出特征图上的投影特征，以及分别对应的权重系数对所述人脸候选区域进行人脸检测的实现方式，作为一种示例，可以将所述至少两层卷积网络所输出特征图上的投影特征，分别乘以其分别对应的权重系数，然后将乘以权重系数之后的投影特征作为ROI pooling层的输入，从而得到相应的检测结果。

以上对本申请实施例提供的人脸检测方法进行了介绍，以下结合附图介绍以上步骤S402“将所述第一卷积网络的投影特征与所述第二卷积网络的投影特征融合得到的融合特征作为所述第一卷积网络的投影特征”的一种实现方式。

参见图5，该图为本申请实施例提供的一种确定第一卷积网络的投影特征的方法的流程示意图。

所述方法例如可以通过如下步骤S501-S504实现。

步骤S501：通过降低所述第一卷积网络的投影特征中的通道数量得到第一特征。

需要说明的是，考虑到融合特征所携带了所述第一投影特征中缺乏的语义信息，因此，将所述融合特征作为所述第一卷积网络的投影特征来对所述人脸候选区域进行人脸识别时，其计算复杂度相应的提高了。鉴于此，在本申请实施例中，降低所述第一卷积网络的投影特征中的通道数量，得到第一特征，而后第一特征与所述第二卷积网络的投影特征进行特征融合，使得得到的融合特征与“直接将第一卷积网络的投影特征和第二卷积网络的投影特征进行融合”得到的融合特征相比，计算复杂度大大降低了。

步骤S502：通过将所述第二卷积网络的投影特征的特征分辨率提高到与所述第一卷积网络的投影特征的特征分辨率一致，得到第二特征。

关于步骤S502，需要说明的是，由于所述第二卷积网络的投影特征的特征分辨率，比所述第一卷积网络的投影特征的特征分辨率低。而所述第一特征的特征分辨率与所述第一卷积网络的投影特征的特征分辨率相同。因此，所述第二卷积网络的投影特征的特征分辨率，比所述第一特征的特征分辨率低。而特征融合要是基于像素进行的，因此，在本申请实施例中，在对所述第一特征和第二卷积网络的投影特征进行融合之前，要对所述第二卷积网络的投影特征进行处理，使得处理后得到的特征对应的特征分辨率与所述第一特征的特征分辨率相同。

在本申请实施例中，可以将所述第二卷积网络的投影特征的特征分辨率提高到与所述第一卷积网络的投影特征的特征分辨率一致，得到第二特征。在本申请实施例中，考虑到第一卷积网络是所述第二卷积网络的低层网络，第二卷积网络的投影特征，是第一卷积网络的投影特征作为所述第二卷积网络的输入，由所述第二卷积网络进行降采样处理得到的。因此，在本申请实施例中，可以对所述第二卷积网络的投影特征进行上采样处理，从而得到与所述第一卷积网络的投影特征的特征分辨率一致的第二特征。

步骤S503：将所述第一特征和所述第二特征进行像素相加操作得到所述融合特征。

可以理解的是，所述第一特征的特征分辨率与所述第二特征的特征分辨率相同，因此，可以对所述第一特征和所述第二特征进行特征融合。

本申请实施例中提及的像素相加操作，指的是，将所述第一特征中各个像素的特征，与第二特征中该像素对应的像素的特征进行相加。

步骤S504：将所述融合特征作为所述第一卷积网络的投影特征。

可以理解的是，由于所述融合特征是所述第一特征和所述第二特征进行像素相加操作得到的，因此，对于所述融合特征中的每一个像素，其既携带有所述第一特征的特征信息，也携带有所述第二特征的特征信息。因此，所述融合特征不仅具有较高的特征分辨率，而且携带较多的语义信息。

以下结合附图介绍步骤S301中“根据人脸检测模型确定待检测图像中的人脸候选区域”的一种实现方式。

考虑到传统技术中，确定人脸候选区域时，可以在待检测图像中均匀的生成锚框的方式，确定人脸候选区域。其中，生成锚框是指，以待检测图像中的某个像素点作为锚框的中心点，生成包含若干像素点的像素框。但是，利用传统方式所确定的人脸候选区域的数量比较多，因此，使得人脸检测模型在对待检测图像进行人脸检测时要检测的人脸候选区域的数量比较多，导致对所述待检测图像进行人脸检测的效率比较低。

鉴于此，在本申请实施例中，对确定人脸候选区域的方式做出来改进，使得确定出的人脸候选区域的数量变少了，从而提升了对待检测图像进行人脸检测的效率。具体地，可参见图6，该图为本申请实施例提供的一种确定人脸候选区域的方法的流程示意图。

所述方法例如可以通过如下步骤S601-S604实现。

步骤S601：获取所述待检测图像中的人脸感兴趣区域。

此处提及的人脸感兴趣区域，与人脸候选区域是比较相似的概念，均是指可能包含人脸的区域。在本申请实施例中，所述人脸感兴趣区域可以用于确定人脸候选区域。本申请实施例不具体限定获取人脸感兴趣区域的实现方式，作为一种示例，考虑到基于级联Boosting的人脸检测器，能够快速的确定出待处理图像中的人脸感兴趣区域。因此，可以利用基于级联Boosting的人脸检测器获取待检测图像中的人脸感兴趣区域。

步骤S602：将所述人脸感兴趣区域投影到根据所述人脸检测模型输出的特征图上，得到第一特征图。

步骤S603：在所述第一特征图上生成锚框，得到第二特征图；在生成锚框的过程中，若目标锚框的中心点未与所述人脸感兴趣区域重叠，增大所述目标锚框的划窗步长。

在本申请实施例中，所述人脸检测模型输出的特征图，可以为所述人脸检测模型所包括的多层卷积网络中，最后一层卷积网络所输出的特征图。所述第一特征图，可以理解能够体现为所述人脸检测模型输出的特征图中，何处对应所述人脸感兴趣区域的图像特征图。

在本申请实施例中，考虑到所述人脸感兴趣区域是人脸候选区域的可能性比较大，因此，在结合所述人脸感兴趣区域和所述人脸检测模型提取的图像特征来确定所述人脸候选区域时。可以重点分析所述人脸感兴趣区域对应的图像特征。

在本申请实施例中，采用在在所述第一特征图上生成锚框的方式确定所述人脸候选区域。具体地，由于所述人脸感兴趣区域为人脸候选区域的可能性比较大，因此，当锚框的中心点与所述人脸感兴趣区域重叠时，可以均匀地生成锚框。而人脸感兴趣区域之外的区域为人脸候选区域的可能性比较小，鉴于此，在本申请实施例中，为了减少确定的所述人脸候选区域的数量，当目标锚框的中心点未与所述人脸感兴趣区域重叠时，可以增大所述目标锚框的划窗步长。也就是说，对于整个待检测图像而言，所生成的锚框是非均匀分布的。在人脸感兴趣区域之外，锚框的分布密度相对于人脸感兴趣区域内的分布密度低，从而减少了锚框数量，相应的减少了确定出的人脸候选区域的数量。举例说明，当锚框的中心点与所述人脸感兴趣区域重叠时，可以以步长1均匀地生成锚框，在均匀生成锚框的过程中，若目标锚框的中心点位于所述人脸感兴趣区域之外，则可以将所述目标锚框的划窗步长设置为2。

在本申请实施例中，考虑到人脸目标的形状特性，可以将每个锚框的长宽比设定为1:1和1:2，而锚框尺度设定为包含128 ²、256 ²和512 ²个像素的三种像素框，因此对于人脸感兴趣区域内每一个位置都对应6个不同的锚框，从而有利于准确的确定出人脸候选区域。

步骤S604：根据多个人脸检测任务的损失函数计算所述第二特征图中的人脸候选区域，并将确定出的人脸候选区域作为所述待检测图像的人脸候选区域。

在本申请实施例中，可以将所述第二特征图作为所述损失函数的输入，从而确定出人脸候选区域，并将所述确定出的人脸候选区域作为所述待检测图像的人脸候选区域。

在本申请实施例中，考虑到在多任务损失函数中，加入高相关度的任务时会提高主任务的精度。因此，所述损失函数，可以是基于所述多个人脸检测任务进行联合训练得到的。其中，所述多个任务之间具有高相关度。

在本申请实施例中，所述多个人脸检测任务包括针对人脸目标的分类任务、针对人脸目标框的位置回归任务以及针对人脸关键点的位置回归任务。其中所述针对人脸目标的分类任务，是指检测出人脸和非人脸；所述针对人脸目标框的位置回归任务，是指在检测出人脸的前提下，要检测出人脸所处的位置；所述针对人脸关键点的位置回归任务，是指检测出人脸的前提下，检测出人脸上的关键位置，所述关键位置例如可以为鼻子、眼睛、嘴巴以及眉毛中的任意一个或组合。

可以理解的是，在对人脸进行检测时，首先要检测出人脸和非人脸；其次，在检测出人脸的前提下，要检测出人脸所处的位置，即确定出人脸目标框的位置。因此，在本申请实施例中，在训练所述损失函数时，所述针对人脸目标的分类任务和针对人脸目标框的位置回归任务可以认为是必须的。而对于所述针对人脸关键点的位置回归任务，其虽然与人脸检测具有比较高的相关度，但是其并不是必须的。

因此，在本申请实施例中，可以将所述针对人脸目标的分类任务和针对人脸目标框的位置回归任务作为主任务，将所述针对人脸关键点的位置回归任务作为辅助任务联合训练各自对应的损失函数。

在本申请实施例中，基于前述主任务和辅助任务训练得到的损失函数，可以用以下公式(1)来表示：

所述公式(1)由四部分相加组成，其中第一部分

即为前述针对人脸目标的分类任务的损失函数，第二部分

即为前述针对人脸目标框的位置回归任务的损失函数，第三部分

为前述针对人脸关键点的位置回归任务的损失函数，第四部分

为权重。

关于前两部分由于与传统损失函数的表示方式类似，故在此不再详细介绍。只是需要强调的是第一部分和第二部分中

以及w ^r中的r表示主任务。

关于第三部分

需要说明的是，

以及w ^a中的上标a表示辅助任务，即人脸关键点的位置回归任务。下标i表示输入数据标号，N表示总的数据，λ ^a表示第a个辅助任务的重要系数，x表示输入样本，y表示输入样本对应的实际输出结果，f(x _i；w ^a)表示输入样本对应的模型预测的结果。

需要说明的是，虽然在人脸检测主任务中加入了人脸关键点检测的辅助任务，可以有效地提高人脸检测主任务的检测精度。但在损失函数中辅助任务的加入会导致整个模型难以收敛，并出现模型参数陷入局部极小值的情况，从而无法得到最优解。因此本申请实施例提供的训练过程可以在保证了模型很好收敛的同时通过人脸关键点检测来提高人脸检测的准确率。

在本申请实施例中，所述人脸检测模型是通过训练得到的。本发明在训练所述人脸检测模型的过程中，使用60k次随机提低下降方法SGD对模型进行微调，起始学习率设定为0.001，在经过20k次迭代后将学习率下降为0.0001。另外，将动量(Momentum)和权重衰减(Weight decay)分别设置为0.9和0.0005，Mini-batch的大小设置为128。

为了提高人脸检测模型对于各个尺度人脸以及小尺度人脸的检测效果，在训练人脸检测模型的过程中，采用了难分样本挖掘和数据增广操作，以实现对训练样本的扩增，从而加快训练得到所述人脸检测模型的速度。

在本申请实施例中，所述难分样本挖掘是指，通过最高置信得分将所有的负样本进行排序，只选得分最高的负样本，通过不断迭代该过程实现正负样本的比例为1:3，这样的难分样本挖掘方法可以加快网络优化的速度，并且使网络训练过程更加稳定。

在本申请实施例中，所述数据增广处理可以包括以下三种情况。

(1)对原始图像进行翻折操作。

(2)随机采样一个样本碎片，对于每个样本随便的尺度设定在原始图像的[0.5,1]内，并且设定矩形框的长宽比例关系在原始图像的[0.5,2]内，从而生成新的训练样本。

(3)随机对原始图像进行剪裁操作。

以上对本申请实施例提供的人脸检测方法进行了介绍，以下结合具体场景，对以上实施例介绍的人脸检测方法进行介绍。

参见图7，该图为本申请实施例提供的一个应用场景示意图。在图7所示的场景中，包括两个第一检测模型，分别为第一检测模型(a)和第一检测模型(b)。第一检测模型(a)适用的尺寸范围区间内的尺寸参数，小于第一检测模型(b)适用的尺寸范围区间内的尺寸参数。

图7所示的方法，可以通过如下步骤S701-S709实现。

步骤S701：基于级联Boosting的人脸检测器获取待检测图像中的人脸感兴趣区域。

步骤S702：将所述人脸感兴趣区域投影到根据所述人脸检测模型输出的特征图上，得到第一特征图。

步骤S703：在所述第一特征图上生成锚框得到第二特征图。

步骤S704：判断目标锚框的中心点是否与所述人脸感兴趣区域重叠，如果是，执行步骤S705a，如果否，执行步骤S705b。

步骤S705a：将划窗步长设置为1。

步骤S705b：将划窗步长设置为2。

步骤S706:根据多个人脸检测任务的损失函数计算所述第二特征图中的人脸候选区域。

步骤S707：判断人脸候选区域的尺寸参数是否小于第一比例条件。

如果人脸候选区域的尺寸参数小于第一比例条件，执行步骤S708，如果人脸候选区域的尺寸参数大于第一比例条件，则可以确定所述人脸候选区域对应大尺度人脸，则利用第二检测模型对所述人脸候选区域进行人脸检测。

步骤S708：判断人脸候选区域的尺寸参数位于第一参数范围区间。

如果人脸候选区域的尺寸参数位于第一参数范围区间，则确定所述人脸候选区域对应小尺度人脸中较小尺度人脸，则利用第一检测模型(a)对所述人脸候选区域进行人脸检测。

如果人脸候选区域的尺寸参数不位于第一参数范围区间，则确定所述人脸候选区域对应小尺度人脸中较大尺度人脸，则利用第一检测模型(b)对所述人脸候选区域进行人脸检测。

步骤S709：合并检测结果。

对所述第一检测模型(a)、第一检测模型(b)以及第二检测模型的检测结果进行合并，实现对所述待检测图像中各个尺度的人脸的检测。

而且，所述第一检测模型(a)、第一检测模型(b)以及第二检测模型可以并行处理，也就是说，同时最多可以对三个人脸候选模型进行人脸检测，提升了对所述待检测图像进行人脸识别的效率。

关于图7所示的方法，以下结合图8所示的人脸检测模型来进行介绍。

参见图8，该图为本申请实施例提供的一种人脸检测模型的结构示意图。

图8所示的人脸检测模型采用类似VGG16的网络结构，其包括5层卷积网络，分别为conv1、conv2、conv3、conv4和conv5。其中，conv1 包括两个卷积层，分别为801和802；conv2包括两个卷积层，分别为803和804；conv3、conv4和conv5分别包括三个卷积层，如图8中所示805-813。

如图8所示，可以利用级联Boosting检测器814获取人脸感兴趣区域，然后，将所述人脸感兴趣区域投影到卷积层814输出的特征图上，得到第一特征图(图8中未示出)；在所述第一特征图上生成锚框，得到第二特征图(图8中未示出)，将所述第二特征图作为损失函数层815的输入，以得到人脸候选区域。其中损失函数层815的损失函数包括针对人脸目标的分类任务的损失函数softmax，针对人脸目标框的位置回归任务的损失函数bbox regressor、以及针对人脸关键点的位置回归任务的损失函数landmark regressor。

在图8所示的场景中，是利用三层卷积网络的投影特征对人脸候选区域进行人脸检测，具体地，利用conv3、conv4和conv5的投影特征对人脸候选区域进行人脸检测。将利用conv3的投影特征816、conv4的投影特征817和conv5的投影特征818，输入ROI Pooling层，ROI Pooling层对投影特征816、817和818进行处理，得到特征819，然后对特征819进行归一化处理，得到特征820，最后将特征820输入两层全连接层(简称FC层)，得到人脸检测结果。其中检测结果包括：是否是人脸(对应图8中人脸目标的分类任务的分类结果821)以及人脸框的位置(针对图8中人脸目标框的位置回归任务的结果822)。

为方便描述，将步骤S709中所述的“小尺度人脸中的较小尺度人脸”称为小尺度人脸，将步骤S709中所述的“小尺度人脸中的较大尺度人脸”称为中尺度人脸。以下结合图9，介绍利用卷积网络conv3、conv4和conv5的投影特征，对上述三种尺度人脸的检测方法。

参见图9，该图为本申请实施例提供的一种检测模型的结构示意图的示意图。

在图9中，(a)示出了利用conv3、conv4和conv5的投影特征识别小尺度人脸的示意图。

具体地，所述conv3为第一卷积网络，conv4为第二卷积网络。对conv3_3的投影特征通过1×1卷积层((a)中所示1×1conv)进行降通道处理。由于conv4_3和conv3_3之间，包括两层卷积层，分别为conv4_1和conv4_2(即图8所示808和809)，因此，从所述conv3_3的投影特征到所述conv4_3的投影特征，经历了两次降采样，为了使得conv4_3的投影特征的特征分辨率与所述conv3_3的投影特征的特征分辨率相同，故而在此对所述并对conv4_3的投影特征进行两次上采样处理((a)中所示×2upsampling)。而后将所述将通道处理之后得到的特征和上采样处理得到的特征进行像素相加，得到融合特征，将所述融合特征作为第一卷积网络conv3的投影特征。然后基于所述conv3、conv4和conv5的投影特征，以及分别对应的权重系数α _small、β _small和γ _small，对所述小尺度人脸进行检测。其中，conv3_3表示conv3的第三层卷积层，即图8所示的卷积层807，conv4_3表示conv4的第三层卷积层，即图8所示的卷积层810；conv5_3表示conv5的第三层卷积层，即图8所示的卷积层813。

关于图9所示(b)，其原理与(a)类似，故在此不再赘述。两者的不同之处体现为两点。

第一、(b)用于检测中尺度人脸，因此，与其尺寸参数匹配的卷积网络为conv4，故而在(b)中，所述conv4为第一卷积网络，conv5为第二卷积网络。

第二、(a)中权重系数α _small、β _small和γ _small中，conv3对应的权重系数α _small最大，因为conv3对应的特征分辨率适用于小尺度人脸的尺寸参数；而由于conv4对应的特征分辨率适用于中尺度人脸的尺寸参数，因此(b)中所示的权重系数α _small、β _small和γ _small，conv4对应的权重系数β _small最大。

关于图9所示(c)，在对大尺度人脸进行人脸识别时，无需进行融合处理，直接利用所述conv3、conv4和conv5的投影特征，以及分别对应的权重系数α _small、β _small和γ _small，对所述大尺度人脸进行检测。可以理解的是，由于conv3对应的特征分辨率适用于小尺度人脸的尺寸参数，conv4对应的特征分辨率适用于中尺度人脸的尺寸参数，因此，无论是conv3和conv4，都可以满足对所述大尺度人脸进行人脸检测的特征分辨率的要求。甚至，所述conv5也适用于所述大尺度人脸的尺寸参数。关于(c)中权重系数α _small、β _small和γ _small的具体取值，可以根据实际情况确定。例如，若所述conv5可以适用于所述大尺度人脸的尺寸参数，则可以将conv5对应的权重系数γ _small设置为最大。若所述conv5可以不适用于所述大尺度人脸的尺寸参数，则由于相较于cov3而言，conv4的投影特征携带的语义信息更多，因此可以将conv4对应的权重系数β _small设置为最大，以使得检测出的人脸更加准确。

以下结合具体检测数据说明本申请实施例提供的人脸检测方法的检测效果，参见图10a所示，图10a示出了利用本申请实施例提供的人脸检测方法和传统的人脸检测方法，对人脸检测模型训练过程中使用的验证集进行人脸检测得到的精度-召回率(precision-recall)曲线图。

所述验证集可以包括多张图像，所述多张图像例如可以为包括不同尺度的人脸的图像。所述验证集中的多张图像可以用于检测人脸检测模型在训练的迭代过程中的人脸检测效果。

其中：

图10a中的曲线①为利用ACF-WIDER人脸检测方法对验证集进行人脸检测得到的precision-recall曲线；

图10a中的曲线②为利用Two-stage-CNN人脸检测方法对验证集进行人脸检测得到的precision-recall曲线；

图10a中的曲线③为利用Faceness-WIDER人脸检测方法对验证集进行人脸检测得到的precision-recall曲线；

图10a中的曲线④为利用Multiscale Cascade CNN人脸检测方法对验证集进行人脸检测得到的precision-recall曲线；

图10a中的曲线⑤为利用LDCF+人脸检测方法对验证集进行人脸检测得到的precision-recall曲线；

图10a中的曲线⑥为利用Multitask Cascade CNN人脸检测方法对验证集进行人脸检测得到的precision-recall曲线；

图10a中的曲线⑦为利用CMS-RCNN人脸检测方法对验证集进行人脸检测得到的precision-recall曲线；

图10a中的曲线⑧为利用HR人脸检测方法对验证集进行人脸检测得到的precision-recall曲线；

图10a中的曲线⑨为利用本申请实施例提供的人脸检测方法对验证集进行人脸检测得到的precision-recall曲线。

从图10a可以看出，在召回率相同时，本申请实施例提供的人脸检测方法的人脸检测精度更高；在检测精度相同时，本申请实施例提供的人脸检测方法的召回率更高。也就是说，本申请实施例提供的人脸检测方法，无论是检测精度、还是召回率都比传统方式的人脸检测方法的效果好。换言之，本申请实施例的人脸检测模型在迭代过程中的检测精度和召回率都比较高。

参见图10b所示，图10b示出了利用本申请实施例提供的人脸检测方法和传统的人脸检测方法，对人脸检测模型训练过程中使用的测试集进行人脸检测得到的精度-召回率(precision-recall)曲线图。

所述测试集可以包括多张图像，所述多张图像例如可以为包括不同尺度的人脸的图像。所述多张图像可以用于检测训练得到的人脸检测模型的人脸检测效果。

其中：

图10b中的曲线①为利用ACF-WIDER人脸检测方法对测试集进行人脸检测得到的precision-recall曲线；

图10b中的曲线②为利用Two-stage-CNN人脸检测方法对测试集进行人脸检测得到的precision-recall曲线；

图10b中的曲线③为利用Faceness-WIDER人脸检测方法对测试集进行人脸检测得到的precision-recall曲线；

图10b中的曲线④为利用Multiscale Cascade CNN人脸检测方法对测试集进行人脸检测得到的precision-recall曲线；

图10b中的曲线⑤为利用LDCF+人脸检测方法对测试集进行人脸检测得到的precision-recall曲线；

图10b中的曲线⑥为利用Multitask Cascade CNN人脸检测方法对测试集进行人脸检测得到的precision-recall曲线；

图10b中的曲线⑦为利用CMS-RCNN人脸检测方法对测试集进行人脸检测得到的precision-recall曲线；

图10b中的曲线⑧为利用HR人脸检测方法对测试集进行人脸检测得到的precision-recall曲线；

图10b中的曲线⑨为利用本申请实施例提供的人脸检测方法对测试集进行人脸检测得到的precision-recall曲线。

从图10b可以看出，在召回率相同时，本申请实施例提供的人脸检测方法的人脸检测精度更高；在检测精度相同时，本申请实施例提供的人脸检测方法的召回率更高。也就是说，本申请实施例提供的人脸检测方法，无论是检测精度、还是召回率都比传统方式的人脸检测方法的效果好。换言之，本申请实施例中使用的训练得到的人脸检测模型，对待检测图像进行人脸检测的精度和召回率都比较高。

结合图10a和图10b可以看出，利用本申请实施例提供的人脸检测模型进行人脸识别，无论是在对人脸检测模型训练的迭代过程中，还是利用训练得到的人脸检测模型，与传统的人脸检测方法相比，都具有较高的精度和较高的召回率。

可以理解的是，前述提及的验证集以及测试集，均为包含多个图像的图像集合。所述验证集(或者测试集)中的图像，可以为包含多种尺度的人脸的图像，利用本申请实施例提供的人脸检测方法，可以有效的检测出包含多尺度人脸的图像中各个尺度的人脸。可结合图11进行理解。

图11示出了本申请实施例提供的人脸检测的方法的检测效果，图11中一个小框框表示一个识别出的人脸。从图11可以看出，利用本申请实施例提供的人脸检测方法，可以检测出各个尺度的人脸，例如图11中左上角的图像中楼梯附近的小尺度人脸和坐在沙发上的大尺度的人脸，都可以精确的检测出来。

基于以上实施例提供的人脸检测方法，以下从整体角度描述本申请实施例提供的又一种人脸检测方法。

参见图12，该图为本申请实施例提供的又一种人脸检测方法的流程示意图。该方法例如可以通过如下步骤S1201-S1203实现。

步骤S1201：根据人脸检测模型确定待检测图像中的人脸候选区域。

需要说明的是，此处提及的人脸检测模型，可以与前述实施例步骤S301中提及的人脸检测模型相同，该人脸检测模型可以包括多层卷积网络。关于根据人脸检测模型确定待检测图像中的人脸候选区域的实现方式，与前述实施例步骤S301中“根据人脸检测模型确定待检测图像中的人脸候选区域”相同，可以参考前述实施例步骤S301中相关内容的描述，此处不再赘述。

步骤S1202：根据所述人脸候选区域的尺寸参数与比例条件的大小关系，确定所述人脸候选区域所对应人脸的目标尺度，所述目标尺度为多个尺度中的一个，不同尺度的人脸对应不同的检测模型。

步骤S1203：根据所述目标尺度的人脸对应的检测模型，对所述人脸候选区域进行人脸检测。

本申请实施例提供的人脸检测方法，可以对待检测图像中的多个尺度的人脸进行检测。在本申请实施例中，考虑到人脸候选区域的尺寸参数，在一定程度上可以表征人脸候选区域中包含的人脸的尺寸参数，因此，可以根据人脸候选区域的尺寸参数与比例条件的大小关系，确定所述人脸候选区域所对应人脸的目标尺度。

在本申请实施例中，所述目标尺度例如可以为小尺度或者大尺度。具体地，在本申请实施例中，若所述人脸候选区域的尺寸参数小于或等于第一比例条件，确定所述人脸候选区域所对应人脸的目标尺度为小尺度；若所述人脸候选区域的尺寸参数大于第二比例条件，确定所述人脸候选区域所对应人脸的目标尺度为大尺度。

关于人脸候选区域的尺寸参数以及第一比例条件的描述，可以参考前述实施例步骤S301中关于尺寸参数的描述部分，此处不再赘述；关于所述第二比例条件，可以参考前述实施例对于第二比例条件的描述，此处不再详述。

在本申请实施例中，包括多个人脸检测模型，分别用于检测各个尺度的人脸。因此，在确定人脸候选区域所对应人脸的目标尺度之后，可以利用目标尺度的人脸对应的检测模型，对所述人脸候选区域进行人脸检测。

在本申请实施例中，若所述人脸候选区域所对应人脸的目标尺度为小尺度，则可以利用前述实施例提及的第一检测模型，对所述人脸候选区域进行检测。关于利用第一检测模型对小尺度人脸进行检测的具体实现方式，可以参考前述实施例的描述部分，此处不再详述。

在本申请实施例中，若所述人脸候选区域所对应人脸的目标尺度为大尺度，则可以利用前述实施例提及的第二检测模型，对所述人脸候选区域进行检测。关于利用第二检测模型对大尺度人脸进行检测的具体实现方式，可以参考前述实施例的描述部分，此处不再详述。

所述小尺度还可以进一步细分为多个不同尺度的小尺度。所述若干种不同尺度的小尺度人脸分别具有各自对应的第一人脸检测模型，以实现对所述若干种尺度的小尺度人脸的人脸检测。

可以理解的是，待检测图像可以包括多个人脸检测区域，对于任意一个人脸检测区域，均可以执行步骤S1202-S1203的方法，对该人脸检测区域进行人脸检测。在本申请实施例中，若待检测图像包括多个人脸检测区域，可以分别利用步骤S1202-S1203的方法对多个人脸检测区域进行人脸检测，然后分别获取所述多个人脸候选区域的多个人脸检测结果；将所述多个人脸检测结果合并，以得到包括该待检测图像中的各个尺度的人脸的人脸检测结果。

由此可见，利用本申请实施例提供的人脸检测方法，确定人脸候选区域对应的人脸尺度之后，可以选择对应的检测模型进行人脸检测，实现了对不同尺度的人脸的识别。

基于前述图2至图9对应的实施例提供的一种人脸检测方法，本实施例提供一种人脸检测装置1300，参见图13a，所述装置1300包括：第一确定单元1301、第二确定单元1302和第一检测单元1303。

第一确定单元1301，用于根据人脸检测模型确定待检测图像中的人脸候选区域；所述人脸检测模型包括多层卷积网络；

第二确定单元1302，用于若所述人脸候选区域的尺寸参数小于第一比例条件，确定所述人脸候选区域对应小尺度人脸；

第一检测单元1303，用于通过对应所述小尺度人脸的第一检测模型对所述人脸候选区域进行人脸检测，包括：

通过所述第一检测模型获取所述人脸候选区域在所述人脸检测模型中至少两层卷积网络所输出特征图上的投影特征；所述至少两层卷积网络包括第一卷积网络和第二卷积网络，所述第一卷积网络所输出特征图的特征分辨率适用于所述尺寸参数，所述第一卷积网络的相邻层卷积网络为所述第二卷积网络，所述第二卷积网络所输出特征图的特征分辨率低于所述第一卷积网络所输出特征图的特征分辨率；

在一种实现方式中，若所述人脸候选区域的尺寸参数大于第二比例条件，参见图13b，所述装置1300还包括：第三确定单元1304和第二检测单元1305。

第三确定单元1304，用于确定所述人脸候选区域对应大尺度人脸；

第二检测单元1305，用于通过对应所述大尺度人脸的第二检测模型对所述人脸候选区域进行人脸检测，包括：

通过所述第二检测模型获取所述人脸候选区域在所述人脸检测模型中至少两层卷积网络所输出特征图上的投影特征；所述至少两层卷积网络包括第三卷积网络，所述第三卷积网络所输出特征图的特征分辨率适用于所述尺寸参数；

在一种实现方式中，所述至少两层卷积网络分别设置有权重系数，在所述至少两层卷积网络中，特征分辨率适用于所述尺寸参数的卷积网络的权重系数大于其它卷积网络的权重系数；

所述根据所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测，包括：

根据所述至少两层卷积网络所输出特征图上的投影特征，以及分别对应的权重系数对所述人脸候选区域进行人脸检测。

在一种实现方式中，所述将所述第一卷积网络的投影特征与所述第二卷积网络的投影特征融合得到的融合特征作为所述第一卷积网络的投影特征，包括：

通过降低所述第一卷积网络的投影特征中的通道数量得到第一特征；

通过将所述第二卷积网络的投影特征的特征分辨率提高到与所述第一卷积网络的投影特征的特征分辨率一致，得到第二特征；

将所述第一特征和所述第二特征进行像素相加操作得到所述融合特征；

将所述融合特征作为所述第一卷积网络的投影特征。

在一种实现方式中，所述第一确定单元1301，具体用于：

获取所述待检测图像中的人脸感兴趣区域；

将所述人脸感兴趣区域投影到根据所述人脸检测模型输出的特征图上，得到第一特征图；

在所述第一特征图上生成锚框，得到第二特征图；在生成锚框的过程中，若目标锚框的中心点未与所述人脸感兴趣区域重叠，增大所述目标锚框的划窗步长；

根据多个人脸检测任务的损失函数计算所述第二特征图中的人脸候选区域，并将确定出的人脸候选区域作为所述待检测图像的人脸候选区域。

在一种实现方式中，所述多个人脸检测任务包括针对人脸目标的分类任务、针对人脸目标框的位置回归任务和针对人脸关键点的位置回归任务，所述多个人脸检测任务的损失函数根据下列方式训练得到：

将所述针对人脸目标的分类任务和针对人脸目标框的位置回归任务作为主任务，将所述针对人脸关键点的位置回归任务作为辅助任务联合训练各自对应的损失函数。

由上述技术方案可以看出，根据包括多层卷积网络的人脸检测模型确定待检测图像中的人脸候选区域，根据人脸候选区域的尺寸参数确定人脸候选区域是否对应的是小尺度人脸，若是，通过用于识别小尺度人脸的第一检测模型对人脸候选区域进行人脸检测，在对人脸候选区域进行人脸检测中，获取人脸候选区域在人脸检测模型中至少两层卷积网络所输出特征图上的投影特征，至少两层卷积网络包括第一卷积网络和第二卷积网络，其中第一卷积网络是根据人脸候选区域的尺寸参数确定的，故第一卷积网络所输出特征图的特征分辨率相对较高，适用于检测具有该尺寸参数的人脸候选区域，而第二卷积网络为第一卷积网络的相邻层卷积网络，虽然特征分辨率没有第一卷积网络高，但是基于人脸检测模型的特性，相对于第一卷积网络，第二卷积网络所输出的特征图携带有更多的语义信息，故将第一卷积网络的投影特征与第二卷积网络的投影特征融合得到的融合特征，不仅具有较高的特征分辨率，而且携带较多的语义信息，有助于检测小尺度人脸，故将该融合特征作为第一卷积网络的投影特征并根据至少两层卷积网络的投影特征对所述人脸候选区域进行人脸检测时，可以提高小尺度人脸的检测精度。

基于前述图12对应的实施例提供的一种人脸检测方法，本实施例提供一种人脸检测装置1400，参见图14a，所述装置1400包括：第一确定模块1401、第二确定模块1402和检测模块1403。

第一确定模块1401，用于根据人脸检测模型确定待检测图像中的人脸候选区域；

第二确定模块1402，用于根据所述人脸候选区域的尺寸参数与比例条件的大小关系，确定所述人脸候选区域所对应人脸的目标尺度，所述目标尺度为多个尺度中的一个，不同尺度的人脸对应不同的检测模型；

检测模块1403，用于根据所述目标尺度的人脸对应的检测模型，对所述人脸候选区域进行人脸检测。

在一种实现方式中，所述第二确定模块1402，具体用于：

若所述人脸候选区域的尺寸参数小于或等于第一比例条件，确定所述人脸候选区域所对应人脸的目标尺度为小尺度；

若所述人脸候选区域的尺寸参数大于第二比例条件，确定所述人脸候选区域所对应人脸的目标尺度为大尺度。

在一种实现方式中，所述待检测图像包括多个人脸候选区域，参见图14b，所述装置1400还包括：获取单元1404和合并单元1405。

获取单元1404，用于分别获取所述多个人脸候选区域的多个人脸检测结果；

合并单元1405，用于将所述多个人脸检测结果合并作为所述待检测图像的人脸检测结果。

由此可见，利用本申请实施例提供的人脸检测装置，确定人脸候选区域对应的人脸尺度之后，可以选择对应的检测模型进行人脸检测，实现了对不同尺度的人脸的识别。

本申请实施例还提供了一种人脸检测设备，下面结合附图对人脸检测设备进行介绍。请参见图15所示，本申请实施例提供了一种人脸检测设备1500，该设备1500可以是服务器等计算设备，可因配置或性能不同而产生比较大的差异，可以包括一个或一个以***处理器(Central Processing Units，简称CPU)1522(例如，一个或一个以上处理器)和存储器1532，一个或一个以上存储应用程序1542或数据1544的存储介质1530(例如一个或一个以上海量存储设备)。其中，存储器1532和存储介质1530可以是短暂存储或持久存储。存储在存储介质1530的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1522可以设置为与存储介质1530通信，在人脸检测设备1500上执行存储介质1530中的一系列指令操作，以实现本申请任一实施例所述的人脸检测方法。

人脸检测设备1500还可以包括一个或一个以上电源1526，一个或一个以上有线或无线网络接口1550，一个或一个以上输入输出接口1558，和/或，一个或一个以上操作***1541，例如Windows Server ^TM，Mac OS X ^TM，Unix ^TM,Linux ^TM，FreeBSD ^TM等等。

上述实施例中执行图2至图9所述的人脸检测方法可以基于该图15所示的服务器结构。

其中，CPU 1522用于执行如下步骤：

通过对应所述小尺度人脸的第一检测模型对所述人脸候选区域进行人脸检测，包括：

上述实施例中执行图12所述的人脸检测方法可以基于该图15所示的服务器结构。

其中，CPU 1522用于执行如下步骤：

根据人脸检测模型确定待检测图像中的人脸候选区域；

请参见图16所示，本申请实施例提供了一种人脸检测设备1600，该设备1600还可以是终端设备等计算设备，该终端设备可以为包括手机、平板电脑、个人数字助理(Personal Digital Assistant，简称PDA)、销售终端(Point of Sales，简称POS)、车载电脑等任意终端设备，以终端设备为手机为例。

图16示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图16，手机包括：射频(Radio Frequency，简称RF)电路1610、存储器1620、输入单元1630、显示单元1640、传感器1650、音频电路1660、无线保真(wireless fidelity，简称WiFi)模块1670、处理器1680、以及电源1690等部件。本领域技术人员可以理解，图16中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图16对手机的各个构成部件进行具体的介绍：

RF电路1610可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器1680处理；另外，将设计上行的数据发送给基站。通常，RF电路1610包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low Noise Amplifier，简称LNA)、双工器等。此外，RF电路1610还可以通过无线通信与网络和其它设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯***(Global System of Mobile communication，简称GSM)、通用分组无线服务(General Packet Radio Service，简称GPRS)、码分多址(Code Division Multiple Access，简称CDMA)、宽带码分多址(Wideband Code Division Multiple Access，简称WCDMA)、长期演进(Long Term Evolution，简称LTE)、电子邮件、短消息服务(Short Messaging Service，简称SMS)等。

存储器1620可用于存储软件程序以及模块，处理器1680通过运行存储在存储器1620的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器1620可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1620可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其它易失性固态存储器件。

输入单元1630可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元1630可包括触控面板1631以及其它输入设备1632。触控面板1631，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1631上或在触控面板1631附近的操作)，并根据预先设定的程式驱动相应的连接装置。在本申请实施例中，触控面板1631可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器1680，并能接收处理器1680发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1631。除了触控面板1631，输入单元1630还可以包括其它输入设备1632。具体地，其它输入设备1632可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元1640可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1640可包括显示面板1641，在本申请实施例中，可以采用液晶显示器(Liquid Crystal Display，简称LCD)、有机发光二极管(Organic Light-Emitting Diode，简称OLED)等形式来配置显示面板1641。进一步地，触控面板1631可覆盖显示面板1641，当触控面板1631检测到在其上或附近的触摸操作后，传送给处理器1680 以确定触摸事件的类型，随后处理器1680根据触摸事件的类型在显示面板1641上提供相应的视觉输出。虽然在图16中，触控面板1631与显示面板1641是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板1631与显示面板1641集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器1650，比如光传感器、运动传感器以及其它传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板1641的亮度，接近传感器可在手机移动到耳边时，关闭显示面板1641和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其它传感器，在此不再赘述。

音频电路1660、扬声器1661，传声器1662可提供用户与手机之间的音频接口。音频电路1660可将接收到的音频数据转换后的电信号，传输到扬声器1661，由扬声器1661转换为声音信号输出；另一方面，传声器1662将收集的声音信号转换为电信号，由音频电路1660接收后转换为音频数据，再将音频数据输出处理器1680处理后，经RF电路1610以发送给比如另一手机，或者将音频数据输出至存储器1620以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块1670可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图16示出了WiFi模块1670，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器1680是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器1620内的软件程序和/或模块，以及调用存储在存储器1620内的数据，执行手机的各种功能和处理数据，从而对手机进行整体监控。在本申请实施例中，处理器1680可包括一个或多个处理单元；在本申请实施例中，处理器1680可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1680中。

手机还包括给各个部件供电的电源1690(比如电池)，在本申请实施例中，电源可以通过电源管理***与处理器1680逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

本申请实施例还提供一种计算机可读存储介质，用于存储程序代码，该程序代码可被处理器执行，以用于执行前述各个实施例所述的一种人脸检测方法中的任意一种实施方式。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质可以是下述介质中的至少一种：只读存储器(英文：read-only memory，缩写：ROM)、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其它实施例的不同之处。尤其，对于设备及***实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的设备及***实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上所述，仅为本申请的一种具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

一种人脸检测方法，由计算设备执行，所述方法包括：

根据人脸检测模型确定待检测图像中的人脸候选区域；所述人脸检测模型包括多层卷积网络；

若所述人脸候选区域的尺寸参数小于第一比例条件，确定所述人脸候选区域对应小尺度人脸；

通过对应所述小尺度人脸的第一检测模型获取所述人脸候选区域在所述人脸检测模型中至少两层卷积网络所输出特征图上的投影特征；所述至少两层卷积网络包括第一卷积网络和第二卷积网络，所述第一卷积网络所输出特征图的特征分辨率适用于所述尺寸参数，所述第一卷积网络的相邻层卷积网络为所述第二卷积网络，所述第二卷积网络所输出特征图的特征分辨率低于所述第一卷积网络所输出特征图的特征分辨率；

将所述第一卷积网络的投影特征与所述第二卷积网络的投影特征融合得到的融合特征作为所述第一卷积网络的投影特征；

根据所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测。
根据权利要求1所述的方法，还包括：

若所述人脸候选区域的尺寸参数大于第二比例条件，确定所述人脸候选区域对应大尺度人脸；

通过对应所述大尺度人脸的第二检测模型获取所述人脸候选区域在所述人脸检测模型中至少两层卷积网络所输出特征图上的投影特征；所述至少两层卷积网络包括第三卷积网络，所述第三卷积网络所输出特征图的特征分辨率适用于所述尺寸参数；

根据所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测。
根据权利要求1或2所述的方法，所述至少两层卷积网络分别设置有权重系数，在所述至少两层卷积网络中，特征分辨率适用于所述尺寸参数的卷积网络的权重系数大于其它卷积网络的权重系数；

所述根据所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测，包括：

根据所述至少两层卷积网络所输出特征图上的投影特征，以及分别对应的权重系数对所述人脸候选区域进行人脸检测。
根据权利要求1所述的方法，所述将所述第一卷积网络的投影特征与所述第二卷积网络的投影特征融合得到的融合特征作为所述第一卷积网络的投影特征，包括：

通过降低所述第一卷积网络的投影特征中的通道数量得到第一特征；

通过将所述第二卷积网络的投影特征的特征分辨率提高到与所述第一卷积网络的投影特征的特征分辨率一致，得到第二特征；

将所述第一特征和所述第二特征进行像素相加操作得到所述融合特征；

将所述融合特征作为所述第一卷积网络的投影特征。
根据权利要求1所述的方法，所述根据人脸检测模型确定待检测图像中的人脸候选区域，包括：

获取所述待检测图像中的人脸感兴趣区域；

将所述人脸感兴趣区域投影到根据所述人脸检测模型输出的特征图上，得到第一特征图；

在所述第一特征图上生成锚框，得到第二特征图；在生成锚框的过程中，若目标锚框的中心点未与所述人脸感兴趣区域重叠，增大所述目标锚框的划窗步长；

根据多个人脸检测任务的损失函数计算所述第二特征图中的人脸候选区域，并将确定出的人脸候选区域作为所述待检测图像的人脸候选区域。
根据权利要求5所述的方法，所述多个人脸检测任务包括针对人脸目标的分类任务、针对人脸目标框的位置回归任务和针对人脸关键点的位置回归任务，所述多个人脸检测任务的损失函数根据下列方式训练得到：

将所述针对人脸目标的分类任务和针对人脸目标框的位置回归任务作为主任务，将所述针对人脸关键点的位置回归任务作为辅助任务联合训练各自对应的损失函数。
一种人脸检测方法，由计算设备执行，所述方法包括：

根据人脸检测模型确定待检测图像中的人脸候选区域；

根据所述人脸候选区域的尺寸参数与比例条件的大小关系，确定所述人脸候选区域所对应人脸的目标尺度，所述目标尺度为多个尺度中的一个，不同尺度的人脸对应不同的检测模型；

根据所述目标尺度的人脸对应的检测模型，对所述人脸候选区域进行人脸检测。
根据权利要求7所述的方法，所述根据所述人脸候选区域的尺寸参数与比例条件的大小关系，确定所述人脸候选区域所对应人脸的目标尺度，包括：

若所述人脸候选区域的尺寸参数小于或等于第一比例条件，确定所述人脸候选区域所对应人脸的目标尺度为小尺度；

若所述人脸候选区域的尺寸参数大于第二比例条件，确定所述人脸候选区域所对应人脸的目标尺度为大尺度。
根据权利要求7所述的方法，所述待检测图像包括多个人脸候选区域，所述方法还包括：

分别获取所述多个人脸候选区域的多个人脸检测结果；

将所述多个人脸检测结果合并作为所述待检测图像的人脸检测结果。
一种人脸检测装置，包括：

第一确定单元，用于根据人脸检测模型确定待检测图像中的人脸候选区域；所述人脸检测模型包括多层卷积网络；

第二确定单元，用于若所述人脸候选区域的尺寸参数小于第一比例条件，确定所述人脸候选区域对应小尺度人脸；

第一检测单元，用于：

通过对应所述小尺度人脸的第一检测模型获取所述人脸候选区域在所述人脸检测模型中至少两层卷积网络所输出特征图上的投影特征；所述至少两层卷积网络包括第一卷积网络和第二卷积网络，所述第一卷积网络所输出特征图的特征分辨率适用于所述尺寸参数，所述第一卷积网络的相邻层卷积网络为所述第二卷积网络，所述第二卷积网络所输出特征图的特征分辨率低于所述第一卷积网络所输出特征图的特征分辨率；

将所述第一卷积网络的投影特征与所述第二卷积网络的投影特征融合得到的融合特征作为所述第一卷积网络的投影特征；

根据所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测。
根据权利要求10所述的装置，还包括：

第三确定单元，用于，若所述人脸候选区域的尺寸参数大于第二比例条件，确定所述人脸候选区域对应大尺度人脸；

第二检测单元，用于：

通过对应所述大尺度人脸的第二检测模型获取所述人脸候选区域在所述人脸检测模型中至少两层卷积网络所输出特征图上的投影特征；所述至少两层卷积网络包括第三卷积网络，所述第三卷积网络所输出特征图的特征分辨率适用于所述尺寸参数；

根据所述至少两层卷积网络所输出特征图上的投影特征对所述人脸候选区域进行人脸检测。
一种人脸检测装置，包括：

第一确定模块，用于根据人脸检测模型确定待检测图像中的人脸候选区域；

第二确定模块，用于根据所述人脸候选区域的尺寸参数与比例条件的大小关系，确定所述人脸候选区域所对应人脸的目标尺度，所述目标尺度为多个尺度中的一个，不同尺度的人脸对应不同的检测模型；

检测模块，用于根据所述目标尺度的人脸对应的检测模型，对所述人脸候选区域进行人脸检测。
根据权利要求12所述的装置，所述待检测图像包括多个人脸候选区域，所述装置还包括：

获取单元，用于分别获取所述多个人脸候选区域的多个人脸检测结果；

合并单元，用于将所述多个人脸检测结果合并作为所述待检测图像的人脸检测结果。
一种人脸检测设备，包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行权利要求1-9任一项所述的人脸检测方法。
一种计算机可读存储介质，所述存储介质中存储有程序代码，所述程序代码可以被处理器执行以实现权利要求1-9任一项所述的人脸检测方法。