CN110163032A

CN110163032A - 一种人脸检测方法及装置

Info

Publication number: CN110163032A
Application number: CN201810149139.0A
Authority: CN
Inventors: 陈媛
Original assignee: Zhejiang Uniview Technologies Co Ltd
Current assignee: Zhejiang Uniview Technologies Co Ltd
Priority date: 2018-02-13
Filing date: 2018-02-13
Publication date: 2019-08-23
Anticipated expiration: 2038-02-13
Also published as: CN110163032B

Abstract

本发明实施例提出一种人脸检测方法及装置，涉及人脸检测技术领域。该方法及装置通过获取待测图像，并基于预训练的当前RFCN网络模型分类器及待测图像获得待测图像包含的疑似人脸目标的类别、类别概率值、目标候选框位置坐标以及定点位置坐标，再依据类别概率值、目标候选框位置坐标以及定点位置坐标检测待测图像是否包含有与类别对应的真实人脸目标并生成检测结果；由于在应用该已经经过训练的RFCN网络模型分类器的对获取待测图像时，可以得到待测图像的定点位置坐标，通过综合待测图像的类别概率值以及定点位置坐标确定待测图像是否包含该类型的人脸目标，不仅提高了人脸定位位置的准确性，还降低了误检率。

Description

一种人脸检测方法及装置

技术领域

本发明涉及人脸检测技术领域，具体而言，涉及一种人脸检测方法及装置。

背景技术

随着智能监控摄像头、自动驾驶汽车的出现，面部识别以及大量对人有价值的应用出现，快速、精准的目标检测***市场也日益蓬勃。

在现有技术中，人脸检测***大多基于SSD目标测算法、R-FCN检测方法对目标进行识别。但由于人脸检测***的前端装置所处的环境存在的多样性、复杂性等特点，给所抓拍到的目标进行提取轮廓或关键点过程造成了很大的困难。此外，通过上述方法检测小目标时，大多会对小目标进行降采样，而进行多次降采样以后，特征图上表示小目标的像素就会非常少，这很不利于小目标的检测，从而导致检出率相对较低。

发明内容

有鉴于此，本发明的目的在于提供一种人脸检测方法及装置，以解决上述问题。

为了实现上述目的，本发明实施例采用的技术方案如下：

第一方面，本发明实施例提供了一种人脸检测方法，所述人脸检测方法包括：

获取待测图像；

基于预训练的当前RFCN网络模型分类器及所述待测图像获得所述待测图像包含的疑似人脸目标的类别、类别概率值、目标候选框位置坐标以及定点位置坐标，其中，所述类别概率值为在所述待测图像包含疑似人脸目标时，所述疑似人脸目标属于所述类别的概率值；

依据所述类别概率值、所述目标候选框位置坐标以及所述定点位置坐标检测所述待测图像是否包含有与所述类别对应的真实人脸目标；

生成检测结果。

第二方面，本发明实施例还提供了一种人脸检测装置，所述人脸检测装置包括：

待测图像获取单元，用于获取待测图像；

人脸目标信息获取单元，用于基于预训练的当前RFCN网络模型分类器及所述待测图像获得所述待测图像包含的疑似人脸目标的类别、类别概率值、目标候选框位置坐标以及定点位置坐标，其中，所述类别概率值为在所述待测图像包含疑似人脸目标时，所述疑似人脸目标属于所述类别的概率值；

检测单元，用于依据所述类别概率值、所述目标候选框位置坐标以及所述定点位置坐标检测所述待测图像是否包含有与所述类别对应的真实人脸目标；

结果生成单元，用于生成检测结果。

本发明实施例提供的人脸检测方法及装置，通过获取待测图像，并基于预训练的当前RFCN网络模型分类器及待测图像获得待测图像包含的疑似人脸目标的类别、类别概率值、目标候选框位置坐标以及定点位置坐标，再依据类别概率值、目标候选框位置坐标以及定点位置坐标检测待测图像是否包含有与类别对应的真实人脸目标并生成检测结果；由于在训练 RFCN网络模型分类器时，对样本的定点位置坐标进行了训练，从而在应用该已经经过训练的RFCN网络模型分类器的对获取待测图像时，可以得到待测图像的定点位置坐标，通过综合待测图像的类别概率值以及定点位置坐标确定待测图像是否包含该类型的人脸目标，不仅提高了人脸定位位置的准确性，还降低了误检率。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了可应用于本发明实施例提供的服务器的功能模块图。

图2示出了本发明第一实施例提供的人脸检测方法的流程图。

图3示出了本发明实施例训练得到当前RFCN网络模型分类器的流程图。

图4示出了本发明第二实施例提供的人脸检测方法的流程图。

图5示出了本发明第三实施例提供的人脸检测装置的功能模块图。

图标：100-服务器；111-存储器；112-处理器；113-通信单元；200- 人脸检测装置；201-待测图像获取单元；202-人脸目标信息获取单元；203- 检测单元；204-结果生成单元；205-人脸位置框生成单元；206-训练样本集获取单元；207-分类单元；208-判断单元；209-扩展单元；210-训练单元。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，图1示出了一种可应用于本发明实施例中的服务器100 的功能框图。服务器100包括人脸检测装置200、存储器111、存储控制器，一个或多个(图中仅示出一个)处理器112、通信单元113。这些组件通过一条或多条通讯总线/信号线相互通讯。所述人脸检测装置200包括至少一个可以软件或固件(firmware)的形式存储于所述存储器111中或固化在所述服务器100的操作***(operating System，OS)中的软件功能单元。

存储器111可用于存储软件程序以及单元，如本发明实施例中的软件测试装置及方法所对应的程序指令/单元，处理器112通过运行存储在存储器111内的人脸检测装置、方法的软件程序以及单元，从而执行各种功能应用以及数据处理，如本发明实施例提供的人脸检测方法。其中，所述存储器111可以是，但不限于，随机存取存储器(Random AccessMemory， RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(ProgrammableRead-Only Memory，PROM)，可擦除只读存储器(Erasable Programmable Read-OnlyMemory，EPROM)，电可擦除只读存储器 (Electric Erasable Programmable Read-OnlyMemory，EEPROM)等。处理器112以及其他可能的组件对存储器111的访问可在存储控制器的控制下进行。

所述通信单元113用于通过所述网络建立所述服务器100与其它通信终端之间的通信连接，并用于通过所述网络收发数据。

应当理解的是，图1所示的结构仅为示意，服务器100还可包括比图 1中所示更多或者更少的组件，或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。

第一实施例

本发明实施例提供了一种人脸检测方法，应用于服务器100，用于检测待测图像中是否包含人脸目标。请参阅图2，为本发明实施例提供的人脸检测方法的流程图。该人脸检测方法包括：

步骤S201：获取待测图像。

该待测图像可以是由智能监控摄像头拍摄并传输的，也可以是由其他终端接收到后再发送至服务器100的，在此不做具体限制。

需要说明的是，该待测图像可能包含人脸目标，也可能不包含人脸目标，仅仅包括背景。

步骤S202：基于预训练的当前RFCN网络模型分类器及待测图像获得待测图像包含的疑似人脸目标的类别、类别概率值、目标候选框位置坐标以及定点位置坐标。

其中，类别概率值为在待测图像包含疑似人脸目标时，疑似人脸目标属于类别的概率值。

需要说明的是，该定点可以为人脸目标中的眼睛、鼻子、嘴巴等器官。在本实施例中，服务器100可获得5个定点位置坐标，分别为双眼的位置坐标、鼻子的位置坐标以及两嘴角的位置坐标。该定点的具体类型由预训练的RFCN网络模型分类器决定，若用户需要更改定点的类型，可在训练 RFCN网络模型分类器时，输入包含目标类型定点位置坐标的训练样本。

还需要说明的是，在本实施例中，人脸目标的类别包括两种：分别为第一类型以及第二类型。具体地，属于第一类型的人脸目标，其与待测图像的比例小于或等于第一阈值；属于第二类型的人脸目标，其与待测图像的比例大于第一阈值。

通常地，第一类型为小目标，第二类型为正常目标。

此外，只有当预训练的当前RFCN网络模型分类器检测出待测图像中包含疑似人脸目标时，才能够获取疑似人脸目标的类别、类别概率值、目标候选框位置坐标以及定点位置坐标；当待测图像中仅仅包含背景时，是无法得到类别概率值、目标候选框位置坐标以及定点位置坐标的。

疑似人脸目标是指，待测图像中可能包含人脸目标，疑似人脸目标通过预训练的当前RFCN网络模型分类器检测得出，但还需进一步确定，是否为真实人脸目标。

请参阅图3，示出了训练RFCN网络模型分类器的方法流程图。训练 RFCN网络模型分类器的方法包括：

步骤S301：获取包含多个训练样本的训练样本集。

其中，训练样本集包括多个训练样本，该训练样本为包含人脸目标的样本。此外，包含人脸目标的训练样本，还包括目标候选框位置坐标，定点位置坐标及标签。

步骤S302：依据标签确定多个训练样本包含的人脸目标的类别。

可以理解地，训练样本中的标签即为该训练样本包含的人脸目标的类型信息。在本实施例中，人脸目标的类别包括第一类型以及第二类型。

步骤S303：判断人脸目标是否属于第一类型，如果是，则执行步骤 S304；如果否，则执行步骤S305。

通过判断人脸目标属于第一类型，从而将属于第一类型的人脸目标筛选出，以进一步操作。

步骤S304：对属于第一类型的人脸目标的目标候选框进行扩展。

由于在属于第一类型的目标类型进行检测时，会对目标候选框进行多次降采样，这样会造成分辨率降低，更难以识别人脸目标。从而在对属于第一类型的目标类型进行识别前，首先对属于第一类型的目标类型的目标候选框进行扩展，使其扩展为一个肩头模型，从而避免了多次降采样造成的分辨率过低不能识别的问题，提高了检出率。

步骤S305：依据属于第二类型的目标候选框、属于第一类型的进行扩展后的目标候选框、定点位置坐标及预建立的初级RFCN网络模型分类器进行训练，从而建立当前RFCN网络模型分类器。

需要说明的是，预建立的初级RFCN网络模型分类器为传统的神经训练网络，在此不再赘述。

RFCN网络模型分类器是在一张图像上共享计算RPN和R-FCN的特征图。其中，RPN模块得到候选框，而R-FCN模块评估了每一个类别的得分及回归边框(regressesbounding boxes)。因而可得到C+1个得分，最后再将这C+1个得分使用softmax函数，则可以得到人脸目标的类别概率值。同时，R-FCN模块还可以依据候选框得到回归偏移量，即目标候选框四顶点坐标的偏移量；R-FCN模块还可以依据定点位置坐标信息得到定点位置坐标的偏移量，从而通过将待测图像输入至预训练的RFCN网络模型分类器，可以得到人脸目标的类别、类别概率值、目标候选框位置坐标以及多个定点位置坐标。

在本实施例在，C＝2，从而C+1类分别对应头肩目标、正常目标及背景。

步骤S203：依据类别概率值、目标候选框位置坐标以及定点位置坐标检测待测图像是否包含有与类别对应的真实人脸目标。

步骤S204：生成检测结果。

具体地，当类别概率值大于或等于预设定的概率阈值，且定点位置坐标在目标候选框内时，生成确定待测图像包含有与类别对应的真实人脸目标的检测结果；否则，生成确定待测图像不包含真实人脸目标的检测结果。

第二实施例

请参阅图4，本发明实施例提供了一种人脸检测方法，需要说明的是，本实施例所提供的人脸检测方法，其基本原理及产生的技术效果和第一实施例所提供的人脸检测方法相同，为简要描述，本实施例部分未提及之处，可参考上述的实施例中相应内容。

在本实施例中，步骤S203包括：

子步骤S2031：依据目标候选框位置坐标生成目标候选框。

目标候选框位置坐标包括目标候选框四个顶点坐标信息，记为 (X_left,Y_Top,X_right,Y_Bot)，其中，X_left是目标框的左上角横坐标，Y_Top是目标框的左上角纵坐标，X_right是目标框的右下角横坐标，Y_Bot是目标框右下角的纵坐标。从而通过顶点坐标便能生成目标候选框。

子步骤S2032：检测类别概率值是否大于或等于预设定的概率阈值且定点位置坐标是否在目标候选框内，如果是，则执行步骤S2041；如果否，则执行步骤S2042。

依据类别概率值、目标候选框以及定点位置坐标判断待测图像是否包含有与类别对应的人脸目标。

在本实施例中，步骤S204包括：

步骤S2041：生成确定待测图像不包含真实人脸目标的检测结果。

当类别概率值小于预设定的概率阈值或是类别概率值大于或等于预设定的概率阈值，但定点位置坐标不在目标候选框内时，当前RFCN网络模型分类器的检出的疑似人脸目标并非为真实人脸目标。

步骤S2042：生成确定待测图像包含有与类别对应的真实人脸目标的检测结果。

当类别概率值大于或等于预设定的概率阈值，且定点位置坐标在目标候选框内时，说明待测图像中包含真实人脸目标，且真实人脸目标的类型同样可以确定。

此外，人脸检测方法还包括步骤S205～步骤S208。

步骤S205：判断真实人脸目标是否属于第一类型，如果否，则执行步骤S206；如果是，则执行步骤S207。

当已经确定待测图像包含真实人脸目标时，需要筛选出属于第一类型的人脸目标，对属于第一类型的人脸目标进行进一步的处理。

步骤S206：输出标记有目标候选框的待测图像。

当人脸目标属于第二类型时，无需再做任何处理，直接输出至客户端。

步骤S207：基于定点位置坐标生成人脸位置框。

由于在训练时，对属于第一类型的人脸目标的目标候选框进行了扩展，成为了肩头模型，从而得到的人脸目标的目标候选框较大，因此需要基于定点位置坐标生成人脸位置框，进一步生成属于第一类型的人脸目标的人脸框。

步骤S208：输出标记有目标候选框以及人脸位置框的待测图像。

第三实施例

请参阅图5，本发明实施例提供了一种人脸检测装置200，需要说明的是，本实施例所提供的人脸检测装置200，其基本原理及产生的技术效果和第一实施例所提供的人脸检测方法相同，为简要描述，本实施例部分未提及之处，可参考上述的实施例中相应内容。该人脸检测装置200包括待测图像获取单元201、人脸目标信息获取单元202、检测单元203、结果生成单元204、人脸位置框生成单元205、训练样本集获取单元206、分类单元207、判断单元208、扩展单元209以及训练单元210。

其中，待测图像获取单元201用于获取待测图像。

在一种优选的实施例中，待测图像获取单元201可用于执行步骤S201。

人脸目标信息获取单元202用于基于预训练的当前RFCN网络模型分类器及待测图像获得待测图像包含的疑似人脸目标的类别、类别概率值、目标候选框位置坐标以及定点位置坐标。

通常地，第一类型为小目标，第二类型为正常目标。

在一种优选的实施例中，人脸目标信息获取单元202可用于执行步骤 S202。

检测单元203用于依据类别概率值、目标候选框位置坐标以及定点位置坐标检测待测图像是否包含有与类别对应的真实人脸目标。

在一种优选的实施例中，检测单元203可用于执行步骤S303。

检测单元203包括目标候选框生成子单元以及检测子单元。

其中，目标候选框生成子单元用于依据目标候选框位置坐标生成目标候选框。

在一种优选的实施例中，目标候选框生成子单元可用于执行子步骤 S2031。

检测子单元用于检测类别概率值是否大于或等于预设定的概率阈值且定点位置坐标是否在目标候选框内。

在一种优选的实施例中，检测子单元可用于执行子步骤S2032。

结果生成单元204用于生成检测结果。

具体地，结果生成单元204用于当类别概率值大于或等于预设定的概率阈值，且定点位置坐标在目标候选框内时，生成确定待测图像包含有与类别对应的真实人脸目标的检测结果；否则，生成确定待测图像不包含真实人脸目标的检测结果。

在一种优选的实施例中，结果生成单元204可用于执行步骤S204。

判断单元208用于判断真实人脸目标是否属于第一类型。

在一种优选的实施例中，判断单元208可用于执行步骤S205。

人脸位置框生成单元205用于当真实人脸目标属于第一类型时，基于定点位置坐标生成人脸位置框。

在一种优选的实施例中，扩展单元209可用于执行步骤S207。

输出单元用于当真实人脸目标属于第二类型时，输出标记有目标候选框的待测图像；输出单元还用于当真实人脸目标属于第一类型时，输出标记有目标候选框以及人脸位置框的待测图像。

在一种优选的实施例中，输出单元可用于执行步骤S206及步骤S208。

训练样本集获取包含多个训练样本的训练样本集。

其中，训练样本集包括多个训练样本，该训练样本大多为包含人脸目标的样本，也包括仅包含背景的样本。此外，包含人脸目标的训练样本，还包括目标候选框位置坐标，定点位置坐标及标签。

在一种优选的实施例中，训练样本集获取单元206可用于执行步骤 S301。

分类单元207用于依据标签确定多个训练样本包含的人脸目标的类别。

可以理解地，训练样本中的标签即为该训练样本包含的人脸目标的类型信息。在本实施例中，人脸目标的类别包括小目标以及正常目标。

在一种优选的实施例中，分类单元207可用于执行步骤S302。

判断单元208用于判断人脸目标是否属于第一类型。

在一种优选的实施例中，判断单元208可用于执行步骤S303。

扩展单元209用于当人脸目标属于第一类型时，对属于第一类型的人脸目标的目标候选框进行扩展。

在一种优选的实施例中，扩展单元209可用于执行步骤S304。

训练单元210用于依据属于第二类型的目标候选框、属于第一类型的进行扩展后的目标候选框、定点位置坐标及预建立的初级RFCN网络模型分类器进行训练，从而建立当前RFCN网络模型分类器。

在一种优选的实施例中，训练单元210可用于执行步骤S305。

综上所述，本发明实施例提供的人脸检测方法及装置，通过获取待测图像，并基于预训练的当前RFCN网络模型分类器及待测图像获得待测图像包含的疑似人脸目标的类别、类别概率值、目标候选框位置坐标以及定点位置坐标，再依据类别概率值、目标候选框位置坐标以及定点位置坐标检测待测图像是否包含有与类别对应的真实人脸目标并生成检测结果；由于在训练RFCN网络模型分类器时，对样本的定点位置坐标进行了训练，从而在应用该已经经过训练的RFCN网络模型分类器的对获取待测图像时，可以得到待测图像的定点位置坐标，通过综合待测图像的类别概率值以及定点位置坐标确定待测图像是否包含该类型的人脸目标，不仅提高了人脸定位位置的准确性，还降低了误检率。

以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可用于执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Onl3Memor3)、随机存取存储器(RAM，Random Access Memor3)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语 “包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……” 限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

Claims

1.一种人脸检测方法，其特征在于，所述人脸检测方法包括：

获取待测图像；

生成检测结果。

2.如权利要求1所述的人脸检测方法，其特征在于，所述依据所述类别概率值、所述目标候选框位置坐标以及所述定点位置坐标检测所述待测图像是否包含有与所述类别对应的真实人脸目标的步骤包括：

依据所述目标候选框位置坐标生成目标候选框；

检测所述类别概率值是否大于或等于预设定的概率阈值且所述定点位置坐标是否在所述目标候选框内。

3.如权利要求2所述的人脸检测方法，其特征在于，所述生成检测结果的步骤包括：

当所述类别概率值大于或等于预设定的概率阈值，且所述定点位置坐标在所述目标候选框内时，生成确定所述待测图像包含有与所述类别对应的真实人脸目标的检测结果。

4.如权利要求3所述的人脸检测方法，其特征在于，当所述待测图像包含的人脸目标与所述待测图像的比例小于或等于第一阈值时，所述人脸目标属于预设定的第一类型，在生成检测结果的步骤之后，所述人脸检测方法还包括：

当所述真实人脸目标属于所述第一类型时，基于所述定点位置坐标生成人脸位置框。

5.如权利要求1所述的人脸检测方法，其特征在于，在所述获取待测图像的步骤之前，所述人脸检测方法还包括：

获取包含多个训练样本的训练样本集，所述训练样本包括目标候选框，定点位置坐标及标签；

依据所述标签确定多个所述训练样本包含的人脸目标的类别，所述类别包括第一类型以及第二类型；

当所述人脸目标属于第一类型时，对属于所述第一类型的人脸目标的目标候选框进行扩展；

依据属于所述第二类型的目标候选框、属于所述第一类型的进行扩展后的目标候选框、所述定点位置坐标及预建立的初级RFCN网络模型分类器进行训练，从而建立当前RFCN网络模型分类器。

6.一种人脸检测装置，其特征在于，所述人脸检测装置包括：

待测图像获取单元，用于获取待测图像；

结果生成单元，用于生成检测结果。

7.如权利要求6所述的人脸检测装置，其特征在于，所述检测单元包括：

目标候选框生成子单元，用于依据所述目标候选框位置坐标生成目标候选框；

检测子单元，用于依据所述类别概率值、所述目标候选框以及所述定点位置坐标确定所述待测图像是否包含有与所述类别对应的真实人脸目标。

8.如权利要求7所述的人脸检测装置，其特征在于，所述结果生成单元用于当所述类别概率值大于或等于预设定的概率阈值，且所述定点位置坐标在所述目标候选框内时，生成确定所述待测图像包含有与所述类别对应的真实人脸目标的检测结果。

9.如权利要求6所述的人脸检测装置，其特征在于，当所述待测图像包含的人脸目标与所述待测图像的比例小于或等于第一阈值时，所述人脸目标属于预设定的第一类型，所述人脸检测装置还包括：

人脸位置框生成单元，用于当所述真实人脸目标属于所述第一类型时，基于所述定点位置坐标生成人脸位置框。

10.如权利要求7所述的人脸检测装置，其特征在于，所述人脸检测装置还包括：

训练样本集获取单元，用于获取包含多个训练样本的训练样本集，所述训练样本包括目标候选框，定点位置坐标及标签；

分类单元，依据所述标签确定多个所述训练样本包含的人脸目标的类别，所述类别包括第一类型以及第二类型；

扩展单元，当所述人脸目标属于第一类型时，对属于所述第一类型的目标候选框进行扩展；

训练单元，依据属于所述第二类型的目标候选框、属于所述第一类型的进行扩展后的目标候选框、所述定点位置坐标及预建立的初级RFCN网络模型分类器进行训练，从而建立当前RFCN网络模型分类器。