CN112052830B

CN112052830B - 人脸检测的方法、装置和计算机存储介质

Info

Publication number: CN112052830B
Application number: CN202011022882.3A
Authority: CN
Inventors: 岳海潇; 冯浩城; 王珂尧
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-09-25
Filing date: 2020-09-25
Publication date: 2022-12-20
Anticipated expiration: 2040-09-25
Also published as: CN112052830A

Abstract

根据本公开的示例实施例，提供了人脸检测的方法、装置和计算机存储介质，涉及人工智能领域，具体为计算机视觉、深度学习技术，可用于人脸识别。人脸检测的方法，包括：基于包括人脸的彩色图像、红外图像和深度图像，确定彩色图像、红外图像和深度图像中的多个人脸关键点；基于多个人脸关键点，分别确定第一置信度、第二置信度和第三置信度，第一置信度与彩色图像相关联，第二置信度与红外图像相关联，第三置信度与深度图像相关联；以及基于第一置信度、第二置信度和第三置信度，确定人脸的真实性。根据本公开的方案。可以准确地进行活体人脸检测。

Description

人脸检测的方法、装置和计算机存储介质

技术领域

本公开的实施例涉及人工智能领域，具体为计算机视觉、深度学习技术，可用于人脸识别，并且更具体地，涉及人脸检测的方法、装置和计算机存储介质。

背景技术

随着人脸技术广泛应用于交通、安防、金融等领域，假冒人脸攻击方式层出不穷。目前已知的假冒人脸攻击方式主要包含：照片攻击、不同材质纸张攻击、手机/Pad/电脑屏幕翻拍攻击、头模攻击等。人脸活体检测技术是面向人工智能领域的一项前沿技术，该技术以新型的3D传感器为依托，以深度学习技术为开发框架，旨在对人脸识别领域中，真实人脸和虚假人脸进行有效判断，从而抵抗非法虚假人脸对人脸识别***的攻击。业界主要应用的可见光摄像头与近红外摄像头，对于金融验证、智能门锁等高风险领域仍存在安全性不足的问题。需要一种针对人脸识别的安全性更高的解决方案。

发明内容

根据本公开的实施例，提供了一种人脸检测的方案。

在本公开的第一方面中，提供了一种人脸检测的方法，包括：基于包括人脸的彩色图像、红外图像和深度图像，确定彩色图像、红外图像和深度图像中的多个人脸关键点；基于多个人脸关键点，分别确定第一置信度、第二置信度和第三置信度，第一置信度与彩色图像相关联，第二置信度与红外图像相关联，第三置信度与深度图像相关联；以及基于第一置信度、第二置信度和第三置信度，确定人脸的真实性。

在本公开的第二方面中，提供了一种人脸检测的装置，包括：第一关键点确定模块，被配置为基于包括人脸的彩色图像、红外图像和深度图像，确定彩色图像、红外图像和深度图像中的多个人脸关键点；第一置信度确定模块，被配置为基于多个人脸关键点，分别确定第一置信度、第二置信度和第三置信度，第一置信度与彩色图像相关联，第二置信度与红外图像相关联，第三置信度与深度图像相关联；以及人脸识别模块，被配置为基于第一置信度、第二置信度和第三置信度，确定人脸的真实性。

在本公开的第三方面中，提供了一种电子设备，包括一个或多个处理器；以及存储装置，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现根据本公开的第一方面的方法。

在本公开的第四方面中，提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现根据本公开的第一方面的方法。

在本公开的第五方面中，提供了一种计算机程序产品，包括计算机程序指令，该计算机程序指令被处理器实现如本公开的第一方面的方法。

应当理解，发明内容部分中所描述的内容并非旨在限定本公开的实施例的关键或重要特征，亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。

附图说明

结合附图并参考以下详细说明，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中，相同或相似的附图标注表示相同或相似的元素，其中：

图1示出了本公开的多个实施例能够在其中实现的示例环境的示意图；

图2示出了根据本公开的一些实施例的人脸检测的过程的流程图；

图3示出了根据本公开的一些实施例的多模态人脸活体检测的过程的流程图；

图4示出了根据本公开的一些实施例的人脸关键点的示意图；以及；

图5示出了根据本公开的一些实施例的人脸检测的装置的示意性框图；以及

图6示出了能够实施本公开的多个实施例的计算设备的框图。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例，然而应该理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

在本文中使用的术语“包括”及其变形表示开放性包括，即“包括但不限于”。除非特别申明，术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。

如以上提及的，需要一种针对人脸识别的安全性更高的解决方案。现有技术通过如下几种方式进行人脸检测。

(1)单一可见光摄像头采集RGB视频流或近红外摄像头采集近红外视频流，活体检测***根据视频流或单帧图片来判断所拍摄人脸是否为真实人脸。该方案的缺点在于只采用单一摄像头传感器采集数据，可见光传感器在强光、暗光等光线复杂条件下成像质量下降，近红外传感器结合补光灯下可在夜晚下可成较清晰人像，相较于可见光传感器，成像与灰度图相近，人脸细节信息较少，因此对于人脸活体检测***准确率有不利影响。

(2)将可见光摄像头和近红外摄像头采集到的RGB视频流和近红外视频流均输入到活体检测***，***根据双模态信息综合判断所拍摄人脸是否为真实人脸。该方案在金融验证、智能门锁等高安全性领域仍不满足需求。

(3)基于双目可见光摄像头采集人脸数据，基于三维结构重建人脸深度图进行人脸活体检测判断。真实人脸的3D信息与虚假的电子设备描述的人脸3D信息有很强的区分度。利用相机的多角度拍摄以及相机内部参数，重构出人脸关键点深度信息，根据关键点的深度信息进行有监督的人脸判定。该技术需要对相机内部参数进行标定，而相机内部参数的标定的准确性、拍摄不同图像的相机之间的旋转位移关系以及图像的质量对重构的人脸深度值有极大的影响，且在暗光等复杂光线场景下会导致重建人脸深度图出现偏差，因此该方法对活体检测的误检率较高。

根据本公开的实施例，提出了一种人脸检测的方案。该方案对RGB、红外、深度三种模态人脸信息进行加权预测。在该方案中，首先获取人脸的彩色图像、红外图像和深度图像。然后通过该彩色图像、红外图像和深度图像确定人脸关键点。接着通过人脸关键点分别确定三个概率，最后对三个概率进行加权处理以确定人脸的真实性。

通过彩色、深度、红外三种模态计算概率并且进行加权预测，可以有效提升人脸活体检测***准确率，从而提升人脸识别***整体安全性与有效性。

以下参考附图来说明本公开的基本原理和若干示例实现。

图1示出了本公开的多个实施例能够在其中实现的示例环境100的示意图。应当理解，图1所示出的环境100仅仅是示例性的，而不应当构成对本公开所描述的实现的功能和范围的任何限制。如图1所示，环境100包括彩色(RGB)传感器、红外(IR)传感器和深度(Depth)传感器、彩色图像101、深度图像102、红外图像103、计算设备104和人脸105。虽然图示为三个分立的传感器，但应该理解也可以利用集成的传感器，本公开在此不做限制。

彩色(RGB)传感器、红外(IR)传感器和深度(Depth)传感器用于采集包括人脸105的彩色、红外和深度三种模态视频流或图像数据，以用于进行人脸活体检测。彩色图像101、深度图像102、红外图像103可以是在任意场景中拍摄的人脸105的照片。彩色传感器也可以被称为可见光传感器，红外传感器可以为近红外传感器，本公开在此不做限制。或者也可以是视频中包含有人脸105某一帧图像等。彩色传感器、红外传感器和深度传感器可以被设置在同一位置或者可以被设置在不同位置，并且可以在拍摄图像或视频前基于是那个传感器的位置和其相应的内参和外参对三个传感器进行配准。

在一些实施例中，彩色传感器、红外传感器和深度传感器可以为具有一个或多个广角或者超广角的摄像头，这些摄像头能够捕获周围环境360度内的场景。

虽然仅图示了三个传感器，但可以理解，传感器的数目可以根据情况不同而增加或者减少，并且还可以存在其他的硬件设备和软件***。硬件设备例如可以包括处理板卡、数据硬盘、近红外补光灯、触摸屏幕、蜂鸣器，电源接口、GPIO、SD-Card接口、RS232串口、USB接口、RJ45网口、Wi-Fi等***接口。软件***例如为包含Linux嵌入式操作***软件。本公开对此不做限制。

彩色传感器、红外传感器和深度传感器可以通信地耦合到计算设备104。计算设备104可以获取传感器拍摄的视频或者图像以用于进行截帧、人脸区域确定、人脸关键点确定、归一化、随机数据增强等图像处理，以用于进行活体人脸检测。这将在下文进一步详细阐述。计算设备104可以被嵌入在包括三个传感器的传感器模组中。计算设备104也可以是传感器模组外部的实体，并且可以经由无线网络与传感器通信。计算设备104可以是任何具有计算能力的设备。作为非限制性示例，计算设备104可以是任意类型的固定计算设备、移动计算设备或便携式计算设备，包括但不限于台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、多媒体计算机、移动电话等；计算设备104的全部组件或一部分组件可以分布在云端。计算设备104至少包含处理器、存储器以及其他通常存在于通用计算机中的组件，以便实现计算、存储、通信、控制等功能。

在一个实施例中，计算设备104可以包括预先训练好的人脸检测神经网络、人脸关键点神经网络，人脸活体检测神经网络等。

计算设备104可以将人脸检测结果发送给支付***、门禁***以用于后续操作。

以下结合图2至图4来进一步描述详细的人脸检测的过程。图2图示了根据本公开的实施例的人脸检测的方法200的流程图。方法200可以由图1中的计算设备104来实施。为便于描述，将参照图1来描述方法200。

在框210，计算设备104基于包括人脸105的彩色图像101、红外图像102和深度图像103，确定彩色图像101、红外图像102和深度图像103中的多个人脸关键点。例如，计算设备104分别经由彩色传感器、红外传感器和深度传感器获取包括人脸105的彩色图像101、红外图像102和深度图像103。计算设备104可以与传感器通信，以获取图像或视频流。应当理解，可以采用本领域公知的网络技术(例如，蜂窝网络(例如第五代(5G)网络、长期演进(LTE)网络、第三代(3G)网络、码分多址(CDMA)网络等)、公共陆地移动网络(PLMN)、局域网(LAN)、广域网(WAN)、城域网(MAN)、电话网络(例如公共交换电话网(PSTN))、专用网络、自组织网络、内联网、因特网、基于光纤的网络等、和/或这些或其他类型的网络的组合)以建立计算设备104与传感器的连接，在此不再详叙。

在一个实施例中，计算设备104首先基于彩色图像101和红外图像103，分别确定彩色图像101和所述红外图像103中的人脸区域。例如，计算设备104可以采用人脸位置检测算法或预先训练的神经网络对人脸候选区域进行检测，分离出人脸区域。在一个示例中，计算设备104设置一个滑动窗口在彩色图像101和红外图像103中不断的滑动，滑动窗口每到一个位置便计算该位置处的特征，若特征值大于预设的阈值，则确定该区域是人脸区域。

在一个实施例中，计算设备104通过深度学习卷积网络提取彩色图像101和红外图像103中的人脸特征，根据不同尺度特征图进行人脸二分类以及框坐标回归，并根据人脸二分类得分排序确定最终人脸检测结果，并返回模型预测的人脸二分类得分以及人脸框坐标。

这样，通过过滤掉图像中不具有人脸的区域，可以从目标人脸图像中确定出人脸所在的区域，可以使得后续对人脸区域的处理更有针对性，有助于提高处理效率。

在一个实施例中，计算设备104可以预先对原始的彩色图像101和所述红外图像103依次进行图像灰度化处理、图像缩放处理以及直方图光线均衡化处理。通过图像灰度化处理将彩色的原始图像转换为灰度图像，通过图像缩放处理将图像缩小在一个合适的尺寸，提升图像检测的速度，通过直方图光线均衡化处理改善图像的对比度和亮度，以避免光线不足或光线过亮对后续检测的影响。

计算设备104然后基于人脸区域，确定所述彩色图像101和红外图像103中的多个人脸关键点。例如，计算设备104可以将上述粗预测的人脸区域的图像输入人脸关键点预测神经网络或者采用人脸关键点预测算法确定多个人脸关键点。如图4所示，人脸关键点是包括人脸各个部位对应的关键点，人脸关键点比如鼻尖、眼角(内眼角和外眼角等)、眉尖、嘴角等，在得到的带有人脸关键点的图像上，对各个人脸关键点都进行了标注，虽然图示了72个关键点，但这是只是示例性，关键点的数目可以变化。

在一个实施例中，计算设备103可以将人脸区域的图像输入至特征提取网络中，经过特征提取网络对人脸区域图像进行特征提取以确定关键点。特征提取网络可以是卷积神经网络(Convolutional Neural Network，CNN)，卷积神经网络是一种深度前馈人工神经网络，已被广泛应用于图像识别技术领域中，卷积神经网络的基本结构包括两层，其一为特征提取层，每个神经元的输入与前一层的局部接受域相连，并提取该局部的特征；其二为特征映射层，特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数，使得特征映射具有位移不变性，并且在使用过程中还包括卷积层，用来识别位移、缩放及其他形式扭曲不变性的二维图形。

最后，计算设备104可以基于彩色图像101和/或红外图像103中的多个人脸关键点，确定深度图像102的多个人脸关键点。由于无法直接从深度图像确定其中的人脸关键点，可以采取将彩色图像101或红外图像103中的人脸关键点映射到深度图像中以确定其中的关键点。

在一个实施例中，计算设备104可以确定所述深度图像102的坐标与彩色图像101和/或红外图像103的坐标之间的对应关系，然后基于该对应关系以及彩色图像101或所述红外图像103中的多个人脸关键点，确定深度图像102中的多个人脸关键点。

例如，计算设备可以确定深度传感器与彩色传感器和/或红外传感器间的相对位置关系，然后确定其间的坐标系偏移，例如横坐标+3mm，纵坐标-2mm，然后计算设备104获取彩色图像101或红外图像103中的72个人脸关键点的坐标(x₁,y₁)…(x₇₂,y₇₂)，然后将(x₁+3,y₁-2)…(x₇₂+3,y₇₂-2)作为为深度图像的人脸关键点。

在一个实施例中，计算设备104可以将彩色图像101或红外图像103中的坐标点进行对齐后取平均作为平均坐标点，然后再根据该平均坐标点计算深度图像中的人脸关键点。

在一个备选实施例中，由于彩色传感器、红外传感器和深度传感器可以被视为放置在同一位置或者深度传感器和红外传感器为同一摄像头，计算设备104可以直接将彩色图像101和/或红外图像103中的人脸关键点映射到深度图像中，例如，计算设备104可以获取彩色图像101或红外图像103中的72个人脸关键点的坐标(x₁,y₁)…(x₇₂,y₇₂),然后将上述坐标点直接标注在深度图像中作为深度图像的人脸关键点。

在框220，计算设备104基于多个人脸关键点，分别确定第一置信度、第二置信度和第三置信度，第一置信度与彩色图像101相关联，第二置信度与红外图像103相关联，所述第三置信度与深度图像102相关联。

在一个实施例中，计算设备104可以基于多个人脸关键点，分别确定彩色图像、红外图像和深度图像中的人脸图像。在一个示例中，计算设备可以确定彩色图像101、深度图像102、红外图像103中的72个人脸关键点的坐标(x₁,y₁)…(x₇₂,y₇₂)中的最大横坐标、纵坐标和最小横坐标、纵坐标4个坐标点，然后根据4个坐标点确定包括所有72个人脸关键点的最小矩形框，然后将矩形框内的图像作为人脸图像。这仅仅是示例性的，还可以通过确定圆心坐标和半径以圆形框来截取人脸图像。本公开在此不做限制。

计算设备104然后可以对所确定的人脸图像进行归一化处理，以获取经归一化的人脸图像。例如，计算设备104对人脸图像中的每一个像素依次进行归一化处理，计算设备可以将每个像素的像素值减128再除以256，使每个像素的像素值在[-0.5,0.5]之间。

在一个示例中，计算设备104还可以将归一化处理后的图像进行随机数据增强处理。例如，计算设备104可以将图像旋转5°，然后获取旋转后的图像作为附加数据进行后续处理。

最后计算设备104基于经归一化的人脸图像，确定所述第一置信度、所述第二置信度和所述第三置信度。例如，计算设备104可以通过经归一化的彩色图像101、深度图像102、红外图像103，利用人脸活体算法或者人脸活体神经网络确定该人脸为活体人脸的概率为80％、70％和65％。

在一个备选实施例中，计算设备104也可以基于经归一化的彩色图像101、深度图像102、红外图像103直接输出二分类结果，即是活体人脸或者是伪造人脸，即相片或者面具。

在框230，计算设备104基于所述第一置信度、所述第二置信度和所述第三置信度，确定人脸的真实性。例如，计算设备104可以基于与第一置信度相关联的第一权重、与所述第二置信度相关联的第二权重以及与所述第三置信度相关联的第三权重，确定人脸置信度，然后如果人脸置信度大于阈值置信度，则确认人脸为活体人脸。例如，根据上述，计算设备分别利用彩色图像101、深度图像102、红外图像103确定该人脸为活体人脸的概率为80％、70％和65％，然后上述三个概率的权重均为的三分之一，则可以确定最终权重为65％，如果对于一般小区门禁，阈值置信度为60％，则计算设备104确定该人脸为活体人脸，若对于支付场景，阈值置信度为70％，则确定为伪造人脸，需要重新验证。

本公开通过彩色、深度、红外三种模态计算概率并且进行加权预测，可以有效提升人脸活体检测***准确率，从而提升人脸识别***整体安全性与有效性。

图3示出了根据本公开的一些实施例的多模态人脸活体检测的过程的流程图。首先计算设备104利用人脸位置检测算法301分别确定RGB人脸区域301-1和红外人脸区域301-2。然后计算设备104利用人脸关键点检测算法302分别确定RGB人脸关键点302-1和红外人脸关键点302-2，然后将RGB人脸关键点302-1和/或红外人脸关键点302-2映射为深度人脸关键点302-3。计算设备104还可以仅获取RGB人脸关键点302-1，然后基于坐标对应关系将其映射为红外人脸关键点302-2和深度人脸关键点302-3(虚线所示)。通过仅确定一个图像中的人脸关键点，可以节省计算成本，便于更快速高效地进行检测。接着计算设备104利用人脸活体算法303分别确定第一置信度303-1、第二置信度303-2和第三置信度303-3。最后计算设备基于与三个置信度相关联的权重304确定人脸置信度。其中详细过程参考上面关于图2的描述，在此不再赘述。

图5示出了根据本公开的一些实施例的人脸检测的装置的示意性框图。装置500可以被包括在图1的计算设备104中或者被实现为计算设备104。

如图5所示，装置500包括第一关键点确定模块510，被配置为基于包括人脸的彩色图像、红外图像和深度图像，确定所述彩色图像、所述红外图像和所述深度图像中的多个人脸关键点；第一置信度确定模块520，被配置为基于所述多个人脸关键点，分别确定第一置信度、第二置信度和第三置信度，所述第一置信度与所述彩色图像相关联，所述第二置信度与所述红外图像相关联，所述第三置信度与所述深度图像相关联；以及人脸识别模块530，被配置为基于所述第一置信度、所述第二置信度和所述第三置信度，确定人脸的真实性。

在一些实施例中，所述第一关键点确定装置510可以包括：人脸区域确定模块，被配置为基于所述彩色图像和所述红外图像，分别确定所述彩色图像和所述红外图像中的人脸区域；第二关键点确定模块，被配置为基于所述人脸区域，确定所述彩色图像、所述红外图像中的多个人脸关键点；以及第三关键点确定模块，被配置为基于所述彩色图像和/或所述红外图像中的多个人脸关键点，确定所述深度图像的多个人脸关键点。

在一些实施例中，所述第三关键点确定模块可以包括：对应关系确定模块，被配置为确定所述深度图像的坐标与所述彩色图像和/或所述红外图像的坐标之间的对应关系；以及第四关键点确定模块，被配置为基于所述对应关系以及所述彩色图像和/或所述红外图像中的多个人脸关键点，确定所述深度图像中的多个人脸关键点。

在一些实施例中，所述第一置信度确定模块520可以包括：人脸图像确定模块，被配置为基于所述多个人脸关键点，分别确定所述彩色图像、所述红外图像和所述深度图像中的人脸图像；归一化模块，被配置为对所确定的所述人脸图像进行归一化处理，以获取经归一化的人脸图像；以及第二置信度确定模块，被配置为基于经归一化的所述人脸图像，确定所述第一置信度、所述第二置信度和所述第三置信度。

在一些实施例中，所述第一置信度确定模块530可以包括：人脸置信度确定模块，被配置为基于与所述第一置信度相关联的所述第一权重、与所述第二置信度相关联的所述第二权重以及与所述第三置信度相关联的所述第三权重，确定人脸置信度；活体检测模块，被配置为如果所述人脸置信度大于阈值置信度，则确认所述人脸为活体人脸。

根据本公开的实施例，本公开还提供了一种用于声音信号处理的电子设备、可读存储介质和计算机程序产品。

图6图示了可以用来实施本公开内容的实施例的示例设备600的示意性框图。例如，如图1所示的示例环境100中的计算设备104可以由设备600来实施。如图所示，设备600包括中央处理单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的计算机程序指令或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序指令，来执行各种适当的动作和处理。在RAM 603中，还可存储设备600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

设备600中的多个部件连接至I/O接口605，包括：输入单元606，例如键盘、鼠标等；输出单元607，例如各种类型的显示器、扬声器等；存储单元608，例如磁盘、光盘等；以及通信单元609，例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

上文所描述的各个过程和处理，例如方法200，可由处理单元701执行。例如，在一些实施例中，方法200可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元608。在一些实施例中，计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序被加载到RAM 603并由CPU 601执行时，可以执行上文描述的方法200中的一个或多个动作。

本公开可以是方法、装置、***和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实施方式，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。

Claims

1.一种人脸检测的方法，包括：

基于彩色图像和红外图像，分别确定所述彩色图像和所述红外图像中的人脸区域；

基于所述人脸区域，确定所述彩色图像、所述红外图像中的多个人脸关键点；

基于所述彩色图像和/或所述红外图像中的多个人脸关键点，确定深度图像的多个人脸关键点，其中所述彩色图像、所述红外图像和所述深度图像中的多个人脸关键点中的相应数目的人脸关键点被分配给人脸的各个部位；

基于所述多个人脸关键点，分别确定所述彩色图像、所述红外图像和所述深度图像中的人脸图像，其中分别确定所述彩色图像、所述红外图像和所述深度图像中的人脸图像包括：分别确定所述彩色图像、所述红外图像和所述深度图像中的包括所述多个人脸关键点中的全部人脸关键点的最小矩形框，并且基于所述最小矩形框在所述彩色图像、所述红外图像和所述深度图像中分别确定所述彩色图像、所述红外图像和所述深度图像中的所述人脸图像；

基于所确定的所述人脸图像，分别确定第一置信度、第二置信度和第三置信度，所述第一置信度与所述彩色图像相关联，所述第二置信度与所述红外图像相关联，所述第三置信度与所述深度图像相关联；

基于与所述第一置信度相关联的第一权重、与所述第二置信度相关联的第二权重以及与所述第三置信度相关联的第三权重，确定人脸置信度；以及

如果所述人脸置信度大于针对场景设置的阈值置信度，则确认所述人脸为活体人脸。

2.根据权利要求1所述的方法，其中所述彩色图像、所述红外图像和所述深度图像分别由彩色传感器、红外传感器和深度传感器拍摄，所述彩色传感器、所述红外传感器和所述深度传感器在拍摄前基于传感器的位置和相应的内参和外参被配准。

3.根据权利要求2所述的方法，其中基于所述彩色图像和/或所述红外图像中的多个人脸关键点，确定所述深度图像的多个人脸关键点包括：

确定所述深度图像的坐标与所述彩色图像和/或所述红外图像的坐标之间的对应关系；以及

基于所述对应关系以及所述彩色图像和/或所述红外图像中的多个人脸关键点，确定所述深度图像中的多个人脸关键点。

4.根据权利要求1所述的方法，其中基于所述多个人脸关键点，分别确定所述第一置信度、所述第二置信度和所述第三置信度包括：

基于所述多个人脸关键点，分别确定所述彩色图像、所述红外图像和所述深度图像中的人脸图像；

对所确定的所述人脸图像进行归一化处理，以获取经归一化的人脸图像；以及

基于经归一化的所述人脸图像，确定所述第一置信度、所述第二置信度和所述第三置信度。

5.一种人脸检测的装置，包括：

人脸区域确定模块，被配置为基于彩色图像和红外图像，分别确定所述彩色图像和所述红外图像中的人脸区域；

第二关键点确定模块，被配置为基于所述人脸区域，确定所述彩色图像、所述红外图像中的多个人脸关键点；

第三关键点确定模块，被配置为基于所述彩色图像和/或所述红外图像中的多个人脸关键点，确定深度图像的多个人脸关键点，其中所述彩色图像、所述红外图像和所述深度图像中的多个人脸关键点中的相应数目的人脸关键点被分配给人脸的各个部位；

人脸图像确定模块，被配置为基于所述多个人脸关键点，分别确定所述彩色图像、所述红外图像和所述深度图像中的人脸图像，其中分别确定所述彩色图像、所述红外图像和所述深度图像中的人脸图像包括：分别确定所述彩色图像、所述红外图像和所述深度图像中的包括所述多个人脸关键点中的全部人脸关键点的最小矩形框，并且基于所述最小矩形框在所述彩色图像、所述红外图像和所述深度图像中分别确定所述彩色图像、所述红外图像和所述深度图像中的所述人脸图像；

第一置信度确定模块，被配置为基于所述多个人脸关键点，分别确定第一置信度、第二置信度和第三置信度，所述第一置信度与所述彩色图像相关联，所述第二置信度与所述红外图像相关联，所述第三置信度与所述深度图像相关联；

人脸置信度确定模块，被配置为基于与所述第一置信度相关联的第一权重、与所述第二置信度相关联的第二权重以及与所述第三置信度相关联的第三权重，确定人脸置信度；以及

活体检测模块，被配置为如果所述人脸置信度大于针对场景设置的阈值置信度，则确认所述人脸为活体人脸。

6.根据权利要求5所述的装置，其中所述彩色图像、所述红外图像和所述深度图像分别由彩色传感器、红外传感器和深度传感器拍摄，所述彩色传感器、所述红外传感器和所述深度传感器在拍摄前基于传感器的位置和相应的内参和外参被配准。

7.根据权利要求6所述的装置，其中所述第三关键点确定模块包括：

对应关系确定模块，被配置为确定所述深度图像的坐标与所述彩色图像和/或所述红外图像的坐标之间的对应关系；以及

第四关键点确定模块，被配置为基于所述对应关系以及所述彩色图像和/或所述红外图像中的多个人脸关键点，确定所述深度图像中的多个人脸关键点。

8.根据权利要求5所述的装置，其中所述第一置信度确定模块包括：

人脸图像确定模块，被配置为基于所述多个人脸关键点，分别确定所述彩色图像、所述红外图像和所述深度图像中的人脸图像；

归一化模块，被配置为对所确定的所述人脸图像进行归一化处理，以获取经归一化的人脸图像；以及

第二置信度确定模块，被配置为基于经归一化的所述人脸图像，确定所述第一置信度、所述第二置信度和所述第三置信度。

9.一种电子设备，所述设备包括：

一个或多个处理器；以及

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-4中任一项所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现如权利要求1-4中任一项所述的方法。