WO2020024737A1

WO2020024737A1 - 生成人脸识别的负样本的方法、装置及计算机设备

Info

Publication number: WO2020024737A1
Application number: PCT/CN2019/093273
Authority: WO
Inventors: 罗文寒; 暴林超; 高源�; 刘威
Original assignee: 腾讯科技（深圳）有限公司
Priority date: 2018-08-02
Filing date: 2019-06-27
Publication date: 2020-02-06
Also published as: CN110163053A; US11302118B2; CN110163053B; EP3751450A1; US20200410266A1; EP3751450A4

Abstract

本申请公开了一种生成人脸识别的负样本的方法、装置及计算机设备。该方法包括：从用于人脸识别的机器学习所需的训练样本库中，获取一个正样本；针对选定的负样本模板，将获取的正样本嵌套进所述负样本模板中，获得模拟在所述负样本模板的显示区域中显示所述正样本的中间样本；针对选定的场景样本，将所述中间样本融合到场景样本中以得到用于人脸识别的机器学习所需的负样本。

Description

生成人脸识别的负样本的方法、装置及计算机设备

本申请要求于2018年08月02日提交的申请号为201810869295.4、发明名称为“生成人脸识别的负样本的方法、装置及计算机设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像处理技术领域，尤其涉及一种生成人脸识别的负样本的方法、装置及计算机设备。

背景技术

目前，人脸识别主要是通过人脸识别模型进行识别，人脸识别模型是通过采用机器学习的方法，对大量的训练样本进行训练学习得到的。其中，用于参与机器学习的训练样本可以划分为两类，即正样本(positive sample)和负样本(negative sample)，正负样本的划分需要根据实际想要验证的内容而定，正样本是指能够得出正确结论的样本，负样本则与之相反。

但是在实际应用过程中，常常会出现正负样本的数量不平衡的情况，例如，正样本数量较多，而负样本数量较少的情况。

发明内容

本申请实施例提供一种生成人脸识别的负样本的方法、装置及计算机设备。

第一方面，提供一种生成人脸识别的负样本的方法，所述方法包括：

从用于人脸识别的机器学习所需的训练样本库中，获取一个正样本；

针对选定的负样本模板，将获取的正样本嵌套进所述负样本模板中，获得模拟在所述负样本模板的显示区域中显示所述正样本的中间样本；

针对选定的场景样本，将所述中间样本融合到场景样本中以得到用于人脸识别的机器学习所需的负样本。

第二方面，提供一种人脸识别模型的训练方法，包括：使用正样本和负样本对人脸识别模型进行训练，所述负样本包括：采用第一方面所述的方法获得的负样本。

第三方面，提供一种人脸活体认证方法，包括：采用人脸识别模型进行人脸活体认证，所述人脸识别模型为基于第二方面的训练方法训练得到的。

第四方面，提供一种生成人脸识别的负样本的装置，所述装置包括：

获取单元，用于从用于人脸识别的机器学习所需的训练样本库中，获取一个正样本；

嵌套单元，用于针对选定的负样本模板，将获取的正样本嵌套进所述负样本模板中，获得模拟在所述负样本模板的显示区域中显示所述正样本的中间样本；

场景融合单元，用于针对选定的场景样本，将所述中间样本融合到场景样本中以得到用于人脸识别的机器学习所需的负样本。

第五方面，提供一种计算机设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如第一方面、第二方面以及第三方面所述的方法。

第六方面，提供一种计算机存储介质，所述计算机存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如第一方面所述的方法。

附图简要说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。下面描述中的附图仅仅是本申请实施例。

图1A为本申请实施例中的一种场景示意图；

图1B为本申请实施例中的另一种场景示意图；

图2为本申请实施例中的生成人脸识别的负样本的方法的流程示意图；

图3为本申请实施例中的生成人脸识别的负样本的方法的流程示意图；

图4为本申请实施例中的第一终端拍摄第二终端中的人脸图片的示意图；

图5为本申请实施例中的第一终端拍摄手持人脸图片的示意图；

图6为本申请实施例中的人脸图片分别置于人脸相框和光晕中的示意图；

图7为本申请实施例中的嵌套过程的示意图；

图8为本申请实施例中的与反射图片合成的过程的示意图；

图9为本申请实施例中的与场景图片融合的过程的示意图；

图10为本申请实施例中的生成人脸识别的负样本的装置的一种结构示意图；

图11为本申请实施例中的计算机设备的一种结构示意图。

实施本发明的方式

为使本申请的目的、技术方案和优点更加清楚明白，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互任意组合。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

为便于理解本申请实施例提供的技术方案，这里先对本申请实施例使用的一些关键名词进行解释：

正样本和负样本：在人脸识别中，正样本和负样本是相对而言的，正样本是指人脸识别模型对样本进行识别之后能够验证通过的样本，那么负样本则是指人脸识别模型对样本进行识别之后不能验证通过的样本。当然，是否验证通过是根据具体的场景而言的。例如，若是需要验证待验证图片是否为人脸，那么人脸图片就可以验证通过，而不包括人脸或者人脸部分只占据很小一部分的图片则不可以验证通过。

或者，例如，用户在使用终端进行支付时，支付***通常会要求用户进行人脸认证，以验证是否本人进行操作。所述用户，或称为第一用户，通常会开启终端上的摄像头拍摄自己的脸部的图片进行认证。这种情况下，第一用户拍摄的第一用户的脸部的图片则可以认为是正样本。然而，还存在着不是第一用户本人，而是第二用户操作第一用户的账户进行支付的情况。这种情况下，第二用户通常会通过用第一用户的照片，或者用其终端中存储的第一用户的脸部的图片或者视频来进行认证。这种情况显然存在危险性，这种情况拍摄的图片则可以认为是负样本，或称为攻击样本。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，在不做特别说明的情况下，一般表示前后关联对象是一种“或”的关系。

在具体实践过程中，诸如上述进行支付时需要验证是否本人进行操作的情况，若是让负样本通过验证的话，则第一用户的账户会存在危险性，第一用户的财产安全无法得以保障，因此通过负样本进行验证的情况通常不允许验证通过。其中，人脸认证的功能是基于人脸识别模型进行的。人脸识别模型是需要将正样本和负样本作为输入，通过建立的人脸识别模型对正样本和负样本中的特征进行学习，从而使得最终得到的人脸识别模型能够正确地区分正样本和负样本。因此，为了在出现上述情况时不让负样本通过人脸认证，那么则需要在对人脸认证模型的训练过程中，加入负样本一并进行训练，从而让模型能够学习到负样本的特征，这样才能在出现上述情况时，能够准确分辨出其为负样本，从而让负样本的人脸认证失败，保证第一用户的账户安全。

在实际生活中，正常进行人脸认证的用户为大多数，因此正样本的数量是能够得以保证的。但是，诸如上述第二用户通过用第一用户的照片或者用其终端中存储第一用户的图片或者视频进行人脸认证，从而操作第一用户的账户的情况，一般正常的用户都不会如此进行，因此认证***能够获取的负样本的数量极少，从而使得正样本和负样本的数量出现极度不平衡的情况，那么通过这些正样本和负样本训练得到的人脸识别模型的准确性也就得不到保证。

本发明人发现，人脸识别很多情况下是用在身份认证上，而在实际应用场景中，最常见的攻击者是采用合法者的照片或者视频来企图骗过人脸活体认证***。照片可以承载在相纸上或者显示在攻击者的手持终端上。视频一般都是在攻击者的手持终端上播放。这种情况下，人脸活体认证***获得的图像中，照片或者视频的周边都会有一个类似框架的东西，并且照片或者终端后面会出现背景。基于此类情况，发明人为了获得负样本，模拟这样的框架结构设计出负样本模板，负样本模板用来模拟照片或者具有显示屏的手持终端设备。进一步，由于正样本是容易获取的，也就是说正样本的数量有所保障，则可以将正样本嵌套进负样本模板中，再加上一定的背景，以利用正样本来生成负样本。这样就可以大量增加负样本的数量，从而解决正样本和负样本极度不平衡的情况。鉴于此，本申请实施例提供了一种生成人脸识别的负样本的方法。在该方法中，可以通过将正样本嵌套在负样本模板中，并融合到一些常见的场景样本中，从而模拟生活场景中使用负样本进行攻击的场景，获得用于人脸识别的机器学习所需的负样本。通过这种方式，可以根据正样本可以生成很多的负样本，从而可以有效地改善由于生活中人脸识别场景中出现攻击的情况为少数，负样本数量过少的现状，进而提高训练所得到的人脸识别模型的性能。常见的场景样本可以是一些常见活动场所的静态照片，例如商场收银台、机场过境闸机等，也可以是带有动态人流的视频等。

此外，本发明人还考虑到，在实际生活中，例如第二用户用终端中存储的第一用户的照片进行人脸认证时，由于光线的反射，不可避免地会在终端的显示单元上反射一些其他物体的影子，这些影子会落在显示单元所显示的第一用户的照片区域中。那么为了使最终得到的负样本的真实性更高，在本申请实施例的方法中，在将获取的正样本嵌套进所述负样本模板中，得到第一中间样本之后，还可以在第一中间样本中加入反射图片的元素，以模拟真实场景中物体反射在第一中间样本中的情景，以形成第二中间样本。

进一步地，本发明人还考虑到，在人脸识别的过程中进行攻击时，一般认证***的摄像头不会直接正对攻击样本，而是与之存在一定的空间位置关系。因此还可以对第二中间样本进行一定的几何形变后，再融合到场景样本中。这样，最终得到的负样本更加符合真实情况，真实性更高。

在介绍完本申请实施例的设计思想之后，下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍，需要说明的是，以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施过程中，可以根据实际需要灵活地应用本申请实施例提供的技术方案。

请参见图1A所示，为发明实施例中的技术方案能够适用的一种应用场景，在该场景中，可以包括终端101和服务器102。

其中，终端101包括摄像头1011。在一种可能的场景中，终端101可以是个人的终端，个人的终端例如可以是用户个人的手机或者平板电脑(PAD)。例如，用户的终端101上的应用程序的账户需要进行人脸认证时，则会打开终端101中的摄像头，拍摄包括该用户人脸的图像，并发送给服务器102。终端101与服务器102之间可以通过网络进行通信。其中，该网络可以是有线网络或者无线网络，无线网络例如可以是移动性蜂窝网络或者无线局域网(Wireless Local Area Network，WLAN)，当然，该网络还可以是其他任何可以进行通信的网络，本申请实施例对此并不进行限制。

服务器102接收到终端101发送的包括用户人脸的图像后，可以通过服务器102中的人脸识别模型对包括用户人脸的图像进行识别，确定出正在进行人脸认证操作的是否为用户本人，并将确定结果反馈给终端101。其中，服务器中102中的人脸识别模型是根据多个正样本和负样本进行训练学习得到的，负样本即可以是根据本申请实施例所提供的技术方案获取的负样本。

在另一种可能的场景中，终端101可以是企业或者事业单位中的终端设备，例如可以是政府办事大厅、银行柜台或者酒店前台的计算机设备等。该计算机设备可以包括摄像头1011。摄像头1011可以是终端101自身包括的摄像头，也可以是终端101外接的摄像头1011。终端101可以采集办理业务的用户的证件信息(一般为身份证)，并通过摄像头1011拍摄办理业务的用户的人脸的图片，然后一并发送给服务器102。服务器102通过人脸识别模型对用户人脸的图片进行识别，进而确定出办理业务的用户与提供的身份信息是否吻合，并将确定结果反馈给终端101。其中，服务器中102中的人脸识别模型是根据多个正样本和负样本进行训练学习得到的，负样本可以包括根据本申请实施例所提供的技术方案获取的负样本。

请参见图1B所示，为本申请实施例中的技术方案能够使用的另一种应用场景。该应用场景例如为安检***。在该场景中，可以包括闸机103和服务器104。

其中，闸机103例如可以是机场安检入口的闸机、火车站检票入口的闸机或者地铁安检入口的闸机等。闸机103中包括一个或者多个摄像头，通过摄像头可以拍摄包括用户人脸的图像106，并采集该用户的证件信息并发送给服务器104进行验证。服务器104可以是相应的安检***中的验证服务器。例如当闸机103为机场入口的闸机时，则服务器104为机场安检***中的验证服务器。服务器104通过服务器104中的人脸识别模型对包括用户人脸的图像进行识别，进而确定出正在进行安检的用户与身份证中的信息是否吻合，并将确定结果反馈给终端103。其中，服务器中104中的人脸识别模型是根据多个正样本和负样本进行训练学习得到的，负样本即可以为根据本申请实施例所提供的技术方案获取的负样本。

当然，本申请实施例提供的方法并不限用于图1A和图1B所示的应用场景中，还可以用于其他可能的应用场景，本申请实施例并不进行限制。

为进一步说明本申请实施例提供的技术方案，下面结合附图以及具体实施方式对此进行详细的说明。虽然本申请实施例提供了如下述实施例或附图所示的方法操作步骤，但所述方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中，这些步骤的执行顺序不限于本申请实施例提供的执行顺序。所述方法在实际的处理过程中或者装置执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行。

图2为本申请实施例中的生成人脸识别的负样本的方法的流程图。如图2所示，该方法包括以下步骤：

步骤201：从用于人脸识别的机器学习所需的训练样本库中，获取一个正样本。

步骤202：针对选定的负样本模板，将获取的正样本嵌套进所述负样本模板中，获得模拟在所述负样本模板的显示区域中显示所述正样本的中间样本。

步骤203：针对选定的场景样本，将所述中间样本融合到场景样本中以得到用于人脸识别的机器学习所需的负样本。

本申请实施例中，通过将正样本嵌套在负样本模板中，再给加上一定的背景，从而模拟生活场景中使用负样本进行攻击的场景，获得用于人脸识别的机器学习所需的负样本，这样，由于正样本的数量有所保证，根据正样本就可以生成很多的负样本，从而可以有效的解决生活中在人脸识别中攻击为少数，负样本数量过少的技术问题，进而提高训练所得到的人脸识别模型的性能。

根据本申请实施例，步骤202中，针对选定的负样本模板，将获取的正样本嵌套进所述负样本模板中，可以包括：

对所述正样本进行预处理，以使得预处理后的正样本能够适应所述负样本模板的显示区域在所述负样本模板中的大小；

将预处理后的正样本嵌套进所述负样本模板中。

本申请实施例中，在将正样本嵌套在负样本模板中时，需要对正样本进行预处理，从而正样本的大小与负样本模板中显示区域的大小相适应，从而使得得到的中间样本愈加接近真实生活场景，从而提到得到的负样本的真实性。

根据本申请实施例，在图2的步骤203：针对选定的场景样本，将所述中间样本融合到场景样本中以得到用于人脸识别的机器学习所需的负样本之前，所述生成人脸识别的负样本的方法还可以包括：

针对选定的反射图片，基于所述中间样本的大小对所述反射图片进行预处理；

对所述中间样本进行如下处理：将所述中间样本作为前景，与预处理后的反射图片进行合成，以模拟所述中间样本中有反射显示的所述反射图片。

本申请实施例中，在实际生活中，由于光线的反射，负样本中不可避免的会包括其他的物体反射形成的反射效果，因此还可以在中间样本中加入反射图片的元素，从而提到得到的负样本的真实性。

根据本申请实施例，所述将所述中间样本作为前景，与预处理后的反射图片进行合成，可以包括：

根据所述中间样本的第一权重值，以及所述反射图片的第二权重值，将所述中间样本与预处理后的反射图片进行合成，其中，所述第一权重值大于预设权重阈值，且所述第二权重值小于或者等于所述预设权重阈值。

本申请实施例中，在将反射图片与中间样本合成时，反射图片的权重小于中间样本的权重，这样，在合成后得到的中间样本中还是主要以合成前的中间样本的内容为主，而反射图片的内容并不会过多的影响视觉效果，更加符合真实场景，从而提高到的负样本的真实性。

根据本申请实施例，所述步骤203的将所述中间样本融合到所述场景样本中，具体可以包括：

对所述中间样本进行至少一次几何形变，几何形变后的中间样本中包括用于指示几何形变前的中间样本在几何形变后的中间样本中的位置的掩膜；

根据所述掩膜将几何形变后的中间样本融合到所述场景样本中。

本申请实施例中，在人脸识别进行攻击时，一般摄像头不会直接正对攻击样本，而是存在一定的空间角度，因此还可以对中间样本进行一定的几何形变后，再融合到场景样本中，这样，最终得到的负样本更加符合真实情况，真实性更高。

在前述实施例中，所述负样本模板可以为具有显示功能的终端的模板，所述显示区域可以为所述终端的显示屏区域；和/或所述场景样本可以包括场景照片或者场景视频。

图3为本申请实施例中的生成人脸识别的负样本的方法的另一个流程示意图。请参见图3所示，本申请实施例提供一种生成人脸识别的负样本的方法，下面以一个负样本的合成为例，该方法的流程如下。

步骤301：从用于人脸识别的机器学习所需的训练样本库中，获取一个正样本。

本申请实施例中，在进行人脸识别模型的训练之前，都需要预先准备好用于机器学习的样本库，样本库可以划分为正样本库和负样本库。样本库中的样本可以是用户在人脸认证过程中拍摄的图片或者视频，或者也可以是从网络获取的人脸的图片或者视频，当然，对于样本的获取方式本申请实施例并不进行限制。

例如，目前许多的手机都可以支持人脸解锁的功能，那么第一用户想要通过人脸解锁手机时，则可以通过手机摄像头拍摄自身的人脸图片，以进行解锁操作，这种情况下拍摄得到的第一用户的人脸图片则可以作为正样本。而若是第二用户获取了第一用户的手机，且获取到第一用户的人脸图片，第二用户有可能通过用第一用户的手机拍摄第一用户的人脸图片(该第一用户的人脸图片例如可以是显示在第二用户的手机上)，对第一用户的手机进行解锁操作。这种情况显然是不能够被允许的，因而这种情况下拍摄得到的图片则可以作为负样本。

再例如，第一用户在银行智能柜台办理业务时，银行智能柜台除了验证第一用户的人脸是否与第一用户提供的证件信息吻合之外，即除了验证拍摄的第一用户的人脸图片是否与证件信息中图片是否匹配之外，还会验证当前拍摄的第一用户是否为活体。那么银行智能柜台通常会要求第一用户完成指定的动作，例如眨眼或者点头等。即银行智能柜台会录制第一用户执行指定的动作时的视频，进而根据该视频进行验证。那么银行智能柜台拍摄的第一用户自身完成上述指定动作的视频既可以作为正样本。而若是第二用户获取到第一用户完成上述指定动作的视频之后，通过在银行智能柜台的摄像头前播放该段视频，以期望通过该视频完成验证时，这时候银行智能柜台的摄像头则可以拍摄到第二用户使用终端播放第一用户完成指定动作的视频的这一段视频。这种情况显然也是不能够被允许的，因而这种情况下摄像头拍摄得到的视频也可以作为负样本。

在实际生活中，因为大多数用户都会按照正常的流程拍摄自身的图片或者视频进行人脸认证，所以正样本是较好获取的，获取到的正样本就可以加入到用于人脸识别的机器学***衡正样本和负样本的数量，进而提高训练得到的模型的性能。

具体地，在通过正样本合成负样本时，需要从正样本库中选取一个正样本，作为合成的基础，在具体进行正样本的选取时，可以通过随机选取的方式进行选取，或者，也可以通过按照一定顺序地方式进行选取，本申请实施例对此不作限制。

步骤302：选取负样本模板，并将正样本嵌套在负样本模板中，得到中间样本。

本申请实施例中，考虑到在实际场景中，第二用户一般都是通过其终端中第一用户的图片或者视频来进行人脸认证，或者，第二用户还可以是手持第一用户的人脸照片来进行人脸认证，因此打开人脸认证页面对用户进行认证的认证终端拍摄到的图片或者视频中还会包括类似框架的东西。例如，第二用户通过其终端中显示的图片进行人脸认证时，认证终端不可避免地会拍摄到第二用户的终端的外形轮廓。或者当第二用户手持人脸图片进行人脸认证时，认证终端会不可避免地拍摄到第二用户的手。因此可以将包括终端外形轮廓、手等这些因素的图片作为负样本模板，进而后续可以与正样本进行嵌套，从而得到模拟实际场景的负样本。

例如，请参见图4所示，第一终端401为打开人脸认证页面的认证设备，第二终端402为显示或播放第一用户的图片或者视频的设备。第二用户在第一终端401的摄像头前通过第二终端402的显示屏播放第一用户的图片或者视频403，第一终端401通过拍摄第二终端播放的图片或者视频403来进行人脸认证时，第二终端402会落入到第一终端401的摄像头的拍摄区域404中，从而第一终端401拍摄得到的图片或者视频中会包括第二终端402的图像。那么这种情况下，负样本中也就相应地可以包括终端的图像。为了模拟真实场景中的负样本，可以在通过正样本合成负样本的过程中，将第二终端的图像作为负样本模板，进而将正样本嵌套在第二终端的图像中，以模拟正样本在第二终端的显示屏上进行显示的情景。

例如，第二用户可能还会直接使用打印出来的第一用户的人脸图片进行人脸认证。请参见图5所示，第一终端501为打开人脸认证页面的认证设备，第一终端501在拍摄第一用户的人脸图片502时，第二用户的手503则会落入到第一终端的摄像头的拍摄区域504中，因而第一终端501拍摄到的图片中还可能包括拿着第一用户的人脸图片的第二用户的手的图像。那么这种情况下，负样本中也就相应的可以包括手的图像，那就可以将手的图像作为负样本模板，进而将正样本嵌套在手的图像中，以模拟手拿着正样本的情景。

例如，如图6中左图所示，第一用户的人脸图片601还可能被放置在相框602中由第二用户拿着在第一终端前面进行验证。那么这种情况下，第一终端拍摄到的图片中也就会包括相框，那么相框的图像也可以作为用于合成负样本的负样本模板。或者，如图6中右图所示，第二用户可能直接将第一用户的人脸图片603放置在一平面上，然后通过第一终端进行拍摄。这种情况下，由于环境中光线的影响，第一终端拍摄的图片中人脸图像周围可能会存在一定的光晕604，那么光晕图像也可以作为用于合成负样本的负样本模板。

在具体实施过程中，可以预先获取市面上较为常用的终端的图像、多个包括不同姿势的手的图像、不同模样的相框的图像以及光晕的图像等作为负样本模板，并添加至负样本模板库中。在进行负样本的合成的过程中，可以从负样本模板库中选取其中一个负样本模板。其中，负样本模板的形式具体可以是图片，例如终端图片。或者负样本模板的形式还可以是视频，那么负样本模板中的每一帧可以均是相同的内容，例如每一帧都可以是终端图片。负样本模板具体还可以是物体本身，例如可以是终端、手或者相框等。

具体地，在进行负样本模板的选取时，可以通过随机选取的方式进行选取，或者，也可以通过按照一定顺序地方式进行选取，本申请实施例对此不作限制。

本申请实施例中，获取正样本和负样本模板之后，则可以将正样本嵌套在负样本模板中，以获得模拟在负样本模板的显示区域中显示正样本的中间样本。

具体地，当负样本模板为具有显示功能的终端的图像时，则显示区域具体指该终端的显示屏区域；或者，当负样本模板为相框的图像时，则显示区域具体指相框的内框区域。

本申请实施例中，为了使得正样本能够适应负样本模板中显示区域的大小，在进行嵌套操作之前，还可以根据终端显示区域的大小先对正样本进行预处理，从而使得嵌套之后得到的中间样本能够显得更加真实。

下面以正样本为人脸图片，终端具体为手机为例进行描述。

请参考图7所示，在得到作为正样本的人脸图片701之后，可以根据作为负样本模板的手机图像702中的显示屏703的大小对人脸图片进行裁剪和/或尺度变换等图像预处理，得到预处理后的人脸图片704。其中，尺度变换是对人脸图片进行缩放，以改变人脸图片的尺寸大小的方式。图7中所示的手机为黑色苹果(iPhone)手机，当然，也可以是其他颜色的手机，或者是其他品牌的手机。

在对人脸图片进行预处理之后，则可以将预处理后的人脸图片704嵌套在手机图像702中得到第一中间样本705，例如图7中所示，即将预处理后的人脸图片704置于手机图片的显示屏区域703中，以模拟出手机正显示人脸图片的效果。

本申请实施例中，若是正样本为视频时，负样本模板可以是图片，或者也可以是视频，例如视频中只包括终端、者手、相框或者光晕等内容。具体的，同样可以将对视频形式的正样本进行预处理后，再嵌套进负样本模板中。例如，可以调整视频的比例，以适应手机显示屏的大小，再将调整后的视频嵌套在手机中，以模拟在手机中播放视频的效果。

步骤303：选取反射图片，并根据中间样本的大小对反射图片进行预处理。

本申请实施例中，考虑到在第二用户通过终端中第一用户的人脸图片或者视频进行人脸认证时，或者第二用户手持打印出来的第一用户的人脸图片时，由于光线的反射，场景中的背景都不可避免地会在终端中或者打印出来的人脸图片中形成反射效果，因而本申请实施例的技术方案对反射也进行了模拟。

具体地，由于用户可以在多种场景中进行人脸认证的过程，因此人脸图片可以反射的物体是很多的。例如在室外场景中时，反射的物体例如可以是建筑物或者建筑物上的商标等，在室内场景中时，反射的物体可以是室内设施，例如壁纸、空调或者电视等。可以采集多个室内场景中的物体的图片以及多个室外场景的物体的图片，作为反射图片加入到反射图片库中，进而在合成负样本的过程中，则可以从反射图片库中进行选取。在具体进行选取时，可以通过随机选取的方式进行选取，或者，也可以通过按照一定顺序地方式进行选取，本申请实施例对此不作限制。

由于采集的反射图片的尺寸与中间样本通常不会直接吻合，因而还需要对反射图片进行预处理，从而使得反射图片的大小与中间样本的大小一致。例如，当负样本模板为终端图片时，具体即是要使得反射图片的大小与终端图片中终端的外形大小一致；或者当负样本模板为相框图片时，具体即是要使得反射图片的大小与相框图片中相框的边框大小一致。

沿用负样本模板为手机图片的例子，则可以对反射图片进行裁剪，使得剪裁后的反射图片与手机图片中手机的外形尺寸相同；或者，还可以对反射图片进行缩放，例如横向的缩放，或者纵向的缩放，使得缩放后的反射图片与手机的外形尺寸相同。由于真实场景下，在反射的物体与手机的显示屏之间可能存在着一定空间位置关系，因此，基于该考虑，除了上述处理操作之外，还可以对反射图片进行几何形变，从而使反射图片在中间样本中更加趋于真实。

步骤304：将中间样本作为前景，与预处理后的反射图片进行合成，使得中间样本中模拟有反射显示的反射图片。

本申请实施例中，在对反射图片进行预处理之后，则可以将中间样本作为前景图片，与预处理后的反射图片进行合成，以使得中间样本中模拟有反射显示的反射图片。

具体地，在中间样本为图片时，则中间样本可以与预处理后的反射图片直接进行合成，相应的合成后的中间样本也为图片。或者，当中间样本为视频时，可以对视频中的每一帧都与反射图片进行合成，相应的合成后的中间样本也为视频。其中，与不同帧进行合成的预处理后的反射图片可以是相同的，也可以是不同的。例如，与第一帧进行合成的预处理后的反射图片可以是原反射图片中的第一部分，而与第二帧进行合成的预处理后的反射图片可以是原反射图片中的第二部分，第一部分和第二部分不同，但是第一部分和第二部分之间可以存在交集，也可以是完全不存在交集。

具体地，由于通常反射图片合成到终端图片中的终端的显示屏上形成的反射效果都是比较浅的，也就是说，在合成后的中间样本中，起到主要视觉效果的还是合成前的中间样本的内容，而反射图片中的内容起到的视觉效果较弱。请参见图8所示，图8为以正样本为人脸图片为例，将中间样本(例如是通过图7的方式得到的第一中间样本705)和合成前的反射图片801进行合成的示意图。从图8可以看到，在合成后的中间样本(称为第二中间样本802)中，合成前的中间样本(第一中间样本705)的内容仍然处于主导地位，而反射图片中的建筑物803虽然也能够感受到，但是感知效果是较弱的。

为了实现如图8所示的合成后的中间样本(第二中间样本802)的效果，在进行合成时，可以为反射图片801设置权重，相应地，合成前的中间样本 (第一中间样本705)的权重则为反射图片801的权重的补集，那么则可以根据各自的权重进行合成前的中间样本和反射图片的合成。

具体地，将合成前的中间样本(第一中间样本)的权重称为第一权重值，以及反射图片的权重称为第二权重值，第一权重值与第二权重值互为补集，且第一权重值大于预设权重阈值，且第二权重值小于或者等于所述预设权重阈值。例如，第二权重值为0.1时，则第一权重值为0.9(即1-0.1)。预设权重阈值可以是根据经验设置的值，或者根据具体实验得出的值，示例性的，预设权重阈值例如可以为0.2。

在将第一中间样本与预处理后的反射图片进行合成时，可以通过以下公式进行计算得到：

S＝(1-a)*I+a*R

其中，S表示合成后的中间样本(第二中间样本)，I表示合成前的中间样本(第一中间样本)，R表示预处理后的反射图片，a为第二权重值，a的取值可以是从满足需求的值中随机选择的，当然，a的取值也可以是固定不变的。

基于上述公式的合成过程，即是将合成前的中间样本(第一中间样本)与预处理后的反射图片中的每一个像素点的像素值与各自相应的权重进行相乘后叠加的过程。

步骤305：对中间样本进行至少一次几何形变，获得几何形变后的中间样本。

在实际场景，例如图4所示的场景中，第一终端和第二终端之间可能很难保持完全平行的状态，也就是说第一终端和第二终端之间或多或少都会存在一定的空间位置关系；或者，例如图5所示的场景中，第二用户手持的人脸图片也很难与第一终端保持完全平行的状态，因此为了使得最终获得负样本更加趋于真实，还可以中间样本进行一次或者多次几何形变，得到几何形变后的中间样本，进而再进行后续的合成过程。

在这里需要声明的是，几何形变前的中间样本可以是步骤304得到的合成后的中间样本(第二中间样本)，也可以是步骤302得到的中间样本(第一中间样本)。

其中，几何形变可以是透视变换，或者仿射变换，当然，几何形变也可以是其他的变换类型，本申请实施例对此并不进行限制。

下面以几何形变为透视变换为例进行描述。

具体地，透视变换的变换参数可以是固定的，也可以是每一次透视变换时都随机选取变换参数，变换参数例如可以包括旋转角度或者拉伸比例等。

请参见图9，在对第二中间样本802进行透视变换之后，得到的几何形变后的第三中间样本901。第三中间样本901中包括指示几何形变前的中间样本在几何形变后的中间样本中的位置的掩膜904，也就是图9所示的第三中间样本901中手机所占据的图像区域即为掩膜904。其中，只有位于掩膜904内的像素点是存在值的，而位于掩膜904之外的像素点是没有值的，具体表现为如图9中所示为纯黑色区域905，掩膜904有助于将几何形变后的中间样本与场景样本进行融合，具体的将在后续进行介绍，在此先不过多进行赘述。

步骤306：将中间样本融合到场景样本中，获得负样本。

本申请实施例中，在进行人脸认证过程中，拍摄图片或者视频时，难以避免的会将周围的环境拍摄进去，因此为了使得最终得到负样本更贴合真实情景，还可以将中间样本融合到一场景中，从而最终得到负样本。即，可以针对选定的场景样本，将中间样本融合到场景样本中以得到用于人脸识别的机器学习所需的负样本。

需要声明的是，这里所指的中间样本可以是步骤302得到的中间样本(第一中间样本)，也可以是步骤304得到的合成后的中间样本(第二中间样本)，或者还可以是步骤305得到的中间样本(第三中间样本)。也就是说，在本申请实施例中，步骤303～步骤305并不是必选的步骤，在具体实施过程中，步骤303～步骤305可以根据实际需求，灵活的选取部分或者全部来执行。

具体地，由于用户可以在多种场景中进行人脸认证的过程，总体来说，场景可以划分为室内场景和室外场景，在具体实施过程中，可以采集多个室内场景的图片以及多个室外场景的图片，加入到场景样本库中，进而在合成负样本的过程中，则可以从场景样本库中进行选取。在具体进行选取时，可以通过随机选取的方式进行选取，或者，也可以通过按照一定顺序地方式进行选取，本申请实施例对此不作限制。其中，场景样本可以是场景照片，也可以是场景视频。此外，除了上述的室内场景的图片以及室外场景的图片之外，场景照片还可以是纯色的背景，例如白墙或者蓝天等。

根据本申请实施例，也可以对场景样本进行预处理，使得场景样本的大小与中间样本的大小一致。

在将中间样本与场景样本进行融合时，可以通过以下公式进行计算得到：

F＝S’*M+B*(1-M)

其中，F表示最终得到的负样本，S’表示中间样本，M表示掩膜，B表示预处理后的场景样本。

例如图9中所示，以中间样本为步骤305得到的中间样本，也就是几何形变后的中间样本(第三中间样本901)为例，将第三中间样本901与场景样本(场景图片902)进行融合的过程中，实质上是将预处理后的场景样本中掩膜904所在的区域替换成中间样本的掩膜904，而预处理后的场景样本中掩膜904之外的区域保持不变，得到负样本903。

本申请实施例中，对于正样本为图片时，得到的负样本也就相应的为图片，对于正样本为视频时，得到的负样本也就相应的为视频。

本申请实施例中，得到负样本之后，则可以将负样本添加到负样本库中，用于人脸识别模型的训练学习，因此，本申请实施例还提供一种人脸识别模型的训练方法，在该方法中，可以结合已有的正样本，以及本申请实施例的生成人脸识别的负样本的方法得到的负样本来对模型进行训练学习，以得到最终的人脸识别模型。本申请实施例并不限于模型的类型，例如可以是神经网络模型或者遗传算法模型，或者其他可能的模型。

相应地，本申请实施例还提供一种人脸认证方法，在该方法中，可以通过上述人脸识别模型的训练方法训练得到的人脸识别模型来进行人脸活体认证，该方法可以适用于多种应用场景中，例如可以包括但不限于如图1A和图1B所示的应用场景。

本申请实施例中，可以通过模拟生活场景中使用负样本进行攻击的场景，获得用于人脸识别的机器学习所需的负样本，这样，根据正样本可以生成很多的负样本，从而可以有效的解决生活中在人脸识别中攻击为少数，负样本数量过少的技术问题，进而提高训练所得到的人脸识别模型的性能。并且，在上述的步骤中，可以加入很多随机因素，例如在选取负样本模板、反射照片或者场景样本时可以随机选取，反射照片的权重可以随机选取，透视变换的变换参数也可以随机选取等，那么理论上可以产生无穷的负样本，继而极大地提升模型的性能。

请参见图10，基于同一发明构思，本申请实施例还提供了一种生成人脸识别的负样本的装置，该装置可以包括：

获取单元1001，用于从用于人脸识别的机器学习所需的训练样本库中，获取一个正样本；

嵌套单元1002，用于针对选定的负样本模板，将获取的正样本嵌套进负样本模板中，获得模拟在负样本模板的显示区域中显示正样本的中间样本；

场景融合单元1003，用于针对选定的场景样本，将中间样本融合到场景样本中以得到用于人脸识别的机器学习所需的负样本。

根据本申请实施例，嵌套单元1002具体可以用于：

对正样本进行预处理，以使得预处理后的正样本能够适应负样本模板的显示区域的大小；

将预处理后的正样本嵌套进负样本模板的显示区域中。

根据本申请实施例，所述装置还可以包括反射合成单元1004。

反射合成单元1004，用于针对选定的反射图片，基于中间样本的大小对反射图片进行预处理；以及对中间样本进行如下处理：将中间样本作为前景，与预处理后的反射图片进行合成，以模拟中间样本中有反射显示的反射图片。

根据本申请实施例，反射合成单元1004具体可以用于：

根据中间样本的第一权重值，以及反射图片的第二权重值，将中间样本与预处理后的反射图片进行合成，其中，第一权重值大于预设权重阈值，且第二权重值小于或者等于预设权重阈值。

根据本申请实施例，场景融合单元1003具体还可以用于：

对中间样本进行至少一次几何形变，几何形变后的中间样本中包括用于指示几何变形前的中间样本在几何变形后的中间样本中的位置的掩膜；

根据掩膜将几何变性后的中间样本融合到场景样本中。

根据本申请实施例，负样本模板例如为具有显示功能的终端的模板，显示区域为终端的显示屏区域；和/或场景样本包括场景照片或者场景视频。

该装置可以用于执行图3～图8所示的实施例所提供的方法，因此，对于该装置的各功能模块所能够实现的功能等可参考图3～图8所示的实施例的描述，不多赘述。其中，反射合成单元1004虽然在图10中一并示出，但需要知道的是，反射合成单元1004并不是必选的功能单元，因此在图10中以虚线示出。

请参见图11，基于同一技术构思，本申请实施例还提供了一种计算机设备，可以包括存储器1101和处理器1102。

所述存储器1101，用于存储处理器1102执行的计算机程序。存储器1101可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序等；存储数据区可存储根据计算机设备的使用所创建的数据等。处理器1102，可以是一个中央处理单元(central processing unit，CPU)，或者为数字处理单元等等。本申请实施例中不限定上述存储器1101和处理器1102之间的具体连接介质。本申请实施例在图11中以存储器1101和处理器1102之间通过总线1103连接，总线1103在图11中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。所述总线1103可以分为地址总线、数据总线、控制总线等。为便于表示，图11中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器1101可以是易失性存储器(volatile memory)，例如随机存取存储器(random-access memory，RAM)；存储器1101也可以是非易失性存储器(non-volatile memory)，例如只读存储器，快闪存储器(flash memory)，硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)、或者存储器1101是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。存储器1101可以是上述存储器的组合。

处理器1102，用于调用所述存储器1101中存储的计算机程序时执行如图3～图8中所示的实施例提供的生成人脸识别的负样本的方法、人脸识别模型的训练方法以及人脸活体认证方法。

本申请实施例还提供了一种计算机存储介质，存储为执行上述处理器所需执行的计算机可执行指令，其包含用于执行上述处理器所需执行的程序。

在一些可能的实施方式中，本申请提供的生成人脸识别的负样本的方法、人脸识别模型的训练方法以及人脸活体认证方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在计算机设备上运行时，所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的生成人脸识别的负样本的方法、人脸识别模型的训练方法以及人脸活体认证方法中的步骤，例如，所述计算机设备可以执行如图3～图8中所示的实施例提供的生成人脸识别的负样本的方法、人脸识别模型的训练方法以及人脸活体认证方法。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器 (ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本申请的实施方式的生成人脸识别的负样本的方法、人脸识别模型的训练方法以及人脸活体认证方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在计算设备上运行。然而，本申请的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了装置的若干单元或子单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外，尽管在附图中以特定顺序描述了本申请方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白，本申请的实施例可提供为方法、***、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

一种生成人脸识别的负样本的方法，其特征在于，所述方法包括：

从用于人脸识别的机器学习所需的训练样本库中，获取一个正样本；

针对选定的负样本模板，将获取的正样本嵌套进所述负样本模板中，获得模拟在所述负样本模板的显示区域中显示所述正样本的中间样本；

针对选定的场景样本，将所述中间样本融合到场景样本中以得到用于人脸识别的机器学习所需的负样本。
如权利要求1所述的方法，其特征在于，所述针对选定的负样本模板，将获取的正样本嵌套进所述负样本模板中，包括：

对所述正样本进行预处理，以使得预处理后的正样本能够适应所述负样本模板的显示区域的大小；

将预处理后的正样本嵌套进所述负样本模板的显示区域中。
如权利要求1所述的方法，其特征在于，

在所述针对选定的场景样本，将所述中间样本融合到场景样本中以得到用于人脸识别的机器学习所需的负样本之前，所述方法还包括：

针对选定的反射图片，基于所述中间样本的大小对所述反射图片进行预处理；

对所述中间样本进行如下处理：将所述中间样本作为前景，与预处理后的反射图片进行合成，以模拟所述中间样本中有反射显示的所述反射图片。
如权利要求3所述的方法，其特征在于，所述将所述中间样本作为前景，与预处理后的反射图片进行合成，包括：

根据所述中间样本的第一权重值，以及所述反射图片的第二权重值，将所述中间样本与预处理后的反射图片进行合成，其中，所述第一权重值大于预设权重阈值，且所述第二权重值小于或者等于所述预设权重阈值。
如权利要求3所述的方法，其特征在于，所述将所述中间样本融合到所述场景样本中，具体包括：

对所述中间样本进行至少一次几何形变，几何形变后的中间样本中包括用于指示几何形变前的中间样本在几何形变后的中间样本中的位置的掩膜；

根据所述掩膜将几何形变后的中间样本融合到所述场景样本中。
如权利要求1-5任一所述的方法，其特征在于，所述负样本模板为具有显示功能的终端的模板，所述显示区域为所述终端的显示屏区域；和/或

所述场景样本包括场景照片或者场景视频。
一种人脸识别模型的训练方法，包括：使用正样本和负样本对人脸识别模型进行训练，其特征在于，所述负样本包括：采用权利要求1～5任一所述的方法获得的负样本。
一种生成人脸识别的负样本的装置，其特征在于，所述装置包括：

获取单元，用于从用于人脸识别的机器学习所需的训练样本库中，获取一个正样本；

嵌套单元，用于针对选定的负样本模板，将获取的正样本嵌套进所述负样本模板中，获得模拟在所述负样本模板的显示区域中显示所述正样本的中间样本；

场景融合单元，用于针对选定的场景样本，将所述中间样本融合到场景样本中以得到用于人脸识别的机器学习所需的负样本。
一种计算机设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1～5任一权利要求所述的方法。
一种计算机存储介质，其特征在于，

所述计算机存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如权利要求1～5任一权利要求所述的方法。