CN113283388A

CN113283388A - 活体人脸检测模型的训练方法、装置、设备及存储介质

Info

Publication number: CN113283388A
Application number: CN202110703241.2A
Authority: CN
Inventors: 喻晨曦
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2021-06-24
Filing date: 2021-06-24
Publication date: 2021-08-20
Anticipated expiration: 2041-06-24
Also published as: CN113283388B

Abstract

本发明公开了一种活体人脸检测模型的训练方法，应用于人工智能技术领域，用于解决通过极不平衡的正负样本对二分类模型进行训练时模型的预测精度不达标的技术问题。本发明提供的方法包括：获取携带有标签的人脸图片样本集；将该正常人脸图片样本和该异常人脸图片样本输入至待训练的活体人脸检测模型得到原始预测值；对该异常人脸图片样本的原始预测值进行纠偏处理，得到纠正预测值；将该纠正预测值作为该异常人脸图片样本的预测值，将原始预测值作为该正常人脸图片样本的预测值，根据该标签中标识的对应人脸图片样本实际所属的类别对该待训练的活体人脸检测模型进行训练；当该活体人脸检测模型的损失函数收敛时，得到训练好的该活体人脸检测模型。

Description

活体人脸检测模型的训练方法、装置、设备及存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种活体人脸检测模型的训练方法、装置、设备及存储介质。

背景技术

在反欺诈风控场景里，智慧客服场景包括：证件冒办反欺诈、人脸活体检测、基于客户历史数据识别高风险客户/用户、大数据反洗黑钱等等。在核保保全风控中，这些场景都普遍存在。而且以上的场景本身都包含极不平衡样本特性，在很多项目中，一些场景的风控目标样本率甚至低于2％，这种极不平衡样本特性导致的问题给模型效果提升带来极大的困难。

以人脸活体检测模型的场景为例，由于活体人脸伪造样本的数量远远小于正常活体人脸样本的数量，在通过二分类模型对人脸活体进行智能检测时，由于缺乏足够多的真实业务数据来做模型训练与测试，公开的实验室的数据大多数与真实业务场景的数据口径不一致而导致模型在真实场景下失效，在目前直接做机器学习的监督模型训练的方法下，在例如训练数据的目标样本比率只有0.3％的场景或者正负样本比例最多为1：200的这种情况中，普通的损失函数比如聚焦损失等是不足以使训练任务达到比较好的精度需求。

发明内容

本发明实施例提供一种活体人脸检测模型的训练方法、装置、计算机设备及存储介质，以解决通过极不平衡的正负样本对二分类模型进行训练时模型的预测精度不达标的技术问题。

一种活体人脸检测模型的训练方法，该方法包括：

获取携带有标签的人脸图片样本集，该人脸图片样本集包括正常人脸图片样本和异常人脸图片样本，该正常人脸图片样本的数量大于该异常人脸图片样本的数量；

将该正常人脸图片样本和该异常人脸图片样本输入至待训练的活体人脸检测模型，得到该正常人脸图片样本的原始预测值和该异常人脸图片样本的原始预测值；

对该异常人脸图片样本的原始预测值进行纠偏处理，得到该异常人脸图片样本纠正预测值；

将该纠正预测值作为该待训练的活体人脸检测模型对该异常人脸图片样本的预测值，将该正常人脸图片样本的原始预测值作为该待训练的活体人脸检测模型对该正常人脸图片样本的预测值，将该标签中标识的对应人脸图片样本实际所属的正常类别或异常类别作为目标，对该待训练的活体人脸检测模型进行训练；

当该活体人脸检测模型的损失函数收敛时，得到训练好的该活体人脸检测模型。

一种活体人脸检测模型的训练装置，该装置包括：

样本获取模块，用于获取携带有标签的人脸图片样本集，该人脸图片样本集包括正常人脸图片样本和异常人脸图片样本，该正常人脸图片样本的数量大于该异常人脸图片样本的数量；

输入模块，用于将该正常人脸图片样本和该异常人脸图片样本输入至待训练的活体人脸检测模型，得到该正常人脸图片样本的原始预测值和该异常人脸图片样本的原始预测值；

纠偏处理模块，用于对该异常人脸图片样本的原始预测值进行纠偏处理，得到该异常人脸图片样本纠正预测值；

训练模块，用于将该纠正预测值作为该待训练的活体人脸检测模型对该异常人脸图片样本的预测值，将该正常人脸图片样本的原始预测值作为该待训练的活体人脸检测模型对该正常人脸图片样本的预测值，将该标签中标识的对应人脸图片样本实际所属的正常类别或异常类别作为目标，对该待训练的活体人脸检测模型进行训练；

收敛模块，用于当该活体人脸检测模型的损失函数收敛时，得到训练好的该活体人脸检测模型。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述活体人脸检测模型的训练方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述活体人脸检测模型的训练方法的步骤。

本发明提出的活体人脸检测模型的训练方法、装置、计算机设备及存储介质，首先获取携带有标签的人脸图片样本集，该人脸图片样本集中正常人脸图片样本的数量大于该异常人脸图片样本的数量，将该正常人脸图片样本和该异常人脸图片样本输入至待训练的活体人脸检测模型，得到该正常人脸图片样本的原始预测值和该异常人脸图片样本的原始预测值，对与样本数量较少的异常人脸图片样本的原始预测值进行纠偏处理，得到该异常人脸图片样本纠正预测值，将该纠正预测值作为该待训练的活体人脸检测模型对该异常人脸图片样本的预测值，将该正常人脸图片样本的原始预测值作为该待训练的活体人脸检测模型对该正常人脸图片样本的预测值，将该标签中标识的对应人脸图片样本实际所属的正常类别或异常类别作为目标，对该待训练的活体人脸检测模型进行训练，使得该活体人脸检测模型在训练过程中更为关注样本数量较少的异常人脸图片样本的特征信息，从而使得训练好的活体人脸检测模型在对待检测的异常人脸图片进行检测时具有更高的识别灵敏度，提高该活体人脸检测模型的检出准确率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中活体人脸检测模型的训练方法的一应用环境示意图；

图2是本发明一实施例中活体人脸检测模型的训练方法的一流程图；

图3是本发明另一实施例中活体人脸检测模型的训练方法的一流程图；

图4是本发明一实施例中活体人脸检测装置的结构示意图；

图5是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请提供的活体人脸检测模型的训练方法，可应用在如图1的应用环境中，其中，该计算机设备可以通过网络与服务器进行通信。其中，该计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。该服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种活体人脸检测模型的训练方法，以该方法应用在图1中的计算机设备为例进行说明，包括如下步骤：

S101、获取携带有标签的人脸图片样本集，该人脸图片样本集包括正常人脸图片样本和异常人脸图片样本，该正常人脸图片样本的数量大于该异常人脸图片样本的数量。

可以理解的是，所述标签用于标记该人脸图片样本为正常样本还是异常样本。其中，异常人脸图片样本表示伪造的活体人脸图片，例如通过翻拍或者视频已录制好的人脸图片，正常人脸图片样本即通过用户当前的活体状态拍摄的活体人脸图片。

S102、将该正常人脸图片样本和该异常人脸图片样本输入至待训练的活体人脸检测模型，得到该正常人脸图片样本的原始预测值和该异常人脸图片样本的原始预测值。

可以理解的是，得到的异常人脸图片样本的原始预测值为通过待训练的活体人脸检测模型对该异常人脸图片样本进行前向传播的结果，得到的正常人脸图片样本的原始预测值为通过待训练的活体人脸检测模型对该正常人脸图片样本进行前向传播的结果。

在其中一个实施例中，该原始预测值可以通过异常概率来表示，这种情况下得到的正常人脸图片样本的原始预测值即将该正常人脸图片样本输入至待训练的活体人脸检测模型得到的该正常人脸图片样本为异常图片的预测概率，得到的异常人脸图片样本的原始预测值即将该异常人脸图片样本输入至待训练的活体人脸检测模型得到的该异常人脸图片样本为异常图片的预测概率。

在其他实施例中，该原始预测值也可以通过正常概率来表示，在这种情况下得到的正常人脸图片样本的原始预测值即将该正常人脸图片样本输入至待训练的活体人脸检测模型得到的该正常人脸图片样本为正常图片的预测概率，得到的异常人脸图片样本的原始预测值即将该异常人脸图片样本输入至待训练的活体人脸检测模型得到的该异常人脸图片样本为正常图片的预测概率。

在其中一个实施例中，所述活体人脸检测模型可以选用适合监督学习的二分类或多分类模型，本方案场景主要针对人脸活体，所以对于广泛的backbone模型，例如mobilenet,resnet,vggnet等模型可以适用。在多分类模型中，对于含有分类器模块的模型也可以使用。

在其中一个实施例中，在将该正常人脸图片样本和异常人脸图片样本输入至待训练的活体人脸检测模型时，可以通过对该正常人脸图片样本和异常人脸图片样本随机抽取方式，将人脸图片样本批量输入至该活体人脸检测模型。

进一步地，可以通过miniBatch的方式对包含该正常人脸图片样本和异常人脸图片样本的人脸图片样本集进行随机抽取，最终将整个人脸样本集D划分为k个样本集合。

S103、对所述异常人脸图片样本的原始预测值进行纠偏处理，得到所述异常人脸图片样本纠正预测值。

在其中一个实施例中，所述对所述异常人脸图片样本的预测值进行纠偏处理，得到所述异常人脸图片样本纠正预测值的步骤进一步包括：

通过以下公式计算所述异常人脸图片样本纠正预测值：

其中，mid表示该异常人脸图片样本i的纠正预测值，P表示异常人脸图片样本的原始预测值，C表示超参数，Max表示样本量最大的类别中样本的数量。

在本实施例中，样本的类别包括正常类别和异常类别，由于本实施例中正常样本的数量远大于异常样本的数量，该Max即表示正常人脸图片样本的数量。

通过对异常人脸图片样本的原始预测值进行纠偏处理，使得活体人脸检测模型在调节参数时，更为关注样本量较少的异常人脸图片样本，可以提高活体人脸检测模型对异常活体人脸的识别精度。

S104、将该纠正预测值作为该待训练的活体人脸检测模型对该异常人脸图片样本的预测值，将该正常人脸图片样本的原始预测值作为该待训练的活体人脸检测模型对该正常人脸图片样本的预测值，将该标签中标识的对应人脸图片样本实际所属的正常类别或异常类别作为目标，对该待训练的活体人脸检测模型进行训练。

可以理解的是，所述异常人脸图片样本的预测值和所述正常人脸图片样本的预测值可以表示为：

其中，(x，y)表示标签为y的第一样本集合中的样本x，LD()表示标签分布自适应损失函数，f_θ表示待学习的参数为θ的活体人脸检测模型，y＝1表示异常人脸图片样本，y＝0表示正常人脸图片样本，P′表示正常人脸图片样本的预测值。

在其中一个实施例中，在该获取携带有标签的正常人脸图片样本和异常人脸图片样本的步骤之后，该方法还包括：

从人脸图片样本集中随机抽取第一样本集合，所述第一样本集合包括所述正常人脸图片样本和所述异常人脸图片样本；

从所述人脸图片样本集中随机抽取第二样本集合，所述第二样本集合包括所述正常人脸图片样本和所述异常人脸图片样本；

进一步地，该将该标签中标识的对应人脸图片样本实际所属的正常类别或异常类别作为目标，对该待训练的活体人脸检测模型进行训练的步骤包括：

选用第一阶段损失函数，通过所述第一样本集合对所述活体人脸检测模型进行第一阶段训练；

当第一阶段损失函数收敛时，选用第二阶段损失函数，通过所述第二样本集合对所述活体人脸检测模型继续进行第二阶段训练。

在其中一个实施例中，所述第一阶段损失函数为：

其中，f_1θ表示处于第一阶段待学习的参数为θ的活体人脸检测模型，(x，y)表示标签为y的第一样本集合中的样本x，m表示第一样本集合中样本的数量，LD((x，y)，f_1θ)表示该活体人脸检测模型在第一阶段对人脸图片样本x的预测值。

通过以下公式判断所述第一阶段损失函数是否收敛：

其中，

表示参数θ的梯度，α1表示该第一阶段损失函数的学习率，f_1θ′表示上一次调节的该参数为θ’时该活体人脸检测模型在第一阶段的输出，当等式左边f_1θ与等式右边的差值的绝对值在预设的第一范围之内时，判断该第一阶段损失函数收敛。

可以理解的是，当在第一阶段训练的过程中参数θ的梯度足够小，f_1θ和f_1θ’无限接近时，表示该第一阶段损失函数已收敛。

在其中一个实施例中，所述第二阶段损失函数为：

其中，f_2θ表示处于第二阶段待学习的参数为θ的活体人脸检测模型，(x′，y′)表示标签为y’的第二样本集合中的样本x’，n_i表示第i个类别中样本的总数量，m表示第一样本集合中样本的数量，LD((x′，y′)，f_2θ)表示该活体人脸检测模型在第二阶段对人脸图片样本x’的预测值。

可以理解的是，当y′为正常人脸图片样本时，n_i表示该第二样本集合中正常人脸图片样本的总数量，当y′为异常人脸图片样本时，n_i表示该第二样本集合中异常人脸图片样本的总数量。

进一步地，通过以下公式判断所述第二阶段损失函数是否收敛：

其中，

表示参数θ的梯度，α表示所述第二阶段损失函数的学习率，n_i表示第i个类别中样本的总数量，f_2θ′表示上一次调节的该参数为θ’时该活体人脸检测模型在第二阶段的输出，当等式左边f_2θ与等式右边的差值的绝对值在预设的第二范围之内时，判断该第二阶段损失函数收敛。

可以理解的是，当在第二阶段训练的过程中参数θ的梯度足够小，f_θ和f_θ′无限接近时，表示该第二阶段损失函数已收敛。

其中，

α′表示所述第二阶段损失函数的初始化学习率，γ为预设的常数，γ大于1。

在其中一个实施例中，γ的取值例如1.1、1.2、1.3等等。

在其中一个实施例中，α′＝α₁。

通过该第二阶段损失函数可以看出，对所述第二阶段损失函数的学习率α进行了等比缩放，将等比缩放后的学习率作为该第二阶段损失函数每次迭代的衰减，可以起到调节学习速度的作用，以加快该活体人脸检测模型在第二阶段收敛速度。

进一步地，为了提高该活体人脸检测模型的损失函数的收敛速度，缩短活体人脸检测模型的训练时间，所述通过所述第一样本集合对所述活体人脸检测模型进行第一阶段训练的步骤进一步包括：

从所述第一样本集合中随机抽取第一样本子集和第二样本子集；

选用所述第一阶段损失函数和所述第一样本子集，并选用自适应学习率机制对所述活体人脸检测模型进行训练；

当所述第一阶段损失函数收敛时，选用所述第二样本子集和cosine衰减学习率对所述活体人脸检测模型继续进行训练；

当所述第一阶段损失函数再次收敛时，判断所述活体人脸检测模型在第一阶段训练完成。

可以理解的是，该cosine衰减学习率也可以称作余弦学习率。

S105、当所述活体人脸检测模型的损失函数收敛时，得到训练好的所述活体人脸检测模型。

进一步地，所述当所述活体人脸检测模型的损失函数收敛时，得到训练好的所述活体人脸检测模型的步骤具体包括：

当所述活体人脸检测模型的第二阶段损失函数收敛时，得到训练好的所述活体人脸检测模型。

本实施例提出的活体人脸检测模型的训练方法，首先获取携带有标签的人脸图片样本集，该人脸图片样本集中正常人脸图片样本的数量大于该异常人脸图片样本的数量，将该正常人脸图片样本和该异常人脸图片样本输入至待训练的活体人脸检测模型，得到该正常人脸图片样本的原始预测值和该异常人脸图片样本的原始预测值，对与样本数量较少的异常人脸图片样本的原始预测值进行纠偏处理，得到该异常人脸图片样本纠正预测值，将该纠正预测值作为该待训练的活体人脸检测模型对该异常人脸图片样本的预测值，将该正常人脸图片样本的原始预测值作为该待训练的活体人脸检测模型对该正常人脸图片样本的预测值，将该标签中标识的对应人脸图片样本实际所属的正常类别或异常类别作为目标，对该待训练的活体人脸检测模型进行训练，使得该活体人脸检测模型在训练过程中更为关注样本数量较少的异常人脸图片样本的特征信息，从而使得训练好的活体人脸检测模型在对待检测的异常人脸图片进行检测时具有更高的识别灵敏度，提高该活体人脸检测模型的检出准确率。

进一步地，当新增有未标注的人脸图片样本时，在对该活体人脸检测模型继续进行训练，更新该活体人脸检测模型的参数的过程中，图3是本发明另一实施例中活体人脸检测模型的训练方法的一流程图，如图3所示，为了减少对人脸图片样本的人工标注的工作量，在所述活体人脸检测模型的第二阶段损失函数收敛的步骤之后，所述方法还包括以下步骤S301至S309：

S301、获取没有携带标签的无标签人脸图片样本和所述无标签人脸图片样本的初始标签预设值；

S302、将所述无标签人脸图片样本输入至在所述第二阶段训练完成的所述活体人脸检测模型，得到所述无标签人脸图片样本的第一伪标签；

S303、根据所述第一轮伪标签和所述初始标签预设值计算初始伪标签的损失；

S304、根据所述初始伪标签的损失和所述第二阶段损失函数的损失计算所述活体人脸检测模型的损失；

S305、根据计算的所述活体人脸检测模型的损失反向调节所述活体人脸检测模型的参数；

S306、将所述无标签人脸图片样本再次输入所述活体人脸检测模型进行正向传播，得到所述无标签人脸图片样本的当前伪标签；

S307、根据所述当前伪标签和相邻地上一次正向传播时得到的伪标签计算伪标签的当前损失；

S308、根据所述当前伪标签的损失和所述第二阶段损失函数的损失计算所述活体人脸检测模型的损失；

S309、当所述活体人脸检测模型的损失未收敛时，循环所述反向调节所述活体人脸检测模型的参数至所述计算所述活体人脸检测模型的损失的步骤，直到所述活体人脸检测模型的损失收敛时，得到训练好的活体人脸检测模型。

在其中一个实施例中，将当前伪标签和相邻地上一次在所述活体人脸检测模型中正向传播时得到的伪标签的差值的绝对值作为所述伪标签的当前损失，当所述当前伪标签为首次通过所述活体人脸检测模型正向传播得到时，将所述当前伪标签和所述初始标签预设值的差值的绝对值作为所述伪标签的当前损失。

用数学方式表示该伪标签的当前损失例如：

其中，y_i′表示当前伪标签，y_i″表示相邻地上一次正向传播时得到的伪标签，当y_i′为首次正向传播时得到的伪标签时，y_i″为所述初始标签预设值。

在其中一个实施例中，所述通过所述第一轮伪标签和所述初始标签预设值计算所述活体人脸检测模型的损失的步骤进一步包括：

通过以下公式计算所述活体人脸检测模型的损失：

其中，

表示所述第二阶段损失函数的损失，

表示所述伪标签的当前损失，μ表示预设的参数。

本实施例提出的通过没有携带标签的无标签人脸图片样本对该活体人脸检测模型进行半监督学习，使得当新增有未标注的人脸图片样本，需要对该活体人脸检测模型继续进行训练时，可以减少对人脸图片样本的人工标注的工作量，提高活体人脸检测模型的更新效率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种活体人脸检测模型的训练装置，该活体人脸检测模型的训练装置与上述实施例中活体人脸检测模型的训练方法一一对应。在其中一个实施例中，所述活体人脸检测模型可以选用适合监督学习的二分类或多分类模型，本方案场景主要针对人脸活体，所以对于广泛的backbone模型，譬如mobilenet,resnet,vggnet等模型可以适用。在多分类模型中，对于含有分类器模块的模型也可以使用。如图4所示，该活体人脸检测模型的训练装置100包括样本获取模块11、输入模块12、纠偏处理模块13、训练模块14和收敛模块15。各功能模块详细说明如下：

样本获取模块11，用于获取携带有标签的人脸图片样本集，该人脸图片样本集包括正常人脸图片样本和异常人脸图片样本，该正常人脸图片样本的数量大于该异常人脸图片样本的数量；

输入模块12，用于将该正常人脸图片样本和该异常人脸图片样本输入至待训练的活体人脸检测模型，得到该正常人脸图片样本的原始预测值和该异常人脸图片样本的原始预测值；

纠偏处理模块13，用于对该异常人脸图片样本的原始预测值进行纠偏处理，得到该异常人脸图片样本纠正预测值；

训练模块14，用于将该纠正预测值作为该待训练的活体人脸检测模型对该异常人脸图片样本的预测值，将该正常人脸图片样本的原始预测值作为该待训练的活体人脸检测模型对该正常人脸图片样本的预测值，将该标签中标识的对应人脸图片样本实际所属的正常类别或异常类别作为目标，对该待训练的活体人脸检测模型进行训练；

收敛模块15，用于当该活体人脸检测模型的损失函数收敛时，得到训练好的该活体人脸检测模型。

本实施例提出的活体人脸检测模型的训练装置，在得到该正常人脸图片样本的原始预测值和该异常人脸图片样本的原始预测值时，对与样本数量较少的异常人脸图片样本的原始预测值进行纠偏处理，得到该异常人脸图片样本纠正预测值，将该纠正预测值作为该待训练的活体人脸检测模型对该异常人脸图片样本的预测值，将该正常人脸图片样本的原始预测值作为该待训练的活体人脸检测模型对该正常人脸图片样本的预测值，将该标签中标识的对应人脸图片样本实际所属的正常类别或异常类别作为目标，对该待训练的活体人脸检测模型进行训练，使得该活体人脸检测模型在训练过程中更为关注样本数量较少的异常人脸图片样本的特征信息，从而使得训练好的活体人脸检测模型在对待检测的异常人脸图片进行检测时具有更高的识别灵敏度，提高该活体人脸检测模型的检出准确率。

在其中一个实施例中，所述纠偏处理模块13具体用于通过以下公式计算该异常人脸图片样本纠正预测值：

在其中一个实施例中，所述活体人脸检测模型的训练装置100还包括：

第一抽取模块，用于从该人脸图片样本集中随机抽取第一样本集合，该第一样本集合包括该正常人脸图片样本和该异常人脸图片样本；

第二抽取模块，用于从该人脸图片样本集中随机抽取第二样本集合，该第二样本集合包括该正常人脸图片样本和该异常人脸图片样本。

进一步地，所述训练模块14具体包括：

第一阶段训练单元，用于选用第一阶段损失函数，通过该第一样本集合对该活体人脸检测模型进行第一阶段训练；

第二阶段训练单元，用于当第一阶段损失函数收敛时，选用第二阶段损失函数，通过该第二样本集合对该活体人脸检测模型继续进行第二阶段训练。

在其中一个实施例中，所述第一阶段损失函数为：

其中，f_1θ表示处于第一阶段待学习的参数为θ的活体人脸检测模型，(x，y)表示该标签为v的第一样本集合中的样本x，m表示第一样本集合中样本的数量，LD((x，y)，f_1θ)表示该活体人脸检测模型在第一阶段对人脸图片样本x的预测值。

在其中一个实施例中，通过以下公式判断该第一阶段损失函数是否收敛：

其中，

表示参数θ的梯度，α₁表示该第一阶段损失函数的学习率，f_1θ′表示上一次调节的该参数为θ’时该活体人脸检测模型在第一阶段的输出，当等式左边f_1θ与等式右边的差值的绝对值在预设的第一范围之内时，判断该第一阶段损失函数收敛。

进一步地，该第二阶段损失函数为：

进一步地，该第二阶段训练单元通过以下公式判断该第二阶段损失函数是否收敛：

其中，

表示参数θ的梯度，α表示该第二阶段损失函数的学习率，n_i表示第i个类别中样本的总数量，f_2θ′表示上一次调节的该参数为θ’时该活体人脸检测模型在第二阶段的输出，当等式左边f_2θ与等式右边的差值的绝对值在预设的第二范围之内时，判断该第二阶段损失函数收敛。

其中，

在其中一个实施例中，γ的取值例如1.1、1.2、1.3等等。

当新增有未标注的人脸图片样本时，在对该活体人脸检测模型继续进行训练，更新该活体人脸检测模型的参数的过程中，为了减少对人脸图片样本的人工标注的工作量，该活体人脸检测模型的训练装置100还包括：

初始标签获取模块，用于获取没有携带标签的无标签人脸图片样本和所述无标签人脸图片样本的初始标签预设值；

无标签样本输入模块，用于将所述无标签人脸图片样本输入至在所述第二阶段训练完成的所述活体人脸检测模型，得到所述无标签人脸图片样本的第一伪标签；

初始标签损失计算模块，用于根据所述第一轮伪标签和所述初始标签预设值计算初始伪标签的损失；

第一模型损失计算模块，用于根据所述初始伪标签的损失和所述第二阶段损失函数的损失计算所述活体人脸检测模型的损失；

参数调节模块，用于根据计算的所述活体人脸检测模型的损失反向调节所述活体人脸检测模型的参数；

传播模块，用于将所述无标签人脸图片样本再次输入所述活体人脸检测模型进行正向传播，得到所述无标签人脸图片样本的当前伪标签；

标签损失计算模块，用于根据所述当前伪标签和相邻地上一次正向传播时得到的伪标签计算伪标签的当前损失；

第二模型损失计算模块，用于根据所述当前伪标签的损失和所述第二阶段损失函数的损失计算所述活体人脸检测模型的损失；

循环模块，用于当所述活体人脸检测模型的损失未收敛时，循环所述反向调节所述活体人脸检测模型的参数至所述计算所述活体人脸检测模型的损失的步骤，直到所述活体人脸检测模型的损失收敛时，得到训练好的活体人脸检测模型。

用数学方式表示该伪标签的当前损失例如：

在其中一个实施例中，所述第二模型损失计算模块具体用于：

通过以下公式计算所述活体人脸检测模型的损失：

其中，

表示所述第二阶段损失函数的损失，

表示所述伪标签的当前损失，μ表示预设的参数。

本实施例通过没有携带标签的无标签人脸图片样本对该活体人脸检测模型进行半监督学习，使得当新增有未标注的人脸图片样本，需要对该活体人脸检测模型继续进行训练时，可以减少对人脸图片样本的人工标注的工作量，提高活体人脸检测模型的更新效率。

其中上述模块/单元中的“第一”和“第二”的意义仅在于将不同的模块/单元加以区分，并不用于限定哪个模块/单元的优先级更高或者其它的限定意义。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块，本申请中所出现的模块的划分，仅仅是一种逻辑上的划分，实际应用中实现时可以有另外的划分方式。

关于活体人脸检测模型的训练装置的具体限定可以参见上文中对于活体人脸检测模型的训练方法的限定，在此不再赘述。上述活体人脸检测模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图5所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种活体人脸检测模型的训练方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中活体人脸检测模型的训练方法的步骤，例如图2所示的步骤101至步骤105及该方法的其它扩展和相关步骤的延伸。或者，处理器执行计算机程序时实现上述实施例中活体人脸检测模型的训练装置的各模块/单元的功能，例如图4所示模块11至模块15的功能。为避免重复，这里不再赘述。

所述处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述计算机装置的控制中心，利用各种接口和线路连接整个计算机装置的各个部分。

所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。

所述存储器可以集成在所述处理器中，也可以与所述处理器分开设置。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中活体人脸检测模型的训练方法的步骤，例如图2所示的步骤101至步骤105及该方法的其它扩展和相关步骤的延伸。或者，计算机程序被处理器执行时实现上述实施例中活体人脸检测模型的训练装置的各模块/单元的功能，例如图4所示模块11至模块15的功能。为避免重复，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种活体人脸检测模型的训练方法，其特征在于，所述方法包括：

获取携带有标签的人脸图片样本集，所述人脸图片样本集包括正常人脸图片样本和异常人脸图片样本，所述正常人脸图片样本的数量大于所述异常人脸图片样本的数量；

将所述正常人脸图片样本和所述异常人脸图片样本输入至待训练的活体人脸检测模型，得到所述正常人脸图片样本的原始预测值和所述异常人脸图片样本的原始预测值；

对所述异常人脸图片样本的原始预测值进行纠偏处理，得到所述异常人脸图片样本纠正预测值；

将所述纠正预测值作为所述待训练的活体人脸检测模型对所述异常人脸图片样本的预测值，将所述正常人脸图片样本的原始预测值作为所述待训练的活体人脸检测模型对所述正常人脸图片样本的预测值，将所述标签中标识的对应人脸图片样本实际所属的正常类别或异常类别作为目标，对所述待训练的活体人脸检测模型进行训练；

当所述活体人脸检测模型的损失函数收敛时，得到训练好的所述活体人脸检测模型。

2.根据权利要求1所述的活体人脸检测模型的训练方法，其特征在于，所述对所述异常人脸图片样本的原始预测值进行纠偏处理，得到所述异常人脸图片样本纠正预测值的步骤包括：

通过以下公式计算所述异常人脸图片样本纠正预测值：

其中，mid表示所述异常人脸图片样本i的纠正预测值，P表示异常人脸图片样本的原始预测值，C表示超参数，Max表示样本量最大的类别中样本的数量。

3.根据权利要求2所述的活体人脸检测模型的训练方法，其特征在于，在所述获取携带有标签的正常人脸图片样本和异常人脸图片样本的步骤之后，所述方法还包括：

从所述人脸图片样本集中随机抽取第一样本集合，所述第一样本集合包括所述正常人脸图片样本和所述异常人脸图片样本；

所述将所述标签中标识的对应人脸图片样本实际所属的正常类别或异常类别作为目标，对所述待训练的活体人脸检测模型进行训练的步骤包括：

4.根据权利要求3所述的活体人脸检测模型的训练方法，其特征在于，所述第一阶段损失函数为：

其中，f_1θ表示处于第一阶段待学习的参数为θ的活体人脸检测模型，(x，y)表示所述标签为y的第一样本集合中的样本x，m表示第一样本集合中样本的数量，LD((x，y)，f_1θ)表示所述活体人脸检测模型在第一阶段对人脸图片样本x的预测值。

5.根据权利要求4所述的活体人脸检测模型的训练方法，其特征在于，通过以下公式判断所述第一阶段损失函数是否收敛：

其中，

表示参数θ的梯度，α₁表示所述第一阶段损失函数的学习率，f_1θ′表示上一次调节的所述参数为θ’时所述活体人脸检测模型在第一阶段的输出，当等式左边f_1θ与等式右边的差值的绝对值在预设的第一范围之内时，判断所述第一阶段损失函数收敛。

6.根据权利要求3所述的活体人脸检测模型的训练方法，其特征在于，所述第二阶段损失函数为：

其中，f_2θ表示处于第二阶段待学习的参数为θ的活体人脸检测模型，(x′，y′)表示标签为y’的第二样本集合中的样本x’，n_i表示第i个类别中样本的总数量，m表示第一样本集合中样本的数量，LD((x′，y′)，f_2θ)表示所述活体人脸检测模型在第二阶段对人脸图片样本x’的预测值。

7.根据权利要求6所述的活体人脸检测模型的训练方法，其特征在于，通过以下公式判断所述第二阶段损失函数是否收敛：

其中，

表示参数θ的梯度，α表示所述第二阶段损失函数的学习率，n_i表示第i个类别中样本的总数量，f_2θ′表示上一次调节的所述参数为θ’时所述活体人脸检测模型在第二阶段的输出，当等式左边f_2θ与等式右边的差值的绝对值在预设的第二范围之内时，判断所述第二阶段损失函数收敛。

8.一种活体人脸检测模型的训练装置，其特征在于，所述装置包括：

样本获取模块，用于获取携带有标签的人脸图片样本集，所述人脸图片样本集包括正常人脸图片样本和异常人脸图片样本，所述正常人脸图片样本的数量大于所述异常人脸图片样本的数量；

输入模块，用于将所述正常人脸图片样本和所述异常人脸图片样本输入至待训练的活体人脸检测模型，得到所述正常人脸图片样本的原始预测值和所述异常人脸图片样本的原始预测值；

纠偏处理模块，用于对所述异常人脸图片样本的原始预测值进行纠偏处理，得到所述异常人脸图片样本纠正预测值；

训练模块，用于将所述纠正预测值作为所述待训练的活体人脸检测模型对所述异常人脸图片样本的预测值，将所述正常人脸图片样本的原始预测值作为所述待训练的活体人脸检测模型对所述正常人脸图片样本的预测值，将所述标签中标识的对应人脸图片样本实际所属的正常类别或异常类别作为目标，对所述待训练的活体人脸检测模型进行训练；

收敛模块，用于当所述活体人脸检测模型的损失函数收敛时，得到训练好的所述活体人脸检测模型。

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述活体人脸检测模型的训练方法的步骤。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述活体人脸检测模型的训练方法的步骤。