CN113159006B

CN113159006B - 基于人脸识别的考勤方法、***、电子设备和存储介质

Info

Publication number: CN113159006B
Application number: CN202110699382.1A
Authority: CN
Inventors: 王东; 王月平
Original assignee: Hangzhou Moredian Technology Co ltd
Current assignee: Hangzhou Moredian Technology Co ltd
Priority date: 2021-06-23
Filing date: 2021-06-23
Publication date: 2021-09-14
Anticipated expiration: 2041-06-23
Also published as: CN113159006A

Abstract

本申请涉及一种基于人脸识别的考勤方法、***、电子设备和存储介质，该方法包括采集待考勤人员的端正人脸图片作为样本集，通过预先训练的3D可变形对抗生成网络对端正人脸图片生成任意角度人脸图片以扩充样本集，用扩充后的样本集训练人脸识别模型，用训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录，通过本申请，解决了人脸识别技术在门禁或考勤***中准确度较低的问题，提高了提高人脸识别效率及考勤效率。

Description

基于人脸识别的考勤方法、***、电子设备和存储介质

技术领域

本申请涉及机器学习技术领域，特别是基于人脸识别的考勤方法、***、电子设备和存储介质。

背景技术

随着人脸识别技术的发展，如今，越来越多的人脸识别技术应用到人们的日常生活中，例如，人脸识别技术用于在门禁或考勤***。

目前，由于缺乏大角度姿态人脸样本的现状，不仅人脸识别模型的识别准确性较低，而且用户往往需要刻意地配合摄像仪器的角度，以采集端正的人脸图像，才能进行人脸识别，使得在实际复杂情况下人脸识别效率较低，因此在考勤时容易发生通行时的短暂驻留甚至排队拥堵的情况。

发明内容

本申请实施例提供了一种基于人脸识别的考勤方法、***、电子设备和存储介质，目的之一在于提高人脸识别效率，从而提高考勤效率，节约通行时间，避免考勤人员驻留和排队拥堵。

第一方面，本申请实施例提供了一种基于人脸识别的考勤方法，该方法包括：

采集待考勤人员的端正人脸图片作为样本集；

通过预先训练的3D可变形生成对抗网络（3D Morphable Model GenerativeAdversarial Networks ，可简称3D可变形模型 GAN）对所述端正人脸图片生成任意角度人脸图片以扩充样本集，其中，所述3D可变形生成对抗网络由3D可变形模型和生成对抗网络结合生成；

用扩充后的样本集训练人脸识别模型；

用训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录；

所述3D可变形生成对抗网络通过如下方式获得：

将随机纹理参数

和3D可变形模型形状参数

输入纹理生成器

，生成3D可变形模型对应形状的纹理图；

将所述随机纹理参数

、所述3D可变形模型形状参数

、随机背景参数

、姿势标签

和表情参数

输入背景生成器

，生成符合给定参数的背景图；

通过所述3D可变形模型将所述纹理图和姿势标签

、所述表情参数

以及所述3D 可变形模型形状参数

结合以进行3D重建，并通过纹理映射方法

和可微渲染函数R将纹理映射到渲染的图像空间中，生成渲染后的面部纹理图；

将所述渲染后的面部纹理图和所述背景图进行合成，将合成后的图送入判别器D，并通过优化所述判别器D的损失函数

和所述纹理生成器

损失函数以及所述背景生成器

的损失函数

以得到所述预先训练的3D可变形生成对抗网络。

在其中一些实施例中，所述人脸识别模型为端到端的深度卷积神经网络模型。

在其中一些实施例中，所述3D可变形生成对抗网络的训练方式如下：

交替最小化判别器和生成器的损失，其中，目标损失函数为：

其中，

为判别器的损失函数，

为生成器的损失函数，

表示真实样本的交叉熵损失值，

表示生成的样本的交叉熵损失值，

代表附加梯度惩罚项，

由公式为

计算得出，

是指包括随机纹理参数

、随机背景参数

、3D可变形模型形状参数

、表情参数

在内的矢量表示，

为从训练数据

的分布中随机选择的真实图像和相关的姿势标签，

为真实图像，

为姿势标签，

，

为参数化的生成器网络G，

代表参数化纹理，

代表背景生成器网络，

代表参数化的判别器网络D，N代表

中纹理、背景、形状和表情参数向量维度的综合表示符号。

在其中一些实施例中，所述的通过预先训练的3D可变形生成对抗网络对所述端正人脸图片生成任意角度人脸图片以扩充样本集包括：

根据

生成任意角度人脸图片，其中，

是生成的图像，

是

维的随机纹理参数，

是

维的随机背景参数，

是

维的 3D可变形模型形状参数，

是

维的表情参数，

为姿势标签，

为练好的参数化纹理，

代表训练好的背景生成器网络；将生成的任意角度人脸图片加入到所述样本集中，得到所述扩充后的样本集，其中，G为生成器网络。

在其中一些实施例中，在通过所述预先训练的3D可变形生成对抗网络生成左右摇摆30度的人脸图片、左右摇摆60度的人脸图片和左右摇摆90度的人脸图片的情况下，所述方法还包括：

通过所述训练好的人脸识别模型对所述端正人脸图片以及所述左右摇摆30度的人脸图片、所述左右摇摆60度的人脸图片和所述左右摇摆90度的人脸图片提取人脸特征向量；

对提取的所述人脸特征向量进行融合；

将融合后的特征作为注册特征以建立人脸特征数据库。

在其中一些实施例中，所述的用训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录包括：通过所述训练好的人脸识别模型对考勤现场摄像头抓拍的任意人脸图片提取人脸特征向量，将提取的人脸特征向量与所述人脸特征数据库中的人脸特征向量逐一求取余弦相似度；

若所述余弦相似度超过预设的阈值，则识别成功，生成考勤记录。

第二方面，本申请实施例提供了一种基于人脸识别的考勤***，所述***包括：

采集模块，用于采集待考勤人员的端正人脸图片作为样本集；

扩充模块，用于通过预先训练的3D可变形生成对抗网络对所述端正人脸图片生成任意角度人脸图片以扩充样本集；

训练模块，用于通过扩充后的样本集训练人脸识别模型；

识别模块，用于通过训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录。

第三方面，本申请实施例提供了一种电子设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执如上述的基于人脸识别的考勤方法。

第四方面，本申请实施例提供了一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行如上述的基于人脸识别的考勤方法。

相比于相关技术，本申请实施例提供的基于人脸识别的考勤方法中，采集待考勤人员的端正人脸图片作为样本集，又考虑到由于现实中很难获含不同角度姿势变化的数据集，并且即使能抓拍到大角度人脸数据也很难进行类别（不同人）清洗整理，因此本申请实施例通过预先训练的3D可变形生成对抗网络对端正人脸图片生成任意角度人脸图片以扩充样本集，解决了训练数据严重短缺问题；接着用扩充后的样本集训练人脸识别模型，相较于现有技术中样本集只包括端正人脸图片，本申请实施例扩充后的样本集增加了一些其他角度人脸图片，本申请实施例通过扩充后的样本集训练人脸识别模型，由于数据集更全面，所以训练的模型效果更好，能够提高人脸识别的准确性，同时提高了人脸识别模型的鲁棒性；然后通过训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录。相比于以往做人脸识别，由于无法识别出大角度姿态的人脸图片，当采集到的人脸图片包括大角度人脸图片时，不仅需要通过人脸角度估计模块过滤将其过滤掉，而且用户必须配合采集设备停下脚步、转身或者扭头已被采集端正人脸图片（拍摄正面照）才能顺利识别出人脸，导致人脸识别效率低，而且由于识别通过速度慢、通行时间过长不仅造成考勤现场短暂驻留甚至排队拥堵的情况发生，而且也导致考勤的时间成本高、考勤效率低，然而，本申请实施例中考勤人员无需配合人脸图片采集设备的拍摄角度而停下脚步、转身或者扭头以被拍摄正面照（端正人脸图片），而是用上述训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，提高了人脸识别的效率，从而提高了考勤效率，避免发生考勤人员在通行时的短暂驻留甚至排队拥堵的情况。因此，本申请不仅改善了大角度人脸识别通过体感，而且节约考勤时间、提高了考勤效率。另外，本申请实施例通过扩充后的样本集训练人脸识别模型，由于数据集更全面，所以训练的模型效果更好，能够提高人脸识别的准确性。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的基于人脸识别的考勤方法的第一流程图；

图2是根据本申请实施例的3D可变形生成对抗网络获得方式的流程图；

图3是根据本申请实施例的通过预先训练的3D可变形生成对抗网络对所述端正人脸图片生成任意角度人脸图片以扩充样本集包括的步骤的流程图；

图4是根据本申请实施例的基于人脸识别的考勤方法的第二流程图；

图5是根据本申请实施例的用训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录包括的步骤的流程图；

图6是根据本申请实施例的基于人脸识别的考勤***的结构框图；

图7是根据本申请实施例的电子设备的内部结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行描述和说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。基于本申请提供的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。此外，还可以理解的是，虽然这种开发过程中所作出的努力可能是复杂并且冗长的，然而对于与本申请公开的内容相关的本领域的普通技术人员而言，在本申请揭露的技术内容的基础上进行的一些设计，制造或者生产等变更只是常规的技术手段，不应当理解为本申请公开的内容不充分。

在本申请中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是，本申请所描述的实施例在不冲突的情况下，可以与其它实施例相结合。

除非另作定义，本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制，可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形，意图在于覆盖不排他的包含；例如包含了一系列步骤或模块（单元）的过程、方法、***、产品或设备没有限定于已列出的步骤或单元，而是可以还包括没有列出的步骤或单元，或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接，而是可以包括电气的连接，不管是直接的还是间接的。本申请所涉及的“多个”是指大于或者等于两个。“和/或”描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象，不代表针对对象的特定排序。

本申请提供一种基于人脸识别的考勤方法，图1为本申请实施例的基于人脸识别的考勤方法的第一流程图，如图1所示，在本实施例中，该方法包括如下步骤：

步骤S101，采集待考勤人员的端正人脸图片作为样本集；其中，本领域技术人员可以通过采集设备采集待考勤人员的端正人脸图片作为样本集，其中，采集设备可以是摄像头或者其他，此处不做具体限定；值得注意的是，端正人脸图片中脸部的左右摇摆幅度值和上下俯仰幅度值均为0；

步骤S102，通过预先训练的3D可变形生成对抗网络对端正人脸图片生成任意角度人脸图片以扩充样本集；例如，预先训练的3D可变形生成对抗网络对端正人脸图片生成左摇摆5度的人脸图片、右摇摆5度的人脸图片、左摇摆10度的人脸图片、右摇摆10度的人脸图片、左摇摆15度的人脸图片以及右摇摆15度的人脸图片以扩充样本集，当然在一些其他实施例中，预先训练的3D可变形生成对抗网络对端正人脸图片生成其他角度的人脸图片以扩充样本集，具体根据用户需求设定，此处不做具体限定；由于现实中很难获含不同角度姿势变化的数据集，因此稀缺大角度姿态变化的人脸数据；并且，即使能抓拍到大角度人脸数据也很难进行类别（不同人）清洗整理，因此现有算法模型对大角度人脸识别不够鲁棒，靠模型做数据的清洗整理不可靠，人工操作的成本又过高，为了方便理解，以步骤S102中过预先训练的3D可变形生成对抗网络对端正人脸图片生成左摇摆5度的人脸图片、右摇摆5度的人脸图片、左摇摆10度的人脸图片、右摇摆10度的人脸图片、左摇摆15度的人脸图片以及右摇摆15度的人脸图片以扩充样本集为例进行说明，相较于现有技术中样本集只包括端正人脸图片，扩充样本集增加了左摇摆5度的人脸图片、右摇摆5度的人脸图片、左摇摆10度的人脸图片、右摇摆10度的人脸图片、左摇摆15度的人脸图片以及右摇摆15度的人脸图片，弥补了训练数据严重短缺的缺陷，而且有利于增强人脸识别模型的鲁棒性；

步骤S103，用扩充后的样本集训练人脸识别模型；由于扩充后的样本集相较于现有技术样本集增加了一些其他角度人脸图片以使样本集更全面，因此，提高了人脸识别模型对人脸识别的准确度；

步骤S104，用训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录。相比于以往做人脸识别时，无法识别出大角度姿态的人脸图片，当采集到的人脸图片包括大角度人脸图片时，不仅需要通过人脸角度估计模块过滤将其过滤掉，而且用户必须配合采集设备停下脚步、转身或者扭头已被采集端正人脸图片（拍摄正面照）才能顺利识别出人脸，如此导致人脸识别效率低，而且由于识别通过速度慢、通行时间过长不仅造成考勤现场短暂驻留甚至排队拥堵的情况发生，而且也导致考勤的时间成本高，然而本申请无需配合采集设备停下脚步、转身或者扭头拍摄正面照便可以用训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，提高了人脸识别效率且改善了大角度人脸识别通过体感，并且减少了考勤通行时短暂驻留甚至排队拥堵的情况，帮助用户节约考勤时间成本，解决了人脸识别技术在门禁或考勤***中准确度较低的问题，并且在识别成功时，生成考勤记录，如此，有利于后续考勤记录的查询。

通过上述步骤S101至步骤S104，在本实施例的技术方案中，采集待考勤人员的端正人脸图片作为样本集，又考虑到由于现实中很难获含不同角度姿势变化的数据集，并且即使能抓拍到大角度人脸数据也很难进行类别（不同人）清洗整理，本申请实施例通过预先训练的3D可变形生成对抗网络对端正人脸图片

生成任意角度人脸图片以扩充样本集，解决了训练数据严重短缺问题，而且有利于增强人脸识别模型的鲁棒性；本申请用扩充后的样本集训练人脸识别模型，相较于现有技术中样本集只包括端正人脸图片，扩充样本集增加了大量其他角度的人脸图片以使样本集中的数据更全面，因此，用扩充后的样本集训练人脸识别模型使训练后人脸识别模型效果更好，提高了对人脸识别的准确度，此外，本申请通过训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录，相比于以往做人脸识别，由于无法识别出大角度姿态的人脸图片（大角度姿态的人脸图片为非端正人脸图片），当采集到的人脸图片包括大角度人脸图片时，不仅需要通过人脸角度估计模块过滤将其过滤掉，而且用户必须配合采集设备停下脚步、转身或者扭头已被采集端正人脸图片（拍摄正面照）才能顺利识别出人脸，导致人脸识别效率低，而且由于识别通过速度慢、通行时间过长不仅造成考勤现场短暂驻留甚至排队拥堵的情况发生，而且也导致考勤的时间成本高，而本申请的优点在于，无需配合采集设备停下脚步、转身或者扭头拍摄正面照，而是用上述训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，提高了人脸识别的效率，并且避免了通行时短暂驻留甚至排队拥堵的情况，提高了人脸识别的通过率且改善了大角度人脸识别通过体感，同时帮助用户节约了时间，也提高了考勤效率，并且在识别成功时，生成考勤记录，如此，也有利于后续考勤记录的查询。

在一些实施例中，预先训练的3D可变形生成对抗网络由3D可变形模型（3DMorphable Model，简称3D可变形模型）和生成对抗网络（Generative AdversarialNetworks，简称GAN）的结合方式生成。具体地，图2根据本申请实施例的3D可变形生成对抗网络获得方式的流程图，如图2所示，在一可选实施例中，所述3D可变形生成对抗网络通过如下方式获得的步骤包括：

步骤S201，将随机纹理参数

和3D可变形模型形状参数

输入纹理生成器

，生成3D可变形模型对应形状的纹理图；其中，由于纹理信息无关姿态与表情，因此姿态参数

与表情参数

无需作为纹理生成器的输入，另外，本领域技术人员易于理解的是姿势标签又称条件姿态参数或者姿态参数，3D可变形模型形状参数又称3D可变形模型形状参数。

步骤S202，将随机纹理参数

、3D可变形模型形状参数

、随机背景参数

、姿势标签

和表情参数

输入背景生成器

，生成符合给定参数的背景图；需要说明的是，背景图中包含了与纹理信息相符合的头发边缘、衣服、眼镜等3D可变形模型不重建的特征。

步骤S203，通过3D可变形模型将纹理图和姿势标签

、表情参数

以及3D可变形模型形状参数

结合以进行3D重建，并通过纹理映射方法M和可微渲染函数R将纹理映射到渲染的图像空间中，生成渲染后的面部纹理图；

步骤S204，将渲染后的面部纹理图和背景图进行合成，将合成后的图送入判别器 D，并通过优化判别器D的损失函数

和纹理生成器

损失函数以及背景生成器

的损失函数以得到预先训练的3D可变形生成对抗网络，其中，所述纹理生成器

损失函数以及所述背景生成器

的损失函数表示为

。

通过上述步骤S201至步骤S204可得到所述预先训练的3D可变形生成对抗网络，并且通过预先训练的3D可变形生成对抗网络对端正人脸图片生成任意角度人脸图片以扩充样本集，其有益效果上文已经提到，此处不在一一赘述。

在一些实施例中，人脸识别模型为端到端的深度卷积神经网络模型，上述端到端是指从模型的输入端到输出端直接由深度卷积神经网络模型相连接，当然在一些其他实施例中，人脸识别模型还可以采用其他神经网络模型，此处不做具体限定，具体根据用户需求设定。

在一些实施例中，3D可变形生成对抗网络的训练方式如下：

其中，

为判别器的损失函数，

为生成器的损失函数，

表示真实样本的交叉熵损失值，

表示生成的样本的交叉熵损失值，

代表附加梯度惩罚项，

由公式为

计算得出，

是指包括随机纹理参数

、随机背景参数

、3D可变形模型形状参数

、表情参数

在内的矢量表示，

为从训练数据

的分布中随机选择的真实图像和相关的姿势标签，

为真实图像，

为其姿势标签，姿势标签又称条件姿态参数或者姿态参数，用于控制脸部的左右摇摆幅度值和上下俯仰幅度值，

，

为参数化的生成器网络G，

代表参数化纹理，

代表背景生成器网络，

代表参数化的判别器网络D，N代表

中纹理、背景、形状和表情参数向量维度的综合表示符号。

本领域技术人员可知，

是

维的随机纹理参数，符合标准正态分布（Normal distribution，又称高斯分布）；

是

维的随机背景参数，符合标准正态分布；

是

维的3D可变形模型形状参数，符合标准正态分布；

是

维的表情参数，同样符合标准正态分布，并且

和

为用于控制3D可变形模型（3D可变形模型）的形式；

需要说明的是，交替最小化生成器与判别器损失是通用的学习训练方式，另外，多次交替迭代优化生成器和判别器可以使二者共同逼近全局最优才以训练出较好的网络模型，有利于后续利用训练好的3D可变形生成对抗网络生成随机任意角度的大角度人脸样本。

图3为本申请实施例的通过预先训练的3D可变形生成对抗网络对端正人脸图片生成任意角度人脸图片以扩充样本集包括的步骤的流程图，如图3所示，在一些实施例中，通过预先训练的3D可变形生成对抗网络对端正人脸图片生成任意角度人脸图片以扩充样本集包括如下步骤：

步骤S301，根据

生成任意角度人脸图片，其中，

是生成的图像，

是

维的随机纹理参数，符合标准正态分布，

是

维的随机背景参数，符合标准正态分布，

是

维的3D可变形模型形状参数，符合标准正态分布，

是

维的表情参数，符合标准正态分布，并且

和

均用于控制3D可变形模型（3D可变形模型）；

为姿势标签，即

代表脸部的左右摇摆幅度值和上下俯仰幅度值，

为练好的参数化纹理，

代表训练好的背景生成器网络；当然在一些其他实施例中，还可以根据

生成任意角度人脸图片，其中，本领域技术人员可知，

是生成的图像，

是背景生成器，

是纹理生成器，

是一个用于组合背景图片和纹理的二进制掩码，1表示与图片相同形状的全1向量，由于

运算代表

两个向量按元素位相乘，则

代表

和

两个向量按元素位相乘，同理，

代表

和

两个向量按元素位相乘，其中，

是逆纹理映射函数，将生成的纹理贴图中的插值映射到图像空间中的适当位置，y代表对图像空间中的纹理坐标的渲染；由于与 K关联的y渲染由可微分渲染函数R执行，那么

，其中，

是3D可变形模型（3D可变形模型）的随机实例形状顶点向量，

代表3D可变形模型（3D可变形模型）的

个三角形顶点索引列表，

是纹理坐标的向量，其中，

个三角形都有三个二维纹理顶点集。

步骤S302，将生成的任意角度人脸图片加入到样本集中，得到扩充后的样本集。优选的，扩充后的样本集中的人脸图片包括端正人脸图片和通过预先训练的3D可变形生成对抗网络根据端正人脸图片生成的任意角度人脸图片，其中，人脸图片的具体角度可以根据用户需求设定，此处不做具体限定；

通过上述步骤S301至步骤S302，本实施例先根据

生成任意角度人脸图片，在通过将生成的任意角度人脸图片加入到样本集中，得到扩充后的样本集，由于扩充后的样本集相较于现有技术样本集增加了一些其他角度人脸图片，样本集更丰富，因此训练后的人脸识别模型效果更好，能够提高人脸识别的准确性。

图4为本申请实施例的基于人脸识别的考勤方法的第二流程图，如图4所示，在通过预先训练的3D可变形生成对抗网络生成左右摇摆30度的人脸图片、左右摇摆60度的人脸图片和左右摇摆90度的人脸图片的情况下，该方法还包括如下步骤：

步骤S401，通过训练好的人脸识别模型对端正人脸图片以及左右摇摆30度的人脸图片、左右摇摆60度的人脸图片和左右摇摆90度的人脸图片提取人脸特征向量；在本实施例中，通过训练好的人脸识别模型对端正人脸图片以及左右摇摆30度的人脸图片、左右摇摆60度的人脸图片和左右摇摆90度的人脸图片提取人脸特征向量，当然在一些其他实施例中，右摇摆的人脸图片的角度也可以是15度、45度或者其他，此处不做具体限定；需要说明的是，在深度学习领域，人脸特征向量是指卷积网络计算得到的一定维度的浮点型数字向量，通常描述为特征向量，即数字化描述一张人脸。

步骤S402，对提取的人脸特征向量进行融合；本实施例中，为对7张不同姿态人脸图片（端正人脸图片以及左右摇摆30度的人脸图片、左右摇摆60度的人脸图片和左右摇摆90度的人脸图片）的人脸特征向量之间对应维度的特征值进行平均，得到融合特征向量。

步骤S403，将融合后的特征作为注册特征以建立人脸特征数据库。

该方法还包括上述步骤S401至步骤S403，本实施例通过训练好的人脸识别模型对端正人脸图片以及左右摇摆30度的人脸图片、左右摇摆60度的人脸图片和左右摇摆90度的人脸图片提取人脸特征向量；对提取的人脸特征向量进行融合；将融合后的特征作为注册特征以建立人脸特征数据库。需要说明的是，该人脸特征数据库可以作为上文的底库。

图5为本申请实施例的用训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录包括的步骤的流程图，如图5所示，的用训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录包括：

步骤S501，通过训练好的人脸识别模型对考勤现场摄像头抓拍的任意人脸图片提取人脸特征向量，将提取的人脸特征向量与底库（底库即人脸特征数据库）中的人脸特征向量逐一求取余弦相似度；

步骤S502，若余弦相似度超过预设的阈值，则识别成功，生成考勤记录。例如，本实施例中，余弦相似度为0.7，预设的阈值为0.6，那么，余弦相似度超过预设的阈值则识别成功，生成考勤记录，当然在一些其他实施例中，若余弦相似度未超过预设的阈值，则识别失败，生成失败考勤记录或者不生成考勤记录；

在本实施例中，通过步骤S501至步骤S502完成人脸识别的过程，具体地，通过训练好的人脸识别模型对考勤现场摄像头抓拍的任意人脸图片提取人脸特征向量，将提取的人脸特征向量与底库（底库即人脸特征数据库）中的人脸特征向量逐一求取余弦相似度；例如，该余弦距离作为抓拍人脸和注册人脸之间的相似度，比如是0.0至1.0范围，最终找到相似度最大的一组人脸，对应的分值如果超过预先设定好的阈值，即认为抓拍到的人脸与对应的注册人脸属于同一个人，此时识别成功，则考勤登记成功，生成考勤记录；否则，判定抓拍到的人脸不在人脸特征数据库中，此时人脸识别失败，考勤登记失败。需要说明的是，预设的阈值根据用户需求设定，此处不做具体限定。

本申请还提供了一种基于人脸识别的考勤***，该***实现上述实施例方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图6为本申请实施例的基于人脸识别的考勤***的结构框图，如图6所示，该***包括：

采集模块61，用于采集待考勤人员的端正人脸图片作为样本集；

扩充模块62，用于通过预先训练的3D可变形生成对抗网络对端正人脸图片生成任意角度人脸图片以扩充样本集；

训练模块63，用于通过扩充后的样本集训练人脸识别模型；

识别模块64，用于通过训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录。

在该***的技术方案中，通过采集模块61采集待考勤人员的端正人脸图片作为样本集，由于现实中很难获含不同角度姿势变化的数据集，并且即使能抓拍到大角度人脸数据也很难进行类别（不同人）清洗整理，在本申请中，扩充模块62通过预先训练的3D可变形生成对抗网络对端正人脸图片生成任意角度人脸图片以扩充样本集，解决了训练数据严重短缺问题；相较于现有技术中样本集只包括端正人脸图片，在本申请中，训练模块63通过扩充后的样本集训练人脸识别模型；易于理解的是，扩充后样本集不仅包括端正人脸图片还包括其他角度的人脸图片，因此扩充后样本集数据更丰富，用扩充后的样本集训练人脸识别模型的效果更好、人脸识别的准确度更强；由于传统的技术方案中无法识别出大角度姿态的人脸图片（大角度姿态的人脸图片为非端正人脸图片），当采集到的人脸图片包括大角度人脸图片时，不仅需要通过人脸角度估计模块过滤将其过滤掉，而且用户必须配合采集设备停下脚步、转身或者扭头已被采集端正人脸图片（拍摄正面照）才能顺利识别出人脸，导致人脸识别效率低，而且由于识别通过速度慢、通行时间过长不仅造成考勤现场短暂驻留甚至排队拥堵的情况发生，而且也导致考勤的时间成本高，在本申请的技术方案中，识别模块64通过训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录，由于本申请无需配合采集设备停下脚步、转身或者扭头拍摄正面照便，而是用上述训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，提高了人脸识别的效率，并且避免了通行时短暂驻留甚至排队拥堵的情况，提高了人脸识别的通过率且改善了大角度人脸识别通过体感，同时帮助用户节约了时间，也提高了考勤效率，并且在识别成功时，生成考勤记录，如此，也有利于后续考勤记录的查询。

需要说明的是，上述各个模块可以是功能模块也可以是程序模块，既可以通过软件来实现，也可以通过硬件来实现。对于通过硬件来实现的模块而言，上述各个模块可以位于同一处理器中；或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。

本申请还提供了一种电子设备，包括存储器和处理器，该存储器中存储有计算机程序，处理器被设置为运行计算机程序以执行上述的基于人脸识别的考勤方法。

可选地，上述电子设备还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，采集待考勤人员的端正人脸图片作为样本集；

S2，通过预先训练的3D可变形生成对抗网络对端正人脸图片生成任意角度人脸图片以扩充样本集；

S3，用扩充后的样本集训练人脸识别模型；

S4，用训练好的人脸识别模型识别现场考勤人员的任意角度人脸图片，并在识别成功时，生成考勤记录。

需要说明的是，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

另外，结合上述实施例中的基于人脸识别的考勤方法，本申请实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序；该计算机程序被处理器执行时实现上述实施例中的任意一种基于人脸识别的考勤方法。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人脸识别的考勤方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

在一个实施例中，图7是根据本申请实施例的电子设备的内部结构示意图，如图7所示，提供了一种电子设备，该电子设备可以是服务器，其内部结构图可以如图7所示。该电子设备包括通过内部总线连接的处理器、网络接口、内存储器和非易失性存储器，其中，该非易失性存储器存储有操作***、计算机程序和数据库。处理器用于提供计算和控制能力，网络接口用于与外部的终端通过网络连接通信，内存储器用于为操作***和计算机程序的运行提供环境，计算机程序被处理器执行时以实现一种基于人脸识别的考勤方法，数据库用于存储数据。

本领域技术人员可以理解，图7中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

本领域的技术人员应该明白，以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。