CN109635643A

CN109635643A - 一种基于深度学习的快速人脸识别方法

Info

Publication number: CN109635643A
Application number: CN201811295723.3A
Authority: CN
Inventors: 孔锐; 蔡佳纯; 何铸辉
Original assignee: Jinan University
Current assignee: Jinan University
Priority date: 2018-11-01
Filing date: 2018-11-01
Publication date: 2019-04-16
Anticipated expiration: 2038-11-01
Also published as: CN109635643B

Abstract

本发明公开了一种基于深度学习的快速人脸识别方法，该快速人脸识别方法针对实时人脸识别技术受限于网络带宽和硬件处理能力的影响以及识别速度不高的问题进行了探索，在兼顾人脸识别准确率的同时，考虑到人脸识别占用内存空间和识别速度问题，对轻量级的卷积神经网络模型SqueezeNet进行改进，实现SqueezeNet的特征提取和分类功能分离，以欧式距离代替Softmax和全连接层的分类能力来减少模型参数，利用改进的SqueezeNet提取特征，利用欧氏距离进行分类识别，不仅可以兼顾识别准确率，而且能提高人脸识别的识别速度，相比于现有技术算法，具有一定优势。

Description

一种基于深度学习的快速人脸识别方法

技术领域

本发明涉及人脸智能识别技术领域，具体涉及一种基于深度学习的快速人脸识别方法。

背景技术

生活工作中的方方面面都涉及到个人身份的识别和验证。传统身份识别与验证方式安全性都很低，用来标识身份的个人物品容易丢失或者被仿造，用来标识身份的符号容易被遗忘或者窃取，生物特征作为身份验证和识别依据越来越被重视，人脸识别是比较友好的生物识别技术，已经被广泛研究及应用。

近年来，自从人脸识别引入了深度卷积网络后，人脸识别的效果取得巨大的提高。2014年，Facebook利用大规模人脸图像对卷积神经网络进行训练得到Deepface。该方法在LFW人脸识别数据集的识别准确率为97.35％，性能几乎可以与人工识别媲美。Simonyan和Zisserman采取深层网络拓扑结构和较大的输入图像构建的VGG网络获得了98.95％的准确率。香港中文大学提出的DeepId网络对卷积神经网络做了一系列改进，采用局部和全局特征相联合、利用联合贝叶斯处理卷积特征及利用识别和认证两种监督信息进行训练，将准确率提升到99％以上。随着人脸数据集的扩大，人脸识别精度也得到了相应的提高。2015年Google采用三元组损失函数(TripletLoss)作为其监督信息，只利用200张图片训练得到的FaceNet，取得了99.63％的识别准确率。随后，百度在LFW数据集上得到了99.77％的识别准确率。与此同时，深度卷积神经网络的结构变更大更深：VGGFace的网络层数是16层，FaceNet的网络层数是22层，ResNet的网络层数已达152层。

目前，人脸识别技术由于网络带宽，硬件处理能力的限制，识别速度不高，在保证准确率的前提下，需对算法进行改进优化，提高识别速度，实现准确快速的人脸识别。

发明内容

本发明的目的是为了克服现有人脸识别算法复杂度太高、训练时间和测试时间过长给人脸识别速度带来的影响，提供一种保证准确率的条件下进行快速人脸识别的方法。

本发明的目的可以通过采取如下技术方案达到：

一种基于深度学习的快速人脸识别方法，所述的快速人脸识别方法包括下列步骤：

S1、利用人脸数据库，训练人脸检测分类器，根据检测结果对弱分类器个数、强分类器个数进行调节优化；

S2、对人脸数据库进行人脸检测并进行裁剪，作为人脸识别方法的训练集和验证集；

S3、设置批数据的大小和基本学习率，利用训练集对卷积神经网络模型SqueezeNet进行训练，并根据训练结果判断模型的泛化能力并通过扩充数据量来防止过拟合；

训练是对改进前的squeezenet卷积神经网络模型进行训练，设置超参数、做出防拟合措施等，确定squeezenet卷积神经网络的参数及整体模型，然后在确定的模型的基础上再进行改进，分离其特征提取和分类功能，保留其特征提取功能，通过特征分类器进行特征分类等。

超参数是在开始训练前人为设置的参数，用于定义模型的复杂性、学习能力。通过合理地设计超参数可以使模型具有更高的准确率和更好地泛化能力。

批数据的大小和基本学习率是超参数。

批数据的大小(Batch size)指的是组成一个batch的样本个数，选取合适的Batchsize能够减少训练的损失函数值的震荡，提高内存效率。

基本学习率(base_lr)是用于所有层的梯度下降求解最优值的步长。在迭代过程中，基本学习率需要动态地调整来适应迭代的变化。

合理的批数据的大小设置能够减少训练的损失函数值的震荡，提高内存效率；用于定义模型的复杂性和学习能力的超参数，除了批数据还有其他参数，设置批数据的大小只是其中一方面。

S4、将卷积神经网络模型SqueezeNet的特征提取和分类功能分离，首先，将删除Softmax Loss层和全连接层后的卷积神经网络模型SqueezeNet作为人脸识别模型进行特征提取，提取人脸图像的256维的特征向量，然后，通过特征分类器对特征进行分类；

S5、以欧氏距离衡量特征之间的相似度进行分类，并根据ROC评价标准确定欧氏距离的分类阈值。

进一步地，所述的步骤S1中训练人脸检测分类器的过程如下：

S11、利用Adaboost算法，采用MIT人脸数据库进行训练；

S12、训练得出分类器后，利用包含不同姿态和光照条件下、不同背景下的加州理工大学的人脸数据库进行测试；

S13、将级联分类器作为决策树，通过多层检测的检测结果，对弱分类器个数、强分类器个数进行调节，以实现对分类器的结构的调整测试，得出检测结果最优的分类器结构，其中，级联分类器是由一系列强分类器串联组成的，每层强分类器包含多个弱分类器，强分类器的判断结果由各个弱分类器的投票加权平均结果得出。

进一步地，所述的步骤S2过程如下：

S21、对CASIA-WebFace人脸数据集进行人脸检测并进行裁剪；

S22、把CASIA-WebFace人脸数据集分成两部分，第一部分为每个人的图片集的前10张，这部分作为验证集，用于评估模型的泛化能力；第二部分为剩余的图片，这部分作为训练集，用于模型的训练。

进一步地，所述的步骤S3过程如下：

S31、对批数据的大小和基本学习率进行设置；

S32、根据模型输出的测试准确率和训练准确率相差是否悬殊来判断模型的泛化能力，并通过将数据集中的图像进行左右映射来扩充数据量，作为防止过拟合的措施。

进一步地，所述的卷积神经网络模型SqueezeNet由1个数据层、1个卷积层、8个Fire module、4个池化层、1个Softmax Loss层、1个全连接层、1个准确率层和1个accuracy_top5层组成。

进一步地，所述的步骤S5过程如下：

S51、计算两张图像的标准化特征向量，设两张图像的特征向量分别为(a₁,a₂,a₃,…a_n)和(b₁,b₂,b₃,…b_n)，对特征向量进行标准化，得到标准化的特征向量(A₁,A₂,A₃,…A_n)和(B₁,B₂,B₃,…B_n),标准化计算公式如下：

S52、计算两个特征之间的欧氏距离d，计算公式如下：

S53、以欧氏距离d衡量特征之间的相似度进行分类，当d小于设定的分类阈值时，判定(a₁,a₂,a₃,…a_n)和(b₁,b₂,b₃,…b_n)所对应的人脸属于同一个人，否则，不属于同一个人。

进一步地，所述的步骤S5中，根据ROC评价标准来评价基于欧氏距离方法的人脸识别性能，利用穷举法确定欧氏距离的分类阈值，通过设定不同分类阈值来测试分类的准确率，以确定在该数据库下人脸识别的最佳分类阈值。

进一步地，所述的根据ROC评价标准来评价基于欧氏距离方法的人脸识别性能具体如下：

用ROC评价标准来评价基于欧氏距离方法的人脸识别性能，通过计算模型的真阳性率和假阳性率来执行这一评价标准，准确率ACC为：

其中，TP表示真阳性，即测试集中人脸对为同一人，分类器也识别为同一个人；TN为真阴性，即测试集中人脸对不是同一人，分类器识别也不是同一人；FP为假阳性，即测试集中人脸对不是同一人，但是分类器识别成同一人；FN表示假阴性，即测试集中人脸是同一人，但是分类器识别不是同一人；P表示分类器识别为同一人；N表示分类器识别不是同一人。

本发明相对于现有技术具有如下的优点及效果：

1、本发明公开的基于深度学习的快速人脸识别方法在现有的人脸识别技术基础上进行了创新，新识别方法复杂度较低，训练收敛更快，减少了训练参数的数量，降低了资源消耗，增大了实现移动端本地应用的可能性，同时提高了人脸识别***的安全性，非常具有实用价值。

2、本发明中，利用欧氏距离对SqueezeNet得到的人脸特征进行分类具有良好的效果。同时由于SqueezeNet只起到提取特征的作用，对识别分类的类别没有起到限制作用。当增加识别类别时，只需要重新计算欧氏距离的分类阈值，不需要增加全连接层的维度来重新训练模型。

附图说明

图1是本发明实施例中左右映射效果对比图；

图2是本发明实施例中损失函数值与迭代次数的关系示意图一，其中，最大迭代次数为300000；

图3是本发明实施例中损失函数值与迭代次数的关系示意图二，其中，最大迭代次数为150000；

图4是本发明实施例中测试准确率与迭代次数的关系示意图；

图5是本发明实施例中删除softmax层的SqueezeNet人脸识别结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

本实施例具体公开了一种基于深度学习的快速人脸识别方法，包括以下步骤：

S1、利用人脸数据库，训练人脸检测分类器，根据检测结果对弱分类器个数、强分类器个数等相关参数进行调节优化；

所述的步骤S1中训练人脸检测分类器的过程如下：

S11、利用Adaboost算法，采用MIT人脸数据库进行训练；

S13、级联分类器是由一系列强分类器串联组成的，每层强分类器包含多个弱分类器，强分类器的判断结果由各个弱分类器的投票加权平均结果得出。级联分类器实际上是决策树，通过多层检测，检测结果更为可靠。根据测试结果，对弱分类器个数、强分类器个数等参数进行调节，以实现对分类器的结构的调整测试，得出检测结果最优的分类器结构。

所述的步骤S2过程如下：

S21、对CASIA-WebFace人脸数据集进行人脸检测并进行裁剪；

加州理工大学的人脸数据库和CASIA-WebFace人脸数据集都是人脸数据库，其中，加州理工大学的人脸数据库是用来测试检测效果的，而对CASIA-WebFace人脸数据集进行检测是为了接下来进一步的特征提取和分类。

S3、超参数是在开始训练前人为设置的参数，用于定义模型的复杂性、学习能力。设置超参数批数据的大小和基本学习率，利用训练集对卷积神经网络模型SqueezeNet进行训练，并根据训练结果判断模型的泛化能力并通过扩充数据量来防止过拟合。

所述的步骤S3过程如下：

S31、对批数据的大小(Batch_size)和基本学习率(base_lr)进行设置；

S32、根据模型输出的测试准确率和训练准确率相差是否悬殊来判断模型的泛化能力，即算法对新鲜样本的适应能力，并通过将数据集中的图像进行左右映射来扩充数据量，作为防止过拟合的措施。

S4、将卷积神经网络模型SqueezeNet的特征提取和分类功能分离，通过特征分类器对特征进行分类，代替Softmax和全连接层的分类能力来减少模型参数，提高人脸识别速度。

其中，卷积神经网络模型SqueezeNet作为人脸识别模型是由1个数据层、1个卷积层、8个Fire module、4个池化层(pooling Layer)、1个Softmax Loss层、1个全连接层、1个准确率层和1个accuracy_top5层组成的，在这个训练过程中，卷积神经网络模型SqueezeNet最后一层全连接层和Softmax Loss层起的作用是分类，其余层的作用是特征提取。将轻量级的卷积神经网络模型SqueezeNet进行改进，为减少参数、扩展识别类别，删除Softmax Loss层和全连接层；

删除Softmax Loss层和全连接层的卷积神经网络模型SqueezeNet的人脸识别结构主要起到特征提取的作用，提取人脸图像的256维的特征向量。通过特征分类器对特征进行分类，代替Softmax和全连接层的分类能力。

S5、通过特征分类器对特征进行分类，以欧氏距离衡量特征之间的相似度进行分类，并根据ROC评价标准确定欧氏距离的分类阈值。

所述的步骤S5过程如下：

S52、计算两个特征之间的欧氏距离d，计算公式如下：

S53、以欧氏距离d衡量特征之间的相似度进行分类，当d小于设定的阈值时，判定(a₁,a₂,a₃,…a_n)和(b₁,b₂,b₃,…b_n)所对应的人脸属于同一个人，否则，不属于同一个人；

本实施例根据ROC评价标准来评价基于欧氏距离方法的人脸识别性能，利用穷举法确定欧氏距离的分类阈值，通过设定不同阈值来测试分类的准确率，以确定在该数据库下人脸识别的最佳分类阈值。

用ROC评价标准来评价基于欧氏距离方法的人脸识别性能，通常通过计算模型的真阳性率(TPR)和假阳性率(TPR)来执行这一评价标准，准确率(ACC)为：

根据ROC评价标准，利用穷举法确定欧氏距离的分类阈值，该阈值可以使识别准确率达到高。本发明使用循环迭代的方法来确定最佳阈值，初步设定阈值为0.7，以0.005的间隔向前迭代，通过比较每次迭代后的准确率来确定最佳阈值，求得在LFW数据集上最优的分类阈值为0.865，人脸识别的准确率为98.5714％。

通过上述公开的一种基于深度学习的快速人脸识别方法，选择合适测试对象，测试所提人脸识别算法在实际环境中的应用效果。

比如，建立一个实时的人脸识别***，进行实时检测和识别处理，以某段视频为测试对象，测试所提人脸识别算法在实际环境中的应用效果。

实施例二

本实施例公开了一种基于深度学习的快速人脸识别方法，包括下述步骤：

T1、利用Adaboost算法，采用MIT人脸数据库训练人脸检测分类器。该人脸图像数据库包含2706张不同人种、不同形态下的人脸图像，以及4381张非人脸图像，可以直接用于人脸检测算法的训练。训练得出分类器后，利用包含不同姿态和光照条件下、不同背景下的加州理工大学的人脸数据库进行测试，对分类器的结构进行调整测试，得出检测结果最优的分类器结构。

级联分类器是由一系列强分类器串联组成的，每层强分类器包含多个弱分类器，强分类器的判断结果由各个弱分类器的投票加权平均结果得出。级联分类器实际上是决策树，通过多层检测，检测结果更为可靠。根据测试结果，对弱分类器个数、强分类器个数等参数进行调节，以实现对分类器的结构的调整测试，得出检测结果最优的分类器结构。

T2、对轻量级的卷积神经网络模型SqueezeNet进行改进，实现SqueezeNet的特征提取和分类功能分离。特征提取功能的实现如下，设置超参数，利用训练集对改进后的卷积神经网络模型SqueezeNet进行训练，并根据训练结果判断模型的泛化能力并作出一些防止过拟合的措施。

①超参数的设置。超参数中最重要的是批数据的大小(Batch_size)和基本学习率(base_lr)的设置。

选取合适的Batch size能够减少训练的损失函数值的震荡，提高内存效率。在双卡Nvidia P40的浪潮服务器上进行多次试验，得到合适的Batch size。在训练集的Batchsize为512，验证集的Batch size为256的条件下，1秒大约可以实现5.3个迭代训练。

较高的学习率可以加快训练速度，但是有可能会导致网络不收敛，损失函数值震荡等问题的出现。而较低的学习率可以提高训练准确率，但是训练速度会比较慢，训练时间变长。本文根据硬件环境，经过多次试验，将基本学习率设定为0.01，避免了设置更多参数带导致学习率变化不合理。本文设置的最大迭代次数为15000，初始网络权重为0.0002，每100个迭代输出一次训练准确率，每1000个迭代保存一次网络快照并利用验证集测试网络模型的识别准确率，利用服务器上所有的GPU进行训练。

②为防止网络过拟合，应在数据和网络结构两个方面做好防护措施。在数据方面，本文通过将数据集中的图像进行左右映射来扩充数据量，可以对过拟合起到一定的防范作用，左右映射的效果如图1所示。

本发明利用dropout舍弃某些神经元的输出以减少神经元之间的协调来防止过拟合。从以上网络描述可得，dropout层对pooling层的输出进行概率为0.3的随机置零操作，然后训练置零的网络，最后把所有的网络参数合并成一个完整的网络。通过这种方式学习到的网络，其实相当于是多个网络对同样数据进行训练，再把多个模型参数融合起来。如此，多个模型融合可以减低单个模型对训练集过于依赖的风险，从而起到防止过拟合的作用。

根据超参数和防止过拟合的设置，本发明通过运用以CASIA-WebFace为训练集的SqueezeNet模型来实现人脸识别。模型训练过程中，主要参考随迭代次数增加的softmaxloss层输出的损失函数值、识别准确率和测试准确率，这三个指标来确定模型的性能。随着对模型的训练，模型输出的损失函数值会越来越低，最终达到稳定。SqueezeNet的损失函数值达到基本稳定时，网络模型达到收敛，如图2所示。

由图2可知，当迭代次数为30000时，loss几乎为0；模型完全收敛，此时模型的训练准确率为1，很可能会过拟合模型。所以选取loss比较低的15000次迭代作为最多迭代次数，再重新训练，loss随着迭代次数变化的曲线图，如图3所示。当迭代次数为15000时，损失函数值为0.0724734，模型的训练准确率为98.4375％。

测试准确率是用验证集对训练的模型进行测试得到的。将测试准确率与训练准确率进行比较，可以得知模型是否存在过拟合的问题。测试准确率与迭代次数的关系如图4所示。

根据图3可知，模型的损失函数值已经收敛，模型能够充分地学习特征。由图4可得，测试准确率与训练准确率相差无几，模型有良好的泛化能力，没有出现过拟合的情况。

通过上述训练得到的模型能够有效地学习特征，具有良好的性能，基本满足轻量化的模型要求。在这个训练过程中，SqueezeNet最后一层全连接层和softmax层起的作用是分类，其余层的作用是特征提取。全连接层的占据了整个SqueezeNet的大部分参数，同时限制了人脸识别的扩展，为了减少参数，扩展识别类别，本文保留了SqueezeNet的特征提取功能，以传统机器学习的方法来代替SqueezeNet中全连接层的分类功能，结构如图5所示。

T3、以传统机器学习的方法来代替SqueezeNet中全连接层的分类功能，本发明以欧氏距离衡量特征之间的相似度进行分类；通过欧氏距离进行分类后，用ROC评价标准来评价基于欧氏距离方法的人脸识别性能。

设两张图像的特征向量分别为(a₁,a₂,a₃,…a_n)和(b₁,b₂,b₃,…b_n)，对特征向量进行标准化，得到标准化的特征向量(A₁,A₂,A₃,…A_n)和(B₁,B₂,B₃,…B_n)，标准化如下式所示：

两个特征之间的欧氏距离为：

当d小于设定的阈值时，(a₁,a₂,a₃,…a_n)和(b₁,b₂,b₃,…b_n)所对应的人脸属于同一个人。通过欧氏距离判断人脸是否是同一张人脸后，可以用ROC评价标准来评价基于欧氏距离方法的人脸识别性能。ROC是应用广泛的人脸识别模型的评价标准，通常通过计算模型的真阳性率(TPR)和假阳性率(TPR)来执行这一评价标准，准确率(ACC)为：

根据ROC评价标准，本文利用穷举法确定欧氏距离的分类阈值，该阈值可以使识别准确率达到高。本文使用循环迭代的方法来确定最佳阈值，初步设定阈值为0.7，以0.005的间隔向前迭代，通过比较每次迭代后的准确率来确定最佳阈值，求得在LFW数据集上最优的分类阈值为0.865，人脸识别的准确率为98.5714％。

上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

Claims

1.一种基于深度学习的快速人脸识别方法，其特征在于，所述的快速人脸识别方法包括下列步骤：

2.根据权利要求1所述的一种基于深度学习的快速人脸识别方法，其特征在于，所述的步骤S1中训练人脸检测分类器的过程如下：

S11、利用Adaboost算法，采用MIT人脸数据库进行训练；

3.根据权利要求1所述的一种基于深度学习的快速人脸识别方法，其特征在于，所述的步骤S2过程如下：

S21、对CASIA-WebFace人脸数据集进行人脸检测并进行裁剪；

4.根据权利要求1所述的一种基于深度学习的快速人脸识别方法，其特征在于，所述的步骤S3过程如下：

S31、对批数据的大小和基本学习率进行设置；

5.根据权利要求1所述的一种基于深度学习的快速人脸识别方法，其特征在于，所述的卷积神经网络模型SqueezeNet由1个数据层、1个卷积层、8个Fire module、4个池化层、1个Softmax Loss层、1个全连接层、1个准确率层和1个accuracy_top5层组成。

6.根据权利要求1所述的一种基于深度学习的快速人脸识别方法，其特征在于，所述的步骤S5过程如下：

S52、计算两个特征之间的欧氏距离d，计算公式如下：

7.根据权利要求1所述的一种基于深度学习的快速人脸识别方法，其特征在于，所述的步骤S5中，根据ROC评价标准来评价基于欧氏距离方法的人脸识别性能，利用穷举法确定欧氏距离的分类阈值，通过设定不同分类阈值来测试分类的准确率，以确定在该数据库下人脸识别的最佳分类阈值。

8.根据权利要求7所述的一种基于深度学习的快速人脸识别方法，其特征在于，所述的根据ROC评价标准来评价基于欧氏距离方法的人脸识别性能具体如下：