CN107392182A

CN107392182A - 一种基于深度学习的人脸采集识别方法及装置

Info

Publication number: CN107392182A
Application number: CN201710705219.5A
Authority: CN
Inventors: 郑士查; 李达
Original assignee: Ningbo Yong Hui Intelligent Technology Co Ltd
Current assignee: Ningbo Yong Hui Intelligent Technology Co Ltd
Priority date: 2017-08-17
Filing date: 2017-08-17
Publication date: 2017-11-24
Anticipated expiration: 2037-08-17
Also published as: CN107392182B

Abstract

本发明公开一种基于深度学习的人脸采集识别方法及装置，所述方法包括：步骤S1，收集大量含有人脸的图片并处理成人脸文件；步骤S2，对所述人脸文件进行深度学习，建立学习模型；步骤S3，将输入的视频流与所述学习模型比对，对视频中的人脸进行采集；步骤S4，对采集到的所述人脸，提取人脸特征数据，并将此人脸特征数据与数据库中的人脸特征数据进行比对，确认是否相符；所述装置包括与步骤对应的人脸处理单元、模型建立单元、人脸采集单元和人脸识别单元。这样，可以迅速从视频流中提取人脸进行对比，加快了人脸识别速度。

Description

一种基于深度学习的人脸采集识别方法及装置

技术领域

本发明涉及人脸识别技术领域，具体涉及一种基于深度学习的人脸采集识别方法及装置。

背景技术

人脸识别技术是基于人的脸部特征信息进行身份识别的一种生物识别技术，是近年来随着计算机、图像处理、模式识别等技术的迅速进步而出现的一种崭新的生物特征识别技术。用摄像机或摄像头采集含有人脸的图像或者视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人的脸部进行一系列相关技术，达到识别不同人身份的目的。

目前的人脸识别技术有着人脸识别速度慢和人脸识别精确度低等不足之处。

鉴于上述缺陷，本发明创作者经过长时间的研究和实践终于获得了本发明。

发明内容

为解决上述技术缺陷，本发明采用的技术方案在于，首先提供一种基于深度学习的人脸采集识别方法，其包括：

步骤S1，收集大量含有人脸的图片并处理成人脸文件；

步骤S2，对所述人脸文件进行深度学习，建立学习模型；

步骤S3，将输入的视频流与所述学习模型比对，对视频中的人脸进行采集；

步骤S4，对采集到的所述人脸，提取人脸特征数据，并将此人脸特征数据与数据库中的人脸特征数据进行比对，确认是否相符。

较佳的，所述人脸文件包括人脸图片、图片的名字和人脸区域的位置信息。

较佳的，所述步骤S1包括：

步骤S11，收集大量含有人脸的图片；

步骤S12，进行人脸抠图以及记录各个图片的人脸位置信息，并处理成人脸文件。

较佳的，所述步骤S4包括：

步骤S41，采集相关人员的人脸照片，并提取所述人脸特征数据，将所述人脸特征数据保存在所述数据库中；

步骤S42，对采集到的视频中的所述人脸，提取所述人脸特征数据；

步骤S43，将视频中的所述人脸特征数据与数据库中的所述人脸特征数据进行1：N比对，确认是否相符。

较佳的，所述步骤S41包括：

步骤S411，采集相关人员的人脸照片，将所述人脸照片按照固定大小进行缩放，压缩成固定大小尺寸的图片；

步骤S412，确认缩放后的图片中眼睛和嘴唇的位置后，通过分类和回归原理确认其他特征点的位置；

步骤S413，根据所述特征点的位置，提取人脸特征数据并存在所述数据库中。

较佳的，所述步骤S42包括：

步骤S421，对采集到的视频中的所述人脸照片，将所述人脸照片按照固定大小进行缩放，压缩成固定大小尺寸的图片；

步骤S422，确认缩放后的图片中眼睛和嘴唇的位置后，通过分类和回归原理确认其他特征点的位置；

步骤S423，根据所述特征点的位置，提取人脸特征数据。

较佳的，所述步骤S43包括：

步骤S431，将人脸特征切割为多个方块，由所述方块之间进行特征比对，确认所述方块的比对相似度；

步骤S432，根据所述比对相似度确定相似度较高的所述方块；

步骤S433，综合统计各个相似度较高方块的比对相似度，计算出最终的比对百分比，若所述比对百分比超过设定阈值，则认定为相符。

较佳的，所述回归原理公式为：

其中，x为参数。

其次提供一种与所述的人脸采集识别方法对应的基于深度学习的人脸采集识别装置，其包括：

人脸处理单元，收集大量含有人脸的图片并处理成人脸文件；

模型建立单元，对所述人脸文件进行深度学习，建立学习模型；

人脸采集单元，将输入的视频流与所述学习模型比对，对视频中的人脸进行采集；

人脸识别单元，对采集到的所述人脸，提取人脸特征数据，并将此人脸特征数据与数据库中的人脸特征数据进行比对，确认是否相符。

较佳的，所述人脸识别单元包括：

人员特征提取子单元，采集相关人员的人脸照片，并提取所述人脸特征数据，将所述人脸特征数据保存在所述数据库中；

人脸特征提取子单元，对采集到的视频中的所述人脸，提取所述人脸特征数据；

特征比对子单元，将视频中的所述人脸特征数据与数据库中的所述人脸特征数据进行1：N比对，确认是否相符。

与现有技术比较本发明的有益效果在于：提供一种基于深度学习的人脸采集识别方法及装置，这样，可以迅速从视频流中提取人脸进行对比，加快了人脸识别速度；可以在0.1秒以内识别人脸，相对于普通的人脸提取，可以大大提高人脸识别速度；通过深度学习，可以持续不间断进行学习，不断提高人脸识别精度，识别精度将远高于普通的识别技术。

附图说明

为了更清楚地说明本发明各实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。

图1是本发明基于深度学习的人脸采集识别方法的流程图；

图2是本发明基于深度学习的人脸采集识别方法步骤S1的流程图；

图3是本发明人脸图片中特征点的位置示意图；

图4是本发明基于深度学习的人脸采集识别方法步骤S4的流程图；

图5是本发明基于深度学习的人脸采集识别方法步骤S41的流程图；

图6是本发明基于深度学习的人脸采集识别方法步骤S42的流程图；

图7是本发明基于深度学习的人脸采集识别方法步骤S43的流程图；

图8是本发明基于深度学习的人脸采集识别装置的结构图；

图9是本发明基于深度学习的人脸采集识别装置中人脸识别单元的结构图；

图10是本发明基于深度学习的人脸采集识别装置中人员特征提取子单元的结构图；

图11是本发明基于深度学习的人脸采集识别装置中人脸特征提取子单元的结构图；

图12是本发明基于深度学习的人脸采集识别装置中特征比对子单元的结构图。

具体实施方式

以下结合附图，对本发明上述的和另外的技术特征和优点作更详细的说明。

当前人脸识别作为生物识别技术之一有其固有的缺点，这主要表现在：

1、人脸特征稳定性差

人脸是具有极强可塑性的三维柔软皮肤表面，会随着表情、年龄等方面的变化而改变，皮肤的特型也会随年龄、化妆、整容、意外伤害等情况发生改变。

2、可靠性、安全性低

尽管每个人的脸都不相同，但人类的面孔总体是相似的，很多人的面孔之间的差别是非常细微的，技术上实现安全可靠的认证有相当的难度。

3、图像的采集易受外界条件影响

人脸识别***必须面对不同光照条件、视角、距离变化等非常困难的视觉问题，这些复杂的成像因素都会极大地影响人脸图像的成像质量，使得识别性能不够稳定。这些缺点使得人脸识别***目前只能在视角、光照等条件比较理想的情况下满足一般应用的要求。

有鉴于此，本发明创作者经过长时间的研究和实践终于获得了本发明。

实施例1

如图1所示，其为本发明基于深度学习的人脸采集识别方法的流程图；其中，所述人脸采集识别方法包括：

步骤S1，收集大量含有人脸的图片并处理成人脸文件；

步骤S2，对所述人脸文件进行深度学习，建立学习模型；

其中，所述输入的视频流可以是通过摄像机或者摄像头采集的，也可以是通过其他方式获得的视频。

这样，可以迅速从视频流中提取人脸进行对比，加快了人脸识别速度；可以在0.1秒以内识别人脸，相对于普通的人脸提取，可以大大提高人脸识别速度；通过深度学习，可以持续不间断进行学习，不断提高人脸识别精度，识别精度将远高于普通的识别技术。

实施例2

如上述所述的基于深度学习的人脸采集识别方法，本实施例与其不同之处在于，如图2所示，所述步骤S1包括：

步骤S11，收集大量含有人脸的图片；

为了提高识别的准确度，需要收集总数不低于10000张的包含人脸的图片；这样，可以进行充分的训练，进而使得识别的准确度大大提高。

步骤S12，进行人脸抠图以及记录各个图片的人脸位置信息，并处理成人脸文件；

该步骤具体为：读取含有人脸的图片，在含有人脸的图片上画矩形框扣取人脸，并且把人脸位置信息等信息保存，并使保存的信息与图片相关联。

其中，可以把人脸位置信息等信息保存到XML文档，然后使XML文档和图片相关联。

在上述基础上增加人脸分类，如幼儿人脸和成人人脸，从而增加识别的准确度。此时，需要在画矩形框扣取人脸后输入分类信息。

该步骤需要处理的内容较多，可以编写专用的软件进行处理，这样节省时间，增加处理速度。

所述人脸文件至少包括：样本文件和处理信息；所述样本文件为人脸图片；所述处理信息为各个图片对应的人脸图片信息；

所述处理信息至少包含对应图片的名字以及人脸区域的位置；这样可以快速读取。还可以包含图片的尺寸，以及人脸分类等，这样便于后续读取。

所述处理信息可以记录在XML文件中，这样便于保存、更改和读取。

所述人脸文件还包括训练文件，所述训练文件包括训练以及测试的图片集的设置文件，以便训练程序读取特定图像分别进行测试以及训练。

实施例3

如上述所述的基于深度学习的人脸采集识别方法，本实施例与其不同之处在于，所述步骤S2中：

进行学习算法的编写，读取上述制作好的人脸文件，进行深度学习，建立学习模型。

所述学习算法的编写，是利用tensorflow多层卷积神经网络编写程序。

卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。卷积神经网络是近年发展起来，并引起广泛重视的一种高效识别方法。一般地，CNN的基本结构包括两层，其一为特征提取层，每个神经元的输入与前一层的局部接受域相连，并提取该局部的特征。一旦该局部特征被提取后，它与其它特征间的位置关系也随之确定下来；其二是特征映射层，网络的每个计算层由多个特征映射组成，每个特征映射是一个平面，平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数，使得特征映射具有位移不变性。此外，由于一个映射面上的神经元共享权值，因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层，这种特有的两次特征提取结构减小了特征分辨率。

该深度学习可以使用tensorflow库(TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习***，其命名来源于本身的运行原理。)，在此基础上建立多层卷积神经网络，由于TensorFlow是GOOGLE公开代码，这里就不具体展开深度学习的具体步骤。

利用tensorflow多层卷积神经网络编写程序，可以将类别分别定义为幼儿人脸以及成人人脸，这样通过这种学习模式能够正确区分小孩和成人，提高是别的精确度。

实施例4

如上述所述的基于深度学习的人脸采集识别方法，本实施例与其不同之处在于，所述步骤S3中：

将输入的所述视频流保存为图片格式与生成的所述学习模型进行比对，如果图片某区域与模型的比对成功率大于阈值，则认为此区域包含人脸，将此照片的人脸部分进行保存。

所述阈值为80％，这样比对的准确率更高。所述阈值也可以根据实际情况进行设定。

所述比对为调用Testsorflow库与学习模型进行比对。

实施例5

如上述所述的基于深度学习的人脸采集识别方法，本实施例与其不同之处在于，如图4所示，所述步骤S4包括：

这样，提高了识别精度。

实施例6

如上述所述的基于深度学习的人脸采集识别方法，本实施例与其不同之处在于，如图5所示，步骤S41包括：

这样每个特征位置比如说嘴唇或者眼睛将大致出现在相同位置；便于进行特征提取和识别。

其中，所述回归原理公式为：

其中，x为参数。

这样使得整个特征提取的准确率更高，判断更加稳定。

目标函数是分类和回归损失的和，分类采用交叉熵，回归采用所述回归原理公式。

整体损失函数具体为：

人脸图片中特征点的位置如图3所示。

所述人脸特征数据提取中，在卷积的最后一层feature map(特征提取图)上使用固定大小的窗口滑动，每个窗口会输出固定大小维度的特征，每一个窗口对候选的9个box进行回归坐标和分类(这里的分类表示box中是不是一个类object(对象)，而不是具体的类别)。

所述人脸特征数据提取，可以是利用Testsorflow的深度学习的分类和回归功能实现的，这样便于操作。

实施例7

如上述所述的基于深度学习的人脸采集识别方法，本实施例与其不同之处在于，如图6所示，步骤S42包括：

其中，所述回归原理公式为：

这样进行判断更加稳定。

整体损失函数具体为：

人脸图片中特征点的位置如图3所示。

步骤S423，根据所述特征点的位置，提取人脸特征数据。

实施例8

如上述所述的基于深度学习的人脸采集识别方法，本实施例与其不同之处在于，步骤S43中，由于受到光线、环境、拍摄角度等方面的影响，直接将人脸特征数据与数据库进行1：N人脸特征比对时，可能会出现比对成功率比较低的情况。

为了解决该问题，如图7所示，步骤S43包括：

该步骤具体为，将人脸特征切割为多个方块，将方块内的特征点与数据库中的每张人脸对应的特征进行比对，确认每个特征点的相似度。

所述人脸特征定义了多个特征点，如图3所示，其中特征点为67个，切割的所述方块需包含人脸的每个特征点。这样，防止遗漏特征点，降低识别的准确性。

在所述方块之间进行特征比对，是将方块内的特征点与数据库中的每张人脸对应的特征进行比对，这样比对目标明确，比对速度快。

步骤S432，根据所述比对相似度确定相似度较高的所述方块；

具体为：根据上述确认的每个方块的比对相似度，找出一些较高的方块。

这样某些遮盖住的部分脸部也可顺利进行比对，可以减少因改变服装、表情及环境变化带来的影响。

其中，确定的相似度较高的所述方块至少包含50％特征点(即34个方块)，相似度阈值由***根据情况自动确定，也可以将方块根据比对相似度进行排序，确认前34个方块为相似度较高的所述方块(也可以是前66个，具体数量可以根据实际情况确认)。

其中，所述计算方法为根据各个方块比对相似度比率求平方平均值。这样计算方便，判断准确。

所述设定阈值为70％，这样可以有较高的准确性。也可以根据实际情况确定。

实施例9

如图8所示，其为本发明基于深度学习的人脸采集识别装置的结构图；其中，所述人脸采集识别装置包括：

人脸处理单元1，收集大量含有人脸的图片并处理成人脸文件；

模型建立单元2，对所述人脸文件进行深度学习，建立学习模型；

人脸采集单元3，将输入的视频流与所述学习模型比对，对视频中的人脸进行采集；

人脸识别单元4，对采集到的所述人脸，提取人脸特征数据，并将此人脸特征数据与数据库中的人脸特征数据进行比对，确认是否相符。

实施例10

如上述所述的基于深度学习的人脸采集识别装置，本实施例与其不同之处在于，人脸处理单元1中：

该单元中，读取含有人脸的图片，在含有人脸的图片上画矩形框扣取人脸，并且把人脸位置信息等信息保存，并使保存的信息与图片相关联。

该单元需要处理的内容较多，可以编写专用的软件进行处理，这样节省时间，增加处理速度。

实施例11

如上述所述的基于深度学习的人脸采集识别装置，本实施例与其不同之处在于，所述模型建立单元2中：

该深度学习可以使用tensorflow库(TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习***，其命名来源于本身的运行原理。)，在此基础上建立多层卷积神经网络，由于TensorFlow是GOOGLE公开代码，这里就不具体展开深度学习的具体过程。

实施例12

如上述所述的基于深度学习的人脸采集识别装置，本实施例与其不同之处在于，所述人脸采集单元3中：

所述比对为调用Testsorflow库与学习模型进行比对。

实施例13

如上述所述的基于深度学习的人脸采集识别装置，本实施例与其不同之处在于，如图9所示，所述人脸识别单元4包括：

人员特征提取子单元41，采集相关人员的人脸照片，并提取所述人脸特征数据，将所述人脸特征数据保存在所述数据库中；

人脸特征提取子单元42，对采集到的视频中的所述人脸，提取所述人脸特征数据；

特征比对子单元43，将视频中的所述人脸特征数据与数据库中的所述人脸特征数据进行1：N比对，确认是否相符。

这样，提高了识别精度。

实施例14

如上述所述的基于深度学习的人脸采集识别装置，本实施例与其不同之处在于，如图10所示，人员特征提取子单元41包括：

人员采集模块411，采集相关人员的人脸照片，将所述人脸照片按照固定大小进行缩放，压缩成固定大小尺寸的图片；

第一位置确认模块412，确认缩放后的图片中眼睛和嘴唇的位置后，通过分类和回归原理确认其他特征点的位置；

其中，所述回归原理公式为：

这样进行判断更加稳定。

整体损失函数具体为：

人脸图片中特征点的位置如图3所示。

第一特征提取模块413，根据所述特征点的位置，提取人脸特征数据并存在所述数据库中。

实施例15

如上述所述的基于深度学习的人脸采集识别装置，本实施例与其不同之处在于，如图11所示，人脸特征提取子单元42包括：

人脸数据采集模块421，对采集到的视频中的所述人脸照片，将所述人脸照片按照固定大小进行缩放，压缩成固定大小尺寸的图片；

第二位置确认模块422，确认缩放后的图片中眼睛和嘴唇的位置后，通过分类和回归原理确认其他特征点的位置；

其中，所述回归原理公式为：

这样进行判断更加稳定。

整体损失函数具体为：

人脸图片中特征点的位置如图3所示。

第二特征提取模块423，根据所述特征点的位置，提取人脸特征数据。

实施例16

如上述所述的基于深度学习的人脸采集识别装置，本实施例与其不同之处在于，特征比对子单元43中，由于受到光线、环境、拍摄角度等方面的影响，直接将人脸特征数据与数据库进行1：N人脸特征比对时，可能会出现比对成功率比较低的情况。

为了解决该问题，如图12所示，特征比对子单元43包括：

方块切割模块431，将人脸特征切割为多个方块，由所述方块之间进行特征比对，确认所述方块的比对相似度；

该模块具体为，将人脸特征切割为多个方块，将方块内的特征点与数据库中的每张人脸对应的特征进行比对，确认每个特征点的相似度。

方块确定模块432，根据所述比对相似度确定相似度较高的所述方块；

百分比计算模块433，综合统计各个相似度较高方块的比对相似度，计算出最终的比对百分比，若所述比对百分比超过设定阈值，则认定为相符。

以上所述仅为本发明的较佳实施例，对本发明而言仅仅是说明性的，而非限制性的。本专业技术人员理解，在本发明权利要求所限定的精神和范围内可对其进行许多改变，修改，甚至等效，但都将落入本发明的保护范围内。

Claims

1.一种基于深度学习的人脸采集识别方法，其特征在于，包括：

步骤S1，收集大量含有人脸的图片并处理成人脸文件；

步骤S2，对所述人脸文件进行深度学习，建立学习模型；

2.如权利要求1所述的人脸采集识别方法，其特征在于，所述人脸文件包括人脸图片、图片的名字和人脸区域的位置信息。

3.如权利要求1所述的人脸采集识别方法，其特征在于，所述步骤S1包括：

步骤S11，收集大量含有人脸的图片；

步骤S12，进行人脸抠图以及记录各个图片的人脸位置信息，并处理成所述人脸文件。

4.如权利要求1-3中任一所述的人脸采集识别方法，其特征在于，所述步骤S4包括：

5.如权利要求4所述的人脸采集识别方法，其特征在于，所述步骤S41包括：

步骤S413，根据所述特征点的位置，提取人脸特征数据并存储在所述数据库中。

6.如权利要求4所述的人脸采集识别方法，其特征在于，所述步骤S42包括：

步骤S423，根据所述特征点的位置，提取所述人脸特征数据。

7.如权利要求4所述的人脸采集识别方法，其特征在于，所述步骤S43包括：

步骤S432，根据所述比对相似度确定相似度较高的所述方块；

步骤S433，综合统计各个相似度较高方块的所述比对相似度，计算出最终的比对百分比，若所述比对百分比超过设定阈值，则认定为相符。

8.如权利要求4所述的人脸采集识别方法，其特征在于，所述回归原理公式为：

<mrow> <msub> <mi>Smooth</mi> <msub> <mi>L</mi> <mn>1</mn> </msub> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>0.5</mn> <msup> <mi>x</mi> <mn>2</mn> </msup> </mrow> </mtd> <mtd> <mrow> <mo>|</mo> <mi>x</mi> <mo>|</mo> <mo><</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>|</mo> <mi>x</mi> <mo>|</mo> <mo>-</mo> <mn>0.5</mn> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>w</mi> <mi>i</mi> <mi>s</mi> <mi>e</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> 1

其中，x为参数。

9.一种与权利要求1-8中任一所述的人脸采集识别方法对应的基于深度学习的人脸采集识别装置，其特征在于，包括：

人脸处理单元，收集大量含有人脸的图片并处理成所述人脸文件；

模型建立单元，对所述人脸文件进行深度学习，建立所述学习模型；

人脸识别单元，对采集到的所述人脸，提取所述人脸特征数据，并将此人脸特征数据与数据库中的人脸特征数据进行比对，确认是否相符。

10.如权利要求9所述的人脸采集识别装置，其特征在于，所述人脸识别单元包括：