CN108229258A

CN108229258A - 一种基于深度学习和Spark的人脸并行识别方法

Info

Publication number: CN108229258A
Application number: CN201611194471.6A
Authority: CN
Inventors: 田文洪; 任小芹; 刘弘; 刘弘一; 黄文强; 黄超杰; 何马均
Original assignee: Individual
Current assignee: Individual
Priority date: 2016-12-21
Filing date: 2016-12-21
Publication date: 2018-06-29

Abstract

本发明公布了一种基于深度学习和Spark的人脸并行识别方法通过深度学习框架以及使用Spark并行化的方式实现人脸的识别。在图像特征的提取过程中，使用Partition将图形分到不同的集群节点，利用Spark集群中的每一个节点并行化训练参数以及模型，在每一个集群节点，均会生成一个模型，这些模型将用来之后的人脸并行化识别，通过并行化减少时间开销。在识别人脸的过程中，使用Spark的特性，采用并行化的识别方式将特征广播到每一个集群节点，在每一个集群节点分别计算，每一个节点产生一个对应的待识别人脸的结果。在主节点上汇总所有分节点的结果，通过所有的结果比较，得到最终的结果。

Description

一种基于深度学习和Spark的人脸并行识别方法

技术领域

本发明属于人脸识别方法与识别领域，具体涉及一种人脸识别的并行化识别方法。

背景技术

随着我国智慧城市的建设，人脸识别已经成为仅次于指纹识别的高速发展领域。人脸识别是根据所提取的人脸图像特征采用相关识别算法进行人脸确认或辨别。即将已检测到的待识别人脸与数据库中已知人脸进行比较匹配，得出相关信息，该过程的关键是选择适当的人脸表征方式与匹配策略，***的构造与人脸的表征方式密切相关。一般根据所提特征而选择不同识别算法进行度量，常用的包括距离度量、支持向量机、神经网络、k均值聚类等方法。

在实际应用中，涉及到的人脸识别范围通常是大量人群的图像识别，训练模型以及人脸识别花费的时间开销将是巨大的。严重影响了人们的工作进度与工作人员的效率。

发明内容

针对当前大多数人脸识别算法实时性差、识别率低的问题，首先分析原因大致有以下两点：1.人脸识别过程中的分类器模型训练时间过长；2.分类器分类效果不佳。而当前最新的深度学习算法通过对大量样本数据的学习，找到最合适的分类方法和标准，致使分类精度大大提升。

基于以上分析，本发明提供了一种基于深度学习和Spark的人脸并行识别方法，所述方法包括以下步骤：

步骤1：首先将提取出的人脸特征分块然后处理并存储在HDFS(Hadoop DistributedFile System)文件***上，输入到Spark，转换为Block；

步骤2：:在Spark数据输入形成RDD(Resilient Distributed Datasets)后，在Transition阶段，在每个节点上使用TensorFlow框架，框架中调用利用TensorFlow训练好的深度学习分类器模型来对特征进行处理，实现分类的目的。深度学习分类器模型是由卷积神经网络训练得到的，该卷积神经网络结构为：卷积层，降采样层，全链接层；

步骤3：作业开始执行，Driver接收Spark作业和数据，Master节点向Worker发送命令，最终分配Task在集群中的各节点上的Executor上执行；

步骤4：将最终结果数据输出存储到HDFS，然后加载结果数据显示识别结果。

进一步地，所述步骤1中所述的输入人脸特征实际上也是利用深度学习方法训练出的特征。（这不是本发明的重点，所以在此不再赘述）

进一步地，所述步骤2中，所述的卷积神经网络详细情况是：第一层输入层就是输入Spark数据，第二层卷积层Conv1：实现卷积以及Rectified Linear Activation（需要设定），第三层池化层Pool1：Max Pooling（这里是2*2的Max_Pool），第四层卷积层Conv2：实现卷积以及Rectified Linear Activation，第五层池化层Pool2：Max Pooling，，第六层卷积层Conv3：实现卷积以及Rectified Linear Activation，第七层池化层Pool3：MaxPooling，第八层全连接层Local3：基于修正线性激活的全连接层，第九层全连接层Local4：基于修正线性激活的全连接层，第10层输出层Softmax_Linear：进行线性变换以输出Logits，激活函数用Relu。

本发明的有益效果是：本发明所使用的方法在LFW数据库上能够很大程度上提高分类识别精度，提高了整体速度。本发明的创新点是提出了一种新的结合Spark和深度学习的并行训练方法，是针对当前业界缺少并行化和深度学习相结合的算法现状，本发明的核心是结合深度学习与分布式计算，最终提高人像识别的精确度和实现识别时间的最小化，即实现处理速度和处理效果的双赢。采用新一代深度学习框架，率先研发在CPU、GPU集群上基于深度学习框架的并行训练模型和识别算法，提高训练、识别速度和精度。

附图说明

图1是本发明一种基于深度学习和Spark的人脸并行识别方法的核心步骤图。

图2是本发明一种基于深度学习和Spark的人脸并行识别方法的流程图。

具体实施方式

下面根据附图和发明内容，对本发明的具体实施方式作进一步详细说明，以下实施例用于说明本发明，但不用来限制本发明的范围。

步骤1：首先将提取出的人脸特征分块然后处理并存储在HDFS 文件***上，输入到Spark，转换为Block；

步骤2：:在Spark数据输入形成RDD后，在Transition阶段，在每个节点上使用TensorFlow框架，框架中调用利用TensorFlow训练好的深度学习分类器模型来对特征进行处理，实现分类的目的。深度学习分类器模型是由卷积神经网络训练得到的，该卷积神经网络结构为：卷积层，降采样层，全链接层；

步骤4：将最终结果数据输出存到HDFS，然后加载结果数据显示识别结果。

进一步地，所述步骤2中，所述的卷积神经网络详细情况是：第一层输入层，第二层卷积层Conv1：实现卷积以及Rectified Linear Activation（需要设定），第三层池化层Pool1：Max Pooling（这里是2*2的Max_Pool），第四层卷积层Conv2：实现卷积以及RectifiedLinear Activation，第五层池化层Pool2：Max Pooling，，第六层卷积层Conv3：实现卷积以及Rectified Linear Activation，第七层池化层Pool3：Max Pooling，第八层全连接层Local3：基于修正线性激活的全连接层，第九层全连接层Local4：基于修正线性激活的全连接层，第10层输出层Softmax_Linear：进行线性变换输出Logits，激活函数用Relu。

Claims

1.一种基于深度学习和Spark的人脸并行识别方法，其特征是利用Spark***的并行化，将人脸识别中神经网络模型的训练过程以及人脸的识别过程通过并行化来节省时间开销，提高工作效率。

2.根据权利要求1所述的方法，其特征是利用Spark集群进行分类器模型的并行训练，创建RDD对象，使用Transformation的方式，创建新的RDD对象，最后使用Action，启动并行计算，得到相应的参数，将参数带入模型，实现并行训练。

3.根据权利要求1所述的方法，其特征是利用Spark集群进行人脸的并行识别，对视频处理，得到人脸图像，提取图像中人脸特征，得到特征之后，将包含特征的向量T[t1,t2，t3，…,t4,tn]分发到Spark集群中每一个节点，将得到的结果进行比较，找出与待识别人脸拟合程度最好的一个结果，实现并行识别。

4.根据权利要求1所述的方法，其特征是基于深度学习的框架，可以使用Caffe、Torch开源框架得到训练的参数，最后带入模型，作为分类器模型的最后结果,然后再结合输入的待识别人脸的特征识别出人脸。