CN110110673B

CN110110673B - 一种基于双向2dpca和级联前向神经网络的人脸识别方法

Info

Publication number: CN110110673B
Application number: CN201910389942.6A
Authority: CN
Inventors: 文成林; 翁楦乔
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2019-05-10
Filing date: 2019-05-10
Publication date: 2020-11-27
Anticipated expiration: 2039-05-10
Also published as: CN110110673A

Abstract

本发明公开了一种基于双向2DPCA与级联前向神经网络的人脸识别方法，本发明大体包括三部分内容：第一部分，对原始图像进行直方图均衡化，提高对比度；第二部分，使用双向2DPCA进行特征提取；第三部分，将提取后的特征输入进级联前向神经网络训练，建立起人脸识别分类器。本发明即能够快速准确提取出特征值，也能利用级联前向神经网络进行识别，并通过样本不断学习提高识别准确率，实现了对人脸的有效识别。

Description

一种基于双向2DPCA和级联前向神经网络的人脸识别方法

技术领域

本发明涉及一种基于双向2DPCA和级联前向神经网络的人脸识别方法，属于模式识别领域。

背景技术

近年来，人工智能与机器学习的迅速发展使得很多新兴的技术成为了可能。目前，识别技术是人工智能广泛应用的一个领域之一，例如人脸识别和指纹识别等。其中人脸识别在安防、交易支付、信息安全等方面有着重要的应用。目前，人脸识别的方法主要有特征脸、Fisherface和BP神经网络等。

特征脸是利用原有图片转化成一个特征向量集，被称为“特征脸”，利用特征向量集作为工具进行识别。出现需要识别的图片时，将图片投影到特征脸位于的子空间，通过投影后图片的投影点在子空间的位置计算欧式距离进行判别。特征脸方法使用的空间变换方法为PCA，但是PCA在计算过程中需要将图片变换为向量，会产生高维度的向量，增加计算特征向量所耗费的成本。并且，如果面部图片出现角度、光线等变化，而原始图片获得的特征脸并未包含那些信息的话，便无法识别新的图片。

Fisherface进行人脸识别的本质是利用线性判别分析，将高维空间中的数据降维至低维空间。将投影后不同类别数据之间的距离最大，而相同类别的数据越集中作为求取投影矩阵的目标。识别图像的方法是将图像向量与投影矩阵乘积获得投影之后的特征向量，求得的特征向量与已知的特征向量进行欧氏距离的计算来判断图像属于哪一个类别。但是光线对于上两种方法的识别准确率影响是比较严重的。

使用BP神经网络来进行识别的方法最为经典。由于神经网络的特性，输入维数希望能够控制在一个较低的区间内，以便于提高识别效率，降低计算的复杂程度。

这样就产生了降低计算成本的要求，本发明使用的双向2DPCA就是一种PCA的改进方法，能够在不降低识别率的情况下，大幅度降低提取特征所需要的时间。

此外级联前向神经网络由于结构与BP神经网络不同，其网络中的每一层均有神经元直接连接，所以其每一层学习到的特征并不会因为下一层的训练而丢失，能够提高识别的准确率。

发明内容

为了应对上述背景中所提到的计算耗费大量时间、识别率不高以及易受环境影响等不足，本发明基于双向2DPCA和级联前向神经网络提出一种新的人脸识别方法，通过双向2DPCA提取特征并使用级联前向神经网络进行训练和识别。

本发明包括以下步骤：

步骤1获得图像直方图并进行均衡化。

图像A∈N^m×n，N表示非负整数集合，图像的灰度范围是[0,255]。

直方图是一个离散函数：

其中，r代表灰度级别；mn代表图像像素总数；q_r代表第r个灰度级别所含有的像素数量；P(r)代表第r个灰度级别所含像素占总像素数的比例。

由于灰度图像是离散的，则直方图均衡化的公式为

s₀＝P_T(0)＝P(0)

s_k＝P_T(r)＝P_T(r-1)+P(r),r＝1,2,…,255

步骤2利用双向2DPCA提取特征。

双向2DPCA的主元是一个矩阵：

设总共有M个人脸，每个人脸N张照片，则上标代表第i个人脸，j代表第i个人脸的第j张图片，k与l表示图片中第k行与第l列的像素。双向2DPCA提取特征首先要求出总体散布矩阵F，再求出另一个总体散布矩阵G。

求出F与G的特征值与特征向量，特征值按降序排列成为一个列向量，特征向量按照其对应特征值的大小排列成矩阵。选择出总体散布矩阵F的前t个特征向量组成的矩阵作为列压缩投影矩阵B，而总体散布矩阵G的前u个特征向量组成的矩阵的转置作为行压缩投影矩阵A，经过线性变换Y＝AXB得到特征矩阵Y。其中，X是大小m×n的原始矩阵，A是大小为u*m的行压缩投影矩阵，B是大小为n*t(t<n)的列压缩投影矩阵，Y是大小为u*t的特征矩阵。

步骤3将提取的特征输入级联前向神经网络进行训练。

级联前向神经网络不仅相邻两层之间是全连接的，而且该网络的输入层与网络中的每一层都有连接权重，并且每一层都与该层之后的所有层进行连接。

其中，

表示第L层的第j个神经元输出；

表示第L-1层的第K个神经元指向第L层的第J个神经元的权重；

表示第L层的阈值；σ表示激活函数。该神经网络的输入节点42个，与双向2DPCA后提取的主元数量一致；包含两层隐含层：第一层隐层含节点100个，激活函数为tanh函数，第二层隐层含节点80个，激活函数为sigmoid函数；输出节点40个，与所需要分类的人脸数有关。

神经网络使用BP算法进行训练。规定L(a^[l],y)为第L层的误差，令

为了计算关于权重和阈值的偏导数，令

由以下公式更新权重和误差：

根据权重和误差更新公式训练神经网络，减少网络的代价函数值。

训练完成后，将需要识别的人脸照片输入级联前向神经网络中，得到输出向量，其中向量的第几个值最接近1，说明神经网络判断这张图片的人脸为第几个人的人脸。

本发明的有益效果：本发明较传统的识别方法以及PCA和BP神经网络结合的方法相比，有更高的识别率以及更快的计算速度。

附图说明

图1为本发明流程图。

图2为级联神经网络的结构图。

具体实施方式

以下结合附图对本发明作进一步说明，

本发明大体包括三部分内容。第一部分对原始图像进行直方图均衡化的预处理；第二部分使用双向2DPCA提取预处理后图片的特征值；第三部分使用级联前向神经网络进行训练建立分类器并识别。

如图1所示，本发明包括以下步骤：

步骤1获得图像的直方图并进行均衡化。图像的直方图是由图像的灰度图像得出的一种质量分布图，它的本质是从一幅灰度图像中统计其不同灰度范围的像素个数，并从低灰度到高灰度按顺序排列。图像A∈N^m×n，N表示非负整数集合，图像的灰度级范围是[0,L-1]，一般取L＝2⁸＝256，即图像的灰度范围是[0,255]。

直方图是一个离散函数：

其中，r代表灰度级别；mn是图像像素总数；q_r是指第r个灰度级别所含有的像素数量；P(r)表示第r个灰度级别所含像素占总像素数的比例。

假设s的概率密度为P(s)，r的概率密度为P(r)，r＝T^-1(s)，于是可以得到s的概率密度函数表示为

再假设变换T为

上式中

为r的累积分布函数，再对上式两边对r求导得到

将式 (4)带入s的概率密度函数得

可以发现如果变换T为r的累积分布函数时，s的概率密度函数变为1，即代表s是均匀分布的。

由于灰度图像是离散的，则直方图均衡化的公式为

s₀＝P_T(0)＝P(0) (6)

s_k＝P_T(r)＝P_T(r-1)+P(r),r＝1,2,…,255 (7)

步骤2使用双向2DPCA提取特征。双向2DPCA的主元是一个矩阵

设总共有M个人脸，每个人脸N张照片，则上标代表第i个人脸，j代表第i个人脸的第j张图片，k与l表示图片中第k行与第l列的像素。

双向2DPCA在原有2DPCA的基础上，从只有列方向上的压缩扩展到了行和列方向的同时压缩。双向2DPCA提取特征首先要求出总体散布矩阵F，再求出另一个总体散布矩阵G。

求出F与G的特征值与特征向量，特征值按降序排列成为一个列向量，特征向量按照其对应特征值的大小排列成矩阵。选择出总体散布矩阵F的前t个特征向量组成的矩阵作为列压缩投影矩阵B，而总体散布矩阵G的前u个特征向量组成的矩阵的转置作为行压缩投影矩阵A，经过线性变换Y＝AXB得到特征矩阵Y。其中，X是大小m×n的原始矩阵，A是大小为u*m(u<m)的行压缩投影矩阵，B是大小为n*t(t<n)的列压缩投影矩阵，Y是大小为u*t的特征矩阵。

步骤3将压缩后的矩阵变换为列向量输入级联前向神经网络进行训练。采用的神经网络为级联前向神经网络，该神经网络是由最基础的前馈神经网络改进而来，由输入、隐含层和输出层组成，见图2。在训练网络的过程中，计算从输入层开始并一层层地传递到输出层，而误差会从网络的最后一层反向传播到上一层。

与前馈神经网络不同的是，级联前向神经网络不仅相邻两层之间是全连接的，而且该网络的输入层与网络中的每一层都有连接权重，并且每一层都与该层之后的所有层进行连接。于是，级联前向神经网络中的每一层都进行了连接，这样在不同层级之间识别的特征可以有效的被其他层利用。理论上网络中隐层的数量越多，能够学习表达更复杂的数据关系。级联前向神经网络在最优化参数的时候同样使用反向传播算法，但是此网络的主要特征是某一层的神经元都与其之前的所有层中的神经元相关。

其中，

表示第L层的第j个神经元输出；

表示第L-1层的第K个神经元指向第L层的第J个神经元的权重；

为了计算关于权重和阈值的偏导数，令

由以下公式更新权重和误差：

根据式(14-19)训练神经网络，减少网络的代价函数值。训练完成后，将需要识别的人脸照片输入级联前向神经网络中，得到输出向量，其中向量的第几个值最接近1，说明神经网络判断这张图片的人脸为第几个人的人脸。

Claims

1.一种基于双向2DPCA和级联前向神经网络的人脸识别方法，其特征在于该方法包含以下步骤：

步骤1获得图像直方图并进行均衡化；

图像A∈N^m×n，N表示非负整数集合，图像的灰度范围是[0,255]；

直方图是一个离散函数：

其中，r代表灰度级别；mn代表图像像素总数；q_r代表第r个灰度级别所含有的像素数量；P(r)代表第r个灰度级别所含像素占总像素数的比例；

假设s的概率密度为P(s)，r的概率密度为P(r)，r＝T^-1(s)，于是得到s的概率密度函数：

再假设变换T为

上式中

为r的累积分布函数，再对上式两边对r求导得到

将上式带入s的概率密度函数得

发现如果变换T为r的累积分布函数时，s的概率密度函数变为1，即代表s是均匀分布的；

由于灰度图像是离散的，则直方图均衡化的公式为

s₀＝P_T(0)＝P(0)

s_k＝P_T(r)＝P_T(r-1)+P(r),r＝1,2,…,255

步骤2利用双向2DPCA提取特征；

双向2DPCA的主元是一个矩阵：

设总共有M个人脸，每个人脸N张照片，则上标代表第i个人脸，j代表第i个人脸的第j张图片，k与l表示图片中第k行与第l列的像素；双向2DPCA提取特征首先要求出总体散布矩阵F，再求出另一个总体散布矩阵G；

求出F与G的特征值与特征向量，特征值按降序排列成为一个列向量，特征向量按照其对应特征值的大小排列成矩阵；选择出总体散布矩阵F的前t个特征向量组成的矩阵作为列压缩投影矩阵B，而总体散布矩阵G的前u个特征向量组成的矩阵的转置作为行压缩投影矩阵A，经过线性变换Y＝AXB得到特征矩阵Y；其中，X是大小m×n的原始矩阵，A是大小为u*m的行压缩投影矩阵，B是大小为n*t(t<n)的列压缩投影矩阵，Y是大小为u*t的特征矩阵；

步骤3将提取的特征输入级联前向神经网络进行训练；

级联前向神经网络不仅相邻两层之间是全连接的，而且该网络的输入层与网络中的每一层都有连接权重，并且每一层都与该层之后的所有层进行连接；