CN112364809A

CN112364809A - 一种高准确率的人脸识别改进算法

Info

Publication number: CN112364809A
Application number: CN202011332325.1A
Authority: CN
Inventors: 宋强; 张颖
Original assignee: University of Science and Technology Liaoning USTL
Current assignee: University of Science and Technology Liaoning USTL
Priority date: 2020-11-24
Filing date: 2020-11-24
Publication date: 2021-02-12

Abstract

本发明提供一种高准确率的人脸识别改进算法，采用的技术方案是基于卷积神经网络的人脸识别改进算法，步骤如下：步骤一：选用双对称LeNet并行连接的网络结构；步骤二：采用DCT‑LBP联合处理的方法对输入图像的全局特征和局部特征分别进行提取；步骤三：在输出层Softmax回归分类中加余弦矫正用以增强泛化能力。本发明是一种基于卷积神经网络的人脸识别改进算法，能有效的提高人脸识别准确率，可以高精准的获得人脸图像的全部信息。

Description

一种高准确率的人脸识别改进算法

技术领域

本发明涉及人脸识别算法技术领域，特别涉及一种高准确率的人脸识别改进算法。

背景技术

在目前的相关技术中，人脸识别方法主要以基于深度学习为主，速率及准确率虽相对其他人脸识别技术较好，但仍需进一步完善，而本发明采用双对称LeNet网络并行连接的网络结构，对输入图像(特征提取)DCT-LBP化以及输出分类余弦矫正等联合处理算法是人脸识别准确率最高的方法之一。

双对称LeNet网络是以经典的卷积神经网络LeNet为基础，采用完全对称的方式并行同步模型，实现双对称LeNet并行连接的网络结构。分别进行图像处理，各自独立获取高层特征向量，在输出层进行合并分类过程，取得提升准确率的效果。

DCT-LBP联合处理过程是指DCT利用傅里叶变换，在频域中获取低频信息，保留整体特征。LBP特征提取通过分析像素点之间的关系，来描述图像纹理特征，在局部特征提取方面取得较好效果。

Softmax回归分类是一个线性的多分类模型，是Logistic回归模型的延伸。在多分类问题上，可以把真实权重向量转化为一种概率分布，从而实现特征信息分类过程。

发明内容

为克服人脸识别准确率低的技术问题，本发明提供了一种高准确率的人脸识别改进算法，在不影响训练效率的情况下，提高识别精度。

为了达到上述目的，本发明采用以下技术方案实现：

本发明采用的技术方案是在经典的卷积神经网络的基础下，采用双对称LeNet并行连接的网络结构，利用DCT-LBP联合处理法特征提取，并在输出层回归分类余弦矫正。

一种高准确率的人脸识别改进算法，其步骤如下：

步骤一：选用双对称LeNet并行连接的网络结构：以经典卷积神经网络模型LeNet为基础，采用双对称LeNet并行连接网络结构，同步模型采取两路并行网络，分别进行图像处理，独立获取高层特征向量，在输出层进行合并；

步骤二：采用DCT-LBP联合处理的方法对输入图像的全局特征和局部特征分别进行提取：LBP化处理是局部二值模式，对人脸图像进行像素级的LBP编码，再根据编码求其统计直方图，来作为具有空间不变性的人脸的局部特征；DCT化处理是人脸图像信息经过DCT离散余弦变换后，所获得的低频系数，来作为人脸的局部特征；

步骤三：当图像信息到达输出层时，采用Softmax回归分类对人脸图像信息与数据库中信息进行比对分类，得出正确完整的人物信息；在回归分类中增加余弦矫正，减少冗余，增强泛化能力减少过拟合。

进一步地，所述的步骤二具体为：DCT-LBP联合处理利用像素级LBP编码的二值化处理，获取其局部二值模式中的跳变次数的统计直方图，用以提取人脸信息局部特征；计算公式如公式(1)所示：

其中

式中：a_c为中心像素灰度值，a_i为周围邻域点像素灰度值，S为阈值函数，f_LBP(m_c，n_c)为中心像素的LBP值；

DCT离散变换获得低频系数作为人脸信息的全局特征；其计算公式如公式(2)所示：

其中

式中：F(u，v)为DCT系数，u，v代表DCT变换后矩阵内某个数值的坐标位置，f(x，y)代表图像数据矩阵内的数个数值；

将LBP与DCT进行加权融合联合处理，其计算公式如公式(3)所示：

S＝a·DCT+b·LBP (3)

式中：a为DCT的加权系数，b为LBP的加权系数，且a+b＝1；S为加权后的图像。

进一步地，所述的步骤三中，Softmax回归是一个线性的多分类模型，是Logistic回归模型的延伸；在多分类问题上，可以把真实权重向量转化为一种概率分布，损失函数表达式如公式(4)所示：

式中：M为样本数量，N为类别数量；x_i为第i个样本的特征向量，y_i为类别标记；W和b分别作为全连接层的权重矩阵和偏置向量，W_j为权重矩阵的第j列，b_j为对应的偏置项；

Softmax回归分类中增加余弦矫正，消除损失函数带来较大类内变化，使其更加紧密，特征更具有判别性，该类内余弦相似性损失函数如公式(5)所示：

式中：

为第i个样本的特征向量与其对应类别权重向量之间的夹角；

为了便于前向传播和反向传播，将类内余弦相似性损失函数转化如公式(6)所示：

式中：：

为实际的损失层输入，且该函数可以有效地描述类内变化；

为了使学习到的特征具有判别性，在Softmax损失与类内余弦相似性损失共同监督下训练，得到的表达式公式(7)所示：

式中：λ为一个标量，用来平衡两个损失函数；

在输出层Softmax回归分类中的特征和权重向量间增加类内余弦矫正，使得类内更加紧凑，类间尽可能远离，增强了卷积神经网络模型的泛化能力，减少过拟合现象，提高了识别率。

在训练过程中，为了使与测试阶段的余弦相似性衡量一致，把样本相似性的欧式距离转化为余弦距离，权重与特征归一化到相同的值S，使其自动学习，不同类之间的人脸样本特征能够较好的在超球面上分离；其最终联合表达式如公式(8)所示：

式中：λ为归一化后的联合表达式的平衡系数；

在具有近5000多人在不同环境下的人脸图像信息的LFW数据库中，用Casia-WebFace数据库作为训练集，LFW数据库作为测试集；利用测试结果的数据对比来验证改进后人脸识别算法的准确率。

以双对称LeNet网络结构为基础，对输入的人脸图像进行DCT-LBP联合处理，分别提取全局特征和局部特征，并在输出层Softmax回归分类中加以余弦矫正，确认所识别信息的准确性，并利用识别结果验证该算法的有效性。

与现有技术相比，本发明的有益效果是：

1、本发明采用双对称LeNet并行连接的网络结构，利用DCT-LBP联合处理法对人脸信息图像特征提取，并在输出层Softmax回归余弦矫正对全局特征和局部特征进行分类匹配，极大的提升了人脸识别的准确率。本发明提出的一种高准确率的人脸识别改进算法的优势在于结构优化可分别独立获取高层特征向量，用以完善特征信息；同时结合频域与空间域的信息，对整体特征提取和局部特征提取进行充分考虑，结合互补，达到最优特征提取状态；且在分类中通过余弦矫正后的回归分类增强了泛化能力，减少过拟合现象，使其准确率最佳；

2、由于LBP特征描述的纹理细节信息都表现出高频特性，而DCT离散变换后的低频系数，二者具有互补性，结合起来更好的进行人脸特征描述，有利于提高人脸检测识别***的性能。其联合处理用以消除图像的杂质，减化数据量，恢复真实的图像信息，增强卷积网络的训练效果。本发明利用DCT-LBP联合处理的方法分别对全局特征和局部特征进行图像信息提取，独立获取高层特征向量。弥补了DCT过程中的高频信息丢失问题以及LBP特征提取的局限性。因此DCT-LBP联合处理在特征提取过程中取得很好的效果；

3、在输出层Softmax回归分类中的特征和权重向量间增加类内余弦矫正，可以使得类内更加紧凑，类间尽可能远离，增强了卷积神经网络模型的泛化能力，减少过拟合现象，提高了识别率。

附图说明

图1是本发明的改进算法的网络结构总体概览；

图2是本发明的网络训练过程概览。

具体实施方式

以下结合附图对本发明提供的具体实施方式进行详细说明。

本发明综合考虑网络结构的优化、图像信息提取的完善及分类输出的改进，采用双对称LeNet并行连接的网络结构、DCT-LBP联合处理的图像特征提取方法及余弦矫正后分类识别法，弥补了单一特征和分类过拟合的不足之处，增强了泛化能力，使人脸识别准确率更高。

本发明提出一种高准确率的人脸识别改进算法，包含以下步骤：

步骤一：选用双对称LeNet并行连接的网络结构：以经典卷积神经网络模型LeNet为基础，采用双对称LeNet并行连接网络结构，同步模型采取两路并行网络，分别进行图像处理，可以独立获取高层特征向量，在输出层进行合并。

步骤二：采用DCT-LBP联合处理的方法对输入图像的全局特征和局部特征分别进行提取：所谓LBP化处理，指的是局部二值模式，对人脸图像进行像素级的LBP编码，再根据编码求其统计直方图，来作为具有空间不变性的人脸的局部特征。DCT化处理，指的是人脸图像信息经过DCT离散余弦变换后，所获得的低频系数，来作为人脸的局部特征。由于LBP特征描述的纹理细节信息都表现出高频特性，而DCT离散变换后的低频系数，二者具有互补性，结合起来更好的进行人脸特征描述，有利于提高人脸检测识别***的性能。其联合处理用以消除图像的杂质，减化数据量，恢复真实的图像信息，增强卷积网络的训练效果。本发明利用DCT-LBP联合处理的方法分别对全局特征和局部特征进行图像信息提取，独立获取高层特征向量。弥补了DCT过程中的高频信息丢失问题以及LBP特征提取的局限性。因此DCT-LBP联合处理在特征提取过程中取得很好的效果。

DCT-LBP化联合处理，具体是利用像素级LBP编码的二值化处理，获取其局部二值模式中的跳变次数的统计直方图，用以提取人脸信息局部特征。计算公式如公式(1)所示：

其中

式中：a_c为中心像素灰度值，a_i为周围邻域点像素灰度值，S为阈值函数，f_LBP(m_c，n_c)为中心像素的LBP值。

DCT离散变换获得低频系数作为人脸信息的全局特征。其计算公式如公式(2)所示：

其中

将LBP与DCT进行加权融合联合处理，其提取计算公式如公式(3)所示：

S＝a·DCT+b·LBP (3)

步骤三：当图像信息经过一系列处理后到达输出层，采用Softmax回归分类对人脸图像信息与数据库中信息进行比对分类，得出正确完整的人物信息。在回归分类中增加余弦矫正可以减少冗余，增强泛化能力减少过拟合。

Softmax回归是一个线性的多分类模型，是Logistic回归模型的延伸。在多分类问题上，可以把真实权重向量转化为一种概率分布，损失函数表达式如公式(4)所示：

式中：M为样本数量，N为类别数量；x_i为第i个样本的特征向量，y_i为类别标记；W和b分别作为全连接层的权重矩阵和偏置向量，W_j为权重矩阵的第j列，b_j为对应的偏置项。

式中：

为第i个样本的特征向量与其对应类别权重向量之间的夹角。

式中：：

为实际的损失层输入，且该函数可以有效地描述类内变化。

式中：λ为一个标量，用来平衡两个损失函数。

在输出层Softmax回归分类中的特征和权重向量间增加类内余弦矫正，可以使得类内更加紧凑，类间尽可能远离，增强了卷积神经网络模型的泛化能力，减少过拟合现象，提高了识别率。在训练过程中，为了使与测试阶段的余弦相似性衡量一致，把样本相似性的欧式距离转化为余弦距离，权重与特征归一化到相同的值S，使其自动学习，不同类之间的人脸样本特征能够较好的在超球面上分离。其最终联合表达式如公式(8)所示：

式中：λ为归一化后的联合表达式的平衡系数。

在具有近5000多人在不同环境下的人脸图像信息的LFW数据库中，用Casia-WebFace数据库作为训练集，LFW数据库作为测试集。利用测试结果的数据对比来验证改进后人脸识别算法的准确率。

通过在LFW人脸数据库实验对比数据分析可知，DCT-LBP化过程联合处理时当a＝0.875，b＝0.125时，即全局特征与局部特征提取比例近似为7:1，在余弦矫正后的双对称LeNet并行连接的网络结构上识别效果最好。识别的准确率由97.20％升至为99.05％。这说明一种高准确率的人脸识别改进算法取得很好的效果。

一种高准确率的人脸识别改进算法的优势在于网络结构的优化、特征提取中的频域与空间域的结合改进，以及回归分类中的余弦矫正优化。考虑整体特征提取与局部特征提取之间的互补结合性和分类识别的泛化能力，使其互相补充，达到识别准确率最优效果。

下面结合附图和具体实施进一步详细说明本发明。

首先采用双对称LeNet网络并行连接的结构，利用DCT-LBP联合处理的方法分别对人脸图像信息的局部特征和全局特征进行提取，最后经过卷积和降采样等网络训练在全连接层进行特征信息的合并在输出层回归分类中引入类内余弦矫正，具有很好的训练效果。

本发明提供一种高准确率的人脸识别改进算法，如图1所示，为本发明的改进算法的网络结构总体概览，如图2所示，为本发明的改进算法的网络训练过程概览。包括：

步骤1、使用双对称LeNet网络并行连接的结构，同步模型采取两路并行网络，分别进行图像处理，可以独立获取高层特征向量，在输出层进行合并。

步骤2、使用DCT-LBP联合处理的方法分别对人脸图像特征信息提取。LBP化处理，实际就是局部二值模式，对人脸图像信息进行像素LBP编码，求取其编码的统计直方图，作为具有空间不变性的人脸的局部特征。而DCT化处理，指的是人脸图像信息经过DCT离散余弦变换后，获取的低频系数作为人脸的全局特征。DCT-LBP联合处理将二者特征提取优势结合互补，在人脸识别中的图像信息提取中具有较好的性能。

LBP二值化处理获取局部特征信息的计算公式如公式(1)所示：

其中

其中

S＝a·DCT+b·LBP (3)

步骤3、图像信息经过一系列处理后到达输出层，采用Softmax回归分类对人脸图像信息与数据库中信息进行比对分类，得出正确完整的人物信息。Softmax回归是一个线性的多分类模型，是Logistic回归模型的延伸。在多分类问题上，可以把真实权重向量转化为一种概率分布，损失函数表达式如公式(4)所示：

在回归分类中增加类内余弦矫正，消除损失函数带来较大类内变化，使其更加紧密，特征更具有判别性，该类内余弦相似性损失函数如公式(5)所示：

在训练过程中，为了使与测试阶段的余弦相似性衡量一致，把样本相似性的欧式距离转化为余弦距离，权重与特征归一化到相同的值S，使其自动学习，不同类之间的人脸样本特征能够较好的在超球面上分离。使网络训练具有减少冗余，增强泛化能力减少过拟合现象的能力。其最终联合表达式如公式(6)所示：

步骤4、将双对称网络LeNet与DCT-LBP联合处理人脸图像特征提取以及余弦矫正后的Softmax回归分类输出结合，使人脸识别在改进后的算法中具有非常高的准确率。

本发明所述的是一种高准确率的人脸识别改进算法，为人脸图像信息识别提供了一种新的、更加完善的高准确率的算法。并且通过具体的实验数据说明了改进算法的优越性和有效性，很大程度上弥补了基于深度学习的人脸识别网络训练的准确率低的问题，使利用改进后算法的人脸识别运算结果更加准确，在人脸识别和人工智能等图像处理领域具有重大意义。

以上实施例在以本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于上述的实施例。上述实施例中所用方法如无特别说明均为常规方法。

Claims

1.一种高准确率的人脸识别改进算法，其特征在于，采用双对称LeNet并行连接的网络结构，利用DCT-LBP联合处理法特征提取，并在输出层回归分类余弦矫正，其步骤如下：

2.根据权利要求1所述的一种高准确率的人脸识别改进算法，其特征在于，所述的步骤二具体为：DCT-LBP联合处理利用像素级LBP编码的二值化处理，获取其局部二值模式中的跳变次数的统计直方图，用以提取人脸信息局部特征；计算公式如公式(1)所示：

其中

其中

S＝a·DCT+b·LBP (3)

3.根据权利要求1所述的一种高准确率的人脸识别改进算法，其特征在于，所述的步骤三中，Softmax回归是一个线性的多分类模型，是Logistic回归模型的延伸；在多分类问题上，可以把真实权重向量转化为一种概率分布，损失函数表达式如公式(4)所示：

式中：

为第i个样本的特征向量与其对应类别权重向量之间的夹角；

在输出层Softmax回归分类中的特征和权重向量间增加类内余弦矫正，使得类内更加紧凑，类间尽可能远离，增强了卷积神经网络模型的泛化能力，减少过拟合现象，提高了识别率；

为了使与测试阶段的余弦相似性衡量一致，把样本相似性的欧式距离转化为余弦距离，权重与特征归一化到相同的值S，使其自动学习，不同类之间的人脸样本特征能够较好的在超球面上分离；其最终联合表达式如公式(6)所示：

式中：λ为归一化后的联合表达式的平衡系数。

4.根据权利要求1所述的一种高准确率的人脸识别改进算法，其特征在于，在具有近5000多人在不同环境下的人脸图像信息的LFW数据库中，用Casia-Web Face数据库作为训练集，LFW数据库作为测试集；利用测试结果的数据对比来验证改进后人脸识别算法的准确率。