CN112364809A - 一种高准确率的人脸识别改进算法 - Google Patents

一种高准确率的人脸识别改进算法 Download PDF

Info

Publication number
CN112364809A
CN112364809A CN202011332325.1A CN202011332325A CN112364809A CN 112364809 A CN112364809 A CN 112364809A CN 202011332325 A CN202011332325 A CN 202011332325A CN 112364809 A CN112364809 A CN 112364809A
Authority
CN
China
Prior art keywords
lbp
dct
formula
face
face recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011332325.1A
Other languages
English (en)
Inventor
宋强
张颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology Liaoning USTL
Original Assignee
University of Science and Technology Liaoning USTL
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology Liaoning USTL filed Critical University of Science and Technology Liaoning USTL
Priority to CN202011332325.1A priority Critical patent/CN112364809A/zh
Publication of CN112364809A publication Critical patent/CN112364809A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种高准确率的人脸识别改进算法,采用的技术方案是基于卷积神经网络的人脸识别改进算法,步骤如下:步骤一:选用双对称LeNet并行连接的网络结构;步骤二:采用DCT‑LBP联合处理的方法对输入图像的全局特征和局部特征分别进行提取;步骤三:在输出层Softmax回归分类中加余弦矫正用以增强泛化能力。本发明是一种基于卷积神经网络的人脸识别改进算法,能有效的提高人脸识别准确率,可以高精准的获得人脸图像的全部信息。

Description

一种高准确率的人脸识别改进算法
技术领域
本发明涉及人脸识别算法技术领域,特别涉及一种高准确率的人脸识别改进算法。
背景技术
在目前的相关技术中,人脸识别方法主要以基于深度学习为主,速率及准确率虽相对其他人脸识别技术较好,但仍需进一步完善,而本发明采用双对称LeNet网络并行连接的网络结构,对输入图像(特征提取)DCT-LBP化以及输出分类余弦矫正等联合处理算法是人脸识别准确率最高的方法之一。
双对称LeNet网络是以经典的卷积神经网络LeNet为基础,采用完全对称的方式并行同步模型,实现双对称LeNet并行连接的网络结构。分别进行图像处理,各自独立获取高层特征向量,在输出层进行合并分类过程,取得提升准确率的效果。
DCT-LBP联合处理过程是指DCT利用傅里叶变换,在频域中获取低频信息,保留整体特征。LBP特征提取通过分析像素点之间的关系,来描述图像纹理特征,在局部特征提取方面取得较好效果。
Softmax回归分类是一个线性的多分类模型,是Logistic回归模型的延伸。在多分类问题上,可以把真实权重向量转化为一种概率分布,从而实现特征信息分类过程。
发明内容
为克服人脸识别准确率低的技术问题,本发明提供了一种高准确率的人脸识别改进算法,在不影响训练效率的情况下,提高识别精度。
为了达到上述目的,本发明采用以下技术方案实现:
本发明采用的技术方案是在经典的卷积神经网络的基础下,采用双对称LeNet并行连接的网络结构,利用DCT-LBP联合处理法特征提取,并在输出层回归分类余弦矫正。
一种高准确率的人脸识别改进算法,其步骤如下:
步骤一:选用双对称LeNet并行连接的网络结构:以经典卷积神经网络模型LeNet为基础,采用双对称LeNet并行连接网络结构,同步模型采取两路并行网络,分别进行图像处理,独立获取高层特征向量,在输出层进行合并;
步骤二:采用DCT-LBP联合处理的方法对输入图像的全局特征和局部特征分别进行提取:LBP化处理是局部二值模式,对人脸图像进行像素级的LBP编码,再根据编码求其统计直方图,来作为具有空间不变性的人脸的局部特征;DCT化处理是人脸图像信息经过DCT离散余弦变换后,所获得的低频系数,来作为人脸的局部特征;
步骤三:当图像信息到达输出层时,采用Softmax回归分类对人脸图像信息与数据库中信息进行比对分类,得出正确完整的人物信息;在回归分类中增加余弦矫正,减少冗余,增强泛化能力减少过拟合。
进一步地,所述的步骤二具体为:DCT-LBP联合处理利用像素级LBP编码的二值化处理,获取其局部二值模式中的跳变次数的统计直方图,用以提取人脸信息局部特征;计算公式如公式(1)所示:
Figure BDA0002796180760000021
其中
Figure BDA0002796180760000022
式中:ac为中心像素灰度值,ai为周围邻域点像素灰度值,S为阈值函数,fLBP(mc,nc)为中心像素的LBP值;
DCT离散变换获得低频系数作为人脸信息的全局特征;其计算公式如公式(2)所示:
Figure BDA0002796180760000023
其中
Figure BDA0002796180760000024
式中:F(u,v)为DCT系数,u,v代表DCT变换后矩阵内某个数值的坐标位置,f(x,y)代表图像数据矩阵内的数个数值;
将LBP与DCT进行加权融合联合处理,其计算公式如公式(3)所示:
S=a·DCT+b·LBP (3)
式中:a为DCT的加权系数,b为LBP的加权系数,且a+b=1;S为加权后的图像。
进一步地,所述的步骤三中,Softmax回归是一个线性的多分类模型,是Logistic回归模型的延伸;在多分类问题上,可以把真实权重向量转化为一种概率分布,损失函数表达式如公式(4)所示:
Figure BDA0002796180760000031
式中:M为样本数量,N为类别数量;xi为第i个样本的特征向量,yi为类别标记;W和b分别作为全连接层的权重矩阵和偏置向量,Wj为权重矩阵的第j列,bj为对应的偏置项;
Softmax回归分类中增加余弦矫正,消除损失函数带来较大类内变化,使其更加紧密,特征更具有判别性,该类内余弦相似性损失函数如公式(5)所示:
Figure BDA0002796180760000032
式中:
Figure BDA0002796180760000033
为第i个样本的特征向量与其对应类别权重向量之间的夹角;
为了便于前向传播和反向传播,将类内余弦相似性损失函数转化如公式(6)所示:
Figure BDA0002796180760000034
式中::
Figure BDA0002796180760000035
为实际的损失层输入,且该函数可以有效地描述类内变化;
为了使学习到的特征具有判别性,在Softmax损失与类内余弦相似性损失共同监督下训练,得到的表达式公式(7)所示:
Figure BDA0002796180760000036
式中:λ为一个标量,用来平衡两个损失函数;
在输出层Softmax回归分类中的特征和权重向量间增加类内余弦矫正,使得类内更加紧凑,类间尽可能远离,增强了卷积神经网络模型的泛化能力,减少过拟合现象,提高了识别率。
在训练过程中,为了使与测试阶段的余弦相似性衡量一致,把样本相似性的欧式距离转化为余弦距离,权重与特征归一化到相同的值S,使其自动学习,不同类之间的人脸样本特征能够较好的在超球面上分离;其最终联合表达式如公式(8)所示:
Figure BDA0002796180760000037
式中:λ为归一化后的联合表达式的平衡系数;
在具有近5000多人在不同环境下的人脸图像信息的LFW数据库中,用Casia-WebFace数据库作为训练集,LFW数据库作为测试集;利用测试结果的数据对比来验证改进后人脸识别算法的准确率。
以双对称LeNet网络结构为基础,对输入的人脸图像进行DCT-LBP联合处理,分别提取全局特征和局部特征,并在输出层Softmax回归分类中加以余弦矫正,确认所识别信息的准确性,并利用识别结果验证该算法的有效性。
与现有技术相比,本发明的有益效果是:
1、本发明采用双对称LeNet并行连接的网络结构,利用DCT-LBP联合处理法对人脸信息图像特征提取,并在输出层Softmax回归余弦矫正对全局特征和局部特征进行分类匹配,极大的提升了人脸识别的准确率。本发明提出的一种高准确率的人脸识别改进算法的优势在于结构优化可分别独立获取高层特征向量,用以完善特征信息;同时结合频域与空间域的信息,对整体特征提取和局部特征提取进行充分考虑,结合互补,达到最优特征提取状态;且在分类中通过余弦矫正后的回归分类增强了泛化能力,减少过拟合现象,使其准确率最佳;
2、由于LBP特征描述的纹理细节信息都表现出高频特性,而DCT离散变换后的低频系数,二者具有互补性,结合起来更好的进行人脸特征描述,有利于提高人脸检测识别***的性能。其联合处理用以消除图像的杂质,减化数据量,恢复真实的图像信息,增强卷积网络的训练效果。本发明利用DCT-LBP联合处理的方法分别对全局特征和局部特征进行图像信息提取,独立获取高层特征向量。弥补了DCT过程中的高频信息丢失问题以及LBP特征提取的局限性。因此DCT-LBP联合处理在特征提取过程中取得很好的效果;
3、在输出层Softmax回归分类中的特征和权重向量间增加类内余弦矫正,可以使得类内更加紧凑,类间尽可能远离,增强了卷积神经网络模型的泛化能力,减少过拟合现象,提高了识别率。
附图说明
图1是本发明的改进算法的网络结构总体概览;
图2是本发明的网络训练过程概览。
具体实施方式
以下结合附图对本发明提供的具体实施方式进行详细说明。
本发明综合考虑网络结构的优化、图像信息提取的完善及分类输出的改进,采用双对称LeNet并行连接的网络结构、DCT-LBP联合处理的图像特征提取方法及余弦矫正后分类识别法,弥补了单一特征和分类过拟合的不足之处,增强了泛化能力,使人脸识别准确率更高。
本发明提出一种高准确率的人脸识别改进算法,包含以下步骤:
步骤一:选用双对称LeNet并行连接的网络结构:以经典卷积神经网络模型LeNet为基础,采用双对称LeNet并行连接网络结构,同步模型采取两路并行网络,分别进行图像处理,可以独立获取高层特征向量,在输出层进行合并。
步骤二:采用DCT-LBP联合处理的方法对输入图像的全局特征和局部特征分别进行提取:所谓LBP化处理,指的是局部二值模式,对人脸图像进行像素级的LBP编码,再根据编码求其统计直方图,来作为具有空间不变性的人脸的局部特征。DCT化处理,指的是人脸图像信息经过DCT离散余弦变换后,所获得的低频系数,来作为人脸的局部特征。由于LBP特征描述的纹理细节信息都表现出高频特性,而DCT离散变换后的低频系数,二者具有互补性,结合起来更好的进行人脸特征描述,有利于提高人脸检测识别***的性能。其联合处理用以消除图像的杂质,减化数据量,恢复真实的图像信息,增强卷积网络的训练效果。本发明利用DCT-LBP联合处理的方法分别对全局特征和局部特征进行图像信息提取,独立获取高层特征向量。弥补了DCT过程中的高频信息丢失问题以及LBP特征提取的局限性。因此DCT-LBP联合处理在特征提取过程中取得很好的效果。
DCT-LBP化联合处理,具体是利用像素级LBP编码的二值化处理,获取其局部二值模式中的跳变次数的统计直方图,用以提取人脸信息局部特征。计算公式如公式(1)所示:
Figure BDA0002796180760000051
其中
Figure BDA0002796180760000052
式中:ac为中心像素灰度值,ai为周围邻域点像素灰度值,S为阈值函数,fLBP(mc,nc)为中心像素的LBP值。
DCT离散变换获得低频系数作为人脸信息的全局特征。其计算公式如公式(2)所示:
Figure BDA0002796180760000054
其中
Figure BDA0002796180760000055
式中:F(u,v)为DCT系数,u,v代表DCT变换后矩阵内某个数值的坐标位置,f(x,y)代表图像数据矩阵内的数个数值;
将LBP与DCT进行加权融合联合处理,其提取计算公式如公式(3)所示:
S=a·DCT+b·LBP (3)
式中:a为DCT的加权系数,b为LBP的加权系数,且a+b=1;S为加权后的图像。
步骤三:当图像信息经过一系列处理后到达输出层,采用Softmax回归分类对人脸图像信息与数据库中信息进行比对分类,得出正确完整的人物信息。在回归分类中增加余弦矫正可以减少冗余,增强泛化能力减少过拟合。
Softmax回归是一个线性的多分类模型,是Logistic回归模型的延伸。在多分类问题上,可以把真实权重向量转化为一种概率分布,损失函数表达式如公式(4)所示:
Figure BDA0002796180760000061
式中:M为样本数量,N为类别数量;xi为第i个样本的特征向量,yi为类别标记;W和b分别作为全连接层的权重矩阵和偏置向量,Wj为权重矩阵的第j列,bj为对应的偏置项。
Softmax回归分类中增加余弦矫正,消除损失函数带来较大类内变化,使其更加紧密,特征更具有判别性,该类内余弦相似性损失函数如公式(5)所示:
Figure BDA0002796180760000062
式中:
Figure BDA0002796180760000063
为第i个样本的特征向量与其对应类别权重向量之间的夹角。
为了便于前向传播和反向传播,将类内余弦相似性损失函数转化如公式(6)所示:
Figure BDA0002796180760000064
式中::
Figure BDA0002796180760000065
为实际的损失层输入,且该函数可以有效地描述类内变化。
为了使学习到的特征具有判别性,在Softmax损失与类内余弦相似性损失共同监督下训练,得到的表达式公式(7)所示:
Figure BDA0002796180760000066
式中:λ为一个标量,用来平衡两个损失函数。
在输出层Softmax回归分类中的特征和权重向量间增加类内余弦矫正,可以使得类内更加紧凑,类间尽可能远离,增强了卷积神经网络模型的泛化能力,减少过拟合现象,提高了识别率。在训练过程中,为了使与测试阶段的余弦相似性衡量一致,把样本相似性的欧式距离转化为余弦距离,权重与特征归一化到相同的值S,使其自动学习,不同类之间的人脸样本特征能够较好的在超球面上分离。其最终联合表达式如公式(8)所示:
Figure BDA0002796180760000071
式中:λ为归一化后的联合表达式的平衡系数。
在具有近5000多人在不同环境下的人脸图像信息的LFW数据库中,用Casia-WebFace数据库作为训练集,LFW数据库作为测试集。利用测试结果的数据对比来验证改进后人脸识别算法的准确率。
通过在LFW人脸数据库实验对比数据分析可知,DCT-LBP化过程联合处理时当a=0.875,b=0.125时,即全局特征与局部特征提取比例近似为7:1,在余弦矫正后的双对称LeNet并行连接的网络结构上识别效果最好。识别的准确率由97.20%升至为99.05%。这说明一种高准确率的人脸识别改进算法取得很好的效果。
一种高准确率的人脸识别改进算法的优势在于网络结构的优化、特征提取中的频域与空间域的结合改进,以及回归分类中的余弦矫正优化。考虑整体特征提取与局部特征提取之间的互补结合性和分类识别的泛化能力,使其互相补充,达到识别准确率最优效果。
下面结合附图和具体实施进一步详细说明本发明。
首先采用双对称LeNet网络并行连接的结构,利用DCT-LBP联合处理的方法分别对人脸图像信息的局部特征和全局特征进行提取,最后经过卷积和降采样等网络训练在全连接层进行特征信息的合并在输出层回归分类中引入类内余弦矫正,具有很好的训练效果。
本发明提供一种高准确率的人脸识别改进算法,如图1所示,为本发明的改进算法的网络结构总体概览,如图2所示,为本发明的改进算法的网络训练过程概览。包括:
步骤1、使用双对称LeNet网络并行连接的结构,同步模型采取两路并行网络,分别进行图像处理,可以独立获取高层特征向量,在输出层进行合并。
步骤2、使用DCT-LBP联合处理的方法分别对人脸图像特征信息提取。LBP化处理,实际就是局部二值模式,对人脸图像信息进行像素LBP编码,求取其编码的统计直方图,作为具有空间不变性的人脸的局部特征。而DCT化处理,指的是人脸图像信息经过DCT离散余弦变换后,获取的低频系数作为人脸的全局特征。DCT-LBP联合处理将二者特征提取优势结合互补,在人脸识别中的图像信息提取中具有较好的性能。
LBP二值化处理获取局部特征信息的计算公式如公式(1)所示:
Figure BDA0002796180760000072
其中
Figure BDA0002796180760000073
DCT离散变换获得低频系数作为人脸信息的全局特征。其计算公式如公式(2)所示:
Figure BDA0002796180760000081
其中
Figure BDA0002796180760000082
将LBP与DCT进行加权融合联合处理,其提取计算公式如公式(3)所示:
S=a·DCT+b·LBP (3)
步骤3、图像信息经过一系列处理后到达输出层,采用Softmax回归分类对人脸图像信息与数据库中信息进行比对分类,得出正确完整的人物信息。Softmax回归是一个线性的多分类模型,是Logistic回归模型的延伸。在多分类问题上,可以把真实权重向量转化为一种概率分布,损失函数表达式如公式(4)所示:
Figure BDA0002796180760000083
在回归分类中增加类内余弦矫正,消除损失函数带来较大类内变化,使其更加紧密,特征更具有判别性,该类内余弦相似性损失函数如公式(5)所示:
Figure BDA0002796180760000084
在训练过程中,为了使与测试阶段的余弦相似性衡量一致,把样本相似性的欧式距离转化为余弦距离,权重与特征归一化到相同的值S,使其自动学习,不同类之间的人脸样本特征能够较好的在超球面上分离。使网络训练具有减少冗余,增强泛化能力减少过拟合现象的能力。其最终联合表达式如公式(6)所示:
Figure BDA0002796180760000085
步骤4、将双对称网络LeNet与DCT-LBP联合处理人脸图像特征提取以及余弦矫正后的Softmax回归分类输出结合,使人脸识别在改进后的算法中具有非常高的准确率。
本发明所述的是一种高准确率的人脸识别改进算法,为人脸图像信息识别提供了一种新的、更加完善的高准确率的算法。并且通过具体的实验数据说明了改进算法的优越性和有效性,很大程度上弥补了基于深度学习的人脸识别网络训练的准确率低的问题,使利用改进后算法的人脸识别运算结果更加准确,在人脸识别和人工智能等图像处理领域具有重大意义。
以上实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于上述的实施例。上述实施例中所用方法如无特别说明均为常规方法。

Claims (4)

1.一种高准确率的人脸识别改进算法,其特征在于,采用双对称LeNet并行连接的网络结构,利用DCT-LBP联合处理法特征提取,并在输出层回归分类余弦矫正,其步骤如下:
步骤一:选用双对称LeNet并行连接的网络结构:以经典卷积神经网络模型LeNet为基础,采用双对称LeNet并行连接网络结构,同步模型采取两路并行网络,分别进行图像处理,独立获取高层特征向量,在输出层进行合并;
步骤二:采用DCT-LBP联合处理的方法对输入图像的全局特征和局部特征分别进行提取:LBP化处理是局部二值模式,对人脸图像进行像素级的LBP编码,再根据编码求其统计直方图,来作为具有空间不变性的人脸的局部特征;DCT化处理是人脸图像信息经过DCT离散余弦变换后,所获得的低频系数,来作为人脸的局部特征;
步骤三:当图像信息到达输出层时,采用Softmax回归分类对人脸图像信息与数据库中信息进行比对分类,得出正确完整的人物信息;在回归分类中增加余弦矫正,减少冗余,增强泛化能力减少过拟合。
2.根据权利要求1所述的一种高准确率的人脸识别改进算法,其特征在于,所述的步骤二具体为:DCT-LBP联合处理利用像素级LBP编码的二值化处理,获取其局部二值模式中的跳变次数的统计直方图,用以提取人脸信息局部特征;计算公式如公式(1)所示:
Figure FDA0002796180750000011
其中
Figure FDA0002796180750000012
式中:ac为中心像素灰度值,ai为周围邻域点像素灰度值,S为阈值函数,fLBP(mc,nc)为中心像素的LBP值;
DCT离散变换获得低频系数作为人脸信息的全局特征;其计算公式如公式(2)所示:
Figure FDA0002796180750000013
其中
Figure FDA0002796180750000014
式中:F(u,v)为DCT系数,u,v代表DCT变换后矩阵内某个数值的坐标位置,f(x,y)代表图像数据矩阵内的数个数值;
将LBP与DCT进行加权融合联合处理,其计算公式如公式(3)所示:
S=a·DCT+b·LBP (3)
式中:a为DCT的加权系数,b为LBP的加权系数,且a+b=1;S为加权后的图像。
3.根据权利要求1所述的一种高准确率的人脸识别改进算法,其特征在于,所述的步骤三中,Softmax回归是一个线性的多分类模型,是Logistic回归模型的延伸;在多分类问题上,可以把真实权重向量转化为一种概率分布,损失函数表达式如公式(4)所示:
Figure FDA0002796180750000021
式中:M为样本数量,N为类别数量;xi为第i个样本的特征向量,yi为类别标记;W和b分别作为全连接层的权重矩阵和偏置向量,Wj为权重矩阵的第j列,bj为对应的偏置项;
Softmax回归分类中增加余弦矫正,消除损失函数带来较大类内变化,使其更加紧密,特征更具有判别性,该类内余弦相似性损失函数如公式(5)所示:
Figure FDA0002796180750000022
式中:
Figure FDA0002796180750000023
为第i个样本的特征向量与其对应类别权重向量之间的夹角;
在输出层Softmax回归分类中的特征和权重向量间增加类内余弦矫正,使得类内更加紧凑,类间尽可能远离,增强了卷积神经网络模型的泛化能力,减少过拟合现象,提高了识别率;
为了使与测试阶段的余弦相似性衡量一致,把样本相似性的欧式距离转化为余弦距离,权重与特征归一化到相同的值S,使其自动学习,不同类之间的人脸样本特征能够较好的在超球面上分离;其最终联合表达式如公式(6)所示:
Figure FDA0002796180750000024
式中:λ为归一化后的联合表达式的平衡系数。
4.根据权利要求1所述的一种高准确率的人脸识别改进算法,其特征在于,在具有近5000多人在不同环境下的人脸图像信息的LFW数据库中,用Casia-Web Face数据库作为训练集,LFW数据库作为测试集;利用测试结果的数据对比来验证改进后人脸识别算法的准确率。
CN202011332325.1A 2020-11-24 2020-11-24 一种高准确率的人脸识别改进算法 Pending CN112364809A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011332325.1A CN112364809A (zh) 2020-11-24 2020-11-24 一种高准确率的人脸识别改进算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011332325.1A CN112364809A (zh) 2020-11-24 2020-11-24 一种高准确率的人脸识别改进算法

Publications (1)

Publication Number Publication Date
CN112364809A true CN112364809A (zh) 2021-02-12

Family

ID=74532855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011332325.1A Pending CN112364809A (zh) 2020-11-24 2020-11-24 一种高准确率的人脸识别改进算法

Country Status (1)

Country Link
CN (1) CN112364809A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113569818A (zh) * 2021-09-23 2021-10-29 湖南星汉数智科技有限公司 人脸特征编码方法、装置、计算机设备和存储介质
CN113837976A (zh) * 2021-09-17 2021-12-24 重庆邮电大学 基于联合多域的多聚焦图像融合方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165566A (zh) * 2018-08-01 2019-01-08 中国计量大学 一种基于新型损失函数的人脸识别卷积神经网络训练方法
CN110598584A (zh) * 2019-08-26 2019-12-20 天津大学 一种基于小波变换和dct的卷积神经网络人脸识别算法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165566A (zh) * 2018-08-01 2019-01-08 中国计量大学 一种基于新型损失函数的人脸识别卷积神经网络训练方法
CN110598584A (zh) * 2019-08-26 2019-12-20 天津大学 一种基于小波变换和dct的卷积神经网络人脸识别算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋强等: "基于卷积神经网络的人脸识别算法", 《辽宁科技大学学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837976A (zh) * 2021-09-17 2021-12-24 重庆邮电大学 基于联合多域的多聚焦图像融合方法
CN113837976B (zh) * 2021-09-17 2024-03-19 重庆邮电大学 基于联合多域的多聚焦图像融合方法
CN113569818A (zh) * 2021-09-23 2021-10-29 湖南星汉数智科技有限公司 人脸特征编码方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN113378632B (zh) 一种基于伪标签优化的无监督域适应行人重识别方法
CN107122809B (zh) 基于图像自编码的神经网络特征学习方法
Feng et al. Convolutional neural network based on bandwise-independent convolution and hard thresholding for hyperspectral band selection
Stuhlsatz et al. Feature extraction with deep neural networks by a generalized discriminant analysis
CN111414862B (zh) 基于神经网络融合关键点角度变化的表情识别方法
CN111695456B (zh) 一种基于主动判别性跨域对齐的低分辨人脸识别方法
CN111709311A (zh) 一种基于多尺度卷积特征融合的行人重识别方法
CN112528928B (zh) 一种基于自注意力深度网络的商品识别方法
CN109815357B (zh) 一种基于非线性降维及稀疏表示的遥感图像检索方法
Sheng et al. Learning-based road crack detection using gradient boost decision tree
CN112836671B (zh) 一种基于最大化比率和线性判别分析的数据降维方法
CN112800876A (zh) 一种用于重识别的超球面特征嵌入方法及***
CN110188827A (zh) 一种基于卷积神经网络和递归自动编码器模型的场景识别方法
CN111079514A (zh) 一种基于clbp和卷积神经网络的人脸识别方法
CN111695455B (zh) 一种基于耦合判别流形对齐的低分辨人脸识别方法
CN112364809A (zh) 一种高准确率的人脸识别改进算法
Zhang et al. SAR target recognition using only simulated data for training by hierarchically combining CNN and image similarity
Zhang et al. Fusion of multifeature low-rank representation for synthetic aperture radar target configuration recognition
Liu et al. Mmran: A novel model for finger vein recognition based on a residual attention mechanism: Mmran: A novel finger vein recognition model
CN111259938B (zh) 基于流形学习和梯度提升模型的图片偏多标签分类方法
CN116109898A (zh) 基于双向对抗训练与关系度量约束的广义零样本学习方法
CN113222072A (zh) 基于K-means聚类和GAN的肺部X光图像分类方法
Tseng et al. An interpretable compression and classification system: Theory and applications
CN114972904A (zh) 一种基于对抗三元组损失的零样本知识蒸馏方法及***
CN112560949B (zh) 基于多级统计学特征提取的高光谱分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210212

RJ01 Rejection of invention patent application after publication