CN110110673B - 一种基于双向2dpca和级联前向神经网络的人脸识别方法 - Google Patents
一种基于双向2dpca和级联前向神经网络的人脸识别方法 Download PDFInfo
- Publication number
- CN110110673B CN110110673B CN201910389942.6A CN201910389942A CN110110673B CN 110110673 B CN110110673 B CN 110110673B CN 201910389942 A CN201910389942 A CN 201910389942A CN 110110673 B CN110110673 B CN 110110673B
- Authority
- CN
- China
- Prior art keywords
- neural network
- matrix
- layer
- bidirectional
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 45
- 230000002457 bidirectional effect Effects 0.000 title claims abstract description 21
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000000605 extraction Methods 0.000 claims abstract description 4
- 239000011159 matrix material Substances 0.000 claims description 46
- 239000013598 vector Substances 0.000 claims description 20
- 239000006185 dispersion Substances 0.000 claims description 12
- 210000002569 neuron Anatomy 0.000 claims description 12
- 230000006835 compression Effects 0.000 claims description 10
- 238000007906 compression Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 230000009466 transformation Effects 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 230000001186 cumulative effect Effects 0.000 claims description 4
- 238000005315 distribution function Methods 0.000 claims description 4
- 238000009795 derivation Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 17
- 238000004364 calculation method Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于双向2DPCA与级联前向神经网络的人脸识别方法,本发明大体包括三部分内容:第一部分,对原始图像进行直方图均衡化,提高对比度;第二部分,使用双向2DPCA进行特征提取;第三部分,将提取后的特征输入进级联前向神经网络训练,建立起人脸识别分类器。本发明即能够快速准确提取出特征值,也能利用级联前向神经网络进行识别,并通过样本不断学习提高识别准确率,实现了对人脸的有效识别。
Description
技术领域
本发明涉及一种基于双向2DPCA和级联前向神经网络的人脸识别方法,属于模式识别领域。
背景技术
近年来,人工智能与机器学习的迅速发展使得很多新兴的技术成为了可能。目前,识别技术是人工智能广泛应用的一个领域之一,例如人脸识别和指纹识别等。其中人脸识别在安防、交易支付、信息安全等方面有着重要的应用。目前,人脸识别的方法主要有特征脸、Fisherface和BP神经网络等。
特征脸是利用原有图片转化成一个特征向量集,被称为“特征脸”,利用特征向量集作为工具进行识别。出现需要识别的图片时,将图片投影到特征脸位于的子空间,通过投影后图片的投影点在子空间的位置计算欧式距离进行判别。特征脸方法使用的空间变换方法为PCA,但是PCA在计算过程中需要将图片变换为向量,会产生高维度的向量,增加计算特征向量所耗费的成本。并且,如果面部图片出现角度、光线等变化,而原始图片获得的特征脸并未包含那些信息的话,便无法识别新的图片。
Fisherface进行人脸识别的本质是利用线性判别分析,将高维空间中的数据降维至低维空间。将投影后不同类别数据之间的距离最大,而相同类别的数据越集中作为求取投影矩阵的目标。识别图像的方法是将图像向量与投影矩阵乘积获得投影之后的特征向量,求得的特征向量与已知的特征向量进行欧氏距离的计算来判断图像属于哪一个类别。但是光线对于上两种方法的识别准确率影响是比较严重的。
使用BP神经网络来进行识别的方法最为经典。由于神经网络的特性,输入维数希望能够控制在一个较低的区间内,以便于提高识别效率,降低计算的复杂程度。
这样就产生了降低计算成本的要求,本发明使用的双向2DPCA就是一种PCA的改进方法,能够在不降低识别率的情况下,大幅度降低提取特征所需要的时间。
此外级联前向神经网络由于结构与BP神经网络不同,其网络中的每一层均有神经元直接连接,所以其每一层学习到的特征并不会因为下一层的训练而丢失,能够提高识别的准确率。
发明内容
为了应对上述背景中所提到的计算耗费大量时间、识别率不高以及易受环境影响等不足,本发明基于双向2DPCA和级联前向神经网络提出一种新的人脸识别方法,通过双向2DPCA提取特征并使用级联前向神经网络进行训练和识别。
本发明包括以下步骤:
步骤1获得图像直方图并进行均衡化。
图像A∈Nm×n,N表示非负整数集合,图像的灰度范围是[0,255]。
直方图是一个离散函数:
其中,r代表灰度级别;mn代表图像像素总数;qr代表第r个灰度级别所含有的像素数量;P(r)代表第r个灰度级别所含像素占总像素数的比例。
由于灰度图像是离散的,则直方图均衡化的公式为
s0=PT(0)=P(0)
sk=PT(r)=PT(r-1)+P(r),r=1,2,…,255
步骤2利用双向2DPCA提取特征。
双向2DPCA的主元是一个矩阵:
设总共有M个人脸,每个人脸N张照片,则上标代表第i个人脸,j代表第i个人脸的第j张图片,k与l表示图片中第k行与第l列的像素。双向2DPCA提取特征首先要求出总体散布矩阵F,再求出另一个总体散布矩阵G。
求出F与G的特征值与特征向量,特征值按降序排列成为一个列向量,特征向量按照其对应特征值的大小排列成矩阵。选择出总体散布矩阵F的前t个特征向量组成的矩阵作为列压缩投影矩阵B,而总体散布矩阵G的前u个特征向量组成的矩阵的转置作为行压缩投影矩阵A,经过线性变换Y=AXB得到特征矩阵Y。其中,X是大小m×n的原始矩阵,A是大小为u*m的行压缩投影矩阵,B是大小为n*t(t<n)的列压缩投影矩阵,Y是大小为u*t的特征矩阵。
步骤3将提取的特征输入级联前向神经网络进行训练。
级联前向神经网络不仅相邻两层之间是全连接的,而且该网络的输入层与网络中的每一层都有连接权重,并且每一层都与该层之后的所有层进行连接。
其中,表示第L层的第j个神经元输出;表示第L-1层的第K个神经元指向第L层的第J个神经元的权重;表示第L层的阈值;σ表示激活函数。该神经网络的输入节点42个,与双向2DPCA后提取的主元数量一致;包含两层隐含层:第一层隐层含节点100个,激活函数为tanh函数,第二层隐层含节点80个,激活函数为sigmoid函数;输出节点40个,与所需要分类的人脸数有关。
由以下公式更新权重和误差:
根据权重和误差更新公式训练神经网络,减少网络的代价函数值。
训练完成后,将需要识别的人脸照片输入级联前向神经网络中,得到输出向量,其中向量的第几个值最接近1,说明神经网络判断这张图片的人脸为第几个人的人脸。
本发明的有益效果:本发明较传统的识别方法以及PCA和BP神经网络结合的方法相比,有更高的识别率以及更快的计算速度。
附图说明
图1为本发明流程图。
图2为级联神经网络的结构图。
具体实施方式
以下结合附图对本发明作进一步说明,
本发明大体包括三部分内容。第一部分对原始图像进行直方图均衡化的预处理;第二部分使用双向2DPCA提取预处理后图片的特征值;第三部分使用级联前向神经网络进行训练建立分类器并识别。
如图1所示,本发明包括以下步骤:
步骤1获得图像的直方图并进行均衡化。图像的直方图是由图像的灰度图像得出的一种质量分布图,它的本质是从一幅灰度图像中统计其不同灰度范围的像素个数,并从低灰度到高灰度按顺序排列。图像A∈Nm×n,N表示非负整数集合,图像的灰度级范围是[0,L-1],一般取L=28=256,即图像的灰度范围是[0,255]。
直方图是一个离散函数:
其中,r代表灰度级别;mn是图像像素总数;qr是指第r个灰度级别所含有的像素数量;P(r)表示第r个灰度级别所含像素占总像素数的比例。
假设s的概率密度为P(s),r的概率密度为P(r),r=T-1(s),于是可以得到s的概率密度函数表示为
再假设变换T为
将式 (4)带入s的概率密度函数得
可以发现如果变换T为r的累积分布函数时,s的概率密度函数变为1,即代表s是均匀分布的。
由于灰度图像是离散的,则直方图均衡化的公式为
s0=PT(0)=P(0) (6)
sk=PT(r)=PT(r-1)+P(r),r=1,2,…,255 (7)
步骤2使用双向2DPCA提取特征。双向2DPCA的主元是一个矩阵
设总共有M个人脸,每个人脸N张照片,则上标代表第i个人脸,j代表第i个人脸的第j张图片,k与l表示图片中第k行与第l列的像素。
双向2DPCA在原有2DPCA的基础上,从只有列方向上的压缩扩展到了行和列方向的同时压缩。双向2DPCA提取特征首先要求出总体散布矩阵F,再求出另一个总体散布矩阵G。
求出F与G的特征值与特征向量,特征值按降序排列成为一个列向量,特征向量按照其对应特征值的大小排列成矩阵。选择出总体散布矩阵F的前t个特征向量组成的矩阵作为列压缩投影矩阵B,而总体散布矩阵G的前u个特征向量组成的矩阵的转置作为行压缩投影矩阵A,经过线性变换Y=AXB得到特征矩阵Y。其中,X是大小m×n的原始矩阵,A是大小为u*m(u<m)的行压缩投影矩阵,B是大小为n*t(t<n)的列压缩投影矩阵,Y是大小为u*t的特征矩阵。
步骤3将压缩后的矩阵变换为列向量输入级联前向神经网络进行训练。采用的神经网络为级联前向神经网络,该神经网络是由最基础的前馈神经网络改进而来,由输入、隐含层和输出层组成,见图2。在训练网络的过程中,计算从输入层开始并一层层地传递到输出层,而误差会从网络的最后一层反向传播到上一层。
与前馈神经网络不同的是,级联前向神经网络不仅相邻两层之间是全连接的,而且该网络的输入层与网络中的每一层都有连接权重,并且每一层都与该层之后的所有层进行连接。于是,级联前向神经网络中的每一层都进行了连接,这样在不同层级之间识别的特征可以有效的被其他层利用。理论上网络中隐层的数量越多,能够学习表达更复杂的数据关系。级联前向神经网络在最优化参数的时候同样使用反向传播算法,但是此网络的主要特征是某一层的神经元都与其之前的所有层中的神经元相关。
其中,表示第L层的第j个神经元输出;表示第L-1层的第K个神经元指向第L层的第J个神经元的权重;表示第L层的阈值;σ表示激活函数。该神经网络的输入节点42个,与双向2DPCA后提取的主元数量一致;包含两层隐含层:第一层隐层含节点100个,激活函数为tanh函数,第二层隐层含节点80个,激活函数为sigmoid函数;输出节点40个,与所需要分类的人脸数有关。
由以下公式更新权重和误差:
根据式(14-19)训练神经网络,减少网络的代价函数值。训练完成后,将需要识别的人脸照片输入级联前向神经网络中,得到输出向量,其中向量的第几个值最接近1,说明神经网络判断这张图片的人脸为第几个人的人脸。
Claims (1)
1.一种基于双向2DPCA和级联前向神经网络的人脸识别方法,其特征在于该方法包含以下步骤:
步骤1获得图像直方图并进行均衡化;
图像A∈Nm×n,N表示非负整数集合,图像的灰度范围是[0,255];
直方图是一个离散函数:
其中,r代表灰度级别;mn代表图像像素总数;qr代表第r个灰度级别所含有的像素数量;P(r)代表第r个灰度级别所含像素占总像素数的比例;
假设s的概率密度为P(s),r的概率密度为P(r),r=T-1(s),于是得到s的概率密度函数:
再假设变换T为
将上式带入s的概率密度函数得
发现如果变换T为r的累积分布函数时,s的概率密度函数变为1,即代表s是均匀分布的;
由于灰度图像是离散的,则直方图均衡化的公式为
s0=PT(0)=P(0)
sk=PT(r)=PT(r-1)+P(r),r=1,2,…,255
步骤2利用双向2DPCA提取特征;
双向2DPCA的主元是一个矩阵:
设总共有M个人脸,每个人脸N张照片,则上标代表第i个人脸,j代表第i个人脸的第j张图片,k与l表示图片中第k行与第l列的像素;双向2DPCA提取特征首先要求出总体散布矩阵F,再求出另一个总体散布矩阵G;
求出F与G的特征值与特征向量,特征值按降序排列成为一个列向量,特征向量按照其对应特征值的大小排列成矩阵;选择出总体散布矩阵F的前t个特征向量组成的矩阵作为列压缩投影矩阵B,而总体散布矩阵G的前u个特征向量组成的矩阵的转置作为行压缩投影矩阵A,经过线性变换Y=AXB得到特征矩阵Y;其中,X是大小m×n的原始矩阵,A是大小为u*m的行压缩投影矩阵,B是大小为n*t(t<n)的列压缩投影矩阵,Y是大小为u*t的特征矩阵;
步骤3将提取的特征输入级联前向神经网络进行训练;
级联前向神经网络不仅相邻两层之间是全连接的,而且该网络的输入层与网络中的每一层都有连接权重,并且每一层都与该层之后的所有层进行连接;
其中,表示第L层的第j个神经元输出;表示第L-1层的第K个神经元指向第L层的第J个神经元的权重;表示第L层的阈值;σ表示激活函数;该神经网络的输入节点42个,与双向2DPCA后提取的主元数量一致;包含两层隐含层:第一层隐层含节点100个,激活函数为tanh函数,第二层隐层含节点80个,激活函数为sigmoid函数;输出节点40个,与所需要分类的人脸数有关;
由以下公式更新权重和误差:
根据权重和误差更新公式训练神经网络,减少网络的代价函数值;
训练完成后,将需要识别的人脸照片输入级联前向神经网络中,得到输出向量,其中向量的第几个值最接近1,说明神经网络判断这张图片的人脸为第几个人的人脸。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910389942.6A CN110110673B (zh) | 2019-05-10 | 2019-05-10 | 一种基于双向2dpca和级联前向神经网络的人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910389942.6A CN110110673B (zh) | 2019-05-10 | 2019-05-10 | 一种基于双向2dpca和级联前向神经网络的人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110110673A CN110110673A (zh) | 2019-08-09 |
CN110110673B true CN110110673B (zh) | 2020-11-27 |
Family
ID=67489439
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910389942.6A Active CN110110673B (zh) | 2019-05-10 | 2019-05-10 | 一种基于双向2dpca和级联前向神经网络的人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110110673B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112257672A (zh) * | 2020-11-17 | 2021-01-22 | 中国科学院深圳先进技术研究院 | 一种人脸识别方法、***、终端以及存储介质 |
CN112597890A (zh) * | 2020-12-21 | 2021-04-02 | 杭州电子科技大学 | 基于多维泰勒网的人脸识别方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100395770C (zh) * | 2005-06-27 | 2008-06-18 | 北京交通大学 | 一种基于特征关系度量的手部特征融合认证方法 |
CN102547123B (zh) * | 2012-01-05 | 2014-02-26 | 天津师范大学 | 基于人脸识别技术的自适应视线跟踪***及其跟踪方法 |
CN103218617B (zh) * | 2013-05-13 | 2015-12-23 | 山东大学 | 一种多线性大间距的特征提取方法 |
CN103778320A (zh) * | 2013-12-30 | 2014-05-07 | 杭州电子科技大学 | 一种基于变分贝叶斯多传感器量化融合目标跟踪方法 |
CN103824055B (zh) * | 2014-02-17 | 2018-03-02 | 北京旷视科技有限公司 | 一种基于级联神经网络的人脸识别方法 |
CN107292225B (zh) * | 2016-08-18 | 2020-11-20 | 北京师范大学珠海分校 | 一种人脸识别方法 |
CN107590604B (zh) * | 2017-09-13 | 2020-09-04 | 国网福建省电力有限公司 | 一种结合s变换和2dpca的同调机组分群方法及*** |
CN108108676A (zh) * | 2017-12-12 | 2018-06-01 | 北京小米移动软件有限公司 | 人脸识别方法、卷积神经网络生成方法及装置 |
CN108564061B (zh) * | 2018-04-28 | 2021-09-17 | 河南工业大学 | 一种基于二维主元分析的图像识别方法和*** |
CN109242028A (zh) * | 2018-09-19 | 2019-01-18 | 西安电子科技大学 | 基于2d-pca和卷积神经网络的sar图像分类方法 |
CN109614866A (zh) * | 2018-11-08 | 2019-04-12 | 中科天网(广东)科技有限公司 | 基于级联深度卷积神经网络的人脸检测方法 |
CN109711384A (zh) * | 2019-01-09 | 2019-05-03 | 江苏星云网格信息技术有限公司 | 一种基于深度卷积神经网络的人脸识别方法 |
-
2019
- 2019-05-10 CN CN201910389942.6A patent/CN110110673B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110110673A (zh) | 2019-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106599797B (zh) | 一种基于局部并行神经网络的红外人脸识别方法 | |
CN108537743B (zh) | 一种基于生成对抗网络的面部图像增强方法 | |
CN105469034B (zh) | 基于加权式鉴别性稀疏约束非负矩阵分解的人脸识别方法 | |
He et al. | l 2, 1 regularized correntropy for robust feature selection | |
Agarwal et al. | Face recognition using eigen faces and artificial neural network | |
Yu et al. | Deep learning with kernel regularization for visual recognition | |
CN110378208B (zh) | 一种基于深度残差网络的行为识别方法 | |
CN107292225B (zh) | 一种人脸识别方法 | |
CN111541632B (zh) | 一种基于主成分分析和残差网络的物理层认证方法 | |
CN101872424A (zh) | 基于Gabor变换最优通道模糊融合的人脸表情识别方法 | |
CN109376787B (zh) | 流形学习网络及基于其的计算机视觉图像集分类方法 | |
CN101021897A (zh) | 一种基于块内相关性的二维线性鉴别分析人脸识别方法 | |
CN116343330A (zh) | 一种红外-可见光图像融合的异常行为识别方法 | |
US20220391611A1 (en) | Non-linear latent to latent model for multi-attribute face editing | |
CN110110673B (zh) | 一种基于双向2dpca和级联前向神经网络的人脸识别方法 | |
KR100729273B1 (ko) | Pca와 역전파 알고리즘을 이용한 얼굴인식 방법 | |
CN104715266B (zh) | 基于src‑dp与lda相结合的图像特征提取方法 | |
Dhanaseely et al. | Performance comparison of cascade and feed forward neural network for face recognition system | |
Sogi et al. | A method based on convex cone model for image-set classification with CNN features | |
Hu et al. | LDF-Net: Learning a displacement field network for face recognition across pose | |
KR20160037423A (ko) | 동적보상퍼지신경네트워크(dcfnn)를 기반으로 한 얼굴인식 알고리즘 | |
CN114780767A (zh) | 一种基于深度卷积神经网络的大规模图像检索方法及*** | |
CN113536939B (zh) | 一种基于3d卷积神经网络的视频去重方法 | |
CN113706404A (zh) | 一种基于自注意力机制的俯角人脸图像校正方法及*** | |
CN110287973B (zh) | 一种基于低秩鲁棒线性鉴别分析的图像特征提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |