CN107451537B - 基于深度学习多层非负矩阵分解的人脸识别方法 - Google Patents

基于深度学习多层非负矩阵分解的人脸识别方法 Download PDF

Info

Publication number
CN107451537B
CN107451537B CN201710568578.0A CN201710568578A CN107451537B CN 107451537 B CN107451537 B CN 107451537B CN 201710568578 A CN201710568578 A CN 201710568578A CN 107451537 B CN107451537 B CN 107451537B
Authority
CN
China
Prior art keywords
matrix
layer
projection
test sample
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710568578.0A
Other languages
English (en)
Other versions
CN107451537A (zh
Inventor
同鸣
李明阳
陈逸然
席圣男
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201710568578.0A priority Critical patent/CN107451537B/zh
Publication of CN107451537A publication Critical patent/CN107451537A/zh
Application granted granted Critical
Publication of CN107451537B publication Critical patent/CN107451537B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • Biomedical Technology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于深度学习多层非负矩阵分解的人脸识别方法,主要解决现有人脸识别技术在复杂外观变化下识别率低的问题。其技术方案是:1.利用VGG‑Face提取训练样本和测试样本各个通道数据的特征数据;2.对训练样本各个通道数据的特征数据分别重复L次归一化、非线性变换和矩阵分解的特征提取过程,得到低秩鲁棒特征;3.构建K个最近邻分类器;4.将测试样本的各个通道数据的特征数据分别进行投影,得到投影系数向量;5.将投影系数向量输入到K个最近邻分类器进行分类;6.综合K个最近邻分类器的分类结果,得到测试样本的识别结果。本发明提高了复杂外观变化下的人脸识别率,可应用于身份鉴定和信息安全领域。

Description

基于深度学习多层非负矩阵分解的人脸识别方法
技术领域
本发明属于图像处理技术领域,特别涉及人脸图像识别方法,可应用于身份鉴定和信息安全领域。
背景技术
随着人类社会的不断发展,人脸识别在安保、金融、电子政务等多个领域具有广泛应用,提高人脸识别性能有利于扩大人脸识别的应用。当前关于人脸识别的主要研究在于提取有效、鲁棒并且更具鉴别性的特征和设计具有更好分类能力的分类器。选择更加鲁棒、更有鉴别力的特征以及设计具有良好分类能力的分类器是提高人脸识别鲁棒性的关键。
非负矩阵分解是一种在非负约束下进行矩阵分解的特征提取方法,具有良好的数据表示能力,可大幅度降低数据特征的维数,而且其分解特性合乎人类视觉感知的直观体验,分解结果具有可解释和明确的物理意义。基本非负矩阵分解NMF直接将原始系数矩阵分解为基矩阵和系数矩阵,并要求基矩阵以及系数矩阵都是非负的,这表明非负矩阵分解NMF只存在加性组合。因此,非负矩阵分解NMF可以看作是一个基于部分表示的模型,能够提供观测数据的局部结构,但有些情况下,NMF算法也会给出全局特征,导致分类性能受限。
深度学习是机器学习领域中特征表示的一个新的研究方向,近年来在语音识别、计算机视觉等多类应用中取得突破性的进展,深度学习通过组合底层特征形成更加抽象的高层表示或特征。深度学习模型中,具有更多的非线性变换层,具有更强的泛化能力。但在实际应用中,头部姿势、照明、遮挡等因素产生的外观变化会导致深度学习的性能下降,到目前为止没有良好的解决办法。
发明内容
鉴于以上所述的现有技术缺点,本发明的目的在于提供一种基于深度学习多层非负矩阵分解的人脸识别方法,以获取深层次更具判别性的低秩鲁棒特征,提高复杂外观变化下的人脸识别率。
实现本发明的技术关键是在深度学习的基础上,引入了一种新的多层非负矩阵分解,以对现有的深度学习方法进行改进。具体来说,本发明是通过对深度学习得到的样本特征进行多次非负矩阵分解,以此得到更具鉴别力的低秩特征表示,从而提高人脸识别率,其步骤包括如下:
(1)将训练样本的每个通道数据输入到VGG-Face深度卷积神经网络中,得到训练样本每个通道数据的特征数据X(k),其中,k=1,2,...,K,K为训练样本的通道数;
(2)对步骤(1)得到的特征数据X(k)分别进行归一化、非线性变换和矩阵分解的特征提取过程,得到系数矩阵H(k);
(3)将步骤(2)中的特征提取过程重复L次,得到低秩鲁棒特征hj(k),其中,j=1,2,...,n,n为训练样本总数;
(4)根据步骤(3)得到的低秩鲁棒特征hj(k),构造K个最近邻分类器;
(5)将测试样本的每个通道数据输入到VGG-Face深度卷积神经网络中,得到测试样本每个通道数据的特征数据Y(k);
(6)根据步骤(5)得到的特征数据Y(k)进行投影过程,得到投影系数向量
Figure BDA0001349019230000021
(7)将步骤(6)得到的投影系数向量
Figure BDA0001349019230000022
输入到K个最近邻分类器中,得到测试样本每个通道的分类结果,其中,i=1,2,...,e,e为测试样本总数;
(8)综合步骤(7)得到的测试样本每个通道的分类结果,得到测试样本的分类结果。
本发明与现有技术相比,具有如下优点:
1)本发明在深度学习的基础上结合了多层非负矩阵分解,能够得到更具鉴别力的特征表示;
2)本发明通过综合不同通道的分类结果,进一步提高了复杂外观变化下的人脸识别率。
附图说明
图1是本发明的实现流程图。
具体实施方式
参照图1,本发明的基于深度学习多层非负矩阵分解的人脸识别步骤如下:
步骤1,获取训练样本每个通道数据的特征数据X(k)。
(1a)获取人脸数据集Vtrain作为训练数据集,该训练数据集中的训练样本总数为n,该训练数据集的类别数量为c,该训练数据集中的每个训练样本等分为K个区域,每个区域作为训练样本的1个通道数据,训练样本共包含K个通道数据;
(1b)根据训练数据集,在Linux操作***下,利用Caffe深度学习框架对VGG-Face深度卷积神经网络参数进行微调;
(1c)将训练数据集中每个训练样本的每个通道数据输入到VGG-Face深度卷积神经网络中,得到训练每个通道数据的特征数据X(k),其中,k=1,2,...,K;K为训练样本的通道数。
步骤2,根据特征数据X(k),获取系数矩阵H(k)。
对特征数据X(k)分别进行归一化、非线性变换和矩阵分解的特征提取过程,得到系数矩阵H(k);
(2a)使用L2范数对特征数据X(k)进行归一化处理;
(2b)使用sigmoid函数对步骤(2a)归一化处理后的结果进行非线性变换,得到变换后的结果B(k);
(2c)使用软约束非负矩阵分解对步骤(2b)中非线性变换后的结果B(k)进行矩阵分解,得到B(k)≈Z(k)A(k)F(k),其中,B(k)为m×n阶矩阵,Z(k)为m×φ阶的基矩阵,A(k)为φ×c阶的辅助矩阵,F(k)为c×n阶的预测标签矩阵,m为原始特征维数,φ为分解维数,c为类别数,n为训练样本总数;
(2c1)随机初始化基矩阵Z(1)(k)、辅助矩阵A(1)(k)和预测标签矩阵F(1)(k)作为迭代1次后的结果,其中,基矩阵Z(1)(k)中的任意元素满足
Figure BDA0001349019230000031
Figure BDA0001349019230000038
为基矩阵Z(1)(k)的第p行q列元素;辅助矩阵A(1)(k)中的任意元素满足
Figure BDA0001349019230000032
Figure BDA0001349019230000039
为辅助矩阵A(1)(k)的第α行β列元素;预测标签矩阵F(1)(k)中的任意元素满足
Figure BDA0001349019230000033
Figure BDA00013490192300000310
为预测标签矩阵F(1)(k)的第γ行
Figure BDA0001349019230000034
列元素;p=1,2,...,m,q=1,2,...,φ,α=1,2,...,φ,β=1,2,...,c,γ=1,2,...,c,
Figure BDA0001349019230000037
(2c2)根据如下公式,对基矩阵Z中的元素Zp,q进行更新:
Figure BDA0001349019230000035
其中,t为迭代次数,t=2,...,iter,iter为最大迭代次数,T为矩阵转置,
Figure BDA0001349019230000036
为迭代t次后得到的非归一化基矩阵Z(t)′(k)的第p行q列元素;
(2c3)对步骤(2c2)中得到的基矩阵Z(t)′(k)进行归一化处理,得到迭代t次的基矩阵Z(t)(k);
(2c4)根据如下公式,对辅助矩阵A(k)中的元素Aα,β(k)进行更新:
Figure BDA0001349019230000041
其中,
Figure BDA0001349019230000042
为迭代t次后得到的辅助矩阵A(t)(k)的第α行β列元素;A(t)(k)为迭代t次后得到的辅助矩阵;
(2c5)根据如下公式,对预测标签矩阵F(k)中的元素
Figure BDA0001349019230000043
进行更新:
Figure BDA0001349019230000044
其中,
Figure BDA0001349019230000045
为迭代t次后预测标签矩阵F(t)(k)的第γ行
Figure BDA0001349019230000046
列元素;F(t)(k)为迭代t次后预测标签矩阵;λ为正则项系数;
Figure BDA0001349019230000047
为预先定义的本地标签矩阵C(k)的第γ行
Figure BDA0001349019230000048
列元素;
(2c6)判断迭代次数t是否达到最大迭代次数iter:如果是,则停止迭代,将第iter次迭代得到的基矩阵Z(iter)(k)、辅助矩阵A(iter)(k)和预测标签矩阵F(iter)(k),作为最终的基矩阵Z(k)、辅助矩阵A(k)和预测标签矩阵F(k);否则,返回步骤(2c2);
(2d)根据步骤(2c)中软约束非负矩阵分解后得到的辅助矩阵A(k)和预测标签矩阵F(k),得到系数矩阵:H(k)=A(k)F(k)。
步骤3,获取训练样本的低秩鲁棒特征h(k)。
重复步骤2中的特征提取过程,得到训练样本的每个通道特征数据X(k)的低秩鲁棒特征h(k);
(3a)根据步骤2对训练样本的各个通道的特征数据X(k)进行处理,得到第1层基矩阵Z1(k)和第1层系数矩阵H1(k);
(3b)根据步骤2对步骤(3a)得到的第1层系数矩阵H1(k)进行处理,得到第2层基矩阵Z2(k)和第2层系数矩阵H2(k);
(3c)根据步骤(3a)和(3b)继续重复相同步骤,根据第l-1层系数矩阵Hl-1(k),得到第l层基矩阵Zl(k)和第l层系数矩阵Hl(k),直到重复次数l=L,得到第L层基矩阵ZL(k)和第L层系数矩阵HL(k),其中,l=2,...,L,L为多层非负矩阵分解的层数;
(3d)根据步骤(3c)得到的第L层系数矩阵HL(k),得到训练样本各个通道的低秩鲁棒特征hj(k),其中,j=1,2,...,n。
步骤4,根据步骤3得到的低秩鲁棒特征hj(k),构造K个最近邻分类器。
(4a)从步骤3中得到的结果,选取每个训练样本第k个通道的低秩鲁棒特征hj(k),构成一个特征集合;
(4b)根据步骤(4a)得到的特征集合,构成一个最近邻分类器;
(4c)针对不同的通道重复步骤(4a)和(4b),得到K个最近邻分类器。
步骤5,获取测试样本每个通道数据的特征数据Y(k)。
(5a)获取与训练数据集属性相同的人脸数据集Vtest作为测试数据集,该测试数据集中的测试样本总数为e,该测试数据集的类别数量为c,该测试数据集中的每个测试样本根据步骤(1a)划分为K个通道数据;
(5b)根据步骤(1b)对VGG-Face深度卷积神经网络的参数进行设置;
(5c)将测试样本的每个通道数据输入到VGG-Face深度卷积神经网络中,得到测试样本每个通道数据的特征数据Y(k)。
步骤6,将步骤5得到的测试样本的每个通道数据的特征数据Y(k)分别进行投影,输出投影系数向量
Figure BDA0001349019230000051
(6a)对测试样本的特征数据Y(k)进行归一化处理、非线性变换和投影变换的投影处理过程,得到第1层投影矩阵
Figure BDA0001349019230000052
(6a1)使用L2范数对测试样本的特征数据Y(k)进行归一化处理;
(6a2)使用Sigmoid函数对步骤(6a1)中归一化处理后得到的结果进行非线性变换,得到非线性变换后的变换结果f(Y(k)),其中,f(·)表示利用Sigmoid函数进行非线性变换;
(6a3)将步骤(6a2)非线性变换后的结果f(Y(k))分别在步骤(3a)得到的第1层基矩阵Z1(k)上进行投影变换,得到第1层投影矩阵:
Figure BDA0001349019230000053
其中,
Figure BDA0001349019230000054
表示广义逆运算;
(6b)根据步骤(6a)得到的第1层投影矩阵
Figure BDA0001349019230000055
和第2层基矩阵Z2(k)进行相同处理过程,得到第2层投影矩阵
Figure BDA0001349019230000056
(6c)根据步骤(6a)和(6b)继续重复相同步骤,根据第l-1层投影矩阵
Figure BDA0001349019230000057
和第l层基矩阵Zl(k)得到第l层投影矩阵
Figure BDA0001349019230000058
直到重复次数l=L,得到第L层投影矩阵
Figure BDA0001349019230000059
其中,l=2,...,L;
(6d)根据步骤(6c)得到的第L层投影矩阵
Figure BDA0001349019230000061
得到每个测试样本的投影系数向量
Figure BDA0001349019230000062
其中,i=1,2,...,e。
步骤7,将步骤6得到的投影系数向量
Figure BDA0001349019230000063
输入到K个最近邻分类器中,得到测试样本每个通道的分类结果。
(7a)计算训练样本的低秩鲁棒特征hj(k)与测试样本的投影系数向量
Figure BDA0001349019230000064
之间的低维欧氏距离
Figure BDA0001349019230000065
得到距离集合
Figure BDA0001349019230000066
其中,j=1,2,...,n,i∈{1,2,...,e},||·||2表示2范数;
(7b)根据步骤(7a)得到的距离集合
Figure BDA0001349019230000067
将距离集合中最小值
Figure BDA0001349019230000068
对应的第ξ个训练样本的类别作为第i个测试样本在第k个最近邻分类器上的分类结果,其中,ξ∈{1,2,...,n};
(7c)根据步骤(7a)和(7b)分别对每个测试样本的K个通道进行分类,得到每个测试样本在K个最近邻分类器上的分类结果。
步骤8,综合步骤7得到的测试样本每个通道的分类结果,得到测试样本的最终分类结果。
(8a)根据步骤7得到的每个测试样本在K个最近邻分类器上的分类结果,分别统计每个最近邻分类器上的被正确分类的测试样本数目CNk,计算每个最近邻分类器的识别率:
Figure BDA0001349019230000069
其中,CNk为第k个最近邻分类器上的被正确分类的测试样本数目,ok为第k个最近邻分类器的识别率;
(8b)根据步骤(8a)得到的K个最近邻分类器的识别率分别计算K个最近邻分类器的线性权重系数αk
Figure BDA00013490192300000610
(8c)根据步骤(8b)得到的线性权重系数αk,计算测试样本K个通道投影系数向量
Figure BDA00013490192300000611
与训练样本K个通道低秩鲁棒特征hj(k)之间的加权距离:
Figure BDA0001349019230000071
,得到加权距离集合{d1i,d2i,...,dji,...,dni};
(8d)根据步骤(8c)得到的加权距离集合{d1i,d2i,...,dji,...,dni},将加权距离集合中最小值dωi对应的第ω个训练样本的类别作为测试样本的分类结果,其中,ω∈{1,2,...,n}。
以上描述仅是本发明的一个具体实例,不构成对本发明的任何限制,显然对于本领域的专业人员来说,在了解了本发明内容和原理后,都可能在不背离本发明原理、结构的情况下,进行形式和细节上的各种修正和改变,但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。

Claims (6)

1.基于深度学习多层非负矩阵分解的人脸识别方法,包括:
(1)将训练样本的每个通道数据输入到VGG-Face深度卷积神经网络中,得到训练样本每个通道数据的特征数据X(k),其中,k=1,2,...,K,K为训练样本的通道数;
(2)对步骤(1)得到的特征数据X(k)分别进行归一化、非线性变换和矩阵分解的特征提取过程,得到系数矩阵H(k);
(3)将步骤(2)中的特征提取过程重复L次,得到低秩鲁棒特征hj(k),其中,j=1,2,...,n,n为训练样本总数;具体实现步骤如下:
(3a)根据步骤(2)对训练样本的各个通道的特征数据X(k)进行处理,得到第1层基矩阵Z1(k)和第1层系数矩阵H1(k),其中,k=1,2,...,K;
(3b)根据步骤(2)对步骤(3a)得到的第1层系数矩阵H1(k)进行处理,得到第2层基矩阵Z2(k)和第2层系数矩阵H2(k);
(3c)根据步骤(3a)和(3b)继续重复相同步骤,根据第l-1层系数矩阵Hl-1(k),得到第l层基矩阵Zl(k)和第l层系数矩阵Hl(k),直到重复次数l=L,得到第L层基矩阵ZL(k)和第L层系数矩阵HL(k),其中,l=2,...,L,L为多层非负矩阵分解的层数;
(3d)根据步骤(3c)得到的第L层系数矩阵HL(k),得到训练样本各个通道的低秩鲁棒特征hj(k),其中,j=1,2,...,n;
(4)根据步骤(3)得到的低秩鲁棒特征hj(k),构造K个最近邻分类器;
(5)将测试样本的每个通道数据输入到VGG-Face深度卷积神经网络中,得到测试样本每个通道数据的特征数据Y(k);
(6)根据步骤(5)得到的特征数据Y(k)进行投影过程,得到投影系数向量
Figure FDA0002458444860000011
(7)将步骤(6)得到的投影系数向量
Figure FDA0002458444860000012
输入到K个最近邻分类器中,得到测试样本每个通道的分类结果,其中,i=1,2,...,e,e为测试样本总数;
(8)综合步骤(7)得到的测试样本每个通道的分类结果,得到测试样本的分类结果。
2.根据权利要求1所述的方法,其中所述步骤(2)的实现步骤如下:
(2a)使用L2范数对特征数据X(k)进行归一化处理;
(2b)使用sigmoid函数对步骤(2a)归一化处理后的结果进行非线性变换,得到变换后的结果B(k);
(2c)使用软约束非负矩阵分解对步骤(2b)中非线性变换后的结果B(k)进行矩阵分解,得到B(k)≈Z(k)A(k)F(k),其中,B(k)为m×n阶矩阵,Z(k)为m×φ阶的基矩阵,A(k)为φ×c阶的辅助矩阵,F(k)为c×n阶的预测标签矩阵,m为原始特征维数,φ为分解维数,c为类别数,n为训练样本总数;
(2d)根据步骤(2c)中软约束非负矩阵分解后得到的辅助矩阵A(k)和预测标签矩阵F(k),得到系数矩阵:H(k)=A(k)F(k)。
3.根据权利要求2所述的方法,其中步骤(2c)中使用软约束非负矩阵分解对步骤(2b)中非线性变换后的结果B(k)进行矩阵分解,按如下步骤进行:
(2c1)随机初始化基矩阵Z(1)(k)、辅助矩阵A(1)(k)和预测标签矩阵F(1)(k)作为迭代1次后的结果,其中,基矩阵Z(1)(k)中的任意元素满足
Figure FDA0002458444860000021
Figure FDA0002458444860000022
为基矩阵Z(1)(k)的第p行q列元素;辅助矩阵A(1)(k)中的任意元素满足
Figure FDA0002458444860000023
Figure FDA0002458444860000024
为辅助矩阵A(1)(k)的第α行β列元素;预测标签矩阵F(1)(k)中的任意元素满足
Figure FDA0002458444860000025
Figure FDA0002458444860000026
为预测标签矩阵F(1)(k)的第γ行
Figure FDA0002458444860000028
列元素;p=1,2,...,m,q=1,2,...,φ,α=1,2,…,φ,β=1,2,...,c,γ=1,2,…,c,
Figure FDA0002458444860000029
(2c2)根据如下公式,对基矩阵Z中的元素Zp,q进行更新:
Figure FDA0002458444860000027
其中,t为迭代次数,t=2,...,iter,iter为最大迭代次数,T为矩阵转置,
Figure FDA0002458444860000031
为迭代t次后得到的非归一化基矩阵Z(t)′(k)的第p行q列元素;
(2c3)对步骤(2c2)中得到的基矩阵Z(t)′(k)进行归一化处理,得到迭代t次的基矩阵Z(t)(k);
(2c4)根据如下公式,对辅助矩阵A(k)中的元素Aα,β(k)进行更新:
Figure FDA0002458444860000032
其中,
Figure FDA0002458444860000033
为迭代t次后得到的辅助矩阵A(t)(k)的第α行β列元素;A(t)(k)为迭代t次后得到的辅助矩阵;
(2c5)根据如下公式,对预测标签矩阵F(k)中的元素
Figure FDA0002458444860000037
进行更新:
Figure FDA0002458444860000034
其中,
Figure FDA0002458444860000035
为迭代t次后预测标签矩阵F(t)(k)的第γ行
Figure FDA0002458444860000038
列元素;F(t)(k)为迭代t次后预测标签矩阵;λ为正则项系数;
Figure FDA00024584448600000310
为预先定义的本地标签矩阵C(k)的第γ行
Figure FDA0002458444860000039
列元素;
(2c6)判断迭代次数t是否达到最大迭代次数iter:如果是,则停止迭代,将第iter次迭代得到的基矩阵Z(iter)(k)、辅助矩阵A(iter)(k)和预测标签矩阵F(iter)(k),作为最终的基矩阵Z(k)、辅助矩阵A(k)和预测标签矩阵F(k);否则,返回步骤(2c2)。
4.根据权利要求1所述的方法,其中所述步骤(6)的实现步骤如下:
(6a)对测试样本的特征数据Y(k)进行归一化处理、非线性变换和投影变换的投影处理过程,得到投影矩阵
Figure FDA0002458444860000036
其中,k∈{1,2,...,K},K为样本通道数;
(6a1)使用L2范数对测试样本的特征数据Y(k)进行归一化处理;
(6a2)使用Sigmoid函数对步骤(6a1)中归一化处理后得到的结果进行非线性变换,得到非线性变换后的变换结果f(Y(k)),其中,f(·)表示利用Sigmoid函数进行非线性变换;
(6a3)将步骤(6a2)非线性变换后的结果f(Y(k))分别在步骤(3a)得到的第1层基矩阵Z1(k)上进行投影变换,得到第1层投影矩阵:
Figure FDA0002458444860000041
其中,
Figure FDA00024584448600000414
表示广义逆运算;
(6b)根据步骤(6a)得到的第1层投影矩阵
Figure FDA0002458444860000042
和第2层基矩阵Z2(k)进行相同处理过程,得到第2层投影矩阵
Figure FDA0002458444860000043
(6c)根据步骤(6a)和(6b)继续重复相同步骤,根据第l-1层投影矩阵
Figure FDA0002458444860000044
和第l层基矩阵Zl(k)得到第l层投影矩阵
Figure FDA0002458444860000045
直到重复次数l=L,得到第L层投影矩阵
Figure FDA0002458444860000046
其中,l=2,...,L,L为多层非负矩阵分解的层数;
(6d)根据步骤(6c)得到的第L层投影矩阵
Figure FDA0002458444860000047
得到每个测试样本的投影系数向量
Figure FDA0002458444860000048
其中,i=1,2,...,e。
5.根据权利要求1所述的方法,其中所述步骤(7),按如下步骤进行:
(7a)计算训练样本的低秩鲁棒特征hj(k)与测试样本的投影系数向量
Figure FDA0002458444860000049
之间的低维欧氏距离
Figure FDA00024584448600000410
得到距离集合
Figure FDA00024584448600000411
其中,j=1,2,...,n,k∈{1,2,...,K},i∈{1,2,...,e},||·||2表示2范数;
(7b)根据步骤(7a)得到的距离集合
Figure FDA00024584448600000412
将距离集合中最小值
Figure FDA00024584448600000413
对应的第ξ个训练样本的类别作为第i个测试样本在第k个最近邻分类器上的分类结果,其中,ξ∈{1,2,...,n};
(7c)根据步骤(7a)和(7b)分别对每个测试样本的K个通道进行分类,得到每个测试样本在K个最近邻分类器上的分类结果。
6.根据权利要求1所述的方法,其中所述步骤(8),按如下步骤进行:
(8a)根据步骤(7)得到的每个测试样本在K个最近邻分类器上的分类结果,分别统计每个最近邻分类器上的被正确分类的测试样本数目CNk,计算每个最近邻分类器的识别率:
Figure FDA0002458444860000051
其中,CNk为第k个最近邻分类器上的被正确分类的测试样本数目,ok为第k个最近邻分类器的识别率;
(8b)根据步骤(8a)得到的K个最近邻分类器的识别率分别计算K个最近邻分类器的线性权重系数αk
Figure FDA0002458444860000052
(8c)根据步骤(8b)得到的线性权重系数αk,计算测试样本K个通道投影系数向量
Figure FDA0002458444860000054
与训练样本K个通道低秩鲁棒特征hj(k)之间的加权距离:
Figure FDA0002458444860000053
得到加权距离集合{d1i,d2i,...,dji,...,dni},其中,j=1,2,...,n,i∈{1,2,...,e};
(8d)根据步骤(8c)得到的加权距离集合{d1i,d2i,...,dji,...,dni},将加权距离集合中最小值dωi对应的第ω个训练样本的类别作为测试样本的分类结果,其中,ω∈{1,2,...,n}。
CN201710568578.0A 2017-07-13 2017-07-13 基于深度学习多层非负矩阵分解的人脸识别方法 Active CN107451537B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710568578.0A CN107451537B (zh) 2017-07-13 2017-07-13 基于深度学习多层非负矩阵分解的人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710568578.0A CN107451537B (zh) 2017-07-13 2017-07-13 基于深度学习多层非负矩阵分解的人脸识别方法

Publications (2)

Publication Number Publication Date
CN107451537A CN107451537A (zh) 2017-12-08
CN107451537B true CN107451537B (zh) 2020-07-10

Family

ID=60488656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710568578.0A Active CN107451537B (zh) 2017-07-13 2017-07-13 基于深度学习多层非负矩阵分解的人脸识别方法

Country Status (1)

Country Link
CN (1) CN107451537B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108256569B (zh) * 2018-01-12 2022-03-18 电子科技大学 一种复杂背景下的对象识别方法及使用的计算机技术

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254328A (zh) * 2011-05-17 2011-11-23 西安电子科技大学 基于部分稀疏约束非负矩阵分解的视频运动特征提取方法
CN103345624A (zh) * 2013-07-15 2013-10-09 武汉大学 一种多通道脉冲耦合神经网络的加权特征人脸识别方法
CN105469034A (zh) * 2015-11-17 2016-04-06 西安电子科技大学 基于加权式鉴别性稀疏约束非负矩阵分解的人脸识别方法
CN106355138A (zh) * 2016-08-18 2017-01-25 电子科技大学 基于深度学习和关键点特征提取的人脸识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9721202B2 (en) * 2014-02-21 2017-08-01 Adobe Systems Incorporated Non-negative matrix factorization regularized by recurrent neural networks for audio processing

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102254328A (zh) * 2011-05-17 2011-11-23 西安电子科技大学 基于部分稀疏约束非负矩阵分解的视频运动特征提取方法
CN103345624A (zh) * 2013-07-15 2013-10-09 武汉大学 一种多通道脉冲耦合神经网络的加权特征人脸识别方法
CN105469034A (zh) * 2015-11-17 2016-04-06 西安电子科技大学 基于加权式鉴别性稀疏约束非负矩阵分解的人脸识别方法
CN106355138A (zh) * 2016-08-18 2017-01-25 电子科技大学 基于深度学习和关键点特征提取的人脸识别方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
"基于NMF与BP神经网络的人脸识别方法研究";熊培;;《中国硕士学位论文全文数据库 信息科技辑》;20101215(第12期);I138-281 *
"基于深度迁移学习的人脸识别方法研究";余化鹏等;;《成都大学学报( 自然科学版)》;20170630;第36卷(第2期);第151-156页 *
"深度非负矩阵分解算法研究";曲省卫;;《中国硕士学位论文全文数据库 信息科技辑》;20170315(第3期);I138-85 *
正交指数约束的平滑非负矩阵分解方法及应用;同鸣;《***工程与电子技术》;20130704;第35卷(第10期);第2221-2228页 *

Also Published As

Publication number Publication date
CN107451537A (zh) 2017-12-08

Similar Documents

Publication Publication Date Title
Yuan et al. Projective nonnegative matrix factorization for image compression and feature extraction
Zhang et al. Deep cascade model-based face recognition: When deep-layered learning meets small data
Patel et al. Latent space sparse and low-rank subspace clustering
He et al. Online robust subspace tracking from partial information
Sun et al. A novel method of combined feature extraction for recognition
Yang et al. Adaptive method for nonsmooth nonnegative matrix factorization
CN108171279B (zh) 一种多视角视频自适应乘积Grassmann流形子空间聚类方法
CN108564061B (zh) 一种基于二维主元分析的图像识别方法和***
CN112115881B (zh) 基于鲁棒鉴别特征学习的图像特征提取方法
Hu et al. Single sample face recognition under varying illumination via QRCP decomposition
Sharma et al. Efficient face recognition using wavelet-based generalized neural network
CN109657611A (zh) 一种用于人脸识别的自适应图正则化非负矩阵分解方法
Li et al. Online low-rank representation learning for joint multi-subspace recovery and clustering
He et al. Blind source separation using clustering-based multivariate density estimation algorithm
Li et al. Weighted error entropy-based information theoretic learning for robust subspace representation
CN111324791A (zh) 一种多视数据子空间聚类方法
CN107423697B (zh) 基于非线性融合深度3d卷积描述子的行为识别方法
Li et al. Incoherent dictionary learning with log-regularizer based on proximal operators
Banitalebi-Dehkordi et al. Face recognition using a new compressive sensing-based feature extraction method
CN107451537B (zh) 基于深度学习多层非负矩阵分解的人脸识别方法
CN117935299A (zh) 基于多阶特征分支和局部注意力的行人重识别模型
Kobayashi Generalized mutual subspace based methods for image set classification
CN107085700A (zh) 一种基于稀疏表示与单隐层神经网络技术相结合的人脸识别方法
CN108734206B (zh) 一种基于深度参数学习的最大相关主成分分析方法
Xu et al. Nonlinear component analysis based on correntropy

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant