CN106250929A - 弹性网络约束自解释稀疏表示分类器的设计方法 - Google Patents

弹性网络约束自解释稀疏表示分类器的设计方法 Download PDF

Info

Publication number
CN106250929A
CN106250929A CN201610620582.2A CN201610620582A CN106250929A CN 106250929 A CN106250929 A CN 106250929A CN 201610620582 A CN201610620582 A CN 201610620582A CN 106250929 A CN106250929 A CN 106250929A
Authority
CN
China
Prior art keywords
centerdot
sample
phi
rsqb
lsqb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610620582.2A
Other languages
English (en)
Inventor
王立
刘宝弟
韩丽莎
王延江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN201610620582.2A priority Critical patent/CN106250929A/zh
Publication of CN106250929A publication Critical patent/CN106250929A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及一种弹性网络约束自解释稀疏表示分类器的设计方法的设计方法,含有以下步骤:读取训练样本,将训练样本进行非线性变换,变换到高维的核空间,在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典;通过训练得到的稀疏表达词典获取测试样本在核空间的弹性网络系数编码,最后用每一类的词典及词典所对应的弹性网络稀疏编码拟合测试样本,并计算该拟合误差,拟合误差最小类为测试样本的类别。本发明综合了岭回归和lasso回归的优点,使样本的稀疏编码特征既具有稀疏性,又具有较小的拟合误差,有效降低了分类误差,提升分类器的识别性能。

Description

弹性网络约束自解释稀疏表示分类器的设计方法
技术领域
本发明隶属于模式识别技术领域,具体地说,涉及一种弹性网络约束自解释稀疏表示分类器的设计方法的设计方法。
背景技术
分类器设计(Classifier Design)是模式识别领域一个重要的研究分支,特征提取是模式识别***的重要组成部分,是模式分类识别的前提条件,但是如何对抽取到的特征进行最大限度地分类,则是模式识别的最终目的,是模式识别***的核心单元。从分类决策的角度来看,有效地分类判别规则是降低错误识别率、提高模式识别精度的主要因素。
目前,主要的分类器设计方法有以下几种。
1、支持向量机方法(英文:Support Vector Machine)
支持向量机方法是Corinna Cortes和Vapnik等于1995年首先提出来的,它旨在通过最大化类别间隔建立最优分类面。该类方法在解决小样本、非线性及高维模式识别中表现出许多特有的优势。然而,该类分类器只有少量的边界点(即支持向量)参与到分类面建立,如果边界点分布的位置不好,那么对于分类是十分不利的。
2、基于稀疏表示的分类器设计方法(英文:Sparse RepresentationbasedClassifier)
基于稀疏表示的分类器设计方法是由J.Wright等人于2009年提出的,该分类器设计方法首先将测试样本在所有训练集上进行稀疏编码,然后根据产生最小编码误差的类别决定分类结果。该分类器设计方法在多类分类中取得了很大的成功,然而,该分类器设计方法没有训练的过程,直接将每类训练样本构造相应子空间,并没有考虑该分类样本中每个个体对构造子空间的贡献,容易产生较大的拟合误差。
3、基于协同表示的分类器设计方法(英文:Collaborative RepresentationbasedClassifier)
基于协同表示的分类器设计方法是由zhang等人于2011年提出,该分类器设计方法首先将测试样本在所有训练集上进行协同表示,然后根据产生最小编码误差的类别决定分类结果。该分类器设计方法在某些数据集上性能优于基于稀疏表示的分类器设计方法。同样地,该分类器设计方法没有训练的过程,直接将每类训练样本构造相应子空间,容易产生较大拟合误差,导致分类性能不高。
4、基于词典学习的分类器设计方法
基于词典学习的分类器设计方法是由Yang等人于2010年提出,该分类器设计方法弥补了传统的基于稀疏表示的分类器设计方法容易产生较大拟合误差导致分类准确率不高的问题,然而,该分类器设计方法只能在欧式空间中进行,很难处理具有非线性结构的数据,使其使用范围大大受限。
由上可知,现有的分类器设计方法均存在拟合误差比较大而导致分类精确度不高的问题。
发明内容
本发明针对现有分类器设计方法设计的分类器存在拟合误差大、精确度不高的上述不足,提供一种弹性网络约束自解释稀疏表示分类器的设计方法。通过本发明分类器的设计方法设计的分类器拟合误差小、识别精度高。
本发明的技术方案是:一种弹性网络约束自解释稀疏表示分类器的设计方法的设计方法,含有以下步骤:
步骤一:设计分类器,其步骤为:
(一)读取训练样本,训练样本一共C类,定义X=[X1,X2,…,Xc,…,XC]∈RD×N表示训练样本,D是人脸特征维度,N是训练样本总的数目,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N+,…+Nc+…+NC
(二)对训练样本进行二范数归一化,得到归一化的训练样本;
(三)依次取出训练样本中的每一类,并对该类样本训练词典,训练词典的过程为:
(1)取出第c类样本Xc,将Xc映射到核空间φ(Xc);
(2)根据φ(Xc)训练基于稀疏编码算法的词典Bc,Bc表示第c类样本学习到的词典,该词典的训练需要满足约束条件,所述约束条件的目标函数为:
f ( S c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 + 2 α Σ n = 1 N c | | S · n c | | 1 + β | | S c | | F 2 | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K - - - ( 1 )
式中,α为稀疏编码算法中稀疏项约束的惩罚系数,β为稀疏编码算法中协同约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(Xc)Wc
(3)对步骤(2)中约束条件的目标函数进行求解,即对公式(1)求解,其求解过程为:固定Wc,更新Sc;随机产生矩阵Wc,将其带入约束条件的目标函数,这时该目标函数转化成为一个弹性网络正则化最小二乘问题,即目标函数转化为:
f ( S c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 + 2 α Σ n = 1 N c | | β · n c | | 1 + β | | S c | | F 2 - - - ( 2 )
上述公式(2)可以简化为:
f ( S c ) = t r a c e { φ ( X c ) T φ ( X c ) - 2 φ ( X c ) T φ ( X c ) W c S c } + t r a c e { S c T ( W c T φ ( X c ) T φ ( X c ) W c ) S c } + 2 α Σ n = 1 N c | | S · n c | | 1 + β | | S c | | F 2 = t r a c e { κ ( X c , X c ) } - 2 t r a c e { κ ( X c , X c ) W c S c } + t r a c e { S c T ( W c T κ ( X c , X c ) W c ) S c } + 2 α Σ n = 1 N c | | S · n c | | 1 + β | | S c | | F 2 = t r a c e { κ ( X c , X c ) } - 2 Σ n = 1 N c [ κ ( X c , X c ) W c ] n · S · n c + Σ n = 1 N S · n c T [ W c T κ ( X c , X c ) W c ] S · n c + 2 α Σ k = 1 K Σ n = 1 N c | S k n c | + β Σ k = 1 K Σ n = 1 N c ( S k n c ) 2 - - - ( 3 )
进一步把公式(3)分解成一系列子问题求解;针对Sc中的每一个元素进行求解,并剔除掉与求解无关的项,则公式(3)可以简化为:
f ( S k n c ) = - 2 [ κ ( X c , X c ) W c ] n k S k n c + ( S k n c ) 2 [ W c T κ ( X c , X c ) W c ] k k + 2 Σ l = 1 , l ≠ k K [ W c T κ ( X c , X c ) W c ] l k S k n c + 2 α | S k n c | + β ( S k n c ) 2 - - - ( 4 )
根据抛物线理论,很容易求出公式(4)的解;并且由于每个样本点是独立的,每次求解Sc的一行,其求解公式如下:
S k · c = 1 1 + β min { [ W c T κ ( X c , X c ) ] k · - [ E S c ‾ k ] k · , - α } + 1 1 + β max { [ W c T κ ( X c , X c ) ] k · - [ E S c ‾ k ] k · , α } - - - ( 5 )
式中,E=Wc^Tκ(Xc,Xc)Wc+βI,I表示单位阵;
遍历Sc的每一列,完成Sc的一次更新;
(4)固定步骤(3)中更新后的Sc,更新Wc,这时约束条件的目标函数转换为一个l2范数约束的最小二乘问题,即目标函数转化为:
f ( W c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 s . t . | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K . - - - ( 6 )
上述公式(6)采用拉格朗日乘子的方法求解,最终求得的解为:
W · k c = ( S · k c ) - [ W c ‾ k F ] · k ( S k · c T - [ W c ‾ k F ] · k ) T κ ( X c , X c ) ( ( S k · c ) T - [ W c ‾ k F ] · k ) - - - ( 7 )
式中,F=ScScT,
(5)交替迭代步骤(3)和步骤(4),最终得到最优稀疏编码词典Bc=φ(Xc)Wc
(6)按照步骤(1)至(5)获得每类样本的最优稀疏编码词典,将每类样本得到的最优稀疏编码词典放在一起,获得词典B=[B1,…,Bc,…,BC];
步骤二:对样本进行分类,其步骤为:
(1)读取待识别测试样本的图像特征,并对图像特征进行二范数归一化,定义y∈RD×1表示一幅待识别的测试样本图像特征;
(2)将测试样本图像特征y映射到核空间φ(y);
(3)使用步骤一中获得的词典B,对核空间φ(y)进行拟合,拟合函数为:
f ( s ) = | | φ ( y ) - B s | | 2 2 + 2 α | | s | | 1 + β | | s | | 2 2 - - - ( 8 )
式中s表示核空间中测试样本图像特征y的稀疏编码;
(4)对步骤(3)中的拟合函数进行求解,求解结果为:
s · k = 1 1 + β min { [ W c T κ ( X c , y ) ] k · - [ W c ^ T κ ( X c , X c ) W c s ‾ k ] k · , - α } + 1 1 + β max { [ W c T κ ( X c , y ) ] k · - [ W c ^ T κ ( X c , X c ) W c s ‾ k ] k · , α } - - - ( 9 )
式中,s=[s1,…,sc,…,sC];
(5)求核空间φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,其表达式为:
r ( c ) = | | φ ( y ) - B c s c | | 2 2 = | | φ ( y ) - φ ( X c ) W c s c | | 2 2 - - - ( 10 )
(6)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
本发明的有益效果是:本发明结合核技巧和词典学习方法,将弹性网络约束加入到稀疏表达分类器设计当中,首先将原特征空间中的样本通过核函数映射,变换到一个高维的核空间,并借助核技巧在新的核空间中应用非线性分析求解最优的弹性网络约束的稀疏表达词典;本发明有效地提取隐藏在样本特征中的非线性结构,同时采用弹性网络约束求取稀疏表达词典,弹性网络约束同时吸收了岭回归约束和lasso约束的优点,使训练出的稀疏表达词典具有较小的拟合误差,又有稀疏性的优点,从而提高分类器的分类精度。本发明分类器首先读取训练样本,将训练样本进行非线性变换,变换到高维的核空间,然后在高维核空间对每一类训练样本进行学习,找出该类训练样本中每个个体对于构造该类训练样本子空间所做的贡献(即权重),该类训练样本与权重矩阵的乘积构成词典;通过训练得到的稀疏表达词典获取测试样本在核空间的弹性网络系数编码,最后用每一类的词典及词典所对应的弹性网络稀疏编码拟合测试样本,并计算该拟合误差,拟合误差最小类为测试样本的类别。与现有技术相比,本发明采用弹性网络约束,综合了岭回归和lasso回归的优点,使样本的稀疏编码特征既具有稀疏性,又具有较小的拟合误差,有效降低了分类误差,提升分类器的识别性能。
附图说明
图1为本发明具体实施例设计分类器的流程图。
图2为本发明具体实施例对样本进行分类的流程图。
具体实施方式
下面结合一个仿真实例并结合附图对本发明作出进一步说明。
一种弹性网络约束自解释稀疏表示分类器的设计方法的设计方法,含有以下步骤:
步骤一:参见图1,设计分类器,其步骤为:
(一)读取训练样本,训练样本一共C类,定义X=[X1,X2,…,Xc,…,XC]∈RD×N表示训练样本,D是人脸特征维度,N是训练样本总的数目,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N+,…+Nc+…+NC
(二)对训练样本进行二范数归一化,得到归一化的训练样本;
(三)依次取出训练样本中的每一类,并对该类样本训练词典,训练词典的过程为:
(1)取出第c类样本Xc,将Xc映射到核空间φ(Xc);
(2)根据φ(Xc)训练基于稀疏编码算法的词典Bc,Bc表示第c类样本学习到的词典,该词典的训练需要满足约束条件,所述约束条件的目标函数为:
f ( S c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 + 2 α Σ n = 1 N c | | S · n c | | 1 + β | | S c | | F 2 | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K - - - ( 1 )
式中,α为稀疏编码算法中稀疏项约束的惩罚系数,β为稀疏编码算法中协同约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(Xc)Wc
(3)对步骤(2)中约束条件的目标函数进行求解,即对公式(1)求解,其求解过程为:固定Wc,更新Sc;随机产生矩阵Wc,将其带入约束条件的目标函数,这时该目标函数转化成为一个弹性网络正则化最小二乘问题,即目标函数转化为:
f ( S c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 + 2 α Σ n = 1 N c | | S · n c | | 1 + β | | S c | | F 2 - - - ( 2 )
上述公式(2)可以简化为:
f ( S c ) = t r a c e { φ ( X c ) T φ ( X c ) - 2 φ ( X c ) T φ ( X c ) W c S c } + t r a c e { S c T ( W c T φ ( X c ) T φ ( X c ) W c ) S c } + 2 α Σ n = 1 N c | | S · n c | | 1 + β | | S c | | F 2 = t r a c e { κ ( X c , X c ) } - 2 t r a c e { κ ( X c , X c ) W c S c } + t r a c e { S c T ( W c T κ ( X c , X c ) W c ) S c } + 2 α Σ n = 1 N c | | S · n c | | 1 + β | | S c | | F 2 = t r a c e { κ ( X c , X c ) } - 2 Σ n = 1 N c [ κ ( X c , X c ) W c ] n · S · n c + Σ n = 1 N S · n c T [ W c T κ ( X c , X c ) W c ] S · n c + 2 α Σ k = 1 K Σ n = 1 N c | S k n c | + β Σ k = 1 K Σ n = 1 N c ( S k n c ) 2 - - - ( 3 )
进一步把公式(3)分解成一系列子问题求解;针对Sc中的每一个元素进行求解,并剔除掉与求解无关的项,则公式(3)可以简化为:
f ( S k n c ) = - 2 [ κ ( X c , X c ) W c ] n k S k n c + ( S k n c ) 2 [ W c T κ ( X c , X c ) W c ] k k + 2 Σ l = 1 , l ≠ k K [ W c T κ ( X c , X c ) W c ] l k S k n c + 2 α | S k n c | + β ( S k n c ) 2 - - - ( 4 )
根据抛物线理论,很容易求出公式(4)的解;并且由于每个样本点是独立的,每次求解Sc的一行,其求解公式如下:
S k · c = 1 1 + β min { [ W c T κ ( X c , X c ) ] k · - [ E S c ‾ k ] k · , - α } + 1 1 + β max { [ W c T κ ( X c , X c ) ] k · - [ E S c ‾ k ] k · , α } - - - ( 5 )
式中,E=Wc^Tκ(Xc,Xc)Wc+βI,I表示单位阵;
遍历Sc的每一列,完成Sc的一次更新;
(4)固定步骤(3)中更新后的Sc,更新Wc,这时约束条件的目标函数转换为一个l2范数约束的最小二乘问题,即目标函数转化为:
f ( W c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 s . t . | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K . - - - ( 6 )
上述公式(6)采用拉格朗日乘子的方法求解,最终求得的解为:
W · k c = ( S · k c ) - [ W c ‾ k F ] · k ( S k · c T - [ W c ‾ k F ] · k ) T κ ( X c , X c ) ( ( S k · c ) T - [ W c ‾ k F ] · k ) - - - ( 7 )
式中,F=ScScT,
(5)交替迭代步骤(3)和步骤(4),最终得到最优稀疏编码词典Bc=φ(Xc)Wc
(6)按照步骤(1)至(5)获得每类样本的最优稀疏编码词典,将每类样本得到的最优稀疏编码词典放在一起,获得词典B=[B1,…,Bc,…,BC];
步骤二:参见图2,对样本进行分类,其步骤为:
(1)读取待识别测试样本的图像特征,并对图像特征进行二范数归一化,定义y∈RD×1表示一幅待识别的测试样本图像特征;
(2)将测试样本图像特征y映射到核空间φ(y);
(3)使用步骤一中获得的词典B,对核空间φ(y)进行拟合,拟合函数为:
f ( s ) = | | φ ( y ) - B s | | 2 2 + 2 α | | s | | 1 + β | | s | | 2 2 - - - ( 8 )
式中s表示核空间中测试样本图像特征y的稀疏编码;
(4)对步骤(3)中的拟合函数进行求解,求解结果为:
s · k = 1 1 + β min { [ W c T κ ( X c , y ) ] k · - [ W c ^ T κ ( X c , X c ) W c s ‾ k ] k · , - α } + 1 1 + β max { [ W c T κ ( X c , y ) ] k · - [ W c ^ T κ ( X c , X c ) W c s ‾ k ] k · , α } - - - ( 9 )
式中,s=[s1,…,sc,…,sC];
(5)求核空间φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,其表达式为:
r ( c ) = | | φ ( y ) - B c s c | | 2 2 = | | φ ( y ) - φ ( X c ) W c s c | | 2 2 - - - ( 10 )
(6)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
在本发明的一个实施例中:采用本发明提出的分类器的设计方法(简称KECSSC)设计的分类器在CUM-PIE数据库上进行分类实验,并与其他分类器设计方法设计的分类器进行比较,本发明分类器的设计方法将每张图片切割为32*32像素,并将切割好的图片像素排成一个列向量,本发明实施例中采用L2-norm对该列向量进行归一化。
在本实施例中,本发明提出的分类器的设计方法与5种分类器设计方法进行了对比,所述的5中分类器方法分别为:最近邻分类器方法(简称NN)、基于协同表示的分类器设计方法(简称CRC)、基于稀疏表示的分类器设计方法(简称SRC)、自解释稀疏表示的分类器设计方法(简称CSDL)、基于支持向量机SVM分类器设计方法(简称SVM)。为了对比结果的公平性,本次分类实验对每类样本随机选择5张图片作为测试图片,10张图片作为训练图片。
在本实施例分类器的设计方法中,α为稀疏编码算法中稀疏项约束的惩罚系数,β为稀疏编码算法中协同约束的惩罚系数,本实施例分类器的设计方法对α设置为2的-9次方,β设置为2的-4次方。
本实施例中分类器的设计方法在CUM-PIE数据库的实验结果如下:
TABLE I
RECOGNITION RATE ON THE CMU PIE DATASET(%).
在本实施例的实验中分别使用3种核方法(即线性核liner、Hellinger核、poly核)对分类器进行设计实验。由TABLE Ⅰ可以看出,在CUM-PIE数据库多次实验中,在使用三种核方法的识别率明显高于其他五种分类器设计方法。其中,本发明分类器的设计方法使用线性核(liner)的识别率为79.89±1.98,比CSDL方法识别率高5.43%;使用Hellinger核的识别率是81.78%±1.77,比CSDL方法高7%;使用poly核的识别率是79.84%±1.64,比CSDL方法高6.35%。
在本发明的另一个实施例中,采用本发明提出的分类器的设计方法(简称KECSSC)设计的分类器在ExtendedYaleB数据库上进行分类实验,并与其他分类器设计方法设计的分类器进行比较,本发明分类器的设计方法将每张图片切割为32*32像素,并将切割好的图片像素排成一个列向量,本发明实施例中采用L2-norm对该列向量进行归一化。
在本实施例中,本发明提出的分类器的设计方法与5种分类器设计方法进行了对比,所述的5中分类器方法分别为:最近邻分类器方法(简称NN)、基于协同表示的分类器设计方法(简称CRC)、基于稀疏表示的分类器设计方法(简称SRC)、自解释稀疏表示的分类器设计方法(简称CSDL)、基于支持向量机SVM分类器设计方法(简称SVM)。为了对比结果的公平性,本次分类实验对每类样本随机选择5张图片作为测试图片,10张图片作为训练图片。
在本实施例分类器的设计方法中,α为稀疏编码算法中稀疏项约束的惩罚系数,β为稀疏编码算法中协同约束的惩罚系数,本实施例分类器的设计方法对α设置为2的-9次方,β设置为2的-4次方。
本实施例中分类器的设计方法在ExtendedYaleB数据库的实验结果如下:
TABLE II
RECOGNITION RATE ON THE EXTENDED YALEB DATASET(%).
在本实施例的实验中分别使用3种核方法(即线性核liner、Hellinger核、poly核)对分类器进行设计实验。由TABLE Ⅱ可以看出,在Extended YaleB数据库多次实验中,在使用三种核方法的识别率明显高于其他五种分类器设计方法。其中,本发明分类器的设计方法使用线性核(liner)的识别率为79.09±1.87,比CSDL方法识别率高0.54%;使用Hellinger核的识别率是91.22%±1.51,比CSDL方法高2.24%;使用poly核的识别率是80.13%±2.04,比CSDL方法高0.45%。
在本发明的又一个实施例中,采用本发明提出的分类器的设计方法(简称KECSSC)设计的分类器在AR数据库上进行分类实验,并与其他分类器设计方法设计的分类器进行比较,本发明分类器的设计方法将每张图片切割为32*32像素,并将切割好的图片像素排成一个列向量,本发明实施例中采用L2-norm对该列向量进行归一化。
在本实施例中,本发明提出的分类器的设计方法与5种分类器设计方法进行了对比,所述的5中分类器方法分别为:最近邻分类器方法(简称NN)、基于协同表示的分类器设计方法(简称CRC)、基于稀疏表示的分类器设计方法(简称SRC)、自解释稀疏表示的分类器设计方法(简称CSDL)、基于支持向量机SVM分类器设计方法(简称SVM)。为了对比结果的公平性,本次分类实验对每类样本随机选择5张图片作为测试图片,10张图片作为训练图片。
在本实施例分类器的设计方法中,α为稀疏编码算法中稀疏项约束的惩罚系数,β为稀疏编码算法中协同约束的惩罚系数,本实施例分类器的设计方法对α设置为2的-9次方,β设置为2的-4次方。
本方法在AR数据库中的实验结果如下:
TABLE III
RECOGNITION RATE ON THE AR DATASET(%).
在本实施例的实验中分别使用3种核方法(即线性核liner、Hellinger核、poly核)对分类器进行设计实验。由TABLEIII可以看出,在AR数据库多次实验中,在使用三种核方法的识别率明显高于其他五种分类器设计方法。其中,本发明分类器设计方法使用线性核(liner)的识别率为94.11±1.16,比CSDL方法识别率高2.99%;使用Hellinger核的识别率是93.45%±0.84,比CSDL方法高3.68%;使用poly核的识别率是93.48%±0.96,比CSDL方法高4.46%。
从上述实施例的实验结果可以看出,本发明分类器的设计方法比当前的其它种类的分类器设计方法分类误差小,分类器的识别性能高,使用本发明提出的方法可以明显提升分类器的识别性能。
以上所举实施例仅用为方便举例说明本发明,并非对本发明保护范围的限制,在本发明所述技术方案范畴,所属技术领域的技术人员所作各种简单变形与修饰,均应包含在以上申请专利范围中。

Claims (1)

1.一种弹性网络约束自解释稀疏表示分类器的设计方法的设计方法,其特征在于:含有以下步骤:
步骤一:设计分类器,其步骤为:
(一)读取训练样本,训练样本一共C类,定义X=[X1,X2,…,Xc,…,XC]∈RD×N表示训练样本,D是人脸特征维度,N是训练样本总的数目,X1,X2,…,Xc,…,XC分别表示第1,2,…,c,…,C类样本,定义N1,N2,…,Nc,…,NC分别表示每类训练样本数目,则N=N1+N+,…+Nc+…+NC
(二)对训练样本进行二范数归一化,得到归一化的训练样本;
(三)依次取出训练样本中的每一类,并对该类样本训练词典,训练词典的过程为:
(1)取出第c类样本Xc,将Xc映射到核空间φ(Xc);
(2)根据φ(Xc)训练基于稀疏编码算法的词典Bc,Bc表示第c类样本学习到的词典,该词典的训练需要满足约束条件,所述约束条件的目标函数为:
f ( S c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 + 2 α Σ n = 1 N | S · n c | | 1 + β | β c | | F 2 | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K - - - ( 1 )
式中,α为稀疏编码算法中稀疏项约束的惩罚系数,β为稀疏编码算法中协同约束的惩罚系数,Sc为第c类核空间训练样本的稀疏表示矩阵,K为学习得到的词典的大小,是一个权重矩阵,其每一列表示核空间样本对构造词典中每个词条的贡献大小,词典Bc=φ(Xc)Wc
(3)对步骤(2)中约束条件的目标函数进行求解,即对公式(1)求解,其求解过程为:固定Wc,更新Sc;随机产生矩阵Wc,将其带入约束条件的目标函数,这时该目标函数转化成为一个弹性网络正则化最小二乘问题,即目标函数转化为:
f ( S c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 + 2 α Σ n = 1 N c | | S · n c | | 1 + β | S c | | F 2 - - - ( 2 )
上述公式(2)可以简化为:
f ( S c ) = t r a c e { φ ( X c ) T φ ( X c ) - 2 φ ( X c ) T φ ( X c ) W c S c } + t r a c e { S c T ( W c T φ ( X c ) T φ ( X c ) W c ) S c } + 2 α Σ n = 1 N c | | S · n c | | 1 + β | | S c | | F 2 = t r a c e { κ ( X c , X c ) } - 2 t r a c e { κ ( X c , X c ) W c S c } + t r a c e { S c T ( W c T κ ( X c , X c ) W c ) S c } + 2 α Σ n = 1 N c | | S · n c | | 1 + β | | S c | | F 2 = t r a c e { κ ( X c , X c ) } - 2 Σ n = 1 N c [ κ ( X c , X c ) W c ] n · S · n c + Σ n = 1 N S · n c T [ W c T κ ( X c , X c ) W c ] S · n c + 2 α Σ k = 1 K Σ n = 1 N c | S k n c | + β Σ k = 1 K Σ n = 1 N c ( S k n c ) 2 - - - ( 3 )
进一步把公式(3)分解成一系列子问题求解;针对Sc中的每一个元素进行求解,并剔除掉与求解无关的项,则公式(3)可以简化为:
f ( S k n c ) = - 2 [ κ ( X c , X c ) W c ] n k S k n c + ( S k n c ) 2 [ W c T κ ( X c , X c ) W c ] k k + 2 Σ l = 1 , l ≠ k K [ W c T κ ( X c , X c ) W c ] l k S k n c + 2 α | S k n c | + β ( S k n c ) 2 - - - ( 4 )
根据抛物线理论,很容易求出公式(4)的解;并且由于每个样本点是独立的,每次求解Sc的一行,其求解公式如下:
S k · c = 1 1 + β min { [ W c T κ ( X c , X c ) ] k · - [ E S c ‾ k ] k · , - α } + 1 1 + β max { [ W c T κ ( X c , X c ) ] k · - [ E S c ‾ k ] k · , α } - - - ( 5 )
式中,I表示单位阵;
遍历Sc的每一列,完成Sc的一次更新;
(4)固定步骤(3)中更新后的Sc,更新Wc,这时约束条件的目标函数转换为一个l2范数约束的最小二乘问题,即目标函数转化为:
f ( W c ) = | | φ ( X c ) - φ ( X c ) W c S c | | F 2 s . t . | | φ ( X c ) W · k c | | 2 2 ≤ 1 , ∀ k = 1 , 2 , ... , K . - - - ( 6 )
上述公式(6)采用拉格朗日乘子的方法求解,最终求得的解为:
W · k c = ( S · k c ) - [ W c ‾ k F ] · k ( S k · c T - [ W c ‾ k F ] · k ) T κ ( X c , X c ) ( ( S k · c ) T - [ W c ‾ k F ] · k ) - - - ( 7 )
式中,F=ScScT,
(5)交替迭代步骤(3)和步骤(4),最终得到最优稀疏编码词典Bc=φ(Xc)Wc
(6)按照步骤(1)至(5)获得每类样本的最优稀疏编码词典,将每类样本得到的最优稀疏编码词典放在一起,获得词典B=[B1,…,Bc,…,BC];
步骤二:对样本进行分类,其步骤为:
(1)读取待识别测试样本的图像特征,并对图像特征进行二范数归一化,定义y∈RD×1表示一幅待识别的测试样本图像特征;
(2)将测试样本图像特征y映射到核空间φ(y);
(3)使用步骤一中获得的词典B,对核空间φ(y)进行拟合,拟合函数为:
f ( s ) = | | φ ( y ) - B s | | 2 2 + 2 α | | s | | 1 + β | | s | | 2 2 - - - ( 8 )
式中s表示核空间中测试样本图像特征y的稀疏编码;
(4)对步骤(3)中的拟合函数进行求解,求解结果为:
s · k = 1 1 + β min { [ W c T κ ( X c , y ) ] k · - [ W c ^ T κ ( X c , X c ) W c s ‾ k ] k · , - α } + 1 1 + β max { [ W c T κ ( X c , y ) ] k · - [ W c ^ T κ ( X c , X c ) W c s ‾ k ] k · , α } - - - ( 9 )
式中,s=[s1,…,sc,…,sC];
(5)求核空间φ(y)在每类样本所构成子空间的拟合误差,用r(c)表示,其表达式为:
r ( c ) = | | φ ( y ) - B c s c | | 2 2 = | | φ ( y ) - φ ( X c ) W c s c | | 2 2 - - - ( 10 )
(6)比较核空间φ(y)和每类样本的拟合误差,待识别图像则属于拟合误差最小的那个类别。
CN201610620582.2A 2016-07-29 2016-07-29 弹性网络约束自解释稀疏表示分类器的设计方法 Pending CN106250929A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610620582.2A CN106250929A (zh) 2016-07-29 2016-07-29 弹性网络约束自解释稀疏表示分类器的设计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610620582.2A CN106250929A (zh) 2016-07-29 2016-07-29 弹性网络约束自解释稀疏表示分类器的设计方法

Publications (1)

Publication Number Publication Date
CN106250929A true CN106250929A (zh) 2016-12-21

Family

ID=57606980

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610620582.2A Pending CN106250929A (zh) 2016-07-29 2016-07-29 弹性网络约束自解释稀疏表示分类器的设计方法

Country Status (1)

Country Link
CN (1) CN106250929A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875928A (zh) * 2017-05-15 2018-11-23 广东石油化工学院 多输出回归网络及学习方法
CN111695464A (zh) * 2020-06-01 2020-09-22 温州大学 一种基于融合核的线性核化特征空间成组性的建模方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104392251A (zh) * 2014-11-28 2015-03-04 西安电子科技大学 一种基于半监督字典学习的高光谱图像分类方法
CN105608433A (zh) * 2015-12-23 2016-05-25 北京化工大学 一种基于核协同表达的高光谱图像分类方法
CN105740908A (zh) * 2016-01-31 2016-07-06 中国石油大学(华东) 基于核空间自解释稀疏表示的分类器设计方法
CN105760821A (zh) * 2016-01-31 2016-07-13 中国石油大学(华东) 基于核空间的分类聚集稀疏表示的人脸识别方法
CN105787430A (zh) * 2016-01-12 2016-07-20 南通航运职业技术学院 加权协同表征与线性表示分类相融合的二级人脸识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104392251A (zh) * 2014-11-28 2015-03-04 西安电子科技大学 一种基于半监督字典学习的高光谱图像分类方法
CN105608433A (zh) * 2015-12-23 2016-05-25 北京化工大学 一种基于核协同表达的高光谱图像分类方法
CN105787430A (zh) * 2016-01-12 2016-07-20 南通航运职业技术学院 加权协同表征与线性表示分类相融合的二级人脸识别方法
CN105740908A (zh) * 2016-01-31 2016-07-06 中国石油大学(华东) 基于核空间自解释稀疏表示的分类器设计方法
CN105760821A (zh) * 2016-01-31 2016-07-13 中国石油大学(华东) 基于核空间的分类聚集稀疏表示的人脸识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
B.D LIU等: "Class specific subspace learning for collaborative representation", 《2014 IEEE INTERNATIONAL CONFERENCE ON SYSTEMS, MAN, AND CYBERNETICS (SMC)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108875928A (zh) * 2017-05-15 2018-11-23 广东石油化工学院 多输出回归网络及学习方法
CN108875928B (zh) * 2017-05-15 2021-02-26 广东石油化工学院 多输出回归网络及学习方法
CN111695464A (zh) * 2020-06-01 2020-09-22 温州大学 一种基于融合核的线性核化特征空间成组性的建模方法

Similar Documents

Publication Publication Date Title
US11170502B2 (en) Method based on deep neural network to extract appearance and geometry features for pulmonary textures classification
CN105740908B (zh) 基于核空间自解释稀疏表示的分类器设计方法
CN103605972B (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN101419671B (zh) 基于模糊支持向量机的人脸性别识别方法
Xu et al. Stacked Sparse Autoencoder (SSAE) based framework for nuclei patch classification on breast cancer histopathology
CN106897685A (zh) 基于核非负矩阵分解的字典学习和稀疏特征表示的人脸识别方法及***
CN109992779A (zh) 一种基于cnn的情感分析方法、装置、设备及存储介质
CN108090830B (zh) 一种基于面部画像的信贷风险评级方法和装置
CN105138973A (zh) 人脸认证的方法和装置
CN105868796A (zh) 基于核空间的线性鉴别稀疏表示分类器的设计方法
CN103824054A (zh) 一种基于级联深度神经网络的人脸属性识别方法
CN110751038A (zh) 一种基于图注意力机制的pdf表格结构识别方法
CN102930301A (zh) 基于特征权重学习与核稀疏表示的图像分类方法
CN109948467A (zh) 人脸识别的方法、装置、计算机设备和存储介质
CN111401156A (zh) 基于Gabor卷积神经网络的图像识别方法
CN105550649A (zh) 基于全耦合局部约束表示的极低分辨率人脸识别方法及***
CN108154924A (zh) 基于支持向量机的阿尔茨海默症特征分类方法及***
CN110349170A (zh) 一种全连接crf级联fcn和k均值脑肿瘤分割算法
CN106021402A (zh) 用于跨模态检索的多模态多类Boosting框架构建方法及装置
CN109948609A (zh) 基于深度学习的智能阅卷定位方法
CN115658886A (zh) 基于语义文本的智能肝癌分期方法、***及介质
CN106250929A (zh) 弹性网络约束自解释稀疏表示分类器的设计方法
CN108520201A (zh) 一种基于加权混合范数回归的鲁棒人脸识别方法
CN104933410A (zh) 一种高光谱图像光谱域与空间域联合分类方法
CN110210562A (zh) 基于深度网络和稀疏Fisher矢量的图像分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination