一种基于二维主元分析的图像识别方法和***
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于二维主元分析的图像识别方法和***。
背景技术
随着技术的发展,越来越多的工作已经可以通过计算机来完成以提高效率,这些技术可以统称为人工智能。其中,图像识别是人工智能的重要领域,随着技术的发展,对图像识别精确度的要求也越来越高。这是由于在海量图像中识别出相似或相同的图片是无法用人力完成的,而如果计算机通过训练样本进行训练后获取准确的识别模型,就可以高效且准确的对海量图片中进行识别。现有技术中提高图像识别率的关键在于对图像特征的提取,而在强噪声背景下,图像目标特征提取一直是一个难题。
主成分分析(Principal Component Analysis,PCA)是图像识别中提取特征的一种常用的线性变换方法,此算法已经发展的很成熟,一维PCA算法在人脸识别技术中,需要把二维图像矩阵转化为一维向量。虽然此方法具有简单、快速和易行等特点,能够整体上反映了人脸图像的灰度相关性,但是此方法导致了高维空间并且计算复杂度的相对提升,即小样本大维数的计算量复杂度,使得图像失去了结构信息,不利于准确的检测识别。
针对一维PCA的缺陷,参考文献[1]提出了一种基于2DPCA的人脸识别算法。2DPCA算法是一种线性无监督的统计方法,提出了直接对图像矩阵进行处理的特征提取方法,克服了一维PCA提取特征将二维图像矩阵转成一维向量的问题,在很大程度上减少了计算量。2DPCA还利用了样本间的差异,有效的保留了样本的结构信息,增加了识别信息,又成为了新的研究热点。文献[2]阐释了矩阵理论中线性变换的应用,通过应用2DPCA求出特征向量之后再采用经典一维PCA技术做进一步的压缩,从而使维数减少,结果表明对图像直接求协方差矩阵,比对一维PCA的向量在识别率上更有效。参考文献[3]-[7]都是在经典2DPCA算法上进行了改进,但是类内特征向量考虑的不全。
图像识别技术在不断的更新和优化,由经典的PCA算法开始,陆续出现算法简化的2DPCA算法、SVM以统计分析知识分类人脸、卷积神经网络算法直接对大量人脸图像进行训练、以及改进的PCA算法和改进的2DPCA算法等。文献[8]-[10]是基于局部的特征提取方法,这些算法只利用局部的信息,却忽略了原始人脸图像的全局特征,信息不够完整。参考文献[11]中提出了基于类内平均分块2DPCA的人脸识别方法,此方法先对图像矩阵进行分块,将进行类内平均归一化后的子图像块用于构造总体散布矩阵,再进行投影,能快速降低特征的维数,避免使用奇异值分解,同时缩小了类内样本识别距离。实验结果表明,该方法识别性能优于2DPCA算法。以上算法都是2DPCA算法直接对图像处理,参考文献[12]是结合WT和2DPCA的优点,提出了一种人脸识别算法,由结果可知,直接对图像进行2DPCA降维,不能有效的解决外界的影响(如ORL人脸数据库上的表情与姿态的变化),以至于不能获得较好的识别效果,然而利用小波处理图像后,识别率明显提高。
综上所述,这些算法虽然识别率略高于经典的2DPCA人脸识别算法,但是对特征相近,识别效果仍然不太好。分析表明,这些算法都没有利用特征向量间的冗余信息,难以获得投影的最大值,所以提取的信息不够准确。
本发明涉及的参考文献如下,本发明实施例将下述的12篇参考文献全文引用于此:
[1]Jian Yang,David Zhang,Alejandro F Frangi et al.Two-DimensionalPCA:A New Approach to Appear-ance-Based Face Representation and Recognition[J].IEEE Trans PatternAnalysis andMachine Intelligence,2004,26(1):131~137.
[2]谭子尤,梁靖.基于PCA+2DPCA的人脸识别分析方法[J].吉首大学学报.2011,32(3):55-58.
[3]Liwei Wang,Xiao Wang,Xuerong Zhang et al.The equivalence of two-dimensional PCAto linebased PCA[J].Pattern recognition Letters,2005,26(1):57-60.
[4]李德福,黄新.基于二维PCA和SVM算法的人脸识别***[J].桂林电子科技大学学报.2017,37(5):391-395.
[5]冯飞,蒋宝华,刘培学,陈玉杰.改进的2DPCA算法在人脸识别中的应用[J].计算机科学.2017,44(11A):267-269.
[6]叶学义,王大安,宦天枢,夏经文,顾亚风.基于张量的2D-PCA人脸识别算法[J].计算机工程与应用.2017,53(6):1-6.
[7]LI Xiaodong,FEI Shumin.New face recognition method based onimprovedmodular 2DPCA[J].Journal ofSystem Simulation,2009,21(15):4672-4675(inChinese).
[8]WANG LiWei,WANG Xiao,CHANG Ming,FENG Ju-Fu.Is Two-dimensionalPCAaNew Technique?[J].ActaAutomatica Sinica,2005,31(5):782-787.
[9]Ming-Hsuan Yang.Kernel Eigenfaces vs.Kernel Fisherfaces:FaceRecognition Using Kernel Methods.Processing IEEE International ConferenceAutomatic Face and Gesture Recognition.Washington D.C.,2002,3:215-220.
[10]Shutao Li,Dayi Gong,Yuan Yuan.Face recognit-ion using Weber localdescriptors[J].Neurocomputing,2013,122(12):272-283.
[11]李靖平.基于分块的2DPCA人脸识别方法[j].长春师范学院学报.2014,33(1):40-44.
[12]甘俊英,李春芝.基于小波变换、二维主元分析与独立元分析的人脸识别方法[J].模式识别与人工智能.2007,20(3):377-381.
发明内容
本发明所要解决的技术问题是提供一种基于二维主元分析的图像识别方法和***,以解决现有技术中图像识别技术的图像目标特征提取方法存在精确度低和计算量大的问题。
为了解决上述技术问题,本发明的技术方案是这样实现的:
一种基于二维主元分析的图像识别方法,包括基于特征增强的图像预处理步骤、基于标架理论的二维主成分分析步骤;
基于特征增强的图像预处理步骤用于对训练样本图像进行一级小波分解以获取图像的四个分量并添加零矩阵以获取图像的小波重构图像:
基于标架理论的二维主成分分析步骤是通过将小波重构图像进行线性变换投影到投影区间以获取小波重构图像的投影特征向量,然后获取训练样本的投影特征向量的协方差矩阵,该协方差矩阵的特征值中最大的d个特征值,在相邻的两个特征值中间进行插值以得到2d种组合的特征向量;并利用该2d种组合的特征向量来提取图像特征。
其中,所述基于特征增强的图像预处理步骤具体包括:
步骤11、获取训练样本图像集合Fi∈Rm×n,其中i=1,2,…,N,N为训练样本数;其中m和n分别代表图像大小的行和列维数;针对训练样本图像集合中给定的图像F采用一级小波分解,以获得该图像F的低频分量LL、水平高频分量HL、垂直高频分量LH、对角高频分量HH;其中图像F的低频分量LL为原图像的平滑像;
步骤12、针对步骤11获得的四个分量添加零矩阵以进行扩展以与训练样本匹配;扩展后的矩阵LL、HL、LH、HH为:
LL∈Rm×n
LH∈Rm×n
HL∈Rm×n;
HH∈Rm×n
步骤13、通过公式(1)获取图像F的小波重构图像A:
A=αLL+βHL+βLH+βHH (1)
其中参数α和β给定系数,都在1附近;
步骤14、针对训练样本图像Fi∈Rm×n中的训练样本图像F1,F2,...,FN,获取小波重构图像A1,A2,...,AN组成的小波重构图像集Ai(i=1,...,N)∈Rm×n。
其中,所述基于标架理论的二维主成分分析步骤具体包括:
步骤21、获取训练样本图像Fi∈Rm×n以及小波重构图像集Ai(i=1,...,N)∈Rm×n;通过以下公式(2)将小波重构图像集中的每一小波重构图像Ai进行线性变换投影到X上得到图像Ai的投影特征向量Yi;
Yi=AiX (2)
其中X∈Rn×1为投影空间;
步骤22、通过以下的公式(3)获取训练样本投影特征向量Yi的协方差矩阵Sx的迹tr(SX)
其中T为转置;tr(SX);当迹tr(SX)为最大值时,则找到一个将所有训练投影在上面的投影空间X,使得投影后所得特征向量的总体散布矩阵最大化;
通过公式(3)式可以得到如下公式(4)和公式(5):
tr(Sx)=XTGX (4)
其中Sx是滤波算法中的协方差矩阵,G是主元分析中图像的协方差矩阵,最佳投影空间X中的特征向量是归一化的标准正交向量;其中协方差矩阵G的特征值表示为λi(i=1,2,…,n),且λ1≥λ2…≥λn,且特征值对应的特征向量为ui(i=1,2,…,n),则特征向量集合U=[u1,u2,…,un];因此,矩阵G的谱分解为:
把协方差矩阵G带入公式(4)式即可求得:
步骤23、选择前d个特征值λi(i=1,2,…,d)对应的特征向量ui(i=1,2,…,d)来构造特征子空间,其中d≤n,则前d个特征值对应的特征向量集合Ud=[u1,u2,…,ud]
x是矩阵X的列向量;
当协方差矩阵G的特征值λi取最大时,对应的特征向量ui为最大值,特征向量像ui在投影空间X上的投影为最大,而当投影空间X的特征向量为最大时,tr(Sx)为最大值;
从所述协方差矩阵G的特征值中选择d个取值最大的特征值,则该d个取值最大的特征值对应的正交化标准特征向量为:
步骤24、在获取的d个取值最大的特征值X1,X2,…Xd,对投影轴Xi和Xj(i,j=1,2,…,d)之间***一个值,以此类推,在每两个特征向量之间都***一个值以得到2d种组合的特征向量;并利用该2d种组合的特征向量来提取图像特征。本发明实施例中,是采用相邻的两个特征向量之间***一个值。
其中,利用该2d种组合的特征向量来提取图像特征,具体包括:
在每两个特征向量之间***的值为该两个特征向量的均值,以得到一个不标准正交基向量集合;
对于给定的图像A,在投影到新得到投影空间X'k上得:
Yk'=AX'k(k=1,1.5,2,…,d) (12)
以得到的投影特征向量Y1',Y1'.5,Y2'…,Yd',作为图象A的主成分向量,并从中选取d个主成分向量组成一个m×d的矩阵,作为图像A的特征图像,即:
B'=[Y1',Y1'.5,Y2',...,Yd']=A[X'1,X1'.5,X'2,...,X'd] (13)。
其中,获取图像A的特征图像B',对特征图像B'进行识别分类。
同时,本发明还提出了一种根据以上所述的基于二维主元分析的图像识别***,包括:基于特征增强的图像预处理模块、基于标架理论的二维主成分分析模块;
其中基于特征增强的图像预处理模块用于对训练样本图像进行一级小波分解以获取图像的四个分量并添加零矩阵以获取图像的小波重构图像:
基于标架理论的二维主成分分析模块用于通过将小波重构图像进行线性变换投影到投影区间以获取小波重构图像的投影特征向量,然后获取训练样本的投影特征向量的协方差矩阵,该协方差矩阵的特征值中最大的d个特征值,在相邻的两个特征值中间进行插值以得到2d种组合的特征向量;并利用该2d种组合的特征向量来提取图像特征。
本发明相比现有技术的有益效果:
本发明用在图像识别的图像目标特征提取精确度高,计算量小。具体来说:
考虑到图像会受到人为以及环境噪声影响的问题,首先对图像做基于特征增强的图像预处理,采用小波变换对图像进行处理,使得图像不受其他噪声因素的影响。
然后提出了基于标架理论的2DPCA算法对人脸进行特征提取,在处理特征值对应的特征向量时,使用标架理论,将正交主元空间扩展为标架的(非正交)的主元空间,能利用图像的冗余信息,在识别图像特征相近时,可以更有效的提取特征信息来进行图像识别。
通过利用小波理论与标架理论相结合的二维主元分析来进行图像识别,已经在标准ORL人脸识别数据库上进行仿真实验,实验结果表明,不仅提高了人脸识别率,而且识别所用的时间也较短。
附图说明
图1是本发明的实施流程示意图;
图2是本发明的实施流程中一级小波分解的原理图。
具体实施方式
以下结合附图1和图2,以及具体实施例,对本发明作出进一步描述。
为了使得图像检测和识别中的特征提取更为准确,本发明实施例针对强噪声背景下的图像目标特征相近这一问题,综合考虑了多种已有技术,考虑到图像会受到人为以及环境噪声的影响,提出了一种小波理论与标架理论相结合的二维主元分析技术方案。该技术方案首先通过小波变换技术对图像进行预处理以实现特征增强;然后对预处理过得到图像矩阵求特征向量,对特征向量进行标架插值处理以使得在标架理论上获得更充分的信息,更好的在图像上提取特征。上述技术方案在标准ORL人脸识别数据库上与其他算法进行对比,最后通过仿真实验在识别率和识别时间上的对比,已经证明了本申请的技术方案的有效性。
如图1所示的,本发明实施例提出了一种基于二维主元分析的图像识别方法,包括:基于特征增强的图像预处理步骤、基于标架理论的二维主成分分析步骤;
基于特征增强的图像预处理步骤用于对训练样本图像进行一级小波分解以获取图像的四个分量并添加零矩阵以获取图像的小波重构图像:
基于标架理论的二维主成分分析步骤是通过将小波重构图像进行线性变换投影到投影区间以获取小波重构图像的投影特征向量,然后获取训练样本的投影特征向量的协方差矩阵,该协方差矩阵的特征值中最大的d个特征值,在相邻的两个特征值中间进行插值以得到2d种组合的特征向量;并利用该2d种组合的特征向量来提取图像特征。
本发明实施例的技术方案具体包括:
一、基于特征增强的图像预处理
对于检测和识别强噪声背景下的小目标图像,直接对原图像处理这无疑会影响检测结果。因此经过图像的预处理,将有利于提取图像的特征,进而提高检测精度和识别率。在ORL人脸数据库中图像受姿态等特征差异不太大因素的影响,通过小波变换可以增强姿态间的特征信息,以便于提高识别率。该方法具体包括:
如图2所示的,对于给定的图像F采用一级小波分解,以获得该图像F的低频分量、水平高频分量、垂直高频分量、对角高频分量;图2中LL表示图像的低频分量,为原图像的平滑像;HL表示图像的水平高频分量,LH表示图像的垂直高频分量,HH则表示图像的对角高频分量。
训练样本图像集合i=1,2,…,N,其中i=1,2,…,N,N为训练样本数;其中m和n分别代表图像大小的行和列维数;将训练样本的图像依次进行小波变换以获取图像的一级小波分解;提取小波分解图中的低频分量和高频分量,该低频分量和高频分量均表示小波分解后的子带图像。为了使其与训练样本匹配,需要对其添加零矩阵以进行扩展,则矩阵LL、HL、LH、HH为:
LL∈Rm×n
LH∈Rm×n
HL∈Rm×n;
HH∈Rm×n
然后通过公式(1)获取图像F的小波重构图像A:
A=αLL+βHL+βLH+βHH (1)
其中参数α和β给定系数;
针对训练样本图像Fi∈Rm×n中的训练样本图像F1,F2,…,FN,获取小波重构的图像A1,A2,...,AN组成的小波重构图像集Ai(i=1,...,N)∈Rm×n。
二、经典的2DPCA算法
现有的2DPCA算法的步骤包括:
获取训练样本图像Fi∈Rm×n以及小波重构图像集Ai(i=1,...,N)∈Rm×n;通过以下公式(2)将小波重构图像集中的每一小波重构图像Ai进行线性变换投影到X上得到图像Ai的投影特征向量Yi;
Yi=AiX (2)
其中X∈Rn×1为投影空间,最佳投影空间X根据特征向量Yi的散布情况来确定;
通过以下的公式(3)获取训练样本投影特征向量Yi的协方差矩阵Sx的迹tr(SX):
其中T为转置;j=1,...,N;当迹tr(SX)为最大值时,则找到一个将所有训练投影在上面的投影空间X,使得投影后所得特征向量的总体散布矩阵最大化;
通过公式(3)式可以得到如下公式(4)和公式(5):
tr(Sx)=XTGX (4)
其中Sx是滤波算法中的协方差矩阵,G是主元分析中图像的协方差矩阵,最佳投影空间X中的特征向量是归一化的标准正交向量;其中协方差矩阵G的特征值表示为λi(i=1,2,…,n),且λ1≥λ2…≥λn,且特征值对应的特征向量为ui(i=1,2,…,n),则特征向量集合U=[u1,u2,…,un];因此,矩阵G的谱分解为:
把协方差矩阵G带入公式(4)式即可求得:
选择前d个特征值λi(i=1,2,…,d)对应的特征向量ui(i=1,2,…,d)来构造特征子空间,其中d≤n,则前d个特征值对应的特征向量集合Ud=[u1,u2,…,ud]
x是矩阵X的列向量;
此时,只有当协方差矩阵G的特征值λi取最大时,对应的特征向量ui为最大值,特征向量ui在投影空间X上的投影为最大,所以当投影空间X的特征向量为最大时,tr(Sx)为最大值;
物理意义是:图像矩阵在空间上面投影之后得到的特征向量的总体分散程度最大。最佳投影空间即为图像总体散布矩阵G的最大特征值所对应的特征向量,这里的最佳投影空间X中的向量是归一化的标准正交向量,使得tr(Sx)最大化。
即设协方差矩阵G的特征值从大到小,选取前d个特征值对应的正交化标准特征向量为:
图像的特征矩阵:X1…Xd可以用来提取特征,对于给定的图像样本A,投影到Xk上,
则:Yk=AXk(k=1,2,…,d) (10)
这样我们就可以得到一组投影特征向量Y1,…,Yd,叫做图像A的主成分向量。则选取一定的d值可以组成一个m×d的矩阵,叫做图像A的特征图像,即:
B=[Y1,Y2,...,Yd]=A[X1,X2,...,Xd] (11)
则B称为所提取A的特征矩阵或者特征图像。
三、标架理论的2DPCA的算法
前述第二项中对经典的2DPCA算法进行了详细说明。针对强噪声背景下的图像小目标时,对于某些特征相近或是提取的信息不完全等情况,本发明实施例提出了一种采用标架理论的2DPCA会使得提取特征更准确。本发明实施例中将该方法称为“标架理论的2DPCA”。
本发明实施例提出的标架理论的2DPCA包括:
经过2DPCA提取的特征X1,X2,...Xd,我们可以对投影轴进行操作,在投影轴Xi和Xj(i,j=1,2,…,d)之间***一个值。以此类推,在每两个特征向量之间都***一个值,以得到2d种组合的特征向量;用这些组合来提取图像特征。本发明实施例中,是采用相邻的两个特征向量之间***一个值。
在相邻两个特征向量之间***的值还为该两个特征向量的均值,以得到一个不标准正交基向量集合;
对于给定的图像A,在投影到新得到投影空间X'k上得:
Yk'=AX'k(k=1,1.5,2,…,d) (12)
这样得到的投影特征向量Y1',Y1'.5,Y2'…,Yd',作为图像A的主成分向量,并从中选取d个主成分向量组成一个m×d的矩阵,叫做图像A的特征图像,即:
B'=[Y1',Y1'.5,Y2',...,Yd']=A[X'1,X1'.5,X'2,...,X'd] (13)
则B'称为采用标架理论的2DPCA算法下的提取图像A的特征图像。
最后利用上面得到的特征图像进行识别分类。
四、仿真实验
图像样本经过小波变换后再经标架理论的2DPCA算法,得到每个图像的特征矩阵,采用最近邻准则进行分类,则任意的训练样本特征矩阵
和测试样本特征矩阵
其中
代表
和
之间的欧几里得距离,其中B'
1,B'
2,...B'
N是每个类别的样本数,样本总数为N,最后依据最近邻准则完成识别。
4.1实验条件
为验证小波理论与标架理论相结合的二维主元分析的图像识别的有效性,本项目与经典的2DPCA算法、经过小波变换的2DPCA算法以及未经过小波处理的基于标架理论的2DPCA算法进行比较。本项目的实验对象是ORL人脸数据库。ORL人脸数据库有40人、每人10种不同的姿态及表情,共400幅图像;每张人脸图像的尺寸为112×92像素,灰度级为256。ORL人脸数据库的人脸面部表情(睁着眼睛或者闭着眼睛,笑的,非笑的)及面部修饰(戴眼镜或者不戴眼镜)都是变化的。采用取自ORL人脸库第一个人的样本。在ORL人脸数据库上,选择40人中每人的前5幅共200幅人脸图像作为训练样本,并以此作为训练样本集。其余每人的后五幅图像共200幅图像作为测试样本,此作为测试样本集。本项目是当小波处理图像中(1)式的α、β分别为1.5和1.1时经过的小波变换之后的重构样本图像。在基于标架理论的2DPCA算法和2DPCA算法中,选择协方差矩阵中较大特征值对应的特征向量作为最佳投影方向。由于最佳投影轴影响人脸的正确识别率,实验中,探讨了投影轴变化时,经过小波变换的基于标架理论的2DPCA算法和经典的2DPCA算法、以及未经过小波变换的基于标架理论的2DPCA算法和经典的2DPCA算法在ORL人脸数据库上正确识别率和所用时间的变化情况。
4.2结果分析
由表1可知在经过小波变换后,基于标架理论的2DPCA算法在ORL人脸数据库上正确识别率随投影轴变化的趋势。对比之下,本文算法比经过小波变换的2DPCA算法以及未经过小波变换的基于标架理论的2DPCA算法和经典的2DPCA算法在识别率上相对有所提高。如下表1所示:
表1 ORL库中不同主成分下2DPCA算法与本文算法的识别率比较(%)
主成分 |
P=6 |
P=8 |
P=10 |
P=20 |
P=45 |
2DPCA |
89.9 |
90.2 |
91.7 |
92.5 |
93.8 |
WT-2DPCA |
90.1 |
90.3 |
91.9 |
92.6 |
93.9 |
未经过小波变换的标架理论2DPCA |
90.1 |
90.6 |
92.1 |
92.9 |
94.2 |
本文算法 |
92.3 |
93.1 |
93.9 |
94.1 |
94.8 |
由表2可知在经过小波变换后,基于标架理论的2DPCA算法在ORL人脸数据库上正确识别时间随投影轴变化的趋势。对比之下,本文算法比经过小波变换的2DPCA算法以及未经过小波变换的基于标架理论的2DPCA算法和经典的2DPCA算法在识别所用时间上有所减少。如下表2所示:
表2 ORL库中不同主成分下2DPCA算法与本文算法的识别时间比较(s)
以上所述的实施例,仅仅是对本发明的优选实施方式的描述。在不脱离本发明设计精神的前提下,本领域技术人员对本发明的技术方案作出的各种变形和改进,均应属于本发明权利要求书确定的保护范围。