CN103279746B - 一种基于支持向量机的人脸识别方法及*** - Google Patents

一种基于支持向量机的人脸识别方法及*** Download PDF

Info

Publication number
CN103279746B
CN103279746B CN201310210372.2A CN201310210372A CN103279746B CN 103279746 B CN103279746 B CN 103279746B CN 201310210372 A CN201310210372 A CN 201310210372A CN 103279746 B CN103279746 B CN 103279746B
Authority
CN
China
Prior art keywords
sample
face
training
difference
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310210372.2A
Other languages
English (en)
Other versions
CN103279746A (zh
Inventor
张莉
夏佩佩
丁春涛
王邦军
李凡长
何书萍
杨季文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201310210372.2A priority Critical patent/CN103279746B/zh
Publication of CN103279746A publication Critical patent/CN103279746A/zh
Application granted granted Critical
Publication of CN103279746B publication Critical patent/CN103279746B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于支持向量机的人脸识别方法及***。所述方法包括:获取人脸样本训练集:对于人脸样本训练集中的每一个人脸样本,随机选取k个与该人脸样本属于同一个类别的人脸样本作为同类样本,随机选取k个与该人脸样本属于不同类别的人脸样本作为异类样本;根据所述同类样本和所述异类样本生成差样本对集合;所述差样本对集合中,对于所述人脸样本训练集中的每一个人脸样本,均有2k个同类差样本对,以及2k个异类差样本对;对于差样本对集合,采用支持向量机训练得到相似性判断模型;根据所述相似性判断模型得到分类模型,采用所述分类模型进行人脸识别。采用本发明的方法或***,可以在保证快速采样的前提下提高人脸识别的效率。

Description

一种基于支持向量机的人脸识别方法及***
技术领域
本发明涉及人脸识别领域,特别是涉及一种基于支持向量机的人脸识别方法及***。
背景技术
人脸识别是指利用分析比较人脸视觉特征信息进行身份鉴别的计算机技术。目前,基于支持向量机(Support Vector Machine,SVM)的人脸识别方法发展较为迅速。
所谓支持向量是指那些在间隔区边缘的训练样本点。这里的“机(machine,机器)”实际上是“算法”的含义。在机器学习领域,常把一些算法看做是一个机器。支持向量机建立在统计学习理论的VC维(Vapnik-Chervonenkis Dimension)理论和结构风险最小原理基础上,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以求获得最好的推广能力。其中,VC维反映了函数集的学习能力,VC维越大则学习机器越复杂(容量越大)。
P.Jonathon Phillips在文章《Support Vector Machines Applied to FaceRecognition》中提出将支持向量机(SVM)应用到人脸识别问题中。在该文章提出的方法中,支持向量机首先要学习一个相似性函数,构造样本对,然后通过人脸图像之间的相似性来进行人脸识别。
但是,该方法在构造样本对的过程中存在问题。一方面,该方法会产生大量的训练样本对,可能导致该方法的运行时间过长甚至内存溢出而无法执行。另一方面该方法会产生不平衡数据问题。不平衡数据问题是指,由于人脸识别问题的特殊性,会出现相似样本对和不相似样本对之间的极大不平衡,这会在很大程度上影响支持向量机的性能。
发明内容
本发明的目的是提供一种基于支持向量机的人脸识别方法及***,能够减少训练样本对的数目,同时使相似样本对和不相似样本对的数目保持平衡,进而可以在保证快速采样的前提下提高人脸识别的效率。
为实现上述目的,本发明提供了如下方案:
一种基于支持向量机的人脸识别方法,包括:
获取人脸样本训练集的步骤:所述人脸样本训练集中包含有多个类别的人脸样本集合,每个类别的人脸样本集合中包含多个人脸样本;
选取同类样本和异类样本的步骤:对于所述人脸样本训练集中的每一个人脸样本,随机选取k个与该人脸样本属于同一个类别的人脸样本作为同类样本,随机选取k个与该人脸样本属于不同类别的人脸样本作为异类样本;
生成差样本对集合的步骤:根据所述同类样本和所述异类样本生成差样本对集合;所述差样本对集合中,对于所述人脸样本训练集中的每一个人脸样本,均有2k个同类差样本对,以及2k个异类差样本对;
生成分类模型的步骤:对于所述差样本对集合,采用支持向量机训练得到相似性判断模型,根据所述相似性判断模型得到分类模型;
人脸识别的步骤:采用所述分类模型进行人脸识别。
可选的,所述采用支持向量机训练得到相似性判断模型,包括:
采用核函数为高斯径向基函数的支持向量机训练得到所述相似性判断模型。
可选的,所述生成差样本对集合之前,还包括:
对所述人脸样本训练集中的各个样本进行随机降维,各个样本降维后的维数相同;
采用降维后的人脸样本生成差样本对集合;
相应的,采用所述分类模型进行人脸识别时,包括:
对待识别人脸样本进行随机降维,降维后的所述待识别人脸样本的维数与降维后的人脸样本的维数相同。
可选的,所述采用所述分类模型进行人脸识别,包括:
获取待识别人脸样本;
分别从所述人脸训练集每一类别的样本集合中随机选取k个人脸样本,生成2k个待识别差样本对,得到待识别差样本对集合;
利用所述分类模型对所述待识别差样本对集合进行分析,得到所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
根据所述相似性概率,确定所述待识别人脸样本归属的类别。
可选的,所述方法还包括:
重复执行选取同类样本和异类样本的步骤和生成差样本对集合的步骤,得到多个相似性判断模型,根据所述多个相似性判断模型得到分类模型;
相应的,所述利用所述分类模型对所述待识别差样本对集合进行分析,包括:
利用所述多个相似性判断模型对所述待识别差样本对集合进行分析,得到多个所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
对多个所述相似性概率求平均值,得到平均相似性概率;
所述确定所述待识别人脸样本归属的类别,包括:
将平均相似性概率最大的类别,确定为所述待识别人脸样本归属的类别。
一种基于支持向量机的人脸识别***,包括:
训练集获取模块,用于获取人脸样本训练集;所述人脸样本训练集中包含有多个类别的人脸样本集合,每个类别的人脸样本集合中包含多个人脸样本;
样本选取模块,用于执行选取同类样本和异类样本的步骤:对于所述人脸样本训练集中的每一个人脸样本,随机选取k个与该人脸样本属于同一个类别的人脸样本作为同类样本,随机选取k个与该人脸样本属于不同类别的人脸样本作为异类样本;
差样本对集合生成模块,用于执行生成差样本对集合的步骤:根据所述同类样本和所述异类样本生成差样本对集合;所述差样本对集合中,对于所述人脸样本训练集中的每一个人脸样本,均有2k个同类差样本对,以及2k个异类差样本对;
分类模型生成模块,用于对于所述差样本对集合,采用支持向量机训练得到相似性判断模型,根据所述相似性判断模型得到分类模型;
人脸识别模块,用于采用所述分类模型进行人脸识别。
可选的,所述分类模型生成模块,包括:
相似性判断模型生成单元,用于采用核函数为高斯径向基函数的支持向量机训练得到所述相似性判断模型。
可选的,还包括:
训练集样本降维模块,用于对所述人脸样本训练集中的各个样本进行随机降维,各个样本降维后的维数相同;以便所述差样本对集合生成模块采用降维后的人脸样本生成差样本对集合;
相应的,所述人脸识别模块,包括:
待识别样本降维单元,用于对待识别人脸样本进行随机降维,降维后的所述待识别人脸样本的维数与降维后的人脸样本的维数相同。
可选的,所述人脸识别模块,包括:
待识别人脸样本获取单元,用于获取待识别人脸样本;
待识别差样本对集合生成单元,用于分别从所述人脸训练集每一类别的样本集合中随机选取k个人脸样本,生成2k个待识别差样本对,得到待识别差样本对集合;
相似性概率计算单元,用于利用所述分类模型对所述待识别差样本对集合进行分析,得到所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
类别确定单元,用于根据所述相似性概率,确定所述待识别人脸样本归属的类别。
可选的,还包括:
重复执行模块,用于控制所述样本选取模块以及所述差样本对集合生成模块重复执行选取同类样本和异类样本的步骤和生成差样本对集合的步骤,得到多个相似性判断模型,根据所述多个相似性判断模型得到分类模型;
相应的,所述相似性概率计算单元包括:
相似性概率计算子单元,用于利用所述多个相似性判断模型对所述待识别差样本对集合进行分析,得到多个所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
平均相似性概率计算子单元,用于对多个所述相似性概率求平均值,得到平均相似性概率;
所述类别确定单元,包括:
类别确定子单元,用于将平均相似性概率最大的类别,确定为所述待识别人脸样本归属的类别。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明的人脸识别方法及***,通过对于所述人脸样本训练集中的每一个人脸样本,随机选取k个同类样本以及k个异类样本,根据所述同类样本以及所述异类样本,生成差样本对集合,对于所述差样本对集合,采用支持向量机训练得到相似性判断模型;根据所述多个相似性判断模型得到分类模型;采用所述分类模型进行人脸识别;一方面由于从所述人脸样本训练集中的每一类别的人脸样本集合中,随机选取k个同类样本以及k个异类样本构造差样本对,与现有技术中,对于所述人脸样本训练集中的每一个人脸样本,选取除该人脸样本外的所有人脸样本构造差样本对相比,能够减少训练样本对的数目;另一方面,由于选取的同类样本以及异类样本的数目相同,所以可以生成相同数目的同类差样本对和异类差样本对,使相似样本对和不相似样本对的数目保持平衡。结合上述两方面的有益效果,本发明的方法或***可以在保证快速采样的前提下提高人脸识别的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于支持向量机的人脸识别方法实施例的流程图;
图2为本发明的基于支持向量机的人脸识别***实施例的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明的基于支持向量机的人脸识别方法实施例的流程图。如图1所示,所述方法包括:
步骤101:获取人脸样本训练集;所述人脸样本训练集中包含有多个类别的人脸样本集合,每个类别的人脸样本集合中包含多个人脸样本;
每个类别的人脸样本集合中的人脸样本,可以是归属于同一个人的人脸样本。同一个类别中的不同人脸样本,采样角度,或者采样时的表情可以是不同的。
步骤102:对于所述人脸样本训练集中的每一个人脸样本,随机选取k个与该人脸样本属于同一个类别的人脸样本作为同类样本,随机选取k个与该人脸样本属于不同类别的人脸样本作为异类样本;其中,k为正整数。
通常每一类别下的人脸样本数目是比较少的,例如10到20个。步骤102中的k的取值小于该类别下的人脸样本数目。
步骤103:根据所述同类样本和所述异类样本生成差样本对集合;所述差样本对集合中,对于所述人脸样本训练集中的每一个人脸样本,均有2k个同类差样本对,以及k个异类差样本对;
假设所述人脸样本训练集中的一个人脸样本为A,k个同类样本为A1,A2,A3,A4,A5,则可以生成的同类差样本对为:A-A1,A-A2,A-A3,A-A4,A-A5;A1-A,A2-A,A3-A,A4-A,A5-A。采用同样的方式可以生成2k个异类差样本对。
步骤104:对于所述差样本对集合,采用支持向量机训练得到相似性判断模型,根据所述相似性判断模型得到分类模型;
可以采用核函数为高斯径向基函数的支持向量机训练得到所述相似性判断模型。
可以根据一个相似性判断模型得到分类模型,也可以根据多个相似性判断模型得到分类模型。当根据一个相似性判断模型得到分类模型时,所述分类模型可以与所述相似性判断模型相同;当根据多个相似性判断模型得到分类模型时,所述分类模型可以是多个相似性判断模型的集合。
设x,z∈X,X属于R(n)空间,非线性函数Φ实现输入空间X到特征空间F的映射,其中F属于R(m),n<<m。根据核函数技术有:
K(x,z)=<Φ(x),Φ(z)>——————(1)
其中:<,>为内积,K(x,z)为核函数。从式(1)可以看出,核函数将m维高维空间的内积运算转化为n维低维输入空间的核函数计算,从而解决了在高维特征空间中计算的“维数灾难”等问题。
本步骤中的高斯径向基函数指的是径向基函数中的高斯核函数。
所谓径向基函数(Radial Basis Function简称RBF),就是某种沿径向对称的标量函数。通常定义为空间中任一点x到某一中心xc之间欧氏距离的单调函数,可记作k(||x-xc||),其作用往往是局部的,即当x远离xc时函数取值很小。
最常用的径向基函数是高斯核函数,形式为k(||x-xc||)=exp{-||x-xc||^2/2*σ^2)}其中xc为核函数中心,σ为函数的宽度参数,控制了函数的径向作用范围。
步骤105:采用所述分类模型进行人脸识别。
具体的,采用所述分类模型进行人脸识别的过程可以包括下述步骤:
步骤A:获取待识别人脸样本;
步骤B:分别从所述人脸训练集每一类别的样本集合中随机选取k个人脸样本,生成2k个待识别差样本对,得到待识别差样本对集合;
步骤C:利用所述分类模型对所述待识别差样本对集合进行分析,得到所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
步骤D:根据所述相似性概率,确定所述待识别人脸样本归属的类别。
其中,步骤C中,利用所述分类模型对所述待识别差样本对集合进行分析,指的是将所述待识别差样本对作为输入值,代入所述分类模型进行计算。分类模型的计算结果表示所述待识别人脸样本与所述人脸训练集中每一类的相似性概率。
步骤D中,可以根据相似性概率的大小,将最大的相似性概率对应的类别,确定为所述待识别人脸样本归属的类别。
综上所述,本实施例的人脸识别方法,通过对于所述人脸样本训练集中的每一个人脸样本,随机选取k个同类样本以及k个异类样本,根据所述同类样本以及所述异类样本,生成差样本对集合,对于所述差样本对集合,采用支持向量机训练得到相似性判断模型;根据所述相似性判断模型得到分类模型;采用所述分类模型进行人脸识别;一方面由于从所述人脸样本训练集中的每一类别的人脸样本集合中,随机选取k个同类样本以及k个异类样本构造差样本对,与现有技术中,对于所述人脸样本训练集中的每一个人脸样本,选取除该人脸样本外的所有人脸样本构造差样本对相比,本实施例的方法能够减少训练样本对的数目;另一方面,由于选取的同类样本以及异类样本的数目相同,所以可以生成相同数目的同类差样本对和异类差样本对,使相似样本对和不相似样本对的数目保持平衡。结合上述两方面的有益效果,本实施例的方法进而可以在保证快速采样的前提下提高人脸识别的效率。
为了进一步提高本发明的人脸识别方法的效率,在步骤103之前,还可以包括下述步骤:
对所述人脸样本训练集中的各个样本进行随机降维,各个样本降维后的维数相同;
采用降维后的人脸样本生成差样本对集合。
其中,人脸样本训练集中的各个样本可以是图片格式。所述降维可以是降低所述各个样本的像素数目。
相应的,当对人脸样本进行降维处理后,采用所述分类模型进行人脸识别时,可以包括如下步骤:
对待识别人脸样本进行随机降维,降维后的所述待识别人脸样本的维数与降维后的人脸样本的维数相同。
为了进一步提高本发明的人脸识别方法的准确性,本发明的人脸识别方法还可以采用以下步骤:
重复执行步骤102和步骤103,得到多个相似性判断模型,根据所述多个相似性判断模型得到分类模型;
例如,可以重复执行步骤102和步骤103各50次,就可以得到50个相似性判断模型。然后可以根据50个相似性判断模型各自的分类结果,综合分析(例如取平均值)得到平均相似性概率。
上述多个相似性判断模型的集合可以构成分类模型。本发明可以根据所述分类模型,进行人脸识别。
相应的,利用所述分类模型对所述待识别差样本对集合进行分析时,可以包括下述步骤:
利用所述多个相似性判断模型对所述待识别差样本对集合进行分析,得到多个所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
对多个所述相似性概率求平均值,得到平均相似性概率;
确定所述待识别人脸样本归属的类别时,可以包括下述步骤:
将平均相似性概率最大的类别,确定为所述待识别人脸样本归属的类别。
本发明还公开了一种基于支持向量机的人脸识别***。图2为本发明的基于支持向量机的人脸识别***实施例的结构图。如图2所示,所述***可以包括:
训练集获取模块201,用于获取人脸样本训练集;所述人脸样本训练集中包含有多个类别的人脸样本集合,每个类别的人脸样本集合中包含多个人脸样本;
样本选取模块202,用于执行选取同类样本和异类样本的步骤:对于所述人脸样本训练集中的每一个人脸样本,随机选取k个与该人脸样本属于同一个类别的人脸样本作为同类样本,随机选取k个与该人脸样本属于不同类别的人脸样本作为异类样本;
差样本对集合生成模块203,用于执行生成差样本对集合的步骤:根据所述同类样本和所述异类样本生成差样本对集合;所述差样本对集合中,对于所述人脸样本训练集中的每一个人脸样本,均有2k个同类差样本对,以及2k个异类差样本对;
分类模型生成模块204,用于对于所述差样本对集合,采用支持向量机训练得到相似性判断模型,根据所述相似性判断模型得到分类模型;
人脸识别模块205,用于采用所述分类模型进行人脸识别。
其中,所述分类模型生成模块204,可以包括:
相似性判断模型生成单元,用于采用核函数为高斯径向基函数的支持向量机训练得到所述相似性判断模型。
所述人脸识别模块205,可以包括:
待识别人脸样本获取单元,用于获取待识别人脸样本;
待识别差样本对集合生成单元,用于分别从所述人脸训练集每一类别的样本集合中随机选取k个人脸样本,生成2k个待识别差样本对,得到待识别差样本对集合;
相似性概率计算单元,用于利用所述分类模型对所述待识别差样本对集合进行分析,得到所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
类别确定单元,用于根据所述相似性概率,确定所述待识别人脸样本归属的类别。
所述***还可以包括:
训练集样本降维模块,用于对所述人脸样本训练集中的各个样本进行随机降维,各个样本降维后的维数相同;以便所述差样本对集合生成模块采用降维后的人脸样本生成差样本对集合;
相应的,所述人脸识别模块205,可以包括:
待识别样本降维单元,用于对待识别人脸样本进行随机降维,降维后的所述待识别人脸样本的维数与降维后的人脸样本的维数相同。
所述***还可以包括:
重复执行模块,用于控制所述样本选取模块202以及所述差样本对集合生成模块203重复执行选取同类样本和异类样本的步骤和生成差样本对集合的步骤,得到多个相似性判断模型,根据所述多个相似性判断模型得到分类模型;
相应的,所述相似性概率计算单元可以包括:
相似性概率计算子单元,用于利用所述多个相似性判断模型对所述待识别差样本对集合进行分析,得到多个所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
平均相似性概率计算子单元,用于对多个所述相似性概率求平均值,得到平均相似性概率;
所述类别确定单元,可以包括:
类别确定子单元,用于将平均相似性概率最大的类别,确定为所述待识别人脸样本归属的类别。
为了进一步理解本发明的方法及有益效果,下面用一个更加具体的例子进行说明。
本例中,人脸样本训练集采用UMIST人脸数据库。UMIST人脸数据集包含564张图像,共20人,涵盖了不同的种族、性别和外貌。该数据集中每个个体拍摄的照片都有从侧面到正面的不同角度的连续姿态变化,是一种常用的人脸识别数据库。本例中从20类样本中每类随机选取一半作为训练集,另一半作为测试集,训练集、测试集中各282个样本。
具体实施步骤如下:
(1)步骤1:对人脸训练样本进行处理,构造新的训练样本。设已有图像数据为 { x i , y i } i = 1 282 , x i &Element; R 10304 , y i = { 1,2 , . . . , 20 } .
首先对训练集中的样本进行随机降维,将样本降到50维,同时保持降维后的类别标记不变。则降维后的训练样本集为 { x &OverBar; i , y i } i = 1 282 , x &OverBar; i &Element; R 50 , y i = { 1,2 , . . . , 20 } .
随机降维之后,要产生新的差样本对训练集。对于任意两个样本 来说,可以产生两个不同的差样本的类别相同,则记新的样本的类别值+1,即正样本,否则记为-1,即负样本。
在训练集中对每一个样本分别随机选择k个同类样本点和异类样本点,分别把这些样本点分别存储在集合中,k取5。则新的训练集差样本可表示为 z q = x &OverBar; i - x &OverBar; j | x &OverBar; j &Element; SK i k , y &OverBar; q = 1 z q = x &OverBar; i - x &OverBar; j | x &OverBar; j &Element; DX i k , y &OverBar; q = - 1 , zq∈R50,q=1,...,5640,5640为差样本对的数目。
可以生成多个相似性判断模型,为每个相似性判断模型分别构造差样本对集合。假设共构造enum个相似性判断模型,enum取50,则重复上述构造过程50次。得到的差样本对集合中,包括每一类别对应的差样本对,将所述差样本对集合作为新的训练样本集合,分别记为Trn1,Trn2,...,Trn50
(2)步骤2:用新的训练样本集合对支持向量机进行训练,得到50个相似性判断模型。这50个相似性判断模型构成的集合,就是本发明中的分类模型。具体的,对于每一个训练样本集合Trni,i=1,2,...,50,分别采用支持向量机训练得到一个相似性判断模型,共50个,彼此互相独立,其中第p个相似性判断模型是按照下面的方法来获得:
支持向量机的核函数选择应用最广泛的高斯径向基函数其中σ是核参数。指定支持向量机需要的参数后,输入训练样本集合,以高斯径向基函数为核函数,训练产生一个相似性判断模型:
f p ( z ) = sgn ( &Sigma; i = 1 m &alpha; i p y &OverBar; i K ( z i , z ) + b p )
其中 和bp是由支持向量机训练产生的第p个相似性判断模型的系数,sgn()表示符号函数。
(3)步骤3:对测试集的测试样本进行处理,构造新的测试样本。设任意一个待测试样本x,x∈R10304
同样的,对测试样本进行随机降维,将测试样本的维度降到50维,待测试样本x变为测试样本的随机降维的过程和相应的训练样本的随机降维是完全一样的。
随机降维之后,要产生新的包含差样本对的测试集。为减少新的测试样本的个数,在原训练集的每一类样本中随机挑选num个样本,num取5,对于待测试样本与挑选出的每个训练样本都生成两个差样本对则新的测试集可表示为q=1,...,200,200为差样本对的数目。
(4)步骤4:将新的测试集中得到的差样本对依次输入到各个相似性判断模型中,代替原相似性判断模型中的z,每个相似性判断模型都可得到200个判断结果。每个相似性判断模型的结果依次表示为根据分类结果,可以统计出每个相似性判断模型中x与原训练样本中每一类的相似性概率大小
P ij = &Sigma; h = ( j - 1 ) &times; 5 + 1 j &times; 5 ( ( v ^ h i + 1 ) / 2 ) 5 , i = 1,2 , . . . , 50 , j = 1,2 , . . . , 20 .
(5)步骤5:将各个相似性判断模型的结果进行集成,得出最终分类结果。通过各个相似性判断模型可以得出待测样本x与原训练样本中每一类的相似性概率大小Pij,i=1,2,...,50,j=1,2,...,20。然后计算出待测样本与类平均相似性概率Pj′,计算方式如下:
P j &prime; = &Sigma; i = 1 50 P ij / 50 , j = 1,2 , . . . , 20 .
最后将待测样本x按照平均相似概率最大准则进行分类,即
y = arg max j = 1,2 , . . . , 20 P j &prime; .
本发明的效果可以通过如下实验验证:
实验的过程中,正则因子的取值取10,高斯径向核函数的参数则在每次生成新的差样本对的训练样本后都通过计算得出,计算过程具体如下:先确定训练样本集合的均值,然后求出每个训练样本到均值点的欧氏距离,所有距离的平均值的中值则为核参数的取值。根据训练集上得出的模型,在测试集上估计性能获得识别率。训练样本和测试样本的挑选是随机的,重复10次试验,最后的实验结果如表1。
表1
本发明的对比方法是四种典型的下采样方法,分别为随机下采样,NearMiss-1,NearMiss-2和NearMiss-3,其中下采样方法的采样率以采样后新的训练集合达到平衡为准来确定。
通过实验结果,可以看出本发明的人脸识别效果明显优于其他四种下采样方法,并且表现出了较强的稳定性,具有一定的优势。
本发明 随机下采样 NearMiss-1 NearMiss-2 NearMiss-3
时间(秒) 1321.5(50次) 604(1次) 2291.5(1次) 2467.5(1次) 1109.3(1次)
表2
表2给出了这四种方法在某一次训练中所花费的时间。注意本发明包括了50次生成样本对生成和50次SVM训练的时间,也就是说,每次只需要26.43秒就可以。其他四种方法的执行时间,均是1次样本对生成时间和1次SVM训练的时间。很明显,本发明的采采样时间相对来说是非常快的。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的***而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (6)

1.一种基于支持向量机的人脸识别方法,其特征在于,包括:
获取人脸样本训练集的步骤:所述人脸样本训练集中包含有多个类别的人脸样本集合,每个类别的人脸样本集合中包含多个人脸样本;
选取同类样本和异类样本的步骤:对于所述人脸样本训练集中的每一个人脸样本,随机选取k个与该人脸样本属于同一个类别的人脸样本作为同类样本,随机选取k个与该人脸样本属于不同类别的人脸样本作为异类样本;
生成差样本对集合的步骤:根据所述同类样本和所述异类样本生成差样本对集合;所述差样本对集合中,对于所述人脸样本训练集中的每一个人脸样本,均有2k个同类差样本对,以及2k个异类差样本对;
生成分类模型的步骤:对于所述差样本对集合,采用支持向量机训练得到相似性判断模型,根据所述相似性判断模型得到分类模型;
人脸识别的步骤:采用所述分类模型进行人脸识别;
所述采用所述分类模型进行人脸识别,包括:
获取待识别人脸样本;
分别从所述人脸训练集每一类别的样本集合中随机选取k个人脸样本,生成2k个待识别差样本对,得到待识别差样本对集合;
利用所述分类模型对所述待识别差样本对集合进行分析,得到所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
根据所述相似性概率,确定所述待识别人脸样本归属的类别;
还包括:重复执行选取同类样本和异类样本的步骤和生成差样本对集合的步骤,得到多个相似性判断模型,根据所述多个相似性判断模型得到分类模型;
相应的,所述利用所述分类模型对所述待识别差样本对集合进行分析,包括:
利用所述多个相似性判断模型对所述待识别差样本对集合进行分析,得到多个所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
对多个所述相似性概率求平均值,得到平均相似性概率;
所述确定所述待识别人脸样本归属的类别,包括:
将平均相似性概率最大的类别,确定为所述待识别人脸样本归属的类别。
2.根据权利要求1所述的方法,其特征在于,所述采用支持向量机训练得到相似性判断模型,包括:
采用核函数为高斯径向基函数的支持向量机训练得到所述相似性判断模型。
3.根据权利要求1所述的方法,其特征在于,所述生成差样本对集合之前,还包括:
对所述人脸样本训练集中的各个样本进行随机降维,各个样本降维后的维数相同;
采用降维后的人脸样本生成差样本对集合;
相应的,采用所述分类模型进行人脸识别时,包括:
对待识别人脸样本进行随机降维,降维后的所述待识别人脸样本的维数与降维后的人脸样本的维数相同。
4.一种基于支持向量机的人脸识别***,其特征在于,包括:
训练集获取模块,用于获取人脸样本训练集;所述人脸样本训练集中包含有多个类别的人脸样本集合,每个类别的人脸样本集合中包含多个人脸样本;
样本选取模块,用于执行选取同类样本和异类样本的步骤:对于所述人脸样本训练集中的每一个人脸样本,随机选取k个与该人脸样本属于同一个类别的人脸样本作为同类样本,随机选取k个与该人脸样本属于不同类别的人脸样本作为异类样本;
差样本对集合生成模块,用于执行生成差样本对集合的步骤:根据所述同类样本和所述异类样本生成差样本对集合;所述差样本对集合中,对于所述人脸样本训练集中的每一个人脸样本,均有2k个同类差样本对,以及2k个异类差样本对;
分类模型生成模块,用于对于所述差样本对集合,采用支持向量机训练得到相似性判断模型,根据所述相似性判断模型得到分类模型;
人脸识别模块,用于采用所述分类模型进行人脸识别;
待识别人脸样本获取单元,用于获取待识别人脸样本;
待识别差样本对集合生成单元,用于分别从所述人脸训练集每一类别的样本集合中随机选取k个人脸样本,生成2k个待识别差样本对,得到待识别差样本对集合;
相似性概率计算单元,用于利用所述分类模型对所述待识别差样本对集合进行分析,得到所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
类别确定单元,用于根据所述相似性概率,确定所述待识别人脸样本归属的类别,还包括:
重复执行模块,用于控制所述样本选取模块以及所述差样本对集合生成模块重复执行选取同类样本和异类样本的步骤和生成差样本对集合的步骤,得到多个相似性判断模型,根据所述多个相似性判断模型得到分类模型;
相应的,所述相似性概率计算单元包括:
相似性概率计算子单元,用于利用所述多个相似性判断模型对所述待识别差样本对集合进行分析,得到多个所述待识别人脸样本与所述人脸训练集中每一类的相似性概率;
平均相似性概率计算子单元,用于对多个所述相似性概率求平均值,得到平均相似性概率;
所述类别确定单元,包括:
类别确定子单元,用于将平均相似性概率最大的类别,确定为所述待识别人脸样本归属的类别。
5.根据权利要求4所述的***,其特征在于,所述分类模型生成模块,包括:
相似性判断模型生成单元,用于采用核函数为高斯径向基函数的支持向量机训练得到所述相似性判断模型。
6.根据权利要求4所述的***,其特征在于,还包括:
训练集样本降维模块,用于对所述人脸样本训练集中的各个样本进行随机降维,各个样本降维后的维数相同;以便所述差样本对集合生成模块采用降维后的人脸样本生成差样本对集合;
相应的,所述人脸识别模块,包括:
待识别样本降维单元,用于对待识别人脸样本进行随机降维,降维后的所述待识别人脸样本的维数与降维后的人脸样本的维数相同。
CN201310210372.2A 2013-05-30 2013-05-30 一种基于支持向量机的人脸识别方法及*** Active CN103279746B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310210372.2A CN103279746B (zh) 2013-05-30 2013-05-30 一种基于支持向量机的人脸识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310210372.2A CN103279746B (zh) 2013-05-30 2013-05-30 一种基于支持向量机的人脸识别方法及***

Publications (2)

Publication Number Publication Date
CN103279746A CN103279746A (zh) 2013-09-04
CN103279746B true CN103279746B (zh) 2016-12-07

Family

ID=49062261

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310210372.2A Active CN103279746B (zh) 2013-05-30 2013-05-30 一种基于支持向量机的人脸识别方法及***

Country Status (1)

Country Link
CN (1) CN103279746B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008364B (zh) * 2013-12-31 2018-09-25 广西科技大学 人脸识别方法
CN103679160B (zh) * 2014-01-03 2017-03-22 苏州大学 一种人脸识别方法和装置
CN103793699A (zh) * 2014-02-24 2014-05-14 苏州大学 一种人脸识别方法及***
CN105139033B (zh) * 2015-08-24 2018-11-06 小米科技有限责任公司 分类器构建方法及装置和图片处理方法及装置
CN107688829A (zh) * 2017-08-29 2018-02-13 湖南财政经济学院 一种基于支持向量机的识别***及识别方法
CN108446659A (zh) * 2018-03-28 2018-08-24 百度在线网络技术(北京)有限公司 用于检测人脸图像的方法和装置
CN108564067B (zh) * 2018-04-28 2021-07-20 深圳卡安兴科技有限公司 人脸比对的阈值确定方法及***
CN109145991B (zh) * 2018-08-24 2020-07-31 北京地平线机器人技术研发有限公司 图像组生成方法、图像组生成装置和电子设备
CN112819018A (zh) * 2019-10-31 2021-05-18 北京沃东天骏信息技术有限公司 生成样本的方法、装置、电子设备和存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663370A (zh) * 2012-04-23 2012-09-12 苏州大学 一种人脸识别的方法及***

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7050607B2 (en) * 2001-12-08 2006-05-23 Microsoft Corp. System and method for multi-view face detection

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663370A (zh) * 2012-04-23 2012-09-12 苏州大学 一种人脸识别的方法及***

Also Published As

Publication number Publication date
CN103279746A (zh) 2013-09-04

Similar Documents

Publication Publication Date Title
CN103279746B (zh) 一种基于支持向量机的人脸识别方法及***
CN108564129B (zh) 一种基于生成对抗网络的轨迹数据分类方法
CN106096538B (zh) 基于定序神经网络模型的人脸识别方法及装置
CN107273845B (zh) 一种基于置信区域和多特征加权融合的人脸表情识别方法
CN102663370B (zh) 一种人脸识别的方法及***
Mori et al. Recognizing objects in adversarial clutter: Breaking a visual CAPTCHA
CN103605972B (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN110852168A (zh) 基于神经架构搜索的行人重识别模型构建方法及装置
CN106599941A (zh) 基于卷积神经网络与支持向量机的手写数字识别方法
CN107103281A (zh) 基于聚集损失深度度量学习的人脸识别方法
CN106934012A (zh) 一种基于知识图谱的自然语言问答实现方法和***
Liu et al. Facial landmark machines: A backbone-branches architecture with progressive representation learning
CN104318242A (zh) 一种高效的svm主动半监督学习算法
Zeng et al. Fine-grained image retrieval via piecewise cross entropy loss
CN104392231A (zh) 基于分块与稀疏主特征提取的快速协同显著性检测方法
Wu et al. Some analysis and research of the AdaBoost algorithm
US10747961B2 (en) Method and device for identifying a sentence
US20200320387A1 (en) Independent and dependent reading using recurrent networks for natural language inference
CN109961093A (zh) 一种基于众智集成学习的图像分类方法
CN109948735A (zh) 一种多标签分类方法、***、装置及存储介质
CN103065158A (zh) 基于相对梯度的isa模型的行为识别方法
CN103679160A (zh) 一种人脸识别方法和装置
CN105320764A (zh) 一种基于增量慢特征的3d模型检索方法及其检索装置
CN113158955B (zh) 基于聚类引导和成对度量三元组损失的行人重识别方法
Yuan et al. A multi-class boosting method for learning from imbalanced data

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant