CN104915684A - 一种基于鲁棒多平面支持向量机的图像识别方法及装置 - Google Patents

一种基于鲁棒多平面支持向量机的图像识别方法及装置 Download PDF

Info

Publication number
CN104915684A
CN104915684A CN201510372326.1A CN201510372326A CN104915684A CN 104915684 A CN104915684 A CN 104915684A CN 201510372326 A CN201510372326 A CN 201510372326A CN 104915684 A CN104915684 A CN 104915684A
Authority
CN
China
Prior art keywords
sample
robust
sigma
projection
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510372326.1A
Other languages
English (en)
Other versions
CN104915684B (zh
Inventor
张召
顾震峰
李凡长
张莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou University
Original Assignee
Suzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou University filed Critical Suzhou University
Priority to CN201510372326.1A priority Critical patent/CN104915684B/zh
Publication of CN104915684A publication Critical patent/CN104915684A/zh
Application granted granted Critical
Publication of CN104915684B publication Critical patent/CN104915684B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于鲁棒多平面支持向量机的图像识别方法及装置,包括:将测试图像向鲁棒线性分类器进行投影,获取测试图像对应各个类别的第一投影特征;其中,鲁棒线性分类器中的投影向量为通过对训练样本集中的多个样本图像进行训练,将1-范数度量应用于多平面支持向量机,紧凑类内散度矩阵与分离类间散度矩阵确定得到;将训练样本集中的样本图像的均值向鲁棒线性分类器进行投影,获取所述训练样本集均值在各个类别的第二投影特征;分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离;将所述距离的最小值所对应的类别确定为所述测试图像的类别。本发明所提供的图像识别方法及装置,有效提升了图像识别的鲁棒性。

Description

一种基于鲁棒多平面支持向量机的图像识别方法及装置
技术领域
本发明涉及计算机视觉和图像识别技术领域,特别是涉及一种基于鲁棒多平面支持向量机的图像识别方法及装置。
背景技术
随着计算机技术和智能化的不断发展,图像识别与分类已经发展成为计算机视觉与模式识别研究中的重要研究课题之一。图像识别通过计算机将纸质图像数字化,结合图像分析与描述,获取图像特征,在图像检索、人脸识别和机器人等研究领域中有着重大的意义,一旦研究成功并投入应用,将产生巨大的社会和经济效益。但是抽取图像特征的过程具有一定难度,到目前为止,图像识别方法距实用要求还有一定距离。目前,大部分研究工作集中在处理图像特征提取和识别问题,且也已取得一定的成果。但是真实世界中的图像(例如人脸图像、手写体等)通常包含噪音、数据破坏、数据缺失等问题,因此如何有效减少数据中的噪音或异类对图像特征提取和图像识别结果的不利影响需要进一步深入探讨。
近年来,鉴于传统支持向量机(SVM)的优越性能和泛化能力,被广泛应用于数据分类和图像识别等领域。但是SVM只输出一个超平面,对一些特殊分布的数据(如XOR)处理效果较差。鉴于此,近年来基于多平面的支持向量机学***面SVM学***面SVM方法均基于传统的2-范数距离度量,对数据中噪音非常敏感。另外,MVSVM还会受模型最优参数选择的困扰,且泛化特征值分析过程易遭遇奇异性问题。
因此,本发明提出一种将1-范数度量应用于多平面支持向量机的图像识别方法及装置,通过对训练样本进行鲁棒的判别学***面支持向量的优点。
发明内容
本发明的目的是提供一种基于鲁棒多平面支持向量机的图像识别方法及装置,目的在于解决现有技术中容易受到噪声干扰、易因参数选择造成误差以及学习***不稳定等问题。
为解决上述技术问题,本发明提供一种基于鲁棒多平面支持向量机的图像识别方法,包括:
将测试图像向鲁棒线性分类器进行投影,获取所述测试图像对应各个类别的第一投影特征;其中,所述鲁棒线性分类器中的投影向量为通过对训练样本集中的多个样本图像进行训练,将1-范数度量应用于多平面支持向量机,紧凑类内散度矩阵与分离类间散度矩阵,确定得到的鲁棒投影最优向量;
将训练样本集中的样本图像的均值向所述鲁棒线性分类器进行投影,获取所述训练样本集均值在各个类别的第二投影特征;
分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离;
将所述距离的最小值所对应的类别确定为所述测试图像的类别。
可选地,所述鲁棒线性分类器中的投影向量为通过对训练样本集中的多个样本图像进行训练,将1-范数度量应用于多平面支持向量机,紧凑类内散度矩阵与分离类间散度矩阵,确定得到的鲁棒投影最优向量包括:
建立基于1-范数度量的多平面支持向量机分类器模型;
对样本图像进行学习,确定以使类内距离最小且类间距离最大的鲁棒投影最优向量。
可选地,所述建立基于1-范数度量的多平面支持向量机分类器模型包括:
获取预设的图像数据向量集合X=[x1,x2,...,xN]∈Rn×N,所述集合包括:有类别标签的训练样本集XL=[x1,x2,...,xl]∈Rn×l以及无类别标签的测试样本集XU=[x1,x2,...,xu]∈Rn×u,且满足样本数量l+u=N;
所述训练样本集包括两个类别的样本集,A类样本集 X a = [ x 1 , x 2 , ... , x l a ] ∈ R n × l 1 ∈ X L 以及为B类样本集 X b = [ x 1 , x 2 , ... , x l b ] ∈ R n × l 2 ∈ X L , 且满足训练样本数量l1+l2=l。
可选地,所述对样本图像进行学习,确定以使类内距离最小且类间距离最大的鲁棒投影最优向量包括:
通过迭代优化,对鲁棒投影最优向量w1、w2的值不断更新,使得F(w1)、F(w2)的目标函数值最大;在F(w1)、F(w2)最大化到趋于不变时,对应的w1、w2为鲁棒投影最优向量;
其中,w1=arg max F(w1),w1 Tw1=1,w2=arg max F(w2),w2 Tw2=1, F ( w 1 ) = || w 1 T 1 l a Σ i = 1 l a x a i - w 1 T 1 l b Σ j = 1 l b x b j || 1 Σ i = 1 l a || w 1 T x a i - w 1 T 1 l a Σ j = 1 l a x a j || 1 , F ( w 2 ) = || w 2 T 1 l b Σ i = 1 l b x b i - w 2 T 1 l a Σ j = 1 l a x a j || 1 Σ i = 1 l b || w 2 T x b i - w 2 T 1 l b Σ j = 1 l b x b j || 1 , n是图像数据样本的维度,N是样本的数量,w1和w2为所需求得的鲁棒投影最优向量w1∈Rn×1,w2∈Rn×1,la、lb分别为两类样本的数量,xi为样本集合中的单个样本,||·||1为1-范数度量,F(w1)的分母为实现类内距离最小、分子为实现类间距离最大。
本发明提供了一种基于鲁棒多平面支持向量机的图像识别装置,包括:
第一获取模块,用于将测试图像向鲁棒线性分类器进行投影,获取所述测试图像对应各个类别的第一投影特征;其中,所述鲁棒线性分类器中的投影向量为通过训练模块对训练样本集中的多个样本图像进行训练,将1-范数度量应用于多平面支持向量机,确定得到的鲁棒投影最优向量;
第二获取模块,将训练样本集中的样本图像的均值向所述鲁棒线性分类器进行投影,获取所述训练样本集均值在各个类别的第二投影特征;
计算模块,用于分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离;
确定模块,用于将所述距离的最小值所对应的类别确定为所述测试图像的类别。
可选地,所述训练模块包括:
建立模型单元,用于建立基于1-范数度量的多平面支持向量机分类器模型;
确定单元,用于对样本图像进行学习,确定以使类内距离最小且类间距离最大的鲁棒投影最优向量。
可选地,所述建立模型单元用于建立基于1-范数度量的多平面支持向量机分类器模型包括:
所述建立模型单元具体用于获取预设的图像数据向量集合X=[x1,x2,...,xN]∈Rn×N,所述集合包括:有类别标签的训练样本集XL=[x1,x2,...,xl]∈Rn×l以及无类别标签的测试样本集XU=[x1,x2,...,xu]∈Rn×u,且满足样本数量l+u=N;
所述训练样本集包括两个类别的样本集,A类样本集 X a = [ x 1 , x 2 , ... , x l a ] ∈ R n × l 1 ∈ X L 以及为B类样本集 X b = [ x 1 , x 2 , ... , x l b ] ∈ R n × l 2 ∈ X L , 且满足训练样本数量l1+l2=l。
可选地,所述确定单元用于对样本图像进行学习,确定以使类内距离最小且类间距离最大的鲁棒投影最优向量包括:
所述确定单元具体用于通过迭代优化,对鲁棒投影最优向量w1、w2的值不断更新,使得F(w1)、F(w2)的目标函数值最大;在F(w1)、F(w2)最大化到趋于不变时,对应的w1、w2为鲁棒投影最优向量;
其中,w1=arg max F(w1),w1 Tw1=1,w2=arg max F(w2),w2 Tw2=1, F ( w 1 ) = || w 1 T 1 l a Σ i = 1 l a x a i - w 1 T 1 l b Σ j = 1 l b x b j || 1 Σ i = 1 l a || w 1 T x a i - w 1 T 1 l a Σ j = 1 l a x a j || 1 , F ( w 2 ) = || w 2 T 1 l b Σ i = 1 l b x b i - w 2 T 1 l a Σ j = 1 l a x a j || 1 Σ i = 1 l b || w 2 T x b i - w 2 T 1 l b Σ j = 1 l b x b j || 1 , n是图像数据样本的维度,N是样本的数量,w1和w2为所需求得的鲁棒投影最优向量,w1∈Rn×1,w2∈Rn×1,la、lb分别为两类样本的数量,xi为样本集合中的单个样本,||·||1为1-范数度量,F(w1)的分母为实现类内距离最小、分子为实现类间距离最大。
可选地,所述训练模块还包括:
训练预处理单元,用于对提取到的样本图像进行预处理操作。
可选地,所述预处理包括尺寸压缩和/或数据归一化处理。
本发明所提供的基于鲁棒多平面支持向量机的图像识别方法及装置,通过对图像训练样本进行判别学***面支持向量机,有效提升了图像识别的鲁棒性,并且能够有效避免模型参数估计,稳定性更好。
附图说明
图1为本发明所提供的基于鲁棒多平面支持向量机的图像识别方法的一种具体实施方式的方法流程图;
图2为本发明所提供的基于鲁棒多平面支持向量机的图像识别方法的一种具体实施方式中确定鲁棒投影最优向量的过程的流程图;
图3为本发明所提供的基于鲁棒多平面支持向量机的图像识别方法的另一种具体实施方式的方法流程图;
图4为本发明所提供的基于鲁棒多平面支持向量机的图像识别装置的一种具体实施方式的结构框图;
图5为本发明实施例公开的一种基于鲁棒多平面支持向量机的图像识别过程示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明所提供的基于鲁棒多平面支持向量机的图像识别方法的一种具体实施方式的方法流程图如图1所示,该方法包括:
步骤S101:将测试图像向鲁棒线性分类器进行投影,获取所述测试图像对应各个类别的第一投影特征;其中,所述鲁棒线性分类器中的投影向量为通过对训练样本集中的多个样本图像进行训练,将1-范数度量应用于多平面支持向量机,紧凑类内散度矩阵与分离类间散度矩阵,确定得到的鲁棒投影最优向量;
步骤S102:将训练样本集中的样本图像的均值向所述鲁棒线性分类器进行投影,获取所述训练样本集均值在各个类别的第二投影特征;
步骤S103:分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离;
步骤S104:将所述距离的最小值所对应的类别确定为所述测试图像的类别。
本发明所提供的图像识别方法,通过对图像训练样本进行判别学***面支持向量机,有效提升了图像识别的鲁棒性,并且能够有效避免模型参数估计,稳定性更好。
可选地,如图2所示,本发明所提供的基于鲁棒多平面支持向量机的图像识别方法中确定鲁棒投影最优向量的过程可以具体为:
步骤S201:建立基于1-范数度量的多平面支持向量机分类器模型;
步骤S202:对样本图像进行学习,确定以使类内距离最小且类间距离最大的鲁棒投影最优向量。
本发明所提供的基于鲁棒多平面支持向量机的图像识别方法的另一种具体实施方式的方法流程图如图3所示,该方法包括:
步骤S301:建立基于1-范数度量的多平面支持向量机分类器模型,对训练样本数据进行学习,同时紧凑类内离散度和分离类间离散度。
步骤S301可以具体为:
对于给定的一个图像数据向量集合X=[x1,x2,...,xN]∈Rn×N(其中,n是图像数据样本的维度,N是样本的数量),其中包含有类别标签(共2个类别)的训练样本集XL=[x1,x2,...,xl]∈Rn×l(其中 X a = [ x 1 , x 2 , ... , x l a ] ∈ R n × l 1 ∈ X L 为A类样本集, X b = [ x 1 , x 2 , ... , x l b ] ∈ R n × l 2 ∈ X L 为B类样本集,且满足训练样本数量l1+l2=l)和无任何标签的测试样本集XU=[x1,x2,...,xu]∈Rn×u,且满足样本数量l+u=N。
根据原始训练集计算得到一对最具鉴别性的鲁棒投影最优向量w1∈Rn×1和w2∈Rn×1,具体可以通过下式来实现:
w1=arg max F(w1),其中w1 Tw1=1,w2=arg max F(w2),其中w2 Tw2=1 F ( w 1 ) = || w 1 T 1 l a Σ i = 1 l a x a i - w 1 T 1 l b Σ j = 1 l b x b j || 1 Σ i = 1 l a || w 1 T x a i - w 1 T 1 l a Σ j = 1 l a x a j || 1 , F ( w 2 ) = || w 2 T 1 l b Σ i = 1 l b x b i - w 2 T 1 l a Σ j = 1 l a x a j || 1 Σ i = 1 l b || w 2 T x b i - w 2 T 1 l b Σ j = 1 l b x b j || 1 ,
其中,w1和w2即为所需求得的鲁棒投影最优向量,la、lb分别为两类样本的数量,xi为样本集合中的单个样本,||·||1为1-范数度量,F(w1)的分母为实现类内距离最小、分子为实现类间距离最大。
步骤S302:通过不断优化得到一对最优的最具鉴别性的鲁棒投影子空间或鲁棒线性分类器,提取出样本外图像的显著特征,进而用于样本外测试图像的鲁棒归纳和识别过程;
具体可以为:
令迭代周期t=0,t为迭代周期,每迭代一次t加一,对w1、w2初始化操作,w1(0)=m1,w2(0)=m2,其中m1、m2分别为第一类和第二类样本的均值,并且令w1(0)=w1(0)/||w1(0)||2、w2(0)=w2(0)/||w2(0)||2。进而完成目标函数值初始化:
F ( w 1 ( 0 ) ) = | w 1 ( 0 ) T 1 l a Σ i = 1 l a x a i - w 1 ( 0 ) T 1 l b Σ j = 1 l b x b j | Σ i = 1 l a | w 1 ( 0 ) T x a i - w 1 ( 0 ) T 1 l a Σ j = 1 l a x a j | , F ( w 2 ( 0 ) ) = | w 2 ( 0 ) T 1 l b Σ i = 1 l b x b i - w 2 ( 0 ) T 1 l a Σ j = 1 l a x a j | Σ i = 1 l b | w 2 ( 0 ) T x b i - w 2 ( 0 ) T 1 l b Σ j = 1 l b x b j |
在迭代过程中,每一次迭代都是分别对w1、w2进行w1(t+1)=w1(t)+βd1(t)、w2(t+1)=w2(t)+βd2(t)操作,其中,β是用于投影向量w1和w2更新的步长系数。其中,用于迭代更新d1(0)和d2(0)初始化如下:
d 1 ( 0 ) = | 1 l a Σ i = 1 l a x a i - 1 l b Σ j = 1 l b x b j | | w 1 ( 0 ) T 1 l a Σ i = 1 l a x a i - w 1 ( 0 ) T 1 l b Σ j = 1 l b x b j | - Σ i = 1 l a | x a i - 1 l a Σ j = 1 l a x a j | Σ i = 1 l a | w 1 ( 0 ) T x a i - w 1 ( 0 ) T 1 l a Σ j = 1 l a x a j |
d 2 ( 0 ) = | 1 l b Σ i = 1 l b x b i - 1 l a Σ j = 1 l a x a j | | w 2 ( 0 ) T 1 l b Σ i = 1 l b x b i - w 2 ( 0 ) T 1 l a Σ j = 1 l a x a j | - Σ i = 1 l b | x b i - 1 l b Σ j = 1 l b x b j | Σ i = 1 l b | w 2 ( 0 ) T x b i - w 2 ( 0 ) T 1 l b Σ j = 1 l b x b j |
其中,d1(t)、d2(t)的值也随投影向量w1、w2的更新而不断迭代更新。由此可得,当迭代次数不断变大后,有
F ( w 1 ( t ) ) = | w 1 ( t ) T 1 l a Σ i = 1 l a x a i - w 1 ( t ) T 1 l b Σ j = 1 l b x b j | Σ i = 1 l a | w 1 ( t ) T x a i - w 1 ( t ) T 1 l a Σ j = 1 l a x a j | , F ( w 2 ( t ) ) = | w 2 ( t ) T 1 l b Σ i = 1 l b x b i - w 2 ( t ) T 1 l a Σ j = 1 l a x a j | Σ i = 1 l b | w 2 ( t ) T x b i - w 2 ( t ) T 1 l b Σ j = 1 l b x b j |
d 1 ( t ) = | 1 l a Σ i = 1 l a x a i - 1 l b Σ j = 1 l b x b j | | w 1 ( t ) T 1 l a Σ i = 1 l a x a i - w 1 ( t ) T 1 l b Σ j = 1 l b x b j | - Σ i = 1 l a | x a i - 1 l a Σ j = 1 l a x a j | Σ i = 1 l a | w 1 ( t ) T x a i - w 1 ( t ) T 1 l b Σ j = 1 l a x a j |
d 2 ( t ) = | 1 l b Σ i = 1 l b x b i - 1 l a Σ j = 1 l a x a j | | w 2 ( t ) T 1 l b Σ i = 1 l b x b i - w 2 ( t ) T 1 l a Σ j = 1 l a x a j | - Σ i = 1 l b | x b i - 1 l b Σ j = 1 l b x b j | Σ i = 1 l b | w 2 ( t ) T x b i - w 2 ( t ) T 1 l b Σ j = 1 l b x b j |
最终,F(w1)、F(w2)最大化到趋于不变时,此时的w1、w2即可作为最优解。由此,我们得到了可提取鉴别性的图像特征的鲁棒投影向量对w1∈Rn×1和w2∈Rn×1。从而,利用优化得到的这对鲁棒图像子空间或鲁棒线性分类器,实现图像数据训练样本的最具鉴别性的显著特征提取。
步骤S303:将测试图像向***输出的一对线性分类器进行投影,取与均值投影后的距离的最小值对应的类别,用于测试图像的类别鉴定,具体为:
给定一个图像样本集合,首先划分为训练集和测试集,分别包含原始的训练样本和测试样本。基于训练集,可通过所述优化过程计算得到最具鉴别性的鲁棒投影向量对w1∈Rn×1和w2∈Rn×1,再将测试样本放入得到的鲁棒投影空间,完成具鉴别性的显著特征提取,从而进行分类。
本发明所提供的图像识别方法,通过对图像训练样本进行判别学***面支持向量机,设计出性能鲁棒的图像识别装置。最终,计算得到一对最具描述性的鲁棒图像子空间或一对最具鉴别性的鲁棒线性分类器,可用于样本外图像的鲁棒归纳和识别过程。样本外图像的归纳过程主要通过将测试样本向***输出的一对线性分类器进行投影,取与均值投影后距离的最小值对应的类别,用于测试图像的类别鉴定,得到最准确的***识别结果。此外,本发明通过建立基于比率的1-范数支持向量机分类模型,有效避免了模型参数估计,***稳定性好。
上述本发明公开的实施例中详细描述了方法,对于本发明的方法可采用多种形式的***实现,因此本发明还公开了一种装置,下面给出具体的实施例进行详细说明。
本发明所提供的基于鲁棒多平面支持向量机的图像识别装置的一种具体实施方式的结构框图如图4所示,该装置包括:
第一获取模块100,用于将测试图像向鲁棒线性分类器进行投影,获取所述测试图像对应各个类别的第一投影特征;其中,所述鲁棒线性分类器中的投影向量为通过训练模块500对训练样本集中的多个样本图像进行训练,将1-范数度量应用于多平面支持向量机,确定得到的鲁棒投影最优向量;
第二获取模块200,将训练样本集中的样本图像的均值向所述鲁棒线性分类器进行投影,获取所述训练样本集均值在各个类别的第二投影特征;
计算模块300,用于分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离;
确定模块400,用于将所述距离的最小值所对应的类别确定为所述测试图像的类别。
本发明所提供的基于鲁棒多平面支持向量机的图像识别装置,通过对图像训练样本进行判别学***面支持向量机,有效提升了图像识别的鲁棒性,并且能够有效避免模型参数估计,稳定性更好。
可选地,所述训练模块500包括:
建立模型单元501,用于建立基于1-范数度量的多平面支持向量机分类器模型;
确定单元502,用于对样本图像进行学习,确定以使类内距离最小且类间距离最大的鲁棒投影最优向量。
具体地,训练模块500能够进行基于1-范数度量的鲁棒多平面支持向量机学习,提高***鲁棒性,同时降低噪声干扰。通过建立比率形式的模型,有效避免参数选择造成的误差影响,通过迭代优化,获得一对最佳的线性投影分类器。对于给定的一个图像数据向量集合X=[x1,x2,...,xN]∈Rn×N(其中,n是图像数据样本的维度,N是样本的数量),其中包含有类别标签(共2个类别)的训练样本集XL=[x1,x2,...,xl]∈Rn×l(其中A类样本B类样本且满足训练样本数量l1+l2=l)和无任何标签的测试样本集XU=[x1,x2,...,xu]∈Rn×u,且满足样本数量l+u=N。所述根据原始训练集计算得到一对最具鉴别性的鲁棒投影向量w1∈Rn×1和w2∈Rn×1
可选地,上述训练模块500还可以进一步包括:
训练预处理单元503,用于对提取到的样本图像进行预处理操作。
其中,预处理包括尺寸压缩和/或数据归一化。
下面对利用本发明所提供的基于鲁棒多平面支持向量机的图像识别装置进行图像识别的具体过程进行详细描述:
对鲁棒多平面支持向量机学习模型,
输入:原始训练数据矩阵XL=[x1,x2,...,xl]∈Rn×l
输出:鲁棒投影矩阵最优向量对w1∈Rn×1和w2∈Rn×1
初始化:
先得出第一类的投影向量:A类样本B类样本令迭代周期t=0,t为迭代周期,每迭代一次t加一,对w1初始化操作,w1(0)=m1,其中m1分别为第一类训练图像样本数据的均值,并且令w1(0)=w1(0)/||w1(0)||2。则
F ( w 1 ( 0 ) ) = | w 1 ( 0 ) T 1 l a Σ i = 1 l a x a i - w 1 ( 0 ) T 1 l b Σ j = 1 l b x b j | Σ i = 1 l a | w 1 ( 0 ) T x a i - w 1 ( 0 ) T 1 l a Σ j = 1 l a x a j |
while F(w1(t))还未收敛时;do
修正并更新w1(t+1):w1(t+1)=w1(t)+βd(t)
修正并更新d(t):
d 1 ( t ) = | 1 l a Σ i = 1 l a x a i - 1 l b Σ j = 1 l b x b j | | w 1 ( t ) T 1 l a Σ i = 1 l a x a i - w 1 ( t ) T 1 l b Σ j = 1 l b x b j | - Σ i = 1 l a | x a i - 1 l a Σ j = 1 l a x a j | Σ i = 1 l a | w 1 ( t ) T x a i - w 1 ( t ) T 1 l a Σ j = 1 l a x a j |
修正并更新F(w1(t)):
F ( w 1 ( t ) ) = | w 1 ( t ) T 1 l a Σ i = 1 l a x a i - w 1 ( t ) T 1 l b Σ j = 1 l b x b j | Σ i = 1 l a | w 1 ( t ) T x a i - w 1 ( t ) T 1 l a Σ j = 1 l a x a j |
检查是否收敛:(收敛条件为前后F(w1(t))结果之差的绝对值不大于10-7);
若是,则停止;
否则继续迭代;
end while
其中,w1即为所需求得的鲁棒投影最优向量,la为对应类的样本数,xi为样本类中的单个样本,||·||1为1-范数度量。
在算法最后一步迭代中,w1即为所需求得的第一类样本数据的鲁棒线性分类器。同理,根据该算法步骤,可得出第二类样本数据的鲁棒线性分类器w2
利用迭代优化得到一对最具鉴别性的鲁棒投影子空间或鲁棒线性分类器进行样本外图像的显著特征提取,为下一步样本外图像的鲁棒归纳和识别做好准备。
将测试样本输入***获得的分类器,取与均值投影后的距离的最小值对应的类别,用于测试图像的类别鉴定,获得训练样本的类别标签,得到最准确的***识别结果。
具体过程如下:
将测试样本输入***获得的分类器,获取投影结果。分别为w1 Tx和w2 Tx,其中x为待测试样本。将测试样本在各类投影向量上的投影结果与对应各类样本训练集均值在对应分类器上的投影结果,分别为进行比较,其中,为训练集A和B中的样本均值。即取与距离的最小值即对应的类别作为分类结果。图5示出了本发明实施例公开的一种基于鲁棒多平面支持向量机的图像识别过程示意图。请参阅表1,为本发明方法和GEPSVM(Generalized ProximalSVM)、MVSVM(Multi-weight Vector Projection SVM)、TWSVM(TWINSVM)方法识别结果对比表,给出了各方法实验的平均和最高识别率。
本发明在三个数据库中进行了测试,即AR、JAFFE、Indian人脸图像数据库。AR人脸数据库是美国普渡大学(Purdue University)的人脸数据库,包含超过126人的4000个彩色图像,每个人有26张两会期间拍摄的图像,包括更多的面部表情变化,例如在不同光照条件下,表情,以及面部的“伪装”(太阳镜和围巾)。以下标准评估程序,我们使用的AR数据库包括五十个男人和五十个女人的2600个人脸图像的子集。JAFFE是日本ATR(Advanced TelecommunicationResearch Institute International)的专门用于表情识别研究的基本表情数据库,包含了213幅(每幅图像的分辨率:256像素×256像素)日本女性的脸相,每幅图像都有原始的表情定义。表情库中共有10个人,每个人有7种表情(中性脸、高兴、悲伤、惊奇、愤怒、厌恶、恐惧)。JAFFE数据库均为正面脸相,且把原始图像进行重新调整和修剪,使得眼睛在数据库图像中的位置大致相同,脸部尺寸基本一致,光照均为正面光源,但光照强度有差异。Indian face database是苏黎世联邦理工学院的计算机视觉实验室的人脸数据库,包含了40个不同的人的11个不同的图像。有些人有一些额外的照片。所有的图片都与直立人明亮均匀背景,正面的位置。该图像数据库是由男性和女性两个主要目录构成。在这些目录中,有十一种不同的图像。
实验中,首先设定训练集占总数均为70%。分类实验设置如下:1、Indian女性人脸图像vs.Indian男性人脸图像;2、Japanese女性人脸图像vs.Indian女性人脸图像;3、AR女性人脸图像vs.男性人脸图像;4、AR女性人脸图像vs.Japanese女性人脸图像。在本发明的分类实验中,为了验证分类器模型对于数据中噪音的敏感性和鲁棒性,均人工加入了不同浓度的高斯噪声(均值为0,方差分别为0.01和0.02)。
本实施例中,参与比较的GEPSVM、MVSVM和TWSVM方法(采用各文献中算法使用的默认参数)使用各自的线性分类器进行测试样本的类别鉴定。
表1本发明和GEPSVM、MVSVM、TWSVM方法识别结果对比
通过实验结果我们可以看出本发明的图像识别方法效果明显优于相关的GEPSVM、MVSVM以及TWSVM方法,且表现出了较强的***稳定性和对噪音的鲁棒性,具有一定的优势。
综上所述:本发明公开了一种基于鲁棒多平面支持向量机的图像识别方法与装置,通过对图像训练样本进行判别学***面支持向量机,设计出性能鲁棒的图像识别装置。最终,计算得到一对最具描述性的鲁棒图像子空间或一对最具鉴别性的鲁棒线性分类器,可用于样本外图像的鲁棒归纳和识别过程。样本外图像的归纳过程主要通过将测试样本向***输出的一对线性分类器进行投影,取与均值投影后的距离的最小值对应的类别,用于测试图像的类别鉴定,得到最准确的***识别结果。此外,本发明通过建立基于比率的1-范数支持向量机分类模型,有效避免了模型参数估计,***稳定性更好。
对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于鲁棒多平面支持向量机的图像识别方法,其特征在于,包括:
将测试图像向鲁棒线性分类器进行投影,获取所述测试图像对应各个类别的第一投影特征;其中,所述鲁棒线性分类器中的投影向量为通过对训练样本集中的多个样本图像进行训练,将1-范数度量应用于多平面支持向量机,紧凑类内散度矩阵与分离类间散度矩阵,确定得到的鲁棒投影最优向量;
将训练样本集中的样本图像的均值向所述鲁棒线性分类器进行投影,获取所述训练样本集均值在各个类别的第二投影特征;
分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离;
将所述距离的最小值所对应的类别确定为所述测试图像的类别。
2.如权利要求1所述的图像识别方法,其特征在于,所述鲁棒线性分类器中的投影向量为通过对训练样本集中的多个样本图像进行训练,将1-范数度量应用于多平面支持向量机,紧凑类内散度矩阵与分离类间散度矩阵,确定得到的鲁棒投影最优向量包括:
建立基于1-范数度量的多平面支持向量机分类器模型;
对样本图像进行学习,确定以使类内距离最小且类间距离最大的鲁棒投影最优向量。
3.如权利要求2所述的图像识别方法,其特征在于,所述建立基于1-范数度量的多平面支持向量机分类器模型包括:
获取预设的图像数据向量集合X=[x1,x2,...,xN]∈Rn×N,所述集合包括:有类别标签的训练样本集XL=[x1,x2,...,xl]∈Rn×l以及无类别标签的测试样本集XU=[x1,x2,...,xu]∈Rn×u,且满足样本数量l+u=N;
所述训练样本集包括两个类别的样本集,A类样本集 X a = [ x 1 , x 2 , ... , x l a ] ∈ R n × l 1 ∈ X L 以及为B类样本集 X b = [ x 1 , x 2 , ... , x l b ] ∈ R n × l 2 ∈ X L , 且满足训练样本数量l1+l2=l。
4.如权利要求3所述的图像识别方法,其特征在于,所述对样本图像进行学习,确定以使类内距离最小且类间距离最大的鲁棒投影最优向量包括:
通过迭代优化,对鲁棒投影最优向量w1、w2的值不断更新,使得F(w1)、F(w2)的目标函数值最大;在F(w1)、F(w2)最大化到趋于不变时,对应的w1、w2为鲁棒投影最优向量;
其中,w1=arg max F(w1),w1 Tw1=1,w2=arg max F(w2),w2 Tw2=1,
F ( w 1 ) = || w 1 T 1 l a Σ i = 1 l a x a i - w 1 T 1 l b Σ j = 1 l b x b j || 1 Σ i = 1 l a || w 1 T x a i - w 1 T 1 l a Σ j = 1 l a x a j || 1 , F ( w 2 ) = || w 2 T 1 l b Σ i = 1 l b x b i - w 2 T 1 l a Σ j = 1 l a x a j || 1 Σ i = 1 l b || w 2 T x b i - w 2 T 1 l b Σ j = 1 l b x b j || 1 ,
n是图像数据样本的维度,N是样本的数量,w1和w2为所需求得的鲁棒投影最优向量w1∈Rn×1,w2∈Rn×1,la、lb分别为两类样本的数量,xi为样本集合中的单个样本,||.||1为1-范数度量,F(w1)的分母为实现类内距离最小、分子为实现类间距离最大。
5.一种基于鲁棒多平面支持向量机的图像识别装置,其特征在于,包括:
第一获取模块,用于将测试图像向鲁棒线性分类器进行投影,获取所述测试图像对应各个类别的第一投影特征;其中,所述鲁棒线性分类器中的投影向量为通过训练模块对训练样本集中的多个样本图像进行训练,将1-范数度量应用于多平面支持向量机,确定得到的鲁棒投影最优向量;
第二获取模块,将训练样本集中的样本图像的均值向所述鲁棒线性分类器进行投影,获取所述训练样本集均值在各个类别的第二投影特征;
计算模块,用于分别计算各个类别的第一投影特征与对应类别的第二投影特征的距离;
确定模块,用于将所述距离的最小值所对应的类别确定为所述测试图像的类别。
6.如权利要求5所述的图像识别装置,其特征在于,所述训练模块包括:
建立模型单元,用于建立基于1-范数度量的多平面支持向量机分类器模型;
确定单元,用于对样本图像进行学习,确定以使类内距离最小且类间距离最大的鲁棒投影最优向量。
7.如权利要求6所述的图像识别装置,其特征在于,所述建立模型单元用于建立基于1-范数度量的多平面支持向量机分类器模型包括:
所述建立模型单元具体用于获取预设的图像数据向量集合X=[x1,x2,...,xN]∈Rn×N,所述集合包括:有类别标签的训练样本集XL=[x1,x2,...,xl]∈Rn×l以及无类别标签的测试样本集XU=[x1,x2,...,xu]∈Rn×u,且满足样本数量l+u=N;
所述训练样本集包括两个类别的样本集,A类样本集 X a = [ x 1 , x 2 , ... , x l a ] ∈ R n × l 1 ∈ X L 以及为B类样本集 X b = [ x 1 , x 2 , ... , x l b ] ∈ R n × l 2 ∈ X L , 且满足训练样本数量l1+l2=l。
8.如权利要求7所述的图像识别装置,其特征在于,所述确定单元用于对样本图像进行学习,确定以使类内距离最小且类间距离最大的鲁棒投影最优向量包括:
所述确定单元具体用于通过迭代优化,对鲁棒投影最优向量w1、w2的值不断更新,使得F(w1)、F(w2)的目标函数值最大;在F(w1)、F(w2)最大化到趋于不变时,对应的w1、w2为鲁棒投影最优向量;
其中,w1=arg max F(w1),w1 Tw1=1,w2=arg max F(w2),w2 Tw2=1,
F ( w 1 ) = || w 1 T 1 l a Σ i = 1 l a x a i - w 1 T 1 l b Σ j = 1 l b x b j || 1 Σ i = 1 l a || w 1 T x a i - w 1 T 1 l a Σ j = 1 l a x a j || 1 , F ( w 2 ) = || w 2 T 1 l b Σ i = 1 l b x b i - w 2 T 1 l a Σ j = 1 l a x a j || 1 Σ i = 1 l b || w 2 T x b i - w 2 T 1 l b Σ j = 1 l b x b j || 1 ,
n是图像数据样本的维度,N是样本的数量,w1和w2为所需求得的鲁棒投影最优向量,w1∈Rn×1,w2∈Rn×1,la、lb分别为两类样本的数量,xi为样本集合中的单个样本,||.||1为1-范数度量,F(w1)的分母为实现类内距离最小、分子为实现类间距离最大。
9.如权利要求5至8任一项所述的图像识别装置,其特征在于,所述训练模块还包括:
训练预处理单元,用于对提取到的样本图像进行预处理操作。
10.如权利要求9所述的图像识别装置,其特征在于,所述预处理包括尺寸压缩和/或数据归一化处理。
CN201510372326.1A 2015-06-30 2015-06-30 一种基于鲁棒多平面支持向量机的图像识别方法及装置 Active CN104915684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510372326.1A CN104915684B (zh) 2015-06-30 2015-06-30 一种基于鲁棒多平面支持向量机的图像识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510372326.1A CN104915684B (zh) 2015-06-30 2015-06-30 一种基于鲁棒多平面支持向量机的图像识别方法及装置

Publications (2)

Publication Number Publication Date
CN104915684A true CN104915684A (zh) 2015-09-16
CN104915684B CN104915684B (zh) 2018-03-27

Family

ID=54084733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510372326.1A Active CN104915684B (zh) 2015-06-30 2015-06-30 一种基于鲁棒多平面支持向量机的图像识别方法及装置

Country Status (1)

Country Link
CN (1) CN104915684B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105469117A (zh) * 2015-12-03 2016-04-06 苏州大学 一种基于鲁棒特征提取的图像识别方法与装置
CN105528620A (zh) * 2015-12-11 2016-04-27 苏州大学 一种联合鲁棒主成分特征学习与视觉分类方法及***
CN106022356A (zh) * 2016-05-11 2016-10-12 华东师范大学 一种基于梯度下降法的多视图gepsvm网页分类算法
CN106444653A (zh) * 2016-08-19 2017-02-22 苏州大学 一种故障检测方法和***
CN110147725A (zh) * 2019-04-12 2019-08-20 杭州电子科技大学 一种基于正交指数局保投影的高光谱图像特征提取方法
CN113449772A (zh) * 2021-05-26 2021-09-28 浙江工业大学 基于鲁棒多投影支持向量机的医学图像处理方法
WO2022052459A1 (zh) * 2020-09-14 2022-03-17 苏州大学 一种图像类别检测方法、***、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101021897A (zh) * 2006-12-27 2007-08-22 中山大学 一种基于块内相关性的二维线性鉴别分析人脸识别方法
US20080101689A1 (en) * 2006-10-25 2008-05-01 George Henry Forman Classification using feature scaling
CN101329724A (zh) * 2008-07-29 2008-12-24 上海天冠卫视技术研究所 一种优化的人脸识别方法和装置
CN102254166A (zh) * 2011-08-15 2011-11-23 无锡中星微电子有限公司 一种人脸识别方法
CN104463202A (zh) * 2014-11-28 2015-03-25 苏州大学 一种多类图像半监督分类方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080101689A1 (en) * 2006-10-25 2008-05-01 George Henry Forman Classification using feature scaling
CN101021897A (zh) * 2006-12-27 2007-08-22 中山大学 一种基于块内相关性的二维线性鉴别分析人脸识别方法
CN101329724A (zh) * 2008-07-29 2008-12-24 上海天冠卫视技术研究所 一种优化的人脸识别方法和装置
CN102254166A (zh) * 2011-08-15 2011-11-23 无锡中星微电子有限公司 一种人脸识别方法
CN104463202A (zh) * 2014-11-28 2015-03-25 苏州大学 一种多类图像半监督分类方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
业巧林 等: "权向量投影多平面支持向量机", 《模式识别与人工智能》 *
黄华娟: "孪生支持向量机关键问题的研究", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105469117A (zh) * 2015-12-03 2016-04-06 苏州大学 一种基于鲁棒特征提取的图像识别方法与装置
CN105469117B (zh) * 2015-12-03 2019-01-01 苏州大学 一种基于鲁棒特征提取的图像识别方法与装置
CN105528620A (zh) * 2015-12-11 2016-04-27 苏州大学 一种联合鲁棒主成分特征学习与视觉分类方法及***
CN106022356A (zh) * 2016-05-11 2016-10-12 华东师范大学 一种基于梯度下降法的多视图gepsvm网页分类算法
CN106444653A (zh) * 2016-08-19 2017-02-22 苏州大学 一种故障检测方法和***
CN106444653B (zh) * 2016-08-19 2019-07-19 苏州大学 一种故障检测方法和***
CN110147725A (zh) * 2019-04-12 2019-08-20 杭州电子科技大学 一种基于正交指数局保投影的高光谱图像特征提取方法
WO2022052459A1 (zh) * 2020-09-14 2022-03-17 苏州大学 一种图像类别检测方法、***、电子设备及存储介质
CN113449772A (zh) * 2021-05-26 2021-09-28 浙江工业大学 基于鲁棒多投影支持向量机的医学图像处理方法

Also Published As

Publication number Publication date
CN104915684B (zh) 2018-03-27

Similar Documents

Publication Publication Date Title
CN104915684A (zh) 一种基于鲁棒多平面支持向量机的图像识别方法及装置
US11423076B2 (en) Image similarity-based group browsing
Li et al. Robust and accurate iris segmentation in very noisy iris images
Li et al. Towards 3D face recognition in the real: a registration-free approach using fine-grained matching of 3D keypoint descriptors
Hermosilla et al. A comparative study of thermal face recognition methods in unconstrained environments
Castrillón-Santana et al. On using periocular biometric for gender classification in the wild
Mittal et al. Recognizing composite sketches with digital face images via SSD dictionary
WO2016110030A1 (zh) 一种人脸图像的检索***及方法
Lee et al. Vasir: an open-source research platform for advanced iris recognition technologies
Wu et al. Optimizing mean reciprocal rank for person re-identification
Zhang et al. Robust 3D face recognition based on resolution invariant features
CN103198303A (zh) 一种基于人脸图像的性别识别方法
WO2016106966A1 (zh) 人物标注方法和终端、存储介质
WO2022042043A1 (zh) 机器学习模型的训练方法、装置和电子设备
CN105184266B (zh) 一种手指静脉图像识别方法
CN104834905A (zh) 一种人脸图像识别仿真***及方法
Ren et al. A chi-squared-transformed subspace of LBP histogram for visual recognition
CN105631433A (zh) 一种两维线性鉴别分析的人脸识别方法
Ahmed et al. Evaluation of accurate iris center and eye corner localization method in a facial image for gaze estimation
Ahmed et al. Eye center localization in a facial image based on geometric shapes of iris and eyelid under natural variability
Zafeiriou et al. Probabilistic slow features for behavior analysis
Binder et al. Enhanced representation and multi-task learning for image annotation
CN105528620A (zh) 一种联合鲁棒主成分特征学习与视觉分类方法及***
CN109766455A (zh) 一种有鉴别的全相似性保留哈希跨模态检索方法
Ahmed et al. Eye center localization using gradient and intensity information under uncontrolled environment

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant