CN105184298A - 一种快速局部约束低秩编码的图像分类方法 - Google Patents

一种快速局部约束低秩编码的图像分类方法 Download PDF

Info

Publication number
CN105184298A
CN105184298A CN201510534124.2A CN201510534124A CN105184298A CN 105184298 A CN105184298 A CN 105184298A CN 201510534124 A CN201510534124 A CN 201510534124A CN 105184298 A CN105184298 A CN 105184298A
Authority
CN
China
Prior art keywords
vector
image
dictionary
dist
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510534124.2A
Other languages
English (en)
Other versions
CN105184298B (zh
Inventor
范敏
王芬
杜思远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201510534124.2A priority Critical patent/CN105184298B/zh
Publication of CN105184298A publication Critical patent/CN105184298A/zh
Application granted granted Critical
Publication of CN105184298B publication Critical patent/CN105184298B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种快速局部约束低秩编码的图像分类方法,该方法分字典学习部分、训练部分和测试部分。字典学习部分是根据数据集提取的所有SIFT特征学运用到k-menas方法聚类或其他字典学习方法得到相应的字典。训练部分选取每个数据集每类中的部分图像作为训练图像,然后针对这些图像的标签学习每个类别对应的低秩表示,经过SPM量化得到经过SVM分类训练得到类别标签和特征表示矩阵对应的核函数。测试部分以每个数据库中剩余的所有图像作为待分类的测试图像,针对任意一张不知类别的图像,首先提取SIFT特征,然后求得其在字典下的低秩编码矩阵,经过SPM量化得到最终的特征表示矩阵,将其输入训练部分得到的SVM分类器,从而得到该图像所属类别。

Description

一种快速局部约束低秩编码的图像分类方法
技术领域
本发明涉及一种利用快速局部约束低秩编码的方法进行图像分类,此方法快速并精度较高,是一种基于图像内容的数据驱动的分类方法。
背景技术
图像分类属于计算机视觉的一个重要研究方向,它包括图像的预处理,特征的表达与分类器的设计,其中特征表达包括图像特征的提取、特征的降维和特征的编码。特征提取主要是通过图像中各种内容表现出来的颜色、亮度、纹理、形状及像素的空间分布等属性对图像描述。特征表达式指在最基本的特征基础上进行统计(矢量量化)、编码或其他方法以形成一幅图像最后的特征,通常情况下会比原始的基本特征具有更好的性能;良好的特征表达能够提升图像分类和识别的性能。
近几年对于特征描述表示的方法比较多,有视觉词包模型(bagofwords,BOW)、基于稀疏编码的空间金字塔模型(SparseCodingSpatialPyramidMatching,ScSPM)、局部约束线性编码(Locality-constrainedLinearCoding,LLC)、结构低秩表示的图像分类方法(StructuredLow-rankRepresentation,SLRR)和低秩稀疏分解的图像分类方法(Low-rankSparseCoding,LRSC),这些方法在一定程度上克服了一些难题,不过依然都存在不足。
视觉词包模型(bagofwords,BOW)虽然易于构建,但忽略了同类图像具有一定的空间结构相似性。基于稀疏编码的空间金字塔模型(SparseCodingSpatialPyramidMatching,ScSPM)忽略了局部描述子之间的相关性,而且对特征的变化和噪声敏感,而且计算量很大,耗内存。局部约束线性编码(Locality-constrainedLinearCoding,LLC),这种局部性一定程度上导致了稀疏性,相对于稀疏编码使得算法的运算量大大减小,速度提高,但LLC忽略了特征之间的整体结构化特征的空间信息。结构低秩表示的图像分类方法(StructuredLow-rankRepresentation,SLRR),对人脸识别有较好的效果,尤其适用于有严重噪声(如遮挡、光照角度变化等)的图像分类。低秩稀疏分解的图像分类方法(Low-rankSparseCoding)(LRSC)分类精度得到了一定提高,但还是忽略了局部空间信息;其中稀疏部分对编码仍然很敏感。基于空间金字塔的快速低秩表示的图像分类方法(FastLow-rankRepresentationbasedSpatialPyramidMatching,LrrSPM),此方法的分类速度是ScSPM的5~16倍,但是分类精度低于ScSPM和LLC方法。
目前图像分类方法大都采用稀疏编码和低秩表示的编码方式,但是鉴于稀疏编码对图像的变化和噪声较敏感,非常耗内存;采用低秩表示的编码方式在精度和计算复杂度间得到一个平衡。
发明内容
鉴于目前分类方法在分类效果及分类速度方面的缺陷,本发明提出一种快速局部约束低秩编码的图像分类方法,该方法包括字典学习部分,训练部分和测试部分三个部分。字典学习部分要求对图像库内所有图像提取图像的SIFT特征,经过K-means聚类得到字典;训练部分首先对训练集中的图像提取SIFT特征,然后求得SIFT特征在字典下的特征编码表示,采用局部约束的低秩编码方法,同时考虑图像的全局结构一致性和局部空间相似性,得到特征编码矩阵,经过空间金字塔匹配核、池化后得到最终的特征表示矩阵,采用SVM方法对特征表示矩阵和类标记进行训练,建立分类模型。测试部分首先对任意一张图像进行特征提取,然后求得在其字典下编码矩阵,经过空间金字塔匹配核、池化得到特征表示矩阵后,输入训练得到的SVM分类器,得到该图像所属的分类结果。
为实现本发明目的而采用的技术方案是这样的,一种快速局部约束低秩编码的图像分类方法,包括字典学习部分、训练部分和测试部分。
所述字典学习部分步骤过程如下:
1)利用SIFT特征提取方法对图像库所有图像进行局部特征提取,得到输入特征向量矩阵X=[x1,x2,…,xn]∈Rm×n,其中xi∈Rn是特征向量矩阵的第i个分量向量,其中m为向量的维数,n为向量个数。
2)利用K-means方法聚类或者其他字典学习方法,对所有图像提取的特征向量矩阵X进行聚类处理,得到过完备字典D=[d1,d2,…,dk]∈Rm×k,其中m是字典的维数,k为字典基的数目,满足字典过完备性m<<k,k通常为256,1024,4096等。
所述训练部分步骤过程如下:
i)从图像库中选取部分图像作为训练图像,利用SIFT特征提取方法对所有训练图像进行局部特征提取,得到输入特征向量矩阵X'=[x1',x2',…,xn']∈Rm×n。其中xi'∈Rn是特征向量矩阵的第i个分量向量,其中m为向量的维数,n为向量个数。
ii)计算每个特征向量xi和字典向量之间的欧式距离pi,计算公式如下:
p i = exp ( d i s t ( x i ′ , D ) σ )
dist(xi',D)=[dist(xi',d1),…,dist(xi',dk)]T,dist(xi',di)是特征向量xi'与每一个字典向量di间的欧式距离,σ是调整局部约束速度的权重。
iii)计算局部约束低秩编码的特征表示向量Z,计算公式为:
Z = ( λ 1 I + DD T + λ 1 λ 2 Σ i = 1 k p i T p i ) - 1 D T X ′
其中λ12>0是权重;pi为上述步骤ii计算得到的欧氏距离pi
iv)对得到的特征表示向量Z采用空间金字塔匹配方法进行处理,将Z分成2l×2l块,其中l=1,2,4,分别代表不同的三层对应的空间金字塔分块的个数。然后针对每层中每个字块的zi进行最大池化,即zi=max{|z1i|,|z2i|,…,|zji|},得到最终的低秩编码的第i向量zi,其中zji是第j块中的第i个元素,j=2l×2l,通过这个过程得到最后的特征表示矩阵Z'。
v)将特征表示矩阵Z'输入SVM分类器,根据每类图像类别标签和其对应的特征表示矩阵Z',学习得到SVM分类器的核函数。
所述测试部分步骤过程如下:
I)对图像库中剩余的所有图像提取SIFT特征,得到输入特征向量矩阵X*=[x1*,x1*,…,xn*]∈Rm×n,其中xi*∈Rn是特征向量矩阵的第i个分量向量。
II)计算每个特征向量xi*和字典向量之间的欧式距离pi,计算公式如下:
p i * = exp ( d i s t ( x i * , D ) σ )
dist(xi*,D)=[dist(xi*,d1),…,dist(xi*,dk)]T,dist(xi*,di)是特征向量xi*与每一个字典向量di间的欧式距离,σ是调整局部约束速度的权重。
III)计算局部约束低秩编码的特征表示向量Z*,计算公式为:
Z * = ( λ 1 I + DD T + λ 1 λ 2 Σ i = 1 k p i * T p i * ) - 1 D T X *
其中λ12>0是权重;pi*为上述步骤II计算得到的欧氏距离。
IV)采用空间金字塔匹配方法,将特征表示向量Z*分成2l×2l块,其中l=1,2,4,分别代表不同的三层对应的空间金字塔分块的个数。然后针对每层中每个字块的zi*进行最大池化,保持特征表示向量具有一定的鲁棒性,即zi*=max{|z1i*|,|z2i*|,…,|zji*|},得到最终的低秩编码的第i向量zi*,其中zji*是第j块中的第i个元素,j=2l×2l,这样得到最后的特征表示矩阵Z*'。
V)将特征表示矩阵Z*'输入训练部分得到的SVM分类器,得到待分类图像所属的类别标签。
VI)统计测试分类图像正确分类的百分比,得到每类测试图像最终的分类精度。
进一步,所述一种快速局部约束低秩编码的图像分类方法中,训练部分中步骤iii及测试部分中步骤III计算特征编码的低秩表示向量。
现有低秩表示的编码方法是在允许的误差范围内寻找特征向量的低秩表示,即
m i n Z , E | | Z | | * + λ 1 | | E | | p
s.t.X=DZ+E
其中μ12>0是误差惩罚项,λ1>0是权值,Z为特征向量X在字典D下的表示。其中‖Z‖*是核范数,‖E‖p是约束稀疏编码项的l1范数或者约束某一类干扰的l2-1范数。
现有低秩优化算法常见的是采用拉格朗日乘子优化AugmentedLagrangeMultiplealgorithm(ALM),优化表达式如下:
min Z , D | | Z | | * + λ | | D - D 0 | | F + t r [ Y T ( D - D 0 - E 1 ) ] + t r [ Y T ( X - D Z - E 2 ) ] + μ 1 2 | | D - D 0 - E 1 | | F 2 + μ 2 2 | | X - D Z - E 2 | | F 2 - - - ( 1 )
其中‖·‖F是F范数(Frobeniusnorm),λ1>0是权值,Y1,Y2拉格朗日乘子,μ12>0是误差惩罚项。
上式1可采用典型的exactALM或inexactALM方法,采用迭代方法一步一步分别更新特征表示向量Z和初始字典D0,这种方法的计算复杂度为O(mn2),n为特征向量的个数。这种计算来那个很大,而且是一种离线的迭代优化的方法,对增量式的输入图像无法得到分类结果(如不属于该类别的图像求不出特征表示)。同时,现有的低秩约束只考虑了图像特征的全局结构一致性,忽略了特征的局部空间相似性,不能全面的表示图像特征间的关联信息。
本方法中计算局部约束的低秩编码方法步骤如下:
a)在字典误差为零的情况下,E1=D-D0=0,F范数‖·‖F可以取代核范数‖·‖*。上述优化表达式1变为
m i n Z | | Z | | F + λ 1 / 2 | | X - D Z | | F 2 - - - ( 2 )
b)低秩约束采取联合编码方式,在图像特征全局结构一致性的基础上,弥补特征的局部空间相似性,加入局部约束项上述表达式2变为:
其中λ12>0为不相等的权重,符号⊙表示两向量的对应元素相乘,pi为特征向量xi和字典向量D的欧氏距离pi
p i = exp ( d i s t ( x i , D ) σ )
dist(xi,D)=[dist(xi,d1),…,dist(xi,dk)]T,dist(xi,di)是特征向量xi与每一个字典向量di间的欧式距离,σ是调整局部约束速度的权重。
c)对上述表达式3进行求导
最后计算得到特征表示向量: Z = ( λ 1 I + DD T + λ 1 λ 2 Σ i = 1 k p i T p i ) - 1 D T X , 其中I为k×k的单位向量。
在求导过程中采取阈值约束项将特征表示向量zi约束在0.98以内。
本发明的技术效果是毋庸置疑的,本发明采用一种快速的局部约束的低秩编码分类方法,同时考虑图像特征的全局结构一致性和局部空间相似性,不仅能更好的表示图像特征间的关联信息,得到有效的分类精度,而且计算量降低,分类速度稍大于LLC,仅是ScSPM的19.4~25%。
附图说明
图1为图像分类总流程;
图2为局部约束低秩编码(FLCLR)流程图;
图3为表1中部分类的图像示例;
图4为表2中部分类的图像示例;
图5为表4中部分类的图像示例;
图中:1-特征提取,2-特征编码,3-池化过程。
具体实施方式
下面结合实施例对本发明作进一步说明,但不应该理解为本发明上述主题范围仅限于下述实施例。在不脱离本发明上述技术思想的情况下,根据本领域普通技术知识和惯用手段,做出各种替换和变更,均应包括在本发明的保护范围内。
以下实施选取图像分类常用的权威图像库Scene13和Caltech101作为分类测试数据集。Scene13是最常用的场景分类数据集,有13类图像,包含郊区(CALsuburb),海岸(MITcoast),森林(MITforest)等共4485幅,每类包含200到400张图片。Caltech101图像库包含101类(如动物、花、人脸等)和一个背景类图像,共9144幅。每一类包含31到800幅图像,并且有较大的类内差异,是图像分类最常用的数据库。
如图1所示,整个实施步骤分为三大部分,第一部分是字典学习部分,根据数据集提取所有SIFT特征,运用k-menas方法聚类等字典学习方法得到相应的字典。第二部分是训练部分,选取每个数据集每类中的部分图像,其中Scene13随机取100个作为训练图像,Caltech101随机取30个作为训练图像。然后针对这些训练图像的标签学习每个类别对应的低秩表示,经过SPM量化得到经过SVM分类训练得到类别标签和特征表示对应的核函数。第三部分是测试部分,以每个数据库中剩余的所有图像作为待分类的测试图像,针对任意一张不知类别的图像,首先提取SIFT特征,然后求得其在字典下的低秩编码向量,经过SPM量化得到最终的特征表示矩阵,将其输入训练部分所得到的SVM分类器,进而得到该图像所属的类别。
预处理说明:把图像大小调整为最大300×300像素,特征提取密集釆样的网格为16×16像素,其步长为4像素。
字典学习部分:
1)对图像库中所有的图像提取SIFT局部特征,得到输入特征向量矩阵X=[x1,x2,…,xn]∈Rm×n,其中xi∈Rn是图像的第i个局部特征向量,其中m为向量的维数,n为向量个数。
2)利用K-means方法聚类或者其他字典学习方法,对所有图像提取的特征向量进行聚类处理,得到过完备字典D=[d1,d2,…,dk]∈Rm×k,其中k是字典的维数,m为字典基的数目,满足字典过完备性m<<k,其中k为字典的维数取1024。
训练部分:
i)对选取的训练图像提取SIFT特征,得到输入特征向量矩阵X'=[x'1,x'2,…,x'n]∈Rm×n,其中xi'∈Rn是特征向量矩阵的第i个分量向量。
ii)计算训练图像中的每个特征向量xi'和字典向量之间的欧氏距离pi,计算公式如下:
p i = exp ( d i s t ( x i ′ , D ) σ )
dist(xi',D)=[dist(xi',d1),…,dist(xi',dk)]T,dist(xi',di)是特征向量xi'与每一个字典向量di间的欧式距离;σ是调整局部约束速度的权重,取100。
iii)计算局部约束低秩编码的特征表示向量Z,计算公式为:
Z = ( λ 1 I + DD T + λ 1 λ 2 Σ i = 1 k p i T p i ) - 1 D T X ′
其中I为单位矩阵,维度与Z一致,λ12>0是权重,λ12按照文献Wang和Peng的经验值取值分别为0.7,0.0001。pi为上述步骤2中计算得到的欧氏距离。
步骤ii和步骤iii寻求得到特征向量矩阵X在字典D下的特征表示向量z,即X=DZ其中Z=[z1,z1,…,zn]∈Rk×n。算法流程图如图2所示。
iv)采用空间金字塔匹配方法,将Z分成2l×2l块,其中l=1,2,4,分别代表不同的三层对应的空间金字塔分块的个数。然后针对每层中每个字块的zi进行最大池化,保持特征表示向量具有一定的鲁棒性,即zi=max{|z1i|,|z2i|,…,|zji|},得到最终的低秩编码的第i向量zi,其中zji是第j块中的第i个元素,j=2l×2l,这样得到最后的特征表示矩阵Z'。
v)将特征表示矩阵Z'输入SVM分类器,根据每类图像类别标签和其对应的特征表示矩阵Z',学习得到SVM分类器的核函数。
测试部分:
I)对图像库中剩余的所有图像提取SIFT特征,得到输入特征向量矩阵X*=[x1*,x1*,…,xn*]∈Rm×n,其中xi*∈Rn是特征向量矩阵的第i个分量向量。
II)计算每个特征向量xi*和字典向量之间的欧式距离pi,计算公式如下:
p i * = exp ( d i s t ( x i * , D ) σ )
dist(xi*,D)=[dist(xi*,d1),…,dist(xi*,dk)]T,dist(xi*,di)是特征向量xi*与每一个字典向量di间的欧式距离,σ是调整局部约束速度的权重。
III)计算局部约束低秩编码的特征表示向量Z*,计算公式为:
Z * = ( λ 1 I + DD T + λ 1 λ 2 Σ i = 1 k p i * T p i * ) - 1 D T X *
其中λ12>0是权重;pi*为上述步骤II计算得到的欧氏距离。
IV)采用空间金字塔匹配方法,将Z*分成2l×2l块,其中l=1,2,4,分别代表不同的三层对应的空间金字塔分块的个数。然后针对每层中每个字块的zi*进行最大池化,保持特征表示向量具有一定的鲁棒性,即zi*=max{|z1i*|,|z2i*|,…,|zji*|},得到最终的低秩编码的第i向量zi*,其中zji*是第j块中的第i个元素,j=2l×2l,这样得到最后的特征表示矩阵Z*'。
V)将特征表示矩阵Z*'输入训练部分得到的SVM分类器,得到待分类图像所属的类别标签。
VI)统计测试分类图像正确分类的百分比,得到每类测试图像最终的分类精度。
为了对比本发明方法的有效性,测试中选取了最常用的几种相关图像分类方法对应程序,对比试验的实验参数的设置完全相同,均得到实验分类对比结果,如列表所示。
表1为Scene13的部分分类精度(第一组);
表2为Scene13的部分分类精度(第二组);
表3为Scene13的整体分类精度和时间;
表4为Caltech101的部分分类精度(第一组);
表5为Caltech101的整体分类精度和时间。
其中ScSPM为基于稀疏编码的空间金字塔模型图像分类方法,LLC为局部约束线性编码图像分类方法,LrrSPM为基于空间金字塔的快速低秩表示的图像分类方法,FLCLR为本实验提出的快速局部约束地址编码的图像分类方法。
表1
Classes ScSPM LLC LrrSPM FLCLR
MITtallbuilding 0.7182 0.7727 0.8148 0.85714
bedroom 0.8787 0.8129 0.9074 0.9858
MITforest 0.8397 0.8431 0.8538 0.9414
MIThighway 0.6387 0.6774 0.7027 0.7818
MITcoast 0.83654 0.8846 0.8125 0.89375
kitchen 0.9118 0.9161 0.8992 0.9423
MITmountain 0.8980 0.9102 0.9025 0.93226
Mean 0.8174 0.8310 0.8420 0.9049
表2
Classes ScSPM LLC LrrSPM FLCLR
Livingroom 0.8550 0.8438 0.83125 0.8437
MITstreet 0.6638 0.6840 0.6293 0.6207
MITopencountry 0.9478 0.9391 0.8783 0.8922
MITinsidecity 0.8802 0.8654 0.8594 0.8608
CALsuburb 0.8323 0.8308 0.8154 0.8123
PARoffice 0.6725 0.6032 0.6032 0.6009
Mean 0.8086 0.7944 0.7695 0.7718
表3
表4
Classes ScSPM LLC LrrSPM FLCLR
car_side 0.7000 0.7318 0.7536 0.8364
chair 0.4615 0.6223 0.6485 0.72230
Faces 0.6470 0.6647 0.7059 0.7765
mayfly 0.7192 0.7192 0.7587 0.8462
pyramid 0.6667 0.7578 0.7783 0.8519
water_lilly 0.4286 0.6429 0.6943 0.7714
widsor_char 0.84615 0.9315 0.9534 0.9931
表5

Claims (1)

1.一种快速局部约束低秩编码的图像分类方法,其特征在于:包括字典学习部分、训练部分和测试部分;
所述字典学习部分包括以下步骤过程;
1)利用SIFT特征提取方法对图像库所有图像进行局部特征提取,得到输入特征向量矩阵X=[x1,x2,…,xn]∈Rm×n;其中xi∈Rn是特征向量矩阵的第i个分量向量,m为向量的维数,n为向量个数;
2)利用K-means方法聚类或者其他字典学习方法,对所有图像提取的特征向量矩阵X进行聚类处理,得到过完备字典D=[d1,d2,…,dk]∈Rm×k;其中m是字典的维数,k为字典基的数量;
所述训练部分包括以下步骤过程;
i)从图像库中选取部分图像作为训练图像,利用SIFT特征提取方法对所有训练图像进行局部特征提取,得到输入特征向量矩阵X'=[x1',x2',…,xn']∈Rm×n;其中xi'∈Rn是特征向量矩阵的第i个分量向量,其中m为向量的维数,n为向量个数;
ii)计算每个特征向量xi'和字典向量D之间的欧式距离pi,计算公式如下:
p i = exp ( d i s t ( x i ′ , D ) σ )
dist(xi',D)=[dist(xi',d1),…,dist(xi',dk)]T,dist(xi',di)是特征向量xi'与每一个字典向量di间的欧式距离;σ是调整局部约束速度的权重;
iii)计算局部约束低秩编码的特征表示向量Z,计算公式为:
Z = ( λ 1 I + DD T + λ 1 λ 2 Σ i = 1 k p i T p i ) - 1 D T X ′
其中λ12>0是权重,I为单位向量,Z=[z1,z1,…,zn]∈Rk×n;pi为上述步骤ii计算得到的欧氏距离;
iv)对得到的特征表示向量Z采用空间金字塔匹配方法进行处理,将Z分成2l×2l块,其中l=1,2,4,分别代表不同的三层对应的空间金字塔分块的个数;然后针对每层中每个字块的zi进行最大池化,即zi=max{|z1i|,|z2i|,…,|zji|},得到最终的低秩编码的第i向量zi,其中zji是第j块中的第i个元素,j=2l×2l,通过这个过程得到最后的特征表示矩阵Z';
v)将特征表示矩阵Z'输入SVM分类器;每个图像对应有一个标签,根据每类图像类别标签和其对应的特征表示矩阵Z',学习得到SVM分类器的核函数;
所述测试部分包括以下步骤过程;
I)对图像库中选取训练图像后剩余的图像,提取SIFT特征,得到输入特征向量矩阵X*=[x1 *,x1 *,…,xn *]∈Rm×n,其中xi *∈Rn是特征向量矩阵的第i个分量向量;
II)计算每个特征向量xi *和字典向量之间的欧式距离pi,计算公式如下:
p i * = exp ( d i s t ( x i * , D ) σ )
dist(xi *,D)=[dist(xi *,d1),…,dist(xi *,dk)]T,dist(xi *,di)是特征向量xi *与每一个字典向量di间的欧式距离;σ是调整局部约束速度的权重;
III)计算局部约束低秩编码的特征表示向量Z*,计算公式为:
Z * = ( λ 1 I + DD T + λ 1 λ 2 Σ i = 1 k p i * T p i * ) - 1 D T X *
其中λ12>0是权重,其中I为单位向量;pi *为上述步骤II计算得到的欧氏距离;
IV)采用空间金字塔匹配方法,将特征表示向量Z*分成2l×2l块,其中l=1,2,4,分别代表不同的三层对应的空间金字塔分块的个数;然后针对每层中每个字块的zi *进行最大池化,保持特征表示向量具有一定的鲁棒性,即zi *=max{|z1i *|,|z2i *|,…,|zji *|},得到最终的低秩编码的第i向量zi *,其中zji *是第j块中的第i个元素,j=2l×2l,这样得到最后的特征表示矩阵Z*';
V)将特征表示矩阵Z*'输入训练部分得到的SVM分类器,得到待分类图像所属的类别标签;
VI)统计测试分类图像正确分类的百分比,得到每类测试图像最终的分类精度;
所述训练部分中步骤iii以及测试部分中步骤III,计算局部约束低秩编码的特征表示向量,计算局部约束的低秩编码方法包括以下步骤;
a)在字典误差为零的情况下,E1=D-D0=0,F范数||·||F可以取代核范数||·||*;将现有的表达式 min Z , D | | Z | | * + λ | | D - D 0 | | F + t r [ Y T ( D - D 0 - E 1 ) ] + t r [ Y T ( X - D Z - E 2 ) ] + μ 1 2 | | D - D 0 - E 1 | | F 2 + μ 2 2 | | X - D Z - E 2 | | F 2 优化变成为
min Z | | Z | | F + λ 1 / 2 | | X - D Z | | F 2
b)低秩约束采取联合编码方式,在图像特征全局结构一致性的基础上,弥补特征的局部空间相似性,加入局部约束项上述步骤a中优化后的表达式变为:
其中λ12>0为不相等的权重;符号⊙表示两向量的对应元素相乘;pi为特征向量xi和字典向量D的欧氏距离pi:
p i = exp ( d i s t ( x i , D ) σ )
dist(xi,D)=[dist(xi,d1),…,dist(xi,dk)]T,dist(xi,di)是特征向量xi与每一个字典向量di间的欧式距离;σ是调整局部约束速度的权重;
c)对上述步骤b中加入局部约束项后的优化表达式进行求导
最后计算得到特征表示向量: Z = ( λ 1 I + DD T + λ 1 λ 2 Σ i = 1 k p i T p i ) - 1 D T X , 其中I为k×k的单位向量。
CN201510534124.2A 2015-08-27 2015-08-27 一种快速局部约束低秩编码的图像分类方法 Active CN105184298B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510534124.2A CN105184298B (zh) 2015-08-27 2015-08-27 一种快速局部约束低秩编码的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510534124.2A CN105184298B (zh) 2015-08-27 2015-08-27 一种快速局部约束低秩编码的图像分类方法

Publications (2)

Publication Number Publication Date
CN105184298A true CN105184298A (zh) 2015-12-23
CN105184298B CN105184298B (zh) 2018-10-19

Family

ID=54906364

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510534124.2A Active CN105184298B (zh) 2015-08-27 2015-08-27 一种快速局部约束低秩编码的图像分类方法

Country Status (1)

Country Link
CN (1) CN105184298B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718934A (zh) * 2016-01-25 2016-06-29 无锡中科富农物联科技有限公司 一种基于低秩稀疏编码技术的害虫图像特征学习与识别方法
CN106056082A (zh) * 2016-05-31 2016-10-26 杭州电子科技大学 一种基于稀疏低秩编码的视频动作识别方法
CN106407899A (zh) * 2016-08-30 2017-02-15 电子科技大学 基于局部纹理特征的人群密度谱估计方法
CN107092875A (zh) * 2017-04-11 2017-08-25 福州大学 一种新的场景识别方法
CN107392140A (zh) * 2017-07-19 2017-11-24 苏州闻捷传感技术有限公司 基于低秩稀疏分解和增量学习的极化sar地物分类方法
CN107766790A (zh) * 2017-08-31 2018-03-06 电子科技大学 一种基于局部约束低秩编码的人体行为识别方法
CN108052867A (zh) * 2017-11-20 2018-05-18 河海大学 一种基于词袋模型的单样本人脸识别方法
CN109271949A (zh) * 2018-09-28 2019-01-25 中国科学院长春光学精密机械与物理研究所 多谱段图像数据提取方法、装置、设备及可读存储介质
CN109726730A (zh) * 2017-10-27 2019-05-07 财团法人工业技术研究院 自动光学检测图像分类方法、***及计算机可读介质
CN110580482A (zh) * 2017-11-30 2019-12-17 腾讯科技(深圳)有限公司 图像分类模型训练、图像分类、个性化推荐方法及装置
CN110889345A (zh) * 2019-11-15 2020-03-17 重庆邮电大学 一种基于协作表示与分类的判别低秩矩阵恢复遮挡人脸识别方法
CN111930934A (zh) * 2020-06-05 2020-11-13 江苏理工学院 一种基于对偶局部一致的约束稀疏概念分解的聚类方法
US11315231B2 (en) 2018-06-08 2022-04-26 Industrial Technology Research Institute Industrial image inspection method and system and computer readable recording medium
CN115082727A (zh) * 2022-05-25 2022-09-20 江苏大学 基于多层局部感知深度字典学习的场景分类方法及***

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103413151A (zh) * 2013-07-22 2013-11-27 西安电子科技大学 基于图正则低秩表示维数约简的高光谱图像分类方法
US20140156575A1 (en) * 2012-11-30 2014-06-05 Nuance Communications, Inc. Method and Apparatus of Processing Data Using Deep Belief Networks Employing Low-Rank Matrix Factorization
CN104268556A (zh) * 2014-09-12 2015-01-07 西安电子科技大学 一种基于核低秩表示图和空间约束的高光谱图像分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140156575A1 (en) * 2012-11-30 2014-06-05 Nuance Communications, Inc. Method and Apparatus of Processing Data Using Deep Belief Networks Employing Low-Rank Matrix Factorization
CN103413151A (zh) * 2013-07-22 2013-11-27 西安电子科技大学 基于图正则低秩表示维数约简的高光谱图像分类方法
CN104268556A (zh) * 2014-09-12 2015-01-07 西安电子科技大学 一种基于核低秩表示图和空间约束的高光谱图像分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DEVANSH ARPIT等: "Locality-constrained Low Rank Coding for Face Recognition", 《21ST INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105718934A (zh) * 2016-01-25 2016-06-29 无锡中科富农物联科技有限公司 一种基于低秩稀疏编码技术的害虫图像特征学习与识别方法
CN106056082B (zh) * 2016-05-31 2019-03-08 杭州电子科技大学 一种基于稀疏低秩编码的视频动作识别方法
CN106056082A (zh) * 2016-05-31 2016-10-26 杭州电子科技大学 一种基于稀疏低秩编码的视频动作识别方法
CN106407899A (zh) * 2016-08-30 2017-02-15 电子科技大学 基于局部纹理特征的人群密度谱估计方法
CN106407899B (zh) * 2016-08-30 2019-07-19 电子科技大学 基于局部纹理特征的人群密度谱估计方法
CN107092875A (zh) * 2017-04-11 2017-08-25 福州大学 一种新的场景识别方法
CN107092875B (zh) * 2017-04-11 2020-02-07 福州大学 一种新的场景识别方法
CN107392140B (zh) * 2017-07-19 2021-01-08 苏州闻捷传感技术有限公司 基于低秩稀疏分解和增量学习的极化sar地物分类方法
CN107392140A (zh) * 2017-07-19 2017-11-24 苏州闻捷传感技术有限公司 基于低秩稀疏分解和增量学习的极化sar地物分类方法
CN107766790A (zh) * 2017-08-31 2018-03-06 电子科技大学 一种基于局部约束低秩编码的人体行为识别方法
CN107766790B (zh) * 2017-08-31 2021-04-30 电子科技大学 一种基于局部约束低秩编码的人体行为识别方法
CN109726730A (zh) * 2017-10-27 2019-05-07 财团法人工业技术研究院 自动光学检测图像分类方法、***及计算机可读介质
CN108052867A (zh) * 2017-11-20 2018-05-18 河海大学 一种基于词袋模型的单样本人脸识别方法
CN108052867B (zh) * 2017-11-20 2021-11-23 河海大学 一种基于词袋模型的单样本人脸识别方法
CN110580482A (zh) * 2017-11-30 2019-12-17 腾讯科技(深圳)有限公司 图像分类模型训练、图像分类、个性化推荐方法及装置
CN110580482B (zh) * 2017-11-30 2022-04-08 腾讯科技(深圳)有限公司 图像分类模型训练、图像分类、个性化推荐方法及装置
US11315231B2 (en) 2018-06-08 2022-04-26 Industrial Technology Research Institute Industrial image inspection method and system and computer readable recording medium
CN109271949A (zh) * 2018-09-28 2019-01-25 中国科学院长春光学精密机械与物理研究所 多谱段图像数据提取方法、装置、设备及可读存储介质
CN110889345A (zh) * 2019-11-15 2020-03-17 重庆邮电大学 一种基于协作表示与分类的判别低秩矩阵恢复遮挡人脸识别方法
CN111930934A (zh) * 2020-06-05 2020-11-13 江苏理工学院 一种基于对偶局部一致的约束稀疏概念分解的聚类方法
CN111930934B (zh) * 2020-06-05 2023-12-26 江苏理工学院 一种基于对偶局部一致的约束稀疏概念分解的聚类方法
CN115082727A (zh) * 2022-05-25 2022-09-20 江苏大学 基于多层局部感知深度字典学习的场景分类方法及***

Also Published As

Publication number Publication date
CN105184298B (zh) 2018-10-19

Similar Documents

Publication Publication Date Title
CN105184298A (zh) 一种快速局部约束低秩编码的图像分类方法
CN107609601B (zh) 一种基于多层卷积神经网络的舰船目标识别方法
He et al. Learning and incorporating top-down cues in image segmentation
CN111753828B (zh) 一种基于深度卷积神经网络的自然场景水平文字检测方法
CN104616316B (zh) 基于阈值矩阵和特征融合视觉单词的人物行为识别方法
CN110619369A (zh) 基于特征金字塔与全局平均池化的细粒度图像分类方法
CN112528928B (zh) 一种基于自注意力深度网络的商品识别方法
CN105574548A (zh) 一种基于稀疏和低秩表示图的高光谱数据降维方法
CN109063719B (zh) 一种联合结构相似性和类信息的图像分类方法
CN104462196B (zh) 多特征联合哈希信息检索方法
CN107451545B (zh) 基于软标签下多通道判别非负矩阵分解的人脸识别方法
CN103955702A (zh) 基于深度rbf网络的sar图像地物分类方法
CN104268593A (zh) 一种小样本情况下多稀疏表示的人脸识别方法
CN107943856A (zh) 一种基于扩充标记样本的文本分类方法及***
CN103605972A (zh) 一种基于分块深度神经网络的非限制环境人脸验证方法
CN101551809A (zh) 基于高斯混合模型分类的sar图像检索方法
CN103761531A (zh) 基于形状轮廓特征的稀疏编码车牌字符识别方法
CN109657704B (zh) 一种基于稀疏融合的核化场景特征提取方法
CN108460400A (zh) 一种结合多种特征信息的高光谱图像分类方法
CN104268507A (zh) 一种基于rgb-d图像的手语字母识别方法
CN104318271A (zh) 一种基于适应性编码和几何平滑汇合的图像分类方法
CN109034213A (zh) 基于相关熵原则的高光谱图像分类方法和***
CN111898704A (zh) 对内容样本进行聚类的方法和装置
Al-Hmouz et al. Enhanced numeral recognition for handwritten multi-language numerals using fuzzy set-based decision mechanism
Shi et al. A new multiface target detection algorithm for students in class based on bayesian optimized YOLOv3 model

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant