CN103049760B - 基于图像分块和位置加权的稀疏表示目标识别方法 - Google Patents

基于图像分块和位置加权的稀疏表示目标识别方法 Download PDF

Info

Publication number
CN103049760B
CN103049760B CN201210581686.9A CN201210581686A CN103049760B CN 103049760 B CN103049760 B CN 103049760B CN 201210581686 A CN201210581686 A CN 201210581686A CN 103049760 B CN103049760 B CN 103049760B
Authority
CN
China
Prior art keywords
image
sample image
storehouse
image block
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210581686.9A
Other languages
English (en)
Other versions
CN103049760A (zh
Inventor
何珺
孙波
吴学文
葛凤祥
余乐军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Normal University
Original Assignee
Beijing Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Normal University filed Critical Beijing Normal University
Priority to CN201210581686.9A priority Critical patent/CN103049760B/zh
Publication of CN103049760A publication Critical patent/CN103049760A/zh
Application granted granted Critical
Publication of CN103049760B publication Critical patent/CN103049760B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及模式识别技术领域,公开了一种基于图像分块和位置加权的稀疏表示目标识别方法,所述方法包括以下步骤:S1、获取样本图像库,并对所述样本图像库中的样本图像进行图像分割,得到样本图像块库;S2、根据样本图像块库中各样本图像块的位置序号和稀疏表示误差,求得识别字典和位置权重向量;S3、根据所述识别字典和位置权重向量设计分类器;S4、逐像素地分割待识别图像,得到待识别图像块集;S5、对所述待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用所述分类器对待识别图像块进行类型识别。本发明能够用于识别外观不完整的物体。

Description

基于图像分块和位置加权的稀疏表示目标识别方法
技术领域
本发明涉及模式识别技术领域,特别是涉及一种基于图像分块和位置加权的稀疏表示目标识别方法。
背景技术
基于稀疏表示的分类(SRC)方法是一种像素级对齐方法,其遵循自然界中普遍适用的线性组合原理。
SRC方法的原理是:假设目标物在某种姿态下的图像,即测试对象可以用它在其他姿态下图像的线性组合表示或近似,然后根据测试对象相对于整个训练集的稀疏表示系数,得到测试对象的类别归属。可见,待测图像与训练字典的图像样本的相似性越高,SRC方法的适用效果就越好。
SRC方法的应用有如下特点:(1)基于整体的识别率与图像样本的选取密切相关;需要根据应用条件,适当选取图像样本。(2)识别与特征无关。识别(或分类)的依据是各原子在线性组合中的统计关系,即求解稀疏方程,根据解的分布等统计特点进行类型或目标判别。
而人脸识别(FaceRecoginition,FR)的目标物不是脸,而是具有主动性的人,旨在判定某一幅人脸图像对应或属于某一个人。相比而言,刚性物体,如汽车、飞机、舰船等不但具有较好的外形稳定性,其外形及其细节即为类型或型号的区分依据;而且常为人造物体,不具智能性,表现为对摄像设备的不合作性,识别应用的随机性较强。
结合SRC方法的原理和步骤,为了在对刚性目标物的识别应用中获得较好的效果,需要从图像样本中获取更多的目标物细节,并以不同视角(水平或俯仰视角)、不同目标比例、不同尺度以及不同光照下的图像样本为基础构建或训练识别字典。由此,与FR相比,SRC方法在刚性物体的识别应用中存在的问题可归纳为:
(1)基于海量样本构建或训练识别字典
为了保留最多的细节,涵盖更多可能的环境条件,构建或训练识别字典所依据的图像样本将是海量的,也不同于FR应用。因此,利用SRC方法识别刚性目标物首要解决的问题是:以何为依据以及如何能从海量图像样本筛选得到有效样本,从而构建或训练得到高效的识别字典。
(2)目标物的对齐或定位
一般地,目标识别的第一步是图像的对齐或定位。该应用中,待测图像较高的随机性使对齐或定位较FR中困难,尤其刚性目标物并无统一的特征可循。因此,利用SRC方法识别刚性目标物时需要解决目标物的对齐或定位问题。
SRC方法应用研究多集中在人脸、文字和纹理等识别领域,识别效果较好,但是对刚性物体,尤其是外观不完整的刚性物体进行识别时,结果则不甚理想。
发明内容
(一)要解决的技术问题
本发明首先要解决的技术问题是:如何提供一种能够识别外观不完整的物体的图像识别方法。
(二)技术方案
为了解决上述技术问题,本发明提供一种基于图像分块和位置加权的稀疏表示目标识别方法,所述方法包括以下步骤:
S1、获取样本图像库,并对所述样本图像库中的样本图像进行图像分割,得到样本图像块库;
S2、根据样本图像块库中各样本图像块的位置序号和稀疏表示误差,求得识别字典和位置权重向量;
S3、根据所述识别字典和位置权重向量设计分类器;
S4、逐像素地分割待识别图像,得到待识别图像块集;
S5、对所述待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用所述分类器对待识别图像块进行类型识别。
优选地,步骤S1中,在同一尺度、相同环境下,从不同角度分别获取多个目标物体的多个图像,并将所获取的多个图像进行中心化对齐,形成所述样本图像库,利用图像块分割窗口对所述样本图像库中的样本图像进行分割,得到多个相同大小的所述样本图像块。
优选地,步骤S4具体为:利用所述图像块分割窗口对待识别图像逐像素地进行图像分割,得到多个相同大小的待识别图像块。
优选地,步骤S5中,求解稀疏方程后,首先根据所述稀疏方程的解的稀疏程度剔除所述待识别图像块中不属于所述识别字典的待识别图像块,然后再根据所述稀疏方程的解,利用所述分类器进行类型识别。
优选地,利用贪婪算法求解所述稀疏方程。
优选地,所述待识别目标物体为外观不完整的目标物体。
(三)有益效果
上述技术方案具有如下优点:本发明通过对待识别图像进行图像分割,得到待识别图像块,然后对待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用分类器对待识别图像块进行类型识别的方法,能够用于识别外观不完整的物体。
附图说明
图1是本发明的方法流程图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,本发明提供一种基于图像分块和位置加权的稀疏表示目标识别方法,所述方法包括以下步骤:
S1、获取样本图像库,并对所述样本图像库中的样本图像进行图像分割与筛选,在一定的稀疏表示误差范围内,筛选出最少的图像块表示全部的样本图像,从而得到样本图像块库;
步骤S1中,在同一尺度、相同环境下,从N个不同角度分别获取P类目标物体(每一类目标物体为一个)的多个图像,并将所获取的多个图像进行中心化对齐,从而得到样本图像库I={Iij|i∈T;j∈J},其中T={1,2,...,P}和J={1,2,...,N}分别为目标物种类和样本图像标号集,P、N为正整数。按一定的顺序(如设左上起始,向下向右依次编号)利用图像块分割窗口对所述样本图像库中的样本图像进行分割,得到多个m个相同大小的所述样本图像块Bijk,其中下标k∈L为该块在图像Iij上的位置序号,L={1,2,...,m}为位置序号集,m为正整数。
为了表述方便,定义操作符dB表示矩阵列向量。那么,BijkdB表示在位置序号为k处抽取一定大小的图像块并列向量化为块字典DB的一列,即一个原子。于是,利用取自样本图像库中的某一类的不同图像上不同位置的图像块,可线性组合得到:
y = Σ j ∈ J Σ k ∈ L B ijk d B x ijk - - - ( 1 )
基于上述定义,我们要在较好地表示全部图像的前提下筛选出最少的图像块,相应的目标函数可写为:
min | J | , min | L | s . t . arg B ijk ( Σ i = 1 P | | y i - Σ j ∈ J Σ k ∈ L B ijk d B x ijk | | 2 2 ≤ ϵ c 2 ) - - - ( 2 )
其中 y i = Σ j = 1 N Σ k = 1 m B ijk d B
其中,yi为第i类物体的样本图像库中的所有图像块;xijk为各原子在对yi的线性表示中的系数,即为稀疏方程解;为设定的筛选误差阈值。
S2、根据样本图像块库中各样本图像块的位置序号和稀疏表示误差,求得识别字典和位置权重向量;
步骤S2具体为:
对P个目标物,设计如下的识别字典(为矩阵)构建及各原子(识别字典矩阵中的每一列称为一个原子)的位置权重向量计算的步骤:
对每个物体循环执行下面的步骤(1)~(3)。
(1)对第i(i=1…P)个物体,初始化识别字典Dio1和位置权重向量Mio1(下标o表示原始结果):
(a)任取属于同一幅样本图像Ii1的m个图像块,经随机高斯投影初始化目标字典Dio1
Dio1=[Bi11dB,...,Bi1kdB,...,Bi1mdB](3)
(b)按照位置序号将对位置权重向量进行初始化,即各位置序号的初始权重均为0:Mio1=[mi11,mi12,...,mi1m]T=0,各元素与图像块一一对应。
(c)令r=1。
(2)循环操作,更新识别字典Dior和位置权重向量Mior
利用识别字典Dior稀疏表示Bi(r+1)k∈Ii(r+1),根据稀疏表示误差更新得到原始识别字典Dio(r+1)和原始位置权重向量Mio(r+1);其中,r∈J′,J′={1,2,...,N-1}表示待筛选样本图像标号。
(a)首先利用Dior求Bi(r+1)k(k=1,2,....,M)的稀疏表示误差
ϵ i ( r + 1 ) k 2 = | | B i ( r + 1 ) k d B - Σ k ∈ L B irk d B x i ( r + 1 ) k | | 2 2 , (k=1,2,…,m)(4)
(b)若 ϵ i ( r + 1 ) k 2 > ϵ c 2 ,
Dio(r+1)=[Dior,Bi(r+1)kdB]且mi(r+1)k=mirk+1(5)
否则Dio(r+1)=Dior且mi(r+1)k=mirk
(c)若r≤N-1,则r=r+1,继续循环;否则退出本步骤的循环,
并得到基于样本图像块的原始识别字典和原始位置权重向量:
Dio=DioN和Mio=Miom=[mi1,...,mim]T(6)
(3)构建第i类物体的识别字典Di和位置权重向量Mi设定筛选频率阈值mc,得到Mi=mi1,...mij...mim]T满足mij>mc,及其对应的字典Di=[Bi11dB,...,BijkdB...BiNmdB],即从原始字典Dio中筛选出出现次数高于mc的原子,得到各字典Di及其位置权重向量Mi
(4)组合得到P类目标物的识别字典和位置权重向量
D=[D1,...,DP],M=[M1,...,MP](7)
S3、根据所述识别字典和位置权重向量设计分类器;
基于位置权重向量M设计如下的分类器:
type = arg max i ( Σ t m ij ) , 其中mij∈M(8)
其中,ij为待测图像块的识别结果。求解基于第t个待测图像块yt和识别字典D的稀疏方程yt=DX,将解元素xij∈X代入(9)式得到t:
t t = arg max ij ( min | | y t - Σ i = 1 P Dx ij | | 2 ) - - - ( 9 )
那么,tt=ij表示第t个待测图像块与第i个目标物的第j个位置序号上的图像块相似性最高,最可能落在第i个目标物的第j个位置上。
S4、逐像素地分割待识别图像,得到待识别图像块集;
步骤S4具体为:利用图像块分割窗口对同尺度的待识别目标物体(为外观不完整的目标物体)的图像逐像素地进行图像分割,得到多个相同大小的所述待识别图像块。
S5、利用贪婪算法求解对所述待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用所述分类器对待识别图像块进行类型识别。
步骤S5中,求解稀疏方程后,首先根据所述稀疏方程的解x的稀疏程度剔除所述待识别图像块中不属于所述识别字典的待识别图像块,然后再根据所述稀疏方程的解,利用所述分类器对剩余的待识别图像块进行类型识别。
利用稀疏解x求稀疏程度的公式为:
SCI ( x i ) = - 1 / ( P - 1 ) fori = 1 , . . . , k P | | x i | | 1 | | x | | 1 - - - ( 10 )
其中,k表示待识别图像块的位置序号,xi表示稀疏解x中的第i个元素,稀疏解x为列向量。
若SCI(xi)>τc,则 t t = arg max ij ( min | | y t - Σ i = 1 P Dx ij | | 2 ) 否则ti=0,即该图像块不属于字典中的任何一个类;τc表示预设稀疏程度阈值。
将ti代入(9)式得到最后的识别结果。
在MATLABR2010下模拟本发明的方法,对每种汽车模型获取132张样本图像,构造4个目标物体的识别字典和位置权重向量,再逐一应用于待识别图像块。实验结果表明,本发明的方法依然适用于完整的目标图像,同时对部分、不完整或者有俯仰偏差的目标物体也表现出较好的识别性能。
由以上实施例可以看出,本发明通过对待识别图像进行图像分割,得到待识别图像块,然后对待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用分类器对待识别图像块进行类型识别的方法,能够用于识别外观不完整的物体。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。

Claims (5)

1.一种基于图像分块和位置加权的稀疏表示目标识别方法,其特征在于,所述方法包括以下步骤:
S1、获取样本图像库,并对所述样本图像库中的样本图像进行图像分割,得到样本图像块库;
S2、根据样本图像块库中各样本图像块的位置序号和稀疏表示误差,求得识别字典和位置权重向量;
S3、根据所述识别字典和位置权重向量设计分类器;
S4、逐像素地分割待识别图像,得到待识别图像块集;
S5、对待识别图像块求解稀疏方程,并根据所述稀疏方程的解,利用所述分类器对待识别图像块进行类型识别;
步骤S5中,求解稀疏方程后,首先根据所述稀疏方程的解的稀疏程度剔除所述待识别图像块中不属于所述识别字典的待识别图像块,然后再根据所述稀疏方程的解,利用所述分类器进行类型识别。
2.如权利要求1所述的方法,其特征在于,步骤S1中,在同一尺度、相同环境下,从不同角度分别获取多个目标物体的多个图像,并将所获取的多个图像进行中心化对齐,形成所述样本图像库,利用图像块分割窗口对所述样本图像库中的样本图像进行分割,得到多个相同大小的所述样本图像块。
3.如权利要求2所述的方法,其特征在于,步骤S4具体为:利用所述图像块分割窗口对待识别图像逐像素地进行图像分割,得到多个相同大小的待识别图像块。
4.如权利要求1所述的方法,其特征在于,利用贪婪算法求解所述稀疏方程。
5.如权利要求1~4中任一项所述的方法,其特征在于,待识别目标物体为外观不完整的目标物体。
CN201210581686.9A 2012-12-27 2012-12-27 基于图像分块和位置加权的稀疏表示目标识别方法 Expired - Fee Related CN103049760B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210581686.9A CN103049760B (zh) 2012-12-27 2012-12-27 基于图像分块和位置加权的稀疏表示目标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210581686.9A CN103049760B (zh) 2012-12-27 2012-12-27 基于图像分块和位置加权的稀疏表示目标识别方法

Publications (2)

Publication Number Publication Date
CN103049760A CN103049760A (zh) 2013-04-17
CN103049760B true CN103049760B (zh) 2016-05-18

Family

ID=48062392

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210581686.9A Expired - Fee Related CN103049760B (zh) 2012-12-27 2012-12-27 基于图像分块和位置加权的稀疏表示目标识别方法

Country Status (1)

Country Link
CN (1) CN103049760B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6188400B2 (ja) * 2013-04-26 2017-08-30 オリンパス株式会社 画像処理装置、プログラム及び画像処理方法
CN103268607B (zh) * 2013-05-15 2016-10-12 电子科技大学 一种弱监督条件下的共同对象检测方法
CN104732186B (zh) * 2013-12-18 2018-03-09 南京理工大学 基于局部子空间稀疏表示的单样本人脸识别方法
CN103942531B (zh) * 2014-03-06 2017-03-29 中南民族大学 一种人脸识别***及其方法
CN104615999B (zh) * 2015-02-15 2017-11-07 北京师范大学 基于稀疏表示分类的滑坡泥石流区域检测方法
CN105590088A (zh) * 2015-09-17 2016-05-18 重庆大学 一种基于稀疏自编码和稀疏表示进行交通标志识别的方法
CN109492610B (zh) * 2018-11-27 2022-05-10 广东工业大学 一种行人重识别方法、装置及可读存储介质
CN112600994B (zh) * 2020-12-02 2023-04-07 达闼机器人股份有限公司 物体探测装置、方法、存储介质和电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436589A (zh) * 2010-09-29 2012-05-02 中国科学院电子学研究所 一种基于多类基元自主学习的复杂目标自动识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8447119B2 (en) * 2010-03-16 2013-05-21 Nec Laboratories America, Inc. Method and system for image classification

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102436589A (zh) * 2010-09-29 2012-05-02 中国科学院电子学研究所 一种基于多类基元自主学习的复杂目标自动识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Modular Weighted Global Sparse Representation for Robust Face Recognition;Jian Lai等;《IEEE SIGNAL PROCESSING LETTERS》;20120930;第19卷(第9期);第571-574页 *
基于Gabor多通道加权优化与稀疏表征的人脸识别方法;杨清山等;《电子与信息学报》;20110731;第33卷(第7期);全文 *

Also Published As

Publication number Publication date
CN103049760A (zh) 2013-04-17

Similar Documents

Publication Publication Date Title
CN103049760B (zh) 基于图像分块和位置加权的稀疏表示目标识别方法
CN106874889B (zh) 基于卷积神经网络的多特征融合sar目标鉴别方法
CN103247059B (zh) 一种基于整数小波与视觉特征的遥感图像感兴趣区检测方法
Zhang et al. Recognition of flotation working conditions through froth image statistical modeling for performance monitoring
CN107563428A (zh) 基于生成对抗网络的极化sar图像分类方法
CN110414538A (zh) 缺陷分类方法、缺陷分类训练方法及其装置
CN105740790B (zh) 基于多核字典学习的彩色人脸识别方法
CN107292336A (zh) 一种基于dcgan的极化sar图像分类方法
CN104091169A (zh) 基于多特征融合的行为识别方法
CN109766835A (zh) 基于多参数优化生成对抗网络的sar目标识别方法
CN102867195B (zh) 一种遥感图像多类目标检测和识别方法
CN107895139A (zh) 一种基于多特征融合的sar图像目标识别方法
CN106096660B (zh) 基于独立成分分析算法的卷积神经网络
CN104200217A (zh) 基于一种复合核函数的高光谱分类方法
CN103996047A (zh) 基于压缩谱聚类集成的高光谱图像分类方法
CN103839075B (zh) 一种基于联合稀疏表示的sar图像分类方法
CN103258217A (zh) 一种基于增量学习的行人检测方法
CN105574475A (zh) 一种基于共同向量词典的稀疏表示分类方法
CN105678249B (zh) 针对注册人脸和待识别人脸图片质量不同的人脸识别方法
CN107767416A (zh) 一种低分辨率图像中行人朝向的识别方法
CN103208097A (zh) 图像多方向形态结构分组的主分量分析协同滤波方法
CN103336942A (zh) 一种基于Radon BEMD变换的国画鉴定方法
CN104966075B (zh) 一种基于二维判别特征的人脸识别方法与***
CN103839066A (zh) 一种源于生物视觉的特征提取方法
CN103390170A (zh) 一种基于多光谱遥感图像纹理元的地物类型纹理分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160518

CF01 Termination of patent right due to non-payment of annual fee