CN103049760B

CN103049760B - 基于图像分块和位置加权的稀疏表示目标识别方法

Info

Publication number: CN103049760B
Application number: CN201210581686.9A
Authority: CN
Inventors: 何珺; 孙波; 吴学文; 葛凤祥; 余乐军
Original assignee: Beijing Normal University
Current assignee: Beijing Normal University
Priority date: 2012-12-27
Filing date: 2012-12-27
Publication date: 2016-05-18
Anticipated expiration: 2032-12-27
Also published as: CN103049760A

Abstract

本发明涉及模式识别技术领域，公开了一种基于图像分块和位置加权的稀疏表示目标识别方法，所述方法包括以下步骤：S1、获取样本图像库，并对所述样本图像库中的样本图像进行图像分割，得到样本图像块库；S2、根据样本图像块库中各样本图像块的位置序号和稀疏表示误差，求得识别字典和位置权重向量；S3、根据所述识别字典和位置权重向量设计分类器；S4、逐像素地分割待识别图像，得到待识别图像块集；S5、对所述待识别图像块求解稀疏方程，并根据所述稀疏方程的解，利用所述分类器对待识别图像块进行类型识别。本发明能够用于识别外观不完整的物体。

Description

基于图像分块和位置加权的稀疏表示目标识别方法

技术领域

本发明涉及模式识别技术领域，特别是涉及一种基于图像分块和位置加权的稀疏表示目标识别方法。

背景技术

基于稀疏表示的分类（SRC）方法是一种像素级对齐方法，其遵循自然界中普遍适用的线性组合原理。

SRC方法的原理是：假设目标物在某种姿态下的图像，即测试对象可以用它在其他姿态下图像的线性组合表示或近似，然后根据测试对象相对于整个训练集的稀疏表示系数，得到测试对象的类别归属。可见，待测图像与训练字典的图像样本的相似性越高，SRC方法的适用效果就越好。

SRC方法的应用有如下特点：（1）基于整体的识别率与图像样本的选取密切相关；需要根据应用条件，适当选取图像样本。（2）识别与特征无关。识别（或分类）的依据是各原子在线性组合中的统计关系，即求解稀疏方程，根据解的分布等统计特点进行类型或目标判别。

而人脸识别（FaceRecoginition，FR）的目标物不是脸，而是具有主动性的人，旨在判定某一幅人脸图像对应或属于某一个人。相比而言，刚性物体，如汽车、飞机、舰船等不但具有较好的外形稳定性，其外形及其细节即为类型或型号的区分依据；而且常为人造物体，不具智能性，表现为对摄像设备的不合作性，识别应用的随机性较强。

结合SRC方法的原理和步骤，为了在对刚性目标物的识别应用中获得较好的效果，需要从图像样本中获取更多的目标物细节，并以不同视角（水平或俯仰视角）、不同目标比例、不同尺度以及不同光照下的图像样本为基础构建或训练识别字典。由此，与FR相比，SRC方法在刚性物体的识别应用中存在的问题可归纳为：

（1）基于海量样本构建或训练识别字典

为了保留最多的细节，涵盖更多可能的环境条件，构建或训练识别字典所依据的图像样本将是海量的，也不同于FR应用。因此，利用SRC方法识别刚性目标物首要解决的问题是：以何为依据以及如何能从海量图像样本筛选得到有效样本，从而构建或训练得到高效的识别字典。

（2）目标物的对齐或定位

一般地，目标识别的第一步是图像的对齐或定位。该应用中，待测图像较高的随机性使对齐或定位较FR中困难，尤其刚性目标物并无统一的特征可循。因此，利用SRC方法识别刚性目标物时需要解决目标物的对齐或定位问题。

SRC方法应用研究多集中在人脸、文字和纹理等识别领域，识别效果较好，但是对刚性物体，尤其是外观不完整的刚性物体进行识别时，结果则不甚理想。

发明内容

（一）要解决的技术问题

本发明首先要解决的技术问题是：如何提供一种能够识别外观不完整的物体的图像识别方法。

（二）技术方案

为了解决上述技术问题，本发明提供一种基于图像分块和位置加权的稀疏表示目标识别方法，所述方法包括以下步骤：

S1、获取样本图像库，并对所述样本图像库中的样本图像进行图像分割，得到样本图像块库；

S2、根据样本图像块库中各样本图像块的位置序号和稀疏表示误差，求得识别字典和位置权重向量；

S3、根据所述识别字典和位置权重向量设计分类器；

S4、逐像素地分割待识别图像，得到待识别图像块集；

S5、对所述待识别图像块求解稀疏方程，并根据所述稀疏方程的解，利用所述分类器对待识别图像块进行类型识别。

优选地，步骤S1中，在同一尺度、相同环境下，从不同角度分别获取多个目标物体的多个图像，并将所获取的多个图像进行中心化对齐，形成所述样本图像库，利用图像块分割窗口对所述样本图像库中的样本图像进行分割，得到多个相同大小的所述样本图像块。

优选地，步骤S4具体为：利用所述图像块分割窗口对待识别图像逐像素地进行图像分割，得到多个相同大小的待识别图像块。

优选地，步骤S5中，求解稀疏方程后，首先根据所述稀疏方程的解的稀疏程度剔除所述待识别图像块中不属于所述识别字典的待识别图像块，然后再根据所述稀疏方程的解，利用所述分类器进行类型识别。

优选地，利用贪婪算法求解所述稀疏方程。

优选地，所述待识别目标物体为外观不完整的目标物体。

（三）有益效果

上述技术方案具有如下优点：本发明通过对待识别图像进行图像分割，得到待识别图像块，然后对待识别图像块求解稀疏方程，并根据所述稀疏方程的解，利用分类器对待识别图像块进行类型识别的方法，能够用于识别外观不完整的物体。

附图说明

图1是本发明的方法流程图。

具体实施方式

下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。

如图1所示，本发明提供一种基于图像分块和位置加权的稀疏表示目标识别方法，所述方法包括以下步骤：

S1、获取样本图像库，并对所述样本图像库中的样本图像进行图像分割与筛选，在一定的稀疏表示误差范围内，筛选出最少的图像块表示全部的样本图像，从而得到样本图像块库；

步骤S1中，在同一尺度、相同环境下，从N个不同角度分别获取P类目标物体（每一类目标物体为一个）的多个图像，并将所获取的多个图像进行中心化对齐，从而得到样本图像库I＝{I_ij|i∈T；j∈J}，其中T＝{1，2,...,P}和J＝{1,2,...,N}分别为目标物种类和样本图像标号集，P、N为正整数。按一定的顺序（如设左上起始，向下向右依次编号）利用图像块分割窗口对所述样本图像库中的样本图像进行分割，得到多个m个相同大小的所述样本图像块B_ijk，其中下标k∈L为该块在图像I_ij上的位置序号，L＝{1,2,...，m}为位置序号集，m为正整数。

为了表述方便，定义操作符d_B表示矩阵列向量。那么，B_ijkd_B表示在位置序号为k处抽取一定大小的图像块并列向量化为块字典D_B的一列，即一个原子。于是，利用取自样本图像库中的某一类的不同图像上不同位置的图像块，可线性组合得到：

y = \underset{j &Element; J}{Σ} \underset{k &Element; L}{Σ} B_{ijk} d_{B} x_{ijk} - - - (1)

基于上述定义，我们要在较好地表示全部图像的前提下筛选出最少的图像块，相应的目标函数可写为：

\min | J |, \min | L | s . t . \underset{B_{ijk}}{\arg} (Σ_{i = 1}^{P} {| | y_{i} - \underset{j &Element; J}{Σ} \underset{k &Element; L}{Σ} B_{ijk} d_{B} x_{ijk} | |}_{2}^{2} \leq ϵ_{c}^{2}) - - - (2)

其中

y_{i} = Σ_{j = 1}^{N} Σ_{k = 1}^{m} B_{ijk} d_{B}

其中，y_i为第i类物体的样本图像库中的所有图像块；x_ijk为各原子在对y_i的线性表示中的系数，即为稀疏方程解；为设定的筛选误差阈值。

步骤S2具体为：

对P个目标物，设计如下的识别字典（为矩阵）构建及各原子（识别字典矩阵中的每一列称为一个原子）的位置权重向量计算的步骤：

对每个物体循环执行下面的步骤（1）~（3）。

（1）对第i（i=1…P）个物体，初始化识别字典D_io1和位置权重向量M_io1（下标o表示原始结果）：

（a）任取属于同一幅样本图像I_i1的m个图像块，经随机高斯投影初始化目标字典D_io1；

D_io1＝[B_i11d_B，...,B_i1kd_B，...,B_i1md_B](3)

（b）按照位置序号将对位置权重向量进行初始化，即各位置序号的初始权重均为0：M_io1=[m_i11,m_i12，...,m_i1m]^T=0，各元素与图像块一一对应。

（c）令r=1。

（2）循环操作，更新识别字典D_ior和位置权重向量M_ior

利用识别字典D_ior稀疏表示B_i(r+1)k∈I_i(r+1)，根据稀疏表示误差更新得到原始识别字典D_io(r+1)和原始位置权重向量M_io(r+1)；其中，r∈J′，J′＝{1,2,...，N-1}表示待筛选样本图像标号。

（a）首先利用D_ior求B_i(r+1)k（k＝1,2，....,M）的稀疏表示误差

ϵ_{i (r + 1) k}^{2} = {| | B_{i (r + 1) k} d_{B} - \underset{k &Element; L}{Σ} B_{irk} d_{B} x_{i (r + 1) k} | |}_{2}^{2},

(k＝1,2,…,m)(4)

（b）若

ϵ_{i (r + 1) k}^{2} > ϵ_{c}^{2},

则

D_io(r+1)＝[D_ior,B_i(r+1)kd_B]且m_i(r+1)k＝m_irk+1(5)

否则D_io(r+1)＝D_ior且m_i(r+1)k＝m_irk。

（c）若r≤N-1，则r＝r+1，继续循环；否则退出本步骤的循环，

并得到基于样本图像块的原始识别字典和原始位置权重向量：

D_io＝D_ioN和M_io＝M_iom＝[m_i1,...,m_im]^T(6)

（3）构建第i类物体的识别字典D_i和位置权重向量Mⁱ设定筛选频率阈值m_c，得到Mⁱ＝m_i1,...m_ij...m_im]^T满足m_ij＞m_c，及其对应的字典D_i＝[B_i11d_B,...,B_ijkd_B...B_iNmd_B]，即从原始字典D_io中筛选出出现次数高于m_c的原子，得到各字典D_i及其位置权重向量M_i。

（4）组合得到P类目标物的识别字典和位置权重向量

D＝[D₁,...,D_P]，M＝[M₁,...,M_P](7)

S3、根据所述识别字典和位置权重向量设计分类器；

基于位置权重向量M设计如下的分类器：

type = \underset{i}{\arg \max} (\underset{t}{Σ} m_{ij}),

其中m_ij∈M(8)

其中，ij为待测图像块的识别结果。求解基于第t个待测图像块y_t和识别字典D的稀疏方程y_t＝DX，将解元素x_ij∈X代入（9）式得到t：

t_{t} = \underset{ij}{\arg \max} (\min {| | y_{t} - Σ_{i = 1}^{P} {Dx}_{ij} | |}_{2}) - - - (9)

那么，t_t＝ij表示第t个待测图像块与第i个目标物的第j个位置序号上的图像块相似性最高，最可能落在第i个目标物的第j个位置上。

S4、逐像素地分割待识别图像，得到待识别图像块集；

步骤S4具体为：利用图像块分割窗口对同尺度的待识别目标物体（为外观不完整的目标物体）的图像逐像素地进行图像分割，得到多个相同大小的所述待识别图像块。

S5、利用贪婪算法求解对所述待识别图像块求解稀疏方程，并根据所述稀疏方程的解，利用所述分类器对待识别图像块进行类型识别。

步骤S5中，求解稀疏方程后，首先根据所述稀疏方程的解x的稀疏程度剔除所述待识别图像块中不属于所述识别字典的待识别图像块，然后再根据所述稀疏方程的解，利用所述分类器对剩余的待识别图像块进行类型识别。

利用稀疏解x求稀疏程度的公式为：

SCI (x_{i}) = {- 1 / (P - 1) fori = 1, . . ., k}_{\frac{P {| | x_{i} | |}_{1}}{{| | x | |}_{1}}} - - - (10)

其中，k表示待识别图像块的位置序号，x_i表示稀疏解x中的第i个元素，稀疏解x为列向量。

若SCI(x_i)＞τ_c，则

t_{t} = \underset{ij}{\arg \max} (\min {| | y_{t} - Σ_{i = 1}^{P} {Dx}_{ij} | |}_{2})

否则t_i＝0，即该图像块不属于字典中的任何一个类；τ_c表示预设稀疏程度阈值。

将t_i代入（9）式得到最后的识别结果。

在MATLABR2010下模拟本发明的方法，对每种汽车模型获取132张样本图像，构造4个目标物体的识别字典和位置权重向量，再逐一应用于待识别图像块。实验结果表明，本发明的方法依然适用于完整的目标图像，同时对部分、不完整或者有俯仰偏差的目标物体也表现出较好的识别性能。

由以上实施例可以看出，本发明通过对待识别图像进行图像分割，得到待识别图像块，然后对待识别图像块求解稀疏方程，并根据所述稀疏方程的解，利用分类器对待识别图像块进行类型识别的方法，能够用于识别外观不完整的物体。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和替换，这些改进和替换也应视为本发明的保护范围。

Claims

1.一种基于图像分块和位置加权的稀疏表示目标识别方法，其特征在于，所述方法包括以下步骤：

S3、根据所述识别字典和位置权重向量设计分类器；

S4、逐像素地分割待识别图像，得到待识别图像块集；

S5、对待识别图像块求解稀疏方程，并根据所述稀疏方程的解，利用所述分类器对待识别图像块进行类型识别；

步骤S5中，求解稀疏方程后，首先根据所述稀疏方程的解的稀疏程度剔除所述待识别图像块中不属于所述识别字典的待识别图像块，然后再根据所述稀疏方程的解，利用所述分类器进行类型识别。

2.如权利要求1所述的方法，其特征在于，步骤S1中，在同一尺度、相同环境下，从不同角度分别获取多个目标物体的多个图像，并将所获取的多个图像进行中心化对齐，形成所述样本图像库，利用图像块分割窗口对所述样本图像库中的样本图像进行分割，得到多个相同大小的所述样本图像块。

3.如权利要求2所述的方法，其特征在于，步骤S4具体为：利用所述图像块分割窗口对待识别图像逐像素地进行图像分割，得到多个相同大小的待识别图像块。

4.如权利要求1所述的方法，其特征在于，利用贪婪算法求解所述稀疏方程。

5.如权利要求1～4中任一项所述的方法，其特征在于，待识别目标物体为外观不完整的目标物体。