CN104376312A

CN104376312A - 基于词袋压缩感知特征提取的人脸识别方法

Info

Publication number: CN104376312A
Application number: CN201410739127.5A
Authority: CN
Inventors: 周凯; 元昌安; 郑彦; 宋文展
Original assignee: Guangxi University
Current assignee: Guangxi University
Priority date: 2014-12-08
Filing date: 2014-12-08
Publication date: 2015-02-25
Anticipated expiration: 2034-12-08
Also published as: CN104376312B

Abstract

本发明公开了一种基于词袋压缩感知特征提取的人脸识别方法，包括人脸识别***，其特征在于其识别步骤包括：图像的尺度不变特征变换特征提取、特征编码、不同尺度的特征融合和分类。该方法相比于原来的词袋模型，不仅简单实用，而且更有效，用尺度不变特征变换提取图像关键点特征后，不再找聚类中心或者学习字典，而是利用随机矩阵。让关键点特征通过与随机矩阵来进行编码，可以节省大量时间，而且没有像原词袋模型方法那样，丢失大量的空间信息。能够很好的克服人脸光照，遮挡以及表情等变化对人脸识别的影响，不仅可以获得较高的识别率，运行速度也较快，在很具有挑战性的AR数据库上进行人脸识别，大大提高了人脸识别率，更具有实时性。

Description

基于词袋压缩感知特征提取的人脸识别方法

技术领域

本发明涉及涉及机器视觉与图像处理技术，尤其是人脸识别方法。

背景技术

在现有人脸识别***中灯光的亮暗、人脸的姿态以及眼镜等伪装，一直是人脸识别中富有挑战性的问题，在图像预处理中，特征提取是很关键的一步。现有的人脸识别方法有多种，如基于词袋特征的方法，因为词袋模型忽略了特征的空间信息并且使特征无序，导致算法识别率低，而且词袋模型中K均值聚类花费时间长，使整个算法运行时间长。

发明内容

本发明的目的地是提供一种提高了算法性能，速度运行更快的基于词袋压缩感知特征提取的人脸识别方法。

为达到上述目的，本方法的技术方案为：

一种基于词袋压缩感知特征提取的人脸识别方法，包括人脸识别***，其特征在于其识别步骤包括：

步骤一、用尺度不变特征变换特征的方法来提取图像特征

(1)设一幅图像的函数为，图像与高斯核函数卷积得到不同尺度下的尺度空间；公式如下：

(1)

其中，表示像素位置，表示尺度空间，表示尺度空间因子；

(2)得到图像的尺度空间后，采用金字塔方法，即用差分高斯金字塔函数与图像卷积得到的空间的方法寻找来寻找极值点，得到的公式为：

(2)

其中ｋ是相邻两个不同的尺度空间；

(3)根据极值点进而确定关键点，对关键点赋予的一个方向，实现图像的旋转不变性，具体做法为，根据关键点所在的尺度，选择与该尺度最相近的高斯平滑图像；计算上每一个点的梯度与方向；

(3)

(4)

(4)关键点周围选择一个邻域，以关键点为中心利用所有在此区域内的点的梯度形成一个直方图。并对其中点的梯度做高斯加权。这个邻域划分为四个子区域，在每个子区域取八个方向。从而得到图像的尺度不变特征变换；

步骤二、特征编码

用分块的方法将图像分割为块后，每块用上述的尺度不变特征变换得到图像的局部特征后，利用压缩感知的思想，***随机生成一个随机字典B，然后通过稀疏表示得到特征编码；

假如***生成的随机字典为，一幅图像分割为块，是图像尺度不变特征变换提取的第块特征，一幅图像的每一局部块通过式(5)可求得特征编码，公式如下：

(5)

其中是常数，是所求特征编码

步骤三、图像中不同尺度的特征融合

利用(5)式得到一副图像的特征编码矩阵为，是对应块的系数，为了融合系数用最大池方法，其定义为：

(6)

其中是池向量的第个元素，表示系数编码矩阵的行，列；

最后使用空间金字塔匹配算法，即将一副图像分割成与不同的块，就可以对不同空间位置和尺度的子区域进行特征编码，假如使用空间金字塔匹配算法求得该尺度的最大池为，然后将不同尺度和区域的特征向量串接起来，最后得到这副图像特征向量；

步骤四、分类

用上述方法特征提取得到每幅图像的特征向量后，采用核稀疏表示方法来分类，核函数采用直方图交叉核，其表达式如下：

(7)

其中是两个维度为的特征向量，分别是特征向量的特征值；

假如图像特征提取后得到的训练集为，测试样本为，以第个测试样本为例，可以通过矩阵核表示为：

(8)

其中是核函数高维特征投影空间的稀疏系数，将上式展开后得到的式子如下：

(9)

其中表示第个测试样本，表示求与的直方图交叉核。解式(9)得到系数后，最后通过求最小残差的来分类：

(10)

式中表示第类相应的稀疏表示系数。

本发明的特点与优势为：

1、本发明相比于原来的词袋模型，不仅简单实用，而且更有效，本发明方法用尺度不变特征变换提取图像关键点特征后，不再找聚类中心或者学习字典，而是利用随机矩阵。让关键点特征通过与随机矩阵来进行编码。这样既可以节省大量时间，而且没有像原词袋模型方法那样，丢失大量的空间信息，大大提高了识别率；

2、本发明方法结合压缩感知思想，压缩感知方案中通过求稀疏系数矩阵可以很好的重构原有图像，本发明方法还利用了空间金字塔模型和最大池的优势，使算法更具有稳定性；

3、本发明方法能够很好的克服人脸光照，遮挡以及表情等变化对人脸识别的影响，不仅可以获得较高的识别率，运行速度也较快，在很具有挑战性的AR数据库上进行人脸识别，相对于经典的词袋模型，本发明方法能够很好的克服各种因素的影响，大大提高了人脸识别率，更具有实时性。

附图说明

图1是本发明光照、表情和伪装变化的7张正面人脸图像。

具体实施方式

下面结合附图，对本发明作进一步说明。

下面通过一个具体的实例对本发明做详细说明，在人脸识别***中，通过MATLAB来仿真，实验平台为i5处理器，主频2.4GHz，2G内存。本发明的保护范围不限于下述的实施实例。

图1所示，是本发明光照、表情和伪装变化的7张正面人脸图像。第一张是正常图像，第二张是人脸表情变化的图像，第三张是光照的变化，第四张戴眼镜，第五张是戴眼镜和光照变化，第六张是围围巾，第七张是围围巾和光照的变化。本实例在一个公用很具有挑战性的人脸数据库—AR数据库上实验。AR数据库中包不同光照、表情和伪装变化的正面人脸图像2600幅，共100人，每人26幅图像。AR数据库分为两部分，第一部分的前1-7幅图像是表情、光照的变化，本文用来做训练集(700张)，然后各取第一、第二部分的第8-10幅戴眼镜和第11-13幅戴围巾人脸图像分别来做测试集(各300张)，为降低成本将人脸规格化为8360像素大小的图像。

首先在Matlab中对于所以图像分割成与不同的块，然后每一块用尺度不变特征变换方法进行特征提取。假设得到训练集的特征为，测试集的特征为，其中和表示一副图像由1到N块组成。

然后将训练集、测试集通过公式得到一幅图像每一块的特征编码。用空间金字塔匹配和最大池方法将图像的所有块通过公式进行融合，最后每幅图像的特征向量，训练集为，测试集。

运用核投影到高维特征空间，根据核函数计算训练集与测试集，与的直方图交叉核，分别得到和。

再利用公式，计算出每个测试样本对应于训练样本的稀疏系数矩阵。

最后根据稀疏系数矩阵通过求最小残差来判别分类：

(11)

式中表示第类相应的稀疏表示系数。

实验结果如表1所示，其中可以看出本发明方法明显识别率明显优于现有方法。对于AR人脸库第一部分的戴眼镜和围围巾的识别率达到97%以上，因为实验训练集采用的是第一部分的前7张，所以对于第二部分，识别率虽然有所下降，但本发明方法算法识别率高出现有算法7%以上。最后表中时间是表示平均每幅图像处理时间，可以看到本发明方法比现有方法花费的时间更少。

表1 两种算法在AR数据库上识别率的比较

	眼镜1	围巾1	眼镜2	围巾2	时间(s)
						词袋（现有方法）	81.35	80.34	73.37	62.03	0.1800
本发明方法	98.32	97.33	80.96	87.02	0.1001

所以本发明方法，可以广泛应用于现实生活中，从实验中可以看到，本发明方法有很好的鲁棒性。

Claims

1.一种基于词袋压缩感知特征提取的人脸识别方法，包括人脸识别***，其特征在于其识别步骤为：

步骤一、用尺度不变特征变换特征的方法来提取图像特征；

(1)

其中，表示像素位置，表示尺度空间，表示尺度空间因子；

得到图像的尺度空间后，采用金字塔方法，即用差分高斯金字塔函数与图像卷积得到的空间的方法寻找来寻找极值点，得到的公式为：

(2)

其中ｋ是相邻两个不同的尺度空间；

(3)

(4)

(4)关键点周围选择一个邻域，以关键点为中心利用所有在此区域内的点的梯度形成一个直方图；

并对其中点的梯度做高斯加权；

这个邻域划分为四个子区域，在每个子区域取八个方向；

从而得到图像的尺度不变特征变换；

步骤二、特征编码

(5)

其中是常数，是所求特征编码

步骤三、图像中不同尺度的特征融合

(6)

其中是池向量的第个元素，表示系数编码矩阵的行，列；

步骤四、分类

(7)

其中是两个维度为的特征向量，分别是特征向量的特征值；

(8)

(9)

其中表示第个测试样本，表示求与的直方图交叉核；

解式(9)得到系数后，最后通过求最小残差的来分类：

(10)

式中表示第类相应的稀疏表示系数。