CN104376312A - 基于词袋压缩感知特征提取的人脸识别方法 - Google Patents
基于词袋压缩感知特征提取的人脸识别方法 Download PDFInfo
- Publication number
- CN104376312A CN104376312A CN201410739127.5A CN201410739127A CN104376312A CN 104376312 A CN104376312 A CN 104376312A CN 201410739127 A CN201410739127 A CN 201410739127A CN 104376312 A CN104376312 A CN 104376312A
- Authority
- CN
- China
- Prior art keywords
- image
- feature
- face recognition
- formula
- represent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于词袋压缩感知特征提取的人脸识别方法,包括人脸识别***,其特征在于其识别步骤包括:图像的尺度不变特征变换特征提取、特征编码、不同尺度的特征融合和分类。该方法相比于原来的词袋模型,不仅简单实用,而且更有效,用尺度不变特征变换提取图像关键点特征后,不再找聚类中心或者学习字典,而是利用随机矩阵。让关键点特征通过与随机矩阵来进行编码,可以节省大量时间,而且没有像原词袋模型方法那样,丢失大量的空间信息。能够很好的克服人脸光照,遮挡以及表情等变化对人脸识别的影响,不仅可以获得较高的识别率,运行速度也较快,在很具有挑战性的AR数据库上进行人脸识别,大大提高了人脸识别率,更具有实时性。
Description
技术领域
本发明涉及涉及机器视觉与图像处理技术,尤其是人脸识别方法。
背景技术
在现有人脸识别***中灯光的亮暗、人脸的姿态以及眼镜等伪装,一直是人脸识别中富有挑战性的问题,在图像预处理中,特征提取是很关键的一步。现有的人脸识别方法有多种,如基于词袋特征的方法,因为词袋模型忽略了特征的空间信息并且使特征无序,导致算法识别率低,而且词袋模型中K均值聚类花费时间长,使整个算法运行时间长。
发明内容
本发明的目的地是提供一种提高了算法性能,速度运行更快的基于词袋压缩感知特征提取的人脸识别方法。
为达到上述目的,本方法的技术方案为:
一种基于词袋压缩感知特征提取的人脸识别方法,包括人脸识别***,其特征在于其识别步骤包括:
步骤一、用尺度不变特征变换特征的方法来提取图像特征
(1)设一幅图像的函数为 ,图像与高斯核函数卷积得到不同尺度下的尺度空间;公式如下:
(1)
其中,表示像素位置,表示尺度空间,表示尺度空间因子;
(2)得到图像的尺度空间后,采用金字塔方法,即用差分高斯金字塔函数与图像卷积得到的空间的方法寻找来寻找极值点,得到的公式为:
(2)
其中k是相邻两个不同的尺度空间;
(3)根据极值点进而确定关键点,对关键点赋予的一个方向,实现图像的旋转不变性,具体做法为,根据关键点所在的尺度,选择与该尺度最相近的高斯平滑图像;计算上每一个点的梯度与方向;
(3)
(4)
(4)关键点周围选择一个邻域,以关键点为中心利用所有在此区域内的点的梯度形成一个直方图。并对其中点的梯度做高斯加权。这个邻域划分为四个子区域,在每个子区域取八个方向。从而得到图像的尺度不变特征变换;
步骤二、特征编码
用分块的方法将图像分割为块后,每块用上述的尺度不变特征变换得到图像的局部特征后,利用压缩感知的思想,***随机生成一个随机字典B,然后通过稀疏表示得到特征编码;
假如***生成的随机字典为,一幅图像分割为块,是图像尺度不变特征变换提取的第块特征,一幅图像的每一局部块通过式(5)可求得特征编码,公式如下:
(5)
其中是常数,是所求特征编码
步骤三、图像中不同尺度的特征融合
利用(5)式得到一副图像的特征编码矩阵为,是对应块的系数,为了融合系数用最大池方法,其定义为:
(6)
其中是池向量的第个元素,表示系数编码矩阵的行,列;
最后使用空间金字塔匹配算法,即将一副图像分割成与不同的块,就可以对不同空间位置和尺度的子区域进行特征编码,假如使用空间金字塔匹配算法求得该尺度的最大池为,然后将不同尺度和区域的特征向量串接起来,最后得到这副图像特征向量;
步骤四、分类
用上述方法特征提取得到每幅图像的特征向量后,采用核稀疏表示方法来分类,核函数采用直方图交叉核,其表达式如下:
(7)
其中是两个维度为的特征向量,分别是特征向量的特征值;
假如图像特征提取后得到的训练集为,测试样本为,以第个测试样本为例,可以通过矩阵核表示为:
(8)
其中是核函数高维特征投影空间的稀疏系数,将上式展开后得到的式子如下:
(9)
其中表示第个测试样本,表示求与的直方图交叉核。解式(9)得到系数后,最后通过求最小残差的来分类:
(10)
式中表示第类相应的稀疏表示系数。
本发明的特点与优势为:
1、本发明相比于原来的词袋模型,不仅简单实用,而且更有效,本发明方法用尺度不变特征变换提取图像关键点特征后,不再找聚类中心或者学习字典,而是利用随机矩阵。让关键点特征通过与随机矩阵来进行编码。这样既可以节省大量时间,而且没有像原词袋模型方法那样,丢失大量的空间信息,大大提高了识别率;
2、本发明方法结合压缩感知思想,压缩感知方案中通过求稀疏系数矩阵可以很好的重构原有图像,本发明方法还利用了空间金字塔模型和最大池的优势,使算法更具有稳定性;
3、本发明方法能够很好的克服人脸光照,遮挡以及表情等变化对人脸识别的影响,不仅可以获得较高的识别率,运行速度也较快,在很具有挑战性的AR数据库上进行人脸识别,相对于经典的词袋模型,本发明方法能够很好的克服各种因素的影响,大大提高了人脸识别率,更具有实时性。
附图说明
图1是本发明光照、表情和伪装变化的7张正面人脸图像。
具体实施方式
下面结合附图,对本发明作进一步说明。
下面通过一个具体的实例对本发明做详细说明,在人脸识别***中,通过MATLAB来仿真,实验平台为i5处理器,主频2.4GHz,2G内存。本发明的保护范围不限于下述的实施实例。
图1所示,是本发明光照、表情和伪装变化的7张正面人脸图像。第一张是正常图像,第二张是人脸表情变化的图像,第三张是光照的变化,第四张戴眼镜,第五张是戴眼镜和光照变化,第六张是围围巾,第七张是围围巾和光照的变化。本实例在一个公用很具有挑战性的人脸数据库—AR数据库上实验。AR数据库中包不同光照、表情和伪装变化的正面人脸图像2600幅,共100人,每人26幅图像。AR数据库分为两部分,第一部分的前1-7幅图像是表情、光照的变化,本文用来做训练集(700张),然后各取第一、第二部分的第8-10幅戴眼镜和第11-13幅戴围巾人脸图像分别来做测试集(各300张),为降低成本将人脸规格化为8360像素大小的图像。
首先在Matlab中对于所以图像分割成与不同的块,然后每一块用尺度不变特征变换方法进行特征提取。假设得到训练集的特征为,测试集的特征为,其中和表示一副图像由1到N块组成。
然后将训练集、测试集通过公式得到一幅图像每一块的特征编码。用空间金字塔匹配和最大池方法将图像的所有块通过公式进行融合,最后每幅图像的特征向量,训练集为,测试集。
运用核投影到高维特征空间,根据核函数计算训练集与测试集,与的直方图交叉核,分别得到和。
再利用公式,计算出每个测试样本对应于训练样本的稀疏系数矩阵。
最后根据稀疏系数矩阵通过求最小残差来判别分类:
(11)
式中表示第类相应的稀疏表示系数。
实验结果如表1所示,其中可以看出本发明方法明显识别率明显优于现有方法。对于AR人脸库第一部分的戴眼镜和围围巾的识别率达到97%以上,因为实验训练集采用的是第一部分的前7张,所以对于第二部分,识别率虽然有所下降,但本发明方法算法识别率高出现有算法7%以上。最后表中时间是表示平均每幅图像处理时间,可以看到本发明方法比现有方法花费的时间更少。
表1 两种算法在AR数据库上识别率的比较
眼镜1 | 围巾1 | 眼镜2 | 围巾2 | 时间(s) | |
词袋(现有方法) | 81.35 | 80.34 | 73.37 | 62.03 | 0.1800 |
本发明方法 | 98.32 | 97.33 | 80.96 | 87.02 | 0.1001 |
所以本发明方法,可以广泛应用于现实生活中,从实验中可以看到,本发明方法有很好的鲁棒性。
Claims (1)
1.一种基于词袋压缩感知特征提取的人脸识别方法,包括人脸识别***,其特征在于其识别步骤为:
步骤一、用尺度不变特征变换特征的方法来提取图像特征;
(1)设一幅图像的函数为 ,图像与高斯核函数卷积得到不同尺度下的尺度空间;公式如下:
(1)
其中,表示像素位置,表示尺度空间,表示尺度空间因子;
得到图像的尺度空间后,采用金字塔方法,即用差分高斯金字塔函数与图像卷积得到的空间的方法寻找来寻找极值点,得到的公式为:
(2)
其中k是相邻两个不同的尺度空间;
(3)根据极值点进而确定关键点,对关键点赋予的一个方向,实现图像的旋转不变性,具体做法为,根据关键点所在的尺度,选择与该尺度最相近的高斯平滑图像;计算上每一个点的梯度与方向;
(3)
(4)
(4)关键点周围选择一个邻域,以关键点为中心利用所有在此区域内的点的梯度形成一个直方图;
并对其中点的梯度做高斯加权;
这个邻域划分为四个子区域,在每个子区域取八个方向;
从而得到图像的尺度不变特征变换;
步骤二、特征编码
用分块的方法将图像分割为块后,每块用上述的尺度不变特征变换得到图像的局部特征后,利用压缩感知的思想,***随机生成一个随机字典B,然后通过稀疏表示得到特征编码;
假如***生成的随机字典为,一幅图像分割为块,是图像尺度不变特征变换提取的第块特征,一幅图像的每一局部块通过式(5)可求得特征编码,公式如下:
(5)
其中是常数,是所求特征编码
步骤三、图像中不同尺度的特征融合
利用(5)式得到一副图像的特征编码矩阵为,是对应块的系数,为了融合系数用最大池方法,其定义为:
(6)
其中是池向量的第个元素,表示系数编码矩阵的行,列;
最后使用空间金字塔匹配算法,即将一副图像分割成与不同的块,就可以对不同空间位置和尺度的子区域进行特征编码,假如使用空间金字塔匹配算法求得该尺度的最大池为,然后将不同尺度和区域的特征向量串接起来,最后得到这副图像特征向量;
步骤四、分类
用上述方法特征提取得到每幅图像的特征向量后,采用核稀疏表示方法来分类,核函数采用直方图交叉核,其表达式如下:
(7)
其中是两个维度为的特征向量,分别是特征向量的特征值;
假如图像特征提取后得到的训练集为,测试样本为,以第个测试样本为例,可以通过矩阵核表示为:
(8)
其中是核函数高维特征投影空间的稀疏系数,将上式展开后得到的式子如下:
(9)
其中表示第个测试样本,表示求与的直方图交叉核;
解式(9)得到系数后,最后通过求最小残差的来分类:
(10)
式中表示第类相应的稀疏表示系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410739127.5A CN104376312B (zh) | 2014-12-08 | 2014-12-08 | 基于词袋压缩感知特征提取的人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410739127.5A CN104376312B (zh) | 2014-12-08 | 2014-12-08 | 基于词袋压缩感知特征提取的人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104376312A true CN104376312A (zh) | 2015-02-25 |
CN104376312B CN104376312B (zh) | 2019-03-01 |
Family
ID=52555210
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410739127.5A Active CN104376312B (zh) | 2014-12-08 | 2014-12-08 | 基于词袋压缩感知特征提取的人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104376312B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488491A (zh) * | 2015-12-23 | 2016-04-13 | 西安电子科技大学 | 基于金字塔匹配直方图交叉核的人体睡眠姿态检测方法 |
CN106056135A (zh) * | 2016-05-20 | 2016-10-26 | 北京九艺同兴科技有限公司 | 一种基于压缩感知的人体动作分类方法 |
CN108229330A (zh) * | 2017-12-07 | 2018-06-29 | 深圳市商汤科技有限公司 | 人脸融合识别方法及装置、电子设备和存储介质 |
CN108960201A (zh) * | 2018-08-01 | 2018-12-07 | 西南石油大学 | 一种基于人脸关键点提取和稀疏表达分类的表情识别方法 |
CN109800719A (zh) * | 2019-01-23 | 2019-05-24 | 南京大学 | 基于分部件和压缩字典稀疏表示的低分辨率人脸识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102637251A (zh) * | 2012-03-20 | 2012-08-15 | 华中科技大学 | 基于参考特征的人脸识别方法 |
CN103310208A (zh) * | 2013-07-10 | 2013-09-18 | 西安电子科技大学 | 基于局部几何视觉短语描述的鉴别性人脸姿态识别方法 |
CN103745200A (zh) * | 2014-01-02 | 2014-04-23 | 哈尔滨工程大学 | 一种基于词带模型的人脸图像识别方法 |
-
2014
- 2014-12-08 CN CN201410739127.5A patent/CN104376312B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102637251A (zh) * | 2012-03-20 | 2012-08-15 | 华中科技大学 | 基于参考特征的人脸识别方法 |
CN103310208A (zh) * | 2013-07-10 | 2013-09-18 | 西安电子科技大学 | 基于局部几何视觉短语描述的鉴别性人脸姿态识别方法 |
CN103745200A (zh) * | 2014-01-02 | 2014-04-23 | 哈尔滨工程大学 | 一种基于词带模型的人脸图像识别方法 |
Non-Patent Citations (1)
Title |
---|
FILIPE MAGALHAES ET AL.: "Compressive Sensing Based Face Detection without Explicit Image Reconstruction Using Support Vector Machines", 《INTERNATIONAL CONFERENCE ON IMAGE ANALYSIS & RECOGNITION》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105488491A (zh) * | 2015-12-23 | 2016-04-13 | 西安电子科技大学 | 基于金字塔匹配直方图交叉核的人体睡眠姿态检测方法 |
CN106056135A (zh) * | 2016-05-20 | 2016-10-26 | 北京九艺同兴科技有限公司 | 一种基于压缩感知的人体动作分类方法 |
CN108229330A (zh) * | 2017-12-07 | 2018-06-29 | 深圳市商汤科技有限公司 | 人脸融合识别方法及装置、电子设备和存储介质 |
CN108960201A (zh) * | 2018-08-01 | 2018-12-07 | 西南石油大学 | 一种基于人脸关键点提取和稀疏表达分类的表情识别方法 |
CN109800719A (zh) * | 2019-01-23 | 2019-05-24 | 南京大学 | 基于分部件和压缩字典稀疏表示的低分辨率人脸识别方法 |
CN109800719B (zh) * | 2019-01-23 | 2020-08-18 | 南京大学 | 基于分部件和压缩字典稀疏表示的低分辨率人脸识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104376312B (zh) | 2019-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105825183B (zh) | 基于部分遮挡图像的人脸表情识别方法 | |
CN110852182B (zh) | 一种基于三维空间时序建模的深度视频人体行为识别方法 | |
CN106127196A (zh) | 基于动态纹理特征的人脸表情的分类与识别方法 | |
CN109543548A (zh) | 一种人脸识别方法、装置及存储介质 | |
CN104850825A (zh) | 一种基于卷积神经网络的人脸图像颜值计算方法 | |
CN105574534A (zh) | 基于稀疏子空间聚类和低秩表示的显著性目标检测方法 | |
Huang et al. | DeepDiff: Learning deep difference features on human body parts for person re-identification | |
CN104376312A (zh) | 基于词袋压缩感知特征提取的人脸识别方法 | |
CN104123554B (zh) | 基于mmtd的sift图像特征提取方法 | |
CN113963032A (zh) | 一种融合目标重识别的孪生网络结构目标跟踪方法 | |
CN104281572A (zh) | 一种基于互信息的目标匹配方法及其*** | |
CN110751027A (zh) | 一种基于深度多示例学习的行人重识别方法 | |
CN111985332A (zh) | 一种基于深度学习的改进损失函数的步态识别方法 | |
CN106203448A (zh) | 一种基于非线性尺度空间的场景分类方法 | |
CN103714340A (zh) | 基于图像分块的自适应特征提取方法 | |
CN105550642B (zh) | 基于多尺度线性差分特征低秩表示的性别识别方法及*** | |
CN105354547A (zh) | 一种结合纹理和彩色特征的行人检测方法 | |
Ming et al. | A unified 3D face authentication framework based on robust local mesh SIFT feature | |
CN113822134A (zh) | 一种基于视频的实例跟踪方法、装置、设备及存储介质 | |
CN108133192A (zh) | 一种基于高斯-拉普拉斯分布统计的行人重识别 | |
CN109977892B (zh) | 基于局部显著性特征和cnn-svm的舰船检测方法 | |
CN103390150A (zh) | 人体部件检测方法和装置 | |
Chen et al. | Illumination processing in face recognition | |
CN110147755B (zh) | 基于上下文级联cnn的人头检测方法 | |
CN109614877B (zh) | 低分辨率监控场景中具有遮挡的行人属性识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |