CN104778457B - 基于多示例学习的视频人脸识别方法 - Google Patents

基于多示例学习的视频人脸识别方法 Download PDF

Info

Publication number
CN104778457B
CN104778457B CN201510183977.6A CN201510183977A CN104778457B CN 104778457 B CN104778457 B CN 104778457B CN 201510183977 A CN201510183977 A CN 201510183977A CN 104778457 B CN104778457 B CN 104778457B
Authority
CN
China
Prior art keywords
video
face
classification
bag
piecemeal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510183977.6A
Other languages
English (en)
Other versions
CN104778457A (zh
Inventor
陈海鹏
申铉京
王玉
吕颖达
王子瑜
徐浩然
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin University
Original Assignee
Jilin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin University filed Critical Jilin University
Priority to CN201510183977.6A priority Critical patent/CN104778457B/zh
Publication of CN104778457A publication Critical patent/CN104778457A/zh
Application granted granted Critical
Publication of CN104778457B publication Critical patent/CN104778457B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提出一种基于多示例学习的视频人脸识别算法,该算法将每个人脸视频视为一个包,将视频中正规化后的人脸帧图像作为包中的示例,采用基于加权的分块局部二值模式级联直方图作为示例特征,在训练集合的多示例特征空间中,采用多示例学习算法得到分类器,进而实现对测试样本的分类及预测。通过在人脸视频库中的相关实验,该算法得到了比较高的识别精度,同时,该方法对光照变化、表情变化等具有良好的鲁棒性,验证了算法的有效性。

Description

基于多示例学习的视频人脸识别方法
技术领域
本发明涉及数字图像处理与计算机视觉领域,特别涉及一种视频人脸识别方法。
背景技术
视频人脸识别近年来成为计算机视觉领域的研究热点和难点问题,伴随着物联网、网络安全等的发展,具有广阔的应用前景。相对于静态图像,动态视频中可选用的特征信息更加丰富多样,例如,视频的时间动态信息有助于识别率的提升;从视频序列中可以选取分辨率相对较高的图像以能够提高识别性能;还可以通过视频学习重构目标三维模型,利用这些模型可以高效的实现目标识别。总之,时间和运动信息在基于视频的目标识别中起到了至关重要的作用。
视频人脸识别方法主要分为两类:一类方法是设法提取出视频序列中最具代表性的单独人脸帧图像,采用传统的基于静态图像的人脸识别方法,包括基于几何特征的方法、基于统计的方法等等。该类方法存在的主要问题是对关键帧的定义较为模糊,且没有有效利用视频中的上下文信息。另外一类方法就是将视频看成是一个视频帧集合,从帧集合的角度进行分析,利用3D建模、时空连续信息的概率模型方法、设计视频纹理描述等提高识别率,在这类方法中如何充分利用视频中人脸的时间和空间信息克服视频中人脸分辨率低、光照、表情、姿态变化剧烈等困难是研究的重点。因此,需要一种方法解决上述问题。
发明内容
本发明所要解决的技术问题是为解决视频人脸识别问题中关键帧难以准确定位以及高信噪比导致的识别率偏低等问题,提出一种基于多示例学习的视频人脸识别方法。所述方法在提高视频人脸识别准确率和识别性能方面有显著地提高。
为了解决上述技术问题,本发明所采用的技术方案是:
一种基于多示例学习的视频人脸识别方法,包括如下步骤:
步骤A,对从视频中提取的正面人脸视频序列以双眼坐标为基准进行人脸归一化处理;
步骤B,在预处理阶段,对提取出的人脸视频序列中的每个视频帧进行两个尺度、四个方向的Gabor变换,得到频域幅值图像,利用这些频域幅值图像可以获得增强的频域幅值特征;
步骤C,将上一步骤得到的频域幅值图像集合划分分块,并对每个分块通过LBP算子获得分块的纹理特征,每个分块的纹理特征通过统计直方图的形式表示,将各分块直方图级联以得到该人脸视频的全局纹理信息;
步骤D,通过上述步骤得到训练视频的特征分布空间,通过EMDD算法得到特征空间中多样性密度最大点t,对于每一个测试包,计算t与测试包之间的距离。如果测试包与t之间的距离小于分类阈值,那么就将其作为正包,否则,将其归为反包,实现对测试包的二分类。
步骤E,对于给定的K个分类的训练视频集合,通过上述步骤将得到K(K-1)/2个子分类器,通过采用One-Against-One方法可以建立多分类模型,对于任一测试人脸视频,可以通过步骤A、B、C的操作后获得全局纹理信息,输入到该多分类模型就可以得到测试包的最终分类结果。
所述的分类阈值的确定可以通在候选阈值进行选择,当某一候选阈值可以最大程度上将训练集合中的包进行正确分类时,将该候选阈值最为最终的分类阈值。
有益效果:本发明提出了一种基于多示例学习的视频人脸识别算法,所述算法提出了一种基于多示例学习的视频人脸识别方法,该方法将人脸视频视为一个包,而将视频中的人脸图像作为包中的示例,对包中的示例提取加权的LBP特征直方图来以获取示例特征,通过多示例学习算法训练得到分类器以实现对测试人脸视频的分类预测。本文算法在得到较高的识别精度的同时,有效解决了人脸视频中关键帧难以选择的问题,并且具有较强的抗干扰能力,对光照变化、表情等问题也具有较好的鲁棒性。
附图说明
图1是本发明基于多示例学习的视频人脸识别方法的流程图。
具体实施方式
下面结合附图,对本发明提出的一种基于直方图的彩色图像分割方法进行详细说明:
如图1所示,本发明的视频人脸识别方法,其步骤如下:
下面结合图1详细说明本发明的基于多示例学习的视频人脸识别算法。
首先,进行人脸图像的预处理。Gabor小波变换能够提取图像的多尺度、多方向局部频率信息,可以增强一些关键特征,在提取目标的局部空间频率域信息方面具有良好的特性。在人脸识别领域中,Gabor变换得到了广泛的应用。
二维Gabor小波函数定义为:
其中,μ和ν分别表示Gabor核的方向与尺度,z=(x,y)代表图像中的一个像素点。kμ,ν控制高斯窗口的宽度、震荡部分的波长及方向,ν的取值决定了Gabor滤波的波长,μ的取值表示Gabor核的方向。
Gabor人脸可以通过二维Gabor小波函数和人脸图像进行卷积运算得到:
Gψ,f(x,y)=f(x,y)*ψ(z) (2)
Gabor小波函数与图像的卷积结果是由实部和虚部两个分量构成的复数响应(滤波系数)。幅值比较稳定,不会随位置产生旋转,幅值信息反映了图像的能量谱,因此常被用来进行人脸的特征表示。其幅值表示为:
其中,Re(G(x,y))、Im(G(x,y))分别为G(x,y)的实部与虚部。这里我们取m∈{0,1},两个尺度,n∈{0,1,2,3}四个方向的幅值图谱,并通过如下方法获得增强的Gabor幅值图谱表示:
其次,对人脸图像提取LBP算子以获得特征直方图。本发明采用了一种加权的局部二值模式人脸描述算子。局部二值模式具有计算简单、对均匀光照变化鲁棒等特点,而人脸的不同分块、LBP直方图中的不同特征值对人脸识别的贡献是不同的,在训练过程中可以得到特征空间中每个属性的权值,加权的LBP算子具有较强的分类能力,可以进一步提高识别精度和效率类。实验结果表明该方法对人脸表情变化及光照变化是鲁棒的,而且具有很好的判别能力。该算子是一种从纹理局部近邻定义中衍生出来,灰度范围内的纹理度量算子,具有很强的分类能力、较高的计算效率、灰度不变性和旋转不变性的特点。对于给定图像中的任一像素点,其LBP编码值可通过如下公式计算得到:
在LBP的各种模式中,有一部分模式出现的概率相当高,而且它们占据了绝大多数的纹理信息,这样的模式称为等价模式,等价模式的特点是在LBP的二进制编码中,最多有两个0到1(或者1到0)的变化。表示一种等价模式的LBP算子,采用了等价模式后,二进制模式大大减少,模式的数量从最开始的2p减少到了P(P-1)+2种(降维),等价模式具体定义为:其中U(LBP)表示0到1或1到0跳变的次数,等价模式的计算方法如下式所示。
接下来,通过训练样本得到多示例分类器。多示例学习模型被认为非常适合低信噪比或者数据缺失严重的环境下的概念学习,受到机器学习界广泛的重视并成为当前研究的热点之一。在众多示例学习算法中,DD算法及其基于EM策略的变体EM-DD算法应用最为普遍。
对于二分类问题,假设训练集合中共有n个正包和m个负包D={B1+;…;Bn+;B1-;…;Bm-},则对于任一目标点t的多样性密度定义如下式所示:
在实现过程中,示例特征是通过LBP直方图表示的,而直方图相似度匹配的公式包括直方图相交、Chi平方概率统计及Log概率统计等,本文选择了直方图相交的匹配方式,同时,在训练得到多示例分类器的过程中还可以获得各示例特征值对应的不同权值,如公式(9)所示,即可以得到一个加权的LBP特征直方图,可以进一步增强人脸的纹理表示性能。
式中,s代表相关属性的权值,s是一个非负的值,如果等于零,则说明这个属性很不相关,若越大,则说明这个属性越重要。
最后,执行对测试包的预测分类。DD算法及EM-DD算法学习到的概念是空间中多样性密度最大点t,对于每一个测试包,计算t与测试包之间的距离。对于给定的阈值threshold,如果包与t之间的距离小于threshold,那么就将其作为正包,否则,将其归为反包。
通过上述实施方式,可见本发明具有如下优点:
本发明在得到较高的识别精度的同时,有效解决了人脸视频中关键帧难以选择的问题,并且具有较强的抗干扰能力。
另外,本发明利用LBP算子获取纹理特征,该算子对光照变化、人脸的表情等具有较好的鲁棒性。

Claims (2)

1.一种基于多示例学习的视频人脸识别方法,其特征在于:包括如下步骤:
步骤A,对从视频中提取的正面人脸视频序列以双眼坐标为基准进行人脸归一化处理;
步骤B,在预处理阶段,对提取出的人脸视频序列中的每个视频帧进行两个尺度、四个方向的Gabor变换,得到频域幅值图像,利用这些频域幅值图像可以获得增强的频域幅值特征;
步骤C,将上一步骤得到的频域幅值图像集合划分分块,并对每个分块通过LBP算子获得分块的纹理特征,每个分块的纹理特征通过统计直方图的形式表示,将各分块直方图级联以得到该人脸视频的全局纹理信息;
步骤D,通过上述步骤得到训练视频的特征分布空间,通过EMDD算法得到特征空间中多样性密度最大点t,对于每一个测试包,计算t与测试包之间的距离,如果测试包与t之间的距离小于分类阈值,那么就将其作为正包,否则,将其归为反包,实现对测试包的二分类;
步骤E,对于给定的K个分类的训练视频集合,通过上述步骤将得到K(K-1)/2个子分类器,通过采用One-Against-One方法可以建立多分类模型,对于任一测试人脸视频,可以通过步骤A、B、C的操作后获得全局纹理信息,输入到该多分类模型就可以得到测试包的最终分类结果。
2.根据权利要求1所述的一种基于多示例学习的视频人脸识别方法,其特征在于:步骤D所述的分类阈值的确定可以通在候选阈值进行选择,当某一候选阈值可以最大程度上将训练集合中的包进行正确分类时,将该候选阈值做为最终的分类阈值。
CN201510183977.6A 2015-04-18 2015-04-18 基于多示例学习的视频人脸识别方法 Active CN104778457B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510183977.6A CN104778457B (zh) 2015-04-18 2015-04-18 基于多示例学习的视频人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510183977.6A CN104778457B (zh) 2015-04-18 2015-04-18 基于多示例学习的视频人脸识别方法

Publications (2)

Publication Number Publication Date
CN104778457A CN104778457A (zh) 2015-07-15
CN104778457B true CN104778457B (zh) 2017-12-01

Family

ID=53619910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510183977.6A Active CN104778457B (zh) 2015-04-18 2015-04-18 基于多示例学习的视频人脸识别方法

Country Status (1)

Country Link
CN (1) CN104778457B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105069473B (zh) * 2015-08-05 2019-07-23 广东工业大学 面向在线不确定图像识别的多示例加权包学习方法
CN105278376A (zh) * 2015-10-16 2016-01-27 珠海格力电器股份有限公司 利用人脸识别技术的装置使用方法及装置
CN105426829B (zh) * 2015-11-10 2018-11-16 深圳Tcl新技术有限公司 基于人脸图像的视频分类方法和装置
CN105469076B (zh) * 2015-12-29 2019-05-03 广东微模式软件股份有限公司 基于多示例学习的人脸比对验证方法
CN107085822B (zh) * 2016-02-16 2020-09-04 北京小米移动软件有限公司 人脸图像处理方法及装置
CN106127247B (zh) * 2016-06-21 2019-07-09 广东工业大学 基于多任务多示例支持向量机的图像分类方法
CN106127193B (zh) * 2016-07-12 2019-09-06 青岛大学 一种人脸图像识别方法
CN106250924B (zh) * 2016-07-27 2019-07-16 南京大学 一种基于多示例学习的新增类别检测方法
CN106980826A (zh) * 2017-03-16 2017-07-25 天津大学 一种基于神经网络的动作识别方法
CN106951869B (zh) * 2017-03-22 2019-03-15 腾讯科技(深圳)有限公司 一种活体验证方法及设备
CN107392142B (zh) * 2017-07-19 2020-11-13 广东工业大学 一种真伪人脸识别方法及其装置
CN107563418A (zh) * 2017-08-19 2018-01-09 四川大学 一种基于区域敏感得分图谱及多实例学习的图片属性探测方法
CN108038434B (zh) * 2017-12-04 2020-06-16 东南大学 基于多示例学习的视频人脸表情预检测方法
CN109299650B (zh) * 2018-07-27 2021-09-07 东南大学 基于视频的非线性在线表情预检测方法及装置
CN109344902B (zh) * 2018-10-12 2021-07-20 吉林大学 一种基于局部时空连续性聚合描述的视频纹理描述方法
CN109446980A (zh) * 2018-10-25 2019-03-08 华中师范大学 表情识别方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509084A (zh) * 2011-11-18 2012-06-20 中国科学院自动化研究所 一种基于多示例学习的恐怖视频场景识别方法
CN102722736A (zh) * 2012-06-13 2012-10-10 合肥工业大学 复杂干扰下字符串的分割与识别方法
CN103413125A (zh) * 2013-08-26 2013-11-27 中国科学院自动化研究所 基于判别性示例选择多示例学习的恐怖视频识别方法
US8804005B2 (en) * 2008-04-29 2014-08-12 Microsoft Corporation Video concept detection using multi-layer multi-instance learning

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8249366B2 (en) * 2008-06-16 2012-08-21 Microsoft Corporation Multi-label multi-instance learning for image classification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8804005B2 (en) * 2008-04-29 2014-08-12 Microsoft Corporation Video concept detection using multi-layer multi-instance learning
CN102509084A (zh) * 2011-11-18 2012-06-20 中国科学院自动化研究所 一种基于多示例学习的恐怖视频场景识别方法
CN102722736A (zh) * 2012-06-13 2012-10-10 合肥工业大学 复杂干扰下字符串的分割与识别方法
CN103413125A (zh) * 2013-08-26 2013-11-27 中国科学院自动化研究所 基于判别性示例选择多示例学习的恐怖视频识别方法

Also Published As

Publication number Publication date
CN104778457A (zh) 2015-07-15

Similar Documents

Publication Publication Date Title
CN104778457B (zh) 基于多示例学习的视频人脸识别方法
Satpathy et al. LBP-based edge-texture features for object recognition
Lee et al. Deep saliency with encoded low level distance map and high level features
Tang et al. Compressed-domain ship detection on spaceborne optical image using deep neural network and extreme learning machine
Wang et al. Generative adversarial network (GAN) based data augmentation for palmprint recognition
Luo et al. Spatio-temporal feature extraction and representation for RGB-D human action recognition
Ye et al. Real-time no-reference image quality assessment based on filter learning
Yuan et al. Congested scene classification via efficient unsupervised feature learning and density estimation
Schwartz et al. Visual material traits: Recognizing per-pixel material context
Donoser et al. Discrete-continuous gradient orientation estimation for faster image segmentation
CN107992800A (zh) 一种基于svm和随机森林的指纹图像质量判断方法
Bouchaffra et al. Structural hidden Markov models for biometrics: Fusion of face and fingerprint
Liu et al. SAR image segmentation based on hierarchical visual semantic and adaptive neighborhood multinomial latent model
Nie et al. Two-dimensional extension of variance-based thresholding for image segmentation
Chi Self‐organizing map‐based color image segmentation with k‐means clustering and saliency map
CN110738672A (zh) 一种基于分层高阶条件随机场的图像分割方法
Raja et al. Smartphone based robust iris recognition in visible spectrum using clustered k-means features
Hüsem et al. A survey on image super-resolution with generative adversarial networks
Dhar et al. Interval type-2 fuzzy set and human vision based multi-scale geometric analysis for text-graphics segmentation
Liu et al. Iris double recognition based on modified evolutionary neural network
Sowmya et al. Significance of processing chrominance information for scene classification: a review
Raju et al. A survey on texture classification techniques
Jaswal et al. Palmprint and finger knuckle based person authentication with random forest via kernel-2DPCA
Li et al. Research on hybrid information recognition algorithm and quality of golf swing
Yadav et al. A survey: comparative analysis of different variants of local binary pattern

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant