CN107330412B - 一种基于深度稀疏表示的人脸年龄估计方法 - Google Patents
一种基于深度稀疏表示的人脸年龄估计方法 Download PDFInfo
- Publication number
- CN107330412B CN107330412B CN201710546450.4A CN201710546450A CN107330412B CN 107330412 B CN107330412 B CN 107330412B CN 201710546450 A CN201710546450 A CN 201710546450A CN 107330412 B CN107330412 B CN 107330412B
- Authority
- CN
- China
- Prior art keywords
- age
- face
- dictionary
- sparse representation
- estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 238000000556 factor analysis Methods 0.000 claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 10
- 241000282414 Homo sapiens Species 0.000 claims description 48
- 238000012549 training Methods 0.000 claims description 32
- 239000013598 vector Substances 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 19
- 238000012360 testing method Methods 0.000 claims description 13
- 230000006870 function Effects 0.000 claims description 10
- 230000014509 gene expression Effects 0.000 claims description 9
- 238000007670 refining Methods 0.000 claims description 9
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims description 3
- 238000003909 pattern recognition Methods 0.000 abstract description 3
- 238000000605 extraction Methods 0.000 description 14
- 238000004458 analytical method Methods 0.000 description 10
- 238000013461 design Methods 0.000 description 9
- 238000011160 research Methods 0.000 description 8
- 239000000654 additive Substances 0.000 description 7
- 230000000996 additive effect Effects 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000032683 aging Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 238000000354 decomposition reaction Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003592 biomimetic effect Effects 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000011664 nicotinic acid Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/178—Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于深度稀疏表示的年龄估计方法,属于图像处理与模式识别技术领域。它解决了现存人脸年龄估计方法不稳定的问题。其主要包括如下步骤:A、构建鉴别字典学习模型;B、基于鉴别字典建立深度稀疏表示模型;C、构建两因子分析模型进行身份因子去除;D、提取鲁棒性年龄特征;E、构建分层年龄估计模型进行年龄估计。本发明具有抗干扰能力强、准确度高等优点。
Description
技术领域
本发明属于图像处理与模式识别技术领域,涉及一种基于深度稀疏表示的人脸年龄估计方法。
背景技术
在医学界,人们主要通过分析胆固醇、高密度胆固醇、白蛋白等血检指标来测定一个人的“生理年龄”并以此研究人体衰老的程度。但遗憾的是这套指标体系目前还很不完善,且使用不方便。如果能利用计算机和图像处理技术,通过分析人脸表观图像能精准预测一个人的“生理年龄”,将“生理年龄”与“实际年龄”对比,就可以知道你究竟是“青春常驻”还是“未老先衰”。那么将极大地提高研究效率和降低研究成本。通过看“脸”来估计年龄不仅可用于量化衰老,还可以应用于智慧城市和平安城市建设中。如,基于年龄分析的强制、控制、商业分析,广告投递和人机交互等应用。在日常的语言交谈中,谈话内容与方式往往受对方性别和年龄等因素影响。例如,在面对年长者时,谈话的语言显然会正式些。更一般地,人类会通过对方人脸外观迅速估计对方性别、年龄和身份等信息以便选择不同社交方式。
相对人脸识别问题,年龄分析所受到的关注要少得多。然而,这并不表明年龄分析没有人脸身份识别重要。人脸年龄分析最容易想到是在人脸识别、法医学方面的应用。近年来关于人脸年龄分析的研究吸引了更多心理学、美学,刑侦学、计算机图形学、计算机视觉等领域的研究兴趣。可以肯定,未来年龄自动分析的应用并不亚于人脸识别,并将广泛应用于智能广告投递,生物鉴定学,生物统计学,电子客户关系管理,人脸识别、美容,法律实施,安全控制、人口统计与普查、人机交互等领域。
在人脸年龄自动估计***中,通常分为两个阶段,第一个阶段是提取年龄特征,第二个阶段是估计年龄,通常研究的重点是如何提取到最佳的年龄特征。目前人脸年龄特征提取方法大致可以分为经典传统和基于深度学习的两大类方法。第一类方法理论成熟、实现简单,但鲁棒性不高。其中典型代表有主动表观模型(AAM),局部二元模式(LBP),Gabor和仿生特征(Bio-inspired Features,BIF)等。每种方法都有各自的特点和应用场合。例如,AAM特征综合了人脸纹理和形状信息具有全局性,适用于人脸年龄粗估计。LBP主要是提取人脸局部纹理特征,具有局部细节性,在区分相近的年龄比较有效,但由于缺乏全局信息容易出现大区域跨年龄段估计错误。BIF特征考虑了人类分类识别物体的思维方式,所以取得了比较好的效果,但其人类物体识别思维方式并没有充分利用。因此,如何有效地综合利用以上特征并充分挖掘人类思维方式是年龄估计未来的重要研究方向。本发明朝此方向作有益的探讨与研究,提出基于深度稀疏表达的人脸特征提取方法。该方法融合了AAM、LBP和BIF特征的各自特点。
最近,由于深度学习的研究与应用不断深入与发展,出现了不少基于深度学习的人脸年龄估计方法。如,文章“Dong Yi,Zhen Lei,Stan Z.Li.Age Estimation by Multi-scale Convolutional Network[C].In Proceedings of 12th Asian Conference onComputer Vision,Singapore,2014.”和专利“一种人脸图像的年龄估计方法(专利号:CNIO5956571A)”等将深度卷积神经网络应用于年龄估计。深度学习是目前研究的热门,基于深度学习的年龄估计虽然取得了显著的效果。但其应用面临着深度网络的优化设计和人脸图像优化处理技巧等问题;其次,现有的深度学习结构当隐层数增多时参数急剧增加,对运算性能提出了较高的要求;最后,面临海量年龄训练样本缺乏和工程应用等问题。而本发明提出的深度稀疏表示人脸年龄估计方法具有计算复杂度低,不需要海理量训练样本和鲁棒性高等优点。
发明内容
本发明的目的是针对现有的技术存在的上述问题,提供一种基于深度稀疏表示的人脸年龄估计方法,本发明所要解决的技术问题是如何通过人脸特征估计人的年龄。
本发明目的通过如下技术方案来实现:一种基于深度稀疏表示的人脸年龄估计方法,其特征在于,本方法包括如下步骤:
A、构建鉴别字典学习模型:
其中,r(Ai,D,Xi)为人脸重构保真项,||X||1为稀疏约束项以保证求解系数的稀疏性,
f(X)为鉴别约束项,L(Di)=||Di||*为低秩(Low-rank)正定化噪声处理项,λ1,λ2,γ为平衡因子参数。式(1)字典学习模型的目标函数求解可以通过交替迭代的方法进行求解。
B、根据AAM特征对年龄进行粗分类(第一层)
首先,利用步骤A介绍的字典学习方法求得的完备字典DAAM对测试人脸y进行稀疏表示求取稀疏表示系数xAAM:
C、根据BIF特征对年龄进行分类(第二层)
然后,根据式(3)求取ei,并选取前k类别(最相近的前一半)确认下层字典类别。
D、根据Gabor特征和LBP特征年龄进行分类(第三层)
根据步骤A获得完备字典DGL,使用步骤C得到的类别对其进行提炼得到精简后的字典D′GL。进一步对字典D′GL的类别进行聚类,去除奇异类别(边缘类)。对测试人脸y利用去除奇异类后的D′GL第三次进行稀疏表示求取稀疏表示系数
优选的,经过步骤B和步骤C,留下来的类别都是与测试年龄相邻的类别。此时,字典D′GL内的年龄特征比较相近,而身份特征的干扰逐渐增强,加大了对年龄进一步细分的难度。因此,对于年龄的进一步细分问题,如果能去除身份信息的干扰,无疑是“雪中送炭”。本发明利用两因子分析模型进行人脸年龄与身份分离,并利用加性模型进行身份因子去除,来提高特征的年龄细分能力。
E、提取最终人脸年龄特征(融合层)
F、通过年龄估计模块对年龄自动估计
年龄估计分为模型训练和年龄估计两个阶段
模型训练阶段:将人脸年龄(0-80岁)以10岁为间隔分成8组,如图2所示。每组利用支持向量回归(SVR)单独训练一个估计模型,总共得到8个不同的年龄估计器。
年龄估计阶段:首先,根据深度稀疏表达模型对待估人脸进行分组;然后,根据第一步的分组情况,选择相应的SVR模型进行年龄估计。
本方法还包括一个基于因子分析的人脸身份信息去除的步骤,方法如下:
综上所述,本发明提出的一种基于深度稀疏表示的人脸年龄估计方法,具有如下优点:
1)为了提取鲁棒性人脸年龄特征,同时克服人脸年龄的相邻相似性和次序性问题,本发明利用不同特征提取方法的优缺点和分层稀疏表达的特点,提出深度稀疏表达的人脸年龄特征提取模型。在此深度模型中,根据年龄变化特点,在不同层次使用了不同特征的稀疏表达;层次间具有严格的递进关系,使得提取的特征具有很强的位置信息。因此,深度稀疏表达特征不但具有很强鉴别性能,同时还具有年龄组信息,便于后期分层年龄估计模型的设计。
2)为了降低基于人脸图像的年龄估计中人脸身份信息的干扰,本发明提出两因子分析模型进行人脸年龄与身份因子分析。基于此模型,采用加性模型去除人脸身份因子的干扰以加强年龄细分的能力。
附图说明
图1是一种基于深度稀疏表示的人脸年龄特征提取方法流程图。
图2是基于分层支持向量回归模型的人脸年龄估计方法流程图。
具体实施方式
以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
本发明提出的一种基于深度稀疏表示的人脸年龄估计方法,主要包括:人脸年龄特征提取和人脸年龄估计两大模块:
S1人脸年龄特征提取模块
此模块为主要是提取具有鉴别性和鲁棒性的人脸年龄特征。由于人脸年龄的特殊性,导致目前的人脸年龄特征提取算法各具特色。因此,如何利用一种结构框架同时融合不同算法优点提取高鉴别性的年龄特征是整个人脸年龄估计方法的关键。本发明从基础理论和应用设计两方面着手研究信号稀疏表达的数学模型和字典优化方法,并分析目前经典主流的AAM、LBP、Gabor和BIF等人脸特征提取的年龄特性。据此,提出一种深度稀疏表示的人脸年龄特征提取方法(Deep_SRC),如图1所示Deep_SRC总共分为三层,每层采用不同特征和字典。其中,每层的原始超完备字典在后台训练得出;系数特征竖状长方形中白色部分表示为全0项,灰色部分表示非0系数项。Deep_SRC的实施步骤如下:
①鉴别字典学习
收集0-80岁的人脸样本,每岁作为一类,每类包含500幅人脸图像。据此,组成年龄人脸训练集A=[A1,A2,L,A80],其中 为第i类中第j个样本的特征向量。一般的,可以直接使用上述训练集作为人脸年龄完备字典。但这种方式构建的字典并非最优,同时可能导致字典矩阵过大。假设训练样本集A由完备字典D线性组合表示,其稀疏表示系数矩阵为X。则X可以改写为X=[X1,X2,L,X80],其中Xi为子集Ai的系数矩阵。为了使求取的完备字典D不但对样本集A具有很好的稀疏重建能力,同时还具有很强的鉴别和噪声处理能力,本发明构建如下的字典学习模型:
其中,r(Ai,D,Xi)为人脸重构保真项,||X||1为稀疏约束项以保证求解系数的稀疏性,
f(X)为鉴别约束项,L(Di)=||Di||*为低秩(Low-rank)正定化噪声处理项,λ1,λ2,γ为平衡因子参数。式(1)字典学习模型的目标函数求解可以通过交替迭代的方法进行求解。
②第一层设计
由于AAM特征综合了人脸纹理和形状信息具有全局性,适用于人脸年龄粗估计。因此,第一层采用AAM特征。首先,利用①介绍的字典学习方法求得的完备字典DAAM对测试人脸y进行稀疏表示求取稀疏表示系数xAAM:
③第二层设计
由于BIF特征考虑了人类识别物体的思维方式,取得了比较好的效果。因此,第二层采用BIF特征。
然后,根据式(3)求取ei,并选取前k类别(最相近的前一半)确认下层字典类别。
④第三层设计
由于Gabor滤波器具有多尺度和方向性,同时LBP特征具有局部细节性。因此,第三层采用Gabor+LBP特征。
对完备字典DGL(利用①介绍的字典学习在后台训练得到),使用上层得到的类别对其进行提炼得到精简后的字典D′GL。进一步对字典D′GL的类别进行聚类,去除奇异类别(边缘类)。对测试人脸y利用去除奇异类后的D′GL第三次进行稀疏表示求取稀疏表示系数
优选的,经过前两层,留下来的类别都是与测试年龄相邻的类别。此时,字典D′GL内的年龄特征比较相近,而身份特征的干扰逐渐增强,加大了对年龄进一步细分的难度。因此,对于年龄的进一步细分问题,如果能去除身份信息的干扰,无疑是“雪中送炭”。本发明利用两因子分析模型进行人脸年龄与身份分离,并利用加性模型进行身份因子去除,来提高特征的年龄细分能力。
⑤融合层设计
S2人脸年龄估计模块
此模块利用上模块提取的人脸年龄特征进行年龄估计器的训练和学习。现有的年龄估计算法中,研究人员对年龄估计这个问题只是单纯的视作单一的分类问题或者回归问题。将年龄视作回归问题,就相当于建立特征与年龄的全局函数,然而人的年龄老化过程存在一定的可变性,全局函数并不能确切的拟合年龄随着特征的变化。考虑以上因素,为了获得更佳的估计结果,本发明采用分层方案进行年龄估计,如图2所示。人脸年龄估计分为模型训练和年龄估计两个阶段。
模型训练阶段:将0~80岁的人脸年龄以10岁为间隔分成8组,如图2所示。每组利用支持向量回归(SVR)单独训练一个估计模型,总共得到8个不同的年龄估计器。
年龄估计阶段:首先,根据深度稀疏表达模型对待估人脸进行分组;然后,根据第一步的分组情况,选择相应的SVR模型进行年龄估计。
实施例1:
本发明提出的一种基于深度稀疏表示的人脸年龄估计方法主要包括字典训练、深度稀疏表示模型构建、特征提取和年龄估计四大步骤。
步骤1:字典训练
本步骤可以在后台离线完成。首先,收集0-80岁的人脸样本,每岁作为一类,每类包含500幅人脸图像。据此,组成年龄人脸训练集A=[A1,A2,L,A80],其中 为第i类中第j个样本人脸。然后,对人脸训练集A进行AAM、BIF和Gabor+LBP特征提取。最后,利用鉴别字典学习方法训练出基于AAM、BIF和Gabor+LBP的完备字典DAAM,DBIF,DGL。
步骤2:深度稀疏表示模型构建
利用上步训练得到的完备字典构建深度稀疏表示模型,如图1所示模型包含有四层。
第一层利用字典DAMM对测试人脸进行稀疏表示,求解稀疏表示系数;然后,根据稀疏表示系数求解出重建误差最小的k类(年龄类别)作为下一层稀疏表示类别。
第二层利用第一层得到的k类别对字典DBIF进行精减得到D′BIF,对测试人脸利用精减后的字典D′BIF进行重新稀疏表示,求解稀疏表示系数;然后,根据稀疏表示系数求解出重建误差最小的k′类作为下一层稀疏表示类别。
第三层利用第二层得到的k′类别对字典DGL进行精减得到D′GL,对测试人脸利用精减后的字典D′GL进行重新稀疏表示,求解稀疏表示系数。
优选的,为了提高模型对人脸年龄的细分能力,本发明在第三层进行稀疏表示之前,先进行人脸身份因子去除。年龄估计就是要从人脸样本图像中提取年龄信息。在年龄相差大于10岁情况下,年龄信息在人脸样本中占主要地位。然而,在年龄相差小于10岁情况下,身份信息在人脸样本中所占地位逐渐增强成为主导。因此,本发明将进行人脸年龄和身份因子分析,并利用加性模型去除人脸身份因子的干扰。
步骤3:人脸特征提取
对输入的人脸图像,进行AMM、BIF和Gabor+LBP特征提取,并进行因子分析求解出人脸身份因子去除后的人脸。然后,将以上得到的人脸特征和处理后人脸代入深度稀疏表示模型提取人脸年龄特征。
步骤4:人脸年龄估计
根据步骤3得到的人脸年龄特征,确定输入人脸所属的年龄组。然后,将人脸年龄特征代入其相应的年龄组SVR模型进行年龄估计。
优选的,本发明将年龄(0-80岁)按10岁为间隔分成8组,在后台利用收集的人脸训练样本为每个分组训练出一个最优的基于SVR的年龄估计模型。
实施例2:
一种基于深度稀疏表示的人脸年龄估计方法同实施例1,其中步骤1中的鉴别字典学习方法包括如下步骤:
(1a)收集0-80岁的人脸样本,每岁作为一类,每类包含500幅人脸图像。据此,组成年龄人脸训练集A=[A1,A2,L,A80],其中 为第i类中第j个样本的特征向量。假设训练样本集A由完备字典D线性组合表示,其稀疏表示系数矩阵为X。则X可以改写为X=[X1,A2,L,X80],其中Xi为子集Ai的系数矩阵。
(1b)为了使求取的完备字典D不但对样本集A具有很好的稀疏重建能力,同时还具有很强的鉴别和噪声处理能力,本发明构建如下的字典学习模型:
其中,r(Ai,D,Xi)为人脸重构保真项,其定义如下:
||X||1为稀疏约束项以保证求解系数的稀疏性。
f(X)为鉴别约束项,本文采用经典Fisher准则,并对其类间与类内散布矩阵(SB,SW)加权改进以达到更佳效果,其定义如下:
L(Di)=||Di||*为低秩(Low-rank)正定化噪声处理项,||·||*代表核范数,表示矩阵的奇异值之和。由于Low-rank正定化能够分离信息噪声,因此它可使得学***衡因子参数。
(1c)式(1)字典学习模型的目标函数求解可以通过交替迭代的方法分成两个子问题求解:①固定字典D,优化匹配得到系数矩阵X;②固定系数矩阵X,优化匹配得到字典D。如此交替迭代直到收敛为止。
更新系数矩阵X:
假定D已知,则目标函数式(1)简化为稀疏表示问题。可以通过逐个更新X而固定所有的Xj(j≠i)的方式求解最终的X,其求解目标函数为:
其求解可以通过迭代投影法进行求解。
更新字典D:
当X已知时,可以通过逐个更新Di而固定所有的Dj(j≠i)的方式求解最终的D,其求解目标函数为:
其中,Ei为训练子集Ai误差矩阵,||·||2,1为l2,1-norm范数被用于测量指定样本的腐蚀和噪声。(6)式可以通过不确定增广拉格朗日乘子求解。
实施例3:
一种基于深度稀疏表示的人脸年龄估计方法同实施例1-2,其中步骤2中的深度稀疏表示模型构建方法包括如下步骤:
(2a)第一层设计:由于AAM特征综合了人脸纹理和形状信息具有全局性,适用于人脸年龄粗估计。因此,第一层采用AAM特征。首先,利用步骤1介绍的字典学习方法求得的完备字典DAAM对测试人脸y进行稀疏表示求取稀疏表示系数xAAM:
(2b)第二层设计:由于BIF特征考虑了人类识别物体的思维方式,取得了比较好的效果。因此,第二层采用BIF特征。
然后,根据式(2)求取ei,并选取前k类别(最相近的前一半)确认下层字典类别。
(2c)第三层设计:由于Gabor滤波器具有多尺度和方向性,同时LBP特征具有局部细节性。因此,第三层采用Gabor+LBP特征。
对完备字典DGL(利用步骤1介绍的字典学习在后台训练得到),使用上层得到的类别对其进行提炼得到精简后的字典D′GL。进一步对字典D′GL的类别进行聚类,去除奇异类别(边缘类)。对测试人脸y利用去除奇异类后的D′GL第三次进行稀疏表示求取稀疏表示系数
实施例4:
一种基于深度稀疏表示的人脸年龄估计方法同实施例1-3,其中步骤2中的人脸身份因子去除方法包括如下步骤:
(2e)因子分析模型:把内容和风格看作影响一个事物的两个互相独立的因素,它们决定了事物的观测。比如:在人脸年龄分析中,人脸年龄信息是风格,而人脸的身份信息是内容。人脸年龄估计的任务就是根据人脸风格信息估计出不同的年龄。
其中,k∈[1,K]表示人脸观察向量中第k维特征,符号s和c分别标记风格和内容,wijk表示内容与风格的交互作用关系,这里的观测可以看作原始图像。为了使模型更具灵活性,假定交互作用项wijk随着风格变化而变化,设则式(1)变为:
ysc=Asbc (2)
(2f)模型匹配求解:模型匹配的目标是使用训练集去拟合模型使平方误差最小。因此,因子分析模型的目标函数为:
其中,hsc(t)表示指示器,当y(t)属于风格s和内容c时,其值为1,否则为0。收集0-80岁的训练样本,以相差20岁作为分水岭,将年龄风格分为4类。当训练集中每个人在每种风格下包含相同数量的人脸训练样本时,重写式(1)为:
经过SVD变换,风格参数矩阵A为US的前J列(与前J个最大奇异值对应),内容参数矩阵B为VT的前J行。
(2j)基于加性模型的身份因子去除:因子分离的目的是要降低观察样本ysc中受内容信息影响的部分,让同一风格下的内容差异对ysc差异影响最小。从Deep_SRC模型可以看出当到第三层时,已经可以确定测试人脸的年龄分组情况,即因子分析模型中的风格类别As。根据式(1),已知ysc和As可以求出人脸内容bc。设平均风格因子为其中,As是利用训练样本与SVD求解的风格因子。那么可以定义只与人脸内容相关的平均人脸:
优势分析:两因子分析方法由斯坦福大学的Joshua B.Tenenbaum最先提出,随后的多因子分析、张量分解和非线性因子分析方法都是其变种。并已成功应用于手写笔迹、人脸、姿态和步态识别。在实际应用中,一般只知道输入对象的观察,而并不知道其风格与内容信息。往往通过采用最大期望算法(EM)求解近似的风格和内容信息,并进行相应识别任务。然而,EM算法有一定误差,影响了后续的分类任务。由于在Deep_SRC的第三层已经知道了人脸的风格信息(人脸年龄段),因此本发明方法成功避免了EM估计误差问题。
本文提及的词语均为本领域技术人员公知的术语,为便于理解,特对其进行简单定义和解读,如下:
AAM:主动外观模型(AAM,Active Appearance Model)是广泛应用于模式识别领域的一种特征点提取方法。基于AAM的人脸特征定位方法在建立人脸模型过程中,不但考虑局部特征信息,而且综合考虑到全局形状和纹理信息,通过对人脸形状特征和纹理特征进行统计分析,建立人脸混合模型,即为最终对应的AAM模型。
BIF:仿生特征(Bio-inspired Features,BIF)是一种模仿人类观察和判断事物方式的一种纹理特征提取算法,同时它也是一种改进的Gabor特征提取方法。
Gabor:Gabor特征是一种可以用来描述图像纹理信息的特征,Gabor滤波器的频率和方向与人类的视觉***类似,特别适合于纹理表示与判别。Gabor特征主要依靠Gabor核在频率域上对信号进行加窗,从而能描述信号的局部频率信息。
LBP:LBP指局部二值模式,英文全称:Local Binary Pattern,是一种用来描述图像局部特征的算子,LBP特征具有灰度不变性和旋转不变性等显著优点。它是由T.Ojala,M.和D.Harwood在1994年提出,由于LBP特征计算简单、效果较好,因此LBP特征在计算机视觉的许多领域都得到了广泛的应用。
SVR:支持向量加归(SVR)的本质是支持向量机(SVM)原理,只不过SVM主要用于分类问题,而SVR是用于具体值的估计预测问题。
本发明中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (3)
1.一种基于深度稀疏表示的人脸年龄估计方法,其特征在于,本方法包括如下步骤:
A、构建鉴别字典学习模型:
其中,r(Ai,D,Xi)为人脸重构保真项,||X||1为稀疏约束项以保证求解系数的稀疏性,其中,Ai为第i类人脸年龄训练样本,训练样本集A由完备字典D线性组合表示,X为稀疏表示系数矩阵;
f(X)为鉴别约束项,L(Di)=||Di||*为低秩(Low-rank)正定化噪声处理项,λ1,λ2,γ为平衡因子参数;
式(1)字典学习模型的目标函数求解可以通过交替迭代的方法进行求解;
B、根据AAM特征对年龄进行粗估计
首先,利用步骤A介绍的字典学习方法求得的完备字典DAAM对测试人脸y进行稀疏表示求取稀疏表示系数xAAM:
C、根据BIF特征对年龄进行估计
然后,根据式(3)求取ei,并选取前较小的k类别作为下一步骤的字典类别;
D、根据Gabor特征和LBP特征年龄进行估计
E、通过年龄估计模块对年龄自动估计
年龄估计分为模型训练和年龄估计两个阶段
模型训练阶段:将0~80岁的人脸年龄以10岁为间隔分成8组;每组利用支持向量回归(SVR)单独训练一个估计模型,总共得到8个不同的年龄估计器;
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710546450.4A CN107330412B (zh) | 2017-07-06 | 2017-07-06 | 一种基于深度稀疏表示的人脸年龄估计方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710546450.4A CN107330412B (zh) | 2017-07-06 | 2017-07-06 | 一种基于深度稀疏表示的人脸年龄估计方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107330412A CN107330412A (zh) | 2017-11-07 |
CN107330412B true CN107330412B (zh) | 2021-03-26 |
Family
ID=60196191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710546450.4A Active CN107330412B (zh) | 2017-07-06 | 2017-07-06 | 一种基于深度稀疏表示的人脸年龄估计方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107330412B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109255289B (zh) * | 2018-07-27 | 2021-10-26 | 电子科技大学 | 一种基于统一式生成模型的跨衰老人脸识别方法 |
CN109543546B (zh) * | 2018-10-26 | 2022-12-20 | 复旦大学 | 基于深度序分布回归的步态年龄估计方法 |
CN109886099B (zh) * | 2019-01-11 | 2020-11-10 | 西安电子科技大学 | 一种年龄评估评判标准模型的建立方法 |
CN111523367B (zh) * | 2020-01-22 | 2022-07-22 | 湖北科技学院 | 基于人脸属性分析的智能化人脸表情识别方法与*** |
CN111444787B (zh) * | 2020-03-12 | 2023-04-07 | 江西赣鄱云新型智慧城市技术研究有限公司 | 一种性别约束的全智能化人脸表情识别方法及*** |
CN111611877B (zh) * | 2020-04-30 | 2023-05-02 | 杭州电子科技大学 | 基于多时空信息融合的抗年龄干扰的人脸识别方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006323507A (ja) * | 2005-05-17 | 2006-11-30 | Yamaha Motor Co Ltd | 属性識別システムおよび属性識別方法 |
CN101819628A (zh) * | 2010-04-02 | 2010-09-01 | 清华大学 | 结合形状特征的稀疏表示人脸识别方法 |
TW201430722A (zh) * | 2013-01-30 | 2014-08-01 | Nat Univ Tainan | 年齡評估系統與方法 |
WO2015074157A1 (en) * | 2013-11-25 | 2015-05-28 | Ehsan Fazl Ersi | System and method for face recognition |
CN104992151A (zh) * | 2015-06-29 | 2015-10-21 | 华侨大学 | 一种基于tfidf的人脸图像年龄的估计方法 |
CN105069400A (zh) * | 2015-07-16 | 2015-11-18 | 北京工业大学 | 基于栈式稀疏自编码的人脸图像性别识别*** |
CN105550634A (zh) * | 2015-11-18 | 2016-05-04 | 广东微模式软件股份有限公司 | 基于Gabor特征与字典学习的人脸姿态识别方法 |
CN105718898A (zh) * | 2016-01-22 | 2016-06-29 | 东南大学 | 基于稀疏无向概率图模型的人脸年龄估计方法、*** |
CN106022287A (zh) * | 2016-05-27 | 2016-10-12 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于深度学习与字典表示的跨年龄人脸验证方法 |
-
2017
- 2017-07-06 CN CN201710546450.4A patent/CN107330412B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006323507A (ja) * | 2005-05-17 | 2006-11-30 | Yamaha Motor Co Ltd | 属性識別システムおよび属性識別方法 |
CN101819628A (zh) * | 2010-04-02 | 2010-09-01 | 清华大学 | 结合形状特征的稀疏表示人脸识别方法 |
TW201430722A (zh) * | 2013-01-30 | 2014-08-01 | Nat Univ Tainan | 年齡評估系統與方法 |
WO2015074157A1 (en) * | 2013-11-25 | 2015-05-28 | Ehsan Fazl Ersi | System and method for face recognition |
CN104992151A (zh) * | 2015-06-29 | 2015-10-21 | 华侨大学 | 一种基于tfidf的人脸图像年龄的估计方法 |
CN105069400A (zh) * | 2015-07-16 | 2015-11-18 | 北京工业大学 | 基于栈式稀疏自编码的人脸图像性别识别*** |
CN105550634A (zh) * | 2015-11-18 | 2016-05-04 | 广东微模式软件股份有限公司 | 基于Gabor特征与字典学习的人脸姿态识别方法 |
CN105718898A (zh) * | 2016-01-22 | 2016-06-29 | 东南大学 | 基于稀疏无向概率图模型的人脸年龄估计方法、*** |
CN106022287A (zh) * | 2016-05-27 | 2016-10-12 | 广东顺德中山大学卡内基梅隆大学国际联合研究院 | 一种基于深度学习与字典表示的跨年龄人脸验证方法 |
Non-Patent Citations (1)
Title |
---|
《人脸年龄估计算法的设计与实现》;闫陈静;<中国优秀硕士学位论文全文数据库 信息科技辑>;20160715;第I138-975页; * |
Also Published As
Publication number | Publication date |
---|---|
CN107330412A (zh) | 2017-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107330412B (zh) | 一种基于深度稀疏表示的人脸年龄估计方法 | |
CN105975931B (zh) | 一种基于多尺度池化的卷积神经网络人脸识别方法 | |
Rao et al. | Research on a handwritten character recognition algorithm based on an extended nonlinear kernel residual network | |
Wan et al. | Local graph embedding based on maximum margin criterion via fuzzy set | |
Ban et al. | Face detection based on skin color likelihood | |
CN104392231B (zh) | 基于分块与稀疏主特征提取的快速协同显著性检测方法 | |
CN109615008B (zh) | 基于堆叠宽度学习的高光谱图像分类方法和*** | |
CN106529504B (zh) | 一种复合时空特征的双模态视频情感识别方法 | |
CN107273824B (zh) | 基于多尺度多方向局部二值模式的人脸识别方法 | |
Kobayashi et al. | Three-way auto-correlation approach to motion recognition | |
CN113989890A (zh) | 基于多通道融合和轻量级神经网络的人脸表情识别方法 | |
Li et al. | Gray level difference-based transition region extraction and thresholding | |
Kosarevych et al. | Image segmentation based on the evaluation of the tendency of image elements to form clusters with the help of point field characteristics | |
CN107368803A (zh) | 一种基于类别稀疏表示的人脸识别方法及*** | |
CN108710836A (zh) | 一种基于级联特征提取的唇部检测及读取方法 | |
Zhang et al. | Multi-view dimensionality reduction via canonical random correlation analysis | |
CN107045624A (zh) | 一种基于最大加权团的脑电信号预处理与分类方法 | |
Liao | Facial age feature extraction based on deep sparse representation | |
Pratiwi et al. | Personality type assessment system by using enneagram-graphology techniques on digital handwriting | |
CN111127407B (zh) | 一种基于傅里叶变换的风格迁移伪造图像检测装置及方法 | |
CN109460768B (zh) | 一种用于组织病理学显微图像的文本检测与去除方法 | |
CN116821764A (zh) | 一种基于知识蒸馏的多源域适应的eeg情绪状态分类方法 | |
Chen et al. | Attention-aware conditional generative adversarial networks for facial age synthesis | |
Lee et al. | Learning non-homogenous textures and the unlearning problem with application to drusen detection in retinal images | |
Wang et al. | An improved deeplab model for clothing image segmentation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231110 Address after: 437000 Building 5, Nanlin Innovation and Entrepreneurship Industrial Park, Nanlinqiao Town, Tongshan County, Xianning, Hubei Province Patentee after: Hubei Dacheng Medical Technology Co.,Ltd. Address before: No.88 Xianning Avenue, Xian'an District, Xianning City, Hubei Province, 437100 Patentee before: HUBEI University OF SCIENCE AND TECHNOLOGY |
|
TR01 | Transfer of patent right |