CN114267060A - 基于不确定抑制网络模型的人脸年龄识别方法及*** - Google Patents

基于不确定抑制网络模型的人脸年龄识别方法及*** Download PDF

Info

Publication number
CN114267060A
CN114267060A CN202111376110.4A CN202111376110A CN114267060A CN 114267060 A CN114267060 A CN 114267060A CN 202111376110 A CN202111376110 A CN 202111376110A CN 114267060 A CN114267060 A CN 114267060A
Authority
CN
China
Prior art keywords
uncertainty
network model
age
face
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111376110.4A
Other languages
English (en)
Inventor
张利军
徐勇
曹士平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN202111376110.4A priority Critical patent/CN114267060A/zh
Publication of CN114267060A publication Critical patent/CN114267060A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于不确定抑制网络模型的人脸年龄识别方法及***,包括:训练集获取步骤,将含有年龄标签的人脸图像进行预处理,得到带有标签分布的训练图像;模型训练步骤,将训练图像输入不确定性抑制网络模型进行迭代训练,直到不确定性抑制网络模型在验证集上的预测准确度在迭代过程中不再上升,获得训练好的不确定性抑制网络模型的权重文件;年龄预测步骤,使用训练好的不确定性抑制网络模型权重文件对待识别的人脸图像进行识别,得到人脸年龄预测结果。模型使用轻量级Resnet网络作为主干网络进行图像特征提取,使用L‑Net分支网络剔除面部轮廓对年龄预测的影响,同时计算图像本身的不确定性,降低不确定性数据对年龄预测造成的干扰。

Description

基于不确定抑制网络模型的人脸年龄识别方法及***
技术领域
本发明属于人脸属性识别领域,具体涉及一种基于不确定抑制网络模型的人脸年龄识别方法及***。
背景技术
传统方法将人脸年龄估计任务分为特征提取和年龄估计两个阶段,特征提取阶段采用手工设计的特征,稳定性差、鲁棒性不高,对于自然场景下的光照、姿态以及表情变化极为敏感;年龄估计阶段分类、回归模型,对特征的分辨能力较差。近年来,深度神经网络的崛起将计算机视觉领域推向了一个新的发展高度。相关研究表明,卷积神经网络在图像的高层语义特征构建上具有的优势是手工特征所不具备的;此外,这种特征提取能力可以适应不同的视觉场景,拥有较强的泛化能力,人脸年龄估计任务也不例外。
深度学习模型因其庞大的模型权重和计算复杂度,并不利于在实际应用中部署,而MobileNet等轻量级网络在人脸属性识别领域,尤其是年龄估计任务中的表现欠佳,如何在保证模型精度的情况下,有效缩减模型权重和计算复杂度,成为年龄估计任务中的一个热点;此外,人脸年龄由于其标签的特殊性和极大的个体间差异,导致学习过程困难,在实际应用中精度较低,如何避免个体间差异的影响,为每个个体构建其独有的年龄标签分布也是一个难点。
发明内容
本发明针对上述问题,提供了一种基于不确定抑制网络模型的人脸年龄识别方法、***及存储介质,能够有效缩减识别模型权重和计算复杂度的同时,提高人脸年龄精度。
本发明的第一方面,提供了一种基于不确定抑制网络模型的人脸年龄识别方法,包括以下步骤:
训练集获取步骤,将含有年龄标签的人脸图像进行预处理,得到带有标签分布的训练图像;
模型训练步骤,将训练图像输入不确定性抑制网络模型进行迭代训练,直到不确定性抑制网络模型在验证集上的预测准确度在迭代过程中不再上升,获得训练好的不确定性抑制网络模型的权重文件;
年龄预测步骤,使用训练好的不确定性抑制网络模型权重文件对待识别的人脸图像进行识别,得到人脸年龄预测结果;
其中所述不确定性抑制网络模型包括用于图像特征提取的轻量级Resnet网络、基于人脸关键点信息剔除面部轮廓差异的L-Net分支网络,所述模型训练步骤包括:
利用轻量级Resnet网络得到的全局池化特征向量和L-Net分支网络得到的面部轮廓特征向量计算平滑的一阶正则损失函数值Lsa
利用不确定性抑制网络模型得到的预测概率密度分布与标签分布计算KLD损失函数值Lr
利用不确定性抑制网络模型得到的预测结果与真实年龄计算平滑的一阶正则损失函数值La
利用两个平滑的一阶正则损失函数值Ls、La和一个KLD损失函数值Lr进行反向传播更新不确定性抑制网络模型的权重文件。
根据本发明的一些实施例,所述不确定性抑制网络模型还包括基于批注意力机制的图像不确定性评估模块,所述图像不确定评估模块包括用于对每个训练图像进行全局特征转换的全连接层、批量池化层以及归一化层,所述图像不确定评估模块采用了Query-Key匹配机制计算训练图像样本的不确定性得分,所述Query由批量样本中所有训练图像的全局池化特征通过求和平均得到,每个样本都会对应一个Key值向量,通过输入输出维度均为512的全连接层得到,图像不确定性评估模块主要为降低不确定图像在训练过程中给网络带来的干扰,加快网络的收敛速度。
根据本发明的一些实施例,所述将含有年龄标签的人脸图像进行预处理,具体步骤包括:
标签编码,将年龄标签转化为标签分布,具体为预先假设人脸年龄的标签分布符合正态分布,设定正态分布的均值为真实年龄标签,方差为先验,将年龄标签从一个具体数值转化为其对应的标签分布,其有益效果是平滑人脸年龄的变化过程,同时有效学习年龄标签之间的相关性;
数据增强:使用关键点检测工具获取人脸面部的关键点信息以及瞳孔坐标,根据瞳孔坐标进行人脸对齐,其有益效果是能够通过数据增强进行数据扩充,提升模型的鲁棒性。
根据本发明的一些实施例,在模型训练步骤前,先使用在MS-Celeb-1M数据上预训练好的权重文件,加载到轻量级Resnet网络中,并使用Kaiming Normal对L-Net分支网络和图像不确定性评估模块进行权重初始化,其有益效果是能够帮助模型快速收敛,缓解训练数据不充足的问题。
根据本发明的一些实施例,所述轻量级Resnet网络基于Resnet18网络并进行改进,包括:
将输入图像尺寸调整为112*112;
将Resnet18网络中所有残差块重复次数降为1;
将Resnet18网络中所有卷积层的通道个数缩减为原来的1/2。
根据本发明的一些实施例,所述L-Net分支网络由全连接网络和正交分离平面构成,所述L-Net分支网络使用人脸面部的关键点坐标作为输入特征,所述正交分离平面由面部关键点坐标提取的特征向量和轻量级Resnet网络提取的特征向量构成,是两个特征向量之间的点积运算,采用L-Net分支网络的有益效果是能够通过关键点辅助信息构建人脸面部轮廓,进而学习个体间面部轮廓的差异,达到差异化信息剔除的效果。
根据本发明的一些实施例,所述KLD损失函数值计算步骤如下:
第一次迭代计算不确定抑制网络模型的预测概率密度分布与标签分布之间的KLD损失函数值;
记录每次迭代过程中不确定抑制网络模型的预测结果;
从第二次迭代开始,计算不确定抑制网络模型预测概率密度分布与标签分布之间的第一KLD损失函数值、以及计算不确定抑制网络模型预测概率密度分布与前一次迭代时的不确定抑制网络模型预测概率密度分布之间的第二KLD损失函数值,将第一KLD损失函数值和第二KLD损失函数值通过超参数进行平衡。以KLD损失函数为基础,在训练过程中不仅以标签编码后的标签分布为学习目标,同时兼顾模型本身学习到的知识。其有益效果是可以纠正通过先验设定的方差于样本的真实方差之间存在的差异,同时降低年龄标签错误对模型学习方向的干扰。
根据本发明的一些实施例,所述年龄预测步骤具体为:
将不确定性抑制网络模型设定为预测模式,预测模式中L-Net分支网络和图像不确定性评估模块不参与;
加载不确定性抑制网络模型训练完成时得到的权重文件;
将待识别人脸图像输入到加载完成的不确定性抑制网络模型中,得到年龄预测概率密度分布;
通过计算年龄预测概率密度分布的期望值得到不确定性抑制网络模型输出的人脸年龄预测结果。
本发明的第二方面,提供了一种基于不确定抑制网络模型的人脸年龄识别***,包括:
训练集获取模块,用于将含有年龄标签的人脸图像进行预处理,得到带有标签分布的训练图像;
模型训练模块,用于将训练图像输入不确定性抑制网络模型进行迭代训练,直到不确定性抑制网络模型在验证集上的预测准确度在迭代过程中不再上升,获得训练好的不确定性抑制网络模型的权重文件;
年龄预测模块,用于使用训练好的不确定性抑制网络模型权重文件对待识别的人脸图像进行识别,得到人脸年龄预测结果;
其中所述不确定性抑制网络模型包括用于图像特征提取的轻量级Resnet网络、基于人脸关键点信息剔除面部轮廓差异的L-Net分支网络、以及基于批注意力机制的图像不确定性评估模块,所述模型训练模块具体包括:
利用轻量级Resnet网络得到的全局池化特征向量和L-Net分支网络得到的面部轮廓特征向量计算平滑的一阶正则损失函数值Lsa
利用不确定性抑制网络模型得到的预测概率密度分布与标签分布计算KLD损失函数值Lr
利用不确定性抑制网络模型得到的预测结果与真实年龄计算平滑的一阶正则损失函数值La
利用两个平滑的一阶正则损失函数值Ls、La和一个KLD损失函数值Lr进行反向传播更新不确定性抑制网络模型的权重文件。
本发明的第三方面,提供了一种计算机可读存储介质,其上存储有指令,其特征在于,所述指令在被处理器执行时,使得所述处理器执行如上所述的基于不确定抑制网络模型的人脸年龄识别方法。
本发明提供的一种基于不确定抑制网络模型的人脸年龄识别方法、***及存储介质,首先使用带有年龄标签的人脸图像样本数据对基于不确定性抑制网络模型进行训练,然后使用训练完成的网络模型对给待识别的人脸图像进行年龄估计。基于不确定性抑制网络模型采用标签分布作为年龄估计的基本模式,将年龄估计转化为预测其概率密度分布;基于不确定性抑制网络模型使用轻量级ResnNet网络作为主干网络进行图像特征提取,之后使用L-Net分支网络剔除面部轮廓对年龄估计的影响,同时基于批注意力机制的图像不确定性评估模块计算图像本身的不确定性,降低不确定性数据对年龄估计造成的干扰。本发明提出基于批注意力机制的图像的不确定性评估算法,同时为了能够为每个图像学习到其对应的概率密度分布,提出了改进的KLD损失函数进行监督学习。最终达到的有益效果:
1、使用在MS-Celeb-1M训练好的权重文件,将其加载进轻量级Resnet主干网络中,并使用KaimingNormal对L-Net和图像不确定性评估模块进行初始化,有益效果是能够帮助模型快速收敛,缓解训练数据不充足的问题;
2、将年龄标签从一个具体数值转化为其对应的标签分布,其有益效果是平滑人脸年龄的变化过程,同时有效学习年龄标签之间的相关性;
3、使用关键点检测工具获取人脸面部的关键点信息以及瞳孔坐标,根据瞳孔坐标进行人脸对齐,其有益效果是能够通过数据增强进行数据扩充,提升模型的鲁棒性;
4、采用L-Net分支网络的有益效果是能够通过关键点辅助信息构建人脸面部轮廓,进而学习个体间面部轮廓的差异,达到差异化信息剔除的效果;
5、以KLD损失函数为基础,在训练过程中不仅以标签编码后的标签分布为学习目标,同时兼顾模型本身学习到的知识。其有益效果是可以纠正通过先验设定的方差于样本的真实方差之间存在的差异,同时降低年龄标签错误对模型学习方向的干扰。
附图说明
图1为本发明实施例中基于不确定抑制网络模型的人脸年龄识别方法流程示意图;
图2为本发明实施例中基于人脸关键点信息剔除面部轮廓差异的L-Net分支网络结构示意图;
图3为本发明实施例中不确定抑制网络模型训练流程图;
图4为本发明实施例中年龄预测流程图;
图5为本发明实施例中基于不确定抑制网络模型的人脸年龄识别***结构示意图。
具体实施方式
为进一步对本发明的技术方案作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的步骤。
如图1所示,提出了一种基于不确定抑制网络模型的人脸年龄识别方法,包括以下步骤:
S01、训练集获取步骤,将含有年龄标签的人脸图像进行预处理,得到带有标签分布的训练图像;
具体实施过程中,获取预处理后的带有关键点和年龄标注的人脸图像,过程包括:
标签编码,将年龄标签转化为标签分布,具体为预先假设人脸年龄的标签分布符合正态分布,设定正态分布的均值为真实年龄标签,方差为先验,具体实施中方差初始值为3,将年龄标签从一个具体数值转化为其对应的标签分布,后面不确定性抑制网络模型会在训练过程中纠正通过先验设定的方差与真实值之间的差距;其有益效果是平滑人脸年龄的变化过程,同时有效学习年龄标签之间的相关性;
数据增强:使用关键点检测工具获取人脸面部的68个关键点信息以及瞳孔坐标,通过计算瞳孔坐标所在直线与水平线的夹角,进行人脸对齐,其有益效果是能够通过数据增强进行数据扩充,提升模型的鲁棒性。最后面部关键点pnorm使用如下公式进行正则化,其中P代表关键点坐标,pc表示瞳孔间中心点,d表示瞳孔间距离,
Figure BDA0003364010560000061
另外,预处理还包括对人脸图像色彩、亮度调整、图像归一化、随机中心裁剪和等比例缩放。
S02、模型训练步骤,将训练图像输入不确定性抑制网络模型进行迭代训练,直到不确定性抑制网络模型在验证集上的预测准确度在迭代过程中不再上升,获得训练好的不确定性抑制网络模型的权重文件;
具体实施过程中,在模型训练步骤前,先使用在MS-Celeb-1M数据上预训练好的权重文件,加载到轻量级Resnet网络中,并使用Kaiming Normal对L-Net分支网络和图像不确定性评估模块进行权重初始化,其有益效果是能够帮助模型快速收敛,缓解训练数据不充足的问题,同时模型包含了各种场景下的人脸面部特征,可以提升模型的鲁棒性。其中MS-Celeb-1M为微软公开的人脸数据集,Kaiming Normal是一种模型权重初始化方法。
具体地,不确定抑制网络模型结构包含三个部分,用于图像特征提取的轻量级Resnet网络、基于人脸关键点信息剔除面部轮廓差异的L-Net分支网络、以及基于批注意力机制的图像不确定性评估模块。其中轻量级Resnet网络作为主干网络,用于图像特征的提取,轻量级Resnet网络基于Resnet18网络并进行改进,包括将输入图像尺寸调整为112*112;将Resnet18网络中所有残差块重复次数降为1;将Resnet18网络中所有卷积层的通道个数缩减为原来的1/2。轻量级Resnet网络通过卷积层之间的跳层连接,赋予了模型学***面构成,如图2所示,,其中全连接层分为四层,维度分别为136、512、256、512,其中136为68个面部关键点展开的一维向量,中间层为256维度可以有效剔除噪声信息。L-Net分支网络使用人脸面部的68个关键点坐标作为输入特征,将关键点信息根据瞳孔间距离进行归一化。正交分离平面由面部关键点坐标提取的特征向量和轻量级Resnet网络提取的特征向量构成,是两个特征向量之间的点积运算,通过降低两个特征向量之间的相关性,达到从全局特征中剔除面部轮廓信息的作用。采用L-Net分支网络的有益效果是能够通过关键点辅助信息构建人脸面部轮廓,进而学***均得到,每个样本都会对应一个Key值向量,通过输入输出维度均为512的全连接层得到,具体为一个全连接层对批处理中每个图像的全局池化特征进行转化得到Key值,其中全连接层的输入、输出维度均为512维。图像不确定性评估模块主要为降低不确定图像在训练过程中给网络带来的干扰,加快网络的收敛速度。图像不确定评估模块采用了Query、Key匹配机制,用来从一批样本中筛选出图像质量较低、不确定较高的样本,降低其在权重更新过程中的指导作用。图像样本的不确定性得分具体由Query和Key的点积运算经过Sigmoid激活函数得到,用来衡量输入样本对批处理样本的整体分布的偏离程度,得分越接近1表示样本越符合整体分布,而分值趋近于0表示样本不符合整体分布,不确定性较大。
不确定抑制网络模型训练具体步骤如图3所示,其中获取训练图像在网络前向传播之后的预测结果具体过程为:该过程就是网络前向传播计算阶段,根据网络结构的特点,图像首先经过特征提取轻量级Resnet网络,然后会分别送入L-Net分支网络和图像不确定评估模块,与L-Net分支网络中学习到的人面面部轮廓特征进行正交计算;在图像不确定评估模块中通过批注意力机制计算样本与整体分布的偏离程度:具体的,假设X={x1,x2,x3,...,xb}为每次迭代过程中模型的输入训练图像数据;F={f1,f2,f3,...,fb}表示经过特征提取轻量级Resnet网络获取到的人脸图像特征向量;
Figure BDA0003364010560000071
表示所有特征向量的均值;那么对于每个输入图像数据xi,其不确定性由如下公式计算得到:αi=sigmoid(fa·WTfi),其中W是将特征向量fi转换为Key值向量的权重矩阵,fa表示Query向量。此外图像在轻量级Resnet网络的全局池化特征会经过全连接层转化为年龄标签对应的类别个数,并经过softmax函数转化为预测概率密度分布;为计算得到模型的预测年龄,需要计算预测概率密度分布的期望。
如图3所示不确定抑制网络模型训练具体步骤,其中根据真实标签对预测结果进行损失值计算具体过程为:每个图像对应一个真实年龄和一个先验分布。其中真实年龄针对的是年龄标签的编码,假设人脸年龄的标记分布符合正态分布,将每个图像的年龄标签作为正态分布的均值,并通过先验设定方差,具体实施中3作为正态分布的方差,计算标签分布,具体为在i∈[1,100]的年龄区间内,每个年龄都对应一个概率值ρi,具体编码公式如下:
Figure BDA0003364010560000072
其中y为训练图像对应的真实年龄,σ是人为设定的正态分布方差。
损失函数的计算具体过程为:
利用轻量级Resnet网络得到的全局池化特征向量和L-Net分支网络得到的面部轮廓特征向量计算平滑的一阶正则损失函数值;L-Net分支网络最后一个全连接层的输出特征与轻量级Resnet网络中全局池化特征构建正交损失,具体为计算两个521特征的点积,并使用平滑的一阶正则进行损失计算。此正交损失用来从人脸图像全局池化特征中剔除面部轮廓信息,约束两个特征向量之间的相关性。具体地,假设fglobal表示轻量级Resnet网络得到的人脸图像的全局池化特征向量,fshape表示L-Net分支网络最后一个全连接层输出的面部轮廓特征向量,s=fglobal·fshape为两个向量之间的点击运算,损失函数如下:
Figure BDA0003364010560000081
利用不确定性抑制网络模型的预测概率密度分布与标签分布计算KLD损失函数值;预测概率密度分布与年龄标签编码得到的标签分布采用KLD损失函数进行计算,同时模型在第t次迭代过程中,将t-1时刻的预测输出当作学***滑样本的学***衡。以KLD损失函数为基础,在训练过程中不仅以标签编码后的标签分布为学习目标,同时兼顾模型本身学习到的知识。其有益效果是可以纠正通过先验设定的方差于样本的真实方差之间存在的差异,同时降低年龄标签错误对模型学习方向的干扰。KLD损失函数的定义如下:
Figure BDA0003364010560000082
其中η是超参数,用来进行损失函数的平衡,优选设置为0.1,仍由年龄标签编码得到的标签分布作为主导因素,指导网络的学习过程。pt-1表示样本在t-1时刻的预测概率密度分布,pt表示样本在t时刻的预测概率密度分布,p表示样本经过标签编码得到的标签分布,k是具体的年龄标签,pk表示标签k可以作为样本估计年龄的概率。
前向传播过程中,模型的预测年龄y'由其预测概率密度分布的期望计算得出,公式如下:
Figure BDA0003364010560000083
其中K表示年龄标签的类别个数。
最后,采用平滑的一阶正则损失函数进行计算模型的预测年龄y'与真实年龄y的差异。公式如下:
Figure BDA0003364010560000091
总损失值由上述两个平滑的一阶正则损失函数值Ls、La和一个KLD损失函数值Lr求和得到,考虑到损失函数的大小,以及任务的重要性平衡关系,轻量级Resnet网络得到的全局池化特征向量和L-Net分支网络得到的面部轮廓特征向量计算平滑的一阶正则损失函数值Ls权重设置为0.5,其他两项La、Lr设置为1。在得到的求和损失值的基础上乘上图像不确定性评估模块计算得到的不确定性评分αi,得到最终的损失函数值。
Figure BDA0003364010560000092
其中N是训练图像样本数量。
如图3所示不确定抑制网络模型训练具体步骤,其中使用反向传播算法进行权重的更新要涉及反向传播算法,通过将两个平滑的一阶正则损失函数值和一个KLD损失函数值进行反向传播更新不确定性抑制网络模型的权重文件。具体过程为:将上述计算得到的总损失函数值,根据链式法则逐层传递,直至输入层为止,在传递过程中更新模型的权重参数。通过多次迭代来逼近全局最优解,每次迭代涉及将全部训练样本分为多个批次进行前向传播和梯度更新。
如图3所示不确定抑制网络模型训练具体步骤,其中验证集精度计算,验证集上的精度计算在每次迭代结束之后进行,即完成全部训练样本的一次前向传播和梯度更新之后,将验证集数据同样划分为多个批次,进行前向传播,而不进行梯度更新,计算在模型在验证集上的预测结果,并采用平均绝对误差、累计精度作为验证集上的衡量指标。公式定义如下:
Figure BDA0003364010560000093
其中y为真实年龄标签,N为训练样本数量,N{E≤3}表示年龄预测误差在3岁以内的训练样本数量,MAE为平均绝对误差,CAE为累计精度。
当模型在验证集上的平均绝对误差MAE和累计精度CAE不再提高时,结束训练,得到最终的模型权重文件。至此,训练过程完成。
S03、年龄预测步骤,使用训练好的不确定性抑制网络模型权重文件对待识别的人脸图像进行识别,得到人脸年龄预测结果;
具体地,年龄预测步骤如图4所示,具体为:
将不确定性抑制网络模型设定为预测模式,预测模式中L-Net分支网络和图像不确定性评估模块不参与;
加载不确定性抑制网络模型训练完成时得到的权重文件;
将待识别人脸图像输入到加载完成的不确定性抑制网络模型中,对图像进行前向传播并得到年龄预测概率密度分布,此处将图像尺寸缩放到112*112,此外不需要进行其他变换操作,在预测过程中不需要年龄关键点作为辅助信息。
通过计算年龄预测概率密度分布的期望值得到不确定性抑制网络模型输出的人脸年龄预测结果。
以下,参照图5来描述根据本公开实施例的与图1所示的方法对应的***,一种基于不确定抑制网络模型的人脸年龄识别***,所述***100包括:训练集获取模块101,用于将含有年龄标签的人脸图像进行预处理,得到带有标签分布的训练图像;模型训练模块102,用于将训练图像输入不确定性抑制网络模型进行迭代训练,直到不确定性抑制网络模型在验证集上的预测准确度在迭代过程中不再上升,获得训练好的不确定性抑制网络模型的权重文件;年龄预测模块103,用于使用训练好的不确定性抑制网络模型权重文件对待识别的人脸图像进行识别,得到人脸年龄预测结果;其中所述不确定性抑制网络模型包括用于图像特征提取的轻量级Resnet网络、基于人脸关键点信息剔除面部轮廓差异的L-Net分支网络、以及基于批注意力机制的图像不确定性评估模块,所述模型训练模块102具体包括:利用轻量级Resnet网络得到的全局池化特征向量和L-Net分支网络得到的面部轮廓特征向量计算平滑的一阶正则损失函数值;利用不确定性抑制网络模型得到的预测概率密度分布与标签分布计算KLD损失函数值;利用不确定性抑制网络模型得到的预测结果与真实年龄计算平滑的一阶正则损失函数值;通过将两个平滑的一阶正则损失函数值和一个KLD损失函数值进行反向传播更新不确定性抑制网络模型的权重文件。除了这上述模块以外,***100还可以包括其他部件,然而,由于这些部件与本公开实施例的内容无关,因此在这里省略其图示和描述。
本发明实施例也可以被实现为计算机可读存储介质。根据实施例的计算机可读存储介质上存储有计算机可读指令。当所述计算机可读指令由处理器运行时,可以执行参照以上附图描述的根据本发明实施例的基于不确定抑制网络模型的人脸年龄识别方法。
综上所述,本发明提供的一种基于不确定抑制网络模型的人脸年龄识别方法、***及存储介质,首先使用带有年龄标签的人脸图像样本数据对基于不确定性抑制网络模型进行训练,然后使用训练完成的网络模型对给待识别的人脸图像进行年龄估计。基于不确定性抑制网络模型采用标签分布作为年龄估计的基本模式,将年龄估计转化为预测其概率密度分布;基于不确定性抑制网络模型使用轻量级ResnNet网络作为主干网络进行图像特征提取,之后使用L-Net分支网络剔除面部轮廓对年龄估计的影响,同时基于图像不确定性评估模块计算图像本身的不确定性,降低不确定性数据对年龄估计造成的干扰。本发明提出基于批注意力机制的图像的不确定性评估算法,同时为了能够为每个图像学***滑人脸年龄的变化过程,同时有效学习年龄标签之间的相关性;使用关键点检测工具获取人脸面部的关键点信息以及瞳孔坐标,根据瞳孔坐标进行人脸对齐,其有益效果是能够通过数据增强进行数据扩充,提升模型的鲁棒性;采用L-Net分支网络的有益效果是能够通过关键点辅助信息构建人脸面部轮廓,进而学习个体间面部轮廓的差异,达到差异化信息剔除的效果;以KLD损失函数为基础,在训练过程中不仅以标签编码后的标签分布为学习目标,同时兼顾模型本身学习到的知识。其有益效果是可以纠正通过先验设定的方差于样本的真实方差之间存在的差异,同时降低年龄标签错误对模型学习方向的干扰。
在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的步骤、方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种步骤、方法所固有的要素。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种基于不确定抑制网络模型的人脸年龄识别方法,其特征在于,包括以下步骤:
训练集获取步骤,将含有年龄标签的人脸图像进行预处理,得到带有标签分布的训练图像;
模型训练步骤,将训练图像输入不确定性抑制网络模型进行迭代训练,直到不确定性抑制网络模型在验证集上的预测准确度在迭代过程中不再上升,获得训练好的不确定性抑制网络模型的权重文件;
年龄预测步骤,使用训练好的不确定性抑制网络模型权重文件对待识别的人脸图像进行识别,得到人脸年龄预测结果;
其中所述不确定性抑制网络模型包括用于图像特征提取的轻量级Resnet网络、基于人脸关键点信息剔除面部轮廓差异的L-Net分支网络,所述模型训练步骤包括:
利用轻量级Resnet网络得到的全局池化特征向量和L-Net分支网络得到的面部轮廓特征向量计算平滑的一阶正则损失函数值Lsa
利用不确定性抑制网络模型得到的预测概率密度分布与标签分布计算KLD损失函数值Lr
利用不确定性抑制网络模型得到的预测结果与真实年龄计算平滑的一阶正则损失函数值La
利用两个平滑的一阶正则损失函数值Ls、La和一个KLD损失函数值Lr进行反向传播更新不确定性抑制网络模型的权重文件。
2.根据权利要求1所述的一种基于不确定抑制网络模型的人脸年龄识别方法,其特征在于,所述不确定性抑制网络模型还包括基于批注意力机制的图像不确定性评估模块,所述图像不确定评估模块包括用于对每个训练图像进行全局特征转换的全连接层、批量池化层以及归一化层,所述图像不确定评估模块采用了Query-Key匹配机制计算训练图像样本的不确定性得分,所述Query由批量样本中所有训练图像的全局池化特征通过求和平均得到,每个样本都会对应一个Key值向量,通过输入输出维度均为512的全连接层得到。
3.根据权利要求1所述的一种基于不确定抑制网络模型的人脸年龄识别方法,其特征在于,所述将含有年龄标签的人脸图像进行预处理,具体步骤包括:
标签编码,将年龄标签转化为标签分布,具体为预先假设人脸年龄的标签分布符合正态分布,设定正态分布的均值为真实年龄标签,方差为先验,将年龄标签从一个具体数值转化为其对应的标签分布;
数据增强:使用关键点检测工具获取人脸面部的关键点信息以及瞳孔坐标,根据瞳孔坐标进行人脸对齐。
4.根据权利要求2所述的一种基于不确定抑制网络模型的人脸年龄识别方法,其特征在于,在模型训练步骤前,先使用在MS-Celeb-1M数据上预训练好的权重文件,加载到轻量级Resnet网络中,并使用Kaiming Normal对L-Net分支网络和图像不确定性评估模块进行权重初始化。
5.根据权利要求1所述的一种基于不确定抑制网络模型的人脸年龄识别方法,其特征在于,所述轻量级Resnet网络基于Resnet18网络并进行改进,包括:
将输入图像尺寸调整为112*112;
将Resnet18网络中所有残差块重复次数降为1;
将Resnet18网络中所有卷积层的通道个数缩减为原来的1/2。
6.根据权利要求1所述的一种基于不确定抑制网络模型的人脸年龄识别方法,其特征在于,所述L-Net分支网络由全连接网络和正交分离平面构成,所述L-Net分支网络使用人脸面部的关键点坐标作为输入特征,所述正交分离平面由面部关键点坐标提取的特征向量和轻量级Resnet网络提取的特征向量构成,是两个特征向量之间的点积运算。
7.根据权利要求1所述的一种基于不确定抑制网络模型的人脸年龄识别方法,其特征在于,所述KLD损失函数值计算步骤如下:
第一次迭代计算不确定抑制网络模型的预测概率密度分布与标签分布之间的KLD损失函数值;
记录每次迭代过程中不确定抑制网络模型的预测结果;
从第二次迭代开始,计算不确定抑制网络模型预测概率密度分布与标签分布之间的第一KLD损失函数值、以及计算不确定抑制网络模型预测概率密度分布与前一次迭代时的不确定抑制网络模型预测概率密度分布之间的第二KLD损失函数值,将第一KLD损失函数值和第二KLD损失函数值通过超参数进行平衡。
8.根据权利要求2所述的一种基于不确定抑制网络模型的人脸年龄识别方法,其特征在于,所述年龄预测步骤具体为:
将不确定性抑制网络模型设定为预测模式,预测模式中L-Net分支网络和图像不确定性评估模块不参与;
加载不确定性抑制网络模型训练完成时得到的权重文件;
将待识别人脸图像输入到加载完成的不确定性抑制网络模型中,得到年龄预测概率密度分布;
通过计算年龄预测概率密度分布的期望值得到不确定性抑制网络模型输出的人脸年龄预测结果。
9.一种基于不确定抑制网络模型的人脸年龄识别***,其特征在于,包括:
训练集获取模块,用于将含有年龄标签的人脸图像进行预处理,得到带有标签分布的训练图像;
模型训练模块,用于将训练图像输入不确定性抑制网络模型进行迭代训练,直到不确定性抑制网络模型在验证集上的预测准确度在迭代过程中不再上升,获得训练好的不确定性抑制网络模型的权重文件;
年龄预测模块,用于使用训练好的不确定性抑制网络模型权重文件对待识别的人脸图像进行识别,得到人脸年龄预测结果;
其中所述不确定性抑制网络模型包括用于图像特征提取的轻量级Resnet网络、基于人脸关键点信息剔除面部轮廓差异的L-Net分支网络,所述模型训练模块具体包括:
利用轻量级Resnet网络得到的全局池化特征向量和L-Net分支网络得到的面部轮廓特征向量计算平滑的一阶正则损失函数值Lsa
利用不确定性抑制网络模型得到的预测概率密度分布与标签分布计算KLD损失函数值Lr
利用不确定性抑制网络模型得到的预测结果与真实年龄计算平滑的一阶正则损失函数值La
利用两个平滑的一阶正则损失函数值Ls、La和一个KLD损失函数值Lr进行反向传播更新不确定性抑制网络模型的权重文件。
10.一种计算机可读存储介质,其上存储有指令,其特征在于,所述指令在被处理器执行时,使得所述处理器执行如权利要求1-8中任一项所述的方法。
CN202111376110.4A 2021-11-19 2021-11-19 基于不确定抑制网络模型的人脸年龄识别方法及*** Pending CN114267060A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111376110.4A CN114267060A (zh) 2021-11-19 2021-11-19 基于不确定抑制网络模型的人脸年龄识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111376110.4A CN114267060A (zh) 2021-11-19 2021-11-19 基于不确定抑制网络模型的人脸年龄识别方法及***

Publications (1)

Publication Number Publication Date
CN114267060A true CN114267060A (zh) 2022-04-01

Family

ID=80825272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111376110.4A Pending CN114267060A (zh) 2021-11-19 2021-11-19 基于不确定抑制网络模型的人脸年龄识别方法及***

Country Status (1)

Country Link
CN (1) CN114267060A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115359546A (zh) * 2022-10-21 2022-11-18 乐山师范学院 基于面部识别的人类年龄识别方法及***
CN117523548A (zh) * 2024-01-04 2024-02-06 青岛臻图信息技术有限公司 基于神经网络的三维模型对象提取和识别方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115359546A (zh) * 2022-10-21 2022-11-18 乐山师范学院 基于面部识别的人类年龄识别方法及***
CN117523548A (zh) * 2024-01-04 2024-02-06 青岛臻图信息技术有限公司 基于神经网络的三维模型对象提取和识别方法
CN117523548B (zh) * 2024-01-04 2024-03-26 青岛臻图信息技术有限公司 基于神经网络的三维模型对象提取和识别方法

Similar Documents

Publication Publication Date Title
CN109919108B (zh) 基于深度哈希辅助网络的遥感图像快速目标检测方法
CN108182427B (zh) 一种基于深度学习模型和迁移学习的人脸识别方法
CN109359608B (zh) 一种基于深度学习模型的人脸识别方法
CN114492574A (zh) 基于高斯均匀混合模型的伪标签损失无监督对抗域适应图片分类方法
CN112085055B (zh) 一种基于迁移模型雅克比阵特征向量扰动的黑盒攻击方法
CN114267060A (zh) 基于不确定抑制网络模型的人脸年龄识别方法及***
CN112818850B (zh) 基于渐进式神经网络和注意力机制的跨姿态人脸识别方法和***
CN112434655A (zh) 一种基于自适应置信度图卷积网络的步态识别方法
CN113076927B (zh) 基于多源域迁移的指静脉识别方法及***
CN109829414B (zh) 一种基于标签不确定性和人体组件模型的行人再识别方法
CN112084895A (zh) 一种基于深度学习的行人重识别方法
CN114882534B (zh) 基于反事实注意力学习的行人再识别方法、***、介质
CN115147632A (zh) 基于密度峰值聚类算法的图像类别自动标注方法及装置
CN114118303B (zh) 基于先验约束的人脸关键点检测方法及装置
CN111160161B (zh) 一种基于噪声剔除的自步学习人脸年龄估计方法
CN110427804B (zh) 一种基于二次迁移学习的虹膜身份验证方法
CN116524538A (zh) 一种基于多尺度深度特征匹配的域泛化行人重识别方法
CN112784800B (zh) 一种基于神经网络和形状约束的人脸关键点检测方法
CN116012942A (zh) 手语教学方法、装置、设备及存储介质
CN115100694A (zh) 一种基于自监督神经网络的指纹快速检索方法
CN114973350A (zh) 一种源域数据无关的跨域人脸表情识别方法
CN114299543A (zh) 一种无监督行人重识别方法
CN114821632A (zh) 一种遮挡行人重识别方法
CN113963235A (zh) 一种跨类别图像识别模型重用方法和***
CN114445649A (zh) 用多尺度超像素融合检测rgb-d单幅图像阴影的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination