CN112183326A - 人脸年龄识别模型训练方法及相关装置 - Google Patents

人脸年龄识别模型训练方法及相关装置 Download PDF

Info

Publication number
CN112183326A
CN112183326A CN202011033875.3A CN202011033875A CN112183326A CN 112183326 A CN112183326 A CN 112183326A CN 202011033875 A CN202011033875 A CN 202011033875A CN 112183326 A CN112183326 A CN 112183326A
Authority
CN
China
Prior art keywords
age
value
label
face image
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011033875.3A
Other languages
English (en)
Inventor
陈仿雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shuliantianxia Intelligent Technology Co Ltd
Original Assignee
Shenzhen Shuliantianxia Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shuliantianxia Intelligent Technology Co Ltd filed Critical Shenzhen Shuliantianxia Intelligent Technology Co Ltd
Priority to CN202011033875.3A priority Critical patent/CN112183326A/zh
Publication of CN112183326A publication Critical patent/CN112183326A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Probability & Statistics with Applications (AREA)
  • Medical Informatics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本申请公开了一种人脸年龄识别模型训练方法及相关装置。其中方法包括:获取样本数据集,所述样本数据集包括多个样本人脸图像,每个所述样本人脸图像标注有对应的年龄值标签和年龄差值标签,所述年龄值标签指示所述样本人脸图像中人脸的实际年龄值,所述年龄差值标签用于指示与所述实际年龄值的偏差范围;基于所述样本人脸图像、所述样本人脸图像的所述年龄值标签和所述年龄差值标签,对网络模型进行训练,获得年龄识别模型,该年龄识别模型能提升对人脸图像年龄识别的准确度。

Description

人脸年龄识别模型训练方法及相关装置
技术领域
本发明涉及计算机视觉技术领域,尤其是涉及一种人脸年龄识别模型训练方法及相关装置。
背景技术
人脸图像往往包含很多人脸特征信息,其中年龄作为一项很重要的特征信息,在人脸识别领域得了广泛的应用。
一般在对人脸图像的年龄识别问题中,常将年龄作为一个标签信息,在模型训练过程,建立一个人脸图像与其年龄的对应关系。而不同人在相同的年龄阶段,存在一些相似的特征,通常的人脸年龄识别算法在实际应用中对人脸年龄的识别准确度较低。
发明内容
本申请提供了一种人脸年龄识别模型训练方法及相关装置。
第一方面,提供了一种人脸年龄识别模型训练方法,包括:
获取样本数据集,所述样本数据集包括多个样本人脸图像,每个所述样本人脸图像标注有对应的年龄值标签和年龄差值标签,所述年龄值标签指示所述样本人脸图像中人脸的实际年龄值,所述年龄差值标签用于指示与所述实际年龄值的偏差范围;
基于所述样本人脸图像、所述样本人脸图像的所述年龄值标签和所述年龄差值标签,对网络模型进行训练,获得年龄识别模型。
第二方面,提供了一种人脸年龄识别模型训练装置,包括:
获取模块,用于获取样本数据集,所述样本数据集包括多个样本人脸图像,每个所述样本人脸图像标注有对应的年龄值标签和年龄差值标签,所述年龄值标签指示所述样本人脸图像中人脸的实际年龄值,所述年龄差值标签用于指示与所述实际年龄值的偏差范围;
训练模块,用于基于所述样本人脸图像、所述样本人脸图像的所述年龄值标签和所述年龄差值标签,对网络模型进行训练,获得年龄识别模型。
第三方面,提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如上述第一方面及其任一种可能的实现方式的步骤。
本申请实施例通过获取样本数据集,上述样本数据集包括多个样本人脸图像,每个上述样本人脸图像标注有对应的年龄值标签和年龄差值标签,上述年龄值标签指示上述样本人脸图像中人脸的实际年龄值,上述年龄差值标签用于指示与上述实际年龄值的偏差范围,再基于上述样本人脸图像、上述样本人脸图像的上述年龄值标签和上述年龄差值标签,对网络模型进行训练,获得年龄识别模型,可以利用年龄差值弱化年龄标签,通过年龄值标签与年龄差值标签之间的相互约束,使得网络模型更好地学习相近年龄值的人脸特征信息,构建多层次损失函数,进行模型训练。并可以在应用中根据预测的年龄值以及可接受的年龄差值,综合评判年龄识别结果,使得年龄识别结果的范围更加接近真实年龄值,从而提升对人脸图像的年龄识别的准确度。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1为本申请实施例提供的一种人脸年龄识别模型训练方法的流程示意图;
图2为本申请实施例提供的一种人脸年龄识别模型训练方法的流程示意图;
图3为本申请实施例提供的一种网络模型的结构示意图;
图4为本申请实施例提供的一种人脸年龄识别模型训练装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例中涉及的神经网络(Neural Networks,NN)是由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络***,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习***。神经网络具有大规模并行、分布式存储和处理、自组织、自适应和自学能力,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。
卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks),是深度学习(deeplearning)的代表算法之一。
下面结合本申请实施例中的附图对本申请实施例进行描述。
请参阅图1,图1是本申请实施例提供的一种人脸年龄识别模型训练方法的流程示意图。该方法可包括:
101、获取样本数据集,上述样本数据集包括多个样本人脸图像,每个上述样本人脸图像标注有对应的年龄值标签和年龄差值标签,上述年龄值标签指示上述样本人脸图像中人脸的实际年龄值,上述年龄差值标签用于指示与上述实际年龄值的偏差范围。
本申请实施例的执行主体可以为一种人脸年龄识别模型训练装置,可以为电子设备,具体实现中,上述电子设备可以为一种终端,也可称为终端设备,包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便携式设备。还应当理解的是,在某些实施例中,上述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
具体的,可以先构建样本数据集。上述样本数据集可以包括不同年龄的样本人脸图像、具体可以设置所选样本人脸图像的预设年龄范围,即样本人脸图像的年龄分布在预设年龄范围内,比如可设置为1-100岁,可尽量使样本数据集包含该预设年龄范围内的各个年龄的样本人脸图像。本申请实施例中将人脸的实际年龄作为模型训练的标签,同时还标注每一张样本人脸图像的年龄差值,即年龄预测可接受的年龄偏差范围值,比如当一张样本人脸图像的年龄值标签为36,年龄差值标签在正负2岁以内,则该样本人脸图像的年龄标签范围在[34,38]之间。其中,不同年龄值对应的年龄差值可以不同,可以根据实际情况调整各个年龄值对应的年龄差值的范围。本申请实施例中年龄差值的设置规则可以分不同年龄阶段设置不同的年龄差值,比如,对于10-19的年龄阶段,其中每个年龄对应的年龄差值标签是1,对于30-39的年龄阶段,其中每个年龄对应的年龄差值标签是2,是基于不同年龄阶段中人脸的变化程度准则来设置的年龄差值,因为在人的不同时期,人脸特征的变化程度是不同的,在青少年时期可能因为发育较快,人脸特征变化相对中年时期会更大,因此可以设置相对更小的年龄差值。设置相同年龄差值可能导致预测结果偏大或偏小,针对不同的年龄阶段设置不同的年龄差值,考虑了人在不同年龄阶段的人脸变化大小,以便在利用这些标签进行训练后能更准确地预测人脸年龄,对不同年龄阶段的人脸的年龄预测具有针对性。可以根据需要设置年龄差值最大不超过预设阈值,比如正负4岁,以防止年龄差值过大,对于一个年龄涵盖太多其他年龄的特征,造成模型学习的不准确性。
102、基于上述样本人脸图像、上述样本人脸图像的上述年龄值标签和上述年龄差值标签,对网络模型进行训练,获得年龄识别模型。
为了使模型能够更好的学习相近年龄值之间的相似特征信息,在模型训练阶段,利用上述年龄值标签和上述年龄差值标签,弱化单一年龄值的标签,并构建多层次的损失函数来训练网络模型。
在一种可选的实施方式中,上述网络模型可以是预先构建的深度网络模型。
本申请实施例中可以对样本人脸图像进行预处理,使样本人脸图像为预设图像大小。进一步可选的,可以构建深度网络模型,比如,针对输入图像的大小224*224*3,表示RGB色彩模式下的图像大小,其中224*224表示图像的像素尺寸(长*宽)。
网络模型主要采用卷积核3*3大小,步长设置为2,激活函数设置为Relu,经过多层的卷积运算,获得7*7大小的特征图像,然后再经过由全连接层构成的多层输出结构,构成年龄识别的深度网络模型。
本申请实施例的网络模型中特征提取的网络结构不受限制,可以根据实际需要进行替换,比如采用Mobilenet结构、Inception结构等。
在一种可选的实施方式中,上述步骤103可包括:
21、根据上述每个样本人脸图像的上述年龄值标签和上述年龄差值标签,生成上述每个样本人脸图像对应的年龄标签向量;
22、根据上述每个样本人脸图像的上述年龄值标签、上述年龄差值标签以及上述年龄标签向量,对网络模型进行训练,获得上述年龄识别模型。
本申请实施例中,可以对每个样本人脸图像的年龄值标签和上述年龄差值标签进行整合,以将标签信息表示为对应的向量形式,即上述年龄标签向量,并在模型训练中使用。
具体的,上述根据上述每个样本人脸图像的上述年龄值标签和上述年龄差值标签,生成上述每个样本人脸图像对应的年龄标签向量,包括:
根据上述每个样本人脸图像的上述年龄值标签和上述年龄差值标签,确定上述每个样本人脸图像对应的多个目标年龄值;
再根据上述多个目标年龄值生成上述每个样本人脸图像对应的年龄标签向量,上述年龄标签向量包括预设年龄范围内的每个年龄值的向量值,其中上述预设年龄范围内的上述多个目标年龄值对应的向量值大于其他年龄值对应的向量值。
可选的,可以利用独热编码的方式构建年龄标签向量。独热编码即One-Hot编码,又称一位有效编码,其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。
根据上述每个样本人脸图像的年龄值标签和年龄差值标签,可以确定每个样本人脸图像对应的多个目标年龄值,比如,当一张样本人脸图像的年龄值标签为36,年龄差值标签在正负2岁以内,则该样本人脸图像的年龄标签范围在[34,38]之间,即对应的目标年龄值包括34、35、36、37、38。可以用向量的形式表示目标年龄值,在生成年龄标签向量时,目标年龄值对应位置与其他位置的向量值区别标注,以体现有效的年龄值。比如上述目标年龄值包括34、35、36、37、38,对应的年龄标签向量可表示为[0,…,0,1,1,1,1,1,0,…,0],其中假设预设年龄范围设置为1-100,则该年龄标签向量中的第34、35、36、37、38位向量值记为1,其他位向量值记为0。
还可以设置其他方式根据年龄值标签和年龄差值标签生成对应的年龄标签向量表示,本申请实施例对此不做限制。
进一步地,上述步骤22具体可包括:
将上述样本人脸图像输入上述网络模型,输出上述样本人脸图像的预测分类结果;
采用损失函数计算上述各个样本人脸图像的预测分类结果与标签数据之间的总损失值;根据上述总损失值调整上述网络模型的网络参数,直到上述网络模型收敛,获得上述年龄识别模型,上述标签数据包括上述样本人脸图像的上述年龄值标签、上述年龄差值标签以及上述年龄标签向量。
在生成样本人脸图像的年龄标签向量之后,可以使用上述样本人脸图像训练网络模型,在训练过程中采用损失函数计算各个样本人脸图像的预测分类结果与标签数据之间的总损失值,并根据总损失值调整网络模型的网络参数,直到网络模型收敛,其中,损失函数可以计算包括年龄值标签、年龄差值标签以及年龄标签向量三个层次的损失值。
进一步可选的,该方法还包括:
23、获取待识别人脸图像;
24、采用上述年龄识别模型对所述待识别人脸图像进行处理,获得上述待识别人脸图像的年龄预测结果。
其中,上述步骤可以在步骤102之后执行,通过前述步骤101和步骤102可以获得训练好的年龄识别模型,再应用于上述处理步骤。即训练后获得的模型也可以在其他设备中执行上述处理步骤,此处不做限制。
上述待识别人脸图像可以是拍摄的包含人脸的图像。可以先对获取的图像进行裁剪等预处理,获得标准化的待识别人脸图像,以识别其中的人脸年龄。实际应用中,可以根据预测的年龄值以及可接受的年龄差值,综合评判待识别人脸图像的年龄识别结果。
本申请实施例通过获取样本数据集,上述样本数据集包括多个样本人脸图像,每个上述样本人脸图像标注有对应的年龄值标签和年龄差值标签,上述年龄值标签指示上述样本人脸图像中人脸的实际年龄值,上述年龄差值标签用于指示与上述实际年龄值的偏差范围,再基于上述样本人脸图像、上述样本人脸图像的上述年龄值标签和上述年龄差值标签,对网络模型进行训练,获得年龄识别模型,可以利用年龄差值弱化年龄标签,通过年龄值标签与年龄差值标签之间的相互约束,使得网络模型更好地学习相近年龄值的人脸特征信息,构建多层次损失函数,进行模型训练。并可以在应用中根据预测的年龄值以及可接受的年龄差值,综合评判年龄识别结果,使得年龄识别结果的范围更加接近真实年龄值,从而提升对人脸图像年龄识别的准确度。
请参阅图2,图2是本申请实施例提供的另一种人脸年龄识别模型训练方法的流程示意图。如图2所示,该方法可具体包括:
201、获取样本数据集,上述样本数据集包括多个样本人脸图像,每个上述样本人脸图像标注有对应的年龄值标签和年龄差值标签,上述年龄值标签指示上述样本人脸图像中人脸的实际年龄值,上述年龄差值标签用于指示与上述实际年龄值的偏差范围。
202、根据上述每个样本人脸图像的上述年龄值标签和上述年龄差值标签,生成上述每个样本人脸图像对应的年龄标签向量。
其中,上述步骤201和步骤202可以分别参考图1所示实施例中步骤101和步骤202中步骤21相关的具体描述,此处不再赘述。上述步骤202可以在训练阶段中由网络模型执行,也可以在模型训练阶段之前执行。
203、将上述样本人脸图像输入上述网络模型,输出上述样本人脸图像的预测分类结果,上述样本人脸图像的预测分类结果包括上述样本人脸图像的预测年龄值、预测年龄向量和预测年龄差值。
在训练阶段,网络模型可以对样本人脸图像进行处理,预测各个样本人脸图像对应的年龄值、年龄向量和年龄差值。其中上述预测年龄向量包括模型预测的每个年龄值对应的概率值,而预测年龄值可以理解为其中概率值最大的一个年龄值。
204、计算上述各个样本图像的预测年龄向量和上述年龄标签向量的第一损失值,计算上述各个样本图像的预测年龄值和上述年龄值标签的第二损失值,计算上述各个样本图像的预测年龄差值和上述年龄差值标签的第三损失值,将上述第一损失值、上述第二损失值和上述第三损失值相加获得上述总损失值。
具体的,为了使模型能够更好的学习相近年龄值之间的相似特征信息,在模型训练阶段,可利用上述年龄标签向量,弱化单一年龄值的标签,构建了多层次损失函数。本申请实施例中网络模型的损失函数可以由三部分构成,第一部分的第一损失值是年龄标签向量损失值L1,此部分则采用K-L距离函数,第二部分的第二损失值是年龄回归损失值L2,第三部分的第三损失值是年龄差值损失值L3。
在一种可选的实施方式中,损失函数的计算方式具体如下:
Figure BDA0002704593160000081
其中,上述n表示上述预设年龄范围内的最大值,上述Pi表示上述年龄标签向量中的第i个年龄的向量值,Qi表示预测年龄向量,即模型预测的每个年龄值对应的概率值;y表示年龄值标签指示的实际年龄值,f表示模型输出的预测年龄值,ycha表示年龄差值标签指示的年龄差值,fcha表示模型输出的预测年龄差值。
205、根据上述总损失值调整上述网络模型的网络参数,直到上述网络模型收敛,获得年龄识别模型,上述标签数据包括上述样本人脸图像的上述年龄值标签、上述年龄差值标签以及上述年龄标签向量。
可以重复执行上述步骤203和步骤204,直到网络模型收敛,训练结束,可以获得训练好的年龄识别模型。
本申请实施例中可以根据需要选择不同的算法来优化模型参数,包括设置迭代次数、学习率等训练参数,本申请实施例对此不做限制。
在一种可选的实施方式中,为了使得整个模型训练的损失值最小,可采用Adam算法优化模型参数,举例来讲,可以将迭代次数设置为500次,初始化学习率设置为0.001,权重衰减设置为0.0005,每100次迭代,学习率衰减为原来的1/10,以进行网络模型的训练。以上仅为一种示例,实际训练参数可以有其他设置,本申请实施例对此不做限制。
在一种可选的实施方式中,请参见图3,图3是本申请实施例提供的一种网络模型的结构示意图,如图3所示构建年龄预测的深度网络结构,本结构中主要采用卷积核、激活函数、以及全连接层,其中圆圈部分表示全连接层的结点,仅作一种示意。
本申请实施例中可以获取预设图像大小的样本人脸图像;将上述样本人脸图像输入深度网络结构,在上述深度网络结构的卷积层中进行特征提取,获得样本人脸图像对应的特征图。上述卷积层的卷积核3*3大小,步长为2,激活函数设置为Relu。
比如,首先针对输入图像的大小设置为224*224*3,可以通过采用卷积核3*3大小,步长设置为2,激活函数设置为Relu,不断提取不同尺度的特征图,从而提取出由浅层特征到深层次的语义特征,最终获得7*7大小的特征图。其中对于特征提取部分并不做限制,可以采用提取已有的结构进行替换。
在获得上述样本人脸图像对应的特征图之后,再将样本人脸图像对应的特征图输入全连接层处理,获得上述特征图对应的特征结构;再根据上述特征图对应的特征结构,计算并输出样本人脸图像的预测分类结果。该预测分类结果可包括预测年龄值、预测年龄差值和预测年龄向量三部分。其中上述预测年龄向量包括预测的各个年龄值对应的概率值。
具体的,在获得最后7*7大小的特征图之后,采用全连接层,将特征图7*7大小的转为1*1*1024特征结构;再通过全连接层,转为1*1*n特征结构。此时为了满足构建多层次损失函数,模型将分成三个部分进行输出,上层部分输出预测年龄值,此部分只有单个值,比如33岁;中层部分输出预测年龄差值,也是单个值,比如-1岁或者1岁,则表示图像中人脸的年龄在32-34之间,都是可以接受的,在这个范围内都表示预测准确。因此下层部分则是输出预测年龄向量,包括预测的各个年龄值对应的概率值,向量大小为n,即具体为
[0,0,0,…,0.3,0.4,0.3,…,0]。在图3中Qi表示预测年龄向量,即模型预测的每个年龄值对应的概率值;f表示模型输出的预测年龄值,fcha表示模型输出的预测年龄差值。
以上结构设置仅为一种示例,实际可以根据需要构建不同的网络模型的结构,以及可以调整不同的网络参数,本申请实施例对此不作限制。
可选的,在获得上述年龄识别模型之后,可以使用该年龄识别模型对人脸图像进行年龄识别,如图1所示实施例中步骤23和步骤24中的描述,此处不再赘述。
进一步可选的,上述步骤24包括:
采用上述年龄识别模型对上述待识别人脸图像进行处理,获得上述待识别人脸图像的预测年龄值和预测年龄差值;
判断上述预测年龄差值的绝对值是否大于差值阈值;
若不大于,上述年龄预测结果为上述预测年龄值;若大于,上述年龄预测结果为上述预测年龄值与上述预测年龄差值的和。
在年龄识别应用场景中,可以预先设置上述差值阈值,比如4(岁),可以采用上述年龄识别模型对待识别人脸图像进行处理,获得上述待识别人脸图像的年龄预测结果。具体的,将待识别人脸图像输入训练好的年龄识别模型,在卷积层进行特征提取获得特征图,再经过全连接层处理,可以获得待识别人脸图像的预测年龄向量,包括该待识别人脸图像对应于各个年龄值的概率,并可以将其中概率最大的一个年龄值确定为上述预测年龄值输出,最后可以输出上述预测年龄值和预测年龄差值。当预测年龄差值在差值阈值以内时,则输出该预测年龄值,当预测年龄差值大于差值阈值时,则将预测年龄值加上预测年龄差值的结果,作为最终输出的年龄值,即年龄预测结果。
本申请实施例中,在标注样本人脸图像的年龄时,增加可接受的年龄差值标签,弱化单一的年龄值标签,从而降低相近年龄之间明确分界影响,在模型训练过程中受限于预测年龄值和预测年龄差值之间的约束关系,使得年龄的识别结果的范围更加接近真实值,而相比一般方案对人脸年龄识别结果波动较大、准确度不高,本申请可以提升人脸年龄识别的准确度。
基于上述人脸年龄识别模型训练方法实施例的描述,本申请实施例还公开了一种人脸年龄识别模型训练装置。请参见图4,人脸年龄识别模型训练装置400包括:
获取模块410,用于获取样本数据集,上述样本数据集包括多个样本人脸图像,每个上述样本人脸图像标注有对应的年龄值标签和年龄差值标签,上述年龄值标签指示上述样本人脸图像中人脸的实际年龄值,上述年龄差值标签用于指示与上述实际年龄值的偏差范围;
训练模块420,用于基于上述样本人脸图像、上述样本人脸图像的上述年龄值标签和上述年龄差值标签,对网络模型进行训练,获得年龄识别模型。
可选地,所述获取模块410还用于,获取待识别人脸图像;
所述训练模块420还用于,采用所述年龄识别模型对所述待识别人脸图像进行处理,获得所述待识别人脸图像的年龄预测结果。
根据本申请的一个实施例,图1和图2所示的方法所涉及的各个步骤均可以是由图4所示的人脸年龄识别模型训练装置400中的各个模块执行的,此处不再赘述。
本申请实施例中的人脸年龄识别模型训练装置400,可以通过获取样本数据集,上述样本数据集包括多个样本人脸图像,每个上述样本人脸图像标注有对应的年龄值标签和年龄差值标签,上述年龄值标签指示上述样本人脸图像中人脸的实际年龄值,上述年龄差值标签用于指示与上述实际年龄值的偏差范围,再基于上述样本人脸图像、上述样本人脸图像的上述年龄值标签和上述年龄差值标签,对网络模型进行训练,获得年龄识别模型,可以利用年龄差值弱化年龄标签,通过年龄值标签与年龄差值标签之间的相互约束,使得网络模型更好地学习相近年龄值的人脸特征信息,构建多层次损失函数,进行模型训练。并可以在应用中根据预测的年龄值以及可接受的年龄差值,综合评判年龄识别结果,使得年龄识别结果的范围更加接近真实年龄值,从而提升年龄识别的准确度。
本申请实施例还提供了一种计算机存储介质(Memory),上述计算机存储介质是电子设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括电子设备中的内置存储介质,当然也可以包括电子设备所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了电子设备的操作***。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或多条的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器;可选的还可以是至少一个位于远离前述处理器的计算机存储介质。
在一个实施例中,可由处理器加载并执行计算机存储介质中存放的一条或多条指令,以实现上述实施例中的相应步骤;具体实现中,计算机存储介质中的一条或多条指令可以由处理器加载并执行图1和/或图2中方法的任意步骤,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。例如,该模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个模块或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。所显示或讨论的相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。该计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。该计算机指令可以存储在计算机可读存储介质中,或者通过该计算机可读存储介质进行传输。该计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。该计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是只读存储器(read-onlymemory,ROM),或随机存储存储器(random access memory,RAM),或磁性介质,例如,软盘、硬盘、磁带、磁碟、或光介质,例如,数字通用光盘(digital versatile disc,DVD)、或者半导体介质,例如,固态硬盘(solid state disk,SSD)等。

Claims (10)

1.一种人脸年龄识别模型训练方法,其特征在于,包括:
获取样本数据集,所述样本数据集包括多个样本人脸图像,每个所述样本人脸图像标注有对应的年龄值标签和年龄差值标签,所述年龄值标签指示所述样本人脸图像中人脸的实际年龄值,所述年龄差值标签用于指示与所述实际年龄值的偏差范围;
基于所述样本人脸图像、所述样本人脸图像的所述年龄值标签和所述年龄差值标签,对网络模型进行训练,获得年龄识别模型。
2.根据权利要求1所述的人脸年龄识别模型训练方法,其特征在于,所述基于所述样本人脸图像、所述样本人脸图像的所述年龄值标签和所述年龄差值标签,对网络模型进行训练,获得年龄识别模型,包括:
根据所述每个样本人脸图像的所述年龄值标签和所述年龄差值标签,生成所述每个样本人脸图像对应的年龄标签向量;
根据所述每个样本人脸图像的所述年龄值标签、所述年龄差值标签以及所述年龄标签向量,对网络模型进行训练,获得所述年龄识别模型。
3.根据权利要求2所述的人脸年龄识别模型训练方法,其特征在于,所述根据所述每个样本人脸图像的所述年龄值标签和所述年龄差值标签,生成所述每个样本人脸图像对应的年龄标签向量,包括:
根据所述每个样本人脸图像的所述年龄值标签和所述年龄差值标签,确定所述每个样本人脸图像对应的多个目标年龄值;
根据所述多个目标年龄值生成所述每个样本人脸图像对应的年龄标签向量,所述年龄标签向量包括预设年龄范围内的每个年龄值的向量值,其中所述预设年龄范围内的所述多个目标年龄值对应的向量值大于其他年龄值对应的向量值。
4.根据权利要求2或3所述的人脸年龄识别模型训练方法,其特征在于,所述根据所述每个样本人脸图像的所述年龄值标签、所述年龄差值标签以及所述年龄标签向量,对网络模型进行训练,获得所述年龄识别模型,包括:
将所述样本人脸图像输入所述网络模型,输出所述样本人脸图像的预测分类结果;
采用损失函数计算所述各个样本人脸图像的预测分类结果与标签数据之间的总损失值;根据所述总损失值调整所述网络模型的网络参数,直到所述网络模型收敛,获得所述年龄识别模型,所述标签数据包括所述样本人脸图像的所述年龄值标签、所述年龄差值标签以及所述年龄标签向量。
5.根据权利要求4所述的人脸年龄识别模型训练方法,其特征在于,所述样本人脸图像的预测分类结果包括所述样本人脸图像的预测年龄值、预测年龄向量和预测年龄差值;
所述采用损失函数计算所述各个样本人脸图像的预测分类结果与标签数据之间的总损失值,包括:
计算所述各个样本图像的预测年龄向量和所述年龄标签向量的第一损失值;计算所述各个样本图像的预测年龄值和所述年龄值标签的第二损失值;计算所述各个样本图像的预测年龄差值和所述年龄差值标签的第三损失值;
将所述第一损失值、所述第二损失值和所述第三损失值相加获得所述总损失值。
6.根据权利要求1-5任一项所述的人脸年龄识别模型训练方法,其特征在于,所述方法还包括:
获取待识别人脸图像;
采用所述年龄识别模型对所述待识别人脸图像进行处理,获得所述待识别人脸图像的年龄预测结果。
7.根据权利要求6所述的人脸年龄识别模型训练方法,其特征在于,所述采用所述年龄识别模型对所述待识别人脸图像进行处理,获得所述待识别人脸图像的年龄预测结果,包括:
采用所述年龄识别模型对所述待识别人脸图像进行处理,获得所述待识别人脸图像的预测年龄值和预测年龄差值;
判断所述预测年龄差值的绝对值是否大于差值阈值;
若不大于,所述年龄预测结果为所述预测年龄值;若大于,所述年龄预测结果为所述预测年龄值与所述预测年龄差值的和。
8.一种人脸年龄识别模型训练装置,其特征在于,包括:
获取模块,用于获取样本数据集,所述样本数据集包括多个样本人脸图像,每个所述样本人脸图像标注有对应的年龄值标签和年龄差值标签,所述年龄值标签指示所述样本人脸图像中人脸的实际年龄值,所述年龄差值标签用于指示与所述实际年龄值的偏差范围;
训练模块,用于基于所述样本人脸图像、所述样本人脸图像的所述年龄值标签和所述年龄差值标签,对网络模型进行训练,获得年龄识别模型。
9.根据权利要求8所述的装置,其特征在于,
所述获取模块还用于,获取待识别人脸图像;
所述训练模块还用于,采用所述年龄识别模型对所述待识别人脸图像进行处理,获得所述待识别人脸图像的年龄预测结果。
10.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述的人脸年龄识别模型训练方法的步骤。
CN202011033875.3A 2020-09-27 2020-09-27 人脸年龄识别模型训练方法及相关装置 Pending CN112183326A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011033875.3A CN112183326A (zh) 2020-09-27 2020-09-27 人脸年龄识别模型训练方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011033875.3A CN112183326A (zh) 2020-09-27 2020-09-27 人脸年龄识别模型训练方法及相关装置

Publications (1)

Publication Number Publication Date
CN112183326A true CN112183326A (zh) 2021-01-05

Family

ID=73944291

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011033875.3A Pending CN112183326A (zh) 2020-09-27 2020-09-27 人脸年龄识别模型训练方法及相关装置

Country Status (1)

Country Link
CN (1) CN112183326A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906525A (zh) * 2021-02-05 2021-06-04 广州市百果园信息技术有限公司 年龄识别方法、装置及电子设备
CN113065525A (zh) * 2021-04-27 2021-07-02 深圳数联天下智能科技有限公司 年龄识别模型训练方法、人脸年龄识别方法及相关装置
CN113076833A (zh) * 2021-03-25 2021-07-06 深圳数联天下智能科技有限公司 年龄识别模型的训练方法、人脸年龄识别方法及相关装置
CN113221645A (zh) * 2021-04-07 2021-08-06 深圳数联天下智能科技有限公司 目标模型训练方法、人脸图像生成方法以及相关装置
CN114998978A (zh) * 2022-07-29 2022-09-02 杭州魔点科技有限公司 一种人脸图像质量分析的方法和***

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906525A (zh) * 2021-02-05 2021-06-04 广州市百果园信息技术有限公司 年龄识别方法、装置及电子设备
CN113076833A (zh) * 2021-03-25 2021-07-06 深圳数联天下智能科技有限公司 年龄识别模型的训练方法、人脸年龄识别方法及相关装置
CN113076833B (zh) * 2021-03-25 2024-05-31 深圳数联天下智能科技有限公司 年龄识别模型的训练方法、人脸年龄识别方法及相关装置
CN113221645A (zh) * 2021-04-07 2021-08-06 深圳数联天下智能科技有限公司 目标模型训练方法、人脸图像生成方法以及相关装置
CN113221645B (zh) * 2021-04-07 2023-12-12 深圳数联天下智能科技有限公司 目标模型训练方法、人脸图像生成方法以及相关装置
CN113065525A (zh) * 2021-04-27 2021-07-02 深圳数联天下智能科技有限公司 年龄识别模型训练方法、人脸年龄识别方法及相关装置
CN113065525B (zh) * 2021-04-27 2023-12-12 深圳数联天下智能科技有限公司 年龄识别模型训练方法、人脸年龄识别方法及相关装置
CN114998978A (zh) * 2022-07-29 2022-09-02 杭州魔点科技有限公司 一种人脸图像质量分析的方法和***

Similar Documents

Publication Publication Date Title
CN112183326A (zh) 人脸年龄识别模型训练方法及相关装置
US11694109B2 (en) Data processing apparatus for accessing shared memory in processing structured data for modifying a parameter vector data structure
CN108171260B (zh) 一种图片识别方法及***
CN112634170B (zh) 一种模糊图像修正的方法、装置、计算机设备及存储介质
CN110378438A (zh) 标签容错下的图像分割模型的训练方法、装置及相关设备
CN114494784A (zh) 深度学习模型的训练方法、图像处理方法和对象识别方法
CN111178537B (zh) 一种特征提取模型训练方法及设备
CN111581926A (zh) 文案生成方法、装置、设备和计算机可读存储介质
CN115082920A (zh) 深度学习模型的训练方法、图像处理方法和装置
CN113537192B (zh) 图像检测方法、装置、电子设备及存储介质
CN112650885A (zh) 视频分类方法、装置、设备和介质
CN113065525A (zh) 年龄识别模型训练方法、人脸年龄识别方法及相关装置
CN113837836A (zh) 模型推荐方法、装置、设备及存储介质
CN114118526A (zh) 一种企业风险预测方法、装置、设备及存储介质
CN112183603A (zh) 痘痘类型识别模型训练方法及相关装置
CN116451081A (zh) 数据漂移的检测方法、装置、终端及存储介质
CN114255381B (zh) 图像识别模型的训练方法、图像识别方法、装置及介质
CN114241411B (zh) 基于目标检测的计数模型处理方法、装置及计算机设备
CN114971375A (zh) 基于人工智能的考核数据处理方法、装置、设备及介质
CN112749978B (zh) 检测方法、装置、设备、存储介质以及程序产品
CN115516490A (zh) 基于机器学习的股票趋势分析方法、装置
CN114707638A (zh) 模型训练、对象识别方法及装置、设备、介质和产品
CN112200028A (zh) 人脸识别设备
CN114117037A (zh) 意图识别方法、装置、设备和存储介质
CN111898626A (zh) 模型确定方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination