CN111046786A - 年龄估计神经网络的生成方法、装置以及电子设备 - Google Patents

年龄估计神经网络的生成方法、装置以及电子设备 Download PDF

Info

Publication number
CN111046786A
CN111046786A CN201911256144.2A CN201911256144A CN111046786A CN 111046786 A CN111046786 A CN 111046786A CN 201911256144 A CN201911256144 A CN 201911256144A CN 111046786 A CN111046786 A CN 111046786A
Authority
CN
China
Prior art keywords
age
data set
neural network
accumulated
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911256144.2A
Other languages
English (en)
Inventor
苏驰
李凯
刘弘也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Original Assignee
Beijing Kingsoft Cloud Network Technology Co Ltd
Beijing Kingsoft Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Kingsoft Cloud Network Technology Co Ltd, Beijing Kingsoft Cloud Technology Co Ltd filed Critical Beijing Kingsoft Cloud Network Technology Co Ltd
Priority to CN201911256144.2A priority Critical patent/CN111046786A/zh
Publication of CN111046786A publication Critical patent/CN111046786A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种年龄估计神经网络的生成方法、装置以及电子设备,涉及神经网络的技术领域,包括:获取初始数据集;所述初始数据集包括多个人脸图像,以及每个所述人脸图像的标注年龄;根据每个所述人脸图像的标注年龄生成累积监督信号,并形成最终数据集;所述最终数据集包括多个人脸图像、每个所述人脸图像的标注年龄,以及每个所述人脸图像的累积监督信号;利用所述最终数据集对初始神经网络进行训练,获得年龄估计神经网络,解决了年龄估计数据集经常会存在年龄分布不均衡的情况从而增加年龄估计神经网络训练难度的技术问题。

Description

年龄估计神经网络的生成方法、装置以及电子设备
技术领域
本申请涉及神经网络技术领域,尤其是涉及一种年龄估计神经网络的生成方法、装置以及电子设备。
背景技术
年龄作为一种重要的人脸属性,在人机交互、智能商务、安全监控等领域有着广阔的应用前景。人脸年龄估计是指采用计算机视觉等技术根据输入的人脸图像自动估计出其真实的年龄。人脸年龄估计作为一种重要的生物特征识别技术,目前已经在模式识别和计算机视觉领域内广泛应用。
目前,需要应用训练好的神经网络进行人脸年龄估计。但是,对于神经网络的训练过程,收集到的作为训练样本的年龄估计数据集经常会存在年龄分布不均衡的问题,从而增加了对年龄估计神经网络的训练难度。
发明内容
本发明的目的在于提供一种年龄估计神经网络的生成方法、装置以及电子设备,以解决年龄估计数据集经常会存在年龄分布不均衡的情况从而增加年龄估计神经网络训练难度的技术问题。
第一方面,本申请实施例提供了一种年龄估计神经网络的生成方法,包括:
获取初始数据集;所述初始数据集包括多个人脸图像,以及每个所述人脸图像的标注年龄;
根据每个所述人脸图像的标注年龄生成累积监督信号,并形成最终数据集;所述最终数据集包括多个人脸图像、每个所述人脸图像的标注年龄,以及每个所述人脸图像的累积监督信号;
利用所述最终数据集对初始神经网络进行训练,获得年龄估计神经网络。
在一个可能的实现中,获取初始数据集的步骤,包括:
获取人脸图像数据集
Figure BDA0002307142140000021
其中,N为人脸图像的数量,Xi为第i个人脸图像;
获取每个所述人脸图像的标注数据,并根据所述标注数据得到初始数据集
Figure BDA0002307142140000022
其中yi为第i个人脸图像的标注年龄。
在一个可能的实现中,获取每个所述人脸图像的标注数据,并根据所述标注数据得到初始数据集
Figure BDA0002307142140000023
的步骤,包括:
获取n个人分别对人脸图像Xi进行标注的标注结果
Figure BDA0002307142140000024
其中,
Figure BDA0002307142140000025
为整数;
Figure BDA0002307142140000026
的平均值yi作为Xi的标注年龄,得到初始数据集
Figure BDA0002307142140000027
Figure BDA0002307142140000028
在一个可能的实现中,根据每个所述人脸图像的标注年龄生成累积监督信号,并形成最终数据集的步骤,包括:
对所述初始数据集D1中的每一个样本(Xi,yi),根据标注年龄yi生成Xi的累积监督信号ci∈Rp;其中,ci为维度为p的向量,R为ci的维度,R代表实数,Rp表示维度为p的所有实数向量,p为预设的标注年龄的最大值;
形成最终数据集
Figure BDA0002307142140000029
在一个可能的实现中,根据标注年龄yi生成Xi的累积监督信号ci∈Rp的步骤,包括:
根据以下算式生成累积监督信号ci∈R101
Figure BDA0002307142140000031
其中,
Figure BDA0002307142140000032
为ci的第k维的值。
在一个可能的实现中,利用所述最终数据集对初始神经网络进行训练,获得年龄估计神经网络的步骤,包括:
对所述最终数据集D2中的每一个样本(Xi,yi,ci),将Xi输入初始神经网络,输出累计监督向量
Figure BDA0002307142140000033
和预测年龄
Figure BDA0002307142140000034
根据
Figure BDA0002307142140000035
Figure BDA0002307142140000036
计算损失函数,获得年龄估计神经网络。
在一个可能的实现中,将Xi输入初始神经网络,输出累计监督向量
Figure BDA0002307142140000037
和预测年龄
Figure BDA0002307142140000038
均步骤,包括:
将Xi输入初始神经网络,对Xi进行特征提取,获得特征图;
对所述特征图进行全局平均池化操作,全局特征fi
将所述全局特征fi输入累计隐含层,输出是大小为p的累计监督向量
Figure BDA0002307142140000039
将所述累计监督向量
Figure BDA00023071421400000310
输入全连接层,输出预测年龄
Figure BDA00023071421400000311
在一个可能的实现中,根据
Figure BDA00023071421400000312
Figure BDA00023071421400000313
计算损失函数,获得年龄估计神经网络的步骤,包括:
利用以下算式计算损失函数Li
Figure BDA00023071421400000314
通过反向传播算法求Li对所有参数W的导数
Figure BDA00023071421400000315
通过随机梯度下降算法更新权重。
第二方面,提供了一种年龄估计神经网络的生成装置,包括:
获取模块,用于获取初始数据集;所述初始数据集包括多个人脸图像,以及每个所述人脸图像的标注年龄;
生成模块,用于根据每个所述人脸图像的标注年龄生成累积监督信号,并形成最终数据集;所述最终数据集包括多个人脸图像、每个所述人脸图像的标注年龄,以及每个所述人脸图像的累积监督信号;
训练模块,用于利用所述最终数据集对初始神经网络进行训练,获得年龄估计神经网络。
第三方面,本申请实施例又提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的第一方面所述方法。
第四方面,本申请实施例又提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述的第一方面方法。
本申请实施例带来了以下有益效果:
本申请实施例提供的一种年龄估计神经网络的生成方法、装置以及电子设备,能够获取包括多个人脸图像和每个人脸图像标注年龄的初始数据集,然后根据每个人脸图像的标注年龄生成累积监督信号,并形成包括了多个人脸图像、每个人脸图像的标注年龄及每个人脸图像的累积监督信号的最终数据集,再利用该最终数据集对初始神经网络进行训练,从而获得年龄估计神经网络,通过累积监督信号对初始神经网络进行监督训练,由于年龄越相近其所对应的累积监督信号也越相似,在某年龄所对应的样本数量较少的情况下,通过该累积监督信号使始神经网络能够从该年龄的领域样本中进行学习,从而解决年龄分布不均衡从而增加年龄估计神经网络训练难度的问题。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的年龄估计神经网络的生成方法的流程示意图;
图2为本申请实施例提供的年龄估计神经网络的生成方法的另一流程示意图;
图3为本申请实施例提供的年龄估计神经网络的生成装置的结构示意图;
图4为示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
目前,在人脸年龄估计过程中,需要面对不同年龄的样本分布不均衡的问题。具体来说,由于涉及到个人隐私,收集带有年龄标签的人脸样本是非常困难、昂贵且耗时的,这导致收集到的年龄估计数据集大都存在年龄分布不均衡的问题,这大大增加了年龄估计算法的训练难度。
现有的传统人脸年龄估计方法缺乏人脸的高层语义信息,因此一般精度较低。而且,现有的深度人脸年龄估计算法大都直接在年龄分布不均衡的数据集上进行训练,这使得模型训练比较困难,进而导致得到的模型在样本较少的年龄上性能较差。再者,现有的传统人脸年龄估计算法一般首先人工提取人脸特征(如主动外观特征、人体测量学特征、生物启发特征等),然后训练一个人脸特征到年龄的回归器。这种方法缺乏人脸的高层语义信息,因此精度一般也较差。
基于此,本申请实施例提供了一种年龄估计神经网络的生成方法、装置以及电子设备。通过该方法可以解决年龄估计数据集经常会存在年龄分布不均衡的情况从而增加年龄估计神经网络训练难度的技术问题。
下面结合附图对本发明实施例进行进一步地介绍。
图1为本申请实施例提供的一种年龄估计神经网络的生成方法的流程示意图。如图1所示,该方法包括:
S110,获取初始数据集。
本步骤中,初始数据集包括多个人脸图像,以及每个人脸图像的标注年龄。例如,本步骤中的初始数据集可以为经过人工标注后的人脸年龄估计数据集D1。
S120,根据每个人脸图像的标注年龄生成累积监督信号,并形成最终数据集。
本步骤中,最终数据集包括多个人脸图像、每个人脸图像的标注年龄,以及每个人脸图像的累积监督信号。例如,本步骤中的最终数据集可以为上述数据集D1中的每一个样本生成对应的累积监督信号后所形成新的数据集D2。再例如,还可以设置一个累积隐含层,以便后续通过该层的累积信号进行监督训练。
S130,利用最终数据集对初始神经网络进行训练,获得年龄估计神经网络。
本步骤中,初始神经网络可以为各种深度学习模型架构。例如,可以设置初始人脸年龄估计模型的网络架构,利用上述数据集D2对该初始人脸年龄估计模型进行训练,直到收敛,得到最终的人脸年龄估计模型。
本实申请施例提供的年龄估计神经网络的生成方法可以作为一种基于累积监督信号的深度人脸年龄估计模型生成方法,利用最终生成的年龄估计神经网络,能够基于人脸图像自动输出该人脸所对应的年龄信息。而且,通过本申请实施例提供的方法,可以自动学习与年龄有关的人脸图像多层级语义特征,这种深度学习的方法可以考虑人脸的高层语义信息,使人脸识别的精度较高。
对于现有技术而言,已有的基于深度学习的人脸年龄估计算法大都直接训练一个卷积神经网络建立输入人脸和年龄的映射。
本实施例中,通过累积信号进行神经网络的监督训练,该累积监督信号能够使年龄越相近的样本,其所对应的累积信号也越相似。如果某年龄所对应的样本数量较少,通过该累积信号使神经网络可以从该年龄的领域样本中隐式地进行学习,从而能够大大缓解年龄分布不均衡的问题,使得模型对所有年龄的测试样本精度普遍比较高。
因此,为了缓解年龄估计问题中样本分布不均衡的问题,本申请实施例提供了一种基于累积监督信号的深度人脸年龄估计算法。具体来讲,设置一个累积隐含层,该层通过一个累积信号进行监督训练。该累积监督信号有一个非常好的性质:年龄越相近的样本,其所对应的累积信号也越相似。如果某年龄所对应的样本数量较少,通过该累积信号的帮助,网络可以从该年龄的领域样本中隐式地进行学习,因此可以大大缓解年龄分布不均衡的问题。
下面对上述步骤进行详细介绍。
在一些实施例中,上述步骤S110可以包括如下步骤:
步骤a,获取人脸图像数据集
Figure BDA0002307142140000081
其中,N为人脸图像的数量,Xi为第i个人脸图像。
步骤b,获取每个人脸图像的标注数据,并根据标注数据得到初始数据集
Figure BDA0002307142140000082
其中yi为第i个人脸图像的标注年龄。
在实际应用中,一共收集到了N张人脸图像,其中,第i张人脸图像用Xi表示,从而得到人脸图像数据
Figure BDA0002307142140000083
基于每个人脸图像上标注的年龄数据yi,能够得到初始数据集
Figure BDA0002307142140000084
通过获取人脸图像数据集
Figure BDA0002307142140000085
以及获取人脸图像数据集中的每个人脸图像的标注年龄yi,能够得到初始数据集
Figure BDA0002307142140000086
从而使初始数据集中的人脸图像和其标注年龄之间能够对应,以保证初始数据集的数据全面性以及数据准确性。
在一些实施例中,上述步骤b可以包括如下步骤:
步骤b1,获取n个人分别对人脸图像Xi进行标注的标注结果
Figure BDA0002307142140000087
步骤b2,取
Figure BDA0002307142140000088
的平均值yi作为Xi的标注年龄,得到初始数据集
Figure BDA0002307142140000089
对于上述步骤b1,其中,
Figure BDA00023071421400000810
为整数。需要说明的是,
Figure BDA00023071421400000811
的上限不一定为100,只要保证
Figure BDA00023071421400000812
与后续ci的维度相同即可。例如,也许样本中最大的年龄标注结果只有90岁、85岁等都可以。
对于上述步骤b2中的平均值yi,需要对其取整,例如,通过向上取整、向下取整、四舍五入取整等方法取平均值yi的整数。
示例性的,对每一张人脸图像Xi,可以通过n个人分别对其年龄进行标注,得到n个标注结果
Figure BDA0002307142140000091
每一个标注结果
Figure BDA0002307142140000092
是0到100之间的整数,分别代表0到100岁。取
Figure BDA0002307142140000093
的平均yi作为Xi最终的标注结果,即:
Figure BDA0002307142140000094
从而得到标注过的人脸年龄数据集
Figure BDA0002307142140000095
本实施例中,通过取多种不同年龄标注结果的平均值的方式,从而得到包含这种年龄标注结果的初始数据集,使得到的初始数据集中的年龄标注内容更加精确,以保证整体的初始数据集的数据准确性。
在一些实施例中,上述步骤S120可以包括如下步骤:
步骤c,对初始数据集D1中的每一个样本(Xi,yi),根据标注年龄yi生成Xi的累积监督信号ci∈Rp
步骤d,形成最终数据集
Figure BDA0002307142140000096
对于上述步骤c,其中,ci为维度为p的向量,R为ci的维度,p为预设的标注年龄的最大值。
对于上述步骤c,示例性的,对D1中的每一个样本(Xi,yi),依据年龄标签yi生成Xi累积监督信号ci∈R101,其中,ci可以是一个101维度的向量,代表0到100岁共101个不同的年龄。
需要说明的是,年龄越相近,人脸的外观也越相似。相同的,累积监督信号也具有这样的性质:年龄越相近,其所对应的累积信号也越相似,例如,相较于40岁的人脸C,10岁的人脸A和12岁的人脸B更相似。
对于累积监督信号,A和B所对应的累积监督信号有两个维度的值不同,A和C所对应的累积监督信号有三十个维度的值不同。因此,相较于人脸C,人脸A所对应的累积监督信号和B的更相似,这与其面部表观之间的相似关系是一致的。
由于即使某年龄所对应的样本数量较少,通过该累积信号网络也可以从该年龄的领域样本中隐式的进行学习,以为数据集D1中的每一个样本生成对应的累积监督信号从而形成新的最终数据集D2。因此,通过本申请实施例提供的累积监督信号,能够有助于缓解年龄估计数据集中的样本分布不均衡的问题。
在一些实施例中,上述步骤c可以包括如下步骤:
步骤c1,根据以下算式生成累积监督信号ci∈R101
Figure BDA0002307142140000101
其中,
Figure BDA0002307142140000102
为ci的第k维的值。也可以理解为,ci的第k维
Figure BDA0002307142140000103
定义如下:
Figure BDA0002307142140000104
本实施例中,通过在k≤yi时使ci的第k维的值为1,在k>yi时使ci的第k维的值为0,以生成累积监督信号ci∈R101,使累积监督信号的数据值能够考虑到多方面情况,使最终得到的积监督信号更加精确。
在一些实施例中,如图2所示,上述步骤S130可以包括如下步骤:
步骤e,对最终数据集D2中的每一个样本(Xi,yi,ci),将Xi输入初始神经网络,输出累计监督向量
Figure BDA0002307142140000105
和预测年龄
Figure BDA0002307142140000106
步骤f,根据
Figure BDA0002307142140000107
Figure BDA0002307142140000108
计算损失函数,获得年龄估计神经网络。
其中,初始神经网络可以为任意的深度学习模型架构。例如,可以设置初始人脸年龄估计模型的网络架构,即初始神经网络。输入至初始神经网络的为224x224的图像Xi,即将数据集D2的一个样本Xi输入至该初始神经网络,得到两个输出,分别为
Figure BDA0002307142140000109
Figure BDA00023071421400001010
因此,通过不断迭代的对该初始神经网络的参数进行更新,直到收敛,以得到最终的人脸年龄估计模型,即年龄估计神经网络,以使年龄估计神经网络中的参数更加精确。
在一些实施例中,上述步骤e可以包括如下步骤:
步骤e1,将Xi输入初始神经网络,对Xi进行特征提取,获得特征图。
步骤e2,对特征图进行全局平均池化操作,全局特征fi
步骤e3,将全局特征fi输入累计隐含层,输出是大小为p的累计监督向量
Figure BDA0002307142140000111
步骤e4,将累计监督向量
Figure BDA0002307142140000112
输入全连接层,输出预测年龄
Figure BDA0002307142140000113
示例性的,初始神经网络可以由四部分组成:特征提取部分、全局平均池化层、累积隐含层以及输出层。
其中,特征提取部分是由一系列的卷积、批归一化以及激活函数组成。全局平均池化层用于将特征提取部分得到的特征进行全局平均池化操作,从而得到输入图像Xi的全局特征fi。累积隐含层作为一个全连接层,输入为图像的全局特征fi,输出是大小为101的向量
Figure BDA0002307142140000114
输出层也可以作为一个全连接层,输入为向量
Figure BDA0002307142140000115
输出是大小为1的标量
Figure BDA0002307142140000116
其中,
Figure BDA0002307142140000117
代表Xi的预测年龄。
通过特征提取、全局平均池化操作、将全局特征输入至累计隐含层、将累计监督向量输入全连接层等一系列的数据处理过程,能够使最终输出的预测年龄更加精确,以保证预测年龄结果的准确性。
在一些实施例中,上述步骤f可以包括如下步骤:
步骤f1,利用以下算式计算损失函数Li
Figure BDA0002307142140000118
步骤f2,通过反向传播算法求Li对所有参数W的导数
Figure BDA0002307142140000119
步骤f3,通过随机梯度下降算法更新权重。
需要说明的是,
Figure BDA00023071421400001110
代表标量
Figure BDA00023071421400001111
的绝对值,
Figure BDA00023071421400001112
代表向量
Figure BDA00023071421400001113
的1范数。通过反向传播算法求Li对Net所有参数W的导数
Figure BDA00023071421400001114
接下来,通过随机梯度下降算法更新Net的权重,即
Figure BDA00023071421400001115
其中,α代表学习率。
本实施例中,如图2所示,通过公式计算损失函数、通过反向传播算法确定导数、再通过随机梯度下降算法更新权重,以不断迭代的对初始神经网络的参数进行精确的更新,直到准确的收敛,最终得到数据更加精确的人脸年龄估计模型。
图3提供了一种年龄估计神经网络的生成装置的结构示意图。如图3所示,年龄估计神经网络的生成装置300包括:
获取模块301,用于获取初始数据集;初始数据集包括多个人脸图像,以及每个人脸图像的标注年龄;
生成模块302,用于根据每个人脸图像的标注年龄生成累积监督信号,并形成最终数据集;最终数据集包括多个人脸图像、每个人脸图像的标注年龄,以及每个人脸图像的累积监督信号;
训练模块303,用于利用最终数据集对初始神经网络进行训练,获得年龄估计神经网络。
在一些实施例中,获取模块301具体用于:
获取人脸图像数据集
Figure BDA0002307142140000121
其中,N为人脸图像的数量,Xi为第i个人脸图像;
获取每个人脸图像的标注数据,并根据标注数据得到初始数据集
Figure BDA0002307142140000122
其中yi为第i个人脸图像的标注年龄。
在一些实施例中,获取模块301还用于:
获取n个人分别对人脸图像Xi进行标注的标注结果
Figure BDA0002307142140000123
其中,
Figure BDA0002307142140000124
为整数;
Figure BDA0002307142140000125
的平均值yi作为Xi的标注年龄,得到初始数据集
Figure BDA0002307142140000126
Figure BDA0002307142140000127
在一些实施例中,生成模块302具体用于:
对初始数据集D1中的每一个样本(Xi,yi),根据标注年龄yi生成Xi的累积监督信号ci∈Rp;其中,ci为维度为p的向量,R为ci的维度,p为预设的标注年龄的最大值;
形成最终数据集
Figure BDA0002307142140000131
在一些实施例中,生成模块302还用于:
根据以下算式生成累积监督信号ci∈R101
Figure BDA0002307142140000132
其中,
Figure BDA0002307142140000133
为ci的第k维的值。
在一些实施例中,训练模块303具体用于:
对最终数据集D2中的每一个样本(Xi,yi,ci),将Xi输入初始神经网络,输出累计监督向量
Figure BDA0002307142140000134
和预测年龄
Figure BDA0002307142140000135
根据
Figure BDA0002307142140000136
Figure BDA0002307142140000137
计算损失函数,获得年龄估计神经网络。
在一些实施例中,训练模块303还用于:
将Xi输入初始神经网络,对Xi进行特征提取,获得特征图;
对特征图进行全局平均池化操作,全局特征fi
将全局特征fi输入累计隐含层,输出是大小为p的累计监督向量
Figure BDA0002307142140000138
将累计监督向量
Figure BDA0002307142140000139
输入全连接层,输出预测年龄
Figure BDA00023071421400001310
在一些实施例中,训练模块303还用于:
利用以下算式计算损失函数Li
Figure BDA00023071421400001311
通过反向传播算法求Li对所有参数W的导数
Figure BDA00023071421400001312
通过随机梯度下降算法更新权重。
本申请实施例提供的年龄估计神经网络的生成装置,与上述实施例提供的年龄估计神经网络的生成方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
本申请实施例提供的一种电子设备,如图4所示,电子设备400包括存储器401、处理器402,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例提供的方法的步骤。
参见图4,电子设备还包括:总线403和通信接口404,处理器402、通信接口404和存储器401通过总线403连接;处理器402用于执行存储器401中存储的可执行模块,例如计算机程序。
其中,存储器401可能包含高速随机存取存储器(Random Access Memory,简称RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口404(可以是有线或者无线)实现该***网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线403可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器401用于存储程序,所述处理器402在接收到执行指令后,执行所述程序,前述本申请任一实施例揭示的过程定义的装置所执行的方法可以应用于处理器402中,或者由处理器402实现。
处理器402可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器402中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器402可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(DigitalSignal Processing,简称DSP)、专用集成电路(Application Specific IntegratedCircuit,简称ASIC)、现成可编程门阵列(Field-Programmable GateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器401,处理器402读取存储器401中的信息,结合其硬件完成上述方法的步骤。
对应于上述年龄估计神经网络的生成方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述年龄估计神经网络的生成方法的步骤。
本申请实施例所提供的年龄估计神经网络的生成装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的***、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述移动控制方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (11)

1.一种年龄估计神经网络的生成方法,其特征在于,包括:
获取初始数据集;所述初始数据集包括多个人脸图像,以及每个所述人脸图像的标注年龄;
根据每个所述人脸图像的标注年龄生成累积监督信号,并形成最终数据集;所述最终数据集包括多个人脸图像、每个所述人脸图像的标注年龄,以及每个所述人脸图像的累积监督信号;
利用所述最终数据集对初始神经网络进行训练,获得年龄估计神经网络。
2.根据权利要求1所述的方法,其特征在于,获取初始数据集的步骤,包括:
获取人脸图像数据集
Figure FDA0002307142130000011
其中,N为人脸图像的数量,Xi为第i个人脸图像;
获取每个所述人脸图像的标注数据,并根据所述标注数据得到初始数据集
Figure FDA0002307142130000012
其中yi为第i个人脸图像的标注年龄。
3.根据权利要求2所述的方法,其特征在于,获取每个所述人脸图像的标注数据,并根据所述标注数据得到初始数据集
Figure FDA0002307142130000013
的步骤,包括:
获取n个人分别对人脸图像Xi进行标注的标注结果
Figure FDA0002307142130000014
其中,
Figure FDA0002307142130000015
为整数;
Figure FDA0002307142130000016
的平均值yi作为Xi的标注年龄,得到初始数据集
Figure FDA0002307142130000017
Figure FDA0002307142130000018
4.根据权利要求2所述的方法,其特征在于,根据每个所述人脸图像的标注年龄生成累积监督信号,并形成最终数据集的步骤,包括:
对所述初始数据集D1中的每一个样本(Xi,yi),根据标注年龄yi生成Xi的累积监督信号ci∈Rp;其中,ci为维度为p的向量,R为ci的维度,R代表实数,Rp表示维度为p的所有实数向量,p为预设的标注年龄的最大值;
形成最终数据集
Figure FDA0002307142130000021
5.根据权利要求4所述的方法,其特征在于,根据标注年龄yi生成Xi的累积监督信号ci∈Rp的步骤,包括:
根据以下算式生成累积监督信号ci∈R101
Figure FDA0002307142130000022
其中,
Figure FDA0002307142130000023
为ci的第k维的值。
6.根据权利要求4所述的方法,其特征在于,利用所述最终数据集对初始神经网络进行训练,获得年龄估计神经网络的步骤,包括:
对所述最终数据集D2中的每一个样本(Xi,yi,ci),将Xi输入初始神经网络,输出累计监督向量
Figure FDA0002307142130000024
和预测年龄
Figure FDA0002307142130000025
根据
Figure FDA0002307142130000026
Figure FDA0002307142130000027
计算损失函数,获得年龄估计神经网络。
7.根据权利要求6所述的方法,其特征在于,将Xi输入初始神经网络,输出累计监督向量
Figure FDA0002307142130000028
和预测年龄
Figure FDA0002307142130000029
的步骤,包括:
将Xi输入初始神经网络,对Xi进行特征提取,获得特征图;
对所述特征图进行全局平均池化操作,全局特征fi
将所述全局特征fi输入累计隐含层,输出是大小为p的累计监督向量
Figure FDA00023071421300000210
将所述累计监督向量
Figure FDA00023071421300000211
输入全连接层,输出预测年龄
Figure FDA00023071421300000212
8.根据权利要求6所述的方法,其特征在于,根据
Figure FDA00023071421300000213
Figure FDA00023071421300000214
计算损失函数,获得年龄估计神经网络的步骤,包括:
利用以下算式计算损失函数Li
Figure FDA00023071421300000215
通过反向传播算法求Li对所有参数W的导数
Figure FDA0002307142130000031
通过随机梯度下降算法更新权重。
9.一种年龄估计神经网络的生成装置,其特征在于,包括:
获取模块,用于获取初始数据集;所述初始数据集包括多个人脸图像,以及每个所述人脸图像的标注年龄;
生成模块,用于根据每个所述人脸图像的标注年龄生成累积监督信号,并形成最终数据集;所述最终数据集包括多个人脸图像、每个所述人脸图像的标注年龄,以及每个所述人脸图像的累积监督信号;
训练模块,用于利用所述最终数据集对初始神经网络进行训练,获得年龄估计神经网络。
10.一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至8任一项所述的方法的步骤。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行所述权利要求1至8任一项所述的方法。
CN201911256144.2A 2019-12-06 2019-12-06 年龄估计神经网络的生成方法、装置以及电子设备 Pending CN111046786A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911256144.2A CN111046786A (zh) 2019-12-06 2019-12-06 年龄估计神经网络的生成方法、装置以及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911256144.2A CN111046786A (zh) 2019-12-06 2019-12-06 年龄估计神经网络的生成方法、装置以及电子设备

Publications (1)

Publication Number Publication Date
CN111046786A true CN111046786A (zh) 2020-04-21

Family

ID=70235341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911256144.2A Pending CN111046786A (zh) 2019-12-06 2019-12-06 年龄估计神经网络的生成方法、装置以及电子设备

Country Status (1)

Country Link
CN (1) CN111046786A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967382A (zh) * 2020-08-14 2020-11-20 北京金山云网络技术有限公司 年龄估计方法、年龄估计模型的训练方法及装置
CN112364713A (zh) * 2020-10-22 2021-02-12 深圳大学 一种智能化妆建议方法及***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169454A (zh) * 2017-05-16 2017-09-15 中国科学院深圳先进技术研究院 一种人脸图像年龄估算方法、装置及其终端设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107169454A (zh) * 2017-05-16 2017-09-15 中国科学院深圳先进技术研究院 一种人脸图像年龄估算方法、装置及其终端设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KAI LI 等: "D2C: Deep cumulatively and comparatively learning for human age estimation" *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967382A (zh) * 2020-08-14 2020-11-20 北京金山云网络技术有限公司 年龄估计方法、年龄估计模型的训练方法及装置
CN112364713A (zh) * 2020-10-22 2021-02-12 深圳大学 一种智能化妆建议方法及***

Similar Documents

Publication Publication Date Title
CN109376631B (zh) 一种基于神经网络的回环检测方法及装置
CN110503459B (zh) 基于大数据的用户信用度评估方法、装置及存储介质
CN109948680B (zh) 病历数据的分类方法及***
CN110705718A (zh) 基于合作博弈的模型解释方法、装置、电子设备
CN113360711B (zh) 视频理解任务的模型训练和执行方法、装置、设备及介质
CN111782927B (zh) 物品推荐方法及其装置、计算机可存储介质
CN113688310B (zh) 一种内容推荐方法、装置、设备及存储介质
EP3591545A1 (en) Method for co-clustering senders and receivers based on text or image data files
CN116015837A (zh) 用于计算机网络信息安全的入侵检测方法及***
CN115019374B (zh) 基于人工智能的智慧课堂学生专注度低耗检测方法及***
CN111046786A (zh) 年龄估计神经网络的生成方法、装置以及电子设备
CN115222443A (zh) 客户群体划分方法、装置、设备及存储介质
CN113886697A (zh) 基于聚类算法的活动推荐方法、装置、设备及存储介质
CN112329810B (zh) 一种基于显著性检测的图像识别模型训练方法及装置
CN111667018A (zh) 一种对象聚类的方法、装置、计算机可读介质及电子设备
CN111967383A (zh) 年龄估计方法、年龄估计模型的训练方法和装置
CN112801006B (zh) 表情表征模型的训练方法、面部的表情表征方法及装置
CN108921226B (zh) 一种基于低秩表示和流形正则化的零样本图像分类方法
CN111428741B (zh) 网络社区的发现方法、装置、电子设备及可读存储介质
US11531722B2 (en) Electronic device and control method therefor
CN109885504B (zh) 推荐***的测试方法、装置、介质及电子设备
CN114417982A (zh) 一种模型训练方法、终端设备及计算机可读存储介质
CN113393303A (zh) 物品推荐方法、装置、设备及存储介质
CN113591881A (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN113656586A (zh) 情感分类方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200421