CN108052862B - 年龄预估方法和装置 - Google Patents

年龄预估方法和装置 Download PDF

Info

Publication number
CN108052862B
CN108052862B CN201711100297.9A CN201711100297A CN108052862B CN 108052862 B CN108052862 B CN 108052862B CN 201711100297 A CN201711100297 A CN 201711100297A CN 108052862 B CN108052862 B CN 108052862B
Authority
CN
China
Prior art keywords
age
model
gender
face image
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711100297.9A
Other languages
English (en)
Other versions
CN108052862A (zh
Inventor
李宣平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Kwai Technology Co.,Ltd.
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN201711100297.9A priority Critical patent/CN108052862B/zh
Publication of CN108052862A publication Critical patent/CN108052862A/zh
Priority to US16/762,706 priority patent/US11587356B2/en
Priority to PCT/CN2018/114368 priority patent/WO2019091402A1/zh
Application granted granted Critical
Publication of CN108052862B publication Critical patent/CN108052862B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2148Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06V10/7747Organisation of the process, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/178Human faces, e.g. facial parts, sketches or expressions estimating age from face image; using age information for improving recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明提供了一种年龄预估方法和装置,该方法包括:根据人脸图像样本对性别模型进行性别训练,使所述性别模型收敛,其中,所述性别模型包括至少两个卷积层;根据所述人脸图像样本以及所述至少两个卷积层收敛后的权重,对年龄模型进行年龄训练,使所述年龄模型收敛,其中,所述年龄模型包括所述至少两个卷积层;根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估。本发明能够消除人脸图像的性别差异造成的年龄预估不准确的问题,进而提升年龄预估准确度。

Description

年龄预估方法和装置
技术领域
本发明涉及计算机视觉技术领域,特别是涉及一种年龄预估方法和装置。
背景技术
目前,随着人脸图像的年龄在互联网用户画像、广告精准推送、图像或视频推荐等领域的应用越来越广泛,对人脸图像的年龄估计的需求也越来越大。
目前,人脸图像的年龄预估方法主要包括传统的机器学习方法,具体而言,首先设计定义人工特征,如hog(Histogram of Oriented Gradient,方向梯度直方图),sift(Scale-Invariant Feature Taransform,尺度不变特征变换)等特征,然后,采用降维的方法来提取对年龄预估有用的有效特征,最后采用回归模型检测人脸图像的年龄。
但是,传统的机器学习方法所学习到的特征对噪声、背景、光线、人脸不同状态等信息不鲁邦,导致人脸年龄检测不准确。比如同一个人脸,在不同场景下拍摄的图片,这种方法检测出的年龄差距较大,因此,对人脸图像的年龄估计准确度较低。
发明内容
本发明提供了一种年龄预估方法和装置,以解决相关技术中对人脸图像的年龄进行估计时,准确度较低的问题。
为了解决上述问题,根据本发明的一个方面,本发明公开了一种年龄预估方法,包括:
根据人脸图像样本对性别模型进行性别训练,使所述性别模型收敛,其中,所述性别模型包括至少两个卷积层;
根据所述人脸图像样本以及所述至少两个卷积层收敛后的权重,对年龄模型进行年龄训练,使所述年龄模型收敛,其中,所述年龄模型包括所述至少两个卷积层;
根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估。
可选地,所述性别模型还包括至少一个第一全连接层以及第一分类器,所述根据人脸图像样本对性别模型进行性别训练,使所述性别模型收敛,包括:
根据人脸图像样本的性别标注信息对性别模型的所述至少两个卷积层、所述至少一个第一全连接层以及所述第一分类器进行性别训练,使所述性别模型收敛。
可选地,所述年龄模型还包括至少一个卷积层、至少一个第二全连接层以及第二分类器,所述根据所述人脸图像样本以及所述至少两个卷积层收敛后的权重,对年龄模型进行年龄训练,使所述年龄模型收敛,包括:
根据人脸图像样本的年龄标注信息对年龄模型的所述至少一个卷积层、所述至少一个第二全连接层以及所述第二分类器进行年龄训练,使所述年龄模型收敛。
可选地,所述根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估之前,所述年龄预估方法还包括:
在所述年龄模型收敛后,选用预设学习率并根据所述人脸图像样本对所述年龄模型进行二次年龄训练,使所述年龄模型再次收敛。
可选地,所述根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估,包括:
根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估,得到每个年龄类别对应的概率值。
可选地,所述根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估,得到每个年龄类别对应的概率值之后,所述年龄预估方法还包括:
根据每个年龄类别对应的概率值和每个年龄类别对应的年龄,计算所述人脸图像的估计年龄。
根据本发明的另一方面,本发明还公开了一种年龄预估装置,包括:
第一训练模块,用于根据人脸图像样本对性别模型进行性别训练,使所述性别模型收敛,其中,所述性别模型包括至少两个卷积层;
第二训练模块,用于根据所述人脸图像样本以及所述至少两个卷积层收敛后的权重,对年龄模型进行年龄训练,使所述年龄模型收敛,其中,所述年龄模型包括所述至少两个卷积层;
预估模块,用于根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估。
可选地,所述性别模型还包括至少一个第一全连接层以及第一分类器,所述第一训练模块包括:
第一训练子模块,用于根据人脸图像样本的性别标注信息对性别模型的所述至少两个卷积层、所述至少一个第一全连接层以及所述第一分类器进行性别训练,使所述性别模型收敛。
可选地,所述年龄模型还包括至少一个卷积层、至少一个第二全连接层以及第二分类器,所述第二训练模块包括:
第二训练子模块,用于根据人脸图像样本的年龄标注信息对年龄模型的所述至少一个卷积层、所述至少一个第二全连接层以及所述第二分类器进行年龄训练,使所述年龄模型收敛。
可选地,所述年龄预估装置还包括:
第三训练模块,用于在所述年龄模型收敛后,选用预设学习率并根据所述人脸图像样本对所述年龄模型进行二次年龄训练,使所述年龄模型再次收敛。
可选地,所述预估模块包括:
预估子模块,用于根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估,得到每个年龄类别对应的概率值。
可选地,所述年龄预估装置还包括:
计算模块,用于根据每个年龄类别对应的概率值和每个年龄类别对应的年龄,计算所述人脸图像的估计年龄。
根据本发明的再一方面,本发明还公开了一种移动终端,该移动终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的年龄预估程序,所述年龄预估程序被所述处理器执行时实现上述任意一种所述的年龄预估方法的步骤。
根据本发明的又一方面,本发明还公开了一种计算机可读存储介质,所述计算机可读存储介质上存储有年龄预估程序,所述年龄预估程序被处理器执行时实现上述任意一种所述的年龄预估方法中的步骤。
与现有技术相比,本发明包括以下优点:
这样,本发明实施例通过使性别模型和年龄模型共用至少两个卷积层,并通过对性别模型进行训练,使得性别模型收敛;并对年龄模型进行训练,在训练过程中保持上述至少两个卷积层的权重不变,仍旧是性别模型收敛后的权重,使得年龄模型的训练过程中得到性别信息的监督,最终利用收敛后的年龄模型来对人脸图像进行年龄预估,从而消除人脸图像的性别差异造成的年龄预估不准确的问题,进而提升年龄预估准确度
附图说明
图1是本发明的一种年龄预估方法实施例的步骤流程图;
图2是本发明的一种深度神经网络模型实施例的示意图;
图3是本发明的一种年龄预估装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种年龄预估方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,根据人脸图像样本对性别模型进行性别训练,使所述性别模型收敛,其中,所述性别模型包括至少两个卷积层;
其中,人脸图像样本包括多个人脸图像,每个人脸图像均标注有年龄和性别信息。其中,性别模型,用于检测人脸图像的性别,该性别模型可以是一种深度神经网络模型,该性别模型包括至少两个卷积层。本发明实施例通过具有性别信息标注的人脸图像样本来对该性别模型进行训练,从而调整性别模型中各个网络层的权重,直至该性别模型收敛,所谓性别模型的收敛,即性别模型输出的性别预测结果与实际性别之间的误差小于预设误差阈值,模型收敛的概念属于本领域的公知常识,这里不再详述。
步骤102,根据所述人脸图像样本以及所述至少两个卷积层收敛后的权重,对年龄模型进行年龄训练,使所述年龄模型收敛,其中,所述年龄模型包括所述至少两个卷积层;
其中,年龄模型,用于检测人脸图像的年龄,而为了实现性别信息对年龄预测的监督,本发明实施例的年龄模型和性别模型共用部分卷积层,即上述的至少两个卷积层。其中,该年龄模型同样可以是一种深度神经网络模型,该年龄模型中的至少两个卷积层经过步骤101的训练,每个卷积层的权重都是对性别预测收敛的,因此,为了实现性别信息对年龄预测的监督,在对年龄模型进行训练时,可以保持该至少两个卷积层中每个卷积层的权重不变(即仍旧是步骤101训练收敛后的权重),然后,将上述标注有年龄信息的多个人脸图像样本分别输入至年龄模型,来对年龄模型训练,在训练过程中不对年龄模型的上述至少两个卷积层的权重进行修改,而是对年龄模型的其他网络层的权重进行调整,直至调整后的各网络层的权重使得年龄模型收敛。所谓年龄模型的收敛,即年龄模型输出的年龄预测结果与实际年龄之间的误差小于预设年龄误差阈值。
步骤103,根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估。
其中,可以利用经过上述性别信息监督训练而收敛后的年龄模型来对任意一个需要估计年龄的人脸图像进行识别,具体则是将该人脸图像输入至该年龄模型,经过年龄模型的预测,可以输出年龄预估结果。
这样,本发明实施例通过使性别模型和年龄模型共用至少两个卷积层,并通过对性别模型进行训练,使得性别模型收敛;并对年龄模型进行训练,在训练过程中保持上述至少两个卷积层的权重不变,仍旧是性别模型收敛后的权重,使得年龄模型的训练过程中得到性别信息的监督,最终利用收敛后的年龄模型来对人脸图像进行年龄预估,从而消除人脸图像的性别差异造成的年龄预估不准确的问题,进而提升年龄预估准确度。
下面为了更好的理解本发明上述实施例的技术方案,结合图2来对本发明实施例的上述技术方案进行详细阐述。本实施例的人脸年龄预估方法的流程主要包括:
步骤1:收集一批不同年龄的人脸图像样本,并对这些人脸图像样本,按照年龄标注成16类,并对每个人脸图像标注性别信息;
具体如表1所示,16类的年龄段分别为:0-1岁,2-4岁,5-6岁,7-12岁,13-15岁,16-18岁,19-22岁,23-25岁,26-30岁,31-35岁,36-40岁,41-45岁,46-50岁,51-55岁,56-60岁,60岁以上。针对每类年龄段本发明在表1中还设置了每个年龄段的平均年龄,依次为0.5岁,3岁,5.5岁,10.5岁,14岁,17岁,20.5岁,24岁,28岁,33岁,38岁,43岁,48岁,53岁,58岁,60岁。
表1
步骤2:构建一个如图2所示的深度神经网络模型,该深度神经网络模型可以划分为性别模型和年龄模型,其中,性别模型和年龄模型均是深度神经网络模型,性别模型、年龄模型均包括卷积网络、全连接网络、分类网络三个部分。
如图2所示,性别模型包括4个卷积层(conv1、conv2、conv3、conv4)、两个全连接层(FC1和FC2)以及一个分类层(softmax1)。其中,本实施例中的性别模型包括4个卷积层,实际上,该性别模型中的卷积层的个数可以是两个或两个以上任意个数,具体可以根据需要灵活设置。该性别模型中的全连接层的个数可以是一个或一个以上任意个数,具体可以根据需要灵活设置。其中,conv4(即最后一个卷积层)输出的特征可以输入至FC1,FC1输出的特征再输入至FC2,最后FC2输出的特征再输入至softmax1进行性别分类;可选的,年龄模型除了可以包括性别模型的上述4个卷积层之外,还包括第五个卷积层(conv5);此外,该年龄模型还可以包括至少一个全连接层,该至少一个全连接层与年龄模型中最后一个卷积层(conv5)连接,这里示出了两个全连接层(FC3和FC4);此外,年龄模型还可以包括至少一个分类器,该分类器(即分类层,softmax2)连接在最后一个全连接层FC4后面。其中,conv4输出的特征可以输入至conv5,conv5再将提取的特征输入至FC3进行全连接,FC3再将全连接的特征输入至FC4继续进行全连接处理,最后,FC4将处理后的特征输入至softmax2进行年龄分类检测。
步骤3:利用步骤1中进行性别和年龄标注的人脸图像样本来对步骤2搭建的深度神经网络模型进行训练。
第一次训练:将表1中标注有性别信息的人脸图像样本输入至性别模型,从而训练conv1,conv2,onv3,conv4,FC1,FC2和softmax1,使所述性别模型收敛。具体过程为每输入一个人脸图像的样本至性别模型,性别模型都可以输出一个性别预测结果,那么本发明实施例的方法根据该人脸图像的样本的性别预测结果与实际性别之间的差距,调整性别模型中上述各个网络层的权重;然后,再输入一个人脸图像的样本,利用调整了权重的性别模型继续进行性别预测和调整各个网络层的权重,直至性别预测结果与该人脸图像的实际性别之间的误差小于预设性别误差阈值(例如1%),从而使性别模型收敛,能够学习到性别特征;
第二次训练:待性别模型收敛后,可以将第一次训练后收敛的性别模型中的conv1,conv2,conv3,conv4的权重进行固定,然后,将标注有年龄信息的上述人脸图像样本输入至年龄模型,来对年龄模型中的conv5,FC3,FC4和softmax2进行训练,使年龄模型收敛。具体过程为每输入一个人脸图像的样本至年龄模型,年龄模型都可以输出一个年龄预测结果,那么本发明实施例的方法根据该人脸图像的样本的年龄预测结果与实际年龄(这里的实际年龄取表1中的年龄均值,举例来说,例如某个属于1类的人脸图像,该人脸图像的年龄为2岁,那么以该人脸图像的龄为年龄均值3岁来训练)之间的差距,调整年龄模型中上述conv5,FC3,FC4和softmax2的权重;然后,再输入一个人脸图像的样本,利用调整了conv5,FC3,FC4和softmax2的权重的年龄模型继续进行年龄预测和调整conv5,FC3,FC4和softmax2的权重的步骤,直至年龄预测结果与该人脸图像的实际年龄之间的误差小于预设年龄误差阈值(例如2%),从而使年龄模型收敛,能够学习到年龄特征;
可选地,第三次训练,待年龄模型收敛后,可以选用预设学习率(该预设学习率可以为较小的学习率),利用上述人脸图像样本来对年龄模型进行整体训练,其中包括训练conv1,conv2,conv3,conv4,conv5,FC3,FC4和softmax2,即,第三次训练主要目的在于对第一次训练收敛后的conv1,conv2,conv3,conv4的权值,以及第二次训练后收敛的conv5,FC3,FC4和softmax2的权值分别进行微调,实现对年龄模型的权值微调,直至该年龄模型再次收敛,从而获得准确的年龄模型。其中,对各个网络层的权值更新的幅度与学习率有关。本实施例通过选用较小的学习率,从而可以小幅度的更新各网络层的权值,实现对年龄模型中每个网络层的权值微调。
步骤4:利用步骤3中训练的年龄模型来对待测的人脸图像进行年龄预估,从而可以由softmax2输出该人脸图像的每个年龄分类类别(即表1中的16个类别)对应的概率值。
步骤5:利用年龄模型输出的每个年龄分类类别对应的概率值以及每个年龄类别对应的年龄均值,来对该待测的人脸图像的年龄进行估计计算。
其中,年龄计算公式如公式(1)所示:
meanAge=∑Middle Agei×pi 公式(1)
其中,MiddleAgei为表1所示的年龄分类类别i对应的平均年龄,pi为本发明实施例如图2所示的深度神经网络模型输出的各年龄分类类别的概率值,i为大于等于零且小于等于15的整数。
借助于本发明上述实施例的技术方案,本发明实施例考虑到人脸图像的年龄和对应的性别存在很大相关性,特别是成年人的表象年龄和性别关系更为突出,比如女性相比于男性更注重保养,在男女实际年龄相同的条件下,但二者的表象年龄可能相差很大。而在社交网络中,图片和视频中人脸的表象年龄往往与真实年龄相差很多。因此为了准确的检测出人脸图像的实际年龄,有必要利用人脸图像的性别信息,来辅助检测人脸的年龄。本发明实施例的深度神经网络模型中用于对年龄进行分类的模型在训练时能够在性别信息的监督下进行,从而进一步保证了年龄分类检测的准确度,提升了人脸图像的年龄估计准确度。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
与上述本发明实施例所提供的方法相对应,参照图3,示出了本发明一种年龄预估装置实施例的结构框图,具体可以包括如下模块:
第一训练模块31,用于根据人脸图像样本对性别模型进行性别训练,使所述性别模型收敛,其中,所述性别模型包括至少两个卷积层;
其中,人脸图像样本包括多个人脸图像,每个人脸图像均标注有年龄和性别信息。其中,性别模型,用于检测人脸图像的性别,该性别模型可以是一种深度神经网络模型,该性别模型包括至少两个卷积层。本发明实施例通过具有性别信息标注的人脸图像样本来对该性别模型进行训练,从而调整性别模型中各个网络层的权重,直至该性别模型收敛,所谓性别模型的收敛,即性别模型输出的性别预测结果与实际性别之间的误差小于预设误差阈值,模型收敛的概念属于本领域的公知常识,这里不再详述。
第二训练模块32,用于根据所述人脸图像样本以及所述至少两个卷积层收敛后的权重,对年龄模型进行年龄训练,使所述年龄模型收敛,其中,所述年龄模型包括所述至少两个卷积层;
其中,年龄模型,用于检测人脸图像的年龄,而为了实现性别信息对年龄预测的监督,本发明实施例的年龄模型和性别模型共用部分卷积层,即上述的至少两个卷积层。其中,该年龄模型同样可以是一种深度神经网络模型,该年龄模型中的至少两个卷积层经过第一训练模块31的训练,每个卷积层的权重都是对性别预测收敛的,因此,为了实现性别信息对年龄预测的监督,在对年龄模型进行训练时,可以保持该至少两个卷积层中每个卷积层的权重不变(即仍旧是第一训练模块31训练收敛后的权重),然后,将上述标注有年龄信息的多个人脸图像样本分别输入至年龄模型,来对年龄模型训练,在训练过程中不对年龄模型的上述至少两个卷积层的权重进行修改,而是对年龄模型的其他网络层的权重进行调整,直至调整后的各网络层的权重使得年龄模型收敛。所谓年龄模型的收敛,即年龄模型输出的年龄预测结果与实际年龄之间的误差小于预设年龄误差阈值。
预估模块33,用于根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估。
其中,可以利用经过上述性别信息监督训练而收敛后的年龄模型来对任意一个需要估计年龄的人脸图像进行识别,具体则是将该人脸图像输入至该年龄模型,经过年龄模型的预测,可以输出年龄预估结果。
这样,本发明实施例通过使性别模型和年龄模型共用至少两个卷积层,并通过对性别模型进行训练,使得性别模型收敛;并对年龄模型进行训练,在训练过程中保持上述至少两个卷积层的权重不变,仍旧是性别模型收敛后的权重,使得年龄模型的训练过程中得到性别信息的监督,最终利用收敛后的年龄模型来对人脸图像进行年龄预估,从而消除人脸图像的性别差异造成的年龄预估不准确的问题,进而提升年龄预估准确度。
在一种可能的实施方式中,所述性别模型还包括至少一个第一全连接层以及第一分类器,所述第一训练模块31包括:
第一训练子模块,用于根据人脸图像样本的性别标注信息对性别模型的所述至少两个卷积层、所述至少一个第一全连接层以及所述第一分类器进行性别训练,使所述性别模型收敛。
在一种可能的实施方式中,所述年龄模型还包括至少一个卷积层、至少一个第二全连接层以及第二分类器,所述第二训练模块32包括:
第二训练子模块,用于根据人脸图像样本的年龄标注信息对年龄模型的所述至少一个卷积层、所述至少一个第二全连接层以及所述第二分类器进行年龄训练,使所述年龄模型收敛。
在一种可能的实施方式中,根据本发明实施例的装置还包括:
第三训练模块,用于在所述年龄模型收敛后,选用预设学习率并根据所述人脸图像样本对所述年龄模型进行二次年龄训练,使所述年龄模型再次收敛。
在一种可能的实施方式中,所述预估模块33包括:
预估子模块,用于根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估,得到每个年龄类别对应的概率值。
在一种可能的实施方式中,根据本发明实施例的装置还包括:
计算模块,用于根据每个年龄类别对应的概率值和每个年龄类别对应的年龄,计算所述人脸图像的估计年龄。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
根据本发明的另一个实施例,还提供了一种移动终端,该移动终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的年龄预估程序,所述年龄预估程序被所述处理器执行时实现如上述实施例的年龄预估方法的步骤。
根据本发明的另一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有年龄预估程序,所述年龄预估程序被处理器执行时实现如上述实施例的年龄预估方法中的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种年龄预估方法和一种年龄预估装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (14)

1.一种年龄预估方法,其特征在于,包括:
根据人脸图像样本对性别模型进行性别训练,使所述性别模型收敛,其中,所述性别模型包括至少两个卷积层;
根据所述人脸图像样本以及所述至少两个卷积层收敛后的权重,对年龄模型进行年龄训练,使所述年龄模型收敛,其中,所述年龄模型包括所述至少两个卷积层;
根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估;
其中,所述性别模型和所述年龄模型共用所述至少两个卷积层;所述对年龄模型进行年龄训练的过程中,所述至少两个卷积层收敛后的权重保持不变;对所述年龄模型中除所述至少两个卷积层之外的网络层的权重进行调整,直至调整后的各网络层的权重使得年龄模型收敛。
2.根据权利要求1所述的方法,其特征在于,所述性别模型还包括至少一个第一全连接层以及第一分类器,所述根据人脸图像样本对性别模型进行性别训练,使所述性别模型收敛,包括:
根据人脸图像样本的性别标注信息对性别模型的所述至少两个卷积层、所述至少一个第一全连接层以及所述第一分类器进行性别训练,使所述性别模型收敛。
3.根据权利要求1所述的方法,其特征在于,所述年龄模型还包括至少一个卷积层、至少一个第二全连接层以及第二分类器,所述根据所述人脸图像样本以及所述至少两个卷积层收敛后的权重,对年龄模型进行年龄训练,使所述年龄模型收敛,包括:
根据人脸图像样本的年龄标注信息对年龄模型的所述至少一个卷积层、所述至少一个第二全连接层以及所述第二分类器进行年龄训练,使所述年龄模型收敛。
4.根据权利要求1所述的方法,其特征在于,所述根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估之前,所述方法还包括:
在所述年龄模型收敛后,选用预设学习率并根据所述人脸图像样本对所述年龄模型进行二次年龄训练,使所述年龄模型再次收敛。
5.根据权利要求1所述的方法,其特征在于,所述根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估,包括:
根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估,得到每个年龄类别对应的概率值。
6.根据权利要求5所述的方法,其特征在于,所述根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估,得到每个年龄类别对应的概率值之后,所述方法还包括:
根据每个年龄类别对应的概率值和每个年龄类别对应的年龄,计算所述人脸图像的估计年龄。
7.一种年龄预估装置,其特征在于,包括:
第一训练模块,用于根据人脸图像样本对性别模型进行性别训练,使所述性别模型收敛,其中,所述性别模型包括至少两个卷积层;
第二训练模块,用于根据所述人脸图像样本以及所述至少两个卷积层收敛后的权重,对年龄模型进行年龄训练,使所述年龄模型收敛,其中,所述年龄模型包括所述至少两个卷积层;
预估模块,用于根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估;
其中,所述性别模型和所述年龄模型共用所述至少两个卷积层;所述对年龄模型进行年龄训练的过程中,所述至少两个卷积层收敛后的权重保持不变;对所述年龄模型中除所述至少两个卷积层之外的网络层的权重进行调整,直至调整后的各网络层的权重使得年龄模型收敛。
8.根据权利要求7所述的装置,其特征在于,所述性别模型还包括至少一个第一全连接层以及第一分类器,所述第一训练模块包括:
第一训练子模块,用于根据人脸图像样本的性别标注信息对性别模型的所述至少两个卷积层、所述至少一个第一全连接层以及所述第一分类器进行性别训练,使所述性别模型收敛。
9.根据权利要求7所述的装置,其特征在于,所述年龄模型还包括至少一个卷积层、至少一个第二全连接层以及第二分类器,所述第二训练模块包括:
第二训练子模块,用于根据人脸图像样本的年龄标注信息对年龄模型的所述至少一个卷积层、所述至少一个第二全连接层以及所述第二分类器进行年龄训练,使所述年龄模型收敛。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第三训练模块,用于在所述年龄模型收敛后,选用预设学习率并根据所述人脸图像样本对所述年龄模型进行二次年龄训练,使所述年龄模型再次收敛。
11.根据权利要求7所述的装置,其特征在于,所述预估模块包括:
预估子模块,用于根据收敛后的所述年龄模型对输入的人脸图像进行年龄预估,得到每个年龄类别对应的概率值。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
计算模块,用于根据每个年龄类别对应的概率值和每个年龄类别对应的年龄,计算所述人脸图像的估计年龄。
13.一种移动终端,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的年龄预估程序,所述年龄预估程序被所述处理器执行时实现如权利要求1至6中任一项所述的年龄预估方法的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有年龄预估程序,所述年龄预估程序被处理器执行时实现如权利要求1至6中任一项所述的年龄预估方法中的步骤。
CN201711100297.9A 2017-11-09 2017-11-09 年龄预估方法和装置 Active CN108052862B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201711100297.9A CN108052862B (zh) 2017-11-09 2017-11-09 年龄预估方法和装置
US16/762,706 US11587356B2 (en) 2017-11-09 2018-11-07 Method and device for age estimation
PCT/CN2018/114368 WO2019091402A1 (zh) 2017-11-09 2018-11-07 年龄预估方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711100297.9A CN108052862B (zh) 2017-11-09 2017-11-09 年龄预估方法和装置

Publications (2)

Publication Number Publication Date
CN108052862A CN108052862A (zh) 2018-05-18
CN108052862B true CN108052862B (zh) 2019-12-06

Family

ID=62118786

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711100297.9A Active CN108052862B (zh) 2017-11-09 2017-11-09 年龄预估方法和装置

Country Status (3)

Country Link
US (1) US11587356B2 (zh)
CN (1) CN108052862B (zh)
WO (1) WO2019091402A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108052862B (zh) * 2017-11-09 2019-12-06 北京达佳互联信息技术有限公司 年龄预估方法和装置
CN109086680A (zh) * 2018-07-10 2018-12-25 Oppo广东移动通信有限公司 图像处理方法、装置、存储介质和电子设备
CN109034078B (zh) * 2018-08-01 2023-07-14 腾讯科技(深圳)有限公司 年龄识别模型的训练方法、年龄识别方法及相关设备
JP7326867B2 (ja) * 2019-05-21 2023-08-16 富士通株式会社 情報処理装置、情報処理プログラム及び情報処理方法
CN110532970B (zh) * 2019-09-02 2022-06-24 厦门瑞为信息技术有限公司 人脸2d图像的年龄性别属性分析方法、***、设备和介质
CN111914772B (zh) * 2020-08-06 2024-05-03 北京金山云网络技术有限公司 识别年龄的方法、年龄识别模型的训练方法和装置
CN112036293A (zh) * 2020-08-27 2020-12-04 北京金山云网络技术有限公司 年龄估计方法、年龄估计模型的训练方法及装置
CN113920562B (zh) * 2021-09-24 2024-04-30 深圳数联天下智能科技有限公司 年龄预测模型的训练方法、年龄预测方法及装置
CN114232281A (zh) * 2022-01-13 2022-03-25 合肥美菱物联科技有限公司 一种洗衣机安全保护控制方法
CN116561347B (zh) * 2023-07-07 2023-11-07 广东信聚丰科技股份有限公司 基于用户学习画像分析的题目推荐方法及***

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9400925B2 (en) * 2013-11-15 2016-07-26 Facebook, Inc. Pose-aligned networks for deep attribute modeling
CN105095833B (zh) * 2014-05-08 2019-03-15 中国科学院声学研究所 用于人脸识别的网络构建方法、识别方法及***
CN105426872B (zh) * 2015-12-17 2019-06-21 电子科技大学 一种基于相关高斯过程回归的面部年龄估计方法
CN106384080A (zh) * 2016-08-31 2017-02-08 广州精点计算机科技有限公司 一种基于卷积神经网络的表观年龄估计方法及装置
CN106529402B (zh) * 2016-09-27 2019-05-28 中国科学院自动化研究所 基于多任务学习的卷积神经网络的人脸属性分析方法
CN106503669B (zh) * 2016-11-02 2019-12-10 重庆中科云丛科技有限公司 一种基于多任务深度学习网络的训练、识别方法及***
CN106548234A (zh) * 2016-11-17 2017-03-29 北京图森互联科技有限责任公司 一种神经网络剪枝方法及装置
US10360494B2 (en) * 2016-11-30 2019-07-23 Altumview Systems Inc. Convolutional neural network (CNN) system based on resolution-limited small-scale CNN modules
CN106951825B (zh) * 2017-02-13 2021-06-29 苏州飞搜科技有限公司 一种人脸图像质量评估***以及实现方法
CN108052862B (zh) * 2017-11-09 2019-12-06 北京达佳互联信息技术有限公司 年龄预估方法和装置
CN108197592B (zh) * 2018-01-22 2022-05-27 百度在线网络技术(北京)有限公司 信息获取方法和装置
US20190259384A1 (en) * 2018-02-19 2019-08-22 Invii.Ai Systems and methods for universal always-on multimodal identification of people and things

Also Published As

Publication number Publication date
US11587356B2 (en) 2023-02-21
CN108052862A (zh) 2018-05-18
US20210174066A1 (en) 2021-06-10
WO2019091402A1 (zh) 2019-05-16

Similar Documents

Publication Publication Date Title
CN108052862B (zh) 年龄预估方法和装置
Hosu et al. KonIQ-10k: An ecologically valid database for deep learning of blind image quality assessment
Huang et al. Efficient uncertainty estimation for semantic segmentation in videos
Chen et al. Source-free domain adaptive fundus image segmentation with denoised pseudo-labeling
US11699095B2 (en) Cross-domain recommender systems using domain separation networks and autoencoders
EP3767536A1 (en) Latent code for unsupervised domain adaptation
CN108288051B (zh) 行人再识别模型训练方法及装置、电子设备和存储介质
CN111582150B (zh) 一种人脸质量评估的方法、装置和计算机存储介质
CN110852447A (zh) 元学习方法和装置、初始化方法、计算设备和存储介质
WO2012071696A1 (zh) 基于用户兴趣学习的个性化广告推送方法与***
CN105760488B (zh) 基于多层次特征融合的图像表达方法和装置
Chen et al. No-reference screen content image quality assessment with unsupervised domain adaptation
CN113207010B (zh) 模型训练方法、直播推荐方法、设备、存储介质
WO2023284465A1 (zh) 图像检测方法、装置、计算机可读存储介质及计算机设备
Mustapha et al. Towards nonuniform illumination face enhancement via adaptive contrast stretching
Duan et al. Age estimation using aging/rejuvenation features with device-edge synergy
CN112927266A (zh) 基于不确定性引导训练的弱监督时域动作定位方法及***
Feng et al. Unsupervised domain adaptive fundus image segmentation with category-level regularization
CN115705706A (zh) 视频处理方法、装置、计算机设备和存储介质
CN117576781A (zh) 基于行为识别的训练强度监测***及方法
CN110490053B (zh) 一种基于三目摄像头深度估计的人脸属性识别方法
CN112541010B (zh) 一种基于逻辑回归的用户性别预测方法
CN116704609A (zh) 基于时序注意力的在线手卫生评估方法及***
Hao et al. Iris segmentation using feature channel optimization for noisy environments
CN104598866B (zh) 一种基于人脸的社交情商促进方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211013

Address after: B2201, 20 / F, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing 100084

Patentee after: Beijing Dajia Internet Information Technology Co.,Ltd.

Patentee after: Beijing Kwai Technology Co.,Ltd.

Address before: B2201, 20 / F, building 8, yard 1, Zhongguancun East Road, Haidian District, Beijing 100084

Patentee before: Beijing Dajia Internet Information Technology Co.,Ltd.

TR01 Transfer of patent right