CN111695602B - 多维度任务人脸美丽预测方法、***及存储介质 - Google Patents

多维度任务人脸美丽预测方法、***及存储介质 Download PDF

Info

Publication number
CN111695602B
CN111695602B CN202010423325.6A CN202010423325A CN111695602B CN 111695602 B CN111695602 B CN 111695602B CN 202010423325 A CN202010423325 A CN 202010423325A CN 111695602 B CN111695602 B CN 111695602B
Authority
CN
China
Prior art keywords
task
network
face
dimensional
beauty
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010423325.6A
Other languages
English (en)
Other versions
CN111695602A (zh
Inventor
甘俊英
吴必诚
翟懿奎
何国辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuyi University
Original Assignee
Wuyi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuyi University filed Critical Wuyi University
Priority to CN202010423325.6A priority Critical patent/CN111695602B/zh
Priority to PCT/CN2020/104560 priority patent/WO2021232582A1/zh
Priority to US17/424,403 priority patent/US11798266B2/en
Publication of CN111695602A publication Critical patent/CN111695602A/zh
Application granted granted Critical
Publication of CN111695602B publication Critical patent/CN111695602B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/776Validation; Performance evaluation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/778Active pattern-learning, e.g. online learning of image or video features
    • G06V10/7784Active pattern-learning, e.g. online learning of image or video features based on feedback from supervisors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/95Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了多维度任务人脸美丽预测方法、***及存储介质,其中方法包括:在训练阶段,使用第一人脸图像优化用于提取共享特征的共享特征提取网络和训练多个执行人脸美丽分类任务的分任务网络;在测试阶段,提取第二人脸图像的共享特征;输入共享特征至已训练的多个人脸美丽分类任务;结合多个人脸美丽分类任务的第一输出结果得到第一美丽预测结果。能有效解决人脸美丽预测过程中出现的数据样本不平衡的问题,提高人脸美丽预测的准确性。

Description

多维度任务人脸美丽预测方法、***及存储介质
技术领域
本发明涉及神经网络领域,特别是多维度任务人脸美丽预测方法、***及存储介质。
背景技术
在进行人脸美丽预测,由于现实中普通颜值的人数往往比起高颜值和低颜值人数占比更高,所以常常出现数据样本不平衡的问题。数据样本不平衡会使得分类器往多数类的样本倾斜,这使得分类器对于少数类样本分类效果不佳,且提高了整体数据样本的平均分类代价。
发明内容
本发明的目的在于至少解决现有技术中存在的技术问题之一,提供多维度任务人脸美丽预测方法、***及存储介质。
本发明解决其问题所采用的技术方案是:
本发明的第一方面,多维度任务人脸美丽预测方法,包括以下步骤:
训练阶段:
使用第一人脸图像优化用于提取共享特征的共享特征提取网络和训练多个执行人脸美丽分类任务的分任务网络,其中,所述第一人脸图像标记有反映人脸美丽等级的多维标签,所述多维标签用于监督所述共享特征提取网络,所述多维标签的每一维分别用于监督一个所述分任务网络;
测试阶段:
通过已训练的所述共享特征提取网络提取第二人脸图像的共享特征;
输入所述第二人脸图像的共享特征至已训练的多个所述分任务网络;
结合多个所述分任务网络的第一输出结果得到第一美丽预测结果。
根据本发明的第一方面,在所述训练阶段前,还包括以下步骤:
参数迁移阶段:
输入标记有人脸美丽等级标签的第三人脸图像至迁移网络,其中所述迁移网络包括共享特征层和分类器;
利用人脸美丽等级标签对所述迁移网络监督,并利用反向传播算法优化所述共享特征层和所述分类器的参数;
将所述共享特征层的参数迁移至网络框架,所述网络框架包括所述共享特征提取网络和多个所述分任务网络。
根据本发明的第一方面,在所述测试阶段前,还包括以下步骤:
验证阶段:
输入标记有所述多维标签的第四人脸图像至已训练的所述网络框架;
采集错误样本,所述错误样本是所述分任务网络分类错误所对应的所述第四人脸图像;
将所述错误样本重新输入至所述网络框架,并按次序优化每个所述分任务网络的参数。
根据本发明的第一方面,所述多维标签的每一维分别用于监督一个所述分任务网络具体为:判断一个所述分任务网络输出的第二输出结果与所述多维标签中对应的一维是否相同;计算代价值。
根据本发明的第一方面,第i个所述第一人脸图像的所述K维标签的第k维表示为
Figure BDA0002497765830000031
其中,yi∈{1,2…K,K+1},k∈{1,2,3…K},K为多维标签的总维数;则在监督过程中,所述分任务网络的代价值为:
Figure BDA0002497765830000032
所述分任务网络的代价敏感损失函数为:
Figure BDA0002497765830000033
其中,W(k)是所述人脸美丽分类任务的参数,σ(x)是sigmoid函数。
根据本发明的第一方面,在所述训练阶段中,利用反向传播算法循环地对多个所述分任务网络按次序优化每个所述分任务网络的参数。
根据本发明的第一方面,在每次优化一个所述分任务网络的参数的同时,优化所述共享特征提取网络的参数。
根据本发明的第一方面,结合多个所述人脸美丽分类任务的第一输出结果得到第一美丽预测结果具体为:将多个所述分任务网络的第一输出结果转换为与所述多维标签形式相同的集成结果;比较所述集成结果是否对应所述多维标签以判断所述集成结果是否错误;若所述集成结果对应所述多维标签,则将所述集成结果对应的人脸美丽等级作为所述第一美丽预测结果;若所述集成结果不对应所述多维标签,则根据多个所述第一输出结果修正所述集成结果,将修正后的所述集成结果对应的人脸美丽等级作为所述第一美丽预测结果。
本发明的第二方面,应用本发明第一方面所述的多维度任务人脸美丽预测方法的多维度任务人脸美丽预测***,包括:
共享特征提取网络,用于在训练阶段提取第一人脸图像的共享特征,以及在测试阶段提取第二人脸图像的共享特征,其中,所述第一人脸图像标记有用于反映人脸美丽等级的多维标签,所述多维标签的每一维均为布尔型;
多个分任务网络,每个所述分任务网络分别用于执行一个所述人脸美丽分类任务,所述多维标签的每一维分别用于监督一个所述人脸美丽分类任务;以及
预测结果输出网络,用于结合多个所述分任务网络的第一输出结果得到第一美丽预测结果。
本发明的第三方面,存储介质存储有可执行指令,可执行指令能被计算机执行,使所述计算机执行本发明第一方面所述的多维度任务人脸美丽预测方法。
上述方案至少具有以下的有益效果:将单个预测任务拆分为多个人脸美丽分类任务进行,利用单任务数据进行多任务预测学***衡的问题,提高人脸美丽预测的准确性。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
下面结合附图和实例对本发明作进一步说明。
图1是本发明实施例多维度任务多维度任务人脸美丽预测***的结构图;
图2是本发明实施例多维度任务人脸美丽预测方法的整体流程图;
图3是本发明实施例多维度任务人脸美丽预测方法的训练阶段的流程图;
图4是本发明实施例多维度任务人脸美丽预测方法的测试阶段的流程图;
图5是本发明实施例多维度任务人脸美丽预测方法的参数迁移阶段的流程图;
图6是本发明实施例多维度任务人脸美丽预测方法的验证阶段的流程图。
具体实施方式
本部分将详细描述本发明的具体实施例,本发明之较佳实施例在附图中示出,附图的作用在于用图形补充说明书文字部分的描述,使人能够直观地、形象地理解本发明的每个技术特征和整体技术方案,但其不能理解为对本发明保护范围的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
参照图2、图3和图4,本发明的某些实施例,提供了多维度任务人脸美丽预测方法,包括以下步骤:
训练阶段:
步骤S110、使用第一人脸图像优化用于提取共享特征的共享特征提取网络10和训练多个执行人脸美丽分类任务的分任务网络20,其中,第一人脸图像标记有反映人脸美丽等级的多维标签,多维标签用于监督共享特征提取网络10,多维标签的每一维分别用于监督一个分任务网络20;
测试阶段:
步骤S210、通过已训练的所述共享特征提取网络10提取第二人脸图像的共享特征;
步骤S220、输入第二人脸图像的共享特征至已训练的已训练的多个分任务网络20;
步骤S230、结合多个分任务网络20的第一输出结果得到第一美丽预测结果。
在该实施例中,将单个预测任务拆分为多个人脸美丽分类任务进行,利用单任务数据进行多任务预测学***衡的问题,提高人脸美丽预测的准确性。
以共享特征的形式保留各个人脸美丽分类任务之间的关联性,而且每个人脸美丽分类任务更加专门化。将用于反映人脸美丽等级的多维标签以排序方式拆分以用于多任务优化,思路与人脑神经将一个事物拆分为多个部件/多个步骤分别解决且每个部件/每个步骤间具有关联性相似,使得网络的泛化能力更强。
具体地,共享特征提取网络和分任务网络均采用CNN神经网络模型结构。
参照图2和图5,另外,在所述训练阶段前,还包括以下步骤:
参数迁移阶段:
步骤S310、输入标记有人脸美丽等级标签的第三人脸图像至迁移网络,其中所述迁移网络包括共享特征层和分类器;共享特征层具有与共享特征提取网络10相同的结构;其中人脸美丽等级标签直接用常数形式表示,例如1,2,3等;第三人脸图像采用与第一人脸图像相同的图像集;
步骤S320、利用人脸美丽等级标签对迁移网络监督,并利用反向传播算法优化共享特征层和分类器的参数;
步骤S330、将共享特征层的参数迁移至网络框架,网络框架包括共享特征提取网络10和多个分任务网络20。
参照图2和图6,另外,在所述测试阶段前,还包括以下步骤:
验证阶段:
步骤S410、输入标记有多维标签的第四人脸图像至经过所述训练阶段的所述网络框架;第四人脸图像不属于第一人脸图像;
步骤S420、采集错误样本,错误样本是分任务网络20分类错误所对应的第四人脸图像;
步骤S430、将错误样本重新输入至网络框架,并按次序优化每个分任务网络20的参数。
验证阶段能进一步提高网络的泛化能力。
进一步,在步骤S110中,多维标签的每一维分别用于监督一个分任务网络20具体为:判断一个分任务网络20输出的第二输出结果与多维标签中对应的一维是否相同;计算代价值。多维标签起到监督作用,在人脸美丽分类任务训练过程中,分类错误,则标签同样会产生错误。分类的误差程度越大,代价值越高;分类正确,则代价值为0。
需要说明的是,第一输出结果是测试阶段,分任务网络20输出的值;第二输出结果是训练阶段,分任务网络20输出的值。
进一步,对于设置了(K+1)种等级的人脸美丽程度,可以使用K维标签进行表示。第i个第一人脸图像的多维标签的第k维表示为
Figure BDA0002497765830000091
其中,yi是三维标签对应的人脸美丽等级,yi∈{1,2…K,K+1},k∈{1,2,3…K},K为多维标签的总维数。即例如对于一个三维标签,人脸美丽等级yi为1对应的三维标签表示为[0,0,0],人脸美丽等级yi为2对应的三维标签表示为[1,0,0],人脸美丽等级yi为3对应的三维标签表示为[1,1,0]。
则在监督过程中,分任务网络20的代价值具体为:
Figure BDA0002497765830000092
分任务网络20的代价敏感损失函数为:
Figure BDA0002497765830000093
其中,W(k)是分任务网络20的参数,σ(x)是sigmoid函数,xi是第i个输入的人脸图像。
进一步,在训练阶段中,利用反向传播算法循环地对多个人脸美丽分类任务按次序优化每个用于执行人脸美丽分类任务的分任务网络20的参数。这能防止多个人脸美丽分类任务之间的负迁移,使多个人脸美丽分类任务之间能尽量共享特征。
另外,在每次优化一个分任务网络20的参数的同时,优化用于提取第一人脸图像的共享特征的共享特征提取网络10的参数。
进一步,在测试阶段中,在步骤S230中,结合多个分任务网络20的第一输出结果得到第一美丽预测结果具体为:将多个分任务网络20的第一输出结果转换为与多维标签形式相同的集成结果;将集成结果与多维标签比较以判断集成结果是否错误;若错误则修正集成结果;将正确的集成结果对应的人脸美丽等级作为第一美丽预测结果。需要说明的是,经修正的集成结果被认为是正确的集成结果,判断结果为正确的集成结果同样是正确的集成结果,两者对应的人脸美丽等级均可作为第一美丽预测结果。
具体地,多个分任务网络20的第一输出结果按序排列,得到如[a,b,c…]的与多维标签形式相同的集成结果。
另外,若集成结果不与多维标签中的任何一个相同,即集成结果不对应多维标签,则判断集成结果错误。例如,多维标签包括[0,0,0]、[1,0,0]和[1,1,0]分别对应人脸美丽等级1、2和3。而集成结果为[0,1,0],则集成结果是错误的。其中第一个元素对应第一个人脸美丽分类任务,第二个元素对应第二个人脸美丽分类任务,第三个元素对应第三个人脸美丽分类任务。以出错的人脸美丽分类任务数量最少为标准进行校正,即校正集成结果的至少一个数字即可得到与多维标签对应的正确的结果,则只需要校正一个数字。选择置信度更低的一个人脸美丽分类任务对应的元素进行校正,由于是布尔型元素,则0校正为1,1校正为0即可。
参照图1,本发明的某些实施例,提供了多维度任务人脸美丽预测***,多维度任务人脸美丽预测***应用方法实施例的多维度任务人脸美丽预测方法,多维度任务人脸美丽预测***包括:
共享特征提取网络10,用于在训练阶段提取第一人脸图像的共享特征,以及在测试阶段提取第二人脸图像的共享特征,其中,第一人脸图像标记有用于反映人脸美丽等级的多维标签,多维标签的每一维均为布尔型;
多个分任务网络20,每个分任务网络分别用于执行一个人脸美丽分类任务,多维标签的每一维分别用于监督一个人脸美丽分类任务;以及
预测结果输出网络30,用于结合多个分任务网络20的第一输出结果得到第一美丽预测结果。
在该装置实施例中,多维度任务人脸美丽预测***应用如方法实施例所述的多维度任务人脸美丽预测方法,能执行人脸美丽预测方法的各个步骤,具有和人脸美丽预测方法相同的技术效果,在此不再详述。
本发明的某些实施例,提供了存储介质,存储介质存储有可执行指令,可执行指令能被计算机执行,使计算机执行如方法实施例所述的多维度任务人脸美丽预测方法。
存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。

Claims (9)

1.多维度任务人脸美丽预测方法,其特征在于,包括以下步骤:
训练阶段:
使用第一人脸图像优化用于提取共享特征的共享特征提取网络和训练多个执行人脸美丽分类任务的分任务网络,其中,所述第一人脸图像标记有反映人脸美丽等级的多维标签,所述多维标签用于监督所述共享特征提取网络,所述多维标签的每一维分别用于监督一个所述分任务网络;
测试阶段:
通过已训练的所述共享特征提取网络提取第二人脸图像的共享特征;
输入所述第二人脸图像的共享特征至已训练的多个所述分任务网络;
结合多个所述分任务网络的第一输出结果得到第一美丽预测结果;其中,结合多个所述分任务网络的第一输出结果得到第一美丽预测结果具体为:将多个所述分任务网络的第一输出结果按序排列以转换为与所述多维标签形式相同的集成结果;比较所述集成结果是否对应所述多维标签以判断所述集成结果是否错误;若所述集成结果对应所述多维标签,则将所述集成结果对应的人脸美丽等级作为所述第一美丽预测结果;若所述集成结果不对应所述多维标签,则根据多个所述第一输出结果修正所述集成结果,将修正后的所述集成结果对应的人脸美丽等级作为所述第一美丽预测结果;
所述根据多个所述第一输出结果修正所述集成结果具体为:以出错的人脸美丽分类任务数量最少为标准,对所述集成结果中的与置信度更低的一个人脸美丽分类任务对应的元素进行修正;
第i个所述第一人脸图像的所述多维标签的第k维表示为
Figure FDA0003005468480000021
其中,yi是三维标签对应的人脸美丽等级,yi∈{1,2…K,K+1},k∈{1,2,3…K},K为所述多维标签的总维数。
2.根据权利要求1所述的多维度任务人脸美丽预测方法,其特征在于,在所述训练阶段前,还包括以下步骤:
参数迁移阶段:
输入标记有人脸美丽等级标签的第三人脸图像至迁移网络,其中所述迁移网络包括共享特征层和分类器;
利用人脸美丽等级标签对所述迁移网络监督,并利用反向传播算法优化所述共享特征层和所述分类器的参数;
将所述共享特征层的参数迁移至网络框架,所述网络框架包括所述共享特征提取网络和多个所述分任务网络。
3.根据权利要求2所述的多维度任务人脸美丽预测方法,其特征在于,在所述测试阶段前,还包括以下步骤:
验证阶段:
输入标记有所述多维标签的第四人脸图像至经过所述训练阶段的所述网络框架;
采集错误样本,所述错误样本是所述分任务网络分类错误所对应的所述第四人脸图像;
将所述错误样本重新输入至所述网络框架,并按次序优化每个所述分任务网络的参数。
4.根据权利要求1至3任一项所述的多维度任务人脸美丽预测方法,其特征在于,所述多维标签的每一维分别用于监督一个所述分任务网络具体为:判断一个所述分任务网络输出的第二输出结果与所述多维标签中对应的一维是否相同;计算代价值。
5.根据权利要求4所述的多维度任务人脸美丽预测方法,其特征在于,在监督过程中,所述分任务网络的代价值为:
Figure FDA0003005468480000031
所述分任务网络的代价敏感损失函数为:
Figure FDA0003005468480000032
,其中,W(k)是所述人脸美丽分类任务的参数,σ(x)是sigmoid函数,Xi是第i个输入的人脸图像。
6.根据权利要求1所述的多维度任务人脸美丽预测方法,其特征在于,在所述训练阶段中,利用反向传播算法循环地对多个所述分任务网络按次序优化每个所述分任务网络的参数。
7.根据权利要求6所述的多维度任务人脸美丽预测方法,其特征在于,在每次优化一个所述分任务网络的参数的同时,优化所述共享特征提取网络的参数。
8.应用如权利要求1至7任一项所述的多维度任务人脸美丽预测方法的多维度任务人脸美丽预测***,其特征在于,包括:
共享特征提取网络,用于在训练阶段提取第一人脸图像的共享特征,以及在测试阶段提取第二人脸图像的共享特征,其中,所述第一人脸图像标记有用于反映人脸美丽等级的多维标签,所述多维标签的每一维均为布尔型;
多个分任务网络,每个所述分任务网络分别用于执行一个所述人脸美丽分类任务,所述多维标签的每一维分别用于监督一个所述人脸美丽分类任务;以及
预测结果输出网络,用于结合多个所述分任务网络的第一输出结果得到第一美丽预测结果。
9.存储介质,其特征在于,所述存储介质存储有可执行指令,可执行指令能被计算机执行,使所述计算机执行如权利要求1至7任一项所述的多维度任务人脸美丽预测方法。
CN202010423325.6A 2020-05-18 2020-05-18 多维度任务人脸美丽预测方法、***及存储介质 Active CN111695602B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010423325.6A CN111695602B (zh) 2020-05-18 2020-05-18 多维度任务人脸美丽预测方法、***及存储介质
PCT/CN2020/104560 WO2021232582A1 (zh) 2020-05-18 2020-07-24 多维度任务人脸美丽预测方法、***及存储介质
US17/424,403 US11798266B2 (en) 2020-05-18 2020-07-24 Multi-dimensional task facial beauty prediction method and system, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010423325.6A CN111695602B (zh) 2020-05-18 2020-05-18 多维度任务人脸美丽预测方法、***及存储介质

Publications (2)

Publication Number Publication Date
CN111695602A CN111695602A (zh) 2020-09-22
CN111695602B true CN111695602B (zh) 2021-06-08

Family

ID=72477201

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010423325.6A Active CN111695602B (zh) 2020-05-18 2020-05-18 多维度任务人脸美丽预测方法、***及存储介质

Country Status (3)

Country Link
US (1) US11798266B2 (zh)
CN (1) CN111695602B (zh)
WO (1) WO2021232582A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111695602B (zh) * 2020-05-18 2021-06-08 五邑大学 多维度任务人脸美丽预测方法、***及存储介质
CN112633295B (zh) * 2020-12-22 2024-06-18 深圳集智数字科技有限公司 面向循环任务的预测方法、装置、电子设备及存储介质
CN114973377A (zh) * 2022-06-09 2022-08-30 五邑大学 人脸美丽预测方法和装置、电子设备、存储介质
CN115410250A (zh) * 2022-08-01 2022-11-29 五邑大学 阵列式人脸美丽预测方法、设备及存储介质
CN118248167A (zh) * 2024-05-28 2024-06-25 深圳荣耀智能机器有限公司 检测方法、可读存储介质、程序产品及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101305913A (zh) * 2008-07-11 2008-11-19 华南理工大学 一种基于视频的人脸美丽评价方法
CN108280452A (zh) * 2018-01-26 2018-07-13 深圳市唯特视科技有限公司 一种基于并行网络构架的图像语义标签纠错方法
CN108960087A (zh) * 2018-06-20 2018-12-07 中国科学院重庆绿色智能技术研究院 一种基于多维度评估标准的人脸图像质量评估方法及***
CN110119689A (zh) * 2019-04-18 2019-08-13 五邑大学 一种基于多任务迁移学习的人脸美丽预测方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7024033B2 (en) * 2001-12-08 2006-04-04 Microsoft Corp. Method for boosting the performance of machine-learning classifiers
US8041082B1 (en) 2007-11-02 2011-10-18 Google Inc. Inferring the gender of a face in an image
US20120082371A1 (en) * 2010-10-01 2012-04-05 Google Inc. Label embedding trees for multi-class tasks
US10339685B2 (en) * 2014-02-23 2019-07-02 Northeastern University System for beauty, cosmetic, and fashion analysis
US11163860B2 (en) * 2018-06-04 2021-11-02 International Business Machines Corporation Protecting deep learning models using watermarking
CN109165674A (zh) * 2018-07-19 2019-01-08 南京富士通南大软件技术有限公司 一种基于多标签深度卷积网络的证件照分类方法
US20210303818A1 (en) * 2018-07-31 2021-09-30 The Regents Of The University Of Colorado, A Body Corporate Systems And Methods For Applying Machine Learning to Analyze Microcopy Images in High-Throughput Systems
US11126826B1 (en) * 2019-04-03 2021-09-21 Shallow.Ai Inc. Machine learning system and method for recognizing facial images
CN111985265B (zh) * 2019-05-21 2024-04-12 华为技术有限公司 图像处理方法和装置
CN110414489A (zh) * 2019-08-21 2019-11-05 五邑大学 一种基于多任务学习的人脸美丽预测方法
CN111695602B (zh) * 2020-05-18 2021-06-08 五邑大学 多维度任务人脸美丽预测方法、***及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101305913A (zh) * 2008-07-11 2008-11-19 华南理工大学 一种基于视频的人脸美丽评价方法
CN108280452A (zh) * 2018-01-26 2018-07-13 深圳市唯特视科技有限公司 一种基于并行网络构架的图像语义标签纠错方法
CN108960087A (zh) * 2018-06-20 2018-12-07 中国科学院重庆绿色智能技术研究院 一种基于多维度评估标准的人脸图像质量评估方法及***
CN110119689A (zh) * 2019-04-18 2019-08-13 五邑大学 一种基于多任务迁移学习的人脸美丽预测方法

Also Published As

Publication number Publication date
US11798266B2 (en) 2023-10-24
WO2021232582A1 (zh) 2021-11-25
US20220309770A1 (en) 2022-09-29
CN111695602A (zh) 2020-09-22

Similar Documents

Publication Publication Date Title
CN111695602B (zh) 多维度任务人脸美丽预测方法、***及存储介质
CN110348580B (zh) 构建gbdt模型的方法、装置及预测方法、装置
US20220092411A1 (en) Data prediction method based on generative adversarial network and apparatus implementing the same method
KR20210032140A (ko) 뉴럴 네트워크에 대한 프루닝을 수행하는 방법 및 장치
KR20210108319A (ko) 기계학습 기반 적응형 자동분류 방법 및 시스템
CN112948937B (zh) 一种混凝土强度智能预判断方法和装置
CN115080749B (zh) 一种基于自监督训练的弱监督文本分类方法、***和装置
CN111178196B (zh) 一种细胞分类的方法、装置及设备
CN113139570A (zh) 一种基于最优混合估值的大坝安全监测数据补全方法
CN111160526B (zh) 基于mape-d环形结构的深度学习***在线测试方法与装置
CN117523218A (zh) 标签生成、图像分类模型的训练、图像分类方法及装置
CN114741527A (zh) 基于多源异构医疗知识图谱的图表示学习方法及装置
CN114781688A (zh) 业扩项目的异常数据的识别方法、装置、设备及存储介质
CN113657510A (zh) 一种有标注价值的数据样本的确定方法及装置
CN116433050B (zh) 应用于农业大数据管理***的异常报警方法及***
CN111723010A (zh) 一种基于稀疏代价矩阵的软件bug分类方法
CN114912516B (zh) 一种协调特征一致性和特异性的跨域目标检测方法及***
CN116451081A (zh) 数据漂移的检测方法、装置、终端及存储介质
CN112433952B (zh) 深度神经网络模型公平性测试方法、***、设备及介质
CN114972282A (zh) 基于图像语义信息的增量学习无参考图像质量评价方法
CN114861922A (zh) 一种量子比特读取数据的分析方法、装置、设备及介质
CN113254428A (zh) 一种基于决策树的缺失数据填充方法及***
CN118260683B (zh) 一种基于大数据的反欺诈模型训练方法及***
US20230004863A1 (en) Learning apparatus, method, computer readable medium and inference apparatus
CN113837863B (zh) 一种业务预测模型创建方法、装置及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant