CN105894050A - 一种基于多任务学习的人脸图像种族和性别识别方法 - Google Patents

一种基于多任务学习的人脸图像种族和性别识别方法 Download PDF

Info

Publication number
CN105894050A
CN105894050A CN201610383915.4A CN201610383915A CN105894050A CN 105894050 A CN105894050 A CN 105894050A CN 201610383915 A CN201610383915 A CN 201610383915A CN 105894050 A CN105894050 A CN 105894050A
Authority
CN
China
Prior art keywords
task
picture
function
learning
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610383915.4A
Other languages
English (en)
Inventor
袁家政
赵新超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Union University
Original Assignee
Beijing Union University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Union University filed Critical Beijing Union University
Priority to CN201610383915.4A priority Critical patent/CN105894050A/zh
Publication of CN105894050A publication Critical patent/CN105894050A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/30Noise filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • G06V10/507Summing image-intensity values; Histogram projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/513Sparse representations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

一种基于多任务学习的人脸图像种族和性别识别方法,该方法涉及数字图像处理、模式识别、计算机视觉、生理学等技术领域,用于解决多种场合下基于静态图像或视频图像的人脸图像种族和性别识别问题。多任务学习方法是一种通过相关任务学习来提高学习性能的学习方法,既可以区分任务间学习的差异性,也可以共享任务间相关特征,通过相关性来提高学习能力,缓解高维小样本过学习问题。将多任务学习方法引入人脸图像种族和性别识别中,以不同语义作为不同任务,提出基于语义的多任务特征选择,应用于种族和性别识别,能显著提高学习***的泛化能力和识别效果。

Description

一种基于多任务学习的人脸图像种族和性别识别方法
技术领域
本发明是一种基于多任务学习的人脸图像种族和性别识别方法,该方法涉及数字图像处理、模式识别、计算机视觉、生理学等技术领域。
背景技术
人脸图像蕴含着丰富的信息,从模式识别的角度,可以进行种族识别、性别识别、身份识别等。
主成分分析法(Principle Component Analysis,PCA),其基本思想是通过K-L变换来提取样本的主要特征,通过解训练样本协方差矩阵的特征向量得到展开基,按特征值降序排序代表主成分的重要程度。Kirby(Turk,M.,Pentland,A.,Eigenface for Recognition[J].Journal of cognitive Neuroscience.Vol.3,No.1,1991,pp.1-17)等在1990年将PCA用于解决人脸识别问题,Turk(Kirby,M.,Sirovich,L.,Application of the Karhunen-Loeve procedure for the characterization of humanfaces[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1990,Vol.12,No.1,pp.103-108)等将之发展为特征脸(Eigenfaces),用于正面人脸识别,从此人脸子空间的方法得到研究者的重视。
支持向量机[42](Support Vector Machine,SVM)(Cortes,V.V.,Support vectornetworks[J].Machine Learning,Vol.20,1995,pp.273~297)是由Cortes和Vapnik于1995年提出用来解决手写识别问题的。它可以根据有限的样本信息在模型的复杂度和学习能力之间寻求最佳的折衷,以期得到最好的推广能力。
SVM的最终决策函数只由少数的支持向量所确定,计算的复杂度取决于支持向量的数目,而不是样本空间的维数,这不但可以帮助我们抓住关键样本、剔除大量冗余样本,而且方法简单,具有较好的鲁棒性,主要体现在:
1.增、删非支持向量样本对模型没有影响;
2.支持向量样本集具有一定的鲁棒性;
3.对核的选取相对不敏感。
SVM本质上是两类分类器。但面对多类问题,可以构造一对多,一对一和SVM决策树等方法。SVM决策树(SVM Decision Tree)将SVM和二叉决策树结合起来,构成多级分类器。
多任务学习方法是一种通过相关任务学习来提高学习性能的学习方法,既可以区分任务间学习的差异性,也可以共享任务间相关特征,通过相关性来提高学习能力,缓解高维小样本过学习问题。
发明内容
人脸图像包含的丰富语义为多任务学习的引入提供可能,我们将不同的语义作为不同的任务,提出了基于语义的多任务特征选择算法,对于给定的人脸图像训练集,提取特征后得到按任务排序的数据集,通过迭代求得最优的c个任务的稀疏系数W,W的每一列对应单个任务的稀疏系数,稀疏值绝对值越大,表明该维特征对所在任务识别的贡献率越大,按贡献值排序后即可实现对每种任务的特征进行选择。
此法主要包含训练部分和测试部分。训练部分是通过训练集和学习策略得到性别和种族的特征选择标签,在测试过程中选择不同的任务类标,经分类器后得到识别结果,经多次测量得到多任务特征选择的识别准确率。
一种基于多任务学习的人脸图像种族和性别识别方法,该方法包括如下步骤:
S1图片预处理
图片预处理是人脸识别流程中重要的一个环节,其主要目的是削弱甚至消除人脸图片中对识别无关的信息,滤除噪声干扰,增强有用信息的比重,便于后期提取更加有效的特征用于分类。本发明采用的图片预处理的方法主要包括:
(1)直方图均衡化:该方法将已知图片经过某种变换,使其灰度概率密度呈均勾分布,以此削弱光照不均匀变化的影响,从而增强图像整体对比度。直方图均衡化分三步:
a)统计原图像的直方图;
b)由原始图片的灰度直方图根据积分累计函数做变换生成新灰度直方图;
Sk=T(rk)=∑Pr(r)
其中,Sk表示变换后的图像灰度;r表示原始图像灰度;k表示灰度级编号;T(rk)表示变换函数;Pr(r)表示图像灰度级的概率密度函数。
c)用新灰度直方图代替原直方图,此时可使图片中各个像素值出现的概率相近。
(2)灰度拉伸:灰度拉伸是最基本的灰度变换方法之一,通过采用分段线性函数对原始图像灰度值的任一范围进行转换,使其变化到指定的区间,从而可以增大图像在某一区间的对比度。灰度拉伸分两步完成:
a)在原始图像上计算直方图,根据原始图像的直方图分布情况来确定灰度拉伸的拐点。
b)使用确定的分段线性函数将原像素灰度值映射成指定数值,以此代替原像素值。
通过该方法对人脸图片的像素值的指定范围进行映射,从而增强灰度值局部对比度。
(3)图像归一化:人脸图像归一化包含两个方面:
a)将人脸图片进行缩放或者旋转使其成为大小一致、人脸特征点位置大致相同的一批图片,这一步骤称为人脸图片的几何归一化。这是由于人脸图片在采集的过程中,一些物理位置的差异造成的如人脸拍摄距离不同或者人脸的拍摄角度差异。
b)消除在人脸图片采集过程中由于光照变化等带来的图片像素值差异较大的影响。对这一类差异我们可进行图像的灰度值归一化操作,以此削弱因光照或者拍摄角度不同引起的灰度值的差异。通过对图像进行归一化可以在很大程度上改善人脸识别***的性能,提高识别算法识别率,因此具有很重要的意义。
S2多任务标记
(1)从训练样本库中选择M幅人脸图片作为训练样本集,并进行预处理。
(2)对于给定的c个相关学习任务,训练集标记为:{(X1,y1),…,(Xc,yc)},其中:
表示第i个任务的训练样本;
表示第i个任务的类标;
n:表示第i个任务训练样本的个数;
d:表示训练样本的维数。
通过c个任务的共同学习,以期得到权重矩阵:W=[w1,…,wc]∈Rd*c为第i个任务的权值系数。
S3训练模型
假设Ji(wi,Xi,yi)=|wiXi-yi|为第i个任务的损失函数,通用的损失函数有:对数似然函数、指数似然函数和Hinge函数。
对于第i个任务,最小化经验误差的同时,使用范式得到优化问题如下:
m i n w i J i ( w i , X i , y i ) + λ | | w i | | 1
对单个任务来看,上述问题通常被称为LASSO(least absolute shrinkage andselection operator),即稀疏表示分类(sparse representation for classification,SRC)方法,LASSO是一个凸优化问题,不再具有解析解,但求解过程中会使wi中多项趋近于0,具有稀疏性,是l0正则化很好的近似(l0是NP难问题)。
单独求解c个任务的最优解与求解联合任务的全局目标函数一致,表述如下:
m i n w Σ i = 1 c J i ( w i , X i , y i ) + λ Σ i = 1 c | | w i | | 1
W = w 1 1 w 2 1 ... w c 1 w 1 2 w 2 2 ... w c 2 ... ... ... ... w 1 d w 2 d ... w c d
可见,在l1范数的约束下,各个任务之间是相互独立的,为了对全局特征进行特征选择,做如下改变后,得到l2范数约束下的目标函数表达形式:
min w Σ i = 1 c J i ( w i , X i , y i ) + λ Σ k = 1 d | | w k | | 2
W = w 1 1 w 2 1 ... w c 1 w 1 2 w 2 2 ... w c 2 ... ... ... ... w 1 d w 2 d ... w c d
直观可见l2范数下共享了各个任务之间的特征。从整个W来看,先计算wk的2范数,再求和,称为l1/l2范数。
通过迭代求得最优的c个任务的稀疏系数W,W的每一列对应单个任务的稀疏系数,稀疏值绝对值越大,表明该维特征对所在任务识别的贡献率越大,按贡献值排序后即可实现对每种任务的特征进行选择,最终得到最优模型。
S4模型测试
(1)从测试样本库中选择N幅人脸图片作为测试样本集,并进行预处理。
(2)将测试图片依次输入到训练好的模型中,同时对两个任务进行求解。
(3)对求解的类别得分进行排序,取最大值作为最终的预测类别。
(4)得出人脸图片的种族和性别的类别之后,可根据索引从对应的类标记文件中读取标记文本进行输出说明。
当下流行的机器学习算法理论都是在统一的模型下一次只学习一个任务,将复杂问题先分解成理论上独立的子问题,在每个子问题中,训练集中的样本只反映单个任务的信息。人脸图像蕴含着种族、性别、身份等信息,对应不同信息的识别任务间存在相关性,在学习过程中各个任务之间共享一定的相关信息。将多任务学习方法引入人脸图像种族和性别识别中,以不同语义作为不同任务,提出基于语义的多任务特征选择,应用于种族和性别识别,能显著提高学习***的泛化能力和识别效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是关于该发明方法的模型训练流程示意图;
图2是关于该发明方法的模型测试流程示意图;
图3是根据一示例性实施例示出的一组原始的训练样本图片集;
图4是根据一示例性实施例示出的一组经过预处理之后的样本图片集;
图5是根据一示例性实施例示出的一组测试结果示意图;
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。
以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的方法的例子。
在本发明中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。
在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
在本发明中使用的术语“和”、“或”是指包含一个或多个相关联的列出项目的任何或所有可能的组合。
在本发明可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不仅限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在......时”或“当......时”或“响应于......”。
以下结合附图,对本发明的具体实施例作进一步详细说明:
一种基于多任务学习的人脸图像种族和性别识别方法,该方法包括如下步骤:
S1图片预处理
图片预处理是人脸识别流程中重要的一个环节,其主要目的是削弱甚至消除人脸图片中对识别无关的信息,滤除噪声干扰,增强有用信息的比重,便于后期提取更加有效的特征用于分类。本发明采用的图片预处理的方法主要包括:
(1)直方图均衡化:该方法将已知图片经过某种变换,使其灰度概率密度呈均勾分布,以此削弱光照不均匀变化的影响,从而增强图像整体对比度。直方图均衡化分三步:
a)统计原图像的直方图;
b)由原始图片的灰度直方图根据积分累计函数做变换生成新灰度直方图;
Sk=T(rk)=∑Pr(r)
其中,Sk表示变换后的图像灰度;r表示原始图像灰度;k表示灰度级编号;T(rk)表示变换函数;Pr(r)表示图像灰度级的概率密度函数。
c)用新灰度直方图代替原直方图,此时可使图片中各个像素值出现的概率相近。
(2)灰度拉伸:灰度拉伸是最基本的灰度变换方法之一,通过采用分段线性函数对原始图像灰度值的任一范围进行转换,使其变化到指定的区间,从而可以增大图像在某一区间的对比度。灰度拉伸分两步完成:
a)在原始图像上计算直方图,根据原始图像的直方图分布情况来确定灰度拉伸的拐点。
b)使用确定的分段线性函数将原像素灰度值映射成指定数值,以此代替原像素值。
通过该方法对人脸图片的像素值的指定范围进行映射,从而增强灰度值局部对比度。
(3)图像归一化:人脸图像归一化包含两个方面:
a)将人脸图片进行缩放或者旋转使其成为大小一致、人脸特征点位置大致相同的一批图片,这一步骤称为人脸图片的几何归一化。这是由于人脸图片在采集的过程中,一些物理位置的差异造成的如人脸拍摄距离不同或者人脸的拍摄角度差异。
b)消除在人脸图片采集过程中由于光照变化等带来的图片像素值差异较大的影响。对这一类差异我们可进行图像的灰度值归一化操作,以此削弱因光照或者拍摄角度不同引起的灰度值的差异。通过对图像进行归一化可以在很大程度上改善人脸识别***的性能,提高识别算法识别率,因此具有很重要的意义。
S2多任务标记
(1)从训练样本库中选择M幅人脸图片作为训练样本集,并进行预处理。
(2)对于给定的c个相关学习任务,训练集标记为:{(X1,y1),…,(Xc,yc)},
其中:
表示第i个任务的训练样本;
表示第i个任务的类标;
n:表示第i个任务训练样本的个数;
d:表示训练样本的维数。
通过c个任务的共同学习,以期得到权重矩阵:W=[w1,…,wc]∈Rd*c为第i个任务的权值系数。
S3训练模型
假设Ji(wi,Xi,yi)=|wiXi-yi|为第i个任务的损失函数,通用的损失函数有:对数似然函数、指数似然函数和Hinge函数。
对于第i个任务,最小化经验误差的同时,使用范式得到优化问题如下:
min w i J i ( w i , X i , y i ) + λ | | w i | | 1
对单个任务来看,上述问题通常被称为LASSO(least absolute shrinkage andselection operator),即稀疏表示分类(sparse representation for classification,SRC)方法,LASSO是一个凸优化问题,不再具有解析解,但求解过程中会使wi中多项趋近于0,具有稀疏性,是l0正则化很好的近似(l0是NP难问题)。
单独求解c个任务的最优解与求解联合任务的全局目标函数一致,表述如下:
min w Σ i = 1 c J i ( w i , X i , y i ) + λ Σ i = 1 c | | w i | | 1
W = w 1 1 w 2 1 ... w c 1 w 1 2 w 2 2 ... w c 2 ... ... ... ... w 1 d w 2 d ... w c d
可见,在l1范数的约束下,各个任务之间是相互独立的,为了对全局特征进行特征选择,做如下改变后,得到l2范数约束下的目标函数表达形式:
min w Σ i = 1 c J i ( w i , X i , y i ) + λ Σ k = 1 d | | w k | | 2
W = w 1 1 w 2 1 ... w c 1 w 1 2 w 2 2 ... w c 2 ... ... ... ... w 1 d w 2 d ... w c d
直观可见l2范数下共享了各个任务之间的特征。从整个W来看,先计算wk的2范数,再求和,称为l1/l2范数。
通过迭代求得最优的c个任务的稀疏系数W,W的每一列对应单个任务的稀疏系数,稀疏值绝对值越大,表明该维特征对所在任务识别的贡献率越大,按贡献值排序后即可实现对每种任务的特征进行选择,最终得到最优模型。
S4模型测试
(1)从测试样本库中选择N幅人脸图片作为测试样本集,并进行预处理。
(2)将测试图片依次输入到训练好的模型中,同时对两个任务进行求解。
(3)对求解的类别得分进行排序,取最大值作为最终的预测类别。
(4)得出人脸图片的种族和性别的类别之后,可根据索引从对应的类标记文件中读取标记文本进行输出说明。

Claims (1)

1.一种基于多任务学习的人脸图像种族和性别识别方法,其特征在于:该方法包括如下步骤:
S1图片预处理
图片预处理是人脸识别流程中重要的一个环节,其主要目的是削弱甚至消除人脸图片中对识别无关的信息,滤除噪声干扰,增强有用信息的比重,便于后期提取更加有效的特征用于分类;本发明采用的图片预处理的方法主要包括:
(1)直方图均衡化:该方法将已知图片经过某种变换,使其灰度概率密度呈均勾分布,以此削弱光照不均匀变化的影响,从而增强图像整体对比度;直方图均衡化分三步:
a)统计原图像的直方图;
b)由原始图片的灰度直方图根据积分累计函数做变换生成新灰度直方图;
Sk=T(rk)=∑Pr(r)
其中,Sk表示变换后的图像灰度;r表示原始图像灰度;k表示灰度级编号;T(rk)表示变换函数;Pr(r)表示图像灰度级的概率密度函数;
c)用新灰度直方图代替原直方图,此时可使图片中各个像素值出现的概率相近;
(2)灰度拉伸:灰度拉伸是最基本的灰度变换方法之一,通过采用分段线性函数对原始图像灰度值的任一范围进行转换,使其变化到指定的区间,从而可以增大图像在某一区间的对比度;灰度拉伸分两步完成:
a)在原始图像上计算直方图,根据原始图像的直方图分布情况来确定灰度拉伸的拐点;
b)使用确定的分段线性函数将原像素灰度值映射成指定数值,以此代替原像素值;
通过该方法对人脸图片的像素值的指定范围进行映射,从而增强灰度值局部对比度;
(3)图像归一化:人脸图像归一化包含两个方面:
a)将人脸图片进行缩放或者旋转使其成为大小一致、人脸特征点位置大致相同的一批图片,这一步骤称为人脸图片的几何归一化;这是由于人脸图片在采集的过程中,一些物理位置的差异造成的如人脸拍摄距离不同或者人脸的拍摄角度差异;
b)消除在人脸图片采集过程中由于光照变化等带来的图片像素值差异较大的影响;对这一类差异我们可进行图像的灰度值归一化操作,以此削弱因光照或者拍摄角度不同引起的灰度值的差异;通过对图像进行归一化可以在很大程度上改善人脸识别***的性能,提高识别算法识别率,因此具有很重要的意义;
S2多任务标记
(1)从训练样本库中选择M幅人脸图片作为训练样本集,并进行预处理;
(2)对于给定的c个相关学习任务,训练集标记为:{(X1,y1),…,(Xc,yc)},
其中:
表示第i个任务的训练样本;
表示第i个任务的类标;
n:表示第i个任务训练样本的个数;
d:表示训练样本的维数;
通过c个任务的共同学习,以期得到权重矩阵:W=[w1,…,wc]∈Rd*c为第i个任务的权值系数;
S3训练模型
假设Ji(wi,Xi,yi)=|wiXi-yi|为第i个任务的损失函数,通用的损失函数有:对数似然函数、指数似然函数和Hinge函数;
对于第i个任务,最小化经验误差的同时,使用范式得到优化问题如下:
m i n w i J i ( w i , X i , y i ) + λ | | w i | | 1
对单个任务来看,上述问题通常被称为LASSO(least absolute shrinkage andselection operator),即稀疏表示分类(sparse representation for classification,SRC)方法,LASSO是一个凸优化问题,不再具有解析解,但求解过程中会使wi中多项趋近于0,具有稀疏性,是l0正则化很好的近似(l0是NP难问题);
单独求解c个任务的最优解与求解联合任务的全局目标函数一致,表述如下:
m i n W Σ i = 1 c J i ( w i , X i , y i ) + λ Σ i = 1 c | | w i | | 1
W = w 1 1 w 2 1 ... w c 1 w 1 2 w 2 2 ... w c 2 ... ... ... ... w 1 d w 2 d ... w c d
可见,在l1范数的约束下,各个任务之间是相互独立的,为了对全局特征进行特征选择,做如下改变后,得到l2范数约束下的目标函数表达形式:
min W Σ i = 1 c J i ( w i , X i , y i ) + λ Σ k = 1 d | | w k | | 2
W = w 1 1 w 2 1 ... w c 1 w 1 2 w 2 2 ... w c 2 ... ... ... ... w 1 d w 2 d ... w c d
直观可见l2范数下共享了各个任务之间的特征;从整个W来看,先计算wk的2范数,再求和,称为l1/l2范数;
通过迭代求得最优的c个任务的稀疏系数W,W的每一列对应单个任务的稀疏系数,稀疏值绝对值越大,表明该维特征对所在任务识别的贡献率越大,按贡献值排序后即可实现对每种任务的特征进行选择,最终得到最优模型;
S4模型测试
(1)从测试样本库中选择N幅人脸图片作为测试样本集,并进行预处理;
(2)将测试图片依次输入到训练好的模型中,同时对两个任务进行求解;
(3)对求解的类别得分进行排序,取最大值作为最终的预测类别;
(4)得出人脸图片的种族和性别的类别之后,可根据索引从对应的类标记文件中读取标记文本进行输出说明。
CN201610383915.4A 2016-06-01 2016-06-01 一种基于多任务学习的人脸图像种族和性别识别方法 Pending CN105894050A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610383915.4A CN105894050A (zh) 2016-06-01 2016-06-01 一种基于多任务学习的人脸图像种族和性别识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610383915.4A CN105894050A (zh) 2016-06-01 2016-06-01 一种基于多任务学习的人脸图像种族和性别识别方法

Publications (1)

Publication Number Publication Date
CN105894050A true CN105894050A (zh) 2016-08-24

Family

ID=56709167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610383915.4A Pending CN105894050A (zh) 2016-06-01 2016-06-01 一种基于多任务学习的人脸图像种族和性别识别方法

Country Status (1)

Country Link
CN (1) CN105894050A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203752A (zh) * 2017-05-25 2017-09-26 四川云图睿视科技有限公司 一种联合深度学习和特征二范数约束的人脸识别方法
CN108320272A (zh) * 2018-02-05 2018-07-24 电子科技大学 图像去光的方法
CN108319940A (zh) * 2018-04-12 2018-07-24 Oppo广东移动通信有限公司 人脸识别处理方法、装置、设备及存储介质
CN109214350A (zh) * 2018-09-21 2019-01-15 百度在线网络技术(北京)有限公司 一种光照参数的确定方法、装置、设备及存储介质
CN109344872A (zh) * 2018-08-31 2019-02-15 昆明理工大学 一种少数民族服装图像的识别方法
CN110135442A (zh) * 2019-05-20 2019-08-16 驭势科技(北京)有限公司 一种特征点提取算法的评价***与方法
CN110148085A (zh) * 2019-04-22 2019-08-20 智慧眼科技股份有限公司 人脸图像超分辨率重建方法及计算机可读取的存储介质
WO2019183758A1 (en) * 2018-03-26 2019-10-03 Intel Corporation Methods and apparatus for multi-task recognition using neural networks
CN111626303A (zh) * 2020-05-29 2020-09-04 南京甄视智能科技有限公司 性别和年龄的识别方法、装置、存储介质及服务器
CN112287966A (zh) * 2020-09-21 2021-01-29 深圳市爱深盈通信息技术有限公司 一种人脸识别方法、装置及电子设备
WO2021151296A1 (zh) * 2020-07-22 2021-08-05 平安科技(深圳)有限公司 多任务分类方法、装置、计算机设备及存储介质
CN113486946A (zh) * 2021-07-01 2021-10-08 有米科技股份有限公司 基于图像数据的服装商品性别分类方法及装置
CN113516286A (zh) * 2021-05-14 2021-10-19 山东建筑大学 基于多粒度任务联合建模的学生学业预警方法及***
CN113486946B (zh) * 2021-07-01 2024-07-02 有米科技股份有限公司 基于图像数据的服装商品性别分类方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914683A (zh) * 2013-12-31 2014-07-09 闻泰通讯股份有限公司 基于人脸图像的性别识别方法及***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103914683A (zh) * 2013-12-31 2014-07-09 闻泰通讯股份有限公司 基于人脸图像的性别识别方法及***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李杨: "基于多任务学习的人脸图像识别", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
沈慧钧: "关于人脸识别图像预处理方法的研究与实现", 《科技与创新》 *

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107203752A (zh) * 2017-05-25 2017-09-26 四川云图睿视科技有限公司 一种联合深度学习和特征二范数约束的人脸识别方法
CN108320272A (zh) * 2018-02-05 2018-07-24 电子科技大学 图像去光的方法
WO2019183758A1 (en) * 2018-03-26 2019-10-03 Intel Corporation Methods and apparatus for multi-task recognition using neural networks
US11106896B2 (en) 2018-03-26 2021-08-31 Intel Corporation Methods and apparatus for multi-task recognition using neural networks
CN108319940A (zh) * 2018-04-12 2018-07-24 Oppo广东移动通信有限公司 人脸识别处理方法、装置、设备及存储介质
CN109344872A (zh) * 2018-08-31 2019-02-15 昆明理工大学 一种少数民族服装图像的识别方法
CN109214350A (zh) * 2018-09-21 2019-01-15 百度在线网络技术(北京)有限公司 一种光照参数的确定方法、装置、设备及存储介质
CN110148085A (zh) * 2019-04-22 2019-08-20 智慧眼科技股份有限公司 人脸图像超分辨率重建方法及计算机可读取的存储介质
CN110135442A (zh) * 2019-05-20 2019-08-16 驭势科技(北京)有限公司 一种特征点提取算法的评价***与方法
CN110135442B (zh) * 2019-05-20 2021-12-14 驭势科技(北京)有限公司 一种特征点提取算法的评价***与方法
CN111626303A (zh) * 2020-05-29 2020-09-04 南京甄视智能科技有限公司 性别和年龄的识别方法、装置、存储介质及服务器
CN111626303B (zh) * 2020-05-29 2021-04-13 南京甄视智能科技有限公司 性别和年龄的识别方法、装置、存储介质及服务器
WO2021151296A1 (zh) * 2020-07-22 2021-08-05 平安科技(深圳)有限公司 多任务分类方法、装置、计算机设备及存储介质
CN112287966A (zh) * 2020-09-21 2021-01-29 深圳市爱深盈通信息技术有限公司 一种人脸识别方法、装置及电子设备
CN113516286A (zh) * 2021-05-14 2021-10-19 山东建筑大学 基于多粒度任务联合建模的学生学业预警方法及***
CN113516286B (zh) * 2021-05-14 2024-05-10 山东建筑大学 基于多粒度任务联合建模的学生学业预警方法及***
CN113486946A (zh) * 2021-07-01 2021-10-08 有米科技股份有限公司 基于图像数据的服装商品性别分类方法及装置
CN113486946B (zh) * 2021-07-01 2024-07-02 有米科技股份有限公司 基于图像数据的服装商品性别分类方法及装置

Similar Documents

Publication Publication Date Title
CN105894050A (zh) 一种基于多任务学习的人脸图像种族和性别识别方法
CN109583322B (zh) 一种人脸识别深度网络训练方法和***
CN108564129B (zh) 一种基于生成对抗网络的轨迹数据分类方法
Chherawala et al. Feature set evaluation for offline handwriting recognition systems: application to the recurrent neural network model
CN111915437B (zh) 基于rnn的反洗钱模型的训练方法、装置、设备及介质
CN106599941A (zh) 基于卷积神经网络与支持向量机的手写数字识别方法
CN110046634B (zh) 聚类结果的解释方法和装置
CN109492075B (zh) 一种基于循环生成对抗网络的迁移学习排序方法
CN104573672B (zh) 一种基于邻域保持的鉴别嵌入人脸识别方法
CN106096517A (zh) 一种基于低秩矩阵与特征脸的人脸识别方法
CN104281572B (zh) 一种基于互信息的目标匹配方法及其***
US20230101817A1 (en) Systems and methods for machine learning-based data extraction
CN109961093A (zh) 一种基于众智集成学习的图像分类方法
WO2010062268A1 (en) A method for updating a 2 dimensional linear discriminant analysis (2dlda) classifier engine
CN114444600A (zh) 基于记忆增强原型网络的小样本图像分类方法
CN105930792A (zh) 一种基于视频局部特征字典的人体动作分类方法
Zhang et al. Large-scale aerial image categorization using a multitask topological codebook
CN111931562A (zh) 一种基于软标签回归的无监督特征选择方法和***
CN111898704A (zh) 对内容样本进行聚类的方法和装置
CN113095229B (zh) 一种无监督域自适应行人重识别***及方法
Law Clustering, dimensionality reduction, and side information
Wang et al. Interpret neural networks by extracting critical subnetworks
CN110287973B (zh) 一种基于低秩鲁棒线性鉴别分析的图像特征提取方法
Xiao et al. An improved siamese network model for handwritten signature verification
Yu et al. Research on face recognition method based on deep learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160824