CN105095833B - 用于人脸识别的网络构建方法、识别方法及*** - Google Patents
用于人脸识别的网络构建方法、识别方法及*** Download PDFInfo
- Publication number
- CN105095833B CN105095833B CN201410193260.5A CN201410193260A CN105095833B CN 105095833 B CN105095833 B CN 105095833B CN 201410193260 A CN201410193260 A CN 201410193260A CN 105095833 B CN105095833 B CN 105095833B
- Authority
- CN
- China
- Prior art keywords
- matrix
- value
- layer
- picture
- face
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提出了一种用于人脸性别识别或年龄估计的深层网络构建方法,所述方法包含:步骤101)将所有的训练图片划分为若干组;步骤102)基于卷积神经网络提取一组训练图片的高层特征,进而得到由高层特征向量组成的第一矩阵;同时基于人工神经网络提取同一组训练图片的低层和全局特征,进而得到低层特征向量组成的第二矩阵;基于提取的第一矩阵、第二矩阵和定义的判决公式得到一组性别识别或者年龄估计的结果;其中定义的判决公式中的第一权值矩阵w1、第二权值矩阵w2、偏置矩阵b和调节权重β的值利用误差反向传播算法更新,获得这些参数的最终取值,完成网络构建。基于网络构建完成时确定的参数的值确定的判决公式进行待识别人脸的年龄和性别的判决。
Description
技术领域
本发明涉及计算机视觉及深度学习技术领域,特别涉及一种用于人脸识别的网络构建方法、识别方法及***。
背景技术
人脸作为一个对计算机来说识别和分析都非常困难的物体,从20世纪90年代开始就引起了研究者们的广泛关注。而成功有效的人脸分析在智能监控,视频索引以及人口信息统计等领域又存在着巨大的应用前景。人脸分析主要包括人脸的性别识别和人脸的年龄估计,性别分类的准确率和年龄估计的平均绝对误差分别是两者的关键性指标。
目前存在的人脸分析领域的相关研究,都是基于人为“手工”确定特征描述子来表示人脸,结合分类器算法或者回归算法展开。人工选定特征往往耗费大量的前期准备时间,具有主观性,且选取出来的特征往往在某一类数据上表现良好,而扩展到另外的数据时性能会有显著下降,泛化能力较弱。而实际应用时,传统方法的弱泛化能力恰好在质量较低的图片(强光照图片、存在背景干扰图片、歪脸侧脸图片)上性能不佳,满足不了实际应用的需求。目前人脸分析领域的研究受限于这一瓶颈而发展缓慢。另一方面,近年来,基于深度学***,例如人脸检测,行人检测以及人脸识别等;而深度信念网络算法主要在语音识别领域的应用较多,效果较好;深层稀疏自编码算法则更多的被应用于数据降维类的问题。
卷积神经网络本质是一种深层的神经网络结构,其算法的基本原理和特点是网络结构由两种重要的部分组成:卷积处理单元构成的卷积层,以及下采样处理单元构成的下采样层。卷积层和下采样层由神经元组成二维结构,对同样是二维结构的输入图像分别进行卷积处理和下采样处理,然后重复卷积和下采样,直到提取出图像的“理想”(根据研究应用需要确定)特征后,再进行分类或者回归或者检测。当输入图像为N×N大小时,首先连接卷积层C1,C1中每一个神经元只与上一层的一块局部接收域(又称作卷积核,filter)相连。假设卷积核的大小为m×m,那么C1层将会用这m×m的卷积核卷积输入图片所有可能的(N-m+1)×(N-m+1)位置的像素点,生成一张(N-m+1)×(N-m+1)的局部特征图。输入图片每一块m×m大小区域内的所有像素点与C1层中一个神经元相连,且这m×m个连接采取相同的权值(即权值共享机制)。当使用多个不同权值的连接方式生成多张局部特征图时,C1层就提取出原图的不同局部特征。接着C1层的局部特征图连接至下一层的下采样层S1。假设C1层有F1张特征图,那么对应C1层也有F1张下采样图,且与C1层的特征图一一对应。S1层每一张图中的每一个神经元连接这上一层的一块局部域,且没有重叠,然后计算这块区域内所有值的平均值作为采样层的值。假设C1层中每张特征图的大小为(N-m+1)×(N-m+1),局部连接区域大小为n×n,那么S1层每一张下采样图的大小即为(N-m+1)/n×(N-m+1)/n。这样即实现了对上一层特征图的下采样,降低空间分辨率。然后S1层再与一个新的卷积层C2层连接,C2层与S2层连接,如此交叉反复,根据实际需要确定卷积层的个数和下采样层的个数。最后网络的输出称作输出层,根据问题的不同可能是输出不同的类别,也可能是输出回归估计的概率。
然而,卷积神经网络的卷积+下采样处理方式虽然能够提取目标物体的高层、抽象的特征,用于某些分类问题时取得了很好的效果,但忽略了一些低层却对分类有效的特征和信息。且卷积+下采样处理提取到的特征图描述的主要是物体的局部特征和局部关联性,缺少对物体整体特征的表现。解决人脸性别识别和人脸年龄估计问题时,恰恰需要对人脸进行全方位、多层次的特征提取和描述,才能够获得准确、全面的信息。
基于上述,在人脸分析领域应用传统的“手工”确定特征描述子的方法,或者直接应用卷积神经网络(包括现有的其它深度学习的方法),它们性能和最终的效果都不能满足实际应用的需要。本发明应用全新的基于多特征深度学习的方法进行人脸分析,构建训练深层的网络,“自动”地学习、提取到人脸的分层次、全方位的特征,形成一种多特征(高层、低层,抽象、具体)的结构描述表示人脸。这样的多特征结构应用于最终的性别分类和年龄估计时取得了非常好的效果。
在现有技术中尚缺乏此类方法或***。
发明内容
本发明的目的在于,为克服现有人脸分析的技术中的传统方法的性能满足不了实际应用需要的缺陷,从而提出一种用于人脸识别的网络构建方法、及基于该构建网络的人脸识别方法及***。
为了实现上述目的,本发明提供一种用于人脸性别识别或年龄估计的深层网络构建方法,所述方法包含:
步骤101)将所有的训练图片划分为若干组;
步骤102)基于卷积神经网络提取一组训练图片的高层特征,进而得到由高层特征向量组成的第一矩阵;同时基于人工神经网络提取同一组训练图片的低层和全局特征,进而得到低层特征向量组成的第二矩阵;
基于提取的第一矩阵、第二矩阵和如下判决公式得到一组性别识别或者年龄估计的结果:
o=sigm(w1*hfo+β×w2*lfo+b)
其中,hfo表示第一矩阵;lfo表示第二矩阵;针对输入的第一组训练图片上述公式中的第一权值矩阵w1、第二权值矩阵w2、偏置矩阵b和调节权重β的初值采用随机初始化方式获得;针对输入的其余各组的训练图片上述公式中的w1、w2、b和β的获取方法为:利用误差反向传播算法计算判决结果o与各组训练图片的实际标签矩阵Y的误差函数J(W,b;β),再通过计算w1、w2、b和β对误差函数J(W,b;β)的梯度进而更新参数w1、w2、b和β的值;
步骤103)再输入一组训练图片,并对再次输入的训练图片重复执行上述步骤102),直至所有的分组均被进行了步骤102)的处理,完成一次训练迭代;
步骤104)将所有的训练图片重新划分为若干组,并对重新划分的各组重复执行上述步骤102)和步骤103),完成再次迭代;
经过若干重新分组和迭代处理,直至最终输出的判决o满足设定的条件时,得到最终的参数w1、w2、b和β的值,完成网络构建。
可选的,进行低层特征提取时进一步包含:
步骤102-11)将输入的一组训练图片的每一张训练图片由二维的图结构形式转化为向量的形式,再对向量进行归一化,得到每一张训练图片的原始特征向量;
步骤102-12)将得到的每一张训练图片的原始向量输入人工神经网络,进而得到一组重建特征向量,即得到所述的第二矩阵;其中,所述人工神经网络包含L层,且层与层之间采用全连接方式,每一层的各神经元采用sigmoid函数激活。
可选的,针对一张输入训练图片的性别或年龄识别过程具体包含:
步骤102-21)当提取的一张训练图片的高层特征向量为Hf维的高层特征向量,且低层特征向量为Lf维的特征向量时,构造一个包含“Hf+Lf”个神经元的联合表决层;
步骤102-22)当用于性别识别时,将构造的联合表决层的各个神经元分别与输出层的两个输出神经元相连,且每个输出神经元基于所述判决公式进行性别判别,输出训练图片为男性或女性的概率;当用于年龄估计时,联合表决层的各个神经元与输出层的S个输出神经元相连,其中每个输出神经元对应一岁。
可选的,采用如下公式的误差反向传播算法更新第一权值矩阵w1的值:
其中,(w1)new表示在每一次的误差反向传播时更新后的第一权值矩阵w1的值,(w1)old对应更新前的第一权值矩阵w1的值,Od表示输出层灵敏度矩阵,该输出层灵敏度矩阵采用误差函数J(W,b;β)结合判决结果o求出;α表示网络的学习率,其中将α的取值初始化为一个较大的值,然后随训练迭代次数的增加而逐渐减小;
通过如下公式更新第二权值矩阵w2的值:
其中,(w2)new表示在每一次的误差反向传播时更新后的第二权值矩阵w2的值,(w2)old对应更新前的第二权值矩阵w2的值。
可选的,所述β的值在每一次训练迭代中更新方法为:
其中,βnew表示在每一次的误差反向传播时更新后的调节权重β的值,βold对应更新前的调节权重β的值;
上述公式中求偏导的部分可由如下公式得到:
其中,f′(o)表示对判决结果o求导,“mean(B(:))”表示对矩阵B中所有元素取平均值运算;矩阵B表示由在每一次的误差反向传播时更新后的调节权重β的值构成的矩阵,该矩阵B的行列数与判决结果o的行列数相同。
基于上述构建的深层网络,本发明还提供了一种用于人脸的年龄或性别的识别方法,所述方法包含:
用于基于卷积神经网络提取待识别人脸图片的高层特征;
用于基于人工神经网络提取待识别人脸图片的低层和全局特征;
用于将提取的低层特征和高层特征输入如下的判决公式,进行性别或者年龄判决,输出判决结果:
o=sigm(w1*hfo+β×w2*lfo+b)
其中,上述公式中的第一权值矩阵w1、第二权值矩阵w2、β和b为深层网络构建方法确定的值,hfo表示提取的待识别人脸的高层特征向量,lfo表示提取的待识别人脸的低层特征向量,o表示性别或年龄的判决结果。
采用如下步骤提取低层特征:
用于将输入的待识别的人脸图片进行扁平化处理并归一化后,得到人脸的原始特征向量;
用于将原始特征向量输入人工神经网络,通过多层神经元结构对输入向量进行重建,得到一个Lf维的特征向量作为提取的低层特征向量。
此外,本发明提供了一种用于人脸的年龄或性别的识别***,所述***包含:
高层特征提取模块,用于基于卷积神经网络提取待识别人脸图片的高层特征;
低层特征提取模块,用于基于人工神经网络提取待识别人脸图片的低层和全局特征;
基于神经网络的判决模块,用于将提取的低层特征和高层特征输入如下的判决公式,进行性别或者年龄判决,输出判决结果:
o=sigm(w1*hfo+β×w2*lfo+b)
其中,上述公式中的第一权值矩阵w1、第二权值矩阵w2、β和b为完成针对训练图片的若干次迭代后获取(即上述网络构建完成时得到的各参数的最终取值),hfo表示提取的待识别人脸的高层特征向量,lfo表示提取的待识别人脸的低层特征向量,o表示性别或年龄的判决结果。
可选的,上述低层特征提取模块进一步包含:
扁平化处理模块,用于将输入的待识别的人脸图片进行扁平化处理并归一化后,得到人脸的原始特征向量;
重建特征向量获取模块,用于将原始特征向量输入人工神经网络,通过多层神经元结构对输入向量进行重建,得到一个Lf维的特征向量作为提取的低层特征向量。
可选的,上述判决模块进一步包含:
联合表决层模块,用于融合提取到的高层特征和低层特征,输出一种多特征结构;
输出层模块,用于采用若干输出神经元进行性别判决或年龄判决,所述的各个神经元基于所述判决公式进行判决。
与传统的“手工”确定特征描述子的方法相比,本发明的技术优势在于:
本发明提供的深层网络能够“自动”学习人脸的特征,并且学习到的特征具有分层结构,这样的特征对数据本身有着更本质的刻画,所以最终使用这样的特征进行分类和回归估计时的效果也更好。进一步,与现有的深度学习的方法相比,本发明的深层网络不仅能学习到人脸的高层抽象特征,同时学习了人脸的低层全局特征,结合两种全方位、多层次的描述表示人脸,这样最终的分类和回归估计时,本发明的性能比只提取了单独的高层特征的现有深度学习的方法要更好。本发明这种基于多特征的深度学习的方法在应用于人脸分析领域时,不仅具有极强的学习能力,还有极强的泛化能力。在测试公共数据集的高质量标准人脸图片,质量较低的网络人脸图片以及监控设备采集的实际人脸图片时,都取得了超过现有技术的性能。故本发明能够满足实际人脸分析应用的需要。
附图说明
图1为本发明提供的人脸性别识别流程图;
图2为本发明提供的人脸年龄估计流程图;
图3为本发明实施实例提供的人脸分析***的结构示意图。
具体实施方式
现结合附图对本发明作进一步的描述。
本发明给出了一种基于多特征深度学习的人脸分析方法,包括:
步骤1)、对图片进行人脸检测和预处理。
步骤2)、对步骤1)得到的人脸图片进行人脸分析,分别输入到人脸性别识别深层网络和人脸年龄估计深层网络。
步骤3)、人脸性别识别深层网络输出预测的人脸图片的性别,男或女;人脸年龄估计深层网络输出估计的人脸图片的年龄整数值,多少岁。
一、人脸性别识别网络的构建:
上述技术方案中,所述的步骤2)提供了一种人脸性别识别方法,如图1所示,即一种用于人脸性别识别的深层网络***,包括:
步骤2-1)以步骤1)中得到的人脸图片作为网络的输入,网络的输出为图片中人的性别预测值(男或女)。网络主要由4部分功能模块组成,包括高层特征提取模块,低层特征提取模块,融合特征联合判决输出模块以及参数训练模块。
上述方案中,所述步骤2-1)具体包括如下步骤:
步骤2-1-1)、高层特征提取:直接采用现有深度学习方法中的卷积神经网络的卷积层和下采样层结构实现对输入训练图片的高层特征提取。在具体实施时,采用3层卷积层C1,C2和C3,以及两层下采样层S1,S2的组合,层与层之间全连接。
步骤2-1-2)、低层特征提取:与高层特征提取模块同步对输入训练图像进行处理。
首先,将输入的人脸的训练图片由二维的图结构形式转化为向量的形式(称为扁平化处理,flat操作)。对输入图片进行flat操作后再对得到的向量进行归一化,得到人脸的原始特征向量。
然后,将原始特征向量连接到重建网络以获得重建特征向量。重建网络基于人工神经网络原理搭建,共L层。每一层的神经元输出即可看作是特征向量,下一层的神经元对上一层输出的向量进行重新编码,进行重新表示和描述后再输出,层与层之间采取全连接的方式,每一个神经元采用sigmoid函数进行激活。原始特征向量首先连接至重建网络的H1层,H1层含有h1个神经单元,假设输入图片大小为N×N,那么人脸原始特征向量为N×N维,经过H1层后变为h1维特征向量。然后接着连接至H2层,H2层含有h2个神经单元,那么特征向量进一步变为h2维。以此类推,根据实际需要,最后连接至Hn层,得到一个hn维的特征向量。层与层之间的连接用数学公式表达为:
al+1=sigm(Wl·al+bl) (1)
其中“sigm()”表示sigmoid函数的矩阵形式(即对矩阵中每一个元素进行sigmoid函数激活),al+1及al分别表示第(l+1)层和第l层的输出的矩阵形式(此处即为特征向量),Wl为连接第(l+1)层和第l层之间神经元的权值矩阵,bl表示第l层的偏置矩阵。
这个hn维的特征向量即是重建网络的输出,也即重建特征向量。重建特征向量剔除了人脸原始特征向量中对性别分类无效的冗余信息,减少了部分噪声干扰,能够较好的刻画人脸的低层和全局特征。
步骤2-1-3)、联合判决输出:联合提取到的高层特征与低层特征一起进行最终的性别判决,输出性别预测值(男或女)。
高层特征提取部分得到的高层特征图进行flat操作后转化为向量形式,与低层特征提取得到的重建特征向量连接在一起构成联合表决层,联合表决层仍然基于人工神经网络原理与上一层相连。假设高层特征提取最后得到了G张q×q大小的特征图,那么转化为向量后可得到一个G×q×q维高层特征向量;重建特征向量为hn维;那么联合表决层中即含有(G×q×q+hn)个神经元,对高层特征向量和重建特征向量进行融合,形成一种多特征结构形式的向量。联合表决层的输出即是我们整个网络提取到的多特征结构的(G×q×q+hn)维特征向量。
联合表决层再全连接到最终的输出神经元,输出神经元有两个(男女两类),输出的是最终结果某一类的概率pi,输出神经元采用sigmoid函数激活,那么每一类的概率可表示为:
其中表示联合表决层第k个神经元的输出,表示联合表决层第i个神经元与输出层第k个神经元的连接权值,为输出层对应偏置。
因为整个网络的每次输入多张训练图片(参数训练部分会有相应说明),故本发明定义的网络的判决输出结果的矩阵形式为:
o=sigm(w1*hfo+w2*lfo+b) (3)
其中,o表示网络输出的判决结果(每一列表示一个样本的判决结果);w1表示输出层与高层特征提取部分的输出相连的权值矩阵,即第一权值矩阵;“*”表示矩阵乘法,hfo表示高层特征提取部分的输出(每一列表示一个样本的输出);w2表示输出层与低层特征提取部分的输出相连的权值矩阵,即第二权值矩阵;lfo表示低层特征提取部分的输出矩阵(每一列表示一个样本的输出);b表示输出层偏置矩阵。
考虑到两种特征对最后结果的影响,在表示低层特征的重建特征向量中加入一个调节权重β,0≤β≤1,进行调节,低层特征对最终结果的判定的影响得到一定程度的抑制。则最终网络输出的判决结果为:
o=sigm(w1*hfo+β×w2*lfo+b) (4)
步骤2-1-4)、采用训练方法获取参数w1、w2、b和β的最终取值:人工神经网络,深度学习的基本理论分为网络的设计和网络中参数的训练两部分。当设计好网络的结构后(即获得上述高层特征、低层特征、及判决公式),需要训练确定网络中每一个参数的值(即确定w1、w2、b和β的值,以及卷积层和下采样层中的参数的值,人工神经网络中L层中的各神经元的参数的值),然后才能使用该网络对待识别的人脸图片进行实际的分类和回归等应用。
所述训练方法采取误差反向传播算法,同时考虑到深度学习需要大量训练样本支持,为减少计算负荷,结合随机梯度下降策略进行训练。将所有T张训练图片随机划分为若干组,且每B张一组(B要能够整除T),共“T/B”组。按顺序将所有“T/B”组输入上述设计好的网络中,进而提取高层特征低层特征并进行性别判决后,完成一次训练迭代;然后重新将所有T张训练图片随机划分为若干组,仍然是每B张一组,共“T/B”组。每次都是随机划分,确保每次划分后每一组的图片与上一次都不相同,仍然按顺序将所有“T/B”组输入上述设计好的网络中,进而提取高层特征低层特征并进行性别判决后,完成新的一次训练迭代。总共进行E次训练迭代才能最终获得参数w1、w2、b和β的取值。
更新参数w1、w2、b的具体过程如下:
首先,随机初始化参数w1、w2、b和β的取值,再输入第一组训练图片得到最后的判决结果o,o中每一列表示一个样本的判决输出结果。然后计算出输出层的误差,计算公式如下:
其中,MSE表示判决结果o与实际样本标签(类别,此处即为男女)矩阵Y之间的均方误差,MSE为矩阵表示;Y为输入样本的标签矩阵,如果输入的人脸图片是男性,那么Y就为[10]T矩阵,若是女性,则为[0 1]T矩阵;o为网络输出的判决结果,“|| ||2”表示矩阵之间对应元素求平方差后的矩阵表示。
然后,利用这个误差可以计算出公式(4)中的参数w1,w2,b以及β对于最终的误差函数J(W,b;β)的梯度,利用梯度下降原理更新上述参数w1,w2,b以及β的值。其中误差函数J(W,b;β)的矩阵形式即为MSE。为此,需计算输出层的灵敏度:
其中,Od表示输出层灵敏度的矩阵形式,表示矩阵之间的点乘(对应元素相乘,维度一致)。其中f′(o)表示对输出函数求导,激活函数采用sigmoid函数,其导数形式为f′(x)=f(x)(1-f(x))。根据灵敏度采用如下3个公式可进一步求出参数w1,w2以及偏置b的值,即对w1,w2以及偏置b进行更新:
其中,(w1)new表示在每一次的误差反向传播时更新后的第一权值矩阵w1的值,(w1)old对应更新前的第一权值矩阵w1的值;α表示网络的学习率,本发明采取变学习率策略训练,即α的取值初始化为一个较大的值,然后随训练迭代次数的增加而逐渐减小,保证整个网络的收敛性。
其中,(w2)new表示在每一次的误差反向传播时更新后的第二权值矩阵w2的值,(w2)old对应更新前的第二权值矩阵w2的值。
其中,(b)new表示在每一次的误差反向传播时更新后的偏置矩阵b的值,(b)old对应更新前的偏置矩阵b的值。
更新参数β的具体过程如下:
由于β是一个实数,采取梯度下降法更新β的更新公式如下:
误差函数对β求偏导的式子可由链式规则进一步化为:
β与矩阵(w2*lfo)相乘可看作一个与矩阵相同行列数的矩阵A与矩阵(w2*lfo)点乘,其中A中元素值全都为β。这样,公式(11)最终可化为:
其中“mean(B(:))”表示对矩阵B中所有元素取平均值运算,矩阵B表示由在每一次的误差反向传播时更新后的调节权重β的值构成的矩阵,该矩阵B的行列数与判决结果o的行列数相同。
总之利用误差反向传播算法,可完成公式(4)中的网络参数w1,w2,b以及β的更新。整个网络中还包括卷积层中的参数,下采样层中的参数以及L层人工神经网络中的参数需要通过训练确定它们的值。所使用方法仍然是误差反向传播算法。继续将误差MSE向前传播,此时联合表决层一部分与高层特征提取部分相连,一部分与重建网络相连,那么MSE分为两部分误差,分别在这两个模块中继续向前传播。在高层特征提取部分的误差反向传播过程中,直接采用现有深度学习技术中的卷积层和下采样层误差反向传播更新参数的方法,更新卷积层和下采样层中的参数{CS}({CS}表示卷积层和下采样层中所有参数的矩阵集合)的值。在低层特征提取部分的误差反向传播过程中,直接采用现有人工神经网络技术中的误差反向传播更新参数的方法,更新L层人工神经网络中的参数{LN}({LN}表示L层人工神经网络中所有参数的矩阵集合)的值。这样就完成了一组图片的参数训练过程,接着输入第二组图片训练时,以第一组图片确定的网络参数w1,w2,b和β的值,以及{CS}和{LN}的值计算判决结果o,然后重复误差反向传播过程,更新网络中w1,w2,b和β值,以及{CS}和{LN}的值。以此类推,每一组图片的训练以上一组图片训练后确定的参数的值计算判决结果,然后从输出开始计算误差并反向传播至输入,更新整个网络所有的参数的值。直到“T/B”组训练样本全部输入网络完成训练后,才完成一次训练迭代。
当完成所有E次训练迭代后,此时的网络即可用于实际的性别识别,输入人脸图片,网络就会输出性别的预测值。
二、人脸年龄估计网络的构建:
上述技术方案中,所述的步骤2)提供了一种人脸年龄估计的方法,如图2所示,即一种用于人脸年龄估计的深层网络***,包括:
步骤2-2)以步骤1)中得到的人脸训练图片作为网络的输入,网络的输出为图片中人的年龄估计值(整数)。网络主要由4部分功能模块组成,包括高层特征提取模块,低层特征提取模块,融合特征联合判决输出模块以及参数训练模块。
上述方案中,所述步骤2-1)包括:
步骤2-2-1)、高层特征提取:直接采用现有深度学习方法中的卷积神经网络的卷积层和下采样层结构实现针对训练图片的高层特征提取。在具体实施时,采用3层卷积层C1,C2和C3,以及三层下采样层S1,S2和S3的组合,层与层之间全连接。
步骤2-2-2)、低层特征提取:与高层特征提取模块同步对输入图像进行处理。
首先,将输入的人脸的训练图片由二维的图结构形式转化为向量的形式(称为扁平化处理,flat操作),再对得到的向量进行归一化,得到人脸原始特征向量。
然后,将原始特征向量连接到重建网络以获得重建特征向量。重建网络基于人工神经网络原理搭建,共L层。每一层的神经元输出即可看作是特征向量,下一层的神经元对上一层输出的向量进行重新编码,进行重新表示和描述后再输出,层与层之间采取全连接的方式,每一个神经元采用sigmoid函数进行激活。人脸原始特征向量首先连接至重建网络的H1层,H1层含有h1个神经单元,假设输入图片大小为N×N,那么人脸原始特征向量为N×N维,经过H1层后变为h1维特征向量。然后接着连接至H2层,H2层含有h2个神经单元,那么特征向量进一步变为h2维。以此类推,根据实际需要,最后连接至Hn层,得到一个hn维的特征向量。层与层之间的连接的具体计算可由公式(1)得到。
这个hn维的特征向量即是重建网络的输出,也即重建特征向量。重建特征向量剔除了人脸原始特征向量中对年龄估计无效的冗余信息,减少了部分噪声干扰,能够较好的刻画人脸的低层、全局特征。
步骤2-2-3)、联合表决层和输出:联合提取的高层特征和低层特征进行最终的年龄估计,输出年龄预测值(多少岁)。
将提取得到的高层特征图连接至一个含有M个神经元的全连接层,得到一个M维的高层特征向量。然后高层特征向量与重建特征向量连接在一起构成联合表决层。假设重建特征向量为hn维,那么两者联合在一起即构成一个含有(M+hn)个神经元的联合表决层。联合表决层的输出即是我们整个网络提取到的多特征结构的(M+hn)维特征向量。
联合表决层再全连接到最终的输出神经元。输出神经元有S个(每一个对应一岁)。输出层仍然采用sigmoid函数激活,那么每一类的概率可表示为公式(2)。因为整个网络的每次输入多张图片(参数训练部分会有相应说明),故本发明定义的网络的输出矩阵形式可表示为公式(3)。
考虑到两种特征对最后结果的影响,在表示低层特征的重建特征向量中加入一个调节权重β,0≤β≤1,进行调节,低层特征对最终结果的判定的影响得到一定程度的抑制。则最终网络输出可由公式(4)得到。
步骤2-2-4)、采用训练方法获取参数w1、w2、b和β的最终取值:人工神经网络,深度学习的基本理论分为网络的设计和网络中参数的训练两部分。当设计好网络的结构后(即获得上述高层特征、低层特征、及判决公式),需要训练确定网络中每一个参数的值(即确定w1、w2、b和β的值,以及卷积层和下采样层中的参数的值,人工神经网络中L层中的各神经元的参数的值),然后才能使用该网络对待识别的人脸图片进行实际的分类和回归等应用。
所述训练方法采取误差反向传播算法,同时考虑到深度学习需要大量训练样本支持,为减少计算负荷,结合随机梯度下降策略进行训练。将所有T张训练图片随机划分为若干组,且每B张一组(B要能够整除T),共“T/B”组。按顺序将所有“T/B”组输入上述设计好的网络中,进而提取高层特征低层特征并进行性别判决后,完成一次训练迭代;然后重新将所有T张训练图片随机划分为若干组,仍然是每B张一组,共“T/B”组。每次都是随机划分,确保每次划分后每一组的图片与上一次都不相同,仍然按顺序将所有“T/B”组输入上述设计好的网络中,进而提取高层特征低层特征并进行性别判决后,完成新的一次训练迭代。总共进行E次训练迭代才能最终获得参数w1、w2、b和β的取值。更新参数w1、w2、b的具体过程如下:
首先,随机初始化参数w1、w2、b和β的取值,再输入第一组训练图片得到最后的判决结果o,o中每一列表示一个样本的判决输出结果。然后使用公式(5)计算出输出层的误差。需要注意的是,在年龄估计中,公式(5)中的样本标签矩阵Y为S维向量形式,如果输入人脸图片对应的年龄是1岁,那么Y则为[1 0 ... 0]T;如果年龄是2岁,Y为[0 1 ... 0]T;如果是S岁,则为[0 0 ... 1]T。
然后,利用公式(5)得到的误差可以计算出公式(4)中的参数w1,w2,b以及β对于最终的误差函数J(W,b;β)的梯度,利用梯度下降原理更新上述参数w1,w2,b以及β的值。其中误差函数J(W,b;β)的矩阵形式即为MSE。为此,需计算输出层的灵敏度,可有公式(6)得到。根据灵敏度,采用公式(7),公式(8)和公式(9)可进一步求出参数w1,w2以及偏置b的值,即对w1,w2以及偏置b进行更新。
由于β是一个实数,采取梯度下降法更新β时,可利用公式(10)求出更新后的β的值。误差函数对β求偏导的式子可由链式规则进一步通过公式(11)转化。最后,β与矩阵(w2*lfo)相乘可看作一个与矩阵相同行列数的矩阵A与矩阵(w2*lfo)点乘,其中A中元素值全都为β。这样,公式(11)最终可化为公式(12),从而计算出β的更新值。
总之利用误差反向传播算法,可完成公式(4)中的网络参数w1,w2,b以及β的更新。整个网络中还包括卷积层中的参数,下采样层中的参数以及L层人工神经网络中的参数需要通过训练确定它们的值,所使用方法仍然是误差反向传播算法。继续将误差MSE向前传播,此时联合表决层一部分与高层特征提取部分相连,一部分与重建网络相连,那么MSE分为两部分误差,分别在这两个模块中继续向前传播。在高层特征提取部分的误差反向传播过程中,直接采用现有深度学习技术中的卷积层和下采样层误差反向传播更新参数的方法,更新卷积层和下采样层中的参数{CS}({CS}表示卷积层和下采样层中所有参数的矩阵集合)的值。在低层特征提取部分的误差反向传播过程中,直接采用现有人工神经网络技术中的误差反向传播更新参数的方法,更新L层人工神经网络中的参数{LN}({LN}表示L层人工神经网络中所有参数的矩阵集合)的值。这样就完成了一组图片的参数训练过程,接着输入第二组图片训练时,以第一组图片确定的网络参数w1,w2,b和β的值,以及{CS}和{LN}的值计算判决结果o,然后重复误差反向传播过程,更新网络中w1,w2,b和β值,以及{CS}和{LN}的值。以此类推,每一组图片的训练以上一组图片训练后确定的参数的值计算判决结果,然后从输出开始计算误差并反向传播至输入,更新整个网络所有的参数的值。直到“T/B”组训练样本全部输入网络完成训练后,才完成一次训练迭代。
当完成所有E次训练迭代后,此时的网络即可用于实际的年龄估计,输入人脸图片,网络就会输出年龄的估计值。
上述公式(3)、(4)、(7)、(8)、(10)、(12)是本发明提出的新的公式。
三,基于上述构建网络进行人脸年龄估计和性别识别:
当采用上述方法构建得到性别识别网络和年龄估计网络后,将待识别的图片输入已经构建的网络中进行性别识别或年龄估计,具体的识别过程为:
基于卷积神经网络提取待识别人脸图片的高层特征;
基于人工神经网络提取待识别人脸图片的低层和全局特征;
将提取的低层特征和高层特征输入如下的判决公式,进行性别或者年龄判决,输出判决结果:
o=sigm(w1*hfo+β×w2*lfo+b)
其中,上述公式中的第一权值矩阵w1、第二权值矩阵w2、β和b为完成针对训练图片的若干次迭代后获取(即上述网络构建完成时得到的各参数的最终取值),hfo表示提取的待识别人脸的高层特征向量,lfo表示提取的待识别人脸的低层特征向量,o表示性别或年龄的判决结果。
低层特征提取进一步包含:
将输入的待识别的人脸图片进行扁平化处理并归一化后,得到人脸的原始特征向量;
将原始特征向量输入人工神经网络,通过多层神经元结构对输入向量进行重建,得到一个Lf维的特征向量作为提取的低层特征向量。
具体的判决过程为:
融合提取到的高层特征和低层特征,输出一种多特征结构;采用若干输出神经元进行性别判决或年龄判决,所述的各个神经元基于所述判决公式进行判决。
本发明还给出了一种基于多特征深度学习的人脸分析方法具体实施的***实例,如图3所示。其中图3中的“人脸检测和图片预处理”直接采用现有技术手段实现,人脸检测基于标注点检测评分结合人脸局部区域验证的方法实现;图片预处理包括彩色图片的灰度化处理,图片大小调整以及图片直方图均衡化处理。经过预处理后***对人脸图片采用如下策略进行识别:
高层特征提取模块,用于基于卷积神经网络提取待识别人脸图片的高层特征;
低层特征提取模块,用于基于人工神经网络提取待识别人脸图片的低层和全局特征;
判决模块,用于将提取的低层特征和高层特征输入如下的判决公式,进行性别或者年龄判决,输出判决结果:
o=sigm(w1*hfo+β×w2*lfo+b)
其中,上述公式中的第一权值矩阵w1、第二权值矩阵w2、β和b为完成针对训练图片的若干次迭代后获取(即上述网络构建完成时得到的各参数的最终取值),hfo表示提取的待识别人脸的高层特征向量,lfo表示提取的待识别人脸的低层特征向量,o表示性别或年龄的判决结果。
上述低层特征提取模块进一步包含:
扁平化处理模块,用于将输入的待识别的人脸图片进行扁平化处理并归一化后,得到人脸的原始特征向量;
重建特征向量获取模块,用于将原始特征向量输入人工神经网络,通过多层神经元结构对输入向量进行重建,得到一个Lf维的特征向量作为提取的低层特征向量。
上述判决模块进一步包含:
联合表决层模块,用于融合提取到的高层特征和低层特征,输出一种多特征结构;到输出层进行最终的性别或年龄的判决。
输出层模块,用于采用若干输出神经元进行性别判决或年龄判决,所述的各个神经元基于所述判决公式进行判决。
总之,本发明提供了一种基于多特征深度学***均绝对误差,同时***具有较强的泛化能力,能在低质量的网络图片和摄像头实际采集的图片上表现出良好的性能。
上述技术方案中的黑体的变量表示矩阵。
最后所应说明的是,以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,对本发明的技术方案进行修改或者等同替换,都不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (9)
1.一种用于人脸性别识别或年龄估计的深层网络构建方法,所述方法包含:
步骤101)将所有的训练图片划分为若干组;
步骤102)基于卷积神经网络提取一组训练图片的高层特征,进而得到由高层特征向量组成的第一矩阵;同时基于人工神经网络提取同一组训练图片的低层和全局特征,进而得到低层特征向量组成的第二矩阵;
基于提取的第一矩阵、第二矩阵和如下判决公式得到一组性别识别或者年龄估计的结果:
o=sigm(w1*hfo+β×w2*lfo+b)
其中,hfo表示第一矩阵;lfo表示第二矩阵;针对第一组训练图片上述公式中的第一权值矩阵w1、第二权值矩阵w2、偏置矩阵b和调节权重β的初值采用随机初始化方式获得;针对输入的其余各组的训练图片上述公式中的w1、w2、b和β的值的获取方法为:利用误差反向传播算法计算判决结果o与各组训练图片的实际标签矩阵Y的误差函数J(W,b;β),再通过计算w1、w2、b和β对误差函数J(W,b;β)的梯度进而更新参数w1、w2、b和β的值;
步骤103)再输入一组训练图片,并对再次输入的训练图片重复执行上述步骤102),直至所有的分组均被进行了步骤102)的处理,完成一次训练迭代;
步骤104)将所有的训练图片重新划分为若干组,并对重新划分的各组重复执行上述步骤102)和步骤103),完成再次迭代;
经过若干重新分组和迭代处理,直至最终输出的判决o满足设定的条件时,得到最终的参数w1、w2、b和β的值,完成网络构建;
采用如下公式的误差反向传播算法更新第一权值矩阵w1的值:
其中,(w1)new表示在每一次的误差反向传播时更新后的第一权值矩阵w1的值,(w1)old对应更新前的第一权值矩阵w1的值,Od表示输出层灵敏度矩阵;α表示网络的学习率;
通过如下公式更新第二权值矩阵w2的值:
其中,(w2)new表示在每一次的误差反向传播时更新后的第二权值矩阵w2的值,(w2)old对应更新前的第二权值矩阵w2的值。
2.根据权利要求1所述的用于人脸性别识别或年龄估计的深层网络构建方法,其特征在于,进行低层特征提取时进一步包含:
步骤102-11)将输入的一组训练图片的每一张训练图片由二维的图结构形式转化为向量的形式,再对向量进行归一化,得到每一张训练图片的原始特征向量;
步骤102-12)将得到的每一张训练图片的原始向量输入人工神经网络,进而得到一组重建特征向量,即得到所述的第二矩阵;其中,所述人工神经网络包含L层,且层与层之间采用全连接方式,每一层的各神经元采用sigmoid函数激活。
3.根据权利要求1所述的用于人脸性别识别或年龄估计的深层网络构建方法,其特征在于,所述得到一组性别识别或者年龄估计的结果中针对一张训练图片的性别识别或年龄估计过程具体包含:
步骤102-21)当提取的一张训练图片的高层特征向量为Hf维的高层特征向量,且低层特征向量为Lf维的特征向量时,构造一个包含“Hf+Lf”个神经元的联合表决层;
步骤102-22)当用于性别识别时,将构造的联合表决层的各个神经元分别与输出层的两个输出神经元相连,且每个输出神经元基于所述判决公式进行性别判别,输出训练图片为男性或女性的概率;当用于年龄估计时,联合表决层的各个神经元与输出层的S个输出神经元相连,其中每个输出神经元对应一岁。
4.根据权利要求1所述的用于人脸性别识别或年龄估计的深层网络构建方法,其特征在于,所述β的值在每一次训练迭代中更新方法为:
其中,βnew表示在每一次的误差反向传播时更新后的调节权重β的值,βold对应更新前的调节权重β的值;
上述公式中求偏导的部分可由如下公式得到:
其中,f′(o)表示对判决结果o求导,“mean(B(:))”表示对矩阵B中所有元素取平均值运算;矩阵B表示由在每一次的误差反向传播时更新后的调节权重β的值构成的矩阵,且该矩阵B的行列数与判决结果o的行列数相同。
5.一种用于人脸的年龄或性别的识别方法,该方法基于权利要求1-4中任意一条权利要求记载的构建网络最终确定的第一权值矩阵w1、第二权值矩阵w2、β和b的值,所述方法包含:
基于卷积神经网络提取待识别人脸图片的高层特征;
基于人工神经网络提取待识别人脸图片的低层和全局特征;
将提取的低层特征和高层特征输入如下的判决公式,进行性别或者年龄判决,输出判决结果:
o=sigm(w1*hfo+β×w2*lfo+b)
其中,上述公式中的第一权值矩阵w1、第二权值矩阵w2、β和b为深层网络构建方法确定的值,hfo表示提取的待识别人脸的高层特征向量,lfo表示提取的待识别人脸的低层特征向量,o表示性别或年龄的判决结果。
6.根据权利要求5所述的用于人脸的年龄或性别的识别方法,其特征在于,采用如下步骤提取低层特征:
将输入的待识别的人脸图片进行扁平化处理并归一化后,得到人脸的原始特征向量;
将原始特征向量输入人工神经网络,通过多层神经元结构对输入向量进行重建,得到一个Lf维的特征向量作为提取的低层特征向量。
7.一种用于人脸的年龄或性别的识别***,其特征在于,所述***包含:
高层特征提取模块,用于基于卷积神经网络提取待识别人脸图片的高层特征;
低层特征提取模块,用于基于人工神经网络提取待识别人脸图片的低层和全局特征;
基于神经网络的判决模块,用于将提取的低层特征和高层特征输入如下的判决公式,进行性别或者年龄判决,输出判决结果:
o=sigm(w1*hfo+β×w2*lfo+b)
其中,上述公式中的第一权值矩阵w1、第二权值矩阵w2、β和b为完成针对训练图片的若干次迭代后获取,hfo表示提取的待识别人脸的高层特征向量,lfo表示提取的待识别人脸的低层特征向量,o表示性别或年龄的判决结果;
采用如下公式的误差反向传播算法更新第一权值矩阵w1的值:
其中,(w1)new表示在每一次的误差反向传播时更新后的第一权值矩阵w1的值,(w1)old对应更新前的第一权值矩阵w1的值,Od表示输出层灵敏度矩阵;α表示网络的学习率;
通过如下公式更新第二权值矩阵w2的值:
其中,(w2)new表示在每一次的误差反向传播时更新后的第二权值矩阵w2的值,(w2)old对应更新前的第二权值矩阵w2的值。
8.根据权利要求7所述的人脸的年龄或性别的识别***,其特征在于,所述低层特征提取模块进一步包含:
扁平化处理模块,用于将输入的待识别的人脸图片进行扁平化处理并归一化后,得到人脸的原始特征向量;
重建特征向量获取模块,用于将原始特征向量输入人工神经网络,通过多层神经元结构对输入向量进行重建,得到一个Lf维的特征向量作为提取的低层特征向量。
9.根据权利要求7所述的人脸的年龄或性别的识别***,其特征在于,所述判决模块进一步包含:
联合表决层模块,用于融合提取到的高层特征和低层特征,输出一种多特征结构;
输出层模块,用于采用若干输出神经元进行性别判决或年龄判决,所述的各个神经元基于所述判决公式进行判决。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410193260.5A CN105095833B (zh) | 2014-05-08 | 2014-05-08 | 用于人脸识别的网络构建方法、识别方法及*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410193260.5A CN105095833B (zh) | 2014-05-08 | 2014-05-08 | 用于人脸识别的网络构建方法、识别方法及*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105095833A CN105095833A (zh) | 2015-11-25 |
CN105095833B true CN105095833B (zh) | 2019-03-15 |
Family
ID=54576227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410193260.5A Active CN105095833B (zh) | 2014-05-08 | 2014-05-08 | 用于人脸识别的网络构建方法、识别方法及*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105095833B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480582A (zh) * | 2017-06-28 | 2017-12-15 | 北京五八信息技术有限公司 | 简历真实度的检测方法及装置 |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106803054B (zh) | 2015-11-26 | 2019-04-23 | 腾讯科技(深圳)有限公司 | 人脸模型矩阵训练方法和装置 |
CN105426963B (zh) * | 2015-12-01 | 2017-12-26 | 北京天诚盛业科技有限公司 | 用于人脸识别的卷积神经网络的训练方法、装置及应用 |
CN105678381B (zh) * | 2016-01-08 | 2019-03-08 | 浙江宇视科技有限公司 | 一种性别分类网络训练方法、性别分类方法及相关装置 |
CN106991478B (zh) * | 2016-01-20 | 2020-05-08 | 中科寒武纪科技股份有限公司 | 用于执行人工神经网络反向训练的装置和方法 |
CN106991477B (zh) * | 2016-01-20 | 2020-08-14 | 中科寒武纪科技股份有限公司 | 一种人工神经网络压缩编码装置和方法 |
CN107103266B (zh) * | 2016-02-23 | 2019-08-20 | 中国科学院声学研究所 | 二维人脸欺诈检测分类器的训练及人脸欺诈检测方法 |
CN105844236B (zh) * | 2016-03-22 | 2019-09-06 | 重庆医科大学 | 基于皮肤图像信息处理的年龄测试方法 |
WO2017177371A1 (en) * | 2016-04-12 | 2017-10-19 | Xiaogang Wang | Method and system for object re-identification |
CN105975916B (zh) * | 2016-04-28 | 2019-10-11 | 西安电子科技大学 | 基于多输出卷积神经网络和有序回归的年龄估计方法 |
CN106127159A (zh) * | 2016-06-28 | 2016-11-16 | 电子科技大学 | 一种基于卷积神经网络的性别识别方法 |
CN107657204A (zh) * | 2016-07-25 | 2018-02-02 | 中国科学院声学研究所 | 深层网络模型的构建方法及人脸表情识别方法和*** |
CN106295521B (zh) * | 2016-07-29 | 2019-06-04 | 厦门美图之家科技有限公司 | 一种基于多输出卷积神经网络的性别识别方法、装置及计算设备 |
CN107688576B (zh) * | 2016-08-04 | 2020-06-16 | 中国科学院声学研究所 | 一种cnn-svm模型的构建及倾向性分类方法 |
CN107766774A (zh) * | 2016-08-17 | 2018-03-06 | 鸿富锦精密电子(天津)有限公司 | 人脸识别***及方法 |
CN107871106B (zh) * | 2016-09-26 | 2021-07-06 | 北京眼神科技有限公司 | 人脸检测方法和装置 |
CN106485235B (zh) * | 2016-10-24 | 2019-05-03 | 厦门美图之家科技有限公司 | 一种卷积神经网络生成方法、年龄识别方法及相关装置 |
CN106503661B (zh) * | 2016-10-25 | 2019-06-28 | 陕西师范大学 | 基于烟花深度信念网络的人脸性别识别方法 |
CN108229263B (zh) * | 2016-12-22 | 2021-03-02 | 杭州光启人工智能研究院 | 目标对象的识别方法和装置、机器人 |
CN106874929B (zh) * | 2016-12-28 | 2020-03-17 | 浙江诸暨会智科技有限公司 | 一种基于深度学习的珍珠分类方法 |
CN106991147A (zh) * | 2017-03-27 | 2017-07-28 | 重庆大学 | 一种植物识别***及识别方法 |
CN108734719A (zh) * | 2017-04-14 | 2018-11-02 | 浙江工商大学 | 一种基于全卷积神经网络的鳞翅目昆虫图像前背景自动分割方法 |
CN107239532B (zh) * | 2017-05-31 | 2020-07-31 | 北京京东尚科信息技术有限公司 | 数据挖掘方法及装置 |
CN107545238A (zh) * | 2017-07-03 | 2018-01-05 | 西安邮电大学 | 基于深度学习的煤矿井下行人检测方法 |
CN107463965B (zh) * | 2017-08-16 | 2024-03-26 | 湖州易有科技有限公司 | 基于深度学习的面料属性图片采集和识别方法及识别*** |
CN107506737A (zh) * | 2017-08-29 | 2017-12-22 | 四川长虹电器股份有限公司 | 人脸性别识别方法 |
CN107545249A (zh) * | 2017-08-30 | 2018-01-05 | 国信优易数据有限公司 | 一种人群年龄识别方法及装置 |
CN107622282A (zh) * | 2017-09-21 | 2018-01-23 | 百度在线网络技术(北京)有限公司 | 图像校验方法和装置 |
CN107844760A (zh) * | 2017-10-24 | 2018-03-27 | 西安交通大学 | 基于曲面法向分量图神经网络表示的三维人脸识别方法 |
CN108052862B (zh) * | 2017-11-09 | 2019-12-06 | 北京达佳互联信息技术有限公司 | 年龄预估方法和装置 |
CN108171325B (zh) * | 2017-12-28 | 2020-08-28 | 中国科学技术大学 | 一种多尺度人脸恢复的时序集成网络、编码装置及解码装置 |
CN108182429B (zh) * | 2018-02-01 | 2022-01-28 | 重庆邮电大学 | 基于对称性的人脸图像特征提取的方法及装置 |
CN110502959A (zh) * | 2018-05-17 | 2019-11-26 | Oppo广东移动通信有限公司 | 性别判断方法、装置、存储介质及电子设备 |
CN109002755B (zh) * | 2018-06-04 | 2020-09-01 | 西北大学 | 基于人脸图像的年龄估计模型构建方法及估计方法 |
CN109001833A (zh) * | 2018-06-22 | 2018-12-14 | 天和防务技术(北京)有限公司 | 一种基于深度学习的太赫兹危险品检测方法 |
CN108833713A (zh) * | 2018-06-28 | 2018-11-16 | Oppo广东移动通信有限公司 | 睡眠时天线控制方法及相关产品 |
CN109344840B (zh) * | 2018-08-07 | 2022-04-01 | 深圳市商汤科技有限公司 | 图像处理方法和装置、电子设备、存储介质、程序产品 |
CN110956190A (zh) * | 2018-09-27 | 2020-04-03 | 深圳云天励飞技术有限公司 | 图像识别方法及装置、计算机装置和计算机可读存储介质 |
CN109711243B (zh) * | 2018-11-01 | 2021-02-09 | 长沙小钴科技有限公司 | 一种基于深度学习的静态三维人脸活体检测方法 |
CN112955906B (zh) * | 2018-11-08 | 2024-03-12 | 北京比特大陆科技有限公司 | 神经网络层分组方法、装置、设备、存储介质及程序产品 |
CN109872364B (zh) * | 2019-01-28 | 2022-02-01 | 腾讯科技(深圳)有限公司 | 图像区域定位方法、装置、存储介质和医学影像处理设备 |
CN111723613A (zh) * | 2019-03-20 | 2020-09-29 | 广州慧睿思通信息科技有限公司 | 人脸图像数据处理方法、装置、设备及存储介质 |
CN110378372A (zh) * | 2019-06-11 | 2019-10-25 | 中国科学院自动化研究所南京人工智能芯片创新研究院 | 图数据识别方法、装置、计算机设备和存储介质 |
CN111753641B (zh) * | 2020-05-07 | 2023-07-18 | 中山大学 | 一种基于人脸高维特征的性别预测方法 |
US11966453B2 (en) | 2021-02-15 | 2024-04-23 | International Business Machines Corporation | Ordering annotation sets for machine learning |
CN113298156A (zh) * | 2021-05-28 | 2021-08-24 | 有米科技股份有限公司 | 用于图像性别分类的神经网络训练方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102612841A (zh) * | 2009-11-17 | 2012-07-25 | Lg电子株式会社 | 用于用户鉴别的方法,和视频通信设备及其显示设备 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5359699A (en) * | 1991-12-02 | 1994-10-25 | General Electric Company | Method for using a feed forward neural network to perform classification with highly biased data |
CN102339384B (zh) * | 2011-09-16 | 2013-07-03 | 北京交通大学 | 一种人脸识别方法 |
CN103679185B (zh) * | 2012-08-31 | 2017-06-16 | 富士通株式会社 | 卷积神经网络分类器***、其训练方法、分类方法和用途 |
CN103778414A (zh) * | 2014-01-17 | 2014-05-07 | 杭州电子科技大学 | 基于深度神经网络的实时人脸识别方法 |
-
2014
- 2014-05-08 CN CN201410193260.5A patent/CN105095833B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102612841A (zh) * | 2009-11-17 | 2012-07-25 | Lg电子株式会社 | 用于用户鉴别的方法,和视频通信设备及其显示设备 |
Non-Patent Citations (2)
Title |
---|
Robust Pedestrian Detection Using Low Level and High Level Features;Fariba Takarli,Ali Aghagolzadeh,Hadi Seyedarabi;《2013 21st Iranian Conference on Electrical Engineering》;20130916;第2,3,4,6章 * |
典型人工神经网络;巩敦卫,孙晓燕;《智能控制技术简明教程》;20101231;第127-128页 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480582A (zh) * | 2017-06-28 | 2017-12-15 | 北京五八信息技术有限公司 | 简历真实度的检测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN105095833A (zh) | 2015-11-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105095833B (zh) | 用于人脸识别的网络构建方法、识别方法及*** | |
Zhao et al. | A deep learning iris recognition method based on capsule network architecture | |
CN113011499B (zh) | 一种基于双注意力机制的高光谱遥感图像分类方法 | |
CN107657204A (zh) | 深层网络模型的构建方法及人脸表情识别方法和*** | |
CN107437096B (zh) | 基于参数高效的深度残差网络模型的图像分类方法 | |
Suryawati et al. | Deep structured convolutional neural network for tomato diseases detection | |
CN105678284B (zh) | 一种固定位人体行为分析方法 | |
CN108830157A (zh) | 基于注意力机制和3d卷积神经网络的人体行为识别方法 | |
CN109817276A (zh) | 一种基于深度神经网络的蛋白质二级结构预测方法 | |
CN108304826A (zh) | 基于卷积神经网络的人脸表情识别方法 | |
CN107122809A (zh) | 基于图像自编码的神经网络特征学习方法 | |
CN107766894A (zh) | 基于注意力机制和深度学习的遥感图像自然语言生成方法 | |
CN107423756A (zh) | 基于深度卷积神经网络结合长短期记忆模型的核磁共振图像序列分类方法 | |
CN112784764A (zh) | 一种基于局部与全局注意力机制的表情识别方法及*** | |
CN106485259B (zh) | 一种基于高约束高分散主成分分析网络的图像分类方法 | |
CN110569725B (zh) | 一种基于自注意力机制的深度学习的步态识别***与方法 | |
CN111639719A (zh) | 基于时空运动和特征融合的足迹图像检索方法 | |
CN109086802A (zh) | 一种基于八元数卷积神经网络的图像分类方法 | |
CN112818764A (zh) | 一种基于特征重建模型的低分辨率图像人脸表情识别方法 | |
Xu et al. | UP-CNN: Un-pooling augmented convolutional neural network | |
CN106980830A (zh) | 一种基于深度卷积网络自亲缘关系识别方法与装置 | |
Yang et al. | Down image recognition based on deep convolutional neural network | |
CN113128424A (zh) | 基于注意力机制的图卷积神经网络动作识别方法 | |
CN115966010A (zh) | 一种基于注意力和多尺度特征融合的表情识别方法 | |
CN105404865A (zh) | 基于概率态受限玻尔兹曼机级联的人脸检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20211119 Address after: Building 5, innovation park, Keji East Road, wulongjiang middle Avenue, Shangjie Town, Minhou County, Fuzhou, Fujian 350108 Patentee after: HENGFENG INFORMATION TECHNOLOGY CO.,LTD. Address before: 100190, No. 21 West Fourth Ring Road, Beijing, Haidian District Patentee before: INSTITUTE OF ACOUSTICS, CHINESE ACADEMY OF SCIENCES |