CN104408470A - 基于平均脸预学习的性别检测方法 - Google Patents

基于平均脸预学习的性别检测方法 Download PDF

Info

Publication number
CN104408470A
CN104408470A CN201410720517.8A CN201410720517A CN104408470A CN 104408470 A CN104408470 A CN 104408470A CN 201410720517 A CN201410720517 A CN 201410720517A CN 104408470 A CN104408470 A CN 104408470A
Authority
CN
China
Prior art keywords
layer
convolutional neural
face
neural networks
sex
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410720517.8A
Other languages
English (en)
Other versions
CN104408470B (zh
Inventor
沈飞
谢衍涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Zhongchuang Onsai Software Technology Co., Ltd.
Original Assignee
ThunderSoft Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ThunderSoft Co Ltd filed Critical ThunderSoft Co Ltd
Priority to CN201410720517.8A priority Critical patent/CN104408470B/zh
Publication of CN104408470A publication Critical patent/CN104408470A/zh
Application granted granted Critical
Publication of CN104408470B publication Critical patent/CN104408470B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明基于平均脸预学***均脸;B、将所述各平均脸数据配置为卷积神经网络的输出层、各平均脸所属类别下的人脸数据集中的人脸各位置配置为卷积神经网络的输入层,对卷积神经网络进行预学习;C、用性别分类层替换卷积神经网络的输出层,并对所述卷积神经网络和所述性别分类层进行最终学习;检测步骤:将待检人员的人脸图像输入学习后的卷积神经网络,由性别分类层输出性别。本发明避开一些比较差的次最优解,有效解决深度神经网路无法通过经典的学习方法一次得到比较好的模型的局限,通过预学习的步骤提高性别检测的准确性。

Description

基于平均脸预学习的性别检测方法
技术领域
本发明涉及电子设备的人脸性别识别领域,特别涉及一种基于平均脸预学习的性别检测方法。
背景技术
现有技术中,性别识别算法大体分为三类,一类是基于语音,一类是基于人的步态,一类是基于人脸图像。由于目前人脸检测的技术比较成熟,基于人脸图像的方案变得更简单、直接。但由于现实环境中复杂的背景、光照和摄像头本身的精度差别以及人脸的角度等等因素,极大的增加了性别识别的难度,导致准确率比较低,稳定性不高。
进一步详细分析,基于人脸图像的性别识别的技术最大的问题是准确率低,不稳定。导致这个问题有多方面的因数:
1.现实环境中光照复杂,摄像头本身的参数和精度千差万别。
2.现实中人脸的角度的变化非常多。
3.不同人种的肤色差异较大。
以上三个因素极大的增加了在人脸图像中性别识别器的识别难度。传统的基于hand-crafted的特征(如LBP,HOG,Gabor等),无法对复杂的各种各样的人脸图像有很好的表达能力。传统的解决光照、角度与肤色的方法可以分为两类:
1、在检测中,对检测图像进行预处理,减少由于光照、角度、不同肤色带来的差异性。
2、基于各种不同的数据集,训练多个分类器。
由于环境的差异导致图像千差万别。预处理的方法无法很好的消除这一影响。方法二将由于环境引起的复杂度在训练时进行解决。由于差异性比较大,训练器的个数与如何组合不同的训练器的结果都难以有个很好的解决方案。最新研究表明深度神经网路拥有很强的模型表达能力(如CNN在很多方面都取得了比较好的成果),但由于深度神经网路的局部极小值很多,导致很难通过经典的学习算法一次得到很好的模型。
发明内容
本申请提供一种基于平均脸预学习的性别检测方法,通过对卷积神经网络的卷积层进行预学习,避开一些比较差的次最优解,有效的解决了深度神经网路在现有的传统技术上无法通过学习得到比较好的模型的局限性,从而提高性别检测的准确性。
所述基于平均脸预学习的性别检测方法包括学习的步骤和检测步骤:
所述学习的步骤包括:
A、对人脸图像数据库进行分类,并计算各类人脸图像的平均脸;
B、将所述各平均脸数据配置为卷积神经网络的输出层、各平均脸所属类别下的人脸数据集中的人脸各位置配置为卷积神经网络的输入层,对卷积神经网络进行预学习;
C、用性别分类层替换卷积神经网络的输出层,并对所述卷积神经网络和所述性别分类层进行最终学习;
所述检测步骤包括:
将输入待检人员的人脸图像输入学习后的卷积神经网络,由性别分类层输出性别。
由上,通过对卷积神经网络的预学习,避开一些比较差的次最优解,有效的解决了深度神经网路在现有的传统技术上无法通过学习得到比较好的模型的局限性。
可选的,步骤A所述对人脸图像数据库进行分类包括:依据人脸对应的性别和肤色进行分类。
由上,可实现对于不同肤色和性别的人脸进行初级分化,完成原始数据的累计。
可选的,将平均脸的各位置像素表示为(X1、X2,……,Xn),配置为卷积神经网络输出层的各个神经单元;
将对应类别的各人脸的各位置像素表示为(O1、O2,……,On),配置为卷积神经网络输入层的各个神经单元配置;
使所述输入层的各人脸的各位置像素与输出层的平均脸的各位置像素区别最小的方式对卷积神经网络进行学习。
其中,卷积神经网络输入层的各个神经单元与卷积神经网络输出层的各个神经单元数量匹配。
由上,通过人脸数据库数据对于卷积神经网络中的卷基层和隐含层的学习,实现其输出的特征表达。
可选的,所述使所述输入层的各人脸的各位置像素与输出层的平均脸的各位置像素区别最小的方式包括:采用对应各位置像素的最小平方差和的方式。
基于输入层和输出层神经单元的平方差和的约束,对卷积网路进行预学习,使之具有较好的起始值,从而避开一些比较差的次最优解。
可选的,步骤C中,对所述卷积神经网络和所述性别分类层进行最终学***均脸的人脸图像数据库中各个图像的真实性别相匹配。
可选的,使所述性别分类层输出的性别与卷积神经网络输入层的计算所述平均脸的人脸图像数据库中各个图像的真实性别相匹配:采用反向传播算法进行学习,计算 E ( w ) = - 1 np ( t | w ) = - Σ n = 1 N { t n 1 n y n + ( 1 - t n ) 1 n ( 1 - y n ) } + λ 2 | | w | | 2 使其结果最小,式中w为所述性别分类层和所述卷积神经网络的卷积层、隐含层的参数,tn为所述人脸图像数据库中第n个样本的真实性别,yn为第n个样本通过模型后的性别,为权重腐蚀。
由上,由于卷积层的参数已经在步骤B中进行了预学习,具有较好的起始值,可以适应不同数据,而性别分类层初始值不定,有可能导致训练出来的网路,只在训练数据上有比较好的结果,拿别的数据来测试时结果就很差。因此进行权重腐蚀,防止其过度拟合。
可选的,所述性别分类层包括softmax分类层。
附图说明
图1为本发明的流程图;
图2为的基于平均脸预学习的性别检测模型的原理示意图。
具体实施方式
本发明所涉及基于平均脸预学习的性别检测方法,通过对卷积神经网络(CNN,Convolutional Neural Networks)的预学习,避开一些比较差的次最优解,有效的解决了深度神经网路无法在经典的学习方法中得到比较好的模型的局限性。
如图1所示,本发明包括以下步骤:
S10:将人脸数据分类,计算不同类别的平均脸。
本实施例中,根据肤色与性别,将人脸数据集进行分类,本实施例采用以下6个类别:白-男、白-女、黑-男、黑-女、黄-男、黄-女。以上每个类别的数据应包含不同的光照与姿势,并将其缩放到统一像素尺寸上。针对于每个类别下的人脸数据集,通过计算该类别数据集中的各个人脸图像数据,即各个人脸图像相同位置的像素平均值,得到每个类别的平均脸。其中,计算出的平均脸可以表示为一数组,如(X1、X2,……,Xn),分别对应该平均脸各个位置像素平均值。本步骤即得到6类的平均脸。
S20:对CNN卷积层进行预学习。
其中,对CNN进行学***均脸数据作为输出层,对应该平均脸所属类别下的人脸数据集中的人脸各位置作为输入层,对CNN的中间层(本实施例中,中间层是对卷积层、隐含层的统称)进行学习,或称对CNN模型进行训练。下面进行详细说明:
本实施例中,将CNN输出层的神经单元个数配置为与输入层相匹配,并如下配置:
如图2所示,CNN输出层对应平均脸数据,CNN输出层的各个神经单元配置为平均脸的各位置像素,如上表示为(X1、X2,……,Xn)。
CNN输入层各个神经单元配置为与输出层平均脸所属类别下的人脸数据集中的各人脸的各位置像素,表示为(O1、O2,……,On)。
对CNN进行学***均脸数据的平方差和最小。具体的,每个样本对应的平方差和计算表示为:E(w)=1/2[(O1-X1)*(O1-X1)+……+(On-Xn)*(On-Xn)]。通过求解使E(w)最小,即,使对应每个样本CNN输入层的人脸图像各位置与输出层的平均脸的各位置的区别最小,以达到对CNN中卷积层和隐含层的学习。
上述反向传播算法主要指由激励传播和权重更新的两个环节反复循环迭代,直到网络对输入的响应达到预定的目标范围为止的过程。通过该过程对卷积层的参数进行预学习,使之具有较好的起始值,从而避开一些比较差的次最优解。
S30:对预学习模型进行最终训练。
本实施例中,固定步骤S20中预学习得到的卷积层参数,并将卷积层后面配置的输出层替换为softmax分类层。所述的神经单元为数据库人脸性别,分为男、女2个。使用传统的反向传播算法,基于交叉熵对预学习模型中的卷积层和softmax分类层进行最终训练,同时优化卷积层的参数。交叉熵的目标函数公式为:
E ( w ) = - 1 np ( t | w ) = - Σ n = 1 N { t n 1 n y n + ( 1 - t n ) 1 n ( 1 - y n ) } + λ 2 | | w | | 2 ; 其中,w包括卷积层隐含层和softmax分类层的参数,最终训练的目标是找到一个w使得目标函数E(w)的值最小,tn为第n个样本的真实性别,yn为第n个样本通过模型后的检测性别。
为防止过拟合,对softmax分类层的参数进行权重腐蚀(即在交叉熵损失函数后加一项权重惩罚,见上述公式的第二项而卷积层的参数不进行权重腐蚀。这是由于卷积层的参数已经在步骤S20中进行了预学习,具有较好的起始值,可以适应不同数据,而softmax分类层初始值不定,有可能导致训练出来的网路,只在训练数据上有比较好的结果,拿别的数据来测试时结果就很差。
步骤S40:输入待检人员的头像,检测其性别。
在实际的性别鉴别过程中,向CNN网路的输入层输入待检人员头像,softmax分类层依据CNN网络中卷基层所计算的结果进行性别识别,并输出识别结果。由此避开一些比较差的次最优解,有效的解决了深度网络在现有经典的学习算法中无法得到比较好的模型的局限性。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,总之凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于平均脸预学习的性别检测方法,其特征在于,包括学习的步骤和检测步骤:
所述学习的步骤包括:
A、对人脸图像数据库进行分类,并计算各类人脸图像的平均脸;
B、将所述各平均脸数据配置为卷积神经网络的输出层、各平均脸所属类别下的人脸数据集中的人脸各位置配置为卷积神经网络的输入层,对卷积神经网络进行预学习;
C、用性别分类层替换卷积神经网络的输出层,并对所述卷积神经网络和所述性别分类层进行最终学习;
所述检测步骤包括:
将待检人员的人脸图像输入学习后的卷积神经网络,由性别分类层输出性别。
2.根据权利要求1所述的方法,其特征在于,步骤A所述对人脸图像数据库进行分类包括:依据人脸对应的性别和肤色进行分类。
3.根据权利要求1所述的方法,其特征在于,将平均脸的各位置像素表示为(X1、X2,……,Xn),配置为卷积神经网络输出层的各个神经单元;
将对应类别的各人脸的各位置像素表示为(O1、O2,……,On),配置为卷积神经网络输入层的各个神经单元配置;
使所述输入层的各人脸的各位置像素与输出层的平均脸的各位置像素区别最小的方式对卷积神经网络进行学习。
其中,卷积神经网络输出层的各个神经单元与卷积神经网络输入层的各个神经单元数量匹配。
4.根据权利要求3所述的方法,其特征在于,所述使所述输入层的各人脸的各位置像素与输出层的平均脸的各位置像素区别最小的方式包括:采用对应各位置像素的最小平方差和的方式。
5.根据权利要求1所述的方法,其特征在于,步骤C中,对所述卷积神经网络和所述性别分类层进行最终学***均脸的人脸图像数据库中各个图像的真实性别相匹配。
6.根据权利要求5所述的方法,其特征在于,使所述性别分类层输出的性别与卷积神经网络输入层的计算所述平均脸的人脸图像数据库中各个图像的真实性别相匹配包括:采用反向传播算法进行学习,计算 E ( w ) = - 1 np ( t | w ) = - Σ n = 1 N { t n 1 n y n + ( 1 - t n ) 1 n ( 1 - y n ) } + λ 2 | | w | | 2 使其结果最小,式中w为所述性别分类层和所述卷积神经网络的卷积层、隐含层的参数,tn为所述人脸图像数据库中第n个样本的真实性别,yn为第n个样本通过模型后的性别,为权重腐蚀。
7.根据权利要求1所述的方法,其特征在于,所述性别分类层包括softmax分类层。
CN201410720517.8A 2014-12-01 2014-12-01 基于平均脸预学习的性别检测方法 Active CN104408470B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410720517.8A CN104408470B (zh) 2014-12-01 2014-12-01 基于平均脸预学习的性别检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410720517.8A CN104408470B (zh) 2014-12-01 2014-12-01 基于平均脸预学习的性别检测方法

Publications (2)

Publication Number Publication Date
CN104408470A true CN104408470A (zh) 2015-03-11
CN104408470B CN104408470B (zh) 2017-07-25

Family

ID=52646101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410720517.8A Active CN104408470B (zh) 2014-12-01 2014-12-01 基于平均脸预学习的性别检测方法

Country Status (1)

Country Link
CN (1) CN104408470B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104992167A (zh) * 2015-07-28 2015-10-21 中国科学院自动化研究所 一种基于卷积神经网络的人脸检测方法及装置
CN105825191A (zh) * 2016-03-23 2016-08-03 厦门美图之家科技有限公司 基于人脸多属性信息的性别识别方法、***及拍摄终端
CN107590460A (zh) * 2017-09-12 2018-01-16 北京达佳互联信息技术有限公司 人脸分类方法、装置及智能终端
CN107622274A (zh) * 2016-07-15 2018-01-23 北京市商汤科技开发有限公司 用于图像处理的神经网络训练方法、装置以及计算机设备
CN107766787A (zh) * 2016-08-16 2018-03-06 深圳云天励飞技术有限公司 人脸属性识别方法、装置、终端及存储介质
CN107944363A (zh) * 2017-11-15 2018-04-20 北京达佳互联信息技术有限公司 人脸图像处理方法、***及服务器
CN109977891A (zh) * 2019-03-30 2019-07-05 哈尔滨理工大学 一种基于神经网络的目标检测与识别方法
CN111126173A (zh) * 2019-12-04 2020-05-08 玉林师范学院 一种高精度人脸检测方法
CN111199208A (zh) * 2019-12-31 2020-05-26 上海昌投网络科技有限公司 一种基于深度学习框架的头像性别识别方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8027521B1 (en) * 2008-03-25 2011-09-27 Videomining Corporation Method and system for robust human gender recognition using facial feature localization
WO2011119117A1 (en) * 2010-03-26 2011-09-29 Agency For Science, Technology And Research Facial gender recognition
CN103824054A (zh) * 2014-02-17 2014-05-28 北京旷视科技有限公司 一种基于级联深度神经网络的人脸属性识别方法
CN104021373A (zh) * 2014-05-27 2014-09-03 江苏大学 一种半监督语音特征可变因素分解方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8027521B1 (en) * 2008-03-25 2011-09-27 Videomining Corporation Method and system for robust human gender recognition using facial feature localization
WO2011119117A1 (en) * 2010-03-26 2011-09-29 Agency For Science, Technology And Research Facial gender recognition
CN103824054A (zh) * 2014-02-17 2014-05-28 北京旷视科技有限公司 一种基于级联深度神经网络的人脸属性识别方法
CN104021373A (zh) * 2014-05-27 2014-09-03 江苏大学 一种半监督语音特征可变因素分解方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
蔡诗威 等: "一种基于卷积神经网络的性别识别方法", 《电视技术》 *
陆庆庆: "基于人脸图像的性别分类", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104992167A (zh) * 2015-07-28 2015-10-21 中国科学院自动化研究所 一种基于卷积神经网络的人脸检测方法及装置
CN104992167B (zh) * 2015-07-28 2018-09-11 中国科学院自动化研究所 一种基于卷积神经网络的人脸检测方法及装置
CN105825191A (zh) * 2016-03-23 2016-08-03 厦门美图之家科技有限公司 基于人脸多属性信息的性别识别方法、***及拍摄终端
CN107622274A (zh) * 2016-07-15 2018-01-23 北京市商汤科技开发有限公司 用于图像处理的神经网络训练方法、装置以及计算机设备
CN107622274B (zh) * 2016-07-15 2020-06-02 北京市商汤科技开发有限公司 用于图像处理的神经网络训练方法、装置以及计算机设备
CN107766787A (zh) * 2016-08-16 2018-03-06 深圳云天励飞技术有限公司 人脸属性识别方法、装置、终端及存储介质
CN107590460A (zh) * 2017-09-12 2018-01-16 北京达佳互联信息技术有限公司 人脸分类方法、装置及智能终端
CN107944363A (zh) * 2017-11-15 2018-04-20 北京达佳互联信息技术有限公司 人脸图像处理方法、***及服务器
CN109977891A (zh) * 2019-03-30 2019-07-05 哈尔滨理工大学 一种基于神经网络的目标检测与识别方法
CN111126173A (zh) * 2019-12-04 2020-05-08 玉林师范学院 一种高精度人脸检测方法
CN111126173B (zh) * 2019-12-04 2023-05-26 玉林师范学院 一种高精度人脸检测方法
CN111199208A (zh) * 2019-12-31 2020-05-26 上海昌投网络科技有限公司 一种基于深度学习框架的头像性别识别方法及***

Also Published As

Publication number Publication date
CN104408470B (zh) 2017-07-25

Similar Documents

Publication Publication Date Title
CN104408470A (zh) 基于平均脸预学习的性别检测方法
CN107273845B (zh) 一种基于置信区域和多特征加权融合的人脸表情识别方法
CN106650806B (zh) 一种用于行人检测的协同式深度网络模型方法
CN106682616B (zh) 基于双通道特征深度学习的新生儿疼痛表情识别方法
CN103824054B (zh) 一种基于级联深度神经网络的人脸属性识别方法
CN109815826A (zh) 人脸属性模型的生成方法及装置
CN105825235B (zh) 一种基于多特征图深度学习的图像识别方法
Le Building high-level features using large scale unsupervised learning
TWI537841B (zh) 圖像目標類別識別方法及裝置
CN107229914B (zh) 一种基于深度q学习策略的手写数字识别方法
CN104463243A (zh) 基于平均脸特征的性别检测方法
CN109101938B (zh) 一种基于卷积神经网络的多标签年龄估计方法
CN107102727B (zh) 基于elm神经网络的动态手势学习与识别方法
CN106951825A (zh) 一种人脸图像质量评估***以及实现方法
CN104866829A (zh) 一种基于特征学习的跨年龄人脸验证方法
CN106909938B (zh) 基于深度学习网络的视角无关性行为识别方法
CN104217214A (zh) 基于可配置卷积神经网络的rgb-d人物行为识别方法
CN107451594B (zh) 一种基于多元回归的多视角步态分类方法
CN105469376A (zh) 确定图片相似度的方法和装置
CN107203752A (zh) 一种联合深度学习和特征二范数约束的人脸识别方法
Bu Human motion gesture recognition algorithm in video based on convolutional neural features of training images
WO2022062419A1 (zh) 基于非督导金字塔相似性学习的目标重识别方法及***
CN106548194B (zh) 二维图像人体关节点定位模型的构建方法及定位方法
CN111476261A (zh) 一种社区增强的图卷积神经网络方法
Cheng et al. Classification of long sequential data using circular dilated convolutional neural networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20190429

Address after: No. 1 Dongji Avenue, Jiangning District, Nanjing, Jiangsu Province, 210000 (Jiangning Development Zone)

Patentee after: Nanjing Zhongchuang Onsai Software Technology Co., Ltd.

Address before: 100191, 4 floor, Thai Xiang business building, 1 Longxiang Road, Haidian District, Beijing.

Patentee before: Thunder Software Technology Co., Ltd.

TR01 Transfer of patent right