CN104408470A

CN104408470A - 基于平均脸预学习的性别检测方法

Info

Publication number: CN104408470A
Application number: CN201410720517.8A
Authority: CN
Inventors: 沈飞; 谢衍涛
Original assignee: ThunderSoft Co Ltd
Current assignee: Nanjing Zhongchuang Onsai Software Technology Co., Ltd.
Priority date: 2014-12-01
Filing date: 2014-12-01
Publication date: 2015-03-11
Anticipated expiration: 2034-12-01
Also published as: CN104408470B

Abstract

本发明基于平均脸预学***均脸；B、将所述各平均脸数据配置为卷积神经网络的输出层、各平均脸所属类别下的人脸数据集中的人脸各位置配置为卷积神经网络的输入层，对卷积神经网络进行预学习；C、用性别分类层替换卷积神经网络的输出层，并对所述卷积神经网络和所述性别分类层进行最终学习；检测步骤：将待检人员的人脸图像输入学习后的卷积神经网络，由性别分类层输出性别。本发明避开一些比较差的次最优解，有效解决深度神经网路无法通过经典的学习方法一次得到比较好的模型的局限，通过预学习的步骤提高性别检测的准确性。

Description

基于平均脸预学习的性别检测方法

技术领域

本发明涉及电子设备的人脸性别识别领域，特别涉及一种基于平均脸预学习的性别检测方法。

背景技术

现有技术中，性别识别算法大体分为三类，一类是基于语音，一类是基于人的步态，一类是基于人脸图像。由于目前人脸检测的技术比较成熟，基于人脸图像的方案变得更简单、直接。但由于现实环境中复杂的背景、光照和摄像头本身的精度差别以及人脸的角度等等因素，极大的增加了性别识别的难度，导致准确率比较低，稳定性不高。

进一步详细分析，基于人脸图像的性别识别的技术最大的问题是准确率低，不稳定。导致这个问题有多方面的因数：

1.现实环境中光照复杂，摄像头本身的参数和精度千差万别。

2.现实中人脸的角度的变化非常多。

3.不同人种的肤色差异较大。

以上三个因素极大的增加了在人脸图像中性别识别器的识别难度。传统的基于hand-crafted的特征(如LBP，HOG，Gabor等)，无法对复杂的各种各样的人脸图像有很好的表达能力。传统的解决光照、角度与肤色的方法可以分为两类：

1、在检测中，对检测图像进行预处理，减少由于光照、角度、不同肤色带来的差异性。

2、基于各种不同的数据集，训练多个分类器。

由于环境的差异导致图像千差万别。预处理的方法无法很好的消除这一影响。方法二将由于环境引起的复杂度在训练时进行解决。由于差异性比较大，训练器的个数与如何组合不同的训练器的结果都难以有个很好的解决方案。最新研究表明深度神经网路拥有很强的模型表达能力(如CNN在很多方面都取得了比较好的成果)，但由于深度神经网路的局部极小值很多，导致很难通过经典的学习算法一次得到很好的模型。

发明内容

本申请提供一种基于平均脸预学习的性别检测方法，通过对卷积神经网络的卷积层进行预学习，避开一些比较差的次最优解，有效的解决了深度神经网路在现有的传统技术上无法通过学习得到比较好的模型的局限性，从而提高性别检测的准确性。

所述基于平均脸预学习的性别检测方法包括学习的步骤和检测步骤：

所述学习的步骤包括：

A、对人脸图像数据库进行分类，并计算各类人脸图像的平均脸；

B、将所述各平均脸数据配置为卷积神经网络的输出层、各平均脸所属类别下的人脸数据集中的人脸各位置配置为卷积神经网络的输入层，对卷积神经网络进行预学习；

C、用性别分类层替换卷积神经网络的输出层，并对所述卷积神经网络和所述性别分类层进行最终学习；

所述检测步骤包括：

将输入待检人员的人脸图像输入学习后的卷积神经网络，由性别分类层输出性别。

由上，通过对卷积神经网络的预学习，避开一些比较差的次最优解，有效的解决了深度神经网路在现有的传统技术上无法通过学习得到比较好的模型的局限性。

可选的，步骤A所述对人脸图像数据库进行分类包括：依据人脸对应的性别和肤色进行分类。

由上，可实现对于不同肤色和性别的人脸进行初级分化，完成原始数据的累计。

可选的，将平均脸的各位置像素表示为(X₁、X₂，……，X_n)，配置为卷积神经网络输出层的各个神经单元；

将对应类别的各人脸的各位置像素表示为(O₁、O₂，……，O_n)，配置为卷积神经网络输入层的各个神经单元配置；

使所述输入层的各人脸的各位置像素与输出层的平均脸的各位置像素区别最小的方式对卷积神经网络进行学习。

其中，卷积神经网络输入层的各个神经单元与卷积神经网络输出层的各个神经单元数量匹配。

由上，通过人脸数据库数据对于卷积神经网络中的卷基层和隐含层的学习，实现其输出的特征表达。

可选的，所述使所述输入层的各人脸的各位置像素与输出层的平均脸的各位置像素区别最小的方式包括：采用对应各位置像素的最小平方差和的方式。

基于输入层和输出层神经单元的平方差和的约束，对卷积网路进行预学习，使之具有较好的起始值，从而避开一些比较差的次最优解。

可选的，步骤C中，对所述卷积神经网络和所述性别分类层进行最终学***均脸的人脸图像数据库中各个图像的真实性别相匹配。

可选的，使所述性别分类层输出的性别与卷积神经网络输入层的计算所述平均脸的人脸图像数据库中各个图像的真实性别相匹配：采用反向传播算法进行学习，计算

E (w) = - 1 np (t | w) = - Σ_{n = 1}^{N} {t_{n} 1 n y_{n} + (1 - t_{n}) 1 n (1 - y_{n})} + \frac{λ}{2} {| | w | |}^{2}

使其结果最小，式中w为所述性别分类层和所述卷积神经网络的卷积层、隐含层的参数，tn为所述人脸图像数据库中第n个样本的真实性别，yn为第n个样本通过模型后的性别，为权重腐蚀。

由上，由于卷积层的参数已经在步骤B中进行了预学习，具有较好的起始值，可以适应不同数据，而性别分类层初始值不定，有可能导致训练出来的网路，只在训练数据上有比较好的结果，拿别的数据来测试时结果就很差。因此进行权重腐蚀，防止其过度拟合。

可选的，所述性别分类层包括softmax分类层。

附图说明

图1为本发明的流程图；

图2为的基于平均脸预学习的性别检测模型的原理示意图。

具体实施方式

本发明所涉及基于平均脸预学习的性别检测方法，通过对卷积神经网络(CNN，Convolutional Neural Networks)的预学习，避开一些比较差的次最优解，有效的解决了深度神经网路无法在经典的学习方法中得到比较好的模型的局限性。

如图1所示，本发明包括以下步骤：

S10：将人脸数据分类，计算不同类别的平均脸。

本实施例中，根据肤色与性别，将人脸数据集进行分类，本实施例采用以下6个类别：白-男、白-女、黑-男、黑-女、黄-男、黄-女。以上每个类别的数据应包含不同的光照与姿势，并将其缩放到统一像素尺寸上。针对于每个类别下的人脸数据集，通过计算该类别数据集中的各个人脸图像数据，即各个人脸图像相同位置的像素平均值，得到每个类别的平均脸。其中，计算出的平均脸可以表示为一数组，如(X₁、X₂，……，X_n)，分别对应该平均脸各个位置像素平均值。本步骤即得到6类的平均脸。

S20：对CNN卷积层进行预学习。

其中，对CNN进行学***均脸数据作为输出层，对应该平均脸所属类别下的人脸数据集中的人脸各位置作为输入层，对CNN的中间层(本实施例中，中间层是对卷积层、隐含层的统称)进行学习，或称对CNN模型进行训练。下面进行详细说明：

本实施例中，将CNN输出层的神经单元个数配置为与输入层相匹配，并如下配置：

如图2所示，CNN输出层对应平均脸数据，CNN输出层的各个神经单元配置为平均脸的各位置像素，如上表示为(X₁、X₂，……，X_n)。

CNN输入层各个神经单元配置为与输出层平均脸所属类别下的人脸数据集中的各人脸的各位置像素，表示为(O₁、O₂，……，O_n)。

对CNN进行学***均脸数据的平方差和最小。具体的，每个样本对应的平方差和计算表示为：E(w)＝1/2[(O₁-X₁)*(O₁-X₁)+……+(O_n-X_n)*(O_n-X_n)]。通过求解使E(w)最小，即，使对应每个样本CNN输入层的人脸图像各位置与输出层的平均脸的各位置的区别最小，以达到对CNN中卷积层和隐含层的学习。

上述反向传播算法主要指由激励传播和权重更新的两个环节反复循环迭代，直到网络对输入的响应达到预定的目标范围为止的过程。通过该过程对卷积层的参数进行预学习，使之具有较好的起始值，从而避开一些比较差的次最优解。

S30：对预学习模型进行最终训练。

本实施例中，固定步骤S20中预学习得到的卷积层参数，并将卷积层后面配置的输出层替换为softmax分类层。所述的神经单元为数据库人脸性别，分为男、女2个。使用传统的反向传播算法，基于交叉熵对预学习模型中的卷积层和softmax分类层进行最终训练，同时优化卷积层的参数。交叉熵的目标函数公式为：

E (w) = - 1 np (t | w) = - Σ_{n = 1}^{N} {t_{n} 1 n y_{n} + (1 - t_{n}) 1 n (1 - y_{n})} + \frac{λ}{2} {| | w | |}^{2};

其中，w包括卷积层隐含层和softmax分类层的参数，最终训练的目标是找到一个w使得目标函数E(w)的值最小，tn为第n个样本的真实性别，yn为第n个样本通过模型后的检测性别。

为防止过拟合，对softmax分类层的参数进行权重腐蚀(即在交叉熵损失函数后加一项权重惩罚，见上述公式的第二项而卷积层的参数不进行权重腐蚀。这是由于卷积层的参数已经在步骤S20中进行了预学习，具有较好的起始值，可以适应不同数据，而softmax分类层初始值不定，有可能导致训练出来的网路，只在训练数据上有比较好的结果，拿别的数据来测试时结果就很差。

步骤S40：输入待检人员的头像，检测其性别。

在实际的性别鉴别过程中，向CNN网路的输入层输入待检人员头像，softmax分类层依据CNN网络中卷基层所计算的结果进行性别识别，并输出识别结果。由此避开一些比较差的次最优解，有效的解决了深度网络在现有经典的学习算法中无法得到比较好的模型的局限性。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，总之凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于平均脸预学习的性别检测方法，其特征在于，包括学习的步骤和检测步骤：

所述学习的步骤包括：

所述检测步骤包括：

将待检人员的人脸图像输入学习后的卷积神经网络，由性别分类层输出性别。

2.根据权利要求1所述的方法，其特征在于，步骤A所述对人脸图像数据库进行分类包括：依据人脸对应的性别和肤色进行分类。

3.根据权利要求1所述的方法，其特征在于，将平均脸的各位置像素表示为(X₁、X₂，……，X_n)，配置为卷积神经网络输出层的各个神经单元；

其中，卷积神经网络输出层的各个神经单元与卷积神经网络输入层的各个神经单元数量匹配。

4.根据权利要求3所述的方法，其特征在于，所述使所述输入层的各人脸的各位置像素与输出层的平均脸的各位置像素区别最小的方式包括：采用对应各位置像素的最小平方差和的方式。

5.根据权利要求1所述的方法，其特征在于，步骤C中，对所述卷积神经网络和所述性别分类层进行最终学***均脸的人脸图像数据库中各个图像的真实性别相匹配。

6.根据权利要求5所述的方法，其特征在于，使所述性别分类层输出的性别与卷积神经网络输入层的计算所述平均脸的人脸图像数据库中各个图像的真实性别相匹配包括：采用反向传播算法进行学习，计算

E (w) = - 1 np (t | w) = - Σ_{n = 1}^{N} {t_{n} 1 n y_{n} + (1 - t_{n}) 1 n (1 - y_{n})} + \frac{λ}{2} {| | w | |}^{2}

使其结果最小，式中w为所述性别分类层和所述卷积神经网络的卷积层、隐含层的参数，t_n为所述人脸图像数据库中第n个样本的真实性别，y_n为第n个样本通过模型后的性别，为权重腐蚀。

7.根据权利要求1所述的方法，其特征在于，所述性别分类层包括softmax分类层。