CN104484658A - 一种基于多通道卷积神经网络的人脸性别识别方法及装置 - Google Patents

一种基于多通道卷积神经网络的人脸性别识别方法及装置 Download PDF

Info

Publication number
CN104484658A
CN104484658A CN201410840403.7A CN201410840403A CN104484658A CN 104484658 A CN104484658 A CN 104484658A CN 201410840403 A CN201410840403 A CN 201410840403A CN 104484658 A CN104484658 A CN 104484658A
Authority
CN
China
Prior art keywords
color channel
channel information
weight
passage
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410840403.7A
Other languages
English (en)
Inventor
卢金鑫
谢衍涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ThunderSoft Co Ltd
Original Assignee
ThunderSoft Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ThunderSoft Co Ltd filed Critical ThunderSoft Co Ltd
Priority to CN201410840403.7A priority Critical patent/CN104484658A/zh
Publication of CN104484658A publication Critical patent/CN104484658A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/162Detection; Localisation; Normalisation using pixel segmentation or colour matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Color Image Communication Systems (AREA)
  • Image Processing (AREA)

Abstract

本发明提供一种基于多通道卷积神经网络的人脸性别识别方法及装置,其中基于多通道卷积神经网络的人脸性别识别方法,包括:从当前获取的图像中得到人脸图像;对人脸图像进行处理,得到多个颜色通道信息;将多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果;当表示性别的输出结果在第一预设范围内时,标识人脸性别为男性;当表示性别的输出结果在第二预设范围内时,标识人脸性别为女性。这样通过将人脸图像中的多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果。与现有技术相比增加了性别识别的颜色特征,从而相对于基于单一的灰颜色通道信息识别来说提高性别识别准确度。

Description

一种基于多通道卷积神经网络的人脸性别识别方法及装置
技术领域
本发明涉及人脸性别识别技术领域,更具体地说,涉及一种基于多通道卷积神经网络的人脸性别识别方法及装置。
背景技术
基于人脸图像的性别识别方法是人脸图像信息利用计算机技术识别被观察者的性别属性的过程,主要包括:人脸图像预处理、人脸性别特征提取、人脸性别分类和识别结果稳定四步骤。其中,人脸性别特征提取是性别分类算法的前提,性别特征提取的好坏直接影响着最后性别分类的性能。
目前,人脸性别特征提取的方法总体分为两类,一类是人工设计,包括LBP(Local Binary Patterns,局部二值模式),HOG(Histogram of Oriented Gradient,方向梯度直方图),SIFT(Scale-invariant Feature Transform,尺度不变特征转换)等;另一类是自动学习。人工设计的人脸性别特征提取方法具有识别效果好的特点,但是设计过程复杂,特征挑选过程繁琐,一定程度上依赖于设计者的经验。基于自动学习的人脸性别特征提取方法避免人工设计的缺点,同时达到了非常好的识别效果。
基于自动学习的人脸性别特征提取方法在进行特征提取时,仅提取灰度颜色通道信息进行人脸性别识别,虽然可以避免人工设计的缺点,但是其识别效果还是有一定缺陷。
发明内容
有鉴于此,本发明的目的是提供一种基于多通道卷积神经网络的人脸性别识别方法及装置,用于提高性别识别准确度。
为了实现上述目的,本发明提供如下技术方案:
本发明提供一种基于多通道卷积神经网络的人脸性别识别方法,包括:
从当前获取的图像中得到人脸图像,其中所述人脸图像为RGB图像;
对所述人脸图像进行处理,得到多个颜色通道信息;
将所述多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果;
当所述表示性别的输出结果在第一预设范围内时,标识人脸性别为男性;
当所述表示性别的输出结果在第二预设范围内时,标识人脸性别为女性。
优选地,所述多个颜色通道信息包括红颜色通道信息、绿颜色通道信息、蓝颜色通道信息、灰颜色通道信息、灰红颜色通道信息、灰绿颜色通道信息和灰蓝颜色通道信息。
优选地,对所述人脸图像进行处理,得到多个颜色通道信息,包括:
从所述人脸图像的R通道中获取红颜色通道信息;
从所述人脸图像的G通道中获取绿颜色通道信息;
从所述人脸图像的B通道中获取蓝颜色通道信息;
获取所述人脸图像的R通道、G通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰颜色通道信息,其中r+g+b=1,r为R通道的权重,g为G通道的权重,b为B通道的权重;
获取所述人脸图像的灰颜色通道和R通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰红颜色通道信息,其中gray+r=1,gray为灰颜色通道的权重,r为R通道的权重;
获取所述人脸图像的灰颜色通道和G通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰绿颜色通道信息,其中gray+g=1,gray为灰颜色通道的权重,g为G通道的权重;
获取所述人脸图像的灰颜色通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰绿颜色通道信息,其中gray+b=1,gray为灰颜色通道的权重,b为B通道的权重。
优选地,所述将所述多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果,包括:
将所述多个颜色通道信息输入到所述卷积神经网络中的特征抽取层,得到输出向量;
将所述输出向量输入到所述卷积神经网络中的全连接层,得到表示性别的输出结果。
优选地,将所述多个颜色通道信息输入到所述卷积神经网络中的特征抽取层,得到输出向量,包括:
依据公式进行卷积运算,并对卷积后的运算结果进行下采样得到输出向量,其中Mj表示输入的颜色通道数,inputi表示第i个颜色通道的输入,kij表示第i个颜色通道与第一个卷积层中第j个平面的卷积核,bj表示第一个卷积层中第j个平面的偏置,xj是第一个卷积层的第j个平面,f(·)表示激活函数,“*”号表示卷积操作。
本发明还提供一种基于多通道卷积神经网络的人脸性别识别装置,包括:
第一获取单元,用于从当前获取的图像中得到人脸图像,其中所述人脸图像为RGB图像;
第二获取单元,用于对所述人脸图像进行处理,得到多个颜色通道信息;
计算单元,用于将所述多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果;
第一标识单元,用于当所述表示性别的输出结果在第一预设范围内时,标识人脸性别为男性;
第二标识单元,用于当所述表示性别的输出结果在第二预设范围内时,标识人脸性别为女性。
优选地,所述多个颜色通道信息包括红颜色通道信息、绿颜色通道信息、蓝颜色通道信息、灰颜色通道信息、灰红颜色通道信息、灰绿颜色通道信息和灰蓝颜色通道信息。
优选地,所述第二获取单元包括:红颜色通道信息获取子单元、绿颜色通道信息获取子单元、蓝颜色通道信息获取子单元、灰颜色通道信息获取子单元、灰红颜色通道信息获取子单元、灰绿颜色通道信息获取子单元和灰蓝颜色通道信息获取子单元;其中,
所述红颜色通道信息获取子单元,用于从所述人脸图像的R通道中获取红颜色通道信息;
所述绿颜色通道信息获取子单元,用于从所述人脸图像的G通道中获取绿颜色通道信息;
所述蓝颜色通道信息获取子单元,用于从所述人脸图像的B通道中获取蓝颜色通道信息;
所述灰颜色通道信息获取子单元,用于获取所述人脸图像的R通道、G通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰颜色通道信息,其中r+g+b=1,r为R通道的权重,g为G通道的权重,b为B通道的权重;
所述灰红颜色通道信息获取子单元,用于获取所述人脸图像的灰颜色通道和R通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰红颜色通道信息,其中gray+r=1,gray为灰颜色通道的权重,r为R通道的权重;
所述灰绿颜色通道信息获取子单元,用于获取所述人脸图像的灰颜色通道和G通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰绿颜色通道信息,其中gray+g=1,gray为灰颜色通道的权重,g为G通道的权重;
所述灰蓝颜色通道信息获取子单元,用于获取所述人脸图像的灰颜色通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰绿颜色通道信息,其中gray+b=1,gray为灰颜色通道的权重,b为B通道的权重。
优选地,所述计算单元包括:第一计算子单元和第二计算子单元;其中,
所述第一计算子单元,用于将所述多个颜色通道信息输入到所述卷积神经网络中的特征抽取层,得到输出向量;
所述第二计算子单元,用于将所述输出向量输入到所述卷积神经网络中的全连接层,得到表示性别的输出结果。
优选地,所述第一计算子单元将所述多个颜色通道信息输入到所述卷积神经网络中的特征抽取层,得到输出向量,包括:
依据公式进行卷积运算,并对卷积后的运算结果进行下采样得到输出向量,其中Mj表示输入的颜色通道数,inputi表示第i个颜色通道的输入,kij表示第i个颜色通道与第一个卷积层中第j个平面的卷积 核,bj表示第一个卷积层中第j个平面的偏置,xj是第一个卷积层的第j个平面,f(·)表示激活函数,“*”号表示卷积操作。
与现有技术相比,本发明的优点如下:
本发明提供的基于多通道卷积神经网络的人脸性别识别方法通过将人脸图像中的多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果。与现有技术相比增加了性别识别的颜色特征,从而相对于基于单一的灰颜色通道信息识别来说提高性别识别准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明实施例提供的基于多通道卷积神经网络的人脸性别识别方法的流程图;
图2是图1所示基于多通道卷积神经网络的人脸性别识别方法中多颜色通道信息计算的流程图;
图3是本发明实施例提供的卷积神经网络的示意图;
图4是本发明实施例提供的卷积神经网络构建的示意图;
图5是本发明实施例提供的基于多通道卷积神经网络的人脸性别识别装置的结构示意图;
图6是图5所示基于多通道卷积神经网络的人脸性别识别装置中第二获取单元的结构示意图。
具体实施方式
发明人经过研究发现,目前在对人脸性别识别时,通常利用人脸图像的灰度颜色通道信息进行性别识别,其抛弃人脸图像的彩色通道颜色信息,而利用人脸图像的彩色通道颜色信息进行识别能够有效提升识别率,即提高性别识别准确度。基于此本发明实施例提供了一种基于多通道卷积神经网络的人脸性别识别方法,其核心思想之一是:将多个颜色通道信息输入到预先得 到的卷积神经网络中来识别人脸性别。
为了使本领域技术人员更好地理解本发明,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的基于多通道卷积神经网络的人脸性别识别方法的流程图,可以包括以下步骤:
101:从当前获取的图像中得到人脸图像,其中人脸图像为RGB(红绿蓝)图像。在获取到一张图像后,可以使用人脸检测器检测当前获取的图像中是否包括人脸,当检测到当前获取的图像中包括人脸时,从当前获取的图像中得到人脸图像。
102:对人脸图像进行处理,得到多个颜色通道信息。在本发明实施例中,多个颜色通道信息不仅包括灰颜色通道信息,还包括其他颜色通道信息,以为后续进行识别时提高性别识别准确度。
其中多个颜色通道信息可以包括红颜色通道信息、绿颜色通道信息、蓝颜色通道信息、灰颜色通道信息、灰红颜色通道信息、灰绿颜色通道信息和灰蓝颜色通道信息这七个颜色通道信息。对这七个颜色通道信息的获取方式可以参阅图2所示,包括以下步骤:
1021:从人脸图像的R(红)通道中获取红颜色通道信息。
1022:从人脸图像的G(绿)通道中获取绿颜色通道信息。
1023:从人脸图像的B(蓝)通道中获取蓝颜色通道信息。
1024:获取人脸图像的R通道、G通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到灰颜色通道信息,其中r+g+b=1,r为R通道的权重,g为G通道的权重,b为B通道的权重。
1025:获取人脸图像的灰颜色通道和R通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到灰红颜色通道信息,其中gray+r=1,gray为灰颜色通道的权重,r为R通道的权重。
1026:获取人脸图像的灰颜色通道和G通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到灰绿颜色通道信息,其中gray+g=1,gray为灰颜色通道的权重,g为G通道的权重。
1027:获取人脸图像的灰颜色通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到灰绿颜色通道信息,其中gray+b=1,gray为灰颜色通道的权重,b为B通道的权重。
从上述获取过程可以看出,红颜色通道信息、绿颜色通道信息和蓝颜色通道信息这三个颜色通道信息可以从对应的颜色通道中获取,灰颜色通道信息则是对R通道、G通道和B通道进行权重计算得到。红颜色通道信息、灰绿颜色通道信息和灰蓝颜色通道信息这三个颜色通道信息则是由灰颜色通道和对应的单一颜色通道信息进行权重计算得到。
103:将多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果。
本领域技术人员公知的,卷积神经网络是一种集特征提取和分类为一体的一种神经网络,卷积操作具有抗旋转,抗偏移的特性,该特性能够有效地抵消由于不同人脸检测器得到的人脸图像带来的人脸框偏差以及人脸角度带来的影响;其权值共享的特性大大降低了模型的参数,使得网络更容易学习和收敛,并且使用下采样处理大大降低特征的维度,有效地保留人脸图像的主要特征。因此卷积神经网络能够提取出有利于性别分类的特征。
目前卷积神经网络是一个多层的神经网络,包括特征抽取层和全连接层。其中特征抽取层又包括卷积层和下采样层。在特征抽取层中,每层由多个二维平面组成,而每个平面由多个独立的神经元组成。特征抽取层的输出连接成一个向量输入到全连接层,最后得到表示性别的输出结果。
如图3所示,其中input表示多个颜色通道信息的输入,C1和S1构成特征抽取层,C1为卷积层,S1为下采样层,C2、S2和hidden则构成全连接层,每个矩形表示一个二维平面,且每个矩形上的小矩形表示一个独立的神经元。
在经过卷积神经网络计算时,可以首先将多个颜色通道信息输入到卷积神经网络中的特征抽取层,得到输出向量;将输出向量输入到卷积神经网络中的全连接层,得到表示性别的输出结果。
其中将多个颜色通道信息输入到卷积神经网络中的特征抽取层,得到输出向量的过程可以是:依据公式进行卷积运算,并对卷积后的运算结果进行下采样得到输出向量,其中Mj表示输入的颜色通道数,inputi表示第i个颜色通道的输入,kij表示第i个颜色通道与第一个卷积层中第j个平面的卷积核,bj表示第一个卷积层中第j个平面的偏置,xj是第一个卷积层的第j个平面,f(·)表示激活函数,“*”号表示卷积操作。
在得到输出向量后,全连接层对输出向量的处理过程与现有技术中单一灰颜色通道信息在全连接层的处理过程相同,对此本发明实施例不再阐述。
104:当表示性别的输出结果在第一预设范围内时,标识人脸性别为男性。
105:当表示性别的输出结果在第二预设范围内时,标识人脸性别为女性。
在本发明实施例中,第一预设范围和第二预设范围是预先设置用于区分性别的取值范围,例如用于区分男性和女性的性别时可以将0.5设置为区分点,当大于0.5时将人脸性别标识为男性;当小于0.5时将人脸性别标识为女性。那么第一预设范围可以是[1,0.5),第二预设范围是(0.5,0]。
从上述过程可以看出,本发明提供的基于多通道卷积神经网络的人脸性别识别方法通过将人脸图像中的多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果。与现有技术相比增加了性别识别的颜色特征,从而相对于基于单一的灰颜色通道信息识别来说提高性别识别准确度。
在这里需要说明的一点是:本发明实施例使用的卷积神经网络是预先对已知性别的人脸图像进行识别得到的,其具体过程可以参阅图4所示,包括:
201:从已知性别的人脸图像库中选取一定数量的人脸图像作为训练样本,所选取的人脸图像包括男性的人脸图像和女性的人脸图像。
202:对每个训练样本进行处理,得到每个训练样本的多个颜色通道信息,其中多个颜色通道信息包括红颜色通道信息、绿颜色通道信息、蓝颜色通道信息、灰颜色通道信息、灰红颜色通道信息、灰绿颜色通道信息和灰蓝颜色通道信息这七个颜色通道信息,对其计算过程可以参阅图2所示,此处不再阐述。
203:设定卷积神经网络的训练参数:输入层为7个通道,即红颜色通道,绿颜色通道,蓝颜色通道,灰颜色通道,灰红颜色通道,灰绿颜色通道,灰蓝颜色通道,卷积层数CN,每个卷积层的特征映射数maps,每个卷积层的滤波器核尺寸height*width,神经元的激活函数fc(x),下采样层数SN,下采样层的缩小比例scale,下采样层的步长为stride,下采样方式可以采用平均法或者局部最大值法。全连接的神经元(全连接层)个数H,神经元的激活函数fh(x),输出层神经元个数O;输出层的激活函数fo(x)。训练的迭代次数I。上述的激活函数可以是sigmoid函数、tangent函数或者relu函数等线性或非线性的函数。选择代价函数J(W)。代价函数是均方误差函数
204:初始化迭代次数I,迭代索引i,i=1;
205:计算前向网络的输出误差,其中前向网络是卷积神经网络的前馈型网络,在采用前向网络计算输出误差时,表示性别的输出结果为1时标识为男性,表示性别的输出结果为0时标识为女性。
206:基于输出误差,使用误差反向传播算法更新卷积神经网络的权值,即滤波器核。
207:更新i,i=i+1,如果i>=I,则跳转到209。
208:从人脸图像库中重新选取训练样本,跳转到步骤205,依据步骤205和206对上一次得到的卷积神经网络进行处理。
209:训练停止,得到最终的卷积神经网络。
与上述方法实施例相对应,本发明实施例还提供一种基于多通道卷积神经网络的人脸性别识别装置,其结构示意图如图5所示,可以包括:第一获取单元11、第二获取单元12、计算单元13、第一标识单元14和第二标识单元15。其中,
第一获取单元11,用于从当前获取的图像中得到人脸图像,其中人脸图像为RGB图像。在获取到一张图像后,第一获取单元11可以使用人脸检测器检测当前获取的图像中是否包括人脸,当检测到当前获取的图像中包括人脸时,从当前获取的图像中得到人脸图像。
第二获取单元12,用于对人脸图像进行处理,得到多个颜色通道信息。在本发明实施例中,多个颜色通道信息不仅包括灰颜色通道信息,还包括其他颜色通道信息,以为后续进行识别时提高性别识别准确度。
其中多个颜色通道信息可以包括红颜色通道信息、绿颜色通道信息、蓝颜色通道信息、灰颜色通道信息、灰红颜色通道信息、灰绿颜色通道信息和灰蓝颜色通道信息这七个颜色通道信息。
在本发明实施例中,第二获取单元12的结构示意图可以如图6所示,可以包括:红颜色通道信息获取子单元121、绿颜色通道信息获取子单元122、蓝颜色通道信息获取子单元123、灰颜色通道信息获取子单元124、灰红颜色通道信息获取子单元125、灰绿颜色通道信息获取子单元126和灰蓝颜色通道信息获取子单元127。其中,
红颜色通道信息获取子单元121,用于从人脸图像的R通道中获取红颜色通道信息。
绿颜色通道信息获取子单元122,用于从人脸图像的G通道中获取绿颜色通道信息。
蓝颜色通道信息获取子单元123,用于从人脸图像的B通道中获取蓝颜色通道信息。
灰颜色通道信息获取子单元124,用于获取人脸图像的R通道、G通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到灰颜色通道信息,其中r+g+b=1,r为R通道的权重,g为G通道的权重,b为B通道的权重。
灰红颜色通道信息获取子单元125,用于获取人脸图像的灰颜色通道和R通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到灰红颜色通道信息,其中gray+r=1,gray为灰颜色通道的权重,r为R通道的权重。
灰绿颜色通道信息获取子单元126,用于获取人脸图像的灰颜色通道和G通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到灰绿颜色通道信息,其中gray+g=1,gray为灰颜色通道的权重,g为G通道的权重。
灰蓝颜色通道信息获取子单元127,用于获取人脸图像的灰颜色通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到灰绿颜色通道信息,其中gray+b=1,gray为灰颜色通道的权重,b为B通道的权重。
从上述获取过程可以看出,红颜色通道信息、绿颜色通道信息和蓝颜色通道信息这三个颜色通道信息可以从对应的颜色通道中获取,灰颜色通道信息则是对R通道、G通道和B通道进行权重计算得到。红颜色通道信息、灰绿颜色通道信息和灰蓝颜色通道信息这三个颜色通道信息则是由灰颜色通道和对应的单一颜色通道信息进行权重计算得到。
计算单元13,用于将多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果。其中卷积神经网络的预先得到过程可以参阅图4所示流程图,对此本发明实施例不再阐述。
在本发明实施例中,计算单元13可以包括:第一计算子单元和第二计算子单元。其中,第一计算子单元,用于将多个颜色通道信息输入到卷积神经网络中的特征抽取层,得到输出向量。第二计算子单元,用于将输出向量输入到卷积神经网络中的全连接层,得到表示性别的输出结果。
并且第一计算子单元可以依据公式进行卷积运算,并对卷积后的运算结果进行下采样得到输出向量,其中Mj表示输入的颜色通道数,inputi表示第i个颜色通道的输入,kij表示第i个颜色通道与第一个卷积层中第j个平面的卷积核,bj表示第一个卷积层中第j个平面的偏置,xj是第一个卷积层的第j个平面,f(·)表示激活函数,“*”号表示卷积操作。
第一标识单元14,用于当表示性别的输出结果在第一预设范围内时,标识人脸性别为男性。
第二标识单元15,用于当表示性别的输出结果在第二预设范围内时,标识人脸性别为女性。
在本发明实施例中,第一预设范围和第二预设范围是预先设置用于区分性别的取值范围,例如用于区分男性和女性的性别时可以将0.5设置为区分点,当大于0.5时将人脸性别标识为男性;当小于0.5时将人脸性别标识为女性。那么第一预设范围可以是[1,0.5),第二预设范围是(0.5,0]。
从上述过程可以看出,本发明提供的基于多通道卷积神经网络的人脸性别识别装置通过将人脸图像中的多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果。与现有技术相比增加了性别识别的颜色特征,从而相对于基于单一的灰颜色通道信息识别来说提高性别识别准确度。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种基于多通道卷积神经网络的人脸性别识别方法,其特征在于,包括:
从当前获取的图像中得到人脸图像,其中所述人脸图像为RGB图像;
对所述人脸图像进行处理,得到多个颜色通道信息;
将所述多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果;
当所述表示性别的输出结果在第一预设范围内时,标识人脸性别为男性;
当所述表示性别的输出结果在第二预设范围内时,标识人脸性别为女性。
2.根据权利要求1所述的方法,其特征在于,所述多个颜色通道信息包括红颜色通道信息、绿颜色通道信息、蓝颜色通道信息、灰颜色通道信息、灰红颜色通道信息、灰绿颜色通道信息和灰蓝颜色通道信息。
3.根据权利要求2所述的方法,其特征在于,对所述人脸图像进行处理,得到多个颜色通道信息,包括:
从所述人脸图像的R通道中获取红颜色通道信息;
从所述人脸图像的G通道中获取绿颜色通道信息;
从所述人脸图像的B通道中获取蓝颜色通道信息;
获取所述人脸图像的R通道、G通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰颜色通道信息,其中r+g+b=1,r为R通道的权重,g为G通道的权重,b为B通道的权重;
获取所述人脸图像的灰颜色通道和R通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰红颜色通道信息,其中gray+r=1,gray为灰颜色通道的权重,r为R通道的权重;
获取所述人脸图像的灰颜色通道和G通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰绿颜色通道信息,其中gray+g=1,gray为灰颜色通道的权重,g为G通道的权重;
获取所述人脸图像的灰颜色通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰绿颜色通道信息,其中gray+b=1,gray为灰颜色通道的权重,b为B通道的权重。
4.根据权利要求1所述的方法,其特征在于,所述将所述多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果,包括:
将所述多个颜色通道信息输入到所述卷积神经网络中的特征抽取层,得到输出向量;
将所述输出向量输入到所述卷积神经网络中的全连接层,得到表示性别的输出结果。
5.根据权利要求4所述的方法,其特征在于,将所述多个颜色通道信息输入到所述卷积神经网络中的特征抽取层,得到输出向量,包括:
依据公式进行卷积运算,并对卷积后的运算结果进行下采样得到输出向量,其中Mj表示输入的颜色通道数,inputi表示第i个颜色通道的输入,kij表示第i个颜色通道与第一个卷积层中第j个平面的卷积核,bj表示第一个卷积层中第j个平面的偏置,xj是第一个卷积层的第j个平面,f(·)表示激活函数,“*”号表示卷积操作。
6.一种基于多通道卷积神经网络的人脸性别识别装置,其特征在于,包括:
第一获取单元,用于从当前获取的图像中得到人脸图像,其中所述人脸图像为RGB图像;
第二获取单元,用于对所述人脸图像进行处理,得到多个颜色通道信息;
计算单元,用于将所述多个颜色通道信息输入到预先得到的卷积神经网络中进行计算,得到表示性别的输出结果;
第一标识单元,用于当所述表示性别的输出结果在第一预设范围内时,标识人脸性别为男性;
第二标识单元,用于当所述表示性别的输出结果在第二预设范围内时,标识人脸性别为女性。
7.根据权利要求6所述的装置,其特征在于,所述多个颜色通道信息包括红颜色通道信息、绿颜色通道信息、蓝颜色通道信息、灰颜色通道信息、灰红颜色通道信息、灰绿颜色通道信息和灰蓝颜色通道信息。
8.根据权利要求7所述的装置,其特征在于,所述第二获取单元包括:红颜色通道信息获取子单元、绿颜色通道信息获取子单元、蓝颜色通道信息获取子单元、灰颜色通道信息获取子单元、灰红颜色通道信息获取子单元、灰绿颜色通道信息获取子单元和灰蓝颜色通道信息获取子单元;其中,
所述红颜色通道信息获取子单元,用于从所述人脸图像的R通道中获取红颜色通道信息;
所述绿颜色通道信息获取子单元,用于从所述人脸图像的G通道中获取绿颜色通道信息;
所述蓝颜色通道信息获取子单元,用于从所述人脸图像的B通道中获取蓝颜色通道信息;
所述灰颜色通道信息获取子单元,用于获取所述人脸图像的R通道、G通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰颜色通道信息,其中r+g+b=1,r为R通道的权重,g为G通道的权重,b为B通道的权重;
所述灰红颜色通道信息获取子单元,用于获取所述人脸图像的灰颜色通道和R通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰红颜色通道信息,其中gray+r=1,gray为灰颜色通道的权重,r为R通道的权重;
所述灰绿颜色通道信息获取子单元,用于获取所述人脸图像的灰颜色通道和G通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰绿颜色通道信息,其中gray+g=1,gray为灰颜色通道的权重,g为G通道的权重;
所述灰蓝颜色通道信息获取子单元,用于获取所述人脸图像的灰颜色通道和B通道的权重,将各通道内的像素分别与对应的权重相乘并相加得到所述灰绿颜色通道信息,其中gray+b=1,gray为灰颜色通道的权重,b为B通道的权重。
9.根据权利要求6所述的装置,其特征在于,所述计算单元包括:第一计算子单元和第二计算子单元;其中,
所述第一计算子单元,用于将所述多个颜色通道信息输入到所述卷积神经网络中的特征抽取层,得到输出向量;
所述第二计算子单元,用于将所述输出向量输入到所述卷积神经网络中的全连接层,得到表示性别的输出结果。
10.根据权利要求9所述的装置,其特征在于,所述第一计算子单元将所述多个颜色通道信息输入到所述卷积神经网络中的特征抽取层,得到输出向量,包括:
依据公式进行卷积运算,并对卷积后的运算结果进行下采样得到输出向量,其中Mj表示输入的颜色通道数,inputi表示第i个颜色通道的输入,kij表示第i个颜色通道与第一个卷积层中第j个平面的卷积核,bj表示第一个卷积层中第j个平面的偏置,xj是第一个卷积层的第j个平面,f(·)表示激活函数,“*”号表示卷积操作。
CN201410840403.7A 2014-12-30 2014-12-30 一种基于多通道卷积神经网络的人脸性别识别方法及装置 Pending CN104484658A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410840403.7A CN104484658A (zh) 2014-12-30 2014-12-30 一种基于多通道卷积神经网络的人脸性别识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410840403.7A CN104484658A (zh) 2014-12-30 2014-12-30 一种基于多通道卷积神经网络的人脸性别识别方法及装置

Publications (1)

Publication Number Publication Date
CN104484658A true CN104484658A (zh) 2015-04-01

Family

ID=52759199

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410840403.7A Pending CN104484658A (zh) 2014-12-30 2014-12-30 一种基于多通道卷积神经网络的人脸性别识别方法及装置

Country Status (1)

Country Link
CN (1) CN104484658A (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068644A (zh) * 2015-07-24 2015-11-18 山东大学 一种基于卷积神经网络的p300脑电信号检测方法
CN105095867A (zh) * 2015-07-21 2015-11-25 哈尔滨多智科技发展有限公司 基于深度学习的快速动态人脸提取、识别方法
CN105654028A (zh) * 2015-09-29 2016-06-08 厦门中控生物识别信息技术有限公司 一种真假人脸识别方法及装置
CN105809090A (zh) * 2014-12-30 2016-07-27 中国科学院深圳先进技术研究院 一种人脸性别特征提取的方法及***
CN106127159A (zh) * 2016-06-28 2016-11-16 电子科技大学 一种基于卷积神经网络的性别识别方法
CN106503661A (zh) * 2016-10-25 2017-03-15 陕西师范大学 基于烟花深度信念网络的人脸性别识别方法
CN107220990A (zh) * 2017-06-22 2017-09-29 成都品果科技有限公司 一种基于深度学习的头发分割方法
CN107292885A (zh) * 2017-08-08 2017-10-24 广东工业大学 一种基于自动编码器的产品缺陷分类识别方法及装置
CN107301389A (zh) * 2017-06-16 2017-10-27 广东欧珀移动通信有限公司 基于人脸特征识别用户性别的方法、装置及终端
CN107316015A (zh) * 2017-06-19 2017-11-03 南京邮电大学 一种基于深度时空特征的高精度面部表情识别方法
CN107590460A (zh) * 2017-09-12 2018-01-16 北京达佳互联信息技术有限公司 人脸分类方法、装置及智能终端
CN107909008A (zh) * 2017-10-29 2018-04-13 北京工业大学 基于多通道卷积神经网络和粒子滤波的视频目标跟踪方法
CN109145837A (zh) * 2018-08-28 2019-01-04 厦门理工学院 人脸情感识别方法、装置、终端设备和存储介质
US10269120B2 (en) 2016-11-25 2019-04-23 Industrial Technology Research Institute Character recognition systems and character recognition methods thereof using convolutional neural network
CN110163049A (zh) * 2018-07-18 2019-08-23 腾讯科技(深圳)有限公司 一种人脸属性预测方法、装置及存储介质
CN110574026A (zh) * 2017-04-27 2019-12-13 苹果公司 用于交织通道数据的可配置卷积引擎
CN110874572A (zh) * 2019-10-29 2020-03-10 北京海益同展信息科技有限公司 一种信息检测方法及装置、存储介质
US10747843B2 (en) 2016-06-30 2020-08-18 Apple Inc. Configurable convolution engine
CN111753770A (zh) * 2020-06-29 2020-10-09 北京百度网讯科技有限公司 人物属性识别方法、装置、电子设备和存储介质
CN112507986A (zh) * 2021-02-03 2021-03-16 长沙小钴科技有限公司 基于神经网络的多通道人脸活体检测方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955718A (zh) * 2014-05-15 2014-07-30 厦门美图之家科技有限公司 一种图像主体对象的识别方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955718A (zh) * 2014-05-15 2014-07-30 厦门美图之家科技有限公司 一种图像主体对象的识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BENJAMIN GRAHAM: "Spatially-sparse convolutional neural networks", 《COMPUTER SCIENCE》 *
JAKE BOUVRIE: "Notes on Convolutional Neural Networks", 《COGPRINTS》 *
蔡诗威等: "一种基于卷积神经网络的性别识别方法", 《电视技术》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105809090A (zh) * 2014-12-30 2016-07-27 中国科学院深圳先进技术研究院 一种人脸性别特征提取的方法及***
CN105095867A (zh) * 2015-07-21 2015-11-25 哈尔滨多智科技发展有限公司 基于深度学习的快速动态人脸提取、识别方法
CN105068644A (zh) * 2015-07-24 2015-11-18 山东大学 一种基于卷积神经网络的p300脑电信号检测方法
CN105654028A (zh) * 2015-09-29 2016-06-08 厦门中控生物识别信息技术有限公司 一种真假人脸识别方法及装置
CN106127159A (zh) * 2016-06-28 2016-11-16 电子科技大学 一种基于卷积神经网络的性别识别方法
US10747843B2 (en) 2016-06-30 2020-08-18 Apple Inc. Configurable convolution engine
CN106503661B (zh) * 2016-10-25 2019-06-28 陕西师范大学 基于烟花深度信念网络的人脸性别识别方法
CN106503661A (zh) * 2016-10-25 2017-03-15 陕西师范大学 基于烟花深度信念网络的人脸性别识别方法
US10269120B2 (en) 2016-11-25 2019-04-23 Industrial Technology Research Institute Character recognition systems and character recognition methods thereof using convolutional neural network
US10685421B1 (en) 2017-04-27 2020-06-16 Apple Inc. Configurable convolution engine for interleaved channel data
CN110574026A (zh) * 2017-04-27 2019-12-13 苹果公司 用于交织通道数据的可配置卷积引擎
CN110574026B (zh) * 2017-04-27 2021-02-26 苹果公司 卷积引擎、电子设备和用于处理数据的方法
CN107301389B (zh) * 2017-06-16 2020-04-14 Oppo广东移动通信有限公司 基于人脸特征识别用户性别的方法、装置及终端
CN107301389A (zh) * 2017-06-16 2017-10-27 广东欧珀移动通信有限公司 基于人脸特征识别用户性别的方法、装置及终端
CN107316015A (zh) * 2017-06-19 2017-11-03 南京邮电大学 一种基于深度时空特征的高精度面部表情识别方法
CN107316015B (zh) * 2017-06-19 2020-06-30 南京邮电大学 一种基于深度时空特征的高精度面部表情识别方法
CN107220990A (zh) * 2017-06-22 2017-09-29 成都品果科技有限公司 一种基于深度学习的头发分割方法
CN107292885A (zh) * 2017-08-08 2017-10-24 广东工业大学 一种基于自动编码器的产品缺陷分类识别方法及装置
CN107590460B (zh) * 2017-09-12 2019-05-03 北京达佳互联信息技术有限公司 人脸分类方法、装置及智能终端
CN107590460A (zh) * 2017-09-12 2018-01-16 北京达佳互联信息技术有限公司 人脸分类方法、装置及智能终端
CN107909008A (zh) * 2017-10-29 2018-04-13 北京工业大学 基于多通道卷积神经网络和粒子滤波的视频目标跟踪方法
CN110163049A (zh) * 2018-07-18 2019-08-23 腾讯科技(深圳)有限公司 一种人脸属性预测方法、装置及存储介质
CN110163049B (zh) * 2018-07-18 2023-08-29 腾讯科技(深圳)有限公司 一种人脸属性预测方法、装置及存储介质
CN109145837A (zh) * 2018-08-28 2019-01-04 厦门理工学院 人脸情感识别方法、装置、终端设备和存储介质
CN110874572A (zh) * 2019-10-29 2020-03-10 北京海益同展信息科技有限公司 一种信息检测方法及装置、存储介质
CN111753770A (zh) * 2020-06-29 2020-10-09 北京百度网讯科技有限公司 人物属性识别方法、装置、电子设备和存储介质
CN112507986A (zh) * 2021-02-03 2021-03-16 长沙小钴科技有限公司 基于神经网络的多通道人脸活体检测方法及装置

Similar Documents

Publication Publication Date Title
CN104484658A (zh) 一种基于多通道卷积神经网络的人脸性别识别方法及装置
CN108182441B (zh) 平行多通道卷积神经网络、构建方法及图像特征提取方法
CN108549873B (zh) 三维人脸识别方法和三维人脸识别***
Oh et al. Approaching the computational color constancy as a classification problem through deep learning
CN106599854B (zh) 基于多特征融合的人脸表情自动识别方法
CN111160269A (zh) 一种人脸关键点检测方法及装置
CN102938065B (zh) 基于大规模图像数据的人脸特征提取方法及人脸识别方法
CN103186904B (zh) 图片轮廓提取方法及装置
CN108717524B (zh) 一种基于双摄手机和人工智能***的手势识别***
US10445602B2 (en) Apparatus and method for recognizing traffic signs
CN109684959B (zh) 基于肤色检测和深度学习的视频手势的识别方法及装置
CN106650806A (zh) 一种用于行人检测的协同式深度网络模型方法
CN108681692A (zh) 一种基于深度学习的遥感图像内新增建筑识别方法
CN106682569A (zh) 一种基于卷积神经网络的快速交通标识牌识别方法
CN105956560A (zh) 一种基于池化多尺度深度卷积特征的车型识别方法
CN104408405B (zh) 人脸表示和相似度计算方法
Almogdady et al. A flower recognition system based on image processing and neural networks
CN104200228B (zh) 一种安全带识别方法与***
CN112906550B (zh) 一种基于分水岭变换的静态手势识别方法
CN105956570B (zh) 基于唇部特征和深度学习的笑脸识别方法
CN110032932B (zh) 一种基于视频处理和决策树设定阈值的人体姿态识别方法
CN103839042A (zh) 人脸识别方法和人脸识别***
CN110046544A (zh) 基于卷积神经网络的数字手势识别方法
CN107818299A (zh) 基于融合hog特征和深度信念网络的人脸识别算法
CN109920018A (zh) 基于神经网络的黑白照片色彩恢复方法、装置及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150401

RJ01 Rejection of invention patent application after publication