CN109815814B - 一种基于卷积神经网络的人脸检测方法 - Google Patents

一种基于卷积神经网络的人脸检测方法 Download PDF

Info

Publication number
CN109815814B
CN109815814B CN201811572322.8A CN201811572322A CN109815814B CN 109815814 B CN109815814 B CN 109815814B CN 201811572322 A CN201811572322 A CN 201811572322A CN 109815814 B CN109815814 B CN 109815814B
Authority
CN
China
Prior art keywords
image
neural network
convolutional neural
loss function
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811572322.8A
Other languages
English (en)
Other versions
CN109815814A (zh
Inventor
刘高华
王萌
苏寒松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin University
Original Assignee
Tianjin University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin University filed Critical Tianjin University
Priority to CN201811572322.8A priority Critical patent/CN109815814B/zh
Publication of CN109815814A publication Critical patent/CN109815814A/zh
Application granted granted Critical
Publication of CN109815814B publication Critical patent/CN109815814B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本发明公开了一种基于卷积神经网络的人脸检测方法,包括步骤:步骤(1)、建立数据库;步骤(2)、对数据库中的图像进行;预处理;步骤(3)、训练深搭建好的度学习网络;步骤(4)、对训练结果进行测试,对于图片中出现的有遮挡的、不同角度的、侧面的人脸以及图片中较小的、较模糊的人脸的检测准确率较高,并且网络结构简单,迭代参数较少,训练时间较短。

Description

一种基于卷积神经网络的人脸检测方法
技术领域
本发明属于计算机视觉、人工智能领域,特别涉及一种基于卷积神经网络的人脸检测方法。
背景技术
人脸检测是指在有人脸的图像中,确定出人脸所在的位置、大小的过程,是计算机视觉领域中重要的组成部分,也是进行人脸识别时预处理的关键步骤,其检测精度很大程度上也决定着人脸识别的精度,对后续的工作有着很大的影响,因此,对人脸检测的研究有着重大的意义和实用价值。
人脸检测在实际生活中有着广泛的应用:例如人份认证与安全防护、在关于人脸方面媒体与娱乐、手机、数码相机等电子产品中、以及图像检索层面等等。人脸检测方法大致可分为传统的检测方法(包括基于匹配模板的检测方法、基于距离的检测方法等)以及基于深度学习的检测方法。
近年来深度学习得到不断的完善和发展,无论是在分类还是回归任务上都得到了广泛的应用。基于深度学习的人脸检测方法也在不断发展,但对于目前的方法而言,以最常应用的MTCNN方法为例,其识别速度不够快,识别精度不够高,特别是对于图像、视频中有遮挡、或不同角度、侧面以及在画面中较小的人脸不易检测到。而作为人脸识别过程的预处理步骤,人脸检测的精度也在很大程度上影响着后续识别工作的精度,因此解决这些问题至关重要。
发明内容
基于现有技术,本发明提出了一种基于卷积神经网络的人脸检测方法,特别是涉及对画面中由于光照、遮挡的或者是处于侧面状态以及在画面中很小的人脸的检测,通过建立新的数据库,搭建卷积神经网络,并通过调整超参数,不断迭代训练网络,可以得到一个较好的检测效果,从而有效的对人脸进行检测。
本发明提出了一种基于卷积神经网络的人脸检测方法,该方法包括以下步骤:
一种基于卷积神经网络的人脸检测方法,该方法包括以下步骤:
步骤1、建立数据库获得图像数据进行预处理构建卷积神经网络;
步骤2、通过卷积神经网络中的图像特征分析模块对预处理数据进行四次迭代运算生成图像特征参数;
步骤3、通过卷积神经网络中的全连接层对图像特征参数运算生成图像一维向量;
步骤4、通过卷积神经网络中的分类层对图像一维向量进行分类和回归获得人脸图像的位置坐标。
所述步骤2图像特征分析模块对预处理数据过程,包括如下步骤:
步骤2.1所述图像特征分析模块的卷积层对预处理数据的权值与参数进行相卷积的方法提取图像特征;
步骤2.2、所述图像特征分析模块的激活函数层将图像特征运用ReLu函数进行非线性运算获得非线性特征图参数;
步骤2.3、所述图像特征分析模块的最大池化层对非线性特征图的参数进行降低处理。
所述步骤4中分类层对图像一维向量进行分类和回归过程:包括如下步骤。
步骤4.1,通过随机梯度下降法的优化方法对图像一维向量进行迭代权值,达到令损失函数不断的调整,从不断调整训练时的超参数以获得最佳训练结果,其中超参数包含:迭代次数、批次、最大迭代次数、学习率;
步骤4.2,分类过程选取的损失函数为将中心损失函数与softmax损失函数相结合
的方法,具体表达式为:
Figure BDA0001915858600000021
其中,LS为softmax损失函数,Lc为中心损失函数,λ为系数,表示二者权重这里取λ=0.1。式中Wx+b为全连接层的输出,经log后表示xi属于类别yi的概率,C表示类别的特征中心;
步骤4.3,回归过程所采用的损失函数为:欧氏距离损失函数,具体表达式如下:
Figure BDA0001915858600000031
yi∈R4
其中,
Figure BDA0001915858600000032
是网络预测的输出结果,y为标记的真实标签,即68个人脸关键点的坐标。步骤4.4,将最优权值条件下输出的68个人脸关键点的坐标与数据库中带标签的的人脸关键点坐标及人脸作比对,从而算出此卷积神经网络用于人脸检测的准确率。
有益效果
与现有的技术相比,本发明提供一种基于卷积神经网络的人脸检测方法,对于图片中出现的有遮挡的、不同角度的、侧面的人脸以及图片中较小的、较模糊的人脸的检测准确率较高,并且网络结构简单,迭代参数较少,训练时间较短。
附图说明
图1为一种基于卷积神经网络的人脸检测方法的流程图;
图2为本发明所提出的一种基于卷积神经网络的人脸识别方法所用卷积神经网络的连接方式,其中包含四个卷积层,四个ReLu激活函数层、四个最大池化层、两个全连接层,其中最后一个全连接层为softmax分类层;
具体实施方式
下面结合附图对本发明作进一步详细描述:
如图1所示,为一种基于卷积神经网络的人脸检测方法的流程图。
一种基于卷积神经网络的人脸检测方法,该方法包括以下步骤:
步骤1(110)建立数据库获得图像数据进行预处理构建卷积神经网络;
本步骤中,建立数据库获得图像数据,即在所建立数据库中包含以下要求的图片:图片中含有至少一个人脸,人脸的位置不做要求,最好是不在正中心、距离较远的人脸;且人脸所处背景复杂多样,包含室内及室外各种场景;用矩形框标记出图像中人脸的所在位置,并且标记出人脸中包括眉毛、眼睛、鼻子、嘴巴、脸部轮廓在内的68个关键点。图像清晰度不做要求。所建立的数据库中共包含6000张包含人脸并做好标记的图像。
本步骤中,将数据库中的图像进行预处理过程,对于所建立好的数据库中的图像首先进行空间金字塔池化操作,此操作可由一张图像得到不同像素、不同尺度的多张图像,便于从多尺度的特征中提取出固定大小的特征向量;将上述步骤生成的所有图片进行随机镜像,包括上下、左右镜像操作;将上述步骤处理好的数据库图像中的4/5用作训练数据库,1/5用作测试数据库;
步骤2、(210)通过卷积神经网络中的图像特征分析模块对预处理数据进行四次迭代运算生成图像特征参数;
步骤2.1所述图像特征分析模块的卷积层对预处理数据的权值与参数进行相卷积的方法提取图像特征;
2.2、所述图像特征分析模块的激活函数层将图像特征运用ReLu函数进行非线性运算获得非线性特征图参数;
步骤2.3、所述图像特征分析模块的最大池化层对非线性特征图的参数进行降低处理。
本发明是将预处理后的测试数据库图像送入已训练好的神经网络中,测试图片经过训练好的神经网络权值矩阵,提取特征后经过分类器,输出分类与回归的结果,分类的结果以概率形式表示,若判定为人脸的概率大于判定为非人脸的概率,即判定为人脸,并将判定为人脸的部分用矩形框标记;回归的结果是图片中人脸部分68个关键点处用关键点标记出,并返回标记的坐标。
步骤3、(310)通过卷积神经网络中的全连接层对图像特征参数运算生成图像一维向量。
步骤4、(410)通过卷积神经网络中的分类层对图像一维向量进行分类和回归获得人脸图像的位置坐标。所述步骤4中分类层对图像一维向量进行分类和回归过程:包括如下步骤:
步骤4.1,通过随机梯度下降法的优化方法对图像一维向量进行迭代权值,达到令损失函数不断的调整,从不断调整训练时的超参数以获得最佳训练结果,其中超参数包含:迭代次数、批次、最大迭代次数、学习率;
步骤4.2,分类过程选取的损失函数为将中心损失函数与softmax损失函数相结合的方法,具体表达式为:
Figure BDA0001915858600000051
其中,LS为softmax损失函数,Lc为中心损失函数,λ为系数,表示二者权重这里取λ=0.1。式中Wx+b为全连接层的输出,经log后表示xi属于类别yi的概率,C表示类别的特征中心;
步骤4.3,回归过程所采用的损失函数为:欧氏距离损失函数,具体表达式如下:
Figure BDA0001915858600000052
yi∈R4
其中,
Figure BDA0001915858600000053
是网络预测的输出结果,y为标记的真实标签,即68个人脸关键点的坐标。步骤4.4,将最优权值条件下输出的68个人脸关键点的坐标与数据库中带标签的的人脸关键点坐标及人脸作比对,从而算出此卷积神经网络用于人脸检测的准确率。
本发明训练任务整体分为两个部分:分类与回归。分类是指将人脸检测问题视作人脸以及非人脸的二分类问题;回归是指经神经网络训练后返回出人脸边框的坐标以及人脸68个关键点的所在位置的坐标的过程,从而完成检测人脸的目的。经过不断迭代更新网络中的权值,以减小损失函数,从而最终得到最优权值;将最优权值条件下输出的识别结果与数据库中带标签的的人脸关键点坐标及人脸作比对,从而算出此卷积神经网络用于人脸检测的准确率。
如图2所示,本发明所提出的一种基于卷积神经网络的人脸识别方法所用卷积神经网络包含四个卷积层,四个ReLu激活函数层、四个最大池化层、两个全连接层,其中最后一个全连接层为softmax分类层。其作用分别为:卷积层用于利用将卷积层权值与参数相卷积的方法提取图像的特征;激活函数层是为了增加网络的非线性能力,其中ReLu函数指的是y=max(0,x)这一函数;最大池化层是为了减少输出大小、降低参数量;全连接层是为了将所提取到的特征映射为一维向量;分类层是为了在前述网络提取出的特征中分类出人脸、非人脸两个部分,以及回归出人脸的68个关键点的坐标。整个训练过程为:首先随机初始化卷积层与全连接层中的参数,当将所建立的数据库中的图像送至这个网络后,经过四个卷积、激活、池化层之后,得到人脸的特征,再通过全连接层得到固定大小的特征向量,最后通过分类层得到人脸所在位置的坐标。分类层是为了在前述网络提取出的特征中分类出人脸、非人脸两个部分,以及回归出人脸的68个关键点的坐标。在网络训练的过程中,数据沿网络正向传播,通过损失函数得到的误差沿网络反向传播,使卷积层与全连接层中的参数不断优化,通过不断训练、微调各种参数,最终得到好的训练效果。
本发明的整个训练过程为:首先随机初始化卷积层与全连接层中的参数,当将所建立的数据库中的图像送至这个网络后,经过四个卷积、激活、池化层之后,得到人脸的特征,再通过全连接层得到固定大小的特征向量,最后通过分类层得到人脸所在位置的坐标。在网络训练的过程中,数据沿网络正向传播,通过损失函数得到的误差沿网络反向传播,使卷积层与全连接层中的参数不断优化,通过不断训练、微调各种参数,最终得到好的训练效果。这一步骤是通过对数据库进行训练,从而得到最优的参数。在整个训练过程中,用损失函数表征实际标签与预测结果之间的误差,即通过使损失函数达到最小,不断进行迭代训练,到最后损失函数达到最小时,得到最优参数。其中,要训练的参数包括卷积层的卷积核以及偏置,以及全连接层中的神经元参数。在整个训练过程中,数据前向传播,由损失函数计算得到的误差反向传播,通过梯度下降法,使网络在不断迭代的过程中找到全局最优点,此时便得到了最优参数。在训练结束,即得到最优的网络参数之后,将最优参数代入至整个网络中,此时整个网络具备人脸检测的能力,即可进行人脸检测。之后通过测试可得到此神经网络用于人脸检测的准确率。
以上说书仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内的所作的任何修改、等同替换和改进等,均为包含在本发明的保护范围内。

Claims (2)

1.一种基于卷积神经网络的人脸检测方法,其特征在于,该方法包括以下步骤:
步骤1、建立数据库获得图像数据进行预处理构建卷积神经网络;
步骤2、通过卷积神经网络中的图像特征分析模块对预处理数据进行四次迭代运算生成图像特征参数;
步骤3、通过卷积神经网络中的全连接层对图像特征参数运算生成图像一维向量;
步骤4、通过卷积神经网络中的分类层对图像一维向量进行分类和回归获得人脸图像的位置坐标;其中:所述步骤4中分类层对图像一维向量进行分类和回归过程,包括如下步骤:
步骤4.1、通过随机梯度下降法的优化方法对图像一维向量进行迭代权值,达到令损失函数不断的调整,从不断调整训练时的超参数以获得最佳训练结果,其中超参数包含:迭代次数、批次、最大迭代次数、学习率;
步骤4.2、分类过程选取的损失函数为将中心损失函数与softmax损失函数相结合的方法,具体表达式为:
Figure FDA0003919103020000011
其中,LS为softmax损失函数,Lc为中心损失函数,λ为系数,表示二者权重这里取λ=0.1,式中Wx+b为全连接层的输出,经log后表示xi属于类别yi的概率,C表示类别的特征中心;
步骤4.3、回归过程所采用的损失函数为:欧氏距离损失函数,具体表达式如下:
Figure FDA0003919103020000012
yi∈R4
其中,
Figure FDA0003919103020000013
是网络预测的输出结果,y为标记的真实标签,即68个人脸关键点的坐标;
步骤4.4、将最优权值条件下输出的68个人脸关键点的坐标与数据库中带标签的的人脸关键点坐标及人脸作比对,从而算出此卷积神经网络用于人脸检测的准确率。
2.如权利要求1所述的基于卷积神经网络的人脸检测方法,其特征在于,所述步骤2中图像特征分析模块对预处理数据过程,包括如下步骤:
步骤2.1、所述图像特征分析模块的卷积层对预处理数据的权值与参数进行相卷积的方法提取图像特征;
步骤2.2、所述图像特征分析模块的激活函数层将图像特征运用ReLu函数进行非线性运算获得非线性特征图参数;
步骤2.3、所述图像特征分析模块的最大池化层对非线性特征图的参数进行降低处理。
CN201811572322.8A 2018-12-21 2018-12-21 一种基于卷积神经网络的人脸检测方法 Active CN109815814B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811572322.8A CN109815814B (zh) 2018-12-21 2018-12-21 一种基于卷积神经网络的人脸检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811572322.8A CN109815814B (zh) 2018-12-21 2018-12-21 一种基于卷积神经网络的人脸检测方法

Publications (2)

Publication Number Publication Date
CN109815814A CN109815814A (zh) 2019-05-28
CN109815814B true CN109815814B (zh) 2023-01-24

Family

ID=66602244

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811572322.8A Active CN109815814B (zh) 2018-12-21 2018-12-21 一种基于卷积神经网络的人脸检测方法

Country Status (1)

Country Link
CN (1) CN109815814B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110222764B (zh) * 2019-06-10 2021-06-18 中南民族大学 遮挡目标检测方法、***、设备及存储介质
CN111177469A (zh) * 2019-12-20 2020-05-19 国久大数据有限公司 人脸检索方法及人脸检索装置
CN111523452B (zh) * 2020-04-22 2023-08-25 北京百度网讯科技有限公司 用于检测图像中人***置的方法和装置
CN111612785B (zh) * 2020-06-03 2024-02-02 浙江大华技术股份有限公司 人脸图片质量评估方法、装置及存储介质
CN112084551A (zh) * 2020-07-03 2020-12-15 邱宇 一种基于对抗生成网络的建筑立面识别与生成方法
CN112052772A (zh) * 2020-08-31 2020-12-08 福建捷宇电脑科技有限公司 一种人脸遮挡检测算法
CN112733589B (zh) * 2020-10-29 2023-01-03 广西科技大学 一种基于深度学习的红外图像行人检测方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599830A (zh) * 2016-12-09 2017-04-26 中国科学院自动化研究所 人脸关键点定位方法及装置
CN106874883A (zh) * 2017-02-27 2017-06-20 中国石油大学(华东) 一种基于深度学习的实时人脸检测方法及***
CN107292267A (zh) * 2017-06-21 2017-10-24 北京市威富安防科技有限公司 照片造假卷积神经网络训练方法及人脸活体检测方法
CN107358223A (zh) * 2017-08-16 2017-11-17 上海荷福人工智能科技(集团)有限公司 一种基于yolo的人脸检测与人脸对齐方法
CN107729819A (zh) * 2017-09-22 2018-02-23 华中科技大学 一种基于稀疏全卷积神经网络的人脸标注方法
CN107871134A (zh) * 2016-09-23 2018-04-03 北京眼神科技有限公司 一种人脸检测方法及装置
CN107871106A (zh) * 2016-09-26 2018-04-03 北京眼神科技有限公司 人脸检测方法和装置
CN108073917A (zh) * 2018-01-24 2018-05-25 燕山大学 一种基于卷积神经网络的人脸识别方法
CN108427921A (zh) * 2018-02-28 2018-08-21 辽宁科技大学 一种基于卷积神经网络的人脸识别方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9141196B2 (en) * 2012-04-16 2015-09-22 Qualcomm Incorporated Robust and efficient learning object tracker
CN108496174B (zh) * 2015-10-28 2020-02-11 北京市商汤科技开发有限公司 用于面部识别的方法和***
US10032067B2 (en) * 2016-05-28 2018-07-24 Samsung Electronics Co., Ltd. System and method for a unified architecture multi-task deep learning machine for object recognition
KR20180057096A (ko) * 2016-11-21 2018-05-30 삼성전자주식회사 표정 인식과 트레이닝을 수행하는 방법 및 장치
CN107808129B (zh) * 2017-10-17 2021-04-16 南京理工大学 一种基于单个卷积神经网络的面部多特征点定位方法
CN108304788B (zh) * 2018-01-18 2022-06-14 陕西炬云信息科技有限公司 基于深度神经网络的人脸识别方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107871134A (zh) * 2016-09-23 2018-04-03 北京眼神科技有限公司 一种人脸检测方法及装置
CN107871106A (zh) * 2016-09-26 2018-04-03 北京眼神科技有限公司 人脸检测方法和装置
CN106599830A (zh) * 2016-12-09 2017-04-26 中国科学院自动化研究所 人脸关键点定位方法及装置
CN106874883A (zh) * 2017-02-27 2017-06-20 中国石油大学(华东) 一种基于深度学习的实时人脸检测方法及***
CN107292267A (zh) * 2017-06-21 2017-10-24 北京市威富安防科技有限公司 照片造假卷积神经网络训练方法及人脸活体检测方法
CN107358223A (zh) * 2017-08-16 2017-11-17 上海荷福人工智能科技(集团)有限公司 一种基于yolo的人脸检测与人脸对齐方法
CN107729819A (zh) * 2017-09-22 2018-02-23 华中科技大学 一种基于稀疏全卷积神经网络的人脸标注方法
CN108073917A (zh) * 2018-01-24 2018-05-25 燕山大学 一种基于卷积神经网络的人脸识别方法
CN108427921A (zh) * 2018-02-28 2018-08-21 辽宁科技大学 一种基于卷积神经网络的人脸识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
特征匹配融合结合改进卷积神经网络的人脸识别;李佳妮,张宝华;《激光与光电子学进展》;20180530;全文 *

Also Published As

Publication number Publication date
CN109815814A (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN109815814B (zh) 一种基于卷积神经网络的人脸检测方法
CN109584248B (zh) 基于特征融合和稠密连接网络的红外面目标实例分割方法
US20200285896A1 (en) Method for person re-identification based on deep model with multi-loss fusion training strategy
US11657602B2 (en) Font identification from imagery
Xie et al. Multilevel cloud detection in remote sensing images based on deep learning
CN106096561B (zh) 基于图像块深度学习特征的红外行人检测方法
CN109977757B (zh) 一种基于混合深度回归网络的多模态的头部姿态估计方法
CN114202672A (zh) 一种基于注意力机制的小目标检测方法
US10943352B2 (en) Object shape regression using wasserstein distance
CN111709313B (zh) 基于局部和通道组合特征的行人重识别方法
CN106023257A (zh) 一种基于旋翼无人机平台的目标跟踪方法
CN114332578A (zh) 图像异常检测模型训练方法、图像异常检测方法和装置
CN108288047A (zh) 一种行人/车辆检测方法
CN112766229B (zh) 基于注意力机制的人脸点云图像智能识别***及方法
CN110135327B (zh) 一种基于多区域特征学习模型的驾驶员行为识别方法
CN111882554B (zh) 一种基于SK-YOLOv3的电力线故障智能检测方法
CN111382791B (zh) 深度学习任务处理方法、图像识别任务处理方法和装置
CN110751005B (zh) 融合深度感知特征和核极限学习机的行人检测方法
CN113888603A (zh) 基于光流跟踪和特征匹配的回环检测及视觉slam方法
CN113469091A (zh) 人脸识别方法、训练方法、电子设备及存储介质
CN115272412B (zh) 一种基于边缘计算的低小慢目标检测方法及跟踪***
Chun-man et al. Face expression recognition based on improved MobileNeXt
CN118251698A (zh) 面向稀疏数据的鲁棒nerf模型新颖视图合成
CN115439926A (zh) 一种基于关键区域和场景深度的小样本异常行为识别方法
Ahmad et al. Resource efficient mountainous skyline extraction using shallow learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant