CN108197568A - 一种提升在数字影像中的人脸识别的处理方法 - Google Patents

一种提升在数字影像中的人脸识别的处理方法 Download PDF

Info

Publication number
CN108197568A
CN108197568A CN201711494696.8A CN201711494696A CN108197568A CN 108197568 A CN108197568 A CN 108197568A CN 201711494696 A CN201711494696 A CN 201711494696A CN 108197568 A CN108197568 A CN 108197568A
Authority
CN
China
Prior art keywords
face
frame
location information
face location
digitized video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201711494696.8A
Other languages
English (en)
Inventor
容李庆
袁亚荣
罗杰
林锴
汤俊杰
陈纯敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Two Yuan Technology Co Ltd
Original Assignee
Guangzhou Two Yuan Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Two Yuan Technology Co Ltd filed Critical Guangzhou Two Yuan Technology Co Ltd
Priority to CN201711494696.8A priority Critical patent/CN108197568A/zh
Publication of CN108197568A publication Critical patent/CN108197568A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种提升在数字影像中的人脸识别的处理方法,利用数字影像中的连续帧数字图像信息中人脸位置进行计算和比较,从而提升在数字影像中人脸检测的稳定性,满足后期各种基于数字影像的人脸识别或者追踪等需求。本发明使用较为简单的方法对数字影像中的人脸检测框进行计算,进而提升人脸检测结果的稳定性。利用上一帧的人脸检测结果作为下一帧检测的参考,计算IOU相交值以及哈尔特征差值确定相似性。在多种环境下具有较好的检测结果和稳定性。

Description

一种提升在数字影像中的人脸识别的处理方法
技术领域
本发明涉及一种提升在数字影像中的人脸识别的处理方法。
背景技术
人脸检测技术在近20年内得到了很大的发展和提升,越来越多的应用或者功能需要在其集成人脸检测功能。如关于人脸美颜和美妆的应用,需要在实时的数字影像中加入人脸检测功能从而达到对人脸以及人脸的各个部位进行处理的效果。
在数字影像中加入人脸检测通常的做法以帧为单位对每一帧图像信息进行人脸检测,从而得到在数字影像中的人脸进行定位检测。这样就将1秒连续的视频分解为10~50帧进行处理,每一帧得到人脸检测的位置坐标等信息,从而得到整个视频的人脸检测结果。这种分为每一帧的人脸检测在稳定性方面往往得不到很好的效果,如同样一张人脸位置上一帧与下一帧的人脸检测结果可能存在不同,这样就导致了在人脸检测中无法得到一种更加稳定的检测结果。
由于在数字影像中帧信息具有连续性并且上一帧的人脸检测结果对下一帧具有很大的参考意义,“隐马尔代夫”模型定义了利用这一种特性提升在数字影像中的人脸检测的稳定性和性能,由于该模型训练和样本预处理都较为复杂,并且在多种复杂的环境下也难以得到较为理想的结果。
在类似于实时的人脸化妆的功能处理中,人脸检测定位反馈信息的稳定性直接导致了处理效果的好与坏,所以在以实时为处理基准的人脸相关处理中,获得更加准确和稳定的人脸检测定位结果至为重要。
发明内容
本发明旨在提供一种提升在数字影像中的人脸识别的处理方法,利用数字影像中的连续帧数字图像信息中人脸位置进行计算和比较,从而提升在数字影像中人脸检测的稳定性,满足后期各种基于数字影像的人脸识别或者追踪等需求。
为解决上述技术问题,本发明所采用的技术方案是:
一种提升在数字影像中的人脸识别的处理方法,包括以下步骤:
1)将原始数字影像,分解为单帧输入;
2)对每一帧输入的数字图像进行相关的处理,然后输入到神经网络的人脸检测模型中;
3)人脸检测模型对该帧数字图像进行图像金字塔缩放,然后使用扫窗检测出人脸的位置坐标;保存该帧数字图像的人脸位置信息;
4)继续输入下一帧数字图像,经过同样的处理后输入神经网络人脸检测模型中获取该帧数字图像的人脸位置信息;
5)将该帧的人脸位置信息,计算与上一帧数字图像中的人脸位置信息的矩形框的IOU值,当IOU值大于最小阈值则认为当前帧检测出的人脸位置与上一帧的人脸位置信息符合基本重合特性;
6)将满足步骤5中的两个人脸位置矩形分别计算其哈尔特征的值;
7)定义一个阀值T1,当两个人脸位置矩形哈尔特征的差值小于阈值则以上一帧检测出的人脸位置信息为准,直接输出人脸位置信息;设定另外一个阈值T2,当差值小于T2大于T1时,计算两个矩形的中间矩形,作为输出人脸位置信息;
8)循环直至全部视频帧处理结束。
本发明的优点:
1.使用较为简单的方法对数字影像中的人脸检测框进行计算,进而提升人脸检测结果的稳定性。
2.利用上一帧的人脸检测结果作为下一帧检测的参考,计算IOU相交值以及哈尔特征差值确定相似性。
3.在多种环境下具有较好的检测结果和稳定性。
附图说明
构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例流程示意图;
图2为本发明实施例根据人脸位置信息计算矩形框的IOU值示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
结合图1所示,本发明的人脸检测方法主要利用级联神经网路进行对人脸检测定位模型进行训练,得到人脸检测的神经网络模型。
使用神经网络人脸检测模型提升在数字影像中的人脸识别的处理方法,详细方法如下。
1.原始输入数字影像,分解为单帧输入。
2.对每一帧输入的数字图像进行相关的处理,如尺寸的缩放处理,然后输入到神经网络的人脸检测模型中。
3.人脸检测模型对该帧数字图像进行图像金字塔缩放,然后使用扫窗检测出人脸的位置坐标。保存该帧数字图像的人脸位置信息。
4.继续输入下一帧数字图像,经过同样的处理后输入神经网络人脸检测模型中获取该帧数字图像的人脸位置信息。
5.如图2所示,将该帧的人脸位置信息,主要为矩形的位置信息,计算与上一帧数字图像中的人脸位置信息的矩形框的IOU值:设定一个最小阈值,当IOU值大于最小阈值则认为当前帧检测出的人脸位置与上一帧的人脸位置信息符合基本重合特性。
6.将满足步骤5中的两个人脸位置矩形分别计算其哈尔特征的值,为了加快计算的速度,计算哈尔特征前先分别计算两个矩形框的积分图像,根据积分图像计算其哈尔特征的值。
7.计算两个矩形框内图像哈尔特征的差值,定义一个阈值T1,当差值小于阈值则以上一帧检测出的人脸位置信息为准,直接输出人脸位置信息。设定另外一个阈值T2,当差值小于T2大于T1时,计算两个矩形的中间矩形,作为输出人脸位置信息。
8.循环直至全部视频帧处理结束。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种提升在数字影像中的人脸识别的处理方法,其特征在于包括以下步骤:
1)将原始数字影像,分解为单帧输入;
2)对每一帧输入的数字图像进行相关的处理,然后输入到神经网络的人脸检测模型中;
3)人脸检测模型对该帧数字图像进行图像金字塔缩放,然后使用扫窗检测出人脸的位置坐标;保存该帧数字图像的人脸位置信息;
4)继续输入下一帧数字图像,经过同样的处理后输入神经网络人脸检测模型中获取该帧数字图像的人脸位置信息;
5)将该帧的人脸位置信息,计算与上一帧数字图像中的人脸位置信息的矩形框的IOU值,当IOU值大于最小阈值则认为当前帧检测出的人脸位置与上一帧的人脸位置信息符合基本重合特性;
6)将满足步骤5中的两个人脸位置矩形分别计算其哈尔特征的值;
7)定义一个阀值T1,当两个人脸位置矩形哈尔特征的差值小于阈值则以上一帧检测出的人脸位置信息为准,直接输出人脸位置信息;设定另外一个阈值T2,当差值小于T2大于T1时,计算两个矩形的中间矩形,作为输出人脸位置信息;
8)循环直至全部视频帧处理结束。
2.根据权利要求1所述的一种提升在数字影像中的人脸识别的处理方法,其特征在于:
所述步骤6)中,计算哈尔特征前先分别计算两个矩形框的积分图像,根据积分图像计算其哈尔特征的值。
CN201711494696.8A 2017-12-31 2017-12-31 一种提升在数字影像中的人脸识别的处理方法 Withdrawn CN108197568A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711494696.8A CN108197568A (zh) 2017-12-31 2017-12-31 一种提升在数字影像中的人脸识别的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711494696.8A CN108197568A (zh) 2017-12-31 2017-12-31 一种提升在数字影像中的人脸识别的处理方法

Publications (1)

Publication Number Publication Date
CN108197568A true CN108197568A (zh) 2018-06-22

Family

ID=62587519

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711494696.8A Withdrawn CN108197568A (zh) 2017-12-31 2017-12-31 一种提升在数字影像中的人脸识别的处理方法

Country Status (1)

Country Link
CN (1) CN108197568A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110677585A (zh) * 2019-09-30 2020-01-10 Oppo广东移动通信有限公司 目标检测框的输出方法、装置、终端及存储介质
WO2020056903A1 (zh) * 2018-09-21 2020-03-26 北京字节跳动网络技术有限公司 用于生成信息的方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020056903A1 (zh) * 2018-09-21 2020-03-26 北京字节跳动网络技术有限公司 用于生成信息的方法和装置
CN110677585A (zh) * 2019-09-30 2020-01-10 Oppo广东移动通信有限公司 目标检测框的输出方法、装置、终端及存储介质

Similar Documents

Publication Publication Date Title
CN108229268A (zh) 表情识别及卷积神经网络模型训练方法、装置和电子设备
CN109101865A (zh) 一种基于深度学习的行人重识别方法
CN106127108B (zh) 一种基于卷积神经网络的人手图像区域检测方法
CN107895160A (zh) 人脸检测与识别装置及方法
CN105160318A (zh) 基于面部表情的测谎方法及***
CN110232379A (zh) 一种车辆姿态检测方法及***
Zhao-Yi et al. Real-time facial expression recognition based on adaptive canny operator edge detection
CN111652017A (zh) 一种动态手势识别方法及***
CN103400142B (zh) 一种行人计数方法
CN110458235B (zh) 一种视频中运动姿势相似度比对方法
Kalsh et al. Sign language recognition system
CN105574515A (zh) 一种无重叠视域下的行人再识别方法
CN112541434B (zh) 一种基于中心点跟踪模型的人脸识别方法
CN106529377A (zh) 一种基于图像的年龄估计方法、装置及***
CN107895140A (zh) 基于人脸肤色的***识别办法
CN106447695A (zh) 一种多物体追踪中判断同一物体的方法和装置
CN108197568A (zh) 一种提升在数字影像中的人脸识别的处理方法
CN110879985B (zh) 一种抗噪声数据的人脸识别模型训练方法
CN114549557A (zh) 一种人像分割网络训练方法、装置、设备及介质
CN112329602A (zh) 人脸标注图像的获取方法及装置、电子设备、存储介质
CN107330363B (zh) 一种快速的互联网广告牌检测方法
CN104866826A (zh) 一种基于knn和像素比梯度特征的静态手语识别方法
CN114419493A (zh) 图像的标注方法、装置、电子设备和存储介质
CN110222647A (zh) 一种基于卷积神经网络的人脸活体检测方法
Tian et al. RGB oralscan video-based orthodontic treatment monitoring

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20180622

WW01 Invention patent application withdrawn after publication