CN106845398B - 人脸关键点定位方法及装置 - Google Patents
人脸关键点定位方法及装置 Download PDFInfo
- Publication number
- CN106845398B CN106845398B CN201710039749.0A CN201710039749A CN106845398B CN 106845398 B CN106845398 B CN 106845398B CN 201710039749 A CN201710039749 A CN 201710039749A CN 106845398 B CN106845398 B CN 106845398B
- Authority
- CN
- China
- Prior art keywords
- face
- iteration
- neural network
- convolutional neural
- key point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本公开提供一种人脸关键点定位方法及装置,所述方法包括:确定待定位图像中的人脸区域;针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置;根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置,最终可以获得各所述人脸关键点的精确位置。本公开实施例中,由于卷积神经网络利用深度学习技术而获得,其运算能力更强,精确度更高,有效的解决了模型的初始化问题和定位精度不足的问题。
Description
技术领域
本公开涉及图像处理技术领域,尤其涉及人脸关键点定位方法及装置。
背景技术
人脸关键点定位,是指图像中已确定人脸区域的基础上,确定出人脸区域中的眉毛、眼睛、鼻子或嘴巴等多个关键部位的位置。在很多技术领域里,人脸关键点定位技术有着其独特的应用价值,因为该技术是众多脸部图片处理的先序步骤,这些应用包括但不限于人脸识别、脸部表情分析、脸部变形动画、人脸动画自动合成等。因此,人脸关键点定位的精确性具有重要意义。
发明内容
为克服相关技术中存在的问题,本公开提供了人脸关键点定位方法及装置。
根据本公开实施例的第一方面,提供一种人脸关键点定位方法,所述方法包括:
确定待定位图像中的人脸区域;
针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置;
根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置。
可选的,对于每个人脸关键点,所述根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置,包括:
获取本次迭代的人脸关键点的起始位置,以所述本次迭代的人脸关键点的起始位置为中心,在所述人脸区域中获取若干个图像块;其中,在第一次迭代时,所述本次迭代的人脸关键点的起始位置为所述初始位置,在第i次迭代时,所述本次迭代的人脸关键点的起始位置为上一次迭代所获得的人脸关键点的位置Pi-1,i是大于1的正整数;
分别对所述若干个图像块进行卷积神经网络运算,获得各图像块中人脸关键点的第一位置;
计算各图像块中人脸关键点的第一位置的均值,将所述均值更新为本次迭代所获得的人脸关键点的位置Pi。
可选的,所述方法还包括:
在每一次迭代时,记录迭代次数;
当本次迭代的迭代次数等于预设迭代次数时,确定迭代结束,将本次迭代所获得的人脸关键点的位置作为人脸关键点的目标位置;
当本次迭代的迭代次数小于预设迭代次数时,将本次迭代所获得的人脸关键点的位置作为下一次迭代的人脸关键点的起始位置。
可选的,所述若干个图像块的大小不相同。
可选的,所述卷积神经网络中包括多个预设的卷积神经网络模型;
所述分别对所述若干个图像块进行卷积神经网络运算,包括:
针对每个图像块,采用不同的卷积神经网络模型分别对每个所述图像块进行卷积神经网络运算。
可选的,在本次迭代中,各人脸关键点对应的各个图像块所采用的卷积神经网络模型,与已完成的各次迭代中所采用的卷积神经网络模型都不相同。
根据本公开实施例的第二方面,提供一种人脸关键点定位装置,所述装置包括:
人脸区域确定模块,被配置为:确定待定位图像中的人脸区域;
初始位置确定模块,被配置为:针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置;
迭代更新模块,被配置为:根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置。
可选的,所述迭代更新模块,包括图像块获取子模块、运算子模块和均值计算子模块;
所述图像块获取子模块,被配置为:对于每个人脸关键点,获取本次迭代的人脸关键点的起始位置,以所述本次迭代的人脸关键点的起始位置为中心,在所述人脸区域中获取若干个图像块;其中,在第一次迭代时,所述本次迭代的人脸关键点的起始位置为所述初始位置,在第i次迭代时,所述本次迭代的人脸关键点的起始位置为上一次迭代所获得的人脸关键点的位置Pi-1,i是大于1的正整数;
所述运算子模块,被配置为:分别对所述若干个图像块进行卷积神经网络运算,获得各图像块中人脸关键点的第一位置;
所述均值计算子模块,被配置为:计算各图像块中人脸关键点的第一位置的均值,将所述均值更新为本次迭代所获得的人脸关键点的位置Pi。
可选的,所述迭代更新模块还包括:
迭代次数记录子模块,被配置为:在每一次迭代时,记录迭代次数;
迭代次数判断子模块,被配置为:当本次迭代的迭代次数等于预设迭代次数时,确定迭代结束,将本次迭代所获得的人脸关键点的位置作为人脸关键点的目标位置;当本次迭代的迭代次数小于预设迭代次数时,将本次迭代所获得的人脸关键点的位置作为下一次迭代的人脸关键点的起始位置。
可选的,所述若干个图像块的大小不相同。
可选的,所述卷积神经网络中包括多个预设的卷积神经网络模型;
所述运算子模块,包括:
模型运算子模块,被配置为:针对每个图像块,采用不同的卷积神经网络模型分别对每个所述图像块进行卷积神经网络运算。
可选的,所述模型运算子模块,还被配置为:在本次迭代中,各人脸关键点对应的各个图像块所采用的卷积神经网络模型,与已完成的各次迭代中所采用的卷积神经网络模型都不相同。
根据本公开实施例的第三方面,提供一种人脸关键点定位装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
确定待定位图像中的人脸区域;
针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置;
根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置,获得各所述人脸关键点的目标位置。
本公开的实施例提供的技术方案可以包括以下有益效果:
本公开中,针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置,根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置,最终可以获得各所述人脸关键点的精确位置。由于卷积神经网络利用深度学习技术而获得,其运算能力更强,精确度更高,有效的解决了模型的初始化问题和定位精度不足的问题。
本公开中,以人脸关键点为中心截取若干个图像块,通过对各个图像块进行迭代运算,因此可以迭代更新人脸关键点的位置,从而逐步逼近人脸关键点的真实位置。
本公开中,通过在每次迭代时记录迭代次数,若达到预设迭代次数,则表示已获得人脸关键点的较为精确的位置,因此可以终止迭代运算,获得人脸关键点的目标位置。
本公开中,通过截取大小不同的图像块,可以参考更多的图像内容,从而获得更为精确的结果。
本公开中,在针对图像块进行位置更新时,可以采用不同的卷积神经网络模型进行运算,通过不同的模型,能减少计算误差,使得所运算的结果更为精确。
本公开中,在每一次迭代更新时,可以采用不同的卷积神经网络模型进行运算,通过不同的模型,以减少计算误差,使得所运算的结果更为精确。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本公开根据一示例性实施例示出的一种人脸关键点定位方法的流程图。
图2是本公开根据一示例性实施例示出的另一种人脸关键点定位方法的流程图。
图3是本公开根据一示例性实施例示出的一种人脸关键点定位装置的框图。
图4是本公开根据一示例性实施例示出的另一种人脸关键点定位装置的框图。
图5是本公开根据一示例性实施例示出的另一种人脸关键点定位装置的框图。
图6是本公开根据一示例性实施例示出的另一种人脸关键点定位装置的框图。
图7本公开根据一示例性实施例示出的一种用于人脸关键点定位装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
在人脸关键点定位过程中,图像中不同的姿态、表情、光照以及遮挡等因素,会对人脸关键点的定位精确度造成一定影响。相关技术中,通常是先计算人脸区域的人脸关键点平均位置进行初始化,之后采用采用线性回归模型进行运算;若初始化效果不好,则会在接下来的求解中陷入局部最小值,影响定位的精度。另外,线性回归模型的运算能力有限,无法获得精确结果。
而本公开实施例所提供的方案,针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置,根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置,最终可以获得各所述人脸关键点的精确位置。由于卷积神经网络利用深度学习技术而获得,其运算能力更强,精确度更高,有效的解决了模型的初始化问题和定位精度不足的问题。接下来对本公开实施例进行详细说明。
如图1所示,图1是本公开根据一示例性实施例示出的一种人脸关键点定位方法的流程图,包括以下步骤101至103:
在步骤101中,确定待定位图像中的人脸区域。
在步骤102中,针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置。
在步骤103中,根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置。
本公开实施例所提供的方案,可应用于个人计算机、计算设备、智能手机、平板电脑或拍摄设备等。
卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,在模式分类等领域,由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。CNN的基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层,这种特有的两次特征提取结构减小了特征分辨率。
CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。由于CNN的特征检测层通过训练数据进行学习,所以在使用CNN时,避免了显示的特征抽取,而是隐式地从训练数据中进行学习;再者,由于同一特征映射面上的神经元权值相同,所以网络可以并行学习,这也是卷积网络相对于神经元彼此相连网络的一大优势。卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性,特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。
本公开实施例中,可以针对人脸关键点定位的处理任务,预先准备已标定人脸关键点的图像作为训练样本,对卷积神经网络进行深度学习训练,在训练完成后,采用所得到的卷积神经网络进行人脸关键点定位。其中,卷积神经网络中可以包括多个不同的卷积神经网络模型,各模型通过不同的处理任务训练得到;例如,针对在待定位图像的人脸区域中确定人脸关键点的初始位置的任务,可以对应训练出若干个卷积神经网络模型。或者是,针对在图像中对人脸关键点进行迭代更新的任务,可以对应训练出若干个卷积神经网络模型。或者是,针对人脸关键点所指示的不同人脸部位,对应训练出不同的卷积神经网络模型等等。
其中,人脸关键点表示在图像中能指示人脸的关键特征点,例如眉毛、眼睛、鼻子、嘴巴或脸部轮廓等人脸重要部位的像素点。在实际应用中,可以根据需要预先设定需定位的人脸关键点,例如设定鼻子或嘴巴等。各人脸关键点在图像中的具***置,即表示人脸关键点在图像中的具体坐标。
在进行定位前,可以对待定位图像进行人脸检测,获得人脸区域,以用于后续进行人脸关键点定位时,在已框定的人脸区域中进行计算。具体的,可以采用局部二值模式(Local binary patterns,LBP)与AdaBoost(Adaptive Boosting)相结合的方式进行人脸检测,从而检测出待定位图像中的人脸区域。
在具体采用卷积神经网络进行人脸关键点定位前,还可以对人脸区域图像进行预处理,具体的预处理过程可以根据实际应用和卷积神经网络的训练过程而确定。例如,可以将图像按照训练样本的规格而进行预处理,假设训练过程中所采用的训练图像大部分为64×64的大小,则可以将待定位图像中的人脸区域处理为同样的尺寸。或者,还可以进行灰度处理,以减少计算量。或者,还可以进行归一化处理,例如将每个像素点的像素值减去均值、或者除去方差等处理。
在一个可选的实现方式中,对于每个人脸关键点,所述根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置,包括:
获取本次迭代的人脸关键点的起始位置,以所述本次迭代的人脸关键点的起始位置为中心,在所述人脸区域中获取若干个图像块;其中,在第一次迭代时,所述本次迭代的人脸关键点的起始位置为所述初始位置,在第i次迭代时,所述本次迭代的人脸关键点的起始位置为上一次迭代所获得的人脸关键点的位置Pi-1,i是大于1的正整数。
分别对所述若干个图像块进行卷积神经网络运算,获得各图像块中人脸关键点的第一位置。
计算各图像块中人脸关键点的第一位置的均值,将所述均值更新为本次迭代所获得的人脸关键点的位置Pi。
本公开实施例中,通过设定人脸关键点的初始位置,经过迭代回归的方法来迭代更新人脸关键点的当前位置,从而逐步逼近人脸关键点的真实位置。
在进行第一次迭代更新时,卷积神经网络的输入为人脸关键点的初始位置。卷积神经网络中包括多个卷积神经网络模型,由于每个人脸关键点指示不同的人脸部位,在具体运算时,每个人脸关键点可以采用对应的模型进行运算,不同人脸关键点所采用模型可以不同。在利用卷积神经网络模型更新人脸关键点的位置时,可以以人脸关键点的初始位置作为中心,在原人脸区域上截取图像块,以该图像块作为模型的输入数据进行运算。为使运算结果更为精确,本公开实施例中,可以在原人脸区域上截取多个图像块,并利用模型分别对图像块进行运算。在运算结束,获得多个图像块中人脸关键点的运算结果(即第一位置)后,可对运算结果求取均值,作为本次迭代的更新位置。
其中,在所述人脸区域中获取若干个图像块时,可以是在所述人脸区域中获取若干个大小不同的图像块。采用截取大小不同的图像块的目的,是为了参考更多不同大小的图像内容,从而获得更为精确的结果。
由于卷积神经网络中包括多个预设的卷积神经网络模型,因此,所述分别对所述若干个图像块进行卷积神经网络运算,可以包括:
针对每个图像块,采用不同的卷积神经网络模型分别对每个所述图像块进行卷积神经网络运算,通过不同的模型,以减少计算误差,使得所运算的结果更为精确。
在进行第二次或更多次迭代时,卷积神经网络的输入为上一次迭代所获得的更新位置,使得所计算的位置可以逐渐逼近真实位置。在一个可选的实现方式中,所述方法还包括:
在每一次迭代时,记录迭代次数。
当本次迭代的迭代次数等于预设迭代次数时,确定迭代结束,将本次迭代所获得的人脸关键点的位置作为人脸关键点的目标位置。
当本次迭代的迭代次数小于预设迭代次数时,将本次迭代所获得的人脸关键点的位置作为下一次迭代的人脸关键点的起始位置。
其中,每一次迭代更新时,所采用的卷积神经网络模型不相同。本实施例中,迭代的收敛条件采用迭代次数,若迭代更新达到预先设定的次数,则可以可以终止迭代运算,获得人脸关键点的目标位置。采用迭代次数来确定是否迭代结束的方式更易实现,计算量较低。实际应用中,预设迭代次数可以是3次、4次等数值,具体的数值可以在卷积神经网络模型的训练阶段确定。
接下来结合图2,对本公开实施例再次进行说明如图2所示,图2是本公开根据一示例性实施例示出的另一种人脸关键点定位方法的流程图,包括如下处理过程;
输入图像。
人脸检测:对于输入的待定位图像,首先进行人脸检测,检测出人脸区域。本实施例人脸检测采用LBP特征+Adaboost的方法。
预处理:将人脸区域图像转为灰度图,并缩放到64×64大小,然后进行归一化(减均值,除方差)。
人脸关键点初始化:使用一CNN网络模型对归一化后的人脸区域图像进行回归运算,得到人脸关键点的初始位置P0。假设人脸关键点的个数为n,则CNN网络的输入为64×64的人脸区域图像,输出为长度2n的向量,也就是人脸关键点的坐标P0=(x1,y1,x2,y2,...xn,yn)。其中,(xi,yi)表示第i个人脸关键点在人脸区域图像中的坐标。其中,P0作为初始位置。
优化更新人脸关键点位置:假设当前的人脸关键点位置为Pt-1,以Pt-1中每一个人脸关键点为中心截取若干个小的图像块(本实施例截取3个),图像块的大小分别为15×15、19×19、23×23;然后对每一个小图像块,采用一CNN网络模型进行运算,得到该小图像块所对应的人脸关键点坐标的更新位置,然后将每一个关键点所对应的3个小图像块的结果进行平均,得到该关键点坐标的最终更新位置,从而得到所有人脸关键点的最终更新位置Pt。
在此步骤中,针对每一个人脸关键点所截取的每一个小图像块分别采用不同的CNN网络模型进行计算,也就是针对每一个人脸关键点需要训练3个CNN网络模型(n个人脸关键点的话一共有3n个CNN网络模型),这3个CNN网络的输入分别为15x15、19x19、23x23的图像,输出都为长度为2的向量,表示对应的人脸关键点坐标的更新位置。
重复(4)直到收敛,经过t次迭代后,最终的Pt即为最终的人脸关键点位置。本实施例中,t=3即可达到很好的结果。
其中,每一次迭代都需要3n个CNN模型,也即是,每一次迭代所采用的模型也都不相同。
与前述人脸关键点定位方法的实施例相对应,本公开还提供了人脸关键点定位装置及其所应用的设备的实施例。
如图3所示,图3是本公开根据一示例性实施例示出的一种人脸关键点定位装置的框图,所述装置包括:人脸区域确定模块31、初始位置确定模块32和迭代更新模块33。
其中,人脸区域确定模块31,被配置为:确定待定位图像中的人脸区域。
初始位置确定模块32,被配置为:针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置。
迭代更新模块33,被配置为:根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置。
由上述实施例可见,针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置,根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置,最终可以获得各所述人脸关键点的精确位置。由于卷积神经网络利用深度学习技术而获得,其运算能力更强,精确度更高,有效的解决了模型的初始化问题和定位精度不足的问题。
如图4所示,图4是本公开根据一示例性实施例示出的另一种人脸关键点定位装置的框图,该实施例在前述图3所示实施例的基础上,所述迭代更新模块33,包括图像块获取子模块331、运算子模块332和均值计算子模块333。
所述图像块获取子模块331,被配置为:对于每个人脸关键点,获取本次迭代的人脸关键点的起始位置,以所述本次迭代的人脸关键点的起始位置为中心,在所述人脸区域中获取若干个图像块;其中,在第一次迭代时,所述本次迭代的人脸关键点的起始位置为所述初始位置,在第i次迭代时,所述本次迭代的人脸关键点的起始位置为上一次迭代所获得的人脸关键点的位置Pi-1,i是大于1的正整数。
所述运算子模块332,被配置为:分别对所述若干个图像块进行卷积神经网络运算,获得各图像块中人脸关键点的第一位置。
所述均值计算子模块333,被配置为:计算各图像块中人脸关键点的第一位置的均值,将所述均值更新为本次迭代所获得的人脸关键点的位置Pi。
由上述实施例可见,以人脸关键点为中心截取若干个图像块,通过对各个图像块进行迭代运算,因此可以迭代更新人脸关键点的位置,从而逐步逼近人脸关键点的真实位置。
如图5所示,图5是本公开根据一示例性实施例示出的另一种人脸关键点定位装置的框图,该实施例在前述图4所示实施例的基础上,所述迭代更新模块33还包括:迭代次数记录子模块334和迭代次数判断子模块335。
迭代次数记录子模块334,被配置为:在每一次迭代时,记录迭代次数。
迭代次数判断子模块335,被配置为:当本次迭代的迭代次数等于预设迭代次数时,确定迭代结束,将本次迭代所获得的人脸关键点的位置作为人脸关键点的目标位置;当本次迭代的迭代次数小于预设迭代次数时,将本次迭代所获得的人脸关键点的位置作为下一次迭代的人脸关键点的起始位置。
由上述实施例可见,通过在每次迭代时记录迭代次数,若达到预设迭代次数,则表示已获得人脸关键点的较为精确的位置,因此可以终止迭代运算,获得人脸关键点的目标位置。
在一个可选的实现方式中,所述若干个图像块的大小不相同。
由上述实施例可见,通过截取大小不同的图像块,可以参考更多的图像内容,从而获得更为精确的结果。
如图6所示,图6是本公开根据一示例性实施例示出的另一种人脸关键点定位装置的框图,该实施例在前述图4所示实施例的基础上,所述卷积神经网络中包括多个预设的卷积神经网络模型。
所述运算子模块332,包括:
模型运算子模块3321,被配置为:针对每个图像块,采用不同的卷积神经网络模型分别对每个所述图像块进行卷积神经网络运算。
由上述实施例可见,在针对图像块进行位置更新时,可以采用不同的卷积神经网络模型进行运算,通过不同的模型,能减少计算误差,使得所运算的结果更为精确。
在一个可选的实现方式中,所述模型运算子模块3321,还被配置为:在本次迭代中,各人脸关键点对应的各个图像块所采用的卷积神经网络模型,与已完成的各次迭代中所采用的卷积神经网络模型都不相同。
由上述实施例可见,在每一次迭代更新时,可以采用不同的卷积神经网络模型进行运算,通过不同的模型,以减少计算误差,使得所运算的结果更为精确。
相应的,本公开还提供一种装置,所述装置包括有处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:
确定待定位图像中的人脸区域。
针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置。
根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
图7是根据一示例性实施例示出的一种人脸关键点定位装置的结构示意图。
如图7所示,根据一示例性实施例示出的一种人脸关键点定位装置700,该装置700可以是计算机,移动电话,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等设备。
参照图7,装置700可以包括以下一个或多个组件:处理组件701,存储器702,电源组件703,多媒体组件704,音频组件705,输入/输出(I/O)的接口706,传感器组件707,以及通信组件708。
处理组件701通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件701可以包括一个或多个处理器709来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件701可以包括一个或多个模块,便于处理组件701和其它组件之间的交互。例如,处理部件701可以包括多媒体模块,以方便多媒体组件704和处理组件701之间的交互。
存储器702被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件703为装置700的各种组件提供电力。电源组件703可以包括电源管理***,一个或多个电源,及其它与为装置700生成、管理和分配电力相关联的组件。
多媒体组件704包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件704包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。
音频组件705被配置为输出和/或输入音频信号。例如,音频组件705包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器702或经由通信组件708发送。在一些实施例中,音频组件705还包括一个扬声器,用于输出音频信号。
I/O接口702为处理组件701和***接口模块之间提供接口,上述***接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件707包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件707可以检测到装置700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件707还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件707可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件707还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件707还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件708被配置为便于装置700和其它设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件708经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件708还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其它技术来实现。
在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其它电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器702,上述指令可由装置700的处理器709执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
其中,当所述存储介质中的指令由所述处理器执行时,使得装置700能够执行一种人脸关键点定位方法,包括:
确定待定位图像中的人脸区域。
针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置。
根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
以上所述仅为本公开的较佳实施例而已,并不用以限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开保护的范围之内。
Claims (11)
1.一种人脸关键点定位方法,其特征在于,所述方法包括:
确定待定位图像中的人脸区域;
针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置;
根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置;
对于每个人脸关键点,所述根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置,包括:
获取本次迭代的人脸关键点的起始位置,以所述本次迭代的人脸关键点的起始位置为中心,在所述人脸区域中获取若干个图像块;其中,在第一次迭代时,所述本次迭代的人脸关键点的起始位置为所述初始位置,在第i次迭代时,所述本次迭代的人脸关键点的起始位置为上一次迭代所获得的人脸关键点的位置Pi-1,i是大于1的正整数;
分别对所述若干个图像块进行卷积神经网络运算,获得各图像块中人脸关键点的第一位置;
计算各图像块中人脸关键点的第一位置的均值,将所述均值更新为本次迭代所获得的人脸关键点的位置Pi。
2.根据权利要求1所述的方法,其特征在于,还包括:
在每一次迭代时,记录迭代次数;
当本次迭代的迭代次数等于预设迭代次数时,确定迭代结束,将本次迭代所获得的人脸关键点的位置作为人脸关键点的目标位置;
当本次迭代的迭代次数小于预设迭代次数时,将本次迭代所获得的人脸关键点的位置作为下一次迭代的人脸关键点的起始位置。
3.根据权利要求1所述的方法,其特征在于,所述若干个图像块的大小不相同。
4.根据权利要求1所述的方法,其特征在于,所述卷积神经网络中包括多个预设的卷积神经网络模型;
所述分别对所述若干个图像块进行卷积神经网络运算,包括:
针对每个图像块,分别采用不同的所述卷积神经网络模型进行卷积神经网络运算。
5.根据权利要求4所述的方法,其特征在于,在本次迭代中,各人脸关键点对应的各个图像块所采用的所述卷积神经网络模型,与已完成的各次迭代中所采用的所述卷积神经网络模型均不相同。
6.一种人脸关键点定位装置,其特征在于,所述装置包括:
人脸区域确定模块,被配置为:确定待定位图像中的人脸区域;
初始位置确定模块,被配置为:针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置;
迭代更新模块,被配置为:根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置;
所述迭代更新模块,包括图像块获取子模块、运算子模块和均值计算子模块;
所述图像块获取子模块,被配置为:对于每个人脸关键点,获取本次迭代的人脸关键点的起始位置,以所述本次迭代的人脸关键点的起始位置为中心,在所述人脸区域中获取若干个图像块;其中,在第一次迭代时,所述本次迭代的人脸关键点的起始位置为所述初始位置,在第i次迭代时,所述本次迭代的人脸关键点的起始位置为上一次迭代所获得的人脸关键点的位置Pi-1,i是大于1的正整数;
所述运算子模块,被配置为:分别对所述若干个图像块进行卷积神经网络运算,获得各图像块中人脸关键点的第一位置;
所述均值计算子模块,被配置为:计算各图像块中人脸关键点的第一位置的均值,将所述均值更新为本次迭代所获得的人脸关键点的位置Pi。
7.根据权利要求6所述的装置,其特征在于,所述迭代更新模块还包括:
迭代次数记录子模块,被配置为:在每一次迭代时,记录迭代次数;
迭代次数判断子模块,被配置为:当本次迭代的迭代次数等于预设迭代次数时,确定迭代结束,将本次迭代所获得的人脸关键点的位置作为人脸关键点的目标位置;当本次迭代的迭代次数小于预设迭代次数时,将本次迭代所获得的人脸关键点的位置作为下一次迭代的人脸关键点的起始位置。
8.根据权利要求6所述的装置,其特征在于,所述若干个图像块的大小不相同。
9.根据权利要求6所述的装置,其特征在于,所述卷积神经网络中包括多个预设的卷积神经网络模型;
所述运算子模块,包括:
模型运算子模块,被配置为:针对每个图像块,采用不同的所述卷积神经网络模型分别对每个所述图像块进行卷积神经网络运算。
10.根据权利要求9所述的装置,其特征在于,所述模型运算子模块,还被配置为:在本次迭代中,各人脸关键点对应的各个图像块所采用的所述卷积神经网络模型,与已完成的各次迭代中所采用的所述卷积神经网络模型均不相同。
11.一种人脸关键点定位装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
确定待定位图像中的人脸区域;
针对所述人脸区域,采用预设的卷积神经网络确定若干个人脸关键点的初始位置;
根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置;
在根据各人脸关键点的初始位置,利用所述卷积神经网络迭代更新各人脸关键点的位置时,所述处理器被配置为:
获取本次迭代的人脸关键点的起始位置,以所述本次迭代的人脸关键点的起始位置为中心,在所述人脸区域中获取若干个图像块;其中,在第一次迭代时,所述本次迭代的人脸关键点的起始位置为所述初始位置,在第i次迭代时,所述本次迭代的人脸关键点的起始位置为上一次迭代所获得的人脸关键点的位置Pi-1,i是大于1的正整数;
分别对所述若干个图像块进行卷积神经网络运算,获得各图像块中人脸关键点的第一位置;
计算各图像块中人脸关键点的第一位置的均值,将所述均值更新为本次迭代所获得的人脸关键点的位置Pi。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710039749.0A CN106845398B (zh) | 2017-01-19 | 2017-01-19 | 人脸关键点定位方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710039749.0A CN106845398B (zh) | 2017-01-19 | 2017-01-19 | 人脸关键点定位方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106845398A CN106845398A (zh) | 2017-06-13 |
CN106845398B true CN106845398B (zh) | 2020-03-03 |
Family
ID=59123894
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710039749.0A Active CN106845398B (zh) | 2017-01-19 | 2017-01-19 | 人脸关键点定位方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106845398B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107480640A (zh) * | 2017-08-16 | 2017-12-15 | 上海荷福人工智能科技(集团)有限公司 | 一种基于二值卷积神经网络的人脸对齐方法 |
CN107590482A (zh) * | 2017-09-29 | 2018-01-16 | 百度在线网络技术(北京)有限公司 | 信息生成方法和装置 |
CN108121952B (zh) * | 2017-12-12 | 2022-03-08 | 北京小米移动软件有限公司 | 人脸关键点定位方法、装置、设备及存储介质 |
CN108549863B (zh) * | 2018-04-11 | 2019-11-26 | 腾讯科技(深圳)有限公司 | 人体姿态预测方法、装置、设备及存储介质 |
CN109146845A (zh) * | 2018-07-16 | 2019-01-04 | 中南大学 | 基于卷积神经网络的头颅影像标志点检测方法 |
CN109308721B (zh) * | 2018-10-31 | 2020-10-30 | 东软集团股份有限公司 | 图像关键点的定位方法、装置、存储介质及电子设备 |
CN109740426B (zh) * | 2018-11-23 | 2020-11-06 | 成都品果科技有限公司 | 一种基于采样卷积的人脸关键点检测方法 |
CN109753910B (zh) * | 2018-12-27 | 2020-02-21 | 北京字节跳动网络技术有限公司 | 关键点提取方法、模型的训练方法、装置、介质及设备 |
CN110046602A (zh) * | 2019-04-24 | 2019-07-23 | 李守斌 | 基于分类的深度学习人脸检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105404861A (zh) * | 2015-11-13 | 2016-03-16 | 中国科学院重庆绿色智能技术研究院 | 人脸关键特征点检测模型的训练、检测方法及*** |
CN105469056A (zh) * | 2015-11-26 | 2016-04-06 | 小米科技有限责任公司 | 人脸图像处理方法及装置 |
CN105701770A (zh) * | 2016-01-18 | 2016-06-22 | 武汉大学 | 一种基于上下文线性模型的人脸超分辨率处理方法及*** |
CN105868769A (zh) * | 2015-01-23 | 2016-08-17 | 阿里巴巴集团控股有限公司 | 图像中的人脸关键点定位方法及装置 |
CN106778531A (zh) * | 2016-11-25 | 2017-05-31 | 北京小米移动软件有限公司 | 人脸定位方法及装置 |
-
2017
- 2017-01-19 CN CN201710039749.0A patent/CN106845398B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105868769A (zh) * | 2015-01-23 | 2016-08-17 | 阿里巴巴集团控股有限公司 | 图像中的人脸关键点定位方法及装置 |
CN105404861A (zh) * | 2015-11-13 | 2016-03-16 | 中国科学院重庆绿色智能技术研究院 | 人脸关键特征点检测模型的训练、检测方法及*** |
CN105469056A (zh) * | 2015-11-26 | 2016-04-06 | 小米科技有限责任公司 | 人脸图像处理方法及装置 |
CN105701770A (zh) * | 2016-01-18 | 2016-06-22 | 武汉大学 | 一种基于上下文线性模型的人脸超分辨率处理方法及*** |
CN106778531A (zh) * | 2016-11-25 | 2017-05-31 | 北京小米移动软件有限公司 | 人脸定位方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN106845398A (zh) | 2017-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106845398B (zh) | 人脸关键点定位方法及装置 | |
CN109858524B (zh) | 手势识别方法、装置、电子设备及存储介质 | |
CN109871896B (zh) | 数据分类方法、装置、电子设备及存储介质 | |
CN105205479A (zh) | 人脸颜值评估方法、装置及终端设备 | |
CN107958223B (zh) | 人脸识别方法及装置、移动设备、计算机可读存储介质 | |
CN106557759B (zh) | 一种标志牌信息获取方法及装置 | |
CN107463903B (zh) | 人脸关键点定位方法及装置 | |
CN106446946B (zh) | 图像识别方法及装置 | |
CN112115894B (zh) | 手部关键点检测模型的训练方法、装置及电子设备 | |
CN104123741A (zh) | 生成人脸素描的方法和装置 | |
CN111144266A (zh) | 人脸表情的识别方法及装置 | |
CN110619325A (zh) | 一种文本识别方法及装置 | |
CN110837766B (zh) | 手势识别方法、手势处理方法及装置 | |
CN111589138A (zh) | 动作预测方法、装置、设备及存储介质 | |
CN107992894B (zh) | 图像识别方法、装置及计算机可读存储介质 | |
CN107729886B (zh) | 人脸图像的处理方法及装置 | |
CN107239758B (zh) | 人脸关键点定位的方法及装置 | |
CN105678220B (zh) | 人脸关键点定位处理方法和装置 | |
CN112036307A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN113642551A (zh) | 指甲关键点检测方法、装置、电子设备及存储介质 | |
CN111488964B (zh) | 图像处理方法及装置、神经网络训练方法及装置 | |
CN111046780A (zh) | 神经网络训练及图像识别方法、装置、设备和存储介质 | |
CN116310633A (zh) | 一种关键点检测模型训练方法及关键点检测方法 | |
CN110659726B (zh) | 一种图像处理方法、装置、电子设备及存储介质 | |
CN110751223B (zh) | 一种图像匹配方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |