CN107451950A

CN107451950A - 人脸图像生成方法、人脸识别模型训练方法及相应装置

Info

Publication number: CN107451950A
Application number: CN201610370020.7A
Authority: CN
Inventors: 鲁逸沁; 周而进; 印奇
Original assignee: Beijing Megvii Technology Co Ltd; Beijing Maigewei Technology Co Ltd
Current assignee: Beijing Megvii Technology Co Ltd; Beijing Maigewei Technology Co Ltd
Priority date: 2016-05-30
Filing date: 2016-05-30
Publication date: 2017-12-08

Abstract

本发明的实施例提供了人脸图像生成方法、人脸识别模型训练方法及相应装置。该人脸图像生成方法包括：获取经标注人脸关键点的人脸图像；获取经标注头发关键点的头发图像，其中所述头发关键点与所述人脸关键点对应；以及基于所述人脸关键点和所述头发关键点将所述头发图像的头发部分叠加到所述人脸图像上，以获得人脸合成图像。利用上述人脸图像生成方法和装置，能够获得大量的、逼真的、具有各种发型的人脸的合成图像。为后续人脸图像处理提供了很多有效分析素材。在有效利用这些素材的情况下，可以显著提高人脸图像处理的速度和精度。

Description

人脸图像生成方法、人脸识别模型训练方法及相应装置

技术领域

本发明涉及图像处理领域，更具体地涉及一种人脸图像生成方法和装置，以及人脸识别模型训练方法和装置。

背景技术

随着图像处理技术日新月异的发展，人脸图像处理的应用场景也越来越多。例如人脸检测和人脸识别等技术已经广泛应用于安防、金融等领域。

人脸遮挡对人脸图像处理***的影响巨大，例如目前主流的统计或者机器学习的人脸识别模型。人的头发(特别是刘海)是一种常见的人脸遮挡。下面以人脸识别模型为例说明人的头发对人脸图像处理***的主要影响。1)很难收集大量带刘海的人脸图像用于人脸识别模型训练；2)人的发型款式多变，形态变化大，刘海的样式也千奇百怪，所以头发很难用一个简单的模型刻画；3)头发可改变图像的统计特征、图像特征，从而给人脸识别模型带来识别干扰。

因此，需要一种人脸图像生成方法和装置，以提供各种发型的人脸图像。进而，基于这大量的、具有各种发型的人脸的图像可以获得更理想的人脸图像处理***，例如人脸识别模型。

发明内容

考虑到上述问题而提出了本发明。本发明提供了一种人脸图像生成方法和装置，基于图像中的关键点可以将人脸图像和头发图像合成，从而可以获得大量的、具有各种发型的人脸的合成图像。

根据本发明一方面，提供了一种人脸图像生成方法，包括：

获取经标注人脸关键点的人脸图像；

获取经标注头发关键点的头发图像，其中所述头发关键点与所述人脸关键点对应；以及

基于所述人脸关键点和所述头发关键点，将所述头发图像的头发部分叠加到所述人脸图像上，以获得人脸合成图像。

示例性地，所述所述头发图像的头发部分叠加到所述人脸图像上进一步包括：

根据所述人脸关键点和所述头发关键点，获取用于所述头发图像的变换矩阵；

利用所述变换矩阵对所述头发图像进行变换，以获得投影到所述人脸图像所在视平面的、经变换的头发图像；

对所述经变换的头发图像进行图像分割，以获得所述经变换的头发图像的头发轮廓模板；以及

利用所述头发轮廓模板，将所述经变换的头发图像的头发部分叠加到所述人脸图像上，以获得所述人脸合成图像。

示例性地，所述将所述头发图像的头发部分叠加到所述人脸图像上进一步包括：

对所述头发图像进行图像分割，以获得头发轮廓模板；

根据所述人脸关键点和所述头发关键点，获取用于所述头发图像和所述头发轮廓模板的变换矩阵；

利用所述变换矩阵对所述头发图像和所述头发轮廓模板进行变换，以获得投影到所述人脸图像所在视平面的、经变换的头发图像和投影到所述人脸图像所在视平面的、经变换的头发轮廓模板；以及

利用所述投影到所述人脸图像所在视平面的、经变换的头发轮廓模板，将所述经变换的头发图像的头发部分叠加到所述人脸图像上，以获得所述人脸合成图像。

示例性地，在所述获取变换矩阵之后，所述将所述头发图像的头发部分叠加到所述人脸图像上进一步包括：将所述变换矩阵中的至少部分元素增加噪声，以用于所述变换。

示例性地，所述噪声服从高斯分布。

示例性地，所述变换是透视变换。

示例性地，所述将所述经变换的头发图像的头发部分叠加到所述人脸图像上进一步包括：利用泊松融合方法将所述经变换的头发图像的头发部分叠加到所述人脸图像上。

示例性地，所述人脸关键点包括：正脸最高点、左眼角延长线与脸轮廓的交点、右眼角延长线与脸轮廓的交点和下巴。

根据本发明另一方面，还提供了一种人脸识别模型训练方法，包括：

利用上述人脸图像生成方法生成人脸合成图像；以及

利用图像库进行人脸识别模型的训练，其中所述图像库包括所述人脸合成图像。

根据本发明再一方面，还提供了一种人脸图像生成装置，包括：

第一获取模块，用于获取经标注人脸关键点的人脸图像；

第二获取模块，用于获取经标注头发关键点的头发图像，其中所述头发关键点与所述人脸关键点对应；以及

合成模块，用于基于所述人脸关键点和所述头发关键点将所述头发图像的头发部分叠加到所述人脸图像上，以获得人脸合成图像。

示例性地，所述合成模块进一步包括：

矩阵生成单元，用于根据所述人脸关键点和所述头发关键点，获取用于所述头发图像的变换矩阵；

第一变换单元，用于利用所述变换矩阵对所述头发图像进行变换，以获得投影到所述人脸图像所在视平面的、经变换的头发图像；

第一分割单元，用于对所述经变换的头发图像进行图像分割，以获得所述经变换的头发图像的头发轮廓模板；以及

合成单元，用于利用所述头发轮廓模板，将所述经变换的头发图像的头发部分叠加到所述人脸图像上，以获得所述人脸合成图像。

示例性地，所述合成模块进一步包括：

第二分割单元，用于对所述头发图像进行图像分割，以获得头发轮廓模板；

矩阵生成单元，用于根据所述人脸关键点和所述头发关键点，获取用于所述头发图像和所述头发轮廓模板的变换矩阵；

第二变换单元，用于利用所述变换矩阵对所述头发图像和所述头发轮廓模板进行变换，以获得投影到所述人脸图像所在视平面的、经变换的头发图像和投影到所述人脸图像所在视平面的、经变换的头发轮廓模板；以及

合成单元，用于利用所述投影到所述人脸图像所在视平面的、经变换的头发轮廓模板，将所述经变换的头发图像的头发部分叠加到所述人脸图像上，以获得所述人脸合成图像。

示例性地，所述合成模块进一步包括加噪单元，用于将所述变换矩阵中的至少部分元素增加噪声，以用于所述变换。

示例性地，所述噪声服从高斯分布。

示例性地，所述变换是透视变换。

示例性地，所述合成单元进一步包括：泊松融合子单元，用于利用泊松融合方法将所述经变换的头发图像的头发部分叠加到所述人脸图像上。

根据本发明又一方面，还提供了一种人脸识别模型训练装置，包括：

上述人脸图像生成装置；以及

训练模块，用于利用图像库进行人脸识别模型的训练，其中所述图像库包括所述人脸图像生成装置所生成的人脸合成图像。

根据本发明实施例的人脸图像生成方法和装置，基于人脸关键点以及与人脸关键点对应的头发关键点可以将头发图像的头发部分叠加到人脸图像上，从而获得大量的、逼真的、具有各种发型的人脸的合成图像。为后续人脸图像处理提供了很多有效分析素材。在有效利用这些素材的情况下，可以显著提高人脸图像处理的速度和精度。

根据本发明实施例的人脸图像识别模型训练方法和装置，利用上述人脸图像生成方法和装置所获得的人脸合成图像训练人脸图像识别模型，可以获得识别精度更高且识别速度更快的人脸图像识别模型。

附图说明

通过结合附图对本发明实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解，并且构成说明书的一部分，与本发明实施例一起用于解释本发明，并不构成对本发明的限制。在附图中，相同的参考标号通常代表相同或相似部件或步骤。

图1示出了用于实现根据本发明实施例的人脸图像生成方法和装置的示例电子设备的示意性框图；

图2示出了根据本发明一个实施例的人脸图像生成方法的示意性流程图；

图3示出了根据本发明一个实施例的经标注人脸关键点的人脸图像；

图4a、图4b、图4c和图4d分别示出了根据本发明一个实施例的所采集的头发图像中的头发信息；

图5示出了根据本发明一个实施例的头发关键点的位置示意图；

图6a、图6b、图6c和图6d分别示出了图4a、图4b、图4c和图4d所涉及的头发图像经分割后所获得的头发轮廓模板的示意图；

图7示出了根据本发明一个实施例的将经变换的头发图像的头发部分直接叠加到人脸图像的操作示意图；

图8示出了根据本发明一个实施例的将人脸图像和头发图像合成的示意性流程图；

图9a和图9b分别示出了根据本发明一个实施例的透视变换前后的头发图像中头发部分的示意图；

图10示出了根据本发明一个实施例的采用泊松融合的方式将经变换的头发图像的头发部分叠加到人脸图像的操作示意图；

图11示出了根据本发明另一实施例的将人脸图像和头发图像合成的示意性流程图；

图12示出了根据本发明又一实施例的将人脸图像和头发图像合成的示意性流程图；

图13示出了根据本发明一个实施例的人脸识别模型训练方法的示意性流程图；

图14示出了根据本发明一个实施例的人脸图像生成装置的示意性框图；

图15示出了根据本发明一个实施例的人脸图像生成装置中的合成模块的示意性框图；

图16示出了根据本发明另一个实施例的人脸图像生成装置中的合成模块的示意性框图；

图17示出了根据本发明一个实施例的人脸识别模型训练装置的示意性框图；以及

图18是根据本发明一个实施例的用于人脸图像生成的电子设备的示意性框图。

具体实施方式

为了使得本发明的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本发明的示例实施例。显然，所描述的实施例仅仅是本发明的一部分实施例，而不是本发明的全部实施例，应理解，本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例，本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。

首先，参照图1来描述用于实现本发明实施例的人脸图像生成方法和装置的示例电子设备100。

如图1所示，电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106和输出装置108，这些组件通过总线***110和/或其它形式的连接机构(未示出)互连。应当注意，图1所示的电子设备100的组件和结构只是示例性的，而非限制性的，根据需要，所述电子设备也可以具有其他组件和结构。

所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器102可以运行所述程序指令，以实现下文所述的本发明实施例中(由处理器实现)的计算机功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如所述应用程序使用和/或产生的各种数据等。

所述输入装置106可以是用来接收用户所输入的指令以及采集数据的装置，并且可以包括键盘、鼠标、麦克风、触摸屏和摄像头等中的一个或多个。

所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音)，并且可以包括显示器、扬声器等中的一个或多个。

上述输入装置106和输出装置108主要用于与用户交互，电子设备100也可以不包括二者。

下面，将参考图2描述根据本发明一个实施例的人脸图像生成方法200。

首先，在步骤S210，获取经标注人脸关键点的人脸图像。

人脸图像指包含人脸信息的图像。人脸关键点指在人脸上具有特殊语义的部位，例如瞳孔位置、内眼角位置、外眼角位置等。人脸图像上可以标注这些人脸关键点。

具体地，首先可以通过网络采集各种人脸图像。替代地，还可以在线下通过实拍的方式采集各种人脸图像。然后，在所采集的人脸图像上标注人脸关键点。一部分或全部人脸关键点的标注操作可通过人工方式实现。一部分或全部人脸关键点的标注操作还可由机器自动标注。例如，针对人脸图像，采用主动外观模型(AAM，Active Appearance Model)，主动形状模型(ASM，Active Shape Model)，随机森林(Random forest)，深度学习(Deeplearning)等方法通过机器学习对人脸关键点位置进行拟合。

应了解本发明不受具体人脸关键点标注方法的限制，无论是现有的人脸关键点标注方法还是将来开发的人脸关键点标注方法，都可以应用于根据本发明实施例的人脸图像生成方法中，并且也应包括在本发明的保护范围内。

图3示出了根据本发明一个实施例的经标注人脸关键点的人脸图像。如图3所示，其中人脸关键点可以包括：正脸最高点、左眼角延长线与脸轮廓的交点、右眼角延长线与脸轮廓的交点和下巴。上述关键点反映了人脸的边界，其是与头发图像的定位密切相关的点。根据正脸最高点和下巴能够较准确地确定头发图像在上下方向上的位置，而根据左、右眼角延长线与脸轮廓的交点则能够较准确地确定头发图像在左右方向上的位置。由此，利用上述人脸关键点可以更准确地合成人脸合成图像，使得人脸合成图像上的头发更精准地位于人脸周围的合适位置。本领域技术人员可以理解，图3所示的人脸关键点仅为示意，而非限制，人脸关键点可以不包括上述4个关键点中的部分或全部。此外，人脸关键点还可以包括人脸上其他位置的点。

在步骤S220，获取经标注头发关键点的头发图像。

头发图像指包含人的头发部分的各种图像。其中，头发部分是指图像中人的真实的头发所在的部分，其包含诸如头发位置、颜色、头型形状等头发信息。头发图像可以通过网络采集或在线下通过实拍的方式采集。头发图像可以是针对具有各种发型的人的头部进行图像采集所获得。头发图像中除了包括头发部分，还可以包括人脸部分、图像背景、眼镜等其他信息，对头发部分之外的其他信息在此并不进行限定。图4a至图4d分别示出了根据本发明一个实施例所采集的头发图像中的头发部分。如图所示，人们的头发长短各异，头型也多种多样，其对脸部的遮挡也不尽相同，所以头发对人脸图像的处理会产生较大不良影响。

与人脸图像上标注人脸关键点类似，在头发图像上也需要标注与人脸关键点对应的头发关键点。与人脸关键点类似，头发关键点也可以采用人工或机器标注，本发明不受具体头发关键点标注方法的限制。头发关键点与人脸关键点一一对应。例如，如果人脸图像中的人脸关键点包括正脸最高点，那么该正脸最高点也需要标注在头发图像中，作为头发关键点。根据人脸关键点和头发关键点之间的对应关系可以将头发图像映射到人脸图像，从而建立头发图像中的像素与人脸图像中的像素的对应关系。人脸关键点和头发关键点各自的数目大于2，以有效地建立上述图像之间的映射关系。

图5示出了根据本发明一个实施例的头发关键点的位置示意图。图5中示出了4个头发关键点，具体包括正脸最高点、左眼角延长线与脸轮廓的交点、右眼角延长线与脸轮廓的交点和下巴。可以看出，图5所示的头发关键点与图3所示的人脸关键点是对应的。

在步骤S230，基于上述人脸关键点和头发关键点将上述头发图像的头发部分叠加到人脸图像上，以获得人脸合成图像。

在此步骤中，根据人脸关键点和头像关键点的匹配将头发图像的头发部分叠加到人脸图像上的合适位置。头发图像中包括各种发型的头发，因此，人脸合成图像中的人脸将具有各种各样的发型。

上述人脸图像生成方法200可以自动获得大量的、逼真的、具有各种发型的人脸的合成图像，为后续人脸图像处理提供了很多有效分析素材。在有效利用这些素材的情况下，可以使人脸图像处理避免受到头发的干扰，显著提高人脸图像处理的速度和精度。

在本发明一个实施例中，上述步骤S230包括步骤S231和步骤S232。

在步骤S231中，将头发图像进行图像分割，获得头发图像的头发轮廓模板。图像分割方法可以利用任何现在已知或未来开发的方法，例如Grabcut分割法。头发轮廓模板是通过针对头发图像进行图像分割从而得到的能够提供头发图像中头发的边缘信息的图像。头发图像中的头发的边缘内部是干净的、无其他信息的头发部分。换言之，头发轮廓模板能够帮助确定头发图像中哪些像素属于头发部分，哪些像素属于其他信息部分。图6a至图6d分别示出了图4a至图4d所涉及的头发图像经分割后所获得的头发轮廓模板。对于这些头发轮廓模板，头发图像中与该头发轮廓模板的白色像素对应的部分是头发部分，头发图像中与该头发轮廓模板的黑色像素对应的部分是其他信息部分。示例性地，头发轮廓模块可以为二值化图像，其中，对应图6a至图6d中的白色像素部分其值为1，黑色像素部分其值为0，在进行图像合成处理时，对于头发图像而言，在人脸合成图像中仅保留值为1的像素部分。

在步骤S232中，利用步骤S231所获得的头发轮廓模板，将头发图像的头发部分直接叠加到人脸图像上，以获得所述人脸合成图像。人脸合成图像是将利用头发轮廓模板将头发图像中的头发部分合成到人脸图像中合适位置所获得合成图像。图7示出了根据本发明一个实施例的步骤S232的示意图。图7中左上图是利用步骤S231所获得头发轮廓模板确定的头发图像中的头发部分。图7中左下图是人脸图像。图7中右图是头发部分和人脸图像简单拼合后所获得的人脸合成图像。具体地，如上所述，根据人脸关键点和头发关键点可以建立人脸图像和头发图像之间的映射关系。首先，可以针对头发图像的头发部分中的每个像素，根据上述映射关系，查找其在人脸图像中的对应像素。然后，将人脸图像中的该对应像素的像素值替换为其像素值。例如，假设根据人脸关键点和头发关键点在各自图像中的位置，确定人脸图像与头发图像大小均为1024*1024。那么可以确定头发部分中位于头发图像的位置(500,500)的像素对应于人脸图像中位于位置(500,500)的像素。则可以将人脸图像中位于位置(500,500)的像素的像素值直接替换为头发图像中位于位置(500,500)的像素的像素值。该直接叠加的合成方式，计算简单。但相对来说，适应范围较窄。如果头发图像和人脸图像的大小相差较大，那么该直接叠加的合成方式可能因为合成效果失真严重而失败。

为了使合成效果更加逼真，在步骤S232之前，上述步骤S230还可以包括步骤S231’，将人脸图像或头发图像进行缩放，以使人脸图像中的人脸和头发图像中的头发大小相对应。换言之，缩放操作可以使得头发图像中的头发与人脸图像中的人脸相匹配，而不是过大或过小。

图8示出了根据本发明另一实施例的步骤S230将人脸图像和头发图像合成的示意性流程图。如图8所示，步骤S230进一步包括步骤S831、步骤S833、步骤S835和步骤S837。

在步骤S831中，根据人脸关键点和头发关键点，获取变换矩阵。该变换矩阵用于将头发图像投影到人脸图像所在的视平面。换言之，即通过在后续步骤中利用该变换矩阵对头发图像进行变换，使其变换为人脸图像所在的视平面。

可选地，该变换是透视变换。透视变换不仅能改变图像的大小，还能够改变图像中目标对象的形状。简单地举个例子，变换矩阵可以将待变换图像中的一个正方形变换到四边形；反之，四边形变换到正方形也是一样的。如此，通过透视变换，可以改变头发图像中头发部分的形状，使得最终所获得的人脸合成图像中的发型更丰富多变。

可选地，上述变换可以是仿射变换。仿射变换所需人脸关键点和头发关键点更少，计算量较小。

下面以透视变换为例，详细描述根据本发明一个示例的获取变换矩阵的过程。如下所示，下面的获取变换矩阵的过程利用4个人脸关键点和相应的头发关键点。4个人脸关键点以及相应头发关键点的位置坐标可以作为已知条件来获得变换矩阵。可选地，人脸关键点还可以是5个。4个或5个人脸关键点即可以获得合适的变换矩阵，又可以保证获得变换矩阵的操作的计算量较小。

假设人脸关键点在人脸图像中的坐标为：左眼角延长线与脸轮廓的交点(x_l,y_l)，右眼角延长线与脸轮廓的交点(x_r,y_r)，正脸最高点(x_t,y_t)，下巴(x_c,y_c)。头发关键点在头发图像中的坐标为：左眼角延长线与脸轮廓的交点(x′_l,_′y′_l)，右眼角延长线与脸轮廓的交点(x′_r,y′_r)，正脸最高点(x′_t,y′_t)，下巴(x′_c,y′_c)。通过例如最小二乘法找到最优的变换矩阵T。

其中，w和w″是运算参数，其能够在运算过程中计算出来。

并且，

通过上述运算所获取的变换矩阵T是一个3*3矩阵，下面用来表示。

在步骤S833中，利用变换矩阵T对所述头发图像进行变换，以获得投影到所述人脸图像所在视平面的、经变换的头发图像。如上所述，该变换可以是透视变换，其可以改变头发图像中头发部分的形状和大小。图9a和图9b分别示出了根据本发明一个实施例的透视变换前后的头发图像中头发部分的示意图。

在步骤S835中，对经变换的头发图像进行图像分割，获取所述经变换的头发图像的头发轮廓模板。步骤S835的操作与上述步骤S231的类似，只是步骤S835的操作对象是步骤S833变换操作所获得的经变换的头发图像。

在步骤S837中，利用所述头发轮廓模板，将所述经变换的头发图像的头发部分叠加到所述人脸图像上，以获得所述人脸合成图像。

步骤S837的操作可以与上述步骤S232的类似，利用直接叠加的方式获得人脸合成图像。

替代地，该步骤S837还可以采用泊松融合的方式将所述经变换的头发图像的头发部分叠加到所述人脸图像上。示例性地，可以通过泊松融合对头发图像的头发部分与人脸图像的叠加边界进行处理，使人脸合成图像尽量平滑，没有明显的边界，看起来更自然。泊松融合是一种基于像素点的区域融合算法。可选地，在本发明的一个实施例中，对于每个融合操作所涉及的像素采用了4邻域的方式进行融合操作。可以通过分别解红(R)、绿(G)、蓝(B)三个通道的线性方程组，得到每个像素融合后的新像素值，由此，得到最终人脸合成图像。

图10示出了根据本发明一个实施例的步骤S837的示意图。图10中左上图是利用步骤S835所获得头发轮廓模板确定的头发图像中的头发部分。图10中左下图是人脸图像。图10中右图是头发部分和人脸图像泊松融合后所获得的人脸合成图像。如图所示，与图7中右图相比，图10中右图所得的人脸合成图像更加真实。

头发部分的细节很多。对于人脸合成图像，泊松融合可以得到无缝的、更逼真的融合结果。由此，所获得的人脸合成图像将更有利于后续的人脸图像处理。此外，虽然头发图像的细节较多，但在泊松融合操作中选择融合区域的过程仍然较为简单且方便。

在图8示出的将人脸图像和头发图像合成的操作中，步骤S833中仅对头发图像进行变换，计算量较小。

图11示出了根据本发明另一实施例的步骤S230将人脸图像和头发图像合成的示意性流程图。如图11所示，步骤S230进一步包括步骤S1131、步骤S1133、步骤S1135和步骤S1137。

在步骤S1131中，对头发图像进行图像分割，以获得头发轮廓模板。该步骤与上述步骤S231类似，为了简洁在此不再赘述。

在步骤S1133中，根据人脸关键点和头发关键点，获取用于头发图像和头发轮廓模板的变换矩阵。该步骤与上述步骤S831类似，为了简洁在此不再赘述。

在步骤S1135中，利用变换矩阵对头发图像和头发轮廓模板进行变换，以获得投影到人脸图像所在视平面的、经变换的头发图像和投影到人脸图像所在视平面的、经变换的头发轮廓模板。该变换操作与上述步骤S833的变换操作类似，只是步骤S1135的变换操作不仅针对头发图像还针对头发轮廓模板。也就是说，变换操作的对象增加了头发轮廓模板。可以理解因为基于相同的变换矩阵进行变换，所以，对于头发图像和头发轮廓模板的变换操作是相同的。在步骤S1137中，利用投影到人脸图像所在视平面的、经变换的头发轮廓模板，将经变换的头发图像的头发部分叠加到所述人脸图像上，以获得人脸合成图像。

步骤S1137的操作可以与上述步骤S232的类似，利用直接叠加的方式获得人脸合成图像。替代地，该步骤S1137还可以采用泊松融合的方式将所述经变换的头发图像的头发部分叠加到所述人脸图像上。本领域普通技术人员通过阅读上述关于步骤S232和步骤S837的描述，可以理解本步骤实现过程，为了简洁，在此不再赘述。

需要说明的是，在一些示例中，也可以先执行步骤S1133，再执行步骤S1131。

在图11所示出的将人脸图像和头发图像合成的方案中，首先进行头发图像的分割以获得头发轮廓模板，然后再获取变换矩阵，进而进行图像变换，最后再将人脸图像和头发图像的头发部分进行合成。在此方案中，对于同一个头发图像，无论存在多少待合成的人脸图像，仅需要执行一次步骤S1131的分割操作。虽然步骤S1135中对于每个待合成的人脸图像需要对头发图像和头发轮廓模板这二者执行变换，但因为分割操作的计算量远大于变换操作的计算量，所以在存在多个待合成的人脸图像的情况中，与图8所示的合成方案相比，能够显著减小计算量。

可选地，上述图8和图11所示的合成操作的流程中，在获取变换矩阵之后，还包括将变换矩阵中的至少部分元素增加噪声，以用于上述步骤S837和步骤S1137的变换操作。下面以图8所示的合成操作为例来说明。图12示出了根据本发明又一实施例的步骤S230将人脸图像和头发图像合成的示意性流程图。如图12所示，步骤S230进一步包括步骤S1231、步骤S1232、步骤S1233、步骤S1235和步骤S1237。与图8所示步骤S230相比，图12所示的步骤S230中增加了步骤S1232。其余的步骤S1231、步骤S1233、步骤S1235和步骤S1237分别与图8中的对应步骤类似，为了简洁，在此不再赘述。

在步骤S1232中，将步骤S1231所获得的变换矩阵中的至少部分元素增加噪声，以用于步骤S1233中的头发图像的变换。根据本发明一个示例，增加了噪声的变换矩阵表达为：

其中n_xx,n_xy,n_px,n_yx,n_yy,n_py,n_dx,n_dy是噪声。

n_xx,n_xy,n_yx,n_yy可以用来改变头发的外形，n_dx,n_dy可以用来改变头发的位置，n_px,n_py用来产生透视变换。可选地，上述噪声服从高斯分布。例如，上述噪声均满足均值为0，方差为λ的高斯分布。其中λ用来控制扰动的大小，可选地，λ取值是变换后的头发图像尺寸的1/50。

对变换矩阵T增加噪声能够进一步控制头发的外形和位置，从而能够极大丰富人脸合成图像中人脸的头型样式，进一步地，显著增加人脸合成图像的数量。进一步地，对变换矩阵T增加服从高斯分布的噪声，可以保证所增加的人脸合成图像的合理性，避免人脸合成图像中的人的头型过于怪异。

示例性地，根据本发明实施例的人脸图像生成方法可以在具有存储器和处理器的设备、装置或者***中实现。

根据本发明另一方面，还提供了一种人脸识别模型训练方法。图13示出了根据本发明一个实施例的人脸识别模型训练方法。如图13所示，人脸识别模型训练方法包括步骤S1301和步骤S1303。在步骤S1301中，利用上述人脸图像生成方法生成人脸合成图像。如前所述，人脸合成图像中的人可以具有各种各样的发型。所以，在人脸合成图像中，头发会以各种形状对人脸造成不同程度的遮挡。在步骤S1303中，利用图像库进行人脸识别模型的训练，其中所述图像库包括所述人脸合成图像。图像库可以是完全利用本发明上述人脸图像生成方法所生成的。替代地，也可以通过将所生成的人脸合成图像添加到现有的图像库中来获得所述图像库。总之，上述人脸合成图像极大地丰富了图像库。

利用包括上述人脸合成图像的图像库进行人脸识别模型的训练能够获得更稳健的人脸识别模型。上述人脸识别模型训练方法显著提升了人脸识别模型的识别性能。

图14示出了根据本发明实施例的人脸图像生成装置1400的示意性框图。如图14所示，人脸图像生成装置1400包括第一获取模块1410、第二获取模块1420和合成模块1430。

第一获取模块1410用于获取经标注人脸关键点的人脸图像。所述人脸关键点可以是4个或5个。可选地，人脸关键点包括正脸最高点、左眼角延长线与脸轮廓的交点、右眼角延长线与脸轮廓的交点和下巴。第一获取模块1410可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现，并且可以执行根据本发明一个实施例的人脸图像生成方法中的步骤S210。

第二获取模块1420用于获取经标注头发关键点的头发图像，其中所述头发关键点与所述人脸关键点对应。第二获取模块1420可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现，并且可以执行根据本发明一个实施例的人脸图像生成方法中的步骤S220。

合成模块1430用于基于所述人脸关键点和所述头发关键点将所述头发图像的头发部分叠加到所述人脸图像上，以获得人脸合成图像。合成模块1430可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现，并且可以执行根据本发明一个实施例的人脸图像生成方法中的步骤S230。

利用上述人脸图像生成装置1400，能够获得大量的、逼真的、具有各种发型的人脸的合成图像。为后续人脸图像处理提供了很多有效分析素材。在有效利用这些素材的情况下，可以显著提高人脸图像处理的速度和精度。

图15示出了根据本发明一个实施例的人脸图像生成装置1400中的合成模块1430的示意性框图。如图15所示，所述合成模块1430可以包括矩阵生成单元1531、第一变换单元1533、第一分割单元1535和合成单元1537。

所述矩阵生成单元1531用于根据所述人脸关键点和所述头发关键点，获取用于所述头发图像的变换矩阵。所述矩阵生成单元1531可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现，并且可以执行根据本发明实施例的人脸图像生成方法的步骤S831。

所述第一变换单元1533用于利用所述变换矩阵对所述头发图像进行变换，以获得投影到所述人脸图像所在视平面的、经变换的头发图像。所述第一变换单元1533可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现，并且可以执行根据本发明实施例的人脸图像生成方法的步骤S833。可选地，所述变换是透视变换。

所述第一分割单元1535用于对所述经变换的头发图像进行图像分割，以获得所述经变换的头发图像的头发轮廓模板。所述第一分割单元1535可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现，并且可以执行根据本发明实施例的人脸图像生成方法的步骤S835。

所述合成单元1537用于利用所述头发轮廓模板，将所述经变换的头发图像的头发部分叠加到所述人脸图像上，以获得所述人脸合成图像。所述合成单元1537可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现，并且可以执行根据本发明实施例的人脸图像生成方法的步骤S837。

可选地，所述合成单元1537进一步包括泊松融合子单元，用于利用泊松融合方法将所述经变换的头发图像的头发部分叠加到所述人脸图像上。

图16示出了根据本发明又一个实施例的人脸图像生成装置1400中的合成模块1430的示意性框图。如图16所示，所述合成模块1430可以包括第二分割单元1631、矩阵生成单元1633、第二变换单元1635和合成单元1637。

所述第二分割单元1631用于对所述头发图像进行图像分割，以获得头发轮廓模板。所述第二分割单元1631可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现，并且可以执行根据本发明实施例的人脸图像生成方法的步骤S1131。

所述矩阵生成单元1633用于根据所述人脸关键点和所述头发关键点，获取用于所述头发图像和所述头发轮廓模板的变换矩阵。所述矩阵生成单元1633可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现，并且可以执行根据本发明实施例的人脸图像生成方法的步骤S1133。可选地，所述变换是透视变换。

所述第二变换单元1635用于利用所述变换矩阵对所述头发图像和所述头发轮廓模板进行变换，以获得投影到所述人脸图像所在视平面的、经变换的头发图像和投影到所述人脸图像所在视平面的、经变换的头发轮廓模板。所述第二变换单元1635可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现，并且可以执行根据本发明实施例的人脸图像生成方法的步骤S1135。

所述合成单元1637用于利用所述投影到所述人脸图像所在视平面的、经变换的头发轮廓模板，将所述经变换的头发图像的头发部分叠加到所述人脸图像上，以获得所述人脸合成图像。所述合成单元1637可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现，并且可以执行根据本发明实施例的人脸图像生成方法的步骤S1137。

可选地，所述合成单元1637进一步包括泊松融合子单元，用于利用泊松融合方法将所述经变换的头发图像的头发部分叠加到所述人脸图像上。

可选地，上述合成模块1430还可以包括加噪单元(未示出)。加噪单元用于将矩阵生成单元所获得的变换矩阵中的至少部分元素增加噪声，以用于第一变换单元或第二变换单元的所述变换。可选地，所述噪声服从高斯分布。

图17示出了根据本发明一个实施例的人脸识别模型训练装置1700的示意性框图。如图17所示，人脸识别模型训练装置1700进一步包括上述人脸图像生成装置1400和训练模块1702。其中，训练模块1702用于利用图像库进行人脸识别模型的训练，其中所述图像库包括所述人脸图像生成装置1400所生成的人脸合成图像。

本领域普通技术人员通过阅读上文关于人脸图像生成方法和人脸识别模型训练方法的详细描述，能够理解上述人脸图像生成装置和人脸识别模型训练装置的结构、实现以及优点，因此这里不再赘述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

图18示出了根据本发明实施例的电子设备1800的示意性框图。该电子设备1800可以生成人脸合成图像，该人脸合成图像中的人脸具有各种各样的发型。电子设备1800包括输入装置1810、存储装置1820、处理器1830以及输出装置1840。

所述输入装置1810用于接收用户所输入的操作指令以及采集数据。输入装置1810可以包括键盘、鼠标、麦克风、触摸屏和摄像头等中的一个或多个。

所述存储装置1820存储用于实现根据本发明实施例的人脸图像生成方法中的相应步骤的程序代码。

所述处理器1830用于运行所述存储装置1820中存储的程序代码，以执行根据本发明实施例的人脸图像生成方法的相应步骤，并且用于实现根据本发明实施例的人脸图像生成装置中的第一获取模块1410、第二获取模块1420和合成模块1430。

输出装置1840可以用于输出根据本发明实施例的人脸图像生成方法中相应步骤获得的人脸图像、头发图像以及人脸合成图像中的至少一个。输出装置1840可以向外部输出各种信息，示例性地，向外部显示器输出图像信息(例如，人脸合成图像)，和/或，向具有数据处理能力的模块等输出处理数据(例如，关键点数据、头发图像的分割数据、头发图像的变换数据、模型训练数据、训练得到的模型等)。本领域技术人员可以理解的是，对输出装置1840的输出数据的类型和输出数据的形式等均为示例性的，本发明不对其进行限制。

在一个实施例中，在所述程序代码被所述处理器1830运行时使所述电子设备1800执行以下步骤：

获取经标注人脸关键点的人脸图像；

基于所述人脸关键点和所述头发关键点将所述头发图像的头发部分叠加到所述人脸图像上，以获得人脸合成图像。

示例性地，所述人脸关键点包括正脸最高点、左眼角延长线与脸轮廓的交点、右眼角延长线与脸轮廓的交点和下巴。

示例性地，在所述程序代码被所述处理器1830运行时使所述电子设备1800执行将所述头发图像的头发部分叠加到所述人脸图像上的步骤包括：

示例性地，所述变换是透视变换。

示例性地，将所述经变换的头发图像的头发部分叠加到所述人脸图像上是利用泊松融合方法。

在所述程序代码被所述处理器1830运行时使所述电子设备1800执行将所述头发图像的头发部分叠加到所述人脸图像上的步骤还包括：将所述变换矩阵中的至少部分元素增加噪声，以用于所述变换。

示例性地，所述噪声服从高斯分布。

可选地，上述电子设备1800还可以用于执行根据本发明实施例的人脸识别模型训练方法的相应步骤，并且用于实现根据本发明实施例的人脸识别模型训练装置中的训练模块。

所述存储装置1820还可以存储用于实现根据本发明实施例的人脸识别模型训练方法中的相应步骤的程序代码。

所述处理器1830用于运行所述存储装置1820中存储的程序代码，以执行根据本发明实施例的人脸识别模型训练方法的相应步骤，并且用于实现根据本发明实施例的人脸识别模型训练装置中的人脸图像生成装置和训练模块。

具体地，在所述程序代码被所述处理器1830运行时还使所述电子设备1800执行以下步骤：利用图像库进行人脸识别模型的训练，其中所述图像库包括所述人脸合成图像。

此外，根据本发明实施例，还提供了一种存储介质，在所述存储介质上存储了程序指令，在所述程序指令被计算机或处理器运行时用于执行本发明实施例的人脸图像生成方法或人脸识别模型训练方法的相应步骤，并且用于实现根据本发明实施例的人脸图像生成装置或人脸识别模型训练装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合。

在一个实施例中，所述计算机程序指令在被计算机运行时可以实现根据本发明实施例的人脸图像生成装置或人脸识别模型训练装置的各个功能模块，并且/或者可以执行根据本发明实施例的人脸图像生成方法或人脸识别模型训练方法。

在一个实施例中，所述计算机程序指令在被计算机运行时执行以下步骤：

获取经标注人脸关键点的人脸图像；

示例性地，在所述计算机程序指令在被所述计算机或处理器运行时使计算机或处理器执行将所述头发图像的头发部分叠加到所述人脸图像上的步骤包括：

对所述头发图像进行图像分割，以获得头发轮廓模板；

示例性地，所述变换是透视变换。

示例性地，利用泊松融合方法将所述经变换的头发图像的头发部分叠加到所述人脸图像上。

在所述计算机程序指令在被所述计算机或处理器运行时使计算机或处理器执行将所述头发图像的头发部分叠加到所述人脸图像上的步骤还包括：将所述变换矩阵中的至少部分元素增加噪声，以用于所述变换。

示例性地，所述噪声服从高斯分布。

在一个实施例中，所述计算机程序指令在被计算机运行时还执行以下步骤：利用图像库进行人脸识别模型的训练，其中所述图像库包括所述人脸合成图像。

根据本发明实施例的用于生成人脸图像的电子设备中的各模块可以通过根据本发明实施例的处理器运行在存储器中存储的计算机程序指令来实现，或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。

根据本发明实施例的人脸图像生成方法及装置、电子设备以及存储介质，基于人脸关键点以及与人脸关键点对应的头发关键点可以将人脸图像和头发图像合成，从而获得大量的、逼真的、具有各种发型的人脸的合成图像。为后续人脸图像处理提供了很多有效分析素材。在有效利用这些素材的情况下，可以显著提高人脸图像处理的速度和精度。

根据本发明实施例的人脸图像识别模型训练方法和装置、电子设备以及存储介质，利用上述人脸图像生成方法和装置所获得的人脸合成图像训练人脸图像识别模型，可以获得识别精度更高且识别速度更快的人脸图像识别模型。

尽管这里已经参考附图描述了示例实施例，应理解上述示例实施例仅仅是示例性的，并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改，而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个设备，或一些特征可以忽略，或不执行。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该本发明的的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如相应的权利要求书所反映的那样，其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域的技术人员可以理解，除了特征之间相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的人脸图像生成装置和人脸识别模型训练装置中的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

以上所述，仅为本发明的具体实施方式或对具体实施方式的说明，本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种人脸图像生成方法，包括：

获取经标注人脸关键点的人脸图像；

2.如权利要求1所述的人脸图像生成方法，其中，所述将所述头发图像的头发部分叠加到所述人脸图像上进一步包括：

3.如权利要求1所述的人脸图像生成方法，其中，所述将所述头发图像的头发部分叠加到所述人脸图像上进一步包括：

对所述头发图像进行图像分割，以获得头发轮廓模板；

4.如权利要求2或3所述的人脸图像生成方法，其中，在所述获取变换矩阵之后，所述将所述头发图像的头发部分叠加到所述人脸图像上进一步包括：

将所述变换矩阵中的至少部分元素增加噪声，以用于所述变换。

5.如权利要求4所述的人脸图像生成方法，其中，所述噪声服从高斯分布。

6.如权利要求2或3所述的人脸图像生成方法，其中，所述变换是透视变换。

7.如权利要求2或3所述的人脸图像生成方法，其中，所述将所述经变换的头发图像的头发部分叠加到所述人脸图像上进一步包括：

利用泊松融合方法将所述经变换的头发图像的头发部分叠加到所述人脸图像上。

8.如权利要求1所述的人脸图像生成方法，其中，所述人脸关键点包括：正脸最高点、左眼角延长线与脸轮廓的交点、右眼角延长线与脸轮廓的交点和下巴。

9.一种人脸识别模型训练方法，包括：

利用如权利要求1至8任一项所述的人脸图像生成方法生成人脸合成图像；以及

10.一种人脸图像生成装置，包括：

第一获取模块，用于获取经标注人脸关键点的人脸图像；

11.如权利要求10所述的人脸图像生成装置，其中，所述合成模块进一步包括：

12.如权利要求10所述的人脸图像生成装置，其中，所述合成模块进一步包括：

13.如权利要求11或12所述的人脸图像生成装置，其中，所述合成模块进一步包括：

加噪单元，用于将所述变换矩阵中的至少部分元素增加噪声，以用于所述变换。

14.如权利要求13所述的人脸图像生成装置，其中，所述噪声服从高斯分布。

15.如权利要求11或12所述的人脸图像生成装置，其中，所述变换是透视变换。

16.如权利要求11或12所述的人脸图像生成装置，其中，所述合成单元进一步包括：

泊松融合子单元，用于利用泊松融合方法将所述经变换的头发图像的头发部分叠加到所述人脸图像上。

17.如权利要求10所述的人脸图像生成装置，其中，所述人脸关键点包括：正脸最高点、左眼角延长线与脸轮廓的交点、右眼角延长线与脸轮廓的交点和下巴。

18.一种人脸识别模型训练装置，包括：

如权利要求10至17任一项所述的人脸图像生成装置；以及