CN112991484A

CN112991484A - 智能人脸编辑方法、装置、存储介质及设备

Info

Publication number: CN112991484A
Application number: CN202110466411.XA
Authority: CN
Inventors: 高林; 陈姝宇; 刘锋林
Original assignee: Institute Of Digital Economy Industry Institute Of Computing Technology Chinese Academy Of Sciences
Current assignee: Institute Of Digital Economy Industry Institute Of Computing Technology Chinese Academy Of Sciences
Priority date: 2021-04-28
Filing date: 2021-04-28
Publication date: 2021-06-18
Anticipated expiration: 2041-04-28
Also published as: CN112991484B

Abstract

本发明涉及一种智能人脸编辑方法、装置、存储介质及设备。适用于计算机视觉、计算机图形学领域。提供一种智能人脸编辑方法、装置、存储介质及设备。本发明所采用的技术方案是：一种智能人脸编辑方法，其特征在于：将人脸几何特征图像和人脸外观特征图像根据人脸部位输入相应的、经训练的局部解耦模块，提取人脸各部位对应的几何特征和外观特征；局部解耦模块基于几何特征和外观特征生成人脸各部位对应的局部图像及局部中间特征图；通过经训练的全局融合模块将人脸各部位对应的局部中间特征图融合生成具有所述几何特征和外观特征的最终人脸图像。

Description

智能人脸编辑方法、装置、存储介质及设备

技术领域

本发明涉及一种智能人脸编辑方法、装置、存储介质及设备。适用于计算机视觉、计算机图形学领域。

背景技术

人脸合成技术是数字图像处理领域重要的课题之一，围绕高质量人脸合成有许多相关技术。基于深度学习的人脸合成技术主要有以下两类：通过高斯采样，使用生成式对抗网络（GAN），合成新的人脸；使用条件生成式对抗网络，输入语义标记图、草图、属性标签等信息，合成相应的人脸。通过草图合成真实人脸虽然已有许多技术，但是其大多无法控制生成的人脸的外观，或者人脸合成的效果较差。

对于人脸编辑，一些现有技术使用带标签的人脸属性标记数据，对GAN的隐空间进行解耦。通过操作隐空间的投影编码，对人脸属性进行编辑。但是，这些技术只能编辑特定属性，无法修改属性标签以外的内容，自由度较低。一些技术使用语义标记图编辑人脸，但由于其输入缺少几何信息，因此无法编辑如皱纹、发型走向等人脸几何信息。一些技术使用草图编辑人脸，但是其基于图像补全技术，有较多局限性。

Portenier等人于2018年发表于ACM Transactions on Graphics的“Faceshop:Deep Sketch-Based Face Image Editing”中提出了基于草图的人脸编辑***，使用遮盖标记、草图、颜色笔触，对人脸进行编辑。Jo等人于2019年发表于Proceedings of theIEEE/CVF International Conference on Computer Vision的“SC-FEGAN: Face EditingGenerative Adversarial Network With User’s Sketch and Color.”使用了风格损失，生成了更高质量、更鲁棒的结果。但是，现有技术无法编辑人脸的整体外观，当以纯草图作为输入时，也无法生成真实逼真的人脸。

发明内容

本发明要解决的技术问题是：针对上述存在的问题，提供一种智能人脸编辑方法、装置、存储介质及设备。

本发明所采用的技术方案是：一种智能人脸编辑方法，其特征在于：

将人脸几何特征图像和人脸外观特征图像根据人脸部位输入相应的、经训练的局部解耦模块，提取人脸各部位对应的几何特征和外观特征；

局部解耦模块基于几何特征和外观特征生成人脸各部位对应的局部图像及局部中间特征图；

通过经训练的全局融合模块将人脸各部位对应的局部中间特征图融合生成具有所述几何特征和外观特征的最终人脸图像。

所述几何特征图像为人脸草图或人脸真实图像，所述局部解耦模块包括草图编码器

、图像编码器

、外观编码器

和图像合成生成器

；

所述从几何特征图像中提取人脸各部位对应的几何特征，包括：

训练由草图编码器

和草图解码器

组成的网络，瓶颈层中的隐空间是维度为

的低分辨率特征图，其中

、

和

是几何特征图的高度、宽度和通道数；

令

表示人脸真实图像，而

表示其对应的人脸草图；

通过预训练的草图编码器

，提取

的几何特征，几何特征表示为

；

训练图像编码器

，将相应的人脸真实图像

映射到草图表征的几何隐空间，表示为

。

当

和

输入预训练的解码器

时，算法对

的每一层都施加约束，同时也在最终输出

和

之间添加L1损失。

所述局部解耦模块的几何特征提取训练，包括：

首先，训练

和

，使用L1重建损失函数学习草图的几何隐空间，一旦

经过训练，将几何特征表示为

；

然后训练网络

，以人脸真实图像

作为输入，并预测几何特征

，使其遵循与学习的几何空间相同的分布，损失函数定义如下：

其中，N是解码器

的层数，索引0对应输入特征图，索引N对应输出图像，其他索引是中间特征图。

所述外观编码器

利用全局平均池化，消除人脸外观特征图像上的空间信息并提取与几何特征无关的外观特征。

所述外观编码器及图像合成生成器采用交换训练策略；

使用人脸几何特征图像

的几何特征

与人脸外观特征图像

的外观特征

，生成图像

，即

；

使用

的外观特征与

的几何特征，循环重建图像

，即

。

采用以下损失函数训练局部解耦模块，包括：

a、自重建损失：

其中：

表示感知损失；

表示鉴别器的特征匹配损失；

表示颜色损失，将图像转换到CIE-Lab颜色空间，通过计算a和b通道中的色度距离来控制色调；a和b通道包含CIE LAB颜色空间中的颜色信息；

、

、

根据经验设置具体参数；

b、循环交换损失：

其中

、

根据经验设置具体参数；

c、对抗损失：

采用多尺度鉴别器D来限制生成图像的分布，以匹配真实图像的分布：

权重值

，

。

一种智能人脸编辑装置，其特征在于，包括：

特征提取单元，用于将人脸几何特征图像和人脸外观特征图像根据人脸部位输入相应的、经训练的局部解耦模块，提取人脸各部位对应的几何特征和外观特征；

图像生成单元，用于局部解耦模块基于几何特征和外观特征生成人脸各部位对应的局部图像及局部中间特征图；

图像融合单元，用于通过经训练的全局融合模块将人脸各部位对应的局部中间特征图融合生成具有所述几何特征和外观特征的最终人脸图像。

一种存储介质，其上存储有能被处理器执行的计算机程序，其特征在于：所述计算机程序被执行时实现所述智能人脸编辑方法的步骤。

一种计算机设备，具有存储器和处理器，存储器上存储有能被处理器执行的计算机程序，其特征在于：所述计算机程序被执行时实现所述智能人脸编辑方法的步骤。

本发明的有益效果是：本发明为基于草图的人脸合成与编辑技术，草图所表征的几何信息较为丰富，可以对人脸几何细节进行控制，其相较于现有技术更为灵活。同时，通过解耦技术，可以替换人脸对应的外观，对肤色、发色等信息进行编辑。

本发明将将人脸分成了左眼、右眼、鼻子、嘴巴、背景五个部分，结合局部解耦模块与全局融合模块，可分别编辑局部几何和外观特征，合成结果在局部细节处质量较高。

本发明中局部解耦模块，将图像和草图编码到同一空间，保证信息的解耦。训练过程中，使用交换操作，组合不同图像的几何和外观，生成中间结果，并对该结果分别进行几何和外观约束，从而可从人脸或真实图像提取几何信息，与其他图像的外观组合生成新的局部合成结果。

本发明中局部解耦模块生成中间特征图，全局融合模块将中间特征图按固定位置拼接，再使用下采样网络、残差网络、上采样网络，通过GAN中判别器与相关损失函数优化网络，融合分块拼接的结果。通过局部解耦模块合成的中间特征图，拼接生成高真实感的人脸。

附图说明

图1为实施例的网络框架结构图（示出了结构化的局部到全局的训练策略，同时示出局部解耦模块的交换、循环重建的训练策略）。

图2为实施例中几何编码器的结构及训练策略示意图（将草图几何和真实图像编码到同一个潜在空间，可以从真实图像和草图中提取几何信息）。

图3为实施例中几何和外观交换的人脸生成结果（第一行提供外观信息，第一列提供几何信息）。

图4为实施例中利用草图进行局部编辑的结果（输入的草图进行了序列化的编辑，***生成了对应的人脸编辑结果，该***为用户提供了较高的自由度和创意性）。

图5为实施例中局部外观编辑的结果（固定图像的几何特征，通过替换眼睛和嘴巴的外观参考图像，生成了局部外观编辑的结果）。

图6为实施例中对几何和外观进行插值的结果（左上角与右下角的图像为真实图像，其余为插值生成结果）。

具体实施方式

如图1所示，本实施例使用图像解耦技术，采用局部到全局的方法，提出一种智能人脸编辑方法。

本例中将人脸分成了5个部分：左眼、右眼、鼻子、嘴巴、背景，在完成图像分块后，设计局部解耦模块分别对每个部分的图像进行解耦特征提取与生成；在获取到每个部分的生成结果后，通过全局融合模块将分块的结果进行拼接融合，得到具有全局一致性的人脸图像结果。

本实施例的网络结构包括了5个局部解耦模块用于解耦几何和外观信息，1个全局融合模块实现局部特征的融合并生成高质量的、具有全局一致性的结果。在网络训练的过程中，使用交换的策略，并设计循环一致的特征约束，保证网络框架的鲁棒性与泛化性。

本实施例中智能人脸编辑方法的具体步骤如下：

1）局部解耦：将人脸几何特征图像（图像中包含人脸的几何特征）和人脸外观特征图像（图像中包含人脸的外观特征）根据人脸部位输入相应的、经训练的局部解耦模块，提取人脸各部位对应的几何特征和外观特征，几何特征图像为人脸草图或人脸真实图像。

几何特征主要包括两方面的内容：1. 外形信息，例如五官的形状、人物脸型、头发长短等；2. 几何细节，即人脸的几何特征的细节的表达，例如人物脸部的皱纹、头发的走向等。

外观特征主要包括三个内容：1. 颜色信息，例如人脸的发色、肤色、唇色等色彩信息；2. 材质信息，即人脸的头发和皮肤的质感，例如皮肤的光滑程度等；3. 光照信息，即光照条件对人脸的明暗的影响，例如光线的亮暗、阴影的变化等信息。在某些情况下，以上因素对外观的影响是相互的，如光照变化可能会影响肤色的表达，外观特征并未对以上每个因素之间做明确的划分。

针对每一个局部分块，局部解耦模块先提取其几何和外观信息，再融合生成局部特征图。因此，局部解耦模块包括几何编码器与外观编码器，分别获取几何和外观特征。

1a）几何编码器：草图是真实图像的单色轮廓，可以提取几何信息。因此，自编码器网络从输入草图直接提取几何信息。从真实图像中直接提取几何特征较为困难，当真实人脸局部图像作为输入时，提取其几何特征的一种直观方法是使用一个预先训练好的图像到草图转换网络将真实图像转换成草图，然后将生成的草图应用到草图的几何编码器中。

为了简化网络，本实施例提出一种从草图和真实图像中提取几何信息的统一方法，通过训练两个自编码器来实现这一点，草图编码器

和图像编码器

，一个用于草图，另一个用于图像。本实施例中将图像空间的隐式分布与草图空间的隐式分布对齐，确保仅对几何信息进行编码。

首先训练由草图编码器

和草图解码器

组成的网络，生成草图的中间特征，如图2所示。为了保留必要的空间信息，瓶颈层中的隐空间不是以向量的形式，而是维度为

的低分辨率特征图，其中

、

和

是几何特征图的高度、宽度和通道数。网络的输入和输出都是草图，该草图既可以是从图像中提取的边缘图，也可以是手绘草图。对于手绘草图，特别是草图绘制过程中的不完整草图，发明人使用了预处理过程中草图流形投影提高***鲁棒性。

令

表示真实的图像，而

表示其对应的草图。通过预训练的

，提取

的几何特征，公式为

。

然后，需要训练编码器

，将相应的图像

映射到草图表征的几何隐空间，表示为

。

为了保证

和

遵循相同的分布，当

和

输入预训练的解码器

时，算法对

的每一层都施加约束，同时也在最终输出

和

之间添加L1损失。

1b）外观编码器：外观是人脸图像的另一个重要属性。人脸几何草图和真实人脸图像之间的映射是一对多的，通过指定外观，可解决这种模糊性。

本实施例使用外观编码器

提取外观特征，外观编码器

利用全局平均池化（即，对于每个特征通道，取特征图中所有空间位置的平均值），以消除空间信息并提取与几何特征无关的外观特征。

由于外观特征是针对局部区域提取的，因此删除空间信息不会造成有用信息的显著损失。通过对人脸外观和几何特征的插值实验，如图6，证明

可以学习连续的人脸外观空间。

2）图像生成：局部解耦模块基于几何特征和外观特征生成人脸各部位对应的局部图像及局部中间特征图。

局部解耦模块还包括图像合成生成器

，组合同一幅图像或两幅图像（一幅提供几何特征，另一幅提供外观特征）中的几何特征和外观特征，得到转换后的局部图像及中间特征图。

图像合成生成器：输入独立的几何和外观特征，生成重建或几何、外观交换的结果。为了控制生成人脸图像的外观，本实施例在人脸图像合成生成网络中采用了自适应实例归一化（AdaIN）。

本实施例中图像合成生成器包括4个残差块和4个上采样层：首先，将外观特征注入到每个残差块中；然后，通过4次上采样操作得到特征图，每个特征图与输入图像具有相同的分辨率，但有64个通道；最后，通过一个卷积层生成与输入几何和外观特征一致的图像。

3）全局融合：通过经训练的全局融合模块将人脸各部位对应的局部中间特征图融合生成具有所述几何特征和外观特征的最终人脸图像。

为了将局部图像特征图转换成完整且自然的面部图像，一种可行的方法是直接组合局部解耦生成的局部图像块（如图2中生成

的过程）。然而，这种直观方法容易在局部分块的边界显示人工处理痕迹。

本实施例中不是直接组合局部图像块，而是将局部解耦模块生成的中间特征图输入到图像生成网络进行组合，使网络融合了更多的信息流，生成高质量的图像。

本例中全局融合模块包括三个单元：编码器、残差块和解码器。在给定背景部分的特征图的基础上，使用其他分块对应生成的特征图，按“嘴”、“鼻子”、“左眼”和“右眼”的顺序，替换背景特征图中的对应分块，减少分块间重叠的影响。融合后的特征图送入全局融合模块，生成具有输入指定的外观和几何特征的全新人脸。

以下对本实施例中局部解耦模块和全局融合模块的训练过程进行介绍，本例中分步地训练整个网络框架，先训练局部解耦模块，然后固定局部解耦模块的参数，训练全局融合模块。

A-1）训练数据集：本实施例需要大规模的草图与图像相匹配的数据集训练网络。同时，草图图像对中的草图要求有较高质量，与手绘草图相似。传统的边缘提取技术，如HED和Canny，通常无法产生理想的边缘映射。因此，本实施例使用Photoshop中的影印滤镜获得边缘图像，然后简化边缘图像获得草图，构建训练数据集，使用CelebA HQ作为训练数据，图像和草图的分辨率都设置为512×512。

A-2）解耦训练，局部解耦模块的训练过程包括三个步骤：

首先，训练

和

，使用L1重建损失函数学习草图的几何隐空间。一旦

经过训练，就可以将几何特征表示为

。

然后，训练网络

，以真实图像

作为输入，并预测几何特征

，使其遵循与学习的几何空间相同的分布。损失函数定义如下：

其中，N=7是解码器

的层数，索引0对应输入特征图，索引N对应输出图像，其他索引是中间特征图。本例中在优化

的参数时，固定

和

的权重。

固定

和

的权重，训练外观编码器

和图像合成生成器

。

将草图的几何特征

或真实图像的几何特征

随机输入

。在下面的部分中，将

和

都表示为

，而不区分其来源。

本实施例中外观编码器及图像合成生成器采用交换训练策略，并利用循环一致性损失项解耦真实人脸图像的外观和几何结构；还采用多尺度鉴别器和对抗性损失确保生成图像的真实感。

本例中交换训练策略举例说明如下：给定训练集中的两张图像

（

是真实图像或草图（作为人脸几何特征图像））和

（

是真实图像（作为人脸外观特征图像）），如图1所示，通过预训练的

或

从

和

中提取几何特征

和

，利用

从

中提取外观特征。

通过将

的几何特征与

的几何特征交换，使用

的几何特征

与

的外观特征，生成图像

，即

。

使用

的外观特征与

的几何特征，循环重建图像

，即

。

本实施例还包括自重建损失：当

和

以相同的图像（如

）作为输入时，可以利用其几何特征和外观特征进行重建，

的重建可以表述为

。

本实施例中采用以下损失函数训练局部解耦模块：

自重建损失：

当几何特征和外观特征来自同一张图像时，即

时，该算法的自重建一致性要求通过网络框架可以重建I。

自重构损失函数包含三项：1）感知损失

，通过预训练的VGG-19模型度量生成图像和输入图像之间的视觉相似性；2）鉴别器的特征匹配损失

，旨在稳定训练过程；3）颜色损失

，将图像转换到CIE-Lab颜色空间，通过计算a和b通道中的色度距离来控制色调。自重建损失可以表示为：

其中a和b通道包含CIE LAB颜色空间中的颜色信息，根据经验设置

、

、

。

循环交换损失：

为彻底地解耦几何特征和外观特征，本实施例采用交换的方法从不同图像的几何特征和外观特征生成人脸图像，即

≠

，循环交换损失

包含项

和

。

为彻底解耦人脸图像的几何特征和外观特征，将

的外观替换为

的外观后生成

后，应保持

的几何结构。因此，算法引入了几何损失

（geometry loss），通过与输入图像比较来约束生成图像的几何结构不变：

网络使用了循环一致性损失项保证交换图像

的外观与

相同。使用

的几何结构和交换图像

的外观，生成的图像

应该循环重建图像

。本例使用之前的重建损失公式

来实现循环一致性的约束：

、

、

与之前设置相同。

循环交换损失为：

、

设置为1、1。

对抗损失：

本实施例中采用多尺度鉴别器D来限制生成图像的分布，以匹配真实图像的分布：

权重值

，

。

本实施例中局部解耦模块的优化目标

为以上3项的和，最小化

将优化下述3个网络：

，

，

。

可表示为：

A-3）全局融合训练：局部解耦模块训练完成后，需训练全局融合模块，融合局部解耦模块生成的特征图，生成最终结果。与前一阶段类似，使用了对抗损失、特征匹配损失和感知损失作为全局融合模块的损失函数，该阶段不使用交换策略，因为其不涉及任何解耦操作。

本实施例还提供一种智能人脸编辑装置，包括特征提取单元、图像生成单元和图像融合单元，其中特征提取单元用于将人脸几何特征图像和人脸外观特征图像根据人脸部位输入相应的、经训练的局部解耦模块，提取人脸各部位对应的几何特征和外观特征；图像生成单元用于局部解耦模块基于几何特征和外观特征生成人脸各部位对应的局部图像及中间特征图；图像融合单元用于通过经训练的全局融合模块将人脸各部位对应的局部中间特征图融合生成具有所述几何特征和外观特征的最终人脸图像。

本实施例还提供一种存储介质，其上存储有能被处理器执行的计算机程序，该计算机程序被执行时实现本实施例中智能人脸编辑方法的步骤。

本实施例还提供一种计算机设备，具有存储器和处理器，存储器上存储有能被处理器执行的计算机程序，该计算机程序被执行时实现本实施例中智能人脸编辑方法的步骤。