CN113095149A

CN113095149A - 一种基于单张人脸图像的全头部纹理网络结构及生成方法

Info

Publication number: CN113095149A
Application number: CN202110287940.3A
Authority: CN
Inventors: 刘洋; 樊养余; 吕国云; 郭哲; 齐敏; 王毅; 张君昌
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2021-03-18
Filing date: 2021-03-18
Publication date: 2021-07-09

Abstract

本发明提供了一种基于单张人脸图像的全头部纹理网络结构及生成方法，以单张人脸图像为输入条件，利用设计的生成对抗网络获得对应个体的全头部纹理图，通过三维人脸的先验知识获取输入人脸图像的身份、表情及纹理特征信息，使用变分自编码器将获取的人脸特征信息作为约束来控制GAN网络的纹理生成过程，最后将输入的人脸图像利用两个性质不同的鉴别器与生成的纹理图进行人脸特征点检测反馈，从而得到更真实更符合原图像的全头部纹理图。本发明与输入图像可以保持97％以上的相似度，保持了人脸原有的主要细节。本发明生成的全头部纹理图保持了身份和表情的准确性，并精确的推断出原始图像中不可见区域的纹理信息。

Description

一种基于单张人脸图像的全头部纹理网络结构及生成方法

技术领域

本发明涉及图像处理和深度学习领域，尤其是一种单张人脸图像的全头部纹理生成方法。

背景技术

随着深度学习技术深入的应用到人脸图像和人脸三维模型处理，目前利用先验的人脸模型数据库重建三维人脸的技术已经较为成熟。同时，通过拟合人脸的三维可变形模型可以得到符合映射需求的面部纹理，在高性能的渲染引擎和足够的数据支持下，这种重建的面部纹理图在细节上也恢复的很好。但从单张随机的二维人脸图像来生成符合面部特征的人脸全头部纹理图还存在很大的问题，一方面由于单张随机的人脸图像由于姿态和角度的自遮挡而丢失了很多基本面部信息(如人脸正面图像缺乏侧面和头发区域的纹理信息)，导致常规方法所生成的人脸UV贴图总是不完整的；另一方面，对于随机获取的人脸图像，光照及相机姿态无法确定，难以从这种不受限的图像中恢复出真实的纹理细节。本发明涉及的全头部纹理生成方法可以更为完整的了解人物整个头部的信息，同时，全头部纹理也可以应用于三维模型的生成和投影，进行全头部纹理映射后的人脸三维模型逼真度更高。

发明内容

为了克服现有技术的不足，本发明提供一种基于单张人脸图像的全头部纹理网络结构及生成方法。以单张不受限(大小、角度、表情和光照条件任意)的人脸图像为输入条件，利用设计的生成对抗网络(Generative Adversarial Networks，GAN)获得对应个体的全头部纹理图。具体过程是通过三维人脸的先验知识获取输入人脸图像的身份、表情及纹理特征信息，使用变分自编码器(Variational Autoencoder，VAE)将获取的人脸特征信息作为约束来控制GAN网络的纹理生成过程，最后将输入的人脸图像利用两个性质不同的鉴别器与生成的纹理图进行人脸特征点检测反馈，从而得到更真实更符合原图像的全头部纹理图。在这个训练过程中，收集了足量的人脸纹理图，包括来自于开源数据集的一些人脸UV纹理图以及通过实验室专业3D扫描设备获取的人脸纹理图。本发明的纹理生成过程使用经特殊设计的VAE-GAN(Variational Autoencoder-Generative Adversarial Networks)框架来生成相应的UV纹理图，从而使输入图像中不可见区域的信息可用。

本发明解决其技术问题所采用的技术方案是：

一种基于单张人脸图像的全头部纹理网络结构，包括一个变分自编码器(Variational Autoencoder)模块，一个生成器(Generator)模块和两个用于不同目标的鉴别器(Discriminator)模块，其中变分自编码器模块将输入图像映射到浅层矢量，生成器模块根据浅层矢量生成对应的人脸纹理图像，再将人脸纹理图像分别输入到鉴别器模块中进行鉴别，鉴别器模块包括全局鉴别器和人脸特征点分类器，全局鉴别器识别生成器模块所产生的纹理图的真实性；人脸特征点分类器检测生成纹理图与原始输入图像的局部人脸特征点，使纹理图与原始输入图像的面部特征保持一致；变分自编码器服从隐藏层空间下的单位高斯分布，通过变分自编码器模块将输入的人脸图像投影到隐层矢量，然后使用生成器模块重构与隐层分布相匹配的输入图像特征的原始像素，隐层分布信息和输入图像之间的关系通过变分自编码器和生成对抗网络建立。

所述的变分自编码器是自编码器(Auto-encoder，AE)的一种改进模型，将输入信息经encoder模块处理后转换成隐层矢量；引入重参数构建变分边界，使自编码器通过对隐层特征的修改实现对数据生成过程的微调，将人脸图像作为变分自编码器模块的输入信息，经过卷积和池化过程之后获得输入图像降维后的隐层数据，并将人脸的身份、表情和纹理参数作为重参数加入到隐层矢量中，用于表示输入图像与约束参数的隐层分布。

本发明还提供涉及一种基于单张人脸图像的全头部纹理网络结构的生成方法，具体步骤如下：

步骤1：获取输入参数，输入参数包括PCA模型的纹理参数，身份特征参数和表情特征参数；

PCA模型的压缩降维过程是将人脸样本按照形状、纹理排列为样本矩阵，并对样本矩阵去中心化，然后对协方差矩阵进行特征值分解，得到特征值与特征向量，将特征值与特征向量作为主成成分保留；

其中，

和

分别表示人脸样本的平均形状和平均纹理，P_i和T_i表示面部形状和纹理模型的主成成分的特征基，α_i和β_i为人脸形状参数和纹理参数；

步骤2：基于PCA的多线性模型优化求解；

根据人脸模型中不同的轴向特征排列面部样本，将面部样本数据表示成三阶张量，第一维是面部的坐标顶点，第二维是身份特征，第三维是面部表情特征，采用基于PCA的多线性模型压缩人脸样本，面部样本由三阶张量的多线性组合表示：

S^*＝Cr×_idω_id×_expω_exp (3)

其中，Cr是正交矩阵对应维度的三阶张量核，×_id×_exp分别表示身份和表情的模乘，ω_id为人脸样本的身份特征向量，ω_exp为人脸样本的表情特征向量；S^*表示任意的人脸形状，人脸形状形状S^*由压缩后的张量核Cr和身份、表情的模乘与特征向量进行多线性表示；根据步骤1中求得的

作为初始值，根据所收集的三维人脸数据库中的三维人脸模型张量核Cr，采用高斯-牛顿法求解当前人脸的身份特征向量与表情特征向量即ω_id与ω_exp，其中ω_id、ω_exp为未知参数，此多线性模型的优化过程即求该目标函数最小化的最优解：

其中

分别表示ω_id和ω_exp参数的待求最佳值，S表示PCA模型求解的条件约束的人脸形状函数，对已知变量进行初始化，固定其他变量，仅对一组变量进行求解，更新所求得的一组变量值后，再依次对其余三组变量进行循环迭代，将已求出的此组变量进行固定，对待求变量

进行求解；

步骤3：网络模型中各模块的优化过程及训练参数设置；

将步骤1和步骤2中求解得到的纹理参数β和身份特征向量ω_id、表情特征参数ω_exp作为变分自编码器的条件属性，在经过变分自编码器的卷积层和池化层中对输入图像进行卷积和二次采样过程，将变分自编码器输出的潜层向量的维度设定为256；变分自编码器的末端级联两个连续层，将得到的身份、表情和纹理参数与二次采样的输入图像进行合并；变分自编码器和生成器模块之间采用完全卷积的级联形式结构，通过两个全连接层建立阶跃连接；在生成器模块上设置6个上采用的反卷积层和相应的滤波器结构，其中卷积层在本次设计中分别设置成256，128和64个通道数；

生成器模块的优化过程通过最小化生成纹理与隐层参数相对应的样本纹理之间的逐像素欧氏距离实现，即通过逐像素二范数作为生成器模块的损失函数：

其中，I(x,y)为训练过程中的样本纹理图的像素，I^*(x,y)为生成器生成的纹理图的像素，f_C是全局鉴别器网络中间层的特征，和f_D是本地面部鉴别器网络的中间层特征；

在基于单张人脸图像的全头部纹理生成网络结构中，鉴别器模块包括全局鉴别器和人脸特征点分类器；将Alexnet框架的输入大小设置为256*256作为全局鉴别器模块，并在卷积层之后进行批次归一化，使用已公开的ArcFace作为面部特征点检测分类器的网络框架，通过全局鉴别器和人脸特征点分类器各自的损失函数进行网络结构的训练；其中全局鉴别器的真实性评估标准是，根据输入条件参数生成的全头部纹理是UV纹理图，像素分布连续且符合实际人脸生物学特征，同时，保证生成纹理图的面部和其他位置(如脖颈、耳朵及头发区域)的连接处像素是连续的，全局鉴别器的损失函数表示为：

其中，P_d(x)表示全头部UV纹理图的参数分布，P_d(y)为面部区域的UV纹理参数分布，P_(c)是人脸PCA纹理模型的参数分布；

人脸特征点分类器基于公开的人脸识别网络ArcFace进行设计，该网络经过预训练获取面部区域关键点，在角度空间最大化分类界线，用于检测生成的UV纹理中的面部中心区域是否与输入人脸图像的特征值保持一致；本发明将输入面部图像的特征点位置与生成的纹理图面部区域特征点的余弦距离作为身份特征损失函数：

其中m为批处理大小，n为训练样本的数量，

为输入面部图像的特征向量，

为经过网络模型生成的纹理图中的特征向量，c_yi是第y_i类的特征中心，λ是中心损失的权重；

本发明中基于单张人脸图像的全头部纹理生成网络模型的完整损失函数为公式(4)(5)(6)所表示的各模块损失函数的总和，具体表示如下：

L＝λ_GL_G+λ_DL_D+λ_idL_id (7)

其中，λ_G,λ_D,λ_id为平衡各模块对整体损失函数影响的权重值；

训练过程是对整个全头部纹理生成网络模型的完整损失函数进行最优值计算，网络结构基于Tnesorflow框架实现；

步骤4：网络结构的参数设置及训练数据；

网络训练过程所使用的人脸纹理数据集一部分来源于开源数据集中收集的可用UV纹理图，其中包括WildUV数据集，另一部分纹理数据使用3D扫描设备获得，最终获得不低于5000张的纹理图像样本；

初始输入为不受限的单张人脸图像，尺寸随机，网络结构的训练过程利用Tnesorflow实现，网络训练了200个epochs，批处理数(bathc size)设置为16，学习率(lr)设置为0.001，对网络训练的终止条件为达到200个epochs，满足终止条件后网络满足训练好的条件，损失函数达到最优，使用训练好的网络直接输出，即可生成全头部纹理图。

所述步骤1中，求解特征值与特征向量的步骤为：

1.1：从人脸样本的数据均值中计算

和

即形状和纹理向量的平均值；

1.2：对人脸样本数据进行中心化处理；

1.3：利用奇异值分解求协方差矩阵；

1.4：计算协方差矩阵的特征值，得到P_i和T_i，以及人脸形状α_i和纹理参数β_i。

所述步骤3中，各权重的最优化值设置为λ_G＝1,λ_D＝5×10^-2,λ_id＝10^-3，各权重值的选择可根据网络参数及最终的生成结果进行调整；首次设定各权重的初始测试值时，生成器的权重大于0.5，全局鉴别器和人脸特征点分类器的权重值小于0.1。

所述中心损失的权重λ设置为λ＝0.1。

本发明的有益效果在于利用已知数据的先验知识从有限输入中获取人脸约束特征，作为变分自编码器的条件属性在对抗生成网络中进行生成与反馈训练，最终得到与输入人脸一致的真实、完整的全头部纹理图。在符合硬件测试环境的设备上(内存64G，CPU4.0Hz，GPU NVIDIA 2080TI)进行测试可以发现，从CelebA-HQ数据集中选择的任意测试人脸图像，都可以生成与输入人脸保持一致的完整的全头部纹理图，尤其是在正面脸部区域，与输入图像可以保持97％以上的相似度，保持了人脸原有的主要细节。在原输入图中不可见区域(例如侧脸、头发及脖颈处)，纹理重建效果真实自然，且重建的全头部纹理图符合三维模型UV映射要求，可以直接用于三维人脸模型的UV贴图。本发明提出的全头部纹理生成方法获得的结果与几种目前较为成熟的方法(UVGAN和MVF-Net)进行对比，在相同的输入下生成的纹理图可从图2、3中进行显示对比。其中MVF-Net方法利用单张人脸图像仅能生成面部区域的纹理，无法推广到全头部模型，此外，此方法生成的纹理结果在阴影和自遮挡区域中会出现一些缺失点和纹理变形的情况；UVGAN方法产生成的结果与本发明最终生成的纹理图类型相似，均为全头部UV纹理图，从单张输入图像中推断出了侧脸及部分脖颈处纹理信息，但从图2、3中可以发现，UVGAN方法生成的纹理图会丢失头顶大部分头发区域的像素内容，而且由于UVGAN方法在预测过程中缺少面部纹理参数，导致了此方法生成的结果在表面反照率方面存在缺陷，获得的纹理图的皮肤颜色与原始输入不一致。本发明生成的全头部纹理图保持了身份和表情的准确性，并精确的推断出原始图像中不可见区域的纹理信息。与上述方法相比，我们的发明在全头部纹理图的生成区域和表面细节效果更好。

附图说明

图1是本发明的全头部纹理图生成网络结构摘要图。

图2是图像一在不同方法下由相同输入得到的纹理输出图对比效果图。

图3是图像二在不同方法下由相同输入得到的纹理输出图对比效果图。

具体实施方式

下面结合附图和实施例对本发明进一步说明。

面部纹理图一般是通过纹理映射的方式与三维人脸模型相关联，也就是将二维的纹理图像逐像素贴合到三维物体的表面，这个过程需要将二维图像根据三维模型表面来进行形状、表情和纹理系数的拟合，也被称为Model Fitting过程，这是一个病态求解问题，需要基于统计模型作为先验信息。但统计模型需要在严格可控的条件下获得，以结构光或者红外光扫描的形式来获取纹理图像中的低频和反照率信息。从不受限条件下的二维图像中获取人脸纹理模型是非常困难的，因为对于不受限人脸图像，光照情况和摄像机参数均未知，面部的反照率无法直接通过图像进行分析。目前，有些基于数据驱动的方法，从深度卷积神经网络中提取中间层特征，并通过迭代优化从2D图像中合成完整的3D面部模型的纹理图。有些方法以多个互补视角下的原始纹理图像为输入，通过像素嵌入的方法来生成信息较为完整的面部纹理图，这种像素嵌入方法可以保持生成的纹理图像与原始纹理图像具有相同的像素分辨率，但这些方法是在可控输入条件下完成的，无法应用于实际情况。一些最新的方法则采用可区分的渲染器来学***面来实现逐像素对齐，因此本次发明所生成的全头部纹理图为UV纹理图形式。

由于单张人脸图像中的面部姿态与大小已经固定，图像可视区域外的有效纹理信息不全，因此难以从单个面部图像来生成全头部的纹理。一些3D面部对齐方法建立了三维可变性模型(3DMM)和纹理贴图之间的联系，可以使用拟合的三维人脸模型对2D图像进行采样来生成面部UV纹理图。

根据这种三维模型与纹理图之间的参数约束关联，本发明设计了一个经过改进的生成对抗网络框架，从单张不受限的人脸图像生成对应个体的全头部UV纹理图。

利用单张人脸图像生成全头部纹理的过程，需要利用对应的3D人头部模型获取与输入人脸相关的形状、表情及纹理参数。由于头部是一个具有大共性小差异的三维立体形状，在头部的一些区域具有明显的共性，例如人脸面部的组成部分，五官的分布与各器官的大致位置等。本发明采用主成成分分析(PCA)定义3D全头部模型，利用统计学模型获取输入图像中的身份特征和纹理特征。人脸PCA模型对N个人脸样本进行压缩降维，提取出人脸变化最为明显的成分分量作为特征基，从而将人脸的形状、纹理变化限制在由特征基张成的子空间内。本发明使用人脸PCA模型获取人脸形状参数和纹理参数，具体的求解过程参考技术方案中的步骤一。

本发明对于输入的人脸图像无限制条件，而从实际中获取的输入人脸图像大概率会附带表情。为了将人脸可能附带的表情信息加入到网络的约束性输入特征中，同时又不影响形状参数和纹理参数的求解过程，本发明使用基于PCA的多线性模型压缩人脸样本，使其呈现面部几何形状的线性组合，从而基于身份和表情来提取特征向量。求解过程参考技术方案中的步骤二。

人脸PCA模型将用于求解输入图像的纹理参数，与统计学模型中的身份特征参数和表情特征参数一起作为变分自编码器的输入特征向量。人脸PCA模型的形状参数可以作为多线性模型中的人脸形状参考值，用于多线性模型的优化求解。纹理参数、身份特征参数和表情特征参数将被添加为变分自编码器的输入条件属性，这可以约束GAN网络的生成过程。

本发明的网络结构结合了变分自编码器及生成对抗网络的特性，将细粒度类别的标签转换为生成模型，可以在潜在属性向量上使用可选的绘制值恢复特定类别的纹理图，并使用添加过约束参数的随机噪声分布来填充缺失的头部纹理区域，并根据鉴别器的不同目标特征来优化生成纹理的真实性与一致性。本发明保留了与不受限输入人脸图像一致的面部特征标志，在其他部分(例如耳朵，侧脸，部分头发和脖子区域)，设计的网络模型会根据原始像素的属性生成真实自然的图像内容。

本发明的网络结构将细粒度类别的标签转换为生成模型，可以在潜在属性向量上使用可选的绘制值恢复特定类别的纹理图，并使用添加过约束参数的随机噪声分布来填充缺失的头部纹理区域，并根据鉴别器的不同目标特征来优化生成纹理的真实性与一致性。网络的训练过程可以保留输入人脸图像的面部特征标志，在其他部分(例如耳朵，侧脸，部分头发和脖子区域)，设计的网络模型会根据原始像素的属性生成真实且自然的图像内容。

一种基于单张人脸图像的全头部纹理网络结构，为经过改进的生成对抗网络框架，从单张不受限的人脸图像生成对应个体的全头部UV纹理图。所述基于单张人脸图像的全头部纹理网络结构包括一个变分自编码器(Variational Autoencoder)模块，一个生成器(Generator)模块和两个用于不同目标的鉴别器(Discriminator)模块，其中变分自编码器模块将输入图像映射到浅层矢量，生成器模块根据浅层矢量生成对应的人脸纹理图像，再将人脸纹理图像分别输入到鉴别器模块中进行鉴别，鉴别器模块包括全局鉴别器和人脸特征点分类器，全局鉴别器识别生成器模块所产生的纹理图的真实性；人脸特征点分类器检测生成纹理图与原始输入图像的局部人脸特征点，使纹理图与原始输入图像的面部特征保持一致；在实际中，GAN网络实现在当前分布未知的情况下直接采样数据，真实的纹理数据从网络的训练过程中近似得到。但GAN网络的训练过程是不可控的，从GAN生成的样本通常与真实图像有所不同，特别是对于像素复杂且特征耦合度高的UV纹理图像。因此，本发明利用变分自编码器的适用特性给生成对抗网络增加参数约束，在此过程中，变分自编码器服从隐藏层空间下的单位高斯分布。另一方面，由于输入噪声和损失函数均方误差(MSE)不准确，变分自编码器模块生成的输出图像会变得模糊，本发明利用生成对抗网络的无监督对抗训练来改善变分自编码器模块的约束效果，并创建更逼真的实例。本发明通过变分自编码器模块将输入的人脸图像投影到隐层矢量，然后使用生成器模块重构与隐层分布相匹配的输入图像特征的原始像素，隐层分布信息和输入图像之间的关系通过变分自编码器和生成对抗网络建立。

所述的变分自编码器是自编码器(Auto-encoder，AE)的一种改进模型，是一种无监督算法，主要用于特征提取和数据降维，即将输入信息经encoder模块处理后转换成隐层矢量；变分自编码器是在自编码器的基础上引入了变分的思想，即引入重参数构建变分边界，使自编码器通过对隐层特征的修改实现对数据生成过程的微调，将人脸图像作为变分自编码器模块的输入信息，经过卷积和池化过程之后获得输入图像降维后的隐层数据，并将人脸的身份、表情和纹理参数作为重参数加入到隐层矢量中，用于表示输入图像与约束参数的隐层分布。

一种基于单张人脸图像的全头部纹理网络结构的生成方法的步骤如下：

本发明所采用的技术方案主要包括人脸特征参数的求解、网络模型参数的求解及网络模型的训练。其中人脸特征参数利用PCA模型及多线性模型求解所需的纹理参数、身份特征参数和表情特征参数。为了使人脸PCA模型和多线性模型建立的更加准确，本发明使用FaceWareHouse、BU-3DFE以及200个额外的女性面部扫描模型作为三维人脸数据库，一共包括了650个不同身份和47种不同表情的模型样本。求解步骤如下：

步骤一：获取输入参数，输入参数包括PCA模型的纹理参数，身份特征参数和表情特征参数；

其中，

和

求解特征值与特征向量的步骤为：

1.1：从人脸样本的数据均值中计算

和

即形状和纹理向量的平均值；

1.2：对人脸样本数据进行中心化处理；

1.3：利用奇异值分解求协方差矩阵；

步骤2：基于PCA的多线性模型优化求解；

S^*＝Cr×_idω_id×_expω_exp (3)

其中，Cr是正交矩阵对应维度的三阶张量核，×_id×_exp分别表示身份和表情的模乘，ω_id为人脸样本的身份特征向量，ω_exp为人脸样本的表情特征向量；S^*表示任意的人脸形状。这表示任意一个人脸形状形状S^*，由压缩后的张量核Cr和身份、表情的模乘与特征向量进行多线性表示。根据步骤1中求得的S作为初始值，根据所收集的三维人脸数据库中的三维人脸模型张量核Cr，采用高斯-牛顿法求解当前人脸的身份特征向量与表情特征向量即ω_id与ω_exp，其中ω_id、ω_exp为未知参数，此多线性模型的优化过程即求该目标函数最小化的最优解：

其中

进行求解；

步骤3：网络模型中各模块的优化过程及训练参数设置；

将步骤1和步骤2中求解得到的纹理参数β和身份特征向量ω_id、表情特征参数ω_exp作为变分自编码器的条件属性，在经过变分自编码器的卷积层和池化层中对输入图像进行卷积和二次采样过程，将变分自编码器输出的潜层向量的维度设定为256。变分自编码器的末端级联两个连续层，将得到的身份、表情和纹理参数与二次采样的输入图像进行合并；变分自编码器和生成器模块之间采用完全卷积的级联形式结构，通过两个全连接层建立阶跃连接；在生成器模块上设置6个上采用的反卷积层和相应的滤波器结构，其中卷积层在本次设计中分别设置成256，128和64个通道数。

在基于单张人脸图像的全头部纹理生成网络结构中，鉴别器模块包括全局鉴别器和人脸特征点分类器。本发明基于已公开的Alexnet框架进行优化，将Alexnet框架的输入大小设置为256*256作为全局鉴别器模块，并在卷积层之后进行批次归一化，使用已公开的ArcFace作为面部特征点检测分类器的网络框架，通过全局鉴别器和人脸特征点分类器各自的损失函数进行网络结构的训练。其中全局鉴别器的真实性评估标准是，根据输入条件参数生成的全头部纹理是UV纹理图，像素分布连续且符合实际人脸生物学特征，同时，保证生成纹理图的面部和其他位置(如脖颈、耳朵及头发区域)的连接处像素是连续的，全局鉴别器的损失函数表示为：

其中，P_d(x)表示全头部UV纹理图的参数分布，P_d(y)为面部区域的UV纹理参数分布，P_(c)是人脸PCA纹理模型的参数分布。

人脸特征点分类器基于公开的人脸识别网络ArcFace进行设计，该网络经过预训练获取面部区域关键点，在角度空间最大化分类界线，用于检测生成的UV纹理中的面部中心区域是否与输入人脸图像的特征值保持一致。本发明将输入面部图像的特征点位置与生成的纹理图面部区域特征点的余弦距离作为身份特征损失函数：

其中m为批处理大小，n为训练样本的数量，

为输入面部图像的特征向量，

为经过网络模型生成的纹理图中的特征向量。c_yi是第y_i类的特征中心，λ是中心损失的权重，本发明实验测试中设置λ＝0.1，此数值经试验测试，对保持合成纹理图像的身份特性是最优的。

L＝λ_GL_G+λ_DL_D+λ_idL_id (7)

其中，λ_G,λ_D,λ_id为平衡各模块对整体损失函数影响的权重值，经过实验测试，各权重的最优化值设置为λ_G＝1,λ_D＝5×10^-2,λ_id＝10^-3，各权重值的选择可根据网络参数及最终的生成结果进行调整。首次设定各权重的初始测试值时，生成器的权重大于0.5，全局鉴别器和人脸特征点分类器的权重值小于0.1；此网络结构的训练过程即是对整个全头部纹理生成网络模型的完整损失函数进行最优值计算，网络结构基于Tnesorflow框架实现。

步骤4：网络结构的参数设置及训练数据。

网络训练过程所使用的人脸纹理数据集一部分来源于开源数据集中收集的可用UV纹理图，其中包括WildUV数据集，数据集包含近2000张具有不同身份个体的纹理图像和5639个独特的面部UV纹理图像。除此之前，另一部分纹理数据使用专业的3D扫描设备获得，包括400位不同身份的测试人员(其中男性250位，女性150位)，提供了2000种不同的面部纹理图像。此外，筛选出的较为完整的纹理图像进行了数据增广，最终达到10143个纹理图像样本，整体数据量可以满足本网络的训练需求(不低于5000张的纹理图像样本)。

初始输入为不受限的单张人脸图像，尺寸随机。在本发明中，实验测试从CelebA-HQ数据集中选择的随机人脸图像尺寸为512*512，使用的纹理图样本的标准大小为597*377。网络将输入的人脸图像的大小预处理为256*256，脸部区域划定为以鼻尖居中的128*128的范围。网络结构的训练过程利用Tnesorflow实现，网络训练了200个epochs，批处理数(bathc size)设置为16，学习率(lr)设置为0.001，对网络训练的终止条件为达到200个epochs，满足终止条件后网络即认为训练好了，损失函数达到了最优，后续再使用训练好的网络直接输出生成的全头部纹理图。

图1是本发明的全头部纹理图生成网络结构摘要图。输入图像经PCA模型及人脸数据库下的多线性模型优化获得人脸的纹理、身份和表情约束特征向量，与经过变分自编码器处理后的输入图像数据一起送入生成对抗网络的生成器模块，生成器根据图像属性特征生成对应的全头部纹理图。生成的纹理图会经过两个性质不同的鉴别器，其中全局鉴别器会对纹理图进行真假鉴别，鉴别结果会控制生成器生成的纹理图更真；人脸特征分类器是用来对生成纹理图中面部区域的人脸特征点与输入图像中的面部特征点做对比，检测结果会约束网络生成的纹理图在面部特征上与输入图像更加保持一致。

图2、图3是不同方法下由相同输入图像得到的纹理输出图对比。其中，第一行图像为随机从CelebA-HQ数据集中选取的单张人脸图像，图像在大小、角度、表情及光照等都没有限制。第二行为MVF-Net方法得到的人脸纹理图，第三行为UVGAN方法的得到的人脸纹理图，第四行为本发明方法得到的纹理图。

相较于其他方法，本发明生成的全头部纹理图更为完整，尤其是在原图不可见区域内，像素信息恢复自然连贯，在人脸纹理细节上更真实。

Claims

1.一种基于单张人脸图像的全头部纹理网络结构，包括一个变分自编码器模块，一个生成器模块和两个用于不同目标的鉴别器模块，其特征在于：

其中变分自编码器模块将输入图像映射到浅层矢量，生成器模块根据浅层矢量生成对应的人脸纹理图像，再将人脸纹理图像分别输入到鉴别器模块中进行鉴别，鉴别器模块包括全局鉴别器和人脸特征点分类器，全局鉴别器识别生成器模块所产生的纹理图的真实性；人脸特征点分类器检测生成纹理图与原始输入图像的局部人脸特征点，使纹理图与原始输入图像的面部特征保持一致；变分自编码器服从隐藏层空间下的单位高斯分布，通过变分自编码器模块将输入的人脸图像投影到隐层矢量，然后使用生成器模块重构与隐层分布相匹配的输入图像特征的原始像素，隐层分布信息和输入图像之间的关系通过变分自编码器和生成对抗网络建立；

所述的变分自编码器是自编码器的一种改进模型，将输入信息经encoder模块处理后转换成隐层矢量；引入重参数构建变分边界，使自编码器通过对隐层特征的修改实现对数据生成过程的微调，将人脸图像作为变分自编码器模块的输入信息，经过卷积和池化过程之后获得输入图像降维后的隐层数据，并将人脸的身份、表情和纹理参数作为重参数加入到隐层矢量中，用于表示输入图像与约束参数的隐层分布。

2.一种利用权利要求1所述基于单张人脸图像的全头部纹理网络结构的生成方法，其特征在于包括下述步骤：