CN112381927A

CN112381927A - 图像生成的方法、装置、设备以及存储介质

Info

Publication number: CN112381927A
Application number: CN202011301138.7A
Authority: CN
Inventors: 杨新航; 陈睿智
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-11-19
Filing date: 2020-11-19
Publication date: 2021-02-19

Abstract

本申请公开了图像生成的方法、装置、设备以及存储介质，涉及深度学习、计算机视觉、云计算等领域。具体实现方案为：根据接收到的图像中包含的目标人物，确定三维模型；根据目标人物的特征对三维模型进行调整，得到调整后的三维模型；将调整后的三维模型与图像中包含的目标人物进行融合，生成融合后的图像。一方面可以提高生成的图像与目标用户的相似度。另一方面，由于生成的图像并非是目标用户的原始面部图像，因此可以实现对于目标用户面部隐私的保护。

Description

图像生成的方法、装置、设备以及存储介质

技术领域

本申请涉及图像处理领域，尤其涉及深度学习、计算机视觉、云计算等领域。

背景技术

通过真人照片生成卡通头像已经越来越成为大众喜爱的玩法。常规技术包括通过用户上传图像，将上传图像中的人脸替换至卡通头像模板中。上述方案融合性较差。

后续发展到利用生成对抗网络将人脸进行卡通变形，得到卡通头像。但上述方案失真度较高，与用户的面部相似度较低。

发明内容

本申请提供了一种图像生成的方法、装置、设备以及存储介质。

根据本申请的一方面，提供了一种图像生成的方法，该方法可以包括以下步骤：

根据接收到的图像中包含的目标人物，确定三维模型；

根据目标人物的特征对三维模型进行调整，得到调整后的三维模型；

将调整后的三维模型与图像中包含的目标人物进行融合，生成融合后的图像。

根据本申请的另一方面，提供了一种图像生成的装置，该装置可以包括以下部件：

三维模型确定模块，用于根据接收到的图像中包含的目标人物，确定三维模型；

三维模型调整模块用于根据目标人物的特征对三维模型进行调整，得到调整后的三维模型；

图像融合模块，用于将调整后的三维模型与图像中包含的目标人物进行融合，生成融合后的图像。

第三方面，本申请实施例提供一种电子设备，包括：

至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，

存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行本申请任意一项实施例所提供的方法。

第四方面，本申请实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行本申请任意一项实施例所提供的方法。

根据本申请的技术一方面可以提高生成的图像与目标用户的相似度。另一方面，由于生成的图像并非是目标用户的原始面部图像，因此可以实现对于目标用户面部隐私的保护。

应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请图像生成的方法的流程图；

图2是根据本申请中的三维模型的示意图；

图3是根据本申请对三维模型进行调整的流程图；

图4是根据本申请中对三维模型的表情进行调整的示意图；

图5是根据本申请对三维模型进行调整的流程图；

图6是根据本申请对图像进行融合的流程图；

图7是根据本申请对图像进行融合的流程图；

图8是根据本申请对图像进行融合的示意图；

图9是根据本申请对图像进行融合的流程图；

图10是根据本申请图像生成的装置的示意图；

图11是用来实现本申请实施例的图像生成的方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本申请实施例提供一种图像生成的方法。如图1所示，该方法可以包括以下步骤：

S101：根据接收到的图像中包含的目标人物，确定三维模型；

S102：根据目标人物的特征对三维模型进行调整，得到调整后的三维模型；

S103：将调整后的三维模型与图像中包含的目标人物进行融合，生成融合后的图像。

本申请的上述方法的执行主体可以是如手机等智能终端，也可以是与智能终端远程通信的云端或服务器等。后续以执行主体为云端为例进行说明。

用户可以通过手机等智能终端拍摄包含目标人物的图像。在图像中包含多个人物的情况下，可以由用户指定其中的至少一个目标人物。

上述图像由智能终端上传至云端。结合图2所示，云端中可以预存有多个三维模型。上述三维模型可以按照年龄、性别、脸型等不同因素预先构建。

云端可以通过对图像中的目标人物进行分析，以确定与目标人物匹配程度最高的三维模型。分析可以根据目标人物的年龄、性别、脸型等不同因素进行。具体分析方式可以利用训练好的用于三维模型判断的神经网络模型实现。将包含目标人物的图像输入用于三维模型判断的神经网络模型，可以选择出与目标人物匹配程度最高的三维模型。

在选择出与目标人物匹配的三维模型后，还可以对三维模型进行调整，以使三维模型更接近于图像中的目标人物。

调整方式可以根据图像中目标人物的特征进行。其中，特征可以包括目标人物的脸型、五官、表情、肤色等。

例如，可以对三维模型的脸型进行横向、纵向或局部微调，以使三维模型的脸型与目标人物接近。

再例如，可以对三维模型的五官形状以及位置进行调整，例如眼睛的形状、眼睛在面部的位置，以及眼睛与鼻子、眉毛之间的相对位置等。

另外，还可以根据目标人物的表情、肤色等对三维模型进行对应的调整。

通过上述方式调整后的三维模型，已经可以与目标人物的外貌接近。将调整后的三维模型与图像中的目标人物进行融合，生成融合后的图像。例如，融合的方式可以包括将三维模型进行二维处理，进而替换图像中的目标人物。又例如，融合的方式还可以包括对目标人物进行掩膜(mask)处理，从而将二维处理后得到的图像与掩膜相结合，生成融合后的图像。

需要说明的是，对于用于三维模型判断的神经网络模型的训练，可以利用大量人脸样本以及对应的三维模型样本进行。例如，预先对不同年龄、性别、脸型等人脸样本进行分组以作为输入，以与上述年龄、性别、脸型对应的三维模型的标识(ID)作为输出，对模型进行训练。在用于三维模型判断的神经网络模型对测试样本的输出结果与真实结果的误差在允许范围内，表示三维模型判断的神经网络模型训练结束。

本申请的上述示例是以将目标人物的头部区域与三维模型进行融合为示例进行阐述的。实际并不限于此，例如，还可以对目标人物的全部区域进行图像生成。另外，还可以对融合后的图像中的用户五官或躯干等位置进行美颜处理或卡通化处理，从而可以增加融合图像的趣味性。

通过上述方案，一方面可以提高生成的图像与目标用户的相似度。另一方面，由于生成的图像并非是目标用户的原始面部图像，因此可以实现对于目标用户面部隐私的保护。

结合如3所示，在一种实施方式中，步骤S102中的根据目标人物的特征对三维模型进行调整，可以包括以下子步骤：

S1021：确定目标人物的脸型特征和表情特征中的至少一种特征；

S1022：根据脸型特征和/或表情特征，对三维模型进行调整。

目标人物的脸型特征和表情特征均可以采用参数形式体现。例如，可以采用脸型参数和表情参数体现。

对于脸型参数和表情参数的计算，可以分别利用脸型参数神经网络模型以及表情参数神经网络模型计算。

对于脸型参数神经网络模型以及表情参数神经网络模型，可以预先进行训练。以表情参数神经网络模型的训练为例进行说明，预先获取不同表情的图像样本，例如可以是微笑、大笑、惊恐、做鬼脸等。以微笑为例，将微笑表情的图像样本输入待训练的表情参数神经网络模型的输入层，输出层可以是微笑表情以及微笑表情的程度。同理，利用其它表情的图像样本对待训练的表情参数神经网络模型进行训练。

在表情参数神经网络模型对测试样本的输出结果与真实结果的误差在允许范围内，表示表情参数神经网络模型训练结束。

对于脸型参数神经网络模型的训练方式与表情参数神经网络模型的训练方式近似。例如，可以预先获取不同脸型的图像样本，示例性的，以脸型的形态分类，可以包括圆形脸型、椭圆形脸型、卵圆形脸型、倒卵圆形脸型、方形脸型、长方形脸型、梯形脸型、倒梯形脸型和菱形脸型等多类。利用脸型样本与对应的脸型分类，对脸型参数神经网络模型进行训练。

在利用脸型参数神经网络模型、表情参数神经网络模型得到目标人物的脸型特征和表情特征(即脸型参数和表情参数)的情况下。可以利用目标人物的脸型特征和表情特征对三维模型进行调整。

结合图4所示，以表情调整为例，图4中左侧的表情可以是利用“嘟嘴做鬼脸”的表情对三维模型进行调整的结果示意图。图4中中间的表情可以是利用“坏笑”的表情对三维模型进行调整的结果示意图。图4中右侧的表情可以是利用“吃惊”的表情对三维模型进行调整的结果示意图。

通过上述方案，以脸型特征和/或表情特征对三维模型进行粗粒度的调整，可以使得三维模型在外部轮廓和表情等方面与目标人物相贴合。

结合图5所示，在一种实施方式中，步骤S102中的根据目标人物的特征对三维模型进行调整，还可以包括以下子步骤：：

S1023：分别确定目标人物的特征点的位置，以及三维模型的特征点的位置；

S1024：根据目标人物的特征点的位置，对三维模型的特征点的位置进行调整，以使调整后的三维模型的特征点的位置与目标人物的特征点的位置之间的误差在允许的范围内。

特征点可以是目标人物的五官轮廓和脸型轮廓等，通过特征点的位置可以表示出目标人物五官的形状、五官之间的相对位置关系以及五官与脸型的相对位置关系等。

分别确定目标人物和三维模型的特征点的位置，根据目标人物的特征点的位置，对三维模型的特征点的位置进行调整。调整的结果以满足三维模型的特征点的位置与目标人物的特征点的位置之间的误差在允许的范围内。

上述步骤(步骤S1023和步骤S1024)可以在前述步骤S1022之后执行，也可以独立于步骤S1021和步骤S1022执行，即在不执行步骤S1021和步骤S1022的情况下，直接执行步骤S1023和步骤S1024。

在前述步骤S1022之后执行的情况下，由于在前述步骤中，已将三维模型的面部轮廓(脸型)参照目标人物进行初步调整。因此本步骤利用特征点的在脸部的位置的对三维模型的的五官进行调整调整。例如调整三维模型中五官的形状、五官在脸部的位置以及五官之间的相对位置关系，可以使得三维模型整体更接近目标人物。

结合图6所示，在一种实施方式中，步骤S103可以包括以下子步骤：

S1031：将调整后的三维模型进行二维处理，得到二维图像；

S1032：利用目标人物的特征点的位置，对所述二维图像中的特征点的位置进行调整；

S1033：利用调整后的二维图像覆盖图像中的目标人物，生成融合后的图像。

在得到调整后的三维模型后，为了使三维模型可以和图像中的目标人物匹配程度更高，可以将调整后的三维模型进行二维处理，从而得到三维模型所对应的二维图像。

进一步的，得到二维图像后，将原三维模型的特征点映射到二维图像上，得到二维图像的特征点。

根据图像中目标人物的特征点的位置，对所述二维图像的特征点的位置进行调整。调整的目的在于：可以将二维图像进行变形，使其脸边缘、鼻子下边缘、眉毛下边缘与图像中的目标人物的脸边缘、鼻子下边缘、眉毛下边缘完全对齐。对上述各边缘进行调整后，将二维图像的眼睛联动对齐到原图像中目标人物的眼睛位置，从而生成融合后的图像。

通过上述方案，由于对调整后的三维模型进行二维处理，得到二维图像。进而依照目标人物对二维图像进行调整，可以得到与图像中目标人物匹配程度更好的头部区域的图像。

结合图7所示，在一种实施方式中，步骤S103还可以包括以下子步骤：

S1034：获取图像中的目标人物的头部区域的掩膜；

S1035：将掩膜与二维图像中的目标人物的头部区域结合，生成融合后的图像。

获取图像中的目标人物的头部区域的掩膜的目的在于，可以区分出目标人物和背景。另外，掩膜还可以实现对于目标人物发饰和眼镜等信息的提取。

结合图8所示，图8中左侧为目标人物头部区域的掩膜。从图中可以看出，掩膜提取出了目标人物发型和眼镜，并且在图像中将目标人物从背景中区分出来。图8中中间位置的图像为前述步骤在对调整后的三维模型进行二维处理得到的二维图像。图8中右侧为将目标人物的头部区域的掩膜与二维图像中的目标人物的头部区域结合的效果图。

通过上述方案，利用掩膜区分出图像中的目标人物以及背景，从而可以实现对于二维图像中脸型的最后一次修正，以使二维图像中的脸型与目标人物的脸型的还原度更高。另外，利用掩膜可以得到目标人物的发型以及眼镜等，通过将上述信息与二维图像结合，可以使得融合后的图像与目标人物更为近似。

结合图9所示，在一种实施方式中，步骤S103还可以包括以下子步骤：

S1036：确定图像中的目标人物的头部区域的肤色特征；

S1037：利用肤色特征对二维图像中的头部区域的肤色进行调整。

由于光照等因素的影响，大多数情况下，在图像中目标人物头部区域的肤色会呈现出亮、暗不均的情况。基于此，可以对图像中的目标人物的头部区域的肤色进行分析，从而确定出肤色特征。进一步的，将确定出的肤色特征作用于二维图像中的头部区域，即利用肤色特征对二维图像中的头部区域的肤色进行调整，从而使得最终呈现出的图像与目标人物更为接近。

其中，本步骤中对于肤色特征的确定可以采用预先训练好的肤色特征神经网络模型实现。在对肤色特征神经网络模型进行训练时，可以预先选择不同肤色特征的图像样本，作为待训练的肤色特征神经网络模型的输入。将肤色结果作为待训练的肤色特征神经网络模型的输出，对其进行训练。

在肤色特征神经网络对测试样本的输出结果与真实结果的误差在允许范围内的情况下，表示肤色特征神经网络训练结束。

结合图10所示，在一种实施方式中，本申请还提供一种图像生成的装置，该装置可以包括以下部件：

三维模型确定模块1001，用于根据接收到的图像中包含的目标人物，确定三维模型；

三维模型调整模块1002，用于根据目标人物的特征对三维模型进行调整，得到调整后的三维模型；

图像融合模块1003，用于将调整后的三维模型与图像中包含的目标人物进行融合，生成融合后的图像。

在一种实施方式中，三维模型调整模块1002可以进一步包括：

特征确定子模块，用于确定目标人物的脸型特征和表情特征中的至少一种特征；

三维模型调整执行子模块，用于根据脸型特征和/或表情特征，对三维模型进行调整。

在一种实施方式中，三维模型调整模块1002还可以进一步包括：

特征点位置确定子模块，用于分别确定目标人物的特征点的位置，以及三维模型的特征点的位置；

三维模型调整执行子模块，用于根据目标人物的特征点的位置，对三维模型的特征点的位置进行调整，以使调整后的三维模型的特征点的位置与目标人物的特征点的位置之间的误差在允许的范围内。

在一种实施方式中，图像融合模块1003可以进一步包括：

二维处理子模块，用于将调整后的三维模型进行二维处理，得到二维图像；

二维图像调整子模块，用于利用目标人物的特征点的位置，对二维图像中的特征点的位置进行调整；

图像融合执行子模块，用于利用调整后的二维图像覆盖图像中的目标人物，生成融合后的图像。

在一种实施方式中，图像融合执行子模块可以进一步包括：

掩膜获取单元，用于获取图像中的目标人物的头部区域的掩膜；

图像融合执行单元，用于将掩膜与二维图像中的目标人物的头部区域结合，生成融合后的图像。

在一种实施方式中，图像融合执行子模块还可以进一步包括：

肤色特征确定单元，用于确定图像中的目标人物的头部区域的肤色特征；

肤色调整单元，用于利用肤色特征对二维图像中的头部区域的肤色进行调整。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图11所示，是根据本申请实施例的图像生成的方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图11所示，该电子设备包括：一个或多个处理器1110、存储器1120，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作(例如，作为服务器阵列、一组刀片式服务器、或者多处理器***)。图11中以一个处理器1110为例。

存储器1120即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的图像生成的方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的图像生成的方法。

存储器1120作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的图像生成的方法对应的程序指令/模块(例如，附图10所示的三维模型确定模块1001、三维模型调整模块1002和图像融合模块1003)。处理器1110通过运行存储在存储器1120中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的图像生成的方法。

存储器1120可以包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需要的应用程序；存储数据区可存储根据图像生成的方法的电子设备的使用所创建的数据等。此外，存储器1120可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器1120可选包括相对于处理器1110远程设置的存储器，这些远程存储器可以通过网络连接至图像生成的方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

图像生成的方法的电子设备还可以包括：输入装置1130和输出装置1140。处理器1110、存储器1120、输入装置1130和输出装置1140可以通过总线或者其他方式连接，图11中以通过总线连接为例。

输入装置1130可接收输入的数字或字符信息，以及产生与图像生成的方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1140可以包括显示设备、辅助照明装置(例如，LED)和触觉反馈装置(例如，振动电机)等。该显示设备可以包括但不限于，液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。

这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如，磁盘、光盘、存储器、可编程逻辑装置(PLD))，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的***和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。

可以将此处描述的***和技术实施在包括后台部件的计算***(例如，作为数据服务器)、或者包括中间件部件的计算***(例如，应用服务器)、或者包括前端部件的计算***(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将***的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决传统物理主机与虚拟专用服务器(VPS)服务中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式***的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种图像生成的方法，包括：

根据接收到的图像中包含的目标人物，确定三维模型；

根据所述目标人物的特征对所述三维模型进行调整，得到调整后的三维模型；

将所述调整后的三维模型与所述图像中包含的所述目标人物进行融合，生成融合后的图像。

2.根据权利要求1所述的方法，其中，所述根据所述目标人物的特征对所述三维模型进行调整，包括：

确定所述目标人物的脸型特征和表情特征中的至少一种特征；

根据所述脸型特征和/或所述表情特征，对所述三维模型进行调整。

3.根据权利要求1或2所述的方法，其中，所述根据所述目标人物的特征对所述三维模型进行调整，包括：

分别确定所述目标人物的特征点的位置，以及所述三维模型的特征点的位置；

根据所述目标人物的特征点的位置，对所述三维模型的特征点的位置进行调整，以使调整后的三维模型的特征点的位置与所述目标人物的特征点的位置之间的误差在允许的范围内。

4.根据权利要求1所述的方法，其中，将所述调整后的三维模型与所述图像中包含的所述目标人物进行融合，包括：

将所述调整后的三维模型进行二维处理，得到二维图像；

利用所述目标人物的特征点的位置，对所述二维图像中的特征点的位置进行调整；

利用调整后的二维图像覆盖所述图像中的所述目标人物，生成融合后的图像。

5.根据权利要求4所述的方法，其中，所述利用调整后的二维图像覆盖所述图像中的所述目标人物，生成融合后的图像，包括：

获取所述图像中的所述目标人物的头部区域的掩膜；

将所述掩膜与所述二维图像中的所述目标人物的头部区域结合，生成融合后的图像。

6.根据权利要求4或5所述的方法，其中，将所述调整后的三维模型与所述图像中包含的所述目标人物进行融合，还包括：

确定所述图像中的所述目标人物的头部区域的肤色特征；

利用所述肤色特征对所述二维图像中的头部区域的肤色进行调整。

7.一种图像生成的装置，包括：

三维模型调整模块，用于根据所述目标人物的特征对所述三维模型进行调整，得到调整后的三维模型；

图像融合模块，用于将所述调整后的三维模型与所述图像中包含的所述目标人物进行融合，生成融合后的图像。

8.根据权利要求7所述的装置，其中，所述三维模型调整模块，包括：

特征确定子模块，用于确定所述目标人物的脸型特征和表情特征中的至少一种特征；

三维模型调整执行子模块，用于根据所述脸型特征和/或所述表情特征，对所述三维模型进行调整。

9.根据权利要求7或8所述的装置，其中，所述三维模型调整模块，包括：

特征点位置确定子模块，用于分别确定所述目标人物的特征点的位置，以及所述三维模型的特征点的位置；

三维模型调整执行子模块，用于根据所述目标人物的特征点的位置，对所述三维模型的特征点的位置进行调整，以使所述调整后的三维模型的特征点的位置与所述目标人物的特征点的位置之间的误差在允许的范围内。

10.根据权利要求7所述的装置，其中，所述图像融合模块，包括：

二维处理子模块，用于将所述调整后的三维模型进行二维处理，得到二维图像；

二维图像调整子模块，用于利用所述目标人物的特征点的位置，对所述二维图像中的特征点的位置进行调整；

图像融合执行子模块，用于利用调整后的二维图像覆盖所述图像中的所述目标人物，生成融合后的图像。

11.根据权利要求10所述的装置，其中，所述图像融合执行子模块，包括：

掩膜获取单元，用于获取所述图像中的所述目标人物的头部区域的掩膜；

图像融合执行单元，用于将所述掩膜与所述二维图像中的所述目标人物的头部区域结合，生成融合后的图像。

12.根据权利要求10或11所述的装置，其中，所述图像融合执行子模块，还包括：

肤色特征确定单元，用于确定所述图像中的所述目标人物的头部区域的肤色特征；

肤色调整单元，用于利用所述肤色特征对所述二维图像中的头部区域的肤色进行调整。

13.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至6中任一项所述的方法。

14.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1至6中任一项所述的方法。