CN114092712A

CN114092712A - 图像生成方法、装置、可读介质和电子设备

Info

Publication number: CN114092712A
Application number: CN202111433242.6A
Authority: CN
Inventors: 高永强; 杨司琪; 郑燊
Original assignee: Beijing ByteDance Network Technology Co Ltd
Current assignee: Beijing ByteDance Network Technology Co Ltd
Priority date: 2021-11-29
Filing date: 2021-11-29
Publication date: 2022-02-25
Anticipated expiration: 2041-11-29

Abstract

本公开涉及一种图像生成方法、装置、可读介质和电子设备，涉及图像处理技术领域，该方法包括：响应于用户请求，获取目标对象的原始图像，对原始图像进行特征提取和对象分割，以得到提取结果和分割结果，根据分割结果，通过预先训练的形状指导模型，确定用于表征目标对象形状的形状指导信息，根据提取结果和形状指导信息，通过预先训练的图像生成模型，生成与目标对象对应的、符合指定类型的目标图像，图像生成模型根据多个符合指定类型的训练图像训练得到，形状指导模型根据多个符合指定类型的形状样本图像训练得到。本公开通过图像特征和分割两个维度来控制图像的生成，能够使生成的目标图像与原始图像同时做到形似和神似。

Description

图像生成方法、装置、可读介质和电子设备

技术领域

本公开涉及图像处理技术领域，具体地，涉及一种图像生成方法、装置、可读介质和电子设备。

背景技术

随着电子信息技术的不断发展，应用市场上出现了各种各样的应用程序(英文：Application，缩写：APP)，以满足用户多样化的需求。针对游戏应用程序，尤其是MMORPG(英文：Multiplayer Online Role-Playing Game，中文：大型多人在线角色扮演游戏)，为了提高玩家的沉浸感和互动性，通常允许玩家根据自己的喜好而不是使用默认模板来编辑游戏中角色的形象。然而由于玩家的操作熟练程度高低不一，往往很难创建出满足需求的形象。因此，为了便于玩家操作，可以让玩家上传满足需求的图像(例如玩家自己的照片)，并根据该图像来生成对应的形象。

发明内容

提供该发明内容部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。

第一方面，本公开提供一种图像生成方法，所述方法包括：

响应于用户请求，获取目标对象的原始图像；

对所述原始图像进行特征提取和对象分割，以得到提取结果和分割结果；

根据所述分割结果，通过预先训练的形状指导模型，确定用于表征所述目标对象形状的形状指导信息；

根据所述提取结果和所述形状指导信息，通过预先训练的图像生成模型，生成与所述目标对象对应的、符合指定类型的目标图像，所述图像生成模型根据多个符合所述指定类型的训练图像训练得到，所述形状指导模型根据多个符合所述指定类型的形状样本图像训练得到。

第二方面，本公开提供一种图像生成方法，所述方法包括：

显示图像生成界面；

接收用户输入的原始图像；

响应于所述用户的触发，在至少一个候选特征类型中确定待生成目标图像的目标特征类型；

接收所述目标图像，并在所述图像生成界面展示所述目标图像；其中，所述目标图像基于所述原始图像、与所述目标特征类型对应的形状指导模型以及图像生成模型生成；所述图像生成模型根据多个符合所述目标特征类型的训练图像训练得到，所述形状指导模型根据多个符合所述指定类型的形状样本图像训练得到，所述形状指导模型用于确定表征所述目标对象形状的形状指导信息。

第三方面，本公开提供一种图像生成方法装置，所述装置包括：

获取模块，用于响应于用户请求，获取目标对象的原始图像；

处理模块，用于对所述原始图像进行特征提取和对象分割，以得到提取结果和分割结果；

形状指导模块，用于根据所述分割结果，通过预先训练的形状指导模型，确定用于表征所述目标对象形状的形状指导信息；

生成模块，用于根据所述提取结果和所述形状指导信息，通过预先训练的图像生成模型，生成与所述目标对象对应的、符合指定类型的目标图像，所述图像生成模型根据多个符合所述指定类型的训练图像训练得到，所述形状指导模型根据多个符合所述指定类型的形状样本图像训练得到。

第四方面，本公开提供一种图像生成方法装置，所述装置包括：

显示模块，用于显示图像生成界面；

接收模块，用于接收用户输入的原始图像；

确定模块，用于响应于所述用户的触发，在至少一个候选特征类型中确定待生成目标图像的目标特征类型；

生成模块，用于接收所述目标图像，并在所述图像生成界面展示所述目标图像；其中，所述目标图像基于所述原始图像、与所述目标特征类型对应的形状指导模型以及图像生成模型生成；所述图像生成模型根据多个符合所述目标特征类型的训练图像训练得到，所述形状指导模型根据多个符合所述指定类型的形状样本图像训练得到，所述形状指导模型用于确定表征所述目标对象形状的形状指导信息。

第五方面，本公开提供一种计算机可读介质，其上存储有计算机程序，该程序被处理装置执行时实现本公开第一方面或第二方面所述方法的步骤。

第六方面，本公开提供一种电子设备，包括：

存储装置，其上存储有计算机程序；

处理装置，用于执行所述存储装置中的所述计算机程序，以实现本公开第一方面或第二方面所述方法的步骤。

通过上述技术方案，本公开作为对用户请求的响应，首先获取目标对象的原始图像。之后对原始图像进行特征提取得到提取结果，进行对象分割得到分割结果。再利用预先训练的形状指导模型根据分割结果，确定用于表征目标对象形状的形状指导信息。最后，根据提取结果和形状指导信息，通过预先训练的图像生成模型，生成与目标对象对应的、符合指定类型的目标图像。本公开通过图像特征和分割两个维度来控制图像的生成，能够使生成的目标图像与原始图像同时做到形似和神似，提升了目标图像的表现力。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

结合附图并参考以下具体实施方式，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中，相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的，原件和元素不一定按照比例绘制。在附图中：

图1是根据一示例性实施例示出的一种图像生成方法的流程图；

图2是根据一示例性实施例示出的另一种图像生成方法的流程图；

图3是根据一示例性实施例示出的图像生成模型与形状指导模型的示意图；

图4是根据一示例性实施例示出的一种训练生成器的流程图；

图5是根据一示例性实施例示出的一种训练形状指导模型的流程图；

图6是根据一示例性实施例示出的一种训练图像生成模型的流程图；

图7是根据一示例性实施例示出的另一种训练图像生成模型的流程图；

图8是根据一示例性实施例示出的一种图像生成方法的流程图；

图9是根据一示例性实施例示出的另一种图像生成方法的流程图；

图10是根据一示例性实施例示出的一种图像生成装置的框图；

图11是根据一示例性实施例示出的另一种图像生成装置的框图；

图12是根据一示例性实施例示出的另一种图像生成装置的框图；

图13是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。

图1是根据一示例性实施例示出的一种图像生成方法的流程图，如图1所示，该方法包括：

步骤101，响应于用户请求，获取目标对象的原始图像。

举例来说，首先在接收到用户发起的用户请求的情况下，可以获取用户(例如：玩家)上传的目标对象的原始图像，原始图像中包括了目标对象。目标对象可以是用户自己，也可以是用户指定的某个人物(例如：历史人物、明星等)，还可以时用户指定的某个动物或者物品。原始图像为2D图像，例如可以是目标对象在真实场景中拍摄的照片，也可以是目标对象的画像，本公开对此不作具体限定。在得到原始图像之后，可以先进行特征点对齐的处理，以确定原始图像中包括的特征点。以目标对象为人脸来举例，那么可以对原始图像先进行人脸特征点对齐(英文：Face Alignment)的处理，以确定原始图像中包括的特征点，例如：左眼、右眼、鼻子等。可以通过ASM(英文：Active Shape Model)、AAM(英文：ActiveAppearance Model)、CLM(英文：Constrained Local Model)等方式进行人脸特征点对齐，本公开对此不作具体限定。

步骤102，对原始图像进行特征提取和对象分割，以得到提取结果和分割结果。

示例的，可以分别对经过对特征点对齐后的原始图像进行特征提取和对象分割，以得到提取结果和分割结果。具体的，可以将原始图像输入一个预先训练的特征提取网络，以将原始图像转换为一个指定维数的，能够表征原始图像的向量，该向量即为提取结果。可以将特征提取网络理解为一个高维映射表，能够提取出表征原始图像的向量。例如，原始图像为一张512*512的照片，提取结果对应的向量，可以为一个256维的向量。同时，还可以将原始图像输入一个预先训练的分割网络，以按照多个通道，对原始图像进行分割，以得到原始图像对应在多个通道上的掩模图像，即分割结果。每个掩膜图像中为1的像素点，属于该掩膜图像对应的通道，为0的像素点，不属于该掩膜图像对应的通道，也就是说，分割结果能够表征原始图像中每个像素点属于哪个通道。例如，原始图像为一张512*512的照片，分割网络能够按照19个通道对原始人像进行分割，19个通道可以包括：背景、皮肤、鼻子、左眼、右眼、左眉毛、右眉毛、左耳朵等，得到的分割结果为19张512*512的掩膜图像。其中，背景对应的掩膜图像中为1的像素点，表示原始图像中该像素点对应的位置属于背景，为0的像素点，表示原始图像中该像素点对应的位置不属于背景。再比如，左眉毛对应的掩膜图像中为1的像素点，表示原始图像中该像素点对应的位置属于左眉毛，为0的像素点，表示原始图像中该像素点对应的位置不属于左眉毛。由此可以看出，分割结果能够反映出原始图像中目标对象各个部位在图像中所处的位置。

步骤103，根据分割结果，通过预先训练的形状指导模型，确定用于表征目标对象形状的形状指导信息。

步骤104，根据提取结果和形状指导信息，通过预先训练的图像生成模型，生成与目标对象对应的、符合指定类型的目标图像，图像生成模型为根据多个符合指定类型的训练图像训练得到的，形状指导模型根据多个符合指定类型的形状样本图像训练得到。

示例的，可以将分割结果输入预先训练的形状指导模型，形状指导模型能够输出形状指导信息。分割结果为原始图像对应在多个通道上的掩模图像，相应的，形状指导模型能够根据多个掩模图像确定形状指导信息，形状指导信息例如可以包括分割模型参数。由于分割结果能够表征原始图像中每个像素点属于哪个通道，因此，形状指导信息能够从形状的维度描述原始图像中的目标对象。其中，形状指导模型的结构可以为RNN(英文：Recurrent Neural Network，中文：循环神经网络)、CNN(英文：Convolutional NeuralNetworks，中文：卷积神经网络)、LSTM(英文：Long Short-Term Memory，中文：长短期记忆网络)等神经网络，例如可以包括输入层、多个卷积层和一个输出层，本公开对此不作具体限定。

由于提取结果能够表征原始图像中的特征，能够表征原始图像。因此，可以将提取结果和形状指导信息结合起来，能够从两个维度描述目标对象，从而利用预先根据多个符合指定类型的样本图像训练得到的图像生成模型，生成符合指定类型的，目标对象对应的目标图像。目标图像中同样包括了目标对象，且图像的类型符合指定类型。例如，原始图像为目标对象在真实场景中拍摄的照片，指定风格为动漫风格，那么目标图像可以为目标对象的动漫形象(也可以理解为avatar形象)。

具体的，可以将提取结果和形状指导信息输入图像生成模型，以得到图像生成模型输出的目标图像。具体的，可以将提取结果，输入到对应的转换器，以得到提取结果对应的提取模型参数，然后将提取模型参数和形状指导模型中包括的分割模型参数进行拼接，得到一个组合模型参数，由图像生成模型利用组合模型参数生成目标图像。其中，图像生成模型例如可以是GAN(英文：Generative Adversarial Network，中文：生成式对抗网络)中的生成器(即Generator)，还可以是其他结构的生成模型，本公开对此不作具体限定。提取结果能够表征原始图像中的特征，使得图像生成模型能够学习到原始图像中目标对象的神态，形状指导信息能够反映出原始图像中目标对象各个部位在图像中所处的位置，使得图像生成模型能够学习到原始图像中各个部位的比例、位置等形状。因此，相比于现有技术中，输入模型参数，在一个基本模型的基础上进行调整的方式，本公开能够使生成的目标图像与原始图像同时做到形似和神似，有效提升目标图像的表现力。

综上所述，本公开作为对用户请求的响应，首先获取目标对象的原始图像。之后对原始图像进行特征提取得到提取结果，进行对象分割得到分割结果。再利用预先训练的形状指导模型根据分割结果，确定用于表征目标对象形状的形状指导信息。最后，根据提取结果和形状指导信息，通过预先训练的图像生成模型，生成与目标对象对应的、符合指定类型的目标图像。本公开通过图像特征和分割两个维度来控制图像的生成，能够使生成的目标图像与原始图像同时做到形似和神似，提升了目标图像的表现力。

图2是根据一示例性实施例示出的另一种图像生成方法的流程图，如图2所示，步骤103的实现方式为：

将分割结果输入形状指导模型，以得到形状指导模型输出的形状指导信息，形状指导信息为分割模型参数，分割结果为原始图像对应在多个通道上的掩模图像。

图像生成模型包括：转换器、合成器和生成器。

步骤104的实现方式可以包括：

步骤1041，将提取结果输入转换器，以得到转换器输出的提取模型参数，提取结果为用于表征原始图像的向量。

步骤1042，将提取模型参数和分割模型参数输入合成器，以得到合成器输出的综合模型参数。

步骤1043，将综合模型参数输入生成器，以得到生成器输出的目标图像。

下面以图3所示的图像生成模型以及形状指导模型来进行举例说明，图像生成模型可以包括：转换器、合成器和生成器。转换器和形状指导模型的输出端，均输入合成器，合成器的输出端与生成器的输入端相连，生成器的输出端作为图像生成模型的输出端。具体的，将提取结果输入转换器，转换器(可以表示为Translator)输出的即为提取模型参数。提取结果为能够表征原始图像的向量，转换器可以理解为一个编码器，能够对该向量进行编码，得到提取模型参数。同时，将对分割结果输入形状指导模型，形状指导模型输出的即为分割模型参数。分割结果为原始图像对应在多个通道上的掩模图像，形状指导模型能够根据多个掩模图像确定分割模型参数。

在得到提取模型参数和分割模型参数之后，可以将提取模型参数和分割模型参数输入合成器，以得到合成器输出的综合模型参数。合成器能够将提取模型参数和分割模型参数，整合为综合模型参数，其中，提取模型参数、分割模型参数和综合模型参数的维度均相同。在一种实现方式中，合成器可以用于对提取模型参数和分割模型参数进行加权求和，得到综合模型参数。在另一种实现方式中，合成器可以是一个MLP(英文：Muti－LayerPerception，中文：多层感知器)，能够将提取模型参数和分割模型参数映射为综合模型参数。最后，将综合模型参数输入生成器，生成器的输出即为目标图像。其中，生成器的结构可以是GAN中的生成器。

需要说明的是，本公开所提及的模型参数(包括：提取模型参数、分割模型参数和综合模型参数)，可以理解为能够从几何、图像视觉方面表征目标对象各个部位的参数。以目标对象为人脸来举例，那么模型参数即为捏脸参数，例如可以包括：人脸脸型、鼻型、嘴型、眼型、眉型、五官分布、胡须位置等。目标对象也可以为猫，那么模型参数可以为包括：猫的脸型、鼻型、嘴型、眼型、胡须位置、花纹、四肢比例等。再比如，目标对象还可以为车辆，那么模型参数可以包括：车辆的挡风玻璃形状、引擎盖形状、前车灯形状、后车灯形状、车轮分布等。

由于提取模型参数是根据原始图像中的特征(即提取结果)确定的，分割模型参数是根据原始图像中目标对象各个部位在图像中所处的位置(即分割结果)确定的，因此，综合模型参数既能够表征原始图像中目标对象的神态，又能够表征原始图像中目标对象各个部位的比例、位置等形状。因此，图像生成模型能够使目标图像与原始图像同时做到形似和神似，有效提升目标图像的表现力。

图4是根据一示例性实施例示出的一种训练生成器的流程图，如图4所示，生成器是通过如下方式训练得到的：

步骤A，获取游戏引擎按照预设规则生成符合指定类型的多个生成样本图像，并确定游戏引擎生成对应的生成样本图像时，使用的真实模型参数。

步骤B，将每个生成样本图像对应的真实模型参数作为生成器的输入，将该生成样本图像作为生成器的输出，以训练生成器。

举例来说，图像生成模型中的生成器可以预先训练得到。对生成器进行训练，首先需要获取用于训练生成器的样本输入集和对应的样本输出集。样本输入集中包括大量的样本输入，样本输出集中包括与每个样本输入对应的样本输出。具体的，可以选取一个游戏引擎，该游戏引擎中的游戏形象符合指定类型，然后利用游戏引擎按照预设规则生成符合指定类型的多个生成样本图像，同时记录游戏引擎在生成每个生成样本图像时，使用的真实模型参数。其中，预设规则可以是游戏引擎随机生成生成样本图像，也可以为游戏引擎设置一定的约束(例如：五官比例的阈值、两个眼睛的间距的范围等)后，随机生成多个生成样本图像。这样，可以将多个生成样本图像对应的多个真实模型参数作为样本输入集，多个生成样本图像作为样本输出集。然后，将样本输入集作为生成器的输入，样本输出集作为生成器的输出，以训练生成器。例如，可以根据生成器的输出和样本输出集的差(或者均方差)，作为生成器的损失函数，以降低损失函数为目标，利用反向传播算法来修正生成器中的神经元的参数，神经元的参数例如可以是神经元的权重(英文：Weight)和偏置量(英文：Bias)。重复上述步骤，直至损失函数满足预设条件，例如损失函数小于预设的损失阈值。

图5是根据一示例性实施例示出的一种训练形状指导模型的流程图，如图5所示，形状指导模型是通过如下方式训练得到的：

步骤C，获取游戏引擎按照预设规则生成的，符合指定类型的多个形状样本图像，并确定游戏引擎生成对应的形状样本图像时，使用的真实模型参数。

步骤D，根据每个形状样本图像进行对象分割，以得到该形状样本图像对应的样本分割结果。

步骤E，将每个形状样本图像对应的样本分割结果作为形状指导模型的输入，将该形状样本图像对应的真实模型参数作为形状指导模型的输出，以训练形状指导模型。

示例的，形状指导模型同样可以预先训练得到。对形状指导模型进行训练，首先需要获取用于训练形状指导模型的样本输入集和对应的样本输出集。样本输入集中包括大量的样本输入，样本输出集中包括与每个样本输入对应的样本输出。具体的，可以选取一个游戏引擎，该游戏引擎中的游戏形象符合指定类型，然后利用游戏引擎按照预设规则生成符合指定类型的多个形状样本图像，同时记录游戏引擎在生成每个形状样本图像时，使用的真实模型参数。其中，预设规则可以是游戏引擎随机生成形状样本图像，也可以为游戏引擎设置一定的约束(例如：五官比例的阈值、两个眼睛的间距的范围等)后，随机生成形状样本图像。

之后，可以对每个形状样本图像进行对象分割，以得到该形状样本图像对应的样本分割结果。对形状样本图像进行对象分割的方式，与对原始图像进行对象分割的方式相同，此处不再赘述。

这样，可以将多个形状样本图像对应的多个样本分割结果作为样本输入集，多个形状样本图像对应的多个真实模型参数作为样本输出集。然后，将样本输入集作为形状指导模型的输入，样本输出集作为形状指导模型的输出，以训练形状指导模型。例如，可以根据形状指导模型的输出和样本输出集的差(或者均方差)，作为形状指导模型的损失函数，以降低损失函数为目标，利用反向传播算法来修正形状指导模型中的神经元的参数，神经元的参数例如可以是神经元的权重和偏置量。重复上述步骤，直至损失函数满足预设条件，例如损失函数小于预设的损失阈值。

图6是根据一示例性实施例示出的一种训练图像生成模型的流程图，如图6所示，图像生成模型是通过如下方式训练得到的：

步骤F，将训练提取结果输入转换器，以得到转换器输出的提取训练模型参数。训练提取结果为根据符合指定类型的训练图像进行特征提取得到的。

步骤G，将提取训练模型参数和分割训练模型参数输入合成器，以得到合成器输出的综合训练模型参数。其中，分割训练模型参数为根据训练分割结果，利用形状指导模型确定的，训练分割结果为根据训练图像进行对象分割得到的。

步骤H，将综合训练模型参数输入生成器，以得到生成器输出的目标训练图像。

步骤I，将自监督提取结果输入转换器，以得到转换器输出的提取自监督模型参数。自监督提取结果为根据目标训练图像进行特征提取得到的。

步骤J，将提取自监督模型参数和分割自监督模型参数输入合成器，以得到合成器输出的综合自监督模型参数。其中，分割自监督模型参数为根据自监督分割结果，利用形状指导模型确定的，自监督分割结果为根据目标训练图像进行对象分割得到的。

步骤K，根据训练提取结果与自监督提取结果、训练分割结果与自监督分割结果、综合训练模型参数与综合自监督模型参数，训练图像生成模型。

举例来说，在预先训练好生成器和形状指导模型之后，可以对图像生成模型中的合成器和转换器进行联合的自监督训练。首先可以获取训练图像，训练图像包括了训练对象。训练对象可以是目标对象，也可以不是目标对象。并且训练图像的类型是未知的(即训练图像不需要预先进行标注)，也就是说，训练图像的类型是任意的，可以是指定类型，也可以不是指定类型。然后，对训练图像分别进行特征提取和对象分割，以得到训练提取结果和训练分割结果。对训练图像进行特征提取的方式，与对原始图像进行特征提取的方式相同，对训练图像进行对象分割的方式，与对原始图像进行对象分割的方式相同，此处不再赘述。

将训练提取结果输入转换器，并将训练分割结果输入形状指导模型，以得到转换器输出的提取训练模型参数、形状指导模型输出的分割训练模型参数。其中，提取训练模型参数能够表征训练图像中训练对象的神态，分割训练模型参数能够表征训练图像中训练对象各个部位的比例、位置等形状。之后，将提取训练模型参数和分割训练模型参数输入合成器，以得到合成器输出的综合训练模型参数。再将综合训练模型参数输入生成器，以得到生成器输出的目标训练图像，其中，目标训练图像中包括了训练对象，且符合指定类型。

在得到目标训练图像之后，可以再将目标训练图像作为图像生成模型的输入，并根据图像生成模型的输出来训练图像生成模型。具体的，可以先对目标训练图像分别进行特征提取和对象分割，以得到自监督提取结果和自监督分割结果。之后，将自监督提取结果输入转换器，并将自监督分割结果输入形状指导模型，以得到转换器输出的提取自监督模型参数、形状指导模型输出的分割自监督模型参数。再将提取自监督模型参数和分割自监督模型参数输入合成器，以得到合成器输出的综合自监督模型参数。

最后，可以利用训练提取结果与自监督提取结果、训练分割结果与自监督分割结果、综合训练模型参数与综合自监督模型参数，确定图像生成模型的损失函数，以降低损失函数为目标，利用反向传播算法来修正图像生成模型中的合成器和转换器的神经元的参数，神经元的参数例如可以是神经元的权重和偏置量。重复上述步骤，直至损失函数满足预设条件，例如损失函数小于预设的损失阈值。

图7是根据一示例性实施例示出的另一种训练图像生成模型的流程图，如图7所示，步骤K的实现方式可以包括：

步骤K1，根据训练提取结果与自监督提取结果，确定提取损失。

步骤K2，根据训练分割结果与自监督分割结果，确定分割损失。

步骤K3，根据综合训练模型参数与综合自监督模型参数，确定综合损失。

步骤K4，根据提取损失、分割损失、综合损失确定总损失。

步骤K5，以降低总损失为目标，利用反向传播算法联合训练转换器和合成器。

以下对上述图像生成模型的损失函数进行具体说明，损失函数为总损失，包括三部分：提取损失、分割损失、综合损失。其中，提取损失是根据训练提取结果与自监督提取结果确定的，例如可以根据公式一确定提取损失：

其中，L₁表示提取损失，e₁表示训练提取结果，e₂表示自监督提取结果。

分割损失是根据训练分割结果与自监督分割结果确定的，例如可以根据公式二确定分割损失：

L₂＝|F_seg(I)-F_seg(I')| 公式二

其中，L₂表示分割损失，I表示训练图像，I'表示目标训练图像，F_seg表示对象分割的处理，即F_seg(I)表示训练分割结果，F_seg(I')表示自监督分割结果。

综合损失是根据综合训练模型参数与综合自监督模型参数确定的，例如可以根据公式三确定综合损失：

L₃＝||x-MLP(T(F_seg(I'))+S(F_recg(I')))|| 公式三

其中，L₃表示综合损失，x表示综合训练模型参数，T(F_seg(I'))表示提取训练模型参数，F_recg表示特征提取处理，即F_recg(I')表示自监督提取结果，S(F_recg(I'))表示分割训练模型参数，MLP(T(F_seg(I'))+S(F_recg(I')))表示综合自监督模型参数。

进一步的，可以根据提取损失、分割损失、综合损失确定总损失。例如，可以根据公式四将提取损失、分割损失、综合损失进行加权求和，得到总损失。

L_mix＝λ₁L₁+λ₂L₂+λ₃L₃ 公式四

其中，L_mix表示总损失，λ₁表示提取损失对应的权重，例如可以设置为0.01，λ₂表示分割损失对应的权重，例如可以设置为1，λ₃表示综合损失对应的权重，例如可以设置为1。最后，可以按照降低总损失为目标，利用反向传播算法来修正图像生成模型中的合成器和转换器的神经元的参数，以达到联合训练转换器和合成器的目的。

图8是根据一示例性实施例示出的一种图像生成方法的流程图，如图8所示，该方法包括以下步骤：

步骤201，显示图像生成界面。

步骤202，接收用户输入的原始图像。

举例来说，在用户需要生成目标图像的应用场景中，可以先在终端设备的屏幕上显示图像生成界面。图像生成界面上可以包括多个区域：以供用户输入原始图像的输入区域，以供用户选择目标特征类型的选择区域，以供用户预览原始图像、查看目标图像的展示区域等，本公开对此不作具体限定。之后可以在接收到用户发起的用户请求的情况下，获取用户(例如：玩家)上传的原始图像，原始图像为2D图像，例如可以是真实场景中拍摄的照片，也可以是其他类型的图像，本公开对此不作具体限定。

步骤203，响应于用户的触发，在至少一个候选特征类型中确定待生成目标图像的目标特征类型。

步骤204，接收目标图像，并在图像生成界面展示目标图像。其中，目标图像基于原始图像、目标特征类型对应的形状指导模型以及图像生成模型生成，图像生成模型根据多个符合目标特征类型的训练图像训练得到，形状指导模型根据多个符合指定类型的形状样本图像训练得到，形状指导模型用于确定表征目标对象形状的形状指导信息。

示例的，用户可以在上传原始图像时，还可以在至少一个候选特征类型中，选择待生成目标图像的目标特征类型。候选特征类型可以理解为图像的风格，例如可以是犬系特征类型、猫系特征类型、兔子特征类型、宝宝特征类型等等，相应的，目标特征类型即为用户指定的候选特征类型。

相应的，可以针对多种候选特征类型，预先训练每种候选特征类型对应的图像生成模型以及形状指导模型。每种候选特征类型对应的图像生成模型，均是根据多个具有该种候选特征类型的训练图像训练得到的。每种候选特征类型对应的形状指导模型，均是根据多个具有该种候选特征类型的形状样本图像训练得到的。

在获取目标特征类型之后，可以在多个预先训练的图像生成模型中，选择目标特征类型对应的目标图像生成模型以及目标形状指导模型。并根据原始图像，生成目标图像，并在图像生成界面展示目标图像，这样，得到的目标图像既具有目标特征类型。生成目标图像的具体方式与图1-图7中所提供的实施例中生成目标图像的方式相同，此处不再赘述。

图9是根据一示例性实施例示出的另一种图像生成方法的流程图，如图9所示，在步骤202之后，该方法还可以包括：

步骤205，基于原始图像，在多个预设特征类型中确定至少一个候选特征类型并显示。

示例的，在接收到原始图像之后，还可以根据原始图像，在多个预设特征类型中确定至少一个候选特征类型，并在图像生成界面中显示至少一个候选特征类型。可以预先建立多个预设特征类型，例如可以包括：犬系特征类型、猫系特征类型、兔子特征类型、宝宝特征类型、古风特征类型、朋克特征类型等。可以根据原始图像的类型，筛选除适用于原始图像的至少一个候选特征类型。例如，原始图像为人脸图像，那么候选特征类型可以为犬系特征类型、猫系特征类型、兔子特征类型、宝宝特征类型等。

在一种实现方式中，目标图像是通过一下方式获取的：

步骤1)对原始图像进行特征提取和对象分割，以得到提取结果和分割结果。

步骤2)根据目标特征类型，在多个预先训练的图像生成模型以及形状指导模型中，确定目标特征类型对应的目标图像生成模型以及目标形状指导模型。

步骤3)根据分割结果，通过目标形状指导模型，确定形状指导信息。

步骤4)根据提取结果和形状指导信息，通过目标图像生成模型，生成符合目标特征类型的目标图像。

在另一种实现方式中，步骤3)的实现方式可以为：

将分割结果输入目标形状指导模型，以得到目标形状指导模型输出的形状指导信息，形状指导信息为分割模型参数，分割结果为原始图像对应在多个通道上的掩模图像。

目标图像生成模型包括：转换器、合成器和生成器。

步骤4)的实现方式可以包括：

首先，将提取结果输入转换器，以得到转换器输出的提取模型参数，提取结果为用于表征原始图像的向量。

之后，将提取模型参数和分割模型参数输入合成器，以得到合成器输出的综合模型参数。

最后，将综合模型参数输入生成器，以得到生成器输出的目标图像。

上述生成目标图像的具体方式与图1-图7中所提供的实施例中生成目标图像的方式相同，此处不再赘述。

图10是根据一示例性实施例示出的一种图像生成装置的框图，如图10所示，该装置300可以包括：

获取模块301，用于响应于用户请求，获取目标对象的原始图像。

处理模块302，用于对原始图像进行特征提取和对象分割，以得到提取结果和分割结果。

形状指导模块303，用于根据分割结果，通过预先训练的形状指导模型，确定用于表征目标对象形状的形状指导信息。

生成模块304，用于根据提取结果和形状指导信息，通过预先训练的图像生成模型，生成与目标对象对应的、符合指定类型的目标图像，图像生成模型根据多个符合指定类型的训练图像训练得到，形状指导模型根据多个符合指定类型的形状样本图像训练得到。

图11是根据一示例性实施例示出的另一种图像生成装置的框图，如图11所示，形状指导模块303可以用于：

图像生成模型包括：转换器、合成器和生成器。生成模块304可以包括：

处理子模块3041，用于将提取结果输入转换器，以得到转换器输出的提取模型参数，提取结果为用于表征原始图像的向量。

合成子模块3042，用于将提取模型参数和分割模型参数输入合成器，以得到合成器输出的综合模型参数。

生成子模块3043，用于将综合模型参数输入生成器，以得到生成器输出的目标图像。

在一种实现方式中，生成器是通过如下方式训练得到的：

在另一种实现方式中，形状指导模型是通过如下方式训练得到的：

在又一种实现方式中，图像生成模型是通过如下方式训练得到的：

步骤F，将训练提取结果输入转换器，以得到转换器输出的提取训练模型参数。训练提取结果为根据训练图像进行特征提取得到的。

进一步的，步骤K的实现方式可以包括：

步骤K4，根据提取损失、分割损失、综合损失确定总损失。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图12是根据一示例性实施例示出的一种图像生成装置的框图，如图12所示，该装置400可以包括：

显示模块401，用于显示图像生成界面。

接收模块402，用于接收用户输入的原始图像。

确定模块403，用于响应于用户的触发，在至少一个候选特征类型中确定待生成目标图像的目标特征类型。

生成模块404，用于接收目标图像，并在图像生成界面展示目标图像。其中，目标图像基于原始图像、与目标特征类型对应的形状指导模型以及图像生成模型生成，图像生成模型根据多个符合目标特征类型的训练图像训练得到，形状指导模型根据多个符合指定类型的形状样本图像训练得到，形状指导模型用于确定表征目标对象形状的形状指导信息。

在一种实现方式中，显示模块401还可以用于：

在接收用户输入的原始图像之后，基于原始图像，在多个预设特征类型中确定至少一个候选特征类型并显示。

在一种实现方式中，目标图像是通过一下方式获取的：

在另一种实现方式中，步骤3)的实现方式可以为：

目标图像生成模型包括：转换器、合成器和生成器。

步骤4)的实现方式可以包括：

下面参考图13，其示出了适于用来实现本公开实施例的电子设备(例如本公开所示实施例中的执行主体，可以是终端设备，也可以是服务器)500的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图13示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图13所示，电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501，其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中，还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

通常，以下装置可以连接至I/O接口505：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507；包括例如磁带、硬盘等的存储装置508；以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图13示出了具有各种装置的电子设备500，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在非暂态计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置509从网络上被下载和安装，或者从存储装置508被安装，或者从ROM 502被安装。在该计算机程序被处理装置501执行时，执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

在一些实施方式中，终端设备、服务器可以利用诸如HTTP(HyperText TransferProtocol，超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信，并且可以与任意形式或介质的数字数据通信(例如，通信网络)互连。通信网络的示例包括局域网(“LAN”)，广域网(“WAN”)，网际网(例如，互联网)以及端对端网络(例如，ad hoc端对端网络)，以及任何当前已知或未来研发的网络。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：响应于用户请求，获取目标对象的原始图像；对所述原始图像进行特征提取和对象分割，以得到提取结果和分割结果；根据所述分割结果，通过预先训练的形状指导模型，确定用于表征所述目标对象形状的形状指导信息；根据所述提取结果和所述形状指导信息，通过预先训练的图像生成模型，生成与所述目标对象对应的、符合指定类型的目标图像，所述图像生成模型根据多个符合所述指定类型的样本图像训练得到。

或者，上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：显示图像生成界面；接收用户输入的原始图像；响应于所述用户的触发，在至少一个候选特征类型中确定目标图像的目标特征类型；获取目标图像并在所述图像生成界面展示所述目标图像；所述目标图像基于所述原始图像、预先训练的形状指导模型、图像生成模型以及所述目标特征类型生成，所述图像生成模型根据多个符合所述目标特征类型的样本图像训练得到，所述形状指导模型用于确定表征所述目标对象形状的形状指导信息。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的模块可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，模块的名称在某种情况下并不构成对该模块本身的限定，例如，获取模块还可以被描述为“获取原始图像的模块”。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

根据本公开的一个或多个实施例，示例1提供了一种图像生成方法，包括：响应于用户请求，获取目标对象的原始图像；对所述原始图像进行特征提取和对象分割，以得到提取结果和分割结果；根据所述分割结果，通过预先训练的形状指导模型，确定用于表征所述目标对象形状的形状指导信息；根据所述提取结果和所述形状指导信息，通过预先训练的图像生成模型，生成与所述目标对象对应的、符合指定类型的目标图像，所述图像生成模型根据多个符合所述指定类型的训练图像训练得到，所述形状指导模型根据多个符合所述指定类型的形状样本图像训练得到。

根据本公开的一个或多个实施例，示例2提供了示例1的方法，所述根据所述分割结果，通过预先训练的形状指导模型，确定用于表征所述目标对象形状的形状指导信息，包括：将所述分割结果输入所述形状指导模型，以得到所述形状指导模型输出的所述形状指导信息，所述形状指导信息为分割模型参数，所述分割结果为所述原始图像对应在多个通道上的掩模图像；所述图像生成模型包括：转换器、合成器和生成器；所述根据所述提取结果和所述形状指导信息，通过预先训练的图像生成模型，生成所述目标对象对应的，符合指定类型的目标图像，包括：将所述提取结果输入所述转换器，以得到所述转换器输出的提取模型参数，所述提取结果为用于表征所述原始图像的向量；将所述提取模型参数和所述分割模型参数输入所述合成器，以得到所述合成器输出的综合模型参数；将所述综合模型参数输入所述生成器，以得到所述生成器输出的所述目标图像。

根据本公开的一个或多个实施例，示例3提供了示例2的方法，所述生成器是通过如下方式训练得到的：获取游戏引擎按照预设规则生成符合所述指定类型的多个生成样本图像，并确定所述游戏引擎生成对应的所述生成样本图像时，使用的真实模型参数；将每个所述生成样本图像对应的真实模型参数作为所述生成器的输入，将该生成样本图像作为所述生成器的输出，以训练所述生成器。

根据本公开的一个或多个实施例，示例4提供了示例2的方法，所述形状指导模型是通过如下方式训练得到的：获取游戏引擎按照预设规则生成的，符合所述指定类型的多个所述形状样本图像，并确定所述游戏引擎生成对应的所述形状样本图像时，使用的真实模型参数；根据每个所述形状样本图像进行对象分割，以得到该形状样本图像对应的样本分割结果；将每个所述形状样本图像对应的样本分割结果作为所述形状指导模型的输入，将该形状样本图像对应的真实模型参数作为所述形状指导模型的输出，以训练所述形状指导模型。

根据本公开的一个或多个实施例，示例5供了示例2的方法，所述图像生成模型是通过如下方式训练得到的：将训练提取结果输入所述转换器，以得到所述转换器输出的提取训练模型参数；所述训练提取结果为根据所述训练图像进行特征提取得到的；将所述提取训练模型参数和分割训练模型参数输入所述合成器，以得到所述合成器输出的综合训练模型参数，所述分割训练模型参数为根据训练分割结果，利用所述形状指导模型确定的，所述训练分割结果为根据所述训练图像进行对象分割得到的；将所述综合训练模型参数输入所述生成器，以得到所述生成器输出的目标训练图像；将自监督提取结果输入所述转换器，以得到所述转换器输出的提取自监督模型参数；所述自监督提取结果为根据所述目标训练图像进行特征提取得到的；将所述提取自监督模型参数和分割自监督模型参数输入所述合成器，以得到所述合成器输出的综合自监督模型参数，所述分割自监督模型参数为根据自监督分割结果，利用所述形状指导模型确定的，所述自监督分割结果为根据所述目标训练图像进行对象分割得到的；根据所述训练提取结果与所述自监督提取结果、所述训练分割结果与所述自监督分割结果、所述综合训练模型参数与所述综合自监督模型参数，训练所述图像生成模型。

根据本公开的一个或多个实施例，示例6提供了示例5的方法，所述根据所述训练提取结果与所述自监督提取结果、所述训练分割结果与所述自监督分割结果、所述综合训练模型参数与所述综合自监督模型参数，训练所述图像生成模型，包括：根据所述训练提取结果与所述自监督提取结果，确定提取损失；根据所述训练分割结果与所述自监督分割结果，确定分割损失；根据所述综合训练模型参数与所述综合自监督模型参数，确定综合损失；根据所述提取损失、所述分割损失、所述综合损失确定总损失；以降低所述总损失为目标，利用反向传播算法联合训练所述转换器和所述合成器。

根据本公开的一个或多个实施例，示例7提供了一种图像生成方法，所述方法包括：显示图像生成界面；接收用户输入的原始图像；响应于所述用户的触发，在至少一个候选特征类型中确定待生成目标图像的目标特征类型；接收所述目标图像，并在所述图像生成界面展示所述目标图像；其中，所述目标图像基于所述原始图像、与所述目标特征类型对应的形状指导模型以及图像生成模型生成；所述图像生成模型根据多个符合所述目标特征类型的训练图像训练得到，所述形状指导模型根据多个符合所述指定类型的形状样本图像训练得到，所述形状指导模型用于确定表征所述目标对象形状的形状指导信息。

根据本公开的一个或多个实施例，示例8提供了示例7的方法，在所述接收用户输入的原始图像之后，所述方法还包括：基于所述原始图像，在多个预设特征类型中确定所述至少一个候选特征类型并显示。

根据本公开的一个或多个实施例，示例9提供了示例7的方法，所述目标图像是通过以下方式获取的：对所述原始图像进行特征提取和对象分割，以得到提取结果和分割结果；根据所述目标特征类型，在多个预先训练的图像生成模型以及形状指导模型中中，确定所述目标特征类型对应的目标图像生成模型以及目标形状指导模型；根据所述分割结果，通过所述目标形状指导模型，确定所述形状指导信息；根据所述提取结果和所述形状指导信息，通过所述目标图像生成模型，生成符合所述目标特征类型的所述目标图像。

根据本公开的一个或多个实施例，示例10提供了示例9的方法，所述根据所述分割结果，通过所述目标形状指导模型，确定所述形状指导信息，包括：将所述分割结果输入所述目标形状指导模型，以得到所述目标形状指导模型输出的所述形状指导信息，所述形状指导信息为分割模型参数，所述分割结果为所述原始图像对应在多个通道上的掩模图像；所述目标图像生成模型包括：转换器、合成器和生成器；所述根据所述提取结果和所述形状指导信息，通过所述目标图像生成模型，生成符合所述目标特征类型的所述目标图像，包括：将所述提取结果输入所述转换器，以得到所述转换器输出的提取模型参数，所述提取结果为用于表征所述原始图像的向量；将所述提取模型参数和所述分割模型参数输入所述合成器，以得到所述合成器输出的综合模型参数；将所述综合模型参数输入所述生成器，以得到所述生成器输出的所述目标图像。

根据本公开的一个或多个实施例，示例11提供了一种图像生成装置，包括：获取模块，用于响应于用户请求，获取目标对象的原始图像；处理模块，用于对所述原始图像进行特征提取和对象分割，以得到提取结果和分割结果；形状指导模块，用于根据所述分割结果，通过预先训练的形状指导模型，确定用于表征所述目标对象形状的形状指导信息；生成模块，用于根据所述提取结果和所述形状指导信息，通过预先训练的图像生成模型，生成与所述目标对象对应的、符合指定类型的目标图像，所述图像生成模型根据多个符合所述指定类型的训练图像训练得到，所述形状指导模型根据多个符合所述指定类型的形状样本图像训练得到。

根据本公开的一个或多个实施例，示例12提供了一种图像生成装置，包括：显示模块，用于显示图像生成界面；接收模块，用于接收用户输入的原始图像；确定模块，用于响应于所述用户的触发，在至少一个候选特征类型中确定待生成目标图像的目标特征类型；生成模块，用于接收所述目标图像，并在所述图像生成界面展示所述目标图像；其中，所述目标图像基于所述原始图像、与所述目标特征类型对应的形状指导模型以及图像生成模型生成，所述图像生成模型根据多个符合所述目标特征类型的训练图像训练得到，所述形状指导模型根据多个符合所述指定类型的形状样本图像训练得到，所述形状指导模型用于确定表征所述目标对象形状的形状指导信息。

根据本公开的一个或多个实施例，示例13提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理装置执行时实现示例1至示例10中所述方法的步骤。

根据本公开的一个或多个实施例，示例14提供了一种电子设备，包括：存储装置，其上存储有计算机程序；处理装置，用于执行所述存储装置中的所述计算机程序，以实现示例1至示例10中所述方法的步骤。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

Claims

1.一种图像生成方法，其特征在于，所述方法包括：

响应于用户请求，获取目标对象的原始图像；

2.根据权利要求1所述的方法，其特征在于，所述根据所述分割结果，通过预先训练的形状指导模型，确定用于表征所述目标对象形状的形状指导信息，包括：

将所述分割结果输入所述形状指导模型，以得到所述形状指导模型输出的所述形状指导信息，所述形状指导信息为分割模型参数，所述分割结果为所述原始图像对应在多个通道上的掩模图像；

所述图像生成模型包括：转换器、合成器和生成器；所述根据所述提取结果和所述形状指导信息，通过预先训练的图像生成模型，生成所述目标对象对应的，符合指定类型的目标图像，包括：

将所述提取结果输入所述转换器，以得到所述转换器输出的提取模型参数，所述提取结果为用于表征所述原始图像的向量；

将所述提取模型参数和所述分割模型参数输入所述合成器，以得到所述合成器输出的综合模型参数；

将所述综合模型参数输入所述生成器，以得到所述生成器输出的所述目标图像。

3.根据权利要求2所述的方法，其特征在于，所述生成器是通过如下方式训练得到的：

获取游戏引擎按照预设规则生成符合所述指定类型的多个生成样本图像，并确定所述游戏引擎生成对应的所述生成样本图像时，使用的真实模型参数；

将每个所述生成样本图像对应的真实模型参数作为所述生成器的输入，将该生成样本图像作为所述生成器的输出，以训练所述生成器。

4.根据权利要求2所述的方法，其特征在于，所述形状指导模型是通过如下方式训练得到的：

获取游戏引擎按照预设规则生成的，符合所述指定类型的多个所述形状样本图像，并确定所述游戏引擎生成对应的所述形状样本图像时，使用的真实模型参数；

根据每个所述形状样本图像进行对象分割，以得到该形状样本图像对应的样本分割结果；

将每个所述形状样本图像对应的样本分割结果作为所述形状指导模型的输入，将该形状样本图像对应的真实模型参数作为所述形状指导模型的输出，以训练所述形状指导模型。

5.根据权利要求2所述的方法，其特征在于，所述图像生成模型是通过如下方式训练得到的：

将训练提取结果输入所述转换器，以得到所述转换器输出的提取训练模型参数；所述训练提取结果为根据所述训练图像进行特征提取得到的；

将所述提取训练模型参数和分割训练模型参数输入所述合成器，以得到所述合成器输出的综合训练模型参数，所述分割训练模型参数为根据训练分割结果，利用所述形状指导模型确定的，所述训练分割结果为根据所述训练图像进行对象分割得到的；

将所述综合训练模型参数输入所述生成器，以得到所述生成器输出的目标训练图像；

将自监督提取结果输入所述转换器，以得到所述转换器输出的提取自监督模型参数；所述自监督提取结果为根据所述目标训练图像进行特征提取得到的；

将所述提取自监督模型参数和分割自监督模型参数输入所述合成器，以得到所述合成器输出的综合自监督模型参数，所述分割自监督模型参数为根据自监督分割结果，利用所述形状指导模型确定的，所述自监督分割结果为根据所述目标训练图像进行对象分割得到的；

根据所述训练提取结果与所述自监督提取结果、所述训练分割结果与所述自监督分割结果、所述综合训练模型参数与所述综合自监督模型参数，训练所述图像生成模型。

6.根据权利要求5所述的方法，其特征在于，所述根据所述训练提取结果与所述自监督提取结果、所述训练分割结果与所述自监督分割结果、所述综合训练模型参数与所述综合自监督模型参数，训练所述图像生成模型，包括：

根据所述训练提取结果与所述自监督提取结果，确定提取损失；

根据所述训练分割结果与所述自监督分割结果，确定分割损失；

根据所述综合训练模型参数与所述综合自监督模型参数，确定综合损失；

根据所述提取损失、所述分割损失、所述综合损失确定总损失；

以降低所述总损失为目标，利用反向传播算法联合训练所述转换器和所述合成器。

7.一种图像生成方法，其特征在于，所述方法包括：

显示图像生成界面；

接收用户输入的原始图像；

8.根据权利要求7所述的方法，其特征在于，在所述接收用户输入的原始图像之后，所述方法还包括：

基于所述原始图像，在多个预设特征类型中确定所述至少一个候选特征类型并显示。

9.根据权利要求7所述的方法，其特征在于，所述目标图像是通过以下方式获取的：

根据所述目标特征类型，在多个预先训练的图像生成模型以及形状指导模型中，确定所述目标特征类型对应的目标图像生成模型以及目标形状指导模型；

根据所述分割结果，通过所述目标形状指导模型，确定所述形状指导信息；

根据所述提取结果和所述形状指导信息，通过所述目标图像生成模型，生成符合所述目标特征类型的所述目标图像。

10.根据权利要求9所述的方法，其特征在于，所述根据所述分割结果，通过所述目标形状指导模型，确定所述形状指导信息，包括：

将所述分割结果输入所述目标形状指导模型，以得到所述目标形状指导模型输出的所述形状指导信息，所述形状指导信息为分割模型参数，所述分割结果为所述原始图像对应在多个通道上的掩模图像；

所述目标图像生成模型包括：转换器、合成器和生成器；

所述根据所述提取结果和所述形状指导信息，通过所述目标图像生成模型，生成符合所述目标特征类型的所述目标图像，包括：

11.一种图像生成装置，其特征在于，所述装置包括：

12.一种图像生成装置，其特征在于，所述装置包括：

显示模块，用于显示图像生成界面；

接收模块，用于接收用户输入的原始图像；

生成模块，用于接收所述目标图像，并在所述图像生成界面展示所述目标图像；其中，所述目标图像基于所述原始图像、与所述目标特征类型对应的形状指导模型以及图像生成模型生成，所述图像生成模型根据多个符合所述目标特征类型的训练图像训练得到，所述形状指导模型根据多个符合所述指定类型的形状样本图像训练得到，所述形状指导模型用于确定表征所述目标对象形状的形状指导信息。

13.一种计算机可读介质，其上存储有计算机程序，其特征在于，该程序被处理装置执行时实现权利要求1-6，或者7-10中任一项所述方法的步骤。

14.一种电子设备，其特征在于，包括：

存储装置，其上存储有计算机程序；

处理装置，用于执行所述存储装置中的所述计算机程序，以实现权利要求1-6，或者7-10中任一项所述方法的步骤。