CN111667547A

CN111667547A - Gan网络训练方法、服装图片生成方法、装置及电子设备

Info

Publication number: CN111667547A
Application number: CN202010520461.7A
Authority: CN
Inventors: 张发恩; 吴佳洪
Original assignee: Alnnovation Beijing Technology Co ltd
Current assignee: Qingdao Chuangxin Qizhi Technology Group Co ltd
Priority date: 2020-06-09
Filing date: 2020-06-09
Publication date: 2020-09-15
Anticipated expiration: 2040-06-09
Also published as: CN111667547B

Abstract

本申请提供了一种GAN网络训练方法、服装图片生成方法、装置及电子设备。该GAN网络训练方法，包括以下步骤：获取多个训练样本，其中，每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字；提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息，以形成具有第一特征信息以及第二特征信息的特征信息组；根据每一所述特征信息组对预设GAN网络进行训练，以得到目标GAN网络。本申请可以基于用户的描述文字生成对应的服装图片，满足用户对服装设计的个性化需求，从而可以提高服装图片生成的自动化程度，可以快速自动生成服装图片。

Description

GAN网络训练方法、服装图片生成方法、装置及电子设备

技术领域

本申请涉及计算机网络技术领域，具体而言，涉及一种GAN网络训练方法、服装图片生成方法、装置及电子设备。

背景技术

现在的服装款式生成***更多的是根据服装图片的要素进行拼装组合，以生成服装图片。其缺少了人工的审美***来评价，虽然可以同时生成各式各样的服装款式，但是，不能根据用户的喜好来生成所需的服装图片，无法快速满足用户对服装的个性化需求。

针对上述问题，目前尚未有有效的技术解决方案。

发明内容

本申请实施例的目的在于提供一种GAN网络训练方法、服装图片生成方法、装置及电子设备，可以基于用户的描述文字生成对应的服装图片，满足用户对服装设计的个性化需求。

第一方面，本申请实施例提供了一种GAN网络训练方法，包括以下步骤：

获取多个训练样本，其中，每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字；

提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息，以形成具有第一特征信息以及第二特征信息的特征信息组；

根据每一所述特征信息组对预设GAN网络进行训练，以得到目标GAN网络。

本申请实施例通过采用服装图片以及描述文字来训练出目标GAN网络，可以基于用户的描述文字生成对应的服装图片，满足用户对服装设计的个性化需求，从而可以提高服装图片生成的自动化程度，可以快速自动生成服装图片。

可选地，在本申请实施例所述的GAN网络训练方法中，所述服装图片包括多个服装要素，所述描述文字包括多个描述字段；

所述根据每一所述特征信息组对预设GAN网络进行训练，以得到目标GAN网络的步骤包括：

将每一所述特征信息组分成多个第一特征信息组，每一所述第一特征信息组包括一第一子特征信息及一对应的第二子特征信息，所述第一子特征信息与一所述服装要素对应，所述第二子特征信息与一所述描述字段对应，所述第一特征信息包括多个第一子特征信息，所述第二特征信息包括多个第二子特征信息；

根据每一所述特征信息组的多个第一特征信息组对预设GAN网络进行训练，以得到目标GAN网络。

可选地，在本申请实施例所述的GAN网络训练方法中，所述将每一所述特征信息组分成多个第一特征信息组的步骤包括：

对每一所述描述文字进行分词处理，以得到多个描述字段；

从所述多个服装图片的描述文字中筛选出具有一个相同描述字段的至少两个服装图片；

从所述至少两个服装图片对应的第一特征信息中提取出所述相同描述字段对应的第一子特征信息；

从所述至少两个服装图片对应的第二特征信息中提取出所述相同描述字段对应的第二子特征信息；

将提取出的第一子特征信息以及对应第二子特征信息组成一第一特征信息组。

可选地，在本申请实施例所述的GAN网络训练方法中，所述从所述至少两个服装图片对应的第一特征信息中提取出所述相同描述字段对应的第一子特征信息的步骤包括：

将所述至少两个服装图片的对应的第一特征信息中的相同的特征信息段提取出，以作为所述相同描述字段对应的第一子特征信息。

可选地，在本申请实施例所述的GAN网络训练方法中，所述多个训练样本中，每一所述训练样本与其他至少一个训练样本具有相同服装元素。

第二方面，本申请实施例提供了一种GAN网络训练装置，包括：

第一获取模块，用于获取多个训练样本，其中，每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字；

第一提取模块，用于提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息，以形成具有第一特征信息以及第二特征信息的特征信息组；

训练模块，用于根据每一所述特征信息组对预设GAN网络进行训练，以得到目标GAN网络。

所述服装图片包括多个服装要素，所述描述文字包括多个描述字段；

可选地，在本申请实施例所述的GAN网络训练装置中，所述训练模块包括：

划分单元，用于将每一所述特征信息组分成多个第一特征信息组，每一所述第一特征信息组包括一第一子特征信息及一对应的第二子特征信息，所述第一子特征信息与一所述服装要素对应，所述第二子特征信息与一所述描述字段对应，所述第一特征信息包括多个第一子特征信息，所述第二特征信息包括多个第二子特征信息；

训练单元，用于根据每一所述特征信息组的多个第一特征信息组对预设GAN网络进行训练，以得到目标GAN网络。

第三方面，本申请实施例提供了一种服装图片生成方法，采用上述任一项所述的GAN网络训练方法训练得到的目标GAN网络，所述方法包括以下步骤：

获取用户输入的用于描述待生成的目标服装图片的描述文字；

将所述描述文字输入所述目标GAN网络，以生成与所述描述文字对应的目标服装图片。

第四方面，本申请实施例提供了一种服装图片生成装置，采用上述任一项所述的GAN网络训练方法训练得到的目标GAN网络，所述装置包括：

第二获取模块，用于获取用户输入的用于描述待生成的目标服装图片的描述文字；

生成模块，用于将所述描述文字输入所述目标GAN网络，以生成与所述描述文字对应的目标服装图片。

第五方面，本申请实施例提供一种电子设备，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如上述第一方面提供的所述方法中的步骤。

第六方面，本申请实施例提供一种存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。

由上可知，本申请实施例通过获取多个训练样本，其中，每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字；提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息，以形成具有第一特征信息以及第二特征信息的特征信息组；根据每一所述特征信息组对预设GAN网络进行训练，以得到目标GAN网络；从而训练出目标GAN网络，可以基于用户的描述文字生成对应的服装图片，满足用户对服装设计的个性化需求，从而可以提高服装图片生成的自动化程度，可以快速自动生成服装图片。

本申请的其他特征和优点将在随后的说明书阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的GAN网络训练方法的一种流程图。

图2为本申请实施例提供的GAN网络训练装置的一种结构示意图。

图3为本申请实施例提供的服装图片生成方法的一种流程图。

图4为本申请实施例提供的服装图片生成装置的一种结构示意图。

图5为本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

请参照图1，图1是本本申请一些实施例中的GAN网络训练方法的流程图。该GAN网络训练方法包括以下步骤：

S101、获取多个训练样本，其中，每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字。

S102、提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息，以形成具有第一特征信息以及第二特征信息的特征信息组。

S103、根据每一所述特征信息组对预设GAN网络进行训练，以得到目标GAN网络。

其中，在该步骤S101中，该多个训练样本为从网络上获取的服装图片，然后基于该服装图片添加对应的描述文字，以对该服装图片内的服装进行描述。其中，每一服装图片具有多个服装元素，对应地，该服装图片对应的描述文字也具有多个描述字段，每一描述字段对应一个服装元素。例如，黑色高领毛衣，其对应的描述字段分别为黑色、高领以及毛衣。

优选地，该多个训练样本中的每一训练样本与该多个训练样本中的其他至少一个训练样本具有一个相同的服装元素。例如，服装A为黑色高领毛衣，服装B为白色圆领毛衣，服装A和服装B的相同的服装元素为毛衣。更进一步地，每一服装元素在该多个训练样本中均出现至少两次。

其中，在该步骤S102中，可以采用CNN网络来提取每一服装图片中的第一特征信息，采用RNN网络来提取每一描述文字中的第二特征信息。在采集时，该相互对应的服装图片以及描述文字分别输入CNN网络以及RNN网络中，从而采集到一组对应的第一特征信息和第二特征信息，该相互对应的第一特征信息和第二特征信息形成一个特征信息组。

其中，在该步骤S103中，将该多个特征信息组输入到预设GAN网络进行训练，从而得到目标GAN网络，也即是将每一服装图片的第一特征信息以及对应描述文字的第二特征信息成对地输入到该预设GAN网络中，从而训练得到目标GAN网络。

具体地，在一些实施例中，该步骤S103包括以下子步骤：S1031、将每一所述特征信息组分成多个第一特征信息组，每一所述第一特征信息组包括一第一子特征信息及一对应的第二子特征信息，所述第一子特征信息与一所述服装要素对应，所述第二子特征信息与一所述描述字段对应，所述第一特征信息包括多个第一子特征信息，所述第二特征信息包括多个第二子特征信息；S1032、根据每一所述特征信息组的多个第一特征信息组对预设GAN网络进行训练，以得到目标GAN网络。

其中，在该步骤S1031中，可以是最初在输入服装图片以及对应的描述文字时，即将该描述文字分成多个描述字段，并在该服装图片中将每一描述字段的服装元素标记出，在进行特征提取时，CNN网络每提取一个服装元素的第一子特征信息，该RNN网络就提取与该服装元素对应的描述字段的第二子特征信息；从而逐步将该各个服装元素及对应的描述字段的子特征信息成对提取出，形成多个第一子特征信息组。

可以理解地，在一些实施例中，该步骤S1031包括：S10311、对每一所述描述文字进行分词处理，以得到多个描述字段；S10312、从所述多个服装图片的描述文字中筛选出具有一个相同描述字段的至少两个服装图片；S10313、从所述至少两个服装图片对应的第一特征信息中提取出所述相同描述字段对应的第一子特征信息；S10314、从所述至少两个服装图片对应的第二特征信息中提取出所述相同描述字段对应的第二子特征信息；S10315、将提取出的第一子特征信息以及对应第二子特征信息组成一第一特征信息组。

其中，在该步骤S10311中，例如，该描述文字为白色短袖衬衫，经过分词处理，得到“白色”、“短袖”以及“衬衫”三个描述字段。在该步骤S10312中，筛选出的至少两个服装图片对应的描述文字仅仅具有一个共同的描述字段。例如，服装图片A的描述文字的三个描述字段分别为：白色、长袖、格子衫；服装图片B的描述文字的三个描述字段分别为：黑色、短袖、格子衫；服装图片C的描述文字的三个描述字段分别为：红色、中长袖、格子衫。因此，该服装图片A、B、C被筛选出且具有相同的描述字段格子衫。在该步骤S10313中，基于该服装图片A、B、C的第一特征信息，通过找出其中的相同的特征信息段，即可确定该格子衫所对应的第一子特征信息。进而，采用这种方法，可以依次确定出每一描述字段对应的第一子特征信息。在该步骤S10314中，可以采用与步骤S10313相同的原理，从该服装图片A、B、C的描述文字的第二特征信息中，提取出共同的特征信息段，即可找到与该共同的描述字段对应的第二子特征信息。在该步骤S10315中，将每一第一子特征信息与对应的第二子特征信息组成第一特征信息组。

请参照图2，图2是本申请一些实施例中的一种GAN网络训练装置的结构示意图。该GAN网络训练装置包括：第一获取模块201、第一提取模块202以及训练模块203。

其中，该第一获取模块201用于获取多个训练样本，其中，每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字；该多个训练样本为从网络上获取的服装图片，然后基于该服装图片添加对应的描述文字，以对该服装图片内的服装进行描述。其中，每一服装图片具有多个服装元素，对应地，该服装图片对应的描述文字也具有多个描述字段，每一描述字段对应一个服装元素。例如，黑色高领毛衣，其对应的描述字段分别为黑色、高领以及毛衣。

其中，该第一提取模块202用于提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息，以形成具有第一特征信息以及第二特征信息的特征信息组。第一提取模块202可以采用CNN网络来提取每一服装图片中的第一特征信息，采用RNN网络来提取每一描述文字中的第二特征信息。在采集时，该相互对应的服装图片以及描述文字分别输入CNN网络以及RNN网络中，从而采集到一组对应的第一特征信息和第二特征信息，该相互对应的第一特征信息和第二特征信息形成一个特征信息组。

其中，该训练模块203用于根据每一所述特征信息组对预设GAN网络进行训练，以得到目标GAN网络。该训练模块203将该多个特征信息组输入到预设GAN网络进行训练，从而得到目标GAN网络，也即是将每一服装图片的第一特征信息以及对应描述文字的第二特征信息成对地输入到该预设GAN网络中，从而训练得到目标GAN网络。

具体地，在一些实施例中，该训练模块203包括：划分单元，用于将每一所述特征信息组分成多个第一特征信息组，每一所述第一特征信息组包括一第一子特征信息及一对应的第二子特征信息，所述第一子特征信息与一所述服装要素对应，所述第二子特征信息与一所述描述字段对应，所述第一特征信息包括多个第一子特征信息，所述第二特征信息包括多个第二子特征信息；训练单元，用于根据每一所述特征信息组的多个第一特征信息组对预设GAN网络进行训练，以得到目标GAN网络。具体地，可以是最初在输入服装图片以及对应的描述文字时，即将该描述文字分成多个描述字段，并在该服装图片中将每一描述字段的服装元素标记出，在进行特征提取时，CNN网络每提取一个服装元素的第一子特征信息，该RNN网络就提取与该服装元素对应的描述字段的第二子特征信息；从而逐步将该各个服装元素及对应的描述字段的子特征信息成对提取出，形成多个第一子特征信息组。

可以理解地，在一些实施例中，该划分单元用于：对每一所述描述文字进行分词处理，以得到多个描述字段；从所述多个服装图片的描述文字中筛选出具有一个相同描述字段的至少两个服装图片；从所述至少两个服装图片对应的第一特征信息中提取出所述相同描述字段对应的第一子特征信息；从所述至少两个服装图片对应的第二特征信息中提取出所述相同描述字段对应的第二子特征信息；将提取出的第一子特征信息以及对应第二子特征信息组成一第一特征信息组。

例如，该描述文字为白色短袖衬衫，经过分词处理，得到“白色”、“短袖”以及“衬衫”三个描述字段。筛选出的至少两个服装图片对应的描述文字仅仅具有一个共同的描述字段。例如，服装图片A的描述文字的三个描述字段分别为：白色、长袖、格子衫；服装图片B的描述文字的三个描述字段分别为：黑色、短袖、格子衫；服装图片C的描述文字的三个描述字段分别为：红色、中长袖、格子衫。因此，该服装图片A、B、C被筛选出且具有相同的描述字段格子衫。基于该服装图片A、B、C的第一特征信息，通过找出其中的相同的特征信息段，即可确定该格子衫所对应的第一子特征信息。进而，采用这种方法，可以依次确定出每一描述字段对应的第一子特征信息。

请参照图3，图3是本申请一些实施例中的一种服装图片生成方法的流程图，该服装图片生成方法采用上述任一实施例所述的GAN网络训练方法训练得到的目标GAN网络进行图片生成。该方法包括以下步骤：

S301、获取用户输入的用于描述待生成的目标服装图片的描述文字。

S302、将所述描述文字输入所述目标GAN网络，以生成与所述描述文字对应的目标服装图片。

其中，在该步骤S301中，该描述文字可以仅仅包括一个描述字段，也可以包括多个描述字段。

其中，在该步骤S302中，当该描述文字仅仅包括一个描述字段时，该目标GAN网络直接提取该描述字段的第二子特征信息，然后输出多个具有该第二子特征信息的描述字段所对应的服装图片。

在一些实施例中，该描述文字具有多个描述字段时，该目标GAN网络提取该多个描述字段的第二子特征信息，生成具有与该多个第二子特征信息对应的第一子特征信息的服装图片。

请参照图4，图4是本申请一些实施例中的一种服装图片生成装置的结构示意图。该服装图片生成装置采用上述任一实施例所述的GAN网络训练方法训练得到的目标GAN网络进行图片生成，所述装置包括：第二获取模块401以及生成模块402。

其中，该第二获取模块401用于获取用户输入的用于描述待生成的目标服装图片的描述文字。该描述文字可以仅仅包括一个描述字段，也可以包括多个描述字段。

其中，该生成模块402用于将所述描述文字输入所述目标GAN网络，以生成与所述描述文字对应的目标服装图片。当该描述文字仅仅包括一个描述字段时，该目标GAN网络直接提取该描述字段的第二子特征信息，然后输出多个具有该第二子特征信息的描述字段所对应的服装图片。在一些实施例中，该描述文字具有多个描述字段时，该目标GAN网络提取该多个描述字段的第二子特征信息，生成具有与该多个第二子特征信息对应的第一子特征信息的服装图片。

请参照图5，图5为本申请实施例提供的一种电子设备的结构示意图，本申请提供一种电子设备5，包括：处理器501和存储器502，处理器501和存储器502通过通信总线503和/或其他形式的连接机构(未标出)互连并相互通讯，存储器502存储有处理器501可执行的计算机程序，当计算设备运行时，处理器501执行该计算机程序，以执行时执行上述实施例的任一可选的实现方式中的方法。

本申请实施例提供一种存储介质，所述计算机程序被处理器执行时，执行上述实施例的任一可选的实现方式中的方法。其中，存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(Static Random AccessMemory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable ProgrammableRead－Only Memory，简称EEPROM)，可擦除可编程只读存储器(Erasable ProgrammableRead OnlyMemory，简称EPROM)，可编程只读存储器(Programmable Red－Only Memory，简称PROM)，只读存储器(Read－Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。

在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

再者，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。

以上所述仅为本申请的实施例而已，并不用于限制本申请的保护范围，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种GAN网络训练方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的GAN网络训练方法，其特征在于，所述服装图片包括多个服装要素，所述描述文字包括多个描述字段；

3.根据权利要求2所述的GAN网络训练方法，其特征在于，所述将每一所述特征信息组分成多个第一特征信息组的步骤包括：

对每一所述描述文字进行分词处理，以得到多个描述字段；

从多个服装图片的描述文字中筛选出具有一个相同描述字段的至少两个服装图片；

4.根据权利要求3所述的GAN网络训练方法，其特征在于，所述从所述至少两个服装图片对应的第一特征信息中提取出所述相同描述字段对应的第一子特征信息的步骤包括：

5.根据权利要求2所述的GAN网络训练方法，其特征在于，所述多个训练样本中，每一所述训练样本与其他至少一个训练样本具有相同服装元素。

6.一种GAN网络训练装置，其特征在于，包括：

7.根据权利要求6所述的GAN网络训练装置，其特征在于，所述服装图片包括多个服装要素，所述描述文字包括多个描述字段；

所述训练模块包括：

8.一种服装图片生成方法，其特征在于，采用权利要求1－5任一项所述的GAN网络训练方法训练得到的目标GAN网络，所述方法包括以下步骤：

9.一种服装图片生成装置，其特征在于，采用权利要求1－5任一项所述的GAN网络训练方法训练得到的目标GAN网络，所述装置包括：

10.一种电子设备，其特征在于，包括处理器以及存储器，所述存储器存储有计算机可读取指令，当所述计算机可读取指令由所述处理器执行时，运行如权利要求1－5或8任一项所述的方法。