CN111667547A - Gan网络训练方法、服装图片生成方法、装置及电子设备 - Google Patents
Gan网络训练方法、服装图片生成方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111667547A CN111667547A CN202010520461.7A CN202010520461A CN111667547A CN 111667547 A CN111667547 A CN 111667547A CN 202010520461 A CN202010520461 A CN 202010520461A CN 111667547 A CN111667547 A CN 111667547A
- Authority
- CN
- China
- Prior art keywords
- characteristic information
- clothing
- training
- gan network
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 116
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000000605 extraction Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 4
- 238000013461 design Methods 0.000 abstract description 7
- 238000004590 computer program Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/001—Texturing; Colouring; Generation of texture or colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4038—Image mosaicing, e.g. composing plane images from plane sub-images
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种GAN网络训练方法、服装图片生成方法、装置及电子设备。该GAN网络训练方法,包括以下步骤:获取多个训练样本,其中,每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字;提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息,以形成具有第一特征信息以及第二特征信息的特征信息组;根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络。本申请可以基于用户的描述文字生成对应的服装图片,满足用户对服装设计的个性化需求,从而可以提高服装图片生成的自动化程度,可以快速自动生成服装图片。
Description
技术领域
本申请涉及计算机网络技术领域,具体而言,涉及一种GAN网络训练方法、服装图片生成方法、装置及电子设备。
背景技术
现在的服装款式生成***更多的是根据服装图片的要素进行拼装组合,以生成服装图片。其缺少了人工的审美***来评价,虽然可以同时生成各式各样的服装款式,但是,不能根据用户的喜好来生成所需的服装图片,无法快速满足用户对服装的个性化需求。
针对上述问题,目前尚未有有效的技术解决方案。
发明内容
本申请实施例的目的在于提供一种GAN网络训练方法、服装图片生成方法、装置及电子设备,可以基于用户的描述文字生成对应的服装图片,满足用户对服装设计的个性化需求。
第一方面,本申请实施例提供了一种GAN网络训练方法,包括以下步骤:
获取多个训练样本,其中,每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字;
提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息,以形成具有第一特征信息以及第二特征信息的特征信息组;
根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络。
本申请实施例通过采用服装图片以及描述文字来训练出目标GAN网络,可以基于用户的描述文字生成对应的服装图片,满足用户对服装设计的个性化需求,从而可以提高服装图片生成的自动化程度,可以快速自动生成服装图片。
可选地,在本申请实施例所述的GAN网络训练方法中,所述服装图片包括多个服装要素,所述描述文字包括多个描述字段;
所述根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络的步骤包括:
将每一所述特征信息组分成多个第一特征信息组,每一所述第一特征信息组包括一第一子特征信息及一对应的第二子特征信息,所述第一子特征信息与一所述服装要素对应,所述第二子特征信息与一所述描述字段对应,所述第一特征信息包括多个第一子特征信息,所述第二特征信息包括多个第二子特征信息;
根据每一所述特征信息组的多个第一特征信息组对预设GAN网络进行训练,以得到目标GAN网络。
可选地,在本申请实施例所述的GAN网络训练方法中,所述将每一所述特征信息组分成多个第一特征信息组的步骤包括:
对每一所述描述文字进行分词处理,以得到多个描述字段;
从所述多个服装图片的描述文字中筛选出具有一个相同描述字段的至少两个服装图片;
从所述至少两个服装图片对应的第一特征信息中提取出所述相同描述字段对应的第一子特征信息;
从所述至少两个服装图片对应的第二特征信息中提取出所述相同描述字段对应的第二子特征信息;
将提取出的第一子特征信息以及对应第二子特征信息组成一第一特征信息组。
可选地,在本申请实施例所述的GAN网络训练方法中,所述从所述至少两个服装图片对应的第一特征信息中提取出所述相同描述字段对应的第一子特征信息的步骤包括:
将所述至少两个服装图片的对应的第一特征信息中的相同的特征信息段提取出,以作为所述相同描述字段对应的第一子特征信息。
可选地,在本申请实施例所述的GAN网络训练方法中,所述多个训练样本中,每一所述训练样本与其他至少一个训练样本具有相同服装元素。
第二方面,本申请实施例提供了一种GAN网络训练装置,包括:
第一获取模块,用于获取多个训练样本,其中,每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字;
第一提取模块,用于提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息,以形成具有第一特征信息以及第二特征信息的特征信息组;
训练模块,用于根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络。
所述服装图片包括多个服装要素,所述描述文字包括多个描述字段;
可选地,在本申请实施例所述的GAN网络训练装置中,所述训练模块包括:
划分单元,用于将每一所述特征信息组分成多个第一特征信息组,每一所述第一特征信息组包括一第一子特征信息及一对应的第二子特征信息,所述第一子特征信息与一所述服装要素对应,所述第二子特征信息与一所述描述字段对应,所述第一特征信息包括多个第一子特征信息,所述第二特征信息包括多个第二子特征信息;
训练单元,用于根据每一所述特征信息组的多个第一特征信息组对预设GAN网络进行训练,以得到目标GAN网络。
第三方面,本申请实施例提供了一种服装图片生成方法,采用上述任一项所述的GAN网络训练方法训练得到的目标GAN网络,所述方法包括以下步骤:
获取用户输入的用于描述待生成的目标服装图片的描述文字;
将所述描述文字输入所述目标GAN网络,以生成与所述描述文字对应的目标服装图片。
第四方面,本申请实施例提供了一种服装图片生成装置,采用上述任一项所述的GAN网络训练方法训练得到的目标GAN网络,所述装置包括:
第二获取模块,用于获取用户输入的用于描述待生成的目标服装图片的描述文字;
生成模块,用于将所述描述文字输入所述目标GAN网络,以生成与所述描述文字对应的目标服装图片。
第五方面,本申请实施例提供一种电子设备,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如上述第一方面提供的所述方法中的步骤。
第六方面,本申请实施例提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时运行如上述第一方面提供的所述方法中的步骤。
由上可知,本申请实施例通过获取多个训练样本,其中,每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字;提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息,以形成具有第一特征信息以及第二特征信息的特征信息组;根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络;从而训练出目标GAN网络,可以基于用户的描述文字生成对应的服装图片,满足用户对服装设计的个性化需求,从而可以提高服装图片生成的自动化程度,可以快速自动生成服装图片。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的GAN网络训练方法的一种流程图。
图2为本申请实施例提供的GAN网络训练装置的一种结构示意图。
图3为本申请实施例提供的服装图片生成方法的一种流程图。
图4为本申请实施例提供的服装图片生成装置的一种结构示意图。
图5为本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1是本本申请一些实施例中的GAN网络训练方法的流程图。该GAN网络训练方法包括以下步骤:
S101、获取多个训练样本,其中,每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字。
S102、提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息,以形成具有第一特征信息以及第二特征信息的特征信息组。
S103、根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络。
其中,在该步骤S101中,该多个训练样本为从网络上获取的服装图片,然后基于该服装图片添加对应的描述文字,以对该服装图片内的服装进行描述。其中,每一服装图片具有多个服装元素,对应地,该服装图片对应的描述文字也具有多个描述字段,每一描述字段对应一个服装元素。例如,黑色高领毛衣,其对应的描述字段分别为黑色、高领以及毛衣。
优选地,该多个训练样本中的每一训练样本与该多个训练样本中的其他至少一个训练样本具有一个相同的服装元素。例如,服装A为黑色高领毛衣,服装B为白色圆领毛衣,服装A和服装B的相同的服装元素为毛衣。更进一步地,每一服装元素在该多个训练样本中均出现至少两次。
其中,在该步骤S102中,可以采用CNN网络来提取每一服装图片中的第一特征信息,采用RNN网络来提取每一描述文字中的第二特征信息。在采集时,该相互对应的服装图片以及描述文字分别输入CNN网络以及RNN网络中,从而采集到一组对应的第一特征信息和第二特征信息,该相互对应的第一特征信息和第二特征信息形成一个特征信息组。
其中,在该步骤S103中,将该多个特征信息组输入到预设GAN网络进行训练,从而得到目标GAN网络,也即是将每一服装图片的第一特征信息以及对应描述文字的第二特征信息成对地输入到该预设GAN网络中,从而训练得到目标GAN网络。
具体地,在一些实施例中,该步骤S103包括以下子步骤:S1031、将每一所述特征信息组分成多个第一特征信息组,每一所述第一特征信息组包括一第一子特征信息及一对应的第二子特征信息,所述第一子特征信息与一所述服装要素对应,所述第二子特征信息与一所述描述字段对应,所述第一特征信息包括多个第一子特征信息,所述第二特征信息包括多个第二子特征信息;S1032、根据每一所述特征信息组的多个第一特征信息组对预设GAN网络进行训练,以得到目标GAN网络。
其中,在该步骤S1031中,可以是最初在输入服装图片以及对应的描述文字时,即将该描述文字分成多个描述字段,并在该服装图片中将每一描述字段的服装元素标记出,在进行特征提取时,CNN网络每提取一个服装元素的第一子特征信息,该RNN网络就提取与该服装元素对应的描述字段的第二子特征信息;从而逐步将该各个服装元素及对应的描述字段的子特征信息成对提取出,形成多个第一子特征信息组。
可以理解地,在一些实施例中,该步骤S1031包括:S10311、对每一所述描述文字进行分词处理,以得到多个描述字段;S10312、从所述多个服装图片的描述文字中筛选出具有一个相同描述字段的至少两个服装图片;S10313、从所述至少两个服装图片对应的第一特征信息中提取出所述相同描述字段对应的第一子特征信息;S10314、从所述至少两个服装图片对应的第二特征信息中提取出所述相同描述字段对应的第二子特征信息;S10315、将提取出的第一子特征信息以及对应第二子特征信息组成一第一特征信息组。
其中,在该步骤S10311中,例如,该描述文字为白色短袖衬衫,经过分词处理,得到“白色”、“短袖”以及“衬衫”三个描述字段。在该步骤S10312中,筛选出的至少两个服装图片对应的描述文字仅仅具有一个共同的描述字段。例如,服装图片A的描述文字的三个描述字段分别为:白色、长袖、格子衫;服装图片B的描述文字的三个描述字段分别为:黑色、短袖、格子衫;服装图片C的描述文字的三个描述字段分别为:红色、中长袖、格子衫。因此,该服装图片A、B、C被筛选出且具有相同的描述字段格子衫。在该步骤S10313中,基于该服装图片A、B、C的第一特征信息,通过找出其中的相同的特征信息段,即可确定该格子衫所对应的第一子特征信息。进而,采用这种方法,可以依次确定出每一描述字段对应的第一子特征信息。在该步骤S10314中,可以采用与步骤S10313相同的原理,从该服装图片A、B、C的描述文字的第二特征信息中,提取出共同的特征信息段,即可找到与该共同的描述字段对应的第二子特征信息。在该步骤S10315中,将每一第一子特征信息与对应的第二子特征信息组成第一特征信息组。
由上可知,本申请实施例通过获取多个训练样本,其中,每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字;提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息,以形成具有第一特征信息以及第二特征信息的特征信息组;根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络;从而训练出目标GAN网络,可以基于用户的描述文字生成对应的服装图片,满足用户对服装设计的个性化需求,从而可以提高服装图片生成的自动化程度,可以快速自动生成服装图片。
请参照图2,图2是本申请一些实施例中的一种GAN网络训练装置的结构示意图。该GAN网络训练装置包括:第一获取模块201、第一提取模块202以及训练模块203。
其中,该第一获取模块201用于获取多个训练样本,其中,每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字;该多个训练样本为从网络上获取的服装图片,然后基于该服装图片添加对应的描述文字,以对该服装图片内的服装进行描述。其中,每一服装图片具有多个服装元素,对应地,该服装图片对应的描述文字也具有多个描述字段,每一描述字段对应一个服装元素。例如,黑色高领毛衣,其对应的描述字段分别为黑色、高领以及毛衣。
优选地,该多个训练样本中的每一训练样本与该多个训练样本中的其他至少一个训练样本具有一个相同的服装元素。例如,服装A为黑色高领毛衣,服装B为白色圆领毛衣,服装A和服装B的相同的服装元素为毛衣。更进一步地,每一服装元素在该多个训练样本中均出现至少两次。
其中,该第一提取模块202用于提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息,以形成具有第一特征信息以及第二特征信息的特征信息组。第一提取模块202可以采用CNN网络来提取每一服装图片中的第一特征信息,采用RNN网络来提取每一描述文字中的第二特征信息。在采集时,该相互对应的服装图片以及描述文字分别输入CNN网络以及RNN网络中,从而采集到一组对应的第一特征信息和第二特征信息,该相互对应的第一特征信息和第二特征信息形成一个特征信息组。
其中,该训练模块203用于根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络。该训练模块203将该多个特征信息组输入到预设GAN网络进行训练,从而得到目标GAN网络,也即是将每一服装图片的第一特征信息以及对应描述文字的第二特征信息成对地输入到该预设GAN网络中,从而训练得到目标GAN网络。
具体地,在一些实施例中,该训练模块203包括:划分单元,用于将每一所述特征信息组分成多个第一特征信息组,每一所述第一特征信息组包括一第一子特征信息及一对应的第二子特征信息,所述第一子特征信息与一所述服装要素对应,所述第二子特征信息与一所述描述字段对应,所述第一特征信息包括多个第一子特征信息,所述第二特征信息包括多个第二子特征信息;训练单元,用于根据每一所述特征信息组的多个第一特征信息组对预设GAN网络进行训练,以得到目标GAN网络。具体地,可以是最初在输入服装图片以及对应的描述文字时,即将该描述文字分成多个描述字段,并在该服装图片中将每一描述字段的服装元素标记出,在进行特征提取时,CNN网络每提取一个服装元素的第一子特征信息,该RNN网络就提取与该服装元素对应的描述字段的第二子特征信息;从而逐步将该各个服装元素及对应的描述字段的子特征信息成对提取出,形成多个第一子特征信息组。
可以理解地,在一些实施例中,该划分单元用于:对每一所述描述文字进行分词处理,以得到多个描述字段;从所述多个服装图片的描述文字中筛选出具有一个相同描述字段的至少两个服装图片;从所述至少两个服装图片对应的第一特征信息中提取出所述相同描述字段对应的第一子特征信息;从所述至少两个服装图片对应的第二特征信息中提取出所述相同描述字段对应的第二子特征信息;将提取出的第一子特征信息以及对应第二子特征信息组成一第一特征信息组。
例如,该描述文字为白色短袖衬衫,经过分词处理,得到“白色”、“短袖”以及“衬衫”三个描述字段。筛选出的至少两个服装图片对应的描述文字仅仅具有一个共同的描述字段。例如,服装图片A的描述文字的三个描述字段分别为:白色、长袖、格子衫;服装图片B的描述文字的三个描述字段分别为:黑色、短袖、格子衫;服装图片C的描述文字的三个描述字段分别为:红色、中长袖、格子衫。因此,该服装图片A、B、C被筛选出且具有相同的描述字段格子衫。基于该服装图片A、B、C的第一特征信息,通过找出其中的相同的特征信息段,即可确定该格子衫所对应的第一子特征信息。进而,采用这种方法,可以依次确定出每一描述字段对应的第一子特征信息。
由上可知,本申请实施例通过获取多个训练样本,其中,每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字;提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息,以形成具有第一特征信息以及第二特征信息的特征信息组;根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络;从而训练出目标GAN网络,可以基于用户的描述文字生成对应的服装图片,满足用户对服装设计的个性化需求,从而可以提高服装图片生成的自动化程度,可以快速自动生成服装图片。
请参照图3,图3是本申请一些实施例中的一种服装图片生成方法的流程图,该服装图片生成方法采用上述任一实施例所述的GAN网络训练方法训练得到的目标GAN网络进行图片生成。该方法包括以下步骤:
S301、获取用户输入的用于描述待生成的目标服装图片的描述文字。
S302、将所述描述文字输入所述目标GAN网络,以生成与所述描述文字对应的目标服装图片。
其中,在该步骤S301中,该描述文字可以仅仅包括一个描述字段,也可以包括多个描述字段。
其中,在该步骤S302中,当该描述文字仅仅包括一个描述字段时,该目标GAN网络直接提取该描述字段的第二子特征信息,然后输出多个具有该第二子特征信息的描述字段所对应的服装图片。
在一些实施例中,该描述文字具有多个描述字段时,该目标GAN网络提取该多个描述字段的第二子特征信息,生成具有与该多个第二子特征信息对应的第一子特征信息的服装图片。
请参照图4,图4是本申请一些实施例中的一种服装图片生成装置的结构示意图。该服装图片生成装置采用上述任一实施例所述的GAN网络训练方法训练得到的目标GAN网络进行图片生成,所述装置包括:第二获取模块401以及生成模块402。
其中,该第二获取模块401用于获取用户输入的用于描述待生成的目标服装图片的描述文字。该描述文字可以仅仅包括一个描述字段,也可以包括多个描述字段。
其中,该生成模块402用于将所述描述文字输入所述目标GAN网络,以生成与所述描述文字对应的目标服装图片。当该描述文字仅仅包括一个描述字段时,该目标GAN网络直接提取该描述字段的第二子特征信息,然后输出多个具有该第二子特征信息的描述字段所对应的服装图片。在一些实施例中,该描述文字具有多个描述字段时,该目标GAN网络提取该多个描述字段的第二子特征信息,生成具有与该多个第二子特征信息对应的第一子特征信息的服装图片。
请参照图5,图5为本申请实施例提供的一种电子设备的结构示意图,本申请提供一种电子设备5,包括:处理器501和存储器502,处理器501和存储器502通过通信总线503和/或其他形式的连接机构(未标出)互连并相互通讯,存储器502存储有处理器501可执行的计算机程序,当计算设备运行时,处理器501执行该计算机程序,以执行时执行上述实施例的任一可选的实现方式中的方法。
本申请实施例提供一种存储介质,所述计算机程序被处理器执行时,执行上述实施例的任一可选的实现方式中的方法。其中,存储介质可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random AccessMemory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable ProgrammableRead-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable ProgrammableRead OnlyMemory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。
由上可知,本申请实施例通过获取多个训练样本,其中,每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字;提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息,以形成具有第一特征信息以及第二特征信息的特征信息组;根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络;从而训练出目标GAN网络,可以基于用户的描述文字生成对应的服装图片,满足用户对服装设计的个性化需求,从而可以提高服装图片生成的自动化程度,可以快速自动生成服装图片。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种GAN网络训练方法,其特征在于,包括以下步骤:
获取多个训练样本,其中,每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字;
提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息,以形成具有第一特征信息以及第二特征信息的特征信息组;
根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络。
2.根据权利要求1所述的GAN网络训练方法,其特征在于,所述服装图片包括多个服装要素,所述描述文字包括多个描述字段;
所述根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络的步骤包括:
将每一所述特征信息组分成多个第一特征信息组,每一所述第一特征信息组包括一第一子特征信息及一对应的第二子特征信息,所述第一子特征信息与一所述服装要素对应,所述第二子特征信息与一所述描述字段对应,所述第一特征信息包括多个第一子特征信息,所述第二特征信息包括多个第二子特征信息;
根据每一所述特征信息组的多个第一特征信息组对预设GAN网络进行训练,以得到目标GAN网络。
3.根据权利要求2所述的GAN网络训练方法,其特征在于,所述将每一所述特征信息组分成多个第一特征信息组的步骤包括:
对每一所述描述文字进行分词处理,以得到多个描述字段;
从多个服装图片的描述文字中筛选出具有一个相同描述字段的至少两个服装图片;
从所述至少两个服装图片对应的第一特征信息中提取出所述相同描述字段对应的第一子特征信息;
从所述至少两个服装图片对应的第二特征信息中提取出所述相同描述字段对应的第二子特征信息;
将提取出的第一子特征信息以及对应第二子特征信息组成一第一特征信息组。
4.根据权利要求3所述的GAN网络训练方法,其特征在于,所述从所述至少两个服装图片对应的第一特征信息中提取出所述相同描述字段对应的第一子特征信息的步骤包括:
将所述至少两个服装图片的对应的第一特征信息中的相同的特征信息段提取出,以作为所述相同描述字段对应的第一子特征信息。
5.根据权利要求2所述的GAN网络训练方法,其特征在于,所述多个训练样本中,每一所述训练样本与其他至少一个训练样本具有相同服装元素。
6.一种GAN网络训练装置,其特征在于,包括:
第一获取模块,用于获取多个训练样本,其中,每一所述训练样本包括服装图片以及用于描述所述服装图片的描述文字;
第一提取模块,用于提取每一所述训练样本中的服装图片的第一特征信息以及对应的描述文字的第二特征信息,以形成具有第一特征信息以及第二特征信息的特征信息组;
训练模块,用于根据每一所述特征信息组对预设GAN网络进行训练,以得到目标GAN网络。
7.根据权利要求6所述的GAN网络训练装置,其特征在于,所述服装图片包括多个服装要素,所述描述文字包括多个描述字段;
所述训练模块包括:
划分单元,用于将每一所述特征信息组分成多个第一特征信息组,每一所述第一特征信息组包括一第一子特征信息及一对应的第二子特征信息,所述第一子特征信息与一所述服装要素对应,所述第二子特征信息与一所述描述字段对应,所述第一特征信息包括多个第一子特征信息,所述第二特征信息包括多个第二子特征信息;
训练单元,用于根据每一所述特征信息组的多个第一特征信息组对预设GAN网络进行训练,以得到目标GAN网络。
8.一种服装图片生成方法,其特征在于,采用权利要求1-5任一项所述的GAN网络训练方法训练得到的目标GAN网络,所述方法包括以下步骤:
获取用户输入的用于描述待生成的目标服装图片的描述文字;
将所述描述文字输入所述目标GAN网络,以生成与所述描述文字对应的目标服装图片。
9.一种服装图片生成装置,其特征在于,采用权利要求1-5任一项所述的GAN网络训练方法训练得到的目标GAN网络,所述装置包括:
第二获取模块,用于获取用户输入的用于描述待生成的目标服装图片的描述文字;
生成模块,用于将所述描述文字输入所述目标GAN网络,以生成与所述描述文字对应的目标服装图片。
10.一种电子设备,其特征在于,包括处理器以及存储器,所述存储器存储有计算机可读取指令,当所述计算机可读取指令由所述处理器执行时,运行如权利要求1-5或8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010520461.7A CN111667547B (zh) | 2020-06-09 | 2020-06-09 | Gan网络训练方法、服装图片生成方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010520461.7A CN111667547B (zh) | 2020-06-09 | 2020-06-09 | Gan网络训练方法、服装图片生成方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111667547A true CN111667547A (zh) | 2020-09-15 |
CN111667547B CN111667547B (zh) | 2023-08-11 |
Family
ID=72386466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010520461.7A Active CN111667547B (zh) | 2020-06-09 | 2020-06-09 | Gan网络训练方法、服装图片生成方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111667547B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114359435A (zh) * | 2022-03-17 | 2022-04-15 | 阿里巴巴(中国)有限公司 | 图像生成方法、模型生成方法及设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109783798A (zh) * | 2018-12-12 | 2019-05-21 | 平安科技(深圳)有限公司 | 文本信息添加图片的方法、装置、终端及存储介质 |
CN110021051A (zh) * | 2019-04-01 | 2019-07-16 | 浙江大学 | 一种基于生成对抗网络通过文本指导的人物图像生成方法 |
EP3518245A1 (en) * | 2018-01-29 | 2019-07-31 | Siemens Healthcare GmbH | Image generation from a medical text report |
CN110135336A (zh) * | 2019-05-14 | 2019-08-16 | 腾讯科技(深圳)有限公司 | 行人生成模型的训练方法、装置及存储介质 |
CN110163267A (zh) * | 2019-05-09 | 2019-08-23 | 厦门美图之家科技有限公司 | 一种图像生成模型的训练方法和生成图像的方法 |
US20190287301A1 (en) * | 2017-06-27 | 2019-09-19 | Mad Street Den, Inc. | Systems and Methods for Synthesizing Images of Apparel Ensembles on Models |
CN110443293A (zh) * | 2019-07-25 | 2019-11-12 | 天津大学 | 基于双判别生成对抗网络文本重构的零样本图像分类方法 |
CN110490953A (zh) * | 2019-07-25 | 2019-11-22 | 维沃移动通信有限公司 | 基于文本的图像生成方法、终端设备及介质 |
US10540757B1 (en) * | 2018-03-12 | 2020-01-21 | Amazon Technologies, Inc. | Method and system for generating combined images utilizing image processing of multiple images |
CN110909754A (zh) * | 2018-09-14 | 2020-03-24 | 哈尔滨工业大学(深圳) | 一种属性生成对抗网络及基于该网络的搭配服饰生成方法 |
-
2020
- 2020-06-09 CN CN202010520461.7A patent/CN111667547B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190287301A1 (en) * | 2017-06-27 | 2019-09-19 | Mad Street Den, Inc. | Systems and Methods for Synthesizing Images of Apparel Ensembles on Models |
EP3518245A1 (en) * | 2018-01-29 | 2019-07-31 | Siemens Healthcare GmbH | Image generation from a medical text report |
US10540757B1 (en) * | 2018-03-12 | 2020-01-21 | Amazon Technologies, Inc. | Method and system for generating combined images utilizing image processing of multiple images |
CN110909754A (zh) * | 2018-09-14 | 2020-03-24 | 哈尔滨工业大学(深圳) | 一种属性生成对抗网络及基于该网络的搭配服饰生成方法 |
KR20200034917A (ko) * | 2018-09-14 | 2020-04-01 | 하얼빈 인스티튜트 오브 테크놀로지, 썬전 | 속성 생성적 대립 네트워크 및 상기 네트워크를 기반으로 하는 의류 매칭 생성 방법 |
CN109783798A (zh) * | 2018-12-12 | 2019-05-21 | 平安科技(深圳)有限公司 | 文本信息添加图片的方法、装置、终端及存储介质 |
CN110021051A (zh) * | 2019-04-01 | 2019-07-16 | 浙江大学 | 一种基于生成对抗网络通过文本指导的人物图像生成方法 |
CN110163267A (zh) * | 2019-05-09 | 2019-08-23 | 厦门美图之家科技有限公司 | 一种图像生成模型的训练方法和生成图像的方法 |
CN110135336A (zh) * | 2019-05-14 | 2019-08-16 | 腾讯科技(深圳)有限公司 | 行人生成模型的训练方法、装置及存储介质 |
CN110443293A (zh) * | 2019-07-25 | 2019-11-12 | 天津大学 | 基于双判别生成对抗网络文本重构的零样本图像分类方法 |
CN110490953A (zh) * | 2019-07-25 | 2019-11-22 | 维沃移动通信有限公司 | 基于文本的图像生成方法、终端设备及介质 |
Non-Patent Citations (2)
Title |
---|
ANDREJ KARPATHY;LI FEI-FEI.: "Deep Visual-Semantic Alignments for Generating Image Descriptions.", IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE. * |
马龙龙;韩先培;孙乐;: "图像的文本描述方法研究综述", 中文信息学报, no. 04 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114359435A (zh) * | 2022-03-17 | 2022-04-15 | 阿里巴巴(中国)有限公司 | 图像生成方法、模型生成方法及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111667547B (zh) | 2023-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109947967B (zh) | 图像识别方法、装置、存储介质和计算机设备 | |
CN107798001B (zh) | 网页处理方法、装置及设备 | |
CN105094775B (zh) | 网页生成方法和装置 | |
CN109033282B (zh) | 一种基于抽取模板的网页正文抽取方法及装置 | |
US10114888B2 (en) | Terminal, system, method, and program for presenting sentence candidate | |
JP7132046B2 (ja) | 検索装置、検索方法及びプログラム | |
CN106611065B (zh) | 搜索方法和装置 | |
CN111708938A (zh) | 用于信息处理的方法、装置、电子设备和存储介质 | |
JP2016001403A (ja) | テンプレート管理装置及びプログラム | |
CN105868240A (zh) | 一种自适应显示网页的方法及装置 | |
CN112131837A (zh) | 业务报告配置方法、装置、计算机设备和存储介质 | |
CN107220291A (zh) | 网页数据防抓取的方法及*** | |
CN113361525A (zh) | 基于ocr的页面生成方法、装置、计算机设备及存储介质 | |
CN113849748A (zh) | 信息展示方法、装置、电子设备及可读存储介质 | |
Sunkara et al. | Towards better semantic understanding of mobile interfaces | |
CN111667547B (zh) | Gan网络训练方法、服装图片生成方法、装置及电子设备 | |
CN112988026B (zh) | 滚动条的显示方法、装置及电子设备 | |
Rizvi et al. | A hybrid approach and unified framework for bibliographic reference extraction | |
CN113094287A (zh) | 页面兼容性检测方法、装置、设备及存储介质 | |
CN108170838B (zh) | 话题演变的可视化展现方法、应用服务器及计算机可读存储介质 | |
JP2019101889A (ja) | テスト実行装置及びプログラム | |
WO2023273501A1 (zh) | Ar交互方法、装置、电子设备、介质及程序 | |
US20190018841A1 (en) | Term extraction method and apparatus | |
KR102444172B1 (ko) | 영상 빅 데이터의 지능적 마이닝 방법과 처리 시스템 | |
JP2018500696A5 (zh) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240619 Address after: Room 501, block a, Haier International Plaza, 939 Zhenwu Road, Jimo Economic Development Zone, Qingdao, Shandong 266200 Patentee after: Qingdao Chuangxin Qizhi Technology Group Co.,Ltd. Country or region after: China Address before: Room 1511, 15 / F, block B, 3 Haidian Street, Haidian District, Beijing Patentee before: ALNNOVATION (BEIJING) TECHNOLOGY Co.,Ltd. Country or region before: China |