CN107392255A - 少数类图片样本的生成方法、装置、计算设备及存储介质 - Google Patents

少数类图片样本的生成方法、装置、计算设备及存储介质 Download PDF

Info

Publication number
CN107392255A
CN107392255A CN201710637315.0A CN201710637315A CN107392255A CN 107392255 A CN107392255 A CN 107392255A CN 201710637315 A CN201710637315 A CN 201710637315A CN 107392255 A CN107392255 A CN 107392255A
Authority
CN
China
Prior art keywords
generation
training
sample
confrontation network
default
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710637315.0A
Other languages
English (en)
Other versions
CN107392255B (zh
Inventor
梁予之
杨敏
曲强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201710637315.0A priority Critical patent/CN107392255B/zh
Publication of CN107392255A publication Critical patent/CN107392255A/zh
Application granted granted Critical
Publication of CN107392255B publication Critical patent/CN107392255B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明适用计算机技术领域,提供了一种少数类图片样本的生成方法、装置、计算设备及存储介质,该方法包括:当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,根据训练后的生成对抗网络,构造条件生成对抗网络,通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。

Description

少数类图片样本的生成方法、装置、计算设备及存储介质
技术领域
本发明属于计算机技术领域,尤其涉及一种少数类图片样本的生成方法、装置、计算设备及存储介质。
背景技术
随着人工智能技术的日趋完善,机器学***衡(label imbalance/class imbalance)的问题。比如利用机器学***衡问题。
标签不平衡问题的解决方法可以分为三类。第一类是通过改变图片样本数量来达到标签平衡,这其中又包含两种方法,一种是欠采样(under-sampling),即通过删去一部分将多数类图片样本或者增加一些少数类图片样本来达到标签平衡;另一种是过采样(over-sampling),即通过增加一些少数类图片样本来达到标签平衡。第二类解决标签不平衡的方法为通过算法的改进增加算法对标签不平衡的适应性,比如对分错少数类和分错多数类的损失设置不同的权重。第三类方法为通过特征选择来解决标签不平衡问题。
现有的增加少数类图片样本的方法大多通过模拟特定少数类图片样本来增加少数图片样本的数量,这种方法泛化效果不好,抗噪性差。换而言之,现有的方法生成的少数类图片样本与特定的已有的少数类图片样本高度相似,缺乏普遍性。
发明内容
本发明的目的在于提供一种少数类图片样本的生成方法、装置、计算设备及存储介质,旨在解决由于现有技术抗噪性和泛化效果不佳,导致生成的少数类图片样本缺乏普遍性且生成效率不高、用户体验不佳的问题。
一方面,本发明提供了一种少数类图片样本的生成方法,所述方法包括下述步骤:
当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,所述训练样本集由标签不平衡图片样本组成;
根据所述训练后的生成对抗网络,构造条件生成对抗网络;
通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练;
根据所述随机噪音向量和所述用户请求中包括的少数类标签,通过所述训练后的条件生成对抗网络生成少数类图片样本。
另一方面,本发明提供了一种少数类图片样本的生成装置,所述装置包括:
第一模型训练单元,用于当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,所述训练样本集由标签不平衡图片样本组成;
模型构造单元,用于根据所述训练后的生成对抗网络,构造条件生成对抗网络;
第二模型训练单元,用于通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练;以及
样本生成单元,用于根据所述随机噪音向量和所述用户请求中包括的少数类标签,通过所述训练后的条件生成对抗网络生成少数类图片样本。
另一方面,本发明还提供了一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述少数类图片样本的生成方法的步骤。
另一方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如所述少数类图片样本的生成方法的步骤。
本发明当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,根据训练后的生成对抗网络,构造条件生成对抗网络,通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。
附图说明
图1是本发明实施例一提供的少数类图片样本的生成方法的实现流程图;
图2是本发明实施例二提供的少数类图片样本的生成装置的结构示意图;
图3是本发明实施例三提供的少数类图片样本的生成装置的结构示意图;以及
图4是本发明实施例四提供的计算设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
以下结合具体实施例对本发明的具体实现进行详细描述:
实施例一:
图1示出了本发明实施例一提供的少数类图片样本的生成方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:
在步骤S101中,当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,训练样本集由标签不平衡图片样本组成。
本发明实施例适用于机器学***衡图片样本生成少数类图片样本,从而得到标签平衡的训练集,提高机器学***衡,则需要在使用这些图片样本进行机器学***衡的图片样本生成少数类图片样本,以解决标签不平衡问题。为了解决上述问题,预先构造了由神经网络(例如,多层感知机、卷积神经网络)组成的生成对抗网络,当接收到生成少数类图片样本的用户请求时,首先将符合预设分布的随机噪音向量输入预先构造的生成对抗网络,然后通过随机噪音向量和预设的训练样本集对生成对抗网络进行训练,即学***衡图片样本组成,随机噪音向量的预设分布可以为正态分布、指数分布或均匀分布等连续型分布,也可以为泊松分布、二项分布等离散型分布。
优选地,在通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练时,可以首先将随机噪音向量输入生成对抗网络G(z),根据预设的训练样本集对对抗网络G(z)进行训练,得到第一生成样本,接着将第一生成样本输入预先构造的第一判别模型D(x),以判定第一生成样本是否为真实样本,得到第一判别结果D(G(z)),若该第一判别结果正确,则G(z)的损失增加,若该第一判别结果不正确,则D(x)损失增加,然后根据公式分别对D(x)和G(z)进行训练,即G(z)尽可能让自己的输出像真实样本,而D(x)则尽可能将不是真实样本的情况分辨出来,当满足预设的第一训练结束条件时,结束训练,得到训练后的生成对抗网络,从而提高了模型训练效率。其中,第一判别模型可由神经网络(例如,多层感知机、卷积神经网络)组成,V(G,D)为价值方程,pdata(x)为真实样本的分布,pz(z)为自定义的先验分布,E表示期望,D(G(z))表示第一判别模型D(x)对生成对抗网络G(z)输出图片的判别,0≤D(x)的判别值≤1,第一训练结束条件可以为pz(z)=pdata(x),即
具体地,在根据 分别对D(x)和G(z)进1行训练时,首先构造损失函数然后使用m个真实样本{x(1),x(2),...,x(m)}和m个随机噪音向量{z(1),z(2),...,z(m)}计算并使用梯度上升法更新D(x)的权重分布,接着使用m个随机噪音向量{z(1),z(2),...,z(m)}计算并使用梯度下降法更新G(z)的权重分布,当时,结束训练。其中,m为真实样本数据集中的样本数量,x(i)为第i个真实样本,z(i)为第i个随机噪音向量。
进一步优选地,也可以直接将真实样本输入该第一判别模型D(x),以判定是否为真实样本,得到判别结果,从而进一步优化对第一判别模型D(x)的训练。
在步骤S102中,根据训练后的生成对抗网络,构造条件生成对抗网络。
在本发明实施例中,首先根据训练后的生成对抗网络的各非输入层的结构和权重分布,构造条件生成对抗网络的各非输入层的结构和权重分布,然后根据条件生成对抗网络的输入要求和作用,构造可同时输入随机噪音向量和预设标签的输入层,从而降低了训练样本数量,同时提高了生成对抗网络的训练速率。具体地,该条件生成对抗网络可由神经网络(例如,多层感知机、卷积神经网络)组成。
在步骤S103中,通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练。
在本发明实施例中,得到条件生成对抗网络之后,首先将随机噪音向量和预设标签输入条件生成对抗网络,然后通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,即学习从随机噪音向量到少数类图片样本的映射关系,根据训练过程中学习到的映射关系,最后得到训练后的条件生成对抗网络。优选地,将随机噪音向量和预设标签串联输入条件生成对抗网络,从而提高输入速率,进而提高条件生成对抗网络的训练效率。
优选地,在通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练时,可以首先将随机噪音向量和预设标签输入条件生成对抗网络G(z|y),通过训练样本集对条件生成对抗网络G(z|y)进行训练,得到第二生成样本,接着将第二生成样本输入预先构造的第二判别模型D(x|y),以判定第二生成样本是否为真实样本,得到第二判别结果D(G(z|y)),若该第二判别结果正确,则G(z|y)的损失增加,若该第二判别结果不正确,则D(x|y)损失增加,然后根据公式 分别对G(z|y)和D(x|y)进行训练,即G(z|y)尽量去欺骗D(x|y),而D(x|y)尽量去辨别输入样本是否标签为y的真实样本,两者博弈最后达到预设平衡(例如,纳什均衡)来得到最优的G(z|y),最后当满足预设的第二训练结束条件时,结束训练,得到训练后的条件生成对抗网络,从而提高了模型训练效率。其中,第二判别模型可由神经网络(例如,多层感知机、卷积神经网络)组成,0≤D(x|y)的判别值≤1,第二训练结束条件可以为pz(z)=pdata(x),即
在步骤S104中,根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本。
在本发明实施例中,得到训练后的条件生成对抗网络之后,首先将随机噪音向量和用户请求中包括的少数类标签输入到训练后的条件生成对抗网络,然后通过训练样本集,使用训练后的条件生成对抗网络生成图片样本并输出,最后将输出的图片样本设置为少数类图片样本,从而实现了少数类图片样本的生成,提高了生成少数类图片样本的质量。
在本发明实施例中,首先通过预先构造的生成对抗网络与所有图片样本(训练样本集中所有的非少数类图片样本和少数类图片样本)训练出一个可以生成图片样本的训练后的生成对抗网络,然后以这个训练后的生成对抗网络为基础构造出条件生成对抗网络,并通过少数类图片样本数据及非少数类图片样本对这个条件生成对抗网络进行训练,以对这个条件生成对抗网络进行优化,得到训练后的条件生成对抗网络,最后通过训练后的条件生成对抗网络得到与训练样本集中少数类图片样本类似的少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。
实施例二:
图2示出了本发明实施例二提供的少数类图片样本的生成装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
第一模型训练单元21,用于当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,训练样本集由标签不平衡图片样本组成。
在本发明实施例中,如果用户获取的用于机器学***衡,则需要在使用这些图片样本进行机器学***衡的图片样本生成少数类图片样本,以解决标签不平衡问题。为了解决上述问题,预先构造了由神经网络(例如,多层感知机、卷积神经网络)组成的生成对抗网络,当接收到生成少数类图片样本的用户请求时,第一模型训练单元21首先将符合预设分布的随机噪音向量输入预先构造的生成对抗网络,然后通过随机噪音向量和预设的训练样本集对生成对抗网络进行训练,即学***衡图片样本组成,随机噪音向量的预设分布可以为正态分布、指数分布或均匀分布等连续型分布,也可以为泊松分布、二项分布等离散型分布。
模型构造单元22,用于根据训练后的生成对抗网络,构造条件生成对抗网络。
在本发明实施例中,模型构造单元22首先根据训练后的生成对抗网络的各非输入层的结构和权重分布,构造条件生成对抗网络的各非输入层的结构和权重分布,然后根据条件生成对抗网络的输入要求和作用,构造可同时输入随机噪音向量和预设标签的输入层,从而降低了训练样本数量,同时提高了生成对抗网络的训练速率。具体地,该条件生成对抗网络可由神经网络(例如,多层感知机、卷积神经网络)组成。
第二模型训练单元23,用于通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练。
在本发明实施例中,得到条件生成对抗网络之后,第二模型训练单元23首先将随机噪音向量和预设标签输入条件生成对抗网络,然后通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,即学习从随机噪音向量到少数类图片样本的映射关系,根据训练过程中学习到的映射关系,最后得到训练后的条件生成对抗网络。优选地,将随机噪音向量和预设标签串联输入条件生成对抗网络,从而提高输入速率,进而提高条件生成对抗网络的训练效率。
样本生成单元24,用于根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本。
在本发明实施例中,得到训练后的条件生成对抗网络之后,样本生成单元24首先将随机噪音向量和用户请求中包括的少数类标签输入训练后的条件生成对抗网络,然后通过训练样本集,使用训练后的条件生成对抗网络生成图片样本并输出,最后将输出的图片样本设置为少数类图片样本,从而实现了少数类图片样本的生成,提高了生成少数类图片样本的质量。
在本发明实施例中,当接收到生成少数类图片样本的用户请求时,第一模型训练单元21通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,模型构造单元22根据训练后的生成对抗网络,构造条件生成对抗网络,第二模型训练单元23通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,样本生成单元24根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。
在本发明实施例中,少数类图片样本的生成装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。
实施例三:
图3示出了本发明实施例三提供的少数类图片样本的生成装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:
第一模型训练单元31,用于通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,训练样本集由标签不平衡图片样本组成。
在本发明实施例中,如果用户获取的用于机器学***衡,则需要在使用这些图片样本进行机器学***衡的图片样本生成少数类图片样本,以解决标签不平衡问题。为了解决上述问题,预先构造了由神经网络(例如,多层感知机、卷积神经网络)组成的生成对抗网络,当接收到生成少数类图片样本的用户请求时,第一模型训练单元31首先将符合预设分布的随机噪音向量输入预先构造的生成对抗网络,然后通过随机噪音向量和预设的训练样本集对生成对抗网络进行训练,即学***衡图片样本组成,随机噪音向量的预设分布可以为正态分布、指数分布或均匀分布等连续型分布,也可以为泊松分布、二项分布等离散型分布。
优选地,在通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练时,可以首先将随机噪音向量输入生成对抗网络G(z),根据预设的训练样本集对对抗网络G(z)进行训练,得到第一生成样本,接着将第一生成样本输入预先构造的第一判别模型D(x),以判定第一生成样本是否为真实样本,得到第一判别结果D(G(z)),若该第一判别结果正确,则G(z)的损失增加,若该第一判别结果不正确,则D(x)损失增加,然后根据公式分别对D(x)和G(z)进行训练,即G(z)尽可能让自己的输出像真实样本,而D(x)则尽可能将不是真实样本的情况分辨出来,当满足预设的第一训练结束条件时,结束训练,得到训练后的生成对抗网络,从而提高了模型训练效率。其中,第一判别模型可由神经网络(例如,多层感知机、卷积神经网络)组成,V(G,D)为价值方程,pdata(x)为真实样本的分布,pz(z)为自定义的先验分布,E表示期望,D(G(z))表示第一判别模型D(x)对生成对抗网络G(z)输出图片的判别,0≤D(x)≤1,第一训练结束条件可以为pz(z)=pdata(x),即
具体地,在根据 分别对D(x)和G(z)进行训练时,首先构造损失函数然后使用m个真实样本{x(1),x(2),...,x(m)}和m个随机噪音向量{z(1),z(2),...,z(m)}计算并使用梯度上升法更新D(x)的权重分布,接着使用m个随机噪音向量{z(1),z(2),...,z(m)}计算并使用梯度下降法更新G(z)的权重分布,当时,结束训练。其中,m为真实样本数据集中的样本数量,x(i)为第i个真实样本,z(i)为第i个随机噪音向量。
进一步优选地,也可以直接将真实样本输入该第一判别模型D(x),以判定是否为真实样本,得到判别结果,从而进一步优化对第一判别模型D(x)的训练。
模型构造单元32,用于根据训练后的生成对抗网络,构造条件生成对抗网络。
在本发明实施例中,模型构造单元32首先根据训练后的生成对抗网络的各非输入层的结构和权重分布,构造条件生成对抗网络的各非输入层的结构和权重分布,然后根据条件生成对抗网络的输入要求和作用,构造可同时输入随机噪音向量和预设标签的输入层,从而降低了训练样本数量,同时提高了生成对抗网络的训练速率。具体地,该条件生成对抗网络可由神经网络(例如,多层感知机、卷积神经网络)组成。
第二模型训练单元33,用于通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练。
在本发明实施例中,得到条件生成对抗网络之后,第二模型训练单元33首先将随机噪音向量和预设标签输入条件生成对抗网络,然后通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,即学习从随机噪音向量到少数类图片样本的映射关系,根据训练过程中学习到的映射关系,最后得到训练后的条件生成对抗网络。优选地,将随机噪音向量和预设标签串联输入条件生成对抗网络,从而提高输入速率,进而提高条件生成对抗网络的训练效率。
优选地,在通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练时,可以首先将随机噪音向量和预设标签输入条件生成对抗网络G(z|y),通过训练样本集对条件生成对抗网络G(z|y)进行训练,得到第二生成样本,接着将第二生成样本输入预先构造的第二判别模型D(x|y),以判定第二生成样本是否为真实样本,得到第二判别结果D(G(z|y)),若该第二判别结果正确,则G(z|y)的损失增加,若该第二判别结果不正确,则D(x|y)损失增加,然后根据公式 分别对G(z|y)和D(x|y)进行训练,即G(z|y)尽量去欺骗D(x|y),而D(x|y)尽量去辨别输入样本是否标签为y的真实样本,两者博弈最后达到预设平衡(例如,纳什均衡)来得到最优的G(z|y),最后当满足预设的第二训练结束条件时,结束训练,得到训练后的条件生成对抗网络,从而提高了模型训练效率。其中,第二判别模型可由神经网络(例如,多层感知机、卷积神经网络)组成,第二训练结束条件可以为pz(z)=pdata(x),即
样本生成单元34,用于根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本。
在本发明实施例中,得到训练后的条件生成对抗网络之后,样本生成单元34首先将随机噪音向量和用户请求中包括的少数类标签输入到训练后的条件生成对抗网络,然后通过训练样本集,使用训练后的条件生成对抗网络生成图片样本并输出,最后将输出的图片样本设置为少数类图片样本,从而实现了少数类图片样本的生成,提高了生成少数类图片样本的质量。
因此,优选地,该第一模型训练单元31包括:
第一样本生成单元311,用于根据随机噪音向量和训练样本集,通过生成对抗网络生成第一生成样本;
第一判别单元312,用于根据第一生成样本,通过预先构造的第一判别模型获取第一判别结果;
第一训练单元313,用于根据预设的第一价值方程分别对生成对抗网络和第一判别模型进行训练;
优选地,该第二模型训练单元33包括:
第二样本生成单元331,用于根据随机噪音向量、预设标签以及训练样本集,通过条件生成对抗网络生成第二生成样本;
第二判别单元332,用于根据第二生成样本,通过预先构造的第二判别模型获取第二判别结果;
第二训练单元333,用于根据预设的第二价值方程分别对条件生成对抗网络和第二判别模型进行训练。
在本发明实施例中,少数类图片样本的生成装置的各单元可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。
实施例四:
图4示出了本发明实施例四提供的计算设备的结构,为了便于说明,仅示出了与本发明实施例相关的部分。
本发明实施例的计算设备4包括处理器40、存储器41以及存储在存储器41中并可在处理器40上运行的计算机程序42。该处理器40执行计算机程序42时实现上述少数类图片样本的生成方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,处理器40执行计算机程序42时实现上述各装置实施例中各单元的功能,例如图2所示单元21至24、图3所示单元31至34的功能。
在本发明实施例中,该处理器40执行计算机程序42时实现上述各个屏幕唤醒的控制方法实施例中的步骤时,当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,根据训练后的生成对抗网络,构造条件生成对抗网络,通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。
该计算设备4中处理器40在执行计算机程序42时实现的步骤具体可参考实施例一中方法的描述,在此不再赘述。
实施例五:
在本发明实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述少数类图片样本的生成方法实施例中的步骤,例如,图1所示的步骤S101至S104。或者,该计算机程序被处理器执行时实现上述各装置实施例中各单元的功能,例如图2所示单元21至24、图3所示单元31至34的功能。
在本发明实施例中,当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,根据训练后的生成对抗网络,构造条件生成对抗网络,通过随机噪音向量、预设标签和训练样本集对条件生成对抗网络进行训练,根据随机噪音向量和用户请求中包括的少数类标签,通过训练后的条件生成对抗网络生成少数类图片样本,从而提高了生成的少数类图片样本的泛化效果和质量,进而提高了少数类图片样本的生成效率。该计算机程序被处理器执行时实现的少数类图片样本的生成方法进一步可参考前述方法实施例中步骤的描述,在此不再赘述。
本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质,例如,ROM/RAM、磁盘、光盘、闪存等存储器。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种少数类图片样本的生成方法,其特征在于,所述方法包括下述步骤:
当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,所述训练样本集由标签不平衡图片样本组成;
根据所述训练后的生成对抗网络,构造条件生成对抗网络;
通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练;
根据所述随机噪音向量和所述用户请求中包括的少数类标签,通过所述训练后的条件生成对抗网络生成少数类图片样本。
2.如权利要求1所述的方法,其特征在于,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练的步骤,包括:
根据所述随机噪音向量和训练样本集,通过所述生成对抗网络生成第一生成样本;
根据所述第一生成样本,通过预先构造的第一判别模型获取第一判别结果;
根据预设的第一价值方程分别对所述生成对抗网络和第一判别模型进行训练。
3.如权利要求1所述的方法,其特征在于,所述条件生成对抗网络的非输入层与所述训练后的生成对抗网络对应的非输入层具有相同的结构和权重分布。
4.如权利要求1所述的方法,其特征在于,通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练的步骤,包括:
根据所述随机噪音向量、预设标签以及训练样本集,通过所述条件生成对抗网络生成第二生成样本;
根据所述第二生成样本,通过预先构造的第二判别模型获取第二判别结果;
根据预设的第二价值方程分别对所述条件生成对抗网络和第二判别模型进行训练。
5.一种少数类图片样本的生成装置,其特征在于,所述装置包括:
第一模型训练单元,用于当接收到生成少数类图片样本的用户请求时,通过符合预设分布的随机噪音向量和预设的训练样本集对预先构造的生成对抗网络进行训练,所述训练样本集由标签不平衡图片样本组成;
模型构造单元,用于根据所述训练后的生成对抗网络,构造条件生成对抗网络;
第二模型训练单元,用于通过所述随机噪音向量、预设标签和所述训练样本集对所述条件生成对抗网络进行训练;以及
样本生成单元,用于根据所述随机噪音向量和所述用户请求中包括的少数类标签,通过所述训练后的条件生成对抗网络生成少数类图片样本。
6.如权利要求5所述的装置,其特征在于,所述第一模型训练单元包括:
第一样本生成单元,用于根据所述随机噪音向量和训练样本集,通过所述生成对抗网络生成第一生成样本;
第一判别单元,用于根据所述第一生成样本,通过预先构造的第一判别模型获取第一判别结果;
第一训练单元,用于根据预设的第一价值方程分别对所述生成对抗网络和第一判别模型进行训练。
7.如权利要求6所述的装置,其特征在于,所述条件生成对抗网络的非输入层与所述训练后的生成对抗网络对应的非输入层具有相同的结构和权重分布。
8.如权利要求6所述的装置,其特征在于,所述第二模型训练单元包括:
第二样本生成单元,用于根据所述随机噪音向量、预设标签以及训练样本集,通过所述条件生成对抗网络生成第二生成样本;
第二判别单元,用于根据所述第二生成样本,通过预先构造的第二判别模型获取第二判别结果;
第二训练单元,用于根据预设的第二价值方程分别对所述条件生成对抗网络和第二判别模型进行训练。
9.一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述方法的步骤。
CN201710637315.0A 2017-07-31 2017-07-31 少数类图片样本的生成方法、装置、计算设备及存储介质 Active CN107392255B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710637315.0A CN107392255B (zh) 2017-07-31 2017-07-31 少数类图片样本的生成方法、装置、计算设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710637315.0A CN107392255B (zh) 2017-07-31 2017-07-31 少数类图片样本的生成方法、装置、计算设备及存储介质

Publications (2)

Publication Number Publication Date
CN107392255A true CN107392255A (zh) 2017-11-24
CN107392255B CN107392255B (zh) 2020-06-12

Family

ID=60342295

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710637315.0A Active CN107392255B (zh) 2017-07-31 2017-07-31 少数类图片样本的生成方法、装置、计算设备及存储介质

Country Status (1)

Country Link
CN (1) CN107392255B (zh)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108090902A (zh) * 2017-12-30 2018-05-29 中国传媒大学 一种基于多尺度生成对抗网络的无参考图像质量客观评价方法
CN108121975A (zh) * 2018-01-04 2018-06-05 中科汇通投资控股有限公司 一种联合原始数据和生成数据的人脸识别方法
CN108333183A (zh) * 2018-01-31 2018-07-27 西安工程大学 一种基于dcgan和dcnn的色织衬衫裁片缺陷检测方法
CN108460761A (zh) * 2018-03-12 2018-08-28 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN108629680A (zh) * 2018-04-03 2018-10-09 中国农业银行股份有限公司 一种风险识别方法及***
CN108648188A (zh) * 2018-05-15 2018-10-12 南京邮电大学 一种基于生成对抗网络的无参考图像质量评价方法
CN108763857A (zh) * 2018-05-29 2018-11-06 浙江工业大学 一种基于相似度生成对抗网络的过程软测量建模方法
CN108846405A (zh) * 2018-04-11 2018-11-20 东莞迪赛软件技术有限公司 基于ssgan的不平衡医保数据分类方法
CN108876847A (zh) * 2017-11-30 2018-11-23 北京旷视科技有限公司 图像定位方法、装置、***和存储介质
CN109190648A (zh) * 2018-06-26 2019-01-11 Oppo(重庆)智能科技有限公司 模拟环境生成方法、装置、移动终端及计算机可读取存储介质
CN109460708A (zh) * 2018-10-09 2019-03-12 东南大学 一种基于生成对抗网络的林火图像样本生成方法
CN109508647A (zh) * 2018-10-22 2019-03-22 北京理工大学 一种基于生成对抗网络的光谱数据库扩展方法
CN109543720A (zh) * 2018-10-30 2019-03-29 东华大学 一种基于对抗生成网络的晶圆图缺陷模式识别方法
CN109634961A (zh) * 2018-12-05 2019-04-16 杭州大拿科技股份有限公司 一种试卷样本生成方法、装置、电子设备和存储介质
CN109658369A (zh) * 2018-11-22 2019-04-19 中国科学院计算技术研究所 视频智能生成方法及装置
CN109815920A (zh) * 2019-01-29 2019-05-28 南京信息工程大学 基于卷积神经网络和对抗卷积神经网络的手势识别方法
CN110188824A (zh) * 2019-05-31 2019-08-30 重庆大学 一种小样本植物病害识别方法及***
CN110210505A (zh) * 2018-02-28 2019-09-06 北京三快在线科技有限公司 样本数据的生成方法、装置及电子设备
CN110245459A (zh) * 2019-06-28 2019-09-17 北京师范大学 激光清洗效果预览方法及装置
CN110276802A (zh) * 2019-06-26 2019-09-24 湖南大学 医学图像中病症组织定位方法、装置与设备
CN110334657A (zh) * 2019-07-08 2019-10-15 创新奇智(北京)科技有限公司 一种鱼眼畸变图像的训练样本生成方法、***及电子设备
CN110427994A (zh) * 2019-07-24 2019-11-08 腾讯医疗健康(深圳)有限公司 消化道内镜图像处理方法、装置、存储介质、设备及***
CN110647986A (zh) * 2019-08-13 2020-01-03 杭州电子科技大学 一种基于对抗式生成网络的道路破损图像生成方法
WO2020149960A1 (en) * 2019-01-16 2020-07-23 Microsoft Technology Licensing, Llc Finding complementary digital images using a conditional generative adversarial network
CN111784592A (zh) * 2020-05-19 2020-10-16 知昇(上海)人工智能科技有限公司 一种基于gan的自动化设计图像生成方法
CN112116025A (zh) * 2020-09-28 2020-12-22 北京嘀嘀无限科技发展有限公司 用户分类模型的训练方法、装置、电子设备及存储介质
CN112215268A (zh) * 2020-09-27 2021-01-12 浙江工业大学 一种灾害天气卫星云图分类方法和装置
CN112613599A (zh) * 2020-12-15 2021-04-06 江西师范大学 一种基于生成对抗网络过采样的网络入侵检测方法
CN112712002A (zh) * 2020-12-24 2021-04-27 深圳力维智联技术有限公司 基于cgan的环境监控方法、装置、***及存储介质
US11776292B2 (en) 2020-12-17 2023-10-03 Wistron Corp Object identification device and object identification method

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
IAN J. GOODFELLOW等: "Generative Adversarial Nets", 《ARXIV》 *
MEHDI MIRZA等: "Conditional Generative Adversarial Nets", 《ARXIV》 *
QQ_34420188: "GAN:生成式对抗网络介绍和其优缺点以及研究现状", 《CSDN》 *
王坤峰 等: "生成式对抗网络GAN的研究进展与展望", 《自动化学报》 *

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108876847B (zh) * 2017-11-30 2021-04-27 北京旷视科技有限公司 图像定位方法、装置、***和存储介质
CN108876847A (zh) * 2017-11-30 2018-11-23 北京旷视科技有限公司 图像定位方法、装置、***和存储介质
CN108090902A (zh) * 2017-12-30 2018-05-29 中国传媒大学 一种基于多尺度生成对抗网络的无参考图像质量客观评价方法
CN108090902B (zh) * 2017-12-30 2021-12-31 中国传媒大学 一种基于多尺度生成对抗网络的无参考图像质量客观评价方法
CN108121975A (zh) * 2018-01-04 2018-06-05 中科汇通投资控股有限公司 一种联合原始数据和生成数据的人脸识别方法
CN108121975B (zh) * 2018-01-04 2022-04-19 中科汇通投资控股有限公司 一种联合原始数据和生成数据的人脸识别方法
CN108333183A (zh) * 2018-01-31 2018-07-27 西安工程大学 一种基于dcgan和dcnn的色织衬衫裁片缺陷检测方法
CN108333183B (zh) * 2018-01-31 2021-03-16 西安工程大学 一种基于dcgan和dcnn的色织衬衫裁片缺陷检测方法
CN110210505A (zh) * 2018-02-28 2019-09-06 北京三快在线科技有限公司 样本数据的生成方法、装置及电子设备
CN108460761A (zh) * 2018-03-12 2018-08-28 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN108629680A (zh) * 2018-04-03 2018-10-09 中国农业银行股份有限公司 一种风险识别方法及***
CN108846405A (zh) * 2018-04-11 2018-11-20 东莞迪赛软件技术有限公司 基于ssgan的不平衡医保数据分类方法
CN108648188B (zh) * 2018-05-15 2022-02-11 南京邮电大学 一种基于生成对抗网络的无参考图像质量评价方法
CN108648188A (zh) * 2018-05-15 2018-10-12 南京邮电大学 一种基于生成对抗网络的无参考图像质量评价方法
CN108763857A (zh) * 2018-05-29 2018-11-06 浙江工业大学 一种基于相似度生成对抗网络的过程软测量建模方法
CN109190648A (zh) * 2018-06-26 2019-01-11 Oppo(重庆)智能科技有限公司 模拟环境生成方法、装置、移动终端及计算机可读取存储介质
CN109190648B (zh) * 2018-06-26 2020-12-29 Oppo(重庆)智能科技有限公司 模拟环境生成方法、装置、移动终端及计算机可读取存储介质
CN109460708A (zh) * 2018-10-09 2019-03-12 东南大学 一种基于生成对抗网络的林火图像样本生成方法
CN109508647A (zh) * 2018-10-22 2019-03-22 北京理工大学 一种基于生成对抗网络的光谱数据库扩展方法
CN109543720B (zh) * 2018-10-30 2023-10-27 东华大学 一种基于对抗生成网络的晶圆图缺陷模式识别方法
CN109543720A (zh) * 2018-10-30 2019-03-29 东华大学 一种基于对抗生成网络的晶圆图缺陷模式识别方法
CN109658369A (zh) * 2018-11-22 2019-04-19 中国科学院计算技术研究所 视频智能生成方法及装置
CN109634961B (zh) * 2018-12-05 2021-06-04 杭州大拿科技股份有限公司 一种试卷样本生成方法、装置、电子设备和存储介质
CN109634961A (zh) * 2018-12-05 2019-04-16 杭州大拿科技股份有限公司 一种试卷样本生成方法、装置、电子设备和存储介质
WO2020149960A1 (en) * 2019-01-16 2020-07-23 Microsoft Technology Licensing, Llc Finding complementary digital images using a conditional generative adversarial network
US10949706B2 (en) 2019-01-16 2021-03-16 Microsoft Technology Licensing, Llc Finding complementary digital images using a conditional generative adversarial network
CN109815920A (zh) * 2019-01-29 2019-05-28 南京信息工程大学 基于卷积神经网络和对抗卷积神经网络的手势识别方法
CN110188824A (zh) * 2019-05-31 2019-08-30 重庆大学 一种小样本植物病害识别方法及***
CN110276802A (zh) * 2019-06-26 2019-09-24 湖南大学 医学图像中病症组织定位方法、装置与设备
CN110245459A (zh) * 2019-06-28 2019-09-17 北京师范大学 激光清洗效果预览方法及装置
CN110334657B (zh) * 2019-07-08 2020-08-25 创新奇智(北京)科技有限公司 一种鱼眼畸变图像的训练样本生成方法、***及电子设备
CN110334657A (zh) * 2019-07-08 2019-10-15 创新奇智(北京)科技有限公司 一种鱼眼畸变图像的训练样本生成方法、***及电子设备
CN110427994A (zh) * 2019-07-24 2019-11-08 腾讯医疗健康(深圳)有限公司 消化道内镜图像处理方法、装置、存储介质、设备及***
CN110647986A (zh) * 2019-08-13 2020-01-03 杭州电子科技大学 一种基于对抗式生成网络的道路破损图像生成方法
CN111784592A (zh) * 2020-05-19 2020-10-16 知昇(上海)人工智能科技有限公司 一种基于gan的自动化设计图像生成方法
CN112215268A (zh) * 2020-09-27 2021-01-12 浙江工业大学 一种灾害天气卫星云图分类方法和装置
CN112116025A (zh) * 2020-09-28 2020-12-22 北京嘀嘀无限科技发展有限公司 用户分类模型的训练方法、装置、电子设备及存储介质
CN112613599A (zh) * 2020-12-15 2021-04-06 江西师范大学 一种基于生成对抗网络过采样的网络入侵检测方法
US11776292B2 (en) 2020-12-17 2023-10-03 Wistron Corp Object identification device and object identification method
CN112712002A (zh) * 2020-12-24 2021-04-27 深圳力维智联技术有限公司 基于cgan的环境监控方法、装置、***及存储介质
CN112712002B (zh) * 2020-12-24 2024-05-14 深圳力维智联技术有限公司 基于cgan的环境监控方法、装置、***及存储介质

Also Published As

Publication number Publication date
CN107392255B (zh) 2020-06-12

Similar Documents

Publication Publication Date Title
CN107392255A (zh) 少数类图片样本的生成方法、装置、计算设备及存储介质
Ai et al. Concept-aware deep knowledge tracing and exercise recommendation in an online learning system.
CN105912500B (zh) 机器学习模型生成方法和装置
CN109952581A (zh) 用于机器学习***的学习教练
CN109710761A (zh) 基于注意力增强的双向lstm模型的情感分析方法
CN111259738B (zh) 人脸识别模型构建方法、人脸识别方法及相关装置
CN109711544A (zh) 模型压缩的方法、装置、电子设备及计算机存储介质
CN108664893A (zh) 一种人脸检测方法及存储介质
CN106779053A (zh) 一种基于影响因子和神经网络的知识点摸底方法
CN107241213A (zh) 一种基于深度强化学习的Web服务组合方法
CN112052948B (zh) 一种网络模型压缩方法、装置、存储介质和电子设备
CN106548190A (zh) 模型训练方法和设备以及数据识别方法
CN107911491A (zh) 信息推荐方法、装置及存储介质、服务器和移动终端
CN108629326A (zh) 目标体的动作行为识别方法及装置
CN109847366A (zh) 用于游戏的数据处理方法和装置
CN109410974A (zh) 语音增强方法、装置、设备及存储介质
CN108776796A (zh) 一种基于全局时空注意力模型的动作识别方法
CN105550509B (zh) 一种医用输液滴速评价方法及***
CN107229966A (zh) 一种模型数据更新方法、装置及***
CN113344479B (zh) 面向在线课堂的学习参与度智能评估方法和装置
CN111282267A (zh) 信息处理方法、装置、介质及电子设备
CN110458247A (zh) 图像识别模型的训练方法及装置、图像识别方法及装置
CN107451230A (zh) 一种问答方法以及问答***
CN110531849A (zh) 一种基于5g通信的增强现实的智能教学***
CN109816438A (zh) 信息推送方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant