基于生成对抗网络的图片处理方法、装置及电子设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种基于生成对抗网络的图片处理方法、装置及电子设备。
背景技术
在实际的工作或生活中,人们常常会遇到需要对初始图片进行风格转换的问题,例如,广告主在广告位上投放广告图片之前,需要对人工设计得到的广告创意初始图片进行风格转换,以得到具有明显的营销、推广风格的目标广告图片,使得广告被投放之后能够取得更好的营销效果(较高的点击转化率)。
然而,现有的自动转换图片风格的图片处理方法,转换得到的目标图片往往色彩不均、图案混乱、质量低下。
发明内容
本说明书实施例提供了一种基于生成对抗网络的图片处理方法、装置及电子设备,以提高处理后的图片的质量。
为解决上述技术问题,本说明书实施例是这样实现的:
第一方面,提出了一种基于生成对抗网络的图片处理方法,包括:
获取待处理的初始图片;
将所述初始图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的图片;
将所述生成模型输出的图片作为处理后的具有预设风格的目标图片,其中,所述生成对抗网络是基于与所述初始图片尺寸相同的样本图片训练得到的,且所述目标图片与所述初始图片的尺寸相同。
第二方面,提出了一种基于生成对抗网络的广告图片处理方法,包括:
获取待处理的初始广告图片;
将所述初始广告图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的广告图片;
将所述生成模型输出的广告图片作为处理后的具有广告风格的目标广告图片,其中,所述生成对抗网络是基于与所述初始广告图片尺寸相同的样本广告图片训练得到的,且所述目标广告图片与所述初始广告图片的尺寸相同。
第三方面,提出了一种基于生成对抗网络的图片处理装置,包括:
第一获取模块,用于获取待处理的初始图片;
第一输入模块,用于将所述初始图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的图片;
第一确定模块,用于将所述生成模型输出的图片作为处理后的具有预设风格的目标图片,其中,所述生成对抗网络是基于与所述初始图片尺寸相同的样本图片训练得到的,且所述目标图片与所述初始图片的尺寸相同。
第四方面,提出了一种基于生成对抗网络的广告图片处理装置,包括:
第二获取模块,用于获取待处理的初始广告图片;
第二输入模块,用于将所述初始广告图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的广告图片;
第二确定模块,用于将所述生成模型输出的广告图片作为处理后的具有广告风格的目标广告图片,其中,所述生成对抗网络是基于与所述初始广告图片尺寸相同的样本广告图片训练得到的,且所述目标广告图片与所述初始广告图片的尺寸相同。
第五方面,提出了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取待处理的初始图片;
将所述初始图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的图片;
将所述生成模型输出的图片作为处理后的具有预设风格的目标图片,其中,所述生成对抗网络是基于与所述初始图片尺寸相同的样本图片训练得到的,且所述目标图片与所述初始图片的尺寸相同。
第六方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取待处理的初始图片;
将所述初始图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的图片;
将所述生成模型输出的图片作为处理后的具有预设风格的目标图片,其中,所述生成对抗网络是基于与所述初始图片尺寸相同的样本图片训练得到的,且所述目标图片与所述初始图片的尺寸相同。
第七方面,提出了一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行以下操作:
获取待处理的初始广告图片;
将所述初始广告图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的广告图片;
将所述生成模型输出的广告图片作为处理后的具有广告风格的目标广告图片,其中,所述生成对抗网络是基于与所述初始广告图片尺寸相同的样本广告图片训练得到的,且所述目标广告图片与所述初始广告图片的尺寸相同。
第八面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行以下操作:
获取待处理的初始广告图片;
将所述初始广告图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的广告图片;
将所述生成模型输出的广告图片作为处理后的具有广告风格的目标广告图片,其中,所述生成对抗网络是基于与所述初始广告图片尺寸相同的样本广告图片训练得到的,且所述目标广告图片与所述初始广告图片的尺寸相同。
由以上本说明书实施例提供的技术方案可见,本说明书实施例提供的方案至少具备如下一种技术效果:由于是通过将待处理的初始图片输入训练得到的生成对抗网络中的生成模型,获得具有预设风格的目标图片,而不是基于简单的规则对待处理的初始图片进行处理,因此可以提高处理得到的目标图片的质量。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本说明书实施例提供的一种基于生成对抗网络的图片处理方法的流程示意图之一。
图2是本说明书实施例提供的生成对抗网络的结构示意图。
图3是本说明书实施例提供的残差网络模型的结构示意图。
图4是本说明书实施例提供的生成对抗网络中的生成模型的结构示意图。
图5是本说明书实施例提供的一种基于生成对抗网络的图片处理方法的流程示意图之二。
图6是图5中的步骤108的一种详细流程示意图。
图7是本说明书实施例提供的一种基于生成对抗网络的广告图片处理方法的流程示意图。
图8是本说明书实施例提供的一种电子设备的结构示意图。
图9是本说明书实施例提供的一种基于生成对抗网络的图片处理装置的结构示意图之一。
图10是本说明书实施例提供的一种基于生成对抗网络的图片处理装置的结构示意图之二。
图11是图10中的模块904的一种详细结构示意图。
图12是本说明书实施例提供的一种广告基于生成对抗网络的图片处理装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为提高风格转换后的图片的质量,本说明书实施例提供一种基于生成对抗网络的图片处理方法及装置。本说明书实施例提供的基于生成对抗网络的图片处理方法及装置可以由电子设备执行,例如终端设备或服务端设备。换言之,所述方法可以由安装在终端设备或服务端设备的软件或硬件来执行。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
图1是本说明书的一个实施例提供的基于生成对抗网络的图片处理方法的流程示意图,如图1所示,该方法可以包括:
步骤102、获取待处理的初始图片。
待处理的初始图片,可以是预先保存的需要进行风格转换的图片,这些初始图片既可以由人工基于用户体验设计(User Experience Design,UED)得到,例如,待处理的初始图片可以是预先由人工基于UED设计得到的初始广告创意图片,也可以由其他方式获得,比如,可以是图像拍摄装置拍摄得到的照片。
步骤104、将所述初始图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的图片。
图2示出了生成对抗网络的一种结构示意图。如图2所示,生成对抗网络包括判别模型(Discriminative,D)和生成模型(Generative,G),其中,生成模型G学习到的是对于所观察数据的联合分布,判别模型D学习到的是条件概率分布,即学习到的是观察变量的前提下的非观察变量的分布情况。
其中,z是生成模型G的输入,一般情况下是高斯随机分布生成的噪音样本数据(在本说明书实施例中为样本图片),生成模型G图中示出3层框架和若干个节点,生成模型G的层数和各层的节点数可以根据实际需要调整。生成模型G的输出是G(z)。
在训练判别模型时,真实数据X的标签可以为1,来自生成模型G的输出G(Z)的标签可以为0。将真实数据X和生成模型G的输出G(Z)混合后,输入给判别模型D,判别模型D可以看作是一个二分类器。
在本说明书实施例中,判别模型D用于判别输入的图片是真实的初始图片,还是由生成模型G生成的虚拟的目标图片,其输出为概率。具体的,当判别模型的输出为1时,表明输入的是真实的初始图片;当判别模型的输出为0时,表明输入的是虚拟的目标图片。其中,判别模型D可以是基于卷积神经网络(Convolutional Neural Networks,CNN)和残差网络模型(Residual Networks,,ResNet)构造的。
图3示出了一种残差网络模型的结构示意图,如图3所示,该残差网络模型包括至少一个残差模块(图3仅示出了1个),该残差模块包括第一层卷积模块31和第二层卷积模块32,第一层卷积模块31和第二层卷积模块32通过激活函数(ReLUctant,ReLU)连接,当该残差模块的输入为X时,经过第一层卷积模块31和第二层卷积模块32的处理,得到F(X),再将X和F(X)相加传递给下一残差模块,该残差模块与下一残差模块也通过RELU连接。
在本说明书实施例中,生成模型G用于在接收到输入的初始图片z(真实图片)之后,输出转换风格后的目标图片G(z)(虚拟图片)。生成模型G的网络结构可以如图4所示,参考图4可知,将初始图片z输入生成模型G之后,生成模型G内部对输入的初始图片z先后经过了映射和重构(project and reshape)、卷积运算(Vector convolution,CONV)1、CONV2、CONV3和CONV4,最后输出目标图片G(z)。当然,生成模型G的网络结构还可以是除图4所示以外的结构,本说明书实施例对此不做限定。
步骤106、将所述生成模型输出的图片作为处理后的具有预设风格的目标图片。
其中,生成对抗网络是基于与所述初始图片尺寸相同的样本图片训练得到的,且所述目标图片与所述初始图片的尺寸相同。
在本说明书实施例中,生成对抗网络中的生成模型用于转换输入的初始图片的风格,而保持输入的初始图片的核心内容不变。
其中,预设风格可以是任意的风格,例如,如果待处理的初始图片是一张初始广告创意图片,那么预设风格可以是广告推广风格;再如,如果待处理的图片是在夏季拍摄的某一风景的照片,那么预设风格可以是冬季风格,等等。
在本说明书实施例中,对于生成对抗网络中的生成模型G来说,其目标是生成几乎可以乱真的目标图片,以欺骗其中的判别模型D,使得判别模型D难以判别出它的真假。而对于生成对抗网络中的判别模型D来说,其目标是防止被生成模型G欺骗。那么,当判别模型D和生成模型G达到纳什平衡时,说明生成模型G的输出的图片已经可以乱真,生成模型G成功地欺骗了判别模型D,此时可以将生成模型G的输出的图片作为初始图片对应的具有预设风格的目标图片。
本说明书实施例,由于是通过将待处理的初始图片输入训练得到的生成对抗网络中的生成模型,获得具有预设风格的目标图片,而不是基于简单的规则对待处理的初始图片进行处理,因此可以提高处理得到的目标图片的质量。
如图5所示,在本说明书的另一实施例中,在上述步骤102之前,基于生成对抗网络的图片处理方法,还可以包括:
步骤108、训练所述生成对抗网络中的生成模型和判别模型。
生成对抗网络的思想是生成模型和判别模型不断对抗训练,从而实现两个模型的相互提升。根据图3和图4可知,生成对抗网络中的生成模型G和判别模型D是两个相互独立的模型。但训练生成模型G时的误差来源于判别模型G,因此,二者的训练过程为单独交替训练,例如,单独交替执行下述子步骤602和子步骤604,直到判别模型和生成模型达到纳什平衡。
参考图6可知,训练所述生成对抗网络中的生成模型和判别模型,具体可以包括:
子步骤602、训练所述生成对抗网络中的判别模型。
详细的,子步骤603可以包括:固定生成模型的参数,将所述样本图片输入所述生成模型,获得所述生成模型输出的样本输出图片;将所述样本图片和所述样本输出图片分别作为正负样本训练所述判别模型。
在训练判别模型的过程中,将所述样本图片作为正样本的含义是,将所述样本图片的标签设为1,将所述样本输出图片作为负样本的含义是,将所述样本输出图片的标签设为0,如此一来,对判别模型的训练即是一个有监督的二分类模型训练。
可以理解,在判别模型的第一次训练中,用来生成样本输出图片的生成模型可以是初始构建的、未经训练的生成模型;在判别模型的第N次训练中(N为大于1的整数),用来生成样本输出图片的生成模型是下述子步骤604训练后的生成模型。
子步骤604、训练所述生成对抗网络中的所述生成模型。
详细的,子步骤604可以包括:固定判别模型的参数,将所述样本图片输入所述生成模型,获得所述生成模型输出的样本输出图片;将所述样本输出图片作为正样本输入所述判别模型,并获得所述判别模型的判别结果,所述判别结果包括将所述样本输出图片判别为所述样本图片的概率。
子步骤606、判断所述判别模型和所述生成模型是否达到纳什平衡,如果是,执行步骤110,否则执行步骤610。
在本说明书实施例中,判断所述判别模型和所述生成模型是否达到纳什平衡的方式可以是,判断判别模型的判别结果是否收敛于0.5,也即在判别模型判别不出生成模型生成的样本输出图片是真实的样本图片还是生成模型生成的虚拟图片的时候,认为所述判别模型和所述生成模型达到了纳什平衡。
子步骤610、对所述生成模型进行优化。
对所述生成模型进行优化的目标包括:相比于将优化前的所述生成模型的样本输出图片输入所述判别模型,在将所述生成模型的样本输出图片输入至所述判别模型时,所述判别模型的输出结果增大。也即,相比于将优化前的所述生成模型的样本输出图片输入至所述判别模型,在将优化后的所述生成模型的样本输出图片输入至所述判别模型时,所述判别模型的输出结果更接近0.5。
子步骤612、对所述判别模型进行优化。
其中,所述判别模型的优化目标包括:相比于将所述样本图片输入至优化前的所述判别模型,在将所述样本图片输入至优化后的所述判别模型时,所述判别模型的输出结果增大,并且,相比于将所述样本图片输入至优化前的所述判别模型,在将所述生成模型的样本输出图片输入至优化后的所述判别模型时,所述判别模型的输出结果减小。也即,相比于将所述样本图片输入至优化前的所述判别模型,在将所述样本图片输入至优化后的所述判别模型时,所述判别模型的输出结果更接近0.5;相比于将所述生成模型的样本输出图片输入至优化前的所述判别模型,在将所述生成模型的样本输出图片输入至优化后的所述判别模型时,所述判别模型的输出结果更远离0.5。
步骤110、保存所述生成模型。
该保存的生成模型即可用于步骤604中生成初始图片对应的目标图片。
本说明书实施例提供的一种基于生成对抗网络的图片处理方法,由于可以通过不断地优化训练,得到与判别模型达到纳什平衡的生成模型,从而可以基于该生成模型对待处理的初始图片进行风格转换,因此,可以提高转换后的图片的质量。
基于与上述生成对抗网络的图片处理方法同样的技术构思,本说明书实施例还提供了一种基于生成对抗网络的广告图片处理方法,以实现将初始广告创意图片转换为具有明显的广告、推广风格的广告图片的目标。
如图7所示,本说明书实施例提供的一种基于生成对抗网络的广告图片处理方法,可以包括:
步骤702、获取待处理的初始广告图片。
待处理的初始广告图片,可以是预先由人工基于UED设计得到的初始广告创意图片。
步骤704、将所述初始广告图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的广告图片。
生成对抗网络包括判别模型(Discriminative,D)和生成模型(Generative,G)。
在本说明书实施例中,生成模型G用于在接收到输入的初始广告图片z(真实图片)之后,输出转换风格后的目标广告图片G(z)(虚拟图片)。
在本说明书实施例中,判别模型D用于判别输入的图片是真实的初始广告图片,还是由生成模型生成的虚拟的目标广告图片,其输出为概率。具体的,当判别模型的输出为1时,表明输入的是真实的初始广告图片;当判别模型的输出为0时,表明输入的是虚拟的目标广告图片。
步骤706、将所述生成模型输出的广告图片作为处理后的具有广告风格的目标广告图片。
其中,所述生成对抗网络是基于与所述初始广告图片尺寸相同的样本广告图片训练得到的,且所述目标广告图片与所述初始广告图片的尺寸相同。
在本说明书实施例中,生成对抗网络中的生成模型用于转换输入的初始广告图片的风格,而保持输入的初始广告图片的核心内容不变。
在本说明书实施例中,对于生成对抗网络中的生成模型G来说,其目标是生成几乎可以乱真的目标广告图片,以欺骗其中的判别模型D,使得判别模型难以判别出它的真假。而对于生成对抗网络中的判别模型D来说,其目标是防止被生成模型G欺骗。那么,当判别模型D和生成模型G达到纳什平衡时,说明生成模型G的输出的图片已经可以乱真,生成模型G成功地欺骗了判别模型D,此时可以将生成模型G的输出的图片作为初始广告图片对应的具有预设风格的目标广告图片。
本说明书实施例,由于是通过将待处理的初始广告图片输入训练得到的生成对抗网络中的生成模型,获得具有广告风格的目标图片,而不是基于简单的规则对待处理的初始广告图片进行处理,因此可以提高处理得到的目标广告图片的质量,不会出现色彩不均、图案混乱等问题。且实验表明,将利用本说明书实施例提供的方法处理后的广告图片投放之后,点击转化率提升了30%以上。
可选地,在步骤702之前,图7所示的方法还可以包括:
训练所述对抗生成网络中的生成模型和判别模型。
具体的训练过程与上文中图5所示的实施例描述的训练过程的区别在于,采用的样本图片为初始广告图片,其余过程类似,因此具体的训练过程可以参照上文,此处不做重复描述。
以上是对本说明书提供的方法实施例的说明,下面对本说明书提供的电子设备进行介绍。
图8是本说明书的一个实施例提供的电子设备的结构示意图。请参考图8,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(PeripheralComponent Interconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图8中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成基于生成对抗网络的图片处理装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取待处理的初始图片;
将所述初始图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的图片;
将所述生成模型输出的图片作为处理后的具有预设风格的目标图片,其中,所述生成对抗网络是基于与所述初始图片尺寸相同的样本图片训练得到的,且所述目标图片与所述初始图片的尺寸相同。
或者,处理器,执行存储器所存放的程序,并具体用于执行以下操作:
获取待处理的初始广告图片;
将所述初始广告图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的广告图片;
将所述生成模型输出的广告图片作为处理后的具有广告风格的目标广告图片,其中,所述生成对抗网络是基于与所述初始广告图片尺寸相同的样本广告图片训练得到的,且所述目标广告图片与所述初始广告图片的尺寸相同。
上述如本说明书图1或图5所示实施例揭示的基于生成对抗网络的图片处理方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(CentralProcessing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书一个或多个实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书一个或多个实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
该电子设备还可执行图1或图5的基于生成对抗网络的图片处理方法,本说明书在此不再赘述。
当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的方法,并具体用于执行以下操作:
获取待处理的初始图片;
将所述初始图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的图片;
将所述生成模型输出的图片作为处理后的具有预设风格的目标图片,其中,所述生成对抗网络是基于与所述初始图片尺寸相同的样本图片训练得到的,且所述目标图片与所述初始图片的尺寸相同。
本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图7所示实施例的方法,并具体用于执行以下操作:
获取待处理的初始广告图片;
将所述初始广告图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的广告图片;
将所述生成模型输出的广告图片作为处理后的具有广告风格的目标广告图片,其中,所述生成对抗网络是基于与所述初始广告图片尺寸相同的样本广告图片训练得到的,且所述目标广告图片与所述初始广告图片的尺寸相同。
下面对本说明书提供的基于生成对抗网络的图片处理装置进行说明。
如图9所示,本说明书的一个实施例提供了一种基于生成对抗网络的图片处理装置,在一种软件实施方式中,该基于生成对抗网络的图片处理装置900可包括:第一获取模块901、第一输入模块902和第一确定模块903。
第一获取模块901,用于获取待处理的初始图片。
第一输入模块902,用于将所述初始图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的图片。
生成对抗网络包括判别模型D和生成模型G,在本说明书实施例中,生成模型G用于在接收到输入的初始图片z(真实图片)之后,输出转换风格后的目标图片G(z)(虚拟图片);判别模型D用于判别输入的图片是真实的初始图片,还是由生成模型生成的虚拟的目标图片,其输出为概率。其中,所述判别模型可以是基于卷积神经网络和残差网络模型构造的。
第一确定模块903,用于将所述生成模型输出的图片作为处理后的具有预设风格的目标图片。
其中,所述生成对抗网络是基于与所述初始图片尺寸相同的样本图片训练得到的,且所述目标图片与所述初始图片的尺寸相同。
在本说明书实施例中,生成对抗网络中的生成模型用于转换输入的初始图片的风格,而保持输入的初始图片的核心内容不变。
在本说明书实施例中,对于生成对抗网络中的生成模型G来说,其目标是生成几乎可以乱真的目标图片,以欺骗其中的判别模型D,使得判别模型难以判别出它的真假。而对于生成对抗网络中的判别模型D来说,其目标是防止被生成模型G欺骗。那么,当判别模型D和生成模型G达到纳什平衡时,说明生成模型G的输出的图片已经可以乱真,生成模型G成功地欺骗了判别模型D,此时可以将生成模型G的输出的图片作为初始图片对应的具有预设风格的目标图片。
本说明书实施例,由于是通过将待处理的初始图片输入训练得到的生成对抗网络中的生成模型,获得具有预设风格的目标图片,而不是基于简单的规则对待处理的初始图片进行处理,因此可以提高处理得到的目标图片的质量。
如图10所示,本说明书的另一个实施例提供的一种基于生成对抗网络的图片处理装置900还可包括:
训练模块904,用于在获取待处理的初始图片之前,训练所述生成对抗网络中的所述生成模型和判别模型。
生成对抗网络的思想是生成模型和判别模型不断对抗训练,从而实现两个模型的相互提升。生成对抗网络中的生成模型G和判别模型D是两个相互独立的模型。但训练生成模型G时的误差来源于判别模型G,因此,二者的训练过程为单独交替训练,例如,单独交替触发下述第一训练子模块111和第二训练子模块112,直到判别模型和生成模型达到纳什平衡。
详细的,如图11所示,训练模块904包括:
第一训练子模块111,用于训练所述生成对抗网络中的判别模型。
详细的,第一训练子模块111,可用于将所述样本图片输入所述生成模型,获得所述生成模型输出的样本输出图片;将所述样本图片和所述样本输出图片分别作为正负样本训练所述判别模型。
第二训练子模块112,用于训练所述生成对抗网络中的所述生成模型。
详细的,第二训练子模块112,可用于将所述样本图片输入所述生成模型,获得所述生成模型输出的样本输出图片;将所述样本输出图片作为正样本输入所述判别模型,并获得所述判别模型的判别结果,所述判别结果包括将所述样本输出图片判别为所述样本图片的概率。
判断子模块113,用于判断所述判别模型和所述生成模型是否达到纳什平衡,如果是,触发下述保存模块905,否则触发下述第一优化子模块114。
第一优化子模块114,用于在获得所述判别模型的判别结果之后,当所述判别模型和所述生成模型未达到纳什平衡时,对所述生成模型进行优化。
其中,所述生成模型进行优化的目标包括:相比于将优化前的所述生成模型的样本输出图片输入所述判别模型,在将优化后的所述生成模型的样本输出图片输入至所述判别模型时,所述判别模型的输出结果增大。
第二优化子模块115,用于对所述判别模型进行优化。.
其中,所述判别模型的优化目标包括:相比于将所述样本图片输入至优化前的所述判别模型,在将所述样本图片输入至优化后的所述判别模型时,所述判别模型的输出结果增大,并且,相比于将所述生成模型的样本输出图片输入至优化前的所述判别模型,在将所述生成模型的样本输出图片输入至优化后的所述判别模型时,所述判别模型的输出结果减小。
保存模块905,用于保存所述生成模型。
该保存的生成模型即可用于第一输入模块902中生成初始图片对应的目标图片。
本说明书实施例提供的一种基于生成对抗网络的图片处理装置,由于可以通过不断地优化训练,得到与判别模型达到纳什平衡的生成模型,从而可以基于该生成模型对待处理的初始图片进行风格转换,因此,可以提高转换后的图片的质量。
需要说明的是,基于生成对抗网络的图片处理装置900能够实现图1的方法实施例的方法,具体可参考图7所示实施例的基于生成对抗网络的图片处理方法,不再赘述。
如图12所示,本说明书的又一个实施例还提供了一种基于生成对抗网络的广告图片处理装置120,包括:第二获取模块121、第二输入模块122和第二确定模块123。
第二获取模块121,用于获取待处理的初始广告图片。
第二输入模块122,用于将所述初始广告图片输入生成对抗网络中的生成模型,并获得所述生成模型输出的广告图片。
第二确定模块123,用于将所述生成模型输出的广告图片作为处理后的具有广告风格的目标广告图片,其中,所述生成对抗网络是基于与所述初始广告图片尺寸相同的样本广告图片训练得到的,且所述目标广告图片与所述初始广告图片的尺寸相同。
在本说明书实施例中,对于生成对抗网络中的生成模型G来说,其目标是生成几乎可以乱真的目标广告图片,以欺骗其中的判别模型D,使得判别模型难以判别出它的真假。而对于生成对抗网络中的判别模型D来说,其目标是防止被生成模型G欺骗。那么,当判别模型D和生成模型G达到纳什平衡时,说明生成模型G的输出的图片已经可以乱真,生成模型G成功地欺骗了判别模型D,此时可以将生成模型G的输出的图片作为初始广告图片对应的具有预设风格的目标广告图片。
本说明书实施例,由于是通过将待处理的初始广告图片输入训练得到的生成对抗网络中的生成模型,获得具有广告风格的目标图片,而不是基于简单的规则对待处理的初始广告图片进行处理,因此可以提高处理得到的目标广告图片的质量,不会出现色彩不均、图案混乱等问题。且实验表明,将利用本说明书实施例提供的装置处理后的广告图片投放之后,点击转化率提升了30%以上。
可选地,图12所示的装置还可以包括:训练模块,用于训练所述对抗生成网络中的生成模型和判别模型。
具体的训练过程与上文中图5所示的实施例描述的训练过程的区别在于,采用的样本图片为初始广告图片,其余过程类似,因此具体的训练过程可以参照上文,此处不做重复描述。
需要说明的是,基于生成对抗网络的广告图片处理装置120能够实现图7的方法实施例的方法,具体可参考图7所示实施例的基于生成对抗网络的广告图片处理方法,不再赘述。
上述对本说明书特定实施例进行了描述,其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
总之,以上所述仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书一个或多个实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的保护范围之内。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制时,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。