CN109064423B

CN109064423B - 一种基于非对称循环生成对抗损失的智能修图方法

Info

Publication number: CN109064423B
Application number: CN201810810809.9A
Authority: CN
Inventors: 高钦泉; 高哲玲; 刘文哲; 童同
Original assignee: Fujian Imperial Vision Information Technology Co ltd
Current assignee: Fujian Imperial Vision Information Technology Co ltd
Priority date: 2018-07-23
Filing date: 2018-07-23
Publication date: 2022-04-08
Anticipated expiration: 2038-07-23
Also published as: CN109064423A

Abstract

本发明公开一种基于非对称循环生成对抗损失的智能修图方法，将用于图像翻译CycleGAN中的循环一致性思想应用于智能修图领域，提出了非对称循环生成对抗损失，将wGAN运用在循环生成对抗网络的训练中。本发明使用四个子网络组成整体网络结构，并利用非对称循环生成对抗损失来训练，最终得到的正向生成器能改善未修图的色彩、亮度、人像效果等多方特征，提高了图像的视觉感受。

Description

一种基于非对称循环生成对抗损失的智能修图方法

技术领域

本发明涉及图像增强领域，尤其涉及一种基于非对称循环生成对抗损失的智能修图方法。

背景技术

修图属于图像增强领域，将图片的色调、纹理、亮度等进行一定的处理，调整，从而达到更好的视觉效果。随着生活水平的提高，人们对修图的要求也随之提高，如今修图已是业余摄影以及专业摄影都不可或缺的技术之一。

传统的图像增强方法可分为两大类：频域法与空域法。在频域法方面，陈春宁等人^[6]改进了频域高斯高通滤波器、巴特沃斯高通滤波器、指数高通滤波器，得出了三种同态滤波器，并通过实验结果给出适用的滤波模型和表达式参数。该方法对图像进行灰度动态范围压缩和对比度增强的效果显著；在空域法方面，Bea等人^[4]提出了一种双尺度色调管理方法，其使用大规模色调平衡管理来控制图像大尺度空间色调变化，同时引入了一种计算局部高频成分来处理强边缘纹理的滤波器。该方法对图像的纹理细节进行增强，使得图像更清晰。Edwin.H.Land等人^[7]提出了一种以色感一致性为基础的图像增算法Retinex，该方法在动态范围压缩、边缘增强和颜色恒常三个方面达到平衡，因此可以对各种不同类型的图像进行增强。传统的图像增强方法通常是使用某种运算操作，如滤波器，来增强图像某一方面的信息。处理图像的单一性以及众多参数的选择和调优，使得传统算法具有较大的局限性。

为了获得更好的图像增强效果，近年来，学术界开始使用深度学习来进行图像增强。(1)Hasinoff S W等人^[5]其受双边网格处理和局部仿射变换的启发，提出了一个结合局部特征与全局特征的卷积神经网络结构。该网络可以用于学习复杂的，依赖于场景转换的图像编辑过程。(2)Andrey Ignatov等人^[2]提出了一种端到端的生成对抗网络将普通照片转换为DSLR图像。此研究引入了一种综合感知误差函数，其将内容，颜色和纹理损失相结合。该方法改进的图像质量与单反相机拍摄的照片相媲美，且适用于任何类型的数码相机。(3)Zhu J Y等人^[3]提出了一种循环生成对抗网络(CycleGAN)来实现不同风格图像的翻译，该网络由两个不同方向的生成器和两个不同领域的判别器组，其使用来自于源域的数据进行对网络进行训练。方法(1)和(2)要求端到端匹配的训练数据，而CycleGAN则可以使用不匹配的数据训练实现图像翻译。

虽然相关研究已经取得了较好的修图效果，但是还是存在一些问题。当采用传统的方法进行图像增强时，往往只能处理图像单方面问题，无法一次性对图像进行多方改善，不适用于自动修图；当采用基于传统神经网学习修图时，其要求一一匹配的训练数据；当采用改进型神经网络CycleGAN进行图像翻译时，虽解决了数据不匹配的问题，但使得训练过程太过自由、结果易失真。

发明内容

本发明的目的在于提供一种基于非对称循环生成对抗损失的智能修图方法。

本发明采用的技术方案是：

一种基于非对称循环生成对抗损失的智能修图方法，其包括如下步骤：

步骤1，将未修图与修后图处理后组成训练数据集；

从图像数据库的未修图I中按d*d截图子图像I_c，并同时从修后图J中截取相应大小的子图像J_c；I_c与J_c形成包含N个子图像的配对集

步骤2，预训练正向生成器；将配对集的未修图的子图像

作为模型的输入数据，进行初始卷积阶段、特征结合阶段、不同尺度卷积阶段，最终获得一幅与

对应的修后图像

所述步骤2具体包括以下步骤：

步骤2.1.1，初始卷积阶段：将未修图像

进行一次卷积运算和一次激活函数运算得到其初试卷积阶段的结果

其计算公式是：

其中

和

分别是本发明生成器的第一层网络的卷积权值参数和偏置参数；

步骤2.1.2，特征结合阶段：将初始卷积处理阶段得到的结果

依次经过四个连接模块，连接模块采用了跨越连接方式，将模块输入与其经过两层卷积后的处理结果相加作为模块输出。最终得到特征结合阶段的结果

其计算公式是：

其中

和

是连接模块中第1层和第2层的输出、

和

分别是生成器的第k个连接模块中第1层和第2层的卷积权值参数、

和

分别是第k个连接模块中第1层和第2层的偏置参数。第k个连接模块的输出为

步骤2.1.3，不同尺度卷积阶段：将特征结合阶段的结果G₅(I(xⁱ))经过卷积核尺度不完全相同的三个卷积层，得到最终的输出图像G(I(xⁱ))，其计算公式是：

其中

和

分别是不同尺度卷积处理阶段第1个、第2个和3个的卷积层的卷积权值参数，

和

分别是不同尺度卷积处理阶段第1个、第2个和3个的卷积层的偏置参数，

是本发明正向生成器的输出；

步骤2.2，更新优化正向生成器：基于正向生成器网络的总体损失不断更新并优化获得最优的卷积权值参数和偏置参数，此时总体损失由感知损失和均方误差组成。其中，感知损失是生成的修后图

经VGG-19网络^[1]提取的特征值与真实修后图

经VGG-19网络^[1]提取的特征值之间的欧氏距离，均方误差是生成修后图

与真实修后图

对应像素之间差值平方的平均值。所述损失的计算公式是：

为生成修后图

与真实修后图

之间的均方误差，其中n为图像的像素点总数；

为生成修后图

与真实修后图

之间的感知损失，其中

是VGG-19网络第j层网络的特征映射，C_j、H_j和W_j分别表示此时图像的通道数、高度和宽度；

为此时正向生成器网络G_f的总体损失。

步骤2.3，当训练结果生成的修后图与真实的修后图进行比较时没有获得预期的修图效果，则继续进行反向传播，利用梯度下降优化算法更新卷积权值参数和偏置参数，再执行步骤2.1至步骤2.2；当训练结果生成的修后图与真实的修后图进行比较时已获得预期的修图效果，则继续停止反向传播，并保存步骤2.2最终所获得的卷积权值参数和偏置参数。

步骤3，加载步骤2.3保存的最优卷积权值参数和偏置参数至正向生成器，在此基础上训练由正向生成器和修后图域判别器组成的Wasserstein生成对抗网络。

所述步骤3具体包括以下步骤：

步骤3.1，生成修后图像。将未修图

作为正向生成器G_f的输入数据，如步骤2.1得到与

对应的修后图像

步骤3.2，获取真实修后图像

的判别值。将真实修后图

作为修后图域判别器的输入，经过卷积处理阶段与全连接处理阶段，得到判别值

所述步骤3.2具体包括以下步骤：

步骤3.2.1，卷积处理阶段：将真实修后图

经过五层特征提取模块，特征提取模块由一个卷积层和一个下采样层组成，最终得到卷积处理阶段的结果

其计算公式是：

其中

和

表示判别器第t个卷积层的卷积权重参数和偏置参数，leak^t表示第t个卷积层激活函数Leaky relu的负轴斜率。

卷积处理阶段的结果

由M个值组成，M的表达式是：

其中d是训练数据库中图像的长和宽，width是此时的网络宽度。

步骤3.2.2，全连接处理阶段：将卷积处理阶段的结果

经过2个全连接层，得到最终的判别值

其计算公式是：

其中，

表示第一个全连接层中第r个神经元的输出，

和

分别表示全连接层第r个神经元的第j个输入的权值参数和偏置参数，

表示第一个全连接层的第j个输入。

步骤3.3，获取正向生成器生成的修后图像

的判别值。将生成修后图

作为修后图域判别器的输入，如步骤3.2得到判别值

步骤3.4，更新优化正向生成器：以步骤2训练的网络为基础，基于总体损失不断更新并优化正向生成器网络，获得最优的卷积权值参数和偏置参数，其中总体损失由感知损失、均方误差与对抗损失组成。对抗损失是由生成修后图的判别值

取反所得，感知损失与均方误差的获取如步骤2.2。所述损失的计算公式是：

其中

为生成修后图

的对抗损失；

为此时正向生成器网络G_f的总体损失。

步骤3.5，更新优化修后图域判别器：基于判别损失不断更新并优化修后图域判别器网络，获得最优的卷积权值参数和偏置参数。其中判别损失是由生成修后图的判别值减去真实的修后图的判别值所得，其计算公式是：

其中

为正向生成器生成的修后图像，

为真实修后图，

为正向生成器生成的修后图的判别值，

为真实修后图的判别值；

每执行n次步骤3.4再执行m次步骤3.5。

步骤3.6，当训练结果生成的修后图与真实的修后图进行比较时没有获得预期的修图效果，则继续进行反向传播，利用梯度下降优化算法更新卷积权值参数和偏置参数，再执行步骤3.1至步骤3.5；当训练结果生成的修后图与真实的修后图进行比较时已获得预期的修图效果，则继续停止反向传播，并保存步骤3.5最终所获得的卷积权值参数和偏置参数。

步骤4，预训练反向生成器。本发明的反向生成器的网络结构与正向生成器完全相同，并使用同样的方法进行预训练。

所述步骤4具体包括以下步骤：

步骤4.1，生成未修图像。参照步骤2.1，将修后图

作为反向生成器G_r的输入数据得到还原的未修图

步骤4.2，更新优化反向生成器。参照步骤2.2基于由感知损失

与均方误差

组成的总体损失

训练反向生成器。

步骤4.3，当训练结果生成的未修图与真实的未修图进行比较时没有获得预期的还原效果，则继续进行反向传播，利用梯度下降优化算法更新卷积权值参数和偏置参数，再执行步骤4.1至步骤4.2；当训练结果生成的未修图与真实的未修图进行比较时已获得预期的还原效果，则继续停止反向传播，并保存步骤4.2最终所获得的卷积权值参数和偏置参数。

步骤5，加载步骤4.3保存的最优卷积权值参数和偏置参数至反向生成器，在此基础上训练由反向生成器和未修图域判别器组成的Wasserstein生成对抗网络。本发明的未修图域判别器的网络结构与修后图域判别器完全相同，并采用同样的方向进行训练。

所述步骤5具体包括以下步骤：

步骤5.1，生成未修图像。参照步骤2.1，将修后图

作为反向生成器G_r的输入数据得到还原的未修图

步骤5.2，获取判别值。参照步骤3.2至步骤3.3，将生成未修图

与真实未修图

分别作为未修图域判别器D_r的输入，获得生成未修图的判别值

与真实未修图的判别值

步骤5.3，更新优化反向生成器：参照步骤3.4，基于总体损失不断更新并优化反向生成器网络，获得最优的卷积权值参数和偏置参数，总体损失

由感知损失

均方误差

与对抗损失

组成。

步骤5.4，更新优化未修图域判别器：基于判别损失

不断更新并优化未修图域判别器网络，获得最优的卷积权值参数和偏置参数。

步骤5.5，当训练结果生成的未修图与真实的未修图进行比较时没有获得预期的还原效果，则继续进行反向传播，利用梯度下降优化算法更新卷积权值参数和偏置参数，再执行步骤5.1至步骤5.4；当训练结果生成的未修图与真实的未修图进行比较时已获得预期的还原效果，则继续停止反向传播，并保存步骤5.4最终所获得的卷积权值参数和偏置参数。

步骤6，加载步骤3保存的最优卷积权值参数和偏置参数至正向生成器和修后图域判别器，且加载步骤5保存的最优卷积权值参数和偏置参数至反向生成器和未修图域判别器，在此基础上训练由这四个子网络组成的整体网络。

所述步骤6具体包括以下步骤：

步骤6.1，获取循环生成网络的结果。

所述步骤6.1具体包括以下步骤：

步骤6.1.1，将步骤1得到的未修图

作为正向生成器G_f的输入，如步骤2.1处理得到生成的修后图

步骤6.1.2，将步骤6.1.1得到的

作为反向生成G_r的输入，如步骤4第一步处理得到循环生成的未修图

步骤6.1.3，将步骤1得到的修后图

作为反向生成器G_r的输入，如步骤4第一步处理得到生成的未修图

步骤6.1.4，将步骤6.1.3得到的

作为正向生成器G_f的输入，如步骤2.1处理得到循环生成的修后图

步骤6.2，更新优化正向生成器。以步骤3训练的正向生成器网络为基础，基于总体损失不断更新并优化正向生成器网络，获得最优的卷积权值参数和偏置参数，此时的总体损失由修后图域的感知损失、均方误差、对抗损失和未修图域的对抗损失组成。其中，修后图域的感知损失、均方误差、对抗损失获取方式如步骤3.4，未修图域的对抗损失是将循环生成的未修图

输入未修图域判别器D_r处理得到的判别值取反所得。此时正向生成器的总体损失计算公式是：

步骤6.3，更新优化反向生成器。

步骤6.3.1，以步骤5训练的反向生成器网络为基础，基于总体损失不断更新并优化反向生成器网络，获得最优的卷积权值参数和偏置参数，此时的总体损失由未修图域的感知损失、均方误差、对抗损失和修后图域的对抗损失组成；其中，修后图域的对抗损失是将循环生成的修后图

输入修后图域判别器D_f处理得到的判别值取反所得；此时反向生成器的总体损失计算公式是：

步骤6.3.2，判断步骤6.3.1执行次数是否达到n次；是则执行步骤6.4，否则执行步骤6.2；

步骤6.4，更新优化修后图域判别器；

以步骤3训练的修后图域判别器网络为基础，基于判别损失不断更新并优化修后图域判别器网络，获得最优的卷积权值参数和偏置参数；

步骤6.5，更新优化未修图域判别器；

步骤6.5.1，以步骤5训练的未修图域判别器网络为基础，基于判别损失不断更新并优化修后图域判别器网络，获得最优的卷积权值参数和偏置参数；

步骤6.5.2，判断步骤6.5.1执行次数是否达到m次；是则执行步骤6.6，否则执行步骤6.4；

步骤6.6，当训练得到的正向生成器生成的修后图与真实的修后图进行比较时没有获得预期的修图效果，则继续进行反向传播，利用梯度下降优化算法更新卷积权值参数和偏置参数，再执行步骤6.1至步骤6.5；当训练得到的正向生成器生成的修后图与真实的修后图进行比较时已获得预期的修图效果，则继续停止反向传播，并保存步骤6.5最终所获得的卷积权值参数和偏置参数。

本发明采用以上技术方案，使用四个子网络组成整体网络结构，并利用非对称循环生成对抗损失来训练，最终得到的正向生成器能改善未修图的色彩、亮度、人像效果等多方特征，提高了图像的视觉感受。本发明提出的基于非对称循环生成对抗损失的智能修图方法的创新性主要体现在3个方面：第一，本发明首次将用于图像翻译CycleGAN中的循环一致性思想^[3]应用于智能修图领域。第二，本发明首次提出了非对称循环生成对抗损失。第三，本发明首次将wGAN运用在循环生成对抗网络的训练中。

附图说明

以下结合附图和具体实施方式对本发明做进一步详细说明；

图1为本发明修图生成对抗网络的整体网络结构；

图2为本发明的生成器结构示意图；

图3为本发明的判别器结构示意图；

图4为原始训练数据集中的未修图；

图5为原始训练数据集中的修后图；

图6为采用本发明方法处理的结果图；

图7为采用现有Retinex处理后的结果图。

具体实施方式

如图1-7之一所示，本发明公开了一种基于非对称循环生成对抗损失的智能修图方法，其分为以下几个步骤：

步骤1，训练数据准备阶段。

所述步骤1具体包括以下步骤：

步骤1.1，选用训练数据集：本发明使用的是以海边婚纱照为主题的图像数据，包含了未修图像和修后图像对。其中修后图是由未修图经过影楼修图师手工修缮得来。修图师在修图过程中，对人像进行了瘦脸、瘦腿、对背景进行了加云朵、去杂物等处理，这使得未修图像和修后图像结构在一定程度上不完全匹配。

步骤1.2，处理图像数据库，形成未修图与修后图的配对集：从未修图I中按d*d(本发明中d＝256)截图子图像I_c，并同时从修后图J中截取相应大小的子图像J_c，形成包含N个子图像的配对集

步骤2，预训练正向生成器。

所述步骤2具体包括以下步骤：

步骤2.1生成修后图像。将步骤1得到的未修图

对应的修后图像

表1为本发明对生成器连接模块的参数设置、表2为本发明对生成器卷积层的参数设置。

网络层次	卷积核大小	输入网络宽度	输出网络宽度	步长	激活函数
						卷积层b1	3*3	64	64	1	ReLU
卷积层b2	3*3	64	64	1	ReLU

表1连接模块参数

网络层次	卷积核大小	输入网络宽度	输出网络宽度	步长	激活函数
						卷积层1	3*3	3	64	1	ReLU
卷积层2	3*3	64	64	1	ReLU
						卷积层3	3*3	64	64	1	ReLU
卷积层4	9*9	64	3	1	tanh

表2生成器卷积层参数

所述步骤2.1具体包括以下步骤：

步骤2.1.1，初始卷积阶段：将未修图像

其计算公式是：

其中

和

步骤2.1.2，特征结合阶段：将初始卷积处理阶段得到的结果

依次经过四个连接模块，其中每个连接模块将模块输入与经过两层卷积后的处理结果相加作为模块输出。最终得到特征结合阶段的结果

其计算公式是：

其中

和

是连接模块中第1层和第2层的输出、

和

和

步骤2.1.3，不同尺度卷积阶段：将特征结合阶段的结果G₅(I(xⁱ))经过卷积核尺度不完全相同的三个卷积层，本发明此步的前两个卷积层的卷积核大小为3x3，最后一个卷积层的卷积核大小为9x9。最终得到输出图像G(I(xⁱ))，其计算公式是：

其中

和

和

是本发明正向生成器的输出；

经VGG-19网络^[1]提取的特征值与真实修后图

与真实修后图

对应像素之间差值平方的平均值。所述损失的计算公式是：

为生成修后图

与真实修后图

之间的均方误差，其中n为图像的像素点总数；

为生成修后图

与真实修后图

之间的感知损失，其中

为此时正向生成器网络G_f的总体损失。本发明将系数α与β设置为1与0.01。

所述步骤3具体包括以下步骤：

步骤3.1，生成修后图像。将未修图

作为正向生成器G_f的输入数据，如步骤2.1得到与

对应的修后图像

步骤3.2，获取真实修后图像

的判别值。将真实修后图

作为修后图域判别器的输入，经过卷积处理阶段与全连接处理阶段得到判别值

表3为本发明对判别器卷积层的参数设置、表4为本发明对判别器全连接层的参数设置。

表3判别器卷积层参数

网络层次	神经元个数	激活函数
			全连接层1	1024	无
全连接层2	1	无

表4判别器全连接层参数

所述步骤3.2具体包括以下步骤：

步骤3.2.1，特征提取处理阶段：将真实修后图

经过五层特征提取模块，特征提取模块由一个卷积层和一个下采样层组成。最终得到卷积处理阶段的结果

其计算公式是：

其中

和

卷积处理阶段的结果

由M个值组成，M的表达式是：

生成修后图卷积处理提取的特征

计算过程同上。

步骤3.2.2，全连接处理阶段：将卷积处理阶段的结果

经过2层全连接层，得到最终的判别值

其计算公式是：

其中，

表示第一个全连接层中第r个神经元的输出，

和

表示第一个全连接层的第j个输入。

步骤3.3，获取正向生成器生成的修后图像的判别值。将生成修后图

作为修后图域判别器的输入，如步骤3.2得到判别值

其中

为生成修后图

的对抗损失；

为此时正向生成器网络G_f的总体损失。本发明将系数α、β和γ设置为1、0.01与(5e-8)。

其中

为正向生成器生成的修后图像，

为真实修后图，

为正向生成器生成的修后图的判别值，

为真实修后图的判别值；

每执行5次步骤3.4再执行1次步骤3.5。

所述步骤4具体包括以下步骤：

步骤4.1，生成未修图像。参照步骤2.1，将修后图

作为反向生成器G_r的输入数据得到还原的未修图

步骤4.2，更新优化反向生成器。参照步骤2.2基于由感知损失

与均方误差

组成的总体损失

训练反向生成器。

所述步骤5具体包括以下步骤：

步骤5.1，生成未修图像。参照步骤2.1，将修后图

作为反向生成器Gr的输入数据得到还原的未修图

步骤5.2，获取判别值。参照步骤3.2至步骤3.3，将生成未修图

与真实未修图

与真实未修图的判别值

由感知损失

均方误差

与对抗损失

组成。

步骤5.4，更新优化未修图域判别器：基于判别损失

步骤6.1，获取循环生成网络的结果。

所述步骤6.1具体包括以下步骤：

步骤6.1.1，将步骤1得到的未修图

作为正向生成器G_f的输入，如步骤2.1处理得到生成的修后图

步骤6.1.2，将步骤6.1.1得到的

步骤6.1.3，将步骤1得到的修后图

步骤6.1.4，将步骤6.1.3得到的

本发明将系数α、β、γ和μ分别设置为1、0.01、(5e-8)和(5e-10)。

步骤6.3，更新优化反向生成器。以步骤5训练的反向生成器网络为基础，基于总体损失不断更新并优化反向生成器网络，获得最优的卷积权值参数和偏置参数，此时的总体损失由未修图域的感知损失、均方误差、对抗损失和修后图域的对抗损失组成。其中，未修图域的感知损失、均方误差、对抗损失获取方式如步骤5.3，修后图域的对抗损失是将循环生成的修后图

输入修后图域判别器D_f处理得到的判别值取反所得。此时反向生成器的总体损失计算公式是：

步骤6.4，更新优化修后图域判别器。以步骤3训练的修后图域判别器网络为基础，如步骤3.5，基于判别损失不断更新并优化修后图域判别器网络，获得最优的卷积权值参数和偏置参数。

步骤6.5，更新优化未修图域判别器。以步骤5训练的未修图域判别器网络为基础，如步骤5.4，基于判别损失不断更新并优化修后图域判别器网络，获得最优的卷积权值参数和偏置参数。

每执行5次步骤6.2至6.3再执行1次步骤6.4至6.5。

为了验证本发明的有效性，将本发明的智能修图结果与Andrey Ignatov等人^[2]提出的利用深度卷积网络的修图结果进行对比。

从对比图4至7可以看出本发明比现有的传统修图技术Retinex处理效果更佳，其中Retinex在对图片进行边缘增强的同时放大了人脸的纹理，在颜色处理方面，处理后图片整体色调较未修图有所改善，但人像皮肤、背景绿植等局部色彩仍不能达到预期效果；而本发明使用基于非对称循环生成对抗损失使得所搭建的网络更好地学习到了未修图至修后图的映射关系，能对未修图的不同方面，如：色彩、亮度、对比度、饱和度等同时进行多方调节，智能修图结果更符合预期。

本发明使用四个子网络组成整体网络结构，并利用非对称循环生成对抗损失来训练，最终得到的正向生成器能改善未修图的色彩、亮度、人像效果等多方特征，提高了图像的视觉感受。本发明提出的基于非对称循环生成对抗损失的智能修图方法的创新性主要体现在3个方面：

第一，本发明首次将用于图像翻译CycleGAN中的循环一致性思想^[3]应用于智能修图领域。受该思想启发，本发明设计了新型的生成器子网络和判别器子网络，组成一个循环生成对抗的整体网络结构。该网络使得图像本身可以通过两个不同映射方向的生成器得到自已所在域的生成图像，并用不同域的判别器得到的判别值来评判生成器网络的性能。这种循环生成对抗网络解决了训练数据图像结构在一定程度上不完全匹配的问题；

第二，本发明首次提出了非对称循环生成对抗损失。已有技术CycleGAN的损失由源域的均方误差和源域的对抗损失组成，其评判生成器性能的损失只基于源域数据，适用于训练数据完全不匹配的图像翻译任务。而在修图领域，未修图和修后图是成对存在的，训练数据仅在一定程度上不匹配，若直接使用CycleGAN学习修图过程将使得生成器脱离目标域的约束而过于自由。故本发明提出了一种非对称循环生成对抗损失，在本发明中，生成器的损失由目标域的均方误差、感知损失与对抗损失和源域的对抗损失组成，生成器同时受到两个领域不对称的损失评判，更适用于使用修图时成对的但具体结构不完全匹配的训练数据学习。

第三，本发明首次将wGAN运用在循环生成对抗网络的训练中。传统的生成对抗网络使用的是原始GAN，原始GAN基于JS散度优化网络^[8]，其很难优化，易失去样本多样性，并且训练过程不稳定。而wGAN基于Wasserstein距离优化网络，优势在于改进判别器的同时生成器也能收到改进的梯度，并且wGAN在判别器中引入例如梯度惩罚使得训练稳定^[9]。

参考文献：

[1]Johnson J，Alahi A，Li F F.Perceptual Losses for Real-Time StyleTransfer and Super-Resolution[C]//European Conference on ComputerVision.Springer，Cham.2016：694-711.

[2]Andrey Ignatov，Nikolay Kobyshev，Radu Timofte，et al.DSLR-QualityPhotos on Mobile Devices with Deep Convolutional Networks[J].IEEEInternational Conference on Computer Vision，2017：3297-3305

[3]Zhu J Y，Park T，Isola P，et al.Unpaired Image-to-Image Translationusing Cycle-Consistent Adversarial Networks[J]..IEEE International Conferenceon Computer Vision，2017：2242-2251.

[4]Soonmin Bae，Sylvain Paris，and Fredo Durand.Two-scale ToneManagement for Photographic Look[J].ACM SIGGRAPH，2016：637-645.

[5]Hasinoff S W，Hasinoff S W，Hasinoff S W.Deep bilateral learning forreal-time image enhancement[J].Acm Transactions on Graphics，2017，36(4)：118.

[6]陈春宁，王延杰.在频域中利用同态滤波增强图像对比度[J].微计算机信息，2007，23(6)：264-266.

[7]Land E H.Lightness and the Retinex Theory[J].Journal of OpticalSociety of America，1971，61.

[8]Goodfellow I J，Pouget-Abadie J，Mirza M，et al.GenerativeAdversarial Networks[J].Advances in Neural Information Processing Systems，2014，3：2672-2680.

[9]Hsu C C，Hwang H T，Wu Y C，et al.Voice Conversion from UnalignedCorpora using Variational Autoencoding Wasserstein Generative AdversarialNetworks[J].2017：3364-3368.

Claims

1.一种基于非对称循环生成对抗损失的智能修图方法，其特征在于：其包括如下步骤：

步骤1，将未修图与修后图处理后组成训练数据集；

步骤2，预训练正向生成器；当训练结果生成的修后图与真实的修后图比较时已获得预期的修图效果，则保存获得步骤2对应的最终所获得的卷积权值参数和偏置参数；

步骤3，加载步骤2保存的最优卷积权值参数和偏置参数至正向生成器，在此基础上训练由正向生成器和修后图域判别器组成的Wasserstein生成对抗网络；当训练结果生成的修后图与真实的修后图比较时已获得预期的修图效果，则保存步骤3对应的最终所获得的卷积权值参数和偏置参数；

步骤4，预训练反向生成器；反向生成器的网络结构与正向生成器完全相同，并使用同样的方法进行预训练；并在训练结果生成的未修图与真实的未修图比较时已获得预期的还原效果时，保存获得步骤4所对应的卷积权值参数和偏置参数；

步骤5，加载步骤4保存的最优卷积权值参数和偏置参数至反向生成器，在此基础上训练由反向生成器和未修图域判别器组成的Wasserstein生成对抗网络；并在训练结果生成的未修图与真实的未修图比较时已获得预期的还原效果时，保存获得步骤5所对应的卷积权值参数和偏置参数；

2.根据权利要求1所述的一种基于非对称循环生成对抗损失的智能修图方法，其特征在于：

步骤2具体包括以下步骤：

步骤2.1，将配对集的未修图的子图像

对应的修后图像

步骤2.2，更新优化正向生成器：

基于正向生成器网络的总体损失不断更新并优化获得最优的卷积权值参数和偏置参数，总体损失由感知损失和均方误差组成；感知损失是生成的修后图

经VGG-19网络提取的特征值与真实修后图

经VGG-19网络提取的特征值之间的欧氏距离，均方误差是生成修后图

与真实修后图

对应像素之间差值平方的平均值；

步骤2.3，当训练结果生成的修后图与真实的修后图比较后没有获得预期的修图效果，则继续进行反向传播，利用梯度下降优化算法更新卷积权值参数和偏置参数，再跳转执行步骤2.1；当训练结果生成的修后图与真实的修后图比较后已获得预期的修图效果，则停止反向传播，并保存步骤2.2最终所获得的卷积权值参数和偏置参数。

3.根据权利要求2所述的一种基于非对称循环生成对抗损失的智能修图方法，其特征在于：步骤2.1具体包括以下步骤：

步骤2.1.1，初始卷积阶段：将未修图像

进行一次卷积运算和一次激活函数运算得到其初始卷积阶段的结果

其计算公式是：

其中

和

分别是所述正向生成器的第一层网络的卷积权值参数和偏置参数；

步骤2.1.2，特征结合阶段：将初始卷积处理阶段得到的结果

依次经过四个连接模块，连接模块采用了跨越连接方式，将模块输入与其经过两层卷积后的处理结果相加作为模块输出，最终得到特征结合阶段的结果

其计算公式是：

其中

和

是连接模块中第1层和第2层的输出、

和

和

分别是第k个连接模块中第1层和第2层的偏置参数，第k个连接模块的输出为

步骤2.1.3，不同尺度卷积阶段：将特征结合阶段的结果

经过卷积核尺度不完全相同的三个卷积层，得到最终的输出图像

其计算公式是：

其中

和

和

是所述正向生成器的输出。

4.根据权利要求2所述的一种基于非对称循环生成对抗损失的智能修图方法，其特征在于：步骤2.2中总体损失的计算公式是：

其中，

为生成修后图

与真实修后图

之间的均方误差，n为图像的像素点总数；

为生成修后图

与真实修后图

之间的感知损失，

为正向生成器G_f的总体损失，α、β为损失系数。

5.根据权利要求1所述的一种基于非对称循环生成对抗损失的智能修图方法，其特征在于：所述步骤3具体包括以下步骤：

步骤3.1，生成修后图像：将未修图

作为正向生成器G_f的输入数据，得到与

对应的修后图像

步骤3.2，获取真实修后图像

的判别值：将真实修后图

步骤3.3，获取正向生成器生成的修后图像

的判别值，将生成修后图

作为修后图域判别器的输入，如步骤3.2得到判别值

步骤3.4，执行n次更新优化正向生成器：

以步骤2训练的网络为基础，基于总体损失不断更新并优化正向生成器网络，获得最优的卷积权值参数和偏置参数，其中总体损失由感知损失、均方误差与对抗损失组成；

对抗损失是由生成修后图的判别值

取反所得，所述损失的计算公式是：

其中

为此时正向生成器G_f的总体损失；

为生成修后图

与真实修后图

之间的均方误差；

为生成修后图

与真实修后图

之间的感知损失；

为生成修后图

的对抗损失；α、β、γ为损失系数；

步骤3.5，执行m次更新优化修后图域判别器：

基于判别损失不断更新并优化修后图域判别器网络，获得最优的卷积权值参数和偏置参数；其中判别损失是由生成修后图的判别值减去真实的修后图的判别值所得，其计算公式是：

其中

为正向生成器生成的修后图像，

为真实修后图，

为正向生成器生成的修后图的判别值，

为真实修后图的判别值；

步骤3.6，当训练结果生成的修后图与真实的修后图比较时没有获得预期的修图效果，则继续进行反向传播，利用梯度下降优化算法更新卷积权值参数和偏置参数，再跳转执行步骤3.1；当训练结果生成的修后图与真实的修后图比较时已获得预期的修图效果，则停止反向传播，并保存步骤3.5最终所获得的卷积权值参数和偏置参数。

6.根据权利要求5所述的一种基于非对称循环生成对抗损失的智能修图方法，其特征在于：所述步骤3.2具体包括以下步骤：

步骤3.2.1，卷积处理阶段：

将真实修后图

其计算公式是：

其中

和

表示修后图域判别器第t个卷积层的卷积权重参数和偏置参数，leak^t表示第t个卷积层激活函数Leaky relu的负轴斜率；

卷积处理阶段的结果

由M个值组成，M的表达式是：

其中d是训练数据库中图像的长和宽，width是此时的网络宽度；

步骤3.2.2，全连接处理阶段：

将卷积处理阶段的结果

经过2个全连接层，得到最终的判别值

其计算公式是：

其中，

表示第一个全连接层中第r个神经元的输出，

和

表示第一个全连接层的第j个输入。

7.根据权利要求1所述的一种基于非对称循环生成对抗损失的智能修图方法，其特征在于：所述步骤4具体包括以下步骤：

步骤4.1，生成未修图像：将修后图

作为反向生成器G_r的输入数据得到还原的未修图

步骤4.2，更新优化反向生成器：基于由感知损失

与均方误差

组成的总体损失

训练反向生成器；步骤4.3，当训练结果生成的未修图与真实的未修图比较时没有获得预期的还原效果，则继续进行反向传播，利用梯度下降优化算法更新卷积权值参数和偏置参数，再跳转执行步骤4.1；当训练结果生成的未修图与真实的未修图比较时已获得预期的还原效果，则停止反向传播，并保存步骤4.2最终所获得的卷积权值参数和偏置参数。

8.根据权利要求1所述的一种基于非对称循环生成对抗损失的智能修图方法，其特征在于：所述步骤5具体包括以下步骤：

步骤5.1，生成未修图像：将修后图

作为反向生成器G_r的输入数据得到还原的未修图

步骤5.2，获取判别值：将生成未修图

与真实未修图

与真实未修图的判别值

步骤5.3，更新优化反向生成器：基于总体损失不断更新并优化反向生成器网络，获得最优的卷积权值参数和偏置参数，总体损失

由感知损失

均方误差

与对抗损失

组成；

步骤5.4，更新优化未修图域判别器：基于判别损失

不断更新并优化未修图域判别器网络，获得最优的卷积权值参数和偏置参数；

步骤5.5，当训练结果生成的未修图与真实的未修图比较时没有获得预期的还原效果，则继续进行反向传播，利用梯度下降优化算法更新卷积权值参数和偏置参数，再跳转执行步骤5.1；当训练结果生成的未修图与真实的未修图比较时已获得预期的还原效果，则停止反向传播，并保存步骤5.4最终所获得的卷积权值参数和偏置参数。

9.根据权利要求1所述的一种基于非对称循环生成对抗损失的智能修图方法，其特征在于：所述步骤6具体包括以下步骤：

步骤6.1，获取正向生成器与反向生成器的处理结果；

所述步骤6.1具体包括以下步骤：

步骤6.1.1，将步骤1得到的未修图

作为正向生成器G_f的输入，处理得到生成的修后图

步骤6.1.2，将步骤6.1.1得到的

作为反向生成器G_r的输入，处理得到循环生成的未修图

步骤6.1.3，将步骤1得到的修后图

作为反向生成器G_r的输入，处理得到生成的未修图

步骤6.1.4，将步骤6.1.3得到的

作为正向生成器G_f的输入，处理得到循环生成的修后图

步骤6.2，更新优化正向生成器：

以步骤3训练的正向生成器网络为基础，基于总体损失不断更新并优化正向生成器网络，获得最优的卷积权值参数和偏置参数，此时的总体损失由修后图域的感知损失、均方误差、对抗损失和未修图域的对抗损失组成；其中，未修图域的对抗损失是将循环生成的未修图

输入未修图域判别器D_r处理得到的判别值取反所得；此时正向生成器的总体损失计算公式是：

其中，α、γ、μ为损失系数；

步骤6.3，更新优化反向生成器：

其中，α、γ、μ为损失系数；

步骤6.4，更新优化修后图域判别器：

步骤6.5，更新优化未修图域判别器：

步骤6.5.1，以步骤5训练的未修图域判别器网络为基础，基于判别损失不断更新并优化未修图域判别器网络，获得最优的卷积权值参数和偏置参数；

步骤6.6，当训练得到的正向生成器生成的修后图与真实的修后图比较时没有获得预期的修图效果，则继续进行反向传播，利用梯度下降优化算法更新卷积权值参数和偏置参数，再跳转执行步骤6.1；当训练得到的正向生成器生成的修后图与真实的修后图比较时已获得预期的修图效果，则停止反向传播，并保存步骤6.5最终所获得的卷积权值参数和偏置参数。