CN108171320A

CN108171320A - 一种基于生成式对抗网络的图像域转换网络和转换方法

Info

Publication number: CN108171320A
Application number: CN201711273921.5A
Authority: CN
Inventors: 肖锋; 白猛猛; 冯飞
Original assignee: Xian Technological University
Current assignee: Xian Technological University
Priority date: 2017-12-06
Filing date: 2017-12-06
Publication date: 2018-06-15
Anticipated expiration: 2037-12-06
Also published as: CN108171320B

Abstract

本发明公开了一种基于生成式对抗网络的图像域转换网络和转换方法，包括U型生成网络、真假鉴别网络和配对鉴别网络，图像域转换过程主要包括以下步骤：1）、训练U型生成网络，建立U型生成网络的网络模型；2）将待转换的图像经过归一化处理后输入经步骤1）建立的网络模型，完成待转换图像的图像域转换；本发明能够实现图像中局部区域的图像域转换任务，且图像局部域转换质量高，网络判断能力强，图像转换的稳定性强，大大提高了生成的图像的真实性。

Description

一种基于生成式对抗网络的图像域转换网络和转换方法

技术领域

本发明涉及图像域转换技术领域，尤其涉及一种基于生成式对抗网络的图像域转换网络和转换方法。

背景技术

图像域转换是计算机视觉里一个重要的研究方向，有着广阔的应用前景。目前，对抗式生成网络(Generative Adversarial Networks,GAN)的出现，在图像生成领域取得了令人瞩目的成就，这也为图像域转换提供了新的解决方法。利用生成式对抗网络，将图像输入并生成网络生成目标域的图像，网络的训练基于生成网络和鉴别网络之间的博弈完成。生成式对抗网络最初提出时是无监督的学习方法，通过生成网络和鉴别网络之间的博弈，逐步学习到训练集中的数据分布，从而实现输入一个随机值使生成网络可以按照学习到的数据分布去随机的生成数据，其最早的应用即图像的生成。之后，Conditional GAN通过给GAN的输入增加人为的条件，使其生成的数据不再是随机生成，而是根据输入的条件不同生成不同的数据，Conditional GAN的提出，使得图像域的转换可以使用生成式对抗网络进行。

之后，改进自原始的GAN的Conditional GAN出现，目前研究的Conditional GAN通过给GAN的输入增加人为的条件，能对特定的输入生成特定的图像数据，而不再是输入随即的数据生成随即的图像数据。Conditional GAN的提出使得图像域的转换可以使用生成式对抗网络进行，即在其框架下输入为原始域图像，通过训练学习使其能够输出目标域图像。在该框架下实现的图像域转换GAN有：(1)pix2pix GAN，其使用的是有监督的方法，网络基于一个生成网络和一个对抗鉴别网络，解决的是图像整体域的转换任务；(2)Cycle GAN，使用了无监督的方法，通过两个生成网络两个对抗网络，利用cycle-consistency loss循环的训练生成网络和对抗鉴别网络实现图像域的转换。其中，无监督的方法尽管不再需要一一配对的训练数据，但转换效果差于有监督的pix2pix网络，且针对的仍然是图像整体域的转换，在现有的图像域转换中，对于图像中局部区域的域转换任务，并没有专门的GAN。

发明内容

本发明的目的是提供一种基于生成式对抗网络的图像域转换网络和转换方法，能够实现图像中局部区域的图像域转换任务，且图像局部域转换质量高，网络判断能力强，图像转换的稳定性强，大大提高了生成的图像的真实性。

本发明采用的技术方案为：

一种基于生成式对抗网络的图像域转换网络，包括U型生成网络、真假鉴别网络和配对鉴别网络，U型生成网络包括编码网络和解码网络，编码网络的输入端接入输入图像Input，编码网络的输出端连接解码网络的输入端，解码网络的输出端输出网络生成图像Output；设与输入图像Input一一配对的真实的目标域图像为目标域图像target；网络生成图像Output作为真假鉴别网络的训练负样本输入真假鉴别网络的负样本输入端，目标域图像target作为真假鉴别网络的训练正样本输入真假鉴别网络的正样本输入端，真假鉴别网络输出的值作为真假损失值反馈至解码网络的真假损失输入端；网络生成图像Output和对应输入图像Input作为训练负样本输入配对鉴别网络的负样本输入端，目标域图像target和对应输入图像Input作为训练正样本输入配对鉴别网络的正样本输入端，配对鉴别网络输出的值作为配对损失值反馈至解码网络的配对损失输入端；将网络生成图像Output与目标域图像target之间结构相似性值作为补偿损失值反馈至解码网络的补偿损失输入端。

所述编码网络包括八层卷积网络，每层卷积网络的卷积核大小为3*3，步长为2*2，每层卷积网络均包括卷积层、Batch Normalization层和Leak ReLU激活层，Leak ReLU激活层的α参数为0.2；所述解码网络包括八层反卷积网络，每层反卷积网络的反卷积核大小为3*3，步长为2*2，每层反卷积网络包括反卷积层、Batch Normalization层和激活层，第一至第七层反卷积网络的激活层采用ReLU激活层，第八层反卷积网络的激活层采用tanh激活层。

所述真假鉴别网络包括多层依次传递的真假鉴别卷积网络，每层真假鉴别卷积网络均包括卷积层、Batch Normalization层和激活层，最后一层真假鉴别卷积网络的激活层采用Sigmoid激活函数，其他层真假鉴别卷积网络的激活层采用ReLU函数。

所述配对鉴别网络包括依次传递的Concat层和多层配对鉴别卷积网络，每层配对鉴别卷积网络均包括卷积层、Batch Normalization层和激活层，最后一层配对鉴别卷积网络的激活层采用Sigmoid激活函数，其它层配对鉴别卷积网络的激活层采用ReLU函数。

一种基于生成式对抗网络的图像域转换方法，包括以下步骤：

1)、训练U型生成网络，建立U型生成网络的网络模型；具体包括以下步骤：

A、收集待转换域的训练图像集，训练图像集中包括一一配对的原始域图像和目标域图像，对训练图像集中的原始域图像进行归一化，归一化后的图像即为网络训练时的输入图像Input，训练图像集中目标域图像为与输入图像Input对应的目标域图像target；

B、将步骤A所得的输入图像Input经U型生成网络转换成为训练网络的网络生成图像Output；

C、利用步骤A和步骤B所得输入图像Input、目标域图像target和网络生成图像Output进行多对抗鉴别网络的训练：多对抗鉴别网络的训练包括真假鉴别网络的训练和配对鉴别网络的训练，其中，真假鉴别网络的训练包括以下步骤：

C11：采用随机初始化方法对真假鉴别网络的网络权重进行初始化；

C12：将网络生成图像Output作为负样本，与输入图像Input对应的目标域图像target作为正样本，在真假鉴别网络中进行训练，使用交叉互信息熵损失函数以及adam优化算法更新真假鉴别网络的网络权重；

配对鉴别网络的训练包括以下步骤：

C21：采用随机初始化方法对配对鉴别网络的网络权重进行初始化：

C22：将网络生成图像Output和对应的输入图像Input作为负样本，将输入图像Input和对应的目标域图像target作为正样本，在配对鉴别网络中进行训练，使用交叉互信息熵损失函数以及adam优化算法更新配对鉴别网络的网络权重；

D、重复步骤C，经过两次多对抗鉴别网络训练后，固定真假鉴别网络和配对鉴别网络的网络权重；

E、利用经过步骤D训练后所得的多对抗鉴别网络，对U型生成网络进行训练；具体包括以下步骤：

E1：采用哈维尔随机初始化方法对U型生成网络的网络权重进行初始化；

E2：将网络生成图像Output输入真假鉴别网络，真假鉴别网络输出真假损失值，并将输出的真假损失值反馈给U型生成网络中的解码网络，用于更新其网络权重：真假鉴别网络输出30*30*1图像，用于返回网络生成图像Output接近真实图像的损失值，其中，真假鉴别网络输出的每个图像像素点值的范围为0到1，像素点值越接近1表示输入图像Input在该像素点感受野区域越接近真实的图像，像素点值越接近0表示输入图像Input在该像素点感受野区域越不接近真实的图像；

E3：将输入图像Input和对应的网络生成图像Output输入配对鉴别网络，配对鉴别网络输出配对损失值，并将输出的配对损失值反馈给U型生成网络中的解码网络，用于更新其网络权重：配对鉴别网络输出30*30*1图像，用于返回输入图像Input和网络生成图像Output是否是输入图像Input与目标域图像target配对的损失值；其中，配对鉴别网络输出的每个图像像素点值的范围为0到1，越接近1表示输入图像Input和网络生成图像Output越匹配，越接近0表示越不匹配；

E4：计算出网络生成图像Output与目标域图像target之间的结构相似数值，并将计算出的结构相似性数值作为损失反馈给U型生成网络中的解码网络，用于更新其网络权重；结构相似性数值包括SSIM损失函数计算结果以及L1正则化计算结果，其中，SSIM损失函数来源于SSIM算法，SSIM算法的输出值SSIM(x,y)表示两幅图像之间的相似性，即输入图像x和目标域图像y之间的结构相似性，SSIM(x,y)的范围为-1到1，接近1表示两幅图像的相似度越高，当输入图像x和目标域图像y一模一样时，SSIM(x,y)的值等于1；

SSIM算法输出值的计算公式如下：

公式(1)中，x为输入图像Input，y为与输入图像Input对应的目标域图像target，μ_x是x的平均值，μ_y是y的平均值，是x的方差，是y的方差，σ_xy是x和y的协方差，c₁＝(k₁L)²和c₂＝(k₂L)²是用来维持稳定的常数，L是像素值的动态范围，k₁＝0.01,₂＝0.03；

F、步骤C～E为一次U型生成网络的权重训练，重复步骤C～E，完成两次U型生成网络的权重训练后，即完成U型生成网络的训练，所得生成网络即为U型生成网络的网络模型；2)、将待转换的图像经过归一化处理后输入经步骤1)建立的网络模型，即可完成待转换图像的图像域转换：归一化后的图像作为输入图像Input输入步骤1)中建立的网络模型中，编码网络提取输入图像Input的高维特征，然后通过解码网络输出网络生成图像Output，输出的网络生成图像Output即为经图像域转换后的目标域图像。

所述步骤E中U型生成网络的整体损失函数为：

L_GAN(G,D₁,D₂)＝L_D1+λ₁L_D2+λ₂L_ssim+λ₃L₁ (2)

整个生成式对抗网络中需要优化的整体损失函数为：

G^*＝argmin_GANmax_D1max_D2(L_GAN(G,D₁,D₂)+L_D1+L_D2) (3)

公式(2)和(3)中，表示真假鉴别网络输出的真假损失，表示配对鉴别网络输出的配对损失，表示SSIM损失函数计算的损SSIM损失，表示L₁正则项损失，x表示输入图像Input，y表示与输入图像Input对应的目标域图像target，λ₁为配对损失占U型生成网络整体损失中权重的参数，λ₂表示SSIM损失占U型生成网络整体损失中权重的参数，λ₃表示L₁正则项的值占U型生成网络整体损失中权重的参数；

U型生成网络的训练初期，真假损失、配对损失、SSIM损失和L1正则项损失的比例为1:1:4:1，随着网络训练次数的增加，真假损失、配对损失、SSIM损失和L1正则项损失的比例逐渐变为1:1：0.5:1，即SSSIM损失占U型生成网络整体损失中权重的参数按照设置的总体训练次数逐渐降低。

所述步骤C中的交叉互信息熵损失函数为带有平滑项的交叉互信息熵损失函数；带有平滑项的交叉互信息熵损失函数的公式为：

公式(4)中，i为batch的大小，t_i为预测的样本值，y_i为真实的样本值，为添加的平滑项，的值选取为0.005。

所述的网络生成图像Output的生成过程包括以下步骤：

a)、将待转换的图像归一化为256*256*3像素的图像，将归一化后的图像作为输入图像Input输入编码网络中，输入图像Input依次经过编码网络中的8层卷积网络，最后输出的数据为1*1*1024的特征图像；编码网络中每层卷积网络的卷积核大小为3*3，步长为2*2；

b)、将步骤a)中生成的1*1*1024的特征图像输入解码网络，特征图像依次经过解码网络的8层反卷积网络，同时将步骤a)中每层卷积网络运算后的特征图像输入到相同数据张量大小的反卷积层中进行运算，最终生成完整的网络生成图像Output，即反卷积层的输入不但有来自上一层反卷积运算的特征图像，还有对应张量大小的卷积运算特征图像；其中，每层反卷积网络的反卷积核大小为3*3，步长为2*2。

所述步骤b)中，在前三层的反卷积网络输入的特征图像中，在将步骤a)中每层卷积网络运算后的特征图像输入到相同数据张量大小的反卷积层中进行运算的过程中加入Dropout操作；其中，Dropout操作的参数使用为0.2，即随机关闭两个连接层中20％的连接节点。

所述步骤E4中SSIM算法的计算采用卷积核的滑窗形式，滑窗大小为7*7。

本发明具有以下优点：

(1)通过包括U型生成网络、配对鉴别网络和真假鉴别网络的对抗式生成网络，建立U型生成网络的网络模型，再通过建立的网络模型实现局部图像的图像域的转换，填补了当下没有针对局部图像转换的对抗式生成网络的空缺，提高了对抗式生成网络在图像域转换领域的使用范围，并提高了图像域转换的效果和可靠性能；

(2)在生成网络的网络模型训练过程中，采用配对鉴别网络和真假鉴别网络的多对抗方式进行，为了提高网络在训练初期鉴别网络判断能力差的问题，增加了SSIM损失函数，使用SSIM算法计算图像的相似度，并将其计算结果作为损失用以更新生成网络的权重，使用SSIM算法的计算结果作为损失，可以弥补对抗网络初期对抗能力低的问题，使得生成网络能更好地收敛，从未获得更好的图像域转换效果；

(3)通过在多对抗鉴别网络的训练过程中使用交叉互信息熵损失函数，使得多对抗鉴别网络的训练更加稳定，由于传统的交叉熵损失函数含有log运算，在计算损失的初期阶段使得损失的波动大，进而使得在训练阶段有可能出现损失函数为0的结果出现，导致训练的失败，通过增加平滑项，减少了训练时的波动，防止了训练的失败情况发生，提升了深度对抗网络训练的稳定性；

(4)通过设置在生成网络中，反卷积层的输入不但有来自上一层反卷积运算的特征图像，还有对应张量大小的卷积运算特征图像，使得图像的信息在最大程度上得到了保留，更好、更完整地保存原图像中的特征信息，提高了图像域转换的效果和真实性，而且在编码网络的前三层卷积层向对应反卷积层输入特征图像的运算中加入Dropout操作，有效防止解码后得到的图像单一化，进一步提高图像域转换质量；

(3)通过采用Leak ReLU激活层并将Leak ReLU的参数为0.2，更好地保留了生成网络原图像域的信息，并使网络在反向传播时尽可能的保留残差信息，提高了转换图像的完整度，保证了转换效果；

附图说明

图1为本发明的网络结构图；

图2为图1中U型生成网络结构图；

图3为图1中真假鉴别网络的网络结构图；

图4为图1中配对鉴别网络的网络结构图；

图5为图1中U型生成网络训练图；

图6为图1中真假鉴别网络的网络训练图；

图7为图1中配对鉴别网络的网络训练图。

具体实施方式

为了更好地理解本发明，下面结合附图对本发明的技术方案做进一步说明。

如图1所示，本发明包括U型生成网络U-net、真假鉴别网络D1-net和配对鉴别网络D2-net，还包括了结构相似性数值计算部分，结构相似性数值计算包括SSIM损失函数计算部分和L1正则化部分；U型生成网络U-net用于图像域的转换，真假鉴别网络D1-net是用于判断网络生成图像Output是否真实的鉴别器，鉴别网络D2-net是用于判断网络生成图像Output与原图像的是否配对的鉴别器；

如图2所示，U型生成网络U-net包括编码网络F-net和解码网络G-net，编码网络F-net对图像进行卷积操作输出其高维的特征图，解码网络G-net使用反卷积网络，通过对特征图进行反卷积完成图像的生成。

编码网络F-net的输入端接入输入图像Input，编码网络F-net的输出端连接解码网络G-net的输入端，解码网络G-net的输出端生成网络生成图像Output。

编码网络F-net包括八层卷积网络，每层卷积网络的卷积核大小为3*3，步长为2*2，每层卷积网络均包括卷积层、Batch Normalization层和Leak ReLU激活层，由于生成网络需要尽量的保留原图像域信息，以及为了使网络在反向传播时尽可能的保留残差信息，因此本发明对于生成网络中编码网络F-net每层激活函数的选取采用的是Leak ReLU激活函数，其中Leak ReLU激活层的α参数为0.2。

解码网络G-net包括八层反卷积网络，每层反卷积网络的反卷积核大小为3*3，步长为2*2，每层反卷积网络包括反卷积层、Batch Normalization层和激活层，第一至第七层反卷积网络的激活层采用ReLU激活层，第八层反卷积网络的激活层采用tanh激活层。

如图3所示，真假鉴别网络D1-net是用于鉴别生成的图像是否为真实的图像，故其输入为一副图像，输出为真假；真假鉴别网络D1-net包括多层依次传递的真假鉴别卷积网络，每层真假鉴别卷积网络均包括卷积层、Batch Normalization层和激活层。

ReLU激活函数能有效的传递残差且能保持非线性拟合，tanh激活函数输出值在-1到1之间，而sigmoid激活函数值输出的值在0到1之间便于与标签进行计算，故真假鉴别网络D1-net的除最后一层的其余每层使用的激励函数为ReLU函数，最后一层输出层使用的是sigmoid激活函数，即最后一层真假鉴别卷积网络的激活层采用Sigmoid激活函数，其他层真假鉴别卷积网络的激活层采用ReLU函数。

每层真假鉴别卷积网络的卷积核的设计遵循小卷积核的原则，采用的是3*3的卷积核，除去32*32*256真假鉴别卷积网络到30*30*1真假鉴别卷积网络之间每层步长stride为1的卷积运算，其余步长stride均为2。为了防止梯度弥散现象的发生，在每层的网络中加入了Bacth Normalization层，同时考虑到部分层卷积计算的步长为2起到了池化作用，因此网络中未添加了pooling层。

配对鉴别网络D2-net用于鉴别生成的图像同输入的图像是否配对，因此其输入为两幅图像；配对鉴别网络D2-net包括依次传递的Concat层和多层配对鉴别卷积网络，每层配对鉴别卷积网络均包括卷积层、Batch Normalization层和激活层，最后一层配对鉴别卷积网络的激活层采用Sigmoid激活函数，其它层配对鉴别卷积网络的激活层采用ReLU函数。

如图4所示，配对鉴别网络D2-net同真假鉴别网络D1-net的结构相似，只在第一层的输入时多了一副图像，即第一层的输入为256*256*6的张量，同样选择ReLU和sigmoid激活函数，使用Bacth Normalization层，并且使用的损失函数同D1-net一样带有平滑项。

设与输入图像Input一一配对的真实的目标域图像为目标域图像target；网络生成图像Output作为真假鉴别网络D1-net的训练负样本输入真假鉴别网络D1-net的负样本输入端，目标域图像target作为真假鉴别网络D1-net的训练正样本输入真假鉴别网络D1-net的正样本输入端，真假鉴别网络D1-net输出的值作为真假损失值反馈至解码网络G-net的真假损失输入端；网络生成图像Output和对应输入图像Input作为训练负样本输入配对鉴别网络D2-net的负样本输入端，目标域图像target和对应输入图像Input作为训练正样本输入配对鉴别网络D2-net的正样本输入端，配对鉴别网络D2-net输出的值作为配对损失值反馈至解码网络G-net的配对损失输入端；将网络生成图像Output与目标域图像target之间的结构相似性数值作为补偿损失值反馈至解码网络G-net的补偿损失输入端，其中，结构相似性数值的计算包括SSIM损失函数和L1正则化。

本发明还包括一种基于生成式对抗网络的图像域转换方法，包括以下步骤：

1)、训练U型生成网络U-net，建立U型生成网络U-net的网络模型；具体包括以下步骤：

A、收集待转换域的训练图像集，训练图像集中包括一一配对的原始域图像和目标域图像，将训练图像集中的原始域图像归一化为256*256*3像素的图像，归一化后的图像即为网络训练时的输入图像Input，训练图像集中目标域图像为与输入图像Input对应的目标域图像target；

B、将步骤A所得的输入图像Input经U型生成网络U-net转换成为训练网络的网络生成图像Output；

C、利用步骤A和步骤B所得输入图像Input、目标域图像target和网络生成图像Output进行多对抗鉴别网络的训练：多对抗鉴别网络的训练包括真假鉴别网络D1-net的训练和配对鉴别网络D2-net的训练；

如图6所示，真假鉴别网络D1-net的训练包括以下步骤：

C11：采用随机初始化方法对真假鉴别网络D1-net的网络权重进行初始化；

C12：将网络生成图像Output作为负样本，与输入图像Input对应的目标域图像target作为正样本，在真假鉴别网络D1-net中进行二分类训练，使用带有平滑项的交叉互信息熵损失函数以及adam优化算法更新真假鉴别网络D1-net的网络权重；

交叉互信息熵在计算损失的开始阶段值会较大，同时在训练阶段有可能出现0导致训练失败，增加平滑项减少了训练时的波动，防止了训练的失败情况发生，改进的带有平滑项的交叉互信息熵函数，提升了深度对抗网络训练的稳定性；

在二分类训练中，首先，要为正、负样本生成one-hot类型的标签，然后根据最后一层sigmoid激活函数输出的0到1的值，利用添加平滑项的SigmoidCrossEntropy计算交叉熵损失，最后根据反馈的损失更新真假鉴别网络D1-net权重；

其中，带有平滑项的交叉互信息熵损失函数的公式为

公式(1)中，i为batch的大小，t_i为预测的样本值，y_i为真实的样本值，为添加的平滑项，的值选取为0.005；

如图7所示，配对鉴别网络D2-net的训练包括以下步骤：

C21：采用随机初始化方法对配对鉴别网络D2-net的网络权重进行初始化：

C22：将网络生成图像Output和对应的输入图像Input作为负样本，将输入图像Input和对应的目标域图像target作为正样本，在配对鉴别网络D2-net中进行二分类的训练，使用带有平滑项的交叉互信息熵损失函数以及adam优化算法更新配对鉴别网络D2-net的网络权重；

D、重复步骤C，经过两次多对抗鉴别网络训练后，固定真假鉴别网络D1-net和配对鉴别网络D2-net的网络权重：为了使U型生成网络U-net的训练更加稳定，采用多次训练真假鉴别网络D1-net和配对鉴别网络D2-net，再训练U型生成网络U-net的策略；

E、利用经过步骤D训练后所得的多对抗鉴别网络，对U型生成网络U-net进行训练；如图5所示，U型生成网络U-net的训练包括以下步骤：

E1：采用哈维尔随机初始化方法对U型生成网络U-net的网络权重进行初始化；

E2：将网络生成图像Output输入真假鉴别网络D1-net，真假鉴别网络D1-net输出真假损失值，并将输出的真假损失值反馈给U型生成网络U-net中的解码网络G-net，用于更新其网络权重：真假鉴别网络D1-net输出30*30*1图像，用于返回网络生成图像Output接近真实图像的损失值，其中，真假鉴别网络D1-net输出的每个图像像素点值的范围为0到1，像素点值越接近1表示输入图像Input在该像素点感受野区域越接近真实的图像，像素点值越接近0表示输入图像Input在该像素点感受野区域越不接近真实的图像；

E3：将输入图像Input和对应的网络生成图像Output输入配对鉴别网络D2-net，配对鉴别网络D2-net输出配对损失值，并将输出的配对损失值反馈给U型生成网络U-net中的解码网络G-net，用于更新其网络权重：配对鉴别网络D2-net输出30*30*1图像，用于返回输入图像Input和网络生成图像Output是否是输入图像Input与目标域图像target配对的损失值；其中，配对鉴别网络D2-net输出的每个图像像素点值的范围为0到1，越接近1表示输入图像Input和网络生成图像Output越匹配，越接近0表示越不匹配；

E4：计算出网络生成图像Output与目标域图像target之间的结构相似性数值，并将计算出的结构相似性数值作为损失反馈给U型生成网络U-net中的解码网络G-net，用于更新其网络权重；结构相似性数值的计算包括SSIM损失函数以及L1正则化，其中，SSIM损失函数来源于SSIM算法，是一种衡量两幅图像相似性的指标，SSIM算法的输出值SSIM(x,y)表示两幅图像之间的相似性，即输入图像x和目标域图像y之间的结构相似性，SSIM(x,y)的范围为-1到1，接近1表示两幅图像的相似度越高，当输入图像x和目标域图像y一模一样时，SSIM(x,y)的值等于1；使用SSIM作为损失函数，能够使得生成网络能更好的收敛，从而获得更好的图像域转换效果；

SSIM算法输出值的计算公式如下：

公式(2)中，x为输入图像Input，y为与输入图像Input对应的目标域图像target，μ_x是x的平均值，μ_y是y的平均值，是x的方差，是y的方差，σ_xy是x和y的协方差，c₁＝(k₁L)²和 ₂＝(k₂L)²是用来维持稳定的常数，L是像素值的动态范围，k₁＝0.01,₂＝0.03；

F、步骤C～E为一次U型生成网络U-net的权重训练，重复步骤C～E，完成两次U型生成网络U-net的权重训练后，即完成U型生成网络U-net的训练，所得生成网络即为U型生成网络U-net的网络模型；

然而，在计算两幅图像SSIM值时需要转化成滑窗的形式，导致选择不同大小的滑窗以及参数δ的不同，所得到的结果均存在差异。Wang et.al等人最初提出的SSIM算法采用的是11*11的滑窗，然而由于生成网络在最初的阶段生成的图像与目标图像相差较大，大尺寸的滑窗计算出的两幅图像之间的SSIM值在最初阶段数值非常接近于0，使得损失无法有效回传到生成网络，导致对抗式生成网络GAN的训练失败。鉴于此问题并考虑到网络输入的是256*256像素的照片，最终本发明中SSIM算法的计算采用卷积核的滑窗形式，选择的滑窗大小为7*7。

在上述对U型生成网络U-net进行训练的步骤E中，U型生成网络U-net的整体损失函数为：

L_GAN(G,D₁,D₂)＝L_D1+λ₁L_D2+λ₂L_ssim+λ₃L₁ (3)

整个生成式对抗网络中需要优化的整体损失函数为：

G^*＝argmin_GANmax_D1max_D2(L_GAN(G,D₁,D₂)+L_D1+L_D2) (4)

公式(3)和(4)中，表示真假鉴别网络D1-net输出的真假损失，表示配对鉴别网络D2-net输出的配对损失，表示SSIM损失函数计算的SSIM损失，表示L₁正则项损失，x表示输入图像Input，y表示与输入图像Input对应的目标域图像target，λ₁为配对损失占整体生成网络的解码网络G-net中权重的参数，λ₂表示SSIM损失占整体生成网络的解码网络G-net中权重的参数，λ₃表示L₁正则项的值占整体生成网络的解码网络G-net中权重的参数。

在U型生成网络U-net的训练初期，真假损失、配对损失、SSIM损失和L1正则项损失的比例为1:1:4:1，随着网络训练次数的增加，真假损失、配对损失、SSIM损失和L1正则项损失的比例逐渐变为1:1：0.5:1，即SSSIM损失占U型生成网络U-net整体损失中权重的参数按照设置的总体训练次数逐渐降低。

在网络训练初期真假鉴别网络D1-net和配对鉴别网络D2-net鉴别能力低时可使用SSIM损失函数反馈U型生成网络U-net的残差，使其能有效的生成目标域图像，当真假鉴别网络D1-net和配对鉴别网络D2-net在训练中能力不断提升后，再降低SSIM损失函数在反馈生成网络残差中所占的权重，使得生成网络的残差较大部分的来自真假鉴别网络D1-net和配对鉴别网络D2-net反馈回来的损失，以获得比现有图像域转换方法的效果更好，生成的图像更真实的效果。

2)、将待转换的图像经过归一化处理，归一化后的像素为256*256，归一化后的图像输入经步骤1)建立的网络模型，即可完成待转换图像的图像域转换：归一化后的图像作为输入图像Input输入步骤1)中建立的网络模型中，编码网络F-net提取输入图像Input的高维特征，然后通过解码网络G-net输出网络生成图像Output，输出的网络生成图像Output即为经图像域转换后的目标域图像。

在U型生成网络的图像域转换过程中，需要将图像输入编码网络F-net先进行卷积操作，然后再进行反卷积操作，实现图像域的转换；但是；以往的U型生成网络，原图在卷积过程中图像的部分信息难以保留，因此，为了能更好的、更完整的保存原图像中的特征信息，本发明网络生成图像Output的生成过程包括以下步骤：

a)、将待转换的图像归一化为256*256*3像素的图像，将归一化后的图像作为输入图像Input输入编码网络F-net中，输入图像Input依次经过编码网络F-net中的8层卷积网络，最后输出的数据为1*1*1024的特征图像；编码网络F-net中每层卷积网络的卷积核大小为3*3，步长为2*2；

b)、将步骤a)中生成的1*1*1024的特征图像输入解码网络G-net，特征图像依次经过解码网络G-net的8层反卷积网络，同时将步骤a)中每层卷积网络运算后的特征图像输入到相同数据张量大小的反卷积层中进行运算，最终生成完整的网络生成图像Output，即反卷积层的输入不但有来自上一层反卷积运算的特征图像，还有对应张量大小的卷积运算特征图像；其中，每层反卷积网络的反卷积核大小为3*3，步长为2*2。

在前三层的反卷积网络输入的特征图像中，在将步骤a)中每层卷积网络运算后的特征图像输入到相同数据张量大小的反卷积层中进行运算的过程中加入Dropout操作；其中，Dropout操作的参数使用为0.2，即随机关闭两个连接层中20％的连接节点。

反卷积层的输入不但有来自上一层反卷积运算的特征图像，还有对应张量大小的卷积运算特征图像，使得图像的信息在最大程度上得到了保留，更好、更完整地保存原图像中的特征信息，提高了图像域转换的效果和真实性，而且为了防止解码网络G-net得到的图像单一化，在编码网络F-net的前三层卷积层向对应反卷积层输入特征图像的运算中加入Dropout操作，有效防止解码后得到的图像单一化，进一步提高图像域转换质量。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解，其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换，而这些修改或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

Claims

1.一种基于生成式对抗网络的图像域转换网络，其特征在于：包括U型生成网络、真假鉴别网络和配对鉴别网络，U型生成网络包括编码网络和解码网络，编码网络的输入端接入输入图像Input，编码网络的输出端连接解码网络的输入端，解码网络的输出端输出网络生成图像Output；设与输入图像Input一一配对的真实的目标域图像为目标域图像target；网络生成图像Output作为真假鉴别网络的训练负样本输入真假鉴别网络的负样本输入端，目标域图像target作为真假鉴别网络的训练正样本输入真假鉴别网络的正样本输入端，真假鉴别网络输出的值作为真假损失值反馈至解码网络的真假损失输入端；网络生成图像Output和对应输入图像Input作为训练负样本输入配对鉴别网络的负样本输入端，目标域图像target和对应输入图像Input作为训练正样本输入配对鉴别网络的正样本输入端，配对鉴别网络输出的值作为配对损失值反馈至解码网络的配对损失输入端；将网络生成图像Output与目标域图像target之间结构相似性值作为补偿损失值反馈至解码网络的补偿损失输入端。

2.根据权利要求1所述的基于生成式对抗网络的图像域转换网络，其特征在于：所述编码网络包括八层卷积网络，每层卷积网络的卷积核大小为3*3，步长为2*2，每层卷积网络均包括卷积层、Batch Normalization层和Leak ReLU激活层，Leak ReLU激活层的α参数为0.2；所述解码网络包括八层反卷积网络，每层反卷积网络的反卷积核大小为3*3，步长为2*2，每层反卷积网络包括反卷积层、BatchNormalization层和激活层，第一至第七层反卷积网络的激活层采用ReLU激活层，第八层反卷积网络的激活层采用tanh激活层。

3.根据权利要求2所述的基于生成式对抗网络的图像域转换网络，其特征在于：所述真假鉴别网络包括多层依次传递的真假鉴别卷积网络，每层真假鉴别卷积网络均包括卷积层、Batch Normalization层和激活层，最后一层真假鉴别卷积网络的激活层采用Sigmoid激活函数，其他层真假鉴别卷积网络的激活层采用ReLU函数。

4.根据权利要求3所述的基于生成式对抗网络的图像域转换网络，其特征在于：所述配对鉴别网络包括依次传递的Concat层和多层配对鉴别卷积网络，每层配对鉴别卷积网络均包括卷积层、Batch Normalization层和激活层，最后一层配对鉴别卷积网络的激活层采用Sigmoid激活函数，其它层配对鉴别卷积网络的激活层采用ReLU函数。

5.一种权利要求4所述的基于生成式对抗网络的图像域转换网络的图像域转换方法，其特征在于：包括以下步骤：

配对鉴别网络的训练包括以下步骤：

E4：计算出网络生成图像Output与目标域图像target之间的结构相似数值，并将计算出的结构相似性数值作为损失反馈给U型生成网络中的解码网络，用于更新其网络权重；结构相似性数值包括SSIM损失函数计算结果以及L1正则化计算结果，其中，SSIM损失函数来源于SSIM算法，SSIM算法的输出值SSIM(x，y)表示两幅图像之间的相似性，即输入图像x和目标域图像y之间的结构相似性，SSIM(x，y)的范围为-1到1，接近1表示两幅图像的相似度越高，当输入图像x和目标域图像y一模一样时，SSIM(x，y)的值等于1；

SSIM算法输出值的计算公式如下：

公式(1)中，x为输入图像Input，y为与输入图像Input对应的目标域图像target，μ_x是x的平均值，μ_y是y的平均值，是x的方差，是y的方差，σ_xy是x和y的协方差，c₁＝(k₁L)²和c₂＝(k₂L)²是用来维持稳定的常数，L是像素值的动态范围，k₁＝0.01，k₂＝0.03；

F、步骤C～E为一次U型生成网络的权重训练，重复步骤C～E，完成两次U型生成网络的权重训练后，即完成U型生成网络的训练，所得生成网络即为U型生成网络的网络模型；

2)、将待转换的图像经过归一化处理后输入经步骤1)建立的网络模型，即可完成待转换图像的图像域转换：归一化后的图像作为输入图像Input输入步骤1)中建立的网络模型中，编码网络提取输入图像Input的高维特征，然后通过解码网络输出网络生成图像Output，输出的网络生成图像Output即为经图像域转换后的目标域图像。

6.根据权利要求5所述的基于生成式对抗网络的图像域转换方法，其特征在于：所述步骤E中U型生成网络的整体损失函数为：

L_GAN(G，D₁，D₂)＝L_D1+λ₁L_D2+λ₂L_ssim+λ₃L₁ (2)

整个生成式对抗网络中需要优化的整体损失函数为：

G^*＝arg min_GANmax_D1max_D2(L_GAN(G，D₁，D₂)+L_D1+L_D2) (3)

U型生成网络的训练初期，真假损失、配对损失、SSIM损失和L1正则项损失的比例为1∶1∶4∶1，随着网络训练次数的增加，真假损失、配对损失、SSIM损失和L1正则项损失的比例逐渐变为1∶1∶0.5∶1，即SSSIM损失占U型生成网络整体损失中权重的参数按照设置的总体训练次数逐渐降低。

7.根据权利要求5所述的基于生成式对抗网络的图像域转换方法，其特征在于：所述步骤C中的交叉互信息熵损失函数为带有平滑项的交叉互信息熵损失函数；带有平滑项的交叉互信息熵损失函数的公式为：

公式(4)中，i为batch的大小，t_i为预测的样本值，y_i为真实的样本值，EPS为添加的平滑项，EPS的值选取为0.005。

8.根据权利要求5所述的基于生成式对抗网络的图像域转换方法，其特征在于：所述的网络生成图像Output的生成过程包括以下步骤：

9.根据权利要求8所述的基于生成式对抗网络的图像域转换方法，其特征在于：所述步骤b)中，在前三层的反卷积网络输入的特征图像中，在将步骤a)中每层卷积网络运算后的特征图像输入到相同数据张量大小的反卷积层中进行运算的过程中加入Dropout操作；其中，Dropout操作的参数使用为0.2，即随机关闭两个连接层中20％的连接节点。

10.根据权利要求5所述的基于生成式对抗网络的图像域转换方法，其特征在于：所述步骤E4中SSIM算法的计算采用卷积核的滑窗形式，滑窗大小为7*7。