CN110826688B

CN110826688B - 一种保障gan模型最大最小损失函数平稳收敛的训练方法

Info

Publication number: CN110826688B
Application number: CN201910896955.2A
Authority: CN
Inventors: 陈旋; 吕成云; 林善冬
Original assignee: Jiangsu Aijia Household Products Co Ltd
Current assignee: Jiangsu Aijia Household Products Co Ltd
Priority date: 2019-09-23
Filing date: 2019-09-23
Publication date: 2022-07-29
Anticipated expiration: 2039-09-23
Also published as: CN110826688A

Abstract

本发明公开了一种保障GAN模型最大最小损失函数平稳收敛的训练方法，涉及GAN模型训练方法的深度学习领域，本方法通过合理设定生成器和对抗器的参数更新条件和频率，解决上述的GAN模型训练过程中生成器与对抗器博弈失衡问题，所谓博弈失衡问题指的是，生成器和对抗器的其中一方在训练过程中快速收敛，使得另一方的优化曲面近乎不可导，从而无法顺利训练的现象。

Description

一种保障GAN模型最大最小损失函数平稳收敛的训练方法

技术领域

本发明涉及GAN模型训练方法的深度学***稳收敛的训练方法。

背景技术

GAN模型在图像生成、语音生成、文字生成等领域都有广泛应用。对GAN模型的训练，一般包括两个步骤，一步是根据生成器的损失函数梯度更新生成器的参数，一步是根据对抗器的损失函数梯度更新对抗器的参数。这两步一般交替进行，直至生成器生成的数据分布逼近真实数据分布，对抗器无法判别生成器的输出和真实数据为止。但在实际操作过程中，这种不顾生成器和对抗器的收敛情况一味地交替训练的方法会造成生成器和对抗器博弈失衡。生成器的损失函数包含了对抗器对于生成器输出的计算，当对抗器快速收敛时，如果生成器的收敛速度跟不上，大概率情况下会造成生成器的损失函数梯度不断增大直至最后梯度***，在数值计算领域不可导，从而使得优化器无法更新生成器参数，最终GAN模型训练失败。

发明内容

本发明的目的是针对背景技术的不足提供了一种保障GAN模型最大最小损失函数平稳收敛的训练方法，其通过合理设定生成器和对抗器的参数更新条件和频率，解决上述的GAN模型训练过程中生成器与对抗器博弈失衡问题。

本发明为解决上述技术问题采用以下技术方案：

一种保障GAN模型最大最小损失函数平稳收敛的训练方法，包括如下步骤：

步骤1，准备MNIST数据集；

步骤2，随机生成一个n维向量z；

步骤3，构建生成器G(.)，生成器G(.)的具体结构选用反卷积结构，过程式具体如下：

G(.)＝Tranpose_CNN(.)；

步骤4，将步骤2生成的n维向量z传入步骤构建的生成器G(.)中，输出一个尺寸和MNIST数据集中的图片一样的矩阵I_gen，过程式如下：

I_gen＝G(z)

步骤5，构建对抗器D(.)，对抗器D(.)的具体结构选用卷积结构，过程式具体如下：

D(.)＝CNN(.)；

步骤6，计算生成结果的对抗分数P_aen，过程式如下：

P_gen＝D(I_gen)；

步骤7，计算生成器损失函数L_G，采用交叉熵形式，过程式如下：

L_G＝-log(P_gen)；

步骤8，从步骤1中准备的MNIST集中随机取出一张图I_real，传入对抗器D(.)中，计算出真实图片的对抗分数P_real，过程式如下：

P_real＝D(I_real)

步骤9，计算对抗器损失函数L_D，采用Wasserstein形式，过程式如下：

L_D＝log(P_gen)-log(P_real)

步骤10，更新生成器损失值L_G动量均值

对抗器损失值L_D的动量均值

若是第一次迭代，则

直接取值L_G，

直接取值L_D；若不是第一次迭代，则更新过程式如下：

其中，γ为动量系数；

步骤11，比较两损失值的相对值L_{G_r}、L_{D_r}，计算过程式如下：

进而比较L_{G_r}和L_{D_r}的大小；根据比较结果，更新模型权重；若L_{G_r}＞L_{D_r}，则更新生成器的参数；反之，则更新对抗器的参数；

步骤12，重复步骤2至步骤11，直到生成器输出满意的结果。

作为本发明一种保障GAN模型最大最小损失函数平稳收敛的训练方法的进一步优选方案，生成器和对抗器的参数并不是交替更新，而是根据各自的相对变化幅度，调整更新频率，使得收敛较慢的一方优先更新权重，有效避免发生博弈失衡的局面。

作为本发明一种保障GAN模型最大最小损失函数平稳收敛的训练方法的进一步优选方案，在步骤4中，输出一个尺寸和MNIST数据集中的图片一样的矩阵I_gen，其尺寸为(28，28，1)。

作为本发明一种保障GAN模型最大最小损失函数平稳收敛的训练方法的进一步优选方案，在步骤10中，所述步骤10中的动量系数γ，取值范围为[0，1)，参考经验值为0.9。

有益效果

本发明采用以上技术方案与现有技术相比，具有以下技术效果：

1、本发通过合理设定生成器和对抗器的参数更新条件和频率，解决上述的GAN模型训练过程中生成器与对抗器博弈失衡问题，所谓博弈失衡问题指的是，生成器和对抗器的其中一方在训练过程中快速收敛，使得另一方的优化曲面近乎不可导，从而无法顺利训练的现象

2、本发明根据生成器和对抗器的训练情况动态调整生成器和对抗器的参数更新频率，能够明显提高GAN模型的训练效果。

附图说明

图1是本发明的方法图；

图2是一张MNIST图片例子。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

一种保障GAN模型最大最小损失函数平稳收敛的训练方法，如图1所示，包括如下步骤：

步骤1，准备MNIST数据集；

步骤2，随机生成一个n维向量z；

步骤3，构建生成器G(.)，生成器G(.)的具体结构选用反卷积结构，也可选择其它结构，这里生成器G(.)的具体结构选用反卷积结构，过程式具体如下：

G(.)＝Tranpose_CNN(.)；

步骤4，将步骤2生成的n维向量z传入步骤构建的生成器G(.)中，输出一个尺寸和MNIST数据集中的图片一样的矩阵I_gen，其尺寸为(28，28，1)；过程式如下：

I_gen＝G(z)

步骤5，构建对抗器D(.)，对抗器D(.)的具体结构选用卷积结构，也可采用其它结构，对抗器D(.)的具体结构选用卷积结构过程式具体如下：

D(.)＝CNN(.)；

步骤6，计算生成结果的对抗分数P_gen，过程式如下：

P_gen＝D(I_gen)；

L_G＝-log(P_gen)；

P_real＝D(I_real)

L_D＝log(P_gen)-log(P_real)

步骤10，更新生成器损失值L_G动量均值

对抗器损失值L_D的动量均值

若是第一次迭代，则

直接取值L_G，

直接取值L_D；若不是第一次迭代，则更新过程式如下：

其中，γ为动量系数；取值范围为[0，1)，参考经验值为0.9

步骤12，重复步骤2至步骤11，直到生成器输出满意的结果。

生成器和对抗器的参数并不是交替更新，而是根据各自的相对变化幅度，调整更新频率，使得收敛较慢的一方优先更新权重，有效避免发生博弈失衡的局面。

具体实施例如下：

在GAN模型(生成对抗网络模型)中，存在两个相互博弈的模型，一个是生成器(generator)，一个是对抗器(discriminator)。简记生成器为函数G(.)，对抗器为函数D(.)。

具体实施的时候，我们选用tensorflow机器学习平台进行算法开发。

为了方法容易复现，我们使用开源的MNIST数据为例。注意，利用DCGAN生成MNIST数据图片非本发明特征，这里只贴出关键步骤主要是为了方便复现。

1.准备数据

用以下命令从互联网上下载MNIST数据集：

(train_images，train_labels)，(_，_)＝tf.keras.datasets.mnist.load_data()

其中，变量train_images中存储的是MNIST图片信息，变量train_labels中存储的是MNIST标签信息。图2是随机抽取的一张标签为“1”的MNIST图片。MNIST图片是大小为(28，28)的灰度图片。

2.定义tensorflow计算图

定义输入节点：

定义生成器：

定义对抗器：

超参配置如下：

真实图像的大小：img_size＝train_images[0].shape[0]

传入给generator的噪声大小：noise_size＝100

生成器隐层参数：g_units＝128

判别器隐层参数：d_units＝128

leaky ReLU的参数：alpha＝0.01

学习率：learning_rate＝0.001

均值动量系数：gama＝0.9

定义对抗器的损失：

识别真实图片的损失：

识别生成的图片的损失：

总体对抗器损失：

d_loss＝tf.add(d_loss_real，d_loss_fake)

定义生成器的损失：

3.定义优化器

对抗器的优化器：

d_train_opt＝tf.train.AdamOptimizer(learning_rate).minimize(d_loss，var_list＝d_vars)

生成器的优化器：

g_train_opt＝tf.train.AdamOptimizer(learning_rate).minimize(g_loss，var_list＝g_vars)

4.训练过程，注意，此处含有本发明的特征

以下代码的关键步骤都作了注释。本发明的特征在于，在对生成器和对抗器进行参数更新之前，先计算生成器和对抗器的相对损失值，然后，根据相对损失值的比较结果，决定是更新生成器的参数还是更新对抗器的参数。由此来动态地控制生成器和对抗器的参数更新频率，从而防止两者博弈失衡。

以上这段代码，具体实现了本发明的特征，代码用的是tensorflow平台进行开发，但开发平台与本发明无关，亦非本发明特征。

由此可见，本发明根据生成器和对抗器的训练情况动态调整生成器和对抗器的参数更新频率，能够明显提高GAN模型的训练效果；在两种实验中都得到验证。一种是MNIST数据生成实验，另一种是家具户型图生成实验。实验采用定性和定量两种指标同时检测。定性指标用的是百张通过率，指生成器生成100张图片，人工审核通过的平均比率。定量指标用的是FID，即Fréchet Inception Distance。在MNIST数据生成实验中，对比测试结果如表1所示：

表1

可以看出，本发明所述方法，由于根据生成器和对抗器的训练情况动态调整生成器和对抗器的参数更新频率，能够明显提高GAN模型的训练效果。

在家具户型图生成实验中，对比测试结果如表2所示：

表2

基准方法在迭代150K次时，生成器已经无法训练。

最后应说明的几点是：首先，在本申请的描述中，需要说明的是，除非另有规定和限定，术语“安装”、“相连”、“连接”应做广义理解，可以是机械连接或电连接，也可以是两个元件内部的连通，可以是直接相连，“上”、“下”、“左”、“右”等仅用于表示相对位置关系，当被描述对象的绝对位置改变，则相对位置关系可能发生改变；

其次：本发明公开实施例附图中，只涉及到与本公开实施例涉及到的结构，其他结构可参考通常设计，在不冲突情况下，本发明同一实施例及不同实施例可以相互组合；

最后：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。