CN107886162A - 一种基于wgan模型的可变形卷积核方法 - Google Patents
一种基于wgan模型的可变形卷积核方法 Download PDFInfo
- Publication number
- CN107886162A CN107886162A CN201711123711.8A CN201711123711A CN107886162A CN 107886162 A CN107886162 A CN 107886162A CN 201711123711 A CN201711123711 A CN 201711123711A CN 107886162 A CN107886162 A CN 107886162A
- Authority
- CN
- China
- Prior art keywords
- mrow
- convolution kernel
- maker
- deformable convolution
- msub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于WGAN模型的可变形卷积核方法,属于深度学习神经网络领域,包括以下步骤:S1、构造原始生成对抗网络模型;S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;S3、初始化随机噪声,输入生成器中;S4、在WGAN模型中利用可变形卷积核对图像进行卷积;S5、将可变形卷积操作得到的损失函数输入生成器进行后续训练。本发明构建的基于WGAN模型的可变形卷积核方法,改变了判别器、生成器接收图片后的卷积方式,让判别器、生成器能够根据训练的情况自动地改变卷积核的大小,从而能够自适应地对数据集图像的特征进行学习,提高了整个网络训练的鲁棒性。
Description
技术领域
本发明涉及深度学习神经网络领域,具体涉及一种基于WGAN模型的可变形卷积核方法。
背景技术
生成式对抗网络(Generative Adversarial Network,简称GAN)是由Goodfellow在2014年提出的深度学习框架,它基于“博奕论”的思想,构造生成器(generator)和判别器(discriminator)两种模型,前者通过输入(0,1)的均匀噪声或高斯随机噪声生成图像,后者对输入的图像进行判别,确定是来自数据集的图像还是由生成器产生的图像。
在传统的对抗网络模型中,对于生成器生成图像质量并没有统一的评判标准,因此,亟待提出一种利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行,另外利用可变形卷积学习图像特征的方法,提高了整个网络的训练效率。
发明内容
本发明的目的是为了解决现有技术中的上述缺陷,提供一种基于WGAN模型的可变形卷积核方法。
本发明的目的可以通过采取如下技术方案达到:
一种基于WGAN模型的可变形卷积核方法,所述可变形卷积核方法包括下列步骤:
S1、构造原始生成对抗网络模型,通过生成器生成图像输入至判别器进行网络训练;
S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;
在本发明所涉及到的网络模型中,利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行。
S3、初始化随机噪声,输入生成器中;
S4、在WGAN模型中利用可变形卷积核对图像进行卷积;
在原始的生成对抗网络模型中,卷积核的形状一般为方形,这限制了神经网络对图像特征学习的自由度,而在本发明中,针对这一缺陷,利用网络训练对卷积核的形状进行自适应地改变,从而能够以更高的效率学习到数据集中图像的特征。
S5、将可变形卷积操作得到的损失函数输入生成器进行后续训练。
进一步地,所述的步骤S2具体如下:
构造多个卷积核,不同的卷积核,代表着在学习的过程中,能够学习到不同的图像特征。
进一步地,所述的步骤S4中在WGAN中利用可变形卷积核对图像进行卷积,具体过程如下:
S41、构造多个不同数值但大小相同的卷积核;
S42、采用已构造的卷积核,分别对生成器生成的多张图像进行卷积,从而得到多张特征图。
进一步地,所述的步骤S5中,将可变形卷积操作得到的损失函数输入生成器进行后续训练。具体过程如下:
S51、对S4中卷积之后的特征图,输入判别器进行判别;
S52、将可变形卷积操作得到的损失函数输入生成器进行后续训练。
S53、将所有损失函数的均值输入至生成器中继续进行训练。
本发明相对于现有技术具有如下的优点及效果:
鲁棒性:本发明根据可变形卷积的操作过程,设置构造了多个可变形卷积核,通过在训练过程中动态地改变卷积核大小的方式,应用在以深度卷积神经网络充当生成器与判别器的对抗网络模型中,同时利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行。
附图说明
图1是本发明中公开的基于WGAN模型的可变形卷积核方法训练流程图;
图2是本发明中对原始卷积核改造成为可变形卷积核的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
本实施例公开了一种基于WGAN模型的可变形卷积核方法,具体包括下列步骤:
步骤S1、构造原始生成对抗网络模型,生成器通过生成图像输入至判别器进行网络训练。
步骤S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;
不同的卷积核,体现在矩阵数值的不同、行列数的不同。
构造多个卷积核,在处理图像的过程中,不同的卷积核意味着能够在网络训练的过程中学习到生成图像的不同特征。
在本发明所涉及到的网络模型中,利用沃瑟斯坦距离作为生成对抗网络的评判指标,从而使整个模型的训练能够往正确的方向进行。
在传统对抗网络的模型中,判别器和生成器所用到的卷积核都是固定大小且数值一致的,在这种情况下的训练效率相对较低,而且学习到的图像特征范围相对较小。而在本发明中,利用可变形卷积,对原始卷积核进行中间插“0”的操作,从而增大了卷积核所能学习到的特征范围,进一步提高了整个网络学习的效率。
在实际应用中,应该根据数据集图像特征的复杂程度,设置卷积核的个数。
步骤S3、初始化随机噪声,输入生成器中。
步骤S4、在WGAN模型中利用可变形卷积核对图像进行卷积。
在原始的生成对抗网络模型中,卷积核的形状一般为方形,这限制了神经网络对图像特征学习的自由度,而在本发明中,针对这一缺陷,利用网络训练对卷积核的形状进行自适应地改变,从而能够以更高的效率学习到数据集中图像的特征。
具体方法如下:
S41、构造多个不同数值但大小相同的卷积核;
S42、通过网络训练过程中反传的误差,对卷积核的形状进行自适应的改变。
步骤S5、将可变形卷积操作得到的损失函数输入生成器进行后续训练。具体过程如下:
S51、将步骤S4中卷积之后的特征图,输入判别器进行判别;
S52、将可变形卷积操作得到的损失函数输入生成器进行后续训练。
S53、将所有损失函数的均值输入至生成器中继续进行训练。
损失函数的作用是衡量判别器对生成图像判断的能力。损失函数的值越小,说明在当前迭代中,判别器能够有较好的性能辨别生成器的生成图像;反之则说明判别器的性能较差。
损失函数的表达式为:
其中,D(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,为梯度,E为取均值的操作符号。
综上所述,本实施例公开了一种基于WGAN模型的可变形卷积核方法,相比于传统的原始对抗网络模型,改变了判别器接收图片后的对图像特征进行学习的方式。在传统对抗网络的模型中,判别器和生成器所用到的卷积核都是固定大小且数值一致的,在这种情况下的训练效率相对较低,而且学习到的图像特征范围相对较小。而在本发明中,利用可变形卷积,根据在训练过程中网络对图像特征学习的效果,动态地改变卷积核的大小,从而增大了卷积核所能学习范围的自适应性,进一步提高了整个网络学习的效率。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
Claims (4)
1.一种基于WGAN模型的可变形卷积核方法,其特征在于,所述的可变形卷积核方法包括下列步骤:
S1、构造原始生成对抗网络模型,通过生成器生成图像输入至判别器进行网络训练;
S2、构造沃瑟斯坦距离,作为对抗网络模型的评判指标;
S3、初始化随机噪声,输入生成器中;
S4、在WGAN模型中利用可变形卷积核对图像进行卷积;
S5、将可变形卷积操作得到的损失函数输入生成器进行后续训练。
2.根据权利要求1所述的一种基于WGAN模型的可变形卷积核方法,其特征在于,所述的步骤S4具体过程如下:
S41、构造多个不同数值但大小相同的卷积核;
S42、通过网络训练过程中反传的误差,对卷积核的形状进行自适应的改变。
3.根据权利要求1所述的一种基于WGAN模型的可变形卷积核方法,其特征在于,所述的步骤S5具体过程如下:
S51、将可变形卷积之后得到的图像特征图,输入判别器中进行判别;
S52、将可变形卷积操作得到的损失函数输入生成器进行后续训练;
S53、将所有损失函数的均值输入至生成器中继续进行训练。
4.根据权利要求1所述的一种基于WGAN模型的可变形卷积核方法,其特征在于,所述的损失函数的表达式为:
<mrow>
<mi>L</mi>
<mrow>
<mo>(</mo>
<mi>D</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mo>-</mo>
<msub>
<mi>E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>p</mi>
<mi>r</mi>
</mrow>
</msub>
<mo>&lsqb;</mo>
<mi>D</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>+</mo>
<msub>
<mi>E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>p</mi>
<mi>g</mi>
</mrow>
</msub>
<mo>&lsqb;</mo>
<mi>D</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>&rsqb;</mo>
<mo>+</mo>
<msub>
<mi>&lambda;E</mi>
<mrow>
<mi>x</mi>
<mo>~</mo>
<mi>X</mi>
</mrow>
</msub>
<msub>
<mo>&dtri;</mo>
<mi>x</mi>
</msub>
</mrow>
其中,D(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,为梯度,E为取均值的操作符号。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711123711.8A CN107886162A (zh) | 2017-11-14 | 2017-11-14 | 一种基于wgan模型的可变形卷积核方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711123711.8A CN107886162A (zh) | 2017-11-14 | 2017-11-14 | 一种基于wgan模型的可变形卷积核方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107886162A true CN107886162A (zh) | 2018-04-06 |
Family
ID=61776659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711123711.8A Pending CN107886162A (zh) | 2017-11-14 | 2017-11-14 | 一种基于wgan模型的可变形卷积核方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107886162A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109359667A (zh) * | 2018-09-07 | 2019-02-19 | 华南理工大学 | 一种基于wgan模型的特征重标定卷积方法 |
CN109933677A (zh) * | 2019-02-14 | 2019-06-25 | 厦门一品威客网络科技股份有限公司 | 图像生成方法和图像生成*** |
CN110728303A (zh) * | 2019-09-12 | 2020-01-24 | 东南大学 | 基于卷积神经网络数据复杂度的动态自适应计算阵列 |
CN112102306A (zh) * | 2020-09-25 | 2020-12-18 | 西安交通大学 | 一种基于双重gan的边缘修复特征融合的缺陷检测方法 |
TWI714397B (zh) * | 2019-03-19 | 2020-12-21 | 大陸商深圳市商湯科技有限公司 | 視頻處理方法、裝置以及電腦儲存介質 |
CN112292694A (zh) * | 2018-04-19 | 2021-01-29 | 智动科技有限公司 | 用于加速操作的方法和加速器装置 |
CN114239814A (zh) * | 2022-02-25 | 2022-03-25 | 杭州研极微电子有限公司 | 用于图像处理的卷积神经网络模型的训练方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103590A (zh) * | 2017-03-22 | 2017-08-29 | 华南理工大学 | 一种基于深度卷积对抗生成网络的图像反射去除方法 |
CN107154023A (zh) * | 2017-05-17 | 2017-09-12 | 电子科技大学 | 基于生成对抗网络和亚像素卷积的人脸超分辨率重建方法 |
-
2017
- 2017-11-14 CN CN201711123711.8A patent/CN107886162A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107103590A (zh) * | 2017-03-22 | 2017-08-29 | 华南理工大学 | 一种基于深度卷积对抗生成网络的图像反射去除方法 |
CN107154023A (zh) * | 2017-05-17 | 2017-09-12 | 电子科技大学 | 基于生成对抗网络和亚像素卷积的人脸超分辨率重建方法 |
Non-Patent Citations (3)
Title |
---|
IAN J. GOODFELLOW 等: "Generative Adversarial Nets", 《ARXIV》 * |
ISHAAN GULRAJANI 等: "Improved Training of Wasserstein GANs", 《ARXIV》 * |
MARTIN ARJOVSKY 等: "Wasserstein GAN", 《ARXIV》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112292694A (zh) * | 2018-04-19 | 2021-01-29 | 智动科技有限公司 | 用于加速操作的方法和加速器装置 |
CN109359667A (zh) * | 2018-09-07 | 2019-02-19 | 华南理工大学 | 一种基于wgan模型的特征重标定卷积方法 |
CN109933677A (zh) * | 2019-02-14 | 2019-06-25 | 厦门一品威客网络科技股份有限公司 | 图像生成方法和图像生成*** |
TWI714397B (zh) * | 2019-03-19 | 2020-12-21 | 大陸商深圳市商湯科技有限公司 | 視頻處理方法、裝置以及電腦儲存介質 |
CN110728303A (zh) * | 2019-09-12 | 2020-01-24 | 东南大学 | 基于卷积神经网络数据复杂度的动态自适应计算阵列 |
CN110728303B (zh) * | 2019-09-12 | 2022-03-11 | 东南大学 | 基于卷积神经网络数据复杂度的动态自适应计算阵列 |
CN112102306A (zh) * | 2020-09-25 | 2020-12-18 | 西安交通大学 | 一种基于双重gan的边缘修复特征融合的缺陷检测方法 |
CN112102306B (zh) * | 2020-09-25 | 2022-10-25 | 西安交通大学 | 一种基于双重gan的边缘修复特征融合的缺陷检测方法 |
CN114239814A (zh) * | 2022-02-25 | 2022-03-25 | 杭州研极微电子有限公司 | 用于图像处理的卷积神经网络模型的训练方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107886162A (zh) | 一种基于wgan模型的可变形卷积核方法 | |
CN107871142A (zh) | 一种基于深度卷积对抗网络模型的空洞卷积方法 | |
CN107590518A (zh) | 一种多特征学习的对抗网络训练方法 | |
CN107886169A (zh) | 一种基于文本‑图像生成对抗网络模型的多尺度卷积核方法 | |
Zhang et al. | Hierarchical feature fusion with mixed convolution attention for single image dehazing | |
CN108009568A (zh) | 一种基于wgan模型的行人检测方法 | |
CN107590531A (zh) | 一种基于文本生成的wgan方法 | |
CN106991408A (zh) | 一种候选框生成网络的生成方法及人脸检测方法 | |
CN108961245A (zh) | 基于双通道深度并行卷积网络的图像质量分类方法 | |
CN107016406A (zh) | 基于生成式对抗网络的病虫害图像生成方法 | |
CN107767413A (zh) | 一种基于卷积神经网络的图像深度估计方法 | |
CN104217404B (zh) | 雾霾天视频图像清晰化处理方法及其装置 | |
CN107944546A (zh) | 一种基于原始生成对抗网络模型的残差网络方法 | |
CN107563493A (zh) | 一种多生成器卷积合成图像的对抗网络算法 | |
CN106447626A (zh) | 一种基于深度学习的模糊核尺寸估计方法与*** | |
CN107577985A (zh) | 基于循环生成对抗网络的人脸头像卡通化的实现方法 | |
CN107992944A (zh) | 一种基于原始生成对抗网络模型的多尺度卷积方法 | |
CN107808132A (zh) | 一种融合主题模型的场景图像分类方法 | |
CN107943750A (zh) | 一种基于wgan模型的分解卷积方法 | |
CN106339984B (zh) | 基于k均值驱动卷积神经网络的分布式图像超分辨方法 | |
CN108615228A (zh) | 基于混合神经网络的人脸图像补全方法 | |
CN106022392A (zh) | 一种深度神经网络样本自动取舍的训练方法 | |
CN106934455A (zh) | 基于cnn的遥感影像光学适配结构选取方法及*** | |
CN106778539A (zh) | 教学效果信息获取方法及装置 | |
CN106846261A (zh) | 基于卷积神经网络的水下图像处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180406 |