CN112132756A

CN112132756A - 一种基于注意力机制的单幅雨滴图像增强方法

Info

Publication number: CN112132756A
Application number: CN201910587306.4A
Authority: CN
Inventors: 郑顾平; ***; 曹锦纲
Original assignee: North China Electric Power University
Current assignee: North China Electric Power University
Priority date: 2019-06-24
Filing date: 2019-06-24
Publication date: 2020-12-25

Abstract

本发明公开提供了一种基于注意力机制的单幅雨滴图像增强方法，方法包括：数据集预处理；采用具有不同扩张因子的多尺度扩张卷积进行特征提取；引入注意力机制模型来关注图像中雨滴区域的细节。本发明提供的方法，能够很好地去除雨滴类图像中的雨滴部分，使雨滴类模糊图像具有较好的质量。

Description

一种基于注意力机制的单幅雨滴图像增强方法

技术领域

本发明涉图像增强领域，尤指一种单幅雨滴图像增强方法。

背景技术

在有雨环境下采集到的图片往往会掺杂雨滴或雨条纹，导致图片模糊，而现有去除雨滴实现图像增强算法容易引入更多噪声或不能去除较大雨滴，为更好地去除图像上的雨滴，恢复图像更多细节，发明人提出了一种基于注意力机制的单幅雨滴图像增强方法。

扩张卷积(Dilated Convolutions)又称膨胀卷积或空洞卷积，与其他卷积方式不同的是扩张卷积引入了一个新参数-扩张率参数即扩张因子(dilation rate)，用其表示扩张的大小。

扩张卷积的结构如图1所示。如Yu等人提到，设F₀，F₁，....，F_n-1：Z₁→R为离散函数，令K₀，K₁，....，K_n-2：Z₂→R为离散3*3滤波器，考虑应用指数增加膨胀的滤波：

F_i+1＝F_i×2′k_i，i＝0，1，2，....，n-2 (1)

将F_i+1中元素p的像素感受野区域定义为在F₀基础上修改F_i+1(p)值的元素值，假设F_i+1中的像素p的感受野大小为这些元素的数量，可以将像素中在扩张卷积下的感受野大小表示为：

F_i+1＝(2ⁱ⁺²-1)×(2ⁱ⁺²-1) (2)

扩张卷积可以对像素进行加权，聚合信息，从而能够在不失去分辨率的情况下增强其感受视野，能够获得更多的特征信息，并可以保证输出的特征映射的大小不发生变化。

视觉注意力机制是人类大脑中特有的视觉信号处理机制，注意力机制思想的本质类似人类的视觉注意力，主要意义是对大量的信息进行筛选，选择对当前任务相关的关键性高价值信息。注意力机制思想最早是被应用在计算机图像视觉研究上，近些年越来越多的研究者使用注意力机制思想与神经网络相结合进行相关问题研究。

因此，借助注意力机制思想，提出一种基于注意力机制的单幅雨滴图像增强方法，以期能有效地提高雨滴类模糊图像增强，使得图像细节更加丰富，能具有较好的图像视觉效果。

发明内容

为解决上述问题，本发明主要目的在于，提供一种有效地提高雨滴模糊图像增强，使图像的细节更加丰富。

本发明采取了如下的技术方案：首先采用具有不同扩张因子的多尺度扩张卷积对输入含雨滴图片进行特征值提取；其次，模型中引入注意力机制来关注图像中雨滴区域的细节，以帮助更好地去除雨滴，恢复图像的细节：最后，端到端地实现雨滴类的模糊图像增强。

该方法包含的步骤如下：

(1)对数据集图片进行统一的分辨率大小处理，划分出训练集和测试集。

(2)建立基于注意力机制的雨滴模糊图像增强模型，并对网络的参数进行初始化。

(3)利用划分出的训练集对模型进行训练，通过损失函数进行反向传播不断更新模型参数，使计算出的损失最小，以使模型得性能效果最优。

(4)每50对图片为一次训练，设置的最大迭代次数为3000，保存模型参数，使用测试集测试模型。

较佳的，其具体实现包括：注意力机制模型帮助对雨滴图像的特征提取，注意力机制可以使网络关注雨滴区域，能够更好地实现雨滴图像增强。所述注意力机制模型包括三层残差网络(ResBlock)、长短记忆神经网络(LSTM)和卷积核大小为3*3、步长为1的普通卷积层(conv)组成。

较佳的损失函数由两部分构成，即注意力机制模型损失L_att和感知损失L_p。

L_p＝L_MSE(VGG(0)，VGG(T)) (4)

使用VGG16对网络进行预训练，提取高层的特征进行监督来保证生成图像的质量，其中，A_t是注意力机制模型在时刻t时产生的注意力机制图，M为二进制掩码，N取4，θ取0.8，O为模型处理后输出的去雨滴图像，T为雨滴图像对应的原清晰无雨滴图像。选用自适应矩估计(ADAM)算法来优化损失函数。模型通过训练数据集不断更新神经网络权重，经过多次训练调优，学习率α定为0.0001，β1＝0，β2＝0.9，在训练过程中，我们将注意力图的值初始化为0.5。

本发明有益效果在于，借助上述技术方案，能有效地在进行特征提取时增强其感受视野，获得到更多的特征信息，更多地关注到了图像中雨滴区域，相比其他算法，本发明提出的模型，提高了雨滴模糊图像增强，使图像的细节更加得丰富。

附图说明

图1为扩张卷积结构图；

图2基于注意力机制的雨天模糊图像增强模型

图3注意力机制模型

图4所采用的的残差网络

图5实验结果对比图

其中：

图5中：(a)雨滴图 (b)清晰图 (c)本发明提出的模型 (d)Tanaka (e)Eigen

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，下面将结合附图，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不用于限定本发明。

如图1所示，本发明提出的基于注意力机制的雨天模糊图像增强模型的整体结构，其中，conv、dia_c和convtranspose分别代表卷积层、扩张卷积层和反卷积层，relu是激活函数。本发明提出的基于注意力机制的雨天模糊图像增强模型包含：

(1)初步提取特征。输入的图像进行两次卷积核尺寸为7*7*64、5*5*128且步长为1的卷积处理，

得到初步提取到的特征。

(2)多尺度扩张卷积提取特征。采用卷积核3*3*256的扩张卷积，即dia_c1、dia_c2、dia_c3，扩张

因子(dilation rate)的值分别为2，4，6，三种扩张卷积处理后得到的三种特征。

(3)生成注意力图。将三种特征分别输入3.2中所介绍的注意力机制模型，输出结果为三种注意力图，

将三种注意力图与原图像做特征融合。

(4)输出图像。输出依次进行3次卷积核尺寸为3*3*256且步长为1的卷积处理、2次卷积核尺寸为4*4*128、4*4*64且步长为2的反卷积操作、卷积核尺寸为3*3*64且步长为1的卷积处理，最终输出除雨后的图像。

如图3所示，本发明中设计的注意力机制模型是由三层残差网络(ResBlock)、长短记忆神经网络(LSTM)和卷积层(conv)组成：

(1)残差网络：由于归一化(Batch Normalization)层会忽略图像特征间的绝对差异，我们所用的残差网络为传统残差网络结构中去掉归一化(Batch Normalization)层。

(2)长短记忆神经网络(LSTM)。

(3)卷积层：采用的是卷积核大小为3*3、步长为1的普通卷积。

实验步骤如下：

为说明本发明提出模型的优越性，我们对Tanaka等人及Eigen等人提出的算法进行了对比实验，使用上述本文自建的雨滴图像数据集，实验的图片质量评价结果如表1所示，图5是选取上述的测试集中4幅图片的实验效果图。

表1图片质量评价结果

从表1中可以看到，Tanaka等人提出的去雨模型的峰值信噪比为26.84，Eigen等人提出模型的峰值信噪比为27.41，而本章提出的模型的峰值信噪比达到了28.37，同时本发明提出的模型的结构相似度达到了0.9091皆高于另外两个模型的结构相似度。从图5中可以看到，Tanaka等人的方法不能去除较密集的雨滴，给图像引入了较多的噪声，Eigen等人的方法处理得到图片的细节不够丰富，图片中有出现失真现象，而经本发明模型处理后的图片在主观的视觉感受方面取得了较好的效果。因此，本发明的算法模型无论是从峰值信噪比还是从结构相似度上来看都要优于其他的算法。

Claims

1.一种基于注意力机制的单幅雨滴图像增强方法，其特征在于采用不同扩张因子的多尺度扩张卷积增强其感受视野，以获得更多的特征信息；模型引入注意力机制构造注意力机制模型来关注图像中雨滴区域，以此更好地去除雨滴，实现雨滴模糊类图像细节的恢复。

2.根据权利要求1所述的一种基于注意力机制的单幅雨滴图像增强方法，该方法包含步骤：

(1)初步提取特征。输入的图像进行两次卷积核尺寸为7*7*64、5*5*128且步长为1的卷积处理，得到初步提取到的特征。

(2)多尺度扩张卷积提取特征。三种扩张卷积处理后得到的三种特征。

(3)生成注意力图。将三种特征分别输入注意力机制模型，输出结果为三种注意力图，将三种注意力图与原图像做特征融合。

3.根据权利要求2所述的多尺度扩张卷积，该方法包含：卷积核3*3*256的扩张卷积，即dia_c1、dia_c2、dia_c3，扩张因子(dilation rate)的值分别为2，4，6。

4.根据权利要求2所述的注意力机制模型，该方法包含步骤：

注意力机制模型是由三层残差网络(ResBlock)、长短记忆神经网络(LSTM)和卷积层(conv)组成：

(2)长短记忆神经网络(LSTM)；

(3)卷积层：采用的是卷积核大小为3*3、步长为1的普通卷积。

5.根据权利要求1所述的一种基于注意力机制的单幅雨滴图像增强方法，其特征在于：所述抗网络损失L_adv和感知损失L_c为：

注意力机制模型损失L_att和感知损失L_p。

L_p＝L_MSE(VGG(O)，VGG(T)) (2)

使用VGG16对网络进行预训练，提取高层的特征进行监督来保证生成图像的质量，其中，A_t是注意力机制模型在时刻t时产生的注意力机制图，M为二进制掩码，N取4，θ取0.8，O为模型处理后输出的去雨滴图像，T为雨滴图像对应的原清晰无雨滴图像。

本文模型的总体损失函数为：

L＝L_att+L_p (3)。