CN112070676B

CN112070676B - 一种双通道多感知卷积神经网络的图片超分辨率重建方法

Info

Publication number: CN112070676B
Application number: CN202010946074.XA
Authority: CN
Inventors: 张淑芬; 王鑫; 吕艳霞
Original assignee: Northeastern University Qinhuangdao Branch
Current assignee: Northeastern University Qinhuangdao Branch
Priority date: 2020-09-10
Filing date: 2020-09-10
Publication date: 2023-10-27
Anticipated expiration: 2040-09-10
Also published as: CN112070676A

Abstract

本发明提供一种双通道多感知卷积神经网络的图片超分辨率重建方法，涉及图像处理技术领域。本发明用具有不同卷积核的双卷积通道，结合局部稠密连接，获得对图片特征信息的多种感知能力，带有卷积调节功能的层间融合结构还原出更加准确的融合信息。网络通过DIV2K数据集训练，在只使用了8层DMRB模块的条件下，对几个基准数据集测试的结果好于目前多数MSRN、EDSR等先进重建算法。DMCN的重建结果图包含更加丰富的高频细节信息，与原始图片更加接近，DMCN网络结构能更全面的感知图片中的各类信息，重建能力更强。

Description

一种双通道多感知卷积神经网络的图片超分辨率重建方法

技术领域

本发明涉及图像处理技术领域，尤其涉及一种双通道多感知卷积神经网络的图片超分辨率重建方法。

背景技术

图片超分辨率重建旨在将模糊的低分辨率(Low-resolution，LR)图片重建为更加清晰的高分辨率(Height-resolution，HR)图片。它可以解决视频监控，医学、卫星成像等领域存在的图片模糊、噪声干扰等问题。常用的图片超分辨率方法有插值法、基于稀疏表示的方法、局部线性回归法以及基于深度学习的方法。

最近的研究表明，深度神经网络可以显着提高单图像超分辨率的质量。当前的研究倾向于使用更深的卷积神经网络来提高性能。但是，盲目地增加网络的深度不能有效地改善网络。更糟糕的是，随着网络深度的增加，培训过程中会出现更多问题，并且需要更多的培训技巧。

对于现有图片超分辨率重建技术，MSRN提出了一种新的多尺度残差网络(MSRN)来充分利用图像的特征：使用MSRB来获取不同尺度的图像特征(局部多尺度特征)。将每个MSRB的输出组合起来进行全局特征融合(HFFS，一个以1×1卷积核为瓶颈层)。将局部多尺度特征与全局特征相结合，最大限度地利用LR图像特征，彻底解决特征在传输过程中消失的问题，还设计了一个简单而高效重建结构可以很容易地实现多尺度的放大。

EDSR在结构上与SRResNet相比，就是把批规范化处理(batch normalization,BN)操作给去掉了。由于批规范化层消耗了与它前面的卷积层相同大小的内存，在去掉这一步操作后，相同的计算资源下，EDSR就可以堆叠更多的网络层或者使每层提取更多的特征，从而得到更好的性能表现。EDSR用L1范数样式的损失函数来优化网络模型。在训练时先训练低倍数的上采样模型，接着用训练低倍数上采样模型得到的参数来初始化高倍数的上采样模型，这样能减少高倍数上采样模型的训练时间，同时训练结果也更好；MDSR的中间部分还是和EDSR一样，只是在网络前面添加了不同的预训练好的模型来减少不同倍数的输入图片的差异。在网络最后，不同倍数上采样的结构平行排列来获得不同倍数的输出结果。

现有方法中存在如下问题：首先，用于超分辨率重建的深度网络的性能高度依赖于网络宽度和深度，新方法倾向于使用更宽的网络和更多的网络层数来提升重建效果。但不断增长的网络规模使得训练难度同步提高，需要更加合理的设计网络以避免训练中出现梯度消失等问题，同时网络在计算过程中的时间复杂度和空间复杂度也在成倍增长，对GPU硬件依赖度高。其次，多数超分辨网络都使用了类似ResNet中的残差堆叠结构来提升训练效果，但单纯的残差结构不能充分提取网络中的图像特征。虽然MSRN网络使用多尺度方法提取图片特征，增强了重建效果，但其MSRB模块结构仍不能提取图片完整特征，特别是经通道稠密连接获得的融合特征信息，对图片全局特征的提取也不够充分。

发明内容

针对现有技术的不足，本发明提供一种双通道多感知卷积神经网络的图片超分辨率重建方法。

为解决上述技术问题，本发明所采取的技术方案是：

一种双通道多感知卷积神经网络的图片超分辨率重建方法，包括以下步骤：

步骤1：构建一个双通道多感知残差模块DMRB，作为重构网络的基础模块；

所述重构网络包括浅层特征提取层、深层特征提取层、放大重建层；

步骤2：浅层特征提取层对输入网络的低分辨率图片I^LR进行升维，由RGB图片的3特征维度提升到深层特征提取层的64特征维度，并获得图片的初步特征信息，输出特征值X₀，该过程为：X₀＝H_SFE(I^LR)，其中H_SFE(.)表示浅层特征提取功能；

步骤3：X₀输入到深层特征提取层，在多层双通道多感知残差模块DMRB间传递，不断提取特征信息，并把各层输出通过调节层(1*1卷积)后，输入到层间融合层，最后通过残差结构提升特征提取效率，输出特征值X_d，则该过程为：X_d＝H_DFE(X₀)，其中H_DFE(.)表示深度特征提取功能；

所述调节层调节各层在融合过程中的比例关系；

所述层间融合层将各深层特征提取层输出的特征信息进行融合；

步骤4：将图片通过放大重建层放大到特定倍数，该过程为：I^SR＝H_{up_REC}(X_d)，其中H_{up_REC}(.)表示放大和重建功能；

步骤5：将整个网络功能表示为H_DMCN(.)，将低分辨图片I^LR映射到高分辨率图片I^SR：I^SR＝H_{up_REC}(H_DEF(H_SFE(I^LR)))。

采用上述技术方案所产生的有益效果在于：

本发明提出了一种双通道多感知卷积神经网络的图片超分辨率重建方法，用具有不同卷积核的双卷积通道，结合局部稠密连接，获得对图片特征信息的多种感知能力，带有卷积调节功能的层间融合结构还原出更加准确的融合信息。网络通过DIV2K数据集训练，在只使用了8层DMRB模块的条件下，对几个基准数据集测试的结果好于目前多数MSRN、EDSR等先进重建算法。DMCN的重建结果图包含更加丰富的高频细节信息，与原始图片更加接近，DMCN网络结构能更全面的感知图片中的各类信息，重建能力更强。

附图说明

图1为本发明双通道多感知卷积神经网络的图片超分辨率重建方法流程图；

图2为本发明重构网络架构图；

图3为本发明双通道多感知残差模块结构图；

图4为本发明实施例在4倍重建中的质量比较示意图。

具体实施方式

下面结合附图对本发明具体实施方式加以详细的说明。

一种双通道多感知卷积神经网络的图片超分辨率重建方法，如图1所示，包括以下步骤：

步骤1：构建一个双通道多感知残差模块DMRB，作为重构网络的基础模块，该模块能最大化感知图片特征，重建中有较强的高频信息还原能力；

所述重构网络如图2所示，包括浅层特征提取层、深层特征提取层、放大重建层；

所述调节层调节各层在融合过程中的比例关系；

本实施例使用了亚像素卷积法上采样。

步骤5：将整个网络功能表示为H_DMCN(.)，将低分辨图片I^LR映射到高分辨率图片I^SR：I^SR＝H_{up_REC}(H_DEF(H_SFE(I^LR)))＝H_DMCN(I^LR)

网络通过DIV2K数据集训练，在只使用了8层DMRB模块的条件下，对几个基准数据集测试的结果好于目前多数先进重建模型。

双通道多感知残差模块DMRB结构图如图3所示。左右两侧的特征提取通道分别采用了3×3和5×5的卷积核。不同卷积核可使卷积操作获得不同尺度上的图片特征信息，如果将信息融合并做进一步特征提取，能有效增强深度结构的感知能力，这种做法在GoogLeNet网络中得到成功应用，后来的MSRN网络也使用了类似结构。本发明的结构与他们不同之处在于，DMRB中除了融合了两种卷积操作输出的特征值外，还融合了局部稠密连接信息。

本实施例实验用DIV2K数据集中的800张图片对卷积网络进行了训练，输入图片为RGB图像并裁剪为48×48大小，对输入图像按EDSR网络中的方法进行旋转、翻转等变换，以增强训练效果。每次训练样本数(BatchSize)为16，共迭代了1000次。训练中对2倍、3倍、4倍重建分别进行训练。训练结果基于Set5、Set14、B100和Urban100基准数据集进行测试，评价指标为峰值信噪比(PSNR)和结构相似性(Structural Similarity Inex,SSIM)。表1给出了本文方法与几个经典SR方法的比较。

表1基准数据集测试结果

表中加下划线数据为测试中最好结果，DMCN+使用了几何自集合(GeometricSelf-ensemble)方法提升测试效果。可以看出在多数训练集中我们提出的DMCN网络都取得了最好的测试数据。

图4给出了DMCN在难度较高的4倍重建中，重建效果与几个主流重建算法VDSR、MSRN等的比较。从主观视觉感受上，可以明显看出DMCN的重建结果图包含更加丰富的高频细节信息，与原始图片更加接近。这一结果主要得益于DMCN网络结构能更全面的感知图片中的各类信息，重建能力更强。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开的实施例中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种双通道多感知卷积神经网络的图片超分辨率重建方法，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种双通道多感知卷积神经网络的图片超分辨率重建方法，其特征在于，步骤1中所述重构网络包括浅层特征提取层、深层特征提取层、放大重建层。

3.根据权利要求1所述的一种双通道多感知卷积神经网络的图片超分辨率重建方法，其特征在于，步骤3中所述调节层调节各层在融合过程中的比例关系；所述层间融合层将各深层特征提取层输出的特征信息进行融合。

4.根据权利要求3所述的一种双通道多感知卷积神经网络的图片超分辨率重建方法，其特征在于，所述层间融合模块，除最后一层输出X_n外，X₀到X_n-1跳跃连接到融合层时都经过一个1×1卷积层，除最后一层输出在融合中有固定作用外，其它层由卷积层进行动态调节，从而提取出准确的图片特征值。