CN111461973A

CN111461973A - 一种图像的超分辨率重建方法及***

Info

Publication number: CN111461973A
Application number: CN202010051767.2A
Authority: CN
Inventors: 陶文兵; 陈中雨
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2020-01-17
Filing date: 2020-01-17
Publication date: 2020-07-28

Abstract

本发明公开了一种图像的超分辨率重建方法及***，基于图像的通道注意力机制和位置注意力机制，在不同深度上提取各图像块上的特征后进行融合，有效的辨识了特征通道信息和位置信息的重要性，并且由于不同深度的特征对于图像超分辨率有着不同的贡献，本发明充分利用并融合不同深度特征，所得图像特征的在保留较大的感受野的同时也保留了更好的细节特征，基于该特征进行重建后，所得图像的超分效果较好。另外，本发明充分挖掘特征之间的联系，缓解了网络过深带来的性能瓶颈问题，且图像的特征表征能力较好，具有鲁棒性。

Description

一种图像的超分辨率重建方法及***

技术领域

本发明属于计算机视觉领域，更具体地，涉及一种图像的超分辨率重建方法及***。

背景技术

早期的基于差值的图像超分辨率方法虽然简单，效率高，但是在实际应用中的效果却受到很大限制。最近，基于深度卷积神经网络的方法已经获得了超越传统图像超分方法的表现。最早的基于深度卷积神经网络的方法，提出了一个只有三层的图像超分辨率网络，其中包含了浅层特征提取、非线性映射、重建和上采样四个部分，第一次将深度学习引入到图像超分任务中。基于上述网络结构，图像超分辨率网络逐渐加深，通过引入残差学习结构可以将超分网络加深并且有效的保证训练收敛，解决了网络过深带来的训练困难等问题。但是网络还是过浅，重建的效果仍然很差。

随着计算机视觉领域分类任务中证明了更深的网络可以有效提升视觉任务上的表现后，这种有效的残差学习策略被引入到其他许多基于卷积网络的图像超分辨率方法中。主流的图像超分辨率网络都有着非常深和宽的特点，均使用分类网络中的残差模块作为基础模块，并通过去除残差模块中的批量归一化层来节省参数量和计算量用来加深网络，使得图像超分辨率效果取得了巨大的进步。通过堆叠残差模块会虽然使得网络变得很深，但是并没有充分挖掘出提取得到的特征之间的联系，限制了网络的特征表征能力，即使网络继续加深也无法提升的提升网络性能，存在性能瓶颈。此外，仅仅利用单一尺度的特征图进行超分辨率重建，在较大超分倍数的情况下，会存在鲁棒性差的问题。

故为了提高执行速度和性能，现有的图像的超分辨率重建方法中，图像超分辨率网络变得深度而紧凑，采用了更有效的跳跃连接方式这种连接虽然有助于该模型准确、有效地执行图像超分任务，但是由于没有充分利用并融合不同深度的特征信息，特征提取时感受野不足，超分效果较差。此外，基于感知损失和对抗生成网络被应用到图像超分辨率任务中，用于提升超分结果的视觉真实感，但是也会带来更多的虚假细节，限制了实际场景中的应用。

由此可见，现有的图像超分辨方法没有充分利用和融合不同深度的特征信息，超分效果较差；另外，由于现有方法主要关注于增加网络的深度和宽度，没有充分挖掘特征之间的联系，限制了网络的特征表征能力，且网络过深，存在性能瓶颈，鲁棒性较差。

发明内容

针对现有技术的以上缺陷或改进需求，本发明提供了一种图像的超分辨率重建方法，其目的在于解决现有技术由于没有充分利用并融合不同层特征信息而导致的超分效果较差的问题。

第一方面，本发明提供了一种图像的超分辨率重建方法，包括以下步骤：

S1、对待处理的低分辨率图像进行分块，得到多个图像块；

S2、基于图像的通道注意力机制和位置注意力机制，在不同深度上提取各图像块上的特征，得到各图像块对应的不同深度的特征图；

S3、对各图像块对应的不同深度的特征图进行融合，根据图像超分倍数，对所得融合后的特征图进行图像重建，得到各超分辨率图像块；

S4、将所得的各超分辨率图像块进行重组，得到高分辨率图像。

本发明的有益效果是：本发明基于图像的通道注意力机制和位置注意力机制，在不同深度上提取各图像块上的特征后进行融合，有效的辨识了特征通道信息和位置信息的重要性，并且由于不同深度的特征对于图像超分辨率有着不同的贡献，本发明充分利用并融合不同深度特征，所得图像特征的在保留较大的感受野的同时也保留了更好的细节特征，基于该特征进行重建后，所得图像的超分效果较好。

本发明进一步的有益效果是：本发明有效地辨识了特征通道和位置的重要性，充分挖掘特征之间的联系，可以在网络继续加深的时候，提高网络表征能力，缓解了网络过深带来的性能瓶颈问题，且图像的特征表征能力较好，具有鲁棒性。

上述技术方案的基础上，本发明还可以做如下改进。

进一步优选地，上述S2包括以下步骤：

S21、采用卷积神经网络提取图像块的浅层特征，得到浅层特征图；

S22、采用已训练好的深层特征提取网络，分别在不同深度上提取浅层特征图的通道注意力特征和位置注意力特征，将二者进行融合，得到图像块对应的不同深度的特征图；

其中，所述深层特征提取网络包括N个级联的基于注意力模型的双注意力卷积神经网络，与N个深度一一对应，N为大于等于2的正整数。

进一步优选地，上述双注意力卷积神经网络包括通道注意力模型、位置注意力模型和融合层；

其中，通道注意力模型的输出端与融合层的输入端相连，位置注意力模型的输出端与融合层的输入端相连；

通道注意力模型用于基于通道注意力机制，通过计算输入特征图各通道的像素平均值，得到通道注意力初始权重，对其进行调整后，与输入特征图进行点乘，得到输入特征图的通道注意力特征；

位置注意力模型用于基于位置注意力机制，通过在输入特征图各像素位置点处计算各通道像素的平均值，得到位置注意力初始权重，对其进行调整后，与输入特征图进行点乘，得到输入特征图的位置注意力特征；

融合层用于将所得通道注意力特征和位置注意力特征进行融合。

本发明进一步的有益效果是：在提取图像特征前，先提取图像的浅层特征，浅层特征可以初步提取到图像的细节特征，为后续提取各个深度的特征提供一个更为精细的输入，从而使得所得不同深度的特征图的特征表征效果较好。

进一步优选地，第c个通道的通道注意力初始权重为：

其中，c＝1,2,…,L，L为输入特征图X的通道数，H为输入特征图X的高，W为输入特征图X的宽，X_c(i,j)为输入特征图X第c个通道上第i行第j列的特征值。

本发明进一步的有益效果是：通过引入图像通道注意力特征，可以有效的区分浅层特征图不同通道的重要性，对更重要的特征通道赋予更大的权重，可以更好的对图像进行表征。

进一步优选地，第i行第j列的位置注意力初始权重为：

其中，i＝1,2,…,H,j＝1,2,…,W，H为输入特征图X的高，W为输入特征图X的宽，δ为激活函数，L为输入特征图X的通道数，X_i,j,c为输入特征图X第c个通道上第i行第j列的特征值。

本发明进一步的有益效果是：通过引入位置注意力特征，可以获取特征图不同位置处的浅层特征对图像超分辨率的贡献度，对更重要的特征位置赋予更大的权重，可以更好的对图像进行表征。

进一步优选地，上述S3中对各图像块对应的不同深度的特征图进行融合的方法，包括：对图像块对应的不同深度的特征图在特征通道上拼接后，进行卷积降维，得到融合后的特征图。

本发明进一步的有益效果是：由于低层特征拥有更多的细节信息，高层特征拥有更好的语义信息，对网络重建效果有着不同的作用，利用并融合好不同深度的特征，通过特征信息互补，可以增强特征的丰富度，增强本发明所提出的方法的鲁棒性。

第二方面，本发明提供了一种图像的超分辨率重建***，包括：图像截取模块、特征提取模块、图像重建模块以及图像重组模块；

其中，图像截取模块用于对待处理的低分辨率图像进行分块，得到多个图像块，并输出到特征提取模块中；

特征提取模块用于基于图像的通道注意力机制和位置注意力机制，在不同深度上提取图像截取模块输入的各图像块的特征，得到各图像块对应的不同深度的特征图，并输出到图像重建模块中；

图像重建模块用于对各图像块对应的不同深度的特征图进行融合，根据所需图像超分倍数，对所得融合后的特征图进行图像重建，得到各超分辨率图像块，并输出到图像重组模块中；

图像重组模块用于将图像重建模块输入的各超分辨率图像块进行重组，得到高分辨率图像。

本发明的有益效果是：本发明所提供的***中包括特征提取模块，基于图像的通道注意力机制和位置注意力机制，充分利用并融合了不同深度特征，所得图像特征的在保留较大的感受野的同时也保留了更好的细节特征，基于该特征进行重建后，所得图像的超分效果较好。

进一步优选地，上述特征提取模块包括浅层网络单元和深层网络单元；

浅层网络单元用于采用卷积神经网络提取图像块的浅层特征，得到浅层特征图，并输出到深层网络单元中；

深层网络单元采用已训练好的深层特征提取网络，分别在不同深度上提取浅层特征图的通道注意力特征和位置注意力特征，将二者进行融合，得到图像块对应的不同深度的特征图；

其中，通道注意力模型的输出端与所述融合层的输入端相连，位置注意力模型的输出端与融合层的输入端相连；

第三方面，本发明还提供了一种存储介质，当计算机读取所述指令时，使所述计算机执行本发明第一方面所提供的图像的超分辨率重建方法。

附图说明

图1是本发明实施例1所提供的一种图像的超分辨率重建方法流程图；

图2是本发明实施例1所提供的双注意力卷积神经网络结构示意图；

图3是本发明实施例2所提供的图像超分辨率***示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

实施例1、

一种图像的超分辨率重建方法，如图1所示，包括以下步骤：

S1、对待处理的低分辨率图像进行分块，得到多个图像块；

具体的，本实施例中，对待处理的低分辨率图像按照滑动窗口的方式，顺序有重复地截取尺寸大小为H×W的图像块。具体为：对待处理的低分辨率RGB图像以滑动窗口的方式，按照从左往右，从上往下的顺序有重复的截取尺寸大小为H×W的图像块。

优选地，包括以下步骤：

S21、采用卷积神经网络提取图像块的浅层特征，得到浅层特征图；具体的，卷积神经网络为浅层卷积神经网络，为1层或者2层卷积神经网络。

S22、采用已训练好的深层特征提取网络，分别在不同深度上提取浅层特征图的通道注意力特征和位置注意力特征，将二者进行融合，得到图像块对应的不同深度的特征图；其中，所述深层特征提取网络包括N个级联的基于注意力模型的双注意力卷积神经网络，与N个深度一一对应，N为大于等于2的正整数。

具体的，各双注意力卷积神经网络级联，当前双注意力卷积神经网络的输出作为下一个双注意力卷积神经网络的输入，深度逐渐增加。另外，通道注意力和位置注意力使得本发明能够有效地关注更重要的特征，大大提高了所得不同深度的特征图的表征能力。本实施例将数据集DIV2K中的800张图像作为训练样本集，并对训练样本集中的图像进行水平翻转和90度旋转，从而增加训练样本数量，提高***的鲁棒性，采用该训练样本训练上述深层特征提取网络，并使用ADAM优化器和L1损失函数对网络调优。

优选地，如图2所示，上述双注意力卷积神经网络包括通道注意力模型、位置注意力模型和融合层；

其中，通道注意力模型的输出端与融合层的输入端相连，位置注意力模型的输出端与融合层的输入端相连；通道注意力模型用于基于通道注意力机制，通过计算输入特征图各通道的像素平均值，得到通道注意力初始权重，对其进行调整后，与输入特征图进行点乘，得到输入特征图的通道注意力特征；具体的，采用卷积神经网络对所得通道注意力初始权重进行调整，使其更接近于真实值，本实施例中，卷积神经网络有2层。位置注意力模型用于基于位置注意力机制，通过在输入特征图各像素位置点处计算各通道像素的平均值，得到位置注意力初始权重，对其进行调整后，与输入特征图进行点乘，得到输入特征图的位置注意力特征；具体的，采用卷积神经网络对所得位置注意力初始权重进行调整，使其更接近于真实值，本实施例中，卷积神经网络有2层。融合层用于将所得通道注意力特征和位置注意力特征进行融合。

具体的，为了有效区分特征图不同通道的重要性，对更重要的特征通道赋予更大的权重，引入通道注意力机制。优选地，第c个通道的通道注意力初始权重为：

为了获取特征图不同位置处的特征对图像超分辨率的贡献度，对更重要的特征位置赋予更大的权重。优选地，第i行第j列的位置注意力初始权重为：

将所得通道注意力特征和位置注意力特征进行融合，得到图像块对应的不同深度的特征图如下：

Y_d＝C_d+A_d,d＝1,2,…,N

其中，N为双注意力卷积神经网络的级联个数，即深度，C_d为第d个深度下的图像通道注意力特征图，A_d为第d个深度下的图像位置注意力特征图。具体的，对于每一个深度下的图像通道注意力特征图，其第c个通道的通道注意力特征图C_c＝Z_c'·X_c，其中，c＝1,2,…,L，L为浅层特征图X的通道数，Z_c'为调制后的输入特征图X的第c个通道的通道注意力权重，X_c为输入特征图X的第c个通道。对于每一个深度下的图像位置注意力特征图，其第i行第j列的位置注意力特征值为A_i,j＝P_i,'_j·X_i,j，其中，i＝1,2,…,H,j＝1,2,…,W，H为输入特征图X的高，W为输入特征图X的宽，P_i'_,j为调制后的输入特征图X第i行第j列的位置注意力权重，X_i,j为输入特征图第i行第j列的特征值。

需要说明的是，不同深度的特征对于图像超分辨率任务有着不同的贡献，浅层特征感受野较小，具有细节特征丰富但是语义信息不足的特点；深层特征感受野较大，具有语义信息完整但是细节特征不足的特点。通过融合不同深度的特征图，可以获得更好的细节特征并且保留较大的感受野特征，对于后续的超分辨率图像的重建具有巨大的促进作用。

优选地，包括以下步骤：

S31、对图像块对应的不同深度的特征图在特征通道上拼接后，进行卷积降维，得到融合后的特征图；

具体的，对应N个不同深度的特征图X₁,X₂,…,X_N，每个特征图的尺寸为H×W×L，其中，H为特征图的高，W为特征图的宽，L为特征图的通道数。先对N个特征图在通道维度上进行拼接，得到拼接后的特征图，其尺寸为H×W×(N×L)，接着使用一层卷积神经网络对拼接后的特征图进行卷积降维，将输出通道数由N×L大小降维至L，得到融合的特征图，其大小为H×W×L。

S32、根据所需图像超分倍数S，对融合后的特征图进行上采样，放大到该特征图的S倍；其中，图像超分倍数S根据实际需求来设置；具体的，可以采用反卷积或者PixelShuffle方法对融合后的特征图进行上采样；

S33、对所得放大后的特征图进行重建得到超分辨率图像块。具体的，对放大后的特征图使用重建网络得到超分辨后的图像块；为了保证算法的效率，本实施例中，重建网络包含两层卷积神经网络，具体的，放大后的特征图为尺寸大小为H'×W'×L，经过重建网络拟合后输出H'×W'×3的RGB图像Y；其中，H'＝S×H，W'＝S×W。训练重建网络时，通过L1损失函数计算输出图像和图像标签的L1范数距离，进而对卷积神经网络的权重参数进行调优。

具体的，将所得各超分辨率图像块按照步骤S1中的接取顺序和位置进行拼接操作，得到高分辨率图像。

为了证明采用本发明提供的方法所得的超分辨率图像的超分效果，分别采用本发明所提供的方法、以及现有的Bicubic算法、SRCNN算法、FSRCNN算法、VDSR算法、EDSR算法、RDN算法、RCAN算法，在图像超分辨率四个标准数据集Set5、BSD100、Manga109上进行2X超分实验，得到的结果如下表所示：

其中，评估指标分别为PSNR(峰值信噪比)和SSIM(结构相似性)，这两个值越高，表示所得高分辨率图像与原始待处理的低分辨率图像的细节和结果越相似，超分效果越好。可以看出本发明所提出的方法与其他各算法相比，在不同标准数据集上，PSNR与SSIM的取值均较高，超分效果较好。

实施例2、

一种图像超分辨率***，如图3所示，包括：图像截取模块1、特征提取模块2、图像重建模块3以及图像重组模块4；

其中，图像截取模块1用于对待处理的低分辨率图像进行分块，得到多个图像块，并输出到特征提取模块2中；

特征提取模块2用于基于图像的通道注意力机制和位置注意力机制，在不同深度上提取图像截取模块输入的各图像块的特征，得到各图像块对应的不同深度的特征图，并输出到图像重建模块3中；优选地，上述特征提取模块包括浅层网络单元21和深层网络单元22；其中，浅层网络单元21用于采用卷积神经网络提取图像块的浅层特征，得到浅层特征图，并输出到深层网络单元22中；本实施例中，卷积神经网络为浅层卷积神经网络，为1层或者2层卷积神经网络。

深层网络单元22采用已训练好的深层特征提取网络，分别在不同深度上提取浅层特征图的通道注意力特征和位置注意力特征，将二者进行融合，得到图像块对应的不同深度的特征图；其中，所述深层特征提取网络包括N个级联的基于注意力模型的双注意力卷积神经网络，与N个深度一一对应，N为大于等于2的正整数。优选地，上述双注意力卷积神经网络包括通道注意力模型、位置注意力模型和融合层；其中，通道注意力模型的输出端与所述融合层的输入端相连，位置注意力模型的输出端与融合层的输入端相连；通道注意力模型用于基于通道注意力机制，通过计算输入特征图各通道的像素平均值，得到通道注意力初始权重，对其进行调整后，与输入特征图进行点乘，得到输入特征图的通道注意力特征；位置注意力模型用于基于位置注意力机制，通过在输入特征图各像素位置点处计算各通道像素的平均值，得到位置注意力初始权重，对其进行调整后，与输入特征图进行点乘，得到输入特征图的位置注意力特征；融合层用于将所得通道注意力特征和位置注意力特征进行融合。

图像重建模块3用于对各图像块对应的不同深度的特征图进行融合，根据所需图像超分倍数，对所得融合后的特征图进行图像重建，得到各超分辨率图像块，并输出到图像重组模块4中；

进一步优选地，图像重建模块3包括多层特征融合单元31、上采样单元32和图像重建单元33；其中，多层特征融合单元31用于对图像块对应的不同深度的特征图在特征通道上拼接后，进行卷积降维，得到融合后的特征图，并输出到上采样单元32中；上采样单元32用于根据所需图像超分倍数S，对多层特征融合单元输入的融合后的特征图进行上采样，放大到该特征图的S倍，并将放大后的特征图输出到图像重建单元33中；图像重建单元33用于对上采样单元输入的放大后的特征图进行重建得到超分辨率图像块。

图像重组模块4用于将图像重建模块3输入的各超分辨率图像块进行重组，得到高分辨率图像。

具体的，本实施例中，将待处理的低分辨率图像输入至图像截取模块1中进行分块，得到多个48*48大小的图像块，并输出到特征提取模块2中；其中，特征提取模块2包括浅层网络单元21和深层网络单元22，其中，浅层网络单元21包括一层卷积神经网络，其卷积核个数为3，卷积核大小为3*3；深层网络单元22包括10个级联的双注意力卷积神经网络。48*48大小的图像块首先经过浅层网络单元21，得到48*48*64大小的浅层特征图，然后经过深层网络单元22得到10个不同深度的特征图x1、x2…、x10。图像重建模块3中的多层特征融合单元31对所得10个不同深度的特征图进行融合，得到融合后的特征图，其大小为48*48*64大小；图像重建模块3中的上采样单元32对融合后的特征图进行上进行2倍超分采样放大，得到96*96*64大小的放大特征图，经过图像重建单元33中的重建网络后得到96*96*3的超分后的图像块；最后在图像重组模块4中将超分后的图像块的进行重组，得到最终超分辨率图像。其中，本实施例将数据集DIV2K中的800张图像作为训练样本集，并对训练样本集中的图像进行水平翻转和90度旋转，从而增加训练样本数量，提高***的鲁棒性，将训练样本输入到图像超分辨率***中，对图像超分辨率***中的网络进行训练，并使用ADAM优化器和L1损失函数对网络调优。

实施例3、

一种存储介质，当计算机读取所述指令时，使所述计算机执行本发明实施例1所提供的图像的超分辨率重建方法。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种图像的超分辨率重建方法，其特征在于，包括以下步骤：

S1、对待处理的低分辨率图像进行分块，得到多个图像块；

S2、基于图像的通道注意力机制和位置注意力机制，在不同深度上提取各图像块的特征，得到各图像块对应的不同深度的特征图；

2.根据权利要求1所述的图像的超分辨率重建方法，其特征在于，所述S2包括以下步骤：

3.根据权利要求2所述的图像的超分辨率重建方法，其特征在于，所述双注意力卷积神经网络包括通道注意力模型、位置注意力模型和融合层；

所述通道注意力模型的输出端与所述融合层的输入端相连，所述位置注意力模型的输出端与所述融合层的输入端相连；

所述通道注意力模型用于基于通道注意力机制，通过计算输入特征图各通道的像素平均值，得到通道注意力初始权重，对其进行调整后，与输入特征图进行点乘，得到输入特征图的通道注意力特征；

所述位置注意力模型用于基于位置注意力机制，通过在输入特征图各像素位置点处计算各通道像素的平均值，得到位置注意力初始权重，对其进行调整后，与输入特征图进行点乘，得到输入特征图的位置注意力特征；

所述融合层用于将所得通道注意力特征和位置注意力特征进行融合。

4.根据权利要求3所述的图像的超分辨率重建方法，其特征在于，第c个通道的通道注意力初始权重为：

5.根据权利要求3所述的图像的超分辨率重建方法，其特征在于，第i行第j列的位置注意力初始权重为：

6.根据权利要求1所述的图像的超分辨率重建方法，其特征在于，所述S3中对各图像块对应的不同深度的特征图进行融合的方法，包括：对图像块对应的不同深度的特征图在特征通道上拼接后，进行卷积降维，得到融合后的特征图。

7.一种图像的超分辨率重建***，其特征在于，包括：图像截取模块、特征提取模块、图像重建模块以及图像重组模块；

所述图像截取模块用于对待处理的低分辨率图像进行分块，得到多个图像块，并输出到所述特征提取模块中；

所述特征提取模块用于基于图像的通道注意力机制和位置注意力机制，在不同深度上提取所述图像截取模块输入的各图像块的特征，得到各图像块对应的不同深度的特征图，并输出到所述图像重建模块中；

所述图像重建模块用于对各图像块对应的不同深度的特征图进行融合，根据所需图像超分倍数，对所得融合后的特征图进行图像重建，得到各超分辨率图像块，并输出到所述图像重组模块中；

所述图像重组模块用于将图像重建模块输入的各超分辨率图像块进行重组，得到高分辨率图像。

8.根据权利要求7所述的图像的超分辨率重建***，其特征在于，所述特征提取模块包括浅层网络单元和深层网络单元；

所述浅层网络单元用于采用卷积神经网络提取图像块的浅层特征，得到浅层特征图，并输出到深层网络单元中；

所述深层网络单元采用已训练好的深层特征提取网络，分别在不同深度上提取浅层特征图的通道注意力特征和位置注意力特征，将二者进行融合，得到图像块对应的不同深度的特征图；

9.根据权利要求8所述的图像的超分辨率重建***，其特征在于，所述双注意力卷积神经网络包括通道注意力模型、位置注意力模型和融合层；

10.一种存储介质，其特征在于，当计算机读取所述指令时，使所述计算机执行本发明权利要求1-6任意一项所述的图像的超分辨率重建方法。