CN115829834A

CN115829834A - 基于半耦合深度卷积字典学习的图像超分辨率重建方法

Info

Publication number: CN115829834A
Application number: CN202211133791.6A
Authority: CN
Inventors: 王力谦; 李东升; 邵文泽; 葛琦
Original assignee: Nanjing University of Posts and Telecommunications
Current assignee: Nanjing University of Posts and Telecommunications
Priority date: 2022-09-16
Filing date: 2022-09-16
Publication date: 2023-03-21

Abstract

本发明公开了一种基于半耦合深度卷积字典学习的图像超分辨率重建方法，包括：准备输入的训练集数据；构建半耦合深度卷积字典学习模型；构建和训练求解该模型的深度神经网络，得到训练好的系数映射网络、字典和系数；利用训练好的系数映射网络、字典和系数重建低分辨率图像得到高分辨率图像。本发明充分利用深度学习的学习能力和字典学习的可解释性，对低分辨率图像进行超分辨率重建，提升图像的分辨率，进而增强图像的显示效果。

Description

基于半耦合深度卷积字典学习的图像超分辨率重建方法

技术领域

本发明属于图像处理技术领域，具体涉及一种基于半耦合深度卷积字典学习的图像超分辨率重建方法。

背景技术

研究表明，人类活动中绝大部分的信息是通过视觉***进行感知的。图像作为记录和传递视觉信息的载体，具有形象直观、信息量大、通俗易懂等优点，在天文观测、定位跟踪、医学成像、交通监控等诸多领域均有着极为重要的应用。随着移动互联网时代的到来以及信息技术的推陈出新，人们对图像质量和分辨率的需求日益增长，这使图像的数据量也呈指数式上升。一方面，拍摄图像的分辨率越来越高，若不采用高效的图像压缩技术，将大大加重存储空间和带宽的压力，导致可存储的图像数量急剧下降。另一方面，在图像采集与传输过程中，压缩后的图像可能存在压缩失真、分辨率低等问题，不利于图像的后续处理，达不到实际应用的要求，使现有的技术和设备面临着巨大的挑战。

超分辨率(Super Resolution，SR)重建通过软件技术将已有的低分辨率图像进行重建处理，在提升图像分辨率的同时恢复图像丢失的高频细节，具有成本低、实用性强的特点，成为图像处理领域的研究热点。

目前的深度神经网络已经在图像超分辨率的任务上取得了良好的效果，研究人员提出了ESRGAN方法(Enhanced super-resolution generative adversarial networks)，但由于深度神经网络自身的黑盒特性，很多深度学习的模型并不具备可靠的理论保证。而传统的基于模型的方法，如基于稀疏表示的图像超分辨率重建法(Image super-resolution via sparse representation)，具有很好的灵活性和可解释性。深度展开模型结合了基于模型方法和基于深度学习方法两者的优点，现有的深度展开网络已经证明了该方法的可行性，甚至某些网络在图像处理任务上的性能超越了深度神经网络，具有一定的优越性，还有人提出了DCDicL方法用于图像去噪(Deep convolutional dictionarylearning for image denoising)。与此同时，现有的基于卷积字典学习的超分辨率任务的先验项是人为设定的，然而，利用这些直观的先验信息可能会忽略一些表征图像结构的潜在信息。

发明内容

解决的技术问题：本发明提出一种基于半耦合深度卷积字典学习的图像超分辨率重建方法，充分利用深度学习的学习能力和字典学习的可解释性，对低分辨率图像进行超分辨率重建，提升图像的分辨率，进而增强图像的显示效果。

技术方案：

一种基于半耦合深度卷积字典学习的图像超分辨率重建方法，所述图像超分辨率重建方法包括以下步骤：

S1，准备输入的训练集数据：对HR图像进行降质退化处理得到对应的LR图像，构建训练集{X_i，Y_i}，其中X_i为LR图像，Y_i为HR图像，下标i表示LR图像或HR图像中的第i个；LR表示低分辨率，HR表示高分辨率；

S2，构建半耦合深度卷积字典学习模型：

式(1)中，X和Y表示LR图像和HR图像，D_x和D_y分别是LR图像和HR图像的字典，A_x、A_y是LR图像和HR图像对应的表示系数，

为表示系数的先验信息，φ(·)为字典的先验信息，*表示卷积，λ表示正则化参数，σ_x、σ_y、

为各项系数，f_y(·)为LR图像和HR图像表示系数之间的系数映射函数；

S3，构建和训练求解半耦合深度卷积字典学习模型的深度神经网络，深度神经网络包括Net-X、Net-Y、Net-F、Hyper-Net四个模块，其中Net-X用于学习LR图像的表示系数A_x和LR图像对应的字典D_x，Net-Y用于学习HR图像的表示系数A_y和HR图像对应的字典D_y，Net-F用于训练学习A_x到A_y的系数映射函数f_y(·)，Hyper-Net用于在每个迭代阶段学习模型中的超参数，利用系数映射损失函数约束映射后的表示系数和HR图像的表示系数之间的差异，并利用重建损失函数约束预测的重建图像和原始HR图像之间的差异，不断调整网络模型参数，直到T个迭代阶段后模型收敛，完成模型的训练，得到训练好的系数映射网络、字典和系数；

S4，将一幅待超分辨率的LR图像输入到训练好的模型中得到第T个迭代阶段LR图像的表示系数

再经过训练好的系数映射函数

映射后与训练好的

进行卷积，得到最终重建的高分辨率图像为

进一步地，步骤S1中，准备输入数据的过程包括以下子步骤：

S11，采用下述公式对HR图像进行降质退化处理得到对应的LR图像：

X＝(Y*k)↓_s+n

其中，X为LR图像，Y为HR图像，*为卷积运算，k为模糊核，↓_s表示s倍的下采样，n为加性高斯白噪声；

S12，将降质退化处理得到的LR图像进行空值上采样，使其与对应HR图的大小一致；

S13，将HR图像和LR图像分割为大小为预设大小的图像块，将分割后的图像进行集合，得到训练集，利用训练集训练网络，图像块大小和批次样本数量与网络载体的设备性能相关。

进一步地，引入辅助变量

并利用半二次***算法迭代求解式(1)，在第t个迭代阶段中，式(1)的求解过程为按顺序依次计算式(2)至式(10)：

其中

其中

构建深度神经网络Net-F，并根据式(3)和式(5)求出的A_x和A_y训练学习映射函数

使得

其中，α_x，α_y，

β_x，β_y，

为通过网络Hyper-Net学习得到的超参数，vec表示向量化操作，即把矩阵转换为列向量，vec^-1表示反向量化操作，unf表示将卷积运算中的矩阵展开成乘积运算的矩阵形式，F(·)和F^-1(·)分别表示2D傅里叶变换和反变换，

表示2D傅立叶变换的复共轭，

表示逐元素相乘，涉及的除法也为逐元素相除，式(3)、式(5)中的

表示通过构建深度神经网络Net-A来求解

式(7)、式(9)中的

表示通过构建深度神经网络Net-D来求解

上标(t)表示第t个迭代阶段，上标T为矩阵转置。

进一步地，所述Net-X包括Head-Net-X、

三个模块；

Head-Net-X采用Head-Net网络结构，Head-Net网络结构为：至少包括2个卷积层，在每2个卷积层之间含有1个ReLu激活函数，每个卷积层至少含有64个通道；在第0个迭代阶段，输入LR图像、退化模型的模糊核k、噪声标准差σ至Head-Net-X，得到初始化的表示系数

和用0初始化的字典

采用Net-A网络结构，Net-A网络结构为：包括7个模块，每一个模块包含n_r个残差单元，每个残差单元至少包含2个卷积层和跳跃连接，在每2个卷积层之间含有1个ReLu激活函数，在前3个模块的卷积层中使用步长卷积下采样特征图谱，在后3个模块的卷积层中使用转置卷积上采样特征图谱，前4个模块的卷积层分别有64，128，256，512个通道；

在第t个迭代阶段处理数据的过程为：输入式(2)求出的辅助变量

超参数，得到表示系数

采用Net-D网络结构，Net-D网络结构为：至少包括6个卷积层，在每2个卷积层之间含有1个ReLu激活函数，每一个卷积层至少包含16个通道，在第一个卷积层的输入和最后一个卷积层的输出之间设置跳跃连接；

在第t个迭代阶段处理数据的过程为：输入式(6)求出的辅助变量

超参数，得到字典

进一步地，Net-Y包括Head-Net-Y、

三部分，在第0个迭代阶段利用Head-Net-Y得到初始化的表示系数

和字典

在第t个迭代阶段，通过

得到

通过

得到

Head-Net-Y采用Head-Net网络结构；Head-Net-Y处理数据的过程为：输入HR图像，得到初始化的表示系数

和用0初始化的字典

采用Net-A网络结构；

在第t个迭代阶段处理数据的过程为：输入式(4)求出的辅助变量

超参数，得到表示系数

采用Net-D网络结构；

在第t个迭代阶段处理数据的过程为：输入式(8)求解的辅助变量

超参数，得到

进一步地，Net-F采用Net-A网络结构；Net-F在第t个迭代阶段处理数据的过程为：输入

得到

并通过系数映射损失函数约束

与

之间的差异，以此将

更新为

进一步地，系数映射损失函数为：

其中θ_F表示Net-F网络的参数，

为第t个迭代阶段LR图像的表示系数，

为第t个迭代阶段HR图像的表示系数，

为第t-1个迭代阶段的系数映射函数，N为批处理样本的数量，下标i表示LR图像或HR图像中的第i个。

进一步地，Hyper-Net网络结构为：至少包括4个卷积层，在每2个卷积层之间含有1个ReLu激活函数，在最后1个卷积层后有1个SoftPlus层；Hyper-Net在第t个迭代阶段处理数据的过程为：输入噪声标准差σ，得到超参数。

进一步地，所述重建损失函数为：

其中θ表示网络的参数，

为第t个迭代阶段HR图像的字典，

和

为第t个阶段LR图像和HR图像的表示系数，*表示卷积，

为系数映射函数，Y_i为第i个HR图像，N为批处理样本的数量。

有益效果：

第一，本发明的基于半耦合深度卷积字典学习的图像超分辨率重建方法，充分利用了深度神经网络的学习能力，学习表示系数和字典的先验信息，同时还通过网络提取表示系数特征，学习系数映射函数，能够较好地保持图像中的结构和纹理要素，有效提高图像的重建质量。

第二，本发明的基于半耦合深度卷积字典学习的图像超分辨率重建方法，由于深度神经网络自身的黑盒特性，很多深度学习的模型并不具备可靠的理论保证，本发明除了利用深度的学习能力外，还充分利用传统字典学习方法的可解释性，使得本发明中设计的网络结构在理论上也是可解释的。

第三，本发明的基于半耦合深度卷积字典学习的图像超分辨率重建方法，在主网络的核心模块融合了U-Net网络和Residual残差网络，使得该模型能学习更丰富的全局特征，有着更强的学习能力。

附图说明

图1为本发明实施例的图像超分辨率重建模型整体结构图。

图2为本发明实施例的Head-Net网络结构图。

图3为本发明实施例的Net-A网络结构图。

图4为本发明实施例的Net-D网络结构图。

图5为本发明实施例的Hyper-Net网络结构图。

图6为原始高分辨率图像示意图。

图7为bicubic方法处理后所得的图像示意图。

图8为SRMD方法处理后所得的图像示意图。

图9为USRNet方法处理后所得的图像示意图。

图10为SwinIR方法处理后所得的图像示意图。

图11为本发明实施例处理后所得的图像示意图。

具体实施方式

下面的实施例可使本专业技术人员更全面地理解本发明，但不以任何方式限制本发明。

本实施例公开了一种基于半耦合深度卷积字典学习的图像超分辨率重建方法，具体包括以下步骤：

步骤一：准备输入的训练集数据。

获取用于训练和测试的公用数据集；本实施例中使用DIV2K、Flickr2K、CBSD68三个公用数据集，其中DIV2K和Flickr2K分别包含800幅和2650幅图像用作训练，CBSD68中包含68幅图像用作测试；对HR图像进行降质退化处理得到对应的LR图像，以此构建训练集{X_i，Y_i}，其中X_i为LR图像，Y_i为HR图像，下标i表示LR或HR图像中的第i个。

降质退化处理的退化模型公式为：X＝(Y*k)↓_s+n；其中，X为LR图像，Y为HR图像，*为卷积运算，k为模糊核，↓_s表示s倍的下采样，n为加性高斯白噪声。

在本实施例中，模糊核k设置为各同向性的高斯模糊核，下采样倍数s设置为2，噪声标准差设置为0到5之间的随机数。

在本实施例中，将降质退化处理得到的LR图像进行空值上采样(即对LR图像进行0值填充)，使其与对应HR图的大小一致；将HR图像和LR图像分割为大小为64×64的图像块，将分割后的图像进行集合，得到训练集；利用训练集训练网络时，批处理样本的数量N设置为32。

步骤二：构建并求解半耦合深度卷积字典学习模型。

构建的半耦合深度卷积字典学习模型为式(1)，通过引入辅助变量

并利用半二次***算法迭代求解式(1)，在第t个迭代阶段(Stage-t)中，式(1)的求解过程为按顺序依次计算式(2)至式(10)。

步骤三：构建和训练求解半耦合深度卷积字典学习模型的深度神经网络，得到训练好的系数映射函数、字典和表示系数。

如图1所示，求解半耦合深度卷积字典学习模型的深度神经网络包括Net-X、Net-Y、Net-F、Hyper-Net四个模块，其中Net-X用于学习LR图像的表示系数A_x和LR图像对应的字典D_x，Net-Y用于学习HR图像的表示系数A_y和HR图像对应的字典D_y，Net-F用于训练学习A_x到A_y的系数映射函数f_y(·)，Hyper-Net用于在每个迭代阶段学习模型中的超参数，利用系数映射损失函数约束映射后的表示系数和HR图像的表示系数之间的差异，并利用重建损失函数约束重建图像和原始HR图像之间的差异，不断调整网络模型参数，直到T个迭代阶段后模型收敛，完成模型的训练。

Net-X包括Head-Net-X、

三个模块，在第0个迭代阶段利用Head-Net-X得到初始化的表示系数

和字典

在第t个迭代阶段，通过

得到

通过

得到

Head-Net-X采用Head-Net网络结构；该模块处理数据的过程为：输入LR图像、退化模型的模糊核k、噪声标准差σ，得到初始化的表示系数

和用0初始化的字典

如图2所示，Head-Net网络结构为：包括2个卷积层，在这2个卷积层之间含有1个ReLu激活函数，每个卷积层含有64个通道。

采用Net-A网络结构；该模块在第t个迭代阶段处理数据的过程为：输入式(2)求出的辅助变量

超参数，得到表示系数

即式(3)的解。

如图3所示，Net-A网络结构为：包括7个模块，每一个模块包含4个残差单元，每个残差单元包含2个卷积层和跳跃连接，在这2个卷积层之间含有1个ReLu激活函数，在前3个模块的卷积层中使用步长卷积下采样特征图谱，在后3个模块的卷积层中使用转置卷积上采样特征图谱，前4个模块的卷积层分别有64，128，256，512个通道.

采用Net-D网络结构；该模块在第t个迭代阶段处理数据的过程为：输入式(6)求出的辅助变量

超参数，得到字典

即式(7)的解。

如图4所示，Net-D网络结构为：包括6个卷积层，在每2个卷积层之间含有1个ReLu激活函数，每一个卷积层包含16个通道，在第一个卷积层的输入和最后一个卷积层的输出之间设置跳跃连接。

Net-Y包括Head-Net-Y、

和字典

在第t个迭代阶段，通过

得到

通过

得到

Head-Net-Y采用Head-Net网络结构；该模块处理数据的过程为：输入HR图像，得到初始化的表示系数

和用0初始化的字典

采用Net-A网络结构；该模块在第t个迭代阶段处理数据的过程为：输入式(4)求出的辅助变量

超参数，得到表示系数

即式(5)的解。

采用Net-D网络结构；该模块在第t个迭代阶段处理数据的过程为：输入式(8)求解的辅助变量

超参数，得到

即式(9)的解。

Net-F采用Net-A网络结构；该模块在第t个迭代阶段处理数据的过程为：输入

得到

并通过系数映射损失函数约束

与

之间的差异，以此将

更新为

系数映射损失函数为：

其中θ_F表示Net-F网络的参数，

为第t个迭代阶段LR图像的表示系数，

为第t个迭代阶段HR图像的表示系数，

为第t-1个迭代阶段的系数映射函数，N为批处理样本的数量，下标i表示LR或HR图像中的第i个。

如图5所示，Hyper-Net网络结构为：包括4个卷积层，在每2个卷积层之间含有1个ReLu激活函数，在最后1个卷积层后有1个SoftPlus层，每个卷积层包含个256通道；该模块在第t个迭代阶段处理数据的过程为：输入噪声标准差σ，得到超参数。

利用重建损失函数

约束重建图像和原始HR图像之间的差异；其中θ表示网络的参数，

为第t个迭代阶段HR图像的字典，

和

为第t个阶段LR图像和HR图像的表示系数，*表示卷积，

为系数映射函数，Y_i为HR图像，N为批处理样本的数量，下标i表示LR或HR图像中的第i个；

在本实施例中，在训练求解半耦合深度卷积字典学习模型的深度神经网络时，使用ADAM优化方法与反向传播来优化调整网络中的参数，初始学习率为10^-4，学习率衰减周期为20000次，训练迭代次数为40000次。

步骤四：利用训练好的系数映射函数、字典和表示系数重建低分辨率图像得到高分辨率图像。

将一幅待超分辨率的LR图像输入到训练好的模型中得到第T个迭代阶段LR图像的表示系数

再经过训练好的系数映射函数

映射后与训练好的

进行卷积，得到重建的高分辨率图像为

下面结合表1和图6至图11，通过实施例的效果评价来进一步说明本发明。

在本实施例中，使用峰值信噪比(Peak Signal-to-Noise Ratio，PSNR)和结构相似性(Structure Similarity，SSIM)作为结果的客观评价指标；

在本实施例中，使用CBSD68数据集中的图像作为测试图像，表1列出了本实施例和其他先进的图像超分辨率方法得到的结果图像的平均PSNR和SSIM。从表1可以看出，本实施例方法得到的结果与其他方法的结果相比有显著提升。

表1

客观评价指标	Bicubic	SRMD	USRNet	SwinIR	本实施例方法
						PSNR	23.53	26.21	28.47	23.69	29.41
SSIM	0.6145	0.7693	0.8096	0.6084	0.8553

图6至图11分别为一幅原始HR图像和用Bicubic、SRMD、USRNet、SwinIR和本实施例方法处理得到的超分辨率结果图像。从图中可以看出，Bicubic和SwinIR方法的结果图像明显存在细节模糊，SRMD和USRnet方法的结果图像中细节较清晰，但某些局部区域存在细节模糊，本实施例方法得到的结果图像中高频细节更加丰富。本实施例方法结果的视觉效果和客观评价指标均表明本发明方法在兼顾网络可解释性的同时，可以获得更好的图像超分辨率重建质量。

以上所述，仅是本发明的较佳实施例，并非对本发明做任何形式上的限制，凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化，均落入本发明的保护范围之内。

Claims

1.一种基于半耦合深度卷积字典学习的图像超分辨率重建方法，其特征在于，所述图像超分辨率重建方法包括以下步骤：

S2，构建半耦合深度卷积字典学习模型：

再经过训练好的系数映射函数

映射后与训练好的

进行卷积，得到最终重建的高分辨率图像为

2.根据权利要求1所述的基于半耦合深度卷积字典学习的图像超分辨率重建方法，其特征在于，步骤S1中，准备输入数据的过程包括以下子步骤：

X＝(Y*k)↓_s+n

S13，将HR图像和LR图像分割为大小为预设大小的图像块，将分割后的图像进行集合，得到训练集，利用训练集分批次训练网络，图像块大小和批次样本数量与网络载体的设备性能相关。

3.根据权利要求1所述的基于半耦合深度卷积字典学习的图像超分辨率重建方法，其特征在于，引入辅助变量

其中

其中

使得

其中，α_x，α_y，

β_x，β_y，

表示2D傅立叶变换的复共轭，

表示通过构建深度神经网络Net-A来求解

式(7)、式(9)中的

表示通过构建深度神经网络Net-D来求解

上标(t)表示第t个迭代阶段，上标T为矩阵转置。

4.根据权利要求3所述的基于半耦合深度卷积字典学习的图像超分辨率重建方法，其特征在于，所述Net-X包括Head-Net-X、

三个模块；

和用0初始化的字典

超参数，得到表示系数

超参数，得到字典

5.根据权利要求3所述的基于半耦合深度卷积字典学习的图像超分辨率重建方法，其特征在于，Net-Y包括Head-Net-Y、

和字典

在第t个迭代阶段，通过

得到

通过

得到

和用0初始化的字典

采用Net-A网络结构；

超参数，得到表示系数

采用Net-D网络结构；

超参数，得到

6.根据权利要求3所述的基于半耦合深度卷积字典学习的图像超分辨率重建方法，其特征在于，Net-F采用Net-A网络结构；Net-F在第t个迭代阶段处理数据的过程为：输入

得到

并通过系数映射损失函数约束

与

之间的差异，以此将

更新为

7.根据权利要求6所述的基于半耦合深度卷积字典学习的图像超分辨率重建方法，其特征在于，系数映射损失函数为：

其中θ_F表示Net-F网络的参数，

为第t个迭代阶段LR图像的表示系数，

为第t个迭代阶段HR图像的表示系数，

8.根据权利要求3所述的基于半耦合深度卷积字典学习的图像超分辨率重建方法，其特征在于，Hyper-Net网络结构为：至少包括4个卷积层，在每2个卷积层之间含有1个ReLu激活函数，在最后1个卷积层后有1个SoftPlus层；Hyper-Net在第t个迭代阶段处理数据的过程为：输入噪声标准差σ，得到超参数。

9.根据权利要求1所述的基于半耦合深度卷积字典学习的图像超分辨率重建方法，其特征在于，所述重建损失函数为：

其中θ表示网络的参数，

为第t个迭代阶段HR图像的字典，

和

为第t个阶段LR图像和HR图像的表示系数，*表示卷积，

为系数映射函数，Y_i为第i个HR图像，N为批处理样本的数量。