CN109495741B

CN109495741B - 基于自适应下采样和深度学习的图像压缩方法

Info

Publication number: CN109495741B
Application number: CN201811439805.0A
Authority: CN
Inventors: 何小海; 张达明; 任超; 吴晓红; 熊淑华; 滕奇志; 王正勇
Original assignee: Sichuan University
Current assignee: Sichuan University
Priority date: 2018-11-29
Filing date: 2018-11-29
Publication date: 2023-03-31
Anticipated expiration: 2038-11-29
Also published as: CN109495741A

Abstract

本发明公布了一种基于基于自适应下采样和深度学习的图像压缩方法。主要包括以下步骤：在编码器端，为待编码的原始图像设计了多种不同的下采样模式和量化模式，然后通过率失真优化算法从多种模式中选择最优的的下采样及量化模式，最后待编码图像将在选择的最优模式下进行下采样和JPEG编码；在解码器端，采用基于卷积神经网络的超分辨率重建算法对解码后的下采样图像进行超分辨率重建，最后利用BM3D算法在超分辨率重建后进一步抑制残留的压缩效应，得到最终的解码图像。实验结果表明，相比于主流的编解码标准和先进的编解码方法，所提出的框架能有效地提升编码图像的率失真性能，并能获得更好的视觉效果。

Description

基于自适应下采样和深度学习的图像压缩方法

技术领域

本发明涉及图像压缩和图像编码技术，具体涉及一种基于自适应下采样和深度学习的图像压缩方法，属于图像通信领域。

背景技术

人类活动中绝大部分的信息是通过视觉进行感知的。图像作为视觉信息的载体，具有形象直观、信息量大、易于理解等优点。然而在实际的图像获取过程中，受限于传输带宽和存储容量，图像或多或少都采取有损压缩方式。其中适用于静止图像的主流压缩编码标准有JPEG和JPEG2000，均由联合图像专家组分别于上世纪90年代初和本世纪初提出。

由于具有良好的压缩性能和较低的复杂度，JPEG已被广泛应用于有损图像压缩的领域。然而在有限码率下，若直接采用JPEG对图像进行压缩，图像数据量太大，分配给每个量化后的离散余弦变换(discrete cosine transform，DCT)系数的编码比特数较少，这将造成解码图像的严重失真。为提高低码率段的编码性能，基于下采样的压缩方法得到了广泛研究，其核心思想是在编码之前对图像进行下采样，从而减少了数据量，使下采样后得到的每一个像素都可分配到更多比特数。然而，现有的基于下采样的压缩方法，在下采样和编码过程中大多无法有效保持图像细节，还有进一步的提升的空间。

超分辨率重建的目的是从已知低分辨率图像获取相应的高分辨率图像。基于学习的图像超分辨率技术近些年来得到了越来越多的关注，其中基于深度学习的超分辨率方法因其相较传统超分辨率技术具有更高精确度和更快的重建速度等优点而受到广泛研究。

发明内容

本发明提出的一种基于适应下采样和深度学习的图像压缩方法，相比于主流的编解码标准和先进的编解码方法，本方法能有效地提升图像的率失真性能，并能获得具有更好视觉效果的解码图像。

本发明所提出的一种基于适应下采样和深度学习的图像压缩方法，主要包括以下操作步骤：

(1)为待编码的原始图像设计多种不同的下采样模式和量化模式；

(2)通过率失真优化算法从多种模式中选择最优的下采样及量化模式；

(3)将待编码图像在选择的最优模式下进行下采样和JPEG编解码；

(4)采用基于卷积神经网络的超分辨率重建算法对解码后的任意下采样模式下采样的图像进行超分辨率重建；

(5)利用BM3D算法在超分辨率重建后进一步抑制残留的压缩效应，得到最终的解码图像。

附图说明

图1是本发明基于自适应下采样和深度学习的图像压缩方法的流程框图

图2是基于深度学习的压缩图像超分辨率算法原理框图

图3是设计的超分辨率重建网络模型结构框架

图4是对“barbara”测试图像进行JPEG及其他三种方法编解码及本方法重建后图像的率失真性能比较

图5是对“bike”测试图像进行JPEG及其他三种方法编解码及本方法重建后图像的率失真性能比较

图6是“barbara”原图与码率同为0.2bpp时，本发明重建后图像与JPEG及其他三种方法解码图像的主观视觉效果比较

具体实施方式

下面结合附图对本发明作进一步说明：

图1中，一种基于自适应下采样和深度学习的图像压缩方法，包括以下步骤:

具体地，所述步骤(1)中，我们提供水平和垂直方向采样率分别为1/4，1/2，3/4，1共计十六种下采样模式，和满足

k＝1,2,…,8的八种量化模式，其中QP和Q均表示改变量化矩阵的参数且Q为JPEG标准的量化参数，对原图进行下采样和量化操作得到128种编码模式。

所述步骤(2)中，通过率失真优化算法，从128种编码模式中自适应选择出最优下采样模式和量化模式，该算法的主要思想是：对图像进行自适应下采样、压缩后的码率和解码后超分辨率重建图像的误差均要小于JPEG直接压缩图像，且在此基础上的码率最小值及均方误差最小值所对应的下采样模式和量化模式即为该算法选出的最优模式。

所述步骤(3)中，将待编码图像在选择的最优模式下进行下采样和JPEG编解码。

所述步骤(4)中，采用基于卷积神经网络的超分辨率重建算法对解码后的任意下采样模式下采样的图像进行超分辨率重建，在训练阶段，通过下采样产生低分辨率图像，并在不同的QP中压缩生成待训练的压缩图像。采用基于卷积神经网络的算法学习压缩图像和相应的原始图像的映射关系，选择从0.5到4间隔为0.5的QP进行编码，这八种模型将在训练阶段获得并储存在解码器中。在重建阶段，根据QP的不同来选择最合适的模型，最后使用选定的模型获得完整的高分辨率图像。

随机选择出两幅测试图像“barbara”，“bike”，用上述步骤对其进行测试，并与JPEG及其他三种方法比较率失真性能和视觉效果。率失真比较如图4及图5所示，其中横轴是码率，单位是bpp；纵轴是峰值信噪比(PSNR)，单位是dB。在相同的码率下，PSNR越高，率失真性能越好。图6是在码率为0.2bpp时，四种对比实验方法与本发明对“barbara”处理后的视觉效果对比图。表一展示了对比方法及本发明图像压缩结果的PSNR对比，实验验证了发明算法能有效提升图像的率失真性能，其重建结果更加可靠，实验结果对于其他测试图像具有普适性。

对比的图像压缩方法为：

方法1：Zhang等人提出的方法，参考文献“Zhang Jian,Xiong Ruiqin,Zhao Chen,et al.CONCOLOR:Constrained non-convex low-rank model for image deblocking[J].IEEE Transactions on Image Processing,2016,25(3):1246-1259.”。

方法2：Lin等人提出的方法，参考文献“Lin Weisi,Dong Li.Adaptivedownsampling to improve image compression at low bit rates[J].IEEETransactions on Image Processing,2006,15(9):2513-2521.”。

方法3：Chen等人提出的方法，参考文献“Chen Honggang,He Xiaohai,MaMinglang,et al.Low bit rates image compression via adaptive blockdownsampling and super resolution[J].Journal of electronic imaging,2016,25(1):013004.”。

表一：

/>

Claims

1.基于自适应下采样和深度学习的图像压缩方法，其特征在于包括以下步骤：

步骤一：为待编码的原始图像设计多种不同的下采样模式和量化模式；

步骤二：通过率失真优化算法从多种模式中选择最优的下采样及量化模式；该算法对图像进行自适应下采样、压缩后的码率和解码后超分辨率重建图像的误差均要小于JPEG直接压缩图像，且在此基础上的码率最小值及均方误差最小值所对应的下采样模式和量化模式即为该算法选出的最优模式；

步骤三：将待编码图像在选择的最优模式下进行下采样和JPEG编解码；

步骤四：采用基于卷积神经网络的超分辨率重建算法对解码后的任意下采样模式下采样的图像进行超分辨率重建；基于卷积神经网络的超分辨率重建算法将下采样产生的低分辨率图像在不同QP中压缩生成待训练的压缩图像，采用基于卷积神经网络的超分辨率重建算法学习压缩图像和相应原始图像的映射关系，根据QP的不同来选择最合适的模型，最后使用选定的模型获得完整的高分辨率图像；参数QP的计算方法如下：

其中Q是JPEG标准的量化参数；

步骤五：利用BM3D算法在超分辨率重建后进一步抑制残留的压缩效应，得到最终的解码图像。

2.根据权利要求1所述的基于自适应下采样和深度学***和垂直方向采样率分别为1/4，1/2，3/4，1共计十六种下采样模式，和满足

的八种量化模式，其中QP和Q均表示改变量化矩阵的参数且Q为JPEG标准的量化参数，对原图进行下采样和量化操作得到128种编码模式，能够充分考虑图像之间的差异性和JPEG在不同码率下的编码特性。/>