CN113034625A - 一种基于图片的无损压缩方法、智能终端及存储介质 - Google Patents

一种基于图片的无损压缩方法、智能终端及存储介质 Download PDF

Info

Publication number
CN113034625A
CN113034625A CN201911360206.4A CN201911360206A CN113034625A CN 113034625 A CN113034625 A CN 113034625A CN 201911360206 A CN201911360206 A CN 201911360206A CN 113034625 A CN113034625 A CN 113034625A
Authority
CN
China
Prior art keywords
feature map
picture
feature
coding
characteristic diagram
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911360206.4A
Other languages
English (en)
Other versions
CN113034625B (zh
Inventor
肖云雷
刘阳兴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan TCL Group Industrial Research Institute Co Ltd
Original Assignee
Wuhan TCL Group Industrial Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan TCL Group Industrial Research Institute Co Ltd filed Critical Wuhan TCL Group Industrial Research Institute Co Ltd
Priority to CN201911360206.4A priority Critical patent/CN113034625B/zh
Publication of CN113034625A publication Critical patent/CN113034625A/zh
Application granted granted Critical
Publication of CN113034625B publication Critical patent/CN113034625B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于图片的无损压缩方法、智能终端及存储介质,所述方法包括:将输入的原始图片进行有损编码,提取多个特征图;将多个所述特征图进行无损编码得到二进制文件;将所述二进制文件进行无损解码得到多个所述特征图;将多个所述特征图进行有损解码得到所述原始图片。本发明通过将原始图片压缩成二进制文件,降低存储占用率,可以提高图片的传输速度,节省流量,在进行图片显示时再将所述二进制文件解码出来即可。

Description

一种基于图片的无损压缩方法、智能终端及存储介质
技术领域
本发明涉及图片处理技术领域,尤其涉及一种基于图片的无损压缩方法、智能终端及存储介质。
背景技术
图片是日常生活中一种常见信息载体,然而无损图片是非常占据物理存储空间的,并且不利于传输,图片压缩的一项关键技术就是熵编码(编码过程中按熵原理不丢失任何信息的编码),熵编码能将图像压缩所产生的中间文件进行无损压缩。
熵编码是根据字符被预估的概率来进行编码,预估概率的方式有很多种,比如一个文本中依次出现了三个字母:A、B和A,最简单的方式是,将A出现的次数/总字母数作为A字符被预估的概率;预估概率越准确,文件压缩比则越高,比如原本文件为50M,压缩之后为25M,压缩比就为2,这个数越高,文件就能被压缩得更小。
传统的熵编码不能充分利用上下文关系来估计每个字符的概率,因此充分利用上下文关系之后,就可以更准确预估每个字符出现的概率,概率被预估的越准确,文件则能被压缩得更小。例如:如果能准确记住一篇文本内容(知道每个字符出现概率),就不用根据所写的暗示(这个暗示所占的体积肯定是小于原文本内容)来背出文章,记住的越清楚,所需要的暗示内容就越小。
因此,现有技术还有待于改进和发展。
发明内容
本发明的主要目的在于提供一种基于图片的无损压缩方法、智能终端及存储介质,旨在解决现有技术中熵编码不能充分利用上下文关系来估计每个字符的概率的问题。
为实现上述目的,本发明提供一种基于图片的无损压缩方法,包括如下步骤:
将输入的原始图片进行有损编码,提取多个特征图;
将多个所述特征图进行无损编码得到二进制文件;
将所述二进制文件进行无损解码得到多个所述特征图;
将多个所述特征图进行有损解码得到所述原始图片。
可选地,所述的基于图片的无损压缩方法,其中,所述将输入的原始图片进行有损编码,提取多个特征图,具体为:
输入所述原始图片,基于CNN的多尺度编码网络对所述原始图片进行有损编码,提取多个特征图。
可选地,所述的基于图片的无损压缩方法,其中,所述将多个所述特征图进行无损编码得到二进制文件,具体为:
将多个所述特征图通过概率估计网络和算术编码进行无损编码得到二进制文件。
可选地,所述的基于图片的无损压缩方法,其中,所述输入所述原始图片,基于CNN的多尺度编码网络对所述原始图片进行有损编码,提取多个特征图,具体包括:
输入所述原始图片,经过空间转通道操作进行下采样,并经过卷积操作、批归一化操作和ReLU激活函数进行非线性变换;
将所述原始图片进行分离处理获取不同尺度的第一特征图、第二特征图、第三特征图和第四特征图;
将所述第一特征图、所述第二特征图和所述第三特征图下采样到与所述第四特征图相同尺度,并进行合并后进行量化处理。
可选地,所述的基于图片的无损压缩方法,其中,所述将多个所述特征图通过概率估计网络和算术编码进行无损编码得到二进制文件,具体包括:
对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值;
将所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图中的单层特征图进行可视化处理;
合并所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的四个特征值和四个概率值,再将合并后的特征值和概率值进行算术编码后形成所述二进制文件。
可选地,所述的基于图片的无损压缩方法,其中,所述对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值,具体包括:
通过所述概率估计网络估计所述第四特征图的概率值,通过所述第四特征图估计所述第三特征图的概率值,通过所述第三特征图估计所述第二特征图的概率值,通过所述第二特征图估计所述第一特征图的概率值。
可选地,所述的基于图片的无损压缩方法,其中,所述将所述二进制文件进行无损解码得到多个所述特征图,具体包括:
将所述二进制文件解码出所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图;
经过所述概率估计网络和所述算术编码处理后得到所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的特征值。
可选地,所述的基于图片的无损压缩方法,其中,所述将多个所述特征图进行有损解码得到所述原始图片,具体包括:
基于CNN的多尺度解码网络将所述第四特征图进行非线性变换后再进行上采样;
所述第一特征图、所述第二特征图和所述第三特征图上采样至各自的尺度,并依次与上采样后的特征图合并,得到解码后的所述原始图像。
此外,为实现上述目的,本发明还提供一种智能终端,其中,所述智能终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于图片的无损压缩程序,所述基于图片的无损压缩程序被所述处理器执行时实现如上所述的基于图片的无损压缩方法的步骤。
此外,为实现上述目的,本发明还提供一种存储介质,其中,所述存储介质存储有基于图片的无损压缩程序,所述基于图片的无损压缩程序被处理器执行时实现如上所述的基于图片的无损压缩方法的步骤。
本发明将输入的原始图片进行有损编码,提取多个特征图;将多个所述特征图进行无损编码得到二进制文件;将所述二进制文件进行无损解码得到多个所述特征图;将多个所述特征图进行有损解码得到所述原始图片。本发明通过将原始图片压缩成二进制文件,降低存储占用率,可以提高图片的传输速度,节省流量,在进行图片显示时再将所述二进制文件解码出来即可。
附图说明
图1是本发明基于图片的无损压缩方法的较佳实施例的流程图;
图2是本发明基于图片的无损压缩方法的较佳实施例中编码和界面流程图;
图3是本发明基于图片的无损压缩方法的较佳实施例中有损失编解码模型的示意图;
图4是本发明基于图片的无损压缩方法的较佳实施例中特征图可视化的示意图;
图5是本发明基于图片的无损压缩方法的较佳实施例中层之间概率估计的示意图;
图6是本发明基于图片的无损压缩方法的较佳实施例中基于Parallel multi-scale Pixcel CNN概率估计的示意图;
图7是本发明基于图片的无损压缩方法的较佳实施例中算术编码过程的示意图;
图8为本发明智能终端的较佳实施例的运行环境示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明较佳实施例所述的基于图片的无损压缩方法,如图1所示,所述基于图片的无损压缩方法包括以下步骤:
步骤S10、将输入的原始图片进行有损编码,提取多个特征图。
具体地,基于CNN(Convolutional Neural Networks,卷积神经网络,是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一)的多尺度编码网络(此网络可以是现有网络)对输入的所述原始图片进行有损编码(即有损压缩,有损压缩是利用了人类对图像或声波中的某些频率成分不敏感的特性,允许压缩过程中损失一定的信息;虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像的影响缩小,却换来了大得多的压缩比),以提取多个特征图,本发明优选为四个特征图,分别为:第一特征图、第二特征图、第三特征图和第四特征图。
进一步地,如图2所示,输入所述原始图片,经过空间转通道操作进行下采样(比如一张彩色图片为RGB 3个通道,宽高各为50,通过空间转通道的操作,可以将这张彩色图片转换成通道数为12,宽高各为25的图片),并经过卷积操作(conv,卷积操作的目的是提取图像的特征)、批归一化操作(BN,一个深度神经网络训练的技巧,它不仅可以加快了模型的收敛速度,而且更重要的是在一定程度缓解了深层网络中“梯度弥散”的问题,从而使得训练深层网络模型更加容易和稳定)和ReLU激活函数(激活函数就是在人工神经网络的神经元上运行的函数,负责将神经元的输入映射到输出端,引入激活函数是为了增加神经网络模型的非线性)进行非线性变换。
如图3所示,将所述原始图片由split(***)分离并获取不同尺度的第一特征图C1、第二特征图C2、第三特征图C3和第四特征图C4;由space2depth将所述第一特征图C1、所述第二特征图C2和所述第三特征图C3下采样到与所述第四特征图C4相同尺度,并进行合并后进行量化处理,量化方式为:对于输入X,截断至[0,m],然后由(N-1)/m*[0,m]变换将X映射至范围N,即完成整型量化。
步骤S20、将多个所述特征图进行无损编码得到二进制文件。
具体地,将多个所述特征图通过概率估计网络(Parallel multi-scale PixelCNN网络,一种可以并行生成多个像素值的多尺度神经网络)和算数编码进行无损编码(即无损压缩,无损压缩是利用数据的统计冗余进行压缩,可完全恢复原始数据而不引起任何失真)得到二进制文件(即中间文件,例如输入一个文件给有损压缩模块,它会压缩出一个文件来,这个文件就是中间文件,可以根据这个中间文件解压出文件来)。
具体包括:如图2和图3所示,对所述第一特征图C1、所述第二特征图C2、所述第三特征图C3和所述第四特征图C4的每个特征值(特征图中的每个点可以被称为特征值,这里的特征值就是C1、C2、C3和C4特征图中的点)分别进行概率估计得到概率值,其时间复杂度(时间复杂度是指执行算法所需要的计算工作量,比如1+1,它只有一个加法运算,时间复杂度为O(1))为O(logN)(N为像素点数);将所述第一特征图C1、所述第二特征图C2、所述第三特征图C3和所述第四特征图C4中的单层特征图进行可视化处理;合并所述第一特征图C1、所述第二特征图C2、所述第三特征图C3和所述第四特征图C4的四个特征值和四个概率值,再将合并后的特征值和概率值进行算术编码后形成所述二进制文件。
对所述第一特征图C1、所述第二特征图C2、所述第三特征图C3和所述第四特征图C4(用C1、C2、C3和C4来简称)的每个特征值分别进行概率估计得到概率值;将所述第一特征图C1、所述第二特征图C2、所述第三特征图C3和所述第四特征图C4中的单层特征图进行可视化处理;合并所述第一特征图C1、所述第二特征图C2、所述第三特征图C3和所述第四特征图C4的四个特征值和四个概率值,再将合并后的特征值和概率值进行算术编码后形成所述二进制文件。
其中,通过所述概率估计网络估计所述第四特征图C4的概率值,通过所述第四特征图C4估计所述第三特征图C3的概率值,通过所述第三特征图C3估计所述第二特征图C2的概率值,通过所述第二特征图C2估计所述第一特征图C1的概率值。
进一步地,将C1、C2、C3和C4(C1、C2、C3和C4一般为多通道(多层)特征图,比如彩色图片为RGB三通道,灰度图片为一通道)中的单层特征图(特征图就是特征图片,也是一种图片)进行可视化(特征图也是图片,可通过程序显示出来)。
如图4所示,可以发现层与层之间特征是有一定相似性,于是,本发明利用C4来估计C3的概率,C3来估计C2的概率,C2来估计C1的概率,其时间复杂度各为O(1),所设计的全新网络参见图5(特征图C4首先经过Upsampling(2)(常用线性上采样运算,2代表上采样两倍)和Conv(3,1,1)(常用卷积操作,3代表卷积核的大小,1代表步长,另外一个1代表特征图宽高的填充大小)运算生成特征图C4_0,特征图C4_0接着经过三组Conv(3,1,1)、BN(常用归一化运算)和Relu(常用激活函数)运算生成特征图C4_1,然后将C4_0和C4_1进行Add(相加)运算生成特征图C4_2,最后将C4_2进行Conv(3,1,1)和Softmax(常用归一化指数函数)运算生成概率图P3(它也是一种图片,只不过每个点的值是0到1之间的浮点数)。
同理可知,C3求概率图P2以及特征图C2求概率图P1的方式。对于C4的概率估计,本发明中的Parallel PixcelCNN网络(一种可以并行生成多个像素值的神经网络,如图6所示),其时间复杂度还是为O(logN)。由于C4特征图的宽和高各为原图片的三十二分之一,而C1是四分之一、C2是八分之一以及C3是十六分之一(在图3中,输入图片会经过两次space2depth操作,所以特征图C1的宽高是原图片的四分之一,其他的同理),因而提高C1、C2和C3的概率估计速度,将提升整幅图概率估计速度。
在估计完每个特征值的概率值之后,将特征值与概率值对应合并(每个特征值对应着自己的概率值,而算术编码是直接把整个输入的消息编码为一个数,所以需要合并成一个整体,也方便代码的书写),然后进行算术编码(算术编码是图像压缩的主要算法之一,是一种无损数据压缩方法,它可以把整个输入的消息编码为一个数,一个满足(0.0≤n<1.0)的小数n),形成二进制文件,其具体流程可参见图7,前面我通过一个序列的网络运算操作,可以获得特征图C1、C2、C3和C4以及概率图P1、P2、P3和P4,接着将四个特征图中的所有特征值合并成一个数组C,同理将概率图中所有概率值合并成一个数组P(这里两个合并是为了方便写程序),每一个数组C的元素在数组P中都有对应的概率值,最后将C和P进行算术编码,就可以编码出一个二进制文件。
步骤S30、将所述二进制文件进行无损解码得到多个所述特征图。
具体地,将所述二进制文件解码出所述第一特征图C1、所述第二特征图C2、所述第三特征图C3和所述第四特征图C4;经过所述概率估计网络(本发明中,算术编码的解码和编码都要用到概率估计网络)和所述算术编码处理后得到所述第一特征图C1、所述第二特征图C2、所述第三特征图C3和所述第四特征图C4的特征值。
进一步地,所述步骤S30主要作用是将步骤S20中所得到二进制文件解码出C1、C2、C3和C4(有损编码网络从原图片中提取到四个特征图,步骤S20是无损编码,所以无损解码出的四个特征图也就是原来的C1、C2、C3和C4。
如果四个特征图总大小为50M,无损压缩之后,总体积变成25M,就起到一个压缩效果,而且这个是无损的压缩,在解压之后,可以得到原来的那四个特征图。首先,本发明先获取C4概率估计,算术编码则根据相应概率值,解码出C4,依据步骤S20中的方法,可以依次得到C3、C2和C1的概率值,同理,根据算术编码也可以解码出C3、C2和C1。
步骤S40、将多个所述特征图进行有损解码得到所述原始图片。
具体地,基于CNN的多尺度解码网络将所述第四特征图C4进行非线性变换后再进行上采样;所述第一特征图C1、所述第二特征图C2和所述第三特征图C3上采样至各自的尺度,并依次与上采样后的特征图合并,得到解码后的所述原始图像。
进一步地,有损解码过程与编码过程相似,如图3中右侧的解码部分,只是space2depth的下采样换成depth2space的上采样,具体过程为:最底层的特征图C4由conv+BN+relu非线性变换后由depth2sapce进行上采样,同时C3,C2,C1分别由depth2space上采样至各自的尺度(与编码阶段的尺度相对应),并依次与上采样后的特征图合并,即concat(并联)操作,随之依次进行非线性与上采样过程,直至最后得到解码图像Reconstruction。
进一步地,如图8所示,基于上述基于图片的无损压缩方法,本发明还相应提供了一种智能终端,所述智能终端包括处理器10、存储器20及显示器30。图8仅示出了智能终端的部分组件,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
所述存储器20在一些实施例中可以是所述智能终端的内部存储单元,例如智能终端的硬盘或内存。所述存储器20在另一些实施例中也可以是所述智能终端的外部存储设备,例如所述智能终端上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器20还可以既包括所述智能终端的内部存储单元也包括外部存储设备。所述存储器20用于存储安装于所述智能终端的应用软件及各类数据,例如所述安装智能终端的程序代码等。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中,存储器20上存储有基于图片的无损压缩程序40,该基于图片的无损压缩程序40可被处理器10所执行,从而实现本申请中基于图片的无损压缩方法。
所述处理器10在一些实施例中可以是一中央处理器(Central Processing Unit,CPU),微处理器或其他数据处理芯片,用于运行所述存储器20中存储的程序代码或处理数据,例如执行所述基于图片的无损压缩方法等。
所述显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。所述显示器30用于显示在所述智能终端的信息以及用于显示可视化的用户界面。所述智能终端的部件10-30通过***总线相互通信。
在一实施例中,当处理器10执行所述存储器20中基于图片的无损压缩程序40时实现以下步骤:
将输入的原始图片进行有损编码,提取多个特征图;
将多个所述特征图进行无损编码得到二进制文件;
将所述二进制文件进行无损解码得到多个所述特征图;
将多个所述特征图进行有损解码得到所述原始图片。
所述将输入的原始图片进行有损编码,提取多个特征图,具体为:
输入所述原始图片,基于CNN的多尺度编码网络对所述原始图片进行有损编码,提取多个特征图。
所述将多个所述特征图进行无损编码得到二进制文件,具体为:
将多个所述特征图通过概率估计网络和算术编码进行无损编码得到二进制文件。
所述输入所述原始图片,基于CNN的多尺度编码网络对所述原始图片进行有损编码,提取多个特征图,具体包括:
输入所述原始图片,经过空间转通道操作进行下采样,并经过卷积操作、批归一化操作和ReLU激活函数进行非线性变换;
将所述原始图片进行分离处理获取不同尺度的第一特征图、第二特征图、第三特征图和第四特征图;
将所述第一特征图、所述第二特征图和所述第三特征图下采样到与所述第四特征图相同尺度,并进行合并后进行量化处理。
所述将多个所述特征图通过概率估计网络和算术编码进行无损编码得到二进制文件,具体包括:
对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值;
将所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图中的单层特征图进行可视化处理;
合并所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的四个特征值和四个概率值,再将合并后的特征值和概率值进行算术编码后形成所述二进制文件。
所述对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值,具体包括:
通过所述概率估计网络估计所述第四特征图的概率值,通过所述第四特征图估计所述第三特征图的概率值,通过所述第三特征图估计所述第二特征图的概率值,通过所述第二特征图估计所述第一特征图的概率值。
所述将所述二进制文件进行无损解码得到多个所述特征图,具体包括:
将所述二进制文件解码出所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图;
经过所述概率估计网络和所述算术编码处理后得到所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的特征值。
所述将多个所述特征图进行有损解码得到所述原始图片,具体包括:
基于CNN的多尺度解码网络将所述第四特征图进行非线性变换后再进行上采样;
所述第一特征图、所述第二特征图和所述第三特征图上采样至各自的尺度,并依次与上采样后的特征图合并,得到解码后的所述原始图像。
本发明还提供一种存储介质,其中,所述存储介质存储有基于图片的无损压缩程序,所述基于图片的无损压缩程序被处理器执行时实现如上所述的基于图片的无损压缩方法的步骤。
综上所述,本发明提供一种基于图片的无损压缩方法、智能终端及存储介质,所述方法包括:将输入的原始图片进行有损编码,提取多个特征图;将多个所述特征图进行无损编码得到二进制文件;将所述二进制文件进行无损解码得到多个所述特征图;将多个所述特征图进行有损解码得到所述原始图片。本发明通过将原始图片压缩成二进制文件,压缩后图片的大小变小,降低了存储占用率,可以提高图片的传输速度,节省流量,在进行图片显示时再将所述二进制文件解码出来即可。
当然,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关硬件(如处理器,控制器等)来完成,所述的程序可存储于一计算机可读取的存储介质中,所述程序在执行时可包括如上述各方法实施例的流程。其中所述的存储介质可为存储器、磁碟、光盘等。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (10)

1.一种基于图片的无损压缩方法,其特征在于,所述基于图片的无损压缩方法包括如下步骤:
将输入的原始图片进行有损编码,提取多个特征图;
将多个所述特征图进行无损编码得到二进制文件;
将所述二进制文件进行无损解码得到多个所述特征图;
将多个所述特征图进行有损解码得到所述原始图片。
2.根据权利要求1所述的基于图片的无损压缩方法,其特征在于,所述将输入的原始图片进行有损编码,提取多个特征图,具体为:
输入所述原始图片,基于CNN的多尺度编码网络对所述原始图片进行有损编码,提取多个特征图。
3.根据权利要求2所述的基于图片的无损压缩方法,其特征在于,所述将多个所述特征图进行无损编码得到二进制文件,具体为:
将多个所述特征图通过概率估计网络和算术编码进行无损编码得到二进制文件。
4.根据权利要求3所述的基于图片的无损压缩方法,其特征在于,所述输入所述原始图片,基于CNN的多尺度编码网络对所述原始图片进行有损编码,提取多个特征图,具体包括:
输入所述原始图片,经过空间转通道操作进行下采样,并经过卷积操作、批归一化操作和ReLU激活函数进行非线性变换;
将所述原始图片进行分离处理获取不同尺度的第一特征图、第二特征图、第三特征图和第四特征图;
将所述第一特征图、所述第二特征图和所述第三特征图下采样到与所述第四特征图相同尺度,并进行合并后进行量化处理。
5.根据权利要求4所述的基于图片的无损压缩方法,其特征在于,所述将多个所述特征图通过概率估计网络和算术编码进行无损编码得到二进制文件,具体包括:
对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值;
将所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图中的单层特征图进行可视化处理;
合并所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的四个特征值和四个概率值,再将合并后的特征值和概率值进行算术编码后形成所述二进制文件。
6.根据权利要求5所述的基于图片的无损压缩方法,其特征在于,所述对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的每个特征值分别进行概率估计得到概率值,具体包括:
通过所述概率估计网络估计所述第四特征图的概率值,通过所述第四特征图估计所述第三特征图的概率值,通过所述第三特征图估计所述第二特征图的概率值,通过所述第二特征图估计所述第一特征图的概率值。
7.根据权利要求5或6所述的基于图片的无损压缩方法,其特征在于,所述将所述二进制文件进行无损解码得到多个所述特征图,具体包括:
将所述二进制文件解码出所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图;
经过所述概率估计网络和所述算术编码处理后得到所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图的特征值。
8.根据权利要求7所述的基于图片的无损压缩方法,其特征在于,所述将多个所述特征图进行有损解码得到所述原始图片,具体包括:
基于CNN的多尺度解码网络将所述第四特征图进行非线性变换后再进行上采样;
所述第一特征图、所述第二特征图和所述第三特征图上采样至各自的尺度,并依次与上采样后的特征图合并,得到解码后的所述原始图像。
9.一种智能终端,其特征在于,所述智能终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于图片的无损压缩程序,所述基于图片的无损压缩程序被所述处理器执行时实现如权利要求1-8任一项所述的基于图片的无损压缩方法的步骤。
10.一种存储介质,其特征在于,所述存储介质存储有基于图片的无损压缩程序,所述基于图片的无损压缩程序被处理器执行时实现如权利要求1-8任一项所述的基于图片的无损压缩方法的步骤。
CN201911360206.4A 2019-12-25 2019-12-25 一种基于图片的无损压缩方法、智能终端及存储介质 Active CN113034625B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911360206.4A CN113034625B (zh) 2019-12-25 2019-12-25 一种基于图片的无损压缩方法、智能终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911360206.4A CN113034625B (zh) 2019-12-25 2019-12-25 一种基于图片的无损压缩方法、智能终端及存储介质

Publications (2)

Publication Number Publication Date
CN113034625A true CN113034625A (zh) 2021-06-25
CN113034625B CN113034625B (zh) 2023-06-20

Family

ID=76458924

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911360206.4A Active CN113034625B (zh) 2019-12-25 2019-12-25 一种基于图片的无损压缩方法、智能终端及存储介质

Country Status (1)

Country Link
CN (1) CN113034625B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002033925A (ja) * 2000-07-18 2002-01-31 Matsushita Graphic Communication Systems Inc 算術符号化・復号化方法および算術符号化・復号化装置
CN103428498A (zh) * 2013-08-21 2013-12-04 江苏新瑞峰信息科技有限公司 一种无损图像压缩***
CN105376578A (zh) * 2015-10-28 2016-03-02 北京锐安科技有限公司 图像压缩方法及装置
CN109903351A (zh) * 2019-03-02 2019-06-18 复旦大学 基于卷积神经网络和传统编码相结合的图像压缩方法
US20190251418A1 (en) * 2018-02-09 2019-08-15 Preferred Networks, Inc. Autoencoder, data processing system, data processing method and non-transitory computer readable medium
CN110225341A (zh) * 2019-06-03 2019-09-10 中国科学技术大学 一种任务驱动的码流结构化图像编码方法
WO2019194460A1 (ko) * 2018-04-01 2019-10-10 엘지전자 주식회사 컨벌루션 뉴럴 네트워크를 이용한 영상 코딩 방법 및 그 장치

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002033925A (ja) * 2000-07-18 2002-01-31 Matsushita Graphic Communication Systems Inc 算術符号化・復号化方法および算術符号化・復号化装置
CN103428498A (zh) * 2013-08-21 2013-12-04 江苏新瑞峰信息科技有限公司 一种无损图像压缩***
CN105376578A (zh) * 2015-10-28 2016-03-02 北京锐安科技有限公司 图像压缩方法及装置
US20190251418A1 (en) * 2018-02-09 2019-08-15 Preferred Networks, Inc. Autoencoder, data processing system, data processing method and non-transitory computer readable medium
WO2019194460A1 (ko) * 2018-04-01 2019-10-10 엘지전자 주식회사 컨벌루션 뉴럴 네트워크를 이용한 영상 코딩 방법 및 그 장치
CN109903351A (zh) * 2019-03-02 2019-06-18 复旦大学 基于卷积神经网络和传统编码相结合的图像压缩方法
CN110225341A (zh) * 2019-06-03 2019-09-10 中国科学技术大学 一种任务驱动的码流结构化图像编码方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
HAICHUAN MA: "A CNN-Based Image Compression Scheme Compatible with JPEG-2000", 《2019 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 *
孔繁锵等: "基于卷积神经网络的端到端多光谱图像压缩方法", 《中国激光》 *
练秋生等: "基于多尺度残差网络的压缩感知重构算法", 《自动化学报》 *
贾铸: "算术编码方法在图像压缩编码中的应用", 《电子技术》 *
陈书贞: "利用多尺度卷积神经网络的图像超分辨率算法", 《信号处理》 *

Also Published As

Publication number Publication date
CN113034625B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
US10909728B1 (en) Learned lossy image compression codec
KR101775522B1 (ko) 차동 전송을 이용한 무손실 이미지 압축
Chaurasia et al. Statistical feature extraction based technique for fast fractal image compression
US11177823B2 (en) Data compression by local entropy encoding
CN111932546A (zh) 图像分割模型训练方法、图像分割方法、装置、设备及介质
KR20200038171A (ko) 그래픽 프로세싱 시스템의 이미지 파이프라인 내 이미지 데이터의 가변 레이트 압축 방법 및 압축 해제 방법
CN114116635A (zh) 压缩数据流的并行解压缩
WO2023051335A1 (zh) 数据编码方法、数据解码方法以及数据处理装置
WO2023207836A1 (zh) 一种图像编码方法、图像解压方法以及装置
Otair et al. Improved near-lossless technique using the Huffman coding for enhancing the quality of image compression
US10897635B2 (en) Memory compression systems and methods
CN113038134B (zh) 一种图片处理方法、智能终端及存储介质
CN112560544A (zh) 一种遥感图像地物识别方法、***和计算机可读存储介质
CN110751251B (zh) 生成、变换二维码图像矩阵的方法和装置
CN113034625B (zh) 一种基于图片的无损压缩方法、智能终端及存储介质
JP6457558B2 (ja) データ圧縮装置およびデータ圧縮方法
WO2023159820A1 (zh) 图像压缩方法、图像解压缩方法及装置
CN105376578A (zh) 图像压缩方法及装置
CN114882512A (zh) 手写数学公式识别方法、***、设备和存储介质
WO2022100140A1 (zh) 一种压缩编码、解压缩方法以及装置
CN113554719B (zh) 一种图像编码方法、解码方法、存储介质及终端设备
CN113315970B (zh) 一种图像压缩方法、图像解码方法、智能终端及存储介质
CN112181221A (zh) 图像处理方法及装置、计算机可读介质及电子设备
Huilgol et al. Lossless Image Compression using Proposed Equations and JPEG-LS Prediction
CN116310660B (zh) 一种增强样本的生成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant