CN102547261B - 一种分形图像编码方法 - Google Patents

一种分形图像编码方法 Download PDF

Info

Publication number
CN102547261B
CN102547261B CN201010604564.8A CN201010604564A CN102547261B CN 102547261 B CN102547261 B CN 102547261B CN 201010604564 A CN201010604564 A CN 201010604564A CN 102547261 B CN102547261 B CN 102547261B
Authority
CN
China
Prior art keywords
block
image
dictionary
blocks
primitive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201010604564.8A
Other languages
English (en)
Other versions
CN102547261A (zh
Inventor
赵莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Dianji University
Original Assignee
Shanghai Dianji University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Dianji University filed Critical Shanghai Dianji University
Priority to CN201010604564.8A priority Critical patent/CN102547261B/zh
Publication of CN102547261A publication Critical patent/CN102547261A/zh
Application granted granted Critical
Publication of CN102547261B publication Critical patent/CN102547261B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

一种分形图像编码方法,包括如下步骤:将原始图像分割成多个互不重叠的大小相同的块;根据所分割的块的大小构成多成分基元块字典;对每一个分割后的块,在多成分基元字典中搜索最优匹配块。本发明的优点在于:(1)本发明针对自然图像特性,构建了一个基于简单图像子块多成份字典,该字典对自然图像有一定的普适性。(2)本发明中得到的图像编码字典是独立于图像内容。(3)本发明方法利用简单图像子块构成编码字典,从而对自然图像子块进行稀疏表示,其构成的字典容量小,与传统方法相比极大提高了编码速度。

Description

一种分形图像编码方法
技术领域
本发明是关于数字图像压缩领域,特别涉及一种基于简单图像子块的快速分形图像编码实现方法,能直接应用于二维静态图像的压缩,尤其是对自然图像等自相似性高的图像。
背景技术
在过去的几十年中,计算机的存储容量随着应用程序的膨胀而迅速增加。随着存储技术的发展,每单位面积存储介质可存储的数据也呈几何级上升,而每兆字节的价格从几百美元急剧下跌到几美分。但随着多媒体、遥感、图像处理及应用等技术的发展,所需存储与处理的视频图像,声音等数据越来越多。如果要存储大型视频与图形文件,则需要的存储量是惊人的。根据计算,一小时的数字视频文件要占2.2G字节的存储空间,是一个小时的数字文件的两百万倍。如此大的数据量,不经过压缩而存储在实际应用中是很难做到的。而在数据在传输中,使图像,图像,声音,动画等多媒体信息时,特别是有较高的质量要求时,不仅需要占用相当大的存储空间,而且需要相当高的数据传输率。
由此可见,压缩编码技术的研究显得特别有意义,也正是由于压缩编码技术及传输技术的不断发展、更新,推动了现代多媒体技术应用的迅速发展,这项技术将会是正在建设的数字信息化社会所依赖的主要技术基础之一。
目前最流行的有损压缩标准主要是国际标准化组织和国际电信联盟制定的国际标准,包括JPEG、JPEG2000、H.26X系列以及MPEG系列。其中JPEG、JPEG2000是静态图像压缩标准,H.26X系列以及MPEG系列是运动图像压缩标准。JPEG的核心算法采用DCT(离散余弦变换),其压缩原理是:对图像数据进行8×8分块,然后进行DCT变换,获得8×8变换域的系数,由于大系数值较为集中在图像的低频区域,而高频区的系数值小,因此可以忽略某些高频系数,使图像数据得以压缩。而JPEG2000采用了对图像进行不同分辨率金字塔形的存贮。通过图像进行“小波变换”(WaveletsTransformation),可以避免原来JPEG的分块边界效应,同时借助小波变换的优良特性,使图像可以根据需要恢复成不同的分辨率和数据量,其细节保真程度明显优于同等压缩率的JPEG图像。
目前的图像压缩软件的核心一般是基于DCT或者小波变换的,由于这些算法的自身局限性,采用这些算法开发的压缩软件普遍存在着压缩比率、图像质量等不够理想或者在两者不能同时兼顾的问题。
因而在新的条件、新的环境下采用新的理论体系,研究一种新的图像压缩方法,使得经该***压缩的数字图像能够在很窄的带宽中快速、流畅地进行传递,就显得非常有必要。
上述传统图像压缩软件的核心一般是是以数学中的调和分析(HarmonicAnalysis)为基础,从数字信号处理的角度出发,通过不同的基函数的线性组合形式来描述信号。比如JPEG方法是利用DCT变换,而JPEG2000则采用离散小波变换作为其基本单元。
然而自然图像所伸展的空间与以上小波分析中假定的函数空间相去甚远,故此小波分析等不是一个表达自然图像的理想工具。不仅如此,随着图像技术的广泛应用,特别是通信的实时性对图像压缩比的要求较高,传统压缩算法普遍存在着压缩比率、图像质量等不够理想或者在两者不能同时兼顾的问题。
发明内容
本发明所要解决的技术问题是,提供一种分形图像编码方法,能够图像压缩质量和压缩速度。
为了解决上述问题,本发明提供了一种分形图像编码方法,包括如下步骤:将原始图像分割成多个互不重叠的大小相同的块;根据所分割的块的大小构成多成分基元块字典;对每一个分割后的块,在多成分基元字典中搜索最优匹配块。
现有技术中分形编码速度慢的本质原因在于传统分形编码是对每一个值域R块,在由定义域D块及其仿射变换块构成的匹配库中搜索出最佳匹配块D*,并记录参数的过程。由于匹配库容量大,且搜索量大,因此分形编码的时间十分耗时。每一个值域R块的编码时间复杂度为T=O(Nd),其中Nd是匹配库所含元素的个数,往往非常巨大。
针对编码速度问题,目前已有的改进工作可以归纳为以下两类:
1、匹配库分类
为了减少搜索区域,将匹配库进行分类则是对这一想法的一种具体实现。根据定义域D块自身的属性(方差、均值等),将所有定义域块分成m个子类,满足:Ω=Ω1∪Ω2∪…Ωm。其中Ω为所有D块的总和。由于同一类中的图像块之间存在着较高的相似性,匹配时对每一个R块,只在其对应类的相同类中搜索。类分得越精细,区域块搜索的范围越小。从而大大节约搜索时间的目的。
然而这种方法的局限性在于首先对图像块进行分类增加了算法的复杂度,另一方面无法确定最优的分类规则。
2、改进搜索算法
合理改进搜索策略,提高搜索效率,则能够达到减少计算量的目的。
然而改进的搜索方法是借助其它的数学工具,将搜索全局最优解的问题转化问求解最优化问题。
然而这类方法求解的并非全局最优解,而是局部最优解。这样做是以编码重建图像质量的下降为代价。
通过上述分析可以看出,上述方法不能彻底解决编码速度慢的问题。因为无论是分类还是改进搜索策略都没有降低匹配库Ω的实际容量。
实际上,编码速度慢的根本原因首先在于由于匹配库容量庞大使得匹配量大,编码速度缓慢,因此要解决速度问题,必须完全降低匹配库的容量;另一方面,传统方法的匹配库完全依赖于待编码的图像本身。即对每一幅编码图像都必须费时地建立各自唯一的匹配库。因此如果想要从根本上解决这一问题,需要寻找一组具有通用性且不依赖于编码图像本身的匹配库。
根据上述对传统分形编码速度慢的本质原因的分析,以下具体实施方式的快速编码方法的基本思想是构建一组不依赖于图像本身图像块作为匹配库,该匹配库中的每一图像块都是由简单图像子块构成,也称之为基元块。根据自然图像中最常见的三种区域模式,分别构建纹理子块、边缘子块以及平滑子块,以此构成的多成分基元字典,并以该字典作为编码中的匹配库,大大降低了码本容量,提高了编码速度。
分形编码中的匹配,从某种意义上可以认为这是在做简单的重复工作,并且只有一次是有效的寻找匹配D块的过程。通过对传统分形编码的实验观察发现,匹配库中的不同的D块使用情况并不均匀。某些D块被成功匹配多次,而有些块匹配次数较少,甚至一次都未匹配。
这些多次匹配成功的D块能通过不同的仿射变换表示多个R块,出现这样现象的原因一方面是由于D块之间也存在着很高的冗余性,另一方面是由于仿射变换之间的等价性决定的。
分形编码时采用的是收缩仿射变换。分析仿射变换w的表达式可以看出,w对每一点的变换都是一种线性的表示,而线性表示具有传递性。例如A、B、C三点的坐标分别为(xa,ya,za),(xb,yb,zb),(xc,yc,zc)。设A到B的变换为w1,B到C的变换为w2,即满足w1(A)=B,w2(B)=C。
x b y b z b = w 1 x a y a z a = a 1 x + b 1 y c 1 x + d 1 y s 1 z + o 1
x c y c z c = w 2 x b y b z b = a 2 x + b 2 y c 2 x + d 2 y s 2 z + o 2
那么可以通过A与B,B与C的变换关系推导出A到C的对应表示。
x c y c z c = w 2 x b y b z b = w 2 [ w 1 x a y a z a ]
将上面两式代入上式得
x c y c z c = ( a 1 a 2 + b 2 c 1 ) x a + ( b 1 a 2 + b 2 d 1 ) y a ( a 1 c 2 + d 2 c 1 ) x a + ( b 1 c 2 + d 2 d 1 ) y a s 2 s 1 z a + s 2 o 1 + o 1
w 3 = w 2 w 1 = x c y c z c = w 3 x a y a z a = a 1 a 2 + b 2 c 1 b 1 a 2 + b 2 d 1 0 a 1 c 2 + d 2 c 1 b 1 c 2 + d 2 d 1 0 0 0 s 2 s 1 x y z + 0 0 s 2 o 1 + o 1
那么如果存在w1(A)=B,w2(B)=C,就可以找到一个仿射变换w3满足w3(A)=C。换句话说,可以利用A来表示B、C两点。同理还可以通过这种线性表示的传递性表示D、E、F等多点。
因此分形编码中块与块的线性表示具有传递性,仿射变换并不是一一对应的关系,而是存在着一对多的表示,即通过不同的仿射变换可以将同一D块表示为多个R块。
图像编码的本质问题是在自然图像中,如何学习出一组表示基元,能对所有自然图像进行有效的编码。对应于分形编码中,这些多次匹配成功的D块可以称之为编码中的基元块,在这一前提的保证下,那么我们可以找出一组基元图像块构成匹配库,用较少的基元块表示所有的R块,就可以降低匹配库的容量,从而达到提高编码速度的目的。
对于分形编码中匹配库的D块,其大小往往是8×8,或者是16×16等,对于如此大小的图像块来说,一般都不会包含太多的信息量,因此考虑到可以用简单的图像块作为匹配库中的基元块,相当于用最为简单的图像块以及仿射变换w表示复杂的图像块。
相对于人工图像,自然图像具有一定的共性,具体而言自然图像的高阶统计特性服从非高斯分布,并且自然图像还具有自相似性(尺度不变性)、边缘主导性(高维奇异性)。自然图像具有明显的尺度不变性,就是说对图像进行放大或缩小操作时,图像像素点的边缘分布不会发生变化。
为了形成对图像的稀疏表示,匹配库中的基元块应能匹配图像中的平滑、边缘、轮廓、纹理等多种局部几何结构,形成对图像这类复杂信号的稀疏表示。为此,依据建立的图像模型,分别针对平滑、边缘以及纹理这三种视觉模式构建对应的子成份基元块Dsmooth,Dedge,Dtexture
这三组基元块中分别对应与匹配图像中特定的局部几何结构Ismooth,Iedge,Itexture。利用仿射变换扩充匹配库的内容,所有的这三类基块的并集就构成了一个图像编码字典库。
Ω = ∪ j = 1 n D j = D smooth ∪ D edge ∪ D texture
故,本发明的优点在于:(1)本发明针对自然图像特性,构建了一个基于简单图像子块多成份字典,该字典对自然图像有一定的普适性。(2)本发明中得到的图像编码字典是独立于图像内容。(3)本发明方法利用简单图像子块构成编码字典,从而对自然图像子块进行稀疏表示,其构成的字典容量小,与传统方法相比极大提高了编码速度。
附图说明
附图1所示是本发明所述方法的实施步骤示意图。
具体实施方式
接下来结合附图详细介绍本发明所述一种分形图像编码方法的具体实施方式。
本方法的分形编码的过程包括对图像的分割,构建多成分字典,搜索最优匹配等三个步骤,包括:步骤1,将原始图像分割成多个互不重叠的大小相同的块;步骤2,根据所分割的块的大小构成多成分基元块字典;步骤3,对每一个分割后的块,在多成分基元字典中搜索最优匹配块。
步骤1,图像分割。
首先把原始图像分割成互不重叠的B×B大小的R块。R块之间没有重叠,它们的并集正好为原始图像,其中NR是R块的个数。
步骤2,构成多成分字典。
由第一步得到R块的大小为B×B,因此构建的基元块的大小也是B×B。分别构建三种子成分基元块。
光滑基元块:利用B×B的全一矩阵点乘不同的权值生成,其中权值代表图像快的灰度值。
边缘基元块:通过实验统计得到常用的三种边缘统计模型,包括阶梯形边缘、屋顶型边缘、线性边缘三种。利用其不同的参数,例如线边缘斜率、方差等生成。
纹理基元块:利用大小为B×B的随机矩阵生成。
对每一个基元块进行传统分形编码方法中的8种仿射变换,以扩充匹配库的内容,所有的这三类基元块及其仿射变换的并集就构成了最终的多成分字典库Ω。
步骤3,搜索最优匹配。
对每一Ri块,在多成分基元字典中搜索最优匹配块Dj。Ri的分形编码可记录为CODE(i,:)={j*,l,s*,o*}。其中j*为Dj在Ω中的块号;l,1≤l≤8为仿射变换的类型;s*,o*为最优亮度变换系数。全体Ri对应的参数即为整幅图像的分形编码CODE。
本具体实施方式的解码与现有技术中分形编码的解码方法相同,具体步骤如下:
(1)从CODE文件中,获得原始图像大小M,R块大小B。
(2)根据原始图像的大小,创建一个M*M的图像作为初始解码图像。采用和编码时一样的方法将原始图像分割为R区和D区,R区用于保存迭代时生成的图像,D区当成码本Ω。
(3)对每一Ri块,1≤i≤NR,根据对应的分形编码CODE(i,:),在D区中找出对应的最佳匹配块D*,首先根据l对D*进行几何变换,再根据最优亮度变换系数s*,o*进行亮度变换s*口D*+oi,得到的结果代替Ri再R区的位置。最终对所有的R块进行变换后,就形成了一次迭代拼贴的结果,并以此作为R区。
(4)如果迭代次数达到最大值,则停止。否则转到(3)。
(5)显示解码图像。
上述编码方法利用了图像块之间线性表示具有传递性的原理,针对自然图像的特征,建立基于简单子快的多成分图像基元字典,采用了基于简单子块稀疏表示的分形图像编码方法。利用图像字典中基元子块与编码图像子块间存在的自相似冗余,借鉴“相似区域之间相互表示”的思想,达到图像压缩的目的。本方法优化了分形编码匹配库的结构,符合人类视觉特性,大大提高了分形编码速度。
综上所述,虽然本发明已用较佳实施例揭露如上,然其并非用以限定本发明,本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰,因此本发明的保护范围当视权利要求书所申请的专利范围所界定者为准。

Claims (2)

1.一种分形图像编码方法,其特征在于,包括如下步骤:
将原始图像分割成多个互不重叠的大小相同的块;
根据所分割的块的大小构成多成分基元块字典,其中对每一个基元块进行分形编码方法中的仿射变换,并将多次匹配成功的同一D块通过不同的仿射变换来表示多个R块,以扩充匹配库的内容,其中D块由定义域确定,R块由值域确定;
对每一个分割后的块,在多成分基元字典中搜索最优匹配块。
2.根据权利要求1所述的方法,其特征在于,所述多成分基元块包括光滑基元块、边缘基元块和纹理基元块。
CN201010604564.8A 2010-12-24 2010-12-24 一种分形图像编码方法 Expired - Fee Related CN102547261B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010604564.8A CN102547261B (zh) 2010-12-24 2010-12-24 一种分形图像编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010604564.8A CN102547261B (zh) 2010-12-24 2010-12-24 一种分形图像编码方法

Publications (2)

Publication Number Publication Date
CN102547261A CN102547261A (zh) 2012-07-04
CN102547261B true CN102547261B (zh) 2016-06-15

Family

ID=46353068

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010604564.8A Expired - Fee Related CN102547261B (zh) 2010-12-24 2010-12-24 一种分形图像编码方法

Country Status (1)

Country Link
CN (1) CN102547261B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819829A (zh) * 2012-07-17 2012-12-12 中国科学院地理科学与资源研究所 基于分形的超分辨率遥感影像的重建算法
CN109005407B (zh) 2015-05-15 2023-09-01 华为技术有限公司 视频图像编码和解码的方法、编码设备和解码设备
CN105528783A (zh) * 2015-12-01 2016-04-27 上海电机学院 多层次紧致纹理特征提取方法以及图像纹理分割方法
CN106612439A (zh) * 2016-02-04 2017-05-03 四川用联信息技术有限公司 一种自适应快速分形图像压缩方法
CN107330959A (zh) * 2017-06-26 2017-11-07 宁德师范学院 一种基于隐马尔科夫模型和稀疏表示的分形图案生成方法及***
CN108810549B (zh) * 2018-06-06 2021-04-27 天津大学 一种面向低功耗的流媒体播放方法
CN109982095B (zh) * 2019-03-20 2023-04-07 南宁师范大学 基于cnn与gep的分形图像压缩编码方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6775415B1 (en) * 1999-05-25 2004-08-10 George Mason University Fractal image compression using reinforcement learning
WO2007010446A2 (en) * 2005-07-15 2007-01-25 Koninklijke Philips Electronics N.V. Image coder for regions of texture
KR100664550B1 (ko) * 2005-11-02 2007-01-03 엠텍비젼 주식회사 인코딩된 데이터 전달 방법 및 그 방법을 수행하는 촬상장치
CN101827268B (zh) * 2010-04-30 2012-04-18 北京航空航天大学 一种基于对象的分形视频压缩与解压缩方法

Also Published As

Publication number Publication date
CN102547261A (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
CN102547261B (zh) 一种分形图像编码方法
Golla et al. Real-time point cloud compression
Gu et al. Geometry images
Pajarola et al. Compressed progressive meshes
CN103780909A (zh) 编码器、解码器及编码方法、解码方法
Ho et al. Compressing large polygonal models
Zheng et al. A novel gray image representation using overlapping rectangular NAM and extended shading approach
CN105160705A (zh) 一种基于三维引擎对移动终端三维图像数据的处理方法
CN104869426A (zh) 在低压缩码率下降低图像方块效应的jpeg编码方法
Hubo et al. Self-similarity based compression of point set surfaces with application to ray tracing
CN100588252C (zh) 小波图像编码方法和相应的译码方法
Lam et al. Effects of JPEG compression on the accuracy of digital terrain models automatically derived from digital aerial images
Siddeq et al. Novel 3D compression methods for geometry, connectivity and texture
Toth et al. Compressing and classifying LiDAR waveform data
CN101986710B (zh) 一种基于sort-last体系结构的并行绘制***
Abasolo et al. Wavelet analysis for a new multiresolution model for large-scale textured terrains
Scarmana Lossless data compression of grid-based digital elevation models: A PNG image format evaluation
Moran et al. Hierarchical coding of 3d models with subdivision surfaces
CN103279963A (zh) 地理信息图像的压缩方法
CN105741332B (zh) 一种真实感三维网格压缩方法
CN106534866A (zh) 图像压缩方法及装置
CN114554175B (zh) 一种基于分类重排的二维点云距离图像的无损压缩方法
Morán Hierarchical 3D mesh coding with subdivision surfaces
WO2023179710A1 (zh) 编码方法及终端
Zhu et al. Data Compression for Network GIS.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160615

Termination date: 20181224

CF01 Termination of patent right due to non-payment of annual fee