CN102611888B - 一种对屏幕内容的编码方法 - Google Patents

一种对屏幕内容的编码方法 Download PDF

Info

Publication number
CN102611888B
CN102611888B CN201110369669.4A CN201110369669A CN102611888B CN 102611888 B CN102611888 B CN 102611888B CN 201110369669 A CN201110369669 A CN 201110369669A CN 102611888 B CN102611888 B CN 102611888B
Authority
CN
China
Prior art keywords
upbound
index
lowbound
pixel
base color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110369669.4A
Other languages
English (en)
Other versions
CN102611888A (zh
Inventor
丁文鹏
尹宝才
朱维佳
施云慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201110369669.4A priority Critical patent/CN102611888B/zh
Publication of CN102611888A publication Critical patent/CN102611888A/zh
Application granted granted Critical
Publication of CN102611888B publication Critical patent/CN102611888B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

公开了一种编码效率更高的对屏幕内容的编码方法,在时间域用若干个基础颜色和一个索引表来表示screen content(屏幕内容)的图像或图像块;其中索引表被拆解为一个匹配表和一个非匹配的索引表,匹配表中的每个元素表示索引表的元素是否与其预测索引相等,若不等,则将更新该索引的值并存储在非匹配的索引表中;预测索引通过两种方法产生:一种是利用时间域的强相关性,将帧间运动估计后搜索到的图像块的索引表当作预测索引表;另一种是利用空间域的相关性,根据当前像素的周围像素的纹理方向,以像素级的预测索引作为预测索引。

Description

一种对屏幕内容的编码方法
技术领域
本发明属于视频编码的技术领域,具体地涉及一种对屏幕内容(screencontent)的编码方法。
背景技术
在已有的技术中,混合图像的编码(对screen content的编码方法)大致可以分为以下三类。
1.基于图像编码的方法:
这种方法还是采用传统的编码框架来对混合图像进行编码,但是针对不同的区域采用不同的量化步长,对于包含文字和图表内容的块,编码后重建效果会非常模糊,所以量化这些块时减少量化步长,为其多分配比特,让其重建的质量尽可能好。但是对于固定的比特数,如果为文字和图表块多分配了比特,那么自然图像块所分配的比特数就会相应地减少,所以总体来说,这种方法仍不能达到很好的效果。
2.基于分层编码的方法:
这种方法采用混合光栅模型来进行压缩。它将一幅图像或者一个图像块分为前景层、背景层和一个二进制算子的平面层。这个二进制算子的平面层表明图像或图像块的每个像素属于前景层还是背景层,并且这个二进制算子平面可以用JBIG(Joint Bi-level Image Experts Group,联合二值图像专家组)标准或JBIG2(Joint Bi-level Image Experts Group2,联合二值图像专家组二代)标准进行压缩。而经过数据填充算法模糊后的前景层和背景层可以用传统的图像编码框架来进行压缩。论文“Compressing compound documents”(The Document and ImageCompression Handbook,M.Barni,Ed.New York:Marcel-Dekker,2005.)提出了这种方法,并通过实验证明这种方法与传统的编解码框架相比,可以取得很大的增益。但是这种方法有一些缺点:首先增益在很大程度上取决于分割的算法,即如何将图像分为前景和背景。第二,分割出来的洞如果不经过任何处理会损害编码的效果。第三,分别编码背景层的文本颜色和二进制算子的文本形状也会降低编码的效率。所以这种方法仍不能满足应用的需要。
3.基于块的编码方法:
这种方法可以分为两类:
一种是利用空域的性质,如直方图统计,梯度,颜色的数目等,可以将当前编码块分为几类中的一种,如文本,图表,自然图像等。然后不同的类别用不同的编码框架来进行压缩以适用于它们的统计特性。
另一种是考虑到屏幕内容中的文字和图表的直方图较稀疏,将其在时域分解为基础颜色和索引表的形式,即Base color and Index map(BCIM)模式,如图1所示,其中“1”、“0”、“253”、“255”表示四种颜色。论文“Enable efficient compound image compression in H.264/AVC intracoding”(Proc.Int.Conf.Image Processing,Oct.2007,vol.2,pp.337-340)首先将这种方法应用到了H.264标准中,并取得了不错的增益,但是编码效率还有待提高。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提供一种编码效率更高的对screen content的编码方法。
本发明的技术解决方案是:这种对屏幕内容的编码方法,在时间域用若干个基础颜色和一个索引表来表示screen content的图像或图像块;其中索引表被拆解为一个匹配表和一个非匹配的索引表,匹配表中的每个元素表示索引表的元素是否与其预测索引相等,若不等,则将更新该索引的值并存储在非匹配的索引表中;预测索引通过两种方法产生:一种是利用时间域的强相关性,将帧间运动估计后搜索到的图像块的索引表当作预测索引表;另一种是利用空间域的相关性,根据当前像素的周围像素的纹理方向,以像素级的预测索引作为预测索引。
编码效率更高的原因:由于屏幕内容具有直方图分布稀疏的性质,所以用若干个基础颜色和一个索引表来表示具有屏幕内容的图像块是非常有效的。我们进而将索引表分解为匹配表和非匹配索引表。由于匹配表的布尔性,即每个元素只有0和1两种值,来表示是否索引表中的索引与预测索引相等。当预测非常精确的时候,那么用于编码匹配表的码流的分布会很不均与,0和1的比例悬殊很大,这样的码流如果用CABAC(Context-basedAdaptive Binary Arithmetic Coding,基于上下文的二进制算术编码)进行编码,那么码率的减少幅度会很大。而编码非匹配索引表是一个小概率时间,它只发生在索引表的索引与预测索引不相等的时候,这时候由于排除了一种可能,为了保证连续性,会将一部分的值前移,这样的话,0出现的概率相对高一些。同样对CABAC适用,会减少码率。而且上述两种产生预测索引的方法利用了空间和时间的相关性,产生预测索引的精确性得到了保证,所以我们提出的方法可以大幅度改进屏幕内容的编码效率。
附图说明
图1示出了现有的BCIM模式;
图2示出了根据本发明的screen content编码方法的流程图;
图3是分解索引表的说明图;
图4示出了如何根据时间域的相关性产生预测索引;
图5示出了如何根据空间域的相关性产生预测索引;
图6示出了当前像素及其左,左上,上,右上位置的像素。
具体实施方式
这种对屏幕内容的编码方法,在时间域用若干个基础颜色和一个索引表来表示screen content的图像或图像块;其中索引表被拆解为一个匹配表和一个非匹配的索引表,匹配表中的每个元素表示索引表的元素是否与其预测索引相等,若不等,则将更新该索引的值并存储在非匹配的索引表中(如图3所示);预测索引通过两种方法产生:一种是利用时间域的强相关性,将帧间运动估计后搜索到的图像块的索引表当作预测索引表;另一种是利用空间域的相关性,根据当前像素的周围像素的纹理方向,以像素级的预测索引作为预测索引。
优选地,如图2所示,这种方法包括以下步骤:
(1)将每个编码单元CU按照四叉树形式分割为预测单元PU;
(2)将每个预测单元PU按照四叉树形式分割为变换单元TU;
(3)对于当前TU有YUV3个分量,对于YUV的每个分量的每个进行步骤(4)-(12)的处理:
(4)将TU内的像素进行动态规划聚类,获得具有代表性的N个值,N为大于0的整数,这N个值即是N个基础颜色,并按递增顺序排序;然后将当前TU中的每个像素根据欧式距离最近的原则映射到N个基础颜色中的一个,并获得一个索引来表明它映射至哪个基础颜色,并且计算每个TU的失真;
(5)产生预测索引;
(6)按照每个索引是否与其对应的预测索引相等的原则来产生匹配表;
(7)对于那些与预测索引不相等的索引,更新索引,并存储在非匹配的索引表中;
(8)计算编码基础颜色、匹配表和非匹配的索引表所产生的码率;
(9)根据步骤(4)中产生的失真和步骤(8)产生的码率来计算率失真代价;
(10)从1至4遍历N的值,固定N后重复步骤(2)-(9),使步骤(9)中计算的率失真代价最小;
(11)将选出的率失真代价最小的基础颜色的信息和匹配表及非匹配的索引表的信息传送至解码端;
(12)解码端在获得相应的信息后,根据基础颜色和索引表来重建当前TU;
(13)重建PU和CU。
优选地,获得基础颜色的方法包括以下步骤:
(a)将当前图像中的像素排成序,统计并记录每个块中的像素值及其出现频率,并且将所有的具有不同值的像素排成一个按照值递增顺序排成区间X,且每个像素值的出现频率也形成一个区间Y,X和Y这两个区间的元素是一一对应的;
(b)设定将块内的像素值分为N类,即要得到N个基础颜色,N为大于0的整数:
β(lowBound,UpBound,N)代表LowBound至UpBound区间内的元素分配到N个类中所产生的失真,
β(lowBound,UpBound,N)=α(LowBound,p-1)+β(p,UpBound,N-1)    N≥2
α(LowBound,UpBound)    N=1
如果N≥2,P点通过下式求得
p = arg min lowBound < P < UpBound - N + 1 ( &alpha; ( LowBound , p - 1 ) + &beta; ( p , UpBound , N - 1 )
&alpha; ( LowBound , p - 1 ) = &Sigma; i = LowBound p - 1 ( X i - avg ( LowBound , p - 1 ) ) 2 &times; Y i
avg ( LowBound , p - 1 ) = &Sigma; i = LowBound p - 1 X i &times; Y i Y i ;
(c)
β(lowBound,UpBound,4)=α(LowBound,p1-1)+β(p1,UpBound,3)
β(p1,UpBound,3)=α(p1,p2-1)+β(p2,UpBound,2)
β(p2,UpBound,2)=α(p2,p3-1)+β(p3,UpBound,1)
β(p3,UpBound,1)=α(p3,UpBound)
其中pi是在每层线性搜索找到的最优点,i是1、2、或3,
α(p3,UpBound),α(p2,p3-1),α(p1,p2-1),α(LowBound,p1-1)就是所求得的基础颜色,且这里有LowBound<p1<p2<p3<UpBound。步骤(2)中的量化采用公式:C(S)=sign(S)×max(0,floor(|S|/Q+1-Z),其中S为输入信号,floor为下取整函数,Q为量化步长,Z是预设的调节参数。
以下具体说明产生预测索引的方法,主要包括:
1.根据时间域的相关性产生
根据时域的相关性,如图4所示,将运动估计所找到的匹配图像块进行相对于当前块的基础颜色的量化,获得一个索引表,作为当前块索引表的预测值。
2.根据空间域的相关性产生
根据空域的相关性,对块内的每个像素的索引进行预测,首先对周围四个像素进行方向性测试,并用2范数进行衡量。2范数越小,代表纹理越光滑,连续性越强,所以在测试周围4个像素后,用2范数最小的对应像素的索引作为当前索引的预测值。图5很好的说明了这一过程。
在编码匹配表时,对上下文进行对应的设计。总共为其设计16种上下文,周围邻近的每个像素的匹配性有2种可能,匹配和不匹配,分别用1和0表示,这样的话,我们这里总共获取4个邻近像素,即左方,上方,左上方和右上方,对应的上下文为24=16。
在不匹配的情况下,要编码非匹配索引表中得对应元素,这时需要进行根据周围像素进行上下文的自适应选择以达到更好的编码效果。
图5中为当前像素及其左,左上,上,右上位置的像素。
为其总共设计15种上下文模型,为了更好的说明,每种上下文用一个四元组表示,四元组分别依次表示左,左上,上,右上位置的像素所表示的索引。这15种上下文分别为{AAAA,AAAB,AABA,ABAA,BAAA,AABB,ABAB,ABBA,AABC,BAAC,BCAA,ABAC,ABCA,BACA,ABCD}。其中A,B,C,D代表4个不同的索引值,例如AAAA代表4个位置的索引是相同的,AAAB代表左方,左上方,上方的3个索引值是一样的,右上方的索引值是与其他三个索引值不一样的。具体做法如下:
首先获得上下左右4个像素对应的索引值,按4个索引的出现频率及其所在位置看其属于15种上下文的哪一种,并用对应的上下文模型进行编码。并且在熵编码之前,我们将当前索引需要进行重映射以达到更好的编码效果。重映射的方法如下:根据其所属上下文模型,将需要频率最高的索引重映射为0,然后按频率递减的顺序重映射所有可能出现的索引,形成一个映射表。最后在映射表中查到当前索引重映射后的索引,并编码这个映射后的索引。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

Claims (2)

1.一种对屏幕内容的编码方法,其特征在于:其具体包括以下步骤:
(1)将每个编码单元CU按照四叉树形式分割为预测单元PU;
(2)将每个预测单元PU按照四叉树形式分割为变换单元TU;
(3)对于当前TU有YUV3个分量,对于YUV分量的每个分量进行步骤(4)-(12)的处理:
(4)将TU内的像素进行动态规划聚类,获得具有代表性的N个值,N为大于0的整数,这N个值即是N个基础颜色,并按递增顺序排序;然后将当前TU中的每个像素根据欧式距离最近的原则映射到N个基础颜色中的一个,并获得一个索引来表明它映射至哪个基础颜色,并且计算每个TU的失真;
(5)产生预测索引;
(6)按照每个索引是否与其对应的预测索引相等的原则来产生匹配表;
(7)对于那些与预测索引不相等的索引,更新索引,并存储在非匹配的索引表中;
(8)计算编码基础颜色、匹配表和非匹配的索引表所产生的码率;
(9)根据步骤(4)中产生的失真和步骤(8)产生的码率来计算率失真代价;
(10)从1至4遍历N的值,固定N后重复步骤(2)-(9),使步骤(9)中计算的率失真代价最小;
(11)将选出的率失真代价最小的基础颜色的信息和匹配表及非匹配的索引表的信息传送至解码端;
(12)解码端在获得相应的信息后,根据基础颜色和索引表来重建当前TU;
(13)重建PU和CU;
所述预测索引通过以下两种方法之一产生:一种是利用时间域的强相关性,将运动估计所找到的匹配图像块进行相对于当前块的基础颜色的量化,获得一个索引表,作为当前块索引表的预测值;另一种是利用空间域的相关性,根据当前像素的周围像素的纹理方向,对块内的每个像素的索引进行预测,首先对周围四个像素进行方向性测试,并用2范数进行衡量,2范数越小,代表纹理越光滑,连续性越强,在测试周围4个像素后,用2范数最小的对应像素的索引作为当前索引的预测值。
2.根据权利要求1所述的方法,其特征在于:获得基础颜色的方法包括以下步骤:
(a)将当前图像中的像素排成序,统计并记录每个块中的像素值及其出现频率,并且将所有的具有不同值的像素排成一个按照值递增顺序排成区间X,且每个像素值的出现频率也形成一个区间Y,X和Y这两个区间的元素是一一对应的;
(b)设定将块内的像素值分为N类,即所求得N个基础颜色,N为大于0的整数:
β(lowBound,UpBound,N)代表LowBound至UpBound区间内的元素分配到N个类中所产生的失真,
&beta; ( lowBound , UpBound , N ) = &alpha; ( LowBound , p - 1 ) + &beta; ( p , UpBound , N - 1 ) N &GreaterEqual; 2 &alpha; ( LowBound , UpBound ) N = 1
如果N≥2,P点通过下式求得
p = arg min lowBound < P < UpBound - N + 1 ( &alpha; ( LowBound , p - 1 ) + &beta; ( p , UpBound , N - 1 )
&alpha; ( LowBound , p - 1 ) = &Sigma; i = LowBound p - 1 ( X i - avg ( LowBound , p - 1 ) ) 2 &times; Y i
avg ( LowBound , p - 1 ) = &Sigma; i = LowBound p - 1 X i &times; Y i Y i ;
(c)
β(lowBound,UpBound,4)=α(LowBound,p1-1)+β(p1,UpBound,3)
β(p1,UpBound,3)=α(p1,p2-1)+β(p2,UpBound,2)
β(p2,UpBound,2)=α(p2,p3-1)+β(p3,UpBound,1)
β(p3,UpBound,1)=α(p3,UpBound)
其中pi是在每层线性搜索找到的最优点,i是1、2、或3,α(p3,UpBound),α(p2,p3-1),α(p1,p2-1),α(LowBound,p1-1)就是所求得的基础颜色,且这里有LowBound<p1<p2<p3<UpBound。
CN201110369669.4A 2011-11-18 2011-11-18 一种对屏幕内容的编码方法 Expired - Fee Related CN102611888B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110369669.4A CN102611888B (zh) 2011-11-18 2011-11-18 一种对屏幕内容的编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110369669.4A CN102611888B (zh) 2011-11-18 2011-11-18 一种对屏幕内容的编码方法

Publications (2)

Publication Number Publication Date
CN102611888A CN102611888A (zh) 2012-07-25
CN102611888B true CN102611888B (zh) 2014-07-23

Family

ID=46529013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110369669.4A Expired - Fee Related CN102611888B (zh) 2011-11-18 2011-11-18 一种对屏幕内容的编码方法

Country Status (1)

Country Link
CN (1) CN102611888B (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5999515B2 (ja) * 2012-02-28 2016-09-28 パナソニックIpマネジメント株式会社 画像処理装置、及び、画像処理方法
US20140056347A1 (en) 2012-08-23 2014-02-27 Microsoft Corporation Non-Transform Coding
CN103402091B (zh) * 2013-07-31 2016-05-04 上海通途半导体科技有限公司 云桌面图像分类与编码方法
US10291827B2 (en) 2013-11-22 2019-05-14 Futurewei Technologies, Inc. Advanced screen content coding solution
TWI538487B (zh) * 2013-12-05 2016-06-11 財團法人工業技術研究院 螢幕視訊之預測編碼的方法與系統
CA2935559C (en) 2014-01-02 2018-11-20 Vid Scale, Inc. Two-dimensional palette coding for screen content coding
WO2015143351A1 (en) 2014-03-21 2015-09-24 Futurewei Technologies, Inc. Advanced screen content coding with improved color table and index map coding methods
US10313684B2 (en) * 2014-06-20 2019-06-04 Qualcomm Incorporated Copy from previous rows for palette mode coding
CN104410863B (zh) * 2014-12-11 2017-07-11 上海兆芯集成电路有限公司 图像处理器以及图像处理方法
US9946743B2 (en) * 2015-01-12 2018-04-17 Cisco Technology, Inc. Order encoded manifests in a content centric network
US9729885B2 (en) 2015-02-11 2017-08-08 Futurewei Technologies, Inc. Apparatus and method for compressing color index map
CN105472392B (zh) * 2015-12-11 2018-11-20 西安万像电子科技有限公司 基于渐进式文字块压缩的屏幕视频编解码方法及编解码器
CN105791824B (zh) * 2016-03-09 2018-08-31 西安电子科技大学 基于边缘点密度的屏幕内容编码预测模式快速选择方法
CN106385592B (zh) * 2016-08-31 2019-06-28 西安万像电子科技有限公司 图像压缩方法和装置
CN106375771B (zh) * 2016-08-31 2019-05-24 西安万像电子科技有限公司 图像特征匹配方法和装置
CN107103891B (zh) * 2017-01-20 2019-06-18 艾体威尔电子技术(北京)有限公司 一种在小内存嵌入式***中使用彩色屏幕的方法
CN106993189B (zh) * 2017-04-06 2019-10-15 北京工业大学 一种基于优化排序的屏幕内容视频编码方法
CN117651149A (zh) 2018-09-10 2024-03-05 华为技术有限公司 视频解码方法及视频解码器

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101217668A (zh) * 2008-01-14 2008-07-09 浙江大学 基于块分类的混合图像压缩方法
CN102223541A (zh) * 2011-07-14 2011-10-19 北京工业大学 一种混合图像的编码方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101217668A (zh) * 2008-01-14 2008-07-09 浙江大学 基于块分类的混合图像压缩方法
CN102223541A (zh) * 2011-07-14 2011-10-19 北京工业大学 一种混合图像的编码方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋宇彬.基于四叉树的图像分割技术.《兵工自动化》.2004,第23卷(第6期),63-64. *

Also Published As

Publication number Publication date
CN102611888A (zh) 2012-07-25

Similar Documents

Publication Publication Date Title
CN102611888B (zh) 一种对屏幕内容的编码方法
CN102223541B (zh) 一种混合图像的编码方法
CN104471934B (zh) 对视频进行熵编码的方法和设备以及对视频进行熵解码的方法和设备
CN101243611B (zh) 变换块的高效编码和解码
CN104885471B (zh) 用于下一代视频的编码/未编码的数据的内容自适应熵编码
CN100547615C (zh) 表示时变图形模型的数据流的编码方案
CN100420308C (zh) 图象编码装置和图象译码装置
CN100392671C (zh) 用于自适应块变换的基于上下文的自适应可变长度编码的方法和***
CN104365099B (zh) 用于变换系数等级的熵编码和熵解码的参数更新方法以及使用该方法的变换系数等级的熵编码装置和熵解码装置
CN110447228A (zh) 运动向量差(mvd)预测
CN110024393A (zh) 用于视频译码的低复杂度符号预测
CN107396124A (zh) 基于深度神经网络的视频压缩方法
CN1319383C (zh) 高性能空域可伸缩的运动估计与运动矢量编码实现方法
CN108605141A (zh) 用于紧凑多遍变换的高效参数存储
CN106559669A (zh) 图像预测的方法及装置
CN107925763A (zh) 等级分割中的块级别变换选择和隐式信令的编码变换方法和设备
CN106170921A (zh) 涉及符号压缩的数据的源编码和解码方法及装置
CN107835421A (zh) 对视频编码的方法和设备以及对视频解码的方法和设备
CN105027560A (zh) 确定用于变换系数的二进制码字的方法
CN1864177A (zh) 视频编码和解码方法及其相应设备
CN106101714A (zh) 一种与压缩编码过程紧耦合的h.264视频信息隐藏方法
CN106612439A (zh) 一种自适应快速分形图像压缩方法
Zhou et al. Distributed video coding using interval overlapped arithmetic coding
CN108464005A (zh) 视频编码中的残差变换及逆向变换***和方法
CN105791868A (zh) 视频编码的方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140723

Termination date: 20211118