CN107277508B - 一种采用自适应模式选择的像素级两向帧内预测方法 - Google Patents

一种采用自适应模式选择的像素级两向帧内预测方法 Download PDF

Info

Publication number
CN107277508B
CN107277508B CN201710612059.XA CN201710612059A CN107277508B CN 107277508 B CN107277508 B CN 107277508B CN 201710612059 A CN201710612059 A CN 201710612059A CN 107277508 B CN107277508 B CN 107277508B
Authority
CN
China
Prior art keywords
pixel
prediction
value
pixels
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710612059.XA
Other languages
English (en)
Other versions
CN107277508A (zh
Inventor
付方发
宣茜玮
王进祥
徐伟哲
王永生
来逢昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FOUNDATION STONE KULIAN MICROELECTRONIC TECHNOLOGY (BEIJING) Co.,Ltd.
Original Assignee
Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Institute of Technology filed Critical Harbin Institute of Technology
Priority to CN201710612059.XA priority Critical patent/CN107277508B/zh
Publication of CN107277508A publication Critical patent/CN107277508A/zh
Application granted granted Critical
Publication of CN107277508B publication Critical patent/CN107277508B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种采用自适应模式选择的像素级两向帧内预测方法,本发明涉及像素级两向帧内预测方法。本发明为了解决现有技术采用基于块的预测方法无法提供像素级预测精度以及方法复杂的缺点。本发明包括:步骤一、根据当前像素所处位置对其进行分类,得到当前像素所属类别;步骤二、根据当前像素所属类别,位于第一列或第一行的像素采用固定预测模式,选择出当前像素的预测值;步骤三、除第一列和第一行外的像素进行自适应模式选择,选择出当前像素的预测值,完成预测过程。本发明为帧内每个像素提供独立的自适应预测模式,适应不同的图像特征,以极低的计算复杂度,得到比较准确的预测结果。本发明用于帧内预测领域。

Description

一种采用自适应模式选择的像素级两向帧内预测方法
技术领域
本发明涉及数字图像压缩编解码中的帧内预测领域,具体涉及采用自适应模式选择的像素级两向帧内预测方法。
背景技术
在信息时代的浪潮中,多媒体技术和移动通信技术飞速发展,人们进行视频信息交流的需求不断扩大,推动数字图像和视频技术的全面发展。近年来,人们对图像质量的要求不断提高,然而高清图像数据量巨大,为了更高效的存储和传输,必须在不损失图像质量的前提下对其进行有效的压缩。
帧内预测是图像压缩过程中的重要技术,传统的基于块的预测方法无法提供像素级的预测精度。并且,在面向便携式设备等计算资源和电源有限的应用中,复杂的传统预测方法需要较大的软硬件代价。为了能更好的节约资源,并且有利于进行软硬件实现,需要采用兼顾简便程度以及准确率的预测方法对每个像素进行独立并且简单的预测。
传统的数字图像压缩编码中,预测过程基于块来完成,以像素块为单位,块内的像素采用统一的模式进行预测。然而,块内的像素具有不同的特征,采用统一的模式进行预测必然无法给每一个像素提供最优的预测结果。并且,传统的预测方法采用复杂的运算过程进行预测值的计算,带来了大量的计算资源以及编码时间的消耗。在便携式设备等计算资源以及电源有限,并且对实时性要求较高的应用中,复杂的预测方法显然是不合适的,因此需要设计低复杂度的方法进行像素级的帧内预测,使其不仅能提供像素级预测精度,还能保证方法简便,为图像压缩的软硬件实现提供较好的基础。
发明内容
本发明的目的是为了解决现有技术采用基于块的预测方法无法提供像素级预测精度以及方法复杂的缺点,而提出一种采用自适应模式选择的像素级两向(两向是指水平和垂直)帧内预测方法。
一种采用自适应模式选择的像素级两向帧内预测方法包括以下步骤:
步骤一、根据当前像素所处位置对当前像素进行分类,得到当前像素所属类别;
设当前像素为Y(i,j),其中(i,j)表示像素位置,i为行数,第一行像素i=1;j为列数,第一列像素j=1,按照不同的位置,将像素分为以下四类:
1)i=1,j=1,输入的第一个像素;
2)i=1,j≠1,除输入的第一个像素外的第一行像素;
3)i≠1,j=1,除输入的第一个像素外的第一列像素;
4)i≠1,j≠1,除第一行和第一列的像素外的其他像素;
步骤二、根据当前像素所属类别,位于第一列或第一行的像素采用固定预测模式,选择出当前像素的预测值;
步骤三、除第一列和第一行外的像素进行自适应模式选择,选择出当前像素的预测值,完成预测过程。
本发明的有益效果为:
本发明提供了一种用于图像压缩的像素级帧内预测方法,为帧内每个像素提供独立的自适应预测模式,适应不同的图像特征,以极低的计算复杂度,得到比较准确的预测结果。
本发明提供了一种采用自适应模式选择的像素级两向帧内预测方法。根据对像素空间相关性的分析,对帧内预测过程提出一种低复杂度的自适应模式选择方法。该方法的设计在兼顾预测准确度的同时,以实现低复杂度的预测方法为宗旨,降低预测过程的计算量,进而提升处理速度。在对像素空间相关性以及预测准确度进行研究分析后,证实了本发明方法的可行性与实用性,提出了分步进行模式选择的快速预测方法。通过像素分类和自适应模式选择两个主要步骤,从左侧和上方已重构像素中选择一个合适的作为预测结果,降低了运算复杂度,并保持了预测准确度。在测试序列中,本发明的预测准确率平均大于86%。
1、方法具有自适应性,编解码端完美复现,不需要在码流中传输额外的模式选择标识;
2、提供像素级的自适应模式选择,得到较为精确的预测结果;
3、预测方法复杂度极低,计算时间短,利于减少编解码时间并且有利于软硬件实现。
附图说明
图1为表示采用自适应模式选择的像素级两向帧内预测方法流程图;
图2为表示面向显示的行扫描方式示意图;图中
Figure GDA0002226667080000021
表示扫描方向;
图3为表示像素分类示意图;
图4为表示参与模式选择的像素位置示意图;
图5为表示模式选择流程图;
图6为表示原视频的一帧图像中Y分量的分布情况图;
图7为表示经预测方法后得到的Y分量残差分布情况图。
具体实施方式
具体实施方式一:如图1所示,一种采用自适应模式选择的像素级两向帧内预测方法包括以下步骤:
步骤一、根据当前像素所处位置对其进行分类,得到当前像素所属类别;
如图3所示,所述步骤一中根据当前像素所处位置对其进行分类,得到当前像素所属类别的具体过程为:
设当前像素为Y(i,j),其中(i,j)表示像素位置,i为行数,第一行像素i=1;j为列数,第一行像素j=1,按照不同的位置,将像素分为以下四类:
1)i=1,j=1,输入的第一个像素;
2)i=1,j≠1,除输入的第一个像素外的第一行像素;
3)i≠1,j=1,除输入的第一个像素外的第一列像素;
4)i≠1,j≠1,除第一行和第一列的像素外的其他像素。
步骤二、根据当前像素所属类别,位于第一列或第一行的像素采用固定预测模式,选择出当前像素的预测值;
步骤三、除第一列和第一行外的像素进行自适应模式选择,选择出当前像素的预测值,完成预测过程。整个模式选择的流程如图5所示。
面向显示时,由于本发明是像素级的预测方式,因此适用于以行扫描方式进行的显示功能,如图2所示;面向压缩时,由于不同的压缩方法有不同的分块方式,本发明适用于各类分块方式的压缩方法的预测部分,并且由于自适应的优点,不用在码流中加入额外码字就能自适应的在解码端完成预测。
具体实施方式二:本实施方式与具体实施方式一不同的是:所述步骤二中根据当前像素所属类别,位于第一列或第一行的像素采用固定预测模式,选择出当前像素的预测值的具体过程为:
1)当i=1,j=1时,使用0作为预测值;
2)当i=1,j≠1时,使用Y(i,j-1)像素的重构像素值作为预测值;
3)当i≠1,j=1时,使用Y(i-1,j)像素的重构像素值作为预测值。
其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是:所述重构值具体为:
在无损压缩时,像素的重构值为预测值与残差值的和;
在有损压缩时,像素的重构值为预测值与反量化后的残差值的和。
其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是:所述步骤三中除第一列和第一行外的像素进行自适应模式选择,选择出当前像素的预测值的具体过程为:
如图4所示,将当前像素Y(i,j)及其相邻的三个像素Y(i,j-1),Y(i-1,j),Y(i-1,j-1)当做一个像素块,像素Y(i,j-1)的重构值记为A,像素Y(i-1,j)的重构值记为B,像素Y(i-1,j-1)的重构值记为C,进行以下计算:
Z=|C-A|,
H=|C-B|
其中Z与H的相对大小表示当前位置像素块垂直和水平的相关性的相对大小;
当H≤Z时,表明在当前位置,像素块的水平相关性强于垂直相关性,说明当前像素值与左边像素Y(i,j-1)的重构值A的接近程度较大。因此在此种情况下,使用A作为当前像素的预测值;
当Z<H时,表明在当前位置,像素块的垂直相关性强于水平相关性,说明当前像素值与上边像素Y(i-1,j)的重构值B更为接近,此时使用B作为当前像素的预测值。其它步骤及参数与具体实施方式一至三之一相同。
采用以下实施例验证本发明的有益效果:
实施例一:
通过本发明的预测方法,可以实现平均大于86%的预测准确率。为了证实方法的优越性,使用本发明的预测方法对1080p的视频进行帧内预测,将YUV格式的视频按帧输入,经过方法的预测过程,得到的残差分布呈现显著的集中。以视频2路车站其中一帧中Y分量为例,当视频的QP值为27时,原Y分量值的分布如图6所示,经过本发明中方法的预测过程,得到的残差分布如图7所示。可以明显地看出,经过方法的预测过程,在方法步骤非常简便、实现代价很小的前提下,离散的数据得到了有效的集中。
实施例二:
对于12个视频的4种QP值,即在48个视频的所有帧中对预测方法的正确率进行统计,预测方法正确率的计算公式为:
Figure GDA0002226667080000041
其中,当位于当前像素左边的像素Y(i,j-1)的重构值、位于当前像素上边的像素Y(i-1,j)的重构值这两者中与当前像素实际值最为接近的元素恰好是方法的预测结果时,认为“预测与实际相符”。
得到的结果如表1所示。
表1预测方法的正确率
Figure GDA0002226667080000051
通过结果可以看出,本发明提出的预测方法达到了平均大于86%的预测准确率。本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,本领域技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (1)

1.一种采用自适应模式选择的像素级两向帧内预测方法,其特征在于:所述采用自适应模式选择的像素级两向帧内预测方法包括以下步骤:
步骤一、根据当前像素所处位置对当前像素进行分类,得到当前像素所属类别;
设当前像素为Y(i,j),其中(i,j)表示像素位置,i为行数,第一行像素i=1;j为列数,第一列像素j=1,按照不同的位置,将像素分为以下四类:
1)i=1,j=1,输入的第一个像素;
2)i=1,j≠1,除输入的第一个像素外的第一行像素;
3)i≠1,j=1,除输入的第一个像素外的第一列像素;
4)i≠1,j≠1,除第一行和第一列的像素外的其他像素;
步骤二、根据当前像素所属类别,位于第一列或第一行的像素采用固定预测模式,选择出当前像素的预测值;
步骤三、除第一列和第一行外的像素进行自适应模式选择,选择出当前像素的预测值,完成预测过程;
所述步骤二中根据当前像素所属类别,位于第一列或第一行的像素采用固定预测模式,选择出当前像素的预测值的具体过程为:
1)当i=1,j=1时,使用0作为预测值;
2)当i=1,j≠1时,使用像素Y(i,j-1)的重构值作为预测值;
3)当i≠1,j=1时,使用像素Y(i-1,j)的重构值作为预测值;
所述重构值具体为:
在无损压缩时,像素的重构值为预测值与残差值的和;
在有损压缩时,像素的重构值为预测值与反量化后的残差值的和;
所述步骤三中除第一列和第一行外的像素进行自适应模式选择,选择出当前像素的预测值的具体过程为:
将与当前像素Y(i,j)相邻的像素Y(i,j-1)的重构值记为A,像素Y(i-1,j)的重构值记为B,像素Y(i-1,j-1)的重构值记为C,进行以下计算:
Z=|C-A|,
H=|C-B|
当H≤Z时,使用A作为当前像素的预测值;当Z<H时,使用B作为当前像素的预测值。
CN201710612059.XA 2017-07-25 2017-07-25 一种采用自适应模式选择的像素级两向帧内预测方法 Active CN107277508B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710612059.XA CN107277508B (zh) 2017-07-25 2017-07-25 一种采用自适应模式选择的像素级两向帧内预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710612059.XA CN107277508B (zh) 2017-07-25 2017-07-25 一种采用自适应模式选择的像素级两向帧内预测方法

Publications (2)

Publication Number Publication Date
CN107277508A CN107277508A (zh) 2017-10-20
CN107277508B true CN107277508B (zh) 2020-04-24

Family

ID=60078539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710612059.XA Active CN107277508B (zh) 2017-07-25 2017-07-25 一种采用自适应模式选择的像素级两向帧内预测方法

Country Status (1)

Country Link
CN (1) CN107277508B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101783957A (zh) * 2010-03-12 2010-07-21 清华大学 一种视频预测编码方法和装置
CN102742275A (zh) * 2010-06-15 2012-10-17 联发科技股份有限公司 用于视频编解码的自适应偏移装置及方法
CN103141091A (zh) * 2010-06-21 2013-06-05 汤姆逊许可公司 图像数据编码/解码的方法及其设备
CN103747250A (zh) * 2013-12-28 2014-04-23 华中科技大学 一种H.264/AVC中4x4子宏块的并行帧内预测方法
CN105516728A (zh) * 2015-12-15 2016-04-20 华中科技大学 一种H.265/HEVC中8x8子宏块的并行帧内预测方法
EP3280141A1 (en) * 2015-05-12 2018-02-07 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding image

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101783957A (zh) * 2010-03-12 2010-07-21 清华大学 一种视频预测编码方法和装置
CN102742275A (zh) * 2010-06-15 2012-10-17 联发科技股份有限公司 用于视频编解码的自适应偏移装置及方法
CN103141091A (zh) * 2010-06-21 2013-06-05 汤姆逊许可公司 图像数据编码/解码的方法及其设备
CN103747250A (zh) * 2013-12-28 2014-04-23 华中科技大学 一种H.264/AVC中4x4子宏块的并行帧内预测方法
EP3280141A1 (en) * 2015-05-12 2018-02-07 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding image
CN105516728A (zh) * 2015-12-15 2016-04-20 华中科技大学 一种H.265/HEVC中8x8子宏块的并行帧内预测方法

Also Published As

Publication number Publication date
CN107277508A (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
US20220353534A1 (en) Transform Kernel Selection and Entropy Coding
Liu et al. Neural video coding using multiscale motion compensation and spatiotemporal context model
TWI536811B (zh) 影像處理方法與系統、解碼方法、編碼器與解碼器
US10506249B2 (en) Segmentation-based parameterized motion models
US10051271B2 (en) Coding structure
US9544597B1 (en) Hybrid transform in video encoding and decoding
CN106170093B (zh) 一种帧内预测性能提升编码方法
CN100574447C (zh) 基于avs视频编码的快速帧间预测模式选择方法
US10681374B2 (en) Diversified motion using multiple global motion models
CN112465698A (zh) 一种图像处理方法和装置
WO2020180449A1 (en) Method and device for picture encoding and decoding
CN101291436B (zh) 视频编/解码方法和视频编/解码装置
CN106961610A (zh) 结合超分辨率重建的超高清视频新型压缩框架
US10021398B2 (en) Adaptive tile data size coding for video and image compression
CN103957420A (zh) 一种h.2***估计编码的全面运动估计改进算法
WO2019036080A1 (en) ESTIMATION OF CONSTRAINED MOTION FIELD FOR INTERPRETING
US10225573B1 (en) Video coding using parameterized motion models
CN112001854A (zh) 一种编码图像的修复方法及相关***和装置
CN106878754A (zh) 一种3d视频深度图像帧内预测模式选择方法
CN107277508B (zh) 一种采用自适应模式选择的像素级两向帧内预测方法
CN111212288B (zh) 视频数据的编解码方法、装置、计算机设备和存储介质
CN102333220A (zh) 一种选择在变换域完成预测编码的视频编解码方法
CN103856780A (zh) 视频编码方法、解码方法、编码器及解码器
Li et al. You Can Mask More For Extremely Low-Bitrate Image Compression
CN101437160A (zh) 用来解码视频信号的方法及相关装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210806

Address after: Room 162, 1f, building 5, No. 8, Dongbeiwang West Road, Haidian District, Beijing 100089

Patentee after: FOUNDATION STONE KULIAN MICROELECTRONIC TECHNOLOGY (BEIJING) Co.,Ltd.

Address before: 150001 No. 92 West straight street, Nangang District, Heilongjiang, Harbin

Patentee before: HARBIN INSTITUTE OF TECHNOLOGY