CN113596444A - 360度视频帧内预测模式决策方法 - Google Patents

360度视频帧内预测模式决策方法 Download PDF

Info

Publication number
CN113596444A
CN113596444A CN202110738504.3A CN202110738504A CN113596444A CN 113596444 A CN113596444 A CN 113596444A CN 202110738504 A CN202110738504 A CN 202110738504A CN 113596444 A CN113596444 A CN 113596444A
Authority
CN
China
Prior art keywords
mode
prediction unit
value
absolute
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110738504.3A
Other languages
English (en)
Other versions
CN113596444B (zh
Inventor
艾达
王易檀
胥策
艾宇
张晓阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Posts and Telecommunications
Original Assignee
Xian University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Posts and Telecommunications filed Critical Xian University of Posts and Telecommunications
Publication of CN113596444A publication Critical patent/CN113596444A/zh
Application granted granted Critical
Publication of CN113596444B publication Critical patent/CN113596444B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种360度视频帧内预测模式决策方法,由构建大尺寸预测单元模式决策方法、构建小尺寸预测单元模式决策方法步骤组成。构建大尺寸预测单元模式决策方法包括构建第一阶段的粗略模式决策方法、构建第二阶段的粗略模式决策方法、用于率失真优化的模式确定、确定最优模式步骤,构建小尺寸预测单元模式决策方法包括确定粗略模式决策的模式集合、确定用于率失真优化的模式步骤、确定最优模式步骤。预测单元PU尺寸分为两种大小,并且对不同尺寸PU根据其特点进行模式的预筛选,有效地减少了将粗略模式决策与率失真优化RDO过程所遍历的模式数目,实现了预测单元PU最优预测模式的快速决策。

Description

360度视频帧内预测模式决策方法
技术领域
本发明属于视频编码技术领域,具体涉及到360度视频帧内预测模式决策。
背景技术
360度视频作为一种虚拟现实技术,在沉浸式影院、VR游戏、社交媒体、电视广播与远程教育等得到了广泛应用。360度视频的分辨率一般为4K、6K或8K,视频的帧分辨率通常为60帧每秒,有时甚至高达90帧每秒,因此高质量的360度视频每秒就可以消耗数千兆的带宽。如何有效地提高编码速度是促进360度视频技术发展的关键因素。联合图像专家组、运动图像专家组以及联合视频研究组等组织正在对360度视频进行了深入的研究,以确定统一的编码标准。
360度视频的处理流程包括对360度视频的拼接处理、投影转换、编码、传输、解码、视频渲染、逆投影等过程。其中,投影转换方式是决定360度视频编码效率的关键因素,常用的投影方式有等矩形投影,它直观易生成但在极点附近会发生过采样,导致较大的形状失真和编码比特浪费。立方体投影将球面投影至立方体表面,并以灵活的方式排列,排列方式不同可导致压缩效率不同。相较于等矩形投影,立方体投影提高了运动估计和运动补偿的效率,但仍存在过采样问题,与原球面相比,过采样率高达190%。除此之外还有等角立方体投影、八面体投影、球面分割投影、旋转的球面投影、赤道圆柱投影、二十面体投影等11种投影方式。不同的投影方式以不同采样密度对球体的不同区域进行采样,且无论使用哪种投影方式都会带来一定程度的画面失真。目前大多数360度视频编码优化研究都是结合高效视频编码进行的。为了提高360度视频编码的性能,目前有许多工作从投影方式、编码框架以及帧内编码算法等方面提出了许多优化方法,用来提高360度视频编码的质量和效率。
360度视频的高分辨率使帧内编码中的CU划分和模式决策过程比传统视频具有更高的编码复杂度,耗费更多的编码时间,因此对其帧内编码算法优化是一项重要的研究工作。
与传统视频相比,经过投影后的360度视频都会产生一定程度的变形失真,这将导致编码器在帧的不同区域展现出不同的编码性能。而且360度视频的高分辨率会使得帧内编码中模式决策过程耗费大量的编码时间。
发明内容
本发明索要解决的技术问题在于克服上述现有技术的缺点,提供一种编码复杂度低、编码时间短的360度视频帧内预测模式决策方法。
解决上述技术问题所采用的技术方案是由下述步骤组成:
(1)构建大尺寸预测单元模式决策方法
预测单元PU尺寸为64×64、32×32,对当前预测单元PU采用两阶段的粗略模式决策方法:
1)构建第一阶段的粗略模式决策方法
选择8种预测模式0、1、2、10、18、26、30、34用于第一阶段的粗略模式决策,按下式确定8种预测模式的哈达码变换的绝对值和SATD:
Figure BDA0003142362690000021
其中H为归一化的N×N阶哈达玛矩阵,N为矩阵的大小,N取值为4或8,X为预测模式对应的预测残差矩阵,大小与H相同,p表示HXH的行,q表示HXH的列。
从8种预测模式的绝对值和SATD中选出最小的两种模式,分别称为第一模式FM1、第二模式SM1
2)构建第二阶段的粗略模式决策方法
按下式构建用于第二阶段粗略模式决策RMD的模式集合M:
Figure BDA0003142362690000022
用模式集合M进行第二阶段的粗略模式决策。
3)将候选模式集合M按照式(1)确定4个哈达码变换的绝对值和SATD,并选择哈达码变换的绝对值和SATD最小的两种模式FM1和SM1用下式构建用于率失真优化RDO的模式集合MR
Figure BDA0003142362690000023
4)确定最优模式
将最可能模式MPM加入到模式集MR中,按式(2)确定率失真代价RDcost,找出代价值最小的模式即为最优模式。
RDcost=Smode+λ×B'mode (2)
其中,Smode表示预测单元PU原始像素块与重构块之间的残差平方和,λ为编码系数,B’mode表示该预测单元PU帧内编码所耗费的比特数。
(2)构建小尺寸预测单元模式决策方法
预测单元PU的尺寸为16×16、8×8、4×4,用像素绝对偏差方法对预测单元PU纹理方向进行初步分析,得到所匹配的角度模式,将该角度模式以及与其相邻的角度模式、模式0、模式1组成用于粗略模式决策的模式,比较其中各模式的哈达码变换的绝对值和SATD,得到自适应模式筛选结果,并与最可能模式MPM组成用于率失真优化的模式,通过率失真优化方法按式(2)确定率失真代价值RDcost,选择最优模式。
在本发明的(2)步骤中,所述的构建用于粗略模式决策的模式的方法为:
确定粗略模式决策的模式集合如下:
用像素绝对偏差方法确定当前预测单元PU中所有像素点在8个纹理方向上的像素绝对偏差值ADP,8个预测方向的像素绝对偏差值ADP分别用水平绝对偏差值AHor、垂直绝对偏差值AVer、左下对角线绝对偏差值ADDL、左上对角线绝对偏差值ADUL、水平偏上绝对偏差值AH_U、水平偏下绝对偏差值AH_D、垂直偏左绝对偏差值AV_L、垂直偏右绝对偏差值AV_R表示。
(1)按下式确定水平绝对偏差值AHor
Figure BDA0003142362690000031
Figure BDA0003142362690000032
其中N为当前预测单元PU的尺寸,N取值为8,P(n,j)表示预测单元PU内第n行j列的像素值,MHor(n)表示第n行像素值的均值。
(2)按下式确定垂直绝对偏差值AVer
Figure BDA0003142362690000033
Figure BDA0003142362690000034
其中P(i,n)表示预测单元PU内第i行n列的像素值,Mver(n)表示预测单元PU块第n列像素平均值。
(3)按下式确定左下对角线绝对偏差值ADDL
Figure BDA0003142362690000041
Figure BDA0003142362690000042
其中P(i,j)表示预测单元PU内第i行j列的像素值,i∈[o,1,···,N-1],j∈[o,1,···,N-1],MDDL(n)表示延左下对角线方向第n行像素值的均值。
(4)对左上对角线绝对偏差值ADUL计算只需将预测单元PU向左旋转90°按式(5)确定。
(5)对水平偏上绝对偏差值AH_U、水平偏下绝对偏差值AH_D计算,根据它们所对应的模式与水平方向所对应的模式间的角度偏移值,将预测单元PU向左或向右旋转13°后按式(4)确定。
(6)对垂直偏左绝对偏差值AV_L、垂直偏右绝对偏差值AV_R计算,根据它们所对应的模式与垂直方向所对应的模式间的角度偏移值,将当前预测单元PU向左或向右旋转13°后按式(3)确定。
将16×16预测单元PU、4×4预测单元PU采用最邻近插值法缩放处理为8×8大小的预测单元PU,按照8×8大小的预测单元PU在各个方向上像素绝对偏差值ADP的方法进行计算。
将最小像素绝对偏差值ADPmin所对应的模式称作可能模式PM,可能模式PM与最小像素绝对偏差值ADPmin的对应关系如下式所示:
Figure BDA0003142362690000043
根据预测单元PU的可能模式PM构建用于粗略模式决策的候选模式集合MS,选取可能模式PM以及与可能模式PM左右相邻的6种模式和0模式、1模式共同构成用于粗略模式决策的模式集合MS
Figure BDA0003142362690000051
在本发明的(2)步骤中,所述的用于率失真优化的模式为:
将候选模式集合MS按照式(1)确定8个哈达码变换的绝对值和SATD,16×16的预测单元PU中选取值最小的2种模式,8×8、4×4的预测单元中选取值最小的3种模式。
在本发明的(2)步骤中,所述的确定最优模式为:
将最可能模式集MPMS加入到率失真优化的模式中,按式(2)确定率失真代价RDcost,找出代价值最小的模式即为最优模式。
本发明采用了预测单元PU尺寸与预测模式以及纹理特征间的相关性,提出将预测单元PU尺寸分为两种类别并使用不同的模式决策方法,对大尺寸预测单元PU使用概率统计分析方法,选取模式占比较高的8种模式用于第一阶段粗略模式决策,根据第一阶段粗略模式决策筛选出的哈达码变换的绝对值值最小的两种模式构建用于第二阶段粗略模式决策的模式集;对小尺寸预测单元PU采用纹理方向分析的方法,根据8个主要纹理方向将35种预测模式分为8组,并使用所提的ADP方法实现当前预测单元PU在8个主要纹理方向的模式匹配,选取ADP值最小的纹理方向所对应的模式分组进入粗略模式决策过程,结合MPM和RDO方法完成最优预测模式的选择。所提算法可减少粗略模式决策以及RDO所遍历的模式数目,实现预测单元PU快速模式决策,从而降低时间损耗。
本发明对基于CMP的360度视频的纹理特征进行分析,考虑进帧内编码过程中,对模式决策部分做出改进,降低编码复杂度,节省编码时间。
本发明具有以下有益效果:
本发明充分考虑CMP格式的360度视频的纹理特征,对帧内编码过程进行改进,能够在降低编码复杂度的同时保证编码效率。
预测单元PU尺寸分为两种大小,并且对不同尺寸PU根据其特点进行模式的预筛选,有效地减少了将粗略模式决策与率失真优化RDO过程所遍历的模式数目,实现了预测单元PU最优预测模式的快速决策。
对于联合视频开发组织所提的18个360度视频测试序列的编码结果,所提方法平均编码时间减少了26.4%,BDBR平均增长0.551%,BDWS-PSNR减少了0.07db,WS-PSNR降低0.0153db。优化效果比现有优化技术有明显的提升。
附图说明
图1是本发明实施例1的流程图。
具体实施方式
下面结合附图和实施例对本发明进一步详细说明,但本发明不限于下述的实施方式。
实施例1
本实施例的360度视频帧内预测模式决策方法由下述步骤组成(参见图1):
(1)构建大尺寸预测单元模式决策方法
预测单元PU尺寸为64×64、32×32,对当前预测单元PU采用两阶段的粗略模式决策方法:
1)构建第一阶段的粗略模式决策方法
选择8种预测模式0、1、2、10、18、26、30、34用于第一阶段的粗略模式决策,按下式确定8种预测模式的哈达码变换的绝对值和SATD:
Figure BDA0003142362690000061
其中H为归一化的N×N阶哈德玛矩阵,N为矩阵的大小,本实施例N取值为4,X为预测模式对应的预测残差矩阵,大小为N,q表示HXH的行,p表示HXH的列。
从8种预测模式的哈达玛变换的绝对值和SATD中选出最小的两种模式,分别称为第一模式和第二模式FM1、SM1
2)构建第二阶段的粗略模式决策方法
按下式构建用于第二阶段粗略模式决策RMD的模式集合M:
Figure BDA0003142362690000071
用模式集合M进行第二阶段的粗略模式决策。
3)将候选模式集合M按照式(1)确定4个哈达码变换的绝对值和SATD,并选择哈达玛变换的绝对值和SATD最小的两种模式FM1和SM1用下式构建用于率失真优化RDO的模式集合MR
Figure BDA0003142362690000072
4)确定最优模式
将最可能模式集MPM加入到模式集MR中,按式(2)确定率失真代价RDcost,找出代价值最小的模式即为最优模式。
RDcost=Smode+λ×B'mode (2)
其中,Smode表示预测单元PU原始像素块与重构块之间的残差平方和,λ为编码系数,B’mode表示该预测单元PU帧内编码所耗费的比特数。
(2)构建小尺寸预测单元模式决策方法
预测单元PU的尺寸为16×16、8×8、4×4,用像素绝对偏差方法对预测单元PU纹理方向进行初步分析,得到所匹配的角度模式,将该角度模式以及与其相邻的角度模式、模式0、模式1组成用于粗略模式决策的模式,比较其中各模式的哈达码变换的绝对值,得到自适应模式筛选结果,并与最可能模式MPM组成用于率失真优化的模式,通过率失真优化方法按式(2)确定率失真代价值RDcost,选择最优模式。
所述的构建用于粗略模式决策的模式的方法为:
确定粗略模式决策的模式集合如下:
用像素绝对偏差方法确定当前预测单元PU中所有像素点在8个纹理方向上的像素绝对偏差值ADP,8个预测方向的像素绝对偏差值ADP分别用水平绝对偏差值AHor、垂直绝对偏差值AVer、左下对角线绝对偏差值ADDL、左上对角线绝对偏差值ADUL、水平偏上绝对偏差值AH_U、水平偏下绝对偏差值AH_D、垂直偏左绝对偏差值AV_L、垂直偏右绝对偏差值AV_R表示。
1)按下式确定水平绝对偏差值AHor
Figure BDA0003142362690000081
Figure BDA0003142362690000082
其中N为当前预测单元PU的尺寸,N取值为8,P(n,j)表示预测单元PU内第n行j列的像素值,MHor(n)表示第n行像素值的均值。
2)按下式确定垂直绝对偏差值AVer
Figure BDA0003142362690000083
Figure BDA0003142362690000084
其中P(i,n)表示预测单元PU内第i行n列的像素值,Mver(n)表示预测单元PU块第n列像素平均值。
3)按下式确定左下对角线绝对偏差值ADDL
Figure BDA0003142362690000085
Figure BDA0003142362690000086
其中P(i,j)表示预测单元PU内第i行j列的像素值,i∈[o,1,···,N-1],j∈[o,1,···,N-1],本实施例的N取值为8,MDDL(n)表示延左下对角线方向第n行像素值的均值。
4)对左上对角线绝对偏差值ADUL计算只需将预测单元PU向左旋转90°按式(5)确定。
5)对水平偏上绝对偏差值AH_U、水平偏下绝对偏差值AH_D计算,根据它们所对应的模式与水平方向所对应的模式间的角度偏移值,将预测单元PU向左或向右旋转13°后按式(4)确定。
6)对垂直偏左绝对偏差值AV_L、垂直偏右绝对偏差值AV_R计算,根据它们所对应的模式与垂直方向所对应的模式间的角度偏移值,将当前预测单元PU向左或向右旋转13°后按式(3)确定。
将16×16预测单元PU、4×4预测单元PU采用最邻近插值法缩放处理为8×8大小的预测单元PU,按照8×8大小的预测单元PU在各个方向上像素绝对偏差值ADP的计算方法进行计算。
将最小像素绝对偏差值ADPmin所对应的模式称作可能模式PM,可能模式PM与最小像素绝对偏差值ADPmin的对应关系如下式所示:
Figure BDA0003142362690000091
根据预测单元PU的可能模式PM构建用于粗略模式决策的候选模式集合MS,选取可能模式PM以及与可能模式PM左右相邻的6种模式和0模式、1模式共同构成用于粗略模式决策的模式集合MS
Figure BDA0003142362690000092
所述的用于率失真优化的模式为:将候选模式集合MS按照式(1)确定8个哈达码变换的绝对值和SATD,16×16的预测单元PU中选取值最小的2种模式,8×8、4×4的预测单元中选取值最小的3种模式。
所述的确定最优模式为:将最可能模式集MPM(已在《新一代高效效视频编码H.265/HEVC原理、标准与实现》中公开)加入到率失真优化的模式中,按式(2)确定率失真代价RDcost,找出代价值最小的模式即为最优模式。
完成360度视频帧内预测模式决策方法。
实施例2
本实施例的360度视频帧内预测模式决策方法由下述步骤组成:
(1)构建大尺寸预测单元模式决策方法
选择8种预测模式0、1、2、10、18、26、30、34用于第一阶段的粗略模式决策,按下式确定8种预测模式的哈达码变换的绝对值和SATD:
Figure BDA0003142362690000101
其中H为归一化的N×N阶哈达玛矩阵,N为矩阵的大小,本实施例的N取值为8,X为预测模式对应的预测残差矩阵,大小为N,q表示HXH的行,p表示HXH的列。
从8种预测模式的哈达玛变换的绝对值和SATD中选出最小的两种模式,分别称为第一模式和第二模式FM1、第二模式SM1
该步骤的其它步骤与实施例1实施例相同。
其它步骤与实施例1实施例相同,完成360度视频帧内预测模式决策方法。
为了验证本发明本发明额的有益效果,发明人采用本发明实施例1的360度视频帧内预测模式决策方法与现有的标准360度视频编码算法HM16.16-360Lib4.0(简称对比试验方法)进行了对比仿真实验,实验情况如下:
实验在HM16.16-360Lib4.0的基础上进行仿真实验,硬件平台为Intel(R)Core(TM)i7-6820HK [email protected],4核处理器,内存为16GB,显卡为GeForce GTX 980M,操作***为64位Win10旗舰版。编译调试软件为Visual Studio 2017,配置参数为全I帧编码模式,QP设置为{22,27,32,37}。实验使用JVET提供的包含A(4K)、B(6K)以及C(8K)三种不同分辨率的16个标准360度视频序列,如表所示。
表1实验所用视频序列
Figure BDA0003142362690000102
本发明与对比试验方法的对比实验结果见表2,在表2中,WS-PSNR表示加权球形均匀峰值信噪比,用于评价球面视频的客观质量,BDBR表示在WS-PSNR相同的条件下,两种不同算法的码率变化情况,BDWS-PSNR表示在码率相同的条件下,本发明方法与对比试验方法的WS-PSNR的差异,ΔT表示本发明方法相对于对比试验方法节省的平均时间百分比,计算公式如下:
Figure BDA0003142362690000111
其中,TimeHM(i)为对比试验方法在第i个量化参数下的编码时间,Timeprop(i)为本发明方法在第i个量化参数下的编码时间。ΔWS-PSNR为本发明方法相对于对比试验方法在编码比特率相同的情况下,视频质量的变化量,计算公式如下:
Figure BDA0003142362690000112
其中,WS-PSNRHM(i)为对比试验方法在第i个量化参数下编码重建视频的视频质量,WS-PSNRprop(i)为本发明方法在第i个量化参数下编码重建视频的视频质量。
表2本算法与HM16.16-360Lib4.0的性能对比
Figure BDA0003142362690000113
Figure BDA0003142362690000121
表2的实验结果表明,相较于对比试验方法,本发明平均编码时间减少了26.4%,BDBR平均增长0.551%,BDW-SPSNR减少了0.07db,ΔWS-PSNR降低0.0153db,所带来的编码性能损耗可忽略不计。对于不同类型的视频序列,本发明方法都可有效地降低编码时间,提高编码效率,同时保证视频质量。本发明方法适用于不同的测试序列,优化效果明显,具有良好的理论意义及应用价值。

Claims (4)

1.一种360度视频帧内预测模式决策方法,其特征在于由下述步骤组成:
(1)构建大尺寸预测单元模式决策方法
预测单元PU尺寸为64×64、32×32,对当前预测单元PU采用两阶段的粗略模式决策方法:
1)构建第一阶段的粗略模式决策方法
选择8种预测模式0、1、2、10、18、26、30、34用于第一阶段的粗略模式决策,按下式确定8种预测模式的哈达码变换的绝对值和SATD:
Figure FDA0003142362680000011
其中H为归一化的N×N阶哈达玛矩阵,N为矩阵的大小,N取值为4或8,X为预测模式对应的预测残差矩阵,大小与H相同,p表示HXH的行,q表示HXH的列;
从8种预测模式的绝对值和SATD中选出最小的两种模式,分别称为第一模式FM1、第二模式SM1
2)构建第二阶段的粗略模式决策方法
按下式构建用于第二阶段粗略模式决策RMD的模式集合M:
Figure FDA0003142362680000012
用模式集合M进行第二阶段的粗略模式决策;
3)将候选模式集合M按照式(1)确定4个哈达码变换的绝对值和SATD,并选择哈达码变换的绝对值和SATD最小的两种模式FM1和SM1用下式构建用于率失真优化RDO的模式集合MR
Figure FDA0003142362680000013
4)确定最优模式
将最可能模式MPM加入到模式集MR中,按式(2)确定率失真代价RDcost,找出代价值最小的模式即为最优模式:
RDcost=Smode+λ×B'mode (2)
其中,Smode表示预测单元PU原始像素块与重构块之间的残差平方和,λ为编码系数,B’mode表示该预测单元PU帧内编码所耗费的比特数;
(2)构建小尺寸预测单元模式决策方法
预测单元PU的尺寸为16×16、8×8、4×4,用像素绝对偏差方法对预测单元PU纹理方向进行初步分析,得到所匹配的角度模式,将该角度模式以及与其相邻的角度模式、模式0、模式1组成用于粗略模式决策的模式,比较其中各模式的哈达码变换的绝对值和SATD,得到自适应模式筛选结果,并与最可能模式MPM组成用于率失真优化的模式,通过率失真优化方法按式(2)确定率失真代价值RDcost,选择最优模式。
2.根据权利要求1所述的360度视频帧内预测模式决策方法,其特征在于在(2)步骤中,所述的构建用于粗略模式决策的模式的方法为:
确定粗略模式决策的模式集合如下:
用像素绝对偏差方法确定当前预测单元PU中所有像素点在8个纹理方向上的像素绝对偏差值ADP,8个预测方向的像素绝对偏差值ADP分别用水平绝对偏差值AHor、垂直绝对偏差值AVer、左下对角线绝对偏差值ADDL、左上对角线绝对偏差值ADUL、水平偏上绝对偏差值AH_U、水平偏下绝对偏差值AH_D、垂直偏左绝对偏差值AV_L、垂直偏右绝对偏差值AV_R表示;
(1)按下式确定水平绝对偏差值AHor
Figure FDA0003142362680000021
Figure FDA0003142362680000022
其中N为当前预测单元PU的尺寸,N取值为8,P(n,j)表示预测单元PU内第n行j列的像素值,MHor(n)表示第n行像素值的均值;
(2)按下式确定垂直绝对偏差值AVer
Figure FDA0003142362680000023
Figure FDA0003142362680000031
其中P(i,n)表示预测单元PU内第i行n列的像素值,Mver(n)表示预测单元PU块第n列像素平均值;
(3)按下式确定左下对角线绝对偏差值ADDL
Figure FDA0003142362680000032
Figure FDA0003142362680000033
其中P(i,j)表示预测单元PU内第i行j列的像素值,i∈[o,1,…,N-1],j∈[o,1,…,N-1],MDDL(n)表示延左下对角线方向第n行像素值的均值;
(4)对左上对角线绝对偏差值ADUL计算只需将预测单元PU向左旋转90°按式(5)确定;
(5)对水平偏上绝对偏差值AH_U、水平偏下绝对偏差值AH_D计算,根据它们所对应的模式与水平方向所对应的模式间的角度偏移值,将预测单元PU向左或向右旋转13°后按式(4)确定;
(6)对垂直偏左绝对偏差值AV_L、垂直偏右绝对偏差值AV_R计算,根据它们所对应的模式与垂直方向所对应的模式间的角度偏移值,将当前预测单元PU向左或向右旋转13°后按式(3)确定;
将16×16预测单元PU、4×4预测单元PU采用最邻近插值法缩放处理为8×8大小的预测单元PU,按照8×8大小的预测单元PU在各个方向上像素绝对偏差值ADP的计算方法进行计算;
将最小像素绝对偏差值ADPmin所对应的模式称作可能模式PM,可能模式PM与最小像素绝对偏差值ADPmin的对应关系如下式所示:
Figure FDA0003142362680000034
根据预测单元PU的可能模式PM构建用于粗略模式决策的候选模式集合MS,选取可能模式PM以及与可能模式PM左右相邻的6种模式和0模式、1模式共同构成用于粗略模式决策的模式集合MS
Figure FDA0003142362680000041
3.根据权利要求1所述的360度视频帧内预测模式决策方法,其特征在于在(2)步骤中,所述的用于率失真优化的模式为:
将候选模式集合MS按照式(1)确定8个哈达码变换的绝对值和SATD,16×16的预测单元PU中选取值最小的2种模式,8×8、4×4的预测单元中选取值最小的3种模式。
4.根据权利要求1所述的360度视频帧内预测模式决策方法,其特征在于在(2)步骤中,所述的确定最优模式为:
将最可能模式集MPMS加入到率失真优化的模式中,按式(2)确定率失真代价RDcost,找出代价值最小的模式即为最优模式。
CN202110738504.3A 2021-05-19 2021-06-30 360度视频帧内预测模式决策方法 Active CN113596444B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2021105447350 2021-05-19
CN202110544735 2021-05-19

Publications (2)

Publication Number Publication Date
CN113596444A true CN113596444A (zh) 2021-11-02
CN113596444B CN113596444B (zh) 2022-07-19

Family

ID=78245189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110738504.3A Active CN113596444B (zh) 2021-05-19 2021-06-30 360度视频帧内预测模式决策方法

Country Status (1)

Country Link
CN (1) CN113596444B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018010492A1 (zh) * 2016-07-12 2018-01-18 北京大学深圳研究生院 视频编码中帧内预测模式的快速决策方法
KR20180039883A (ko) * 2016-10-11 2018-04-19 인하대학교 산학협력단 Hevc 인코더의 인트라 예측 속도 향상을 위한 영상 특성 기반의 블록 후보 조기 결정 방법
CN109068142A (zh) * 2018-09-06 2018-12-21 北方工业大学 基于纹理特征的360度视频帧内预测快速决策
CN109246430A (zh) * 2018-09-06 2019-01-18 北方工业大学 虚拟现实360度视频快速帧内预测和cu划分提前决策
CN109905712A (zh) * 2019-01-09 2019-06-18 西安邮电大学 基于ResNet的HEVC帧内编码快速模式决策算法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018010492A1 (zh) * 2016-07-12 2018-01-18 北京大学深圳研究生院 视频编码中帧内预测模式的快速决策方法
KR20180039883A (ko) * 2016-10-11 2018-04-19 인하대학교 산학협력단 Hevc 인코더의 인트라 예측 속도 향상을 위한 영상 특성 기반의 블록 후보 조기 결정 방법
CN109068142A (zh) * 2018-09-06 2018-12-21 北方工业大学 基于纹理特征的360度视频帧内预测快速决策
CN109246430A (zh) * 2018-09-06 2019-01-18 北方工业大学 虚拟现实360度视频快速帧内预测和cu划分提前决策
CN109905712A (zh) * 2019-01-09 2019-06-18 西安邮电大学 基于ResNet的HEVC帧内编码快速模式决策算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SIK-HO TSANG,YUI-LAM CHAN: "360-Degree Intra Coding Mode for Equirectangular Projection Format Videos", 《2020 IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS (ISCAS)》 *
艾达 等: "用于虚拟现实的360度视频编码技术新进展", 《计算机应用研究》 *

Also Published As

Publication number Publication date
CN113596444B (zh) 2022-07-19

Similar Documents

Publication Publication Date Title
Guo et al. Causal contextual prediction for learned image compression
US6148109A (en) Image predictive coding method
KR100667808B1 (ko) 영상의 인트라 예측 부호화, 복호화 방법 및 장치
KR100739714B1 (ko) 인트라 예측 모드 결정 방법 및 장치
JP4763422B2 (ja) イントラ予測装置
JP5503747B2 (ja) 画像符号化装置、画像復号装置、画像符号化方法及び画像復号方法
KR100716999B1 (ko) 영상의 대칭성을 이용한 인트라 예측 방법, 이를 이용한영상의 복호화, 부호화 방법 및 장치
US7327786B2 (en) Method for improving rate-distortion performance of a video compression system through parallel coefficient cancellation in the transform
US20160345025A1 (en) Method and apparatus for encoding/decoding images using a prediction method adopting in-loop filtering
US20100166073A1 (en) Multiple-Candidate Motion Estimation With Advanced Spatial Filtering of Differential Motion Vectors
CN1589576A (zh) 使用较大像素格栅运动补偿的降低复杂性视频解码
CN109068142B (zh) 360度视频帧内预测快速决策方法、装置、编解码器和介质
CN1925619B (zh) 视频编码和解码的装置和方法
US20060193527A1 (en) System and methods of mode determination for video compression
US20120076207A1 (en) Multiple-candidate motion estimation with advanced spatial filtering of differential motion vectors
KR20130045150A (ko) 영상 복호화 방법 및 장치
WO2011110088A1 (zh) 一种视频预测编码方法和装置
WO2012081162A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法及び動画像復号方法
CN107864380A (zh) 基于dct的3d‑hevc快速帧内预测决策方法
CN112188196A (zh) 一种基于纹理的通用视频编码帧内快速预测的方法
CN113596444B (zh) 360度视频帧内预测模式决策方法
Zhou et al. Fast sample adaptive offset algorithm for 360-degree video coding
Gao et al. A fast intra prediction mode decision algorithm for HEVC intra coding of 4K ultra-HD video
Jiwani Least square intra-prediction mode prediction based video compression
Žádník et al. Performance of texture compression algorithms in low-latency computer vision tasks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant