CN104202612B - 基于四叉树约束的编码单元的划分方法及视频编码方法 - Google Patents

基于四叉树约束的编码单元的划分方法及视频编码方法 Download PDF

Info

Publication number
CN104202612B
CN104202612B CN201410151037.4A CN201410151037A CN104202612B CN 104202612 B CN104202612 B CN 104202612B CN 201410151037 A CN201410151037 A CN 201410151037A CN 104202612 B CN104202612 B CN 104202612B
Authority
CN
China
Prior art keywords
coding unit
division
viewpoint
unit
maximum coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410151037.4A
Other languages
English (en)
Other versions
CN104202612A (zh
Inventor
金欣
迟广晟
王兴政
戴琼海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Tsinghua University
Original Assignee
Shenzhen Graduate School Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Tsinghua University filed Critical Shenzhen Graduate School Tsinghua University
Priority to CN201410151037.4A priority Critical patent/CN104202612B/zh
Publication of CN104202612A publication Critical patent/CN104202612A/zh
Application granted granted Critical
Publication of CN104202612B publication Critical patent/CN104202612B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于四叉树约束的编码单元的划分方法及视频编码方法。编码单元的划分方法包括步骤:输入两个以上视点视频纹理图像和深度图像序列;记录各独立视点的最大编码单元的划分层次信息;获取最大编码单元中各个存储单元在独立视点中的匹配单元;得到最大编码单元对应的子分块的初步划分层次图;利用四叉树约束条件对初步划分层次图进行校正;输出当前编码视点各最大编码单元的划分。视频编码方法中对编码单元的划分采用上述划分方法。本发明利用独立视点的编码单元的划分信息来帮助非独立视点进行编码单元的划分,并利用四叉树约束条件对编码单元划分层次图进行校正,避免了现有的复杂算法,加速了整个编码单元划分的过程,提高了效率。

Description

基于四叉树约束的编码单元的划分方法及视频编码方法
技术领域
本发明涉及视频编码技术,尤其涉及一种基于四叉树约束的多视点视频编码单元的快速划分方法,以及使用该方法的多视点视频编码方法。
背景技术
随着对支持3D视频格式(如“多视点视频”和“多视点视频+深度图”格式)的编码标准的要求越来越强烈,ITU-T VCEG(Video Coding Experts Group)和ISO/IEC MPEG(Moving Pictures Experts Group)组成了JCT-3V(Joint Collaborative Team on 3DVideo coding development)来一起研发3D视频的编码标准。在目前的标准中,基于新一代视频标准HEVC(High Efficiency Video Coding)的3D视频编码标准由于其采用了更复杂的编码工具和利用视点间相关性进行编码,获得了更好的性能。
在新的HEVC标准中,编码层采用的是不同以往宏块(MB)的编码单元,而是新的编码单元(CU,Coding Units)和编码树结构(CTU,Coding Tree Units)。与其它的3D视频编码标准相比,3D-HEVC提供了更高的压缩效率和性能,但也带来了很高的编码复杂度。其主要原因是由于编码层采用了递归的四叉树结构:将每个编码单元划分成四个子编码单元,其大小从最大编码单元(LCU)的64×64到最小编码单元的8×8,并对每种尺寸的CU进行帧内、帧间及视点间运动估计和率失真优化。其中以划分层次信息来表示CTU的四叉树结构:当CU的划分信息值为0时,最大编码单元被划分为64x64的CU;当CU的划分信息值为1时,最大编码单元被划分为32x32的CU;当CU的划分信息值为2时,最大编码单元被划分为16x16的CU;当CU的划分信息值为3时,最大编码单元被划分为8x8的CU。目前的HTM平台上采用的是穷尽迭代法,将一个最大编码单元从64x64的CU经过三层四叉树结构到8x8的CU,划分过程计算复杂度很大,限制了其在实时场景中的应用。
发明内容
为克服上述现有技术的缺陷,本发明提供一种基于四叉树结构的编码单元的划分方法及视频编码方法,加速了编码单元划分的过程,大大提高了效率。
为达到上述目的,本发明采用以下技术方案:
本发明公开了一种基于四叉树约束的编码单元的划分方法,包括以下步骤:A1:输入两个以上视点视频纹理图像和深度图像序列;A2:编码独立视点纹理图像,记录各独立视点的最大编码单元的划分层次信息;A3:获取待编码的非独立视点纹理图像的最大编码单元中各个存储单元在所述各独立视点中的匹配单元;A4:根据步骤A2所述的所述划分层次信息得到当前待编码的非独立视点纹理图像的最大编码单元对应的子分块的初步划分层次图;A5:利用四叉树约束条件对所述初步划分层次图进行校正;A6:输出当前编码视点各最大编码单元的划分。
进一步地,所述步骤A2中,所述各最大编码单元的划分信息为四叉树单元结构的分层信息k,k的取值为0、1、2或3。
更进一步地,所述步骤A2中,所述划分信息是以各最大编码单元内信息的存储单元为单位记录的。
更进一步地,所述步骤A3具体包括:对各待编码的非独立视点纹理图像的最大编码单元中各个存储单元,根据当前编码视点的深度信息图来计算视差向量,得到当前最大编码单元中各个存储单元在独立视点中对应的匹配;其中,对当前最大编码单元中的每一个存储单元都计算一个视差向量。
更进一步地,所述步骤A4中,当前待编码的非独立视点纹理图像中各待编码的最大编码单元对应的子分块的初步划分层次图是通过步骤A3中得到的各个存储单元的匹配单元的划分构成。
更进一步地,所述步骤A5中,利用四叉树约束条件对步骤A4中的得到的初步划分层次图进行校正,使其满足编码单元划分的四叉树结构。
更进一步地,所述编码单元的四叉树结构可由如下公式表示:
如果di,j=k,i,j=0,2,4,…14,
d'i',j'=k,
(i',j')≠(i,j) (1),
di,j为所述步骤A2中每个存储单元中左上角像素位置存储的当前编码单元划分层次信息,d'i',j'为当前编码单元划分层次信息中其它存储单元的深度值,k为四叉树单元结构的分层信息,其所满足的四叉树约束条件由公式(1)表示。
利用公式(1)的四叉树约束条件,对于得到的初步的层次划分图,自顶向下逐级校正其不满足四叉树结构的部分;依次类推,直到将独立视频内的匹配单元和当前最大编码单元划分到标准中允许的最小编码单元为止。
更进一步地,所述计算视差向量可采用HEVC标准中所列方法。
更进一步地,所述HEVC标准中所列方法包括基于已编码深度图像的视差向量估计方法、基于已编码视差向量和运动向量的视差向量估计方法、基于相邻块视差向量的估计方法和基于不同视点已编码的深度图计算的方法。
本发明还公开了一种基于四叉树约束的视频编码方法,该编码方法中对编码单元的划分采用如上述任一项所述的划分方法。
本发明的有益效果是:本发明利用视点间纹理的相关性,利用独立视点的编码单元的划分信息来帮助非独立视点进行编码单元的划分。当编码非独立视点时,利用已编码的同一时刻的独立视点的编码单元划分层次信息来帮助当前编码的非独立视点编码单元的划分,在计算上省略了穷尽迭代的非独立视点的编码单元划分法,取而代之的是统计非独立视点中当前最大编码单元中各个存储单元对应到独立视点中最大编码单元位置内的各个存储单元中编码单元的划分层次信息,初步得到非独立视点编码单元划分的层次图,并利用四叉树结构约束条件对其进行校正,从而避免了现有算法中对每种编码单元划分模式的计算,以及对相应的RDCost的计算,加速了整个编码单元划分的过程,提高了效率。与此同时,相比于其它快速算法,本发明所提供的算法不需要进行复杂的运算,只需根据四叉树约束条件进行校正,本发明所提供的算法引入的平均负载只有0.0187%,并且节省了平均59.4%的编码时间。
附图说明
图1是本发明一个实施例的编码单元的划分方法流程图;
图2是本发明一个实例中待编码的非独立视点中最大编码单元的初步划分层次图;
图3是利用四叉树约束条件校正图2中的初步划分层次图所得到的待编码的非独立视点最大编码单元的划分层次图。
具体实施方式
通过研究视点间纹理的相关性,可通过利用独立视点中的最大编码单元的划分层次信息,来判定当前待编码的非独立视点的最大编码单元对应子分块的划分方法。因为,相邻视点之间基线较短,相邻视点中的内容相同,其在不同视点中的划分有很大的相似性,从而可以初步得到非独立视点中最大编码单元中各子分块的划分,同时四叉树条件约束对初步得到的划分进行校正,使其可以直接用于指导非独立视点最大编码单元的划分,而无须经过复杂的计算,对整个编码器引入的负载可忽略不计,可在保证编码质量的前提下,大大降低编码过程运算的复杂度。
下面对照附图和结合优选具体实施方式对本发明进行详细的阐述。下面的实施过程中所述的具体方法都仅为举例说明,本发明所涵盖的范围不局限于所列举的这些方法。
如图1所示是本发明一个实施例的编码单元的划分方法流程图,其主要包括如下步骤:
A1:输入两个以上视点视频纹理图像和深度图像序列。输入的多视点立体视频序列为:通过摄像机、照相机采集所得,或者通过计算机工具所得的视频序列,数据格式不限,该序列可用于立体观看。
A2:编码独立视点纹理图像,记录各最大编码单元的划分信息。当编码独立视点纹理图像时,记录独立视点内每一帧的各最大编码单元的划分信息。其中划分信息是以各最大编码单元内信息的存储单元为单位记录的,且该划分信息为四叉树单元结构的分层信息k,k的取值为0、1、2或3。
A3:获取待编码的非独立视点纹理图像的最大编码单元中各个存储单元在各独立视点中的匹配单元。根据当前编码视点的深度信息图的深度信息来计算其相对独立视点的视差向量,得到当前待编码的非独立视点的最大编码单元中各个存储单元在独立视点中对应的匹配单元,例如:可以计算当前待编码的非独立视点的最大编码单元中各个存储单元的任一像素位置所对应到独立视点中的位置,根据其位置信息找到其对应在独立视点中对应的存储单元,如在HEVC中:利用当前待编码的非独立视点的最大编码单元中各个存储单元(如4×4的存储单元)左上角像素的信息,通过视差向量得到其在独立视点中对应的位置,此位置右方和下方各4个像素位置所对应的4×4的编码单元即为这里所说的匹配单元。其中,较佳的做法是对当前待编码的非独立视点的最大编码单元中的每个存储单元都重新计算一个视差向量,因为视频中不同区域内容不同,深度值也不同,对于每一个待编码的非独立视点的最大编码单元都重新计算一个视差向量使得该视差向量对当前编码单元更准确。具体视差向量的计算过程可采取基于已编码的深度图来计算视差向量,但不限于此,任何能够算出视差向量的计算方法均可采用,譬如,基于已编码深度图像的视差向量估计方法、基于已编码视差向量和运动向量的视差向量估计方法、基于相邻块视差向量的估计方法和基于不同视点已编码的深度图计算的方法等在HEVC标准中所列出的多种视差向量计算方法。
A4:得到当前待编码的非独立视点纹理图像中各待编码的最大编码单元对应的子分块的初步划分层次图。
当前待编码的非独立视点纹理图像中各待编码的最大编码单元对应的子分块的初步划分层次图是通过步骤A3中得到的各个存储单元的匹配单元的划分构成,但此初步得到的划分层次图不一定满足编码单元划分的四叉树结构。
例如:在HEVC标准中,最大编码单元为64×64,其存储单元大小为4×4,划分层次信息为0、1、2、3,可利用步骤A3中的视差向量得到当前待编码的非独立视点纹理图像中各待编码的最大编码单元对应的子分块的初步划分层次图如图2所示,其中图中所标示出的加粗框部分为不满足四叉树约束条件部分,如左上角加粗矩形框中的值应为2。
A5:利用四叉树约束条件对步骤A4中得到的初步划分层次图进行校正,其中四叉树约束条件的四叉树结构可由如下公式(1)表示:
如果di,j=k,i,j=0,2,4,…14,
d'i',j'=k,
(i',j')≠(i,j) (1),
di,j为所述步骤A2中每个存储单元中左上角像素位置存储的当前编码单元划分层次信息,d'i',j'为当前编码单元划分层次信息中其它存储单元的深度值,k为四叉树单元结构的分层信息,其所满足的四叉树约束条件由公式(1)表示。
利用公式(1)自顶向下,逐级对图2所示的初步划分层次图进行四叉树约束条件校正,经校正后得到待编码的非独立视点最大编码单元的划分层次图,如图3所示,校正后的划分层次图满足四叉树约束条件。
A6:反复执行步骤A4和A5,直至按需要停止(譬如已达当前帧最后一个最大编码单元)为止。
A7:最后,输出当前编码视点各最大编码单元的划分。
本发明一个实施例的基于四叉树约束的视频编码方法,对编码单元的划分采用如上所述的编码单元的划分方法,而其它编码步骤可采用现有技术的做法。利用本发明的多视点视频编码方法,能够明显提高自由视点视频编码中非独立视点的编码速度,避免迭代划分判定编码单元,大幅降低了自由视点视频编码的计算复杂度,加速了整个编码单元划分的过程,提高了效率。与此同时,相比于其它快速算法,本发明所提供的算法不需要进行复杂的运算,只需根据四叉树约束条件进行校正,本发明所提供的算法引入的平均负载只有0.0187%,并且节省了平均59.4%的编码时间。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的技术人员来说,在不脱离本发明构思的前提下,还可以做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明的保护范围。

Claims (7)

1.一种基于四叉树约束的编码单元的划分方法,其特征在于,包括以下步骤:
A1:输入两个以上视点视频纹理图像和深度图像序列;
A2:编码独立视点纹理图像,记录各独立视点的最大编码单元的划分层次信息;
A3:根据当前编码视点的深度信息图的深度信息来计算其相对独立视点的视差向量,得到当前待编码的非独立视点纹理图像的最大编码单元中各个存储单元在所述各独立视点中的匹配单元;
A4:根据步骤A2所述的所述划分层次信息得到当前待编码的非独立视点纹理图像的最大编码单元对应的子分块的初步划分层次图,其中所述初步划分层次图是通过步骤A3中得到的各个存储单元的匹配单元的划分构成;
A5:利用四叉树约束条件对步骤A4中的得到的所述初步划分层次图进行校正,使其满足编码单元划分的四叉树结构;
A6:输出当前编码视点各最大编码单元的划分。
2.如权利要求1所述的划分方法,其特征在于,所述步骤A2中,所述各最大编码单元的划分信息为四叉树单元结构的分层信息k,k的取值为0、1、2或3。
3.如权利要求1所述的划分方法,其特征在于,所述步骤A2中,所述划分信息是以各最大编码单元内信息的存储单元为单位记录的。
4.如权利要求1所述的划分方法,其特征在于,所述步骤A3具体包括:对各待编码的非独立视点纹理图像的最大编码单元中各个存储单元,根据当前编码视点的深度信息图来计算视差向量,得到当前最大编码单元中各个存储单元在独立视点中对应的匹配;其中,对当前最大编码单元中的每一个存储单元都计算一个视差向量。
5.如权利要求4所述的划分方法,其特征在于,所述计算视差向量可采用HEVC标准中所列方法。
6.如权利要求5所述的划分方法,其特征在于,所述HEVC标准中所列方法包括基于已编码深度图像的视差向量估计方法、基于已编码视差向量和运动向量的视差向量估计方法、基于相邻块视差向量的估计方法和基于不同视点已编码的深度图计算的方法。
7.一种基于四叉树约束的视频编码方法,其特征在于,该编码方法中对编码单元的划分采用如权利要求1至6任一项所述的划分方法。
CN201410151037.4A 2014-04-15 2014-04-15 基于四叉树约束的编码单元的划分方法及视频编码方法 Active CN104202612B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410151037.4A CN104202612B (zh) 2014-04-15 2014-04-15 基于四叉树约束的编码单元的划分方法及视频编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410151037.4A CN104202612B (zh) 2014-04-15 2014-04-15 基于四叉树约束的编码单元的划分方法及视频编码方法

Publications (2)

Publication Number Publication Date
CN104202612A CN104202612A (zh) 2014-12-10
CN104202612B true CN104202612B (zh) 2018-11-02

Family

ID=52087828

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410151037.4A Active CN104202612B (zh) 2014-04-15 2014-04-15 基于四叉树约束的编码单元的划分方法及视频编码方法

Country Status (1)

Country Link
CN (1) CN104202612B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101603414B1 (ko) * 2014-03-28 2016-03-15 경희대학교 산학협력단 깊이 정보를 이용한 비디오 부호화 장치 및 그 방법
KR101603413B1 (ko) * 2014-03-28 2016-03-28 경희대학교 산학협력단 깊이 정보를 이용한 비디오 부호화 방법 및 장치
WO2016192054A1 (zh) * 2015-06-03 2016-12-08 富士通株式会社 使用预测信息的图像编码方法、装置以及图像处理设备
CN106954057B (zh) * 2017-02-27 2018-08-28 华侨大学 一种基于视点间相关性的3d-hevc帧间预测快速模式选择方法
CN107071418B (zh) * 2017-05-05 2020-03-17 上海应用技术大学 一种基于决策树的hevc帧内编码单元快速划分方法
CN107295336B (zh) * 2017-06-21 2019-10-29 鄂尔多斯应用技术学院 基于图像相关性的自适应快速编码单元划分方法及装置
WO2019113903A1 (zh) * 2017-12-14 2019-06-20 北京金山云网络技术有限公司 一种编码单元划分决策方法、装置、编码器及存储介质
CN112040245B (zh) * 2019-06-04 2023-07-21 万维数码有限公司 用于帧内编码深度图多层表示的***和方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120236934A1 (en) * 2011-03-18 2012-09-20 Qualcomm Incorporated Signaling of multiview video plus depth content with a block-level 4-component structure
CN103108187B (zh) * 2013-02-25 2016-09-28 清华大学 一种三维视频的编码方法、解码方法、编码器和解码器
CN103414891B (zh) * 2013-07-19 2016-08-10 北京交通大学 一种hevc帧内编码的自底向上快速四叉树裁剪算法
CN103428499B (zh) * 2013-08-23 2016-08-17 清华大学深圳研究生院 编码单元的划分方法及使用该方法的多视点视频编码方法

Also Published As

Publication number Publication date
CN104202612A (zh) 2014-12-10

Similar Documents

Publication Publication Date Title
CN104202612B (zh) 基于四叉树约束的编码单元的划分方法及视频编码方法
CN103428499B (zh) 编码单元的划分方法及使用该方法的多视点视频编码方法
WO2016000538A1 (zh) 视频编码的运动矢量列表构建方法和***
CN103503460B (zh) 译码视频数据的方法和设备
CN103703777B (zh) 对具有深度范围变化的运动深度图进行译码
CN104378643B (zh) 一种3d视频深度图像帧内预测模式选择方法及***
CN104396250B (zh) 用于3d视频译码的深度图的帧内译码的方法和装置
CN100496121C (zh) 一种交互式多视点视频***的图像信号处理方法
CN104521236B (zh) 三维视频编码或解码方法
CN105612747B (zh) 用于深度帧内译码的楔波样式扩展
CN104412597B (zh) 用于3d视频编码的统一视差矢量推导的方法及装置
CN105191317B (zh) 视图内以及跨越视图的深度查找表的预测性译码
CN105874788B (zh) 对3d视频译码中较大预测块的逐段dc译码的简化
US20130271565A1 (en) View synthesis based on asymmetric texture and depth resolutions
CN104125469B (zh) 一种用于hevc的快速编码方法
CN109863748A (zh) 用于对图像进行编码或解码的设备和方法
CN105814896A (zh) 3d视频译码中的大型块和深度建模模式(dmm)
JP2016537869A (ja) マルチビュービデオコーディングにおいて、ビュー合成予測方法及びこれを利用したマージ候補リスト構成方法
CN102801995B (zh) 一种基于模板匹配的多视点视频运动和视差矢量预测方法
Gu et al. Fast bi-partition mode selection for 3D HEVC depth intra coding
CN105393541A (zh) 使用基于深度的块分割编解码纹理块的方法和装置
CN104412587A (zh) 三维视频编码中视图间候选获取的方法和设备
CN102685532A (zh) 自由视点四维空间视频编码***的编码方法
JP2015525997A5 (zh)
CN100581265C (zh) 一种多视点视频的处理方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant