CN106464908A - 用于传输深度图像的预测模式以供层间视频编码和解码的方法和装置 - Google Patents

用于传输深度图像的预测模式以供层间视频编码和解码的方法和装置 Download PDF

Info

Publication number
CN106464908A
CN106464908A CN201580033274.3A CN201580033274A CN106464908A CN 106464908 A CN106464908 A CN 106464908A CN 201580033274 A CN201580033274 A CN 201580033274A CN 106464908 A CN106464908 A CN 106464908A
Authority
CN
China
Prior art keywords
mark
image
depth image
coding
depth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201580033274.3A
Other languages
English (en)
Inventor
李振荣
朴慜佑
曺容振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN106464908A publication Critical patent/CN106464908A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据实施方式的层间视频解码方法包括:从比特流中获取深度图像的当前块的预测模式信息;基于预测模式信息生成当前块的预测块;以及通过使用预测块对深度图像进行解码。从比特流中获取当前块的预测模式包括:接收第一标记、第二标记和第三标记,其中,第一标记表明是否准许通过根据图案将当前块分成两个或更多分区来进行当前块的预测,第二标记表明深度图像是否准许通过使用楔波将深度图像的块分成两个或更多分区来预测该块,以及第三标记表明深度图像是否准许通过使用轮廓将深度图像的块分成两个或更多分区来预测该块;以及在基于第一标记、第二标记和第三标记确定的预定条件得到满足时从比特流中接收第四标记,其中第四标记表示与根据图案将当前块分成两个或更多分区的方法的类型有关的信息。

Description

用于传输深度图像的预测模式以供层间视频编码和解码的方 法和装置
技术领域
本公开涉及层间视频编码和解码方法,更具体地,涉及对深度图像的预测模式进行编码和解码的方法。
背景技术
立体视觉图像是指提供与空间的深度和形状有关的信息以及与图像有关的信息的三维(3D)图像。立体图像将不同视角的图像提供到左眼和右眼。相比之下,每当观察者改变视角时,立体视觉图像都会提供在不同方向上看到的图像。因此,生成立体视觉图像需要从多个视角拍摄的图像。
从各个视角拍摄以生成立体视觉图像的图像数据量很大。因此,如果立体视觉图像考虑到网络基础设施、地波带宽等,那么即使使用针对单视点视频编码(诸如,MPEG-2、H.264/AVC、HEVC等)优化的编码设备对图像进行压缩,也几乎不可能实现立体视觉图像。
因此,需要经优化以生成立体视觉图像的多视点(多层)视频编码设备。具体而言,需要有效减少时间与视角之间的冗余的技术。
例如,根据多视点视频编解码器,从基本视角拍摄的图像可采用单视点视频压缩进行压缩,并且在图像展开时参考该基本视角进行编码,从而提高压缩比。此外,诸如深度图像等辅助数据可另外编码,以便生成具有比图像解码侧输入的视角更多的视角的图像。此处,深度图像用来从中间视角合成图像,而不是直接给用户观看。当深度图像劣化时,合成图像的质量较低。因此,在多视点视频编解码器中,不仅多视点视频应被高效压缩,而且深度图像也应被高效压缩。
本发明的详细描述
有益效果
在根据实施方式的层间视频解码和编码的设备和方法中,深度图像的预测模式可被高效编码或解码,以降低装置复杂性并且在图像合成时高效生成图像。
本公开的技术方面和技术效果不限于上述描述,并且本领域普通技术人员从以下描述中将明白并容易了解其他方面。
附图说明
图1a是根据实施方式的层间视频编码设备的框图。
图1b是根据实施方式的视频编码方法的流程图。
图2a是根据实施方式的层间视频解码设备的框图。
图2b是根据实施方式的视频解码方法的流程图。
图3示出根据实施方式的层间预测方案。
图4a示出根据实施方式的SPS 3D扩展句构。
图4b示出两种类型的DMM预测模式。
图5示出根据实施方式的coding_unit句构。
图6示出用于接收DMM参数的intra_mode_ext句构。
图7是根据实施方式的基于根据树形结构的编码单元的视频编码设备的框图。
图8是根据实施方式的基于根据树形结构的编码单元的视频解码设备的框图。
图9是用于描述根据本公开的实施方式的编码单元的概念的示意图。
图10是根据本公开的实施方式的基于编码单元的图像编码器的框图。
图11是根据本公开的实施方式的基于编码单元的图像解码器的框图。
图12示出根据本公开的实施方式的根据深度和分区的编码单元。
图13示出根据本公开的实施方式的编码单元与变换单元之间的关系。
图14示出根据实施方式的根据深度的多项编码信息。
图15示出根据本公开的实施方式的根据深度的编码单元。
图16、图17和图18示出根据本公开的实施方式的编码单元、预测单元与变换单元之间的关系。
图19示出根据表1的编码模式信息的编码单元、预测单元与变换单元之间的关系。
图20是根据实施方式的存储有程序的磁盘的物理结构的示意图。
图21是用于通过使用磁盘来记录和读取程序的磁盘驱动器的示意图。
图22是用于提供内容分发服务的内容供应***的整体结构的示意图。
图23和图24分别是根据实施方式的应用本公开的视频编码方法和视频解码方法的移动电话的外部结构和内部结构的示意图。
图25是应用根据本公开的通信***的数字广播***的示意图。
图26示出根据本公开的实施方式的使用视频编码设备和视频解码设备的云计算***的网络结构。
发明内容
根据一方面,层间视频解码方法包括:从比特流中获取深度图像的当前块的预测模式信息;基于预测模式信息生成当前块的预测块;以及通过使用预测块对深度图像进行解码。从比特流中获取当前块的预测模式信息包括:接收第一标记、第二标记和第三标记;以及在基于第一标记到第三标记确定的预定条件得到满足时从比特流中接收第四标记,其中,第一标记表明是否准许通过根据图案将当前块分成两个或更多分区来进行当前块的预测,第二标记表明深度图像是否准许通过使用楔波将深度图像的块分成两个或更多分区来预测该块,第三标记表明深度图像是否准许通过使用轮廓将深度图像的块分成两个或更多分区来预测该块,以及第四标记表示与根据图案将当前块分成两个或更多分区的方法的类型有关的信息。
第二标记可还表明深度图像是否准许使用帧内简化深度编码(SDC)模式来预测深度图像的块。
第四标记可限定通过使用楔波将当前块分成两个或更多分区来预测当前块的方法,或者通过使用轮廓将当前块分成两个或更多分区来预测当前块的方法。
当深度图像不准许参考与深度图像的块对应的纹理图像时,第三标记可表示深度图像不准许通过使用轮廓将深度图像的块分成两个或更多分区来预测该块的方法。
获取深度图像的当前块的预测模式信息可包括:当第一标记表明准许通过根据图案将当前块分成两个或更多分区来预测当前块的方法,第二标记表明深度图像准许通过使用楔波将深度图像的块分成两个或更多分区来预测该块的方法,以及第三标记表明深度图像准许通过使用轮廓将深度图像的块分成两个或更多分区来预测该块的方法时,确定预定条件得到满足。
在获取深度图像的当前块的预测模式信息期间,当预定条件未被满足,第二标记表明深度图像准许通过使用楔波将深度图像的块分成两个或更多分区来预测该块的方法,以及第三标记表明深度图像不准许通过使用轮廓将深度图像的块分成两个或更多分区来该块的方法时,可确定通过使用楔波将当前块分成两个或更多分区来预测当前块;以及当预定条件未被满足,第二标记表明深度图像不准许通过使用楔波将深度图像的块分成两个或更多分区来预测该块的方法,以及第三标记表明深度图像准许通过使用轮廓将深度图像的块分成两个或更多分区来预测该块的方法时,可确定通过使用轮廓将当前块分成两个或更多分区来预测当前块。
根据另一方面,层间视频编码方法包括:确定深度图像的当前块的预测模式;通过使用确定的预测模式来生成当前块的预测块;以及通过使用预测块对深度图像进行编码来生成比特流。当前块的预测模式的确定包括:生成第一标记、第二标记和第三标记,其中第一标记表明是否准许通过根据图案将当前块分成两个或更多分区来进行当前块的预测,第二标记表明深度图像是否准许通过使用楔波将深度图像的块分成两个或更多分区来预测该块,以及第三标记表明深度图像是否准许通过使用轮廓将深度图像的块分成两个或更多分区来预测该块;以及在基于第一标记、第二标记和第三标记确定的预定条件得到满足时生成第四标记,其中第四标记表示与根据图案将当前块分成两个或更多分区的方法的类型有关的信息。
根据另一方面,层间视频解码设备包括:预测模式确定器,其被配置成从比特流中获取深度图像的当前块的预测模式信息;预测块生成器,其被配置成基于预测模式信息来生成当前块的预测块;以及解码器,其被配置成通过使用预测块来对深度图像进行解码。预测模式确定器接收第一标记、第二标记和第三标记,并且在基于第一到第三标记确定的预定条件得到满足时从比特流中接收第四标记,其中,第一标记表明是否准许通过根据图案将当前块分成两个或更多分区来进行当前块的预测,第二标记表明深度图像是否准许通过使用楔波将深度图像的块分成两个或更多分区来预测该块,第三标记表明深度图像是否准许通过使用轮廓将深度图像的块分成两个或更多分区来预测该块,以及第四标记表示与根据图案将当前块分成两个或更多分区的方法的类型有关的信息。
根据另一方面,层间视频编码设备包括:预测模式确定器,其被配置成确定深度图像的当前块的预测模式;预测块生成器,其被配置成通过使用确定的预测模式来生成当前块的预测块;以及编码器,其被配置成通过使用预测块对深度图像进行编码来生成比特流。预测模式确定器生成第一标记、第二标记和第三标记,并且在基于第一标记、第二标记和第三标记确定的预定条件得到满足时生成第四标记,其中,第一标记表明是否准许通过根据图案将当前块分成两个或更多分区来进行当前块的预测,第二标记表明深度图像是否准许通过使用楔波将深度图像的块分成两个或更多分区来预测该块,第三标记表明深度图像是否准许通过使用轮廓将深度图像的块分成两个或更多分区来预测该块,以及第四标记表示与根据图案将当前块分成两个或更多分区的方法的类型有关的信息。
根据另一方面,提供了一种计算机可读记录介质,该计算机可读记录介质存储有程序,该程序用于在计算机上执行层间视频解码方法或层间视频编码方法。
具体实施方式
在下文中,将参考图1a到图6提供针对根据实施方式的层间视频解码和编码的设备和方法来预测深度图像的方法。
此外,将参考图7到图19描述根据适用于层间视频编码和解码技术的实施方式的基于具有树形结构的编码单元的视频编码技术和视频解码技术。此外,将参考图20到图26描述适用于视频编码方法和视频解码方法的实施方式。
在下文中,‘图像’可指代静态图像或视频的移动图像,或者视频本身。
在下文中,‘样本’指代分配到图像的采样位置并且将进行处理的数据。例如,空间域的图像中的像素可以是样本。
在下文中,术语‘当前块’可被理解为将要编码或解码的深度图像的单元块。
首先,下文将参考图1a到图6描述根据实施方式的预测深度图像的方法和针对层间视频解码和编码的设备和方法传输预测模式的方法。
图1a是根据实施方式的层间视频编码设备10的框图。图1b是根据实施方式的视频编码方法的流程图。
根据实施方式的层间视频编码设备10可包括预测模式确定器12、预测块生成器14、残余数据生成器16以及编码器18。根据实施方式的层间视频编码设备10可进一步包括中央处理单元(CPU)(未示出),所述CPU被配置成控制预测模式确定器12、预测块生成器14、残余数据生成器16和编码器18的整体操作。或者,预测模式确定器12、预测块生成器14、残余数据生成器16和编码器18可由它们的处理器(未示出)单独操作。当处理器彼此结合操作时,层间视频编码设备10可整体操作。或者,预测模式确定器12、预测块生成器14、残余数据生成器16和编码器18可在层间视频编码设备10的外部处理器(未示出)的控制下受到控制。
层间视频编码设备10可包括至少一个数据存储单元(未示出),所述数据存储单元被配置成存储输入到预测模式确定器12、预测块生成器14、残余数据生成器16和编码器18的数据或者从这些部件输出的数据。层间视频编码设备10可包括存储器控制器(未示出),所述存储器控制器对数据到至少一个数据存储单元的输入和对数据从至少一个数据存储单元的输出进行控制。
为了输出视频编码结果,层间视频编码设备10可与其中安装的视频编码处理器或外部视频编码处理器一起操作,因而执行包括变换在内的视频编码操作。安装在层间视频编码设备10中的视频编码处理器可以是单独处理器,并且执行视频编码操作。或者,层间视频编码设备10、CPU或图形操作装置可包括视频编码处理模块,并且执行基本视频编码操作。
根据实施方式的层间视频编码设备10可根据层而将多个图像序列分类,并且可根据可伸缩视频编码方案对图像序列中的每个进行编码,而且可输出包括根据层进行编码的数据的单独流。层间视频编码设备10可将第一层图像序列和第二层图像序列编码到不同层。
例如,根据基于空间可伸缩性的可伸缩视频编码方法,低分辨率图像可编码为第一层图像,并且高分辨率图像可编码为第二层图像。第一层图像的编码结果可输出为第一层流,并且第二层图像的编码结果可输出为第二层流。
作为另一示例,多视点视频可根据可伸缩视频编码方案进行编码。就这点而言,中部视点图像可编码为第一层图像,并且左视点图像和右视点图像可编码为参考第一层图像的第二层图像。或者,当层间视频编码设备10允许包括第一层、第二层、第三层等的三个或更多层时,中部视点图像可编码为第一层图像、左视点图像可编码为第二层图像,并且右视点图像可编码为第三层图像。然而,本公开未必限于此,并且中部视点图像、左视点图像和右视点图像进行编码的层以及将要参考的层可改变。
作为另一示例,可根据基于时间可伸缩性的时间分层预测来执行可伸缩视频编码方法。可输出第一层流,所述第一层流包括通过对基本帧率图像进行编码而生成的编码信息。时间层次可根据帧率进行分类,并且每个时间层次可根据层进行编码。通过参考基本帧率图像来对高帧率图像进一步编码,可输出第二层流,所述第二层流包括高帧率的编码信息。
此外,可伸缩视频编码可在第一层和多个第二层上执行。当存在至少三个第二层时,可对第一层图像和第一个第二层图像、第二个第二层图像、……、第K个第二层图像进行编码。因此,第一层图像的编码结果可输出为第一层流,并且第一个、第二个、……、第K个第二层图像的编码结果可分别输出为第一个、第二个、……、第K个第二层流。
根据实施方式的层间视频编码设备10可执行帧间预测,其中参考单个层的图像以预测当前图像。通过执行帧间预测,可生成表明当前图像与参考图像之间的运动信息的运动向量,以及当前图像与参考图像之间的残余分量。
此外,层间视频编码设备10可执行层间预测,其中通过参考第一层图像来预测第二层图像。
此外,当根据实施方式的层间视频编码设备10允许至少三个层,即,第一、第二和第三层时,可根据多层预测结构来执行第一层图像与第三层图像之间的层间预测,以及第二层图像与第三层图像之间的层间预测。
在层间预测中,可生成当前图像与不同层的参考图像之间的位移分量,以及当前图像与不同层的参考图像之间的残余分量。
下文将参考图3来描述层间预测方案。
根据实施方式的层间视频编码设备10可根据层而执行根据视频的每个图像的块的编码。块可具有正方形形状、矩形形状或任意几何形状,并且不限于具有预定尺寸的数据单元。在根据树形结构的编码单元之中,所述块可以是最大编码单元、编码单元、预测单元或变换单元。包括树形结构的编码单元的最大编码单元可有不同的称谓,诸如,编码树单元、编码块树、块树、根块树、编码树、编码根或树干。下文将参考图7到图19描述基于根据树形结构的编码单元的视频编码和解码方法。
当根据实施方式的层间视频编码设备10对多视点视频图像进行编码时,诸如深度图像等辅助数据可另外编码,以便从比图像解码侧输入的视角更多的视角生成图像。此处,深度图像用来合成中间视角图像,而不是直接给用户观看。因此,合成图像的质量可受到深度图像是否劣化的影响。
深度图像的深度值的变化程度在对象的边界附近较大,并且在对象或背景区域的内部相对较小。因此,将对象的、深度图的深度值之间差异较大所在的边界处出现的误差最小化可与将合成图像的误差最小化直接相关。此外,可减少深度值的变化程度较小的、对象或背景区域内部的数据量,以提高对深度图像进行编码的效率。
因此,层间视频编码设备10可通过使用诸如DC模式、平面模式或角模式等帧内预测模式对深度图像的当前块进行编码。此外,层间视频编码设备10可通过使用诸如深度建模模式(DMM)、简化深度编码(SDC)模式或者链编码模式(CCD)等预测模式对深度图像进行编码。层间视频编码设备10可以以层为单位生成标记,所述标记含有表明是否将使用如上文所述的预测模式的信息。
层间视频编码设备10可基于预测模式生成预测块,并且生成所生成的预测块与将要编码的当前块之间的差分数据,即,残余数据。
使用预测模式生成的所有残余数据可不进行编码,或者残余数据中只有一些残余数据可进行编码。根据实施方式的层间视频编码设备10可对残余数据的平均值进行编码。
根据实施方式的层间视频编码设备10可计算将要编码的块的DC值(下文称为平均值),并且通过将平均值映射到深度查找表来确定索引。此处,深度查找表是指深度图像可具有的深度值分别匹配到索引的表。
此外,层间视频编码设备10可只将通过将原始块的平均值映射到深度查找表而确定的索引与从根据预测块计算的平均值中计算出的索引之间的差异传输到解码设备。在这种情况下,索引之间的差异可被编码。
下文将参考图1b描述根据实施方式的层间视频编码设备10的操作。
在操作11中,预测模式确定器12可确定深度图像的当前块的预测模式。预测模式的示例可包括DC模式、平面模式、角模式、DMM以及SDC模式。
此处,DC模式是使用包装预测块的预测样本的方法的帧内预测模式,所述预测块具有当前块的参考邻近样本的平均值。
平面模式是通过下列[等式1]来计算参考样本的预测样本predSample[x],[y]的帧内预测模式(此处,x和y各自在0到nTbs-1的范围内)。
[等式1]
predSamples[x][y]=((nTbS-1-x)*p[-1][y]+(x+1)*
p[nTbS][-1]+(nTbS-1-y)*p[x][-1]+(y+1)*p[-1][nTbS]+nTbS)>>(Log2(nTbS)+1)
此处,nTbS表示预测块的水平尺寸或竖直尺寸。
角模式是使用参考样本通过在一个屏幕中考虑预测模式之中的模式2到模式34的方向性而确定预测样本的帧内预测模式。
DMM预测模式是通过深度建模模式技术来准确有效地表达深度图像的边界的方法。具体地,在DMM预测模式中,通过根据图案将当前块分成至少两个区域来预测当前块。可通过使用楔波(Wedgelet)和轮廓(Contour)将当前块分成至少两个区域,并且可计算至少两个区域中的每个区域的平均值。
DMM预测模式可包括DMM模式-1类型(也可称为DMM_WFULL模式或INTRA_DEP_WEDGE)和DMM模式-4类型(也可称为DMM_CPREDTEX模式或INTRA_DEP_CONTOUR)。DMM模式-1是楔波模式,其中层间视频编码设备10通过将各个边界线施加到当前块来将当前块分成两个区域,并且随后由最适当的边界线将当前块分成区域。在这种情况下,‘楔波’是指斜线。楔波分区是指由斜线从将进行预测编码的当前块中分出的两个或更多分区。
DMM模式-4是预测块根据当前块的纹理图案分成至少两个区域的模式,并且轮廓分区可使用对应纹理图像的块进行确定。在这种情况下,轮廓是指包括某一形状的曲线。轮廓分区是指通过使用轮廓线从将进行预测编码的当前块中分出的两个或更多分区。
下文将参考图4b更详细地描述DMM模式-1和DMM模式-4。
SDC预测模式是在基于对象和背景区域内部的深度值的变化程度较小而以DC形式对残余数据进行编码或不对其编码时所使用的模式。残余数据的DC分量是残余块的像素值,并且可被确定为残余块的所有或一些像素值的平均值。
SDC预测模式可包括SDC帧内预测模式和SDC帧间预测模式。例如,SDC帧内预测模式可包括DC模式、DMM模式-1、DMM模式-4和平面预测模式。层间视频编码设备10可通过使用SDC帧内预测模式中包括的代表性模式之中高度可能的代表性模式来预测和编码当前块。SDC帧间预测模式可包括某一预测模式,并且根据分区模式而改变。例如,只在分区模式为2N×2N时才可准许SDC帧间预测模式,而在分区模式为2N×N、N×2N、N×N等时可不准许SDC帧间预测模式。
预测模式确定器12可生成当前深度图像和标记,所述标记含有与当前深度图像的当前块的预测模式有关的信息。下文将参考图4到图6描述含有与预测模式有关的信息的标记。
在操作13中,预测块生成器14可基于确定的预测模式来生成当前块的预测块。
在操作15中,残余数据生成器16可生成残余数据,所述残余数据是当前块与预测块之间的差异。根据实施方式的残余数据生成器16可不将残余数据传输到编码器18,或者可计算残余数据中的全部或一些数据的平均值并将它传输到编码器18。
例如,残余数据生成器16可计算存在于残余块(即,当前块与预测块之间的差异)中的左上角像素、右上角像素、左下角像素和右下角像素的值的平均值,并且将它传输到编码器18。具体地,残余数据生成器16可计算预测块中的左上角和右上角像素以及左下角和右下角像素的值的加权和,而不是计算残余块中包括的像素的所有值的平均值。然而,本公开不限于此,并且残余块的平均值可根据每个像素的位置使用至少一个像素的值(例如,四个左上角像素和四个右上角像素的值)进行预测。
或者,残余数据生成器16可根据预测模式以不同方式计算残余块的平均值。例如,当使用DC模式或平面模式来预测所述预测块时,残余数据生成器16可根据残余块的左上角和右上角像素以及左下角和右下角像素的值来计算残余块的平均值,并且将它传输到编码器18。
当使用DMM预测模式来预测所述预测块时,残余数据生成器16可根据残余块的左上角和右上角像素以及左下角和右下角像素的值来预测从残余块中分出的每个区域的平均值。
作为另一示例,平均值计算器16可根据当前块的预测模式通过使用不同位置的像素的值来预测残余块的平均值。
作为另一示例,当使用角模式之中的水平方向预测模式或竖直方向预测模式来预测所述预测块时,残余数据生成器16可不将残余数据传输到编码器18。
层间视频编码设备10可生成含有与预测模式和残余数据有关的信息的比特流,以对深度图像进行编码。
图2a是根据实施方式的层间视频解码设备20的框图。
根据实施方式的层间视频解码设备20可包括解析器22(也称为预测模式解析器22或预测模式确定器22)、预测块生成器24、残余数据生成器26和解码器28。根据实施方式的层间视频解码设备20可进一步包括CPU(未示出),所述CPU控制解析器22、预测块生成器24、残余数据生成器26和解码器28的整体操作。或者,解析器22、预测块生成器24、残余数据生成器26和解码器28可由它们的处理器(未示出)操作,并且当处理器彼此结合操作时,层间视频解码设备20可整体操作。或者,解析器22、预测块生成器24、残余数据生成器26和解码器28可在根据实施方式的层间视频解码设备20的外部处理器(未示出)的控制下受到控制。
或者,根据实施方式的层间视频解码设备20可包括至少一个数据存储单元(未示出),所述数据存储单元被配置成存储输入到解析器22、预测块生成器24、残余数据生成器26和解码器28的数据或者从这些部件输出的数据。层间视频解码设备20可包括存储器控制器(未示出),所述存储器控制器被配置成控制数据到至少一个数据存储单元的输入和数据从至少一个数据存储单元的输出。
为了通过视频解码来重建视频,根据实施方式的层间视频解码设备20可通过与其中安装的视频解码处理器或外部视频解码处理器一起操作来执行包括逆变换在内的视频解码。安装在根据实施方式的层间视频解码设备20中的视频解码处理器可被理解为不仅包括单独的处理器,而且包括层间视频解码设备20中包括的视频解码处理模块、CPU,或者图形操作装置,以执行基本视频解码操作。
根据实施方式的层间视频解码设备20可根据可伸缩编码方案来接收根据层的比特流。层间视频解码设备20接收的比特流的层数量不受限制。
例如,基于空间可伸缩性的层间视频解码设备20可接收流,其中具有不同分辨率的图像序列在不同层中编码。第一层流可经过解码以重建具有低分辨率的图像序列,并且第二层流可经过编码以重建具有高分辨率的图像序列。
作为另一示例,多视点视频可根据可伸缩视频编码方案进行解码。当多个层中接收到立体视觉视频流时,第一层流可经过解码以重建左视点图像。第二层流可进一步进行解码以重建右视点图像。
或者,当多个层中接收到多视点视频流,第一层流可经过解码以重建中部视点图像。第二层流可进一步进行解码以重建左视点图像。第三层流可进一步进行解码以重建右视点图像。
作为另一示例,可执行基于时间可伸缩性的可伸缩视频编码方法。第一层流可经过解码以重建基本帧率图像。第二层流可进一步进行解码以重建高帧率图像。
此外,当存在至少三个第二层时,可由第一层流重建第一层图像,并且当通过参考第一层重建图像对第二层流进一步解码时,可进一步重建第二层图像。当通过参考第二层重建图像对第K层流进一步解码时,可进一步重建第K层图像。
层间视频解码设备20可从第一层流和第二层流中获取第一层图像和第二层图像的编码数据,此外,可进一步获取经由帧间预测生成的运动向量和经由层间预测生成的预测信息。
例如,层间视频解码设备20可对每层的帧间预测数据进行解码,并且可对多个层之间的层间预测数据进行解码。重建可基于编码单元或预测单元通过运动补偿和层间解码来执行。
图像可通过相对于每个层流参考经由相同层的帧间预测所预测出的重建图像针对当前图像执行运动补偿来重建。运动补偿是这样一种操作,其中通过合成使用当前图像的运动向量和当前图像的残余而确定的参考图像来重建当前图像的重建图像。
或者,层间视频解码设备20可通过参考第一层图像的预测信息来执行层间解码,以便对通过层间预测所预测到的第二层图像进行解码。层间解码是指通过使用其他层的参考块的预测信息来重建当前图像的预测信息,以便确定当前图像的预测信息。
根据实施方式的层间视频解码设备20可执行层间视频解码,以便重建通过参考第二层图像而预测出的第三层图像。将参考图3详细描述层间预测结构。
层间视频解码设备20根据视频的每个图像的块来执行解码。在根据树形结构的编码单元之中,块可以是最大编码单元、编码单元、预测单元或变换单元。下文将参考图7到图20来描述基于具有树形结构的编码单元的视频编码/解码方法。
当根据实施方式的层间视频解码设备20重建多视点视频图像时,诸如深度图像等辅助数据可另外进行解码,以便从比图像解码侧输入的视角更多的视角生成图像。此处,深度图像用来合成中间视角图像,而不是直接给用户观看。因此,合成图像的质量可根据深度图像是否劣化而受到影响。
深度图像的深度值的变化程度在对象的边界附近较大,并且在对象的内部相对较小。因此,将对象的、深度值之间差异较大所在的边界处出现的误差最小化可与将合成图像的误差最小化直接相关。此外,当深度图像的深度值的变化程度较小的、对象内部的数据量减少时,对深度图像进行解码的效率可增加。
层间视频解码设备20可通过使用诸如DC模式、平面模式或角模式等帧内预测模式对深度图像进行解码。或者,层间视频解码设备20可通过使用诸如DMM、SDC模式或CCD模式等预测模式对深度图像进行解码。上文已参考图1描述了DC模式、平面模式、或者角模式、DMM和SDC模式。
层间视频解码设备20可获取深度图像和标记,所述标记含有与深度图像的当前块的预测模式有关的信息(即,编码/解码单元)。根据实施方式的层间视频解码设备20可从含有常用参数信息的视频参数集网络提取层(VPS NAL)单元中接收含有与预测模式有关的信息的标记,以便对基础层和增强层的编码数据进行解码。在另一实施方式中,层间视频解码设备20可从序列参数集(SPS)NAL单元或图片参数集(PPS)NAL单元中接收含有与预测模式有关的信息的标记。
PPS是至少一个图片的参数集。例如,PPS是含有对至少一个图片的视频编码数据进行解码所常用的参数信息的参数集。PPS NAL单元是含有PPS的NAL单元。SPS是序列的参数集。序列是至少一个图片的集合。例如,SPS可包括对图片的编码数据进行编码所常用的参数信息,所述编码数据是通过参考至少一个PPS而编码的。
层间视频解码设备20可生成当前块的预测块,以便通过使用诸如DC模式、平面模式或角模式等帧内预测模式对深度图像进行解码。或者,层间视频解码设备20可通过使用DMM、SDC模式或CCD模式来生成当前块的预测块。或者,层间视频解码设备20可从比特流中接收所生成的预测块与将要编码的当前块之间的差分数据,即,残余数据。
或者,根据实施方式的层间视频解码设备20可计算预测块的DC值(下文称为平均值),并且通过将平均值映射到深度查找表来计算索引。或者,层间视频解码设备20可从比特流中接收对应于重建块的平均值的重建索引与对应于预测块的平均值的预测索引之间的差异。
下文将参考图2b详细描述根据实施方式的层间视频解码设备20的操作。
在操作21中,解析器22可从比特流中获取深度图像的预测模式信息。预测模式信息用来重建深度图像和当前块,并且可包括表明是否使用DC模式、平面模式、角模式、DMM或SDC模式的信息。
解析器22可解析含有操作21中的预测模式信息的标记。解析器22可从比特流中接收标记,所述标记表明深度图像是否准许通过使用DMM模式-1或DMM模式-4来进行深度图像的块的预测,并且表明将要解码的当前图像是否准许DMM预测模式。基于表明当前图像是否准许DMM预测模式的标记和表明深度图像是否准许通过使用DMM模式-1或DMM模式-4来进行深度图像的块的预测的标记,只在预定条件得到满足时,层间视频解码设备10可从比特流中另外接收表明与当前图像的DMM预测模式的类型有关的信息的标记,从而降低复杂性。下文将参考图4a到图6详细描述含有预测模式信息的标记。
在操作23中,预测块生成器24可基于获取的预测模式信息来生成当前块的预测块。
在操作25中,残余数据生成器26可从比特流中获取残余数据。然而,当预测模式是预定模式时,残余数据可不进行编码。
在操作27中,解码器28可通过使用预测块来对当前块和深度图像进行解码。
下文将参考图3描述可由根据实施方式的层间视频编码设备10执行的层间预测方案。
图3示出根据实施方式的层间预测方案。
根据实施方式的层间视频编码设备10可根据图3的多视点视频预测结构的播放顺序30对基本视点图像、左视点图像和右视点图像进行预测编码。
根据依据相关技术的多视点视频预测结构的播放顺序30,相同视点的图像布置在水平方向上。因此,由‘左’表示的左视点图像在水平方向上布置成行,由‘中部’表示的基本视点图像在水平方向上布置成行,并且由‘右’表示的右视点图像在水平方向上布置成行。与左/右视点图像相比,基本视点图像可以是中部视点图像。
此外,具有相同图片序列号(POC)顺序的图像布置在竖直方向上。图像的POC顺序表示形成视频的图像的播放顺序。多视点视频预测结构的播放顺序30中表示的‘POC X’表明对应列中的图像的相对播放顺序,其中在X的值较低时,播放顺序在前面,而当X的值较高时,播放顺序在后面。
因此,根据依据相关技术的多视点视频预测结构的播放顺序30,由‘左’表示的左视点图像根据POC顺序(播放顺序)布置在水平方向上,由‘中部’表示的基本视点图像根据POC顺序(播放顺序)布置在水平方向上,并且由‘右’表示的右视点图像根据POC顺序(播放顺序)布置在水平方向上。此外,与基本视点图像位于相同列上的左视点图像和右视点图像具有不同视点,但具有相同POC顺序(播放顺序)。
四个连续图像根据视点形成一个图片组(GOP)。每个GOP包括连续锚图片(anchorpicture)之间的图像和一个锚图片(关键图片)。
锚图片是随机访问点,并且当播放视频的同时从根据播放顺序(即,POC顺序)布置的图像中任意选择播放位置时,播放根据POC顺序最靠近播放位置的锚图片。基础层图像包括基础层锚图片31、32、33、34和35,左视点图像包括左视点锚图片131、132、133、134和135,并且右视点图像包括右视点锚图片231、232、233、234和235。
多视点图像可根据GOP顺序进行播放和预测(重建。)首先,根据多视点视频预测结构的播放顺序30,可播放GOP 0中包括的图像,随后根据视点,可播放GOP 1中包括的图像。换言之,可按GOP 0、GOP 1、GOP 2和GOP 3的顺序播放每个GOP中包括的图像。此外,根据多视点视频预测结构的编码顺序,可预测(重建)GOP 0中包括的图像,随后根据视点,可预测(重建)GOP 1中包括的图像。换言之,可按GOP 0、GOP 1、GOP 2和GOP 3的顺序预测(重建)每个GOP中包括的图像。
根据多视点视频预测结构的播放顺序30,在图像上执行视点间预测(层间预测)和帧间预测。在多视点视频预测结构中,箭头开始的图像是参考图像,并且箭头终止的图像是使用参考图像预测的图像。
基本视点图像的预测结果可进行编码,随后以基本视点图像流的形式输出,并且附加视点图像的预测结果可进行编码,随后以层比特流的形式输出。此外,左视点图像的预测编码结果可输出为第一层比特流,并且右视点图像的预测编码结果可输出为第二层比特流。
只在基本视点图像上执行帧间预测。换言之,I图片类型的基本层锚图片31、32、33、34和35没有参考其他图像,而B和b图片类型的其余图像是通过参考其他基本视点图像来预测的。B图片类型的图像是通过参考根据POC顺序在B图片类型的图像前面的I图片类型的锚图片和I图片类型的下一锚图片来预测的。b图片类型的图像是通过参考根据POC顺序在b图片类型的图像前面的I类型的锚图片和B图片类型的下一图像来预测的,或者通过参考根据POC顺序在b图片类型的图像前面的B图片类型的图像和下一I图片类型的锚图片来预测的。
在左视点图像和右视点图像中的每个图像上执行参考不同视点图像的视点间预测(层间预测)和参考相同视点图像的帧间预测。
通过分别参考具有相同POC顺序的基本视点锚图片31、32、33、34和35,可在左视点锚图片131、132、133、134和135上执行视点间预测(层间预测)。通过分别参考具有相同POC顺序的基本视点锚图片31、32、33、34和35或者左视点锚图片131、132、133、134和135,可在右视点锚图片231、232、233、234和235上执行视点间预测。此外,通过参考具有相同POC的其他视点图像,可在除了左视点图像131、132、133、134和135及右视点锚图片231、232、233、234和235外的其余图像上执行视点间预测(层间预测)。
左视点图像和右视点图像之中的、除了锚图片131、132、133、134、135、231、232、233、234和235外的其余图像通过参考相同视点图像来预测。
然而,可不通过参考在相同视点的附加视点图像之中具有前一播放顺序的锚图片来预测左视点图像和右视点图像中的每个图像。换言之,为了在当前左视点图像上执行帧间预测,可参考左视点图像(排除按播放顺序在当前左视点图像前面的左视点锚图片)。同样地,为了在当前右视点图像上执行帧间预测,可参考右视点图像(排除按播放顺序在当前右视点图像前面的右视点锚图片)。
此外,为了在当前左视点图像上执行帧间预测,可通过参考属于当前GOP但在当前左视点图像之前重建的左视点图像来执行预测,而不是参考属于当前左视点图像的当前GOP之前的GOP的左视点图像。这同样适用于右视点图像。
根据实施方式的层间视频解码设备20可根据图3的多视点视频预测结构的播放顺序30来重建基本视点图像、左视点图像和右视点图像。
左视点图像可经由参考基本视点图像的视点间视差补偿和参考左视点图像的帧间运动补偿来重建。右视点图像可经由参考基本视点图像和左视点图像的视点间视差补偿和参考右视点图像的帧间运动补偿来重建。可首先针对左视点图像和右视点图像的视差补偿和运动补偿来重建参考图像。
针对左视点图像的帧间运动补偿,可经由参考所重建的左视点参考图像的帧间运动补偿来重建左视点图像。针对右视点图像的帧间运动补偿,可经由参考所重建的右视点参考图像的帧间运动补偿来重建右视点图像。
此外,针对当前左视点图像的帧间运动补偿,可只参考属于当前左视点图像的当前GOP但在当前左视点图像之前重建的左视点图像,而不参考属于当前GOP之前的GOP的左视点图像。这同样适用于右视点图像。
下文将参考图4a到图6描述由根据实施方式的层间视频解码设备执行的接收预测模式信息以预测和重建深度图像的方法。
图4a示出根据实施方式的SPS 3D扩展句构的一部分。
根据实施方式的层间视频解码设备20可接收表明深度图像是否准许SDC模式之中的帧间SDC模式的标记。或者,层间视频解码设备20可接收表明深度图像是否准许DMM预测模式之中的DMM模式-4(DMM_CPREDTEX)的标记。或者,层间视频解码设备20可接收表明深度图像是否准许DMM预测模式之中的DMM模式-1(DMM_WFULL)模式或帧内SDC模式的标记。
在图4a,附图标记‘410’表示标记intra_contour_enabled_flag[d],其表明是否允许DMM预测模式之中的DMM模式-4的使用。当标记intra_contour_enabled_flag[d]410具有值1时,当前深度图像可准许使用预测模式DMM模式-4来预测它的块。因此,可使用DMM模式-4生成当前深度图像的预测块并进行解码。相比之下,当标记intra_contour_enabled_flag[d]410具有值0时,当前深度图像无法使用DMM模式-4进行解码。当标记intra_contour_enabled_flag[d]410没有定义时,标记intra_contour_enabled_flag[d]410的值可估计为‘0’。
在图4a中,附图标记‘420’表示标记intra_dc_only_wedge_enabled_flag[d],其表明是否准许DMM预测模式之中的DMM模式-1的使用和是否准许帧内SDC模式的使用。当标记intra_dc_only_wedge_enabled_flag[d]420具有值1时,当前深度图像准许使用DMM模式-1和帧内SDC模式中的至少一个模式来预测它的块。因此,当前深度图像可通过使用DMM模式-1和帧内SDC模式中的至少一个模式生成预测块来进行解码。相比之下,当标记intra_dc_only_wedge_enabled_flag[d]420具有值0时,当前深度图像无法使用DMM模式-1和帧内SDC模式进行解码。当标记intra_dc_only_wedge_enabled_flag[d]420没有定义时,标记intra_dc_only_wedge_enabled_flag[d]420的值可估计为‘0’。
在图4a中,附图标记‘430’表示标记inter_dc_only_enabled_flag[d],其表明是否准许DMM预测模式之中的帧间SDC模式。当标记inter_dc_only_enabled_flag[d]430具有值1时,当前深度图像可准许使用帧间SDC模式来预测它的块。因此,当前深度图像可通过使用帧间SDC模式生成预测块来进行解码。相比之下,当标记inter_dc_only_enabled_flag[d]430具有值0时,当前深度图像无法使用帧间SDC模式进行解码。当标记inter_dc_only_enabled_flag[d]430没有定义时,标记inter_dc_only_enabled_flag[d]430的值估计为‘0’。
图4b示出两种类型的DMM预测模式。
如上文所述,DMM预测模式是通过深度建模模式技术来准确有效地表达深度图像的边界的方法。具体地,在DMM预测模式中,通过根据图案将当前块分成至少两个区域来预测当前块。通过使用楔波和轮廓可将当前块分成至少两个区域,并且可计算至少两个区域中的每个区域的平均值。
DMM预测模式可包括DMM模式-1类型(也可称为DMM_WFULL模式或INTRA_DEP_WEDGE)和DMM模式-4类型(也可称为DMM_CPREDTEX模式或INTRA_DEP_CONTOUR)。
层间视频解码设备20可通过使用DMM模式-1或DMM模式-4来生成当前块的预测块并且重建当前块,所述DMM模式-1或DMM模式-4是通过将各个边界线应用到当前块来将当前块分成两个区域并且随后由最适当的边界线将当前块分开的楔波模式。此外,层间视频解码设备20可通过使用DMM模式-1或DMM模式-4来生成当前块的预测块并且重建当前块,所述DMM模式-1或DMM模式-4是通过将各个边界线应用到当前块来将当前块分成两个区域并且随后由最适当的边界线将当前块分开的楔波模式。在这种情况下,楔波是指斜线。楔波分区是指由斜线从当前块中分出的两个或更多分区。为方便说明,上文描述了层间视频解码设备20通过使用DMM预测模式来重建当前块的情况,但本领域普通技术人员将明白,可由层间视频编码设备10来执行对应于层间视频解码设备20的操作。
层间视频解码设备20可通过使用楔波443来将当前块440分成部分P1 442和P2444。此外,层间视频解码设备20可通过使用轮廓463来将当前块460分成部分P1 462和P2464。
DMM模式-1是预测模式,其中楔波443的开始点和终止点的位置使用预定表进行表达,并且它的信息根据在比特流中直接传输与楔波443有关的信息的方法进行传输。层间视频解码设备20可通过从比特流中获取与楔波443的开始点和终止点的位置有关的信息而将当前块440分成P1 442和P2 444。
DMM模式-4是参考同位置纹理亮度块(CTLB)以获取与轮廓463有关的信息的预测模式,所述CTLB是与当前块460位于相同位置的纹理图像块480。层间视频解码设备20可计算纹理图像块480的平均亮度值、通过将平均亮度值用作阈值来分割纹理图像块480,并且将分割信息统一应用到当前块460。层间视频解码设备20可基于纹理图像块480的分割信息将当前块460分成部分P1 462和P2 464。
根据实施方式的层间视频解码设备20可使用一个DC值来预测通过使用楔波或轮廓而从当前块中分出的区域中的每个区域。例如,属于部分P1 442的所有像素的值可使用部分P1 442的DC值进行预测,并且属于部分P2 444的所有像素的值可使用部分P2 444的DC值进行预测。
图5示出根据实施方式的coding_unit句构的一部分。
在图5,附图标记‘550’表示条件语句,询问是否准许当前深度图像的DMM预测模式,从而执行intra_mode_ext用于实现DMM预测模式参数。换言之,当标记IntraContourEnabledFlag和IntraDCOnlyWedgeEnabledFlag中的一个标记具有值1时,可执行intra_mode_ext,以通过使用DMM预测模式来预测当前块。下文将使用[等式2]描述标记IntraDCOnlyWedgeEnabledFlag和IntraContourEnabledFlag。
在图5中,附图标记‘570’表示标记no_dim_flag[x0+i][y0+j],其表明当前块是否准许DMM预测模式。当标记no_dim_flag[x0+i][y0+j]570具有值1时,对应于标记no_dim_flag[x0+i][y0+j]570的当前块不准许DMM预测模式。相比之下,当标记no_dim_flag[x0+i][y0+j]570具有值0时,对应于标记no_dim_flag[x0+i][y0+j]的当前块准许DMM预测模式。
图6示出用于接收DMM参数的intra_mode_ext句构。
层间视频解码设备20可另外接收表示用于当前块的DMM预测模式的类型的标记depth_intra_mode_idx_flag[x0][y0]650。标记depth_intra_mode_idx_flag[x0][y0]650可表示当标记depth_intra_mode_idx_flag[x0][y0]650具有值0时,当前块可使用DMM模式-1进行预测,并且表明当标记depth_intra_mode_idx_flag[x0][y0]650具有值1时,当前块可使用DMM模式-4进行预测,但本公开不限于此。
条件语句630表示用于接收标记depth_intra_mode_flag[x0][y0]650的条件。在条件语句630中,只在标记no_dim_flag 570为‘0’,标记IntraDCOnlyWedgeEnabledFlag为‘1’并且标记IntraContourEnabledFlag为‘1’时,才可接收标记depth_intra_mode_flag[x0][y0]650。
标记IntraDCOnlyWedgeEnabledFlag可表示是否准许使用DMM模式-1来进行当前块的预测。标记IntraContourEnabledFlag可表示是否准许使用DMM模式-4来进行当前块的预测。可使用下列[等式2]来定义标记IntraDCOnlyWedgeEnabledFlag和IntraContourEnabledFlag。
[等式2]
IntraContourEnabledFlag=intra_contour_enabled_flag[Depthflag]
&&in_comp_pred_flag
IntraDCOnlyWedgeEnabledFlag
=intra_dc_only_wedge_enabled_flag[DepthFlag]
标记IntraContourEnabledFlag由上述intra_contour_enabled_flag[d]和in_comp_pred_flag确定。in_comp_pred_flag表示表明针对深度图像是否可参考对应于深度图像的纹理图像的信息。in_comp_pred_flag可表明当in_comp_pred_flag具有值1时,可参考对应于深度图像的纹理图像,而当in_comp_pred_flag具有值0时,不可参考。换言之,当不可参考对应于当前深度图像的纹理图像(in_comp_pred_flag=0)时,无法使用DMM模式-4来预测当前块。因此,IntraContourEnabledFlag为‘0’。
标记IntraDCOnlyWedgeEnabledFlag与上文所述的intra_dc_only_wedge_enabled_flag[d]相同。
因此,可以表明当IntraDCOnlyWedgeEnabledFlag具有值1时,准许使用DMM模式-1或帧内SDC模式进行当前块所属的深度图像的预测,而当IntraDCOnlyWedgeEnabledFlag具有值0时,不准许。此外,可以表明当IntraContourEnabledFlag具有值1时,准许使用DMM模式-4进行当前块所属的深度图像的预测,而当IntraContourEnabledFlag具有值0时,不准许。
换言之,当不准许使用DMM模式-1或DMM模式-4进行当前块所属的深度图像的预测时,可不接收表明与当前块的DMM预测模式的类型有关的信息的标记,从而降低装置复杂性。
如果标记no_dim_flag 570为‘0’,IntraContourEnabledFlag为‘1’并且IntraDCOnlyWedgeEnabledFlag为‘0’,那么在不接收标记depth_intra_mode_flag[x0][y0]650的情况下,当前块的DMM预测模式的类型可确定为DMM模式-4。如果标记no_dim_flag 570为‘0’,IntraContourEnabledFlag为‘0’并且IntraDCOnlyWedgeEnabledFlag为‘1’,那么在不接收标记depth_intra_mode_flag[x0][y0]650的情况下,当前块的DMM预测模式的类型可确定为DMM模式-1。
层间视频解码设备20可从层间视频编码设备10中接收含有标记flag no_dim_flag 570并采用基于上下文的自适应二进制算术编码(CABAC)进行编码的比特流,并且通过ABAC对该比特流进行解码。在这种情况下,标记no_dim_flag 570可使用独立的上下文模型进行传输,而无需参考与邻近块有关的信息。
尽管为便于说明,只在上文参考图4到图6详细描述了层间视频解码设备20执行的操作,而没有描述层间视频编码设备10的操作,但本领域普通技术人员将明白,与层间视频解码设备20的操作对应的操作可由层间视频编码设备10执行。
在根据实施方式的层间视频编码设备10和层间视频解码设备20中,视频数据被分割的块可分成具有树形结构的编码单元,并且编码单元、预测单元和变换单元可用来在编码单元上执行层间预测或帧间预测,如上文所述。将参考图7到图19描述根据实施方式基于具有树形结构的编码单元和变换单元的视频编码方法和设备以及视频解码方法和设备。
图7是根据实施方式的基于具有树形结构的编码单元的视频编码设备100的框图。
下文将描述的视频编码设备100是上文参考图1a描述的层间视频编码设备10的一个实施方式。因此,尽管此处未描述,但层间视频编码设备10的上述描述也可应用于视频编码设备100。
根据实施方式的基于根据树形结构的编码单元的、涉及视频预测的视频编码设备100包括最大编码单元(LCU)分割器110、编码单元确定器120和输出单元130。在下文中,为便于描述,基于根据树形结构的编码单元的、涉及视频预测的视频编码设备100将简称为‘视频编码设备100’。
最大编码单元分割器110可基于最大编码单元来分割当前图片,所述最大编码单元是具有图像的当前图片的最大尺寸的编码单元。如果当前图片大于最大编码单元,那么当前图片的图像数据可分割成至少一个最大编码单元。根据实施方式的最大编码单元可以是具有32×32、64×64、128×128、256×256等尺寸的数据单元,其中数据单元的形状是具有2的平方的宽度和长度的正方形。至少一个最大编码单元的图像数据可输出到编码单元确定器120。
根据实施方式的编码单元的特征可以是最大尺寸和深度。深度表示编码单元从最大编码单元空间分割的次数,并且随着深度加深,根据深度的较深编码单元可从最大编码单元分割到最小编码单元。最大编码单元的深度是最大深度,并且最小编码单元的深度是最小深度。由于对应于每个深度的编码单元的尺寸随着最大编码单元的深度加深而减小,因此,对应于较大深度的编码单元可包括对应于较小深度的多个编码单元。
如上文所述,当前图片的图像数据根据编码单元的最大尺寸分割成最大编码单元,并且最大编码单元中的每个可包括根据深度分割的较深编码单元。由于根据实施方式的最大编码单元根据深度进行分割,因此,最大编码单元中包括的空间域的图像数据可根据深度进行分层分类。
限制最大编码单元的高度和宽度进行分层分割的总次数的、编码单元的最大深度和最大尺寸可以预先确定。
编码单元确定器120对通过根据深度分割最大编码单元的区域而获得的至少一个分割区域进行编码,并且根据至少一个分割区域确定输出最终编码的图像数据的深度。换言之,通过根据当前图片的最大编码单元对根据深度的较深编码单元中的图像数据进行编码并且选择具有最小编码误差的深度,编码单元确定器120确定编码深度。根据每个最大编码单元确定的编码深度和图像数据输出到输出单元130。
最大编码单元中的图像数据基于与等于或小于最大深度的至少一个深度对应的较深编码单元进行编码,并且对图像数据进行编码的结果基于较深编码单元中的每个进行比较。在比较较深编码单元的编码误差之后,可选择具有最小编码误差的深度。针对每个最大编码单元,可选择至少一个编码深度。
随着编码单元根据深度进行分层分割,并且随着编码单元的数量增加,最大编码单元的尺寸被分割。此外,即使编码单元对应于一个最大编码单元中的相同深度,也要通过分别测量每个编码单元的图像数据的编码误差来确定是否将对应于相同深度的编码单元中的每个编码单元分割到较低深度。因此,即使在图像数据被包括在一个最大编码单元中时,编码误差也可根据一个最大编码单元中的区域而不同,因此,编码深度可根据图像数据中的区域而不同。因此,在一个最大编码单元中可确定一个或多个编码深度,并且最大编码单元的图像数据可根据至少一个编码深度的编码单元分开。
因此,根据实施方式的编码单元确定器120可确定最大编码单元中包括的具有树形结构的编码单元。根据实施方式的‘具有树形结构的编码单元’包括在最大编码单元包括的所有较深编码之中的、与确定为所述编码深度的编码深度对应的编码单元。编码深度的编码单元可根据最大编码单元的相同区域中的深度来分层确定,并且可在不同区域中独立确定。类似地,当前区域中的编码深度可独立于另一区域中的编码深度进行确定。
根据实施方式的最大深度是与从最大编码单元到最小编码单元的分割次数相关的索引。根据实施方式的第一最大深度可表示从最大编码单元到最小编码单元的总分割次数。根据实施方式的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如,当最大编码单元的深度为0时,最大编码单元被分割一次的编码单元的深度可设置为1,并且最大编码单元被分割两次的编码单元的深度可设置为2。在这种情况下,如果最小编码单元是最大编码单元被分割四次的编码单元,那么存在深度0、1、2、3和4的深度等级,因此,第一最大深度可设置为4,并且第二最大深度可设置为5。
预测编码和变换可根据最大编码单元来执行。预测编码和变换也根据最大编码单元基于根据等于或小于最大深度的深度的较深编码单元来执行。
由于每当最大编码单元根据深度分割时较深编码单元的数量都增加,因此,在随着深度加深而生成的所有较深编码单元上执行包括预测编码和变换在内的编码。为便于描述,现在将基于当前深度的编码单元,在最大编码单元中描述预测编码和变换。
根据实施方式的视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,并且同时,可将相同的数据单元用于所有操作或者将不同的数据单元用于每个操作。
例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,而且可选择不同于编码单元的数据单元,以便在编码单元中的图像数据上执行预测编码。
为了在最大编码单元中执行预测编码,可基于根据实施方式对应于编码深度的编码单元(即,基于不再分割成对应于较低深度的编码单元的编码单元)执行预测编码。在下文中,不再进行分割并且成为用于预测编码的基础单元的编码单元现在将被称为‘预测单元’。通过分割预测单元而获得的分区可包括预测单元和通过分割预测单元的高度和宽度中的至少一个而获得的数据单元。分区是编码单元的预测单元被分割的数据单元,并且预测单元可以是与编码单元具有相同尺寸的分区。
例如,当2N×2N(其中N是正整数)的编码单元不再分割并且成为2N×2N的预测单元时,分区的尺寸可以是2N×2N、2N×N、N×2N或N×N。根据实施方式的分区类型的示例可选择性地包括通过对称地分割预测单元的高度或宽度而获得的对称分区、通过不对称地分割预测单元的高度或宽度(诸如1:n或n:1)而获得的分区、通过几何分割预测单元而获得的分区以及具有任意形状的分区。
预测单元的预测模式可以是帧内模式、帧间模式和跳跃模式中的至少一个。例如,帧内模式或帧间模式可在2N×2N、2N×N、N×2N或N×N的分区上执行。此外,跳跃模式只可在2N×2N的分区上执行。编码在编码单元中的一个预测单元上独立执行,从而选择具有最小编码误差的预测模式。
此外,根据实施方式的视频编码设备100也可不仅基于用于对图像数据进行编码的编码单元而且基于不同于编码单元的数据单元而在编码单元中的图像数据上执行变换。为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的变换单元来执行变换。例如,变换单元可包括用于帧内模式的数据单元和用于帧间模式的变换单元。
根据实施方式,编码单元中的变换单元可按与编码单元根据树形结构进行分割的类似方式递归地分割成更小尺寸的区域。因此,编码单元中的残余数据可根据具有树形结构的变换单元依据变换深度进行分割。
根据实施方式,表明通过分割编码单元的高度和宽度来达到变换单元的分割次数的变换深度也可设置在变换单元中。例如,在2N×2N的当前编码单元中,当变换单元的尺寸是2N×2N时变换深度可为0,当变换单元的尺寸是N×N时变换深度可为1,以及当变换单元的尺寸是N/2×N/2时变换深度可为2。换言之,具有树形结构的变换单元可根据变换深度进行设置。
根据编码深度的编码信息不仅需要与编码深度有关的信息,而且需要与预测编码和变换相关的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,而且确定将预测单元分割成分区的分区类型、根据预测单元的预测模式以及用于变换的变换单元的尺寸。
下文将参考图7到图19详细描述根据实施方式的最大编码单元中的根据树形结构的编码单元以及确定预测单元/分区和变换单元的方法。
编码单元确定器120可通过使用基于拉格朗日乘子的率失真优化来测量根据深度的较深编码单元的编码误差。
输出单元130以比特流的形式输出基于由编码单元确定器120确定的至少一个编码深度进行编码的最大编码单元的图像数据以及与根据深度的编码模式有关的信息。
通过对图像的残余数据进行编码可获得编码的图像数据。
与根据深度的编码模式有关的信息可包括编码深度信息、预测单元的分区类型信息、变换单元尺寸信息等。
编码深度信息可通过使用根据深度的分割信息进行定义,从而表明是否在较低深度而非当前深度的编码单元上执行编码。如果当前编码单元的当前深度是编码深度,那么当前编码单元由当前深度的编码单元进行编码,因此,当前深度的分割信息可定义为不将当前编码单元分割到较低深度。另一方面,如果当前编码单元的当前深度不是编码深度,那么必须通过使用较低深度的编码单元来执行编码,因此,当前深度的分割信息可定义为将当前编码单元分割到较低深度的编码单元。
如果当前深度不是编码深度,那么在分割成较低深度的编码单元的编码单元上执行编码。由于较低深度的一个或多个编码单元存在于当前深度的一个编码单元中,因此,可在较低深度的每个编码单元上重复执行编码,从而可针对具有相同深度的编码单元递归地执行编码。
由于针对一个最大编码单元确定具有树形结构的编码单元,并且必须针对编码深度的编码单元确定与至少一个编码模式有关的信息,因此,可针对一个最大编码单元确定至少一项编码模式信息。此外,最大编码单元的图像数据的编码深度可根据位置而改变,这是因为图像数据根据深度进行分层分割,因此,可针对图像数据来设置编码深度和编码模式信息。
因此,根据实施方式的输出单元130可将编码深度和编码模式信息分配到最大编码单元中包括的编码单元、预测单元和最小单元中的至少一个。
根据实施方式的最小单元是通过将构成最低编码深度的最小编码单元分割成4个而获得的正方形数据单元。或者,根据实施方式的最小单元可以是可被包括在最大编码单元所包括的编码单元、预测单元、分区单元和变换单元的全部中的最大正方形数据单元。
例如,由输出单元130输出的编码信息可分类成根据较深编码单元的编码信息和根据预测单元的编码信息。根据较深编码单元的编码信息可包括预测模式信息和分区尺寸信息。以预测单元为单位传输的编码信息可包括与帧间模式的估计方向有关的信息、与帧间模式的参考图像索引有关的信息、与运动向量有关的信息、与帧内模式的色度分量有关的信息以及与帧内模式的内插法有关的信息。
与根据图片、截片或GOP定义的编码单元的最大尺寸有关的信息以及与最大深度有关的信息可***到比特流的标头、序列参数集或图像参数集中。
与当前视频准许的变换单元的最大尺寸有关的信息以及与变换单元的最小尺寸有关的信息也可通过比特流的标头、序列参数集或图片参数集输出。输出单元130可对下列信息进行编码并输出:与上文参考图1到图6描述的预测相关的参考信息、预测信息、单向预测信息、包括第四截片类型在内的截片类型信息等。
在根据最简单实施方式的视频编码设备100中,较深编码单元可以是通过将较高深度的编码单元(上一层的编码单元)的高度或宽度一分为二所得到的编码单元。换言之,在当前深度的编码单元的尺寸是2N×2N时,较低深度的编码单元的尺寸是N×N。此外,具有2N×2N尺寸的当前编码单元可最大包括四个具有N×N尺寸的较低深度编码单元。
因此,通过基于最大编码单元的尺寸和考虑到当前图片的特征而确定的最大深度来确定每个最大编码单元的具有最佳形状和最佳尺寸的编码单元,视频编码设备100可形成具有树形结构的编码单元。此外,由于可通过使用各种预测模式和变换中的任一个在每个最大编码单元上执行编码,因此,可根据各种图像尺寸的编码单元的特征来确定最佳编码模式。
因此,如果具有高分辨率或大数据量的图像在传统宏块中编码,那么每个图片的宏块数量过度增加。因此,针对每个宏块生成的压缩信息的数量增加,因而难以传输压缩的信息并且数据压缩效率降低。然而,通过使用根据实施方式的视频编码设备100,图像压缩效率可增加,这是因为在考虑图像的特征同时调整编码单元,同时考虑图像的尺寸而增大编码单元的最大尺寸。
图7的视频编码设备100可执行上文参考图1描述的视频编码设备10的操作。
编码单元确定器120可执行视频编码设备10的帧内预测器12的操作。对于最大编码单元中的每个而言,用于帧内预测的预测单元可以以具有树形结构的编码单元为单位进行确定,并且帧内预测可在预测单元上执行。
输出单元130可执行视频编码设备10的符号编码器14的操作。对于预测单元中的每个而言,可针对帧内预测模式预测对MPM标记进行编码。在当前预测单元的帧内预测模式与左/上预测单元的帧内预测模式中的至少一个相同时,可确定固定数量的候选帧内预测模式,并且无论左帧内预测模式和上帧内预测模式是否相同,都可基于候选帧内预测模式确定当前预测单元的当前帧内模式信息并对其进行编码。
输出单元130可针对图片中的每个来确定候选帧内预测模式的数量。类似地,可针对截片中的每个、最大编码单元中的每个、编码单元中的每个或者预测单元中的每个来确定候选帧内预测模式的数量。然而,本公开不限于此,并且可针对预定数据单元中的每个来确定候选帧内预测模式的数量。
输出单元130可根据用于更新候选帧内预测模式的数量的数据单元的等级将表示候选帧内预测模式的数量的信息编码成各种数据单元级(诸如,图片参数集(PPS)、截片参数集(SPS)、最大编码单元级、编码单元级、预测单元级等)的参数。然而,即使以预定数据单元为单位确定候选帧内预测模式的数量,也不始终对表示候选帧内预测模式的数量的信息进行编码。
图8是根据实施方式的基于具有树形结构的编码单元的视频解码设备200的框图。
下文将描述的视频解码设备200是上文参考图2a描述的层间视频解码设备20的实施方式。因此,尽管此处未描述,但层间视频解码设备20的上述描述也可应用于视频解码设备200。
根据实施方式的基于具有树形结构的编码单元的、涉及视频预测的视频解码设备200包括接收器210、图像数据与编码信息提取器220以及图像数据解码器230。为便于描述,根据实施方式的基于具有树形结构的编码单元的、涉及视频预测的视频解码设备200将简称为‘视频解码设备200’。
根据实施方式,用于视频解码设备200的解码操作的各种术语(诸如,编码单元、深度、预测单元、变换单元和各种类型的编码模式信息)的定义与参考图7和视频编码设备100描述的那些定义相同。
接收器210接收并解析编码视频的比特流。图像数据与编码信息提取器220从解析的比特流中提取用于每个编码单元的编码图像数据,其中编码单元具有根据每个最大编码单元的树形结构,并且将提取的图像数据输出到图像数据解码器230。图像数据与编码信息提取器220可从与当前图片有关的标头、序列参数集或图片参数集中提取与当前图片的编码单元的最大尺寸有关的信息。
此外,图像数据与编码信息提取器220针对根据每个最大编码单元的具有树形结构的编码单元从解析的比特流中提取编码深度和编码模式信息。提取的编码深度和编码模式信息输出到图像数据解码器230。换言之,比特流中的图像数据分割成最大编码单元,使得图像数据解码器230针对每个最大编码单元将图像数据解码。
根据每个最大编码单元的编码深度和编码模式信息可针对至少一项编码深度信息进行设置,并且根据每个编码深度的编码模式信息可包括与对应编码单元有关的分区类型信息、预测模式信息、变换单元尺寸信息等。此外,根据深度的分割信息可被提取为编码深度信息。
由图像数据与编码信息提取器220提取的根据每个最大编码单元的编码深度和编码模式信息是被确定当诸如根据实施方式的视频编码设备100等解码器根据每个最大编码单元针对根据深度的每个较深编码单元重复执行编码时会生成最小编码误差的编码深度和编码模式信息。因此,视频解码设备200可通过根据生成最小编码误差的编码方案对图像数据进行解码来重建图像。
由于与编码深度和编码模式信息有关的编码信息可分配到对应编码单元、预测单元和最小单元之中的预定数据单元,因此,图像数据与编码信息提取器220可根据每个预定数据单元提取编码深度和编码模式信息。如果对应最大编码单元的编码深度和编码模式信息根据每个预定数据单元进行记录,那么可以推断,被分配相同编码深度和编码模式信息的预定数据单元就是相同最大编码单元中包括的数据单元。
图像数据解码器230可通过基于根据每个最大编码单元的编码深度和编码模式信息将每个最大编码单元中的图像数据解码来重建当前图片。换言之,图像数据解码器230可基于与每个最大编码单元中包括的具有树形结构的编码单元之中的、每个单元的分区类型、预测模式和变换单元有关的提取信息对编码的图像数据进行解码。解码过程可包括预测和逆变换,所述预测包括帧内预测和运动补偿。
基于与根据每个深度的编码单元的预测单元有关的分区类型信息和预测模式信息,图像数据解码器230可根据每个编码单元的分区和预测模式来执行帧内预测或运动补偿。
此外,图像数据解码器230可读取与用于每个编码单元的根据树形结构的变换单元有关的信息,以便基于每个编码单元的变换单元来执行逆变换,从而针对每个最大编码单元进行逆变换。经由逆变换,可重建编码单元的空间域的像素值。
图像数据解码器230可通过使用根据深度的分割信息来确定当前最大编码单元的编码深度。如果分割信息表明图像数据不再以当前深度分割,那么当前深度就是编码深度。因此,图像数据解码器230可通过使用与预测单元有关的分区类型信息、预测模式信息和变换单元尺寸信息来对当前最大编码单元中的编码数据进行解码。
换言之,通过观察分配给编码单元、预测单元和最小单元之中的预定数据单元的编码信息集,可收集含有包括相同分割信息的编码信息的数据单元,并且可将收集的数据单元视作将由图像数据解码器230以相同编码模式解码的一个数据单元。因此,可通过获取与用于每个编码单元的编码模式有关的信息来对当前编码单元进行解码。
此外,图8的视频解码设备200可执行上文参考图2描述的视频解码设备20的操作。
接收器210可执行视频解码设备20的解析器22的操作。图像数据与编码信息提取器220和图像数据解码器230可执行视频解码设备20的帧内预测器24的操作。
当用于帧内预测的预测单元以具有树形结构的编码单元为单位进行确定时,解析器22可解析来自比特流的MPM标记,以针对预测单元中的每个执行帧内预测模式预测。当前帧内模式信息可在MPM标记的解析之后从比特流中解析出来,而无需确定左帧内预测模式和上帧内预测模式是否相同。在块的符号(包括MPM标记和帧内模式信息)完成解析之后,图像数据与编码信息提取器220可从解析的信息中重建当前帧内预测模式。当前帧内预测模式可使用固定数量的候选帧内预测模式进行预测。图像数据解码器230可通过使用重建的当前帧内预测模式和残余数据在当前预测单元上执行帧内预测。
图像数据与编码信息提取器220可同样针对图片中的每个来确定候选帧内预测模式的数量。
解析器22可从比特流的各种数据单元级(诸如,图片参数集(PPS)、截片参数集(SPS)、最大编码单元级、编码单元级或预测单元级)的参数中解析表示固定数量的候选帧内预测模式的信息。在这种情况下,图像数据与编码信息提取器220可针对与信息解析所处的级对应的数据单元中的每个来确定候选帧内预测模式的数量,该数量由解析的信息表示。
然而,即使表示候选帧内预测模式的数量的信息没有被解析,图像数据与编码信息提取器220仍可针对预定数据单元中的每个(例如,截片中的每个、最大编码单元中的每个、编码单元中的每个或预测单元中的每个)来更新候选帧内预测模式的数量。
因此,视频解码设备200可获取与在针对每个最大编码单元递归地执行编码时生成最小编码误差的至少一个编码单元有关的信息,并且可使用该信息来对当前图片进行解码。换言之,可对确定是每个最大编码单元中的最佳编码单元的、具有树形结构的编码单元进行解码。
因此,即使图像数据具有高分辨率和大量数据,图像数据仍可通过使用编码单元的尺寸和编码模式来高效解码和重建,所述编码单元的尺寸和编码模式是通过使用从编码器接收的最佳编码模式信息根据图像数据的特征自适应地确定的。
图9是用于描述根据本公开的实施方式的编码单元的概念的示意图。
编码单元的尺寸可由宽度×高度来表示,并且可以是64×64、32×32、16×16和8×8。64×64的编码单元可分割成64×64、64×32、32×64或32×32的分区,并且32×32的编码单元可分割成32×32、32×16、16×32或16×16的分区,16×16的编码单元可分割成16×16、16×8、8×16或8×8的分区,以及8×8的编码单元可分割成8×8、8×4、4×8或4×4的分区。
在视频数据310中,分辨率是1920×1080,编码单元的最大尺寸是64,并且最大深度是2。在视频数据320中,分辨率是1920×1080,编码单元的最大尺寸是64,并且最大深度是3。在视频数据330中,分辨率是352×288,编码单元的最大尺寸是16,并且最大深度是1。图9所示的最大深度是指从最大编码单元到最小解码单元的总分割次数。
如果分辨率较高或数据量较大,那么编码单元的最大尺寸可较大,从而不仅增加编码效率,而且准确反映图像的特征。因此,分辨率比视频数据330高的视频数据310和320的编码单元的最大尺寸可以是64。
由于视频数据310的最大深度是2,因此,视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元,以及长轴尺寸为32和16的编码单元,这是因为通过将最大编码单元分割两次,深度加深两个层。由于视频数据330的最大深度是1,因此,视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元,以及长轴尺寸为8的编码单元,这是因为通过将最大编码单元分割一次,深度加深一层。
由于视频数据320的最大深度是3,因此,视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元,以及长轴尺寸为32、16和8的编码单元,这是因为通过将最大编码单元分割三次,深度加深3个层。随着深度加深,可准确地表达详细信息。
图10是根据本公开的实施方式的基于编码单元的图像编码器400的框图。
根据实施方式的图像编码器400执行由视频编码设备100的编码单元确定器120执行的操作,以对图像数据进行编码。换言之,帧内预测器410在当前帧405的帧内模式编码单元上执行帧内预测。运动估算器420和运动补偿器425通过在帧间模式下使用当前帧405和参考帧495来执行帧间估算和运动补偿。
从帧内预测器410、运动估算器420和运动补偿器425输出的数据输入到变换器430和量化器440,随后作为量化的变换系数输出。量化的变换系数被反量化器460和逆变换器470重建成空间域数据。重建的空间域数据由去块化单元480和环路滤波单元490进行后处理,随后作为参考帧495输出。量化的变换系数可输入到熵编码器450,随后作为比特流455输出。
为了应用于根据实施方式的视频编码设备100,作为图像编码器400的元件,帧内预测器410、运动估算器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块化单元480和环路滤波单元490全部应各自针对考虑最大深度的最大编码单元中的每个,基于具有树形结构的编码单元中的每个来执行操作。
具体而言,帧内预测器410、运动估算器420和运动补偿器425可通过考虑当前最大编码单元的最大尺寸和深度来确定具有树形结构的编码单元中的每个的分区和预测模式,并且变换器430可确定将被包括在具有树形结构的编码单元中的每个中的变换单元的尺寸。
具体而言,帧内预测器410可执行视频编码设备10的帧内预测器12的操作。帧内预测器410可以以具有树形结构的编码单元为单位确定用于帧内预测的预测单元(这一步骤将在最大编码单元中的每个上执行),并且在预测单元中的每个上执行帧内预测。
在当前预测单元和左/上预测单元相同并且左帧内预测模式和上帧内预测模式相同或不同时,确定多个候选帧内预测模式。因此,熵编码器450可针对预测单元中的每个而对MPM标记进行编码,在此之后,可对基于当前预测单元的候选帧内预测模式确定的当前帧内模式信息进行编码。
图11是根据本公开的实施方式的基于编码单元的图像解码器500的框图。
当比特流505输入到解析器510时,对将要解码的编码图像数据和执行解码所需的编码信息进行解析。随着编码的图像数据经过熵解码器520和反量化器530,反量化的数据被输出并且随后经由逆变换器540重建成空间域图像数据。
帧内预测器550在空间域图像数据的帧内模式编码单元上执行帧内预测。运动补偿器560通过使用参考帧585而在帧内模式编码单元上执行运动补偿。
经过帧内预测器550和运动补偿器560的空间域图像数据由去块化单元570和环路滤波单元580进行后处理,以输出重建的帧595。此外,随着空间域图像数据被去块化单元570和环路滤波单元580后处理,可输出参考帧585。
根据实施方式在解析器510的操作之后图像解码器500的操作可按顺序执行,从而使得图像数据可由视频解码设备200的图像数据解码器230进行解码。
为了应用于根据实施方式的视频解码设备200,作为图像解码器500的元件,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块化单元570和环路滤波单元580全部可基于具有树形结构的编码单元以最大编码单元为单位来执行操作。
具体而言,帧内预测器550和运动补偿器560可确定具有树形结构的编码单元中的每个的分区和预测模式,并且逆变换器540可确定用于编码单元中的每个的变换单元的尺寸。
具体而言,当用于帧内预测的预测单元以具有树形结构的编码单元为单位进行确定时,解析器510可针对预测单元中的每个从比特流中解析MPM标记,以执行帧内预测模式预测。当前帧内模式信息可随着MPM标记的解析而连续从比特流中解析出来,无需确定左帧内预测模式和上帧内预测模式是否相同。在块的符号(包括MPM标记和帧内模式信息)完成解析之后,熵解码器520可从解析的信息中重建当前帧内预测模式。帧内预测器550可通过使用重建的当前帧内预测模式和残余数据而在当前预测单元上执行帧内预测。
图12示出根据本公开的实施方式的根据深度和分区的编码单元。
根据实施方式的视频编码设备100和根据实施方式的视频解码设备200使用分层编码单元,以便考虑图像的特征。编码单元的最大高度、最大宽度和最大深度可根据图像的特征而自适应地确定,或者可根据用户需要而不同地设置。根据深度的较深编码单元的尺寸可根据编码单元的预定最大尺寸进行确定。
在根据实施方式的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,并且最大深度是4。在这种情况下,最大深度是指编码单元从最大编码单元分割到最小编码单元的总次数。由于深度沿着根据实施方式的编码单元的分层结构600的竖直轴加深,因此,较深编码单元的高度和宽度均被分割。此外,沿着分层结构600的水平轴示出作为每个较深编码单元的预测编码的基础的预测单元和分区。
换言之,编码单元610是分层结构600中的最大编码单元,其中深度为0并且尺寸(即,高度乘宽度)为64×64。深度沿着竖直轴加深,而且编码单元620的尺寸为32×32且深度为1,编码单元630的尺寸为16×16且深度为2,以及编码单元640的尺寸为8×8且深度为3。尺寸为4×4且深度为4的编码单元650是最小编码单元。
编码单元的预测单元和分区根据每个深度沿着水平轴布置。换言之,如果尺寸为64×64且深度为0的编码单元610是预测单元,那么预测单元可分割成尺寸为64×64的编码单元610中包括的分区,即,尺寸为64×64的分区610、尺寸为64×32的分区612、尺寸为32×64的分区614,或者尺寸为32×32的分区616。
同样,尺寸为32×32且深度为1的编码单元620的预测单元可分割成尺寸为32×32的编码单元620中包括的分区,即,尺寸为32×32的分区620、尺寸为32×16的分区622、尺寸为16×32的分区624以及尺寸为16×16的分区626。
同样,尺寸为16×16且深度为2的编码单元630的预测单元可分割成尺寸为16×16的编码单元630中包括的分区,即,编码单元630中包括的尺寸为16×16的分区、尺寸为16×8的分区632、尺寸为8×16的分区634以及尺寸为8×8的分区636。
同样,尺寸为8×8且深度为3的编码单元640的预测单元可分割成尺寸为8×8的编码单元640中包括的分区,即,编码单元640中包括的尺寸为8×8的分区、尺寸为8×4的分区642、尺寸为4×8的分区644以及尺寸为4×4的分区646。
最后,尺寸为4×4且深度为4的编码单元650可以是具有最低深度的最小编码单元,并且与之对应的预测单元可只设置成尺寸为4×4且深度为4的分区650。
为了确定最大编码单元610的编码深度,根据实施方式的视频编码设备100的编码单元确定器120必须在最大编码单元610中包括的对应于每个深度的编码单元上执行编码。
包括相同范围和相同尺寸的数据的、根据深度的较深编码单元的数量随着深度加深而增加。例如,需要四个对应于深度2的编码单元来覆盖一个对应于深度1的编码单元中包括的数据。因此,为了将根据深度的相同数据的编码结果进行比较,对应于深度1的编码单元和对应于深度2的四个编码单元均被编码。
为了根据深度执行编码,可通过沿着编码单元的分层结构600的水平轴,根据深度在编码单元的预测单元上执行编码,选择出代表性编码误差,也就是对应深度的最小编码误差。或者,随着深度沿着编码单元的分层结构600的竖直轴加深,通过针对每个深度执行编码,根据深度比较代表性编码误差来搜索出最小编码误差。最大编码单元610中具有最小编码误差的深度和分区可被选作最大编码单元610的编码深度和分区类型。
图13示出根据本公开的实施方式的编码单元与变换单元之间的关系。
根据实施方式的视频编码设备100或根据实施方式的视频解码设备200根据每个最大编码单元的、尺寸等于或小于最大编码单元的编码单元对图像进行编码或解码。在编码期间用于变换的变换单元的尺寸可基于不大于对应编码单元的数据单元进行选择。
例如,在根据实施方式的视频编码设备100或根据实施方式的视频解码设备200中,如果当前编码单元710的尺寸是64×64,那么可通过使用尺寸为32×32的变换单元720来执行变换。
此外,可通过在尺寸为32×32、16×16、8×8和4×4(都小于64×64)的变换单元中的每个上执行变换,从而对尺寸为64×64的编码单元710的数据进行编码,并且随后可选择具有最小编码误差的变换单元。
图14示出根据实施方式的根据深度的多项编码信息。
根据实施方式的视频编码设备100的输出单元130可针对对应于编码深度的每个编码单元来编码并传输分区类型信息800、预测模式信息810和变换单元尺寸信息820以作为编码模式信息。
分区类型信息800表明与通过分割当前编码单元的预测单元而获得的分区的形状有关的信息,其中分区是用于对当前编码单元进行预测编码的数据单元。例如,尺寸为2N×2N的当前编码单元CU_0可分割成下列分区中的任一个:尺寸为2N×2N的分区802、尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。在这种情况下,与当前编码单元的分区类型有关的分区类型信息800设置成表示下列一个:尺寸为2N×N的分区804、尺寸为N×2N的分区806以及尺寸为N×N的分区808。
预测模式信息810表明每个分区的预测模式。例如,预测模式信息810可表明在由分区类型信息800表明的分区上执行的预测编码的模式,即,帧内模式812、帧间模式814或跳跃模式816。
变换单元尺寸信息820表明在当前编码单元上执行变换时将依据的变换单元。例如,所述变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或者第二帧内变换单元828。
根据实施方式的视频解码设备200的图像数据与编码信息提取器220可提取并使用分区类型信息800、预测模式信息810和变换单元尺寸信息820,以根据每个较深编码单元进行解码。
图15是根据本公开的实施方式的根据深度的较深编码单元的示意图。
分割信息可用来表明深度的变化。分割信息表明当前深度的编码单元是否分割成较低深度的编码单元。
用于对深度为0且尺寸为2N_0×2N_0的编码单元900进行预测编码的预测单元910可包括下列分区类型的分区:尺寸为2N_0×2N_0的分区类型912、尺寸为2N_0×N_0的分区类型914、尺寸为N_0×2N_0的分区类型916和尺寸为N_0×N_0的分区类型918。图15只示出通过对称地分割预测单元而获得的分区912、914、916和918,但分区类型不限于此,并且可包括不对称分区、具有随机形状的分区和具有几何形状的分区。
根据每个分区类型,在尺寸为2N_0×2N_0的一个分区、尺寸为2N_0×N_0的两个分区、尺寸为N_0×2N_0的两个分区和尺寸为N_0×N_0的四个分区上重复执行预测编码。可在尺寸为2N_0×2N_0、N_0×2N_0、2N_0×N_0和N_0×N_0的分区上执行帧内模式和帧间模式的预测编码。只在尺寸为2N_0×2N_0的分区上执行跳跃模式的预测编码。
如果分区类型912、914和916中的一个的编码误差是最小误差,那么预测单元910可不分割成更低深度。
如果分区类型918的编码误差是最小误差,那么在操作920中,深度从0变成1以便分割分区类型918,并且在深度为2且尺寸为N_0×N_0的编码单元930上重复执行编码,以搜索最小编码误差。
用于对深度为1且尺寸为2N_1×2N_1(=N_0×N_0)的编码单元930进行预测编码的预测单元940可包括下列分区类型的分区:尺寸为2N_1×2N_1的分区类型942、尺寸为2N_1×N_1的分区类型944、尺寸为N_1×2N_1的分区类型946和尺寸为N_1×N_1的分区类型948。
如果分区类型948的编码误差是最小误差,那么在操作950中,深度从1变成2以便分割分区类型948,并且在深度为2且尺寸为N_2×N_2的编码单元960上重复执行编码,以搜索最小编码误差。
当最大深度为d时,根据深度的较深编码单元可设置到深度对应于d-1时,并且分割信息可设置到深度对应于d-2时。换言之,当在操作970中在对应于深度d-2的编码单元进行分割之后执行编码直到深度为d-1时,用于对深度为d-1且尺寸为2N_(d-1)×2N_(d-1)的编码单元980进行预测编码的预测单元990可包括下列分区类型的分区:尺寸为2N_(d-1)×2N_(d-1)的分区类型992、尺寸为2N_(d-1)×N_(d-1)的分区类型994、尺寸为N_(d-1)×2N_(d-1)的分区类型996和尺寸为N_(d-1)×N_(d-1)的分区类型998。
可在分区类型之中的尺寸为2N_(d-1)×2N_(d-1)的一个分区、尺寸为2N_(d-1)×N_(d-1)的两个分区、尺寸为N_(d-1)×2N_(d-1)的两个分区、尺寸为N_(d-1)×N_(d-1)的四个分区上执行预测编码,以搜索具有最小编码误差的分区类型。
即使在分区类型998具有最小编码误差时,由于最大深度为d,因此,深度为d-1的编码单元CU_(d-1)不再分割到更低深度,并且构成当前最大编码单元900的编码单元的编码深度被确定为d-1,而且当前最大编码单元900的分区类型可确定为N_(d-1)×N_(d-1)。此外,由于最大深度为d,因此,不设置深度为d-1的编码单元952的分割信息。
数据单元999可以是当前最大编码单元的‘最小单元’。根据实施方式的最小单元可以是通过将具有最低深度的最小编码单元分割成4个而获得的正方形数据单元。通过重复执行编码,根据实施方式的视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以便确定编码深度,并且可将对应分区类型和预测模式设置为编码深度的编码模式。
因此,在所有的深度0、1、……、d-1、d中比较根据深度的最小编码误差,并且可将具有最小编码误差的深度确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为编码模式信息而被编码和传输。此外,由于编码单元从深度0分割到编码深度,因此,只有编码深度的分割信息设置为0,而除编码深度之外的深度的分割信息设置为1。
根据实施方式的视频解码设备200的图像数据与编码信息提取器220可提取并使用与编码单元900的编码深度和预测单元有关的信息,以便对编码单元912进行解码。根据实施方式的视频解码设备200可通过使用根据深度的分割信息而将分割信息为0的深度确定为编码深度,并且可将对应深度的编码模式信息用于解码。
图16、图17和图18示出根据本公开的实施方式的编码单元、预测单元与变换单元之间的关系。
编码单元1010是最大编码单元中的由根据实施方式的视频编码设备100确定的、根据编码深度的编码单元。预测单元1060是根据编码深度的编码单元中的每个的预测单元的分区,并且变换单元1070是根据编码深度的编码单元中的每个的变换单元。
当编码单元1010中的最大编码单元的深度为0时,编码单元1012和1054的深度为1,编码单元1014、1016、1018、1028、1050和1052的深度为2,编码单元1020、1022、1024、1026、1030、1032和1048的深度为3,以及编码单元1040、1042、1044和1046的深度为4。
在预测单元1060中,通过分割编码单元1010中的编码单元获得一些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换言之,编码单元1014、1022、1050和1054的分区类型具有尺寸2N×N,编码单元1016、1048和1052的分区类型具有尺寸N×2N,以及编码单元1032的分区类型具有尺寸N×N。编码单元1010的预测单元和分区小于或等于每个编码单元。
在小于或等于编码单元1052的数据单元中,对变换单元1070中的编码单元1052的图像数据执行变换或逆变换。此外,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052是在尺寸和形状方面不同于预测单元1060中的数据单元的数据单元。换言之,根据实施方式的视频编码设备100和视频解码设备200可在相同编码单元的单个数据单元上执行帧内预测、运动估算、运动补偿、变换以及逆变换。
因此,对最大编码单元的每个区域中具有分层结构的编码单元中的每个递归地执行编码,以确定最佳编码单元,因此,可获得具有递归树形结构的编码单元。编码信息可包括与编码单元有关的分割信息、分区类型信息、预测模式信息以及变换单元尺寸信息。表1示出可由根据实施方式的视频编码设备100和视频解码设备200设置的编码信息。
表1
根据实施方式的视频编码设备100的输出单元130可输出与具有树形结构的编码单元有关的编码信息,并且根据实施方式的视频解码设备200的图像数据与编码信息提取器220可从接收的比特流中提取与具有树形结构的编码单元有关的编码信息。
分割信息表明当前编码单元是否分割成较低深度的编码单元。如果当前深度d的分割信息为0,那么当前编码单元不再分割到较低深度所处的深度是编码深度,因此,可针对编码深度来定义分区模式信息、预测模式和变换单元尺寸信息。如果当前编码单元根据分割信息进一步分割,那么在较低深度的四个分割编码单元上独立执行编码。
预测模式可以是帧内模式、帧间模式和跳跃模式中的一个。帧内模式和帧间模式可限定于所有分区类型,而跳跃模式只可限定于尺寸为2N×2N的分区类型。
分区模式可表明通过对称地分割预测单元的高度或宽度而获得的尺寸为2N×2N、2N×N、N×2N和N×N的对称分区类型,以及通过不对称地分割预测单元的高度或宽度而获得的尺寸为2N×nU、2N×nD、nL×2N和nR×2N的不对称分区类型。尺寸为2N×nU和2N×nD的不对称分区类型可分别通过以1:3和3:1分割预测单元的高度来获得,并且尺寸为nL×2N和nR×2N的不对称分区类型可分别通过以1:3和3:1分割预测单元的宽度来获得。
变换单元的尺寸可设置为在帧内模式下有两个类型并且在帧间模式下有两个类型。换言之,如果变换单元的分割信息为0,那么变换单元的尺寸可以是2N×2N,也就是当前编码单元的尺寸。如果变换单元的分割信息为1,那么可通过分割当前编码单元来获得变换单元。此外,如果尺寸为2N×2N的当前编码单元的分区类型是对称分区类型,那么变换单元的尺寸可以是N×N,并且如果当前编码单元的分区类型是不对称分区类型,那么变换单元的尺寸可以是N/2×N/2。
根据实施方式的与具有树形结构的编码单元有关的编码信息可分配到对应于编码深度的编码单元、预测单元和最小单元中的至少一个。对应于编码深度的编码单元可包括含有相同编码信息的预测单元和最小单元中的至少一个。
因此,通过比较相邻数据单元的编码信息来确定相邻数据单元是否包括在对应于编码深度的相同编码单元中。此外,可通过使用数据单元的编码信息来确定具有对应编码深度的编码单元,因此可从中推断出最大编码单元中的编码深度的分布。
因此,如果通过参考相邻数据单元来预测当前编码单元,那么可直接参考并使用与当前编码单元相邻的较深编码单元中的数据单元的编码信息。
作为另一示例,如果通过参考相邻数据单元来对当前编码单元进行预测编码,那么可按下列方式推断出相邻数据单元:通过使用较深编码单元的编码信息来搜索与当前编码单元相邻并且在较深编码单元中的数据单元。
图19是用于描述根据表1的编码模式信息的编码单元、预测单元与转换单元之间的关系的示意图。
最大编码单元1300包括编码单元1302、1304、1306、以及具有编码深度的1312、1314、1316和1318。此处,由于编码单元1318是具有编码深度的编码单元,因此,分割信息可设置为0。尺寸为2N×2N的编码单元1318的分区类型信息可设置为下列一个:尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326、尺寸为N×N的分区类型1328、尺寸为2N×nU的分区类型1332、尺寸为2N×nD的分区类型1334、尺寸为nL×2N的分区类型1336以及尺寸为nR×2N的分区类型1338。
变换单元的分割信息(TU尺寸标记)是一种类型的变换索引。对应于变换索引的变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。
例如,当分区类型设置为对称,即,尺寸为2N×2N的分区类型1322、尺寸为2N×N的分区类型1324、尺寸为N×2N的分区类型1326或尺寸为N×N的分区类型1328时,如果变换单元的TU尺寸标记为0则设置尺寸为2N×2N的变换单元1342,而如果TU尺寸标记为1则设置尺寸为N×N的变换单元1344。
当分区类型设置为不对称,即,尺寸为2N×nU的分区模式1332、尺寸为2N×nD的分区模式1334、尺寸为nL×2N的分区模式1336或尺寸为nR×2N的分区模式1338时,如果TU尺寸标记为0则设置尺寸为2N×2N的变换单元1352,而如果TU尺寸标记为1则设置尺寸为N/2×N/2的变换单元1354。
参考图19,TU尺寸标记是值为0或1的标记,但根据实施方式的TU尺寸标记不限于1比特,并且在TU尺寸标记从0增加时,变换单元可分层地分割。变换单元的分割信息(TU尺寸标记)可用作变换索引的示例。
在这种情况下,实际使用的变换单元的尺寸可通过使用根据实施方式的变换单元的TU尺寸标记以及变换单元的最大尺寸和最小尺寸来表示。根据实施方式的视频编码设备100可对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编码的结果可***到SPS。根据实施方式的视频解码设备100可通过使用最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记来对视频进行解码。
例如,(a)如果当前编码单元的尺寸是64×64并且最大变换单元尺寸是32×32,那么(a-1)变换单元的尺寸在TU尺寸标记为0时可以是32×32,(a-2)在TU尺寸标记为1时可以是16×16,以及(a-3)在TU尺寸标记为2时可以是8×8。
作为另一示例,(b)如果当前编码单元的尺寸是32×32并且最小变换单元尺寸是32×32,那么(b-1)变换单元的尺寸在TU尺寸标记为0时可以是32×32。此处,由于变换单元的尺寸不可小于32×32,因此,TU尺寸标记无法设置成除了0之外的值。
作为另一示例,(c)如果当前编码单元的尺寸是64×64并且最大TU尺寸标记是1,那么TU尺寸标记可以是0或1。此处,TU尺寸标记无法设置成除了0或1之外的值。
因此,如果将最大TU尺寸标记定义为‘MaxTransformSizeIndex’,将最小变换单元尺寸定义为‘MinTransformSize’,并且当TU尺寸标记为0时变换单元尺寸为‘RootTuSize’,那么可在当前编码单元中确定的当前最小变换单元尺寸‘CurrMinTuSize’可由等式(1)定义:
CurrMinTuSize=
max(MinTransformSize,RootTuSize/(2^MaxTransformSizeIndex))...(1)
与可在当前编码单元中确定的当前最小变换单元尺寸‘CurrMinTuSize’相比,TU尺寸标记为0时的变换单元尺寸‘RootTuSize’可表示可以在***中选择的最大变换单元尺寸。在等式(1)中,‘RootTuSize/(2^MaxTransformSizeIndex)’表示在TU尺寸标记为0时变换单元尺寸‘RootTuSize’被分割对应于最大TU尺寸标记的次数时的变换单元尺寸,并且‘MinTransformSize’表示最小变换尺寸。因此,‘RootTuSize/(2^MaxTransformSizeIndex)’和‘MinTransformSize’之中的较小值可以是可在当前编码单元中确定的当前最小变换单元尺寸‘CurrMinTuSize’。
根据实施方式,最大变换单元尺寸RootTuSize可根据预测模式的类型而改变。
例如,如果当前预测模式是帧间模式,那么‘RootTuSize’可通过使用下列等式(2)来确定。在等式(2)中,‘MaxTransformSize’表示最大变换单元尺寸,并且‘PUSize’表示当前预测单元尺寸。
RootTuSize=min(MaxTransformSize,PUSize).........(2)
换言之,如果当前预测模式是帧间模式,那么在TU尺寸标记为0时,变换单元尺寸‘RootTuSize’可以是最大变换单元尺寸和当前预测单元尺寸之中的较小值。
如果当前分区单元的预测模式是帧内模式,那么‘RootTuSize’可通过使用下列等式(3)来确定。在等式(3)中,‘PartitionSize’表示当前分区单元的尺寸。
RootTuSize=min(MaxTransformSize,PartitionSize)...........(3)
换言之,如果当前预测模式是帧内模式,那么在TU尺寸标记为0时,变换单元尺寸‘RootTuSize’可以是最大变换单元尺寸和当前分区单元的尺寸之中的较小值。
然而,根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸‘RootTuSize’仅仅是示例,并且本公开不限于此。
根据参考图7到图19描述的基于具有树形结构的编码单元的视频编码方法,针对树形结构的每个编码单元,将空间域的图像数据编码。根据基于具有树形结构的编码单元的视频解码方法,针对每个最大编码单元执行解码,以重建空间域的图像数据。因此,可重建图片和视频(即,图片序列)。重建的视频可由播放设备播放、存储在存储介质中,或通过网络传输。
根据本公开的实施方式可编写为计算机程序,并且可在使用计算机可读记录介质执行程序的通用数字计算机中实施。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)和光记录介质(例如,CD-ROM或DVD)。
为便于描述,上文参考图1a到图19描述的视频编码方法和/或视频编码方法将统一被称为‘本公开的视频编码方法’。此外,上文参考图1a到图19描述的层间视频解码方法和/或视频解码方法将被称为‘本公开的视频解码方法’。
另外,已参考图1a到图19描述的视频编码设备(包括视频编码设备、视频编码设备或视频编码器)将被称为‘本公开的视频编码设备’。另外,已参考图1a到图19描述的视频解码设备(包括层间视频解码设备、视频解码设备或视频解码器)将被称为‘本公开的视频解码设备’。
现在将详细描述根据实施方式的存储程序的计算机可读记录介质,诸如,磁盘26000。
图20是根据实施方式的存储有程序的磁盘26000的物理结构的示意图。磁盘26000作为一种存储介质,其可以是硬盘驱动器、紧密式只读存储器(CD-ROM)盘、蓝光光盘或数字多功能盘(DVD)。磁盘26000包括多个同心磁道Tr,所述同心磁道各自在磁盘26000的圆周方向上分成特定数量的扇区Se。在根据实施方式的磁盘26000的特定区域中,可分配并存储执行上述量化参数确定方法、视频编码方法和视频解码方法的程序。
现在将参考图21描述使用存储介质实现的计算机***,所述存储介质存储用于执行上述视频编码方法和视频解码方法的程序。
图21是用于通过使用磁盘26000来记录和读取程序的磁盘驱动器26800的示意图。计算机***26700可经由磁盘驱动器26800在磁盘26000中存储用于执行本公开的视频编码方法和视频解码方法中的至少一个的程序。为了在计算机***26700中运行存储在磁盘26000中的程序,可从磁盘26000中读取程序并且通过使用磁盘驱动器26800将它传输到计算机***26700。
执行本公开的视频编码方法和视频解码方法中的至少一个的程序可不仅存储在图20和图21所示的磁盘26000中,还可存储在存储卡、ROM盒式磁带或固态驱动器(SSD)中。
下文将描述应用上文所述的视频编码方法和视频解码方法的***。
图22是用于提供内容分发服务的内容供应***11000的整体结构的示意图。通信***的服务区域分成预定尺寸的小区,并且无线基站11700、11800、11900和12000分别安装在这些小区中。
内容供应***11000包括多个独立装置。例如,诸如计算机12100、个人数字助理(PDA)12200、摄像机12300和移动电话12500等多个独立装置经由互联网服务提供商11200、通信网络11400以及无线基站11700、11800、11900和12000连接到互联网11100。
然而,内容供应***11000不限于如图22所示,并且装置可选择性地连接到该***。多个独立装置可直接连接到通信网络11400,而不经过无线基站11700、11800、11900和12000。
摄像机12300是能够拍摄视频图像的成像装置,例如,数字摄像机。移动电话12500可采用例如个人数字通信(PDC)、码分多址(CDMA)、宽带码分多址(W-CDMA)、全球移动通信***(GSM)以及个人手持式电话***(PHS)等各种协议中的至少一个通信方法。
摄像机12300可经由无线基站11900和通信网络11400连接到流式服务器11300。流式服务器11300允许经由摄像机12300从用户接收的内容经过实时广播进行流传输。从摄像机12300接收的内容可由摄像机12300或流式服务器11300进行编码。由摄像机12300拍摄的视频数据可经由计算机12100传输到流式服务器11300。
由相机12600拍摄的视频数据也可经由计算机12100传输到流式服务器11300。相机12600是能够拍摄静态图像和视频图像的成像装置,类似于数字相机。由相机12600拍摄的视频数据可使用相机12600或计算机12100进行编码。对视频执行编码和解码的软件可存储在可由计算机12100访问的计算机可读记录介质中,例如,CD-ROM盘、软盘、硬盘驱动器、SSD或存储卡。
如果视频数据由内置在移动电话12500的相机拍摄,那么视频数据可从移动电话12500中接收。
视频数据也可由安装在摄像机12300、移动电话12500或相机12600中的大规模集成电路(LSI)***进行编码。
在根据实施方式的内容供应***11000中,由用户使用摄像机12300、相机12600、移动电话12500或另一成像装置记录的内容数据(例如,在音乐会期间记录的内容)被编码并传输到流式服务器11300。流式服务器11300可采用流内容类型将编码的内容数据传输到请求内容数据的其他客户端。
客户端是能够对编码的内容数据进行解码的装置,例如,计算机12100、PDA12200、摄像机12300或移动电话12500。因此,内容供应***11000允许客户端接收和播放编码的内容数据。此外,内容供应***11000允许客户端接收编码的内容数据,并且实时解码和播放编码的内容数据,从而实现个人播放。
本公开的视频编码设备和视频解码设备可应用于内容供应***11000中包括的多个独立装置的编码操作和解码操作。
现在将参考图23和图24更详细地描述根据实施方式的内容供应***11000中包括的移动电话12500。
图23示出根据实施方式的应用本公开的视频编码方法和视频解码方法的移动电话12500的外部结构。移动电话12500可以是智能电话,它的功能不受限制并且其大量的功能可改变或扩展。
移动电话12500包括外部天线12510,经由该外部天线,射频(RF)信号可与图21的无线基站12000进行交。移动电话12500还包括显示屏12520,所述显示屏12520用于显示由相机12530拍摄的图像或经由天线12510接收并解码的图像,显示屏12520例如液晶显示器(LCD)或有机发光二极管(OLED)屏。移动电话12500包括操作面板12540,所述操作面板12540包括控制按钮和触摸面板。如果显示屏12520是触摸屏,那么操作面板12540进一步包括显示屏12520的触摸感应面板。移动电话12500包括用于输出语音和声音的扬声器12580或另一类型的声音输出单元,以及用于输入语音和声音的麦克风12550或另一类型的声音输入单元。移动电话12500进一步包括相机12530,诸如,电荷耦合装置(CCD)相机,以拍摄视频或静态图像。移动电话12500可进一步包括:存储介质12570,该存储介质12570用于存储编码/解码的数据,例如,由相机12530拍摄、经由电子邮件接收或根据各种方式获取的视频或静态图像;以及槽12560,存储介质12570经由该槽12560装载到移动电话12500中。存储介质12570可以是闪存,例如,安全数字(SD)卡或者包括在塑料盒中的电可擦除可编程只读存储器(EEPROM)。
图24示出移动电话12500的内部结构。为了***地控制包括显示屏12520和操作面板12540的移动电话12500的部分,电源电路12700、操作输入控制器12640、图像编码器12720、相机接口12630、LCD控制器12620、图像解码器12690、多路复用器/多路分解器12680、记录/读取单元12670、调制/解调单元12660以及声音处理器12650经由同步总线12730连接到中央处理器12710。
如果用户操作电源按钮并从‘关机’状态设置到‘开机’状态,那么电源电路12700将电力从电池组供应到移动电话12500的所有部分,从而在操作模式下设置移动电话12500。
中央控制器12710包括中央处理单元(CPU)、ROM和RAM。
在移动电话12500将通信数据传输到外部时,移动电话12500在中央控制器12710的控制下生成数字信号。例如,声音处理器12650可生成数字声音信号,图像编码器12720可生成数字图像信号,并且消息的文本数据可经由操作面板12540和操作输入控制器12640生成。当数字信号在中央控制器12710的控制下传输到调制/解调单元12660时,调制/解调单元12660对数字信号的频带进行调制,并且通信电路12610在频带经调制的数字声音信号上执行数模转换(DAC)和频率转换。从通信电路12610输出的传输信号可经由天线12510传输到语音通信基站或无线基站12000。
例如,当移动电话12500处于对话模式时,经由麦克风12550获取的声音信号在中央控制器12710的控制下被声音处理器12650转换成数字声音信号。数字声音信号可经由调制/解调单元12660和通信单元12610转换成传输信号,并且可经由天线12510传输。
当文本消息(例如,电子邮件)在数据通信模式下传输时,文本消息的文本数据经由操作面板12540输入,并且经由操作输入控制器12640传输到中央控制器12610。在中央控制器12610的控制下,文本数据经由调制/解调单元12660和通信电路12610变换成传输信号,并且经由天线12510传输到无线基站12000。
为了在数据通信模式下传输图像数据,经由相机接口12630将相机12530拍摄的图像数据提供到图像编码器12720。拍摄的图像数据可经由相机接口12630和LCD控制器12620直接显示在显示屏12520上。
图像编码器12720的结构可对应于上文所述的视频编码设备100的结构。图像编码器12720可根据上文所述的视频编码方法将从相机12530接收的图像数据变换成压缩且编码的图像数据,并且随后可将编码的图像数据输出到多路复用器/多路分解器12680。在相机12530的记录操作期间,由移动电话12500的麦克风12550获得的声音信号可经由声音处理器12650变换成数字声音数据,并且数字声音数据可传输到多路复用器/多路分解器12680。
多路复用器/多路分解器12680将从图像编码器12720接收的编码图像数据与从声音处理器12650接收的声音数据多路复用。多路复用数据的结果可经由调制/解调单元12660和通信单元12610转换成传输信号,并且可随后经由天线12510传输。
当移动电话12500接收来自外部的通信数据时,在经由天线12510接收的信号上执行频率恢复和ADC,以将该信号转换成数字信号。调制/解调单元12660对数字信号的频带进行调制。根据数字信号的类型,频带经过调制的数字信号传输到视频解码器12690、声音处理器12650或LCD控制器12620。
在对话模式下,移动电话12500将经由天线12510接收的信号放大,并且通过在放大的信号上执行频率转换和ADC来获取数字声音信号。在中央控制器12710的控制下,接收的数字声音信号经由调制/解调单元12660和声音处理器12650转换成模拟声音信号,并且模拟声音信号经由扬声器12580输出。
当在数据通信模式下时,接收在互联网网站访问的视频文件的数据,经由调制/解调单元12660将经由天线12510从无线基站12000接收的信号作为多路复用数据输出,并且将多路复用数据传输到多路复用器/多路分解器12680。
为了对经由天线12510接收的多路复用的数据进行解码,多路复用器/多路分解器12680将多路复用的数据多路分解成编码视频数据流和编码音频数据流。经由同步总线12730,编码视频数据流和编码音频数据流分别被提供到视频解码器12690和声音处理器12650。
图像解码器12690的结构可对应于上文所述的视频解码设备200的结构。图像解码器12690可根据上文所述的视频解码设备200或图像解码器500采用的视频解码方法对编码的视频数据进行解码,以获得重建的视频数据并且经由LCD控制器12620将重建的视频数据提供到显示屏12520。
因此,在互联网网站访问的视频文件的数据可显示在显示屏12520上。同时,声音处理器12650可将音频数据转换成模拟声音信号,并且将模拟声音信号提供到扬声器12580。因此,在互联网网站访问的视频文件中含有的音频数据也可经由麦克风12580而播放。
移动电话12500或另一类型的通信终端可以是包括本公开的视频编码设备和视频解码设备的收发终端,可以是只包括视频编码设备的收发终端,或者可以是只包括视频解码设备的收发终端。
根据本公开的通信***不限于上文参考图24描述的通信***。例如,图25示出根据实施方式的采用通信***的数字广播***。
根据实施方式的图25的数字广播***可通过使用本公开的视频编码设备和视频解码设备来接收经由卫星或地面网络传输的数字广播。
更具体地,广播站12890通过使用无线电波而将视频数据流传输到通信卫星或广播卫星12900。广播卫星12900传输广播信号,并且广播信号经由***12860传输到卫星广播接收器。在每个家庭中,编码的视频流可由TV接收器12810、机顶盒12870或另一装置解码并播放。
当本公开的视频解码设备实施于播放设备12830中时,播放设备12830可对记录在存储介质12820(诸如,磁盘或存储卡)上的编码视频流进行解析和解码,以重建数字信号。因此,重建的视频信号可例如在显示器12840上播放。
在连接到用于卫星/地面广播的天线12860或用于接收电缆电视(TV)广播的电缆天线12850的机顶盒12870中,可安装本公开的视频解码设备。从机顶盒12870输出的数据也可在TV显示器12880上播放。
作为另一示例,本公开的视频解码设备可安装在TV接收器12810中,而不是机顶盒12870中。
具有适当天线12910的汽车12920可接收从卫星12900或图23的无线基站11700传输的信号。解码的视频可在安装于汽车12920中的汽车导航***12930的显示屏上播放。
视频信号可由本公开的视频编码设备进行编码,并且可随后记录并存储到存储介质中。具体而言,图像信号可由DVD记录器存储在DVD光盘12960中,或者可由硬盘记录器12950存储在硬盘中。作为另一示例,视频信号可存储在SD卡12970中。如果硬盘记录器12950包括本公开的视频解码设备,那么记录在DVD光盘12960、SD卡12970或另一存储介质上的视频信号可在TV显示器12880上播放。
汽车导航***12930可不包括图26的相机12530、相机接口12630和图像编码器12720。例如,计算机12100和TV接收器12810可不包括图26的相机12530、相机接口12630和图像编码器12720。
图26是示出根据实施方式的使用视频编码设备和视频解码设备的云计算***的网络结构的示意图。
云计算***可包括云计算服务器14000、用户数据库(DB)14100、多个计算资源14200以及用户终端。
响应于来自用户终端的请求,云计算***经由数据通信网络(例如,互联网)来提供多个计算资源14200的按需外包服务。在云计算环境下,通过使用虚拟化技术将位于物理上不同位置的数据中心处的计算资源相结合,服务提供商为用户提供所需的服务。服务用户不必将计算资源(例如,应用程序、存储设备、操作***(OS)和安全应用)安装到他/她自己的终端中以进行使用,而是可在所需的时间点从通过虚拟化技术生成的虚拟空间中的服务之中选择并使用所需服务。
指定服务用户的用户终端经由包括互联网和移动远程通信网络的数据通信网络连接到云计算服务器14000。从云计算服务器14000可对用户终端提供云计算服务,具体地如视频播放服务。用户终端可以是能够连接到互联网的各种类型的电子装置,例如,台式PC14300、智能TV 14400、智能电话14500、笔记本电脑14600、便携式多媒体播放器(PMP)14700、平板PC 14800等。
云计算服务器14000可将分布在云网络中的多个计算资源14200进行组合,并且将组合的结果提供到用户终端。多个计算资源14200可包括各种数据服务,并且可包括从用户终端上传的数据。如上文所述,云计算服务器14000可通过根据虚拟化技术将分布在不同区域中的视频数据库进行组合来将所需的服务提供到用户终端。
与订阅云计算服务的用户有关的用户信息存储在用户数据库14100中。用户信息可包括用户的登录信息、地址、名字和个人信用信息。用户信息可进一步包括视频的索引。此处,索引可包括已经播放的视频列表、正在播放的视频列表、过去播放的视频的暂停点等。
存储在用户数据库14100中的与视频有关的信息可在用户装置之间共享。例如,当响应于来自笔记本电脑14600的请求而将视频服务提供到笔记本电脑14600时,视频服务的播放历史便存储在用户数据库14100中。当从智能电话14500接收播放该视频服务的请求时,云计算服务器14000基于用户数据库14100来搜索并播放该视频服务。当智能电话14500接收来自云计算服务器14000的视频数据流时,通过对视频数据流进行解码来播放视频的过程类似于上文参考图24描述的移动电话12500的操作。
云计算服务器14000可参考存储在用户数据库14100中的所需视频服务的播放历史。例如,云计算服务器14000接收来自用户终端的播放存储在用户数据库14100中的视频的请求。如果这个视频已在播放,那么由云计算服务器14000执行的流传输这个视频的方法可根据用户终端的请求而改变,即,根据从视频的开头还是暂停点开始播放该视频。例如,如果用户终端请求从开头开始播放该视频,那么云计算服务器14000将从第一帧开始的视频的流数据传输到用户终端。如果用户终端请求从暂停点开始播放该视频,那么云计算服务器14000将从对应于暂停点的帧开始的视频的流数据传输到用户终端。
在这种情况下,用户终端可包括如上文参考图1a到图19描述的本公开的视频解码设备。作为另一示例,用户终端可包括如上文参考图1a到图19描述的本公开的视频编码设备。或者,用户终端可包括如上文参考图1a到图19描述的本公开的视频解码设备和视频编码设备两者。
上文已参考图20到图26描述了根据上文参考图1a到图19描述的实施方式的视频编码方法、视频解码方法、视频编码设备和视频解码设备的各种应用。然而,根据实施方式的将视频编码方法和视频解码方法存储在存储介质中的方法或者在装置中实施视频编码设备和视频解码设备的方法不限于上文参考图20到图26描述的实施方式。
根据本公开的方法、过程、产品和/或***简单、经济有效、不复杂,而且应用广泛且准确。此外,当公知的元件应用到根据本公开的过程、设备、产品和***时,它们可直接使用,并且高效而经济地制造、应用和使用。本公开的其他重要方面匹配追求成本降低、***简化和性能改善的当前趋势。本公开的实施方式的有用方面因而将至少提高当前技术的水平。
尽管上文已描述本公开的示例性实施方式,但本领域普通技术人员将明白,这些实施方式涵盖落入本发明的范围内的所有更改、等同以及替代。换言之,所附权利要求应被理解为涵盖落入本发明的范围内的所有更改、等同以及替代。因此,在本公开中描述且在附图中示出的所有事项应理解为仅仅是示例,而不意图限制本发明的范围。

Claims (10)

1.一种层间视频解码方法,包括:
从比特流中获取深度图像的当前块的预测模式信息;
基于所述预测模式信息生成所述当前块的预测块;以及
通过使用所述预测块对所述深度图像进行解码,
其中,从所述比特流中获取所述当前块的所述预测模式信息包括:
接收第一标记、第二标记和第三标记,其中,所述第一标记表明是否准许通过根据图案将所述当前块分成两个或更多分区来进行所述当前块的预测,所述第二标记表明所述深度图像是否准许通过使用楔波将所述深度图像的块分成两个或更多分区来预测所述块,以及所述第三标记表明所述深度图像是否准许通过使用轮廓将所述深度图像的所述块分成两个或更多分区来预测所述块;以及
在基于所述第一标记、所述第二标记和所述第三标记确定的预定条件得到满足时从所述比特流中接收第四标记,其中,所述第四标记表示与根据所述图案将所述当前块分成两个或更多分区的方法的类型有关的信息。
2.根据权利要求1所述的层间视频解码方法,其中,所述第二标记还表明所述深度图像是否准许使用帧内简化深度编码(SDC)模式来预测所述深度图像的所述块。
3.根据权利要求1所述的层间视频解码方法,其中,所述第四标记限定:
通过使用所述楔波将所述当前块分成两个或更多分区来预测所述当前块的方法;或者
通过使用所述轮廓将所述当前块分成两个或更多分区来预测所述当前块的方法。
4.根据权利要求1所述的层间视频解码方法,其中,当所述深度图像不准许参考与所述深度图像的所述块对应的纹理图像时,所述第三标记表示所述深度图像不准许通过使用所述轮廓将所述深度图像的所述块分成两个或更多分区来预测所述块的方法。
5.根据权利要求1所述的层间视频解码方法,其中,获取所述深度图像的所述当前块的所述预测模式信息包括:当所述第一标记表明准许通过根据所述图案将所述当前块分成两个或更多分区来预测所述当前块的方法,所述第二标记表明所述深度图像准许通过使用所述楔波将所述深度图像的所述块分成两个或更多分区来预测所述块的方法,以及所述第三标记表明所述深度图像准许通过使用所述轮廓将所述深度图像的所述块分成两个或更多分区来预测所述块的方法时,确定所述预定条件得到满足。
6.根据权利要求1所述的层间视频解码方法,其中,在获取所述深度图像的所述当前块的所述预测模式信息期间:
当所述预定条件未被满足,所述第二标记表明所述深度图像准许通过使用所述楔波将所述深度图像的所述块分成两个或更多分区来预测所述块的方法,以及所述第三标记表明所述深度图像不准许通过使用所述轮廓将所述深度图像的所述块分成两个或更多分区来预测所述块的方法时,确定通过使用所述楔波将所述当前块分成两个或更多分区来预测所述当前块;以及
当所述预定条件未被满足,所述第二标记表明所述深度图像不准许通过使用所述楔波将所述深度图像的所述块分成两个或更多分区来预测所述块的方法,以及所述第三标记表明所述深度图像准许通过使用所述轮廓将所述深度图像的所述块分成两个或更多分区来预测所述块的方法时,确定通过使用所述轮廓将所述当前块分成两个或更多分区来预测所述当前块。
7.一种层间视频编码方法,包括:
确定深度图像的当前块的预测模式;
通过使用所确定的预测模式来生成所述当前块的预测块;以及
通过使用所述预测块对所述深度图像进行编码,从而生成比特流;
其中,确定所述当前块的所述预测模式包括:
生成第一标记、第二标记和第三标记,其中,所述第一标记表明是否准许通过根据图案将所述当前块分成两个或更多分区来进行所述当前块的预测,所述第二标记表明所述深度图像是否准许通过使用楔波将所述深度图像的块分成两个或更多分区来预测所述块,以及所述第三标记表明所述深度图像是否准许通过使用轮廓将所述深度图像的所述块分成两个或更多分区来预测所述块;以及
在基于所述第一标记、所述第二标记和所述第三标记确定的预定条件得到满足时生成第四标记,其中,所述第四标记表示与根据所述图案将所述当前块分成两个或更多分区的方法的类型有关的信息。
8.一种层间视频解码设备,包括:
预测模式确定器,配置成从比特流中获取深度图像的当前块的预测模式信息;
预测块生成器,配置成基于所述预测模式信息来生成所述当前块的预测块;以及
解码器,配置成通过使用所述预测块对所述深度图像进行解码,
其中,所述预测模式确定器接收第一标记、第二标记和第三标记,以及在基于所述第一标记、所述第二标记和所述第三标记确定的预定条件得到满足时接收第四标记,
其中:
所述第一标记表明是否准许通过根据图案将所述当前块分成两个或更多分区来进行所述当前块的预测;
所述第二标记表明所述深度图像是否准许通过使用楔波将所述深度图像的块分成两个或更多分区来预测所述块;
所述第三标记表明所述深度图像是否准许通过使用轮廓将所述深度图像的所述块分成两个或更多分区来预测所述块;以及
所述第四标记表示与根据所述图案将所述当前块分成两个或更多分区的方法的类型有关的信息。
9.一种层间视频编码设备,包括:
预测模式确定器,配置成确定深度图像的当前块的预测模式;
预测块生成器,配置成通过使用所确定的预测模式来生成所述当前块的预测块;以及
编码器,配置成通过使用所述预测块对所述深度图像进行编码,从而生成比特流;
其中,所述预测模式确定器生成第一标记、第二标记和第三标记,以及在基于所述第一标记、所述第二标记和所述第三标记确定的预定条件得到满足时生成第四标记,
其中:
所述第一标记表明是否准许通过根据图案将所述当前块分成两个或更多分区来进行所述当前块的预测;
所述第二标记表明所述深度图像是否准许通过使用楔波将所述深度图像的块分成两个或更多分区来预测所述块;
所述第三标记表明所述深度图像是否准许通过使用轮廓将所述深度图像的所述块分成两个或更多分区来预测所述块;以及
所述第四标记表示与根据所述图案将所述当前块分成两个或更多分区的方法的类型有关的信息。
10.一种计算机可读记录介质,所述计算机可读记录介质记录有程序,所述程序用于在计算机上执行根据权利要求1到7中任一项所述的方法。
CN201580033274.3A 2014-06-20 2015-06-22 用于传输深度图像的预测模式以供层间视频编码和解码的方法和装置 Withdrawn CN106464908A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462014811P 2014-06-20 2014-06-20
US62/014,811 2014-06-20
PCT/KR2015/006283 WO2015194915A1 (ko) 2014-06-20 2015-06-22 인터 레이어 비디오 부복호화를 위한 깊이 영상의 예측 모드 전송 방법 및 장치

Publications (1)

Publication Number Publication Date
CN106464908A true CN106464908A (zh) 2017-02-22

Family

ID=54935817

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580033274.3A Withdrawn CN106464908A (zh) 2014-06-20 2015-06-22 用于传输深度图像的预测模式以供层间视频编码和解码的方法和装置

Country Status (5)

Country Link
US (1) US10368098B2 (zh)
JP (1) JP2017523682A (zh)
KR (1) KR20170023000A (zh)
CN (1) CN106464908A (zh)
WO (1) WO2015194915A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108234987A (zh) * 2018-01-23 2018-06-29 西南石油大学 一种用于深度图像边界拟合的双抛物线分区模板优化方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU3250093A (en) 1991-12-12 1993-07-19 Gilead Sciences, Inc. Nuclease stable and binding competent oligomers and methods for their use
US10244256B2 (en) * 2014-10-08 2019-03-26 Sharp Kabushiki Kaisha Image decoding device
US10297009B2 (en) * 2014-12-22 2019-05-21 Interdigital Ce Patent Holdings Apparatus and method for generating an extrapolated image using a recursive hierarchical process
JP2018050091A (ja) * 2015-02-02 2018-03-29 シャープ株式会社 画像復号装置、画像符号化装置および予測ベクトル導出装置
US11463689B2 (en) 2015-06-18 2022-10-04 Qualcomm Incorporated Intra prediction and intra mode coding
US10142627B2 (en) 2015-06-18 2018-11-27 Qualcomm Incorporated Intra prediction and intra mode coding
US10841593B2 (en) 2015-06-18 2020-11-17 Qualcomm Incorporated Intra prediction and intra mode coding
WO2018008905A1 (ko) * 2016-07-05 2018-01-11 주식회사 케이티 비디오 신호 처리 방법 및 장치
CN107071478B (zh) * 2017-03-30 2019-08-20 成都图必优科技有限公司 基于双抛物线分区模板的深度图编码方法
PL3610654T3 (pl) 2017-04-11 2022-02-14 Dolby Laboratories Licensing Corporation Wrażenia z warstwowej rozszerzonej rozrywki
US11277644B2 (en) 2018-07-02 2022-03-15 Qualcomm Incorporated Combining mode dependent intra smoothing (MDIS) with intra interpolation filter switching
US11303885B2 (en) 2018-10-25 2022-04-12 Qualcomm Incorporated Wide-angle intra prediction smoothing and interpolation
EP3903487A4 (en) 2018-12-28 2022-09-21 Telefonaktiebolaget Lm Ericsson (Publ) METHOD AND DEVICE FOR TRANSFORMATION SELECTION IN AN ENCODER AND DECODER
EP3900333A4 (en) * 2019-02-15 2022-05-25 Huawei Technologies Co., Ltd. ENCODERS, DECODERS AND RELATIVE METHODS FOR LIMITING THE SIZE OF SUBDIVISIONS FROM A TOOL WITH INTRADIVISION CODING MODE
US20220312034A1 (en) * 2019-06-24 2022-09-29 Interdigital Vc Holdings France, Sas Intra prediction for video encoding and decoding
WO2021110045A1 (en) * 2019-12-03 2021-06-10 Huawei Technologies Co., Ltd. Coding method, device, system with merge mode

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101945288A (zh) * 2010-10-19 2011-01-12 浙江理工大学 一种基于h.264压缩域图像深度图生成方法
CN102857763A (zh) * 2011-06-30 2013-01-02 华为技术有限公司 一种基于帧内预测的解码方法和解码装置
WO2013016004A1 (en) * 2011-07-22 2013-01-31 Qualcomm Incorporated Coding motion depth maps with depth range variation
WO2013042884A1 (ko) * 2011-09-19 2013-03-28 엘지전자 주식회사 영상 부호화/복호화 방법 및 그 장치
CN103067716A (zh) * 2013-01-10 2013-04-24 华为技术有限公司 深度图像的编解码方法和编解码装置
WO2013062389A1 (ko) * 2011-10-28 2013-05-02 삼성전자 주식회사 비디오의 인트라 예측 방법 및 장치
WO2013068566A1 (en) * 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Adaptive partition coding
WO2013068567A1 (en) * 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Effective prediction using partition coding
WO2013068564A1 (en) * 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Effective wedgelet partition coding using spatial prediction
CN103155558A (zh) * 2010-08-11 2013-06-12 弗兰霍菲尔运输应用研究公司 多视点信号编解码器
WO2013100635A1 (ko) * 2011-12-30 2013-07-04 (주)휴맥스 3차원 영상 부호화 방법 및 장치, 및 복호화 방법 및 장치
CN103237214A (zh) * 2013-04-12 2013-08-07 华为技术有限公司 深度图像的编解码方法和编解码装置
US20130243088A1 (en) * 2010-12-17 2013-09-19 Electronics And Telecommunications Research Institute Method and apparatus for inter prediction
CN104010196A (zh) * 2014-03-14 2014-08-27 北方工业大学 基于hevc的3d质量可伸缩视频编码

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101357982B1 (ko) 2006-01-09 2014-02-05 톰슨 라이센싱 멀티-뷰 비디오 코딩을 위한 축소 해상도 갱신 모드를제공하는 방법 및 장치
ZA200805337B (en) 2006-01-09 2009-11-25 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multiview video coding
EP3050294A4 (en) * 2013-09-27 2017-08-09 Qualcomm Incorporated Residual coding for depth intra prediction modes
US9756359B2 (en) * 2013-12-16 2017-09-05 Qualcomm Incorporated Large blocks and depth modeling modes (DMM'S) in 3D video coding

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103155558A (zh) * 2010-08-11 2013-06-12 弗兰霍菲尔运输应用研究公司 多视点信号编解码器
CN101945288A (zh) * 2010-10-19 2011-01-12 浙江理工大学 一种基于h.264压缩域图像深度图生成方法
US20130243088A1 (en) * 2010-12-17 2013-09-19 Electronics And Telecommunications Research Institute Method and apparatus for inter prediction
CN102857763A (zh) * 2011-06-30 2013-01-02 华为技术有限公司 一种基于帧内预测的解码方法和解码装置
WO2013016004A1 (en) * 2011-07-22 2013-01-31 Qualcomm Incorporated Coding motion depth maps with depth range variation
WO2013042884A1 (ko) * 2011-09-19 2013-03-28 엘지전자 주식회사 영상 부호화/복호화 방법 및 그 장치
WO2013062389A1 (ko) * 2011-10-28 2013-05-02 삼성전자 주식회사 비디오의 인트라 예측 방법 및 장치
WO2013068566A1 (en) * 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Adaptive partition coding
WO2013068567A1 (en) * 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Effective prediction using partition coding
WO2013068564A1 (en) * 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Effective wedgelet partition coding using spatial prediction
WO2013100635A1 (ko) * 2011-12-30 2013-07-04 (주)휴맥스 3차원 영상 부호화 방법 및 장치, 및 복호화 방법 및 장치
CN103067716A (zh) * 2013-01-10 2013-04-24 华为技术有限公司 深度图像的编解码方法和编解码装置
CN103237214A (zh) * 2013-04-12 2013-08-07 华为技术有限公司 深度图像的编解码方法和编解码装置
CN104010196A (zh) * 2014-03-14 2014-08-27 北方工业大学 基于hevc的3d质量可伸缩视频编码

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
SACHIN DESHPANDE: "On Indications for Inter-layer Prediction", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108234987A (zh) * 2018-01-23 2018-06-29 西南石油大学 一种用于深度图像边界拟合的双抛物线分区模板优化方法

Also Published As

Publication number Publication date
KR20170023000A (ko) 2017-03-02
WO2015194915A1 (ko) 2015-12-23
JP2017523682A (ja) 2017-08-17
US20170251224A1 (en) 2017-08-31
US10368098B2 (en) 2019-07-30

Similar Documents

Publication Publication Date Title
CN106464908A (zh) 用于传输深度图像的预测模式以供层间视频编码和解码的方法和装置
CN106797467B (zh) 用于图像填充区域的视频编码和解码方法和设备
CN105532001B (zh) 用于使用基于深度的视差矢量对视频进行层间编码方法以及解码方法和设备
CN105308966B (zh) 视频编码方法及其设备以及视频解码方法及其设备
CN103931192B (zh) 用于在视频编码或解码中的运动矢量确定的方法和设备
CN106063271B (zh) 用于执行基于子块的预测的层间视频解码方法及其设备以及用于执行基于子块的预测的层间视频编码方法及其设备
CN104396252B (zh) 使用用于多视点视频预测的参考画面集的多视点视频编解码方法及其装置
CN105144713B (zh) 用于解码器设置的对视频进行编码的方法及其装置以及基于解码器设置对视频进行解码的方法及其装置
CN107113442A (zh) 用于对运动矢量进行编码/解码的方法和装置
CN105556972B (zh) 用于层间视频解码和编码设备和方法的对深度图像的场景内预测方法
CN104365104B (zh) 用于多视点视频编码和解码的方法和设备
CN103875249B (zh) 用于多视点视频预测编码的方法和装置以及用于多视点视频预测解码的方法和装置
CN105594212B (zh) 用于确定运动矢量的方法及其设备
CN106031175B (zh) 使用亮度补偿的层间视频编码方法及其装置、以及视频解码方法及其装置
CN106664413A (zh) 用于补偿亮度差的层间视频编码方法和装置以及视频解码方法和装置
CN107005711A (zh) 逐样本预测编码设备和方法
CN107409214A (zh) 用于对层间视频进行解码的方法和设备以及用于对层间视频进行编码的方法和设备
CN105103552A (zh) 用于补偿亮度差的对层间视频进行编码的方法及其装置以及用于对视频进行解码的方法及其装置
CN105264894A (zh) 针对层间解码和编码方法以及设备的确定帧间预测候选的方法
CN105325002A (zh) 使用视点合成预测的多视点视频编码方法及其设备以及多视点视频解码方法及其设备
CN105340275A (zh) 使用视点合成预测的多视点视频编码方法及其设备以及多视点视频解码方法及其设备
CN106576175A (zh) 多视点图像编码/解码方法和装置
CN106416256B (zh) 用于对深度图像进行编码或解码的方法和设备
CN106664415A (zh) 使用深度块的多层视频编码方法和多层视频解码方法
CN105264890B (zh) 用于补偿亮度差的层间视频编码方法和设备以及层间视频解码方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20170222