CN105519112A - 可扩展视频信号编码/解码方法及装置 - Google Patents

可扩展视频信号编码/解码方法及装置 Download PDF

Info

Publication number
CN105519112A
CN105519112A CN201480048665.8A CN201480048665A CN105519112A CN 105519112 A CN105519112 A CN 105519112A CN 201480048665 A CN201480048665 A CN 201480048665A CN 105519112 A CN105519112 A CN 105519112A
Authority
CN
China
Prior art keywords
layer
picture
inter
prediction
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480048665.8A
Other languages
English (en)
Inventor
李培根
金柱英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KT Corp
Original Assignee
KT Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KT Corp filed Critical KT Corp
Priority claimed from PCT/KR2014/008101 external-priority patent/WO2015034216A1/ko
Publication of CN105519112A publication Critical patent/CN105519112A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/39Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本发明的可扩展视频信号解码方法包括:确定用于当前层内的当前画面的层间预测的参考层的相应画面;通过对所确定的相应画面进行上采样来生成层间参考画面;生成包括层间参考画面的参考画面列表;以及基于参考画面列表来执行当前画面的帧间预测。

Description

可扩展视频信号编码/解码方法及装置
技术领域
本发明涉及可扩展视频信号编码/解码方法以及装置。
背景技术
近来,在各个应用领域对高分辨率的高品质视频如HD(高清)视频和UHD(超高清)视频的需求在不断增加。由于视频数据具有高分辨率的高品质图像,所以相比现有视频数据而言数据量较大。因此,当使用媒介如现有的有线及无线宽带线路来传输视频数据或者将视频数据存储在现有的存储介质中时,传输成本和存储成本会增加。为了解决由高分辨率的高品质数据造成的这些问题,可以使用高效的视频压缩技术。
关于视频压缩技术,存在如下各种技术:用于根据当前画面之前或之后的画面来预测包括在当前画面中的像素值的帧间预测技术;用于使用关于包括在当前画面中的像素的信息来预测当前画面中的像素值的帧内预测技术;其中最短的码被分配给最频繁使用的值并且最长的码被分配给最少使用的值的熵编码技术等。视频数据可以使用这些视频压缩技术来高效地压缩,并且然后可以被传输或存储。
同时,随着对高分辨率视频的需求的增加,由于新的视频业务而对立体声视频内容的需求也在不断增加。下面讨论用于高效地提供高分辨率及超高分辨率立体视频内容的视频压缩技术。
发明内容
技术问题
本发明的目的是提供一种用于当对可扩展视频(scalablevideo)信号进行编码/解码时用于确定要用于当前画面的层间预测的参考层的相应画面的方法及装置。
本发明的另一目的是提供一种当对可扩展视频信号进行编码/解码时用于对参考层的相应画面进行上采样的方法以及装置。
本发明的又一目的是提供一种用于当对可扩展视频信号进行编码/解码时使用层间参考画面来构建参考画面列表的方法及装置。
本发明的再一目的是提供一种用于当对可扩展视频信号进行编码/解码时经由层间预测高效地导出当前层的纹理信息的方法及装置。
技术方案
根据本发明的可扩展视频信号解码方法及装置表征为:确定要用于当前层中的当前画面的层间预测的参考层的相应画面;通过对所确定的相应画面进行上采样来生成层间参考画面;生成包括层间参考画面的参考画面列表;以及基于参考画面列表来执行当前画面的帧间预测。
可以基于用于当前画面的层间参考信息来确定根据本发明的参考层的相应画面。
根据本发明的层间参考信息可以包括层间预测标签、关于参考画面的数目的信息和参考层标识符中的至少一个。
可以基于参考有效标签来获取根据本发明的层间预测标签,以及该层间预测标签可以是用于指示与当前层具有直接相关性的所有层的相应画面是否被用于当前画面的层间预测的信息。
根据本发明确定的相应画面可以是与当前层具有直接相关性的层中由参考层标识符指定的层的相应画面。
根据本发明的可扩展视频信号解码方法及装置表征为:确定要用于当前层中的当前画面的层间预测的参考层的相应画面;通过对所确定的相应画面进行上采样来生成层间参考画面;生成包括层间参考画面的参考画面列表;以及基于参考画面列表来执行当前画面的帧间预测。
可以基于用于当前画面的层间参考信息来确定根据本发明的参考层的相应画面。
根据本发明的层间参考信息可以包括层间预测标签、关于参考画面的数目的信息和参考层标识符中的至少一个。
可以基于参考有效标签来获取根据本发明的层间预测标签,以及该层间预测标签可以是用于指示与当前层具有直接相关性的所有层的相应画面是否被用于当前画面的层间预测的信息。
根据本发明确定的相应画面可以是与当前层具有直接相关性的层中由参考层标识符指定的层的相应画面。
有利效果
根据本发明,可以有效地确定要用于当前层中的当前画面的层间预测的参考层的相应画面。
根据本发明,可以对参考层的画面进行高效的上采样。
根据本发明,可以高效地构建包括层间参考画面的参考画面列表。
根据本发明,可以经由层间预测来高效地导出当前层的纹理信息。
附图说明
图1是示意性地示出了根据本发明的实施方式的编码装置的框图;
图2是示意性地示出了根据本发明的实施方式的解码装置的框图;
图3是示出了根据应用了本发明的实施方式的使用参考层的相应画面来进行当前层的帧间预测的过程的流程图;
图4示出了根据应用了本发明的实施方式的用于基于参考有效标签来确定参考层的相应画面的方法;
图5示出了根据应用了本发明的实施方式的用于参考有效标签的语法表;
图6示出了根据应用了本发明的实施方式的用于获取当前画面的层间参考信息的方法;
图7示出了根据应用了本发明的实施方式的用于层间参考信息的语法表;
图8示出了根据应用了本发明的实施方式的用于基于参考存在标签来确定参考层的相应画面的方法;
图9示出示出了根据应用了本发明的实施方式的用于参考存在标签的语法表;
图10示出了根据应用了本发明的实施方式的用于获取当前画面的层间参考信息的方法;
图11示出了根据应用了本发明的实施方式的用于层间参考信息的语法表;
图12是示出了根据应用了本发明的实施方式的用于对参考层的相应画面进行上采样的方法的流程图;
图13是示出了用于指定存储在解码画面缓冲器中的短期参考画面的方法的图;
图14示出了根据应用了本发明的实施方式的用于指定长期参考画面的方法;以及
图15示出了根据应用了本发明的实施方式的使用短期参考画面和长期参考画面来构建参考画面列表的方法。
最佳实施方式
根据本发明的可扩展视频信号解码方法及装置表征为:确定要用于当前层中的当前画面的层间预测的参考层的相应画面;通过对所确定的相应画面进行上采样来生成层间参考画面;生成包括层间参考画面的参考画面列表;以及基于参考画面列表来执行当前画面的帧间预测。
可以基于用于当前画面的层间参考信息来确定根据本发明的参考层的相应画面。
根据本发明的层间参考信息可以包括层间预测标签、关于参考画面的数目的信息和参考层标识符中的至少一个。
可以基于参考有效标签来获取根据本发明的层间预测标签,以及该层间预测标签可以是用于指示与当前层具有直接相关性的所有层的相应画面是否被用于当前画面的层间预测的信息。
根据本发明确定的相应画面可以是与当前层具有直接相关性的层中由参考层标识符指定的层的相应画面。
根据本发明的可扩展视频信号解码方法及装置表征为:确定要用于当前层中的当前画面的层间预测的参考层的相应画面;通过对所确定的相应画面进行上采样来生成层间参考画面;生成包括层间参考画面的参考画面列表;以及基于参考画面列表来执行当前画面的帧间预测。
可以基于用于当前画面的层间参考信息来确定根据本发明的参考层的相应画面。
根据本发明的层间参考信息可以包括层间预测标签、关于参考画面的数目的信息和参考层标识符中的至少一个。
可以基于参考有效标签来获取根据本发明的层间预测标签,并且该层间预测标签可以是用于指示与当前层具有直接相关性的所有层的相应画面是否被用于当前画面的层间预测的信息。
根据本发明确定的相应画面可以是与当前层具有直接相关性的层中由参考层标识符指定的层的相应画面。
具体实施方式
在下文中,将参考附图来描述本发明的优选实施方式。在本说明书和权利要求书中的术语或词语不应被理解为限于通常含义或词典定义。本发明应当被理解为具有与基于以下原则的本发明的技术精神符合的含义:发明人可以适当地定义术语的概念以最佳地描述其发明。因此,说明书中所描述的实施方式以及在附图中示出的配置仅为优选示例并且未排他性地呈现本发明的技术精神。从而,应当理解,在提交本申请时会有可以替选上述实施方式和配置的各种等同方案和修改。
在此说明书中,当提到一个元件与另外的元件“连接”或“耦接”时,可以表示一个元件可以与另一个元件直接连接或耦接,并且第三元件可以“连接”或“耦接”在这两个元件之间。此外,在此说明书中,当提及“包括”特定元件时,可以表示在本发明的实施方式中或本发明的技术精神范围中不排除除了该特定元件以外的元件并且可以包括另外的元件。
术语如“第一”和“第二”可以用于描述各种元件,但元件不受术语的限制。术语仅用于将一个元件与另一个元件区分开。例如,可以在不偏离本发明的范围的情况下将第一元件命名为第二元件。同样地,可以将第二元件命名为第一元件。
此外,单独地示出在本发明的实施方式中描述的元件模块以表示不同的和特征性功能,但这并不意味着每个元件模块由分离的硬件或软件形成。亦即,出于描述方面起见来布置和包括元件模块,并且元件模块中的至少两个可以形成一个元件模块,或者一个元件模块可以划分成多个元件模块以执行其各自的功能。除非偏离了本发明的本质,否则在本发明的范围内包括其中元件模块被集成的实施方式以及其中元件模块被分离的实施方式。
此外,在本发明中,一些元件不是用于执行必需功能的必需元件,而是仅用于提高性能的可选元件。可以仅使用除了仅用于提高性能的元件以外的用于实现本发明的实质的仅必须元件来实现本发明,并且在本发明的范围中包括包含仅必需元件的结构而不包括仅用于提供性能的可选元件。
支持多层比特流的视频编码和解码被称为可扩展视频编码。因为在多个层之间具有很强的相关性,所以当使用这个相关性来执行预测时,可以去除重复的元件并且可以提高视频编码性能。使用关于另外的层的信息来预测当前层被称为层间预测。
多个层可以具有不同的分辨率,并且分辨率可以表示空间分辨率、时间分辨率和图像品质中的至少一个。当进行层间预测时,可以进行层的重采样如上采样或下采样以调整分辨率。
图1为示意性地示出根据本发明的实施方式的编码装置的框图。
根据本发明的编码装置100包括用于上层的编码单元100a和用于下层的编码单元100b。
上层可以被称为当前层或增强层,而下层可以被称为具有低于上层的分辨率的分辨率的增强层、基本层或参考层。空间分辨率、基于帧速率的时间分辨率、颜色格式和基于量化步长的图像质量中的至少一个可以在上层与下层之间互不相同。当需要改变分辨率以用于层间预测时,可以对层执行上采样或下采样。
用于上层的编码单元100a可以包括:划分单元110、预测单元120、变换单元130、量化单元140、重新布置单元150、熵编码单元160、解量化单元170、逆变换单元180、滤波器单元190和存储器195。
用于下层的编码单元100b可以包括:划分单元111、预测单元125、变换单元131、量化单元141、重新布置单元151、熵编码单元161、解量化单元171、逆变换单元181、滤波器单元191和存储器196。
可以通过在本发明的实施方式中描述的视频编码方法来实现编码单元,将在下面对其进行描述,但是可以不执行一些部件的操作,以减小编码装置的复杂性或者使得能够快速实时地进行编码。例如,当预测单元执行帧内预测时,可以执行从有限数目的帧内预测模式中选择一个并且将所选择的一个设置为最终的帧内预测模式的方法,以用于进行实时编码,而不是执行将所有帧内预测模式方法用来选择最佳帧内编码方法的方法。在另一示例中,用于帧内预测或帧间预测的预测块可以具有有限的形状。
在编码装置中处理的块的单元可以是用于执行编码的编码单元、用于执行预测的预测单元或者用于执行变换的变换单元。可以将编码单元、预测单元和变换单元分别表示为CU、PU和TU。
划分单元110和划分单元111中的每个可以通过以下来对层进行划分:将层画面划分成编码块、预测块和变换块的多个组合,并且基于预定的参考(例如成本函数)来选择编码块、预测块和变换块的一个组合。例如,为了将层画面划分成编码单元,可以使用递归树结构例如四叉树结构。在下文中,在本发明的实施方式中,编码块不仅可以指用于编码的块,而且可以指用于解码的块。
预测块可以是用于执行预测(如帧内预测或帧间预测)的单元。用于帧内预测的块可以是具有正方形形式的块如2N×2N或N×N。对于用于帧间预测的块,存在正方形形式的块如2N×2N或N×N;矩形形式的块,如2N×N或N×2N;以及通过使用非对称运动划分(AMP)的预测块划分方法而获得的具有非对称形式的块。变换单元115可以取决于预测块的形式而使用不同的变换方法。
编码单元100a和编码单元100b的预测单元120和预测单元125中的每个可以包括:用于执行帧内预测的帧内预测单元121或126;以及用于执行帧间预测的帧间预测单元122或127。用于上层的编码单元100a的预测单元120可以进一步包括使用与下层有关的信息对上层执行预测的层间预测单元123。
预测单元120和125中的每个可以确定是对预测块执行帧内预测还是帧间预测。当执行帧内预测时,基于预测块来确定帧内预测模式,并且可以基于变换块来执行用于处理基于所确定的帧内预测模式的帧内预测的过程。可以将在所生成的预测块与原始块之间的残差(残差块)输入至变换单元130和131。此外,用于预测的预测模式信息和运动信息等连同残差一起通过熵编码单元130进行编码,并且可以被传输至解码装置。
当使用脉冲编码调制(PCM)模式时,原始块可以在不执行使用预测单元120和125的预测的情况下未改变地被编码,并且可以被传输至解码单元。
帧内预测单元121和126中的每个可以基于位于当前块(预测目标块)附近的参考像素来生成经帧内预测的块。在帧内预测方法中,帧内预测模式可以具有方向性预测模式和非方向性模式,其中,方向性预测模式根据预测方向来使用参考像素,非方向性模式不考虑方向信息。用于预测亮度信息的模式可以不同于用于预测色度信息的模式。通过预测亮度信息所获得的帧内预测模式或者所预测的亮度信息可以用于预测色度信息。同时,如果参考像素不可用,则可以通过将不可用的参考像素用其它像素进行替换来生成预测块。
预测块可以包括多个变换块。如果当执行帧内预测时预测块的大小与变换块的大小相同,则可以基于预测块的左侧的像素、左上像素和上方的像素来对预测块执行帧内预测。然而,在帧内预测时,当预测块的大小与变换块的大小不同并且多个变换块被包括在预测块中,则使用与变换块相邻的邻近像素作为参考像素来执行帧内预测。此处,与变换块相邻的邻近像素可以包括与预测块相邻的邻近像素和在预测块中先前被解码的像素中的至少一个。
然而,如果在进行帧内预测时预测块的大小与变换块的大小不同,并且因此预测块包括多个变换块,则可以基于变换块来确定参考像素,并且基于该参考像素来执行帧内预测。
帧内预测方法可以在根据帧内预测模式将模式依赖帧内平滑(MDIS)滤波器应用于参考像素之后生成预测块。应用于参考像素的MDIS滤波器的类型可以不同。MDIS滤波器是应用于通过执行帧内预测而生成的经帧内预测的块的附加滤波器,并且可以用于减小在参考像素与在执行预测后生成的经帧内预测的块之间的残差。当执行MDIS滤波时,可以根据帧内预测模式的方向来对参考像素以及对包括在经帧内预测的块中的一些列执行不同的滤波。
帧间预测单元122和127中的每个可以通过参考与以下的块有关的信息来执行预测:所述块被包括于在当前画面之前的画面和在当前画面之后的画面中的至少一个中。帧间预测单元122和127中的每个可以包括参考画面插值单元、运动预测单元和运动补偿单元。
参考画面插值单元可以从存储器195或196接收参考画面信息,并且可以生成与来自参考画面的小于整数像素的像素有关的信息。对于亮度像素,可以使用基于离散余弦变换(DCT-based)的8抽头的插值滤波器,其不同地设置滤波器系数以生成与以1/4像素为单位的小于整数像素的像素有关的信息。对于色度信号,可以使用基于离散余弦变换的4抽头的插值滤波器,其不同地设置滤波器系数以生成与以1/8像素为单位的小于整数像素的像素有关的信息。
帧间预测单元122和127中的每个可以基于通过参考画面插值单元进行插值的参考画面来执行运动预测。作为用于计算运动矢量的方法,可以使用各种方法如基于全搜索的块匹配算法(FBMA)、三步搜索(TSS)算法和新三步搜索(NTS)算法。运动矢量可以具有对应于插值的像素的1/2或1/4的运动矢量值。帧间预测单元122和127中的每个可以使用各种帧间预测方法中的任何一个来对当前块执行预测。
对于帧间预测方法,可以使用如以下各种方法中的任何方法:跳过法(skipmethod)、合并法和运动矢量预测(MVP)法。
在帧间预测中,运动信息(即与参考索引、运动矢量和残差信号有关的信息)被进行熵编码并且然后被传输至解码单元。当应用跳过模式时,不生成残差信号,并且因此可以省略用于变换和量化残差信号的处理。
层间预测单元123执行层间预测,以使用与下层有关的信息来对上层进行预测。层间预测单元123可以使用下层的纹理信息、运动信息等来执行层间预测。
可以通过将下层的画面设置为参考画面并且使用下层(参考层)的画面中的运动信息对上层的当前块执行预测来执行层间预测。在层间预测中被用作参考画面的参考层的画面可以是经采样以匹配当前层的分辨率的画面。另外,运动信息可以包括运动矢量和参考索引。在这种情况下,针对参考层的画面的运动矢量值可以被设置为(0,0)。
作为层间预测的示例,描述了使用下层的画面作为参考画面的预测方法,但是本发明并不限于此。层间预测单元123可以另外地执行层间纹理预测、层间运动预测、层间语法预测、层间残差预测等。
层间纹理预测可以基于参考层的纹理来得出当前层的纹理。可以对参考层的纹理进行采样以匹配当前层的分辨率,并且层间预测单元123可以基于经采样的参考层的纹理来预测当前层的纹理。
层间运动预测可以基于参考层的运动矢量来得出当前层的运动矢量。在这种情况下,参考层的运动矢量可以被缩放以匹配当前层的分辨率。层间语法预测可以基于参考层的语法来预测当前层的语法。例如,层间预测单元123可以使用参考层的语法作为当前层的语法。此外,层间残差预测可以使用在恢复的参考层的画面与恢复的当前层的画面之间的残差来重建当前层的画面。
生成包括残差信息(该残差信息是在由预测单元120和125中的每个生成的预测块与预测块的重建的块之间的差异)的残差块,并且该残差块被输入到相应的变换单元130或131。
变换单元130和131中的每个可以使用变换方法如离散余弦变换(DCT)或离散正弦变换(DST)来对残差块进行变换。可以基于用于生成残差块的预测块的帧内预测模式信息以及预测块的大小信息来确定是应用DCT还是DST对残差块进行变换。亦即,变换单元130和131中的每个可以取决于预测块的大小和预测方法而使用不同的变换方法。
量化单元140和141中的每个可以对由相应的变换单元130和131变换至频域的值进行量化。量化系数可以取决于块的类型或画面的重要性而变化。由量化单元140或141计算的值可以被提供至解量化单元170或17以及重新布置单元150或151。
重新布置单元150和151中的每个可以重新布置经量化的残差值的系数值。重新布置单元150或151可以使用系数扫描方法将两维块格式系数变成一维矢量格式系数。例如,重新布置单元150或151可以使用锯齿扫描法在从DC系数到高频带的系数的范围内扫描系数,以将两维块格式系数变成一维矢量格式系数。可以取决于变换块的大小和帧内预测模式来使用垂直扫描法和水平扫描法而不是锯齿扫描法,其中,垂直扫描法沿列方向扫描两维块格式系数,水平扫描法沿行方向扫描两维块格式系数。亦即,可以取决于变换块的大小和帧内预测模式来确定使用锯齿扫描法、垂直扫描法和水平扫描法中的哪一种方法。
熵编码单元160和161中的每个可以基于由重新布置单元150或151计算的值来执行熵编码。例如,熵编码可以使用各种编码方法如指数哥伦布编码、上下文自适应可变长度编码(CAVLC)和上下文自适应二进制算术编码(CABAC)来实现。
熵编码单元160和161可以通过接收来自重新布置单元150和151以及预测单元120和125的各种信息而基于预定的编码方法来执行熵编码,其中,所述各种信息如:编码块的残差系数信息和块类型信息、预测模式信息、划分单元信息、预测块信息和传输单元信息、运动矢量信息、参考帧信息、块的插值信息以及滤波信息等。此外,熵编码单元160和161可以对从重新布置单元150和151输入的编码单元的系数值进行熵编码。
熵编码单元160和161中的每个可以通过对帧内预测模式信息进行二进制编码来对当前块的帧内预测模式信息进行编码。熵编码单元160和161可以包括用于二进制编码的码字映射单元,并且可以取决于用于帧内预测的预测块的大小来有区别地执行二进制编码。码字映射单元可以通过二进制编码操作来适应性地生成码字映射表,或者可以具有先前生成的映射表。在另一实施方式中,熵编码单元160和161可以使用用于执行码号(code-num)映射的码号映射单元和用于执行码字映射的码字映射单元来表示与当前块有关的帧内预测模式信息。码号映射单元和码字映射单元可以分别生成码号映射表和码字映射表,或者可以分别具有先前生成的码号映射表和码字映射表。
解量化单元170和171以及逆变换单元180或181中的每个可以对通过量化单元140或141量化的值进行解量化,并且对通过变换单元130或131变换的值进行逆变换。可以将由解量化单元170或171以及逆变换单元180或181生成的残差值与由包括在预测单元120或125中的帧内预测单元、运动补偿单元以及运动估计单元预测的预测块进行组合,由此可以生成重建的块。
滤波器单元190和191中的每个可以包括解块滤波器和偏移校正单元中的至少一个。
解块滤波器可以在重建的画面中消除由于块之间的边界而生成的块失真。可以基于包括在块的一些行或列中的像素来确定是否执行解块(即是否将解块滤波器应用于当前块)。当将解块滤波器应用于块时,可以根据所要求的解块滤波的强度来应用强滤波器或弱滤波器。此外,在应用解块滤波器中,当执行垂直滤波和水平滤波时,可以并行处理垂直滤波和水平滤波。
偏移校正单元可以以像素为单位对在被执行解块的画面与原始画面之间的偏移进行校正。为了对特定画面执行偏移校正,可以使用将包括在画面中的像素分成某些区域、确定要应用偏移的区域以及将偏移应用于该区域的方法,或者可以使用在考虑与每个像素的边缘有关的信息的情况下应用偏移的方法。
滤波器单元190和191中的每个可以仅使用解块滤波器来实现,或者可以使用解块滤波器和偏移校正二者来实现,而不是使用全部的解块滤波器和偏移校正来实现。
存储器195和196中的每个可以存储由滤波器单元190或191计算的重建的块或画面,并且存储在存储器中的重建的块和画面可以在执行帧内预测时被提供至预测单元120和125。
从下层的熵编码单元100b输出的信息以及从上层的熵编码单元100a输出的信息通过多路复用器MUX197多路复用,并且然后可以采用比特流的形式被输出。
MUX197可以包括在上层的编码单元100a或下层的编码单元100b中,或者可以实现为与编码单元100不同的单独的装置或模块。
图2为示意性地示出根据本发明的实施方式的解码装置的框图。
如图2所示,解码装置200包括上层的解码单元200a和下层的解码单元200b。
上层的解码单元200a可以包括熵解码单元210、重新布置单元220、解量化单元230、逆变换单元245、预测单元250、滤波器单元260和存储器270。
下层的解码单元200b可以包括熵解码单元211、重新布置单元221、解量化单元231、逆变换单元241、预测单元251、滤波器单元261和存储器271。
当对来自编码装置的包括多个层的比特流进行传输时,解多路复用器(DEMUX)280对与每一层对应的信息进行解复用,并且将结果传输至每一层的解码单元200a或200b。可以通过作为编码装置的处理的反转的处理而对输入比特流进行解码。
熵解码单元210和211中的每个可以通过由编码装置的熵编码单元执行的熵编码处理的反转来执行熵解码。在通过熵解码单元210和211解码的信息片段中,需要用来生成预测块的信息被提供至预测单元250和251,并且通过熵解码单元进行熵解码的残差可以被输入至重新布置单元220和221。
像熵编码单元160和161一样,熵解码单元210和211中的每个可以使用CABAC和CAVLC中的至少一个。
熵解码单元210和211中的每个可以对与由编码装置执行的帧内预测和帧间预测有关的信息进行解码。熵解码单元210和211中的每个包括码字映射单元,其具有用于根据所接收的码字来生成帧内预测模式数目的码字映射表。可以预先存储码字映射表,或者可以适应性地生成码字映射表。当使用码号映射表时,用于执行码号映射的码号映射单元可以被另外布置。
重新布置单元220和221中的每个可以基于编码单元所使用的布置方法来对通过熵解码单元210或211进行熵解码的比特流进行重新布置。以一维矢量形式表示的系数可以通过被重建而被重新布置为两维块型系数。重新布置单元220和221中的每个接收与由编码单元执行的系数扫描方法有关的信息,并且可以使用基于由编码单元执行的扫描顺序来执行逆扫描的方法对系数进行重新布置。
解量化单元230和231中的每个可以基于由编码装置提供的量化参数和块的重新布置的系数来执行解量化。
逆变换单元240和241中的每个可以对由编码装置执行的量化的结果执行逆DCT或逆DST,其中,逆DCT和逆DST对应于由相应的变换单元130或131执行的DCT和DST。可以在由编码装置确定的传输单元中执行逆变换。在编码装置的变换单元中,可以根据多个信息片段(如预测方法、当前块的大小和预测方向等)而选择性地执行DCT和DST。解码装置的逆变换单元240或241可以基于与由编码装置的变换单元执行的变换有关的信息来执行逆变换。可以基于编码块而非变换块来执行变换。
预测单元250和251中的每个可以基于以下来生成预测块:由熵解码单元210和211提供的与预测块的生成有关的信息以及从相应的存储器270或271提供的与先前解码的块或画面有关的信息。
预测单元250和251中的每个可以包括预测单元确定单元、帧间预测单元和帧内预测单元。
预测单元确定单元接收各种信息,将预测块与当前编码块分开并且确定预测块是执行帧内预测还是帧间预测,其中,所述各种信息包括从熵解码单元输入的预测单元信息、与帧内预测方法有关的预测模式信息以及与帧间预测方法有关的运动预测信息等。
帧间预测单元可以使用对于由编码装置提供的当前预测块的帧间预测而言所需的信息、基于包括在当前画面(其包括当前预测块)之前的画面和当前画面之后的画面中的至少一个中的信息来执行对当前预测块的帧间预测。为了执行帧间预测,可以确定基于对应的编码块而用作包括在编码块中的预测块的运动预测方法的方法为跳过模式、合并模式或使用运动矢量预测器(MVP)的模式(AMVP模式)。
帧内预测单元可以基于与当前画面中的重建的像素有关的信息来生成预测块。当预测块为被执行帧内预测的预测块时,可以基于由编码装置提供的与预测块有关的帧内预测模式信息而执行帧内预测。帧内预测单元可以包括:MDIS滤波器,其用于对当前块的参考像素执行滤波;参考像素插值单元,其用于通过对参考像素进行插值来以小于单像素的单位生成参考像素;以及DC滤波器,其用于在当前块的预测模式为DC模式时通过滤波来生成预测块。
上层的解码单元200a的预测单元250可以进一步包括用于执行层间预测的层间预测单元,其中,在层间预测中,使用与下层有关的信息来对上层进行预测。
层间预测单元可以通过使用帧内预测模式信息、运动信息等来执行层间预测。
层间预测以下述方式来实现:使得通过采用下层画面作为参考画面并且使用与下层(参考层)的画面相关的运动信息来执行上层的当前块的预测。
在层间预测中,可以适当地对被用作参考画面的参考层的画面进行采样以用于当前层的分辨率。另外,运动信息可以包括运动矢量和参考索引。在这一点上,用于参考层画面的运动矢量值可以被设置为(0,0)。
作为层间预测的示例,描述了使用下层画面作为参考画面的预测方法,但是层间预测不限于此。层间预测单元123可以另外地执行层间纹理预测、层间运动预测、层间语法预测和层间残差预测等。
层间纹理预测可以基于参考层的纹理来得出当前层的纹理。可以适当地对参考层的纹理进行采样以用于当前层的分辨率,并且层间预测单元可以基于经采样的纹理来预测当前层的纹理。层间运动预测可以基于参考层的运动矢量来得出当前层的运动矢量。在此,参考层的运动矢量可以被适当地缩放以用于当前层的分辨率。在层间语法预测中,可以基于参考层的语法来预测当前层的语法。例如,层间预测单元123可以使用参考层的语法作为当前层的语法。此外,在层间残差预测中,可以使用在重建的参考层的图像与重建的当前层的图像之间的残差来重建当前层的画面。
重建的块或画面可以被提供至滤波器单元260和261中的每个。滤波器单元260和261中的每个可以包括解块滤波器和偏移校正单元。
可以从编码装置接收以下信息:与解块滤波器是否被应用于对应的块或画面有关的信息;以及在应用解块滤波器时滤波器为强滤波器或弱滤波器的信息。解码装置的解块滤波器可以接收与由编码装置提供的解块滤波器有关的信息,并且解码装置可以对相应的块执行解块滤波。
偏移校正单元可以基于在编码时应用于图像的偏移值信息以及偏移校正的类型来对重建的图像执行偏移校正。
存储器270和271中的每个可以存储重建的画面或块,使得重建的画面或块能够被用作参考画面或参考块,并且还可以将重建的画面输出。
编码设备和解码设备可以对三层或更多层——而非两层——执行编码,在这种情况下,用于上层的编码单元和解码单元可以设置有在数目上与上层的数目相对应的多个。
在用于支持多层结构的可扩展视频编码(SVC)中,在层之间存在关联性。当通过使用这个关联性来执行预测时,可以移除数据复制元件并且可以改进图像编码性能。
因此,当预测待编码/解码的当前层(即增强层)的画面(即图像)时,可以执行通过使用另一层的信息的层间预测以及使用当前层的信息的帧间预测或帧内预测。
当执行层间预测层时,可以通过使用用于层间预测的参考层的解码画面作为参考画面来生成用于当前层的预测采样。
在这种情况下,因为空间分辨率、时间分辨率和图像质量中的至少一个可能在当前层与参考层之间不相同(这是由于在层之间的可扩展性的差别),所以参考层的解码画面被重新采样以适应当前层的可扩展性,并且然后可以被用作当前层的层间预测的参考画面。“重新采样”指对参考层画面的采样进行上采样或下采样,以匹配当前层画面的画面大小。
在本说明书中,当前层为被执行编码或解码的层,并且可以是增强层或上层。参考层为被参考用于当前层的层间预测的层,并且可以是基本层或下层。可以将用于当前层的层间预测的参考层的画面(即参考画面)称为层间参考画面或层之间的参考画面。
图3为示出根据应用本发明的实施方式使用参考层的相应画面来执行当前层的帧间预测的过程的流程图。
参考图3,可以确定要用于当前层中的当前画面的层间预测的参考层的相应画面(S300)。
参考层可以指其分辨率低于基本层或当前层的分辨率的另一增强层。相应的画面可以指位于与当前层的当前画面同一时隙的画面。
例如,相应的画面可以是具有与当前层的当前画面相同的画面顺序计数(POC)信息的画面。相应的画面可以属于与当前层的当前画面相同的访问单元(AU)。相应的画面可以具有与当前层的当前画面相同的时间级标识符(TemporalID)。此处,时间级标识符可以指用于指定可以根据时间分辨率进行可扩展编码的多个层中的每个层的标识符。
可以允许当前块使用一个或更多个参考层的相应画面来执行层间预测。后面将参照图4至图11来描述用于指定这样的相应画面的方法。
层间参考画面可以通过对在步骤S300处确定的相应画面进行上采样来生成(S310)。
此处,层间参考画面可以用作用于当前画面的层间预测的参考画面。
更具体地,层间参考画面可以包括第一层间参考画面和第二层间参考画面中的至少一个。第一层间参考画面可以指在其整数位置上对其执行滤波的参考画面,并且第二层间参考画面可以指在其整数位置上不对其执行滤波的参考画面。
此处,整数位置可以指经上采样的相应画面的整数像素。可替选地,整数位置可以指当在上采样过程中以小于或等于整数像素的像素为单位执行插值——亦即,以1/n个像素为单位执行插值——然后生成n个相位时,具有0相位的位置(即在插值后对应于n倍整数像素的位置)。可以使用相邻的整数位置来执行对整数位置的滤波。相邻的整数位置可以位于与当前滤波的整数位置相同的行或列中。相邻的整数位置可以包括属于相同行或列的多个整数位置。此处,多个整数位置可以顺序地布置在相同的列或行中。后面将参照图12来描述详细的上采样方法。
可以生成包括在步骤S310处生成的层间参考画面和临时参考画面的参考画面列表(S320)。
首先,参考画面列表可以包括与当前画面属于同一层的参考画面(在下文中称为“临时参考画面”)。临时参考画面可以指具有与当前画面的显示顺序不同的输出顺序(如画面顺序计数POC)的画面。稍后将参照图13至图15描述用于生成由临时参考画面组成的参考画面列表的方法。
同时,当执行当前画面的层间预测时,参考画面列表可以进一步包括层间参考画面。亦即,在多层结构(如在可扩展视频编码或多视点视频编码)中,不仅同一层的参考层可以被用作增强层的参考画面,而且另一层的参考画面也可以被用作增强层的参考画面。
更具体地,属于参考层的画面可以被用作参考画面。在此,参考层可以通过参考层标识符(RefPiclayerId)来识别。参考层标识符可以基于片头的语法inter_layer_pred_layer_idc(在下文中称为“层间指示”)导出。层间指示可以指当前层所使用以执行层间预测的画面的层。如此,可以生成参考层标识符所指定的包括参考层的层间参考画面的参考画面列表。
同时,如在步骤S310处所述,层间参考画面可以包括第一层间参考画面和第二层间参考画面中的至少一个。因此,可以生成包括第一层间参考画面和第二层间参考画面中的任一个的参考画面列表或者包括第一层间参考画面和第二层间参考画面两者的参考画面列表。
为了选择性地使用第一层间参考画面和第二层间参考画面,可以基于画面来选择是使用第一层间参考画面和第二层间参考画面两者还是使用第一层间参考画面和第二层间参考画面中的任一个。此外,在选择并使用第一层间参考画面和第二层间参考画面中的任一个时,可以选择两种画面中的哪一个被使用。为此,解码装置可以发送两种画面中的那一个被使用的信息。
可替选地,对于画面的选择使用,可以使用参考索引。更具体地,使用基于预测块的参考索引,可以选择仅第一层间参考画面或仅第二层间参考画面,或者可以选择第一层间参考画面和第二层间参考画面两者。
当层间参考画面被添加至参考画面列表时,需要改变布置在参考画面列表中的参考画面的数目的范围或分配给各参考画面的参考索引的数目的范围。
在此,假设作为指示基本层的参考画面列表的参考索引的最大值的片头语法元素的num_ref_idx_10_active_minus1和num_ref_idx_11_active_minus1的范围具有0至14的值。
在第一层间参考画面和第二层间参考画面中的一个被使用时,作为指示当前层的参考画面列表的参考索引的最大值的语法元素num_ref_idx_10_active_minus1和num_ref_idx_11_active_minus1的范围可以被限定为值的范围为从0至15。可替选地,即使在第一层间参考画面和第二层间参考画面两者被使用的情况下,当两个层间参考画面被添加至不同的参考画面列表时,num_ref_idx_10_active_minus1和num_ref_idx_11_active_minus1的范围可以被限定为值的范围为从0至15。
例如,在参考画面列表L0中的临时参考画面的数目为15时,如果第一层间参考画面或第二层间参考画面被添加至参考画面列表,则总共存在16个参考画面,并且num_ref_idx_10_active_minus1的值为15。
可替选地,在第一层间参考画面和第二层间参考画面两者被使用时,或者在两个层间参考画面被添加至同一参考画面列表时,作为指示当前层的参考画面列表的参考索引的最大值的语法元素的num_ref_idx_10_active_minus1和num_ref_idx_11_active_minus1的范围可以被限定为值的范围为从0至16。
例如,在参考画面列表L0中的临时参考画面的数目为15、并且第一层间参考画面和第二层间参考画面被添加至参考画面列表L0时,则总共存在17个参考画面,并且num_ref_idx_10_active_minus1的值为16。
可以基于在步骤S320处生成的参考画面列表来执行当前层的帧间预测(S330)。
更具体地,从参考画面列表选择与当前块的参考索引对应的参考画面。所选的参考画面可以是与当前块存在于同一层的临时参考画面或者从参考层的相应画面上采样的层间参考画面。
参考画面中的参考块基于当前块的运动矢量被指定,并且可以使用指定的参考块的重建的采样值或纹理信息来预测当前块的采样值或纹理信息。在这种情况下,在与当前块的参考索引对应的参考画面为层间参考画面时,参考块可以为与当前块位于同一位置处的块。为此,在当前块的参考画面为层间参考画面时,当前块的运动矢量可以被设置为(0,0)。
图4示出了根据应用了本发明的实施方式的用于基于参考有效标签来确定参考层的相应画面的方法,并且图5示出了根据应用了本发明的实施方式的用于参考有效标签的语法表。
参照图4,可以从比特流获取参考有效标签(S400)。
参考有效标签(all_ref_layers_active_flag)可以指示是否应用了下述限制:与当前层具有直接相关性的所有层的相应画面被用于当前画面的层间预测。参照图5,可以从视频参数设置中获取参考有效标签。
此处,可以基于直接相关性标签(direct_dependency_flag[i][j])来确定某个层是否为与当前层具有直接相关性的层。direct_dependency_flag[i][j]可以指示第j层是否被用于第i层即当前层的层间预测。
例如,当直接相关性标签的值为1时,第j层可以用于第i当前层的层间预测,而当直接相关性标签的值为0时,第j层不能用于第i当前层的层间预测。
可以检查参考有效标签的值是否为1(S410)。
当参考有效标签的值为1时,应用下述限制:与当前层具有直接相关性的所有层的相应画面被用于当前画面的层间预测。在这种情况下,与当前层具有直接相关性的所有层的相应画面可以被包括在用于当前画面的参考画面列表中。因此,与当前层具有直接相关性的所有层的相应画面可以被确定为被用于当前画面的层间预测的相应画面(S420)。
与此相反,当参考有效标签的值为0时,不应用下述限制:与当前层具有直接相关性的所有层的相应画面被用于当前画面的层间预测。也就是说,当前层中的当前画面可以使用与当前层具有直接相关性的所有层的相应画面或者选择性地仅使用与当前层具有直接相关性的所有层中的一些层的相应画面来执行层间预测。也就是说,当参考有效标签的值为0时,可以将与当前层具有直接相关性的所有层的相应画面包括在用于当前画面的参考画面列表中,或者可替选地,可以选择性地仅将一些层的相应画面包括在参考画面列表中。因此,有必要在与当前层具有直接相关性的各层的相应画面中指定要用于当前画面的层间预测的相应画面。为此,可以获取当前画面的层间参考信息(S430)。
此处,层间参考信息可以包括层间预测标签、关于参考画面的数目的信息以及参考层标识符中的至少一个。
更具体地,层间预测标签可以指示在当前画面的解码过程中是否使用层间预测。关于参考画面的数目的信息可以指示要用于当前画面的层间预测的相应画面的数目。为了编码效率,可以将关于参考画面的数目的信息编码成通过从要用于当前画面的层间预测的相应画面的数目中减去1而得到的值,然后可以通过发信号传送该值。参考层标识符可以是包括要用于当前画面的层间预测的相应画面的层中的每个层的层标识符(layerId)。
后面将参照图6和图7详细描述用于获得层间参考信息的方法。
可以基于在步骤S430处获得的层间参考信息来确定要用于层间预测的相应画面(S440)。
例如,当前画面的层间预测标签的值为1的情况意味着当前画面被用于执行层间预测。在这种情况下,可以将与当前层具有直接相关性的层中由参考层标识符指定的层的相应画面确定为要用于当前画面的层间预测的相应画面。
与此相反,当前画面的层间预测标签的值为0的情况意味着当前画面不被用于执行层间预测,因此在与当前层具有直接相关性的所有层的相应画面中没有任何画面可以被用于当前画面的层间预测。
图6示出了根据应用了本发明的实施方式的用于获取当前画面的层间参考信息的方法,以及图7示出了根据应用了本发明的实施方式的用于层间参考信息的语法表。
参照图6,可以基于参考有效标签来获取层间预测标签(S600)。
参照图7,仅当参考有效标签(all_ref_layers_active_flag)的值为0时,可以获取层间预测标签(inter_layer_pred_enabled_flag)(S700)。
参考有效标签的值为1的情况可能意味着与当前层具有直接相关性的所有层的相应画面被用于当前画面的层间预测。因此,在这种情况下,没有必要发送当前画面的头信息(例如,片段头)中的层间预测标签。
此外,参照图7,当包括当前画面的当前层的层标识符(nuh_layer_id)大于0时,可以获取层间预测标签。其原因是,当当前层的层标识符为0时,当前层与多个层中未执行层间预测的基本层对应。
此外,参照图7,当与当前层具有直接相关性的层(NumDirectRefLayers)的数目至少为1时,可以获取层间预测标签。其原因是,当不存在与当前层具有直接相关性的层时,当前层中没有任何画面被用来执行层间预测。
返回去参照图6,可以检查在步骤S600处获取的层间预测标签的值是否为1(S610)。
作为步骤S610处的检查结果,如果发现层间预测标签的值为1,则可以获取关于参考画面的数目的信息(S620)。
如上面参照图4所描述的那样,关于参考画面的数目的信息可以指示与当前层具有直接相关性的层的相应画面中要用于当前画面的层间预测的相应画面的数目。
因此,参照图7,当与当前层具有直接相关性的层的数目(NumDirectRefLayers)为1时,要用于当前画面的层间预测的相应画面的数目不能超过1,因此没有必要发送关于参考画面的数目的信息(num_inter_layer_ref_pics_minus1)。在这种情况下,无法获得关于参考画面的数目的信息,并且可以导出要用于当前画面的层间预测的相应画面的数目为1。
同时,可以基于最大有效参考标签来限制性地获取关于参考画面的数目的信息。
在此,最大有效参考标签可以指示对于当前画面的层间预测是否最多仅使用一个相应画面。例如,当最大有效参考标签的值为1时,当前画面通常最多仅使用一个相应画面来执行层间预测,而当最大有效参考标签的值为0时,当前画面可以使用一个或更多个相应画面来执行层间预测。
参照图7,仅当最大有效参考标签(max_one_active_ref_layer_flag)的值为0时,可以获取关于参考画面的数目的信息。也就是说,当最大有效参考标签的值为1时,要用于当前画面的层间预测的相应画面的数目被限制为1,因此没有必要发送关于参考画面的数目的信息。
返回去参照图6,可以基于在步骤S620处获得的关于参考画面的数目的信息来获取参考层标识符(S630)。
更具体地,参照图7,当在与当前层具有直接相关性的层的相应画面中要用于当前画面的层间预测的相应画面(NumActiveRefLayerPics)的数目不同于与当前层具有直接相关性的层的数目(NumDirectRefLayers)时,可以获取参考层标识符。在此,变量NumActiveRefLayerPics是从关于参考画面的数目的信息中导出的变量。例如,当关于参考画面的数目的信息被编码成通过从要用于当前画面的层间预测的相应画面的数目中减去1而得到的值时,变量NumActiveRefLayerPics可以被导出为通过将在步骤S620中获取的参考画面的数目加1而得到的值。
如果变量NumActiveRefLayerPics等于变量NumDirectRefLayers,则意味着与当前层具有直接相关性的层的相应画面是要用于当前画面的层间预测的相应画面。因此,没有必要发送参考层标识符。
图8示出了根据应用了本发明的实施方式的用于基于参考存在标签来确定参考层的相应画面的方法,以及图9示出了根据应用了本发明的实施方式的用于参考存在标签的语法表。
参照图8,可以从比特流获取参考存在标签(S800)。
参考存在标签(inter_layer_pred_present_flag可以指示是否发送了层间参考信息。在此,由于以上参照图4描述了层间参考信息,因此将省略对层间参考信息的详细描述。进一步参照图9,可以从视频参数设置获得参考存在标签。然而,参考存在标签的获取方法不限于此,并且参考存在标签还可以从序列参数设置、画面参数设置和片头中的至少一个来获取。
可以检查参考存在标签的值是否为1(S810)。
当参考存在标签的值为0时,可以将与当前层具有直接相关性的所有层的相应画面确定为要用于当前画面的层间预测的相应画面(S820)。
可以基于以上参照图4描述的直接相关性标签来确定某个层是否与当前层具有直接相关性。
与此相反,当参考存在标签的值为1时,可以获取当前画面的层间参考信息(S830)。
在此,层间参考信息可以包括层间预测标签、关于参考画面的数目的信息和参考层标识符中的至少一个。
更具体地,层间预测标签可以指示在当前画面的解码过程中是否使用了层间预测。关于参考画面的数目的信息可以指示要用于当前画面的层间预测的相应画面的数目。为了编码效率,关于参考画面的数目的信息可以被编码成通过从要用于当前画面的层间预测的相应画面的数目中减去1而得到的值,然后可以发送该值。参考层标识符可以意味着包括要用于当前画面的层间预测的相应画面的层中的每个层的层标识符(layerId)。
后面将参照图10和图11详细描述用于获取层间参考信息的方法。
可以基于在步骤S830处获取的层间参考信息来确定要用于层间预测的相应画面(S840)。
例如,当前画面的层间预测标签的值为1的情况意味着当前画面被用于执行层间预测。在这种情况下,可以将与当前层具有直接相关性的层中由参考层标识符指定的层的相应画面确定为要用于当前画面的层间预测的相应画面。
与此相反,当前画面的层间预测标签的值为0的情况意味着当前画面不被用于执行层间预测,因此在与当前层具有直接相关性的所有层的相应画面中没有任何画面可以被用于当前画面的层间预测。
图10示出了根据应用了本发明的实施方式的用于获取当前画面的层间参考信息的方法,以及图11示出了根据应用了本发明的实施方式的用于层间参考信息的语法表。
参照图10,可以基于参考存在标签来获取层间预测标签(S1000)。
参照图11,仅当参考存在标签(inter_layer_present_flag)的值为1时,可以获取层间预测标签(inter_layer_pred_enabled_flag)(S1100)。当参考存在标签的值为0时,可能意味着与当前层具有直接相关性所有层的相应画面被用于当前画面的层间预测。因此,在这种情况下,没有必要发送当前画面的头信息(例如,片段头)中的层间预测标签。
此外,参照图11,当包括当前画面的当前层的层标识符(nuh_layer_id)大于0时,可以获取层间预测标签。其原因是,当当前层的层标识符为0时,当前层与多个层中未执行层间预测的基本层对应。
此外,参照图11,当与当前层具有直接相关性的层(NumDirectRefLayers)的数目至少为1时,可以获取层间预测标签。其原因是,当不存在与当前层具有直接相关性的层时,当前层中没有任何画面被用来执行层间预测。
返回去参照图10,可以检查在步骤S1000处获取的层间预测标签的值是否为1(S1010)。
作为步骤S1010处的检查结果,如果发现层间预测标签的值为1,则可以获取关于参考画面的数目的信息(S1020)。
如上面参照图8所描述的那样,关于参考画面的数目的信息可以指示与当前层具有直接相关性的层的相应画面中要用于当前画面的层间预测的相应画面的数目。
因此,参照图11,当与当前层具有直接相关性的层的数目(NumDirectRefLayers)为1时,要用于当前画面的层间预测的相应画面的数目不能超过1,因此没有必要发送关于参考画面的数目的信息(num_inter_layer_ref_pics_minus1)。在这种情况下,无法获得关于参考画面的数目的信息,并且可以导出要用于当前画面的层间预测的相应画面的数目为1。
同时,可以基于最大有效参考标签来限制性地关于参考画面的数目的信息。
在此,最大有效参考标签可以指示对于当前画面的层间预测是否最多仅使用一个相应画面。例如,当最大有效参考标签的值为1时,当前画面通常最多仅使用一个相应画面来执行层间预测,而当最大有效参考标签的值为0时,当前画面可以使用一个或更多个相应画面来执行层间预测。
参照图11,仅当最大有效参考标签(max_one_active_ref_layer_flag)的值为0时,可以获取关于参考画面的数目的信息。也就是说,当最大有效参考标签的值为1时,要用于当前画面的层间预测的相应画面的数目被限制为1,因此没有必要发送关于参考画面的数目的信息。
返回去参照图10,可以基于在步骤S1020处获得的关于参考画面的数目的信息来获取参考层标识符(S1030)。
更具体地,参照图11,当在与当前层具有直接相关性的层的相应画面中要用于当前画面的层间预测的相应画面(NumActiveRefLayerPics)的数目不同于与当前层具有直接相关性的层的数目(NumDirectRefLayers)时,可以获取参考层标识符。在此,变量NumActiveRefLayerPics是从关于参考画面的数目的信息中导出的变量。例如,当关于参考画面的数目的信息被编码成通过从要用于当前画面的层间预测的相应画面的数目中减去1而得到的值时,变量NumActiveRefLayerPics可以被导出为通过将在步骤S1020中获取的参考画面的数目加1而得到的值。
如果变量NumActiveRefLayerPics等于变量NumDirectRefLayers,则意味着与当前层具有直接相关性的层的相应画面是要用于当前画面的层间预测的相应画面。因此,没有必要发送参考层标识符。
图12是示出了根据应用了本发明的实施方式的用于对参考层的相应画面进行上采样的方法的流程图。
参照图12,可以导出对应于当前层的当前采样位置的参考层的参考采样位置(S1200)。
由于当前层和参考层可能在分辨率上彼此不同,所以可以在考虑层之间的分辨率上的差的情况下导出与当前采样位置对应的参考采样位置。亦即,可以考虑在当前层的画面与参考层的画面之间的高宽比(aspectratio)。此外,由于参考层的上采样画面的大小可能不匹配当前层的画面的大小,所以可能需要要求的补偿来校正这样的差。
例如,可以在考虑上采样参考层的扩展因子和补偿的情况下导出参考采样位置。
在此,扩展因子可以基于在当前层的当前画面与参考层的相应画面之间的宽长比来计算。
上采样参考层补偿可以指关于位于当前画面的边缘处的任一采样位置与位于层间参考画面的边缘处的任一采样位置之间的差的信息。例如,上采样参考层补偿可以包括关于当前画面的左上采样与层间参考画面的左上采样的水平/竖直位置之间的差以及当前画面的右下采样与层间参考画面的右下采样的水平/竖直位置之间的差的信息。
上采样参考层补偿可以从比特流获取。例如,上采样参考层补偿可以从视频参数设置、顺序参数设置、画面参数设置以及片头中的至少一个获取。
可以在考虑在步骤S1200处导出的参考采样位置处的相位的情况下确定上采样滤波器的滤波器参数(S1210)。
在此,可以使用固定上采样滤波器或自适应上采样滤波器作为上采样滤波器。
1.固定上采样滤波器
固定上采样滤波器可以具有不考虑视频的特征的预设滤波器系数。可以使用抽头滤波器作为固定上采样滤波器,其可以相对于亮度(luma)分量和色度(chroma)分量中的每个被限定。将参照表1和表2描述精度为采样单位的1/16的上采样滤波器。
表1
表1限定了固定上采样滤波器对于亮度分量的滤波器系数。
如表1所示,在对亮度分量进行上采样的情况下,应用8抽头滤波器。换言之,可以通过使用与当前层的当前采样对应的参考层的参考采样以及与该参考采样相邻的邻近采样来执行插值。在此,邻近采样可以根据插值的方向被指定。例如,在插值沿水平方向被执行时,邻近采样可以包括相对于参考采样的左边3个连续采样和右边4个连续采样。可替选地,在插值沿竖直方向被执行时,邻近采样可以包括相对于参考采样的朝顶端3个连续采样和朝底端4个连续采样。
另外,由于插值以1/16采样单位的精度被执行,所以总共存在16个相位。这是用于支持各种2倍以及1.5倍放大的分辨率。
另外,固定上采样滤波器可以使用对于各相位p具有不同系数的滤波器。除了相位p为0的情况,各滤波器系数的级数可以被限定为在0至63的范围内。这意味着滤波以6位精度执行。在此,在以1/n采样单位执行插值时,相位p为0是指n倍整数采样位置。
表2
表2限定了固定上采样滤波器对于色度分量的滤波器系数。
如表2所示,在对色度分量进行上采样的情况下,与亮度分量的情况不同,可以应用4抽头滤波器。换言之,可以通过使用与当前采样对应的参考层的参考采样以及与该参考采样相邻的邻近采样来执行插值。在此,邻近采样可以根据插值的方向被指定。例如,在插值沿水平方向被执行的情况下,邻近采样可以包括相对于参考采样的左边1个采样和右边2个连续采样。可替选地,在插值沿竖直方向被执行的情况下,邻近采样可以包括相对于参考采样的朝顶端1个采样和朝底端2个连续采样。
此外,与亮度分量的情况类似,由于插值以1/16采样单位的精度被执行,所以总共存在16个相位,并且不同的系数可以用于每个相位p。除了相位p为0的情况,各滤波器系数的级数可以被限定为在0至62的范围内。这意味着滤波还是以6位精度执行。
在前面,例举了对于亮度分量应用8抽头滤波器且对于色度分量应用4抽头滤波器的实例,但本发明不限于此,在考虑编码效率的情况下可以不同地确定抽头滤波器的阶数。
2.自适应上采样滤波器
在编码器中,通过考虑图像的特征来确定优化的滤波器系数,而不使用固定滤波器系数,并且被发送到待被传送至的解码器。与此类似,自适应上采样滤波器使用被自适应地确定的滤波器系数。由于图像的特征以画面单位变化,在使用能够期望地体现图像的特征的自适应上采样滤波器而非使用用于所有情况的固定上采样滤波器时,可以改善编码效率。
可以通过将在步骤S1210处确定的滤波器系数应用至参考层的相应画面来生成层间参考画面(S1220)。
具体地,可以通过将所确定的上采样滤波器的滤波器系数应用至相应画面的采样来执行插值。在此,插值主要沿水平方向执行,然后对在水平插值之后所生成的采样,插值其次沿竖直方向执行。
图13是示出用于指定存储在解码画面缓冲器中的短期参考画面的方法的图。
临时参考画面可以存储在解码画面缓冲器(DPB)中并且在需要临时参考画面用于当前画面的帧间预测时可以用作参考画面。存储在解码画面缓冲器中的临时参考画面可以包括短期参考画面。这样的短期参考画面表示以下画面,其POC值与当前画面的POC值没有大的不同。
用于指定短期参考画面存储在当前视角中的解码画面缓冲器中的信息由统称为参考画面组的指示相应画面是否被当前画面直接参考的标签(如used_by_curr_pic_s0_flag、used_by_curr_pic_s1_flag)和参考画面的输出顺序(POC)组成。具体地,在used_by_curr_pic_s0_flag[i]的值为0时,如果短期参考画面组中的第i个短期参考画面具有小于当前画面的输出顺序(POC)值的输出顺序(POC)值,意指所述第i个短期参考画面不被用作当前画面的参考画面。此外,used_by_curr_pic_s1_flag[i]的值为0时,如果短期参考画面组中的第i个短期参考画面具有大于当前画面的输出顺序(POC)值的输出顺序(POC)值,意指所述第i个短期参考画面不被用作当前画面的参考画面。
参考图13,在POC值为26的画面的情况下,可以使用总共三个画面(即POC值为25、24和20的画面)作为用于帧间预测的短期参考画面。然而,由于POC为25的画面的used_by_curr_pic_s0_flag的值为0,所以POC值为25的画面不直接用于POC值为26的画面的帧间预测。
如此,短期参考画面可以基于参考画面的输出顺序(POC)和指示相应画面是否被用作当前画面的参考画面的标签两者来被指定。
同时,可以利用指示画面不被用作参考画面的指示符(如“不被用作参考”)来标注不出现在当前画面的参考画面组中的画面,然后可以将该画面从解码画面缓冲器去除。
图14示出根据应用本发明的实施方式的用于指定长期参考画面的方法。
由于长期参考画面与当前画面在POC上具有大的不同,所以可以使用POC值的最小有效位(LSB)和最大有效位(MSB)来表示长期参考画面。
因此,可以使用参考画面的POC值的LSB、当前画面的POC值的LSB以及在当前画面的POC值的MSB与参考画面的POC值的MSB之间的差来导出长期参考画面的POC值。
例如,假设当前画面的POC为331并且可以通过LSB表示的最大值为32;如此POC值为308的画面被用作长期参考画面。
在这种情况下,当前画面即331的POC值可以通过32*10+11来表示,其中10是MSB值,而11是LSB值。长期参考画面即308的POC值可以通过32*9+20表示,其中9是MSB值而20是LSB值。在此,长期参考画面的POC值可以使用图14所示的公式导出。
图15示出根据应用本发明的实施方式的用于使用短期参考画面和长期参考画面来构建参考画面列表的方法。
参考图15,可以在考虑关于临时参考画面是否是短期参考画面的信息以及短期参考画面的POC值的情况下生成包括临时参考画面的参考画面列表。在此,参考画面列表可以包括针对L0预测的参考画面列表0和针对L1预测的参考画面列表1中的至少一个。
更具体地,参考画面列表0可以以如下顺序布置:POC值小于当前画面的POC值的短期参考画面(RefPicSetCurr0);POC值大于当前画面的POC值的短期参考画面(RefPicSetCurr1);以及长期参考画面(RefPicSetLtCurr)。
同时,参考画面列表1可以以如下顺序布置:POC值大于当前画面的POC值的短期参考画面(RefPicSetCurr1);POC值小于当前画面的POC值的短期参考画面(RefPicSetCurr0);以及长期参考画面(RefPicSetLtCurr)。
此外,为了改善临时参考画面的参考索引的编码效率,可以对包括在参考画面列表中的多个临时参考画面进行重新布置(修改)。这可以基于列表修改标签(list_modification_present_flag)来自适应地执行。在此,列表修改标签表示用于指定是否修改参考画面列表中的参考画面的信息。列表修改标签可以单独地针对参考画面列表0以及参考画面列表1发送。
例如,在列表修改标签(list_modification_present_flag)的值为0时,不修改参考画面列表中的参考画面,而仅在列表修改标签(list_modification_present_flag)的值为1时,可以修改参考画面列表中的参考画面。
在列表修改标签(list_modification_present_flag)的值为1时,可以使用列表输入信息(list_entry[i])来修改参考画面列表中的参考画面。在此,“列表输入信息(list_entry[i])”可以指定参考画面列表中位于当前位置(即第i个输入)处的参考画面的参考索引。
更具体地,指定所生成的参考画面列表中的与列表输入信息(list_entry[i])对应的参考画面,并且所指定的参考画面可以在参考画面列表中的第i个输入中被重新布置。
可以获取与参考画面列表中所包括的参考画面的数目或与参考画面列表的参考索引的最大值一样多段的列表输入信息。另外,可以在考虑当前画面的片类型的情况下获取列表输入信息。亦即,在当前画面的片类型为P片时,可以获取参考画面列表0的列表输入信息(list_entry_10[i]),而在当前画面的片类型为B片时,可以获取参考画面列表1的列表输入信息(list_entry_11[i])。
工业应用性
本发明可以用于对具有多层结构的视频信号进行编码。

Claims (15)

1.一种可扩展视频信号解码方法,包括:
确定要用于当前层中的当前画面的层间预测的参考层的相应画面;
通过对所确定的相应画面进行上采样来生成层间参考画面;
生成包括层间参考画面的参考画面列表;以及
基于所述参考画面列表来执行所述当前画面的帧间预测。
2.根据权利要求1所述的可扩展视频信号解码方法,其中,
基于用于所述当前画面的层间参考信息来确定所述参考层的相应画面,以及
所述层间参考信息包括层间预测标签、关于参考画面的数目的信息和参考层标识符中的至少一个。
3.根据权利要求2所述的可扩展视频信号解码方法,其中,
基于参考有效标签来获取所述层间预测标签,以及
所述参考有效标签是用于指示是否应用限制的信息,所述限制为:与所述当前层具有直接相关性的所有层的相应画面被用于所述当前画面的层间预测。
4.根据权利要求3所述的可扩展视频信号解码方法,其中,当基于参考有效标签而不应用与所述当前层具有直接相关性的所有层的相应画面被用于所述当前画面的层间预测的所述限制时,获取所述层间预测标签。
5.一种可扩展视频信号解码装置,包括:
预测单元,所述预测单元用于:确定要用于当前层中的当前画面的层间预测的参考层的相应画面;通过对所确定的相应画面进行上采样来生成层间参考画面;生成包括层间参考画面的参考画面列表;以及基于所述参考画面列表来执行所述当前画面的帧间预测。
6.根据权利要求5所述的可扩展视频信号解码装置,其中,
基于用于所述当前画面的层间参考信息来确定所述参考层的相应画面,以及
所述层间参考信息包括层间预测标签、关于参考画面的数目的信息和参考层标识符中的至少一个。
7.根据权利要求6所述的可扩展视频信号解码装置,其中,
基于参考有效标签来获取所述层间预测标签,以及
所述参考有效标签是用于指示与所述当前层具有直接相关性的所有层的相应画面是否被用于所述当前画面的层间预测的信息。
8.根据权利要求7所述的可扩展视频信号解码装置,其中,当基于参考有效标签而不应用限制时,获取所述层间预测标签,所述限制为:与所述当前层具有直接相关性的所有层的相应画面被用于所述当前画面的层间预测。
9.一种可扩展视频信号编码方法,包括:
确定要用于当前层中的当前画面的层间预测的参考层的相应画面;
通过对所确定的相应画面进行上采样来生成层间参考画面;
生成包括层间参考画面的参考画面列表;以及
基于所述参考画面列表来执行所述当前画面的帧间预测。
10.根据权利要求9所述的可扩展视频信号编码方法,其中,
基于用于所述当前画面的层间参考信息来确定所述参考层的相应画面,以及
所述层间参考信息包括层间预测标签、关于参考画面的数目的信息和参考层标识符中的至少一个。
11.根据权利要求10所述的可扩展视频信号编码方法,其中,
基于参考有效标签来获取所述层间预测标签,以及
所述参考有效标签是用于指示与所述当前层具有直接相关性的所有层的相应画面是否被用于所述当前画面的层间预测的信息。
12.根据权利要求11所述的可扩展视频信号编码方法,其中,当基于参考有效标签而不应用限制时,获取所述层间预测标签,所述限制为:与所述当前层具有直接相关性的所有层的相应画面被用于所述当前画面的层间预测。
13.一种可扩展视频信号编码装置,包括:
预测单元,所述预测单元用于:确定要用于当前层中的当前画面的层间预测的参考层的相应画面;通过对所确定的相应画面进行上采样来生成层间参考画面;生成包括层间参考画面的参考画面列表;以及基于所述参考画面列表来执行所述当前画面的帧间预测。
14.根据权利要求13所述的可扩展视频信号编码装置,其中,
基于用于所述当前画面的层间参考信息来确定所述参考层的相应画面,以及
所述层间参考信息包括层间预测标签、关于参考画面的数目的信息和参考层标识符中的至少一个。
15.根据权利要求14所述的可扩展视频信号编码装置,其中,
基于参考有效标签来获取所述层间预测标签,以及
所述参考有效标签是用于指示与所述当前层具有直接相关性的所有层的相应画面是否被用于所述当前画面的层间预测的信息。
CN201480048665.8A 2013-09-03 2014-08-29 可扩展视频信号编码/解码方法及装置 Pending CN105519112A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR20130105673 2013-09-03
KR10-2013-0105673 2013-09-03
KR10-2014-0112865 2014-08-28
KR20140112865A KR20150026927A (ko) 2013-09-03 2014-08-28 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치
PCT/KR2014/008101 WO2015034216A1 (ko) 2013-09-03 2014-08-29 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치

Publications (1)

Publication Number Publication Date
CN105519112A true CN105519112A (zh) 2016-04-20

Family

ID=52628623

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201480048668.1A Pending CN105519113A (zh) 2013-09-03 2014-08-29 可扩展视频信号编码/解码方法及装置
CN201480048665.8A Pending CN105519112A (zh) 2013-09-03 2014-08-29 可扩展视频信号编码/解码方法及装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201480048668.1A Pending CN105519113A (zh) 2013-09-03 2014-08-29 可扩展视频信号编码/解码方法及装置

Country Status (4)

Country Link
US (3) US10425650B2 (zh)
KR (4) KR20150026927A (zh)
CN (2) CN105519113A (zh)
WO (1) WO2015034215A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2014288482A1 (en) * 2013-07-12 2015-02-26 Sony Corporation Image coding device and method
WO2015082763A1 (en) * 2013-12-02 2015-06-11 Nokia Technologies Oy Video encoding and decoding
US9826232B2 (en) 2014-01-08 2017-11-21 Qualcomm Incorporated Support of non-HEVC base layer in HEVC multi-layer extensions
US10638140B2 (en) * 2015-05-29 2020-04-28 Qualcomm Incorporated Slice level intra block copy and other video coding improvements
CN116233416A (zh) * 2017-01-16 2023-06-06 世宗大学校产学协力团 影像编码/解码方法
CN112740705A (zh) * 2018-09-21 2021-04-30 夏普株式会社 用于在视频编码中发送信号通知参考图片的***和方法
CN113892266A (zh) * 2019-05-30 2022-01-04 华为技术有限公司 分层视频译码中的参考图像管理
CN110446045B (zh) * 2019-07-09 2021-07-06 中移(杭州)信息技术有限公司 视频编码方法、装置、网络设备及存储介质
WO2021236906A1 (en) * 2020-05-21 2021-11-25 Bytedance Inc. Signaling inter-layer reference pictures in video coding

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008148708A1 (en) * 2007-06-05 2008-12-11 Thomson Licensing Device and method for coding a video content in the form of a scalable stream
WO2012173439A2 (ko) * 2011-06-15 2012-12-20 한국전자통신연구원 스케일러블 비디오 코딩 및 디코딩 방법과 이를 이용한 장치
WO2013116415A1 (en) * 2012-01-31 2013-08-08 Vid Scale, Inc. Reference picture set (rps) signaling for scalable high efficiency video coding (hevc)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110123291A (ko) 2006-10-16 2011-11-14 노키아 코포레이션 멀티뷰 비디오 코딩에서 효율적인 디코딩된 버퍼 관리를 구현하기 위한 시스템 및 방법
EP2772052A1 (en) 2011-10-24 2014-09-03 Telefonaktiebolaget LM Ericsson (PUBL) Reference picture marking
US9258559B2 (en) 2011-12-20 2016-02-09 Qualcomm Incorporated Reference picture list construction for multi-view and three-dimensional video coding
EP2813079B1 (en) * 2012-06-20 2019-08-07 HFI Innovation Inc. Method and apparatus of inter-layer prediction for scalable video coding
US9325990B2 (en) * 2012-07-09 2016-04-26 Qualcomm Incorporated Temporal motion vector prediction in video coding extensions
WO2014047885A1 (en) * 2012-09-28 2014-04-03 Intel Corporation Enhanced reference region utilization for scalable video coding
US20140098880A1 (en) 2012-10-05 2014-04-10 Qualcomm Incorporated Prediction mode information upsampling for scalable video coding
US8958477B2 (en) 2013-04-05 2015-02-17 Vidyo, Inc. Multiple reference layer prediction signaling techniques
US9762920B2 (en) 2013-06-07 2017-09-12 Qualcomm Incorporated Dynamic range control of intermediate data in resampling process
KR101712108B1 (ko) * 2013-07-16 2017-03-03 삼성전자 주식회사 비트 뎁스 및 컬러 포맷의 변환을 동반하는 업샘플링 필터를 이용하는 스케일러블 비디오 부호화 방법 및 장치, 스케일러블 비디오 복호화 방법 및 장치
US10368097B2 (en) * 2014-01-07 2019-07-30 Nokia Technologies Oy Apparatus, a method and a computer program product for coding and decoding chroma components of texture pictures for sample prediction of depth pictures

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008148708A1 (en) * 2007-06-05 2008-12-11 Thomson Licensing Device and method for coding a video content in the form of a scalable stream
WO2012173439A2 (ko) * 2011-06-15 2012-12-20 한국전자통신연구원 스케일러블 비디오 코딩 및 디코딩 방법과 이를 이용한 장치
WO2013116415A1 (en) * 2012-01-31 2013-08-08 Vid Scale, Inc. Reference picture set (rps) signaling for scalable high efficiency video coding (hevc)

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIANLE CHEN: "SHVC Draft 3", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 14TH MEETING: VIENNA, AT,JCTVC-N1008_V1》 *
JIANLE CHEN等: "High efficiency video coding (HEVC) scalable extension Draft 3", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC)OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11 14TH MEETING: VIENNA, AT,JCTVC-N1008_V2》 *

Also Published As

Publication number Publication date
KR20150133686A (ko) 2015-11-30
US10425650B2 (en) 2019-09-24
KR20150133680A (ko) 2015-11-30
US20160198167A1 (en) 2016-07-07
US20160198169A1 (en) 2016-07-07
KR20150026927A (ko) 2015-03-11
KR20150026957A (ko) 2015-03-11
CN105519113A (zh) 2016-04-20
US20160330458A1 (en) 2016-11-10
WO2015034215A1 (ko) 2015-03-12

Similar Documents

Publication Publication Date Title
US10148949B2 (en) Scalable video signal encoding/decoding method and apparatus
CN105519112A (zh) 可扩展视频信号编码/解码方法及装置
KR102286856B1 (ko) 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치
CN105230018A (zh) 用于对支持多个层的视频进行编码的方法和设备
CN105379276A (zh) 可伸缩视频信号编码/解码方法和装置
CN105379277A (zh) 用于编码/解码可伸缩视频信号的方法和装置
CN105684446A (zh) 多层视频信号编码/解码方法和装置
CN105850126A (zh) 用于对多层视频信号进行编码/解码的方法和装置
CN105519115A (zh) 用于对可扩展视频信号进行编码/解码的方法及装置
US20160100187A1 (en) Method for inducing motion information in multilayer structure and apparatus using same
KR101652072B1 (ko) 멀티 레이어 비디오의 움직임 정보 탐색 방법 및 장치
KR20150110294A (ko) 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
KR20150064678A (ko) 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
KR20140079661A (ko) Mpm을 이용한 계층적 영상 복호화 방법 및 이러한 방법을 사용하는 장치
KR20140080884A (ko) 계층적 비디오 코딩에서 색차 블록의 화면 내 예측 모드를 복호화하는 방법 및 이러한 방법을 사용하는 장치
CN105379275A (zh) 用于对可伸缩视频信号进行编码/解码的方法和装置
CN105659598A (zh) 用于对多层视频信号进行编码/解码的方法和装置
KR20140145559A (ko) 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치
KR20150009468A (ko) 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치
KR20150133685A (ko) 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
KR20150044394A (ko) 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
KR20150071653A (ko) 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
KR20150064676A (ko) 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치
KR20150014872A (ko) 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치
KR20150037659A (ko) 멀티 레이어 비디오 신호 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160420

RJ01 Rejection of invention patent application after publication