CN106170980A - 图像解码装置、图像编码装置以及编码数据变换装置 - Google Patents

图像解码装置、图像编码装置以及编码数据变换装置 Download PDF

Info

Publication number
CN106170980A
CN106170980A CN201580019567.6A CN201580019567A CN106170980A CN 106170980 A CN106170980 A CN 106170980A CN 201580019567 A CN201580019567 A CN 201580019567A CN 106170980 A CN106170980 A CN 106170980A
Authority
CN
China
Prior art keywords
layer
information
reference area
picture
play amount
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580019567.6A
Other languages
English (en)
Inventor
山本智幸
猪饲知宏
筑波健史
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of CN106170980A publication Critical patent/CN106170980A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

层次运动图像解码装置(1)具备:参数集解码部(12),对参照区域信息进行解码;以及预测图像生成部(1442),基于从所述参照区域信息导出的对象层参照区域位置以及参照层参照区域位置,导出比例尺或者对应参照位置而生成预测图像。

Description

图像解码装置、图像编码装置以及编码数据变换装置
技术领域
本发明涉及对图像以层次方式进行了编码的层次编码数据进行解码的图像解码装置、以及通过对图像以层次方式进行编码而生成层次编码数据的图像编码装置。
背景技术
在通信***中传输的信息或者在蓄积装置中记录的信息之一,有图像或者运动图像。以往,为了这些图像(以后,包括运动图像)的传输/蓄积,已知对图像进行编码的技术。
作为运动图像编码方式,已知AVC(H.264/MPEG-4高级视频编码(Advanced VideoCoding))和作为其后继编解码器的HEVC(高效率的视频编码(High-Efficiency VideoCoding))(非专利文献1)。
在这些运动图像编码方式中,通常基于通过对输入图像进行编码/解码而获得的局部解码图像来生成预测图像,从输入图像(原图像)减去该预测图像而获得的预测残差进行编码。作为预测图像的生成方法,举出画面间预测(外部预测)以及画面内预测(内部预测)。
在内部预测中,基于同一图片(picture)内的局部解码图像,顺次生成该图片中的预测图像。
在外部预测中,通过图片间的运动补偿来生成预测图像。在外部预测中用于预测图像生成的解码完毕的图片被称为参照图片。
此外,还已知通过将多个相互关联的运动图像分层(层次)而进行编码,从而根据多个运动图像来生成编码数据的技术,被称为层次编码技术。通过层次编码技术而生成的编码数据也被称为层次编码数据。
作为代表性的层次编码技术,已知以HEVC为基础的SHVC(可分级(Scalable)HEVC)(非专利文献2)。
在SHVC中,支持空域分级、时域分级、SNR分级。例如,在空域分级的情况下,将多个不同的分辨率的运动图像分层编码而生成层次编码数据。例如,将从原图像下采样为期望的分辨率的图像作为下位层来进行编码。接着,为了去除层间的冗长性而对原图像应用层间预测的基础上,作为上位层来进行编码。
作为其他的代表性的层次编码技术,已知以HEVC为基础的MV-HEVC(多视图(MultiView)HEVC)。在MV-HEVC中,支持视图分级。在视图分级中,将与多个不同的视点(视图)对应的运动图像分层编码而生成层次编码数据。例如,将与成为基本的视点(基础视图)对应的运动图像作为下位层来进行编码。接着,在对与不同的视点对应的运动图像应用层间预测的基础上,作为上位层来进行编码。
在SHVC或MV-HEVC中的层间预测中,有层间图像预测和层间运动预测。在层间图像预测中,利用下位层的解码图像来生成预测图像。在层间运动预测中,利用下位层的运动信息来导出运动信息的预测值。在层间预测中,用于预测的图片被称为层间参照图片。此外,包括层间参照图片的层被称为参照层。另外,以下,将用于外部预测的参照图片和用于层间预测的参照图片总的简单称为参照图片。
在层间图像预测中,包括导出与上位层上的预测对象像素的位置对应的下位层上的像素位置的参照像素位置导出处理、和导出相当于对下位层的图片应用的放大处理中的放大率的标度的标度导出处理。
在SHVC或MV-HEVC中,在预测图像的生成中,能够利用外部预测、内部预测、层间图像预测中的任一个。
利用SHVC或MV-HEVC的应用之一,有考虑了关注区域的影像应用。例如,在影像再现终端中,通常以比较低分辨率来再现全区域的影像。在影像再现终端的视听者将所显示的影像的一部分指定作为关注区域的情况下,该关注区域以高分辨率来显示在再现终端中。
如上所述的考虑了关注区域的影像应用能够使用层次编码数据来实现,该层次编码数据将全区域的比较低分辨率的影像作为下位层的编码数据、将关注区域的高分辨率影像作为上位层的编码数据来进行了编码。即,通过在再现全区域的情况下,只解码下位层的编码数据而再现,在再现关注区域的高分辨率影像的情况下,将上位层的编码数据追加到所述下位层的编码数据而传输,从而能够以比传输对于低分辨率影像的编码数据和对于高分辨率影像的编码数据的双方时少的传输频带来实现所述应用。此时,通过将与包括关注区域的区域对应的编码数据从上位层以及下位层分别提取而传输,从而能够进一步抑制传输频带。
在如上所述的考虑了关注区域的影像应用中,生成包括关注区域的上位层以及下位层的编码数据的情况下,上位层的像素和下位层的像素的位置关系发生变化,其结果,存在在预测基于下位层的像素值的上位层的像素值时的预测的准确度降低的课题。
在非专利文献3中,公开了如下方法:通过传输表示下位层上的替代图片的位置的追加信息,并使用该追加信息来计算参照像素位置或标度,即使是从层次编码数据提取了相当于关注区域的部分数据的情况下,也实现参照像素位置(对应参照位置)或标度的提取前后的一致。
现有技术文献
非专利文献
[非专利文献1]“Recommendation H.265(04/13)”,ITU-T(2013年6月7日公开)
[非专利文献2]JCTVC-Q1008_v1“Preliminary version of High efficiencyvideo coding(HEVC)scalable extension Draft 6”,Joint Collaborative Team onVideoCoding(JCT-VC)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 17thMeeting:Valencia,ES,27 March-4April 2014(2014年4月15日公开)
[非专利文献3]JCTVC-Q0159“AHG 13:Sub-region extraction-positioncalculation and comparison of different approaches”,Joint Collaborative Teamon Video Coding(JCT-VC)of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 17thMeeting:Valencia,ES,27 March-4April 2014(2014年3月18日公开)
发明内容
发明要解决的课题
但是,在非专利文献3中公开的方式中,存在如下课题:为了将用于实现相当于关注区域的部分数据提取时的参照像素位置或标度维持的追加数据进行编码或者解码,需要将追加的语法元素多次导入。因此,在图像解码装置以及图像编码装置中,追加需要用于处理该追加语法元素的处理,存在导致解码/编码处理的处理量或电路规模的增大的课题。
本发明是鉴于上述问题而完成的,其目的在于,实现一种图像编码装置以及图像解码装置,其能够使用比现有技术少的追加语法元素,实现相当于关注区域的部分数据提取时的参照像素位置或标度维持。即,实现一种图像编码装置以及图像解码装置,其能够通过比以往少的处理量以及小的电路规模来进行编码或者解码处理,实现相当于关注区域的部分数据提取时的参照像素位置或标度维持。
用于解决课题的手段
为了解决上述课题,本发明的图像编码装置是,一种图像解码装置,对进行了层次编码的编码数据进行解码,复原作为对象层的上位层的解码图片,其特征在于,包括:参数集解码部,对参数集进行解码;以及预测图像生成部,参照参照层图片的解码像素,通过层间预测来生成预测图像,所述参数集解码部对参照区域信息进行解码,所述预测图像生成部根据在所述参照区域信息中包含的参照区域位置信息来导出对象层参照区域位置以及参照层参照区域位置,使用所述参照区域位置以及所述参照层参照区域位置来导出在层间预测中使用的标度以及对应参照位置的至少一方。
此外,优选在上述图像解码装置中,所述参照区域位置信息是参照区域偏移量信息,所述对象层参照区域位置是对象层参照区域偏移量,所述参照层参照区域位置是参照层对象区域偏移量。
此外,优选在上述图像解码装置中,所述参照区域位置信息是将第一层识别信息和第二层识别信息设为索引的二维的排列变量,所述第一层识别信息是确定参照区域存在的层的信息,所述第二层识别信息是确定层间处理对象层的信息,所述预测图像生成部在执行对象层和参照层之间的层间预测时,使用将表示所述对象层的所述第一层识别信息和表示所述参照层的所述第二层识别信息设为索引的所述参照区域位置信息来设定所述对象层参照区域位置,使用将表示所述参照层的所述第一层识别信息和表示所述对象层的所述第二层识别信息设为索引的所述参照区域位置信息来设定所述参照层参照区域位置。
此外,优选在上述图像解码装置中,所述第一层识别信息是直接或者间接地指定参照区域存在的层的VPS内索引的信息,所述第二层识别信息是直接或者间接地指定层间处理对象层的VPS内索引的信息,所述预测图像生成部在对于VPS内索引的值为C的所述对象层执行层间预测时,使用将表示VPS内索引C的所述第一层识别信息和表示小于C的VPS内索引R的所述第二层识别信息设为索引的所述参照区域位置信息来设定所述对象层参照区域位置,使用将表示所述VPS内索引R的所述第一层识别信息和表示VPS内索引C的所述第二层识别信息设为索引的所述参照区域位置信息来设定所述参照层参照区域位置。
此外,优选在上述图像解码装置中,所述参照区域位置信息是将第一层识别信息和第二层识别信息设为索引的二维的排列变量,所述第一层识别信息是确定参照区域存在的层的信息,所述第二层识别信息是确定层间处理对象层的信息,所述预测图像生成部在执行对象层和参照层之间的层间预测时,使用将表示所述对象层的所述第一层识别信息和表示所述参照层的所述第二层识别信息设为索引的所述参照区域位置信息来设定所述对象层参照区域位置,使用将表示所述对象层的所述第一层识别信息和表示所述对象层的所述第二层识别信息设为索引的所述参照区域位置信息来设定所述参照层参照区域位置。
此外,优选在上述图像解码装置中,所述参数集解码部对参照区域对象选择信息进行解码,根据该参照区域对象选择信息来导出第一层识别信息和第二层识别信息,且将上述第一层识别信息和上述第二层识别信息的组合与上述参照区域位置信息相关联而记录,所述预测图像生成部在执行对象层和参照层之间的层间预测时,使用与表示所述对象层的所述第一层识别信息和表示所述参照层的所述第二层识别信息的组合相关联而记录的所述参照区域位置信息来设定所述对象层参照区域位置,使用与表示参照层的所述第一层识别信息和表示对象层的所述第二层识别信息相关联而记录的所述参照区域位置信息来设定所述参照层参照区域位置。
此外,优选在上述图像解码装置中,所述参数集解码部对对象层和参照层的显示区域信息进行解码,所述预测图像生成部在执行对象层和参照层之间的层间预测时,在不存在将表示所述对象层的所述第一层识别信息和表示所述参照层的所述第二层识别信息设为索引的所述参照区域位置信息的情况下,将对象层的所述显示区域信息表示的显示区域位置设定作为所述对象层参照区域位置,在不存在将表示参照层的所述第一层识别信息和表示对象层的所述第二层识别信息设为索引的所述参照区域位置信息的情况下,将参照层的所述显示区域信息表示的显示区域设定作为所述参照层参照区域位置。
此外,优选在上述图像解码装置中,所述预测图像生成部导出所述标度,来作为所述对象层参照区域位置表示的参照区域尺寸和所述参照层参照区域位置表示的参照区域尺寸之比或者将比近似的值。
为了解决上述课题,本发明的图像编码装置是,一种图像编码装置,根据输入图像来生成作为对象层的上位层的编码数据,其特征在于,包括:参数集编码部,对参数集进行编码;以及预测图像生成部,参照参照层图片的解码像素,通过层间预测来生成预测图像,所述参数集编码部对参照区域信息进行编码,所述预测图像生成部根据在所述参照区域信息中包含的参照区域位置信息导出对象层参照区域位置以及参照层参照区域位置,使用所述参照区域位置以及所述参照层参照区域位置来导出在层间预测中使用的标度以及对应参照位置的至少一方。
为了解决上述课题,本发明的编码数据变换装置是,一种层次编码数据变换装置,包括参数集修正部,该参数集修正部基于输入的关注区域信息来变换所输入的层次编码数据,生成关注区域层次编码数据而输出,其特征在于,所述参数集修正部以根据层次编码数据来导出的对象层参照区域位置以及参照层参照区域位置分别在变换前后一致的方式,修正参照区域位置信息。
为了解决上述课题,本发明的图像编码装置是,一种图像解码装置,对进行了层次编码的编码数据进行解码,复原作为对象层的上位层的解码图片,其特征在于,包括:参数集解码部,对参数集进行解码;以及预测图像生成部,参照参照层图片的解码像素,通过层间预测来生成预测图像,所述参数集解码部对层间位置对应信息进行解码,所述层间位置对应信息包括与参照层分别相关联的放大参照层偏移量语法、参照层偏移量语法以及层间相位偏移量语法,所述参数集解码部对表示特定的参照层的第一参照层识别符进行解码,根据编码数据来连续对与所述第一参照层识别符相关联的所述放大参照层偏移量语法、与所述第一参照层识别符相关联的所述参照层偏移量语法以及与所述第一参照层识别符相关联的层间相位偏移量语法进行解码,所述预测图像生成部在生成使用预定的参照层时的预测图像的情况下,使用与该参照层相关联的所述放大参照层偏移量语法、所述参照层偏移量语法以及所述层间相位偏移量语法,导出在层间预测中使用的标度以及对应参照位置的至少一方。
此外,在上述图像解码装置中,其特征在于,所述层间位置对应信息包括与特定的参照层相关联的参照层偏移量信息存在与否标记,所述预测图像生成部根据所述参照层偏移量信息存在与否标记的值,对与该参照层偏移量相关联的参照层有关的参照层偏移量语法进行解码。
此外,在上述图像解码装置中,其特征在于,所述层间位置对应信息包括与特定的参照层相关联的层间相位偏移量信息存在与否标记,所述预测图像生成部根据所述层间相位偏移量信息存在与否标记的值,对该参照层偏移量相关联的层间相位偏移量语法进行解码。
此外,在上述图像解码装置中,其特征在于,所述层间位置对应信息包括与特定的参照层相关联的层偏移量信息存在与否标记,所述预测图像生成部根据所述层偏移量信息存在与否标记的值,对该参照层偏移量相关联的放大参照层偏移量语法以及参照层偏移量语法进行解码。
发明效果
本发明的图像解码装置(图像编码装置)包括:参数集解码部,对包括参照区域位置信息的参数集进行解码;以及预测图像生成部,参照根据参照区域位置信息来导出的对象层参照区域位置以及参照层参照区域位置,导出层间预测中的标度或对应参照位置。
因此,本发明的图像解码装置(图像编码装置)能够通过比以往少的处理量以及小的规模的电路的解码处理(编码处理),实现在相当于关注区域的部分数据提取时的对应参照位置或标度的维持。
附图说明
图1是在本实施方式的层次运动图像解码装置以及层次运动图像编码装置中执行的对应参照位置导出处理的流程图。
图2是用于说明本发明的实施方式的层次编码数据的层结构的图,(a)表示层次运动图像编码装置侧,(b)表示层次运动图像解码装置侧。
图3是用于说明本发明的实施方式的层次编码数据的结构的图,(a)表示规定序列SEQ的序列层,(b)表示规定图片PICT的图片层,(c)表示规定条带S的条带层,(d)表示规定编码树单元CTU的CTU层,(e)表示规定在编码树单元CTU中包含的编码单位(CodingUnit;CU)的CU层。
图4是说明本发明的实施方式的层次编码数据中的图片和瓦片(tile)/条带(slice)的关系的图,(a)例示将图片通过瓦片/条带而分割时的分割区域,(b)例示编码数据的结构中的瓦片和条带的关系。
图5是表示上述层次运动图像解码装置的概略结构的功能块图。
图6是例示在上述层次运动图像解码装置中包含的基础解码部的结构的功能块图。
图7是例示作为图片内的部分区域的显示区域和显示区域位置信息的关系的图。
图8是例示对象层图片、对象层参照区域、参照层图片、参照层参照区域与参照区域偏移量的关系的图。
图9是在VPS扩展的解码时参照的语法表的一部分,且是有关参照区域信息所涉及的语法的部分。
图10是在SPS扩展的解码时参照的语法表的一部分,且是有关参照区域信息所涉及的语法的部分。
图11是在SPS扩展的解码时参照的语法表的一部分,且是有关参照区域信息所涉及的语法的部分的其他例。
图12是在SPS扩展的解码时参照的语法表的一部分,且是有关显示区域利用控制标记的部分的例。
图13是例示在上述层次运动图像解码装置中包含的条带解码部的结构的功能块图。
图14是表示本发明的一实施方式的层次运动图像编码装置的概略结构的功能块图。
图15是例示在上述层次运动图像编码装置中包含的条带编码部的结构的功能块图。
图16是表示了本发明的一实施方式的层次编码数据变换装置的概略结构的功能块图。
图17是例示了变换前后的层次编码数据中的图片、关注区域以及瓦片的关系的图。
图18是表示了由上述层次运动图像解码装置、层次运动图像编码装置以及层次编码数据变换装置的组合来实现的关注区域显示***的结构的框图。
图19是表示搭载了上述层次运动图像编码装置的发送装置以及搭载了上述层次运动图像解码装置的接收装置的结构的图。(a)表示搭载了层次运动图像编码装置的发送装置,(b)表示搭载了层次运动图像解码装置的接收装置。
图20是表示搭载了上述层次运动图像编码装置的记录装置以及搭载了上述层次运动图像解码装置的再现装置的结构的图。(a)表示搭载了层次运动图像编码装置的记录装置,(b)表示搭载了层次运动图像解码装置的再现装置。
图21是例示对象层图片、对象层对应区域、参照层图片、参照层对象区域与放大参照层偏移量的关系的图。
图22是在PPS扩展的解码时参照的语法表的一部分,且是有关层间位置对应信息所涉及的语法的部分。
图23是在PPS扩展的解码时参照的语法表的一部分的其他例,且是有关层间位置对应信息所涉及的语法的部分。
图24是在PPS扩展的解码时参照的语法表的一部分的其他例,且是有关层间位置对应信息所涉及的语法的部分。
具体实施方式
基于图1~图20,说明本发明的一实施方式的层次运动图像解码装置1、层次运动图像编码装置2以及编码数据变换装置3,则如下所述。
〔概要〕
本实施方式的层次运动图像解码装置(图像解码装置)1对通过层次运动图像编码装置(图像编码装置)2进行了层次编码的编码数据进行解码。层次编码是,将运动图像从低质量的图像到高质量的图像层次性地编码的编码方式。层次编码例如在SVC或SHVC中进行标准化。另外,这里所称的运动图像的质量广泛地意味着对主观性以及客观性的运动图像的美观产生影响的元素。在运动图像的质量中,例如包括“分辨率”、“帧频”、“画质”以及“像素的表现精度”。因此,以下,若说运动图像的质量不同,则例示性地指“分辨率”等不同,但并不限定于此。例如,在通过不同的量化步长而被量化的运动图像的情况下(即,在通过不同的编码噪声而被编码的运动图像的情况下),也可以说运动图像的质量互相不同。
从被层次化的信息的种类的观点出发,层次编码技术有时也被分类为(1)空域分级、(2)时域分级、(3)SNR(Signal to Noise Ratio,信号对噪声比)分级性以及(4)视图分级。空域分级是,在分辨率或图像的尺寸上进行层次化的技术。时域分级是,在帧频(单位时间的帧数)上进行层次化的技术。此外,SNR分级是,在编码噪声上进行层次化的技术。此外,视图分级是,在与各图像相对应的视点位置上进行层次化的技术。
此外,本实施方式的编码数据变换装置3将通过层次运动图像编码装置2进行了层次编码的编码数据进行变换,生成与预定的关注区域有关的编码数据(关注区域编码数据)。关注区域编码数据能够在本实施方式的层次运动图像解码装置1中进行解码。
在本实施方式的层次运动图像编码装置2、层次运动图像解码装置1以及层次编码数据变换装置3的详细的说明之前,首先说明(1)由层次运动图像编码装置2或者层次编码数据变换装置3生成且由层次运动图像解码装置1进行解码的层次编码数据的层结构,接着,说明(2)能够在各层中采用的数据结构的具体例。
〔层次编码数据的层结构〕
这里,使用图2说明层次编码数据的编码以及解码,则如下所述。图2是示意性地表示通过下位层次L3、中位层次L2以及上位层次L1的3个层次对运动图像层次性地编码/解码的情况的图。即,在图2(a)以及(b)所示的例中,在3个层次中,上位层次L1成为最上位层,下位层次L3成为最下位层。
以下,与能够从层次编码数据进行解码的特定的质量对应的解码图像被称为特定的层次的解码图像(或者,与特定的层次对应的解码图像)(例如,上位层次L1的解码图像POUT#A)。
图2(a)表示将输入图像PIN#A~PIN#C分别层次性地编码而生成编码数据DATA#A~DATA#C的层次运动图像编码装置2#A~2#C。图2(b)表示将层次性地编码的编码数据DATA#A~DATA#C分别进行解码而生成解码图像POUT#A~POUT#C的层次运动图像解码装置1#A~1#C。
首先,使用图2(a)说明编码装置侧。成为编码装置侧的输入的输入图像PIN#A、PIN#B以及PIN#C虽然原画相同,但图像的质量(分辨率、帧频以及画质等)不同。图像的质量按照输入图像PIN#A、PIN#B以及PIN#C的顺序降低。
下位层次L3的层次运动图像编码装置2#C对下位层次L3的输入图像PIN#C进行编码而生成下位层次L3的编码数据DATA#C。包括用于对下位层次L3的解码图像POUT#C进行解码所需的基本信息(图2中由“C”表示)。由于下位层次L3是最下层的层次,所以下位层次L3的编码数据DATA#C也被称为基本编码数据。
此外,中位层次L2的层次运动图像编码装置2#B一边参照下位层次的编码数据DATA#C一边对中位层次L2的输入图像PIN#B进行编码而生成中位层次L2的编码数据DATA#B。在中位层次L2的编码数据DATA#B中,除了在编码数据DATA#C中包含的基本信息“C”之外,还包括用于对中位层次的解码图像POUT#B进行解码所需的附加的信息(图2中由“B”表示)。
此外,上位层次L1的层次运动图像编码装置2#A一边参照中位层次L2的编码数据DATA#B一边对上位层次L1的输入图像PIN#A进行编码而生成上位层次L1的编码数据DATA#A。在上位层次L1的编码数据DATA#A中,除了用于对下位层次L3的解码图像POUT#C进行解码所需的基本信息“C”以及用于对中位层次L2的解码图像POUT#B进行解码所需的附加的信息“B”之外,还包括用于对上位层次的解码图像POUT#A进行解码所需的附加的信息(图2中由“A”表示)。
这样,上位层次L1的编码数据DATA#A包括与不同的多个质量的解码图像有关的信息。
接着,参照图2(b)说明解码装置侧。在解码装置侧中,与上位层次L1、中位层次L2以及下位层次L3的各个层次对应的解码装置1#A、1#B以及1#C对编码数据DATA#A、DATA#B以及DATA#C进行解码而输出解码图像POUT#A、POUT#B以及POUT#C。
另外,也能够提取上位的层次编码数据的一部分信息,通过在较下位的特定的解码装置中,对该提取出的信息进行解码,从而再现特定的质量的运动图像。
例如,中位层次L2的层次运动图像解码装置1#B也可以从上位层次L1的层次编码数据DATA#A中,提取用于对解码图像POUT#B进行解码所需的信息(即,在层次编码数据DATA#A中包含的“B”以及“C”),对解码图像POUT#B进行解码。换言之,在解码装置侧中,能够基于在上位层次L1的层次编码数据DATA#A中包含的信息,对解码图像POUT#A、POUT#B以及POUT#C进行解码。
另外,并不限定于以上的3个层次的层次编码数据,层次编码数据也可以通过2个层次进行层次编码,也可以通过多于3个层次的层次数进行层次编码。
此外,也可以如下构成层次编码数据:将与特定的层次的解码图像有关的编码数据的一部分或者全部,与其他的层次独立地编码,在特定的层次的解码时,也可以不参照其他的层次的信息。例如,在使用了图2(a)以及(b)的上述的例中,说明了在解码图像POUT#B的解码中参照“C”以及“B”,但并不限定于此。也能够如下构成层次编码数据:解码图像POUT#B能够只使用“B”进行解码。例如,还能够构成将在解码图像POUT#B的解码中只由“B”构成的层次编码数据和解码图像POUT#C作为输入的层次运动图像解码装置。
另外,在实现SNR分级的情况下,也能够以在作为输入图像PIN#A、PIN#B以及PIN#C而使用了同一个原画的基础上,解码图像POUT#A、POUT#B以及POUT#C成为不同的画质的方式生成层次编码数据。此时,与上位层次的层次运动图像编码装置相比,下位层次的层次运动图像编码装置通过使用更大的量化步长对预测残差进行量化,从而生成层次编码数据。
在本说明书中,为了便于说明,如下定义用语。只要没有特别提及,则以下的用语用于表示下述的技术事项。
上位层:将比某层次位于更上位的层次称为上位层。例如,在图2中,下位层次L3的上位层是中位层次L2以及上位层次L1。此外,上位层的解码图像是指,质量更高(例如,分辨率更高、帧频更高、画质更高等)的解码图像。
下位层:将比某层次位于更下位的层次称为下位层。例如,在图2中,上位层次L1的下位层是中位层次L2以及下位层次L3。此外,下位层的解码图像是指,质量更低的解码图像。
对象层:是指成为解码或者编码的对象的层次。另外,将与对象层对应的解码图像称为对象层图片。此外,将构成对象层图片的像素称为对象层像素。
参照层(reference layer):将在对与对象层对应的解码图像进行解码时参照的特定的下位层称为参照层。另外,将与参照层对应的解码图像称为参照层图片。此外,将构成参照层的像素称为参照层像素。
在如图2(a)以及(b)所示的例中,上位层次L1的参照层是中位层次L2以及下位层次L3。但是,并不限定于此,也能够如下构成层次编码数据:在特定的上述层的解码中,也可以不参照下位层的全部。例如,也能够如下构成层次编码数据:上位层次L1的参照层成为中位层次L2以及下位层次L3中的任一个。
基本层(基础层(base layer)):将位于最下层的层次称为基本层。基本层的解码图像是能够从编码数据进行解码的质量最低的解码图像,被称为基本解码图像。换言之,基本解码图像是与最下层的层次对应的解码图像。基本解码图像的解码所需的层次编码数据的部分编码数据被称为基本编码数据。例如,在上位层次L1的层次编码数据DATA#A中包含的基本信息“C”是基本编码数据。
扩展层:基本层的上位层被称为扩展层。
层识别符:层识别符是用于识别层次的识别符,与层次1对1对应。在层次编码数据中,包括用于选择特定的层次的解码图像的解码所需的部分编码数据而使用的层次识别符。与对应于特定的层的层识别符相关联的层次编码数据的部分集合也被称为层表现。
一般,在特定的层次的解码图像的解码中,使用该层次的层表现和/或与该层次的下位层对应的层表现。即,在对象层的解码图像的解码中,使用对象层的层表现和/或在对象层的下位层中包含的1个以上层次的层表现。
层间预测:层间预测是,基于在与对象层的层表现不同的层次(参照层)的层表现中包含的语法元素值、通过语法元素值而导出的值以及解码图像,预测对象层的语法元素值或在对象层的解码中使用的编码参数等。有时也将根据参照层的信息来预测与运动预测有关的信息的层间预测称为运动信息预测。此外,有时也将根据下位层的解码图像来预测的层间预测称为层间图像预测(或者层间纹理预测)。另外,在层间预测中使用的层次,例示性地是对象层的下位层。此外,有时也将不使用参照层而在对象层内进行预测称为层内预测。
另外,以上的用语到底是为了便于说明的,也可以由其他的用语来表现上述的技术事项。
〔关于层次编码数据的数据结构〕
以下,例示作为生成各层次的编码数据的编码方式,使用HEVC及其扩展方式的情况。但是,并不限定于此,也可以通过MPEG-2或H.264/AVC等的编码方式来生成各层次的编码数据。
此外,下位层和上位层也可以通过不同的编码方式来进行编码。此外,各层次的编码数据也可以经由相互不同的传输路径而提供给层次运动图像解码装置1,也可以经由相同的传输路径而提供给层次运动图像解码装置1。
例如,也可以在将超高清影像(运动图像、4K影像数据)通过基本层以及1个扩展层进行可分级编码而传输的情况下,基本层通过MPEG-2或者H.264/AVC对将4K影像数据进行缩放(down scaling)、交织化的影像数据进行编码并通过电视广播网而传输,扩展层通过HEVC对4K影像(渐进式)进行编码并通过互联网而传输。
(基本层)
图3是例示在基本层中能够采用的编码数据(若以图2的例来说,则层次编码数据DATA#C)的数据结构的图。层次编码数据DATA#C例示性地包括序列以及构成序列的多个图片。
图3表示层次编码数据DATA#C中的数据的层次结构。图3的(a)~(e)是分别表示规定序列SEQ的序列层、规定图片PICT的图片层、规定条带S的条带层、规定编码树单元(Coding Tree Unit;CTU)的CTU层、规定在编码树单元CTU中包含的编码单位(CodingUnit;CU)的CU层的图。
(序列层)
在序列层中,规定有为了对处理对象的序列SEQ(以下,也称为对象序列)进行解码而层次运动图像解码装置1参照的数据的集合。如图3的(a)所示,序列SEQ包括视频参数集VPS(Video Parameter Set)、序列参数集SPS(Sequence Parameter Set)、图片参数集PPS(Picture Parameter Set)、图片PICT1~PICTNP(NP为在序列SEQ中包含的图片的总数)以及附加扩展信息SEI(Supplemental Enhancement Information)。
在视频参数集VPS中,规定有在编码数据中包含的层数、层间的依赖关系。
在序列参数集SPS中,规定有为了对对象序列进行解码而层次运动图像解码装置1参照的编码参数的集合。SPS也可以在编码数据内存在多个。此时,按每个对象序列从多个候选中选择用于解码的SPS。在特定序列的解码中使用的SPS也被称为有效SPS。以下,只要没有特别说明,则意味着对于对象序列的有效SPS。
在图片参数集PPS中,规定有为了对对象序列内的各图片进行解码而层次运动图像解码装置1参照的编码参数的集合。另外,PPS也可以在编码数据内存在多个。此时,从对象序列内的各图片中选择多个PPS中的任一个。在特定图片的解码中使用的PPS也被称为有效PPS。以下,只要没有特别说明,则PPS意味着对于对象图片的有效PPS。另外,有效SPS以及有效PPS也可以按每个层设定为不同的SPS或PPS。
(图片层)
在图片层中,规定有为了对处理对象的图片PICT(以下,也称为对象图片)进行解码而层次运动图像解码装置1参照的数据的集合。如图3的(b)所示,图片PICT包括条带头SH1~SHNS以及条带S1~SNS(NS是在图片PICT中包含的条带的总数)。
另外,以下,在不需要区分条带头SH1~SHNS或条带S1~SNS的每个的情况下,有时省略标记的下标而记载。此外,关于在以下说明的层次编码数据DATA#C中包含且标上下标的其他的数据,也是同样的。
在条带头SHk中,包括为了决定对应的条带Sk的解码方法而层次运动图像解码装置1参照的编码参数群。例如,包括指定SPS的SPS识别符(seq_parameter_set_id)或指定PPS的PPS识别符(pic_parameter_set_id)。此外,指定条带类型的条带类型指定信息(slice_type)是在条带头SH中包含的编码参数的一例。
作为能够由条带类型指定信息指定的条带类型,举出(1)在编码时只使用内部预测的I条带、(2)在编码时使用单向预测或者内部预测的P条带、(3)在编码时使用单向预测、双向预测或者内部预测的B条带等。
(条带层)
在条带层中,规定有为了对处理对象的条带S(也称为对象条带)进行解码而层次运动图像解码装置1参照的数据的集合。如图3的(c)所示,条带S包括编码树单元CTU1~CTUNC(NC是在条带S中包含的CTU的总数)。
(CTU层)
在CTU层中,规定有为了对处理对象的编码树单元CTU(以下,也称为对象CTU)进行解码而层次运动图像解码装置1参照的数据的集合。另外,有时也将编码树单元称为编码树块(CTB:Coding Tree block)或者最大编码单位(LCU:Largest Cording Unit)。
编码树单元CTU包括CTU头CTUH、编码单位信息CU1~CUNL(NL是在CTU中包含的编码单位信息的总数)。这里,首先,若说明编码树单元CTU和编码单位信息CU的关系,则如下所述。
编码树单元CTU分割为用于确定为了进行内部预测或者外部预测以及变换的各处理的块尺寸的单位。
编码树单元CTU的上述单位通过递归的4叉树分割而被分割。以下,将通过该递归的4叉树分割而获得的树结构称为编码树(coding tree)。
以下,将与作为编码树的末端的节点的叶(leaf)对应的单位作为编码节点(coding node)而参照。此外,由于编码节点成为编码处理的基本的单位,所以以下也将编码节点称为编码单位(CU)。
即,编码单位信息(以下,称为CU信息)CU1~CUNL是与将编码树单元CTU递归性地进行4叉树分割而获得的各编码节点(编码单位)对应的信息。
此外,编码树的根(root)与编码树单元CTU相对应。换言之,编码树单元CTU与将多个编码节点递归性地包括的4叉树分割的树结构的最上位节点相对应。
另外,各编码节点的尺寸的纵横都是成为该编码节点的父节点的编码节点(即,该编码节点的上位1个层次的节点)的尺寸的一半。
此外,编码树单元CTU的尺寸以及各编码单元可取的尺寸,依赖于在序列参数集SPS中包含的最小编码节点的尺寸指定信息以及最大编码节点和最小编码节点的层次深度的差分。例如,在最小编码节点的尺寸为8×8像素且最大编码节点和最小编码节点的层次深度的差分为3的情况下,编码树单元CTU的尺寸为64×64像素,编码节点的尺寸可取4种尺寸、即64×64像素、32×32像素、16×16像素以及8×8像素中的任一个。
(CTU头)
在CTU头CTUH中,包括为了决定对象CTU的解码方法而层次运动图像解码装置1参照的编码参数。具体而言,如图3的(d)所示,包括指定对象CTU至各CU的分割模式的CTU分割信息SP_CTU以及指定量化步长的大小的量化参数差分Δqp(qp_delta)。
CTU分割信息SP_CTU是表示用于分割CTU的编码树的信息,具体而言,是指定在对象CTU中包含的各CU的形状、尺寸以及在对象CTU内的位置的信息。
另外,CTU分割信息SP_CTU也可以不明示地包括CU的形状或尺寸。例如,CTU分割信息SP_CTU也可以是表示是否将对象CTU整体或者CTU的部分区域进行四分割的标记的集合。此时,通过并用CTU的形状或尺寸,能够确定各CU的形状或尺寸。
(CU层)
在CU层中,规定有为了对处理对象的CU(以下,也称为对象CU)进行解码而层次运动图像解码装置1参照的数据的集合。
这里,在说明在CU信息CU中包含的数据的具体的内容之前,说明在CU中包含的数据的树结构。编码节点成为预测树(prediction tree;PT)以及变换树(transform tree;TT)的根的节点。若说明预测树以及变换树,则如下所述。
在预测树中,编码节点分割为一个或者多个预测块,且规定有各预测块的位置和尺寸。换言之,预测块是构成编码节点的一个或者多个不重复的区域。此外,预测树包括通过上述的分割而获得的一个或者多个预测块。
预测处理对该每个预测块进行。以下,也将作为预测的单位的预测块称为预测单位(prediction unit;PU)。
预测树中的分割(以下,简称为PU分割)的种类大致有内部预测的情况和外部预测的情况的两种。
在内部预测的情况下,分割方法有2N×2N(与编码节点相同的尺寸)和N×N。此外,在外部预测的情况下,分割方法有2N×2N(与编码节点相同的尺寸)、2N×N、2N×nU、2N×nD、N×2N、nL×2N以及nR×2N等。
此外,在变换树中,编码节点分割为一个或者多个变换块,且规定有各变换块的位置和尺寸。换言之,变换块是构成编码节点的一个或者多个不重复的区域。此外,变换树包括通过上述的分割而获得的一个或者多个变换块。
在变换树中的分割中,有将与编码节点相同的尺寸的区域作为变换块而分配的分割、以及与上述的树块的分割相同的递归的4叉树分割的分割。
变换处理对该每个变换块进行。以下,也将作为变换的单位的变换块称为变换单位(transform unit;TU)。
(CU信息的数据结构)
接着,参照图3(e)说明在CU信息CU中包含的数据的具体的内容。如图3(e)所示,CU信息CU具体包括跳过标记SKIP、预测树信息(以下,简称为PT信息)PTI以及变换树信息(以下,简称为TT信息)TTI。
跳过标记SKIP是表示是否对对象的PU应用跳过模式的标记,在跳过标记SKIP的值为1的情况下,即在对对象CU应用跳过模式的情况下,该CU信息CU中的PT信息PTI的一部分以及TT信息TTI被省略。另外,跳过标记SKIP在I条带中被省略。
[PT信息]
PT信息PTI是与在CU中包含的预测树(以下,简称为PT)有关的信息。换言之,PT信息PTI是与在PT中包含的一个或者多个PU的各个有关的信息的集合,在由层次运动图像解码装置1生成预测图像时参照。如图3(e)所示,PT信息PTI包括预测类型信息PType以及预测信息PInfo。
预测类型信息PType是指定关于对象PU的预测图像生成方法的信息。在基础层中为指定是使用内部预测还是使用外部预测的信息。
预测信息PInfo是在由预测类型信息PType指定的预测方法中使用的预测信息。在基础层中,在内部预测的情况下,包括内部预测信息PP_Intra。此外,在外部预测的情况下,包括外部预测信息PP_Inter。
外部预测信息PP_Inter包括在层次运动图像解码装置1通过外部预测而生成外部预测图像时参照的预测信息。更具体而言,外部预测信息PP_Inter包括指定对象CU至各外部PU的分割模式的外部PU分割信息以及关于各外部PU的外部预测参数(运动补偿参数)。作为外部预测参数,例如包括合并标记(merge_flag)、合并索引(merge_idx)、估计运动矢量索引(mvp_idx)、参照图片索引(ref_idx)、外部预测标记(inter_pred_flag)以及运动矢量残差(mvd)。
内部预测信息PP_Intra包括在层次运动图像解码装置1通过内部预测而生成内部预测图像时参照的编码参数。更具体而言,在内部预测信息PP_Intra中,包括指定对象CU至各内部PU的分割模式的内部PU分割信息以及关于各内部PU的内部预测参数。内部预测参数是用于指定关于各内部PU的内部预测方法(预测模式)的参数。
[TT信息]
TT信息TTI是与在CU中包含的变换树(以下,简称为TT)有关的信息。换言之,TT信息TTI是与在TT中包含的一个或者多个变换块的各个有关的信息的集合,在由层次运动图像解码装置1解码残差数据时参照。
如图3(e)所示,TT信息TTI包括指定对象CU至各变换块的分割模式的TT分割信息SP_TT以及量化预测残差QD1~QDNT(NT是在对象CU中包含的块的总数)。
具体而言,TT分割信息SP_TT是用于决定在对象CU中包含的各变换块的形状、尺寸以及对象CU内的位置的信息。例如,TT分割信息SP_TT能够由表示是否进行对象节点的分割的信息(split_transform_unit_flag)和表示该分割的深度的信息(trafoDepth)实现。
此外,例如,在CU尺寸为64×64的情况下,通过分割而获得的各变换块可取32×32像素至4×4像素的尺寸。
各量化预测残差QD是,层次运动图像编码装置2通过对作为处理对象的变换块的对象块实施以下的处理1~3而生成的编码数据。
处理1:对从编码对象图像减去预测图像的预测残差进行频率变换(例如,DCT变换(离散余弦变换(Discrete Cosine Transform))以及DST变换(离散正弦变换(DiscreteSine Transform))等);
处理2:对通过处理1而获得的变换系数进行量化;
处理3:对通过处理2而量化的变换系数进行可变长编码;
另外,上述的量化参数qp表示在层次运动图像编码装置2对变换系数进行量化时使用的量化步长QP的大小(QP=2qp/6)。
(PU分割信息)
在由PU分割信息指定的PU分割类型中,若将对象CU的尺寸设为2N×2N像素,则有如下的共计8种模式。即,2N×2N像素、2N×N像素、N×2N像素、N×N像素的4个对称的分割(symmetric splittings)、以及2N×nU像素、2N×nD像素、nL×2N像素、nR×2N像素的4个不对称的分割(asymmetric splittings)。另外,意味着N=2m(m是1以上的任意的整数)。以下,也将分割对象CU而获得的预测单位称为预测块或者分区(Partition)。
(扩展层)
关于在扩展层的层表现中包含的编码数据(以下,扩展层编码数据),例如能够采用与图3所示的数据结构大致相同的数据结构。但是,在扩展层编码数据中,如以下所述,能够追加附加的信息或者省略参数。
在条带层中,也可以被编码空域分级、时域分级以及SNR分级、视图分级的层次的识别信息(分别为dependency_id、temporal_id、quality_id以及view_id)。
此外,在CU信息CU中包含的预测类型信息PType是指定关于对象CU的预测图像生成方法是内部预测、外部预测、或者层间图像预测中的哪一个的信息。在预测类型信息PType中,包括指定有无应用层间图像预测模式的标记(层间图像预测标记)。另外,层间图像预测标记也被称为texture_rl_flag、inter_layer_pred_flag、或者base_mode_flag。
在扩展层中,也可以指定对象CU的CU类型是内部CU、层间CU、外部CU、跳过CU中的哪一个。
内部CU能够与基础层中的内部CU相同地定义。在内部CU中,层间图像预测标记设定为“0”,预测模式标记设定为“0”。
层间CU能够将参照层的图片的解码图像定义为在预测图像生成中使用的CU。在层间CU中,层间图像预测标记设定为“1”,预测模式标记设定为“0”。
跳过CU能够与上述的HEVC方式的情况相同地定义。例如,在跳过CU中,对跳过标记设定“1”。
外部CU也可以定义为应用非跳过且运动补偿(MC;MotionCompensation)的CU。在外部CU中,例如,对跳过标记设定“0”,对预测模式标记设定“1”。
此外,如上所述,也可以通过与下位层的编码方式不同的编码方式,生成扩展层的编码数据。即,扩展层的编码/解码处理不依赖下位层的编解码器的种类。
下位层也可以通过例如MPEG-2或H.264/AVC方式进行编码。
也可以在扩展层编码数据中,VPS被扩展而包括表示层间的参照结构的参数。
此外,也可以在扩展层编码数据中,SPS、PPS、条带头被扩展而包括在层间图像预测中使用的参照层的解码图像所涉及的信息(例如,用于直接或者间接地导出后述的层间参照图片集、层间参照图片列表、基础控制信息等的语法)。
另外,以上说明的参数既可以单独进行编码,也可以是多个参数复合进行编码。在多个参数复合进行编码的情况下,对该参数的值的组合分配索引,被分配的该索引进行编码。此外,若参数能够从其他参数或解码完毕的信息导出,则能够省略该参数的编码。
〔图片、瓦片、条带的关系〕
接着,关于图片、瓦片、条带,参照图4说明相互的关系以及与编码数据的关系。图4是说明层次编码数据中的图片和瓦片/条带的关系的图。瓦片与图片内的矩形的部分区域以及该部分区域所涉及的编码数据相对应。条带与图片内的部分区域以及该部分区域所涉及的编码数据、即该部分区域所涉及的条带头以及条带数据相对应。
图4(a)例示将图片通过瓦片/条带而分割时的分割区域。在图4(a)中,图片分割为矩形的6个瓦片(T00、T01、T02、T10、T11、T12)。瓦片T00、瓦片T02、瓦片T10、瓦片T12分别包括1个条带(依次为条带S00、条带S02、条带S10、条带S12)。另一方面,瓦片T01包括2个条带(条带S01a和条带S01b),瓦片T11包括2个条带(条带S11a和条带S11b)。
图4(b)例示编码数据的结构中的瓦片和条带的关系。首先,编码数据由多个VCL(视频编码层(Video Coding Layer))NAL单元和非VCL(non-VCL)NAL单元构成。相当于1张图片的视频编码层的编码数据由多个VCL NAL构成。在图片分割为瓦片的情况下,在相当于图片的编码数据中,按照瓦片的光栅顺序包括相当于瓦片的编码数据。即,在如图4(a)所示那样图片分割为瓦片的情况下,按照瓦片T00、T01、T02、T10、T11、T12的顺序包括相当于瓦片的编码数据。在瓦片分割为多个条带的情况下,条带开头的CTU从在瓦片内的CTU光栅扫描顺序上位于前方的条带起依次,相当于条带的编码数据包含在相当于瓦片的编码数据中。例如,如图4(a)所示,在瓦片T01包括条带S01a和S01b的情况下,按照条带S01a、条带S01b的顺序,相当于条带的编码数据依次包含在相当于瓦片T01的编码数据中。
如以上的说明可知,对相当于图片内的特定的瓦片的编码数据,相关联了对应于一个以上的条带的编码数据。因此,若能够生成与瓦片相关联的条带的解码图像,则能够生成与该瓦片对应的图片内的部分区域的解码图像。
以下,若没有特别追加的说明,则以如上述的图片、瓦片、条带和编码数据的关系为前提进行说明。
〔层次运动图像解码装置〕
以下,参照图1~图13说明本实施方式的层次运动图像解码装置1的结构。
(层次运动图像解码装置的结构)
参照图5说明层次运动图像解码装置1的概略结构。图5是表示了层次运动图像解码装置1的概略结构的功能块图。层次运动图像解码装置1对层次编码数据DATA(从层次运动图像编码装置2提供的层次编码数据DATAF或者从编码数据变换装置3提供的层次编码数据DATAR)进行解码,生成对象层的解码图像POUT#T。另外,以下,以对象层作为将基本层设为参照层的扩展层来说明。因此,对象层也是相对于参照层的上位层。相反地,参照层也是相对于对象层的下位层。
如图5所示,层次运动图像解码装置1包括NAL解复用部11、参数集解码部12、瓦片设定部13、条带解码部14、基础解码部15、解码图片管理部16。
NAL解复用部11对NAL(网络提取层(Network Abstraction Layer))中的以NAL单元单位传输的层次编码数据DATA进行解复用。
NAL是为了将VCL(视频编码层(Video Coding Layer))和对编码数据进行传输/蓄积的下位***之间的通信抽象化而设置的层。
VCL是进行运动图像编码处理的层,在VCL中进行编码。另一方面,这里所称的下位***与H.264/AVC以及HEVC的文件格式或MPEG-2***对应。
另外,在NAL中,在VCL中生成的比特流以NAL单元的单位划分而传输到成为目的地地址的下位***。在NAL单元中,包括在VCL中进行了编码的编码数据以及用于该编码数据适当地到达目的地地址的下位***的头。此外,各层次中的编码数据通过存储在NAL单元中且进行NAL复用,传输到层次运动图像解码装置1。
在层次编码数据DATA中,除了由VCL生成的NAL之外,还包括包含参数集(VPS、SPS、PPS)或SEI等的NAL。这些NAL相对于VCL NAL被称为非VCL NAL。
NAL解复用部11对层次编码数据DATA进行解复用而取出对象层编码数据DATA#T以及参照层编码数据DATA#$。此外,NAL解复用部11在对象层编码数据DATA#T中包含的NAL中,将非VCLNAL供应给参数集解码部12,将VCL NAL供应给条带解码部14。
参数集解码部12在从被输入的非VCL NAL中,将参数集、即VPS、SPS以及PPS进行解码,并供应给瓦片设定部13和条带解码部14。另外,关于参数集解码部12中的与本发明的关联性高的处理的细节,在后面叙述。
瓦片设定部13基于被输入的参数集来导出图片的瓦片信息,并供应给条带解码部14。瓦片信息至少包括图片的瓦片分割信息。
条带解码部14基于被输入的VCL NAL、参数集、瓦片信息以及参照图片来生成解码图片或者解码图片的部分区域,并记录在解码图片管理部16内的缓冲器中。条带解码部的详细的说明在后面叙述。
解码图片管理部16将被输入的解码图片或基础解码图片记录在内部的解码图片缓冲器(DPB:Decoded Picture Buffer)中,且进行参照图片列表生成或输出图片决定。此外,解码图片管理部16在预定的定时,将在DPB中记录的解码图片作为输出图片POUT#T而输出到外部。
基础解码部15根据参照层编码数据DATA#R来对基础解码图片进行解码。基础解码图片是在对象层的解码图片解码时利用的参照层的解码图片。基础解码部15将进行了解码的基础解码图片记录在解码图片管理部16内的DPB中。
使用图6说明基础解码部15的详细结构。图6是例示了基础解码部15的结构的功能块图。
如图6所示,基础解码部15包括基础NAL解复用部151、基础参数集解码部152、基础瓦片设定部153、基础条带解码部154、基础解码图片管理部156。
基础NAL解复用部151对参照层编码数据DATA#R进行解复用而提取VCL NAL和非VCL NAL,并将非VCL NAL供应给基础参数集解码部152,将VCL NAL供应给基础条带解码部154。
基础参数集解码部152根据被输入的非VCL NAL来解码参数集、即VPS、SPS以及PPS,并供应给基础瓦片设定部153和基础条带解码部154。
基础瓦片设定部153基于被输入的参数集来导出图片的瓦片信息,并供应给基础条带解码部154。
基础条带解码部154基于被输入的VCL NAL、参数集、瓦片信息以及参照图片来生成解码图片或者解码图片的部分区域,并记录在基础解码图片管理部156内的缓冲器中。
基础解码图片管理部156将被输入的解码图片记录在内部的DPB中,且进行参照图片列表生成或输出图片决定。此外,基础解码图片管理部156在预定的定时,将在DPB中记录的解码图片作为基础解码图片而输出。
(参数集解码部12)
参数集解码部12根据被输入的对象层的编码数据,解码在对象层的解码中使用的参数集(VPS、SPS、PPS)而输出。一般,参数集的解码基于既定的语法表来执行。即,按照语法表的确定的顺序,从编码数据读出比特串,对在语法表中包含的语法元素的语法值进行解码。此外,也可以根据需要,将基于进行了解码的语法值来导出的变量包含在要输出的参数集中。因此,从参数集解码部12输出的参数集能够表现为在编码数据中包含的参数集(VPS、SPS、PPS)所涉及的语法元素的语法值、以及根据该语法值来导出的变量的集合。
以下,详细说明在参数集解码部12中用于解码的语法表中、与本发明的关联性高的图片信息以及层间位置对应信息所涉及的语法表的一部分。
(图片信息)
参数集解码部12根据被输入的对象层编码数据,对图片信息进行解码。图片信息大致是确定对象层的解码图片的尺寸的信息。例如,图片信息包括表示对象层的解码图片的宽度或高度的信息。
图片信息包含在例如SPS中。在从SPS解码的图片信息中,包括解码图片的宽度(pic_width_in_luma_samples)和解码图片的高度(pic_height_in_luma_samples)。语法pic_width_in_luma_samples的值对应于以亮度像素单位的解码图片的宽度。此外,语法pic_height_in_luma_samples的值对应于以亮度像素单位的解码图片的高度。
另外,图片信息在层间共享。即,能够在对象层的解码以及编码时参照与对象层不同的层的图片信息。
(显示区域信息)
参数集解码部12根据被输入的对象层编码数据,对显示区域信息进行解码。显示区域信息包含在例如SPS中。从SPS解码的显示区域信息包括显示区域标记(conformance_flag)。显示区域标记示出表示显示区域的位置的信息(显示区域位置信息)是否追加地包含在SPS中。即,在显示区域标记为1的情况下,表示追加地包含显示区域位置信息,在显示区域标记为0的情况下,表示不追加地包含显示区域位置信息。
在显示区域标记为1的情况下,从SPS解码的显示区域信息进一步作为显示区域位置信息而包含显示区域左偏移量(conf_win_left_offset)、显示区域右偏移量(conf_win_right_offset)、显示区域上偏移量(conf_win_top_offset)、显示区域下偏移量(conf_win_bottom_offset)。
在显示区域标记为0的情况下,显示区域被设定图片整体。另一方面,在显示区域标记为1的情况下,被设定显示区域位置信息表示的图片内的部分区域。另外,显示区域也被称为一致性窗(conformance window)。
参照图7说明显示区域位置信息和显示区域的关系。图7是例示作为图片内的部分区域的显示区域和显示区域位置信息的关系的图。如图所示,显示区域包含在图片内,显示区域上偏移量表示图片上边和显示区域上边的距离,显示区域左偏移量表示图片左边和显示区域左边的距离,显示区域右偏移量表示图片右边和显示区域右边的距离,显示区域下偏移量表示图片下边和显示区域下边的距离。因此,根据上述的显示区域位置信息,能够唯一地确定显示区域在图片内的位置以及尺寸。另外,显示区域信息也可以是能够唯一地确定显示区域在图片内的位置以及尺寸的其他的信息。
另外,显示区域信息在层间共享。即,能够在对象层的解码以及编码时参照与对象层不同的层的显示区域信息。
(层间位置对应信息)
参数集解码部12根据被输入的对象层编码数据,对层间位置对应信息进行解码。层间位置对应信息大致表示对象层和参照层的对应的区域的位置关系。例如,在对象层的图片和参照层的图片中包含某物体(物体A)的情况下,对象层的图片上的与物体A对应的区域和参照层的图片上的与物体A对应的区域相当于所述对象层和参照层的对应的区域。另外,层间位置对应信息也可以不一定是准确地表示上述的对象层和参照层的对应的区域的位置关系的信息,但一般而言,为了提高层间预测的准确性,表示准确的对象层和参照层的对应的区域的位置关系。
(参照区域信息)
层间位置对应信息包括参照区域信息。参照区域信息是表示特定的层(以下,层A)中的、以下的2个区域的空间性的位置关系的信息。
(图片区域):层A上的与图片对应的区域
(参照区域):在层A与其他层(层B)之间的层间处理中,在表示层间的像素位置的对应关系的信息的导出中使用的、层A上的区域
在本实施方式中,作为参照区域信息而使用参照区域偏移量。参照区域偏移量是表示上述参照区域的各顶点和上述图片区域的对应的各顶点之间的位移的信息,由与左、上、右、下分别对应的、以下的4个偏移量构成。
1.参照区域左偏移量:参照区域左上像素和图片区域左上像素之间的水平方向的偏移量
2.参照区域上偏移量:参照区域左上像素和图片区域左上像素之间的垂直方向的偏移量
3.参照区域右偏移量:参照区域右下像素和图片区域右下像素之间的水平方向的偏移量
4.参照区域下偏移量:参照区域右下像素和图片区域右下像素之间的垂直方向的偏移量
使用图8说明在参照区域偏移量中包含的上述各偏移量、与图片区域以及参照区域的关系。图8是例示对象层图片、对象层参照区域、参照层图片、参照层参照区域、与参照区域偏移量的关系的图。在图8中,表示在对象层上的图片区域(对象层图片)中包含对象层上的参照区域(对象层参照区域)的情况下的、对象层中的各参照区域偏移量(对象层参照区域左偏移量、对象层参照区域上偏移量、对象层参照区域右偏移量、对象层参照区域下偏移量)的关系。此外,在图8中,表示在参照层上的图片区域(参照层图片)中包含参照层上的参照区域(参照层参照区域)的情况下的、参照层中的各参照区域偏移量(参照层参照区域左偏移量、参照层参照区域上偏移量、参照层参照区域右偏移量、参照层参照区域下偏移量)的关系。以层间预测为代表的层间处理中的对应像素位置导出或标度导出使用对象层参照区域和参照层参照区域来执行。
另外,在图8中,图示了参照区域包含在图片区域中的情况,但并不限定于此,既可以是图片区域包含在参照区域中,也可以是参照区域和图片区域的一部分重叠。在本实施方式中,参照区域偏移量的正负设为在参照区域包含在图片区域中的情况下取正的值,在图片区域中包含参照区域的情况下取负的值。即,在图8所示的在图片区域中包含参照区域的情况下,全部参照区域偏移量的值成为正。另外,参照区域偏移量的正负的定义也可以相反,但此时,需要适当地改变后述的对应参照位置或标度的导出式来应用。
另外,参照区域偏移量的目的在于,规定参照区域的形状、以及图片区域和参照区域的空间性的位置关系。因此,只要达到其目的,则也能够使用上述以外的参照偏移量以外的参数。例如,也可以使用参照区域的左上像素相对于图片区域左上像素的水平以及垂直方向的偏移量、和参照区域的矩形的宽度以及高度的组合。将规定参照区域的形状、以及图片区域和参照区域的空间性的位置关系的信息称为参照区域位置信息。参照区域位置信息相当于参照区域偏移量的上位概念。在本实施方式的说明中,以作为参照区域位置信息而使用参照区域偏移量的情况为前提来记载。
(参照区域偏移量的语法)
参照图9说明在参数集解码部12中,根据被输入的编码数据来解码的参照区域偏移量所涉及的语法。图9是参数集解码部12在VPS中包含的VPS扩展(vps_extension())的解码时参照的语法表的一部分,并且是参照区域偏移量所涉及的部分。
在VPS中,包括参照区域偏移量所涉及的多个语法元素。以下,将这些总称为参照区域偏移量关联语法。图9所示的语法表表示作为构成参照区域偏移量关联语法的语法元素,以下的语法元素包含在VPS扩展中。
·A0:参照区域偏移量存在与否标记(ref_region_offsets_in_vps_flag)
·A1:参照区域偏移量数(num_ref_region_offsets[i])
·A2:参照区域层索引信息(ref_region_layer_idx_delta_minus1[i][j])
·A3L:参照区域左偏移量信息(ref_region_left_offset[i][j])
·A3T:参照区域上偏移量信息(ref_region_top_offset[i][j])
·A3R:参照区域右偏移量信息(ref_region_right_offset[i][j])
·A3B:参照区域下偏移量信息(ref_region_bottom_offset[i][j])
语法元素A0是1比特的标记(u(1))的码。语法元素A1、A2通过在HEVC中规定的非负整数的0阶指数哥伦布码(ue(v))进行编码。A3L、A3T、A3R、A3B通过在HEVC中规定的附带符号的整数的0阶指数哥伦布码(se(v))进行编码。
参照区域偏移量存在与否标记(A0)是表示除了该标记之外的参照区域偏移量关联语法是否包含在VPS扩展中的标记。在该标记的值为1的情况下,表示包含参照区域偏移量关联语法。在除此以外(该标记的值为0)的情况下,表示不包含参照区域偏移量关联语法。
参照区域偏移量数(A1)表示相对于在VPS扩展中包含的根据索引i来确定的层(以下,层i)的参照区域偏移量的数。另外,索引i是表示在VPS扩展中包含的层的索引。参照区域偏移量的个数相当于与左、上、右、下分别对应的4个偏移量(上述A3L、A3T、A3R、A3B)的组合的个数。参照区域偏移量数对根据0以上且MaxLayersMinus1以下的索引的各值来确定的各层进行编码/解码。
另外,在VPS扩展中包含的参照区域偏移量数的个数,在实现还能够进行对于任意层的参照区域偏移量的传输的功能性的基础上,优选上述的个数。因此,在通过其他手段而清楚不能对一部分层利用参照区域偏移量的情况下,也可以省略与该层对应的参照区域偏移量数,将对于该层的参照区域偏移量的值估计为0。
参照区域层索引信息(A2)是确定与层i相关联的第j个层的信息。具体而言,参照区域层索引信息在与层i相关联的第j个层的VPS内的层索引(LIdx[i][j])的导出中利用。在将参照区域层索引信息的语法值ref_region_layer_idx_delta_minus1[i][j]设为RRL[i][j]的情况下,通过下式来导出LIdx[i][j]。
LIdx[i][j]=i-(RRL[i][j]+1)...(j==0)
LIdx[i][j]=LIdx[i][j-1]+(RRL[i][j]+1)...(j>=1)
即,在j等于0的情况下,设定比索引i小对参照区域层索引信息加1所得的数的层索引。此外,在j为1以上的情况下,设定比与层i相关联的第(j-1)个层的索引大对参照区域层索引信息加1所得的数的层索引。这里,RRL[i][j]的最大值小于比特流中的层数最大值(MaxLayersMinus1+1)。即,与层i相关联的第j个层的索引的最大值可取大于层i的索引(索引i)的值。
另外,在如上所述那样定义了参照区域层索引信息的情况下,具有抑制参照区域层索引信息的码量的效果。因此,在该码量的抑制不重要的情况下,也可以使用将索引j和特定的层相关联的其他语法以及导出手段的组合。例如,也可以作为参照区域层索引信息而使用VPS内层索引。此时,通过以下的式来导出LIdx[i][j]。
LIdx[i][j]=RRL[i][j]
参照区域偏移量信息(参照区域左偏移量信息(A3L)、参照区域上偏移量信息(A3T)、参照区域右偏移量信息(A3R)、参照区域下偏移量信息(A3B))是用于导出表示层i上的参照区域的偏移量(参照区域偏移量)的信息,该参照区域在层i和与层i相关联的第j个层之间的层间处理(层间预测)中参照。参照区域偏移量信息也是表示参照区域的位置和大小(形状)的信息,也称为参照区域位置信息。
上述的参照区域偏移量信息能够如下表现。即,参照区域位置信息是将第一层识别信息(上述i)和第二层识别信息(上述j)设为索引的排列变量。作为第一层识别信息的i是参照区域存在的层的VPS内层索引。此外,作为第二层识别信息的j是确定应用参照区域的层间处理的对象层的信息,且通过上述的LIdx[i][j]而与层间处理的对象层的VPS内层索引相关联。
(条带解码部14)
条带解码部14基于被输入的VCL NAL、参数集以及瓦片信息,生成解码图片而输出。
使用图13说明条带解码部14的概略结构。图13是表示了条带解码部14的概略结构的功能块图。
条带解码部14包括条带头解码部141、条带位置设定部142、CTU解码部144。CTU解码部144进一步包括预测残差复原部1441、预测图像生成部1442以及CTU解码图像生成部1443。
(条带头解码部)
条带头解码部141基于被输入的VCL NAL和参数集,对条带头进行解码,并输出到条带位置设定部142、跳过条带判定部143以及CTU解码部144。
在条带头中,包括图片内的条带位置所涉及的信息(SH条带位置信息)以及跳过条带所涉及的信息(SH跳过条带信息)。
在条带头中,作为条带位置信息而包含图片内开头条带标记(first_slice_segment_in_pic_flag)。在图片内开头条带标记为1的情况下,表示对象条带按照解码顺序位于图片内的开头。在图片内开头条带标记为0的情况下,表示对象条带没有按照解码顺序位于图片内的开头。
此外,在条带头中,作为条带位置信息而包含条带PPS识别符(slice_pic_parameter_set_id)。条带PPS识别符是与对象条带相关联的PPS的识别符,经由该PPS识别符来确定应与对象条带相关联的瓦片信息。
(条带位置设定部)
条带位置设定部142基于被输入的条带头和瓦片信息来确定图片内的条带位置,并输出到CTU解码部144。在条带位置设定部142中导出的图片内的条带位置包括在条带中包含的各CTU在图片内的位置。
(CTU解码部)
CTU解码部144大致基于被输入的条带头、条带数据以及参数集,对与在条带中包含的各CTU对应的区域的解码图像进行解码,生成条带的解码图像。条带的解码图像在被输入的条带位置表示的位置上,作为解码图片的一部分而输出。CTU的解码图像由CTU解码部144内部的预测残差复原部1441、预测图像生成部1442以及CTU解码图像生成部1443生成。预测残差复原部1441对在输入的条带数据中包含的预测残差信息(TT信息)进行解码,生成对象CTU的预测残差而输出。预测图像生成部1442基于在输入的条带数据中包含的预测信息(PT信息)表示的预测方法和预测参数,生成预测图像而输出。此时,根据需要,利用参照图片的解码图像或编码参数。CTU解码图像生成部1443将被输入的预测图像和预测残差相加,生成对象CTU的解码图像而输出。
(预测图像生成部的细节)
说明在前述的预测图像生成部1442的预测图像生成处理中,选择了层间图像预测的情况下的预测图像生成处理的细节。
在应用层间图像预测的对象CTU中包含的对象像素的预测像素值的生成处理按照以下的顺序来执行。首先,执行参照图片位置导出处理,导出对应参照位置。这里,对应参照位置是与对象层图片上的对象像素对应的参照层上的位置。另外,由于对象层和参照层的像素不一定以1对1对应,所以对应参照位置以小于参照层中的像素单位的精度来表现。接着,通过以导出的对应参照位置作为输入来执行插值滤波器处理,生成对象像素的预测像素值。
在对应参照位置导出处理中,基于在参数集中包含的图片信息以及参照区域信息来导出对应参照位置。参照图1说明对应参照位置导出处理的详细顺序。另外,以下,作为对应参照位置导出处理的对象层为层C(层C的VPS内索引为c)、对象层的参照层为层R(层R的VPS内索引为r)来说明。这里,根据对象层的参照层为比对象层下位的层且与小的VPS内索引对应的层为更下位的层这样的2个事实,成立r小于c的关系。图1是对应参照位置导出处理的流程图。在将层C设为对象层的情况下的层C和层R之间的层间图像预测处理中的对应参照位置导出处理按照以下的S101~S107的顺序来顺次执行。
(S101)根据在参数集解码部12中作为参照区域信息而解码的、将i和j设为索引的参照区域偏移量信息,导出参照区域偏移量。以下,将导出的参照区域偏移量称为RRO[k][l]。除此之外,如下定义构成RRO[k][l]的、与左、上、右、下分别对应的参照区域偏移量和其记号。
参照区域左偏移量:RRLO[k][l]
参照区域上偏移量:RRTO[k][l]
参照区域右偏移量:RRRO[k][l]
参照区域下偏移量:RRBO[k][l]
基于对应的参照区域偏移量信息,通过以下的计算来导出构成RRO[i][j][k][l]的各偏移量、RRLO[k][l]、RRTO[k][l]、RRRO[k][l]、RRBO[k][l]。
RRLO[k][l]=(ref_region_left_offset[i][j]<<1)
RRTO[k][l]=(ref_region_top_offset[i][j]<<1)
RRRO[k][l]=(ref_region_right_offset[i][j]<<1)
RRBO[k][l]=(ref_region_bottom_offset[i][j]<<1)
这里,有k=i、l=LIdx[i][j]的关系。LIdx[i][j]是基于在参数集解码部12中解码的参照区域层索引信息来导出的排列,表示对于层i的第j个参照区域偏移量信息相关联的层的VPS内索引。
另外,在对与特定的k和l的组合对应的参照区域偏移量(RRO[k][l])不存在与对应的i和j的组合对应的参照区域偏移量信息的情况下,构成RRO[k][l]的各偏移量的值被设定为0。即,在这样的情况下,作为层k上的参照区域并且是在层k和层l之间的层间预测中参照的参照区域的既定值,被设定层k上的相当于图片整体的区域。
根据上述式,将对应的参照区域偏移量信息的语法值设为2倍的值设定为参照区域偏移量,但参照区域偏移量和参照区域偏移量信息的关系并不限定于此。上述的参照区域偏移量信息和参照区域偏移量的关系到低是一例,也可以通过其他的妥当的方法来将两者相关联。
(S102)导出表示参照层(层r)上的参照区域的位置以及形状的参照层参照区域偏移量(参照层参照区域位置)。参照层参照区域偏移量由与左、上、右、下分别对应的4个偏移量(依次为RL_RRLO、RL_RRTO、RL_RRRO、RL_RRBO)构成,且通过下式来导出。
RL_RRLO=RRLO[r][c]
RL_RRTO=RRTO[r][c]
RL_RRRO=RRRO[r][c]
RL_RRBO=RRBO[r][c]
即,作为参照层参照区域偏移量的值,设定参照层R上的参照区域并且是在参照层R和对象层C之间的层间预测中参照的参照区域偏移量。
另外,在参照层参照区域偏移量的值中利用的参照区域偏移量(RRO[r][c])是满足“r<c”的条件的参照区域偏移量。
上述中说明的参照层参照区域偏移量的导出处理能够如下表现。即,使用将参照层的VPS内索引设为第一个排列索引、将对象层的VPS内索引设为第二个排列索引的参照区域偏移量的元素,设定执行对象层和参照层之间的层间预测时的参照层参照区域偏移量(参照层参照区域位置)。在S101中,对应于上述的参照区域偏移量的各元素被设定将参照层的VPS内索引r(第一层识别信息)设为第一个排列索引、将间接地表示对象层的VPS内索引c的序号i(第二层识别信息)设为第二个排列索引的参照区域位置信息(RRO[r][c])的值。
(S103)基于在S102中导出的参照层参照区域偏移量和参照层图片尺寸,导出参照层上的参照区域的尺寸。基于参照层图片的宽度(RL_PICW)和高度(RL_PICH),分别通过下式来导出参照层上的参照区域的宽度(RL_RRW)和高度(RL_RRH)。
RL_RRW=RL_PICW-n*(RL_RRLO+RL_RRRO)
RL_RRH=RL_PICH-n*(RL_RRTO+RL_RRBO)
这里,n的值是用于使参照层图片的像素单位和参照区域偏移量的单位一致的参数。例如,在输入图像的颜色信号为4:2:0形式的情况下,在参照区域偏移量的单位为亮度像素单位的情况下,通过对亮度使用n=1的值、对色差使用n=0.5的值来使单位一致。
即,根据上述的式,通过将参照层参照区域左偏移量和参照层参照区域右偏移量之和使单位一致后加到参照层图片的宽度,导出参照层上的参照区域的宽度。关于参照层上的参照区域的高度,也是同样的。
(S104)导出表示对象层(层c)上的参照区域的位置以及形状的对象层参照区域偏移量(对象层参照区域位置)。对象层参照区域偏移量由与左、上、右、下分别对应的4个偏移量(依次为CL_RRLO、CL_RRTO、CL_RRRO、CL_RRBO)构成,且通过下式来导出。
CL_RRLO=RRLO[c][r]
CL_RRTO=RRTO[c][r]
CL_RRRO=RRRO[c][r]
CL_RRBO=RRBO[c][r]
即,作为对象层参照区域偏移量的值,设定对象层C上的参照区域并且是在对象层C和参照层R之间的层间预测中参照的参照区域偏移量。
另外,在对象层参照区域偏移量的值中利用的参照区域偏移量(RRO[c][r])是满足“c>r”的条件的参照区域偏移量。
上述中说明的对象层参照区域偏移量的导出处理能够如下表现。即,参照将对象层的VPS内索引c设为第一个排列索引、将参照层的VPS内索引r设为第二个排列索引的参照区域偏移量的元素,设定执行对象层和参照层之间的层间预测时的对象层参照区域偏移量(对象层参照区域位置)。在S101中,对应于上述的参照区域偏移量的各元素被设定将对象层的VPS内索引i(第一层识别信息)设为第一个排列索引、将间接地表示参照层的VPS内索引的序号i(第二层识别信息)设为第二个排列索引的参照区域位置信息(RRO[i][j])的值。
(S105)基于在S104中导出的对象层参照区域偏移量和对象层图片尺寸,导出对象层上的对象区域的尺寸。基于对象层图片的宽度(CL_PICW)和高度(CL_PICH),分别通过下式来导出对象层上的参照区域的宽度(CL_RRW)和高度(CL_RRH)。
CL_RRW=CL_PICW-n*(CL_RRLO+CL_RRRO)
CL_RRH=CL_PICH-n*(CL_RRTO+CL_RRBO)
这里,n的值与在S103中说明的n相同,是用于使对象层图片的像素单位和对象区域偏移量的单位一致的参数。
即,根据上述的式,通过将对象层参照区域左偏移量和对象层参照区域右偏移量之和使单位对齐而加到对象层图片的宽度,导出对象层上的参照区域的宽度。关于对象层上的参照区域的高度,也是同样的。
(S106)基于在S103中导出的参照层参照区域的尺寸和在S105中导出的对象层参照区域的尺寸,导出在层间预测中使用的标度。水平方向的标度sx和垂直方向的标度sy分别通过下式来导出。
sx=((RL_RRW<<16)+(CL_RRW>>1))/CL_RRW
sy=((RL_RRH<<16)+(CL_RRH>>1))/CL_RRH
另外,运算符“/”是表示整数的除法的运算符。
即,根据上式,将对参照层参照区域尺寸乘以预定的常数(在上式中为“<<16”),并除以对象层参照区域尺寸所得的值设定作为标度。另外,“(CL_RRW>>1)”的项是调整基于除法的进位的项。因此,若排除单位或进位调整的效果,则标度能够说明为参照层参照区域的尺寸(宽度或者高度)相对于对象层参照区域的尺寸(宽度或者高度)的比率。
(S107)基于在S102中导出的参照层参照区域偏移量和在S106中导出的标度,导出16分之1像素精度的参照像素位置。与对象层上的像素位置(xP、yP)对应的、参照层上的16分之1像素精度的参照像素位置的水平分量(x分量)xRef16和垂直分量(y分量)yRef16的值分别通过以下式来导出。
xRef16=(((xP-CL_OX)*sx+addX+(1<<11))>>12)+deltaX+RL_OX
yRef16=(((yP-CL_OY)*sy+addY+(1<<11))>>12)+deltaY+RL_OY
这里,
CL_OX=CL_RRLO/crAdjust
CL_OY=CL_RRTO/crAdjust
RL_OX=(RL_RRLO<<4)/crAdjust
RL_OY=(RL_RRTO<<4)/crAdjust
另外,crAdjust是对亮度和色差的单位的差异进行校正的参数,例如,在处理4:2:0的解码图像的情况下,若是亮度则被设定1的值,若是色差则被设定2的值。此外,addX、addY、deltaX、deltaY是表示伴随着上采样或隔行扫描的对象层上的像素和参照层上的像素的偏差的参数。
即,根据上式,基于参照层参照区域偏移量和标度来计算参照像素位置。将导出的16分之1像素精度的参照像素位置作为对应参照位置,结束对应参照位置导出处理。
在上述的对应参照位置导出处理中,作为通过参照区域来确定的区域间的尺寸之比而不是作为图片尺寸,导出标度。因此,即使是在根据关注区域提取的目的而对象层图片或参照层图片的图片尺寸发生变更的情况下,通过将关联语法值设定为参照区域相同,也能够在提取前后导出相同的标度。
在插值滤波器处理中,通过对参照层图片上的、所述对应参照位置附近的像素的解码像素应用插值滤波器,生成与在上述对应参照位置导出处理中导出的对应参照位置相当的位置的像素值。
(运动图像解码装置1的效果)
以上说明的本实施方式的层次运动图像解码装置1(层次图像解码装置)包括:参数集解码部12,对参数集进行解码;以及预测图像生成部1442,参照参照层图片的解码像素,通过层间预测来生成预测图像。参数集解码部12对参照区域偏移量进行解码,预测图像生成部1442基于根据该参照区域偏移量来导出的参照层参照区域偏移量和对象层参照区域偏移量,计算标度,并参照该标度来导出对应参照位置,执行层间预测。换言之,层次运动图像解码装置1能够提供如下功能:通过根据编码数据来解码参照区域偏移量的导出所需的语法值,基于根据该语法值来导出的参数,计算对应参照位置,从而在执行关注区域提取的情况下,导出适当的对应参照位置。因此,层次运动图像解码装置1能够提供如下功能:使用比以往更少的语法元素,在关注区域提取前后维持上位层像素和下位层像素的位置关系的准确度。
[变形例1:相对于上位层的参照区域偏移量的限制]
在上述的层次运动图像解码装置1的说明中,记载为在参数集解码部12中对在参照区域信息中包含的参照区域层索引信息进行解码,基于该参照区域层索引信息来导出的与层i相关联的第j个层的索引LIdx[i][j]可取大于i的值。这意味着,与层i相关联的第j个参照区域偏移量信息用于表示在与LIdx[i][j]之间的层间处理中的参照区域而利用,且由LIdx[i][j]表示的层能够对比层i上位的各层独立地指定。
将在变更基于上述的LIdx[i][j]的制约且设为将LIdx[i][j]可取的值设为i以下的基础上,LIdx[i][j]的值成为i时的、与层i相关联的第j个参照区域偏移量信息设为表示层i上的参照区域的偏移量的信息,该参照区域在层i和比层i上位的任意的层之间的层间处理中利用。
在如上所述那样将LIdx[i][j]的值限制为i以下的情况下,在对应参照位置导出处理的S102中说明的参照层参照区域偏移量的导出处理修正为如下。即,导出表示参照层(层R、VPS内索引r)上的参照区域的对象层参照区域偏移量。参照层参照区域偏移量由与左、上、右、下分别对应的4个偏移量(依次为RL_RRLO、RL_RRTO、RL_RRRO、RL_RRBO)构成,且通过下式来导出。
RL_RRLO=RRLO[r][r]
RL_RRTO=RRTO[r][r]
RL_RRRO=RRRO[r][r]
RL_RRBO=RRBO[r][r]
即,作为对象层参照区域偏移量的值,设定在参照层R上的参照区域并且是在层R和比层R上位的任意层之间的层间预测中参照的参照区域偏移量。
根据上述变形例,能够减少参照区域信息所需的码量。这是因为,在参照共同的层(被参照层)的情况下,在该被参照层上能够通过一组参照区域偏移量来确定相同的参照区域。一般而言,通过层间预测而被参照的参照区域是相同的情况较多,所以若能够如上所述那样在被参照层上设定相同的参照区域,则在多数应用中在功能上是充分的。
[变形例2:基于SPS的参照区域信息的传输]
在上述的层次运动图像解码装置1的说明中,说明了将参照区域信息包含在VPS扩展中的例,但还能够通过其他的参数集(SPS或PPS)或头(条带头)来传输。以下,说明在SPS中包含参照区域信息时的变形例。
(SPS内的参照区域偏移量的语法)
参照图10说明在参数集解码部12中,根据被输入的编码数据来解码的参照区域偏移量所涉及的语法。图10是参数集解码部12在SPS中包含的SPS扩展(sps_multilayer_extension())的解码时参照的语法表的一部分,并且是参照区域偏移量所涉及的部分。
在SPS扩展中,包括参照区域偏移量所涉及的多个语法元素。以下,将这些总称为SPS参照区域偏移量关联语法。图10所示的语法表表示作为构成SPS参照区域偏移量关联语法的语法元素,以下的语法元素包含在SPS扩展中。
·B1:参照区域偏移量数(num_ref_region_offsets)
·B2:参照区域层识别符信息(ref_region_layer_id[i])
·B3L:参照区域左偏移量信息(ref_region_left_offset[i])
·B3T:参照区域上偏移量信息(ref_region_top_offset[i])
·B3R:参照区域右偏移量信息(ref_region_right_offset[i])
·B3B:参照区域下偏移量信息(ref_region_bottom_offset[i])
语法元素B1是6比特的2进制表现的码,B2是在HEVC中规定的非负整数的0阶指数哥伦布码(ue(v)),B3L、B3T、A3R、A3B使用在HEVC中规定的附带符号的整数的0阶指数哥伦布码(se(v))进行解码或者编码。
参照区域偏移量数(B1)表示相对于参照SPS扩展的条带(图片)所属的层(以下,对象层)的参照区域偏移量的数。参照区域偏移量的个数相当于与左、上、右、下分别对应的4个偏移量(上述B3L,B3T、B3R、B3B)的组合的个数。
参照区域层识别符信息(B2)是确定对象层中的第i个参照区域偏移量相关联的层的信息。具体而言,参照区域层识别符信息是与对象层相关联的第i个层的层识别符(nuh_layer_id)。ref_region_layer_id[i]的值是对象层的层识别符以下。在ref_region_layer_id[i]的值小于对象层的层识别符的情况下,与索引i相关联的参照区域偏移量信息表示对象层上的参照区域的偏移量,该参照区域在对象层和ref_region_layer_id[i]表示的层之间的层间预测中参照。在ref_region_layer_id[i]的值等于对象层的层识别符的情况下,与索引i相关联的参照区域偏移量信息表示对象层上的参照区域并且是在将对象层设为参照层的层和对象层之间的层间预测中参照的参照区域偏移量。
此外,在索引i1和i2满足“i1<i2”的情况下,优选满足“ref_region_layer_id[i1]<ref_region_layer_id[i2]”的条件。即,参照区域层识别符信息优选在SPS扩展内按对应的层识别符成为升序的顺序包含。若层识别符被赋予顺序,则例如能够通过ref_region_layer_id[num_ref_region_offsets-1]来简单导出层识别符最大的参照区域层识别符信息。
参照区域偏移量信息(参照区域左偏移量信息(B3L)、参照区域上偏移量信息(B3T)、参照区域右偏移量信息(B3R)、参照区域下偏移量信息(B3B))是用于导出表示对象层上的参照区域的偏移量(参照区域偏移量)的信息,该参照区域在对象层和与对象层相关联的第i个层之间的层间处理(层间预测)中参照。
(在使用基于SPS的参照区域信息时的对应参照导出处理)
接着,使用参照上述的图10的语法表而解码的SPS参照区域偏移量关联语法,说明在基于预测图像生成部1442的预测图像生成处理中选择了层间图像预测时执行的、对应参照位置导出处理。
对象层和参照层之间的层间图像预测处理中的对应参照位置导出处理按照以下的S201~S207的顺序顺次执行。
(S201)由参数集解码部12根据从对象层参照的SPS作为参照区域信息而解码的参照区域偏移量信息,导出对象层上的参照区域并且是在对象层(层C、层识别符cLId)和参照层(层R、层识别符rLId)之间的层间预测中参照的参照区域偏移量。以下,将被导出的参照区域偏移量称为RRO[cLId][rLId]。除此之外,如下定义构成RRO[cLId][rLId]的与左、上、右、下分别对应的参照区域偏移量和记号。
参照区域左偏移量:RRLO[cLId][rLId]
参照区域上偏移量:RRTO[cLId][rLId]
参照区域右偏移量:RRRO[cLId][rLId]
参照区域下偏移量:RRBO[cLId][rLId]
基于对应的参照区域偏移量信息,通过以下的计算来导出构成RRO[i][j]的各偏移量、RRLO[i][j]、RRTO[i][j]、RRRO[i][j]、RRBO[i][j]。
RRLO[cLId][rLId]=(ref_region_left_offset[rLId]<<1)
RRTO[cLId][rLId]=(ref_region_top_offset[rLId]<<1)
RRRO[cLId][rLId]=(ref_region_right_offset[rLId]<<1)
RRBO[cLId][rLId]=(ref_region_bottom_offset[rLId]<<1)
(S202)导出表示参照层上的参照区域的参照层参照区域偏移量。参照层参照区域偏移量由与左、上、右、下分别对应的4个偏移量(依次为RL_RRLO、RL_RRTO、RL_RRRO、RL_RRBO)构成,且通过下式来导出。
RL_RRLO=RRLO[cLId][cLId]
RL_RRTO=RRTO[cLId][cLId]
RL_RRRO=RRRO[cLId][cLId]
RL_RRBO=RRBO[cLId][cLId]
即,作为参照层参照区域偏移量的值,设定参照层上的参照区域并且是在参照层和比参照层上位的层之间的层间预测中参照的参照区域偏移量。
另外,在并用VPS中的编码等的情况下,能够参照将第一排列索引设为rLIdx的参照区域偏移量,也可以使用以下。
RL_RRLO=RRLO[rLId][rLId]
RL_RRTO=RRTO[rLId][rLId]
RL_RRRO=RRRO[rLId][rLId]
RL_RRBO=RRBO[rLId][rLId]
(S203)基于在S202中导出的参照层参照区域偏移量和参照层图片尺寸,导出参照层上的参照区域的尺寸。具体的处理除了参照层参照区域偏移量的值是在S202中导出的值之外,与S103的处理相同,省略记载。
(S204)导出表示对象层上的参照区域的对象层参照区域偏移量。对象层参照区域偏移量由与左、上、右、下分别对应的4个偏移量(依次为CL_RRLO、CL_RRTO、CL_RRRO、CL_RRBO)构成,且通过下式来导出。
CL_RRLO=RRLO[cLId][rLId]
CL_RRTO=RRTO[cLId][rLId]
CL_RRRO=RRRO[cLId][rLId]
CL_RRBO=RRBO[cLId][rLId]
即,作为对象层参照区域偏移量的值,设定对象层上的参照区域并且是在对象层(层识别符cLId)和参照层(层识别符rLId)之间的层间预测中参照的参照区域偏移量。
(S205)基于在S204中导出的对象层参照区域偏移量和对象层图片尺寸,导出参照层上的参照区域的尺寸。具体的处理除了对象层参照区域偏移量的值是在S204中导出的值之外,与S105的处理相同,省略记载。
(S206)基于在S203中导出的参照层参照区域的尺寸和在S205中导出的对象层参照区域的尺寸,导出在层间预测中使用的标度。具体的处理除了参照层参照区域的尺寸是在S203中导出的值且对象层参照区域的尺寸是在S205中导出的值之外,与S106的处理相同,省略记载。
(S207)基于在S202中导出的参照层参照区域偏移量和在S206中导出的标度,导出16分之1像素精度的参照像素位置。具体的处理除了参照层参照区域偏移量是在S202中导出的值且标度是在S206中导出的值之外,与S207的处理相同,省略记载。
根据以上说明的在SPS中包含的参照区域偏移量所涉及的语法和使用了该语法值的对应参照位置的导出处理,本变形例的层次运动图像解码装置能够提供在执行关注区域提取时导出适当的对应参照位置的功能。
[变形例3:参照区域偏移量对于层的相对应的其他例]
在上述变形例2中,根据参照区域层识别符的值是小于对象层的层识别符还是等于层识别符,判定了后续的参照区域偏移量表示对象层上的参照区域和参照层上的参照区域中的哪个的偏移量。还能够使用通过其他语法和导出方法来判定参照区域偏移量相关联的层的方法。
例如,如以下参照图11所说明,传输参照区域对象选择信息,根据该参照区域对象选择信息通过预定的方法,导出参照区域是哪一个层上的参照区域以及参照区域是在哪两个层间的层处理中参照的参照区域。
图11是在参数集解码部12中在SPS参照区域偏移量关联语法的解码时参照的语法表,并且能够代替在变形例2的图10中说明的语法表来使用。
图11的语法表表示代替在变形例2的图10的语法表中包含的B2、B3L、B3T、B3R、B3B的语法元素而包括以下的语法元素。
·C2:参照区域对象选择信息(ref_region_target_info[i])
·C3L:参照区域左偏移量信息(ref_region_left_offset[lid1][lid2])
·C3T:参照区域上偏移量信息(ref_region_top_offset[lid1][lid2])
·C3R:参照区域右偏移量信息(ref_region_right_offset[lid1][lid2])
·C3B:参照区域下偏移量信息(ref_region_bottom_offset[lid1][lid2])
大致,首先,参照区域对象选择信息进行解码,接着,根据该参照区域对象选择信息来导出2个层识别符lid1和lid2。之后进行解码的参照区域偏移量信息被设定为层lid1上的参照区域的偏移量,该参照区域在层lid1和层lid2之间的层间预测中参照。
参照区域对象选择信息(C2)是用于确定后续的参照区域偏移量相关联的层的信息。根据参照区域对象选择信息,导出2个层识别符lid1和lid2。
层识别符lid1(第一层识别信息)表示参照区域存在的层的层识别符。lid1按照以下的顺序来导出。另外,将参照区域对象选择信息的值(ref_region_target_info[i])简单记载为RRTI[i]。
1.在RRTI[i]小于对象层的层识别符(nuh_layer_id)的情况下,将lid1的值设定为nuh_layer_id。
2.在上述以外的情况下(RRTI[i]为nuh_layer_id以上的情况下),将lid1的值设定为“RRTI[i]-nuh_layer_id”。
另外,图11上所示的lid1的导出式是用数学式来表现了上述的顺序的式。
层识别符lid2(第二层识别信息)表示参照区域是在层lid1和哪个层之间的层间预测中参照的参照区域。lid2按照以下的顺序来导出。
1.在RRTI[i]小于对象层的层识别符(nuh_layer_id)的情况下,将lid2的值设定为RRTI[i]。
2.在上述以外的情况下(RRTI[i]为nuh_layer_id以上的情况下),将lid2的值设定为nuh_layer_id。
另外,图11上所示的lid2的导出式是用数学式来表现了上述的顺序的式。
按照上述的顺序,根据参照区域对象选择信息的值来导出2个层识别符lid1和lid2。将上述的导出顺序换句话说,在参照区域对象选择信息小于对象层(参照SPS的层)的层识别符的值的情况下,将后续的参照区域偏移量利用作为对象层上的参照区域的偏移量,在参照区域对象选择信息为对象层的层识别符的值以上的情况下,将后续的参照区域偏移量利用作为根据对象层的层识别符而将参照区域对象选择信息的当前的值设为层识别符的层上的参照区域偏移量。
另外,也可以通过其他的方法来执行从参照区域对象选择信息到2个层识别符的映射。但是,在这个情况下,需要如任一个层识别符成为对象层的层识别符这样的导出处理。例如,在判定式或减法中使用了对象层的层识别符nuh_layer_id,但取而代之,也可以使用层识别符的最大值。在这个情况下,参照区域对象选择信息的码量增加,但具有即使是在从其他层参照SPS这样需要改写的情况下,也能够省略参照区域对象选择信息的值的改写这样的优点。
参照区域偏移量信息(参照区域左偏移量信息(C3L)、参照区域上偏移量信息(C3T)、参照区域右偏移量信息(C3R)、参照区域下偏移量信息(C3B))是用于导出表示对象层上的参照区域的偏移量(参照区域偏移量)的信息,该参照区域在层lid1上且在层lid1和层lid2之间的层间处理(层间预测)中参照。参照区域偏移量信息与lid1和lid2的组合相关联而记录。
如上所述,通过并用参照区域选择对象信息而传输参照区域偏移量信息,能够提供即使是在通过SPS传输的情况下,也以少的码量的追加来对层的每个组合指定不同的参照区域偏移量的功能。
[变形例4:显示区域利用的控制信息]
作为在执行2个层间的层间预测时隐式地决定参照区域的方法,已知使用显示区域信息的方法。但是,在指定参照区域的用途上使用显示区域信息的情况下,存在为了指定显示区域而变更显示区域信息受到限制的课题。此外,在特定的层的显示区域发生变更的情况下,由于将该层设为参照层的上位层的层间预测图像发生变化,所以存在产生再生成上位层的编码数据的需要的课题。因此,优选能够根据其他信息来控制是否将显示区域使用作为参照区域。
(4-1:利用作为参照区域的规定值的方法)
在参照图1而说明的对应参照位置导出处理的S101中,说明了在根据参照区域偏移量信息来导出参照区域偏移量时,作为不存在对应的参照区域偏移量信息时的参照区域偏移量既定值,以参照区域成为图片整体的方式设定参照区域偏移量的值。通过将参照区域偏移量既定值设为显示区域,在不传输参照区域偏移量的情况下,将显示区域利用作为参照区域的既定值,且在需要变更显示区域的情况下,指定与将参照区域偏移量显式地变更前的显示区域相当的值,从而能够避免上位层的改写的同时变更显示区域。
以下,记载以将显示区域利用作为参照区域的既定值的方式修正了对应参照位置导出处理的S101的处理、即S101a。
(S101a)根据在参数集解码部12中作为参照区域信息进行了解码的、将i和j设为索引的参照区域偏移量信息,导出对象层C(VPS内索引c)上的参照区域并且是在对象层C和参照层R之间的层间预测中参照的参照区域偏移量。以下,将导出的参照区域偏移量称为RRO[c][r]。除此之外,如下定义构成RRO[c][r]的与左、上、右、下分别对应的参照区域偏移量和记号。
参照区域左偏移量:RRLO[c][r]
参照区域上偏移量:RRTO[c][r]
参照区域右偏移量:RRRO[c][r]
参照区域下偏移量:RRBO[c][r]
基于对应的参照区域偏移量信息,通过以下的计算来导出构成RRO[c][r]的各偏移量、RRLO[c][r]、RRTO[c][r]、RRRO[c][r]、RRBO[c][r]。
RRLO[c][r]=(ref_region_left_offset[i][j]<<1)
RRTO[c][r]=(ref_region_top_offset[i][j]<<1)
RRRO[c][r]=(ref_region_right_offset[i][j]<<1)
RRBO[c][r]=(ref_region_bottom_offset[i][j]<<1)
这里,有c=i、r=LIdx[i][j]的关系。LIdx[i][j]表示基于在参数集解码部12中进行了解码的参照区域层索引信息来导出的排列并且是对于层i的第j个参照区域偏移量信息相关联的层的VPS内索引。
另外,在对与特定的c和r的组合对应的参照区域偏移量(RRO[c][r])不存在与对应的i和j的组合对应的参照区域偏移量信息的情况下,对构成RRO[c][r]的各偏移量的值设定参照层R(VPS内索引r)的显示区域信息的对应的值。即,在这样的情况下,作为对象层C上的参照区域的既定值,设定参照层R上的显示区域,该参照区域在对象层C和参照层R之间的层间预测中参照。具体而言,构成RRO[c][r]的各偏移量、RRLO[c][r]、RRTO[c][r]、RRRO[c][r]、RRBO[c][r]基于参照层R的显示区域信息,通过以下的式来设定。
RRLO[c][r]=conf_win_left_offset[r]
RRTO[c][r]=conf_win_top_offset[r]
RRRO[c][r]=conf_win_right_offset[r]
RRBO[c][r]=conf_win_bottom_offset[r]
这里,conf_win_left_offset[r]、conf_win_top_offset[r]、conf_win_right_offset[r]、conf_win_bottom_offset[r]分别是从参照层R参照的SPS解码的各显示区域位置信息(conf_win_left_offset、conf_win_top_offset、conf_win_right_offset、conf_win_bottom_offset)的对应的语法的值。
(4-2:追加控制标记的方法)
能够将表示是否将参照区域设为显示区域的标记(显示区域利用控制标记)包含在参数集中,在参数集解码部12中进行解码,利用于预测图像生成部1442中的对应参照位置导出处理。作为显示区域利用控制标记,能够利用以下的任一个。
显示区域利用控制标记A:在显示区域利用控制标记A的值为1的情况下,表示将显示区域设为层间预测中的参照区域。在该标记的值为0的情况下,表示将图片整体设为层间预测中的参照区域。
显示区域利用控制标记B:在显示区域利用控制标记B的值为1的情况下,表示将显示区域设为层间预测中的参照区域。在该标记的值为0的情况下,表示将由参照区域偏移量信息指定的参照区域设为参照区域。
图12表示在参数集解码部12中进行解码的、显示区域利用控制标记A的例。显示区域利用标记A(use_conf_win_il_flag)包含在SPS扩展中,作为1比特的标记进行解码或者编码。
在对应参照位置导出处理中,基于显示区域利用标记A的值,参照层参照区域按照以下的顺序来设定。
1.在显示区域利用标记A的值为1的情况下,参照层参照区域偏移量的各偏移量被设定在用于确定参照层的显示区域的显示区域信息中包含的各偏移量的值。
2.在显示区域利用标记A的值为0的情况下,参照层参照区域偏移量的各偏移量被设定0。
通过如上所述那样利用显示区域利用控制标记,能够控制是否将显示区域使用作为参照区域。因此,即使是在与层间预测中的参照区域不同的用途上使用显示区域的情况下,也能够避开层间预测中的参照区域。
[备注事项1:关于能够传输参照区域位置信息的层]
在上述的实施方式或各变形例中,参照区域位置信息(参照区域偏移量信息)与2个层识别信息直接或者间接地相关联。即,某一组的参照区域位置信息是表示层A上的参照区域的形状以及位置的信息,该参照区域在层A和层B之间的层间处理中参照。
参照区域位置信息也可以不需要一定对全部层A和层B的组合包含在编码数据中,而是使用以只将与必要的组合有关的参照区域位置信息能够从编码数据解码的方式确定上述的层A或层B的层识别信息。例如,也可以将层B可取的范围限制为层A的直接参照层(direct reference layer)。在该情况下,作为层识别信息,能够使用对于列表的索引,该列表是对于层A的直接参照层的列表,由此,能够削减层识别信息的码量。尤其,在将参照区域位置信息包含在PPS或条带头中的情况下,优选将层B的范围限制为对于层A的直接参照层。
此外,在参照区域位置信息包含在条带头中的情况下,也可以将层B的范围限制为在包括该条带头的图片中有效的直接参照层(active direct reference layer)。在该情况下,层B的层识别信息能够使用对于列表的索引,该列表是在包括该条带头的图片中有效的直接参照层的列表。
(层次运动图像编码装置的结构)
使用图14说明层次运动图像编码装置2的概略结构。图14是表示了层次运动图像编码装置2的概略结构的功能块图。层次运动图像编码装置2一边参照参照层编码数据DATA#R一边对对象层的输入图像PIN#T进行编码,生成对象层的层次编码数据DATA。另外,设为参照层编码数据DATA#R在与参照层对应的层次运动图像编码装置中编码完毕。
如图14所示,层次运动图像编码装置2包括NAL复用部21、参数集编码部22、瓦片设定部23、条带编码部24、解码图片管理部16以及基础解码部15。
NAL复用部21通过将被输入的对象层编码数据DATA#T和参照层编码数据DATA#R存储在NAL单元中,生成进行了NAL复用的层次运动图像编码数据DATA,并输出到外部。
参数集编码部22基于被输入的瓦片信息和输入图像,设定在输入图像的编码中使用的参数集(VPS、SPS以及PPS),并作为对象层编码数据DATA#T的一部分,以VCL NAL的形式进行分组化而供应给NAL复用部21。
在参数集编码部22进行编码的参数集中,至少包括与层次运动图像解码装置1关联而说明的图片信息、显示区域信息以及参照区域信息。
瓦片设定部23基于输入图像而设定图片的瓦片信息,并供应给参数集编码部22和条带编码部24。例如,设定表示将图片尺寸分割为M×N个瓦片的瓦片信息。这里,M、N是任意的正的整数。
条带编码部24基于被输入的输入图像、参数集、瓦片信息以及在解码图片管理部16中记录的参照图片,对与构成图片的条带对应的输入图像的一部分进行编码,生成该部分的编码数据,并作为对象层编码数据DATA#T的一部分而供应给NAL复用部21。条带编码部24的详细的说明在后面叙述。
解码图片管理部16是与已经说明的层次运动图像解码装置1具备的解码图片管理部16相同的结构元素。其中,在层次运动图像编码装置2具备的解码图片管理部16中,由于不需要将在内部的DPB中记录的图片作为输出图片而输出,所以能够省略该输出。另外,在层次运动图像解码装置1的解码图片管理部16的说明中作为“解码”来说明的记载通过置换为“编码”,还能够应用于层次运动图像编码装置2的解码图片管理部16。
基础解码部15是与已经说明的层次运动图像解码装置1具备的基础解码部15相同的结构元素,省略详细说明。
(条带编码部)
接着,参照图15说明条带编码部24的结构的细节。图15是表示了条带编码部24的概略结构的功能块图。
如图15所示,条带编码部24包括条带头设定部241、条带位置设定部242、CTU编码部244。CTU编码部244在内部包括预测残差编码部2441、预测图像编码部2442、CTU解码图像生成部1443。
条带头设定部241基于被输入的参数集和条带位置信息,生成在以条带单位输入的输入图像的编码中使用的条带头。生成的条带头作为条带编码数据的一部分而输出,且与输入图像一同供应给CTU编码部244。
在条带头设定部241中生成的条带头中,至少包括SH条带位置信息。
条带位置设定部242基于被输入的瓦片信息来决定图片内的条带位置,并供应给条带头设定部241。
CTU编码部244基于被输入的参数集、条带头,以CTU单位对输入图像(对象条带部分)进行编码,生成对象条带所涉及的条带数据以及解码图像(解码图片)并输出。CTU的编码由预测图像编码部2442、预测残差编码部2441、CTU解码图像生成部执行。
预测图像编码部2442决定在对象条带中包含的对象CTU的预测方式以及预测参数,基于决定的预测方式来生成预测图像,并输出到预测残差编码部2441和CTU解码图像生成部1443。预测方式或预测参数的信息作为预测信息(PT信息)进行可变长编码,并作为在条带编码数据中包含的条带数据的一部分而输出。在预测图像编码部2442中能够选择的预测方式中,至少包括层间图像预测。
预测图像编码部2442在作为预测方式而选择了层间图像预测的情况下,执行对应参照位置导出处理,决定与预测对象像素对应的参照层像素位置,并通过基于该位置的插值处理来决定预测像素值。作为对应参照位置导出处理,能够应用关于层次运动图像解码装置1的预测图像生成部1442进行了说明的各处理。例如,应用参照图1来说明的、基于在参数集中包含的参照区域信息来导出对应参照位置的处理。
预测残差编码部2441将对被输入的输入图像和预测图像的差分图像进行变换/量化而获得的量化变换系数(TT信息),作为在条带编码数据中包含的条带数据的一部分来输出。此外,对量化变换系数应用逆变换/逆量化而复原预测残差,并将复原的预测残差输出到CTU解码图像生成部1443。
由于CTU解码图像生成部1443具有与层次运动图像解码装置1的同名的结构元素相同的功能,所以赋予相同的标号,省略说明。
(运动图像编码装置2的效果)
以上说明的本实施方式的层次运动图像编码装置2(层次图像编码装置)包括:参数集编码部22,对参数集进行编码;以及预测图像编码部2442,参照参照层图片的解码像素,通过层间预测来生成预测图像。参数集编码部22对参照区域信息进行编码,预测图像编码部2442使用从参照区域信息导出的对象层参照区域偏移量和参照层参照区域信息的值,导出对于对象层上的像素的对应参照位置。
因此,上述层次运动图像编码装置2通过适当地设定参照区域信息,即使是在以关注区域提取为代表的目的变换层次编码数据的情况下,也能够在变换的前后对相当于同一位置的对象层的像素导出相同的对应参照位置。此时,由于将在标度计算中使用的对象层和参照层的参照区域一同从参照区域信息导出,所以能够实现使用比以往少的语法元素来导出在变换的前后相同的对应参照位置的功能。
〔层次编码数据变换装置3〕
使用图16说明层次编码数据变换装置3的概略结构。图16是表示了层次编码数据变换装置3的概略结构的功能块图。层次编码数据变换装置3对被输入的层次编码数据DATA进行变换,生成被输入的关注区域信息所涉及的层次编码数据DATA-ROI。另外,层次编码数据DATA是由层次运动图像编码装置2生成的层次编码数据。此外,通过将层次编码数据DATA-ROI输入到层次运动图像解码装置1,能够再现关注区域信息所涉及的上位层的运动图像。
如图16所示,层次编码数据变换装置3包括NAL解复用部11、NAL复用部21、参数集解码部12、瓦片设定部13、参数集修正部32、NAL选择部34。
由于NAL解复用部11、参数集解码部12、瓦片设定部13分别具有与层次运动图像解码装置1包含的同名的结构元素相同的功能,所以赋予相同的标号,省略说明。
由于NAL复用部21具有与层次运动图像编码装置2包含的同名的结构元素相同的功能,所以赋予相同的标号,省略说明。
参数集修正部32基于被输入的关注区域信息和瓦片信息,对被输入的参数集信息进行修正而输出。参数集修正部32大致对在参数集中包含的图片信息、显示区域信息、层间像素对应信息、参照区域信息、PPS瓦片信息进行修正。
关注区域信息是在构成运动图像的图片中,用户(例如,再现运动图像的视听者)指定的图片的部分区域。关注区域信息被指定为例如矩形的区域。在该情况下,例如,能够指定表示关注区域的矩形的上边、下边、左边、右边离图片整体的对应的边(上边、下边、左边、或者、右边)的位置的偏移量作为关注区域信息。另外,也可以使用矩形以外的形状的区域(例如,圆、多角形、表示通过物体提取而提取的物体的区域)作为关注区域,但以下,为了简化说明而假设矩形的关注区域。另外,在对矩形以外的区域应用以下记载的内容的情况下,例如,能够将包括关注区域的面积最小的矩形当作以下的说明中的关注区域来应用。
(变换处理的概略)
首先,参照图17说明基于层次编码数据变换装置3的变换处理的参数集修正的概略。图17是例示了变换前后的层次编码数据中的图片、关注区域以及瓦片的关系的图。在图17中,表示在对由扩展层和基础层的2个层构成的层次编码数据(变换前层次编码数据)进行变换而生成包括关注区域的层次编码数据(变换后层次编码数据)的情况下的、变换前后的图片的关系。变换前层次编码数据的扩展层是相当于变换前EL图片的数据,基础层是相当于变换前BL图片的数据。同样地,变换后层次编码数据的扩展层是相当于变换后EL图片的数据,基础层是相当于变换后BL图片的数据。
层次编码数据变换装置3大致从被输入的变换前层次编码数据除去在扩展层上不具有与关注区域重复的区域的瓦片,对关联的参数集进行修正,从而生成变换后的层次编码数据。层次运动图像解码装置能够将变换后层次编码数据作为输入,生成关注区域所涉及的解码图像。
(瓦片信息的修正)
参数集修正部32参照被输入的关注区域信息和瓦片信息,以对应的区域的一部分只包括与关注区域重复的瓦片(提取对象瓦片)的方式,更新扩展层的PPS瓦片信息。基于提取对象瓦片的信息,更新扩展层的PPS瓦片信息。首先,在提取对象瓦片为1个的情况下,将tiles_enabled_flag修正为0。另外,在提取对象瓦片为2个以上的情况下,能够省略修正处理。接着,基于在图片的水平方向和垂直方向中包含的提取对象瓦片的个数,对表示瓦片行数的(num_tile_columns_minus1)和表示瓦片列数的(num_tile_rows_minus1)进行修正。接着,在瓦片尺寸为不均等(uniform_spacing_flag为0)的情况下,从参数集删除与不包括提取对象瓦片的瓦片列的宽度、不包括提取对象瓦片的瓦片行的高度所涉及的语法对应的比特串。
除此之外,参数集修正部32在变换前BL图片中包含的瓦片中,除去在扩展层中提取的瓦片的解码中不需要的瓦片。例如,以与变换后BL图片对应的扩展层上的区域(变换后参照层对应区域)包含变换后EL图片的方式,更新基础层的PPS瓦片信息。
(图片信息的修正)
参数集修正部32将与扩展层的提取对象瓦片的集合对应的区域作为变换后EL图片尺寸来修正图片信息。将变换后EL图片的宽度和高度作为扩展层SPS的pic_width_in_luma_samples和pic_height_in_luma_samples的值来分别设定。
除此之外,参数集修正部32将与基础层的提取对象瓦片的集合对应的区域作为变换后BL图片尺寸来修正图片信息。将变换后BL图片的宽度和高度作为基础层SPS的pic_width_in_luma_samples和pic_height_in_luma_samples的值来分别设定。
(层间像素对应信息的修正)
参数集修正部32根据图片尺寸的变更,对在参数集中包含的层间像素对应信息进行修正。具体而言,对在层间像素对应信息中包含的参照区域偏移量进行修正。这里,为了说明,将扩展层的层识别符设为e,将基础层的层识别符设为b。在参照区域偏移量中包含的、对于层e上的参照区域的参照区域左偏移量ref_region_right_offset[e][k](其中,b=rLIdx[e][k])的值被设定将变换前EL图片的左上像素和变换后EL图片的左上像素的水平方向的距离以2个像素单位来表示的值设为绝对值的负值,该参照区域在层e和层b之间的层间预测中参照。除此之外,对于层b上的参照区域的参照区域左偏移量ref_region_right_offset[b][l](其中,e=rLIdx[b][l])的值被设定将变换前BL图片的左上像素和变换后BL图片的左上像素的水平方向的距离以2个像素单位来表示的值设为绝对值的负值,该参照区域在层b和层e之间的层间预测中参照。其他的与上、右、下对应的参照区域偏移量的值也被同样地设定。
(显示区域信息的修正)
参数集修正部32以与被输入的关注区域信息表示的关注区域一致的方式,改写在被输入的参数集中包含的SPS的显示区域信息。显示区域信息例如按照如下的S301至S303的顺序改写。
(S301)判定关注区域是否与图片整体一致。在一致的情况下,进入S302,在不一致的情况下,进入S303。
(S302)在覆写前的显示区域标记的值为1的情况下,将该显示区域标记的值覆写为0,且从SPS除去显示区域偏移量(conf_win_left_offset、conf_win_right_offset、conf_win_top_offset、conf_win_bottom_offset)而结束处理。
(S303)将显示区域标记的值覆写为1。将显示区域偏移量的各偏移量设定为表示关注区域的矩形的各边与图片的对应的边的位置的偏移量的值。例如,将关注区域上边相对于图片上边的位置偏移量设定为显示区域上偏移量(conf_win_top_offset)的值。另外,在改写前的显示区域标记的值为1的情况下,使用上述设定的关注区域偏移量的值,覆写原来的关注区域偏移量的值。在改写前的显示区域标记的值为1的情况下,将上述设定的关注区域偏移量***到SPS的显示区域标记的紧跟后。
NAL选择部34基于被输入的关注区域信息和瓦片信息,进行被输入的视频编码层NAL(VCL NAL)的选择。被选择的VCL NAL顺次输出到NAL复用部21,未被选择的VCL NAL被丢弃。
在NAL选择部34中选择的VCL NAL是包括与在提取对象瓦片中包含的条带有关的条带头以及条带数据的VCL NAL。NAL选择部34根据在条带头中包含的条带地址和瓦片信息,判定条带是否包含在提取对象瓦片中,在包含的情况下,选择包含该条带的VCL NAL,在不包含的情况下,丢弃该VCL NAL。
(层次编码数据变换处理流程)
层次编码数据变换装置3的层次编码数据变换处理通过顺次执行S501~S506所示的顺序来实现。
(S501)NAL解复用部11对被输入的层次编码数据DATA进行解复用。将参数集所涉及的部分(非VCL NAL)输出到参数解码部12,将作为条带层(条带头、条带数据)所涉及的部分的视频编码层NAL(VCL NAL)输出到NAL选择部34。
(S502)参数集解码部12根据被输入的非VCL NAL来解码参数集(VPS、SPS、PPS),并输出到参数集修正部32和瓦片设定部13。
(S503)瓦片设定部13根据被输入的参数集来导出瓦片信息,并输出到参数集修正部32和NAL选择部34。
(S504)参数集修正部32基于被输入的关注区域信息和瓦片信息,对被输入的参数集进行修正而输出。
(S505)NAL选择部34基于被输入的瓦片信息和关注区域信息,选择被输入的VCLNAL的一部分,并将选择的VCL NAL输出到NAL复用部21。
(S506)NAL复用部21将被输入的修正后的参数集和修正后的条带头和条带数据作为修正后的对象层的编码数据,与被输入的参照层编码数据DATA#R进行复用,并作为层次编码数据DATA-ROI而输出到外部。
(层次编码数据变换装置3的效果)
以上说明的本实施方式的层次编码数据变换装置3包括:NAL选择部34,基于关注区域信息,对在对象层(上位层)的编码数据中包含的视频层的编码数据(VCL NAL)的一部分进行修正;以及参数集修正部32。NAL选择部34基于关注区域信息表示的关注区域,选择具有与关注区域重复的区域的瓦片作为提取对象瓦片,在所述选择的提取对象瓦片中包含的条带所涉及的视频层的编码数据包含在变换后的层次编码数据中。参数集修正部32基于关注区域信息和瓦片信息,对图片信息、PPS瓦片信息、显示信息以及参照区域信息进行修正。
根据上述的层次编码数据变换装置3,能够对被输入的层次编码数据进行变换,提取在上位层中提取对象瓦片(具有与关注区域重复的区域的瓦片)所涉及的VCL NAL,构成变换后的层次编码数据。由于不具有与关注区域重复的区域的瓦片所涉及的VCL NAL被丢弃,所以变换后的层次编码数据的码量比变换前的层次编码数据少。此外,根据上述的层次编码数据变换装置3,由于能够将参数集,配合提取对象瓦片来对图片信息、PPS瓦片信息、显示信息进行修正,所以能够由层次运动图像解码装置对变换后的层次编码数据进行解码,能够显示关注区域所涉及的解码图片。除此之外,由于参照区域信息被修正,所以在变换前后的层次编码数据中维持了标度、和上位层的像素和参照层的像素的对应关系。因此,由变换前的编码数据生成的层间预测的预测图像和由变换后的编码数据生成的层间预测的预测图像被维持为同等程度。
〔关注区域显示***〕
能够将上述的层次运动图像解码装置1、层次运动图像编码装置2以及层次编码数据变换装置3进行组合,构成显示关注区域信息的***(关注区域显示***SYS)。
基于图18,说明能够由上述的层次运动图像解码装置1、层次运动图像编码装置2以及层次编码数据变换装置3的组合构成关注区域显示***的情况。图18是表示了基于层次运动图像解码装置1、层次运动图像编码装置2以及层次编码数据变换装置3的组合的关注区域显示***的结构的框图。关注区域显示***SYS大致对质量不同的输入图像进行层次编码而蓄积,根据来自用户的关注区域信息,对蓄积的层次编码数据进行变换而提供,通过对进行了变换的层次编码数据进行解码,显示关注区域(ROI)所涉及的高质量的再现图像。
如图18所示,关注区域显示***SYS包括层次运动图像编码部SYS1A、层次运动图像编码部SYS1B、层次编码数据蓄积部SYS2、层次编码数据变换部SYS3、层次运动图像解码部SYS4、显示部SYS6、ROI通知部SYS8作为结构元素。
在层次运动图像编码部SYS1A、SYS1B中,能够利用前述的层次运动图像编码装置2。
层次编码数据蓄积部SYS2蓄积层次编码数据,并根据要求而供应层次编码数据。作为层次编码数据蓄积部SYS2,能够利用具备记录介质(存储器、硬盘、光盘)的计算机。
在层次编码数据变换部SYS3中,能够利用前述的层次编码数据变换部3。因此,层次编码数据变换部SYS3能够配合被输入的关注区域,将在被输入的层次编码数据中包含的参照区域信息设定为适当的值。
在层次运动图像解码部SYS4中,能够利用前述的层次运动图像解码装置1。因此,层次运动图像解码部SYS4能够根据参数集来解码参照区域信息,参照该参照区域信息而执行层间预测。
显示部SYS6将解码图像显示在预定的显示区域的预定的显示位置。例如,显示区域是电视机的画面,显示位置是其整体。另外,显示部SYS6优选将被输入的解码图像放大或者缩小为与显示区域的尺寸一致的尺寸而显示。
ROI通知部SYS8通过预定的方法来通知用户指定的关注区域信息。例如,用户能够通过在显示了整体显示图像的显示区域上指定相当于关注区域的区域,对ROI通知部传递关注区域。另外,ROI通知部SYS8在没有用户的指定的情况下,通知表示没有关注区域的信息作为关注区域信息。
(关注区域显示***的流程)
关注区域显示***的处理能够分为层次编码数据生成蓄积处理和关注区域数据生成再现处理。
在层次编码数据生成蓄积处理中,根据不同的质量的输入图像来生成层次编码数据而蓄积。层次编码数据生成蓄积处理按照T101至T103的顺序执行。
(T101)层次运动图像编码部SYS1B对被输入的低质量的输入图像进行编码,并将生成的层次编码数据供应给层次运动图像编码部SYS1A。即,层次运动图像编码部SYS1B根据输入图像,生成在层次运动图像编码部SYS1A中使用作为参照层(下位层)的层次编码数据而输出。
(T102)层次运动图像编码部SYS1A将被输入的层次编码数据作为参照层的编码数据,对被输入的高质量的输入图像进行编码,生成层次编码数据而输出到层次编码数据蓄积部SYS2。
(T103)层次编码数据蓄积部SYS2对被输入的层次编码数据赋予适当的索引而记录在内部的记录介质中。
在关注区域数据生成再现处理中,从层次编码数据蓄积部SYS2读出层次编码数据,变换为相当于关注区域的层次编码数据,并对进行了变换的层次编码数据进行解码而再现以及显示。关注区域数据生成再现处理按照以下的T201~T205的顺序执行。
(T201)与用户选择的运动图像有关的层次编码数据从层次编码数据蓄积部SYS2供应给层次编码数据变换部SYS3。
(T202)ROI通知部SYS8将用户指定的关注区域信息通知给层次编码数据变换部SYS3。
(T203)层次编码数据变换部SYS3基于被输入的关注区域信息,对被输入的层次编码数据进行变换而输出到层次运动图像解码部SYS4。
(T204)层次运动图像解码部SYS4对被输入的层次运动图像编码数据(变换后)进行解码,并将获得的上位层的解码图片输出到显示部SYS6。
(T205)显示部SYS6显示被输入的解码图像。
(关注区域显示***SYS的效果)
以上说明的本实施方式的关注区域显示***SYS包括:关注区域通知部(ROI通知部SYS8),供应关注区域信息;层次编码数据变换部SYS3,基于所述关注区域信息对层次编码数据进行变换而生成变换后层次编码数据;层次运动图像解码部SYS4,对上述变换后层次编码数据进行解码而输出上位层以及下位层的解码图片;以及显示部SYS6。
根据上述的关注区域显示***SYS,能够显示由关注区域信息指定的区域的解码图片。此时,由于由关注区域信息指定的区域的解码图片使用层间图像预测而被解码,所以画质高,该层间图像预测使用根据层次编码数据的上位层的编码数据来基于参照区域信息而导出的标度和对应参照位置。除此之外,基于关注区域进行了变换的层次编码数据的码量比变换前的层次编码数据少。因此,通过使用上述的关注区域显示***SYS,能够削减层次编码数据的传输所需的频带,且能够再现关注区域所涉及的画质高的解码图片。
<实施方式2>
基于图21~图24说明本发明的一实施方式的层次运动图像解码装置3,则如下所述。
[层次运动图像解码装置]
说明层次运动图像解码装置3的概略结构。层次运动图像解码装置3是在参照图5来说明的层次运动图像解码装置1中,将参数集解码部12置换为参数集解码部12A、将条带解码部14置换为条带解码部14A的结构。即,层次运动图像解码装置3包括NAL解复用部11、参数集解码部12A、瓦片设定部13、条带解码部14A、基础解码部15、解码图片管理部16。以下,说明作为新的结构元素的参数解码部12A以及条带解码部14A。
(参数集解码部12A)
(层间位置对应信息)
参数集解码部12A根据被输入的对象层编码数据,对层间位置对应信息进行解码。层间位置对应信息大致表示对象层和参照层的对应的区域的位置关系。例如,在对象层的图片和参照层的图片中包括某物体(物体A)的情况下,对象层的图片上的与物体A对应的区域和参照层的图片上的与物体A对应的区域相当于所述对象层和参照层的对应的区域。另外,层间位置对应信息也可以不一定是准确地表示上述的对象层和参照层的对应的区域的位置关系的信息,但一般而言,为了提高层间预测的准确性,表示准确的对象层和参照层的对应的区域的位置关系。
在本实施方式中,层间位置对应信息包括放大参照层偏移量信息、参照层偏移量信息以及层间相位信息。
(层间位置对应信息:放大参照层偏移量信息)
在层间位置对应信息中,包括规定放大参照层偏移量的信息。放大参照层偏移量能够在编码数据内包括多个,各个放大参照层偏移量由与左、上、右、下分别对应的4个偏移量构成,且与对象图片以及参照图片的2张图片的组合相关联。换言之,对对象图片和特定的参照图片的每个组合,规定对应的放大参照层偏移量的信息包含在层间位置对应信息中。另外,不需要一定对全部对象图片和参照图片的组合包括规定参照层偏移量的信息,还能够以特定的条件对一部分组合省略而使用既定值。
参照图21说明构成放大参照层偏移量的各偏移量的含义。图21是例示对象层图片、参照层图片以及层间像素对应偏移量的关系的图。
图21(a)是表示在参照层的图片整体与对象层的图片的一部分对应的情况下的例。在该情况下,与参照层图片整体对应的对象层上的区域(对象层对应区域)包含在对象层图片的内部中。图21(b)表示在参照层的图片的一部分与对象层的图片整体对应的情况下的例。在该情况下,在参照层对应区域的内部中包括对象层图片。另外,在对象层图片整体中包括偏移量。
如图21所示,放大参照层左偏移量(在图中,SRL左偏移量)表示参照层对应区域左边相对于对象层图片左边的偏移量。另外,在SRL左偏移量大于0的情况下,表示参照层对应区域左边位于对象层图片左边的右侧。
放大参照层上偏移量(在图中,SRL上偏移量)表示参照层对应区域上边相对于对象层图片上边的偏移量。另外,在SRL上偏移量大于0的情况下,表示参照层对应区域上边位于对象层图片上边的下侧。
放大参照层右偏移量(在图中,SRL右偏移量)表示参照层对应区域右边相对于对象层图片右边的偏移量。另外,在SRL右偏移量大于0的情况下,表示参照层对应区域右边位于对象层图片右边的左侧。
放大参照层下偏移量(在图中,SRL下偏移量)表示参照层对应区域下边相对于对象层图片下边的偏移量。另外,在SRL下偏移量大于0的情况下,表示参照层对应区域下边位于对象层图片下边的上侧。
(层间位置对应信息:参照层偏移量信息)
在层间位置对应信息中,包括规定参照层偏移量的信息(参照层偏移量信息)。参照层偏移量能够在编码数据内包括多个,各个参照层偏移量由与左、上、右、下分别对应的4个偏移量构成,且与对象图片以及参照图片的2张图片的组合相关联。换言之,对对象图片和特定的参照图片的每个组合,对应的参照层偏移量能够包含在层间像素对应信息中。
参照层左偏移量表示参照层基准区域左边相对于参照层图片左边的偏移量。另外,在偏移量值大于0的情况下,表示参照层基准区域左边位于参照层图片左边的右侧。
参照层上偏移量表示参照层基准区域上边相对于参照层图片上边的偏移量。另外,在偏移量值大于0的情况下,表示参照层基准区域上边位于参照层图片上边的下侧。
参照层右偏移量表示参照层基准区域右边相对于参照层图片右边的偏移量。另外,在偏移量值大于0的情况下,表示参照层基准区域右边位于参照层图片右边的左侧。
参照层下偏移量表示参照层基准区域下边相对于参照层图片下边的偏移量。另外,在偏移量值大于0的情况下,表示参照层基准区域下边位于参照层图片下边的上侧。
(层间位置对应信息:层间相位信息)
在层间相位信息中,包括表示层间的相位差的信息(层间相位偏移量)。层间相位能够在编码数据内包括多个,各个层间相位偏移量由亮度水平方向、亮度垂直方向、色差水平方向、色差垂直方向的4个偏移量构成,且与对象图片以及参照图片的2张图片的组合相关联。换言之,对对象图片和特定的参照图片的每个组合,对应的层间相位偏移量能够包含在层间像素对应信息中。
层间相位亮度水平偏移量表示对象层的亮度图像上的、参照层对应区域左上像素和与该像素对应的参照层上的像素的小于1像素的水平方向的偏差。
层间相位亮度垂直偏移量表示对象层的亮度图像上的、参照层对应区域左上像素和与该像素对应的参照层上的像素的小于1像素的垂直方向的偏差。
层间相位色差水平偏移量表示对象层的色差图像上的、参照层对应区域左上像素和与该像素对应的参照层上的像素的小于1像素的水平方向的偏差。
层间相位色差垂直偏移量表示对象层的色差图像上的、参照层对应区域左上像素和与该像素对应的参照层上的像素的小于1像素的垂直方向的偏差。
(层间位置对应信息的语法)
接着,说明包含在编码数据中且由参数集解码部12A进行解码的放大参照层偏移量信息、参照层偏移量信息以及层间相位偏移量信息。
放大参照层偏移量信息、参照层偏移量信息以及层间相位偏移量信息例如包含在作为上位层的PPS的一部分的PPS扩展(pps_estension)中,且根据图22所示的语法表进行解码。图22是参数集解码部12A在PPS解码时参照的语法表的一部分,并且是层间像素对应信息所涉及的部分。
在从PPS解码的放大参照层偏移量信息中,包括在PPS扩展中包含的放大参照层偏移量数(num_scaled_ref_layer_offsets)。除此之外,所述放大参照层偏移量数表示的个数的放大参照层偏移量,与参照层识别符一同包含。参照层识别符(ref_layer_id)是表示后续的放大参照层偏移量相关联的参照层的识别符。作为层间像素对应偏移量,包括放大参照层左偏移量(scaled_ref_layer_left_offset)、放大参照层上偏移量(scaled_ref_layer_top_offset)、放大参照层右偏移量(scaled_ref_layer_right_offset)以及放大参照层下偏移量(scaled_ref_layer_bottom_offset)。以下,将scaled_ref_layer_left_offset、scaled_ref_layer_top_offset、scaled_ref_layer_right_offset、scaled_ref_layer_bottom_offset总称为放大参照层偏移量语法。另外,在图22的语法表中,在放大参照层偏移量语法的后方赋予排列索引“[ref_layer_id[i]]”表示放大参照层偏移量语法与ref_layer_id[i]表示的参照层相关联。
参数集解码部12A通过从编码数据解码附带符号的指数哥伦布码(se(v))的码,对放大参照层偏移量语法的值进行解码。具体而言,附带符号的指数哥伦布码能够使用在HEVC中既定的同名的码。被解码的放大参照层偏移量语法的值以对象图片的色差像素为单位。另外,在编码数据中不存在与特定的参照层对应的放大参照层偏移量语法的情况下,与该参照层对应的各放大参照层偏移量的值被设定为0。
在从PPS解码的参照层偏移量信息中,包括表示与层识别符“ref_layer_id[i]”表示的参照层相关联的参照层偏移量信息在PPS内存在与否的标记、即参照层偏移量信息存在与否标记(ref_layer_offset_present_flag)。在排列索引为“i”的参照层偏移量信息存在与否标记的值(ref_layer_offset_present_flag[i])为1的情况下,在PPS中包括参照PPS的条带所属的层(对象层)和与该参照层相关联的各参照层偏移量。具体而言,包括参照层左偏移量(ref_layer_left_offset)、参照层上偏移量(ref_layer_top_offset)、参照层右偏移量(ref_layer_right_offset)以及参照层下偏移量(ref_layer_bottom_offset)。以下,将ref_layer_left_offset、ref_layer_top_offset、ref_layer_right_offset、ref_layer_bottom_offset总称为参照层偏移量语法。
参数集解码部12A通过从编码数据解码附带符号的指数哥伦布码(se(v))的码,对参照层偏移量语法的值进行解码。被解码的参照层偏移量语法的值以经由参照层识别符来与该参照层偏移量语法相关联的参照层图片的色差像素为单位。另外,在编码数据中不存在与特定的参照层对应的参照层偏移量语法的情况下,与该参照层对应的各参照层偏移量的值被设定为0。
在从PPS解码的层间相位偏移量信息中,包括表示与层识别符“ref_layer_id[i]”表示的参照层相关联的层间相位偏移量信息在PPS内的存在与否的标记、即层间相位偏移量信息存在与否标记(resample_phase_present_flag)。在排列索引为“i”的层间相位偏移量信息存在与否标记(resample_phase_present_flag[i])的值为1的情况下,在PPS中包括参照PPS的条带所属的层(对象层)和与该参照层相关联的各层间相位偏移量。具体而言,包括层间相位亮度水平偏移量(phase_hor_luma)、层间相位亮度垂直偏移量(phase_ver_luma)、层间相位色差水平偏移量(phase_hor_chroma)以及层间相位色差垂直偏移量(phase_ver_chroma)。以下,将phase_hor_luma、phase_ver_luma、phase_hor_chroma、phase_ver_chroma总称为层间相位偏移量语法。
参数集解码部12A通过从编码数据解码无符号的指数哥伦布码(se(v))的码,对层间相位偏移量语法的值进行解码。另外,在编码数据中不存在与特定的参照层对应的层间相位偏移量语法的情况下,与该参照层对应的层间相位偏移量的值被设定为0。
以上,参照图22的语法表来说明的、在参数集解码部12A中从PPS解码的层间位置对应信息具有如下特征。
在PPS内包括选择参照层的一个的参照层识别符,在编码数据内连续包含与同一个参照层识别符相关联的放大参照层偏移量语法、参照层偏移量语法以及层间相位偏移量语法。换言之,在PPS中包括ref_layer_id[i],具有同一个排列索引“[ref_layer_id[i]]”的放大参照层偏移量语法、参照层偏移量语法以及层间相位偏移量语法在编码数据内连续包含。另外,也可以在之间包含各偏移量信息的存在与否标记(例如,前述的参照层偏移量信息存在与否标记或层间相位偏移量信息存在与否标记),也可以根据该存在与否标记的值而省略一部分偏移量。此外,与同一个参照层识别符相关联的放大参照层偏移量语法、参照层偏移量语法、层间相位偏移量语法在编码数据内的顺序也可以不一定是前述的顺序,也可以调换顺序。
如以上所述,通过在编码数据内连续包含与同一个参照层识别符相关联的放大参照层偏移量语法、参照层偏移量语法以及层间相位偏移量语法,与按各偏移量的每个种类来对与偏移量的数目相关联的参照层的识别符进行解码的情况相比,能够根据更少的码量的编码数据来解码层间位置对应信息。
换言之,参数集解码部12A通过对表示特定的参照层的第一参照层识别符(ref_layer_id[i])进行解码,根据编码数据来接着对与所述第一参照层识别符相关联的所述放大参照层偏移量语法、与所述第一参照层识别符相关联的所述参照层偏移量语法、以及与所述第一参照层识别符相关联的层间相位偏移量语法进行解码,从而能够根据更少的码量的编码数据来解码层间位置信息。
此外,由于在层间位置对应信息中包括参照层偏移量信息存在与否标记,所以在不需要显式地传输参照层偏移量的情况下,能够削减码量。由于参照层偏移量具有应用默认值的比例高的特性,所以通过使用参照层间偏移量信息存在与否标记,能够削减平均的码量。
此外,由于在层间位置对应信息中包括层间相位偏移量信息存在与否标记,所以在不需要显式地传输层间相位偏移量的情况下,能够削减码量。由于层间相位偏移量具有应用默认值的比例高的特性,所以通过使用层间相位偏移量信息存在与否标记,能够削减平均的码量。
(条带解码部14A)
条带解码部14A具有与参照图13来说明的条带解码部14相同的结构和功能。两者的差异在于,代替条带解码部14包括的预测图像生成部1442,条带解码部14A包括预测图像生成部1443A。在预测图像生成部1443A中,执行在选择了层间预测时的预测图像生成处理时,基于层间位置对应信息,按照以下的S401~S409的顺序执行对应参照位置导出处理。
(S401)判定预测图像生成处理的对象是亮度像素还是色差像素。在对象为亮度像素的情况下,执行S402。在对象为色差像素的情况下,执行S404。
(S402)根据在参数集解码部12A中进行了解码的、与参照层对应的放大参照层偏移量语法的值,导出放大参照层偏移量。以下,将导出的涉及参照层(层R)的放大参照层偏移量称为SRLO[r]。除此之外,如下定义构成SRLO[r]的与左、上、右、下分别对应的放大参照层偏移量和记号。
放大参照层左偏移量:SRLLO[r]
放大参照层上偏移量:SRLTO[r]
放大参照层右偏移量:SRLRO[r]
放大参照层下偏移量:SRLBO[r]
基于对应的放大参照层偏移量语法的值,通过以下的计算来导出构成SRLO[r]的各偏移量、SRLLO、SRLTO、SRLRO、SRLBO。
SRLLO=(scaled_ref_layer_left_offset[r]*SubWidthC)
SRLTO=(scaled_ref_layer_top_offset[r]*SubHeightC)
SRLRO=(scaled_ref_layer_right_offset[r]*SubWidthC)
SRLBO=(scaled_ref_layer_bottom_offset[r]*SubHeightC)
这里,SubWidthC以及SubHeightC是根据与对象层相对应的颜色格式来导出的亮度色差宽度比以及亮度色差高度比。
上述的放大参照层偏移量的导出处理能够如下表现。即,在预测图像生成处理的对象为亮度像素的情况下,根据放大参照层偏移量语法的值和对象层中的亮度色差尺寸比(亮度色差宽度比或者亮度色差高度比)之积,导出放大参照层偏移量。接着,执行S403。
(S403)导出参照层(层r)上的参照层偏移量。参照层偏移量由与左、上、右、下分别对应的4个偏移量(依次为RLLO、RLTO、RLRO、RLBO)构成,且基于参照层偏移量语法的值,通过下式来导出。
RLLO=(ref_layer_left_offset[r]*RefSubWidthC)
RLTO=(ref_layer_top_offset[r]*RefSubHeightC)
RLRO=(ref_layer_right_offset[r]*RefSubWidthC)
RLBO=(ref_layer_bottom_offset[r]*RefSubHeightC)
这里,RefSubWidthC以及RefSubHeightC是根据与参照层相对应的颜色格式来导出的亮度色差尺寸比。即,基于参照层的颜色格式来导出的SubWidthC的值被设定为RefSubWidthC,基于参照层的颜色格式来导出的SubHeightC的值被设定为RefSubHeightC。
上述的参照层偏移量的导出处理能够如下表现。即,在预测图像生成处理的对象为亮度像素的情况下,根据参照层偏移量语法的值和参照层中的亮度色差尺寸比之积,导出参照层偏移量。接着,执行S406。
(S404)在S402中说明的构成SRLO[j]的各偏移量、SRLLO、SRLTO、SRLRO、SRLBO基于对应的放大参照层偏移量语法的值,通过以下的计算来导出。
SRLLO=scaled_ref_layer_left_offset[r]
SRLTO=scaled_ref_layer_top_offset[r]
SRLRO=scaled_ref_layer_right_offset[r]
SRLBO=scaled_ref_layer_bottom_offset[r]
上述的放大参照层偏移量的导出处理能够如下表现。即,在预测图像生成处理的对象为色差像素的情况下,将放大参照层偏移量语法的值作为放大参照层偏移量来导出。
接着,执行S405。
(S405)通过下式来导出在S403中说明的参照层偏移量(RLLO、RLTO、RLRO、RLBO)。
RLLO=ref_layer_left_offset[r]
RLTO=ref_layer_top_offset[r]
RLRO=ref_layer_right_offset[r]
RLBO=ref_layer_bottom_offset[r]
上述的参照层偏移量的导出处理能够如下表现。即,在预测图像生成处理的对象为色差像素的情况下,将参照层偏移量语法的值作为参照层偏移量的值来导出。接着,执行S406。
(S406)基于在S402或者S404中导出的放大参照层偏移量和对象层图片尺寸,导出放大参照层的尺寸。基于对象层图片的宽度(CL_PICW)和高度(CL_PICH),分别通过下式来导出放大参照层的宽度(SRLW)和高度(SRLH)。
SRLW=CL_PICW-(SRLLO+SRLRO)
SRLH=CL_PICH-(SRLTO+SRLBO)
即,根据上述的式,通过从对象层图片的宽度减去放大参照层左偏移量和放大参照层右偏移量之和,导出对象层上的放大参照层的宽度。关于对象层上的放大参照层的高度,也是同样的。接着,执行S407。另外,在上述式中减去偏移量之和是因,如图21(a)所示,偏移量的符号被定义为在放大参照层(图中的参照层对应区域)位于对象层图片的内部时偏移量的值成为正。
(S407)基于在S403或者S405中导出的参照层偏移量和参照层图片尺寸,导出参照层上的成为标度计算的基准的区域(参照层基准区域)的尺寸。基于参照层图片的宽度(RL_PICW)和高度(RL_PICH),分别通过下式来导出参照层基准区域的宽度(RLW)和高度(RLH)。
RLW=RL_PICW-(RLLO+RLRO)
RLH=RL_PICH-(RLTO+RLBO)
即,根据上述的式,通过从参照层图片宽度减去参照层左偏移量和参照层右偏移量之和,导出参照层基准区域的宽度。关于参照层基准区域的高度,也是同样的。接着,执行S408。
(S408)基于在S406中导出的放大参照层的尺寸和在S407中导出的参照层基准区域的尺寸,导出在层间预测中使用的标度。水平方向的标度sx和垂直方向的标度sy分别通过下式来导出。
sx=((RLW<<16)+(SRLW>>1))/SRLW
sy=((RLH<<16)+(SRLH>>1))/SRLH
另外,运算符“/”是表示整数的除法的运算符。
即,根据上式,将对参照层参照区域尺寸乘以预定的常数(在上式中为“<<16”),并除以对象层参照区域尺寸所得的值设定作为标度。另外,“(SRLW>>1)”的项是调整基于除法的进位的项。因此,若排除单位或进位调整的效果,则标度能够说明为参照层基准区域的尺寸(宽度或者高度)相对于放大参照层的尺寸(宽度或者高度)的比率。接着,执行S409。
(S409)基于在S402或者S404中导出的放大参照层偏移量、在S403或者S405中导出的参照层基准区域偏移量、在S408中导出的标度、在参数集解码部12A中进行了解码的层间相位偏移量,导出16分之1像素精度的参照像素位置。与对象层上的像素位置(xP、yP)对应的、参照层上的16分之1像素精度的参照像素位置的水平分量(x分量)xRef16和垂直分量(y分量)yRef16的值分别通过下式来导出。
xRef16=(((xP-CL_OX)*sx+addX+(1<<11))>>12)+RL_OX
yRef16=(((yP-CL_OY)*sy+addY+(1<<11))>>12)+RL_OY
这里,
CL_OX=SRLLO
CL_OY=SRLTO
RL_OX=(RLLO<<4)
RL_OY=(RLTO<<4)
另外,addX、addY是表示伴随上采样或隔行扫描的对象层上的像素和参照层上的像素的偏差的参数,且通过下式来导出。
addX=(sx*phaseX+8)>>4
addY=(sy*phaseY+8)>>4
这里,若将参照层识别符的值设为r,则在对象像素为亮度像素的情况下,对phaseX的值设定phase_hor_luma[r],对phaseY的值设定phase_ver_luma[r]。此外,在对象像素为色差像素的情况下,对phaseX设定phase_hor_chroma[r]的值,对phaseY设定phase_ver_chroma[r]的值。
即,若根据上述的xRef16和yRef16的导出式,则基于放大参照层偏移量、参照层偏移量、层间相位偏移量和标度来计算参照像素位置。将导出的16分之1像素精度的参照像素位置作为对应参照位置,结束对应参照位置导出处理。
在插值滤波器处理中,通过对参照层图片上的、所述对应参照位置附近的像素的解码像素应用插值滤波器,生成与在上述对应参照位置导出处理中导出的对应参照位置相当的位置的像素值。
[变形例5:放大参照层偏移量信息存在与否标记]
说明了在上述的参数集解码部12A中进行解码的层间位置对应信息中,包括参照层偏移量信息存在与否标记和层间相位偏移量信息存在与否标记的例,但也可以是如图23所示,使用追加包括放大参照层偏移量信息存在与否标记的语法表的结构。放大参照层偏移量信息存在与否标记(scaled_ref_layer_offset_prsent_flag)是表示放大参照层偏移量信息在PPS内的存在与否的标记。与排列索引i对应的放大参照层偏移量信息存在与否标记(scaled_ref_layer_offset_present_flag[i])表示与层识别符为ref_layer_id[i]的参照层对应的放大参照层偏移量的语法(scaled_ref_layer_left_offset[ref_layer_id[i]、scaled_ref_layer_top_offset[ref_layer_id[i]scaled_ref_layer_right_offset[ref_layer_id[i]、scaled_ref_layer_bottom_offset[ref_layer_id[i])在编码数据内的存在有无,在值为1的情况下,表示该语法存在,在值为0的情况下,表示该语法不存在。通过使用放大参照层偏移量信息存在与否标记,能够削减在不需要放大参照层偏移量的情况下的码量。
此外,在其他例中,也可以是如图24所示,使用在层间位置对应信息中包括层偏移量信息存在与否标记和层间相位偏移量存在与否标记的语法表的结构。层偏移量信息存在与否标记(layer_offset_present_flag)是表示放大参照层偏移量信息和参照层偏移量信息在PPS内的存在的标记。与排列索引i对应的层偏移量信息存在与否标记(layer_offset_present_flag[i])表示与层识别符为ref_layer_id[i]的参照层对应的放大参照层偏移量和参照层偏移量语法在编码数据内的存在有无,在值为1的情况下,表示该语法存在,在值为0的情况下,表示该语法不存在。在作为典型的用例的对象图片整体对应于参照图片整体的情况下,全部偏移量值为0,放大参照层偏移量和参照层偏移量被省略。因此,通过使用层偏移量信息存在与否标记,能够削减在这样的情况下的码量。
(对于其他的层次运动图像编码/解码***的应用例)
上述的层次运动图像编码装置2以及层次运动图像解码装置1能够搭载在进行运动图像的发送、接收、记录、再现的各种装置中利用。另外,运动图像既可以是通过相机等而拍摄的自然运动图像,也可以是通过计算机等而生成的人工运动图像(包括CG以及GUI)。
基于图19说明将上述的层次运动图像编码装置2以及层次运动图像解码装置1能够利用于运动图像的发送以及接收的情况。图19的(a)是表示搭载了层次运动图像编码装置2的发送装置PROD_A的结构的框图。
如图19的(a)所示,发送装置PROD_A包括通过对运动图像进行编码而获得编码数据的编码部PROD_A1、通过使用编码部PROD_A1获得的编码数据对载波进行调制而获得调制信号的调制部PROD_A2、发送调制部PROD_A2获得的调制信号的发送部PROD_A3。上述的层次运动图像编码装置2作为该编码部PROD_A1而被利用。
发送装置PROD_A也可以作为输入到编码部PROD_A1的运动图像的供应源,进一步包括拍摄运动图像的相机PROD_A4、记录了运动图像的记录介质PROD_A5、用于从外部输入运动图像的输入端子PROD_A6、以及生成或者加工图像的图像处理部A7。在图19的(a)中,虽然例示了发送装置PROD_A包括这些全部的结构,但也可以省略一部分。
另外,记录介质PROD_A5既可以是记录了未进行编码的运动图像的介质,也可以是记录了以与传输用的编码方式不同的记录用的编码方式进行了编码的运动图像的介质。在后者的情况下,只要在记录介质PROD_A5和编码部PROD_A1之间,介入将从记录介质PROD_A5读出的编码数据根据记录用的编码方式进行解码的解码部(未图示)即可。
图19的(b)是表示搭载了层次运动图像解码装置1的接收装置PROD_B的结构的框图。如图19的(b)所示,接收装置PROD_B包括接收调制信号的接收部PROD_B1、通过对接收部PROD_B1接收到的调制信号进行解调而获得编码数据的解调部PROD_B2、通过对解调部PROD_B2获得的编码数据进行解码而获得运动图像的解码部PROD_B3。上述的层次运动图像解码装置1作为该解码部PROD_B3而被利用。
接收装置PROD_B也可以作为解码部PROD_B3输出的运动图像的供应目的地,进一步包括显示运动图像的显示器PROD_B4、用于记录运动图像的记录介质PROD_B5、以及用于向外部输出运动图像的输出端子PROD_B6。在图19的(b)中,虽然例示了接收装置PROD_B包括这些全部的结构,但也可以省略一部分。
另外,记录介质PROD_B5既可以是记录了未进行编码的运动图像的介质,也可以是记录了以与传输用的编码方式不同的记录用的编码方式进行了编码的运动图像的介质。在后者的情况下,只要在解码部PROD_B3和记录介质PROD_B5之间,介入将从解码部PROD_B3取得的运动图像根据记录用的编码方式进行编码的编码部(未图示)即可。
另外,传输调制信号的传输介质既可以是无线,也可以是有线。此外,传输调制信号的传输方式既可以是广播(这里,指发送目的地没有预先确定的发送方式),也可以是通信(这里,指发送目的地预先确定的发送方式)。即,调制信号的传输也可以通过无线广播、有线广播、无线通信以及有线通信中的任一个而实现。
例如,地面数字广播的广播站(广播设备等)/接收站(电视接收机等)是通过无线广播来发送接收调制信号的发送装置PROD_A/接收装置PROD_B的一例。此外,电缆电视广播的广播站(广播设备等)/接收站(电视接收机等)是通过有线广播来发送接收调制信号的发送装置PROD_A/接收装置PROD_B的一例。
此外,使用了互联网的VOD(视频点播(Video On Demand))服务或动画共享服务等的服务器(工作站等)/客户端(电视接收机、个人计算机、智能手机等)是通过通信来发送接收调制信号的发送装置PROD_A/接收装置PROD_B的一例(通常,在LAN中作为传输介质而使用无线或者有线中的任一个,在WAN中作为传输介质而使用有线)。这里,在个人计算机中,包括桌上型PC、膝上型PC以及平板型PC。此外,在智能手机中,还包括多功能便携电话终端。
另外,动画共享服务的客户端除了具有将从服务器下载的编码数据进行解码而在显示器中显示的功能之外,还具有将通过相机拍摄到的运动图像进行编码而上载到服务器中的功能。即,动画共享服务的客户端作为发送装置PROD_A及接收装置PROD_B的双方发挥作用。
基于图20说明能够将上述的层次运动图像编码装置2以及层次运动图像解码装置1利用于运动图像的记录及再现的情况。图20的(a)是表示搭载了上述的层次运动图像编码装置2的记录装置PROD_C的结构的框图。
如图20的(a)所示,记录装置PROD_C包括通过对运动图像进行编码而获得编码数据的编码部PROD_C1、以及将编码部PROD_C1获得的编码数据写入记录介质PROD_M的写入部PROD_C2。上述的层次运动图像编码装置2作为该编码部PROD_C1而被利用。
另外,记录介质PROD_M既可以是(1)如HDD(硬盘驱动器(Hard Disk Drive))或SSD(固态硬盘(Solid State Drive))等那样内置在记录装置PROD_C中的类型,也可以是(2)如SD存储卡或USB(通用串行总线(Universal Serial Bus))闪速存储器等那样连接到记录装置PROD_C的类型,也可以是(3)如DVD(数字视盘(DigitalVersatile Disc))或BD(蓝光盘(Blu-ray Disc)(注册商标))等那样在内置于记录装置PROD_C中的驱动器装置(未图示)中装填的类型。
此外,记录装置PROD_C也可以作为对编码部PROD_C1输入的运动图像的供应源,进一步包括拍摄运动图像的相机PROD_C3、用于从外部输入运动图像的输入端子PROD_C4、用于接收运动图像的接收部PROD_C5以及生成或者加工图像的图像处理部C6。在图20的(a)中,例示了记录装置PROD_C将这些全部具有的结构,但也可以省略一部分。
另外,接收部PROD_C5既可以是接收没有进行编码的运动图像的部分,也可以是接收以与记录用的编码方式不同的传输用的编码方式进行了编码的编码数据的部分。在后者的情况下,只要在接收部PROD_C5和编码部PROD_C1之间,介入对以传输用的编码方式进行了编码的编码数据进行解码的传输用解码部(未图示)即可。
作为这样的记录装置PROD_C,例如举出DVD记录器、BD记录器、HDD(硬盘驱动器(Hard Disk Drive))记录器等(在该情况下,输入端子PROD_C4或者接收部PROD_C5成为运动图像的主要的供应源)。此外,可携式摄像机(在该情况下,相机PROD_C3成为运动图像的主要的供应源)、个人计算机(在该情况下,接收部PROD_C5或者图像处理部C6成为运动图像的主要的供应源)、智能手机(在该情况下,相机PROD_C3或者接收部PROD_C5成为运动图像的主要的供应源)等也是这样的记录装置PROD_C的一例。
图20的(b)是表示搭载了上述的层次运动图像解码装置1的再现装置PROD_D的结构的块。如图20的(b)所示,再现装置PROD_D包括读出在记录介质PROD_M中写入的编码数据的读出部PROD_D1、以及通过对读出部PROD_D1读出的编码数据进行解码而获得运动图像的解码部PROD_D2。上述的层次运动图像解码装置1作为该解码部PROD_D2而被利用。
另外,记录介质PROD_M既可以是(1)如HDD或SSD等那样内置在再现装置PROD_D中的类型,也可以是(2)如SD存储卡或USB闪速存储器等那样连接到再现装置PROD_D的类型,也可以是(3)如DVD或BD等那样在内置于再现装置PROD_D中的驱动器装置(未图示)中装填的类型。
此外,再现装置PROD_D也可以作为解码部PROD_D2输出的运动图像的供应目的地,进一步包括显示运动图像的显示器PROD_D3、用于将运动图像输出到外部的输出端子PROD_D4以及发送运动图像的发送部PROD_D5。在图20的(b)中,例示了再现装置PROD_D将这些全部具有的结构,但也可以省略一部分。
另外,发送部PROD_D5既可以是发送没有进行编码的运动图像的部分,也可以是发送以与记录用的编码方式不同的传输用的编码方式进行了编码的编码数据的部分。在后者的情况下,只要在解码部PROD_D2和发送部PROD_D5之间,介入以传输用的编码方式对运动图像进行编码的编码部(未图示)即可。
作为这样的再现装置PROD_D,例如举出DVD播放器、BD播放器、HDD播放器等(在该情况下,电视接收机等连接的输出端子PROD_D4成为运动图像的主要的供应目的地)。此外,电视接收机(在该情况下,显示器PROD_D3成为运动图像的主要的供应目的地)、数字标牌(也称为电子挂牌或电子布告牌等,显示器PROD_D3或者发送部PROD_D5成为运动图像的主要的供应目的地)、桌上型PC(在该情况下,输出端子PROD_D4或者发送部PROD_D5成为运动图像的主要的供应目的地)、膝上型或者平板型PC(在该情况下,显示器PROD_D3或者发送部PROD_D5成为运动图像的主要的供应目的地)、智能手机(在该情况下,显示器PROD_D3或者发送部PROD_D5成为运动图像的主要的供应目的地)等也是这样的再现装置PROD_D的一例。
(关于硬件的实现以及软件的实现)
最后,层次运动图像解码装置1、层次运动图像编码装置2的各块既可以通过在集成电路(IC芯片)上形成的逻辑电路而以硬件方式实现,也可以使用CPU(中央处理器(Central Processing Unit))而以软件方式实现。
在后者的情况下,上述各装置包括执行用于实现各功能的控制程序的命令的CPU、存储了上述程序的ROM(只读存储器(Read Only Memory))、展开上述程序的RAM(随机存取存储器(Random Access Memory))、存储上述程序以及各种数据的存储器等的存储装置(记录介质)等。并且,通过将实现上述的功能的软件即上述各装置的控制程序的程序代码(执行形式程序、中间代码程序、源程序)以计算机能够读取的方式记录的记录介质提供给上述各装置,其计算机(或者CPU或MPU(微处理器(Micro Processing Unit)))读出在记录介质中记录的程序代码而执行,也能够达成本发明的目的。
作为上述记录介质,例如,能够使用磁带或卡带等的带类、包括软盘(注册商标)/硬盘等的磁盘或CD-ROM(光盘只读存储器(Compact Disc Read-Only Memory))/MO(磁光盘(Magneto-Optical))/MD(迷你盘(Mini Disc))/DVD(数字视盘(Digital VersatileDisk))/CD-R(可录式光盘(CD Recordable))等的光盘的盘类、IC卡(包括存储卡)/光卡等的卡类、掩摸ROM/EPROM(可擦除可编程序只读存储器(Erasable Programmable Read-onlyMemory))/EEPROM(注册商标)(电可擦除可编程只读存储器(Electrically Erasable andProgrammable Read-only Memory))/闪速ROM等的半导体存储器类、或者PLD(可编程逻辑电路(Programmable logic device))或FPGA(可编程门阵列(Field Programmable GateArray))等的逻辑电路类等。
此外,也可以将上述各装置构成为能够与通信网络连接,经由通信网络而提供上述程序代码。该通信网络只要能够传输程序代码即可,没有特别限定。例如,可以利用互联网、内联网、外联网、LAN(局域网(Local Area Network))、ISDN(综合服务数字网络(Integrated Services Digital Network))、VAN(增值网络(Value-Added Network))、CATV(共用天线电视(Community Antenna Television))通信网、虚拟专用网(virtualprivate network)、电话线路网、移动通信网、卫星通信网等。此外,作为构成该通信网络的传输介质,只要能够传输程序代码的介质即可,并不限定于特定的结构或者种类。例如还能够利用IEEE(电气和电子工程师协会(Institute of Electrical and ElectronicEngineers))1394、USB、电力线传输、电缆TV线路、电话线、ADSL(非对称数字用户线路(Asymmetric Digital Subscriber Line))线路等的有线,也可以使用IrDA(红外数据协会(Infrared Data Association))或遥控那样的红外线、Bluetooth(注册商标)、IEEE802.11无线、HDR(高数据率(High Data Rate))、NFC(近场通信(Near FieldCommunication))、DLNA(数字生活网络联盟(Digital Living Network Alliance))、移动电话网、卫星线路、地面波数字网等的无线。另外,通过上述程序代码以电子传输而具体化的、埋入载波的计算机数据信号的方式,也能够实现本发明。
本发明并不限定于上述的实施方式,在权利要求书所示的范围内能够进行各种变更,将在不同的实施方式中公开的技术手段适当地组合而获得的实施方式,也包含在本发明的技术范围中。
产业上的可利用性
本发明能够适合应用于对图像数据以层次方式进行了编码的编码数据进行解码的层次图像解码装置、以及生成图像数据以层次方式进行了编码的编码数据的层次图像编码装置。此外,能够适合应用于由层次图像编码装置生成且由层次图像解码装置参照的层次编码数据的数据结构。
附图标记说明
1、3 层次运动图像解码装置(图像解码装置)
11 NAL解复用部
12、12A 参数集解码部
13 瓦片设定部
14、14A 条带解码部
141 条带头解码部
142 条带位置设定部
144 CTU解码部
1441 预测残差复原部
1442、1442A 预测图像生成部
1443 CTU解码图像生成部
15 基础解码部
151 基础NAL解复用部
152 基础参数集解码部
153 基础瓦片设定部
154 基础条带解码部
156 基础解码图片管理部
16 解码图片管理部
2 层次运动图像编码装置(图像编码装置)
21 NAL复用部
22 参数集编码部
23 瓦片设定部
24 条带编码部
241 条带头设定部
242 条带位置设定部
244 CTU编码部
2441 预测残差编码部
2442 预测图像编码部
3 层次编码数据变换装置(编码数据变换装置)
32 参数集修正部
34 NAL选择部

Claims (14)

1.一种图像解码装置,对进行了层次编码的编码数据进行解码,恢复作为对象层的上位层的解码画面,其特征在于,所述图像解码装置具备:
参数集解码部,对参数集进行解码;以及
预测图像生成部,参照参照层画面的解码像素,通过层间预测而生成预测图像,
所述参数集解码部对层间位置对应信息进行解码,
所述层间位置对应信息包括扩大参照层偏移语法、参照层偏移语法以及层间相位偏移语法,
所述参数集解码部对表示特定的参照层的第一参照层识别符进行解码,对在编码数据内连续地包含的与所述第一参照层识别符相关的所述扩大参照层偏移语法、与所述第一参照层识别符相关的所述参照层偏移语法以及与所述第一参照层识别符相关的层间相位偏移语法进行解码,
所述预测图像生成部在生成使用预定的参照层时的预测图像的情况下,使用与该参照层相关的所述扩大参照层偏移语法、所述参照层偏移语法以及所述层间相位偏移语法,导出在层间预测中使用的比例尺以及对应参照位置的至少一方。
2.如权利要求1所述的图像解码装置,其特征在于,
所述层间位置对应信息包括与特定的参照层相关的参照层偏移信息存在与否标记,
所述预测图像生成部根据所述参照层偏移信息存在与否标记的值,对与该参照层偏移相关的参照层有关的参照层偏移语法进行解码。
3.如权利要求1所述的图像解码装置,其特征在于,
所述层间位置对应信息包括与特定的参照层相关的层间相位偏移信息存在与否标记,
所述预测图像生成部根据所述层间相位偏移信息存在与否标记的值,对该参照层偏移相关的层间相位偏移语法进行解码。
4.如权利要求1所述的图像解码装置,其特征在于,
所述层间位置对应信息包括与特定的参照层相关的层偏移信息存在与否标记,
所述预测图像生成部根据所述层偏移信息存在与否标记的值,对该参照层偏移相关的扩大参照层偏移语法以及参照层偏移语法进行解码。
5.一种图像解码装置,对进行了层次编码的编码数据进行解码,恢复作为对象层的上位层的解码画面,其特征在于,所述图像解码装置具备:
参数集解码部,对参数集进行解码;以及
预测图像生成部,参照参照层画面的解码像素,通过层间预测而生成预测图像,
所述参数集解码部对参照区域信息进行解码,
所述预测图像生成部从在所述参照区域信息中包含的参照区域位置信息导出对象层参照区域位置以及参照层参照区域位置,使用所述参照区域位置以及所述参照层参照区域位置导出在层间预测中使用的比例尺以及对应参照位置的至少一方。
6.如权利要求5所述的图像解码装置,其特征在于,
所述参照区域位置信息是参照区域偏移信息,
所述对象层参照区域位置是对象层参照区域偏移,
所述参照层参照区域位置是参照层对象区域偏移。
7.如权利要求5或权利要求6所述的图像解码装置,其特征在于,
所述参照区域位置信息是将第一层识别信息和第二层识别信息设为索引的二维的排列变量,
所述第一层识别信息是确定参照区域存在的层的信息,
所述第二层识别信息是确定层间处理对象层的信息,
所述预测图像生成部在执行对象层和参照层之间的层间预测时,使用将表示所述对象层的所述第一层识别信息和表示所述参照层的所述第二层识别信息设为索引的所述参照区域位置信息而设定所述对象层参照区域位置,使用将表示所述参照层的所述第一层识别信息和表示所述对象层的所述第二层识别信息设为索引的所述参照区域位置信息而设定所述参照层参照区域位置。
8.如权利要求7所述的图像解码装置,其特征在于,
所述第一层识别信息是直接或者间接地指定参照区域存在的层的VPS内索引的信息,
所述第二层识别信息是直接或者间接地指定层间处理对象层的VPS内索引的信息,
所述预测图像生成部在执行对于VPS内索引的值为C的所述对象层的层间预测时,使用将表示VPS内索引C的所述第一层识别信息和表示小于C的VPS内索引R的所述第二层识别信息设为索引的所述参照区域位置信息而设定所述对象层参照区域位置,使用将表示所述VPS内索引R的所述第一层识别信息和表示VPS内索引C的所述第二层识别信息设为索引的所述参照区域位置信息而设定所述参照层参照区域位置。
9.如权利要求5或权利要求6所述的图像解码装置,其特征在于,
所述参照区域位置信息是将第一层识别信息和第二层识别信息设为索引的二维的排列变量,
所述第一层识别信息是确定参照区域存在的层的信息,
所述第二层识别信息是确定层间处理对象层的信息,
所述预测图像生成部在执行对象层和参照层之间的层间预测时,使用将表示所述对象层的所述第一层识别信息和表示所述参照层的所述第二层识别信息设为索引的所述参照区域位置信息而设定所述对象层参照区域位置,使用将表示所述对象层的所述第一层识别信息和表示所述对象层的所述第二层识别信息设为索引的所述参照区域位置信息而设定所述参照层参照区域位置。
10.如权利要求5或权利要求6所述的图像解码装置,其特征在于,
所述参数集解码部对参照区域对象选择信息进行解码,从该参照区域对象选择信息导出第一层识别信息和第二层识别信息,且将上述第一层识别信息和上述第二层识别信息的组合与上述参照区域位置信息关联记录,
所述预测图像生成部在执行对象层和参照层之间的层间预测时,使用与表示所述对象层的所述第一层识别信息和表示所述参照层的所述第二层识别信息的组合关联记录的所述参照区域位置信息而设定所述对象层参照区域位置,使用与表示参照层的所述第一层识别信息和表示对象层的所述第二层识别信息关联记录的所述参照区域位置信息而设定所述参照层参照区域位置。
11.如权利要求7至10的任一项所述的图像解码装置,其特征在于,
所述参数集解码部对对象层和参照层的显示区域信息进行解码,
所述预测图像生成部在执行对象层和参照层之间的层间预测时,当不存在将表示所述对象层的所述第一层识别信息和表示所述参照层的所述第二层识别信息设为索引的所述参照区域位置信息的情况下,将对象层的所述显示区域信息表示的显示区域位置设定为所述对象层参照区域位置,当不存在将表示参照层的所述第一层识别信息和表示对象层的所述第二层识别信息设为索引的所述参照区域位置信息的情况下,将参照层的所述显示区域信息表示的显示区域设定为所述参照层参照区域位置。
12.如权利要求5至11的任一项所述的图像解码装置,其特征在于,
所述预测图像生成部作为所述对象层参照区域位置表示的参照区域尺寸和所述参照层参照区域位置表示的参照区域尺寸之比或者近似于比的值,导出所述比例尺。
13.一种图像编码装置,从输入图像生成作为对象层的上位层的编码数据,其特征在于,所述图像编码装置具备:
参数集编码部,对参数集进行编码;以及
预测图像生成部,参照参照层画面的解码像素,通过层间预测而生成预测图像,
所述参数集编码部对参照区域信息进行编码,
所述预测图像生成部从在所述参照区域信息中包含的参照区域位置信息导出对象层参照区域位置以及参照层参照区域位置,使用所述参照区域位置以及所述参照层参照区域位置导出在层间预测中使用的比例尺以及对应参照位置的至少一方。
14.一种层次编码数据变换装置,具备参数集修正部,该参数集修正部基于被输入的关注区域信息而变换被输入的层次编码数据,生成关注区域层次编码数据而输出,其特征在于,
所述参数集修正部修正参照区域位置信息,使得从层次编码数据导出的对象层参照区域位置以及参照层参照区域位置分别在变换前后一致。
CN201580019567.6A 2014-04-25 2015-04-24 图像解码装置、图像编码装置以及编码数据变换装置 Pending CN106170980A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2014091275 2014-04-25
JP2014-091275 2014-04-25
JP2014-124100 2014-06-17
JP2014124100 2014-06-17
PCT/JP2015/062555 WO2015163456A1 (ja) 2014-04-25 2015-04-24 画像復号装置、画像符号化装置、および、符号化データ変換装置

Publications (1)

Publication Number Publication Date
CN106170980A true CN106170980A (zh) 2016-11-30

Family

ID=54332616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580019567.6A Pending CN106170980A (zh) 2014-04-25 2015-04-24 图像解码装置、图像编码装置以及编码数据变换装置

Country Status (5)

Country Link
US (2) US10187659B2 (zh)
JP (1) JP6542201B2 (zh)
CN (1) CN106170980A (zh)
TW (1) TWI589152B (zh)
WO (1) WO2015163456A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112544084A (zh) * 2018-05-15 2021-03-23 夏普株式会社 图像编码装置、编码流提取装置以及图像解码装置
WO2021180165A1 (en) * 2020-03-11 2021-09-16 Beijing Bytedance Network Technology Co., Ltd. High level bitstream syntax for quantization parameters
WO2023088141A1 (zh) * 2021-11-22 2023-05-25 中兴通讯股份有限公司 语法元素的编码、解码方法、装置、电子设备和存储介质
US11991397B2 (en) 2020-05-31 2024-05-21 Beijing Bytedance Network Technology Co., Ltd. Palette mode with local dual tree modetype definition

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11336909B2 (en) * 2016-12-27 2022-05-17 Sony Corporation Image processing apparatus and method
WO2018155939A1 (ko) 2017-02-22 2018-08-30 에스케이텔레콤 주식회사 영상 복호화 방법 및 장치
KR102424829B1 (ko) * 2017-02-22 2022-07-25 에스케이텔레콤 주식회사 비디오 데이터가 부호화된 비트스트림을 처리하는 방법
US10234864B2 (en) * 2017-03-07 2019-03-19 nuTonomy Inc. Planning for unknown objects by an autonomous vehicle
US11670101B2 (en) * 2018-03-16 2023-06-06 Inveox Gmbh Automated identification, orientation and sample detection of a sample container
EP3806471A4 (en) * 2018-06-01 2022-06-08 Sharp Kabushiki Kaisha PICTURE DECODING DEVICE AND PICTURE CODING DEVICE
US10798376B2 (en) * 2018-07-17 2020-10-06 Tencent America LLC Method and apparatus for video coding
CN114845111A (zh) 2019-03-11 2022-08-02 杜比实验室特许公司 帧速率可伸缩视频编码
CA3146230A1 (en) * 2019-07-08 2020-10-22 Huawei Technologies Co., Ltd. Handling of multiple picture size and conformance windows for reference picture resampling in video coding
JP2022543627A (ja) * 2019-08-06 2022-10-13 ドルビー ラボラトリーズ ライセンシング コーポレイション 描画面サイズ拡張可能ビデオコーディング
US11336894B2 (en) * 2019-09-20 2022-05-17 Tencent America LLC Signaling of reference picture resampling with resampling picture size indication in video bitstream
US11140402B2 (en) * 2019-09-20 2021-10-05 Tencent America LLC Signaling of reference picture resampling with constant window size indication in video bitstream
GB2587365B (en) * 2019-09-24 2023-02-22 Canon Kk Method, device, and computer program for coding and decoding a picture
US11317093B2 (en) 2019-09-24 2022-04-26 Tencent America LLC Method for reference picture resampling with offset in video bitstream
WO2021121419A1 (en) 2019-12-19 2021-06-24 Beijing Bytedance Network Technology Co., Ltd. Interaction between adaptive color transform and quantization parameters
WO2021136554A1 (en) * 2020-01-05 2021-07-08 Beijing Bytedance Network Technology Co., Ltd. General constraints information for video coding
CN115176470A (zh) 2020-01-18 2022-10-11 抖音视界有限公司 图像/视频编解码中的自适应颜色变换
WO2021235759A1 (ko) * 2020-05-22 2021-11-25 엘지전자 주식회사 비디오 또는 영상 코딩 시스템에서의 다중 레이어 기반 영상 코딩 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060222067A1 (en) * 2005-04-01 2006-10-05 Lg Electronics Inc. Method for scalably encoding and decoding video signal
WO2008060125A1 (en) * 2006-11-17 2008-05-22 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140138538A (ko) * 2013-05-24 2014-12-04 주식회사 케이티 복수의 레이어를 지원하는 비디오 코딩 방법 및 장치
CA2943121C (en) * 2014-03-18 2020-09-08 Arris Enterprises Llc Scalable video coding using reference and scaled reference layer offsets

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060222067A1 (en) * 2005-04-01 2006-10-05 Lg Electronics Inc. Method for scalably encoding and decoding video signal
WO2008060125A1 (en) * 2006-11-17 2008-05-22 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DO-KYOUNG KWON等: "Reference-layer cropping offsets signaling in SHVC", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11,13TH MEETING: INCHEON,KR,JCTVC-M0219-R2》 *
JIANLE CHEN等: "On phase offset for resampling process in SHVC", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11,17TH MEETING: VALENCIA,ES,JCTVC-Q0168》 *
KOOHYAR MINOO等: "Increased resolution for scaled reference layer offset", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11,17TH MEETING: VALENCIA,ES,JCTVC-Q0119》 *
TOMOYUKI YAMAMOTO等: "AHG 13: Sub-region extraction – position calculation and comparison of different", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11,17TH MEETING: VALENCIA,ES,JCTVC-Q0159R1》 *
TOMOYUKI YAMAMOTO等: "MV-HEVC/SHVC HLS: On conversion to ROI-oriented multi-layer bitstream", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG 16 WP 3 AND ISO/IEC JTC 1/SC 29/WG 11,15TH MEETING: GENEVA,CH,JCTVC-O0056》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112544084A (zh) * 2018-05-15 2021-03-23 夏普株式会社 图像编码装置、编码流提取装置以及图像解码装置
CN112544084B (zh) * 2018-05-15 2024-03-01 夏普株式会社 图像编码装置、编码流提取装置以及图像解码装置
WO2021180165A1 (en) * 2020-03-11 2021-09-16 Beijing Bytedance Network Technology Co., Ltd. High level bitstream syntax for quantization parameters
US11856235B2 (en) 2020-03-11 2023-12-26 Beijing Bytedance Network Technology Co., Ltd. Adaptive loop filtering
US11930219B2 (en) 2020-03-11 2024-03-12 Beijing Bytedance Network Technology Co., Ltd. Adaptation parameter set signaling based on color format
US11968403B2 (en) 2020-03-11 2024-04-23 Beijing Bytedance Netwrok Technology Co., Ltd. Transform skip based residual coding
US11991397B2 (en) 2020-05-31 2024-05-21 Beijing Bytedance Network Technology Co., Ltd. Palette mode with local dual tree modetype definition
WO2023088141A1 (zh) * 2021-11-22 2023-05-25 中兴通讯股份有限公司 语法元素的编码、解码方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
US20190075323A1 (en) 2019-03-07
US20170034532A1 (en) 2017-02-02
TWI589152B (zh) 2017-06-21
TW201545544A (zh) 2015-12-01
US10187659B2 (en) 2019-01-22
JP6542201B2 (ja) 2019-07-10
JPWO2015163456A1 (ja) 2017-04-20
WO2015163456A1 (ja) 2015-10-29

Similar Documents

Publication Publication Date Title
CN106170980A (zh) 图像解码装置、图像编码装置以及编码数据变换装置
CN105981386B (zh) 图像解码装置、图像编码装置及编码数据变换装置
CN106105220B (zh) 用于视频编码和解码的方法和装置
CN105594209B (zh) 图像解码装置、图像解码方法以及图像编码装置
CN104126305B (zh) 用于多视图视频译码mvc兼容三维视频译码3dvc的序列等级信息
US20190068985A1 (en) Image decoding device, an image encoding device and a decoding method
CN105814893B (zh) 在多层视频译码中信息用于色域可扩展性的3d查找表的发信分区
CN105659595B (zh) 多层视频译码中的基于三维查找表的色域可缩放性
CN108886642A (zh) 在高效率视频写码及分层高效率视频写码文件格式的图块分组的改进
CN110431846A (zh) 自适应扰动立方体的地图投影
CN105075269B (zh) 图像解码装置、图像编码装置及计算机可读取的记录介质
CN108886620A (zh) 用于视频编码和解码的装置、方法及计算机程序
CN105580370A (zh) 图像解码装置、图像编码装置以及编码数据变换装置
CN109792533A (zh) 在视频译码中用于仿射运动模型的运动向量预测
CN104412593A (zh) 图像解码装置以及图像编码装置
CN105519119A (zh) 图像解码装置
CN105981387A (zh) 使用可分级嵌套sei消息的视频编码和解码
CN104604236A (zh) 用于视频编码的方法和装置
CN104641642A (zh) 用于视频编码的方法和装置
CN106105209A (zh) 多层视频编解码器的级别定义
CN106165422A (zh) 图像解码装置及图像解码方法
CN107005715A (zh) 图像序列编码和解码的装置、方法和计算机程序
CN106233729B (zh) 解码视频数据的方法、装置及编码视频数据的方法、装置
JP2015076807A (ja) 画像復号装置、画像符号化装置、および符号化データのデータ構造

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161130

WD01 Invention patent application deemed withdrawn after publication