CN115362679A - 用于视频编码和解码的方法和装置 - Google Patents

用于视频编码和解码的方法和装置 Download PDF

Info

Publication number
CN115362679A
CN115362679A CN202180025357.3A CN202180025357A CN115362679A CN 115362679 A CN115362679 A CN 115362679A CN 202180025357 A CN202180025357 A CN 202180025357A CN 115362679 A CN115362679 A CN 115362679A
Authority
CN
China
Prior art keywords
sps
picture buffer
decoded picture
syntax
dpb
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180025357.3A
Other languages
English (en)
Inventor
K·纳赛尔
F·莱莱昂内克
T·波里尔
F·加尔平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital CE Patent Holdings SAS
Original Assignee
Interactive Digital Vc Holding France
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Interactive Digital Vc Holding France filed Critical Interactive Digital Vc Holding France
Publication of CN115362679A publication Critical patent/CN115362679A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/88Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving rearrangement of data among different coding units, e.g. shuffling, interleaving, scrambling or permutation of pixel data or permutation of transform coefficient data among different blocks

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明描述了不同的具体实施,具体地,提出了用于视频编码和解码的具体实施。因此,编码或解码包括获得用于对经编码的图片进行解码的解码图片缓冲器的参数。与解码图片缓冲器有关的参数的信令由语法数据元素sps_sublayer_dpb_params_flag控制,该语法数据元素与控制SPS中解码图片缓冲器参数语法结构中的语法元素的存在有关。根据特定特性,当语法数据元素sps_ptl_dpb_hrd_params_present_flag指定SPS中不存在解码图片缓冲器参数语法结构时,语法数据元素sps_sublayer_dpb_params_flag被推断为零。根据另一特定特性,当语法数据元素sps_ptl_dpb_hrd_params_present_flag指定SPS中存在解码图片缓冲器参数语法结构时,在SPS中发信号通知语法数据元素sps_sublayer_dpb_params_flag。

Description

用于视频编码和解码的方法和装置
技术领域
本发明实施方案中的至少一个实施方案整体涉及例如一种用于视频编码或解码的方法或装置,并且更具体地,涉及一种包括获得解码图片缓冲器的参数的方法和装置。
背景技术
一个或多个具体实施的技术领域整体涉及视频压缩。与现有的视频压缩***诸如HEVC(HEVC是指高效视频编码,也称为H.265和MPEG-H第2部分,其在“ITU-T H.265国际电联电信标准化部门(10/2014),H系列:视听和多媒体***,视听服务基础设施-移动视频的编码,高效视频编码,ITU-T H.265建议书”中进行描述)相比,或者与开发中的视频压缩***诸如VVC(通用视频编码,由联合视频专家小组(JVET)开发的新标准)相比,至少一些实施方案涉及改进压缩效率。
为了实现高压缩效率,图像和视频编码方案通常采用包括运动向量预测在内的预测以及变换来利用视频内容中的空间和时间冗余。一般来讲,帧内或帧间预测用于利用帧内或帧间相关性,然后对在原始图像与预测图像之间的差值(通常表示为预测错误或预测残差)进行变换、量化和熵编码。为了重构视频,通过对应于熵编码、量化、变换和预测的逆过程对压缩数据进行解码。缓冲器(称为解码图片缓冲器或DPB)存储经解码图片以用于参考、输出重排序或针对用于比特流检查和解码器一致性的假想参考解码器(HRD)指定的输出延迟。解码图片缓冲器在相关高级语法元素中指定。期望优化解码图片缓冲器的高级语法(HLS)。
发明内容
本发明的目的是克服现有技术的缺点中的至少一个缺点。为此目的,根据至少一个实施方案的一般方面,提出了一种方法。该方法包括对语法数据元素进行解码,该语法数据元素指示在比特流中是否存在解码图片缓冲器参数语法结构;以及响应于存在解码图片缓冲器参数语法结构,至少对表示解码图片缓冲器的参数的语法数据结构进行解码,其中解码图片缓冲器的所述参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息。
根据至少一个实施方案的另一个一般方面,提出了一种方法。该方法包括对语法数据元素进行编码,该语法数据元素指示在比特流中是否存在解码图片缓冲器参数语法结构;以及响应于存在解码图片缓冲器参数语法结构,至少对表示解码图片缓冲器的参数的语法数据结构进行编码,其中解码图片缓冲器的所述参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息。
根据至少一个实施方案的另一个一般方面,提出了一种装置。该装置包括一个或多个处理器,其中该一个或多个处理器被配置为对语法数据元素进行解码,该语法数据元素指示在比特流中是否存在解码图片缓冲器参数语法结构;响应于存在解码图片缓冲器参数语法结构,至少对表示解码图片缓冲器的参数的语法数据结构进行解码。
根据至少一个实施方案的另一个一般方面,提出了一种装置。该装置包括一个或多个处理器,其中该一个或多个处理器被配置为对语法数据元素进行编码,该语法数据元素指示在比特流中是否存在解码图片缓冲器参数语法结构;响应于存在解码图片缓冲器参数语法结构,至少对表示解码图片缓冲器的参数的语法数据结构进行编码。
根据至少一个实施方案的另一个一般方面,提出了一种用于编码的方法。该编码方法包括获得用于对经编码的图片进行解码的解码图片缓冲器的参数。解码图片缓冲器的参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息。与解码图片缓冲器有关参数的信令由语法数据元素(sps_sublayer_dpb_params_flag)控制,该语法数据元素与控制序列参数集(SPS)中解码图片缓冲器参数语法结构中的语法元素的存在有关。根据特定特性,当至少与控制SPS中的解码图片缓冲器参数语法结构的存在有关的语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定SPS中不存在解码图片缓冲器参数语法结构时,与控制SPS中的解码图片缓冲器参数语法结构中语法元素的存在有关的语法数据元素(sps_sublayer_dpb_params_flag)被推断为零。根据另一特定特性,当至少与控制SPS中的解码图片缓冲器参数语法结构的存在有关的语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定SPS中存在解码图片缓冲器参数语法结构时,在SPS中编码或发信号通知与控制SPS中的解码图片缓冲器参数语法结构中语法元素的存在有关的语法数据元素(sps_sublayer_dpb_params_flag)。有利地,当指定SPS中不存在解码图片缓冲器参数语法结构时,跳过与控制SPS中的解码图片缓冲器参数语法结构中的语法元素的存在有关的语法数据元素(sps_sublayer_dpb_params_flag)的信令。
根据至少一个实施方案的另一个一般方面,提出了一种用于解码的方法。该解码方法包括获得用于对图片进行解码的解码图片缓冲器的参数。解码图片缓冲器的参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息。对于编码,与解码图片缓冲器有关的参数的信令由至少一个语法数据元素(sps_sublayer_dpb_params_flag)控制,该至少一个语法数据元素与控制序列参数集(SPS)中解码图片缓冲器参数语法结构中的语法元素的存在有关。根据特定特性,当至少与控制序列参数集(SPS)中的解码图片缓冲器参数语法结构的存在有关的语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定SPS中不存在解码图片缓冲器参数语法结构时,与控制SPS中的解码图片缓冲器参数语法结构中语法元素的存在有关的语法数据元素(sps_sublayer_dpb_params_flag)被推断为零。根据另一特定特性,当至少与控制SPS中的解码图片缓冲器参数语法结构的存在有关的语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定SPS中存在解码图片缓冲器参数语法结构时,从SPS解码与控制SPS中的解码图片缓冲器参数语法结构中语法元素的存在有关的语法数据元素(sps_sublayer_dpb_params_flag)。对于编码方法,当指定序列参数集(SPS)中不存在解码图片缓冲器参数语法结构时,隐式解码与控制SPS中的解码图片缓冲器参数语法结构中的语法元素的存在有关的语法数据元素(sps_sublayer_dpb_params_flag)。
更一般地,根据至少一个实施方案的另一个一般方面,提出了一种方法。该方法包括获得与控制序列参数集(SPS)中的解码图片缓冲器参数语法结构中语法元素的存在有关的语法数据元素(sps_sublayer_dpb_params_flag)。根据特定特性,如果至少与控制SPS中的解码图片缓冲器参数语法结构的存在有关的语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定SPS中不存在解码图片缓冲器参数语法结构,则与控制SPS中的解码图片缓冲器参数语法结构中语法元素的存在有关的语法数据元素(sps_sublayer_dpb_params_flag)被推断为零。根据另一特定特性,在SPS中发信号通知与控制SPS中的解码图片缓冲器参数语法结构中语法元素的存在有关的语法数据元素(sps_sublayer_dpb_params_flag)。
根据至少一个实施方案的另一个一般方面,提出了一种用于编码的设备,该设备包括用于实现编码方法的实施方案中的任一实施方案的装置。
根据至少一个实施方案的另一个一般方面,提出了一种用于解码的设备,该设备包括用于实现解码方法的实施方案中的任一实施方案的装置。
根据至少一个实施方案的另一个一般方面,提供了一种用于编码的设备,该设备包括一个或多个处理器和至少一个存储器。一个或多个处理器被配置为实现编码方法的实施方案中的任一实施方案。
根据至少一个实施方案的另一个一般方面,提供了一种用于解码的设备,该设备包括一个或多个处理器和至少一个存储器。一个或多个处理器被配置为实现解码方法的实施方案中的任一实施方案。
根据至少一个实施方案的另一个一般方面,提出了包含根据前述描述中任一项所述的方法或设备生成的数据内容的非暂态计算机可读介质。
根据至少一个实施方案的另一个一般方面,提供了一种信号,该信号包括根据前述描述中任一项所述的方法或设备生成的视频数据。
本发明实施方案中的一个或多个实施方案还提供一种计算机可读存储介质,该计算机可读存储介质具有存储在其上的用于根据上述方法中的任一种方法对视频数据进行编码或解码的指令。本发明实施方案还提供了一种计算机可读存储介质,该计算机可读存储介质具有存储在其上的根据上述方法生成的比特流。本发明实施方案还提供了一种用于发射根据上述方法生成的比特流的方法和设备。本发明实施方案还提供了一种计算机程序产品,该计算机程序产品包括用于执行所述方法中任一种的指令。
附图说明
图1示出了根据至少一个实施方案的一般方面的解码方法的示例;
图2示出了根据至少一个实施方案的一般方面的编码方法的示例;
图3示出了根据至少一个实施方案的一般方面的用于获得语法数据元素的方法的示例,该语法数据元素与控制序列参数集中的解码图片缓冲器参数语法结构中语法元素的存在相关;
图4示出了可实现实施方案的各个方面的视频编码器的实施方案的框图;
图5示出了可实现实施方案的各个方面的视频编码器的实施方案的框图;
图6示出了可实现实施方案的各个方面的示例性装置的框图。
具体实施方式
应当理解,附图和描述已简化以说明与清楚理解本发明原理相关的元素,同时为了清楚起见,消除了在典型的编码和/或解码设备中发现的许多其他元素。应当理解,尽管在本文中可使用术语第一和第二来描述各种元件,但是这些元件不应受这些术语限制。这些术语仅用于将一个元件与另一元件区分开。
相对于图片的编码/解码描述了各种实施方案。可应用这些实施方案来对图片的一部分进行编码/解码,诸如切片或图块,或整个图片序列。此外,相对于块(例如编码单元CU)的解码描述了各种实施方案,并且这些实施方案易于被推导以用于块的编码。
上文描述了各种方法,并且方法中的每一方法包括用于实现所描述的方法的一个或多个步骤或动作。除非正确操作方法需要特定顺序的步骤或动作,否则可修改或组合特定步骤和/或动作的顺序和/或用途。
首先,公开了根据本发明原理的用于对图片进行解码的方法、用于对图片进行编码的方法、用于获得与语法元素有关的DPB的方法的若干实施方案,然后,提出了实现所公开方法的附加信息和一般实施方案。
在VVC的最新版本中,在视频参数集(VPS)和序列参数集(SPS)中对用于子层的解码图片缓冲器参数进行编码。使用dpb_parameters()语法结构发信号通知解码图片缓冲器参数,该解码图片缓冲器参数提供关于DPB大小、最大图片重排序数目和针对一个或多个输出层集(OLS)的最大等待时间的信息。当VPS中包括dpb_parameters()语法结构时,dpb_parameters()语法结构应用于OLS,该OLS由该VPS指定。当SPS中包括dpb_parameters()语法结构时,该语法结构应用于OLS,该OLS只包括层中指示SPS的最低层,并且该最低层是独立层。
语法元素vps_sublayer_dpb_params_present_flag用于控制VPS中的dpb_parameters()语法结构中max_dec_pic_buffering_minus1[]、max_num_reorder_pics[]和max_latency_increase_plus1[]语法元素的存在。当不存在时,vps_sub_dpb_params_info_present_fla被推断等于0。具体地讲,在VPS中,以下规格提供于VVC中(如由下划线突出显示):
Figure BDA0003868609290000061
本领域技术人员将会理解,如果解码图片缓冲器参数(vps_num_dpb_params)的数目大于0,则使用dpb_parameters()函数来对解码图片缓冲器参数进行解码,该函数定义如下:
Figure BDA0003868609290000071
在SPS级别执行相同的操作,如下(如由下划线突出显示):
Figure BDA0003868609290000072
因此,当sps_ptl_dpb_hrd_params_present_flag等于一时,调用相同的解码图片缓冲器参数函数来对参数进行解码。语法元素sps_ptl_dpb_hrd_params_present_flag等于1指定了SPS中存在profile_tier_level()语法结构和dpb_parameters()语法结构,并且SPS中还可存在general_hrd_parameters()语法结构和ols_hrd_parameters()语法结构。语法元素sps_ptl_dpb_hrd_params_present_flag等于0指定了这四个语法结构均不存在于SPS中。sps_ptl_dpb_hrd_params_present_flag的值应等于vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]]。
并且语法元素sps_sublayer_dpb_params_flag用于控制SPS中的dpb_parameters()语法结构中max_dec_pic_buffering_minus1[i]、max_num_reorder_pics[i]和max_latency_increase_plus1[i]语法元素的存在。当不存在时,sps_sub_dpb_params_info_present_flag的值被推断等于0。
因此,sps_sublayer_dpb_params_flag仅用于dpb_parameters函数。这意味着,如果不使用此函数,则其值变为冗余的。通常会避免对不相关信息进行编码。本发明原理通过调节对sps_ptl_dpb_hrd_params_present_flag的编码来有利地去除sps_sublayer_dpb_params_flag的冗余编码。
用于获得DPB相关语法元素的方法的实施方案
图3示出了根据至少一个实施方案的一般方面的用于获得语法数据元素sps_sublayer_dpb_params_flag的方法的示例,该语法数据元素与控制序列参数集中的解码图片缓冲器参数语法结构中语法元素的存在有关。所公开的方法例如用于编码方法或解码方法中,其中所公开的方法用于控制解码图片缓冲器参数的信令。
因此,根据示例性实施方案,用于获得语法数据元素sps_sublayer_dpb_params_flag的方法30包括:在步骤31中,对语法数据元素sps_ptl_dpb_hrd_params_present_flag进行测试,该语法数据元素至少与控制SPS中的解码图片缓冲器参数语法结构(即用于对图片或视频进行解码的解码图片缓冲器的参数)的存在有关。在步骤33中,在sps_ptl_dpb_hrd_params_present_flag等于零(即标记指定在SPS中不存在(或没有发信号通知)解码图片缓冲器参数语法结构)的情况下,sps_sublayer_dpb_params_flag被推断为零。在步骤32中,在sps_ptl_dpb_hrd_params_present_flag等于一(即标记指定在SPS中存在(发信号通知)解码图片缓冲器参数语法结构)的情况下,在SPS中发信号通知sps_sublayer_dpb_params_flag,从而在编码器处编码或在解码器处解码。有利地,如果sps_ptl_dpb_hrd_params_present_flag为零,则sps_sublayer_dpb_params_flag未被编码但推断为零。有利地;该方法给编码器设计者带来更少困惑,使得当将子层解码图片缓冲器标记设定为一时,其必须执行所期望的操作。如果将该标记设定为一,则意味着控制上文提及的语法元素。然而,由于当sps_ptl_dpb_hrd_params_present_flag为零时,不使用dpb_parameters()函数,因此该标记不控制语法元素。因此,该标记不执行其所期望的操作。最后,本发明原理还在SPS级别下节省1位,这在考虑大规模数据集或互联网流量时是重要的。
下面给出了规格变化(为方便读者,添加的部分已加下划线):
Figure BDA0003868609290000081
Figure BDA0003868609290000091
用于对图片进行解码的方法的实施方案
图1示出了根据至少一个实施方案的一般方面的解码方法的示例。因此,用于对图片进行解码的方法10包括在步骤11中获得用于对图片或视频进行解码的解码图片缓冲器的参数。如先前所描述,解码图片缓冲器的参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片到解码器的最大等待时间的信息。在VPS或/和SPS中发信号通知这些参数。对与解码图片缓冲器有关的参数的检索由语法数据元素sps_sublayer_dpb_params_flag控制,该语法数据元素用于控制SPS中的DPB参数语法结构中语法元素的存在。然后,使用从检索到的DPB参数指定的DPB,同时对图片进行解码12。根据特定特性,当至少用于控制SPS中的DPB参数语法结构的存在的语法数据元素sps_ptl_dpb_hrd_params_present_flag指定SPS中不存在DBP参数语法结构(即sps_ptl_dpb_hrd_params_present_flag等于零)时,sps_sublayer_dpb_params_flag被推断为零。此实施方案有利地避免了在sps_ptl_dpb_hrd_params_present_flag等于零的情况下,从SPS中的编码器向解码器发信号通知标记sps_sublayer_dpb_params_flag。根据另一特定特性,当语法数据元素sps_ptl_dpb_hrd_params_present_flag设定为一时,从SPS解码sps_sublayer_dpb_params_flag。此实施方案有利地避免了去除sps_sublayer_dpb_params_flag的冗余信令。尽管未明确叙述,但sps_sublayer_dpb_params_flag i的信令和解码进一步以语法元素sps_max_sublayers_minus1大于0为条件,其中sps_max_sublayers_minus1指定可在编码分层视频序列中存在的时间子层的最大数目。
用于对图片进行编码的方法的实施方案
图2示出了根据至少一个实施方案的一般方面的编码方法的示例。因此,用于对图片进行编码的方法20包括在步骤21中获得用于对图片或视频进行解码的解码图片缓冲器的参数。如先前所描述,解码图片缓冲器的参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片到解码器的最大等待时间的信息。在VPS或/和SPS中发信号通知这些参数。在解码器处,对与解码图片缓冲器有关的参数的检索由语法数据元素sps_sublayer_dpb_params_flag控制,该语法数据元素用于控制SPS中的DPB参数语法结构中语法元素的存在。然后,使用从检索到的DPB参数指定的DPB,同时重构图片以进一步用于编码。根据特定特性,当至少用于控制SPS中的DPB参数语法结构的存在的语法数据元素sps_ptl_dpb_hrd_params_present_flag指定SPS中不存在DBP参数语法结构(即sps_ptl_dpb_hrd_params_present_flag等于零)时,sps_sublayer_dpb_params_flag被推断为零。此实施方案有利地避免了在sps_ptl_dpb_hrd_params_present_flag等于零的情况下,从SPS中的编码器向解码器发信号通知标记sps_sublayer_dpb_params_flag。换句话讲,跳过对语法元素sps_sublayer_dpb_params_flag的编码。根据另一特定特性,在任选步骤22中,当语法数据元素sps_ptl_dpb_hrd_params_present_flag设定为一时,在SPS中编码sps_sublayer_dpb_params_flag。此外,在任选步骤22中,响应于指示DPB参数被发信号通知的sps_sublayer_dpb_params_flag,通过SPS中的DPB参数语法结构对DPB的参数进行编码。根据变体实施方案,sps_sublayer_dpb_params_flag的信令和编码进一步以语法元素sps_max_sublayers_minus1大于0为条件,其中sps_max_sublayers_minus1指定可在编码分层视频序列中存在的时间子层的最大数目。
另外的实施方案和信息
本申请描述了各个方面,包括工具、特征、实施方案、模型、方法等。具体描述了这些方面中的许多方面,并且至少示出个体特性,通常以可能听起来有限的方式描述。然而,这是为了描述清楚,并不限制这些方面的应用或范围。实际上,所有不同的方面可组合和互换以提供进一步的方面。此外,这些方面也可与先前提交中描述的方面组合和互换。
本专利申请中描述和设想的方面可以许多不同的形式实现。下面的图4、图5和图6提供了一些实施方案,但是设想了其他实施方案,并且图4、图5和图6的讨论不限制具体实施的广度。这些方面中的至少一个方面通常涉及视频编码和解码,并且至少一个其他方面通常涉及发射生成或编码的比特流。这些和其他方面可实现为方法、装置、其上存储有用于根据所述方法中任一种对视频数据编码或解码的指令的计算机可读存储介质,和/或其上存储有根据所述方法中任一种生成的比特流的计算机可读存储介质。
在本申请中,术语“重构”和“解码”可以互换使用,术语“像素”和“样本”可以互换使用,术语“图像”、“图片”和“帧”可以互换使用。
本文描述了各种方法,并且每种方法包括用于实现方法的一个或多个步骤或动作。除非正确操作方法需要特定顺序的步骤或动作,否则可修改或组合特定步骤和/或动作的顺序和/或用途。
本申请中所述的各种方法和其他方面可用于修改模块,例如,视频编码器100和解码器200的参考图像缓冲器(180,280),如图4和图5中所示。此外,本发明方面不限于VVC或HEVC,并且可应用于例如其他标准和推荐(无论是预先存在的还是未来开发的)以及任何此类标准和推荐的扩展(包括VVC和HEVC)。除非另外指明或技术上排除在外,否则本申请中所述的方面可单独或组合使用。
本申请中使用了各种数值,例如标记的值。具体值是为了示例目的,并且所述方面不限于这些具体值。
图4示出了编码器100。设想了这一编码器100的变型,但是为了清楚起见,下文描述了编码器100而不描述所有预期的变型。
在经过编码之前,视频序列可经过预编码处理(101),例如,将颜色变换应用于输入的彩色图像(例如,从RGB 4:4:4转换到YCbCr 4:2:0),或执行输入图像分量的重新映射,以获取更能弹性应对压缩的信号分布(例如,通过颜色分量中的一个颜色分量的直方图均衡化)。元数据可与预处理相关联并且附加到比特流。
在编码器100中,如下所述,图像由编码器元件进行编码。在例如CU的单元中对要编码的图像进行分区(102)和处理。例如,使用帧内模式或帧间模式对每个单元进行编码。当以帧内模式对单元进行编码时,该单元执行帧内预测(160)。在帧间模式中,执行运动估计(175)和运动补偿(170)。该编码器决定(105)以帧内模式或帧间模式中的哪一者对单元进行编码,以及通过例如预测模式标记来指示帧内/帧间的决定。例如,通过从原始图像块减去(110)预测块来计算预测残差。
然后,对该预测残差进行变换(125)和量化(130)。对经过量化的变换系数、运动向量和其他语法元素进行熵编码(145),以输出比特流。该编码器可跳过变换,并对未变换的残余信号直接应用量化。该编码器可绕过变换和量化两者,即,在不应用变换或量化过程的情况下直接对残差进行编码。
该编码器对编码块进行解码以提供进一步预测的参考。对经过量化的变换系数进行解量化(140)和逆变换(150),以对预测残差进行解码。通过组合(155)经解码的预测残差和预测块,重构图像块。将环路滤波器(165)应用到重构的图像,以执行,例如,去块效应/样本自适应偏移(SAO)滤波,从而减少编码伪影。经滤波的图像存储在参考图像缓冲器(180)中。
图5示出了视频解码器200的框图。在解码器200中,如下所述,比特流由解码器元件进行解码。视频解码器200一般执行与图4中所述的编码过程相反的解码过程。编码器100通常还执行视频解码作为对视频数据进行编码的一部分。
具体地,该解码器的输入包括视频比特流,该视频比特流可由视频编码器100生成。首先,对该比特流进行熵解码(230)以获取变换系数、运动向量和其他已编码信息。图像分区信息指示如何对图像进行分区。因此,该解码器可以根据已解码图像分区信息划分(235)图像。通过对该变换系数进行解量化(240)和逆变换(250),对该预测残差进行解码。通过组合(255)经解码的预测残差和预测块,重构图像块。可通过帧内预测(260)或运动补偿预测(即帧间预测)(275)获取(270)该预测块。向该重构图像应用环路滤波器(265)。经滤波的图像存储在参考图像缓冲器(280)中。
经解码的图像还可经过解码后处理(285),例如,逆颜色变换(例如,从YCbCr4:2:0转换到RGB4:4:4)或执行与在预编码处理(101)中执行的重新映射过程相逆的逆重新映射。解码后处理可使用在预编码处理中导出并且在比特流中有信号通知的元数据。
图6示出了实现各个方面和实施方案的***的示例的框图。***1000可体现为包括下文所述的各个部件的设备,并且被配置为执行本文档中所述的一个或多个方面。此类设备的示例包括但不限于各种电子设备,例如个人计算机、膝上型计算机、智能电话、平板电脑、数字多媒体机顶盒、数字电视机接收器、个人视频录制***、连接的家用电器和服务器。***1000的元件可单独地或组合地体现在单个集成电路(IC)、多个IC和/或分立部件中。例如,在至少一个实施方案中,***1000的处理和编码器/解码器元件分布在多个IC和/或分立元件上。在各种实施方案中,***1000经由例如通信总线或通过专用输入和/或输出端口通信地耦接到一个或多个其他***或其他电子设备。在各种实施方案中,***1000被配置为实现本文档中所述的一个或多个方面。
***1000包括至少一个处理器1010,该至少一个处理器被配置为执行加载到其中的指令,以用于实现例如本文档中所述的各个方面。处理器1010可包括嵌入式存储器、输入输出接口和本领域已知的各种其他电路。***1000包括至少一个存储器1020(例如,易失性存储器设备和/或非易失性存储器设备)。***1000包括存储设备1040,该存储设备可包括非易失性存储器和/或易失性存储器,包括但不限于电可擦除可编程只读存储器(EEPROM)、只读存储器(ROM)、可编程只读存储器(PROM)、随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态随机存取存储器(SRAM)、闪存、磁盘驱动器和/或光盘驱动器。作为非限制性示例,存储设备1040可包括内部存储设备、附接存储设备(包括可拆和不可拆的存储设备)和/或网络可访问的存储设备。
***1000包括编码器/解码器模块1030,该编码器/解码器模块被配置为例如处理数据以提供编码视频或解码视频,并且编码器/解码器模块1030可包括其自身的处理器和存储器。编码器/解码器模块1030表示可被包括在设备中以执行编码和/或解码功能的模块。众所周知,设备可包括编码模块和解码模块中的一者或两者。此外,编码器/解码器模块1030可实现为***1000的独立元件,或者可结合在处理器1010内作为本领域技术人员已知的硬件和软件的组合。
要加载到处理器1010或编码器/解码器1030上以执行本文档中所述的各个方面的程序代码可存储在存储设备1040中,并且随后被加载到存储器1020上以供处理器1010执行。根据各种实施方案,处理器1010、存储器1020、存储设备1040和编码器/解码器模块1030中的一者或多者可在本文档中所述过程的执行期间存储各个项目中的一个或多个项目。此类存储项目可包括但不限于输入视频、解码的视频或部分解码的视频、比特流、矩阵、变量以及处理等式、公式、运算和运算逻辑的中间或最终结果。
在一些实施方案中,处理器1010和/或编码器/解码器模块1030内部的存储器用于存储指令和提供工作存储器以用于在编码或解码期间需要的处理。然而,在其他实施方案中,处理设备外部的存储器(例如,处理设备可以是处理器1010或编码器/解码器模块1030)用于这些功能中的一个或多个功能。外部存储器可以是存储器1020和/或存储设备1040,例如动态易失性存储器和/或非易失性闪存存储器。在若干实施方案中,外部非易失性闪存存储器用于存储例如电视机的操作***。在至少一个实施方案中,快速外部动态易失性存储器诸如RAM用作视频编码和解码操作的工作存储器,诸如MPEG-2(MPEG是指运动图片专家组,MPEG-2也称为ISO/IEC13818,并且13818-1也称为H.222,13818-2也称为H.262)、HEVC(HEVC是指高效视频编码,也称为H.265和MPEG-H部分2)或VVC(通用视频编码,由联合视频专家小组(JVET)开发的新标准)。
对***1000的元件的输入可通过如块1130中所示的各种输入设备提供。此类输入设备包括但不限于:(i)射频(RF)部分,其接收例如由广播器通过空中传输的RF信号;(ii)分量(COMP)输入端子(或一组COMP输入端子);(iii)通用串行总线(USB)输入端子;和/或(iv)高清晰度多媒体接口(HDMI)输入端子。图6中未示出的其他示例包括复合视频。
在各种实施方案中,块1130的输入设备具有本领域已知的相关联的相应输入处理元件。例如,RF部分可与适用于以下的元件相关联:(i)选择所需的频率(也称为选择信号,或将信号频带限制到一个频带),(ii)下变频选择的信号,(iii)再次频带限制到更窄频带以选择(例如)在某些实施方案中可称为信道的信号频带,(iv)解调下变频和频带限制的信号,(v)执行纠错,以及(vi)解复用以选择所需的数据包流。各种实施方案的RF部分包括用于执行这些功能的一个或多个元件,例如频率选择器、信号选择器、频带限制器、信道选择器、滤波器、下变频器、解调器、纠错器和解复用器。RF部分可包括执行这些功能中的各种功能的调谐器,这些功能包括例如下变频接收信号至更低频率(例如,中频或近基带频率)或至基带。在一个机顶盒实施方案中,RF部分及其相关联的输入处理元件接收通过有线(例如,电缆)介质发射的RF信号,并且通过滤波、下变频和再次滤波至所需的频带来执行频率选择。各种实施方案重新布置上述(和其他)元件的顺序,移除这些元件中的一些元件,和/或添加执行类似或不同功能的其他元件。添加元件可包括在现有元件之间***元件,例如,***放大器和模数变换器。在各种实施方案中,RF部分包括天线。
此外,USB和/或HDMI端子可包括用于跨USB和/或HDMI连接将***1000连接到其他电子设备的相应接口处理器。应当理解,输入处理(例如Reed-Solomon纠错)的各个方面可根据需要例如在单独的输入处理IC内或在处理器1010内实现。类似地,USB或HDMI接口处理的方面可根据需要在单独的接口IC内或在处理器1010内实现。将解调流、纠错流和解复用流提供给各种处理元件,例如包括处理器1010和编码器/解码器1030,该处理元件与存储器和存储元件结合操作,以处理需要用于呈现在输出设备上的数据流。
***1000的各种元件可设置在集成外壳内,在该集成外壳内,各种元件可使用合适的连接布置(例如,如本领域已知的内部总线,包括IC间(I2C)总线、布线和印刷电路板)互连并且在其间发射数据。
***1000包括能够经由通信信道1060与其他设备通信的通信接口1050。通信接口1050可包括但不限于被配置为通过通信信道1060发射和接收数据的收发器。通信接口1050可包括但不限于调制解调器或网卡,并且通信信道1060可例如在有线和/或无线介质内实现。
在各种实施方案中,使用诸如Wi-Fi网络,例如IEEE 802.11(IEEE是指电气和电子工程师协会)之类的无线网络将数据流式发射或以其他方式提供给***1000。这些实施方案中的Wi-Fi信号通过适用于Wi-Fi通信的通信信道1060和通信接口1050进行接收。这些实施方案的通信信道1060通常连接到接入点或路由器,该接入点或路由器提供对包括互联网的外部网络的访问,以用于允许流式应用和其他云上通信。其他实施方案使用通过输入块1130的HDMI连接传递数据的机顶盒向***1000提供流式数据。还有其他实施方案使用输入块1130的RF连接向***1000提供流式数据。如上所述,各种实施方案以非流式的方式提供数据。另外,各种实施方案使用除了Wi-Fi以外的无线网络,例如蜂窝网络或蓝牙网络。
***1000可将输出信号提供到各种输出设备,包括显示器1100、扬声器1110和其他***设备1120。各种实施方案的显示器1100包括例如触摸屏显示器、有机发光二极管(OLED)显示器、曲面显示器和/或可折叠显示器中的一者或多者。显示器1100可用于电视机、平板电脑、膝上型计算机、蜂窝电话(移动电话)或其他设备。显示器1100还可以与其他部件集成在一起(例如,如在智能电话中),或者是单独的(例如,膝上型计算机的外部监视器)。在实施方案的各种示例中,其他***设备1120包括独立数字视频光盘(或数字通用光盘,两个术语都是DVR)、盘播放器、立体声***和/或照明***中的一者或多者。各种实施方案使用提供基于***1000的输出的功能的一个或多个***设备1120。例如,盘播放器执行播放***1000的输出的功能。
在各种实施方案中,控制信号使用诸如AV.Link、消费电子产品控制(CEC)或其他通信协议的信令在***1000与显示器1100、扬声器1110或其他***设备1120之间传送,该其他通信协议使得能够在有或没有用户干预的情况下进行设备到设备控制。输出设备可通过相应接口1070、1080和1090经由专用连接通信地耦接到***1000。另选地,输出设备可使用通信信道1060经由通信接口1050连接到***1000。显示器1100和扬声器1110可与电子设备(诸如例如电视机)中的***1000的其他部件集成在单个单元中。在各种实施方案中,显示器接口1070包括显示驱动器,诸如例如定时控制器(T Con)芯片。
另选地,如果输入1130的RF部分是单独机顶盒的一部分,则显示器1100和扬声器1110可选地与其他部件中的一个或多个部件分开。在显示器1100和扬声器1110为外部部件的各种实施方案中,输出信号可经由专用输出连接(包括例如,HDMI端口、USB端口或COMP输出)提供。
这些实施方案可由处理器1010或由硬件或由硬件和软件的组合实现的计算机软件执行。作为非限制性示例,这些实施方案可由一个或多个集成电路实现。作为非限制性示例,存储器1020可以是适合于技术环境的任意类型,并且可使用任何适当的数据存储技术来实现,诸如光学存储器设备、磁存储器设备、基于半导体的存储器设备、固定存储器和可移动存储器。作为非限制性示例,处理器1010可以是适合于技术环境的任意类型,并且可涵盖微处理器、通用计算机、专用计算机和基于多核架构的处理器中的一者或多者。
各种具体实施参与解码。如本申请中所用,“解码”可涵盖例如对所接收的编码序列执行的过程的全部或部分,以便产生适于显示的最终输出。在各种实施方案中,此类过程包括通常由解码器执行的一个或多个过程,例如熵解码、逆量化、逆变换和差分解码。在各种实施方案中,此类过程还包括或另选地包括由本申请中描述的各种具体实施的解码器执行的过程,例如,根据解码图片缓冲器的指定参数使用解码图片缓冲器对图片进行解码,其中当至少与控制SPS中的解码图片缓冲器参数语法结构的存在有关的语法数据元素sps_ptl_dpb_hrd_params_present_flag指定SPS中不存在解码图片缓冲器参数语法结构时,与控制SPS中的解码图片缓冲器参数语法结构中语法元素的存在有关的语法数据元素sps_sublayer_dpb_params_flag被推断为零。
作为进一步的示例,在实施方案中,“解码”仅是指熵解码,在另一个实施方案中,“解码”仅是指差分解码,并且在又一个实施方案中,“解码”是指熵解码和差分解码的组合。短语“解码过程”是具体地指代操作的子集还是广义地指代更广泛的解码过程基于具体描述的上下文将是清楚的,并且据信将被本领域的技术人员很好地理解。
各种具体实施参与编码。以与上面关于“解码”的讨论类似的方式,如在本申请中使用的“编码”可涵盖例如对输入视频序列执行以便产生编码比特流的全部或部分过程。在各种实施方案中,此类过程包括通常由编码器执行的一个或多个过程,例如,分区、差分编码、变换、量化和熵编码。在各种实施方案中,此类过程还包括或另选地包括由本申请中描述的各种具体实施的编码器执行的过程,例如,根据解码图片缓冲器的指定参数对图片进行编码,其中当至少与控制SPS中的解码图片缓冲器参数语法结构的存在有关的语法数据元素sps_ptl_dpb_hrd_params_present_flag指定SPS中不存在解码图片缓冲器参数语法结构时,与控制SPS中的解码图片缓冲器参数语法结构中语法元素的存在有关的语法数据元素sps_sublayer_dpb_params_flag被推断为零。因此,跳过标记sps_sublayer_dpb_params_flag的编码。
作为进一步的示例,在实施方案中,“编码”仅是指熵编码,在另一个实施方案中,“编码”仅是指差分编码,并且在又一个实施方案中,“编码”是指差分编码和熵编码的组合。短语“编码过程”是具体地指代操作的子集还是广义地指代更广泛的编码过程基于具体描述的上下文将是清楚的,并且据信将被本领域的技术人员很好地理解。
注意,本文所用的语法元素是描述性术语。因此,它们不排除使用其他语法元素名称。
当附图呈现为流程图时,应当理解,其还提供了对应装置的框图。类似地,当附图呈现为框图时,应当理解,其还提供了对应的方法/过程的流程图。
本文所述的具体实施和方面可在例如方法或过程、装置、软件程序、数据流或信号中实现。即使仅在单个形式的具体实施的上下文中讨论(例如,仅作为方法讨论),讨论的特征的具体实施也可以其他形式(例如,装置或程序)实现。装置可在例如适当的硬件、软件和固件中实现。方法可在例如一般是指处理设备的处理器中实现,
该处理设备包括例如计算机、微处理器、集成电路或可编程逻辑设备。处理器还包括通信设备,诸如例如计算机、手机、便携式/个人数字助理(“PDA”)以及便于最终用户之间信息通信的其他设备。
提及“一个实施方案”或“实施方案”或“一个具体实施”或“具体实施”以及它们的其他变型,意味着结合实施方案描述的特定的特征、结构、特性等包括在至少一个实施方案中。因此,短语“在一个实施方案中”或“在实施方案中”或“在一个具体实施中”或“在具体实施中”的出现以及出现在本申请通篇的各个地方的任何其他变型不一定都是指相同的实施方案。
另外,本申请可涉及“确定”各种信息。确定信息可包括例如估计信息、计算信息、预测信息或从存储器检索信息中的一者或多者。
此外,本申请可涉及“访问”各种信息。访问信息可包括例如接收信息、检索信息(例如,从存储器)、存储信息、移动信息、复制信息、计算信息、确定信息、预测信息或估计信息中的一者或多者。
另外,本申请可涉及“接收”各种信息。与“访问”一样,接收旨在为广义的术语。接收信息可包括例如访问信息或检索信息(例如,从存储器)中的一者或多者。此外,在诸如例如存储信息、处理信息、发射信息、移动信息、复制信息、擦除信息、计算信息、确定信息、预测信息或估计信息的操作期间,“接收”通常以一种方式或另一种方式参与。
应当理解,例如,在“A/B”、“A和/或B”以及“A和B中的至少一者”的情况下,使用以下“/”、“和/或”和“至少一种”中的任一种旨在涵盖仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或选择两个选项(A和B)。作为进一步的示例,在“A、B和/或C”和“A、B和C中的至少一者”的情况下,此类短语旨在涵盖仅选择第一列出的选项(A),或仅选择第二列出的选项(B),或仅选择第三列出的选项(C),或仅选择第一列出的选项和第二列出的选项(A和B),或仅选择第一列出的选项和第三列出的选项(A和C),或仅选择第二列出的选项和第三列出的选项(B和C),或选择所有三个选项(A和B和C)。如对于本领域和相关领域的普通技术人员显而易见的是,这可扩展到所列出的尽可能多的项目。
而且,如本文所用,词语“发信号通知”是指(除了别的以外)向对应解码器指示某物。例如,在某些实施方案中,编码器发信号通知用于基于矩阵的帧内预测的多个参数中的特定一个参数。这样,在一个实施方案中,在编码器侧和解码器侧两者均使用相同的参数。因此,例如,编码器可将特定参数发射(显式信令)到解码器,使得解码器可使用相同的特定参数。相反,如果解码器已具有特定参数以及其他,则可在不发射(隐式信令)的情况下使用信令,以简单允许解码器知道和选择特定参数。通过避免发射任何实际功能,在各种实施方案中实现了位节省。应当理解,信令可以各种方式实现。例如,在各种实施方案中,使用一个或多个语法元素、标记等将信息发信号通知至对应解码器。虽然前面涉及词语“signal(发信号通知)”的动词形式,但是词语“signal(信号)”在本文也可用作名词。
本公开已描述了例如可被传输或存储的各种信息,诸如例如语法。此信息能够以多种方式封装或布置,包括例如视频标准中常见的方式,诸如将信息放入SPS、PPS、NAL单元、标头(例如,NAL单元标头或切片标头)或SEI消息中。其他方式也是可用的,包括例如用于***级或应用级标准的通用方式,诸如将信息放入以下中的一者或多者:
·会话描述协议(SDP),其为用于描述多媒体通信会话以用于会话通知和会话邀请的一种格式,例如,如在RFC中所述并与实时传输协议(RTP)传输结合使用;
·DASH媒体演示描述(MPD)描述符,例如,如在DASH中使用并通过HTTP传输,描述符与表示或表示的集合相关联,以向内容表示提供附加特性;
·RTP标头扩展,例如,如在RTP流式传输期间使用;
·ISO基础媒体文件格式,例如,如在OMAF中使用并且使用box,该box是由唯一类型标识符和长度定义的面向对象的构建块,在某些规范中也称为“atom”;
·通过HTTP传输的HLS(HTTP实时流式传输)清单。例如,清单可与内容的版本或版本集合相关联,以提供版本或版本集合的特性。
对于本领域的普通技术人员将显而易见的是,具体实施可产生格式化为携带例如可存储或可传输的信息的各种信号。信息可包括例如用于执行方法的指令或由所述具体实施中的一个具体实施产生的数据。例如,可格式化信号以携带所述实施方案的比特流。可格式化此类信号例如为电磁波(例如,使用频谱的射频部分)或基带信号。格式化可包括例如对数据流编码并且用编码的数据流调制载体。信号携带的信息可以是例如模拟或数字信息。已知的是,信号可通过各种不同的有线或无线链路发射。信号可存储在处理器可读介质上。
我们描述了多个实施方案。这些实施方案的特征可在各种权利要求类别和类型中单独地或以任何组合提供。此外,实施方案可包括以下特征、设备或方面中的一个或多个,单独地或以任何组合,跨各种权利要求类别和类型:
·通过在语法数据元素sps_ptl_dpb_hrd_params_present_flag指定SPS中不存在解码图片缓冲器参数语法结构时将语法数据元素sps_sublayer_dpb_params_flag推断为零,对视频图片的编码/解码进行修改;
·通过在语法数据元素sps_ptl_dpb_hrd_params_present_flag指定SPS中存在解码图片缓冲器参数语法结构时对语法数据元素sps_sublayer_dpb_params_flag进行编码/解码,对视频图片的编码/解码进行修改;
·通过在语法数据元素sps_ptl_dpb_hrd_params_present_flag指定SPS中不存在解码图片缓冲器参数语法结构并且当语法数据元素sps_max_sublayers_minus1大于零时将语法数据元素sps_sublayer_dpb_params_flag推断为零,对视频图片的编码/解码进行修改;
·通过在语法数据元素sps_ptl_dpb_hrd_params_present_flag指定SPS中存在解码图片缓冲器参数语法结构并且当语法数据元素sps_max_sublayers_minus1大于零时对语法数据元素sps_sublayer_dpb_params_flag进行编码/解码,对视频图片的编码/解码进行修改;
·使用VPS/SPS中的DPB参数的指定信令来对视频图片的编码/解码进行修改。
·包括所描述的语法元素中的一个或多个语法元素或其变型的比特流或信号。
·包括传递根据所述实施方案中任一项生成的信息的语法的比特流或信号。
·在信令中***语法元素,这使得解码器能够以与编码器所使用的方式相对应的方式指定DPB。
·对包括所描述的语法元素中的一个或多个语法元素或其变型的比特流或信号进行创建和/或传输和/或接收和/或解码。
·根据所述实施方案中任一项所述的创建和/或发射和/或接收和/或解码。
·根据所述实施方案中任一项所述的方法、过程、装置、存储指令的介质、存储数据的介质或信号。
·执行根据所述实施方案中任一项所述的变换跳过和残差编码的电视、机顶盒、蜂窝电话、平板电脑或其他电子设备。
·执行根据所述实施方案中任一项所述的变换跳过和残差编码并显示所得图像(例如,使用监视器、屏幕或其他类型的显示器)的电视、机顶盒、蜂窝电话、平板电脑或其他电子设备。
·选择(例如,使用调谐器)用于接收包括编码图像的信号的信道并且执行根据所述实施方案中任一项所述的变换跳过和残差编码的电视、机顶盒、蜂窝电话、平板电脑或其他电子设备。
·通过无线电(例如,使用天线)接收包括编码图像的信号并执行根据所述实施方案中任一项所述的变换跳过和残差编码的电视、机顶盒、蜂窝电话、平板电脑或其他电子设备。

Claims (18)

1.一种方法,所述方法包括:
对语法数据元素(sps_ptl_dpb_hrd_params_present_flag)进行解码,所述语法数据元素指示在比特流中是否存在解码图片缓冲器参数语法结构;
响应于存在所述解码图片缓冲器参数语法结构,至少对表示解码图片缓冲器的参数的语法数据结构(sps_sublayer_dpb_params_flag)进行解码,其中解码图片缓冲器的所述参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息。
2.一种装置,所述装置包括一个或多个处理器,其中所述一个或多个处理器被配置为:
对语法数据元素(sps_ptl_dpb_hrd_params_present_flag)进行解码,所述语法数据元素指示在比特流中是否存在解码图片缓冲器参数语法结构;
响应于存在所述解码图片缓冲器参数语法结构,至少对表示解码图片缓冲器的参数的语法数据结构(sps_sublayer_dpb_params_flag)进行解码,其中解码图片缓冲器的所述参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息。
3.一种方法,所述方法包括:
对语法数据元素(sps_ptl_dpb_hrd_params_present_flag)进行编码,所述语法数据元素指示在比特流中是否存在解码图片缓冲器参数语法结构;
响应于存在所述解码图片缓冲器参数语法结构,至少对表示解码图片缓冲器的参数的语法数据结构(sps_sublayer_dpb_params_flag)进行编码,其中解码图片缓冲器的所述参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息。
4.一种装置,所述装置包括一个或多个处理器,其中所述一个或多个处理器被配置用于:
对语法数据元素(sps_ptl_dpb_hrd_params_present_flag)进行编码,所述语法数据元素指示在比特流中是否存在解码图片缓冲器参数语法结构;
响应于存在所述解码图片缓冲器参数语法结构,至少对表示解码图片缓冲器的参数的语法数据结构(sps_sublayer_dpb_params_flag)进行编码,其中解码图片缓冲器的所述参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息。
5.一种用于对图片进行解码的方法,所述方法包括:
获得用于对图片进行解码的解码图片缓冲器的参数,其中解码图片缓冲器的所述参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息;
根据所获得的所述解码图片缓冲器的参数使用所述解码图片缓冲器对所述图片进行解码;
其中获得用于对图片进行解码的解码图片缓冲器的所述参数由至少一个语法数据元素(sps_sublayer_dpb_params_flag)控制,所述至少一个语法数据元素与控制序列参数集(SPS)中解码图片缓冲器参数语法结构中的语法元素的存在有关;并且
其中在至少与控制序列参数集(SPS)中的解码图片缓冲器参数语法结构的所述存在有关的语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定所述SPS中不存在解码图片缓冲器参数语法结构的条件下,与控制所述SPS中的解码图片缓冲器参数语法结构中语法元素的所述存在有关的所述语法数据元素(sps_sublayer_dpb_params_flag)被推断为零。
6.根据权利要求5所述的方法,其中在至少与控制SPS中的解码图片缓冲器参数语法结构的所述存在有关的所述语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定所述SPS中存在解码图片缓冲器参数语法结构的条件下,从SPS解码与控制所述SPS中的解码图片缓冲器参数语法结构中语法元素的所述存在有关的所述语法数据元素(sps_sublayer_dpb_params_flag)。
7.一种用于对图片进行解码的装置,所述装置包括一个或多个处理器,其中所述一个或多个处理器被配置为:
获得用于对图片进行解码的解码图片缓冲器的参数,其中解码图片缓冲器的所述参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息;
根据所获得的所述解码图片缓冲器的参数使用所述解码图片缓冲器对所述图片进行解码;
其中用于对图片进行解码的解码图片缓冲器的所述参数由语法数据元素(sps_sublayer_dpb_params_flag)控制,所述语法数据元素与控制序列参数集(SPS)中解码图片缓冲器参数语法结构中的语法元素的所述存在有关;并且
其中在至少与控制SPS中的解码图片缓冲器参数语法结构的所述存在有关的语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定所述SPS中不存在解码图片缓冲器参数语法结构的条件下,与控制所述SPS中的解码图片缓冲器参数语法结构中语法元素的所述存在有关的所述语法数据元素(sps_sublayer_dpb_params_flag)被推断为零。
8.根据权利要求7所述的装置,其中在至少与控制SPS中的解码图片缓冲器参数语法结构的所述存在有关的所述语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定所述SPS中存在解码图片缓冲器参数语法结构的条件下,从SPS解码与控制所述SPS中的解码图片缓冲器参数语法结构中语法元素的所述存在有关的所述语法数据元素(sps_sublayer_dpb_params_flag)。
9.一种用于对图片进行编码的方法,所述方法包括:
获得用于对图片进行解码的解码图片缓冲器的参数,其中解码图片缓冲器的所述参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息;
其中用于对图片进行解码的解码图片缓冲器的所述参数由语法数据元素(sps_sublayer_dpb_params_flag)控制,所述语法数据元素与控制序列参数集(SPS)中解码图片缓冲器参数语法结构中的语法元素的所述存在有关;并且
其中在至少与控制SPS中的解码图片缓冲器参数语法结构的所述存在有关的语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定所述SPS中不存在解码图片缓冲器参数语法结构的条件下,与控制所述SPS中的解码图片缓冲器参数语法结构中语法元素的所述存在有关的所述语法数据元素(sps_sublayer_dpb_params_flag)被推断为零。
10.根据权利要求9所述的方法,其中在至少与控制SPS中的解码图片缓冲器参数语法结构的所述存在有关的所述语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定所述SPS中存在解码图片缓冲器参数语法结构的条件下,在SPS中编码与控制所述SPS中的解码图片缓冲器参数语法结构中语法元素的所述存在有关的所述语法数据元素(sps_sublayer_dpb_params_flag)。
11.一种用于对图片进行编码的装置,所述装置包括一个或多个处理器,其中所述一个或多个处理器被配置为:
获得用于对经编码的图片进行解码的解码图片缓冲器的参数,其中解码图片缓冲器的所述参数提供关于缓冲器大小、最大图片重排序数目和针对一个或多个解码图片的最大等待时间的信息;
其中用于对图片进行解码的解码图片缓冲器的所述参数由语法数据元素(sps_sublayer_dpb_params_flag)控制,所述语法数据元素与控制序列参数集(SPS)中解码图片缓冲器参数语法结构中的语法元素的所述存在有关;并且
其中在至少与控制SPS中的解码图片缓冲器参数语法结构的所述存在有关的语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定所述SPS中不存在解码图片缓冲器参数语法结构的条件下,与控制所述SPS中的解码图片缓冲器参数语法结构中语法元素的所述存在有关的所述语法数据元素(sps_sublayer_dpb_params_flag)被推断为零。
12.根据权利要求11所述的装置,其中在至少与控制SPS中的解码图片缓冲器参数语法结构的所述存在有关的所述语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定所述SPS中存在解码图片缓冲器参数语法结构的条件下,在SPS中编码与控制所述SPS中的解码图片缓冲器参数语法结构中语法元素的所述存在有关的所述语法数据元素(sps_sublayer_dpb_params_flag)。
13.一种方法,所述方法包括:
获得语法数据元素(sps_sublayer_dpb_params_flag),所述语法数据元素与控制序列参数集(SPS)中的解码图片缓冲器参数语法结构中语法元素的存在有关,
其中如果至少与控制所述SPS中的解码图片缓冲器参数语法结构的所述存在有关的语法数据元素(sps_ptl_dpb_hrd_params_present_flag)指定所述SPS中不存在解码图片缓冲器参数语法结构,则与控制所述SPS中的解码图片缓冲器参数语法结构中语法元素的所述存在有关的所述语法数据元素(sps_sublayer_dpb_params_flag)被推断为零。
14.根据权利要求13所述的方法,其中所述
在SPS中发信号通知与控制所述SPS中的解码图片缓冲器参数语法结构中语法元素的所述存在有关的所述语法数据元素(sps_sublayer_dpb_params_flag)。
15.一种非暂态计算机可读介质,所述非暂态计算机可读介质包含根据权利要求3或9所述的方法或根据权利要求4或11所述的装置生成的数据内容。
16.一种非暂态计算机可读介质,所述非暂态计算机可读介质包括程序代码指令,所述程序代码指令用于当所述程序在计算机上执行时,执行根据权利要求1所述的解码方法,或执行根据权利要求4所述的编码方法。
17.一种信号,所述信号包含根据权利要求3或9所述的方法或根据权利要求4或11所述的装置生成的数据内容。
18.一种计算机程序产品,所述计算机程序产品包括程序代码指令,所述程序代码指令用于当所述程序在计算机上执行时,执行根据权利要求1、4或5中任一项所述的解码方法,或执行根据权利要求3、9或10中任一项所述的编码方法。
CN202180025357.3A 2020-03-31 2021-03-24 用于视频编码和解码的方法和装置 Pending CN115362679A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20315089 2020-03-31
EP20315089.1 2020-03-31
PCT/EP2021/057634 WO2021197979A1 (en) 2020-03-31 2021-03-24 Method and apparatus for video encoding and decoding

Publications (1)

Publication Number Publication Date
CN115362679A true CN115362679A (zh) 2022-11-18

Family

ID=70482575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180025357.3A Pending CN115362679A (zh) 2020-03-31 2021-03-24 用于视频编码和解码的方法和装置

Country Status (5)

Country Link
US (1) US20230141577A1 (zh)
EP (1) EP4128774A1 (zh)
KR (1) KR20220161441A (zh)
CN (1) CN115362679A (zh)
WO (1) WO2021197979A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230156230A1 (en) * 2020-03-30 2023-05-18 Lg Electronics Inc. Image encoding/decoding method and device for signaling information relating to ptl, dpb, and hrd in sps, and computer-readable recording medium storing bitstream

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9819941B2 (en) * 2013-10-10 2017-11-14 Qualcomm Incorporated Signaling for sub-decoded picture buffer (sub-DPB) based DPB operations in video coding
WO2015136941A1 (en) * 2014-03-13 2015-09-17 Sharp Kabushiki Kaisha Constrained reference picture parameters
US20210235124A1 (en) * 2020-01-29 2021-07-29 Qualcomm Incorporated Decoded picture buffer (dpb) parameter signaling for video coding
AU2021225986A1 (en) * 2020-02-28 2022-09-29 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods of signaling and semantics in parameter sets
KR20220156069A (ko) * 2020-03-24 2022-11-24 후아웨이 테크놀러지 컴퍼니 리미티드 인코더, 디코더 및 대응하는 방법

Also Published As

Publication number Publication date
US20230141577A1 (en) 2023-05-11
KR20220161441A (ko) 2022-12-06
WO2021197979A1 (en) 2021-10-07
EP4128774A1 (en) 2023-02-08

Similar Documents

Publication Publication Date Title
CN117256142A (zh) 用于使用基于人工神经网络的工具对图像和视频进行编码/解码的方法和装置
WO2020263799A1 (en) High level syntax for controlling the transform design
US20230141577A1 (en) Method and apparatus for video encoding and decoding
CN115516858A (zh) 视频编码中的缩放列表控制
CN115280786A (zh) 用于本地色度量化参数控制的高级约束标记
US20220224902A1 (en) Quantization matrices selection for separate color plane mode
US20230262268A1 (en) Chroma format dependent quantization matrices for video encoding and decoding
US20220368912A1 (en) Derivation of quantization matrices for joint cb-br coding
US20230106242A1 (en) Method and apparatus for video encoding and decoding
CN117813817A (zh) 用于对视频进行编码/解码的方法和装置
US20210344962A1 (en) Method and apparatus for video encoding and decoding with signaling of coding type or coding tree type
EP4360317A2 (en) Method and apparatus for video encoding and decoding
KR20240089756A (ko) 다층 코딩 및 디코딩을 위한 alf aps
WO2023099249A1 (en) Downsample phase indication
WO2023041317A1 (en) Method and apparatus for video encoding and decoding with chroma residuals sampling
JP2024522138A (ja) ビデオを符号化/復号するための方法及び装置
KR20240072180A (ko) Isp 모드를 사용한 템플릿 기반 인트라 모드 도출(timd)의 확장
CN117981305A (zh) 用于对视频进行编码/解码的方法和装置
JP2022540659A (ja) ルマツークロマ量子化パラメータテーブルシグナリング
CN117083853A (zh) 用于对视频进行编码/解码的方法和装置
CN116601948A (zh) 使带有色度缩放的亮度映射适于4:4:4 rgb图像内容
WO2023222521A1 (en) Sei adapted for multiple conformance points
CN114631314A (zh) 变换大小与编码工具的相互作用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20231031

Address after: Paris France

Applicant after: Interactive digital CE patent holding Co.

Address before: French Sesong Sevigne

Applicant before: Interactive digital VC holding France