CN116134816A - 在图像/视频编码***中处理一般约束信息的方法和设备 - Google Patents

在图像/视频编码***中处理一般约束信息的方法和设备 Download PDF

Info

Publication number
CN116134816A
CN116134816A CN202180059920.9A CN202180059920A CN116134816A CN 116134816 A CN116134816 A CN 116134816A CN 202180059920 A CN202180059920 A CN 202180059920A CN 116134816 A CN116134816 A CN 116134816A
Authority
CN
China
Prior art keywords
information
constraint
level
video
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180059920.9A
Other languages
English (en)
Inventor
亨得利·亨得利
南廷学
金昇焕
林宰显
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN116134816A publication Critical patent/CN116134816A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

根据本文的一种视频解码设备执行的视频解码方法包括以下步骤:从比特流获取一般约束信息;从所述比特流中解析指示所述一般约束信息是否包括关于输出层集合符合的约束的信息的标志;基于所述标志来解析所述一般约束信息中的关于所述约束的信息;以及基于关于所述约束的信息对当前图片进行解码,其中,所述一般约束信息包括关于所述约束的数目信息和对准信息,并且在所述一般约束信息内,所述对准信息可以存在于所述数目信息之后。

Description

在图像/视频编码***中处理一般约束信息的方法和设备
技术领域
本技术涉及一种用于在图像/视频编码***中对图像/视频信息进行编码/解码的情况下处理一般约束信息的方法和设备。
背景技术
近来,各种领域对高分辨率、高质量图像/视频(诸如4K、8K或更超高清(UHD)图像/视频)的需求正在增加。随着图像/视频分辨率或质量变高,与传统图像/视频数据相比,发送更多的信息量或比特。因此,如果图像/视频数据经由诸如现有的有线/无线宽带线路的介质发送或者存储在传统存储介质中,则会增加传输和存储的成本。
此外,对于虚拟现实(VR)和人工现实(AR)内容以及诸如全息图的沉浸式媒体的关注和需求正在增长;并且诸如游戏图像/视频这样的呈现与实际图像/视频的图像/视频特性不同的图像/视频特性的图像/视频的广播也正在增长。
因此,需要高效的图像/视频压缩技术来有效地压缩并发送、存储或播放示出如上所述的各种特性的高分辨率、高质量图像/视频。
发明内容
技术问题
本文的一个技术主题是提供增强图像/视频的编码效率的方法和设备。
本文的另一技术主题是提供用于在对图像/视频进行编码的情况下有效率地处理一般约束信息的方法和设备。
本文的又一技术主题是提供用于在对图像/视频进行编码时跳过对一般约束信息的解析的方法和设备。
本文的又另一技术主题是提供用于与一般约束信息分开地处理配置文件、层和级别信息的方法和设备。
技术方案
根据本文的一个实施方式,一种由视频解码设备执行的视频解码方法可以包括:从比特流解析表示输出层集合符合的级别的级别信息;从所述比特流获得用于所述输出层集合符合的约束的约束信息;以及基于所述级别信息和所述约束信息对当前图片执行解码过程,其中,所述级别信息和所述约束信息被包括在所述比特流的profile_tier_level语法结构中,并且其中,所述profile_tier_level语法结构中的所述约束信息存在于所述级别信息之后。
根据本文的另一实施方式,一种由视频编码设备执行的视频编码方法可以包括:生成表示输出层集合符合的级别的级别信息;生成用于所述输出层集合符合的约束的约束信息;以及对包括所述级别信息和所述约束信息的图像信息进行编码,其中,所述级别信息和所述约束信息被包括在所述图像信息的profile_tier_level语法结构中,并且其中,所述profile_tier_level语法结构中的所述约束信息存在于所述级别信息之后。
根据本文的又一实施方式,一种包括使视频解码设备执行视频解码方法的信息的计算机可读数字存储介质,其中,所述视频解码方法可以包括:从比特流解析表示输出层集合符合的级别的级别信息;从所述比特流获得用于所述输出层集合符合的约束的约束信息;以及基于所述级别信息和所述约束信息对当前图片执行解码过程,其中,所述级别信息和所述约束信息被包括在所述比特流的profile_tier_level语法结构中,并且其中,所述profile_tier_level语法结构中的所述约束信息存在于所述级别信息之后。
技术效果
根据本文的实施方式,可以增强整体图像/视频压缩效率。
根据本文的实施方式,可以在发信号通知图像/视频信息时有效率地发信号通知一般约束信息。
根据本文的实施方式,可以在对图像/视频进行编码时跳过对一般约束信息的解析。
根据本文的实施方式,可以在对图像/视频进行编码时与一般约束信息分开地处理配置文件、层和级别信息。
附图说明
图1示意性地示出了适用本文的实施方式的视频/图像编码***的示例。
图2是示意性地示出适用本文的实施方式的视频/图像编码设备的配置的图。
图3是示意性例示了适用本文的实施方式的视频/图像解码设备的配置的示图。
图4示出了适用本文的实施方式的示意性图片解码过程的示例。
图5示出了适用本文的实施方式的示意性图片编码过程的示例。
图6和图7示意性示出了根据本文的实施方式的视频/图像编码方法和相关部件的示例。
图8和图9示意性示出了根据本文的实施方式的视频/图像解码方法和相关部件的示例。
图10示出了适用本文中公开的实施方式的内容流***的示例。
具体实施方式
可以以各种形式修改本文的公开内容,并且将在附图中描述和例示其特定实施方式。在本文中使用的术语仅用于描述特定实施方式,而不旨在限制本文中所公开的方法。单个数字的表达包括“至少一个”的表达,只要它被清楚地不同地阅读即可。诸如“包括”和“具有”的术语旨在指示存在公开中所使用的特征、数字、步骤、操作、元件、部件或其组合,并且因此应当理解,不排除存在或添加一个或更多个不同特征、数字、步骤、操作、元件、部件或其组合的可能性。
本文涉及视频/图像编码。例如,在本文中公开的方法/实施方式可以应用于以通用视频编码(VVC)标准公开的方法。此外,本文中公开的方法/实施方式可以应用于以基本视频编码(EVC)标准、AOMedia视频1(AV1)标准、第二代音频视频编码标准(AVS2)或下一代视频/图像编码标准(例如,H.267,H.268等)公开的方法。
在本文中提出与视频/图像编码相关的各种实施方式,并且除非另有说明,否则实施方式可以彼此组合。
另外,在本文中描述的附图的各个配置是用于解释作为彼此不同的特征的功能的独立例示图,并且不意味着各个配置由相互不同的硬件或不同的软件实现。例如,配置中的两个或更多个配置可以被组合以形成一个配置,并且一个配置也可以被划分成多个配置。在不脱离本文的所公开的方法的主旨的情况下,将配置组合和/或分离的实施方式包括在本文的公开的范围内。
在本文中,术语“/”和“,”应被解释为指示“和/或”。例如,表述“A/B”可以意指“A和/或B”。此外,“A、B”可以意指“A和/或B”。此外,“A/B/C”可以意指“A、B和/或C中的至少一个”。另外,“A/B/C”可以意指“A、B和/或C中的至少一者”。
此外,在本文中,术语“或”应被解释为指示“和/或”。例如,表述“A或B”可以包括:1)仅A,2)仅B,和/或3)A和B两者。换言之,本文中的术语“或”应被解释为指示“另外地或另选地”。
此外,本文中使用的括号可以意指“例如”。具体地,在表述“预测(帧内预测)”的情况下,可以指表示提出了“帧内预测”作为“预测”的示例。换言之,本文中的术语“预测”不限于“帧内预测”,并且提出“帧内预测”作为“预测”的示例。此外,即使在表述“预测(即,帧内预测)”的情况下,也可以表示提出“帧内预测”作为“预测”的示例。
在本文中,可以单独地实现或同时实现在一个附图中单独解释的技术特征。
在下文中,将参照附图详细描述本文的实施方式。另外,贯穿附图,相同的附图标记用于指示相同的元件,并且可以省略对相同元件的相同描述。
图1例示了适用本文的实施方式的视频/图像编码***的示例。
参照图1,视频/图像编码***可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以经由数字存储介质或网络以文件或流的形式向接收装置发送编码视频/图像信息或数据。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以称为视频/图像编码设备,并且解码设备可以称为视频/图像解码设备。发送器可以包括在编码设备中。接收器可以包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部部件。
视频源可以通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。视频/图像捕获装置可以包括例如一个或更多个照相机、包括先前捕获的视频/图像的视频/图像档案等。视频/图像生成装置可以包括例如计算机、平板电脑和智能电话,并且可以(电子地)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以由生成相关数据的处理代替。
编码设备可以对输入的视频/图像进行编码。编码设备可以执行诸如预测、变换和量化的一系列过程,以实现压缩和编码效率。编码数据(编码视频/图像信息)能够以比特流的形式输出。
发送器可以通过数字存储介质或网络以文件或流的形式向接收装置的接收器发送以比特流形式输出的编码后的图像/图像信息或数据。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络进行发送的元件。接收器可以接收/提取比特流,并向解码设备发送接收到的比特流。
解码设备可以通过执行与编码设备的操作相对应的诸如反量化、逆变换和预测之类的一系列过程,来对视频/图像进行解码。
渲染器可以渲染解码后的视频/图像。可以通过显示器显示渲染后的视频/图像。
在本文中,视频可以是指随时间推移的一系列图像。图片通常是指表示特定时间帧的一个图像的单元,并且切片/图块是指在编码方面构成图片的一部分的单元。切片/图块可以包括一个或更多个编码树单元(CTU)。一个图片可以由一个或更多个切片/图块组成。一个图片可以由一个或更多个图块组组成。一个图块组可以包括一个或更多个图块。拼块可以表示图片中的图块内的CTU行的矩形区域。可以将图块分割成多个拼块,所述多个拼块中的每一者由图块内的一个或更多个CTU行组成。未被分割成多个拼块的图块也可以被称为拼块。拼块扫描是分割图片的CTU的特定顺序排序,其中CTU在拼块中的CTU光栅扫描中连续排序,图块内的拼块在图块的拼块的光栅扫描中连续排序,并且图片中的图块在图片的图块的光栅扫描中连续排序。图块为图片中的特定图块列以及特定图块行内的CTU的矩形区域。图块列是具有等于图片的高度的高度和由图片参数集中的语法元素指定的宽度的多个CTU的矩形区域。图块扫描是分割图片的CTU的特定顺序排序,其中CTU在图块中的CTU光栅扫描中连续排序,而图片中的图块在图片的图块的光栅扫描中连续排序。切片包括可以专有地包括在单个NAL单元中的图片的整数个拼块。切片可以由多个完整图块或一个图块的仅完整拼块的连续序列组成。在本文中,图块组和切片可以互换使用。例如,在本文中,图块组/图块组报头可以被称作切片/切片报头。
像素或画素(pel)可以意指构成一个图片(或图像)的最小单元。另外,“样本”可以被用作与像素对应的术语。样本通常可以表示像素或像素的值,可以仅表示亮度分量的像素/像素值,或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单元。单元可以包括图片的特定区域和与该区域相关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。在某些情况下,可以将单元与诸如块或区域这样的术语互换地使用。在通常情况下,M×N块可以包括M列N行的样本(或样本阵列)或变换系数的集合(或阵列)。另选地,样本可以表示空间域中的像素值,并且当这样的像素值被变换到频率域时,可以表示频率域中的变换系数。
在一些情况下,单元可以与诸如块或区域的术语互换地使用。通常,M×N块可以表示由M列和N行或一组变换系数组成的样本。样本通常可以表示像素或像素的值,并且还可以仅表示亮度分量的像素/像素值,并且还仅表示色度分量的像素/像素值。样本可以用作对应于配置一个图片(或图像)的像素或画素的项。
图2是例示了适用本文的实施方式的视频/图像编码设备的配置的示意图。下文中,视频编码设备可以包括图像编码设备。
参照图2,编码设备200可以包括并配置有图像分割器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、反量化器234和逆变换器235。残差处理器230还可以包括减法器231。加法器250可以称为重构器或重构块生成器。根据实施方式,上文描述的图像分割器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由至少一个硬件部件(例如,编码器芯片组或处理器)构成。另外,存储器270可以包括解码图片缓冲器(DPB)或者可以由数字存储介质构成。硬件部件还可以包括作为内部/外部部件的存储器270。
图像分割器210可以将输入到编码设备200的输入图像(或图片或帧)分割到一个或更多个处理单元中。例如,处理单元可以被称为编码单元(CU)。在这种情况下,可以根据四叉树二叉树三叉树(QTBTTT)结构从编码树单元(CTU)或最大编码单元(LCU)来递归地分割编码单元。例如,一个编码单元可以基于四叉树结构、二叉树结构和/或三叉树结构而被分割为深度更深的多个编码单元。在这种情况下,例如,可以首先应用四叉树结构,随后可以应用二叉树结构和/或三叉树结构。可替选地,也可以首先应用二叉树结构。可以基于不再分割的最终编码单元来执行根据本文的编码过程。在这种情况下,可以根据图像特性基于编码效率将最大编码单元用作最终编码单元,或者如果需要,可以将编码单元递归地分割为深度更深的编码单元并且具有最佳大小的编码单元可以用作最终编码单元。这里,编码过程可以包括预测、变换和重构的过程,这将在后面描述。作为另一示例,处理单元还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,可以从上述最终编码单元来分离或分割预测单元和变换单元。预测单元可以是样本预测的单元,并且变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
在编码设备200中,可以从输入图像信号(原始块、原始样本阵列)中减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列),以生成残差信号(残差块、残差样本阵列)并且所生成的残差信号被发送到变换器232。在这种情况下,如图所示,在编码设备200中用于从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以称为减法器231。预测器220可以对要处理的块(在下文中称为当前块)执行预测,并生成包括当前块的预测样本的预测块。预测器能够以当前块或CU为单位来确定是应用帧内预测还是应用帧间预测。如稍后在每个预测模式的描述中所述,预测器220可以生成与预测有关的、诸如预测模式信息之类的各种信息,并向熵编码器240发送所生成的信息。关于预测的信息可以在熵编码器240中编码并以比特流的形式输出。
帧内预测器222可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者也可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。非定向模式可以包括例如DC模式和平面模式。根据预测方向的详细程度,定向模式可以包括例如33个定向预测模式或65个定向预测模式。然而,这仅是示例,依据设置,可以使用更多或更少的定向预测模式。帧内预测器222也可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于由参照图片上的运动向量指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息的量,可以基于邻近块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参照图片中的时间邻近块。包括参考块的参照图片和包括时间邻近块的参照图片可以相同或不同。时间邻近块可以称为并置参考块、共位CU(colCU)等,并且包括时间邻近块的参照图片可以称为并置图片(colPic)。例如,帧间预测器221可以基于邻近块来配置运动信息候选列表,并且生成指示使用哪个候选来推导当前块的运动向量和/或参照图片索引的信息。可以基于各种预测模式来执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可以将邻近块的运动信息用作当前块的运动信息。在跳过模式下,与合并模式不同,可能无法发送残差信号。在运动向量预测(MVP)模式的情况下,可以通过将邻近块的运动向量用作运动向量预测子并且发信号通知运动向量差来指示当前块的运动向量。
预测器220可以基于以下描述的各种预测方法来生成预测信号。例如,预测器220不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测这二者。这可以称为帧间帧内组合预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或基于调色板模式来预测块。IBC预测模式或调色板模式可用于游戏等的内容的图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前图片中执行预测,但是可以类似于帧间预测来执行IBC,因为参考块是在当前图片中推导的。即,IBC可以使用本文中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知图片内的样本值。
由预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以用于生成重构信号或可以用于生成残差信号。
变换器232可以通过向残差信号应用变换技术来生成变换系数。例如,变换技术可以包括离散余弦变换(DCT)、离散正弦变换(DST)、基于图的变换(GBT)或条件非线性变换(CNT)中的至少一种。这里,GBT表示当像素之间的关系信息由图表示时从图获得的变换。CNT是指基于使用所有先前重构的像素生成的预测信号而生成的变换。另外,变换处理可以应用于具有相同大小的正方形像素块,或者可以应用于具有可变大小而非正方形的块。
量化器233可以对变换系数进行量化,并且将它们发送给熵编码器240,并且熵编码器240可以对量化信号(关于量化变换系数的信息)进行编码并且输出比特流。关于量化变换系数的信息可以称为残差信息。量化器233可以基于系数扫描顺序将块形式的量化变换系数重新布置为一维向量形式,并且基于一维向量形式的量化变换系数来生成关于量化变换系数的信息。
熵编码器240可以执行各种编码方法,诸如,例如指数哥伦布(Golomb)、上下文自适应可变长度编码(CAVLC)、上下文自适应二进制算术编码(CABAC)等。熵编码器240可以对除了量化变换系数以外的视频/图像重构所需的信息(例如,语法元素的值等)一起或分开地进行编码。能够以比特流的形式以NAL(网络抽象层)为单位发送或存储编码信息(例如,编码视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。另外,视频/图像信息还可包括一般约束信息。在本文中,从编码设备向解码设备发送/发信号通知的信息和/或语法元素可以包括在视频/图片信息中。视频/图像信息可以通过上述编码过程被编码并且被包括在比特流中。比特流可以通过网络发送,或者可以存储在数字存储介质中。网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD的各种存储介质。可以包括发送从熵编码器240输出的信号的发送单元(未示出)和/或存储该信号的存储单元(未示出)作为编码设备200的内部/外部元件,并且可替选地,发送器可以包括在熵编码器240中。
从量化器233输出的量化变换系数可以用于生成预测信号。例如,可以通过利用反量化器234和逆变换器235对量化变换系数应用反量化和逆变换,来重构残差信号(残差块或残差样本)。加法器250将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,以生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块没有残差(诸如应用了跳过模式的情况),则可以将预测块用作重构块。加法器250可以称为重构单元或重构块生成器。所生成的重构信号可以用于在当前图片中要处理的下一块的帧内预测,并且可以通过如下所述的滤波用于下一图片的帧间预测。
此外,在图片编码和/或重构处理期间,可以应用亮度映射与色度缩放(LMCS)。
滤波器260可以通过对重构信号应用滤波来改善主观/客观图像质量。例如,滤波器260可以通过对重构图片应用各种滤波方法来生成修改后的重构图片,并将修改后的重构图片存储在存储器270(具体地,存储器270的DPB)中。各种滤波方法可包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波有关的各种信息,并且将生成的信息发送给熵编码器240,如稍后在各种滤波方法的描述中所述。与滤波有关的信息可以由熵编码器240编码并且以比特流的形式输出。
发送给存储器270的修改后的重构图片可以用作帧间预测器221中的参照图片。当通过编码设备应用帧间预测时,可以避免编码设备200与解码设备之间的预测不匹配,并且可以提高编码效率。
存储器270的DPB可以存储用作帧间预测器221中的参照图片的修改后的重构图片。存储器270可以存储从中推导(或编码)当前图片中的运动信息的块的运动信息和/或图片中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器221,并且用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送给帧内预测器222。
此外,根据本公开的图像/视频编码可以包括基于多层的图像/视频编码。基于多层的图像/视频编码可以包括可缩放编码。基于多层的编码或可缩放编码可以处理各个层的输入信号。输入信号(输入图像/图片)可以依赖于层而在分辨率、帧速率、比特深度、色彩格式、纵横比和视图中的至少一者上不同。在该情况下,可以通过使用层之间的差(即,基于可缩放性)在层之间执行预测来减少信息的重复传输/处理并且提高压缩效率。
图3是用于示意性地说明适用本文的实施方式的视频/图像解码设备的配置的图。
参照图3,解码设备300可以包括并且配置有熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可以包括帧间预测器332和帧内预测器331。残差处理器320可以包括反量化器321和逆变换器322。根据实施方式,上面已经描述的熵解码器310、残差处理器320、预测器330、加法器340和滤波器350可以由硬件部件(例如,解码器芯片组或处理器)构成。另外,存储器360可以包括解码图片缓冲器(DPB),或者可以由数字存储介质构成。硬件部件还可以包括存储器360作为内部/外部部件。
当输入包括视频/图像信息的比特流时,解码设备300可以与在图2的编码设备中处理视频/图像信息的处理相对应地重构图像。例如,解码设备300可以基于从比特流获得的块分割相关信息来推导单元/块。解码设备300可以使用在编码设备中应用的处理单元来执行解码。因此,解码的处理单元可以是例如编码单元,并且可以根据四叉树结构、二叉树结构和/或三叉树结构,从编码树单元或最大编码单元对编码单元进行分割。可以从编码单元推导一个或更多个变换单元。可以通过再现设备来再现通过解码设备300解码并输出的重构图像信号。
解码设备300可以接收以比特流形式从图2的编码设备输出的信号,并且可以通过熵解码器310对接收到的信号进行解码。例如,熵解码器310可以解析比特流,以推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于诸如自适应参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)之类的各种参数集的信息。另外,视频/图像信息还可以包括一般约束信息。解码设备还可以基于关于参数集的信息和/或一般约束信息来对图片进行解码。本文中稍后描述的发信号通知的/接收的信息和/或语法元素可以通过解码过程被解码,并从比特流中获取。例如,熵解码器310基于诸如指数哥伦布编码、上下文自适应可变长度编码(CAVLC)或上下文自适应算术编码(CABAC)之类的编码方法对比特流中的信息进行解码,并输出图像重构所需的语法元素和残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的每个语法元素相对应的bin,使用解码目标语法元素信息、解码目标块的解码信息或在先前级中解码的符号/bin的信息来确定上下文模型,并通过根据所确定的上下文模型预测bin的出现概率来对该bin进行算术解码,并且生成与每个语法元素的值相对应的符号。在这种情况下,在确定上下文模型之后,CABAC熵解码方法可以通过将经解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。由熵解码器310解码的信息之中与预测有关的信息可以提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310中对其执行了熵解码的残差值(也就是说,量化变换系数和相关参数信息)可以被输入到残差处理器320。
残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,由熵解码器310解码的信息之中关于滤波的信息可以提供给滤波器350。此外,用于接收从编码设备输出的信号的接收单元(未示出)可以进一步被配置为解码设备300的内部/外部元件,或者接收单元可以是熵解码器310的部件。此外,根据本文的解码设备可以称为视频/图像/图片解码设备,并且解码设备可以分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括反量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331中的至少一个。
反量化器321可以对量化变换系数进行反量化并且输出变换系数。反量化器321能够以二维块的形式重新布置量化变换系数。在这种情况下,可以基于在编码设备中执行的系数扫描顺序来执行重新布置。反量化器321可以通过使用量化参数(例如,量化步长信息)对量化变换系数执行反量化,并且获得变换系数。
逆变换器322对变换系数进行逆变换以获得残差信号(残差块、残差样本阵列)。
在本文中,可以省略量化/反量化和/或变换/逆变换中的至少一者。当省略量化/反量化时,量化变换系数可以被称作变换系数。当省略变换/逆变换时,变换系数可以被称为系数或残差系数,或为了表达的一致性可以仍被称为变换系数。
在本文中,量化变换系数和变换系数可以分别被称为变换系数和缩放变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且可以通过残差编码语法用信号发送关于变换系数的信息。可以基于残差信息(或关于变换系数的信息)得出变换系数,并且可以通过变换系数的逆变换(缩放)得出缩放变换系数。可以基于缩放变换系数的逆变换(变换)得出残差样本。这也可以在本文的其它部分中应用/表达。
预测器330可以对当前块执行预测,并生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定向当前块应用帧内预测还是应用帧间预测,并且可以确定具体的帧内/帧间预测模式。
预测器330可以基于以下描述的各种预测方法来生成预测信号。例如,预测器不仅可以应用帧内预测或帧间预测来预测一个块,而且可以同时应用帧内预测和帧间预测。这可以称为帧间和帧内组合预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可以用于游戏等的内容图像/视频编码,例如,屏幕内容编码(SCC)。IBC基本上在当前图片中执行预测,但是可以类似于帧间预测来执行IBC,因为在当前图片中推导参考块。即,IBC可以使用本文中描述的帧间预测技术中的至少一种。调色板模式可以被视为帧内编码或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息来发信号通知图片内的样本值。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,参考的样本可以位于当前块的附近,或者可以远离当前块。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以通过使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参照图片上的由运动向量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式中发送的运动信息的量,可以基于邻近块和当前块之间的运动信息的相关性,以块、子块或样本为单位来预测运动信息。运动信息可以包括运动向量和参照图片索引。运动信息还可包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参照图片中的时间邻近块。例如,帧间预测器332可以基于邻近块来配置运动信息候选列表,并基于接收到的候选选择信息来推导当前块的运动向量和/或参照图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示针对当前块的帧间预测的模式的信息。
加法器340可以通过将所获得的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果要处理的块没有残差(例如当应用跳过模式时),则可以将预测块用作重构块。
加法器340可以称为重构器或重构块生成器。所生成的重构信号可以用于当前图片中要处理的下一块的帧内预测,还可以通过如下所述的滤波输出,或者可以用于下一图片的帧间预测。
此外,在图片解码处理中还可以应用亮度映射与色度缩放(LMCS)。
滤波器350可以通过向重构信号应用滤波来改善主观/客观图像质量。例如,滤波器350可以通过对重构图片应用各种滤波方法来生成修改后的重构图片,并将修改后的重构图片存储在存储器360(具体地,存储器360的DPB)中。各种滤波方法可包括例如去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储器360的DPB中存储的(修改后的)重构图片可以用作帧间预测器332中的参照图片。存储器360可以存储从中推导(或解码)当前图片中的运动信息的块的运动信息和/或图片中已重构的块的运动信息。所存储的运动信息可以发送给帧间预测器332,以作为空间邻近块的运动信息或时间邻近块的运动信息来利用。存储器360可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送给帧内预测器331。
在本文中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施方式可以与滤波器350、帧间预测器332和帧内预测器331相同或对应。
图4示出了可以应用本文的实施方式的示意性图片解码过程的示例。
在图像/视频编码中,可以根据解码顺序来编码/解码配置图像/视频的图片。可以以与解码顺序不同地配置对应于解码图片的输出顺序的图片顺序。并且,当基于所配置的图片顺序执行帧间预测时,可以执行正向预测以及反向预测。
在图4中,S400可以由以上在图3中描述的解码设备的熵解码器310执行,S410可以由预测器330执行,S420可以由残差处理器320执行,S430可以由加法器340执行,并且S440可以由滤波器350执行。S400可以包括本文中描述的信息解码过程,S410可以包括本文中描述的帧间/帧内预测过程,S420可以包括本文中描述的残差处理过程,S430可以包括本文中描述的块/图片重构过程,并且S440可以包括本文中描述的环路滤波过程。
参照图4,如对图3的描述中指示的图像解码过程可以示意性包括(通过解码)来自比特流的图像/视频信息获得过程(S400)、图片重构过程(S410至S430)以及针对重构图片的环路滤波过程(S440)。可以基于通过本文中说明的帧间/帧内预测(S410)和残差处理(对量化变换系数的反量化和逆变换)(S420)获得的预测样本和残差样本来执行图片重构过程。对于通过图片重构过程生成的重构图片,可以通过环路滤波过程生成修改后的重构图片,并且修改后的重构图片可以被作为解码图片输出,并且还可以被存储在解码设备的解码图片缓冲器或存储器360中,以在图片解码之后用作帧间预测过程中的参考图片。在某些情况下,可以跳过环路滤波过程,并且在这种情况下,重构图片可以被作为解码图片输出,并且还可以被存储在解码设备的解码图片缓冲器或存储器360中,以在图片解码之后用作帧间预测过程中的参考图片。如上所述,环路滤波过程(S440)可以包括去块滤波过程、采样自适应偏移(SAO)过程、自适应环路滤波器(ALF)过程和/或双边滤波过程,并且可以跳过过程中的一些或全部。另外,可以依次应用去块滤波过程、采样自适应偏移(SAO)过程、自适应环路滤波器(ALF)过程和/或双边滤波器过程中的一个或一些,或者可以依次应用过程的全部。例如,可以在对重构图片应用去块滤波过程之后执行SAO过程。另外,例如,可以在对重构图片应用去块滤波过程之后执行ALF过程。这可以甚至在编码设备中以相同方式执行。
图5例示了适用本文的实施方式的示意性图片编码过程的示例。
在图5中,S500可以由如以上在图2中描述的编码设备的预测器220执行,S510可以由残差处理器230执行,并且S520可以由熵编码器240执行。S500可以包括本文中说明的帧间/帧内预测过程,S510可以包括本文中说明的残差处理过程,并且S520可以包括本文中说明的信息编码过程。
参照图5,如上文在图2中所描述,图片编码过程通常可以包括对用于图片重构的信息(例如,预测信息、残差信息、分割信息等)进行编码并且以比特流形式输出编码后的信息的过程,以及生成用于当前图片的重构图片的过程和将环路滤波应用于重构图片的过程(任选的)。编码设备可以通过反量化器234和逆变换器235从量化变换系数得出残差样本(其被修改),并且接着,编码设备可以基于作为S700的输出的预测样本以及(修改的)残差样本生成重构图片。如上文所描述而生成的重构图片可以与在解码设备中生成的上述重构图片相同。可以通过对重构图片执行环路滤波过程来生成修改的重构的图片,修改后的重构图片随后被存储在解码设备的解码图片缓冲器或存储器270中。并且,如在解码设备中,修改后的重构图片可以在对图片进行编码时在帧间预测过程期间用作参考图片。如上文所描述,在一些情况下,可以跳过环路滤波过程的部分或全部。当执行环路滤波过程时,(环路)滤波相关信息(参数)可以在熵编码器240中被编码,然后以比特流形式发送,并且解码设备可以基于滤波相关信息通过使用与编码设备相同的方法来执行环路滤波过程。
通过执行上述环路滤波过程,可以减少在对图像/移动图片图像进行编码时发生的噪声(诸如阻挡伪影以及振铃伪影),并且可以增强主观/客观视觉质量。另外,通过使编码设备和解码设备两者执行环路滤波过程,编码设备和解码设备可以得出相同预测结果,增加图片编码中的可以靠性,并且减小应发送以用于图片编码的数据的大小(或量)。
如上文所描述,可以在解码设备以及编码设备中执行图片重构过程。可以基于帧内预测/帧间预测针对各个块单元生成重构块,并且可以生成包括重构块的重构图片。在当前图片/切片/图块组为I图片/切片/图块组时,可以仅基于帧内预测重构当前图片/切片/图块组中包括的块。此外,在当前图片/切片/图块组为P或B图片/切片/图块组时,可以基于帧内预测或帧间预测重构当前图片/切片/图块组中包括的块。在这种情况下,帧间预测可以应用于当前图片/切片/图块组内的块的部分,并且帧内预测可以应用于剩余块。图片的颜色分量可以包括亮度分量以及色度分量。并且,除非在本说明书中明确地限制(或约束),否则本说明书中提出的方法和实施方式可以应用于亮度分量和色度分量。
此外,如上所述,一个图片可包括多个切,并且一个切片可包括切片头和切片数据。在这种情况下,可以进一步将一个图片头添加到多个切片(切片头和切片数据的集合)。图片头(图片头语法)可以包括可以共同应用于图片的信息/参数。切片头(切片头语法)可以包括可以共同应用于切片的信息/参数。APS(APS语法)或PPS(PPS语法)可以包括可以共同应用于一个或更多个图片的信息/参数。SPS(SPS语法)可以包括可以共同应用于一个或更多个序列的信息/参数。VPS(VPS语法)可以包括可以共同应用于多个层的信息/参数。DCI(DCI语法)可以包括与解码能力相关的信息/参数。
在本文中,高级语法(HLS)可以包括APS语法、PPS语法、SPS语法、VPS语法、DCI语法、图片报头语法和切片报头语法中的至少一者。此外,在本说明书中,低层级语法(LLS)可以例如包括切片数据语法、CTU语法、变换单元语法等。
在本文中,从编码设备编码到解码设备并且接着以比特流形式发信号通知的图像/视频信息可以不仅包括与图片内分割相关的信息、帧内/帧间预测信息、残差信息、环路滤波信息等,而且可以包括切片报头的信息、图片报头的信息、APS的信息、PPS的信息、SPS的信息、VPS的信息和/或DCI的信息。另外,图像/视频信息可以进一步包括一般约束信息和/或NAL单元报头的信息。
此外,如上所述,本说明书的视频/图像信息可以包括高层信令,并且可以基于视频/图像信息执行视频/图像编码方法。
编码后的图片可以包括一个或更多个切片。可以在图片报头中发信号通知描述编码后的图片的参数,并且可以在切片报头中发信号通知描述所述切片的参数。图片报头(PH)承载于其自身NAL单元类型中。切片报头存在于包括切片载荷(切片数据)的NAL单元的开始部分中。
另外,图片可以被划分为子图片、图块和/或切片。针对子图片的信令存在于SPS中,针对图块和矩形切片的信令存在于PPS中,并且最后,针对光栅扫描切片的信令存在于切片头中。
此外,配置文件、层和级别信息的信令可以存在于VPS和/或SPS中,如下表1和表2中一样。
[表1]
Figure BDA0004113712240000171
在表1中,vps_video_parameter_set_id提供VPS的标识符,以在另一语法元素中被引用。vps_video_parameter_set_id的值应该大于0。
vps_max_layers_minus1+1表示引用VPS的每个编码视频序列(VCS)中的最大允许层数。
vps_max_sublayers_minus1加1表示引用VPS的每个CVS的层中可以存在的时间子层的最大数目。vps_max_sublayers_minus1的值应该在0至6的范围内。
vps_num_ptls_minus1+1表示VPS中的profile_tier_level()语法结构的数目。vps_num_ptls_minus1的值应该小于表示所有输出层集合(OLS)的数目的TotalNumOlss。
如果vps_pt_present_flag[i]的值为1,则这表示配置文件、层和一般约束信息存在于VPS中的第i个profile_tier_level()语法结构中。如果vps_pt_present_flag[i]的值为0,则这表示配置文件、层和一般约束信息不存在于VPS中的第i个profile_tier_level()语法结构中。
vps_pt_present_flag[0]的值被推断为1。如果vps_pt_present_flag[i]的值为0,则推断VPS中的第i个profile_tier_level()语法结构的配置文件、层和一般约束信息与VPS中的第(i-1)个profile_tier_level()语法结构的配置文件、层和一般约束信息相同。
vps_ptl_max_temporal_id[i]表示最上子层表述的TemporalId,由此级别信息存在于VPS中的第i个profile_tier_level()语法结构中。vps_ptl_max_temporal_id[i]的值应该存在于0至vps_max_sublayers_minus1的范围内。如果不存在,则推断vps_ptl_max_temporal_id[i]的值与vps_max_sublayers_minus1的值相同。
vps_ptl_alignment_zero_bit的值等于0。
vps_ols_ptl_idx[i]表示profile_tier_level()语法结构列表中应用于VPS中的第i个OLS的profile_tier_level()语法结构的索引。如果存在,则vps_ols_ptl_idx[i]的值应该存在于0至vps_num_ptls_minus1的范围内。
如果不存在,则vps_ols_ptl_idx[i]的值被如下地推断。
-如果vps_num_ptls_minus1的值为0,则vps_ols_ptl_idx[i]的值被推断为0。
-否则(如果vps_num_ptls_minus1的值大于0,并且vps_num_ptls_minus1+1等于TotalNumOlss),则vps_ols_ptl_idx[i]的值被推断为等于i。
如果NumLayersInOls[i]的值为1,则即使在被第i个OLS中的层引用的SPS中,也存在应用于第i个OLS的profile_tier_level()语法结构。如果NumLayersInOls[i]的值为1,则比特流兼容性的要求应该是VPS中发信号通知的profile_tier_level()语法结构与用于第i个OLS的SPS相同的情况。
VPS中的每个profile_tier_level()语法结构应该通过针对i的至少一个值在0至TotalNumOlss-1的范围内引用。
[表2]
Figure BDA0004113712240000181
参照表2,sps_seq_parameter_set_id提供SPS的标识符,以供其它语法元素引用。
SPS NAL单元共享与sps_seq_parameter_set_id的值空间相同的值空间,而不管nuh_layer_id的值如何。
spsLayerId被称为特定SPS NAL单元的nuh_layer_id值,并且vclLayerId被称为特定VCL NAL单元的nuh_layer_id值。除非spsLayerId小于或等于vclLayerId,否则特定VCL NAL单元不引用该特定SPS NAL单元,并且nuh_layer_id甚至包括其中由包括与vclLayerId的层相同的层的VPS指定的所有OLS具有与spslayerId的nuh_layer_id相同的nuh_layer_id的层。
如果sps_video_parameter_set_id的值大于0,则这表示VPS的vps_video_parameter_set_id值由SPS引用。
如果sps_video_parameter_set_id的值为0,则应用以下。
-SPS不引用VPS,并且当对引用SPS的每个编码层视频序列(CLVS)进行解码时,不引用VPS。
-vps_max_layers_minus1的值被推断为0。
-vps_max_sublayers_minus1的值被推断为6。
-CVS应该仅包括一个层(即,CVS中的所有VCL NAL单元具有相同的nuh_layer_id值)。
-GeneralLayerIdx[nuh_layer_id]的值被推断为0。
-vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]的值被推断为1。
如果vps_independent_layer_flag[GeneralLayerIdx[nuh_layer_id]的值为1,则具有特定nuh_layer_id值的nuhLayerId的CLVS引用的SPS应该具有与nuhLayerId的nuh_layer_id相同的nuh_layer_id。
在CVS中的CLVS引用的所有SPS中,sps_video_parameter_set_id的值应该相同。
sps_max_sublayers_minus1加1表示引用SPS的每个CLVS中可以存在的时间子层的最大数目。sps_max_sublayers_minus1的值应该在0至vps_max_sublayers_minus1的范围内。
sps_reserved_zero_4bits等于0。
如果sps_ptl_dpb_hrd_params_present_flag的值为1,则这可以表示profile_tier_level()语法结构和dpb_parameters()语法结构存在于SPS中,并且general_hrd_parameters()语法结构和ols_hrd_parameters()语法结构存在于SPS中。如果sps_ptl_dpb_hrd_params_present_flag的值为0,则这表示如上所述的四个语法结构不存在于SPS中。
如果sps_video_parameter_set_id的值大于0并且存在其中nuh_layer_id仅包括与SPS的nuh_layer_id的层相同的一个层的OLS或者sps_video_parameter_set_id的值为0,则sps_ptl_dpb_hrd_params_present_flag的值与1相同。
此外,PTL(配置文件、层、级别)信息的语法结构可以如下。
[表3]
Figure BDA0004113712240000201
参照表3,profile_tier_level()语法结构提供了级别信息,并选择性提供了配置文件、层、子配置文件和一般约束信息。
如果profile_tier_level()语法结构被包括在VPS中,则OlsInScope是由VPS指定的一个或更多个OLS。如果profile_tier_level()语法结构被包括在SPS中,则OlsInScope是仅包括引用SPS的层当中的最下层的OLS,并且最下层是独立层。
general_profile_idc表示OlsInScope符合的配置文件。
general_tier_flag表示用于解释general_level_idc的层上下文。
general_level_idc表示OlsInScope符合的级别。
随着general_level_idc的值变大,表示更高的级别。在用于OlsInScope的DCINAL单元中发信号通知的最大级别可以高于在用于OlsInScope中所包括的CLVS的SPS中发信号通知的级别,但不能低于其。
在OlsInScope符合若干配置文件的情况下,general_profile_idc表示由编码设备确定的提供优选比特流标识或优选解码结果的配置文件。
在OlsInScope的CVS符合不同配置文件的情况下,若干profile_tier_level()语法结构可以被包括在DCI NAL单元中,使得存在能够对OlsInScope的每个CVS进行解码的解码设备的配置文件、层和级别的至少一个集合。
num_sub_profiles表示general_sub_profile_idc[i]语法元素的数目。
general_sub_profile_idc[i]表示第i个互操作性元数据。
如果sublayer_level_present_flag[i]的值为1,则这表示级别信息存在于用于表示其中TemporalId为i的子层的profile_tier_level()语法元素中。如果sublayer_level_present_flag[i]的值为0,这表示级别信息不存在于用于表示其中TemporalId为i的子层的profile_tier_level()语法结构中。
ptl_alignment_zero_bits的值与0相同。
sublayer_level_idc[i]的语法元素的语义与general_level_idc语法元素的语义相同,但应用于其中TemporalId为i的子层的表示。
在不存在的情况下,sublayer_level_idc[i]的值被如下地推断。
-sublayer_level_idc[maxNumSubLayersMinus1]被推断为与具有相同profile_tier_level()结构的general_level_idc相同。
-在maxNumSubLayersMinus1-1中,对于包括0的范围内的i(i值的降序),sublayer_level_idc[i]被推断为与sublayer_level_idc[i+1]相同。
作为参考,子层可以表示由具有特定值的TemporalId变量的VCL NAL单元和相关的非VCL NAL单元构成的时间可分级比特流的时间可分级层。子层表示可以是由特定子层和较低子层的NAL单元构成的比特流的子集。
general_constraint_info()可以包括以下的语法元素。
[表4]
Figure BDA0004113712240000221
Figure BDA0004113712240000231
参照表3,级别指示符(即,general_level_idc)的信令存在于一般约束信息(general_constraint_info)的信令之后。相应地,如果一般约束信息存在于PTL信息中,则解码设备应该首先解析一般约束信息,因此级别指示符的解析变得复杂。另外,由于一般约束信息在解码设备中可能不是必需的,因此解码设备可能期望跳过一般约束信息的解析。然而,根据表3,如果一般约束信息存在于PTL信息中,则其解析不能被跳过。
另外,当profileTierPresentFlag的值为1时,一般约束信息的信令总是存在于PTL信息中。然而,当存在配置文件、层和级别信息时,一般约束信息并不总是必须存在于PTL信息中。相应地,需要即使在存在PTL信息的情况下也不发信号通知一般约束信息的机制。
另外,一般约束信息的信令存在于配置文件、层和级别信息的信号的中间。这给将配置文件、层和级别信息与一般约束信息的处理分开地处理的解码信息带来了负担。
预备下图来说明本文的特定示例。已示例性提出图中描述的特定装置的名称或特定信号/信息的标号,因此本说明书的技术特征不限于下图中使用的特定名称。
为了解决上述问题,本文提供了以下方法。相应的方法可以被独立或组合地应用。
1.在配置文件、层和级别结构(PTL结构)中,级别指示符可以在其存在被条件化的语法元素之前被发信号通知。例如,在PTL信息中,可以在general_profile_idc之前发信号通知general_level_idc。
2.可以添加表示是否针对一般约束信息(GCI)发信号通知标志的标志。该标志可以被称为gci_present_flag。一般约束信息的标志包括在表4中指定的语法元素以及尚未保留的语法元素。
3.包括gci_present_flag的一般约束信息的比特的总数以字节为单位来指定(即,比特的数目是8的倍数)。
4.为一般约束标志保留的比特从字节对准位置处开始。结果,在存在保留比特之前,可以存在一些用于字节对准的比特。
5.除了新标志gci_present_flag之外,表示GCI结构中的保留字节的数目的语法元素可以被改变以表示一般约束标志的数目(包括保留比特和标志),并在GCI结构中,可以在gci_present_flag正下方首先被发信号通知。该语法元素可以被称为gci_num_constraint_bytes。如果gci_present_flag的值为0,则gci_num_constraint_bytes的值为0。gci_present_flag和gci_num_constraint_bytes的信令的比特数可以被字节对准。例如,用于gci_num_constraint_bytes的信令的比特数可以变为7。
6.作为条目4的替代,对于一般约束标志,保留比特不必在字节对准位置处开始。结果,这消除了在保留比特存在之前具有字节对准的比特的需要。
7.作为条目1的替代,配置文件、层和级别信息可以按它们不被其它语法元素分开的方法被发信号通知。这可以通过将一般约束信息的信令移动到级别信息的信令之后的位置来实现。
8.作为条目5的替代,gci_num_constraint_bytes的信令可以替换gci_present_flag而不是被添加到gci_present_flag。
9.一般约束信息的语法结构(general_constraint_info())在包括子层的配置文件、层和级别信息的配置文件、层和级别信息的信令之后存在于配置文件层级别结构(profile_tier_level语法)中。
10.在一般约束信息的语法结构存在于配置文件层级别结构的末尾的情况下,一般约束信息的大小可以被或者可以不被字节对准。
作为实施方式,编码设备可以发信号通知具有下表5的结构的profile_tier_level语法,并且其语义可以如下表6中一样。
[表5]
Figure BDA0004113712240000251
[表6]
Figure BDA0004113712240000252
参照表5和表6,general_level_idc表示OlsInScope符合的级别。随着general_level_idc的值变大,更高的级别被表示。在用于OlsInScope的DCI NAL单元中发信号通知的最大级别可以高于在用于OlsInScope中所包括的CLVS的SPS中发信号通知的级别,但不能低于其。在OlsInScope符合若干配置文件的情况下,general_profile_idc表示由编码设备确定的提供优选解码结果或优选比特流标识的配置文件。在OlsInScope的CVS符合不同配置文件的情况下,若干profile_tier_level语法结构可以被包括在DCI NAL单元中,使得对于OlsInScope的各个CVS,能够对CVS进行解码的解码设备的配置文件、层和级别的至少一个集合存在。
general_profile_idc表示OlsInScope符合的配置文件。
general_tier_flag表示用于解释general_level_idc的层上下文。
在表3的profile_tier_level语法结构中,一般约束信息(general_constraint_info)可以存在于配置文件信息(general_profile_idc)、层信息(general_tier_flag)和级别信息(general_level_idc)之后。相应地,解码设备可以在处理配置文件、层和级别信息之后单独地处理一般约束信息。
此外,作为示例,编码设备可以发信号通知具有如下表7中的结构的general_constraint_info语法。
[表7]
Figure BDA0004113712240000261
在表7中,gci_present_flag表示关于约束的信息(general_non_packed_constraint_flag等)是否存在于general_constraint_info语法(一般约束信息)中。
gci_num_reserved_bytes表示为一般约束信息保留的字节数。
gci_alignment_zero_bit是用于字节对准的信息,并且具有值0。
gci_reserved_byte[i]表示为一般约束信息保留的字节。gci_reserved_byte[i]没有对解码处理施加影响,并可以具有某个值。
例如,gci_present_flag的语义可以如下表8中一样。
[表8]
Figure BDA0004113712240000271
参照表8,如果gci_present_flag的值为1,则这表示在profileTierPresentFlag的值为1的情况下,一般约束信息(标志)存在于profile_tier_level语法中。如果gci_present_flag的值为0,则这表示一般约束信息不存在于profile_tier_level语法中。
如果对于profileTierPresentFlag的值为1的profile_tier_level语法而言gci_present_flag的值为0,则推断max_bitdepth_constraint_idc的值为8,并且max_chroma_format_constraint_idc的值为3。另外,推断在general_constraint_info语法中(从general_non_packed_constraint_flag到no_aps_constraint_flag)的其它语法元素的值为0。
相应地,如果一般约束信息不是图像信息的编码所必需的,则编码设备可以将gci_present_flag的值编码为0,并且在gci_present_flag的值为0的情况下,解码设备可以跳过一般约束信息的解析。
作为另一示例,编码设备可以发信号通知具有下表9的结构的general_constraint_info语法。
[表9]
Figure BDA0004113712240000281
在表9中,gci_present_flag的语义可以如表8中一样,并且gci_num_constraint_bytes的语义可以如下表10中一样。
[表10]
Figure BDA0004113712240000282
参照表10,gci_num_constraint_bytes不包括被用于发信号通知gci_present_flag和gci_num_constraint_bytes的字节,并表示包括以字节为单位的保留比特的一般约束标志的长度。gci_num_constraint_bytes的值为0或9。如果gci_present_flag的值为0,则gci_num_constraint_bytes的值为0。如果gci_present_flag的值不为0,则gci_num_constraint_bytes的值不应该小于9。在一般约束标志的数目(关于一般约束的信息)在发信号通知一般约束信息时被改变的情况下,gci_num_constraint_bytes的值可以变为9。
作为另一示例,编码设备可以发信号通知具有如下表11中的结构的general_constraint_info语法。
[表11]
Figure BDA0004113712240000291
在表11中,numSpecifiedFlags的值表示指定的(未保留的)一般约束标志的数目。该值为66(即,从general_non_packed_constraint_flag到no_aps_constraint_flag的标志的数目)。
gci_present_flag和gci_num_constraint_bytes的语义可以如表8和表10中一样,并且gci_reserved_bit[i]的语义可以如下表12中一样。
[表12]
Figure BDA0004113712240000292
参照表12,gci_reserved_bit[i]的值是不对解码处理施加影响的值,并可以具有某个值。
此外,作为另一实施方式,编码设备可以发信号通知具有如下表13中的结构的profile_tier_level语法。
[表13]
Figure BDA0004113712240000293
参照表13,在profile_tier_level语法中级别信息(general_level_idc)可以在配置文件信息(general_profile_idc)和层信息(general_tier_flag)之后发信号通知,并且一般约束信息(general_constraint_info)可以在级别信息之后发信号通知。
在这种情况下,编码设备可以发信号通知具有如下表14或表15中的结构的general_constraint_info语法。
[表14]
Figure BDA0004113712240000301
[表15]
Figure BDA0004113712240000302
在表15中,gci_num_constraint_bytes表示关于约束的信息(一般约束标志)的保留字节的数目,不包括被用于发信号通知gci_num_constraint_bytes的字节,并以字节为单位表示包括保留比特的一般约束标志的长度。gci_num_constraint_bytes的值为0或9。
可以基于gci_num_constraint_bytes的值在general_constraint_info语法中解析gci_reserved_bit[i]。
作为又一实施方式,编码设备可以发信号通知具有如下表16中的结构的profile_tier_level语法。
[表16]
Figure BDA0004113712240000311
参照表16,一般约束信息可以被包括在profile_tier_level语法的末尾。
在这种情况下,编码设备可以发信号通知具有如下表17至表19中的结构的general_constraint_info语法。
[表17]
Figure BDA0004113712240000312
[表18]
Figure BDA0004113712240000321
[表19]
Figure BDA0004113712240000322
在表17中,gci_num_constraint_bits表示为关于一般约束的信息(一般约束标志)保留的比特的数目。可以基于gci_num_constraint_bits的值在general_constraint_info语法中解析gci_reserved_bit[i]。
参照表17至表19,对准信息(gci_alignment_zero_bit)可以存在于general_constraint_info语法的末尾。换句话说,在general_constraint_info语法中,对准信息可以被包括在为一般约束信息保留的比特的数目信息(gci_num_constraint_bits或gci_num_constraint_bytes)和保留比特(gci_reserved_bit[i]或gci_reserved_byte[i])之后。
作为又一实施方式,编码设备可以发信号通知具有如下表20中的结构的profile_tier_level语法。
[表20]
Figure BDA0004113712240000331
参照表20,一般约束信息可以存在于profile_tier_level语法的末尾。换句话说,在profile_tier_level语法中,一般约束信息可以在配置文件信息(general_profile_idc)、层信息(general_tier_flag)和级别信息(general_level_idc)之后发信号通知。
在这种情况下,编码设备可以发信号通知具有如下表21至表24中的结构的general_constraint_info语法。
[表21]
Figure BDA0004113712240000332
[表22]
Figure BDA0004113712240000341
[表23]
Figure BDA0004113712240000342
[表24]
Figure BDA0004113712240000343
在表21和表22中,gci_num_constraint_bits表示为关于约束的信息(一般约束标志)保留的比特的数目。可以基于gci_num_constraint_bits的值在general_constraint_info语法中解析gci_reserved_bit[i]。
参照表21至表24,为一般约束信息保留的比特或字节可以被包括在general_constraint_info语法的末尾。
图6和图7示意性地示出了根据本文的实施方式的视频/图像编码方法和相关部件的示例。
图6中公开的视频/图像编码方法可由图2和图7中公开的(视频/图像)编码设备200执行。作为示例,图6的S600至S620可由编码设备200的熵编码器240执行。图6中公开的视频/图像编码方法可以包括上述实施方式。
具体地,参照图6和图7,编码设备的预测器220可对当前图片中的当前块执行帧间预测或帧内预测中的至少一个,并基于此,可生成当前块的预测样本(预测块)和预测信息。
在执行帧内预测的情况下,预测器220可以通过参考当前图片内的样本(当前块的邻近样本)来预测当前块。预测器220可以通过使用应用于邻近样本的预测模式来确定将应用于当前块的预测模式。
在执行帧间预测的情况下,预测器220可以通过基于当前块的运动信息执行帧间预测来生成预测信息和针对当前块预测的块。上文所描述的预测信息可以包括与预测模式相关的信息、与运动信息相关的信息等。与运动信息相关的信息可以包括候选选择信息(例如,合并索引、mvp_flag或mvp_index),其为用于得出运动向量的信息。另外,与运动信息相关的信息可以包括关于运动向量差(MVD)的上述信息和/或参考图片索引信息。另外,与运动信息相关的信息可以包括指示是应用L0预测、L1预测还是双预测的信息。例如,预测器220可以基于运动估计得出当前图片内的当前块的运动信息。为此,通过使用对应于当前块的原始图片内的原始块,预测器220可以在参考图片内的确定的搜索范围内以分数像素为单位搜索具有高相关性的类似参考块。并且接着,预测器220可以通过所搜索的参考块得出运动信息。可以根据基于相位的样本值之间的差得出块的相似性。例如,可以基于当前块(或当前块模板)与参考块(或参考块模板)之间的绝对差总和(SAD)计算块的相似性。在这种情况下,可以基于在搜索区域内具有最小SAD的参考块得出运动信息。可以通过使用基于帧间预测模式的各种方法将得出的运动信息发信号通知给解码设备。
编码设备的残差处理器230可以基于从预测器220生成的预测样本和原始图片(原始块、原始样本)生成残差样本和残差信息。在本文中,残差信息是与残差样本相关的信息,并且残差信息可以包括与残差样本的(量化)变换系数相关的信息。
编码设备的加法器(或重构器)可以通过将在残差处理器230中生成的残差样本和在预测器220中生成的预测样本相加来生成重构样本(重构图片、重构块、重构样本阵列)。
编码设备的熵编码器240可以对包括由预测器220生成的预测信息、由残差处理器230生成的残差信息和关于HLS的信息的图像信息进行编码。
关于HLS的信息可以包括被用于图像/视频信息的解码的参数集的信息/语法。作为示例,参数集可以包括APS、PPS、SPS、VPS等。SPS和/或VPS可以包括如以上在表1和表2中描述的PTL信息(profile_tier_level语法)。
PTL信息可以包括表示输出层集合符合的配置文件的配置文件信息(general_profile_idc)、表示输出层集合符合的级别的级别信息(general_level_idc)、用于解释级别信息的层上下文信息以及用于输出层集合符合的约束的一般约束信息。一般约束信息可以被简称为约束信息。
如果PTL信息被包括在VPS中,则输出层集合包括由VPS指定的一个或更多个输出层集合。在PTL信息被包括在SPS中的情况下,输出层集合是仅包括引用SPS的层当中的最下层的输出层集合。
编码设备可以在生成PTL信息时生成表示输出层集合符合的级别的级别信息(S600),并且可以生成表示输出层集合符合的配置文件的配置文件信息、用于解释级别信息的层上下文信息以及一般约束信息(S610)。这里,在PTL信息(profile_tier_level语法)中,一般约束信息可以存在于级别信息之后。即,在PTL信息中,级别信息可以在一般约束信息之前首先存在。
一般约束信息可以包括表示关于约束的信息(一般约束标志)是否存在于一般约束信息中的标志(gci_present_flag)。如果gci_present_flag的值为1,则关于约束的信息可以被包括在一般约束信息中。如果gci_present_flag的值为0,则关于约束的信息可以不存在于一般约束信息中。
此外,一般约束信息可包括具有值0的对准信息(gci_alignment_zero_bit)。在一般约束信息中,对准信息可以存在于表示为约束保留的比特的数目的数目信息和/或保留比特之后。例如,对准信息可以存在于一般约束信息的最后位置。
编码设备的熵编码器240可对包括级别信息、配置文件信息、层信息和/或一般约束信息的图像信息进行编码(S620)。编码后的图像信息可以以比特流的形式发送或存储在NAL单元中。
根据本文,由于即使在发信号通知PTL信息的情况下编码设备也可以通过将gci_present_flag的值配置为0而不发信号通知一般约束信息,因此在一般约束信息在解码过程中不必要的情况下,编码设备可以不发信号通知一般约束信息。另外,由于在PTL信息中一般约束信息存在于配置文件信息、层信息和级别信息之后,因此解码设备可以将一般约束信息与配置文件、层和级别信息分开处理。
图8和图9示意性地示出了根据本文的实施方式的视频/图像解码方法和相关部件的示例。
图6中公开的视频/图像解码方法可以由图3和图9中公开的(视频/图像)解码设备300执行。具体地,例如,图8的S800和S810可以由解码设备的熵解码器310执行。S820可以由解码设备的残差处理器320、预测器330和加法器340来执行。图8中公开的视频/图像解码方法可以包括上述实施方式。
参照图8和图9,解码设备的熵解码器310可以从比特流获得图像信息。图像信息可以包括预测相关信息、残差信息、关于HLS的信息和环路滤波相关信息。预测相关信息可以包括帧间/帧内预测分类信息、帧内预测模式相关信息和帧间预测模式相关信息。关于HLS的信息可以包括被用于图像/视频信息的解码的参数集的信息/语法。这里,参数集可以包括APS、PPS、SPS、VPS等。SPS和/或VPS可以包括如以上在表1和表2中描述的PTL信息(profile_tier_level语法)。PTL信息可以包括表示输出层集合符合的配置文件的配置文件信息(general_profile_idc)、表示输出层集合符合的级别的级别信息(general_level_idc)、用于解释级别信息的层上下文信息(general_tier_flag)以及用于输出层集合符合的约束的一般约束信息(general_constraint_info)。
解码设备的熵解码器310可以从比特流中的PTL信息中解析表示输出层集合符合的级别的级别信息、表示输出层集合符合的配置文件的配置文件信息和/或用于解释级别信息的层上下文信息(S800)。此外,解码设备的熵解码器310可以从比特流中的PTL信息中获得用于输出层集合符合的约束的一般约束信息(S810)。这里,在PTL信息中,一般约束信息可以存在于级别信息之后。即,解码设备的熵解码器310可以在解析PTL信息中的级别信息之后获得一般约束信息。
解码设备的熵解码器310可以从一般约束信息中解析表示用于约束的信息(一般约束标志)是否存在于general_constraint_info语法中的标志(gci_present_flag)。如果gci_present_flag的值是1,则关于约束的信息可以被包括在一般约束信息中。如果gci_present_flag的值为0,则关于约束的信息可以不存在于一般约束信息中。
此外,一般约束信息可以包括表示为关于约束的信息保留的比特的数目的数目信息、保留比特和具有值0的对准信息(gci_alignment_zero_bit)。对准信息可以存在于数目信息和/或保留比特之后。换句话说,解码设备的熵解码器310可以在从一般约束信息中解析数目信息和保留比特之后解析对准信息。例如,可以最后从一般约束信息中解析对准信息。
解码设备可以基于包括级别信息和一般约束信息的HLS信息、预测相关信息和残差信息对当前图片执行解码过程(S820)。
例如,解码设备的预测器330可以通过基于从比特流获得的HLS信息使用预测相关信息对当前图片中的当前块执行帧间预测和/或帧内预测来生成当前图片中的当前块的预测样本。另外,解码设备的残差处理器320可以基于从比特流获得的残差信息来生成残差样本。解码设备的加法器340可以基于由预测器330生成的预测样本和由残差处理器320生成的残差样本来生成重构样本,并可以基于重构样本来生成重构图片(重构块)。
此后,根据需要,可以将环路滤波过程(诸如去块滤波、SAO和/或ALF过程)应用于重构图片,以增强主观/客观图片质量。
尽管已经基于以上述实施方式中的序列列出步骤或块的流程图描述了方法,但是本文的步骤不限于特定顺序,并且可以以相对于上面描述的不同的步骤或以不同的顺序或同时执行特定步骤。此外,本领域普通技术人员将理解,流程图的步骤不是排他性的,并且可以在其中包括另一步骤,或者可以删除流程图中的一个或更多个步骤,而不对本文的范围施加影响。
根据本文的前述方法可以是软件的形式,并且根据本文的编码设备和/或解码设备可以包括在用于执行图像处理的装置中,例如TV、计算机、智能电话、机顶盒、显示装置等。
当本文的实施方式通过软件实现时,上述方法可以由执行上述功能的模块(过程或功能)来实现。模块可以存储在存储器中并且由处理器执行。存储器可以安装在处理器内部或外部,并且可以经由各种公知的方式连接到处理器。处理器可以包括专用集成电路(ASIC)、其它芯片组、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪存、存储卡、存储介质和/或其它存储装置。换言之,根据本文的实施方式可以在处理器、微处理器、控制器或芯片上实现和执行。例如,相应图中所示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,关于实现方式的信息(例如,关于指令的信息)或算法可以存储在数字存储介质中。
另外,应用本文的实施方式的解码设备和编码设备可以包括在多媒体广播收发器、移动通信终端、家庭电影视频装置、数字电影视频装置、监视摄像机、视频聊天装置和实时通信装置中,诸如视频通信、移动流装置、存储介质、摄像机、视频点播(VoD)服务提供商、过顶(OTT)视频装置、互联网流服务提供商、3D视频装置、虚拟现实(VR)装置、增强现实(AR)装置、图像电话视频装置、车辆终端(例如,车辆(包括自主车辆)终端、飞机终端或船舶终端)和医疗视频装置;并且可以用于处理图像信号或数据。例如,OTT视频装置可以包括游戏控制台、蓝光播放器、互联网连接TV、家庭影院***、智能电话、平板PC和数字视频记录器(DVR)。
另外,应用本文的实施方式的处理方法可以以由计算机执行的程序的形式生成,并且可以存储在计算机可读记录介质中。具有根据本文的实施方式的数据结构的多媒体数据也可以存储在计算机可读记录介质中。计算机可读记录介质包括存储计算机可读数据的所有类型的存储装置和分布式存储装置。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。计算机可读记录介质还包括以载波(例如,通过互联网的传输)的形式体现的介质。此外,通过编码方法生成的比特流可以存储在计算机可读记录介质中或通过有线或无线通信网络发送。
另外,本文的实施方式可以基于程序代码体现为计算机程序产品,并且程序代码可以根据本文的实施方式在计算机上执行。程序代码可以存储在计算机可读载体上。
图10表示可以应用本文的实施方式的内容流***的示例。
参照图10,应用本文的实施方式的内容流***通常可以包括编码服务器、流服务器、网络服务器、媒体存储装置、用户设备和多媒体输入装置。
编码服务器用于将从诸如智能手机、照相机或便携式摄像机等的多媒体输入装置输入的内容压缩为数字数据,以生成比特流并将比特流发送到流传输服务器。作为另一示例,当诸如智能手机、照相机或便携式摄像机等的多媒体输入装置直接生成比特流时,可以省略编码服务器。
可以通过应用了本文的实施方式的编码方法或比特流生成方法来生成比特流,并且流传输服务器可以在发送或接收比特流的过程中临时存储比特流。
流传输服务器基于用户请求通过网络服务器向用户设备发送多媒体数据,并且网络服务器用作向用户通知服务的媒介。当用户从网络服务器请求所需的服务时,网络服务器向流传输服务器递送该请求,并且流传输服务器向用户发送多媒体数据。在这种情况下,内容流传输***可以包括单独的控制服务器。在这种情况下,控制服务器用于控制内容流传输***内的装置之间的命令/响应。
流传输服务器可以从媒体储存器和/或编码服务器接收内容。例如,当从编码服务器接收内容时,可以实时接收内容。在这种情况下,为了提供平稳的流传输服务,流传输服务器可以将比特流存储预定时间段。
例如,用户设备可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、平板PC、平板电脑PC、超级本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。
内容流***中的服务器中的各个服务器可以作为分布式服务器工作,并且在这种情况下,可以以分布式方式处理由各个服务器接收的数据。

Claims (15)

1.一种由视频解码设备执行的视频解码方法,所述视频解码方法包括以下步骤:
从比特流中解析表示输出层集合符合的级别的级别信息;
从所述比特流获得用于所述输出层集合符合的约束的约束信息;以及
基于所述级别信息和所述约束信息对当前图片执行解码过程,
其中,所述级别信息和所述约束信息被包括在所述比特流的profile_tier_level语法结构中,并且
其中,在所述profile_tier_level语法结构中所述约束信息存在于所述级别信息之后。
2.根据权利要求1所述的视频解码方法,所述视频解码方法还包括从所述比特流中解析表示关于所述约束的信息是否存在的标志,
其中,基于所述标志的值从所述约束信息中解析关于所述约束的信息。
3.根据权利要求2所述的视频解码方法,其中,所述标志存在于所述约束信息中。
4.根据权利要求2所述的视频解码方法,其中,基于所述标志的值为0,关于所述约束的信息不存在于所述约束信息中。
5.根据权利要求2所述的视频解码方法,所述视频解码方法还包括基于所述标志的值为1从所述约束信息中解析关于所述约束的数目信息。
6.根据权利要求5所述的视频解码方法,其中,所述数目信息表示针对关于所述约束的信息的保留比特的数目。
7.根据权利要求6所述的视频解码方法,所述视频解码方法还包括从所述约束信息中解析具有值0的对准信息,
其中,在所述约束信息中所述对准信息存在于所述数目信息之后。
8.根据权利要求7所述的视频解码方法,其中,在所述约束信息中所述对准信息存在于所述保留比特之后。
9.根据权利要求7所述的视频解码方法,其中,最后从所述约束信息中解析所述对准信息。
10.一种由视频编码设备执行的视频编码方法,所述视频编码方法包括:
生成表示输出层集合符合的级别的级别信息;
生成用于所述输出层集合符合的约束的约束信息;以及
对包括所述级别信息和所述约束信息的图像信息进行编码,
其中,所述级别信息和所述约束信息被包括在所述图像信息的profile_tier_level语法结构中,并且
其中,在所述profile_tier_level语法结构中所述约束信息存在于所述级别信息之后。
11.根据权利要求10所述的视频编码方法,其中,所述约束信息包括表示关于所述约束的信息是否存在于所述约束信息中的标志。
12.根据权利要求11所述的视频编码方法,其中,基于所述标志的值为0,关于所述约束的信息不存在于所述约束信息中,并且其中,基于所述标志的值为1,关于所述约束的数目信息被包括在所述约束信息中。
13.根据权利要求12所述的视频编码方法,其中,所述约束信息包括具有值0的对准信息,并且
其中,在所述约束信息中所述对准信息存在于所述数目信息之后。
14.根据权利要求13所述的视频编码方法,其中,所述对准信息最后出现在所述约束信息中。
15.一种包括使得解码设备执行视频解码方法的信息的计算机可读数字存储介质,所述视频解码方法包括以下步骤:
从比特流中解析表示输出层集合符合的级别的级别信息;
从所述比特流获得用于所述输出层集合符合的约束的约束信息;以及
基于所述级别信息和所述约束信息对当前图片执行解码过程,
其中,所述级别信息和所述约束信息被包括在所述比特流的profile_tier_level语法结构中,并且
其中,在所述profile_tier_level语法结构中所述约束信息存在于所述级别信息之后。
CN202180059920.9A 2020-06-03 2021-06-03 在图像/视频编码***中处理一般约束信息的方法和设备 Pending CN116134816A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063033854P 2020-06-03 2020-06-03
US63/033,854 2020-06-03
US202063034950P 2020-06-04 2020-06-04
US63/034,950 2020-06-04
PCT/KR2021/006903 WO2021246790A1 (ko) 2020-06-03 2021-06-03 영상/비디오 코딩 시스템에서 일반 제한 정보를 처리하는 방법 및 장치

Publications (1)

Publication Number Publication Date
CN116134816A true CN116134816A (zh) 2023-05-16

Family

ID=78831189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180059920.9A Pending CN116134816A (zh) 2020-06-03 2021-06-03 在图像/视频编码***中处理一般约束信息的方法和设备

Country Status (4)

Country Link
US (2) US11917210B2 (zh)
KR (1) KR20230023709A (zh)
CN (1) CN116134816A (zh)
WO (1) WO2021246790A1 (zh)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117459724A (zh) * 2014-01-08 2024-01-26 索尼公司 解码设备和编码设备
US9794626B2 (en) * 2014-05-01 2017-10-17 Qualcomm Incorporated Partitioning schemes in multi-layer video coding
US12022123B2 (en) * 2019-09-11 2024-06-25 Sharp Kabushiki Kaisha Systems and methods for signaling subpicture information in video coding
CN114424561B (zh) * 2019-09-24 2023-10-20 华为技术有限公司 不允许不必要的层包括在多层视频码流中
US20230007291A1 (en) * 2019-12-06 2023-01-05 Sharp Kabushiki Kaisha Systems and methods for signaling temporal sublayer information in video coding
WO2021134046A1 (en) * 2019-12-26 2021-07-01 Bytedance Inc. Decoding parameter sets in video coding
WO2021139806A1 (en) * 2020-01-12 2021-07-15 Beijing Bytedance Network Technology Co., Ltd. Constraints for video coding and decoding
WO2021170095A1 (en) * 2020-02-29 2021-09-02 Beijing Bytedance Network Technology Co., Ltd. Constrains for syntax elements of adaptation parameter set
US11470357B2 (en) * 2020-04-03 2022-10-11 Sharp Kabushiki Kaisha Systems and methods for signaling decoding capability information in video coding
US11611778B2 (en) * 2020-05-20 2023-03-21 Sharp Kabushiki Kaisha Systems and methods for signaling general constraint information in video coding
US20210368209A1 (en) * 2020-05-21 2021-11-25 Qualcomm Incorporated General constraint information signaling in video coding

Also Published As

Publication number Publication date
US11917210B2 (en) 2024-02-27
KR20230023709A (ko) 2023-02-17
US20240146972A1 (en) 2024-05-02
WO2021246790A1 (ko) 2021-12-09
US20230103067A1 (en) 2023-03-30

Similar Documents

Publication Publication Date Title
US11895314B2 (en) Method and device for coding image/video on basis of prediction weighted table
CN114556931A (zh) 基于调色板模式的图像或视频编码
US12015766B2 (en) Prediction weighted table-based image/video coding method and apparatus
US20240056566A1 (en) Inter prediction method and apparatus in image/video coding system
US12022128B2 (en) Method and device for weighted prediction for image/video coding
US20240089506A1 (en) Method and apparatus for processing high level syntax in image/video coding system
CN114762351B (zh) 图像/视频编译方法和装置
US20240064305A1 (en) Slice type-based image/video coding method and apparatus
US11716484B2 (en) Image/video coding method and apparatus based on inter prediction
US11936894B2 (en) High level syntax signaling method and device for image/video coding
CN116195247A (zh) 图像编码方法和用于该图像编码方法的装置
CN115699768A (zh) 在视频或图像编码***中基于poc信息和非参考图片标志的图像编码方法
CN114982242A (zh) 发信号通知图片分割信息的方法和设备
US11917210B2 (en) Method and device for processing general constraint information in image/video coding system
US11716464B2 (en) Image/video encoding/decoding method and apparatus using same
CN114747215B (zh) 调色板编码或变换单元的基于量化参数信息的图像或视频编码
US20240129475A1 (en) Method and device for signaling information related to slice in image/video encoding/decoding system
US20230179770A1 (en) Method and device for processing reference of parameter set within single layer bitstream in image/video coding system
CN115668940A (zh) 基于与画面输出相关的信息的图像或视频编码
CN115004709A (zh) 用于发信号通知切片相关信息的方法和装置
CN115004708A (zh) 用于发信号通知图像信息的方法和设备
CN114902667A (zh) 基于色度量化参数偏移信息的图像或视频编码
CN114762335A (zh) 基于变换跳过和调色板编码相关数据的图像或视频编码

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination