CN114902681A - 图像/视频编码/解码***中与切片相关的信令信息的方法和设备 - Google Patents

图像/视频编码/解码***中与切片相关的信令信息的方法和设备 Download PDF

Info

Publication number
CN114902681A
CN114902681A CN202080090684.2A CN202080090684A CN114902681A CN 114902681 A CN114902681 A CN 114902681A CN 202080090684 A CN202080090684 A CN 202080090684A CN 114902681 A CN114902681 A CN 114902681A
Authority
CN
China
Prior art keywords
height
slice
tile
information
slices
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080090684.2A
Other languages
English (en)
Inventor
亨得利·亨得利
塞特拉·帕卢瑞
金昇焕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN114902681A publication Critical patent/CN114902681A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)

Abstract

根据本文档的一种视频解码设备对视频进行解码的方法可以包括以下步骤:从比特流解析与显式地用信号发送当前图片的拼块内的高度的切片的数量相关的数量信息;基于数量信息,从比特流解析与显式地用信号发送高度的切片的高度相关的高度信息;基于数量信息和高度信息导出拼块中的切片的数量;通过基于拼块内的切片预测当前图片的当前块来生成预测样本;基于预测样本来生成重构样本;以及基于重构样本来生成用于当前图片的重构图片。

Description

图像/视频编码/解码***中与切片相关的信令信息的方法和 设备
技术领域
本公开涉及一种用于在对图像/视频进行编码/解码的***中增强与切片相关的信息的信令的方法和设备。
背景技术
最近,在各种领域中对诸如4K或8K或以上超高清晰度(UHD)图像/视频的高分辨率、高质量图像/视频的需求在增加。随着图像/视频分辨率或质量变得更高,与对于常规图像/视频数据相比,发送相对更多量的信息或比特。因此,如果图像/视频数据经由诸如现有有线/无线宽带线路的介质来发送或者被存储在传统存储介质中,则容易增加用于传输和存储的成本。
此外,对虚拟现实(VR)和人工现实(AR)内容以及诸如全息图这样的沉浸式媒体的兴趣和需求日益增长;并且表现出与实际图像/视频不同的图像/视频特性的图像/视频(例如,游戏图像/视频)的广播也日益增长。
因此,需要高度高效的图像/视频压缩技术来有效地压缩并发送、存储或播放如上所述显示出各种特性的高分辨率、高质量图像/视频。
发明内容
技术问题
本公开的技术目的是提供一种用于增加图像/视频的编译效率的方法和设备。
本公开的另一技术目的是提供一种用于有效地用信号发送关于拼块内的切片的信息的方法和设备。
本公开的又一个技术目的是提供一种用于在递送(或者传送)关于拼块内的切片的信息时减少信令开销的方法和设备。
本公开的又一个技术目的是提供一种用于有效地递送(或者传送)与拼块内的切片的数量和高度相关的信息的方法和设备。
本公开的又一个技术目的是提供一种用于在两个或更多个切片在拼块内具有相同高度时更有效地用信号发送相应切片的高度的方法和设备。
技术方案
根据本公开的实施例,这里提供了一种由视频解码设备执行的视频解码方法。该方法可以包括以下步骤:从比特流解析与当前图片的拼块内的每个具有显式地用信号发送的其高度的切片的数量相关的数量信息;基于数量信息,从比特流解析与每个具有显式地用信号发送的其高度的切片的高度相关的高度信息;基于数量信息和高度信息来导出拼块内的切片的数量;通过基于拼块内的切片对当前图片的当前块执行预测来生成预测样本;基于预测样本来生成重构样本;以及基于重构样本来生成用于当前图片的重构图片,其中高度信息可以包括与数量信息的值相同数量的语法元素,其中基于数量信息值等于n,可以基于语法元素来导出拼块内的第0切片到第(n-1)切片的高度,其中可以基于第(n-1)切片的高度来导出拼块内的第n切片的高度,以及其中可以基于从拼块的高度减去拼块内的其他切片的高度之后的剩余高度来导出拼块内的最后切片的高度。
根据本公开的另一实施例,这里提供一种由视频编码设备执行的视频编码方法。该方法可以包括以下步骤:导出当前图片的拼块内的切片;通过基于导出的切片对当前块执行预测来生成预测样本;基于预测样本和原始图片来生成残差信息;基于所导出的切片来生成与拼块内的每个具有显式地用信号发送的其高度的切片的数量相关的数量信息以及与每个具有显式地用信号发送的其高度的切片的高度相关的高度信息;以及对包括残差信息、数量信息和高度信息的图像信息进行编码,其中基于数量信息的值等于n,高度信息可以指示拼块内的第0切片到第(n-1)切片的高度,其中基于第(n-1)切片的高度来导出拼块内的第n切片的高度,以及其中可以基于从拼块的高度减去拼块内的其他切片的高度之后的剩余高度来导出拼块内的最后切片的高度。
根据本公开的又一实施例,本文提供一种计算机可读数字记录介质,该计算机可读数字记录介质具有存储在其中的使视频解码方法由视频解码设备执行的信息。视频解码方法可以包括以下步骤:从图像信息解析与当前图片的拼块内的每个具有显式地用信号发送的其高度的切片的数量相关的数量信息;基于数量信息,从图像信息解析与每个具有显式地用信号发送的其高度的切片的高度相关的高度信息;基于数量信息和高度信息来导出拼块内的切片的数量;通过基于拼块内的切片对当前图片的当前块执行预测来生成预测样本;基于预测样本来生成重构样本;以及基于重构样本来生成用于当前图片的重构图片,其中高度信息可以包括与数量信息的值相同数量的语法元素,其中基于数量信息值等于n,可以基于语法元素来导出拼块内的第0切片到第(n-1)切片的高度,其中可以基于第(n-1)切片的高度来导出拼块内的第n切片的高度,以及其中可以基于从拼块的高度减去拼块内的其他切片的高度之后的剩余高度来导出拼块内的最后切片的高度。
有益效果
根据本公开的实施例,可以增强图像/视频的整体压缩效率。
根据本公开的实施例,可以有效地用信号发送关于拼块内的切片的信息。
根据本公开的实施例,当递送(或传送)关于拼块内的切片的信息时,可以减少信令开销。
根据本公开的实施例,可以有效地用信号发送与拼块内的切片的数量和高度相关的信息。
根据本公开的实施例,当两个或更多个切片在拼块内具有相同高度时,可以跳过具有相同高度的切片的高度信息的信令。
附图说明
图1示意性地示出可应用本公开的实施例的视频/图像编译***的示例。
图2是示意性地图示可应用本公开的实施例的视频/图像编码设备的配置的图。
图3是示意性地图示可应用本公开的实施例的视频/图像解码设备的配置的图。
图4示出图片解码过程的示例。
图5示出图片编码过程的示例。
图6示出基于帧间预测的视频/图像编码方法的示例。
图7示出编码设备中的帧间预测器的一般视图。
图8示出基于帧间预测的视频/图像解码方法的示例。
图9示出解码设备中的帧间预测器的一般视图。
图10和图11分别示出根据本公开的实施例的视频/图像编码方法和相关组件的一般示例。
图12和图13分别示出根据本公开的实施例的视频/图像解码方法和相关组件的一般示例。
图14示出可以应用本公开的实施例的内容流传输***的示例。
具体实施方式
可以各种形式修改本公开的公开内容,并且将在附图中描述和图示其具体实施例。在本公开中使用的术语仅用于描述具体实施例,而不旨在限制本公开中的所公开的方法。单数的表达包括“至少一个”的表达,只要它被清楚地不同地解读。诸如“包括”和“具有”的术语旨在指示存在文档中使用的特征、数量、步骤、操作、元素、组件或其组合,并且因此应当理解,不排除存在或添加一个或多个不同特征、数量、步骤、操作、元素、组件或其组合的可能性。
此外,本文档中描述的附图的每个配置是用于解释作为彼此不同的特征的功能的独立图示,并且不意味着每个配置由相互不同的硬件或不同的软件实现。例如,可将两种或更多种配置组合以形成一种配置,并且还可将一种配置分成多种配置。在不脱离本公开的所公开的方法的主旨的情况下,组合和/或分离配置的实施例包括在本公开的公开内容的范围内。
本文档涉及视频/图像编译。例如,本文档中公开的方法/实施例可以应用于通用视频编译(VVC)标准中公开的方法。此外,本文档中公开的方法/实施例可以应用于基本视频编译(EVC)标准、AOMedia视频1(AV1)标准、第二代音频视频编译标准(AVS2)或下一代视频/图像编译标准(例如,H.267、H.268等)。
在本文档中,视频可能指的是一段时间内的一系列图像(image)。图片(picture)通常指的是在特定时间帧表示一个图像的单元,并且切片(slice)/拼块(tile)指的是在编译方面组成图片的一部分的单元。切片/拼块可以包括一个或多个编译树单元(CTU)。一个图片可以由一个或多个切片/拼块组成。一个图片可以由一个或多个拼块组(tile group)组成。一个拼块组可以包括一个或多个拼块。图块(brick)可以表示图片中的拼块内的CTU行的矩形区域。拼块可以分区成多个图块,其每个由该拼块内的一个或多个CTU行组成。未分区成多个图块的拼块也可以被称为图块。图块扫描是分区图片的CTU的特定顺序排序,其中CTU在图块中的CTU光栅扫描中被连续排序,在拼块内的图块在拼块的图块的光栅扫描中被连续排序,而在图片中的拼块在图片的拼块的光栅扫描中被连续排序。拼块是图片中特定拼块列和特定拼块行内的CTU的矩形区域。拼块列是CTU的矩形区域,其高度等于图片的高度并且宽度由图片参数集中的语法元素指定。拼块行是CTU的矩形区域,其高度由图片参数集中的语法元素指定并且宽度等于图片的宽度。拼块扫描是分区图片的CTU的特定顺序排序,其中CTU在拼块中的CTU光栅扫描中被连续排序,而图片中的拼块在图片的拼块的光栅扫描中被连续排序。切片包括整数个的图片的图块,其可以排他地被包含在单个NAL单元中。切片可以由多个完整的拼块组成,或者仅由一个拼块的完整图块的连续序列组成。在本文档中,拼块组和切片可以互换使用。例如,在本文档中,拼块组/拼块组报头可以被称为切片/切片报头。
像素或像元(pel)可意指构成一个图片(或图像)的最小单元。另外,“样本”可用作与像素对应的术语。样本通常可表示像素或像素值,并且可仅表示亮度分量的像素/像素值或仅表示色度分量的像素/像素值。
单元可以表示图像处理的基本单位。单元可以包括图片的特定区域和与该区域有关的信息中的至少一个。一个单元可以包括一个亮度块和两个色度(例如,cb、cr)块。在一些情况下,单元可与诸如块或区域这样的术语互换使用。在一般情况下,M×N块可以包括M列和N行的样本(或样本阵列)或变换系数的集合(或阵列)。可替选地,样本可意指空间域中的像素值,并且当这样的像素值被变换到频域时,它可意指频域中的变换系数。
在一些情况下,单元可以与诸如块或区域这样的术语互换使用。在一般情况下,M×N块可表示由M列和N行组成的样本或变换系数的集合。样本通常可表示像素或像素值,可仅表示亮度分量的像素/像素值或者仅表示色度分量的像素/像素值。样本可用作与像素或像元的一个图片(或图像)对应的术语。
与视频/图像编译相关的各种实施例在本文档中呈现,并且实施例可以彼此组合,除非另有说明。
在本文档中,在一个附图中单独解释的技术特征可以单独实施或同时实施。
在下文中,将参考附图详细描述本文档的实施例。另外,在所有附图中,相同的附图标记可用于指示相同的元件,并且将省略对相同元件的相同描述。
图1图示可应用本公开的实施例的视频/图像编译***的示例。
参照图1,视频/图像编译***可以包括第一装置(源装置)和第二装置(接收装置)。源装置可以通过数字存储介质或网络将编码的视频/图像信息或数据以文件或流的形式发送至接收装置。
源装置可以包括视频源、编码设备和发送器。接收装置可以包括接收器、解码设备和渲染器。编码设备可以被称为视频/图像编码设备,解码设备可以被称为视频/图像解码设备。发送器可以被包括在编码设备中。接收器可以被包括在解码设备中。渲染器可以包括显示器,并且显示器可以被配置为单独的装置或外部部件。
视频源可以通过捕获、合成或生成视频/图像的处理来获取视频/图像。视频源可以包括视频/图像捕获装置和/或视频/图像生成装置。例如,视频/图像捕获装置可以包括一个或更多个相机、包括先前捕获的视频/图像的视频/图像档案等。例如,视频/图像生成装置可以包括计算机、平板计算机和智能电话,并且可(以电子方式)生成视频/图像。例如,可以通过计算机等生成虚拟视频/图像。在这种情况下,视频/图像捕获处理可以由生成相关数据的处理代替。
编码设备可以对输入视频/图像进行编码。为了压缩和编译效率,编码设备可执行诸如预测、变换和量化的一系列过程。编码的数据(编码的视频/图像信息)可以按比特流的形式输出。
发送器可以通过数字存储介质或网络将以比特流的形式输出的编码的图像/图像信息或数据以文件或流的形式发送至接收装置的接收器。数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。发送器可以包括用于通过预定文件格式生成媒体文件的元件,并且可以包括用于通过广播/通信网络传输的元件。接收器可以接收/提取比特流并且将所接收的比特流发送至解码设备。
解码设备可以通过执行与编码设备的操作对应的诸如解量化、逆变换和预测的一系列过程对视频/图像进行解码。
渲染器可以渲染解码的视频/图像。渲染的视频/图像可以通过显示器显示。
在本文档中,术语“/”和“,”应解释为指示“和/或”。例如,表达“A/B”可以意指“A和/或B”。此外,“A、B”可以意指“A和/或B”。此外,“A/B/C”可以意指“A、B和/或C中的至少一个”。此外,“A/B/C”可以意指“A、B和/或C中的至少一个”。
此外,在文档中,术语“或”应解释为指示“和/或”。例如,表达“A或B”可以包括1)仅A、2)仅B和/或3)A和B这两者。换句话说,本文档中的术语“或”应解释为指示“附加地或替代地”。
此外,本说明书中使用的括号可以意指“例如”。具体地,在表达“预测(帧内预测)”的情况下,可以指示将“帧内预测”作为“预测”的示例提出。换句话说,本说明书中的术语“预测”不限于“帧内预测”,并且可以指示将“帧内预测”作为“预测”的示例提出。此外,即使在表达“预测(即,帧内预测)”的情况下,也可以指示将“帧内预测”作为“预测”的示例提出。
图2是示意性地图示本公开的实施例可以应用于的视频/图像编码设备的配置的图。在下文中,被称为视频编码设备的设备可以包括图像编码设备。
参照图2,编码设备200包括图像分区器210、预测器220、残差处理器230和熵编码器240、加法器250、滤波器260和存储器270。预测器220可以包括帧间预测器221和帧内预测器222。残差处理器230可以包括变换器232、量化器233、解量化器234和逆变换器235。残差处理器230还可以包括减法器231。加法器250可以被称为重构器或重构块生成器。根据实施方式,图像分区器210、预测器220、残差处理器230、熵编码器240、加法器250和滤波器260可以由至少一个硬件部件(例如,编码器芯片组或处理器)配置。另外,存储器270可以包括解码图片缓冲器(DPB),或者可以由数字存储介质配置。硬件部件还可以包括存储器270作为内部/外部部件。
图像分区器210可以将输入到编码设备200的输入图像(或者图片或帧)分割成一个或更多个处理单元。例如,处理单元可以被称为编译单元(CU)。在这种情况下,编译单元可以根据四叉树二叉树三叉树(QTBTTT)结构从编译树单元(CTU)或最大编译单元(LCU)递归地分割。例如,一个编译单元可基于四叉树结构、二叉树结构和/或三元结构被分割成深度更深的多个编译单元。在这种情况下,例如,可首先应用四叉树结构,稍后可应用二叉树结构和/或三元结构。可替选地,可首先应用二叉树结构。可基于不再分割的最终编译单元来执行根据本公开的编译过程。在这种情况下,根据图像特性基于编译效率等,最大编译单元可用作最终编译单元,或者如果需要,编译单元可以被递归地分割成深度更深的编译单元并且具有最优大小的编译单元可用作最终编译单元。这里,编译过程可以包括预测、变换和重构的过程(将稍后描述)。作为另一示例,处理单元还可以包括预测单元(PU)或变换单元(TU)。在这种情况下,预测单元和变换单元中的每个可以从上述最终编译单元分割或分区。预测单元可以是样本预测的单元,变换单元可以是用于推导变换系数的单元和/或用于从变换系数推导残差信号的单元。
编码设备200可以从输入图像信号(原始块、原始样本阵列)减去从帧间预测器221或帧内预测器222输出的预测信号(预测块、预测样本阵列)以生成残差信号(残差块、残差样本阵列),并且所生成的残差信号被发送到变换器232。在这种情况下,如所示,在编码器200中从输入图像信号(原始块、原始样本阵列)减去预测信号(预测块、预测样本阵列)的单元可以被称为减法器231。预测器可以对处理目标块(以下,称为当前块)执行预测并且生成包括当前块的预测样本的预测块。预测器可以确定在当前块或CU的单元中应用帧内预测还是帧间预测。如在各个预测模式的描述中稍后描述的,预测器可以生成关于预测的各种类型的信息(例如,预测模式信息)并将所生成的信息发送到熵编码器240。关于预测的信息可以由熵编码器240编码并且以比特流的形式输出。
帧内预测器222可参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可位于当前块附近或者可隔开。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。例如,非定向模式可以包括DC模式和平面模式。例如,根据预测方向的详细程度,定向模式可以包括33个定向预测模式或65个定向预测模式。然而,这仅是示例,可以根据设置使用更多或更少的定向预测模式。帧内预测器222可以使用应用于邻近块的预测模式来确定应用于当前块的预测模式。
帧间预测器221可以基于参考图片上运动矢量所指定的参考块(参考样本阵列)来推导当前块的预测块。这里,为了减少在帧间预测模式下发送的运动信息量,可基于邻近块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可以包括运动矢量和参考图片索引。运动信息还可以包括帧间预测方向(L0预测、L1预测、Bi预测等)信息。在帧间预测的情况下,邻近块可以包括存在于当前图片中的空间邻近块和存在于参考图片中的时间邻近块。包括参考块的参考图片和包括时间邻近块的参考图片可相同或不同。时间邻近块可以被称为并置参考块、并置CU(colCU)等,并且包括时间邻近块的参考图片可以被称为并置图片(colPic)。例如,帧间预测器221可基于邻近块来配置运动信息候选列表并且生成指示哪一候选用于推导当前块的运动矢量和/或参考图片索引的信息。可基于各种预测模式执行帧间预测。例如,在跳过模式和合并模式的情况下,帧间预测器221可使用邻近块的运动信息作为当前块的运动信息。在跳过模式下,与合并模式不同,可以不发送残差信号。运动矢量预测(MVP)模式可以通过使用邻近块的运动矢量作为运动矢量预测器并且用信号通知运动矢量差来指示当前块的运动矢量。
预测器220可以基于稍后描述的各种预测方法来生成预测信号。例如,预测器220可以应用帧内预测或帧间预测来预测一个块,并且可以同时应用帧内预测和帧间预测。这可以被称为组合帧间和帧内预测(CIIP)。此外,预测器可以基于帧内块复制(IBC)预测模式或基于调色板模式以用于预测块。IBC预测模式或调色板模式可用于游戏等的内容的图像/视频编译,例如屏幕内容编译(SCC)。IBC基本上在当前图片中执行预测,但是它可以与帧间预测类似地执行在于在当前图片中推导参考块。也就是说,IBC可以使用本文档中描述的帧间预测技术中的至少一个。调色板模式可以被视为帧内编译或帧内预测的示例。当应用调色板模式时,可以基于关于调色板表和调色板索引的信息用信号通知图片中的样本值。
通过预测器(包括帧间预测器221和/或帧内预测器222)生成的预测信号可以用于生成重构信号或可以用于生成残差信号。
变换器232可以通过将变换技术应用于残差信号来生成变换系数。例如,变换技术可以包括以下中的至少一个:离散余弦变换(DCT)、离散正弦变换(DST)、基于图形的变换(GBT)或条件非线性变换(CNT)。这里,当像素之间的关系信息被图示为图形时,GBT意指从图形获取的变换。CNT意指基于通过使用所有先前重构的像素生成的预测信号而获取的变换。另外,变换处理还可以应用于具有相同大小的正方形的像素块,或者还可以应用于不是正方形的可变大小的块。
量化器233量化变换系数并且将量化的变换系数发送到熵编码器240,并且熵编码器240编码量化的信号(关于量化的变换系数的信息)并且输出编码的信号作为比特流。关于量化的变换系数的信息可以被称为残差信息。量化器233可以基于系数扫描顺序以一维向量形式重新排列具有块形式的量化的变换系数,并且还基于一维向量形式的量化的变换系数来生成关于量化的变换系数的信息。
熵编码器240可以执行诸如例如指数哥伦布(Golomb)、上下文自适应可变长度编译(CAVLC)、和上下文自适应二进制算术编译(CABAC)等的各种编码方法。熵编码器240还可以一起或单独地对除了量化的变换系数之外的视频/图像重构所必需的信息(例如,语法元素的值等)进行编码。编码的信息(例如,编码的视频/图像信息)可以比特流的形式以网络抽象层(NAL)为单位被发送或存储。视频/图像信息还可以包括关于各种参数集的信息,例如适配参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可以包括一般约束信息。在该文档中,可以在视频/图像信息中包括从编码设备用信号通知/发送到解码设备的信息和/或语法元素。视频/图像信息可以通过前述编码过程来编码并且因此包括在比特流中。比特流可以通过网络被发送或者可以被存储在数字存储介质中。这里,网络可以包括广播网络和/或通信网络,并且数字存储介质可以包括诸如USB、SD、CD、DVD、蓝光、HDD、SSD等的各种存储介质。用于发送从熵编码器240输出的信号的发送单元(未示出)和/或用于存储该信号的存储单元(未示出)可以被配置为编码设备200的内部/外部元件,或者发送单元也可以被包括在熵编码器240中。
从量化器233输出的量化的变换系数可以用于生成预测信号。例如,可以通过解量化器234和逆变换单元235将解量化和逆变换应用于量化的变换系数来重构残差信号(残差块或残差样本)。加法器250可以将重构的残差信号与从帧间预测器221或帧内预测器222输出的预测信号相加,以生成重构信号(重构图片、重构块、重构样本阵列)。诸如在应用跳过模式时,当针对处理目标块不存在残差时,预测块可用作重构块。加法器250可以被称为恢复器或恢复块生成器。所生成的重构信号可以用于当前图片内的下一个处理目标块的帧内预测,并且,还可以在滤波之后用于下一图片的帧间预测,如下所述。
同时,也可以在图片编码和/或重构处理期间应用亮度映射与色度缩放(LMCS)。
滤波器260可以通过对重构信号应用滤波来改进主观/客观图像质量。例如,滤波器260可以通过对重构图片应用各种滤波方法来生成修改的重构图片并将修改的重构图片存储在存储器270(具体地,存储器270的DPB)中。例如,各种滤波方法可以包括去块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。滤波器260可以生成与滤波有关的各种类型的信息并且将所生成的信息传送到熵编码器240,如在各个滤波方法的描述中稍后描述的。与滤波有关的信息可以由熵编码器240编码并以比特流的形式输出。
发送到存储器270的修改的重构图片可以用作帧间预测器221中的参考图片。当通过编码设备应用帧间预测时,可以避免编码设备200与解码设备之间的预测失配并且可以改善编译效率。
存储器270的DPB可以存储修正后的重构图片,以用作帧间预测器221中的参考图片。存储器270可以存储从其推导出(或编码)当前图片中的运动信息的块的运动信息和/或已经重构的图片中的块的运动信息。所存储的运动信息可以被传送到帧间预测器221,以被用作空间邻近块的运动信息或时间邻近块的运动信息。存储器270可以存储当前图片中的重构块的重构样本,并且可以将重构样本传送到帧内预测器222。
图3是用于示意性地解释可应用本公开的实施例的视频/图像解码设备的配置的图。
参照图3,解码设备300可以包括熵解码器310、残差处理器320、预测器330、加法器340、滤波器350和存储器360。预测器330可以包括帧间预测器331和帧内预测器332。残差处理器320可以包括解量化器321和逆变换器321。根据实施方式,熵解码310、残差处理器320、预测器330、加法器340和滤波器350可以由硬件部件(例如,解码器芯片组或处理器)配置。另外,存储器360可以包括解码图片缓冲器(DPB)或者可以由数字存储介质配置。硬件部件还可以包括存储器360作为内部/外部部件。
当输入包括视频/图像信息的比特流时,解码设备300可以响应于在图2所示的编码设备中处理视频/图像信息的过程而重构图像。例如,解码设备300可以基于从比特流获得的块分区相关信息来推导单元/块。解码设备300可以使用应用于编码设备的处理单元来执行解码。因此,例如,用于解码的处理单元可以是编译单元,并且编译单元可以根据四叉树结构、二叉树结构和/或三叉树结构从编译树单元或最大编译单元分割。可以从编译单元推导一个或多个变换单元。此外,通过解码设备300解码和输出的重构图像信号可以通过再现设备被再现。
解码设备300可以接收以比特流的形式从图2的编码设备输出的信号,并且可以通过熵解码器310对接收的信号进行解码。例如,熵解码器310可以解析比特流来推导图像重构(或图片重构)所需的信息(例如,视频/图像信息)。视频/图像信息还可以包括关于各种参数集的信息,例如适配参数集(APS)、图片参数集(PPS)、序列参数集(SPS)或视频参数集(VPS)。另外,视频/图像信息还可以包括一般约束信息。解码设备还可以基于关于参数集和/或一般约束信息的信息来解码图片。稍后将在本文档中描述的用信号通知/接收的信息和/或语法元素可以通过解码过程解码且从比特流获取。例如,熵解码器310可以基于诸如指数Golomb编译、上下文自适应可变长度编译(CAVLC)、或上下文自适应二进制算术编译(CABAC)的编译方法解码比特流内的信息,并且输出图像重构所需的语法元素和用于残差的变换系数的量化值。更具体地,CABAC熵解码方法可以接收与比特流中的每个语法元素相对应的bin,通过使用解码目标语法元素信息、解码目标块的解码信息或者在先前阶段中解码的符号/bin的信息来确定上下文模型,并且通过根据所确定的上下文模型预测出现bin的概率来对bin执行算术解码,并且生成与每个语法元素的值相对应的符号。在这种情况下,CABAC熵解码方法可以在确定上下文模型之后通过将解码的符号/bin的信息用于下一符号/bin的上下文模型来更新上下文模型。由熵解码器310所解码的信息之中与预测有关的信息可以被提供给预测器(帧间预测器332和帧内预测器331),并且在熵解码器310已经执行熵解码的残差值(即,量化的变换系数和相关参数信息)可以被输入到残差处理器320。
残差处理器320可以推导残差信号(残差块、残差样本、残差样本阵列)。另外,由熵解码器310解码的信息之中关于滤波的信息可以被提供给滤波器350。同时,用于接收从编码设备输出的信号的接收器(未示出)还可以被配置成解码设备300的内部/外部元件,或者接收器可以是熵解码器310的组件。同时,根据该文档的解码设备可以被称为视频/图像/图片解码设备,并且解码设备可以被分类为信息解码器(视频/图像/图片信息解码器)和样本解码器(视频/图像/图片样本解码器)。信息解码器可以包括熵解码器310,并且样本解码器可以包括以下中的至少一个:解量化器321、逆变换器322、加法器340、滤波器350、存储器360、帧间预测器332和帧内预测器331。
解量化器321可以将量化后的变换系数解量化并输出变换系数。解量化器321可以按二维块形式重排量化后的变换系数。在这种情况下,可以基于在编码设备中执行的系数扫描顺序来执行重排。解量化器321可以使用量化参数(例如,量化步长信息)对量化后的变换系数执行解量化并且获得变换系数。
逆变换器322对变换系数逆变换以获得残差信号(残差块、残差样本阵列)。
在本文档中,可以省略量化/解量化和/或变换/逆变换中的至少一个。当省略量化/解量化时,量化的变换系数可以被称为变换系数。当省略变换/逆变换时,变换系数可以被称为系数或残差系数,或者为了表达的一致性,仍可以被称为变换系数。
在本文档中,量化的变换系数和变换系数可以分别称为变换系数和缩放的变换系数。在这种情况下,残差信息可以包括关于变换系数的信息,并且关于变换系数的信息可以通过残差编译语法用信号发送。可以基于残差信息(或关于变换系数的信息)导出变换系数,并且可以通过对变换系数的逆变换(缩放)来导出缩放的变换系数。可以基于缩放的变换系数的逆变换(变换)来导出剩余样本。这也可以在本文档的其他部分中被应用/表达。
预测器330可以对当前块执行预测并生成包括当前块的预测样本的预测块。预测器可以基于从熵解码器310输出的关于预测的信息来确定是否对当前块应用帧内预测或帧间预测并且确定特定帧内/帧间预测模式。
预测器330可以基于下述各种预测方法来生成预测信号。例如,预测器可以应用帧内预测或帧间预测以用于预测一个块,而且可以同时应用帧内预测和帧间预测。这可以被称为组合帧间和帧内预测(CIIP)。另外,预测器可以基于帧内块复制(IBC)预测模式或调色板模式来预测块。IBC预测模式或调色板模式可以用于诸如游戏等的内容的图像/视频编译,例如屏幕内容编译(SCC)。IBC可以基本上执行当前图片中的预测,但是可以与帧间预测相似地执行,使得在当前图片内推导参考块。即,IBC可以使用该文档中描述的至少一个帧间预测技术。调色板模式可以被视为帧内编译或帧内预测的示例。当应用调色板模式时,关于调色板表和调色板索引的信息可以包括在视频/图像信息中并且用信号通知。
帧内预测器331可以通过参考当前图片中的样本来预测当前块。根据预测模式,所参考的样本可以位于当前块附近或者可以与当前块隔开。在帧内预测中,预测模式可以包括多个非定向模式和多个定向模式。帧内预测器331可以通过使用应用于相邻块的预测模式来确定应用于当前块的预测模式。
帧间预测器332可以基于参考图片上由运动向量指定的参考块(参考样本阵列)来推导当前块的预测块。在这种情况下,为了减少在帧间预测模式下发送的运动信息量,可以基于相邻块与当前块之间的运动信息的相关性以块、子块或样本为单位预测运动信息。运动信息可以包括运动向量和参考图片索引。运动信息还可以包括关于帧间预测方向(L0预测、L1预测、Bi预测等)的信息。在帧间预测的情况下,相邻块可以包括存在于当前图片中的空间相邻块和存在于参考图片中的时间相邻块。例如,帧间预测器332可以基于相邻块来构造运动信息候选列表并且基于所接收的候选选择信息来推导当前块的运动向量和/或参考图片索引。可以基于各种预测模式来执行帧间预测,并且关于预测的信息可以包括指示用于当前块的帧间预测模式的信息。
加法器340可以通过将所获取的残差信号与从预测器(包括帧间预测器332和/或帧内预测器331)输出的预测信号(预测块、预测样本阵列)相加来生成重构信号(重构图片、重构块、重构样本阵列)。如果针对处理目标块不存在残差,例如应用跳过模式的情况,预测块可以用作重构块。
加法器340可以被称为重构器或重构块生成器。所生成的重构信号可以用于在当前图片中将处理的下一个块的帧内预测,并且如随后描述的,还可以通过滤波来输出或者还可以用于下一个图片的帧间预测。
此外,具有色度缩放的亮度映射(LMCS)还可以被应用于图片解码处理。
滤波器350可以通过向重构信号应用滤波来改善主观/客观图像质量。例如,滤波器350可以通过向重构图片应用各种滤波方法来生成修正后的重构图片,并将修正后的重构图片存储在存储器360中,具体地,存储在存储器360的DPB中。各种滤波方法可以包括例如解块滤波、样本自适应偏移、自适应环路滤波器、双边滤波器等。
存储在存储器360的DPB中的(修改的)重构图片可以用作帧间预测器332中的参考图片。存储器360可以存储从其中推导(解码)当前图片内的运动信息的块的运动信息和/或已经重构的图片内的块的运动信息。存储的运动信息可以被传送到帧间预测器260,以用作空间相邻块的运动信息或时间相邻块的运动信息。存储器360可以存储当前图片内的重构块的重构样本,并且将所重构样本传送到帧内预测器331。
在本文档中,在编码设备200的滤波器260、帧间预测器221和帧内预测器222中描述的实施例可以被同等地应用于或对应于滤波器350、帧间预测器332和帧内预测器331。
同时,根据本文档的视频/图像编译方法可以基于以下分区结构来执行。具体地,可以根据基于分区结构导出的CTU和CU(和/或TU和PU)来执行上述预测、残差处理((逆)变换和(解)量化)、语法元素编译和滤波的过程。块分区过程可以由上述编码设备的图像分区器210执行,并且分区相关信息可以由熵编码器240处理(编码),并且能够以比特流的形式传送到解码设备。解码设备的熵解码器310可以基于从比特流获得的分区相关信息导出当前图片的块分区结构,并且基于此,可以执行用于图像解码的一系列过程(例如,预测、残差处理、块/图片重构、环路滤波等)。CU大小和TU大小可以彼此相等,或者多个TU可以存在于CU区域内。同时,CU大小通常可以表示亮度分量(样本)编译块(CB)大小。TU大小通常可以表示亮度分量(样本)变换块(TB)大小。可以根据按照图片/图像的颜色格式(色度格式,例如,4:4:4、4:2:2、4:2:0等)的分量比率,基于亮度分量(样本)CB或者TB大小,来导出色度分量(样本)CB或TB大小。TU大小可以基于maxTbSize导出。例如,如果CU大小大于maxTbSize,则可以从CU导出多个maxTbSize的TU(TB),并且能够以TU(TB)为单位来执行变换/逆变换。此外,例如,在应用帧内预测的情况下,能够以CU(或CB)为单位来导出帧内预测模式/类型,并且能够以TU(或TB)为单位来执行邻近参考样本导出和预测样本生成过程。在这种情况下,一个或多个TU(或TB)可以存在于一个CU(或CB)区域中,并且在这种情况下,多个TU(或TB)可以共享相同的帧内预测模式/类型。
此外,在根据本文档的视频/图像编译中,图像处理单元可以具有分层结构。一个图片可以被分区成一个或多个拼块、图块、切片和/或拼块组。一个切片可以包括一个或多个图块。一个图块可以包括拼块内的一个或多个CTU行。切片可以包括图片的整数个块。一个拼块组可以包括一个或多个拼块。一个拼块可以包括一个或多个CTU。CTU可以被分区成一个或多个CU。拼块表示图片中特定拼块列和特定拼块行内的CTU的矩形区域。根据图片中的拼块光栅扫描,拼块组可以包括整数个拼块。切片报头可以承载能够被应用于相应切片(切片中的块)的信息/参数。在编码/解码设备具有多核处理器的情况下,可以并行处理拼块、切片、图块和/或拼块组的编码/解码过程。在本文档中,切片或拼块组可以交换使用。即,拼块组报头可以被称为切片报头。这里,切片可以具有切片类型之一,包括帧内(I)切片、预测(P)切片和双向预测(B)切片。在I切片中的预测块时,可以不使用帧间预测,并且可以仅使用帧内预测。当然,即使在这种情况下,也可以通过对原始样本值进行编译而不进行预测来执行信令。关于P切片中的块,可以使用帧内预测或帧间预测,并且在使用帧间预测的情况下,只能使用单向预测。同时,关于B切片中的块,可以使用帧内预测或帧间预测,并且在使用帧间预测的情况下,能够最大程度地使用直到双向预测。
编码设备可以在考虑编译效率或并行处理的情况下,或根据视频图像的特性(例如,分辨率)来确定拼块/拼块组、图块、切片以及最大和最小编译单元大小,并且针对它们的信息或能够诱导它们的信息可以被包括在比特流中。
解码设备可以获得表示当前图片的拼块/拼块组、图块和切片以及是否拼块中的CTU已经被分区成多个编译单元的信息。通过仅在特定条件下获得(发送)这样的信息,能够增强效率。
同时,如上所述,一个图片可以包括多个切片,并且一个切片可以包括切片报头和切片数据。在这种情况下,可以为一个图片中的多个切片(切片报头和切片数据的集合)进一步添加一个图片报头。图片报头(图片报头语法)可以包括能够被共同地应用于图片的信息/参数。切片报头(切片报头语法)可以包括能够被共同地应用于切片的信息/参数。自适应参数集(APS)或图片参数集(PPS)可以包括能够被共同地应用于一个或多个图片的信息/参数。序列参数集(SPS)可以包括能够被共同地应用于一个或多个序列的信息/参数。视频参数集(VPS)可以包括能够被共同地应用于多个层的信息/参数。解码参数集(DPS)可以包括能够被共同地应用于整体视频的信息/参数。DPS可以包括与编译视频序列(CVS)的级联相关的信息/参数。
在本文档中,高级别语法可以包括APS语法、PPS语法、SPS语法、VPS语法、DPS语法、图片报头语法和切片报头语法中的至少一个。
另外,例如,关于拼块/拼块组/图块/切片的分区和配置等的信息可以基于高级别语法在编码设备中被配置,并且然后能够以比特流格式被递送(或传送)到解码设备。
图片可以被分区成一个或多个拼块行和一个或多个拼块列。拼块是覆盖图片的矩形区域的CTU的序列。拼块可以被分区成一个或多个图块,并且每个图块可以由多个CTU行来配置。未被分区成多个图块的拼块也可以被称为图块。然而,作为拼块的子集的图块不被称为拼块。切片可以包括多个拼块或拼块的多个图块。
图4示出图片解码过程的示例。
在图像/视频编译中,可以根据解码顺序对配置图像/视频的图片进行编码/解码。与解码的图片的输出顺序相对应的图片顺序可以与解码顺序不同地配置。并且,当基于配置的图片顺序来执行帧间预测时,可以执行正向预测以及反向预测。
图4示出能够应用本公开的实施例的图片解码过程的一般示例。在图4中,S400可以由上面在图3中描述的解码设备的熵解码器310执行,S410可以由预测器330执行,S420可以由残差处理器320执行,S430可以由加法器340执行,并且S440可以由滤波器350执行。S400可以包括在本说明书中描述的信息解码过程,S410可以包括在本说明书中描述的帧间/帧内预测过程,S420可以包括在本说明书中描述的残差处理过程,S430可以包括在本说明书中描述的块/图片重构过程,并且S440可以包括在本说明书中描述的环路滤波过程。
参考图4,如上面的图3中所述,图片解码过程通常可以包括(通过解码)从比特流获得图像/视频信息的过程(S400)、图片重构过程(S410到S430)以及用于重构图片的环路滤波过程(S440)。图片重构过程可以基于通过执行帧间/帧内预测过程(S410)和残差处理过程(S420,对量化的变换系数的解量化和逆变换过程)获得的预测样本和残差样本被执行。通过对通过执行图片重构过程生成的重构图片执行环路滤波过程,可以生成修改的重构图片,并且可以将修改的重构图片作为解码图片被输出,然后将其存储在解码设备的图像缓冲区或存储器360中,使得在后续过程中执行图片的解码时在帧间预测过程期间用作参考图像。在一些情况下,可以跳过环路滤波过程。并且,在这种情况下,可以将重构图片作为解码的图片输出,然后将其存储在解码设备的解码图片缓冲区或存储器360中,使得在后续过程中执行图片的解码时在帧间预测过程中用作参考图片。如上所述,环路滤波过程(S440)可以包括去块滤波过程、样本自适应偏移(SAO)过程、自适应环路滤波器(ALF)过程和/或双边滤波器过程等,并且可以跳过部分或全部的环路滤波过程。另外,去块滤波过程、样本自适应偏移(SAO)过程、自适应环路滤波器(ALF)过程和双边滤波器过程中的一个或部分可以被顺序地应用,或者所有去块滤波过程、样本自适应偏移(SAO)过程、自适应环路滤波器(ALF)过程和双边滤波器过程可以被顺序地应用。例如,在将去块滤波过程应用于重构图片之后,可以执行SAO过程。可替选地,例如,在将去块滤波过程应用于重构图片之后,可以执行ALF过程。这也可以类似地在编码设备中执行。
图5示出图片编码过程的示例。
图5示出能够应用本公开的实施例的图片编码过程的一般示例。在图5中,S500可以由上面在图2中描述的编码设备的预测器220执行,S510可以由残差处理器230执行,并且S520可以由熵编码器240执行。S500可以包括本说明书中描述的帧间/帧内预测过程,S610可以包括在本说明书中描述的残差处理过程,并且S520可以包括在本说明书中描述的信息编码过程。
参考图5,如上面图2中所描述的,图像编码过程一般可以包括对用于图片重构的信息(例如,预测信息、残差信息、分区信息等)进行编码并以比特流格式输出编码的信息的过程,以及生成用于当前图片的重构图片的过程和对重构图片应用环路滤波的过程(可选)。编码设备可以通过解量化器234和逆变换器235从量化的变换系数导出残差样本(修改的),并且然后编码设备可以基于作为S500的输出的预测样本和(修改的)残差样本来生成重构图片。如上所述生成的重构图片可以与在解码设备中生成的上述重构图片相同。可以通过对重构图片执行环路滤波过程来生成修改的重构图片,然后将其存储在解码设备的解码图片缓冲区或存储器270中。并且,正如在解码设备中一样,在对图片进行编码时,在帧间预测过程期间,可以将修改的重构图片用作参考图片。如上所述,在一些情况下,可以跳过部分或全部的环路滤波过程。当执行环路滤波过程时,(环路)滤波相关信息(参数)可以在熵编码器240中被编码,并且然后以比特流格式被发送,并且解码设备可以通过使用与基于滤波相关信息的编码设备相同的方法来执行环路滤波过程。
通过执行上述环路滤波过程,可以减少在对图像/运动图片图像进行编译时出现的噪声,诸如块伪影(blocking artifact)和振铃伪影(ringing artifact),并且可以增强主观/客观的视觉质量。另外,通过使编码设备和解码设备都执行环路滤波过程,编码设备和解码设备可以导出相同的预测结果,增加图像编译的可靠性,并减少应为图像编译发送的数据的大小(或量)。
如上所述,可以在解码设备以及编码设备中执行图片重构过程。可以基于帧内预测/帧间预测为每个块单元生成重构块,并且可以生成包括重构块的重构图片。在当前图片/切片/拼块组是I图片/切片/拼块组时,可以仅基于帧内预测来重构当前图片/切片/拼块组中包括的块。同时,在当前图片/切片/拼块组是P或B图片/切片/拼块组时,可以基于帧内预测或帧间预测来重构当前图片/切片/拼块组中包括的块。在这种情况下,可以将帧间预测应用于当前图片/切片/拼块组内的部分块,并且可以将帧内预测应用于剩余的块。图片的颜色分量可以包括亮度分量和色度分量。并且,除非在本说明书中显式限定(或限制),否则本说明书中提出的方法和实施例可以应用于亮度分量和色度分量。
同时,基于帧间预测的视频/图像编码过程通常可以包括例如以下内容。
图6示出基于帧间预测的视频/图像编码方法的示例,并且图7示出编码设备中的帧间预测器的一般视图。
参考图6和图7,编码设备对当前块执行帧间预测(S600)。编码设备可以导出当前块的帧间预测模式和运动信息并且生成当前块的预测样本。这里,确定帧间预测模式、导出运动信息和生成预测样本的过程可以全部被同时执行,或者可以在其他过程之前执行在上面提及的过程中的任意一个。例如,编码设备的帧间预测器221可以包括预测模式确定器221_1、运动信息导出器221_2和预测样本导出器221_3。预测模式确定器221_1可以确定用于当前块的预测模式,运动信息导出器221_2可以导出当前块的运动信息,并且预测样本导出器221_3可以导出当前块的预测样本。例如,编码设备的帧间预测器可以通过运动估计在参考图片的预定区域(搜索区域)内搜索与当前块相似的块,并且然后,编码设备的帧间预测器可以导出与当前块具有最小差或与当前块具有等于或低于预定参考标准的差的参考块。基于这种差,可以导出指示参考块所位于的参考图片的参考图片索引,并且可以基于参考块和当前块之间的位置差来导出运动矢量。编码设备可以在各种预测模式之中确定应用于当前块的模式。编码设备可以比较用于各种预测模式的率失真(RD)成本,并且确定用于当前块的最佳预测模式。
例如,在对当前块应用跳过模式或合并模式时,编码设备配置合并候选列表,并且在由合并候选列表中包括的合并候选指示的参考块之中,可以导出与当前块具有最小差或与当前块具有等于或低于预定参考标准的差的参考块。在这种情况下,可以选择与导出的参考块相关联的合并候选,并且可以生成指示所选择的合并候选的合并索引信息,并且然后将其用信号发送给解码设备。可以通过使用选择的合并候选的运动信息来导出当前块的运动信息。
作为另一示例,当(A)MVP模式被应用于当前块时,编码设备配置(A)MVP候选列表,并且从在(A)MVP候选列表中包括的mvp候选选择的所选择的运动矢量预测值(mvp)候选的运动矢量,可以用作当前块的mvp。在这种情况下,例如,指示通过上述运动估计导出的参考块的运动矢量可以用作当前块的运动矢量,并且在mvp候选之中,具有与当前块的运动矢量有最小差的运动矢量的mvp候选可以是所选择的mvp候选。可以导出运动矢量差(MVD),其是通过从当前块的运动矢量减去mvp而获得的差。在这种情况下,可以将与MVD相关的信息用信号发送给解码设备。另外,当应用(A)MVP模式时,参考图片索引的值可以由参考图片索引信息来配置并且可以被单独地用信号发送解码设备。
编码设备可以基于预测样本来导出残差样本(S610)。编码设备可以通过将预测样本与当前块的原始样本进行比较来导出残差样本。
编码设备对包括预测信息和残差信息的图像信息进行编码(S620)。编码设备能够以比特流格式输出编码的图像信息。预测信息可以是与预测过程相关的信息,其可以包括预测模式信息(例如,跳过标志、合并标志或模式索引等)以及与运动信息相关的信息。与运动信息相关的信息可以包括候选选择信息(例如,合并索引、mvp标志或mvp索引),其是用于导出运动矢量的信息。另外,与运动信息相关的信息可以包括上述关于MVD的信息和/或参考图片索引信息。另外,与运动信息相关的信息可以包括指示是应用L0预测、L1预测或者双向预测的信息。残差信息是与残差样本相关的信息。残差信息可以包括与用于残差样本的量化的变换系数相关的信息。
输出的比特流可以被存储在(数字)存储介质中,并且然后递送到解码设备,或者输出的比特流可以通过网络被递送到解码设备。
同时,上述编码设备可以基于参考样本和残差样本来生成重构图片(包括重构样本和重构块)。执行此操作使得编码设备能够导出与通过在解码设备中执行的预测过程获得的预测结果相同的预测结果,并且还因为可以相应地增强编译效率。因此,编码设备可以将重构图片(或重构样本、重构块)存储在存储器中,并且可以将存储的图片用作用于帧间预测的参考图片。如上所述,可以将环路滤波过程等进一步应用于重构图片。
基于帧间预测的视频/图像解码过程通常可以包括例如以下内容。
图8示出基于帧间预测的视频/图像解码方法的示例,并且图9示出解码设备中的帧间预测器的一般视图。
解码设备可以执行与由编码设备执行的操作相对应的操作。解码设备可以基于接收到的预测信息对当前块执行预测并且可以导出预测样本。
更具体地,参考图8和图9,解码设备可以基于从比特流接收到的预测信息来确定用于当前块的预测模式(S800)。解码设备可以基于预测信息内的预测模式信息来确定将哪个帧间预测模式应用于当前块。
例如,可以基于合并标志来确定是否将合并模式应用于当前块或者是否确定(A)MVP模式。可替选地,可以基于合并索引从各种帧间预测模式候选来选择一个帧间预测模式候选。帧间预测模式候选可以包括各种帧间预测模式,诸如跳过模式、合并模式和/或(A)MVP模式等。
解码设备基于所确定的帧间预测模式来导出当前块的运动信息(S810)。例如,在对当前块应用跳过模式或合并模式时,解码设备配置稍后将详细描述的合并候选列表,并且可以从合并候选列表中包括的合并候选来选择一个合并候选。可以基于上述合并索引来执行选择。可以通过使用所选择的合并候选的运动信息来导出当前块的运动信息。所选择的合并候选的运动信息可以用作当前块的运动信息。
作为另一示例,当(A)MVP模式应用于当前块时,解码设备配置(A)MVP候选列表,并且从在(A)MVP候选列表中包括的mvp候选中选择的所选择的运动矢量预测值(mvp)候选的运动矢量可以用作当前块的mvp。可以基于上述选择信息(mvp标志或mvp索引)来执行选择。并且,在这种情况下,可以基于关于MVD的信息来导出当前块的MVD,并且可以基于当前块的mvp和MVD来导出当前块的运动矢量。另外,可以基于参考图片索引信息来导出当前块的参考图片索引。由与当前块相关的参考图片列表内的参考图片索引所指示的图片可以被导出作为参考图片,该参考图片被参考用于当前块的帧间预测。
同时,可以在不配置任何候选列表的情况下导出当前块的运动信息,并且在这种情况下,可以跳过上述候选列表配置。
解码设备可以基于当前块的运动信息来生成用于当前块的预测样本(S820)。在这种情况下,解码设备可以基于当前块的参考图片索引来导出参考图片,并且然后,解码设备可以通过使用由参考图片中的当前块的运动矢量所指示的参考块的样本来导出当前块的预测样本。在这种情况下,在当前块的预测样本之中,可以进一步对当前块的全部或部分预测样本执行预测样本过滤过程,这将在后面更详细地描述。
例如,解码设备的帧间预测器332可以包括预测模式确定器332_1、运动信息导出器332_2和预测样本导出器332_3。预测模式确定器332_1可以基于接收到的预测模式信息来确定用于当前块的预测模式,运动信息导出器332_2可以基于接收到的运动信息的信息来导出当前块的运动信息(运动矢量和/或参考图片索引等),并且预测样本导出器332_3可以导出当前块的预测样本。
解码设备基于接收到的残差信息来生成用于当前块的残差样本(S830)。解码设备可以基于预测样本和残差样本来生成用于当前块的重构样本,并且基于生成的重构样本来生成重构图片(S840)。此后,如上所述,可以将环路滤波过程等进一步应用于重构图片。
同时,如上所述,可以对高级别语法(HLS)进行编译/用信号发送以用于视频/图像编译。编译的图片可以由一个或多个切片来配置。描述编译的图片的参数在图片报头内被用信号发送,并且描述切片的参数在切片报头内被用信号发送。图片报头以其自己的NAL单元格式承载。并且,切片报头存在于包括切片的有效载荷(即,切片数据)的NAL单元的开始(或起点)。
每个图片与图片报头相关联。图片可以由不同类型的切片(帧内编译的切片(即,I切片)和帧间编译的切片(即,P切片和B切片))配置。因此,图片报头可以包括图片的帧内切片和图片的帧间切片中所需的语法元素。
图片可以被分区成(或划分为)子图片、拼块和/或切片。子图片信令可以存在于序列参数集(SPS)中。并且,拼块和方形切片信令可以存在于图片参数集(PPS)中。光栅扫描切片信令可以存在于切片报头中。
例如,关于图片的分区,下表1中所示的语法元素可以被包括在SPS语法中。
[表1]
Figure BDA0003717540540000291
下面表2中所示的语法元素可以被包括在PPS语法中。
[表2]
Figure BDA0003717540540000301
在表2中,num_slices_in_tile_minus1[i]+1指示当第i切片在单个拼块中包括CTU行的子集时在当前拼块内的切片的数量。num_slices_in_tile_minus1[i]的值应该在包括0到RowHeight[tileY]-1的范围内。这里,tileY是包括第i切片的拼块行的索引。当PPS中不存在num_slices_in_tile_minus1[i]时,num_slices_in_tile_minus1[i]的值被导出为0。
slice_height_in_ctu_minus1[i]+1指示当第i切片在单个拼块中包括CTU行的子集时以CTU行为单位的第i矩形切片的高度。slice_height_in_ctu_minus1[i]的值应该在包括0到RowHeight[tileY]-1的范围内。这里,tileY是包括第i切片的拼块行的索引。
下表3中所示的语法元素可以被包括在切片报头语法中。
[表3]
Figure BDA0003717540540000311
参考表1至表3,在当前的拼块和切片设计中,矩形切片可以包括一个或多个拼块。可替选地,矩形切片可以在单个拼块内包括整数(integer number)(或完整数(wholenumber))个CTU行。
当矩形切片在单个拼块内包括整数(或完整数)个CTU行时(这对应于拼块被分区成两个或多个切片的情况),在当前信令中,每个切片的高度被显式地用信号发送。然而,这种类型的信令并不是最佳的信令方法。
一个拼块内的切片的布局可以包括除了最后切片之外拼块内的切片的高度是统一的情况,以及拼块内的切片的高度是不统一的情况。当除了最后切片之外拼块内的切片的高度是统一的(uniform)时,因为拼块内的排除最后切片的所有切片的高度都相同,所以可以仅用信号发送一个切片的高度而无需显式用信号发送每个切片的高度。当拼块内的切片高度不统一时,需要用信号发送拼块内每个切片的高度。
图示以下附图以描述本说明书的详细示例。附图中指定的装置(或设备)的详细术语或信号/信息的详细术语仅是示例性的。因此,本说明书的技术特征将不仅限于以下附图中使用的详细术语。
本说明书提供以下方法以便于解决上述问题。每种方法的项目可以单独应用,或者可以组合应用。
例如,当一个拼块包括两个或更多个切片时,可以用信号发送在CTU行内显式地用信号发送的多个切片高度。这可以被称为语法元素num_exp_slice_in_tile。在这种情况下,可以用信号发送从0到num_exp_slice_in_tile-1的索引的语法元素(slice_row_height_minus1的数组)。这可以作为ue(v)或u(v)被用信号发送,并且用信号发送这种语法元素的比特的数量可以根据拼块内的CTU行的数量而变化。这里,ue(v)表示0阶指数哥伦布编译的语法元素,并且u(v)指示使用v个比特,其中v的值根据其他语法元素的值而变化。
从拼块内的第一切片到第n切片的每个切片的高度分别被给出从0到num_exp_slice_in_tile-1的slice_row_height_minus1+1的值。在此,n等于显式用信号发送的拼块内切片的数量(num_exp_slice_in_tile)。
尽管始终存在大于num_exp_slice_in_tile_minus1+1并且最后(显式地)用信号发送拼块内的剩余CTU行,但是在拼块内定义新切片。换言之,在拼块内存在没有被显式用信号发送的切片。最后切片的高度可能等于或小于最后用信号发送的num_exp_slice_in_tile_minus1+1。
作为另一示例,当一个拼块包括两个或更多个切片时,可以用信号发送拼块中包括的多个切片。在这种情况下,可以用信号发送指示拼块内的每个切片的高度是否统一的标志。当拼块内的每个切片的高度统一时,可以根据CTU行仅用信号发送一个切片高度。拼块内的每个切片的高度可以基于用信号发送的切片高度被导出。并且,当拼块内的每个切片的高度不统一时,可以显式地用信号发送拼块内的不包括最后切片的每个切片的高度。
在本说明书中,关于切片和/或拼块的信息可以包括在表1至表3中公开的信息和/或语法元素。图像/视频信息可以包括在表1至表3中公开的高级别语法(HLS),并且高级别语法(HLS)可以包括与切片相关的信息和/或与拼块相关的信息。与切片相关的信息可以包括指示当前图片内的一个或多个切片的信息,并且与拼块相关的信息可以包括指示当前图片内的一个或多个拼块的信息。包括一个或多个切片的拼块和包括一个或多个拼块的切片可以存在于图片中。
作为实施例,为了表示图片的分区结构,可以将表4中所示的语法和表5中所示的语义用于PPS。
[表4]
Figure BDA0003717540540000341
[表5]
Figure BDA0003717540540000342
参考表4和表5,num_exp_slices_in_tile[i]+1表示PPS中存在的exp_slice_height_in_ctu_minus1[j]的数量。当PPS中不存在num_exp_slices_in_tile[i]时,将num_exp_slices_in_tile_minus1[i]的值导出为0。
exp_slice_height_in_ctu_minus1[j]+1指示当第i切片在单个拼块中包括CTU行的子集时以CTU行为单位显式用信号发送的第j矩形切片的高度。exp_slice_height_in_ctu_minus1[j]的值应该在包括0到RowHeight[tileY]-1的范围内。这里,tileY是包括切片的拼块行的索引。
也就是说,num_exp_slices_in_tile[i]可以被称为关于其高度在当前图片的拼块内被显式地用信号发送的切片的数量的信息(数量信息)。并且,exp_slice_height_in_ctu_minus1[j]可以被称为关于具有显式地用信号发送的其高度的每个切片的高度的信息(高度信息)。
数量信息和高度信息可以是指数哥伦布编译的语法元素。
可以基于关于包括拼块的切片的宽度和高度的信息来解析数量信息。当拼块包括第i切片时,包括拼块的切片的宽度信息可以对应于语法元素slice_width_in_tiles_minus1[i],并且包括拼块的切片的高度信息可以对应于语法元素slice_height_in_tiles_minus1[i]。第i切片可以是矩形切片,并且拼块内的切片也可以被分区成矩形切片。
例如,编码设备可以基于关于当前图片的切片的信息来生成数量信息和高度信息。数量信息和高度信息可以被包括在图像信息中并且以比特流格式被用信号发送给解码设备。
当从PPS解析数量信息时,如表4中所示,解码设备可以基于数量信息从PPS解析高度信息。例如,当数量信息的值等于n(其中n是等于或大于0的整数)时,解码设备可以从PPS解析关于n个切片的高度信息(从拼块内的第0切片开始到第(n-1)切片)。高度信息可以指示编译树单元(CTU)行中的第0切片的高度到第(n-1)切片的高度中的每个。
此后,解码设备可以基于第(n-1)切片的高度来导出拼块内的剩余切片的高度。更具体地,解码设备可以将从拼块内的第n切片开始的拼块内的排除最后切片的剩余切片的高度导出为等于第(n-1)切片的高度。为此,解码设备可以比较拼块的剩余高度,该剩余高度是通过从拼块的总高度减去从第0切片开始到第(n-1)切片的切片的高度之和来计算的,以便确定剩余高度是否等于或大于统一切片高度。这里,统一切片可以意指在拼块内具有统一高度(相同高度)的切片。即,统一切片的高度可以与第(n-1)切片的高度相同。
当拼块的剩余高度等于或大于统一切片的高度时,第n切片的高度可以导出为统一切片的高度。并且,当拼块的剩余高度小于统一切片的高度时,可以导出第n切片的高度作为剩余高度。另外,当拼块的剩余高度等于或大于统一切片的高度时,可以通过从剩余高度减去第n切片的高度来导出更新的剩余高度。并且,当更新的剩余高度等于或大于统一切片的高度时,解码设备可以导出第(n+1)切片的高度作为统一切片的高度。当更新的剩余高度小于统一切片的高度时,解码设备可以导出第(n+1)切片的高度的高度作为更新的剩余高度。即,排除拼块内的最后切片,从第n切片开始到最后切片的切片的高度可以被导出作为统一高度。最后切片的高度可以等于或小于每个统一切片的高度(从第(n-1)切片开始到紧接在最后切片之前的切片)的高度。
例如,当一个拼块中包括5个切片时,并且当数量信息指示3时,可以从PPS解析该拼块内的第一切片到第三切片的高度信息,并且可以导出拼块内的第四切片的高度以具有与第三切片相同的高度。在这种情况下,第五切片的高度可以大于或小于第四切片的高度。
解码设备可以通过执行上述扫描过程来导出拼块内的切片的数量。当数量信息的值大于0时,导出关于拼块内的每个切片的高度的信息和关于拼块内的切片的数量的信息的过程可以被指示,如下表5所示。
[表6]
Figure BDA0003717540540000371
在矩形切片的情况下,包括0到num_slices_in_pic_minus1范围内的i的列表NumCtuInSlice[i]可以指示第i切片内的CTU的数量,包括0到num_slices_in_pic_minus1的范围的i和包括0到NumCtuInSlice[i]-1的范围的j的矩阵CtbAddrInSlice[i][j]指示第i切片内的第j CTB的图片光栅扫描寻址,并且可以如下表7中所示被导出。
[表7]
Figure BDA0003717540540000381
作为另一实施例,为了表示图片的分区结构,可以将表8中所示的语法和表9中所示的语义用于PPS。
[表8]
Figure BDA0003717540540000391
[表9]
Figure BDA0003717540540000392
Figure BDA0003717540540000401
参考表8和表9,如果uniform_slice_spacing_flag[i]的值等于1,这指示CTU行在整个拼块中均匀分布(或分散),并通过使用语法元素uniform_slice_height_in_ctu_minus1[i]用信号发送。如果uniform_slice_spacing_flag[i]的值等于0,这指示CTU行在整个拼块中可以或者可以不均匀分布(或分散),并通过使用语法元素num_slices_in_tile_minus1[i]和slice_height_in_ctu_minus1[i]用信号发送。
当uniform_slice_spacing_flag[i]的值等于1时,slice_rows_height_in_ctu_minus1[i]+1指示以CTB为单位的排除拼块的最后切片的切片的高度。slice_height_in_ctu_minus1[i]的值应该在包括0到RowHeight[tileY]-1的范围内。这里,tileY是包括切片的拼块行的索引。
num_slices_in_tile_minus1[i]+1指示当第i切片在单个拼块中包括CTU行的子集并且当uniform_slice_spacing_flag[i]的值等于0时当前切片内的切片的数量。num_slices_in_tile_minus1[i]的值应该在包括0到RowHeight[tileY]-1的范围内。这里,tileY是包括第i切片的拼块行的索引。当num_slices_in_tile_minus1[i]不存在时,num_slices_in_tile_minus1[i]的值被导出为0。
slice_height_in_ctu_minus1[i]+1指示当第i切片在单个拼块中包括CTU行的子集时以CTU行为单位的第i矩形切片的高度。slice_height_in_ctu_minus1[i]的值应该在包括0到RowHeight[tileY]-1的范围内。这里,tileY是包括第i切片的拼块行的索引。
例如,编码设备可以基于关于当前图片的切片的信息来生成uniform_slice_spacing_flag、slice_rows_height_in_ctu_minus1、num_slices_in_tile_minus1和slice_height_in_ctu_minus1中的至少一个。
当从PPS解析uniform_slice_spacing_flag时,如表8中所示,解码设备可以基于uniform_slice_spacing_flag的值从PPS解析slice_rows_height_in_ctu_minus1或num_slices_in_tile_minus1。例如,如果uniform_slice_spacing_flag的值等于1,则解码设备可以从PPS解析slice_rows_height_in_ctu_minus1,并且然后可以基于slice_rows_height_in_ctu_minus1的值将解析结果导出作为拼块内的排除最后切片的剩余切片的高度。如果uniform_slice_spacing_flag的值等于0,则解码设备可以从PPS解析num_slices_in_tile_minus1和slice_height_in_ctu_minus1,并且可以基于解析的结果来导出拼块内的切片。
例如,与拼块内的切片的数量信息和高度信息相关的变量NumSlicesInTileMinus1[i]和SliceHeightInCtuMinus1[i+k]可以如下所示导出。这里,k可以在包括0到NumSlicesInTileMinus1[i]的范围内。
[表10]
Figure BDA0003717540540000421
在矩形切片的情况下,用于包括0到num_slices_in_pic_minus1范围内的i的列表NumCtuInSlice[i]可以指示用于第i切片内的CTU的数量,用于包括0到num_slices_in_pic_minus1的范围的i和用于包括0到NumCtuInSlice[i]-1的范围的j的矩阵CtbAddrInSlice[i][j]指示第i切片内的第j CTB的图片光栅扫描寻址,并且可以如下表11所示被导出。
[表11]
Figure BDA0003717540540000431
图10和图11分别示出根据本公开的实施例的视频/图像编码方法和相关组件的一般示例。
图10中公开的视频/图像编码方法可以由图2和图11中公开的(视频/图像)编码设备200执行。更具体地,例如,图10的S1000可以由编码设备200的图像分区器210执行,并且S1010可以由编码设备200的预测器220执行。S1020可以由编码设备200的残差处理器230执行。并且,S1030和S1040可以由编码设备200的熵编码器240执行。图10公开的视频/图像编码方法可以包括在本说明书中上面描述的实施例。
更具体地,参考图10和图11,编码设备的图像分区器210可以导出当前图片的拼块内的切片(S1000)。例如,图像分区器210可以将输入图像(或图片、帧)分区成一个或多个CU。输入图像可以包括一个或多个图片。图片可以被分区成一个或多个拼块、图块、切片和/或拼块组。切片可以包括一个或多个图块、拼块和/或拼块组。图块可以包括一个或多个CTU行。拼块组可以包括一个或多个拼块。拼块可以包括一个或多个CTU。CTU可以被分区成一个或多个CU。在当前图片内的特定切片是矩形切片时,图像分区器210可以将矩形切片分区成多个拼块,并且在多个拼块之中,图像分区器210可以分区至少一个拼块,并且然后导出多个矩形切片。
编码设备的预测器220可以基于在图像分区器210中导出的切片对当前块执行预测,并且然后可以生成当前块的预测样本(预测块)和预测相关信息(S1010)。预测器220可以确定是否正在应用帧内预测,或者是否正在当前块或CU单元中应用帧间预测。预测器220可以向熵编码器240递送与预测相关的各种信息(预测相关信息)。这里,预测相关信息可以包括与帧间预测模式相关的信息和与帧内预测模式相关的信息。在当前块的预测模式是帧间预测模式时,可以在预测器220的帧间预测器221中生成预测样本。并且,在当前块的预测模式是帧内预测模式时,预测样本可以在预测器220的帧内预测器222中被生成。
编码设备的残差处理器230可以基于从预测器220生成的预测样本和原始图片(原始块、原始样本)来生成残差样本和残差信息(S1020)。这里,残差信息是与残差样本相关的信息,并且残差信息可以包括与残差样本的(量化的)变换系数相关的信息。
编码设备的加法器(或重构器)可以通过将在残差处理器230中生成的残差样本和将在残差处理器230中生成的预测样本与在帧间预测器221或帧内预测器222中生成的预测样本相加来生成重构样本(重构图片、重构块、重构样本阵列)。
编码设备的熵编码器240可以基于在图像分区器210中导出的分区结构来生成与分区相关的信息。分区相关信息可以包括关于在拼块内的每个具有显式地用信号发送的其高度的切片的数量的信息(数量信息)以及关于每个具有显式地用信号发送的其高度的切片的高度的信息(高度信息)。例如,熵编码器240可以基于在图像分区器210中导出的切片来生成与在拼块内的每个具有显式地用信号发送(提供)的其高度的切片的数量相关的数量信息以及与每个具有显式地用信号发送(提供)的其高度的切片的高度相关的高度信息(S1030)。这里,数量信息可以包括上述语法元素num_exp_slices_in_tile和/或num_slices_in_tile_minus1。高度信息可以包括上述语法元素exp_slice_height_in_ctu_minus1、slice_rows_height_in_ctu_minus1和/或slice_height_in_ctu_minus1。
熵编码器240可以对图像信息进行编码,该图像信息包括分区相关信息,其包括数量信息和高度信息、在预测器220中生成的预测相关信息和/或在残差处理器230中生成的残差信息(S1040)。在熵编码器240中编码的信息能够以比特流格式输出。比特流可以通过网络或存储介质被发送到解码设备。
例如,熵编码器240可以包括图像信息,该图像信息包括作为数量信息的语法元素num_exp_slices_in_tile和作为基于上述表4和表5的高度信息的语法元素exp_slice_height_in_ctu_minus1。高度信息可以指示以CTU行为单位在拼块内的每个具有显式地用信号发送的其高度的切片的高度,并且为此,高度信息可以包括用于每个具有显式地用信号发送的其高度的切片的语法元素。在图像信息中包括的语法元素的数量可以与数量信息值相同。
作为另一示例,熵编码器240可以基于上述表8和表9对包括语法元素uniform_slice_spacing_flag、num_slices_in_tile_minus1、slice_rows_height_in_ctu_minus1和/或slice_height_in_ctu_minus1的图像信息进行编码。语法元素num_slices_in_tile_minus1、slice_rows_height_in_ctu_minus1和slice_height_in_ctu_minus1可以被包括在或可以不被包括在基于uniform_slice_spacing_flag值的图像信息中。
熵编码器240可以通过图像信息内的图片参数集(PPS)用信号发送数量信息和高度信息。在这种情况下,熵编码器240可以通过使用指数哥伦布方法来包括数量信息和/或高度信息。
图12和图13分别示出根据本公开的实施例的视频/图像解码方法和相关组件的一般示例。
图12中公开的视频/图像解码方法可以由图3和图13中公开的(视频/图像)解码设备300执行。更具体地说,例如,图12的S1200至S1220可以由解码设备的熵解码器310。图12的S1230可以由解码设备的预测器330来执行。并且,图12的S1240和S1250可以由解码设备的加法器340来执行。图12中公开的视频/图像解码方法可以包括在本说明书中上面描述的实施例。
参考图12和图13,解码设备的熵解码器310可以从比特流获得分区相关信息、残差信息、预测相关信息(帧间/帧内预测差分信息、帧内预测模式信息、帧间预测模式信息等)、环路滤波相关信息等。这里,分区相关信息可以包括关于在当前图片的拼块内的切片之中的每个具有显式地用信号发送的其高度的切片的数量的信息(数量信息)、关于每个具有显式地用信号发送的其高度的切片的高度的信息(高度信息)等。
例如,熵解码器310可以从比特流解析与在当前图片的拼块内的切片之中的每个具有显式地用信号发送的其高度的切片的数量相关的信息(数量信息)(S1200),并且可以基于数量信息从比特流解析与每个具有显式地用信号发送的其高度的切片的高度相关的信息(高度信息)(S1210)。更具体地,熵解码器310可以基于上述表4从比特流的图片参数集(PPS)解析数量信息和高度信息。这里,可以基于关于包括拼块的切片的宽度和高度的信息来解析数量信息。此时,包括拼块的切片和/或拼块内的切片可以是矩形切片。数量信息和高度信息可以是指数哥伦布编译的语法元素。高度信息可以包括用于每个切片的语法元素,每个切片具有显式地用信号发送的其高度。语法元素的数量可以与数量信息值相同。
例如,熵解码器310可以基于表4从图片参数集(PPS)解析语法元素slice_width_in_tiles_minus1和slice_height_in_tiles_minus1,并且熵解码器310可以基于语法元素slice_width_in_tiles_minus1和slice_height_in_tiles_minus1的值从图片参数集(PPS)解析语法元素num_exp_slices_in_tile。并且,熵解码器310可以从图片参数集(PPS)解析与语法元素num_exp_slices_in_tile的值等效的exp_slice_height_in_ctu_minus1的数量。
当数量信息的值等于n时,熵解码器310可以基于高度信息来导出拼块内的第0切片到第(n-1)切片的高度。并且,熵解码器310可以基于第(n-1)切片的高度来导出拼块内的第n切片的高度。即,第n切片的高度可以导出为与第(n-1)切片的高度相同。这里,第n切片可以不是拼块内的最后切片。换言之,熵解码器310可以导出排除拼块内的最后切片的剩余切片(不显式地用信号发送的切片)的高度,以具有与第(n-1)切片相同的高度。因此,除了拼块内的最后切片之外,从拼块内的第n切片开始到最后切片的切片的高度可以是统一的。熵解码器310可以基于在从拼块的高度减去拼块内的其他切片的高度之后的剩余高度来导出拼块内的最后切片的高度。当导出拼块内的所有切片的高度时,熵解码器310可以导出拼块内的切片的数量(S1220)。这里,拼块内的切片的数量可以对应于从拼块内的从第0切片开始到最后切片的切片的数量。
解码设备300可以基于通过执行上述过程导出的当前图片的切片来解码当前图片。更具体地,解码设备的残差处理器320可以基于从熵解码器310获得的残差信息来生成残差样本。解码设备的预测器330可以基于从熵解码器310获得的预测相关信息对包括在图片内的切片中的当前块执行帧间预测和/或帧内预测以便生成预测样本(S1230)。解码设备的加法器340可以基于在预测器330中生成的预测样本和在残差处理器320中生成的残差样本来生成重构样本(S1240)。并且,解码设备的加法器340可以基于重构样本来生成重构图片(重构块)(S1250)。
此后,可以根据需要将诸如去块滤波、SAO和/或ALF过程的环路滤波过程应用于重构图片,以便于增强主观/客观图片质量。
同时,作为另一示例,熵解码器310可以基于表8从比特流的图片参数集(PPS)解析语法元素slice_width_in_tiles_minus1和slice_height_in_tiles_minus1,并且熵解码器310可以基于语法元素slice_width_in_tiles_minus1和slice_height_in_tiles_minus1的值从图片参数集(PPS)解析语法元素uniform_slice_spacing_flag。在这种情况下,熵解码器310可以基于语法元素uniform_slice_spacing_flag的值从图片参数集(PPS)解析语法元素slice_rows_height_in_ctu_minus1或解析语法元素num_slices_in_tile_minus1。当语法元素uniform_slice_spacing_flag的值等于1时,可以解析语法元素slice_rows_height_in_ctu_minus1,并且当语法元素uniform_slice_spacing_flag的值等于0时,可以解析语法元素num_slices_in_tile_minus1。
当语法元素slice_rows_height_in_ctu_minus1被解析时,熵解码器310可以导出拼块内的排除最后切片的剩余切片的高度作为slice_rows_height_in_ctu_minus1的值。
当解析语法元素num_slices_in_tile_minus1时,熵解码器310可以解析与语法元素num_slices_in_tile_minus1的值相对应的语法元素slice_height_in_ctu_minus1的数量,并且可以将这些值分别各自导出作为拼块内的每个切片的高度。
尽管已经在上述实施例中基于在其中按顺序列举步骤或框的流程图描述了方法,但是本公开的步骤不限于特定次序,并且可以相对于上述次序在不同步骤中或按不同次序或同时地执行某个步骤。此外,本领域的普通技术人员应理解,流程图中的步骤不是排他性的,并且在不对本公开的范围施加影响的情况下,可以在其中包括另一步骤或者可以删除流程图中的一个或多个步骤。
根据本公开的以上提到的方法可以是软件的形式,并且根据本公开的编码设备和/或解码设备可以被包括在用于执行图像处理的装置(例如,TV、计算机、智能电话、机顶盒、显示装置等)中。
当用软件实现本公开的实施方式时,可以用执行以上提到的功能的模块(处理或功能)实现以上提到的方法。模块可以被存储在存储器中并且由处理器执行。存储器可以安装在处理器的内部或外部,并可以经由各种公知装置连接到处理器。处理器可以包括专用集成电路(ASIC)、其他芯片集、逻辑电路和/或数据处理装置。存储器可以包括只读存储器(ROM)、随机存取存储器(RAM)、闪速存储器、存储器卡、存储介质和/或其他存储装置。换句话说,根据本公开的实施方式可以在处理器、微处理器、控制器或芯片上实现和执行。例如,相应图中例示的功能单元可以在计算机、处理器、微处理器、控制器或芯片上实现和执行。在这种情况下,关于实现方式的信息(例如,关于指令的信息)或算法可以被存储在数字存储介质中。
另外,应用本公开的实施方式的解码设备和编码设备可以被包括在多媒体广播收发器、移动通信终端、家庭影院视频装置、数字影院视频装置、监视相机、视频聊天装置、诸如视频通信这样的实时通信装置、移动流传输装置、存储介质、便携式摄像机、视频点播(VoD)服务提供器、顶置(OTT)视频装置、互联网流传输服务提供器、3D视频装置、虚拟现实(VR)装置、增强现实(AR)装置、图像电话视频装置、车载终端(例如,车(包括自主车辆)载终端、飞机终端或轮船终端)和医疗视频装置中;并且可以被用于处理图像信号或数据。例如,OTT视频装置可以包括游戏控制台、Blueray(蓝光)播放器、联网TV、家庭影院***、智能手机、平板PC和数字视频记录仪(DVR)。
另外,应用本公开的实施方式的处理方法能够以由计算机执行的程序的形式产生,并可以被存储在计算机可读记录介质中。根据本公开的实施方式的具有数据结构的多媒体数据也可以被存储在计算机可读记录介质中。计算机可读记录介质包括存储有计算机可读数据的所有种类的存储装置和分布式存储装置。计算机可读记录介质可以包括例如蓝光盘(BD)、通用串行总线(USB)、ROM、PROM、EPROM、EEPROM、RAM、CD-ROM、磁带、软盘和光学数据存储装置。计算机可读记录介质还包括以载波(例如,互联网上的传输)的形式实施的媒体。另外,通过编码方法生成的比特流可以被存储在计算机可读记录介质中,或者可以通过有线或无线通信网络传输。
另外,本公开的实施方式可以基于程序代码被实施为计算机程序产品,并且程序代码可以根据本文献的实施方式在计算机上执行。程序代码可以被存储在计算机可读载体上。
图14表示可以应用本文档的实施例的内容流传输***的示例。
参考图14,应用本文档的实施例的内容流传输***一般可以包括编码服务器、流传输服务器、web服务器、媒体存储(media storage)、用户设备和多媒体输入设备。
编码服务器用来将从诸如智能电话、照相机、便携式摄像机等这样的多媒体输入装置输入的内容压缩为数字数据,生成比特流,并且将其传送至流传输服务器。作为另一示例,在诸如智能电话、照相机、便携式摄像机等这样的多媒体输入装置直接生成码流的情况下,可以省略编码服务器。
可以通过本公开的实施方式应用于的编码方法或比特流生成方法来生成比特流。并且流传输服务器可在发送或接收比特流的过程中暂时存储比特流。
流传输服务器基于用户的请求通过web服务器向用户设备传送多媒体数据,该web服务器充当向用户通知存在什么服务的工具。当用户请求用户想要的服务时,web服务器将请求转移至流传输服务器,并且流传输服务器将多媒体数据传送至用户。在这方面,内容流***可以包括单独的控制服务器,并且在这种情况下,控制服务器用来控制内容流***中的各个设备之间的命令/响应。
流传输服务器可以从媒体存储和/或编码服务器接收内容。例如,在从编码服务器接收到内容的情况下,可实时地接收内容。在这种情况下,流传输服务器可将比特流存储预定时间段以流畅地提供流传输服务。
例如,用户设备可以包括移动电话、智能电话、膝上型计算机、数字广播终端、个人数字助理(PDA)、便携式多媒体播放器(PMP)、导航、板式PC、平板PC、超极本、可穿戴装置(例如,手表型终端(智能手表)、眼镜型终端(智能眼镜)、头戴式显示器(HMD))、数字TV、台式计算机、数字标牌等。
可将内容流***中的每个服务器作为分布式服务器操作,并且在这种情况下,可以分布式方式处理由每个服务器接收的数据。

Claims (15)

1.一种由视频解码设备执行的视频解码方法,所述方法包括:
从比特流解析与当前图片的拼块内的每个具有显式地用信号发送的其高度的切片的数量相关的数量信息;
基于所述数量信息,从所述比特流解析与每个具有显式地用信号发送的其高度的切片的高度相关的高度信息;
基于所述数量信息和所述高度信息来导出所述拼块内的切片的数量;
通过基于所述拼块内的所述切片对所述当前图片的当前块执行预测来生成预测样本;
基于所述预测样本来生成重构样本;以及
基于所述重构样本来生成用于所述当前图片的重构图片,
其中,所述高度信息包括与所述数量信息的值相同数量的语法元素,
其中,基于所述数量信息值等于n,基于所述语法元素来导出所述拼块内的第0切片到第(n-1)切片的高度,
其中,基于所述第(n-1)切片的高度来导出所述拼块内的第n切片的高度,以及
其中,基于从所述拼块的高度减去所述拼块内的其他切片的高度之后的剩余高度来导出所述拼块内的最后切片的高度。
2.根据权利要求1所述的视频解码方法,其中,所述拼块内的切片的数量是从所述第0切片开始到所述最后切片的切片的数量。
3.根据权利要求1所述的视频解码方法,其中,所述第n切片的高度被导出为与所述第(n-1)切片的高度相同。
4.根据权利要求1所述的视频解码方法,其中,在所述拼块内的从所述第n切片开始到紧接在所述最后切片之前的切片的高度是统一的。
5.根据权利要求4所述的视频解码方法,其中,所述最后切片的高度小于或等于所述第(n-1)切片的高度。
6.根据权利要求1所述的视频解码方法,进一步包括:
比较通过从所述拼块的总高度减去从所述第0切片开始到所述第(n-1)切片的切片的高度之和计算的所述拼块的剩余高度,以便确定是否所述剩余高度等于或大于统一切片的高度,
其中,所述统一切片的高度与所述第(n-1)切片的高度相同,
其中,基于通过从所述拼块的总高度减去从所述第0切片到所述第(n-1)切片的切片的高度之和计算的所述拼块的剩余高度等于或者大于所述统一切片的高度,导出具有所述统一切片的高度的所述第n切片,以及
其中,基于通过从所述拼块的总高度减去从所述第0切片开始到所述第(n-1)切片的所述切片的高度之和计算的所述拼块的剩余高度小于所述统一切片的高度,导出具有所述剩余高度的所述第n切片。
7.根据权利要求6所述的视频解码方法,其中,基于所述剩余高度等于或大于所述统一切片的高度,导出更新的剩余高度,其中通过从通过从所述拼块的总高度减去从所述第0切片开始到所述第(n-1)切片的所述切片的高度总和计算的所述拼块的剩余高度减去所述第n切片的高度来更新所述更新的剩余高度,
其中,基于所述更新的剩余高度等于或大于所述统一切片的高度,导出具有所述统一切片的高度的第(n+1)切片,以及
其中,基于所述更新的剩余高度小于所述统一切片的高度,导出具有所述更新的剩余高度的第(n+1)切片。
8.根据权利要求1所述的视频解码方法,其中,所述数量信息和所述高度信息包括指数哥伦布编译的语法元素。
9.根据权利要求1所述的视频解码方法,其中,所述高度信息包括用于具有显式地用信号发送的其高度的每个切片的语法元素,以及
其中,所述语法元素的数量与所述数量信息的值相同。
10.根据权利要求1所述的视频解码方法,其中,所述数量信息包括语法元素num_exp_slices_in_tile,以及
其中,所述高度信息包括语法元素exp_slice_height_in_ctu_minus1。
11.根据权利要求1所述的视频解码方法,其中,所述拼块内的切片是矩形切片。
12.根据权利要求1所述的视频解码方法,其中,基于与包括所述拼块的切片的宽度和高度相关的信息来解析所述数量信息。
13.根据权利要求1所述的视频解码方法,其中,所述高度信息指示编译树单元(CTU)行中的所述第0切片的高度到所述第(n-1)切片的高度中的每个。
14.一种由视频编码设备执行的视频编码方法,所述方法包括:
导出当前图片的拼块内的切片;
通过基于导出的切片对当前块执行预测来生成预测样本;
基于所述预测样本和原始图片来生成残差信息;
基于所述导出的切片来生成与所述拼块内的每个具有显式地用信号发送的其高度的切片的数量相关的数量信息以及与每个具有显式地用信号发送的其高度的所述切片的高度相关的高度信息;以及
对包括所述残差信息、所述数量信息和所述高度信息的图像信息进行编码,
其中,基于所述数量信息的值等于n,所述高度信息指示所述拼块内的第0切片到第(n-1)切片的高度,
其中,基于所述第(n-1)切片的高度来导出所述拼块内的第n切片的高度,以及
其中,基于从所述拼块的高度减去所述拼块内的其他切片的高度之后的剩余高度来导出所述拼块内的最后切片的高度。
15.一种具有存储在其中的信息的计算机可读数字记录介质,所述信息使视频解码方法由视频解码设备执行,其中所述视频解码方法包括:
从图像信息解析与当前图片的拼块内的每个具有显式地用信号发送的其高度的切片的数量相关的数量信息;
基于所述数量信息从所述图像信息解析与每个具有显式地用信号发送的其高度的切片的高度相关的高度信息;
基于所述数量信息和所述高度信息来导出所述拼块内的切片的数量;
通过基于所述拼块内的所述切片对所述当前图片的当前块执行预测来生成预测样本;
基于所述预测样本来生成重构样本;以及
基于所述重构样本来生成用于所述当前图片的重构图片,
其中,所述高度信息包括与所述数量信息的值相同数量的语法元素,
其中,基于所述数量信息值等于n,基于所述语法元素来导出所述拼块内的第0切片到第(n-1)切片的高度,
其中,基于所述第(n-1)切片的高度来导出所述拼块内的第n切片的高度,以及
其中,基于从所述拼块的高度减去所述拼块内的其他切片的高度之后的剩余高度来导出所述拼块内的最后切片的高度。
CN202080090684.2A 2019-11-28 2020-11-26 图像/视频编码/解码***中与切片相关的信令信息的方法和设备 Pending CN114902681A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962941845P 2019-11-28 2019-11-28
US62/941,845 2019-11-28
PCT/KR2020/016891 WO2021107626A1 (ko) 2019-11-28 2020-11-26 영상/비디오 인코딩/디코딩 시스템에서 슬라이스에 관한 정보의 시그널링 방법 및 장치

Publications (1)

Publication Number Publication Date
CN114902681A true CN114902681A (zh) 2022-08-12

Family

ID=76128703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080090684.2A Pending CN114902681A (zh) 2019-11-28 2020-11-26 图像/视频编码/解码***中与切片相关的信令信息的方法和设备

Country Status (11)

Country Link
US (3) US11509905B2 (zh)
EP (1) EP4068786A4 (zh)
JP (2) JP7310022B2 (zh)
KR (1) KR20220087515A (zh)
CN (1) CN114902681A (zh)
AU (2) AU2020393729B2 (zh)
BR (1) BR112022010363A2 (zh)
CA (1) CA3162960A1 (zh)
MX (1) MX2022006429A (zh)
WO (1) WO2021107626A1 (zh)
ZA (1) ZA202206762B (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6080405B2 (ja) * 2012-06-29 2017-02-15 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
CN104838654B (zh) * 2012-12-06 2018-11-06 索尼公司 解码装置、解码方法以及程序
US20140362098A1 (en) * 2013-06-10 2014-12-11 Sharp Laboratories Of America, Inc. Display stream compression
WO2015058722A1 (en) * 2013-10-25 2015-04-30 Mediatek Inc. Method and apparatus for improving visual quality by using neighboring pixel information in flatness check and/or applying smooth function to quantization parameters/pixel values
CN108293111B (zh) * 2015-10-16 2022-07-08 Lg电子株式会社 改善图像编码***中的预测的滤波方法、装置和存储介质
US10574988B2 (en) * 2015-11-19 2020-02-25 Qualcomm Incorporated System and methods for reducing slice boundary visual artifacts in display stream compression (DSC)
US10448024B2 (en) * 2016-01-11 2019-10-15 Qualcomm Incorporated System and methods for calculating distortion in display stream compression (DSC)
CN112740680A (zh) * 2018-09-19 2021-04-30 韩国电子通信研究院 图像编码/解码方法和设备以及存储比特流的记录介质

Also Published As

Publication number Publication date
US11509905B2 (en) 2022-11-22
JP2023504419A (ja) 2023-02-03
EP4068786A4 (en) 2023-10-11
AU2020393729B2 (en) 2024-02-29
CA3162960A1 (en) 2021-06-03
US20240129475A1 (en) 2024-04-18
WO2021107626A1 (ko) 2021-06-03
JP2023118851A (ja) 2023-08-25
BR112022010363A2 (pt) 2022-08-16
ZA202206762B (en) 2023-11-29
US20230055810A1 (en) 2023-02-23
AU2020393729A1 (en) 2022-07-07
MX2022006429A (es) 2022-09-07
AU2023248155A1 (en) 2023-11-02
JP7310022B2 (ja) 2023-07-18
US11902528B2 (en) 2024-02-13
US20220295070A1 (en) 2022-09-15
KR20220087515A (ko) 2022-06-24
EP4068786A1 (en) 2022-10-05

Similar Documents

Publication Publication Date Title
CN113678456A (zh) 用信号通知关于色度格式的信息的方法和装置
CN115244938A (zh) 基于预测加权表对图像/视频进行编译的方法和装置
CN115088263A (zh) 基于预测加权表的图像/视频编译方法和设备
CN115280783A (zh) 用于图像/视频编码的加权预测的方法和装置
CN115244927A (zh) 图像/视频编码***中的帧间预测方法和设备
CN114762351A (zh) 图像/视频编译方法和装置
CN115104315A (zh) 基于nal单元相关信息的图像或视频编码
CN115104316A (zh) 用于切片或图片的基于nal单元类型的图像或视频编码
CN114073078A (zh) 视频/图像编译***中的语法信令的方法和装置
JP2023118843A (ja) 映像/ビデオコーディング方法及び装置
CN115088264A (zh) 图像/视频编码/解码方法和使用该方法的设备
CN114982242A (zh) 发信号通知图片分割信息的方法和设备
CN114762349A (zh) 用于图像/视频编译的高级别语法信令方法和装置
CN115104314A (zh) 基于加权预测的图像/视频编译方法及装置
CN114762350A (zh) 基于切片类型的图像/视频编译方法和设备
CN114788291A (zh) 用于处理图像信息以进行图像/视频编译的方法和装置
US11902528B2 (en) Method and device for signaling information related to slice in image/video encoding/decoding system
AU2020392151B2 (en) Image/video encoding/decoding method and device
US12022127B2 (en) Image/video coding method and apparatus on basis of picture division structure
CN114930855A (zh) 用于图像/视频编译的切片和拼块配置
CN115004708A (zh) 用于发信号通知图像信息的方法和设备
CN115004709A (zh) 用于发信号通知切片相关信息的方法和装置
CN114982231A (zh) 图像解码方法及用于其的装置
CN116134816A (zh) 在图像/视频编码***中处理一般约束信息的方法和设备
CN115136604A (zh) 基于nal单元类型的图像或视频编码

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination