CN118140476A - 利用几何帧内预测模式的视频编解码的方法和装置 - Google Patents

利用几何帧内预测模式的视频编解码的方法和装置 Download PDF

Info

Publication number
CN118140476A
CN118140476A CN202280070919.0A CN202280070919A CN118140476A CN 118140476 A CN118140476 A CN 118140476A CN 202280070919 A CN202280070919 A CN 202280070919A CN 118140476 A CN118140476 A CN 118140476A
Authority
CN
China
Prior art keywords
intra
current block
intra prediction
prediction mode
geometric
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280070919.0A
Other languages
English (en)
Inventor
安镕照
李钟石
许镇
朴胜煜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hyundai Motor Co
Kia Corp
DigitalInsights Inc
Original Assignee
Hyundai Motor Co
Kia Corp
DigitalInsights Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020220111277A external-priority patent/KR20230059136A/ko
Application filed by Hyundai Motor Co, Kia Corp, DigitalInsights Inc filed Critical Hyundai Motor Co
Priority claimed from PCT/KR2022/013245 external-priority patent/WO2023075124A1/ko
Publication of CN118140476A publication Critical patent/CN118140476A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

公开了利用几何帧内预测模式的视频编解码方法和装置,并且在本发明的实施方案中提供了这样的视频编解码方法和装置,其通过利用两种不同的帧内预测模式来生成两个帧内预测因子,然后基于几何块分区,通过利用像素单元的权重对两个帧内预测因子进行加权求和,从而生成最终帧内预测因子。

Description

利用几何帧内预测模式的视频编解码的方法和装置
技术领域
本发明涉及利用几何帧内预测模式的视频编解码方法和装置。
背景技术
本部分中的陈述仅提供与本发明有关的背景技术信息,并不一定构成现有技术。
由于视频数据与音频数据或静止影像数据相比具有大量的数据,所以视频数据需要大量的硬件资源(其包括存储器)来存储或发送未经压缩处理的视频数据。
相应地,编码器通常用于压缩并存储或发送视频数据。解码器接收压缩的视频数据,解压缩接收到的压缩的视频数据,并且播放解压缩的视频数据。视频压缩技术包括H.264/AVC、高效率视频编解码(High Efficiency Video Coding,HEVC)和多功能视频编解码(VVC),所述多功能视频编解码(VVC)比HEVC的编解码效率提高了大约30%或更多。
然而,由于影像大小、分辨率和帧速率逐渐增加,要编码的数据量也会增加。相应地,需要提供比现有压缩技术更高的编解码效率和改善的图像增强效果的新的压缩技术。
在对当前块执行预测时的帧内预测技术,利用相同图像中的当前块的空间邻近的相邻像素来生成预测信号。在传统的视频编码/解码方法和装置中,为了提高帧内预测技术的编解码性能,使用增加数量的帧内预测模式,或者对用于帧内预测的空间邻近的相邻像素应用滤波。由于在生成预测信号时利用与当前块相同的图像中的有限像素的约束,这些帧内预测技术与帧间预测技术相比具有相对较低的生成预测信号的性能。
为了提供帧内预测的预测性能,除了空间邻近的像素之外,还可以利用多个行缓冲区。例如,多参考行(multiple reference line,MRL)帧内预测技术选择位于特定距离处的一个或更多个行的像素来执行帧内预测。还存在矩阵加权帧内预测(Matrix weightedIntra Prediction,MIP)技术,其通过利用相邻像素与预定义的矩阵之间的乘积运算来生成帧内预测信号。因此,为了提高视频编解码效率并增强视频质量,需要进一步改进帧内预测方法。
发明内容
技术问题
本发明致力于提供一种视频编解码方法和装置,其在应用几何帧内预测模式时,通过利用两种不同的帧内预测模式来生成两个帧内预测因子。视频编解码方法和装置使用基于几何块分区的像素级权重来对两个帧内预测因子进行加权求和,从而生成最终帧内预测因子。
技术方案
本发明的至少一个方面提供了由视频解码装置执行的用于对当前块进行帧内预测的方法。该方法包括从比特流解码几何帧内预测标志,所述几何帧内预测标志指示对当前块是否使用几何帧内预测模式,并且检查几何帧内预测标志。如果几何帧内预测标志为真,则方法进一步包括从比特流解码几何分区信息索引、第一帧内预测模式索引以及第二帧内预测模式索引。该方法进一步包括生成包括用于当前块的帧内预测的预测模式的列表。该方法进一步包括通过利用第一帧内预测模式索引从预测模式的列表选择第一帧内预测模式,并且基于第一帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第一帧内预测因子。该方法进一步包括通过利用第二帧内预测模式索引从预测模式的列表选择第二帧内预测模式,并且基于第二帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第二帧内预测因子。该方法进一步包括通过利用几何分区信息索引来获得权重,所述权重包括用于第一帧内预测因子的第一权重和用于第二帧内预测因子的第二权重,并且通过利用权重对第一帧内预测因子和第二帧内预测因子进行加权求和,以生成当前块的最终帧内预测因子。
本发明的另一个方面提供了由视频编码装置执行的用于对当前块进行帧内预测的方法。该方法包括确定几何帧内预测标志,所述几何帧内预测标志指示对当前块是否使用几何帧内预测模式,并且检查几何帧内预测标志。如果几何帧内预测标志为真,则该方法进一步包括确定几何分区信息索引,并且生成包括用于当前块的帧内预测的帧内预测模式的列表。该方法进一步包括确定第一帧内预测模式,并且对于第一帧内预测模式,从帧内预测模式的列表确定第一帧内预测模式索引。该方法进一步包括基于第一帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第一帧内预测因子。该方法进一步包括确定第二帧内预测模式,并且对于第二帧内预测模式,从帧内预测模式的列表确定第二帧内预测模式索引。该方法进一步包括基于第二帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第二帧内预测因子。该方法进一步包括通过利用几何分区信息索引来获得权重,所述权重包括用于第一帧内预测因子的第一权重和用于第二帧内预测因子的第二权重,并且通过利用权重对第一帧内预测因子和第二帧内预测因子进行加权求和,以生成当前块的最终帧内预测因子。
本发明的又一方面提供了计算机可读记录介质,其存储由视频编码方法生成的比特流。该视频编码方法包括确定几何帧内预测标志,所述几何帧内预测标志指示对当前块是否使用几何帧内预测模式,并且检查几何帧内预测标志。如果几何帧内预测标志为真,则视频编码方法进一步包括确定几何分区信息索引,并且生成包括用于当前块的帧内预测的帧内预测模式的列表。该视频编码方法进一步包括确定第一帧内预测模式,并且对于第一帧内预测模式,从帧内预测模式的列表确定第一帧内预测模式索引。该视频编码方法进一步包括基于第一帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第一帧内预测因子。视频编码方法进一步包括确定第二帧内预测模式,并且对于第二帧内预测模式,从帧内预测模式的列表确定第二帧内预测模式索引。该视频编码方法进一步包括基于第二帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第二帧内预测因子。该视频编码方法进一步包括通过利用几何分区信息索引来获得权重,所述权重包括用于第一帧内预测因子的第一权重和用于第二帧内预测因子的第二权重,并且通过利用权重对第一帧内预测因子和第二帧内预测因子进行加权求和,以生成当前块的最终帧内预测因子。
有益效果
如上所述,本发明提供了视频编解码方法和装置,其在应用几何帧内预测模式时,通过利用两种不同的帧内预测模式来生成两个帧内预测因子。视频编解码方法和装置使用基于几何块分区的像素级权重,以从两个帧内预测因子生成最终帧内预测因子。因此,视频编解码方法和装置提高了视频编码效率并且增强了视频质量。
此外,本发明提供了视频编解码方法和装置,其用于通过利用像素级权重从两个不同的帧内预测因子生成最终帧内预测因子。当应用几何帧内预测模式时,视频编解码方法和装置可以利用由模拟几何块分区的混合处理产生的任意块分区的效果。
附图说明
图1是可以实现本发明技术的视频编码装置的框图。
图2示出利用四叉树加二叉树三叉树(QTBTTT)结构来对块进行分区的方法。
图3a和图3b示出包括宽角度帧内预测模式的多个帧内预测模式。
图4示出当前块的相邻块。
图5是可以实现本发明技术的视频解码装置的框图。
图6是示出根据本发明的至少一个实施方案的帧内预测因子生成装置的框图。
图7是示出根据本发明的至少一个实施方案的几何帧内预测模式的应用的示意图。
图8是示出根据本发明的至少一个实施方案的两个预测因子的混合处理的示意图。
图9a和图9b是描绘根据本发明的至少一个实施方案的等分块的直线的示意图。
图10是根据本发明的至少一个实施方案的由视频编码装置执行的帧内预测方法的流程图。
图11是根据本发明的至少一个实施方案的由视频解码装置执行的帧内预测方法的流程图。
具体实施方式
在下文中,将参考所附说明性附图对本发明的一些实施方案进行详细描述。在下面的描述中,相同的附图标记表示相同的元件,尽管元件在不同的附图中示出。此外,在一些实施方案的以下描述中,当认为相关的已知组件和功能的详细描述模糊了本发明的主题时,为了清楚和简洁起见,可以省略对相关的已知组件和功能的详细描述。
图1是可以实现本发明技术的视频编码装置的框图。在下文中,参考图1的图示,对视频编码装置以及该装置的组件进行描述。
编码装置可以包括:图像分割器110、预测器120、减法器130、变换器140、量化器145、重排单元150、熵编码器155、逆量化器160、逆变换器165、加法器170、环路滤波单元180和存储器190。
编码装置的每个组件可以实现为硬件或软件,或者实现为硬件和软件的组合。另外,每个组件的功能可以实现为软件,并且微处理器也可以实现为执行对应于每个组件的软件的功能。
一个视频由包括多个图像的一个或更多个序列组成。每个图像分割为多个区域,并且对每个区域执行编码。例如,一个图像分割为一个或更多个瓦片(tile)或/和切片(slice)。这里,一个或更多个瓦片可以定义为瓦片组。每个瓦片或/和切片分割为一个或更多个编码树单元(coding tree unit,CTU)。另外,每个CTU通过树结构分割为一个或更多个编码单元(coding unit,CU)。应用于每个编码单元(CU)的信息被编码为CU的语法,并且共同应用于包括在一个CTU中的CU的信息被编码为CTU的语法。另外,共同应用于一个切片中的所有块的信息被编码为切片头的语法,而应用于构成一个或更多个图像的所有块的信息被编码为图像参数集(Picture Parameter Set,PPS)或图像头。此外,多个图像共同参考的信息被编码为序列参数集(Sequence Parameter Set,SPS)。另外,一个或更多个SPS共同参考的信息被编码为视频参数集(Video Parameter Set,VPS)。此外,共同应用于一个瓦片或瓦片组的信息也可以被编码为瓦片或瓦片组头的语法。包括在SPS、PPS、切片头、瓦片或瓦片组头中的语法可以称为高级语法。
图像分割器110确定编码树单元(CTU)的大小。关于CTU的大小(CTU尺寸)的信息被编码为SPS或PPS的语法,并且被传送至视频解码装置。
图像分割器110将构成视频的每个图像分割为具有预定大小的多个编码树单元(CTU),然后通过利用树结构递归地分割CTU。树结构中的叶节点成为编码单元(CU),所述CU是编码的基本单元。
树结构可以是四叉树(quadtree,QT),其中较高节点(或父节点)被分割为具有相同大小的四个较低节点(或子节点)。树结构也可以是二叉树(binarytree,BT),其中较高的节点分割为两个较低的节点。树结构还可以是三叉树(ternarytree,TT),其中较高的节点以1:2:1的比率分割为三个较低的节点。树结构还可以是QT结构、BT结构和TT结构中的两个或更多个结构混合的结构。例如,可以使用四叉树加二叉树(quadtree plus binarytree,QTBT)结构,或者可以使用四叉树加二叉树三叉树(quadtree plus binarytreeternarytree,QTBTTT)结构。这里,二叉树三叉树(BTTT)被添加到树结构以称为多类型树(multiple-type tree,MTT)。
图2是用于描述通过利用QTBTTT结构来对块进行分割的方法的示意图。
如图2所示,CTU可以首先分割为QT结构。四叉树分割可以是递归的,直到分割块的大小达到QT中允许的叶节点的最小块大小(MinQTSize)。由熵编码器155对指示QT结构的每个节点是否被分割为下层的四个节点的第一标志(QT_split_flag)进行编码,并将其用信号通知视频解码装置。当QT的叶节点不大于BT中允许的根节点的最大块大小(MaxBTSize)时,可以将叶节点进一步分割为BT结构或TT结构的至少一个。在BT结构和/或TT结构中可以存在多个分割方向。例如,可以存在两个方向,即,水平地分割相应节点的块的方向以及竖直地分割相应节点的块的方向。如图2所示,当MTT分割开始时,由熵编码器155对指示节点是否被分割的第二标志(mtt_split_flag)、以及在节点被分割的情况下额外指示分割方向(竖直或水平)的标志和/或指示分割类型(二叉或三叉)的标志进行编码,并将其用信号通知视频解码装置。
替选地,在对指示每个节点是否被分割为下层的四个节点的第一标志(QT_split_flag)进行编码之前,还可以对指示节点是否被分割的CU分割标志(split_cu_flag)进行编码。当CU分割标志(split_cu_flag)的值指示出每个节点没有被分割时,相应节点的块成为分割树结构中的叶节点并成为CU,CU是编码的基本单元。当CU分割标志(split_cu_flag)的值指示出每个节点被分割时,视频编码装置以上述方案对第一标志首先开始编码。
当QTBT用作树结构的另一个示例时,可以存在两种类型,即,将相应节点的块水平地分割为具有相同大小的两个块的类型(即,对称水平分割)以及将相应节点的块竖直地分割为具有相同大小的两个块的类型(即,对称竖直分割)。由熵编码器155对指示BT结构的每个节点是否被分割为下层的块的分割标志(split_flag)和指示分割类型的分割类型信息进行编码,并将其传送至视频解码装置。另一方面,可以另外存在相应节点的块被分割为彼此非对称的两个块的类型。非对称形式可以包括相应节点的块被分割为大小比率为1:3的两个矩形块的形式,或者还可以包括相应节点的块在对角线方向上被分割的形式。
CU可以根据从CTU分割的QTBT或QTBTTT而具有各种大小。在下文中,与要编码或解码的CU(即,QTBTTT的叶节点)相对应的块称为“当前块”。当采用QTBTTT分割时,除了正方形形状之外,当前块的形状也可以是矩形形状。
预测器120对当前块进行预测以生成预测块。预测器120包括帧内预测器122和帧间预测器124。
通常,可以对图像中的当前块的每个进行预测地编码。通常,可以通过利用帧内预测技术(其利用来自包括当前块的图像的数据)或帧间预测技术(其利用来自在包括当前块的图像之前编码的图像的数据)执行当前块的预测。帧间预测包括单向预测和双向预测两者。
帧内预测器122通过利用在包括当前块的当前图像中位于当前块邻近的像素(参考像素)来预测当前块中的像素。根据预测方向,存在多个帧内预测模式。例如,如图3a所示,多个帧内预测模式可以包括包含平面(Planar)模式和DC模式的两种非方向模式,并且可以包括65种方向模式。根据每种预测模式不同地定义要使用的相邻像素和算法等式。
为了对具有矩形形状的当前块进行高效的方向预测,可以额外地使用图3b中虚线箭头所示的方向模式(#67至#80,帧内预测模式#-1至#-14)。方向模式可以称为“宽角度帧内预测模式(wide angle intra-prediction modes)”。在图3b中,箭头指示用于预测的相应参考样本,而非代表预测方向。预测方向与箭头指示的方向相反。在当前块具有矩形形状时,宽角度帧内预测模式是在没有额外比特传输的情况下在与特定方向模式相反的方向上执行预测的模式。在这种情况下,在宽角度帧内预测模式中,可以通过具有矩形形状的当前块的宽度与高度的比率来确定可用于当前块的一些宽角度帧内预测模式。例如,在当前块具有高度小于宽度的矩形形状时,具有小于45度的角度的宽角度帧内预测模式(帧内预测模式#67至#80)是可用的。在当前块具有宽度大于高度的矩形形状时,具有大于-135度的角度的宽角度帧内预测模式是可用的。
帧内预测器122可以确定要用于对当前块进行编码的帧内预测。在一些示例中,帧内预测器122可以通过利用多个帧内预测模式来对当前块进行编码,并且还可以从测试模式中选择要使用的适当的帧内预测模式。例如,帧内预测器122可以通过利用对多个测试的帧内预测模式的率失真(rate-distortion)分析来计算率失真值,并且还可以在测试模式中选择具有最佳率失真特性的帧内预测模式。
帧内预测器122在多个帧内预测模式中选择一个帧内预测模式,并且通过利用根据选择的帧内预测模式确定的相邻像素(参考像素)和算法等式来预测当前块。由熵编码器155对关于选择的帧内预测模式的信息进行编码并将其传送至视频解码装置。
帧间预测器124通过利用运动补偿处理来生成当前块的预测块。帧间预测器124在比当前图像更早已被编码和解码的参考图像中搜索与当前块最相似的块,并且通过利用搜索到的块来生成当前块的预测块。另外,生成运动矢量(motion vector,MV),所述运动矢量与当前图像中的当前块和参考图像中的预测块之间的位移(displacement)相对应。通常,对亮度(luma)分量执行运动估计,并且基于亮度分量计算的运动矢量用于亮度分量和色度分量两者。由熵编码器155对包括参考图像的信息和关于用于预测当前块的运动矢量的信息的运动信息进行编码,并将其传送至视频解码装置。
帧间预测器124还可以执行参考图像或参考块的插值,以增加预测的准确性。换句话说,通过向包括两个整数样本的多个连续整数样本应用滤波器系数来在两个连续整数样本之间插值子样本。在对插值的参考图像执行搜索与当前块最相似的块的处理时,对于运动矢量可以表示小数单位精度而不是整数样本单位精度。对于要编码的每个目标区域,例如,诸如切片、瓦片、CTU、CU等的单元,可以不同地设置运动矢量的精度或分辨率。当应用这种自适应运动矢量分辨率(adaptive motion vector resolution,AMVR)时,应该针对每个目标区域用信号通知关于要应用于每个目标区域的运动矢量分辨率的信息。例如,当目标区域是CU时,用信号通知关于应用于每个CU的运动矢量分辨率的信息。关于运动矢量分辨率的信息可以是代表要在以下描述的运动矢量差的精度的信息。
另一方面,帧间预测器124可以通过利用双向预测来执行帧间预测。在双向预测的情况下,使用两个参考图像和代表与每个参考图像中的当前块最相似的块位置的两个运动矢量。帧间预测器124分别从参考图像列表0(RefPicList0)和参考图像列表1(RefPicList1)选择第一参考图像和第二参考图像。帧间预测器124还搜索与相应参考图像中的当前块最相似的块,以生成第一参考块和第二参考块。此外,通过对第一参考块和第二参考块进行平均或加权平均来生成当前块的预测块。此外,包括关于用于预测当前块的两个参考图像的信息并且包括关于两个运动矢量的信息的运动信息被传送至熵编码器155。这里,参考图像列表0可以由预重构图像中按显示顺序在当前图像之前的图像构成,并且参考图像列表1可以由预重构图像中按显示顺序在当前图像之后的图像构成。然而,尽管不特别限于此,但可以将显示顺序中在当前图像之后的预重构图像额外地包括在参考图像列表0中。相反,在当前图像之前的预重构图像也可以额外地包括在参考图像列表1中。
为了最小化用于编码运动信息所消耗的比特量,可以使用各种方法。
例如,在当前块的参考图像和运动矢量与相邻块的参考图像和运动矢量相同时,能够识别相邻块的信息被编码以将当前块的运动信息传送至视频解码装置。这种方法称为合并模式(merge mode)。
在合并模式中,帧间预测器124从当前块的相邻块选择预定数量的合并候选块(在下文中,称为“合并候选”)。
作为用于推导合并候选的相邻块,可以使用与当前图像中的当前块邻近的左侧块A0、左下侧块A1、上侧块B0、右上侧块B1和左上侧块B2的全部或一些,如图4所示。此外,除了当前块所在的当前图像之外,位于参考图像内的块(其可以与用于预测当前块的参考图像相同或不同)也可以用作合并候选。例如,参考图像内的当前块的同位块(co-locatedblock)或与该同位块邻近的块可以额外地用作合并候选。如果通过上述方法选择的合并候选的数量小于预设数量,则将零矢量添加到合并候选。
帧间预测器124通过利用相邻块来配置包括预定数量的合并候选的合并列表。从合并列表中包括的合并候选之中选择要用作当前块的运动信息的合并候选,并且生成用于识别选择的候选的合并索引信息。由熵编码器155对生成的合并索引信息进行编码并将其传送至视频解码装置。
合并跳过模式是合并模式的特例。在量化之后,在用于熵编码的所有变换系数都接近零时,仅传输相邻块选择信息而不传输残差信号。通过利用合并跳过模式,对于具有轻微运动的影像、静止影像、屏幕内容影像等可以实现相对较高的编码效率。
此后,合并模式和合并跳过模式统称为合并/跳过模式。
用于编码运动信息的另一种方法是高级运动矢量预测(advanced motion vectorprediction,AMVP)模式。
在AMVP模式中,帧间预测器124通过利用当前块的相邻块来推导用于当前块的运动矢量的运动矢量预测候选。作为用于推导运动矢量预测候选的相邻块,可以使用与图4所示的当前图像中的当前块邻近的左侧块A0、左下侧块A1、上侧块B0、右上侧块B1和左上侧块B2的全部或一些。此外,除了当前块所在的当前图像之外,位于参考图像(其可以与用于预测当前块的参考图像相同或不同)内的块也可以用作用于推导运动矢量预测候选的相邻块。例如,可以使用参考图像内的当前块的同位块或与该同位块邻近的块。如果通过上述方法选择的运动矢量候选的数量小于预设数量,则将零矢量添加到运动矢量候选。
帧间预测器124通过利用相邻块的运动矢量来推导运动矢量预测候选,并且通过利用运动矢量预测候选来确定当前块的运动矢量的运动矢量预测。另外,通过将当前块的运动矢量减去运动矢量预测来计算运动矢量差。
可以通过将预定义函数(例如,中值和平均值计算等)应用于运动矢量预测候选来获取运动矢量预测。在这种情况下,视频解码装置还知道预定义功能。此外,由于用于推导运动矢量预测候选的相邻块是已经完成编码和解码的块,所以视频解码装置也可能已经知道相邻块的运动矢量。因此,视频编码装置不需要对用于识别运动矢量预测候选的信息进行编码。相应地,在这种情况下,对关于运动矢量差的信息和关于用于预测当前块的参考图像的信息进行编码。
另一方面,还可以通过选择运动矢量预测候选的任何一个的方案来确定运动矢量预测。在这种情况下,用于识别选择的运动矢量预测候选的信息与用于预测当前块的关于运动矢量差的信息以及关于参考图像的信息共同进行额外的编码。
减法器130通过将当前块减去由帧内预测器122或帧间预测器124生成的预测块来生成残差块。
变换器140将具有空域的像素值的残差块中的残差信号变换为频域的变换系数。变换器140可以通过利用残差块的整个大小作为变换单元来变换残差块中的残差信号,或者也可以将残差块分割为多个子块,并且可以通过利用子块作为变换单元来执行变换。替选地,将残差块划分成两个子块,即变换区域和非变换区域,以通过仅利用变换区域子块作为变换单元来变换残差信号。这里,变换区域子块可以是基于水平轴线(或竖直轴线)的具有大小比率为1:1的两个矩形块的一个。在这种情况下,由熵编码器155对指示出仅变换子块的标志(cu_sbt_flag)、以及方向(竖直/水平)信息(cu_sbt_horizontal_flag)和/或位置信息(cu_sbt_pos_flag)进行编码,并将其用信号通知视频解码装置。另外,变换区域子块的大小基于水平轴线(或竖直轴线)可以具有1:3的大小比率。在这种情况下,由熵编码器155对划分相应分割的标志(cu_sbt_quad_flag)进行额外地编码,并将其用信号通知视频解码装置。
另一方面,变换器140可以在水平方向和竖直方向上单独地执行残差块的变换。对于该变换,可以使用各种类型的变换函数或变换矩阵。例如,用于水平变换和竖直变换的成对变换函数可以定义为多变换集(multiple transform set,MTS)。变换器140可以选择MTS中具有最高变换效率的一个变换函数对,并且可以在水平方向和竖直方向的每个上变换残差块。由熵编码器155对关于MTS中的变换函数对的信息(mts_idx)进行编码,并将其用信号通知视频解码装置。
量化器145利用量化参数对从变换器140输出的变换系数进行量化,并且将量化的变换系数输出到熵编码器155。量化器145还可以对相关的残差块立即进行量化,而无需对任何块或帧进行变换。量化器145还可以根据变换块中的变换系数的位置来应用不同的量化系数(缩放值)。可以对应用于布置为二维的量化的变换系数的量化矩阵进行编码,并将其用信号通知视频解码装置。
重排单元150可以对量化的残差值执行系数值的重新排列。
重排单元150可以通过利用系数扫描将2D系数阵列改变为1D系数序列。例如,重排单元150可以利用锯齿形扫描(zig-zag scan)或对角线扫描(diagonal scan)来扫描DC系数到高频区域的系数以输出1D系数序列。根据变换单元的大小和帧内预测模式,也可以利用在列方向上扫描2D系数阵列的竖直扫描和在行方向上扫描2D块类型系数的水平扫描来代替锯齿形扫描。换句话说,根据变换单元的大小和帧内预测模式,可以在锯齿形扫描、对角线扫描、竖直扫描和水平扫描中确定要使用的扫描方法。
熵编码器155通过利用包括基于上下文的自适应二进制算术编码(Context-basedAdaptive Binary Arithmetic Code,CABAC)、指数哥伦布(Exponential Golomb)等的各种编码方案来对从重排单元150输出的1D量化的变换系数的序列进行编码,以生成比特流。
此外,熵编码器155对与块分割相关的信息(例如,CTU大小、CTU分割标志、QT分割标志、MTT分割类型和MTT分割方向等)进行编码,以使得视频解码装置能够等同于视频编码装置来分割块。此外,熵编码器155对关于指示当前块是由帧内预测编码还是由帧间预测编码的预测类型的信息进行编码。熵编码器155根据预测类型对帧内预测信息(即,关于帧内预测模式的信息)或帧间预测信息(在合并模式的情况下的合并索引,以及在AMVP模式的情况下的关于参考图像索引和运动矢量差的信息)进行编码。此外,熵编码器155对与量化相关的信息(即,关于量化参数的信息和关于量化矩阵的信息)进行编码。
逆量化器160对从量化器145输出的量化的变换系数进行逆量化,以生成变换系数。逆变换器165将从逆量化器160输出的变换系数从频域变换到空域,以重构残差块。
加法器170将重构的残差块和由预测器120生成的预测块相加,以重构当前块。在对下一个块进行帧内预测时,重构的当前块中的像素用作参考像素。
环路滤波单元180对重构的像素执行滤波,以减少由于基于块的预测和变换/量化而发生的块伪影(blocking artifacts)、振铃伪影(ringing artifacts)、模糊伪影(blurring artifacts)等。作为环内滤波器的环路滤波单元180可以包括去块滤波器182、样本自适应偏移(sample adaptive offset,SAO)滤波器184和自适应环路滤波器(adaptive loop filter,ALF)186的全部或一些。
去块滤波器182对重构的块之间的边界进行滤波,以去除由于块单元编码/解码而发生的块伪影(blocking artifacts),并且SAO滤波器184和ALF 186对去块滤波的视频进行额外的滤波。SAO滤波器184和ALF 186是用于补偿由于有损编码(lossy coding)而发生的重构的像素与原始像素之间的差异的滤波器。SAO滤波器184应用偏移作为CTU单位,以增强主观图像质量和编码效率。另一方面,ALF 186执行块单元滤波,并且通过划分相应块的边界和变化量的程度来应用不同的滤波器以补偿失真。可以对关于要用于ALF的滤波器系数的信息进行编码,并将其用信号通知视频解码装置。
通过去块滤波器182、SAO滤波器184和ALF 186滤波的重构的块存储在存储器190中。当一个图像中的所有块被重构时,重构的图像可以用作用于对随后要被编码的图像内的块进行帧间预测的参考图像。
图5是可以实现本发明技术的视频解码装置的功能框图。在下文中,参考图5,描述了视频解码装置和该装置的组件。
视频解码装置可以包括熵解码器510、重排单元515、逆量化器520、逆变换器530、预测器540、加法器550、环路滤波单元560和存储器570。
类似于图1的视频编码装置,视频解码装置的每个组件可以实现为硬件或软件,或者实现为硬件和软件的组合。另外,每个组件的功能可以实现为软件,并且微处理器也可以实现为执行对应于每个组件的软件的功能。
熵解码器510通过解码由视频编码装置生成的比特流来提取与块分割相关的信息,以确定要解码的当前块,并且提取重构当前块所需的预测信息和关于残差信号的信息。
熵解码器510通过从序列参数集(SPS)或图像参数集(PPS)提取关于CTU大小的信息来确定CTU的大小,并且将图像分割为具有确定大小的CTU。此外,CTU被确定为树结构的最高层(即,根节点),并且提取CTU的分割信息以通过利用树结构来分割CTU。
例如,当通过利用QTBTTT结构来分割CTU时,首先提取与QT的分割相关的第一标志(QT_split_flag),以将每个节点分割为下层的四个节点。另外,相对于与QT的叶节点相对应的节点来提取与MTT的分割相关的第二标志(mtt_split_flag)、分割方向(竖直/水平)和/或分割类型(二叉/三叉),以将相应的叶节点分割为MTT结构。结果,QT的叶节点下方的每个节点被递归地分割为BT或TT结构。
作为另一个示例,当通过利用QTBTTT结构来分割CTU时,提取指示是否分割CU的CU分割标志(split_cu_flag)。当分割相应块时,还可以提取第一标志(QT_split_flag)。在分割过程期间,对于每个节点,在递归QT分割0次或更多次之后可能发生0次或更多次的递归MTT分割。例如,对于CTU,MTT分割可以立即发生,或者相反,也可以仅发生多次QT分割。
作为另一个示例,当通过利用QTBT结构来分割CTU时,提取与QT的分割相关的第一标志(QT_split_flag),以将每个节点分割为下层的四个节点。另外,提取指示将与QT的叶节点相对应的节点是否进一步分割为BT的分割标志(split_flag)以及分割方向信息。
另一方面,当熵解码器510通过利用树结构的分割来确定要解码的当前块时,熵解码器510提取关于指示当前块是被帧内预测还是被帧间预测的预测类型的信息。当预测类型信息指示帧内预测时,熵解码器510提取用于当前块的帧内预测信息(帧内预测模式)的语法元素。当预测类型信息指示帧间预测时,熵解码器510提取代表帧间预测信息的语法元素的信息,即,运动矢量和运动矢量参考的参考图像。
此外,熵解码器510提取量化相关的信息并且提取关于当前块的量化的变换系数的信息作为关于残差信号的信息。
重排单元515可以以由视频编码装置执行的系数扫描次序的相反顺序,将由熵解码器510熵解码的1D量化的变换系数的序列再次改变为2D系数阵列(即,块)。
逆量化器520对量化的变换系数进行逆量化,并且通过利用量化参数对量化的变换系数进行逆量化。逆量化器520还可以向布置为2D的量化的变换系数应用不同的量化系数(缩放值)。逆量化器520可以通过将来自视频编码装置的量化系数(缩放值)的矩阵应用于量化的变换系数的2D阵列来执行逆量化。
逆变换器530通过将逆量化的变换系数从频域逆变换到空域来重构残差信号,以生成当前块的残差块。
此外,当逆变换器530对变换块的部分区域(子块)进行逆变换时,逆变换器530提取仅对变换块的子块进行变换的标志(cu_sbt_flag)、子块的方向(竖直/水平)信息(cu_sbt_horizontal_flag)和/或子块的位置信息(cu_sbt_pos_flag)。逆变换器530还将相应子块的变换系数从频域逆变换到空域以重构残差信号,并且用值“0”填充未被逆变换的区域作为残差信号,以生成当前块的最终残差块。
此外,当应用MTS时,逆变换器530通过利用从视频编码装置用信号通知的MTS信息(mts_idx)来确定在水平方向和竖直方向的每个上要应用的变换索引或变换矩阵。逆变换器530还通过利用确定的变换函数在水平方向和竖直方向上对变换块中的变换系数执行逆变换。
预测器540可以包括帧内预测器542和帧间预测器544。在当前块的预测类型是帧内预测时,激活帧内预测器542,而在当前块的预测类型是帧间预测时,激活帧间预测器544。
帧内预测器542根据从熵解码器510提取的帧内预测模式的语法元素来确定多个帧内预测模式中当前块的帧内预测模式。帧内预测器542还根据帧内预测模式通过利用当前块的相邻参考像素来预测当前块。
帧间预测器544通过利用从熵解码器510提取的帧间预测模式的语法元素来确定当前块的运动矢量和运动矢量参考的参考图像。
加法器550通过将从逆变换器530输出的残差块与从帧间预测器544或帧内预测器542输出的预测块相加来重构当前块。在对后续要被解码的块进行帧内预测时,重构的当前块内的像素用作参考像素。
作为环内滤波器的环路滤波单元560可以包括去块滤波器562、SAO滤波器564和ALF 566。去块滤波器562对重构的块之间的边界执行去块滤波,以便去除由于块单元解码而发生的块伪影。SAO滤波器564和ALF 566在去块滤波之后对重构的块执行额外的滤波,以便补偿由于有损编码而发生的重构的像素与原始像素之间的差异。通过利用关于从比特流解码的滤波器系数的信息来确定ALF的滤波器系数。
通过去块滤波器562、SAO滤波器564和ALF 566滤波的重构的块存储在存储器570中。当一个图像中的所有块被重构时,重构的图像可以用作用于对随后要被编码的图像内的块进行帧间预测的参考图像。
在一些实施方案中本发明涉及如上所述的编码和解码视频影像。更具体地,本发明提供了通过利用两种不同的帧内预测模式来生成两个帧内预测因子的视频编解码方法和装置。视频编码方法和装置通过利用基于几何块分区的像素级权重对两个帧内预测因子进行加权求和,从而生成最终帧内预测因子。
以下实施方案可以通过视频编码装置中的帧内预测器122和视频解码装置中的帧内预测器542来执行。
当执行当前块的帧内预测时,视频编码装置可以在优化率失真方面生成与本实施方案相关的信令信息。视频编码装置可以通过利用熵编码器155编码信令信息,并且可以将其发送到视频解码装置。视频解码装置可以通过利用熵解码器510从比特流解码信令信息。
在下面的描述中,术语“目标块”可以与如上所述的当前块或编码单元(CU)互换使用,或者“目标块”可以意味着编码单元的部分区域。
此外,标志的真值指示将标志设置为1的情况。另外,标志的假值指示将标志设置为0的情况。
I.帧内预测模式和最可能模式(Most Probable Mode,MPM)
如上所述,帧内预测是通过参考存在于当前块的附近的样本来预测要编码的当前块的方法。在多功能视频编解码(VVC)技术中,帧内预测模式除了非方向(即,平面和DC)模式之外,还具有细分的方向模式(即,2至66),如图3a所示。此外,如添加到图3b中的示例,亮度块的帧内预测模式具有根据宽角度帧内预测(wide-angle intra prediction,WAIP)的方向模式(-14到-1以及67到80)。
对于帧内预测,最可能模式(MPM)技术利用相邻块的帧内预测模式对当前块进行帧内预测。视频编码装置生成MPM列表以包括从空间上邻近当前块的预定义的位置推导的帧内预测模式。视频编码装置可以传输MPM列表的索引来代替预测模式的索引,从而提高帧内预测模式的编解码效率。
II.根据本发明的实施方案
图6是示出根据本发明的至少一个实施方案的帧内预测因子生成装置的框图。
在应用几何帧内预测模式时,根据该实施方案的帧内预测因子生成装置(在下文中,称为“预测因子生成装置”)通过对当前块使用两种不同的帧内预测模式来生成两个帧内预测因子,然后基于像素级权重执行混合处理,以生成最终帧内预测因子。预测因子生成装置包括第一帧内预测模式选择器610、第一帧内预测因子生成器620、第二帧内预测模式选择器630、第二帧内预测因子生成器640和最终帧内预测因子生成器650的全部或部分。
图7是示出根据本发明的至少一个实施方案的几何帧内预测模式的应用的示意图。
当应用几何帧内预测模式时,如图7所示,帧内预测装置首先通过对当前块使用不同的帧内预测模式来生成第一帧内预测因子和第二帧内预测因子。帧内预测装置可以通过利用基于几何块分区的权重对第一帧内预测因子和第二帧内预测因子进行加权求和来生成最终帧内预测因子。在图7的示例中,nCbw和nCbh分别代表当前块的宽度和高度。
在图7的示例中,权重代表用于第一帧内预测因子的权重。权重的含义和设置描述如下。
在一个示例中,第一帧内预测因子可以是如上所述通过利用MPM列表中的一个帧内预测模式生成的信号。第二帧内预测因子也可以是通过利用MPM列表中其它剩余模式的一个帧内预测模式而不是用于生成第一帧内预测因子的帧内预测模式而生成的信号。
下面从视频解码装置方面描述帧内预测装置中的组件的操作。如上所述,帧内预测装置也可以包括在视频编码装置中。
第一帧内预测模式选择器610生成用于当前块的帧内预测的MPM列表。第一帧内预测模式选择器610使用从视频编码装置用信号通知的索引信息来选择MPM列表中由相应索引指示的帧内预测模式。
基于第一帧内预测模式,第一帧内预测因子生成器620通过利用空间上邻近当前块的已经重构的像素来生成当前块的第一帧内预测因子。
第二帧内预测模式选择器630通过从MPM列表中排除第一帧内预测模式来重新排序MPM列表。第二帧内预测模式选择器630使用从视频编码装置用信号通知的索引信息来选择重新排序的MPM列表中由相应索引指示的帧内预测模式。
基于第二帧内预测模式,第二帧内预测因子生成器640通过利用空间上邻近当前块的已经重构的像素来生成当前块的第二帧内预测因子。
最终帧内预测因子生成器650通过利用由视频编码装置用信号通知的索引来获得几何块分区信息,例如从查找表中获得几何块分区信息。最终帧内预测因子生成器650基于几何块分区信息来生成权重。这里,权重包括用于第一帧内预测因子的权重w1和用于第二帧内预测因子的权重w2。最终帧内预测因子生成器650通过执行第一帧内预测因子和第二帧内预测因子的加权和,利用权重来生成最终帧内预测因子。在这种情况下,根据几何块分区信息,前述权重可以是逐像素不同的值。
可以如表1所示表示从视频编码装置用信号通知视频解码装置的、与应用于当前块(即,编码单元)的几何帧内预测模式相关的语法。
[表1]
/>
如表1所示,当不处于矩阵加权帧内预测(MIP)模式时,可以用信号通知关于当前块的几何帧内预测模式的信息。可以通过利用以下语法元素用信号通知关于几何帧内预测模式的信息。
首先,可以使用高级别语法用信号通知标志sps_gim_enable_flag,以指示是否启用几何帧内预测模式。表1中所示的示例利用但不限于用于用信号通知的高级别语法中的SPS。即,可以在诸如SPS、PPS、切片头、图像头等的各种高级别语法的一个或更多个中用信号通知几何帧内预测模式的使用或不使用。
如果标志sps_gim_enable_flag为真并且使用几何帧内预测模式,则可以用信号通知几何帧内预测标志“intra_gim_flag”,以指示对编码单元是否启用几何帧内预测模式。
然后,如果intra_gim_flag的值为真并且编码单元使用几何帧内预测模式,则可以用信号通知或解析关于几何帧内预测模式的更多信息。
另一方面,如果intra_gim_flag的值为假并且编码单元不使用几何帧内预测模式,则可以根据传统方法用信号通知或解析关于帧内预测模式的更多信息。
如果“intra_gim_flag”的几何帧内预测标志的值为真,则用信号通知的更多信息可以包括指示应用于编码单元的几何分区形式的几何分区信息索引“intra_gim_partition_idx”、指示第一帧内预测模式的第一帧内预测模式索引“intra_gim_idx0”以及指示第二帧内预测模式的第二帧内预测模式索引“intra_gim_idx1”。
替选地,可以按照指示几何分区形式的索引“intra_gim_partition_idx”、指示第一帧内预测模式的索引“intra_gim_idx0”和指示第二帧内预测模式的索引“intra_gim_idx1”的次序(例如,表1中例示化的次序),用信号通知或解析更多的信息,但是用信号通知或解析次序不一定限于此。换句话说,用信号通知或解析的次序的变化也可以包括在本发明的范围内。例如,可以按照指示第一帧内预测模式的索引、指示第二帧内预测模式的索引以及指示几何分区形式的索引的次序,用信号通知或解析更多的信息。
根据表1,在关于几何帧内预测模式的信息中,关于应用于编码单元的几何分区形式的信息通过利用其指示索引“intra_gim_partition_idx”来用信号通知或解析。关于几何分区形式的这种信息可以包括关于块的等分的信息。在这种情况下,块的等分可以包括通过利用预定义的直线对块进行分区。在下面更详细地描述关于几何分区形式的信息。
根据表1,可以进一步用信号通知指示第一帧内预测模式的索引和指示第二帧内预测模式的索引。在一个示例中,第一帧内预测模式和第二帧内预测模式可以是由编码和解码过程支持的所有帧内预测模式中的两种不同的帧内预测模式。
在另一示例中,第一帧内预测模式和第二帧内预测模式可以是包括在从空间上邻近当前块的预定义的位置推导的候选列表中的帧内预测模式中的、两种不同的帧内预测模式。在这种情况下,候选列表可以是MPM列表。即,根据本发明的第一帧内预测模式和第二帧内预测模式可以定义为选自预定义的帧内预测模式的候选列表的预测模式。
作为另一个示例,可以如表2所示表示从视频编码装置用信号通知视频解码装置的、与几何帧内预测模式相关的语法。
[表2]
/>
如表2所示,当不处于MIP模式时,可以在根据传统方法用信号通知关于帧内预测模式的信息之后用信号通知关于几何帧内预测模式的信息。可以通过利用以下语法元素来用信号通知关于几何帧内预测模式的信息。
首先,可以使用高级别语法来用信号通知标志“sps_gim_enable_flag”,以指示是否启用几何帧内预测模式。
如果标志“sps_gim_enable_flag”为真并且使用几何帧内预测模式,则可以对编码单元用信号通知几何帧内预测标志“intra_gim_flag”,从而指示是否启用几何帧内预测模式。
如果几何帧内预测标志“intra_gim_flag”的值为真,则用信号通知的更多信息可以包括指示应用于编码单元的几何分区形式的几何分区信息索引“intra_gim_partition_idx”和指示第二帧内预测模式的第二帧内式预测模索引“intra_gim_idx1”。在这种情况下,指示第一帧内预测模式的第一帧内预测模式索引“intra_gim_idx0”可以根据默认方法指示较早解析的帧内预测模式(例如,“intra_luma_mpm_idx”或“intra_luma_mpm_remainder”)。
图8是示出根据本发明的至少一个实施方案的两个预测因子的混合处理的示意图。
如图8所示,在为当前块选择两种不同的帧内预测模式之后,预测因子生成装置生成对应于各个帧内预测模式的帧内预测因子。预测因子生成装置通过对两个帧内预测因子加权求和来生成最终帧内预测因子。在执行加权求和时,预测因子生成装置可以相对于对任意形式的块分区执行几何块分区的等分直线,混合两个帧内预测因子。换句话说,预测因子生成装置可以执行混合处理,该混合处理对块中的每个像素不同地进行加权求和,以从两个帧内预测因子生成最终帧内预测因子。
另一方面,在相对于直线在块中逐像素执行不同的加权求和时,应用于两个帧内预测因子中的同位像素的权重之和是1。在这种情况下,包含权重的集可以是{0,1,2,3,4,5,6,7,8},或者前述集可以是考虑了缩放值的{0,1/8,2/8,3/8,4/8,5/8,6/8,7/8,1}。例如,在当前块中的(x,y)像素位置处,当第一帧内预测因子的权重为1(考虑了缩放值时为1/8)时,第二帧内预测因子的权重为7(考虑了缩放值时为7/8)。
在图8的示例中,表示为用于最终帧内预测因子的整数的权重代表用于第一帧内预测因子的权重。
此外,等分直线指示第一帧内预测因子的权重与第一帧内预测因子的权重之间的大小变化的边界。例如,在图8的示例中,对于包括在相对于直线的区域A中的像素,第一帧内预测因子的权重可以大于或等于第二帧内预测因子的权重。此外,对于包括在相对于基线的区域B中的像素,第二帧内预测因子的权重可以大于或等于第一帧内预测因子的权重。
在下文中,在每个区域中利用较大权重的预测因子称为主预测因子。可以通过考虑用于帧内预测的参考样本来确定这些主预测因子。对于图8所示的区域A,第一帧内预测因子可以设置为主预测因子,这是因为它比顶部参考样本更接近左侧参考样本。
图9a和图9b是描绘根据本发明的至少一个实施方案的等分块的直线的示意图。
对于根据几何帧内预测模式编码/解码的块,几何分区形式基于代表块的等分的直线。关于这种直线的信息可以包括指示从块的中心到相关直线的距离的索引“distanceIdx”,以及指示与相关直线正交的线段的角度的索引“angleIdx”。可以如图9a所示设置指示与相关直线正交的线段的角度的索引。此外,可以如图9b所示设置基于这些角度和距离的64个几何块分区形式。
可以通过利用“intra_gim_partition_idx”语法用信号通知64个几何分区形式,所述语法是指示几何分区形式的索引,如表3所示。
[表3]
/>
从图9b的示例推导的索引“distanceIdx”是排除当前块的大小的值。因此,可以通过利用当前块的大小信息、指示角度的索引“angleIdx”以及指示距离的索引“distanceIdx”来计算当前块中的像素与直线之间的实际距离。这里,实际距离是以像素单位表示的值。
此外,实际距离可以用于计算当前块中每个像素的权重。例如,对于当前块中的像素,像素与直线之间的实际距离越大,如上所述的主预测因子的权重越大,并且剩余的其他预测因子的权重越小。对于位于直线上的像素,两个预测因子可以具有相同的权重。在这种情况下,用于像素的两个预测因子的权重之和保持为1。
现在参考图10和图11,描述利用几何帧内预测模式的帧内预测方法。
图10是根据本发明的至少一个实施方案的由视频编码装置执行的帧内预测方法的流程图。
视频编码装置确定几何帧内预测标志(S1000)。这里,几何帧内预测标志“intra_gim_flag”指示对当前块是否使用几何帧内预测模式。如上所述,视频编码装置可以在优化率失真方面确定几何帧内预测标志的使用。
视频编码装置编码几何帧内预测标志(S1002)。
视频编码装置检查几何帧内预测标志(S1004)。
如果几何帧内预测标志为真(S1004为是),则视频编码装置执行以下步骤。
视频编码装置确定几何分区信息索引(S1006)。这里,几何分区信息索引“intra_gim_partition_idx”指示应用于当前块的几何分区形式。换句话说,几何分区信息索引对关于等分当前块的直线的信息进行索引。
视频编码装置生成包括用于当前块的帧内预测的帧内预测模式的列表(S1008)。这里,该列表可以是MPM列表。替选地,该列表可以是包括所有帧内预测模式的列表。
视频编码装置在优化编解码率方面确定第一帧内预测模式(S1010)。
视频编码装置从用于第一帧内预测模式的列表确定第一帧内预测模式索引(S1012)。第一帧内预测模式索引“intra_gim_idx0”对第一帧内预测模式进行索引。例如,如果MPM列表不包括第一帧内预测模式,则可以从包括所有帧内预测模式的列表确定第一帧内预测模式索引。
基于第一帧内预测模式,视频编码装置通过利用空间上邻近当前块的像素来生成当前块的第一帧内预测因子(S1014)。
视频编码装置通过从列表排除第一帧内预测模式来对列表进行重新排序(S1016)。
视频编码装置在优化编解码率方面确定第二帧内预测因子(S1018)。
视频编码装置从用于第二帧内预测模式的重新排序的列表确定第二帧内预测模式索引(S1020)。第二帧内预测模式索引“intra_gim_idx1”对第二帧内预测模式进行索引。例如,如果重新排序的MPM列表不包括第二帧内预测模式,则可以从包括所有帧内预测模式的列表确定第二帧内预测模式索引。
基于第二帧内预测模式,视频编码装置通过利用空间上邻近当前块的像素来生成当前块的第二帧内预测因子(S1022)。
视频编码装置通过利用几何分区信息索引来获得权重(S1024)。这里,权重包括用于第一帧内预测因子的第一权重和用于第二帧内预测因子的第二权重。
关于根据几何分区信息索引的直线的信息可以包括指示从块的中心到相关直线的距离的索引“distanceIdx”,以及指示与相关直线正交的线段的角度的索引“angleIdx”。利用当前块的大小信息、代表角度的索引“angleIdx”以及指示距离的索引“distanceIdx”,可以计算当前块中的像素与直线之间的实际距离。基于这些实际距离,可以为当前块中的像素计算权重。
视频编码装置利用权重,通过对第一帧内预测因子和第二帧内预测因子加权求和来生成当前块的最终帧内预测因子(S1026)。
视频编码装置对几何分区信息索引、第一帧内预测模式索引以及第二帧内预测模式索引进行编码(S1028)。
如果几何帧内预测标志为假(S1004为否),则为当前块省略几何帧内预测。在这种情况下,视频编码装置可以通过利用另一种帧内预测模式来执行当前块的帧内预测。
图11是根据本发明的至少一个实施方案的由视频解码装置执行的帧内预测方法的流程图。
视频解码装置从比特流解码几何帧内预测标志(S1100)。这里,几何帧内预测标志“intra_gim_flag”指示对当前块是否要使用几何帧内预测模式。如上所述,几何帧内预测标志的使用可以由视频编码装置在优化率失真方面确定。
视频解码装置检查几何帧内预测标志(S1102)。
如果几何帧内预测标志为真(S1102为是),则视频解码装置执行以下步骤。
视频解码装置从比特流解码几何分区信息索引、第一帧内预测模式索引以及第二帧内预测模式索引(S1104)。这里,几何分区信息索引“intra_gim_partition_idx”指示应用于当前块的几何分区形式。即,几何分区信息索引对关于等分当前块的直线的信息进行索引。第一帧内预测模式索引“intra_gim_idx0”对第一帧内预测模式进行索引。另外,第二帧内预测模式索引“intra_gim_idx1”对第二帧内预测模式进行索引。
视频解码装置生成包括用于当前块的帧内预测的预测模式的列表(S1106)。这里,该列表可以是MPM列表。替选地,该列表可以是包括所有帧内预测模式的列表。
视频解码装置通过利用第一帧内预测模式索引从列表选择第一帧内预测模式(S1108)。例如,如果第一帧内预测模式索引没有指示MPM列表中的帧内预测模式,则第一帧内预测模式可以选自包括所有帧内预测模式的列表。
基于第一帧内预测模式,视频解码装置通过利用空间上邻近当前块的像素来生成当前块的第一帧内预测因子(S1110)。
视频解码装置通过从列表排除第一帧内预测模式来对列表进行重新排序(S1112)。
视频解码装置通过利用第二帧内预测模式索引从重新排序的列表选择第二帧内预测因子(S1114)。例如,如果第二帧内预测模式索引没有指示重新排序的MPM列表中的帧内预测模式,则第二帧内预测模式可以选自包括所有帧内预测模式的列表。
基于第二帧内预测模式,视频解码装置通过利用空间上邻近当前块的像素来生成当前块的第二帧内预测因子(S1116)。
视频解码装置通过利用几何分区信息索引来获得权重(S1118)。这里,权重包括用于第一帧内预测因子的第一权重和用于第二帧内预测因子的第二权重。
关于根据几何分区信息索引的直线的信息可以包括指示从块的中心到相关直线的距离的索引“distanceIdx”,以及指示与相关直线正交的线段的角度的索引“angleIdx”。利用当前块的大小信息、指示角度的索引“angleIdx”以及指示距离的索引“distanceIdx”,可以计算当前块中的像素与直线之间的实际距离。基于这些实际距离,可以为当前块中的像素计算权重。
利用权重,视频解码装置可以对第一帧内预测因子和第二帧内预测因子进行加权求和,以生成当前块的最终帧内预测因子(S1120)。
如果几何帧内预测标志为假(S1102为否),则为当前块省略几何帧内预测。在这种情况下,视频解码装置可以利用另一种帧内预测模式以执行当前块的帧内预测。
尽管描述了顺序执行的各个流程图中的步骤,但这些步骤仅仅例示了本发明的一些实施方案的技术思想。因此,本发明所属领域的普通技术人员可以通过改变在各个附图中描述的顺序或通过并行地执行两个或更多个步骤来执行步骤。因此,各个流程图中的步骤不限于所示的按发生时间排列的顺序。
应当理解,上述描述呈现了可以以各种其他方式实现的说明性实施方案。在一些实施方案中描述的功能可以通过硬件、软件、固件和/或它们的组合来实现。还应当理解,本发明中描述的功能组件标记为“……单元”,以突出强调它们独立实现的可能性。
另一方面,在一些实施方案中描述的各种方法或功能可以实现为存储在非易失性记录介质中的指令,所述指令可以由一个或更多个处理器读取和执行。非易失性记录介质可以包括例如以计算机***可读取的形式存储数据的各种类型的记录装置。例如,非易失性记录介质可以包括存储介质,例如可擦除可编程只读存储器(EPROM)、闪存驱动器、光盘驱动器、磁性硬盘驱动器和固态驱动器(SSD)等等。
尽管出于说明的目的描述了本发明的示例性实施方案,但是本发明所属领域的普通技术人员应当理解,在不脱离本发明的思想和范围的情况下,可以进行各种修改、添加和替换。因此,出于简洁和清楚起见描述了本发明的实施方案。本发明的实施方案的技术思想的范围不受例示的限制。相应地,本发明所属领域的普通技术人员应当理解,本发明的范围不应受上述明确描述的实施方案的限制,而是受权利要求及其等同形式的限制。
(附图标记)
122:帧内预测器
542:帧内预测器
610:第一帧内预测模式选择器
620:第一帧内预测因子生成器
630:第二帧内预测模式选择器
640:第二帧内预测因子生成器
650:最终帧内预测因子生成器
相关申请的交叉引用
本申请要求于2021年10月25日提交的韩国专利申请No.10-2021-0143104以及于2022年9月2日提交的韩国专利申请No.10-2022-0111277的优先权和权益,其每个的全部内容通过引用结合于本文中。

Claims (11)

1.一种由视频解码装置执行的用于对当前块进行帧内预测的方法,所述方法包括:
从比特流解码几何帧内预测标志,所述几何帧内预测标志指示对当前块是否使用几何帧内预测模式;以及
检查几何帧内预测标志,
其中,如果几何帧内预测标志为真,则所述方法进一步包括:
从比特流解码几何分区信息索引、第一帧内预测模式索引以及第二帧内预测模式索引;
生成包括用于当前块的帧内预测的预测模式的列表;
通过利用第一帧内预测模式索引从预测模式的列表选择第一帧内预测模式;
基于第一帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第一帧内预测因子;
通过利用第二帧内预测模式索引从预测模式的列表选择第二帧内预测模式;
基于第二帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第二帧内预测因子;
通过利用几何分区信息索引来获得权重,所述权重包括用于第一帧内预测因子的第一权重和用于第二帧内预测因子的第二权重;以及
通过利用权重对第一帧内预测因子和第二帧内预测因子进行加权求和,以生成当前块的最终帧内预测因子。
2.根据权利要求1所述的方法,进一步包括:
通过从预测模式的列表排除第一帧内预测模式对预测模式的列表进行重新排序。
3.根据权利要求1所述的方法,其中,获得权重包括:
通过利用几何分区信息索引,获得相对于等分当前块的直线的角度的索引和距离的索引、代表与直线正交的线段的角度的角度的索引,以及代表与直线的距离的距离的索引。
4.根据权利要求3所述的方法,其中,获得权重包括:
通过利用当前块的大小、角度的索引和距离的索引来计算当前块中的像素与直线之间的实际距离。
5.根据权利要求4所述的方法,其中,获得权重包括:
基于实际距离计算用于当前块中的像素的第一权重和第二权重,
其中,对于当前块中的每个像素,第一帧内预测因子的权重以及第二帧内预测因子的权重之和为1。
6.根据权利要求3所述的方法,其中,获得权重包括:
基于用于帧内预测的参考样本来确定预测因子,所述预测因子在当前块的沿着直线等分的每个区域中使用较大的权重。
7.一种由视频编码装置执行的用于对当前块进行帧内预测的方法,所述方法包括:
确定几何帧内预测标志,所述几何帧内预测标志指示对当前块是否使用几何帧内预测模式;以及
检查几何帧内预测标志,
其中,如果几何帧内预测标志为真,则所述方法进一步包括:
确定几何分区信息索引;
生成包括用于当前块的帧内预测的帧内预测模式的列表;
确定第一帧内预测模式;
对于第一帧内预测模式,从帧内预测模式的列表确定第一帧内预测模式索引;
基于第一帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第一帧内预测因子;
确定第二帧内预测模式;
对于第二帧内预测模式,从帧内预测模式的列表确定第二帧内预测模式索引;
基于第二帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第二帧内预测因子;
通过利用几何分区信息索引来获得权重,所述权重包括用于第一帧内预测因子的第一权重和用于第二帧内预测因子的第二权重;以及
通过利用权重对第一帧内预测因子和第二帧内预测因子进行加权求和,以生成当前块的最终帧内预测因子。
8.根据权利要求7所述的方法,进一步包括:
通过从帧内预测模式的列表排除第一帧内预测模式,对帧内预测模式的列表进行重新排序。
9.根据权利要求7所述的方法,进一步包括:
编码几何帧内预测标志。
10.根据权利要求9所述的方法,进一步包括,如果几何帧内预测标志为真:
则对几何分区信息索引、第一帧内预测模式索引以及第二帧内预测模式索引进行编码。
11.一种计算机可读记录介质,其存储由视频编码方法生成的比特流,所述视频编码方法包括:
确定几何帧内预测标志,所述几何帧内预测标志指示对当前块是否使用几何帧内预测模式;以及
检查几何帧内预测标志,
其中,如果几何帧内预测标志为真,则视频编码方法进一步包括:
确定几何分区信息索引;
生成包括用于当前块的帧内预测的帧内预测模式的列表;
确定第一帧内预测模式;
对于第一帧内预测模式,从帧内预测模式的列表确定第一帧内预测模式索引;
基于第一帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第一帧内预测因子;
确定第二帧内预测模式;
对于第二帧内预测模式,从帧内预测模式的列表确定第二帧内预测模式索引;
基于第二帧内预测模式,通过利用空间上邻近当前块的像素来生成当前块的第二帧内预测因子;
通过利用几何分区信息索引来获得权重,所述权重包括用于第一帧内预测因子的第一权重和用于第二帧内预测因子的第二权重;以及
通过利用权重对第一帧内预测因子和第二帧内预测因子进行加权求和,以生成当前块的最终帧内预测因子。
CN202280070919.0A 2021-10-25 2022-09-05 利用几何帧内预测模式的视频编解码的方法和装置 Pending CN118140476A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2021-0143104 2021-10-25
KR1020220111277A KR20230059136A (ko) 2021-10-25 2022-09-02 기하학적 인트라 예측모드를 이용하는 비디오 코딩방법 및 장치
KR10-2022-0111277 2022-09-02
PCT/KR2022/013245 WO2023075124A1 (ko) 2021-10-25 2022-09-05 기하학적 인트라 예측모드를 이용하는 비디오 코딩방법 및 장치

Publications (1)

Publication Number Publication Date
CN118140476A true CN118140476A (zh) 2024-06-04

Family

ID=91240930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280070919.0A Pending CN118140476A (zh) 2021-10-25 2022-09-05 利用几何帧内预测模式的视频编解码的方法和装置

Country Status (1)

Country Link
CN (1) CN118140476A (zh)

Similar Documents

Publication Publication Date Title
CN116530082A (zh) 利用帧内预测的视频编码的方法和装置
CN113892268A (zh) 基于预测模式估计的帧内预测装置和方法
CN116472709A (zh) 用于视频编码和解码的装置和方法
CN113812147B (zh) 使用块内复制的图像编码和解码
CN116941241A (zh) 利用基于矩阵的交叉分量预测的视频编解码方法和装置
CN116636211A (zh) 利用块合并编码视频的方法和装置
CN116134812A (zh) 使用任意块划分的视频编码和解码
CN116491114A (zh) 利用子块单元帧内预测的影像编码和解码方法和装置
CN118140476A (zh) 利用几何帧内预测模式的视频编解码的方法和装置
US20230300325A1 (en) Video coding method and apparatus using intra prediction
US20230396795A1 (en) Inter prediction-based video encoding and decoding
US20240114131A1 (en) Video encoding/decoding method and apparatus
US20230283768A1 (en) Method for predicting quantization parameter used in a video encoding/decoding apparatus
CN117917071A (zh) 利用子块编解码次序变化和根据子块编解码次序变化的帧内预测的视频编解码的方法和装置
CN118251891A (zh) 利用基于模板匹配的帧内预测的视频编解码的方法和装置
KR20230059136A (ko) 기하학적 인트라 예측모드를 이용하는 비디오 코딩방법 및 장치
CN117581534A (zh) 视频编码/解码方法和装置
CN118160304A (zh) 使用各种块划分结构的视频编码方法和设备
CN116472710A (zh) 利用分量之间的参考生成残差信号的方法和装置
CN117044200A (zh) 利用螺旋扫描顺序的视频编解码的方法和装置
CN118369914A (zh) 利用基于模板匹配的次要mpm列表的视频编解码的方法和装置
CN116530084A (zh) 利用基于块的深度学习模型的视频编解码器
CN118414831A (zh) 使用运动矢量预测物的候选列表的视频编码方法和装置
CN118056399A (zh) 利用几何分区模式的视频编码/解码的方法和装置
CN117917073A (zh) 视频编码/解码方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication