CN113574877B - 用于有效地对残差块解码的方法和装置 - Google Patents

用于有效地对残差块解码的方法和装置 Download PDF

Info

Publication number
CN113574877B
CN113574877B CN202080020838.0A CN202080020838A CN113574877B CN 113574877 B CN113574877 B CN 113574877B CN 202080020838 A CN202080020838 A CN 202080020838A CN 113574877 B CN113574877 B CN 113574877B
Authority
CN
China
Prior art keywords
block
sub
current block
residual
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080020838.0A
Other languages
English (en)
Other versions
CN113574877A (zh
Inventor
沈东圭
李钟石
朴时奈
朴胜煜
林和平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hyundai Motor Co
Industry Academic Collaboration Foundation of Kwangwoon University
Kia Corp
Original Assignee
Hyundai Motor Co
Industry Academic Collaboration Foundation of Kwangwoon University
Kia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hyundai Motor Co, Industry Academic Collaboration Foundation of Kwangwoon University, Kia Corp filed Critical Hyundai Motor Co
Publication of CN113574877A publication Critical patent/CN113574877A/zh
Application granted granted Critical
Publication of CN113574877B publication Critical patent/CN113574877B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

公开了视频解码方法和视频解码装置。为了有效地对根据基于块的运动补偿获得的残差块进行编码,视频编码装置和视频解码装置可以将当前块的相关残差块在水平或竖直方向上划分为两个子块,并且仅对两个残差子块中的一个进行编码。

Description

用于有效地对残差块解码的方法和装置
技术领域
本发明在一些实施方案中涉及视频的编码和解码。更具体地,本发明涉及用于有效地对残差块编码的方法和装置。
背景技术
由于视频数据与音频数据或静止影像数据相比具有较大的数据量,因此在进行压缩处理之前,需要大量的硬件资源,包括存储器,用来以原始形式存储或传输数据。
相应地,在解码单元可以接收、解压和再现压缩的视频数据之前,存储或传输视频数据通常伴随着通过利用编码器对其进行压缩。现有的视频压缩技术包括H.264/AVC和高效率视频编码(High Efficiency Video Coding,HEVC),所述高效率视频编码(HEVC)使H.264/AVC的编码效率提高了大约40%。
然而,视频影像在尺寸、分辨率和帧速率上的不断增加以及由此产生的要编码数据量的增加需要一种比现有压缩技术相比具有更好的编码效率改善和更高的影像质量改善的新的且优秀的压缩技术。
在视频编码处理中,视频编码装置利用通过帧内预测或帧间预测来执行当前块的预测,然后从预测块的样本值中减去当前块的样本值以生成残差块。视频编码装置将残差块分割为一个或更多个变换块,对一个或更多个变换块应用变换,从而将变换块的残差值从像素域变换到频域。根据预测精度,残差块的某些区域可能没有残差值或残差值很少,盲目地将残差块划分为更小尺寸的变换块有时效率非常低。
发明内容
技术问题
本发明在一些实施方案中寻求提供一种对残差块编码的方案,其适用于那些没有残差值或具有很少残差值的一些区域的残差块。
技术方案
本发明的至少一个方面提供了一种视频解码装置,其包括解码单元、预测单元、逆量化和逆变换单元、加法器和滤波器单元。解码单元配置为从比特流中解码标志,所述标志指示仅对应于当前块的部分区域的残差信号是否已被编码,以及当所述标志指示出仅对应于当前块的部分区域的残差信号已被编码时,从比特流中解码从当前块分割的两个子块中的一个子块的变换系数信息,以重构变换系数。预测单元配置为预测当前块以生成预测块。逆量化和逆变换单元配置为对变换系数信息已被解码的一个子块中的变换系数执行逆量化和逆变换,以生成当前块的残差块。加法器配置为将预测块和残差块相加,以重构当前块。滤波器单元配置为在水平和竖直方向上以规则的间隔设置N个样本的网格,并且对与网格的边界重合的当前块中的两个子块之间的边界执行去块滤波。
本发明的另一个方面提供了一种视频解码方法,所述方法包括以下步骤:(i)从比特流中解码标志,所述标志指示仅对应于当前块的部分区域的残差信号是否已被编码;(ii)当标志指示出仅对应于当前块的部分区域的残差信号已被编码时,通过从比特流中解码从当前块分割的两个子块中的一个子块的变换系数信息来重构变换系数;(iii)预测当前块,以生成预测块;(iv)通过对变换系数信息已被解码的一个子块中的变换系数执行逆量化和逆变换来生成当前块的残差块;(v)通过将预测块和残差块相加来重构当前块;(vi)在水平和竖直方向上以规则的间隔设置N个样本的网格,并且对与网格的边界重合的当前块中的两个子块之间的边界执行去块滤波。
附图说明
图1是示出可以实现本发明技术的视频编码装置的框图。
图2是用于解释通过利用QTBTTT结构来分割块的方法的示意图。
图3a是示出多个帧内预测模式的示意图。
图3b是示出包括宽角度帧内预测模式的多个帧内预测模式的示意图。
图4是示出能够实现本发明技术的视频解码装置的框图。
图5a至图5d示出要编码的残差块和子块的各种分区类型。
图6是用于解释在当前块的相关残差块中单独地对一个子块编码的情况的示意图,示出了用于预测量化参数(QP)要参考的相邻块的位置。
图7是色度块和与色度块相同位置的至少一个亮度块的示意图。
图8是重构的当前块的示意图,其示出了重构的当前块的相关残差块在它们的左侧子块处进行竖直分区和变换,以通过去块边界来揭示子块间分区边界。
图9是用于解释对残差子块之间的边界以残差信号电平执行的去块滤波的示意图。
图10是根据本发明的至少一个实施方案的由用于对视频的当前块进行帧间预测编码的视频编码装置执行的方法的流程图。
图11是根据本发明的至少一个实施方案的用于从编码的视频比特流对帧间预测编码的当前块解码的视频解码装置的方法的流程图。
具体实施方式
在下文中,将参考所附附图对本发明的一些实施方案进行详细描述。在下面的描述中,相同的附图标记优选地表示相同的元件,尽管元件在不同的附图中示出。此外,在一些实施方案的以下描述中,当认为模糊了本发明的主题时,为了清楚和简洁起见,将省略对相关的已知组件和功能的具体描述。
图1是示出可以实现本发明技术的视频编码装置的框图。在下文中,将参考图1描述视频编码装置和该装置的子组件。
视频编码装置可以配置为包括:图像分割单元110、预测单元120、减法器130、变换单元140、量化单元145、重排单元150、熵编码单元155、逆量化器160、逆变换单元165、加法器170、滤波器单元180和存储器190。
视频编码装置的各个组件可以实现为硬件或软件,或者硬件和软件的组合。另外,每个组件的功能可以通过软件来实现,而每个组件的软件功能可以实现为由微处理器来执行。
视频由多个图像组成。图像分别分割为多个区域,并对每个区域执行编码。例如,一个图像分割为一个或更多个瓦片(tile)或/和切片(slice)。这里,一个或更多个瓦片定义为瓦片组。每个瓦片或/和切片分割为一个或更多个编码树单元(Coding Tree Unit,CTU)。每个CTU通过树结构分割为一个或更多个编码单元(Coding Unit,CU)。应用于各个CU的信息被编码为CU的语法,并且共同应用于包括在一个CTU中的CU的信息被编码为CTU的语法。另外,共同应用于一个切片中的所有块的信息被编码为切片头的语法,而应用于构成一个图像的所有块的信息被编码在图像参数集(Picture Parameter Set,PPS)或图像头中。此外,由多个图像共同参考的信息被编码在序列参数集(Sequence Parameter Set,SPS)中。另外,由一个或更多个SPS共同参考的信息被编码在视频参数集(Video ParameterSet,VPS)中。以相同的方式,共同应用于一个瓦片或瓦片组的信息可以被编码为瓦片头或瓦片组头的语法。
图像分割单元110确定编码树单元(CTU)的大小。关于CTU的大小(CTU尺寸)的信息被编码为SPS或PPS的语法,并且被传输到视频解码装置。
图像分割单元110将构成视频的每个图像分割为具有预定大小的多个编码树单元(CTU),然后使用树结构递归地分割CTU。树结构中的叶节点成为编码单元(CU),所述编码单元(CU)是编码的基本单元。
使用的树结构可以是四叉树(QuadTree,QT)、二叉树(BinaryTree,BT)、三叉树(TernaryTree,TT)或两个或更多个QT结构、BT结构和TT结构的混合,所述四叉树(QT)即上层节点(或父节点)分割为四个大小相等的下层节点(或子节点),所述二叉树(BT)即上层节点分割为两个下层节点,所述三叉树(TT)即上层节点以1:2:1的大小比率分割为三个下层节点。例如,可以使用四叉树加二叉树(QuadTree plus BinaryTree,QTBT)结构,或者可以使用四叉树加二叉树三叉树(QuadTree plus BinaryTree TernaryTree,QTBTTT)结构。这里,BTTT可以统称为多类型树(Multiple-Type Tree,MTT)。
图2示出QTBTTT分割树结构。如图2所示,CTU可以首先分割为QT结构。可以重复四叉树分割,直到分割块的大小达到QT中允许的叶节点的最小块大小(MinQTSize)。指示QT结构的每个节点是否分割为下层的四个节点的第一标志(QT_split_flag)由熵编码单元155编码,并用信号通知视频解码装置。当QT的叶节点不大于BT中允许的根节点的最大块大小(MaxBTSize)时,可以进一步将其分割为任何一个或更多个BT结构或TT结构。在BT结构和/或TT结构中,可以存在多个分割方向。例如,可以存在水平和竖直分割相关节点的块的两个方向。如图2所示,当MTT分割开始时,通过熵编码单元155对指示节点是否分割的第二标志(mtt_split_flag)编码并用信号通知视频编码装置,如果是,则通过熵编码单元155对指示分割方向(竖直或水平)的另一标志进行编码和/或对指示分区或分割类型(二叉或三叉)的标志进行编码,并用信号通知视频解码装置。
替选地,在对指示每个节点是否分割为下层的四个节点的第一标志(QT_split_flag)编码之前,可以对指示节点是否分割的CU分割标志(split_cu_flag)编码。当CU分割标志(split_cu_flag)值指示出节点没有分割时,该节点的块成为分割树结构中的叶节点,并变为编码单元(CU),即是编码的基本单元。当CU分割标志(split_cu_flag)值指示出节点分割时,视频编码装置以上述方式从第一标志开始编码。
作为树结构的另一个示例,当使用QTBT时,可以存在两种类型的分区,包括水平地将相关节点的块分割为两个大小相等的块的类型(即,对称的水平分区)和竖直地将相关节点的块分割为两个大小相等的块的类型(即,对称的竖直分区)。由熵编码单元155编码并传输至视频解码装置的是指示BT结构的每个节点是否分割为下层的块的分割标志(split_flag)和指示其分割类型的分割类型信息。此外,可以存在另一种类型,即相关节点的块分割为两个非对称形成的块。非对称形式可以包括相关节点的块分割为大小比率为1:3的两个矩形块的形式,或者相关节点的块在对角线方向上分割的形式。
根据CTU的QTBT或QTBTTT分割,CU可以具有不同的大小。在下文中,将对应于要编码或解码的CU的块(即,QTBTTT的叶节点)称为“当前块”。采用QTBTTT分割,当前块的形状不仅可以是正方形,也可以是矩形。
预测单元120预测当前块以生成预测块。预测单元120包括帧内预测单元122和帧间预测单元124。
通常,图像中的当前块可以分别被预测地编码。当前块的预测通常可以利用帧内预测技术或帧间预测技术来执行,其中帧内预测技术使用来自包含当前块的每个图像的数据,而帧间预测技术使用来自在包含当前块的图像之前编码的先前图像的数据。帧间预测包括单向预测和双向预测。
帧内预测单元122通过利用位于当前图像中的当前块周围的周边像素(参考像素)来预测当前块中的像素。不同的预测方向呈现多个对应的帧内预测模式。例如,如图3a所示,多个帧内预测模式可以包括含有平面(planar)模式和DC模式的2种非方向模式以及65种方向模式。各个预测模式提供了相邻像素的不同对应定义和要使用的计算公式。
为了矩形形状的当前块的有效方向预测,使用的附加模式可以是由编号67至80以及编号-1至-14处的帧内预测模式的虚线箭头表示的图3b所示的方向模式。这些可以称为“宽角度帧内预测模式”。图3b中的箭头指示用于预测的对应参考样本,而非预测方向。预测方向与箭头指示的方向相反。宽角度帧内预测模式是在当前块为矩形时用于在反方向上执行特定方向模式的预测而无需附加的比特传输的模式。在这种情况下,在宽角度帧内预测模式中,可以通过矩形当前块的宽度与高度的比率来确定可用于当前块中的一些宽角度帧内预测模式。例如,当具有高度小于宽度的矩形形状时,具有角度小于45度的宽角度帧内预测模式(编号67至80处的帧内预测模式)可用于当前块中。当具有高度大于宽度的矩形形状时,具有角度为-135度或更大的宽角度帧内预测模式(编号-1至-14处的帧内预测模式)可用于当前块中。
帧内预测单元122可以确定要用于对当前块编码的帧内预测模式。在一些示例中,帧内预测单元122可以通过利用若干帧内预测模式来对当前块编码,并且从测试的模式中选择要使用的适当的帧内预测模式。例如,帧内预测单元122可以通过对若干测试的帧内预测模式的率失真(rate-distortion)分析来计算率失真值,并且在测试的模式中选择具有最佳率失真特性的帧内预测模式。
帧内预测单元122从多个帧内预测模式中选择一个帧内预测模式,并且通过利用根据选择的帧内预测模式和计算公式确定的至少一个相邻像素(参考像素)来预测当前块。关于选择的帧内预测模式的信息由熵编码单元155编码并传输至视频解码装置。
帧间预测单元124通过运动补偿处理来生成当前块的预测块。帧间预测单元124搜索当前图像之前的编码和解码的参考图像中与当前块最相似的块,并且通过利用搜索到的块来生成当前块的预测块。然后,帧间预测单元124生成与当前图像中的当前块和参考图像中的预测块之间的位移(displacement)相对应的运动矢量(motion vector)。通常,对亮度分量进行运动估计,并且基于亮度分量计算的运动矢量用于亮度分量和色度分量两者。由熵编码单元155来编码包括关于参考图像的信息和关于用于预测当前块的运动矢量的信息的运动信息,并将其传输至视频解码装置。
减法器130通过将当前块减去由帧内预测单元122或帧间预测单元124生成的预测块来生成残差块。
变换单元140将残差块分割为一个或更多个变换块,对一个或更多个变换块应用变换,从而将变换块的残差值从像素域变换到频域。在频域中,变换块称为包含一个或更多个变换系数值的系数块。二维变换核可以用于变换,一维变换核可以用于水平变换和竖直方向变换的每个。变换核可以基于离散余弦变换(DCT)、离散正弦变换(DST)等。
变换单元140可以通过利用残差块的整个大小作为变换单元来变换残差块中的残差信号。此外,变换单元140可以将残差块在水平或竖直方向上分割为两个子块,并且仅对两个子块中的一个进行变换,下面将参考图5a至图5d进行描述。相应地,变换块的大小可以不同于残差块的大小(从而不同于预测块大小)。在未执行变换的子块中,非零残差样本值可能不存在或可能非常稀疏。对于执行变换的子块的残差样本不进行信号通知,并且视频解码装置可以将它们全部视为“0”。根据分割方向和分割比率,可能存在若干分区类型。变换单元140向熵编码单元155提供关于残差块的编码模式(或变换模式)的信息,例如指示变换的是残差块还是残差子块的信息、指示选择为用于将残差块分割为子块的分区类型的信息、以及用于识别执行变换的子块的信息等。熵编码单元155可以对关于残差块的编码模式(或变换模式)的信息编码。
量化单元145对从变换单元140输出的变换系数进行量化,并且将量化的变换系数输出到熵编码单元155。量化单元145可以不经变换直接对特定块或帧的相关残差块进行量化。
重排单元150可以对量化的残差值上的系数值进行重排。重排单元150可以使用系数扫描(coefficient scanning)来将二维系数阵列改变为一维系数序列。例如,重排单元150可以通过锯齿形扫描(zig-zag scan)或对角线扫描(diagonal scan)将DC系数扫描为高频区域中的系数,以输出一维系数序列。根据变换单元的大小和帧内预测模式,使用的锯齿形扫描可以被用于在列方向上扫描二维系数阵列的竖直扫描和用于在行方向上扫描二维块形状系数的水平扫描代替。换句话说,可以根据变换单元的大小和帧内预测模式在锯齿形扫描、对角线扫描、竖直扫描和水平扫描中确定要使用的扫描方法。
熵编码单元155使用诸如基于上下文的自适应二进制算术编码(Context-basedAdaptive Binary Arithmetic Code,CABAC)、指数哥伦布(Exponential Golomb)等各种编码方法来对从重排单元150输出的一维量化的变换系数的序列编码,以生成比特流。
另外,熵编码单元155对关于块分区的信息(例如,CTU大小、CU分割标志、QT分割标志、MTT分割类型和MTT分割方向)编码,使得视频解码装置以与视频编码装置相同的方式来分割块。另外,熵编码单元155根据预测类型、帧内预测信息(即,关于帧内预测模式的信息)或帧间预测信息(即,关于参考图像和运动矢量的信息)来对关于预测类型的信息进行编码和解码,所述预测类型指示当前块是由帧内预测还是帧间预测进行编码。
逆量化单元160对从量化单元145输出的量化的变换系数进行逆量化,以生成变换系数。逆变换单元165将从逆量化单元160输出的变换系数从频域变换到空域,以重构残差块。
加法单元170将重构的残差块和由预测单元120生成的预测块相加,以重构当前块。重构的当前块中的像素在帧内预测下一个块时用作参考像素。
滤波器单元180对重构的像素执行滤波以减少由于基于块的预测和变换/量化而产生的块效应(blocking artifacts)、振铃效应(ringing artifacts)、模糊效应(blurring artifacts)等。滤波器单元180可以包括去块滤波器182和采样自适应偏移(sample adaptive offset,SAO)滤波器184。
去块滤波器180对重构的块之间的边界进行滤波,以去除由逐块编码/解码而引起的块效应,并且SAO滤波器184对去块滤波的影像执行附加滤波。SAO滤波器184是用于对由有损编码引起的重构的像素与原始的像素之间的差进行补偿的滤波器。
重构的块通过去块滤波器182和SAO滤波器184进行滤波,并且存储在存储器190中。当一个图像中的所有块被重构时,重构的图像可以用作要编码的后续图像中的块的帧间预测的参考图像。
图4是示出能够实现本发明技术的视频解码装置的功能框图。在下文中,将参考图4描述视频解码装置和该装置的子组件。
视频解码装置可以配置为包括:熵解码单元410、重排单元415、逆量化单元420、逆变换单元430、预测单元440、加法器450、滤波器单元460和存储器470。
就图1的视频编码装置来说,视频解码装置的各个组件可以实现为硬件或软件,或者硬件和软件的组合。另外,每个组件的功能可以通过软件来实现,而每个组件的软件功能可以实现为由微处理器来执行。
熵解码单元410对由视频编码装置生成的比特流解码并提取关于块分区的信息以确定要解码的当前块,并且提取重构当前块所需的预测信息和关于残差信号的信息等。
熵解码单元410从序列参数集(sequence parameter set,SPS)或图像参数集(picture parameter set,PPS)中提取关于CTU大小的信息,确定CTU的大小,并且将图像分割为确定大小的CTU。然后,熵解码单元410将CTU确定为树结构的最高层,即根节点,并且提取关于CTU的分割信息,从而通过利用树结构来分割CTU。
例如,当通过利用QTBTTT结构来分割CTU时,首先提取与QT分割相关的第一标志(QT_split_flag),并且将每个节点分割为下层的四个节点。对于与QT的叶节点相对应的节点,熵解码单元410提取与MTT的分区有关的第二标志(MTT_split_flag)和分割方向(竖直/水平)和/或分割类型(二叉/三叉)的信息,以将叶节点分割为MTT结构。这使得QT的叶节点下方的各个节点被递归地分割为BT或TT结构。
作为另一示例,当通过利用QTBTTT结构来分割CTU时,熵解码单元410可以首先提取指示CU是否分割的CU分割标志(split_cu_flag),并且在分割相关块时,还可以提取第一标志(QT_split_flag)。在分割过程中,每个节点可以具有零个或更多个递归QT分割,接着是零个或更多个递归MTT分割。例如,CTU可以立即进入MTT分割,或者相反,单独具有多个QT分割。
作为又一示例,当通过利用QTBT结构来分割CTU时,熵解码单元410提取与QT分割相关的第一标志(QT_split_flag),以将每个节点分割为下层的四个节点。并且,对于与QT的叶节点相对应的节点,熵解码单元410提取指示该节点是否进一步分割为BT的分割标志(split_flag)和分割方向信息。
此外,当熵解码单元410通过树结构分割来确定要解码的当前块时,所述熵解码单元410提取关于指示当前块是被帧内预测还是被帧间预测的预测类型的信息。当预测类型信息指示帧内预测时,熵解码单元410提取用于当前块的帧内预测信息(帧内预测模式)的语法元素。当预测类型信息指示帧间预测时,熵解码单元410提取帧间预测信息的语法元素,也就是说,指示运动矢量和由运动矢量参考的参考图像的信息。
此外,熵解码单元410从比特流中提取关于残差块的编码模式的信息,例如关于对残差块编码还是单独地对残差块的子块编码的信息、指示用于将残差块分割为子块的选择的分区类型的信息、识别编码的残差子块的信息、量化参数等。此外,熵解码单元410提取关于量化的当前块的变换系数的信息作为关于残差信号的信息。
重排单元415以由视频编码装置执行的系数扫描序列的相反序列,将由熵解码单元410进行熵解码的一维量化的变换系数重排成二维系数阵列,即块。
逆量化单元420对量化的变换系数进行逆量化。逆变换单元430基于关于残差块的编码模式的信息,将逆量化的变换系数从频域逆变换到空域,以重构残差信号,从而生成重构的当前块的残差块。
逆变换单元430响应于当关于残差块的编码模式的信息指示出在视频编码装置中对当前块的残差块编码时,通过利用当前块的大小(进而,要重构的残差块的大小)作为变换单元来对逆量化的变换系数执行逆变换,以生成重构的当前块的残差块。
另外,逆变换单元430响应于当关于残差块的编码模式的信息指示出在视频编码装置中单独地对残差块的单个子块编码时,通过利用变换的子块的大小作为变换单元来对逆量化的变换系数执行逆变换,以在用“0”值填充未变换的子块的残差信号时重构变换的子块的残差信号,从而生成重构的当前块的残差块。
预测单元440可以包括帧内预测单元442和帧间预测单元444。在当前块的预测类型是帧内预测时,激活帧内预测单元442,而在当前块的预测类型是帧间预测时,激活帧间预测单元444。
帧内预测单元442根据由熵解码单元410提取的帧内预测模式的语法元素,在多个帧内预测模式中确定当前块的帧内预测模式,并且根据确定的帧内预测模式,通过利用当前块的相邻参考像素来预测当前块。
帧间预测单元444利用由熵解码单元410提取的用于帧内预测模式的语法元素来确定当前块的运动矢量和由运动矢量参考的参考图像,并且利用确定的运动矢量和参考图像来预测当前块。
加法器450将从逆变换单元输出的残差块与从帧间预测单元或帧内预测单元输出的预测块相加,以重构当前块。重构的当前块中的像素在对要解码的后续块进行帧内预测时用作参考像素。
滤波器单元460可以包括去块滤波器462和SAO滤波器464。去块滤波器462对重构的块之间的边界进行去块和滤波,以去除由逐块解码引起的块效应。SAO滤波器464在去块滤波之后对重构的块执行附加滤波,以补偿由有损编码引起的重构的像素与原始的像素之间的差。重构的块通过去块滤波器462和SAO滤波器464进行滤波,并且存储在存储器470中。当一个图像中的所有块被重构时,重构的图像用作要被编码的图像内的后续块的帧间预测的参考图像。
本文所示的实施方案的技术通常涉及帧间预测编码,即,对当前块进行编码和解码。为了有效地对根据基于块的运动补偿获得的残差块进行编码,视频编码装置可以将残差块在水平或竖直方向上划分为两个残差子块,并且在两个残差子块之间单独地对一个残差子块编码。换句话说,变换和量化处理可以仅应用于一个残差子块。另一个非编码的子块的残差值被视为“0”或被忽略。当残差块的某些区域没有残差值或残差值很少时,这种编码工具在对残差块进行编码方面会很有效。
视频编码装置可以选择第一编码模式和第二编码模式中最优的一个,其中第一编码模式对残差块编码,从而以与预测块相等大小的变换单元对残差块中的残差信号进行变换,而第二编码模式将残差块在水平或竖直方向上分割为两个子块,并且单独地对一个子块编码,从而以与预测块不同大小的变换单元对残差块中的残差信号进行变换。
下面详述与残差块编码相关的第二模式。下面的描述主要关注于解码技术,特别是视频解码装置的操作,并且将保持编码技术简洁,这是因为编码技术是全面描述的解码技术的逆操作。另外,术语“残差块的子块”和“残差子块”可以互换使用。
1.分区类型和变换位置
图5a至图5d示出要编码(进而变换)的残差块和子块的各种分割或分区类型。残差块可以分割为两个子块。在示出的残差块510至580中,经历变换的子块画有阴影并用“A”标记。位于残差块中左侧或上侧的子块可以表示为位于残差块中的“位置0”处,而位于残差块中右侧或下侧的子块可以表示为位于残差块内的“位置1”处。执行变换的残差块中的子块的位置可以称为“变换位置”。因此,由“位置0”指示的变换位置可以表示对位于残差块中左侧或上侧的子块执行的变换,由“位置1”指示的变换位置可以表示对位于残差块中右侧或下侧的子块执行的变换。
根据分割方向和分割比率,可以考虑各种分区类型。要考虑的块分区类型包括:在水平方向上对称地分割的第一类型、在竖直方向上对称地分割的第二类型、在水平方向上非对称地分割(例如,以1:3或3:1的比率)的第三类型以及在竖直方向上非对称地分割(例如,以1:3或3:1的比率)的第四类型。
块510被竖直地分割为左侧子块和右侧子块,并且不对位置1处的右侧子块执行变换,而对位置0处的左侧子块执行变换。块520被竖直地分割为左侧子块和右侧子块,并且不对左侧子块执行变换,而对位置1处的右侧子块执行变换。块530在水平方向上被分割为上侧子块和下侧子块,并且对位置0处的上侧子块而不是对下侧子块执行变换。块540在水平方向上分割为两个子块,并且对位置1处的下侧子块而不是上侧子块执行变换。
块550被竖直地分割为具有1:3比率的左侧子块和右侧子块,,并且不对位置1处的右侧子块执行变换,而对位置0处的左侧子块执行变换。块560被竖直地分割为具有3:1比率的左侧子块和右侧子块,并且不对左侧子块执行变换,而对位置1处的右侧子块执行变换。块570被水平地分割为具有1:3比率的上侧子块和下侧子块,并且对位置0处的上侧子块而不是对下侧子块执行变换。块580在水平方向上分割为具有3:1比率的两个子块,并且对位置1处的下侧子块而不是上侧子块执行变换。
就图5c和图5d所示的块550至580来说,当残差块被非对称地分割(例如,以1:3或3:1的比率)时,默认情况下可以将变换设置为在较小的子块上执行。
可以根据残差块的大小来限制可用的分割比率和分割方向,以便为要经历变换的子块的高度或宽度提供4个或更多像素。例如,第一类型的水平对称分割可以用于宽度为8个像素或更多的残差块,而第二类型的竖直对称分割可以用于高度为8个像素或更多的残差块。类似地,提供水平或竖直非对称分割的第三类型和第四类型可以用于宽度或高度为16像素或更多的残差块。
2.变换核的选择
根据残差块的分区方向(水平或竖直)及其变换位置,即变换的子块的位置,可以选择水平方向和竖直方向上的变换核(horTransform和verTransform)用于要变换的子块。
当对残差块应用竖直分区时,要用于子块变换的核可以如下隐式推导。就块510和550来说,当被变换的子块在位置0时,则(horTransform,verTransform)=(DCT-8,DST-7)。就块520和560来说,当被变换的子块在位置1时,则(horTransform,verTransform)=(DST-7,DST-7)。
当对残差块应用水平分区时,要用于子块变换的核可以如下隐式推导。就块530和570来说,当被变换的子块位于位置0时,则(horTransform,verTransform)=(DCT-7,DST-8)。就块540和580来说,当被变换的子块位于位置1时,则(horTransform,verTransform)=(DST-7,DST-7)。
当一个残差子块大于32个像素时,DCT-2核可以应用于水平方向和竖直方向。另外,对于色度分量的残差块,DCT-2核可以始终应用于残差子块的变换,而不管残差块的分割方向(水平或竖直)及其变换位置,即变换后的子块的位置。某些情况可以显式地用信号通知识别用于在水平方向和竖直方向上变换的变换核的信息。
3.残差编码模式的信号通知
在当前块被帧间预测编码并且相关残差块具有至少一个非零系数时,可以显式地用信号通知指示当前块的相关残差块是否被变换或仅仅残差块的一个子块被编码的第一标志。
相应地,在重构帧间预测编码的当前块的残差块时,视频解码装置可以从比特流中解码第一标志,以确定视频编码装置是否已经将残差块分割为两个子块并在两个子块之间单独地对一个子块编码。
一些实施方案可以根据当前块的宽度或高度或者根据宽度和高度的乘积、宽度与高度的比率以及宽度和高度中较大的一个来跳过第一标志的信号通知。例如,在当前块的宽度和高度两者都小于8个像素时,视频解码装置可以跳过第一标志的解码并且推断出当前块的整个残差块已被变换。
当仅残差块的一个子块被编码时,残差块的分区类型和变换位置可以另外用信号通知。可以以各种方式向视频编码装置提供关于分区类型和变换位置的信息。例如,可以使用一个语法元素来表示残差块的分区类型,或者可以使用两个标志来表示分割比率和分割方向。此外,可以使用一个标志来表示变换位置,也就是被变换的子块的位置。一个示例情况可以在对残差块中位于左侧或上侧的子块应用变换时将指示变换位置的标志设置为“0”值,并且在对残差块中位于右侧或下侧的子块应用变换时将指示变换位置的标志设置为“1”值。
当以1:3或3:1的比率分割时,残差块可以添加约束,即变换总是在较小的子块处执行,这使得能够免除指示变换位置的标志的信号通知。
此外,根据残差块的宽度和高度,或者根据宽度和高度的乘积、宽度与高度的比率以及宽度和高度中较大的一个,可以限制使用某些分区类型或分割方向和/或分割比率,这使得能够免除表示相同分区类型或分割方向和/或分割比率的语法元素的信号通知。作为示例,当残差块的宽度和高度两者都小于16个像素时,可能不会允许“以1:3的比率或3:1的比率”分割残差块。相应地,视频解码装置可以响应于当残差块的宽度和高度小于16个像素时,推断出分割比率为1:1,而无需对指示分割比率的标志解码。作为另一个示例,当残差块的宽度(或高度)小于8个像素时,可能不会允许在竖直方向(或水平方向)上分割残差块。相应地,频解码装置可以响应于当残差块的宽度小于8个像素时,推断出在水平方向上分割残差块,而无需对指示分割方向的标志解码。类似地,视频解码装置可以响应于当残差块的高度小于8个像素时,推断出在竖直方向上执行分割。又一示例可以响应于当宽度大于高度时,推断出在竖直方向上执行分割,而当高度大于宽度时,推断出在水平方向上执行分割。
与亮度分量相关的残差块可以仅使其一个残差子块被编码,然后对应的与色度分量相关的残差块可以同样地仅使其一个残差子块被编码。相应地,可以在亮度分量残差块与色度分量残差块之间共享在CU级上用信号通知的第一标志。
选择用于亮度分量残差块的相同残差编码模式可以应用于与亮度分量残差块相同位置的色度分量残差块。换句话说,当亮度分量残差块仅使一个子块被编码时,色度分量残差块可以同样地仅使一个子块被编码。在这种情况下,可以在亮度块与色度块之间共享关于残差块的分区类型和要进行编码的子块的位置的信息。
在单个树结构的至少一个实施方案中,可以将相同的残差编码模式应用于亮度分量和色度分量,并且可以将关于确定为用于亮度分量残差块的分割方向和要进行编码的子块的位置的相同信息应用于色度分量残差块。在仅对色度分量残差块的一个子块进行编码的另一个示例中,当仅对相同位置的亮度分量残差块的一个子块进行同样的编码时,关于确定为用于亮度分量残差块的分割方向和要进行编码的子块的位置的相同信息可以应用于色度分量残差块。
4.残差块重构
视频解码装置可以基于分区类型和变换位置,确定要从比特流中解码相关变换系数信息的残差块中的子块的位置和子块的大小。视频解码装置可以从比特流中解码变换系数信息,以重构对应于变换位置的子块的变换系数。视频解码装置对重构的变换系数应用逆量化/逆变换处理,以生成对应于变换位置的子块的残差信号,并且将对应于非变换位置的其他子块的所有残差信号设置为“0”,从而重构当前块的残差块。
类似地,视频编码装置对与变换位置相对应的残差子块执行变换和量化,对量化的变换系数进行熵编码,并对量化的变换系数应用逆量化/逆变换处理,以重构对应于变换位置的残差子块,并且将对应于非变换位置的其他子块的所有残差信号设置为“0”,从而重构当前块的残差块。
5.量化参数的计算
视频编码装置可以确定当前块(CU)的量化参数(Quantization Parameter,QP)值,并且基于QP值和QP预测值来确定当前块的差分量化参数(Delta QP或DQP)值。视频编码装置可以配置为通过利用确定的QP值来用信号通知DQP值并量化当前块。视频编码装置可以调整当前块的QP值,从而调整应用于与当前块相关的系数块的量化程度。
DQP被定义为当前QP(即,在当前块中使用的实际QP)与当前QP的预测值或QP预测值之间的差。基于用信号通知的DQP,可以通过将DQP与QP预测值相加来重构对应的当前QP值。具体地,视频编码装置通过将当前块的实际QP减去QP预测值来计算DQP,并且视频解码装置通过将接收到的DQP与QP预测值相加来重构当前块的实际QP。
在一些实施方案中,相对于当前块的上侧块和左侧块的实际QP值的平均值可以确定为当前块的QP预测值。在一些其他的实施方案中,关于当前块的左侧块、左上侧块和上侧块的实际QP值的代表性值(例如,平均值、中值等)可以确定为当前块的QP预测值。
一些实施方案仅对当前块的相关残差块的一个子块进行编码,其中用于编码的残差块的分区信息、分割形状或子块的位置等用作选择要参考的相邻块的基础。然后,用于选择相邻块的实际QP值可以用作当前块的QP预测值,或者选择的相邻块的实际QP值可以用作得到当前块的QP预测值的基础。
图6是用于解释在当前块的相关残差块中单独地对一个子块编码的情况的示意图,其示出用于预测量化参数(QP)的要参考的相邻块的位置。
当残差块610被竖直分割并且残差信号仅存在于左侧子块中,也就是说,单独地对左侧子块编码时,与左侧子块相邻的相邻块“a、b、d、e”的QP预测值的至少一个可以用作计算当前块的QP预测值的基础。例如,可以基于块“a”和块“b”的QP值的平均值来计算当前块的QP预测值。
当残差块620被竖直分割并且残差信号仅存在于右侧子块中,也就是说,单独地对右侧子块进行编码时,作为与右侧子块相邻的相邻块的块“c”的QP值可以确定为当前块的QP预测值。
图7是色度块和与色度块相同位置的至少一个亮度块的示意图。
可以基于对应亮度块的QP值来确定色度块的QP值。可以基于相同位置处的亮度块的QP值来确定色度块的QP预测值。作为示例,位于当前块中左上侧处的亮度块“a”的QP值可以用作色度分量残差块的QP预测值。替选地,色度分量残差块的可用QP预测值可以是亮度块“a到i”的QP值中最频繁的值、最大值、最小值、平均值或中值。
当在色度分量残差块中单独地对一个子块编码时,色度块的可用QP预测值可以是基于残差块的分割方向、用于编码的子块的位置、子块的大小、子块的水平与竖直比率以及子块的宽度或高度中的较大值(或者,较小值)选择的亮度块的QP值。在至少一个实施方案中,色度分量块的可用QP预测值是块“d”和块“i”中的一个的QP值,或块“d”和块“i”的QP值的平均值,所述块“d”和块“i”是对应于在色度分量残差块中被编码的子块A的亮度块。
6.环路滤波
视频编码装置和视频解码装置可以对重构的当前块执行包括去块滤波的环路滤波(in-loop filtering),并且将滤波的当前块存储在缓冲器(例如,图1的存储器190和图4的存储器470)中,以将来用作要编码的图像中的后续块的帧间预测的参考图像。
去块滤波器应用于块边界处的像素,以减轻由重构图像中块之间的边界引起的块效应。对竖直边界和水平边界执行去块滤波。首先对竖直边界执行的滤波可以用作随后的水平边界滤波的输入。
图8是重构的当前块(810,820)的示意图,其示出重构的当前块的相关残差块在它们的左侧子块处进行竖直分区和变换(即,变换位置为0),以显示它们的子块间分区边界和去块边界。
视频编码装置和视频解码装置可以基于4×4单位(或8×8单位)去块边界是否与残差块的子块之间的边界相匹配来确定是否对当前块应用去块滤波。例如,视频解码装置可以在水平方向和竖直方向上以规则的间隔设置N个样本的网格,并且仅在当前块中的两个子块之间的边界与网格边界重合时执行去块滤波。相应地,可以不对与网格边界不重合的子块之间的边界执行去块滤波。这里,N可以设置为2n(n是自然数)。替选地,视频编码装置和视频解码装置可以基于包括在当前块中的若干列或行中的像素来确定是否对当前块应用去块滤波。可以根据当前块是亮度块还是色度块来使用不同单位的网格。例如,对于亮度块可以以4×4为单位设置网格,对于色度块可以以8×8为单位设置网格。
在一些实施方案中,可以以重构的残差信号的电平执行去块滤波。图9是用于解释对残差子块之间的边界以残差信号电平执行的去块滤波的示意图。图9示出在4×8残差块的下侧4×4子块处(即,变换位置为1)经历水平分割和变换的4×8残差块。一旦重构了对应于下侧子块的残差信号,并且用“0”填充上侧子块的残差信号以完成重构的残差块,则可以对残差块执行去块滤波。图9的实施方案示出了具有应用于两个子块之间的边界的参数[12 1]的一维均值滤波器。
当对当前块应用去块滤波器时,可以根据所需的去块滤波强度来选择强滤波器或弱滤波器。此外,可以考虑在通常的影像处理技术中使用各种常规滤波器,例如均值滤波器、中值滤波器和双边滤波器。
就滤波器选择来说,在选择用于残差去块滤波的滤波器之前,视频编码装置可以通知视频解码装置要使用的滤波器。例如,可以在多个预定的滤波器中用信号通知要使用的滤波器的索引。替选地,可以使用一个预定滤波器。
一旦选择了滤波器,实施方案计算与选择的滤波器相关的滤波参数,特别是确定滤波器强度的参数和像素变化的裁剪值,并且基于计算出的滤波参数,对残差样本边界执行滤波。
对于滤波器参数,可以用信号通知相邻编码单元(例如,前一帧、相邻块、相邻瓦片组、相邻瓦片等)的位置信息,并且对应于位置的相邻解码单元的滤波器参数可以原样用于当前块,或者根据相邻的参数值和进一步用信号通知的差值来重构用于当前块的滤波器参数。
图10是根据本发明的至少一个实施方案的由用于对视频的当前块进行帧间预测编码的视频编码装置执行的方法的流程图。
在步骤S1010,视频编码装置可以通过对正在编码的视频数据的当前块进行帧间预测来生成预测块,并且可以通过将视频数据的当前块减去预测块来生成残差块。
在步骤S1020,视频编码装置可以确定当前块的残差块的残差编码模式。具体地,视频编码装置可以选择是对当前块的残差块进行编码,还是仅对作为残差块的部分区域的一个子块进行编码。该选择可以基于率失真测试。
在步骤S1030,视频编码装置可以对关于选择为用于当前块的相关残差块的残差编码模式的信息进行编码。
残差编码模式信息可以包括指示编码的是残差块还是残差块的单独的一个子块的第一标志。
当仅对残差块的一个子块进行编码时,视频编码装置可以另外对指示用于将残差块分割为两个子块的分区类型的信息进行编码。根据分割方向和分割比率,可能存在各种分区类型。例如,帧间预测编码方法可以考虑使用的分区类型,所述分区类型包括:提供水平对称地分割为两个子块的第一类型、提供竖直对称地分割为两个子块的第二类型、提供水平非对称地分割为两个子块的第三类型(例如,以1:3或3:1的比率)以及提供竖直非对称地分割为两个子块的第四类型(例如,以1:3或3:1的比率)。可以使用一个或更多个语法元素来用信号通知当前块的相关残差块的分区类型(或分割方向和分割比率)。
根据当前块的相关残差块的宽度和高度,并因此根据预测块的宽度和高度,视频编码装置可以限制某些分割方向、分割比率和/或分区类型的使用,从而视频编码装置可以跳过用信号通知表示取决于残差块的宽度和高度的分割方向、分割比率和/或分区类型的语法元素。
在至少一个实施方案中,当残差块的宽度和高度都小于16个像素时,可能不会允许“以1:3或3:1的比率”分割残差块。相应地,当残差块的宽度和高度小于16个像素时,视频解码装置可以推断出分割比率为1:1,视频编码装置可以认为跳过跳过用于信号通知表示分割方向的语法元素(例如,1位标志)。在另一个实施方案中,在当前块的宽度小于8个像素时,可能不会允许当前块的竖直分割。在当前块的高度小于8个像素时,可能不会允许当前块的水平分割。相应地,当残差块的宽度(或高度)小于8个像素时,视频解码装置可以推断出当前块在竖直方向(或水平方向)上以1:1的比率分割,这使得视频编码装置能够跳过用信号通知表示分割方向的语法元素(例如,1位标志)。
另外,视频编码装置可以显式地用信号通知用于识别根据分区类型分类的两个子块之间的要编码(进而要经历变换)的子块的标志。在一些实施方案中,视频编码装置可以响应于在当前块的分区类型是第三类型或第四类型时,即,当在水平或竖直方向上非对称地分割当前块时,立即考虑两个块之间较小的子块要被编码,同时跳过用信号通知用于识别要编码的子块的标志。
在步骤S1040至S1050,视频编码装置根据选择为用于当前块的相关残差块的残差编码模式对残差块或残差块的一个子块进行编码。当选择对残差块编码时,视频编码装置可以以大小等于残差块的变换单元对残差块执行变换和量化,并且对量化的变换系数进行熵编码。当选择为仅对残差块的一个子块进行编码时,视频编码装置可以对与变换位置相对应的子块执行变换和量化,并且对量化的变换系数进行熵编码。对应于未变换的位置的其他子块的残差信号均视为0,这消除了对变换系数信息的需要。
在步骤S1060,视频解码装置可以对量化的变换系数应用逆量化/逆变换处理,以重构对应于变换位置的残差信号,并且将对应于非变换的位置的其他子块的所有残差信号设置为0,从而重构当前块的残差块。视频编码装置可以将重构的残差块与预测块相加,以生成重构的当前块。
在步骤S1070,视频编码装置可以至少对重构的当前块执行去块滤波,并且将滤波的当前块存储在缓冲器(例如,图1的存储器190)中,以用作要编码的图像中的后续块的帧间预测的参考图像。具体地,视频编码装置可以在水平方向和竖直方向上以规则的间隔设置N个样本的网格,并且基于残差块的子块之间的边界是否与网格边界重合来确定是否向当前块应用去块滤波。视频编码装置可以仅在当前块中的两个残差子块之间的边界与网格边界重合时执行去块滤波。换句话说,可以仅当4×4单元(或8×8单元)去块边界与残差子块之间的边界重合时执行去块滤波。
图11是根据本发明的至少一个实施方案的用于从编码的视频比特流解码帧间预测编码的当前块的视频解码装置的方法的流程图。
在步骤S1110,视频解码装置(例如,图4的熵解码单元)可以对关于当前块的相关残差块的残差编码模式的信息进行解码。
例如,视频解码装置可以从比特流中解码指示编码的是当前块的相关残差块还是残差块的单独的一个子块的第一标志。当第一标志具有第一值(例如,“0”)时,可以指示出残差块已被变换,而具有第二值(例如,“1”)的第一标志可以指示出残差块的单独的一个子块已被变换。
当第一标志指示出仅残差块的一个子块被变换时,视频解码装置可以从比特流中进一步解码表示残差块的分区类型(分割方向和/或分割比率)的一个或更多个语法元素,并且可以至少部分地基于解码的一个或更多个语法元素来确定残差块的分区类型。根据分割方向和分割比率,可能存在各种分区类型。例如,分区类型可以包括:提供水平对称地分割为两个子块的第一类型、提供竖直对称地分割为两个子块的第二类型、提供水平非对称地分割为两个子块的第三类型(例如,以1:3或3:1的比率)以及提供竖直非对称地分割为两个子块的第四类型(例如,以1:3或3:1的比率)。
在确定分区类型时,可以进一步考虑当前块的宽度和高度以及指示分区类型的信息。根据当前块的宽度和高度,可以限制某些分区类型(或分割方向和/或分割比率)的使用,这可以免除表示相同分区类型(或分割方向和/或分割比率)的语法元素的信令。
至少一个实施方案可以响应于在当前块的宽度和高度两者都小于16个像素时,不允许“以1:3或3:1的比率”分割当前块。相应地,当残差块的宽度和高度两者都小于16个像素时,视频解码装置可以仅推断出分割比率为1:1,而无需对指示分割方向的语法元素(例如,1位标志)解码。
另一个实施方案可以响应于在当前块的宽度(或高度)小于8个像素时,不允许在竖直方向(或水平方向)上分割当前块。因此,当残差块的宽度小于8个像素时,视频解码装置可以仅推断出分割方向为水平方向,而无需对指示分割方向的语法元素解码。以相同的方式,当残差块的高度小于8个像素时,视频解码装置可以仅推断出分割方向为竖直方向,而无需对指示该方向的语法元素解码。
为了识别要从中解码变换系数信息的子块,视频解码装置可以进一步从比特流中解码指示编码的子块位置的语法元素(例如,1位标志)以及进而已经执行变换的子块位置。在一些实施方案中,视频解码装置可以响应于在当前块的分区类型是第三类型或第四类型时,立即考虑两个块之间较小的子块是要经历变换的一个子块,同时跳过对指示执行变换的子块位置的语法元素的解码。
在步骤S1120至S1130,视频解码装置可以基于解码的残差编码模式信息来重构当前块的相关残差块。
当第一标志指示出当前块的相关残差块被编码时,视频解码装置可以从比特流中解码残差块的变换系数信息以重构变换系数。此后,视频解码装置对变换系数进行逆量化,并且以大小等于残差块的变换单元对逆量化的变换系数执行变换,从而重构当前块的残差块。
当第一标志指示出仅对残差块的一个子块进行编码时,视频解码装置可以从比特流中解码对应于变换位置的子块的变换系数信息,以重构变换系数。此后,视频解码装置对变换系数进行逆量化和逆变换,以生成对应于变换位置的子块的残差信号,并且将对应于非变换位置的其他子块的所有残差信号设置为“0”,从而重构当前块的残差块。
在步骤S1140,视频解码装置可以通过对当前块进行帧间预测来生成预测块,并且可以通过将预测块和残差块相加来重构当前块。
在步骤S1150,视频解码装置可以对重构的当前块执行去块滤波,并且将滤波的当前块存储在缓冲器(例如,图4的存储器470)中,以用作要编码的图像中的后续块的帧间预测的参考图像。视频解码装置可以在水平方向和竖直方向上以规则的间隔设置N个样本的网格,并且基于设置的网格的边界来确定是否对当前块应用去块滤波。例如,在当前块与已被解码的其他块之间的边界与网格边界重合时,可以对当前块与已被解码的其他块之间的边界应用去块滤波。另外,当残差块的子块之间的边界与网格边界重合时,可以对残差块的子块之间的边界应用去块滤波。可以根据当前块是亮度块还是色度块来使用不同单元的网格。例如,对于亮度块可以以4×4为单位设置网格,对于色度块可以以8×8为单位设置网格。
应当理解的是,以上描述呈现了可以以各种其他方式实现的说明性实施方案。在一些实施方案中描述的功能可以通过硬件、软件、固件和/或它们的组合来实现。还应当理解,本说明书中描述的功能组件由“……单元”来标记,以突出强调它们的独立可实现性。
此外,本发明中描述的各种方法或功能可以实现为存储在非易失性记录介质中的指令,所述指令可以由一个或更多个处理器读取和执行。非易失性记录介质包括例如以计算机***可读取的形式存储数据的所有类型的记录装置。例如,非易失性记录介质可以包括存储介质,例如可擦除可编程只读存储器(EPROM)、闪存驱动器、光驱、磁性硬盘驱动器和固态驱动器(SSD)等等。
尽管出于说明的目的已经描述了本发明的示例性实施方案,但是本领域的技术人员应当理解,在不脱离要求保护的本发明思想和精神的情况下,可以进行各种修改、添加和替换。因此,出于简洁和清楚起见,描述了本发明的示例性实施方案。本发明的技术思想的范围不受例示的限制。相应地,普通技术人员应当理解,要求保护的本发明的范围不受上述明确描述的实施方案的限制,而是受权利要求及其等同形式的限制。
相关申请的交叉引用
本申请要求2019年3月12日提交的韩国专利申请No.10-2019-0028364的优先权,该申请的全部内容通过引用结合到本文中。

Claims (15)

1.一种视频解码装置,包括:
解码单元,其配置为
从比特流中解码标志,所述标志指示仅对应于当前块的部分区域的残差信号是否已被编码,以及
当所述标志指示出仅对应于当前块的部分区域的残差信号已被编码时,从比特流中解码从当前块分割的两个子块中的一个子块的变换系数信息,以重构变换系数;
预测单元,其配置为预测当前块以生成预测块;
逆量化和逆变换单元,其配置为对变换系数信息已被解码的一个子块中的变换系数执行逆量化和逆变换,以生成当前块的残差块;
加法器,其配置为将预测块和残差块相加,以重构当前块;以及
滤波器单元,其配置为在水平和竖直方向上以规则的间隔设置N个样本的网格,并且对与网格的边界重合的当前块中的两个子块之间的边界执行去块滤波。
2.根据权利要求1所述的装置,其中,所述逆量化和逆变换单元进一步配置为通过对变换系数信息已被解码的一个子块中的变换系数执行逆量化和逆变换以生成两个子块中的一个子块的残差信号,并且通过将两个子块中的另一个子块的残差信号设置为零,来生成当前块的残差块。
3.根据权利要求1所述的装置,其中,所述解码单元进一步配置为:
从比特流中解码指示当前块的分区类型的一个或更多个语法元素,
根据指示当前块的分区类型的一个或更多个语法元素以及当前块的宽度和高度来确定要分割为两个子块的当前块的分区类型,以及
对仅对应于根据分区类型确定的两个子块的一个子块的变换系数信息进行解码。
4.根据权利要求3所述的装置,其中,所述当前块的分区类型包括:
第一类型,其中在水平方向上对称地分割当前块;
第二类型,其中在竖直方向上对称地分割当前块;
第三类型,其中在水平方向上非对称地分割当前块;以及
第四类型,其中在竖直方向上非对称地分割当前块。
5.根据权利要求4所述的装置,其中,所述解码单元进一步配置为:当分区类型是第三类型或第四类型时,仅对两个子块之间相对较小的子块解码变换系数信息。
6.根据权利要求1所述的装置,其中,所述当前块是由色度分量组成的色度块。
7.根据权利要求1所述的装置,其中,N为8。
8.根据权利要求1所述的装置,进一步包括:
残差滤波器单元,其配置为对在由逆量化和逆变换单元生成的残差块内的两个子块之间的边界进行滤波。
9.根据权利要求1所述的装置,其中,所述解码单元进一步配置为对当前块的差分量化参数进行解码,以及
其中,所述逆量化和逆变换单元进一步配置为:
从与变换系数信息已被解码的一个子块相邻的至少一个相邻块的量化参数推导量化参数预测值,
通过利用量化参数预测值和差分量化参数,对变换系数信息已被解码的一个子块中的变换系数执行逆量化。
10.根据权利要求6所述的装置,其中,所述逆量化和逆变换单元配置为:
从与色度块相同位置的至少一个亮度块的量化参数推导色度块的量化参数,
通过利用色度块的量化参数来执行逆量化。
11.一种视频解码方法,所述方法包括:
从比特流中解码标志,所述标志指示仅对应于当前块的部分区域的残差信号是否已被编码;
当所述标志指示出仅对应于当前块的部分区域的残差信号已被编码时,通过从比特流中解码从当前块分割的两个子块中的一个子块的变换系数信息来重构变换系数;
预测当前块以生成预测块;
对变换系数信息已被解码的一个子块中的变换系数执行逆量化和逆变换来生成当前块的残差块;
通过将预测块和残差块相加来重构当前块;以及
在水平和竖直方向上以规则的间隔设置N个样本的网格,并且对与网格的边界重合匹配的当前块中的两个子块之间的边界执行去块滤波。
12.根据权利要求11所述的方法,其中,重构变换系数包括:
通过对变换系数信息已被解码的一个子块中的变换系数执行逆量化和逆变换以生成两个子块中的一个子块的残差信号,并且通过将两个子块中的另一个子块的残差信号设置为零,来生成当前块的残差块。
13.根据权利要求11所述的方法,其中,重构变换系数包括:
从比特流中解码指示当前块的分区类型的一个或更多个语法元素;
根据指示当前块的分区类型的一个或更多个语法元素以及当前块的宽度和高度来确定要分割为两个子块的当前块的分区类型;以及
对仅对应于根据分区类型确定的两个子块的一个子块的变换系数信息进行解码。
14.根据权利要求13所述的方法,其中,当前块的分区类型包括:
第一类型,其中在水平方向上对称地分割当前块;
第二类型,其中在竖直方向上对称地分割当前块;
第三类型,其中在水平方向上非对称地分割当前块;
第四类型,其中在竖直方向上非对称地分割当前块。
15.根据权利要求14所述的方法,其中,对变换系数信息进行解码包括:
当分区类型是第三类型或第四类型时,仅对两个子块之间相对较小的子块解码变换系数信息。
CN202080020838.0A 2019-03-12 2020-03-12 用于有效地对残差块解码的方法和装置 Active CN113574877B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20190028364 2019-03-12
KR10-2019-0028364 2019-03-12
PCT/KR2020/003455 WO2020185009A1 (ko) 2019-03-12 2020-03-12 잔차블록을 효율적으로 코딩하는 방법 및 장치

Publications (2)

Publication Number Publication Date
CN113574877A CN113574877A (zh) 2021-10-29
CN113574877B true CN113574877B (zh) 2024-06-28

Family

ID=72426941

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080020838.0A Active CN113574877B (zh) 2019-03-12 2020-03-12 用于有效地对残差块解码的方法和装置

Country Status (4)

Country Link
US (2) US11973966B2 (zh)
KR (1) KR20200110220A (zh)
CN (1) CN113574877B (zh)
WO (1) WO2020185009A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4000261A4 (en) * 2019-08-06 2023-05-24 HFI Innovation Inc. METHOD AND DEVICE FOR CODING OR DECODING VIDEO DATA WITH MATCHING INTRA PREDICTION MODES
US11388401B2 (en) * 2020-06-26 2022-07-12 Google Llc Extended transform partitions for video compression
US11683515B2 (en) * 2021-01-27 2023-06-20 Tencent America LLC Video compression with adaptive iterative intra-prediction
CN117280690A (zh) * 2021-04-02 2023-12-22 抖音视界有限公司 对视频块的分割的限制
CN115174908B (zh) * 2022-06-30 2023-09-15 北京百度网讯科技有限公司 视频编码的变换量化方法、装置、设备以及存储介质
WO2024091094A1 (ko) * 2022-10-28 2024-05-02 주식회사 케이티 영상 부호화/복호화 방법 및 비트스트림을 저장하는 기록 매체

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106464881A (zh) * 2014-06-04 2017-02-22 高通股份有限公司 块自适应颜色空间转换译码
KR20180085526A (ko) * 2017-01-19 2018-07-27 가온미디어 주식회사 효율적 변환을 처리하는 영상 복호화 및 부호화 방법

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100723408B1 (ko) * 2004-07-22 2007-05-30 삼성전자주식회사 컬러영상의 변환/역변환 및 양자화/역양자화 방법 및장치와, 이를 이용한 컬러영상의 부호화/복호화 방법 및장치
WO2007032597A1 (en) * 2005-07-20 2007-03-22 Electronics And Telecommunications Research Institute Method of redundant picture coding using polyphase downsampling and the codec using the same
EP1949703A4 (en) * 2005-10-21 2011-03-16 Korea Electronics Telecomm DEVICE AND METHOD FOR CODING AND DECODING A MOVABLE IMAGE USING ADAPTIVE SENSING
KR101366086B1 (ko) * 2007-01-03 2014-02-21 삼성전자주식회사 잔차 블록의 계수들에 대한 부호화 결정 방법, 장치,인코더 및 디코더
US9635368B2 (en) * 2009-06-07 2017-04-25 Lg Electronics Inc. Method and apparatus for decoding a video signal
US20110160526A1 (en) 2009-12-31 2011-06-30 Zunker Maryann Disposable urine incontinence device with cover sheet
US8995527B2 (en) 2010-02-19 2015-03-31 Qualcomm Incorporated Block type signalling in video coding
WO2011129672A2 (ko) * 2010-04-16 2011-10-20 에스케이텔레콤 주식회사 영상 부호화/복호화 장치 및 방법
PE20170650A1 (es) 2010-04-23 2017-05-11 Mandk Holdings Inc Dispositivo de procesamiento de imagenes digitales para codificar una imagen
MX355733B (es) * 2010-06-10 2018-04-27 Thomson Licensing Métodos y aparatos para determinar predictores de parametro de cuantificación a partir de una pluralidad de parametros de cuantificación contiguos.
KR101224141B1 (ko) 2010-08-23 2013-01-18 코리아이앤씨 주식회사 섬유보강 콘크리트 보
JP2014078891A (ja) * 2012-10-11 2014-05-01 Canon Inc 画像処理装置、画像処理方法
AU2013200051B2 (en) * 2013-01-04 2016-02-11 Canon Kabushiki Kaisha Method, apparatus and system for de-blocking video data
WO2016043933A1 (en) 2014-09-15 2016-03-24 Mediatek Inc. Method of deblocking for intra block copy in video coding
EP3349455A1 (en) * 2017-01-11 2018-07-18 Thomson Licensing Method and device for coding a block of video data, method and device for decoding a block of video data
KR102566332B1 (ko) * 2017-03-31 2023-08-11 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 화상 부호화 장치, 화상 복호 장치, 화상 부호화 방법 및 화상 복호 방법
ES2927102T3 (es) 2017-05-31 2022-11-02 Lg Electronics Inc Método y dispositivo para realizar descodificación de imágenes sobre la base de la intrapredicción en sistemas de codificación de imágenes
MX2020001886A (es) * 2017-08-22 2020-03-24 Panasonic Ip Corp America Codificador de imagen, descodificador de imagen, metodo de codificacion de imagen y metodo de descodificacion de imagen.
EP3777192A1 (en) * 2018-03-29 2021-02-17 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Refined block-based predictive coding and decoding of a picture
CN114556924B (zh) * 2019-10-14 2024-01-26 字节跳动有限公司 视频处理中色度残差的联合编解码与滤波的方法、装置及介质
US11765370B2 (en) * 2021-07-27 2023-09-19 Mediatek Inc. Video residual decoding apparatus using neighbor storage device with smaller storage size to store neighbor data for context selection and associated method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106464881A (zh) * 2014-06-04 2017-02-22 高通股份有限公司 块自适应颜色空间转换译码
KR20180085526A (ko) * 2017-01-19 2018-07-27 가온미디어 주식회사 효율적 변환을 처리하는 영상 복호화 및 부호화 방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CE11-related: subblock boundary filter at 8x8 Grid;Hyeongmun Jang et al.;《Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 13th Meeting: Marrakech, MA, 9–18 Jan. 2019》;第1节 *
CE6: Sub-block transform for inter blocks (CE6.4.1);Yin Zhao et al.;《Joint Video Experts Team (JVET) of ITU-T SG 16 WP 3 and ISO/IEC JTC 1/SC 29/WG 11 13th Meeting: Marrakech, MA, 9–18 Jan. 2019》;第1节 *

Also Published As

Publication number Publication date
WO2020185009A1 (ko) 2020-09-17
US20240244247A1 (en) 2024-07-18
CN113574877A (zh) 2021-10-29
KR20200110220A (ko) 2020-09-23
US11973966B2 (en) 2024-04-30
US20220191531A1 (en) 2022-06-16

Similar Documents

Publication Publication Date Title
CN113574877B (zh) 用于有效地对残差块解码的方法和装置
US20220191530A1 (en) Intra prediction method and device for predicting and dividing prediction unit into sub-units
US11962777B2 (en) Inverse quantization device and method used in video decoding device
JP2024019428A (ja) 動画データのイントラ予測コーディングのための方法及び装置
CN113892268A (zh) 基于预测模式估计的帧内预测装置和方法
US20230048262A1 (en) Decoding device and method for predicting block partitioned into random shape
EP4068776A1 (en) Decoding device and method for predicting block partitioned into random shapes
CN113841403A (zh) 影像解码装置中使用的逆量化装置和方法
RU2803519C2 (ru) Способ и устройство для эффективного кодирования остаточных блоков
RU2803426C2 (ru) Способ и устройство для эффективного кодирования остаточных блоков
RU2776871C1 (ru) Способ и устройство для эффективного кодирования остаточных блоков
RU2803519C9 (ru) Способ и устройство для эффективного кодирования остаточных блоков
RU2803537C2 (ru) Способ и устройство для эффективного кодирования остаточных блоков
RU2803532C2 (ru) Способ и устройство для эффективного кодирования остаточных блоков
CN114762328B (zh) 利用差分调制的视频编码和解码方法
US20240214566A1 (en) Method of restoration in subblock units, and video decoding apparatus
CN114128281B (zh) 用于控制编码工具的方法
US20240007645A1 (en) Video encoding and decoding method using adaptive reference pixel selection
US20240007623A1 (en) Block splitting structure for efficient prediction and transform, and method and appartus for video encoding and decoding using the same
US20240007620A1 (en) Image encoding and decoding method using adaptive alternative mode
US20220132156A1 (en) Image decoding device using differential coding
CN116458160A (zh) 利用自适应替代模式的影像编码和解码方法
KR20220071129A (ko) 적응적 참조화소 선택을 이용한 영상 부호화 및 복호화 방법
CN118339835A (zh) 在多变换选择中调整多变换选择候选的数量的视频编码/解码方法和装置
CN116648907A (zh) 用于高效预测和变换的块分割结构以及利用块分割结构的视频编码和解码的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant