CN113498609B - 用于视频编解码的依赖图片分辨率的配置 - Google Patents

用于视频编解码的依赖图片分辨率的配置 Download PDF

Info

Publication number
CN113498609B
CN113498609B CN201980092938.1A CN201980092938A CN113498609B CN 113498609 B CN113498609 B CN 113498609B CN 201980092938 A CN201980092938 A CN 201980092938A CN 113498609 B CN113498609 B CN 113498609B
Authority
CN
China
Prior art keywords
motion vector
level
picture
motion
buffer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201980092938.1A
Other languages
English (en)
Other versions
CN113498609A (zh
Inventor
陈漪纹
王祥林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Publication of CN113498609A publication Critical patent/CN113498609A/zh
Application granted granted Critical
Publication of CN113498609B publication Critical patent/CN113498609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

在具有一个或更多个处理器以及存储将由一个或更多个处理器执行的多个程序的存储器的计算设备处执行一种视频编解码方法。所述方法包括:响应于第一图片分辨率、第一档次或第一等级中的任一项,选择第一时间运动矢量预测压缩方案;并且响应于第二图片分辨率、第二档次或第二等级中的任一项,选择第二时间运动矢量预测压缩方案。

Description

用于视频编解码的依赖图片分辨率的配置
相关申请的交叉引用
本申请要求于2018年12月31日提交的序列号为62/787,240的美国临时专利申请的优先权。上述申请的全部公开通过引用全部包含于此。
技术领域
本公开总体上涉及视频编解码和压缩。更具体地,本公开涉及用于使用帧间预测执行视频编解码的***和方法。
背景技术
此部分提供了与本公开相关的背景信息。此部分中包含的信息应不必被解释为现有技术。
可使用各种视频编解码技术中的任一种来压缩视频数据。可根据一个或更多个视频编解码标准来执行视频编解码。一些说明性的视频编解码标准包括通用视频编解码(VVC)、联合探索测试模型(JEM)、高效视频编解码(H.265/HEVC)、高级视频编解码(H.264/AVC)和运动图片专家组(MPEG)编解码。视频编解码通常利用预测方法(例如,帧间预测、帧内预测等),这些预测方法利用视频图像或序列中固有的冗余。视频编解码技术的一个目标是在避免或最小化视频质量的劣化的同时将视频数据压缩为使用较低比特率的形式。
发明内容
此部分提供了本公开的总体概述,而不是其全部范围或其所有特征的全面公开。
根据本公开的第一方面,在具有一个或更多个处理器以及存储将由一个或更多个处理器执行的多个程序的存储器的计算设备处执行一种视频编解码方法。所述方法包括:响应于第一图片分辨率、第一档次或第一等级中的任一项,选择第一时间运动矢量预测压缩方案;并且响应于第二图片分辨率、第二档次或第二等级中的任一项,选择第二时间运动矢量预测压缩方案。
根据本公开的第二方面,在具有一个或更多个处理器以及存储将由一个或更多个处理器执行的多个程序的存储器的计算设备处执行一种视频编解码方法。所述方法包括:选择用于将第一运动矢量存储在运动矢量缓冲器中的第一运动矢量精度水平,其中,该选择是响应于与第一图片相关联的第一图片分辨率、第一档次或第一等级中的任一项被执行的;并且选择用于将第二运动矢量存储在运动矢量缓冲器中的第二运动矢量精度水平,其中,该选择是响应于与第二图片相关联的第二图片分辨率、第二档次或第二等级中的任一项被选择的;其中第一运动矢量精度水平不同于第二运动矢量精度水平。
根据本公开的第三方面,在具有一个或更多个处理器以及存储将由一个或更多个处理器执行的多个程序的存储器的计算设备处执行一种视频编解码方法。所述方法包括:选择用于执行运动补偿的第一最小可允许块尺寸,其中,该选择是响应于与第一图片相关联的第一图片分辨率、第一档次或第一等级中的任一项被执行的;并且选择用于执行运动补偿的第二最小可允许块尺寸,其中,该选择是响应于与第二图片相关联的第二图片分辨率、第二档次或第二等级中的任一项被执行的;其中第一最小可允许块尺寸不同于第二最小可允许块尺寸。
附图说明
在下文中,将结合附图描述本公开的说明性、非限制性实施例的集合。相关领域的普通技术人员可基于这里提供的示例来实现结构、方法或功能的变型,并且这样的变型都被包含在本公开的范围内。在不存在冲突的情况下,不同实施例的教导可以但不必彼此组合。
图1是阐述说明性通用视频编解码测试模型3(VTM-3)编码器的框图。
图2是划分为多个编码树单元(CTU)的图片的图形描绘。
图3示出具有多个分割模式的多类型树结构。
图4A示出针对VTM-3的基于块的4参数仿射运动模型的示例。
图4B示出针对VTM-3的基于块的6参数仿射运动模型的示例。
图5是组织为多个子块的仿射运动矢量场(MVF)的图形描绘。
图6A示出在通用视频编解码的上下文中由基于子块的时间运动矢量预测(SbTMVP)过程使用的空间邻近块的集合。
图6B示出基于子块的时间运动矢量预测(SbTMVP)过程,其中,所述过程用于通过应用来自空间邻近的运动移位并对来自对应同位子CU的运动信息进行缩放来推导子编码单元(CU)运动场。
图7A示出用于在高效视频编解码(HEVC)中使用的16:1运动矢量(MV)压缩的代表性MV。
图7B示出用于在VTM-3中使用的4:1运动矢量(MV)压缩的代表性MV。
图8A示出用于垂直8:1运动矢量(MV)压缩的代表性MV。
图8B示出用于水平8:1运动矢量(MV)压缩的代表性MV。
具体实施方式
本公开中使用的术语旨在示出特定示例,而不是限制本公开。如本公开以及所附权利要求中使用的单数形式“一”、“一个”和“该”也指复数形式,除非在上下文中明确包含其他含义。应理解,如这里所使用的术语“和/或”是指一个或更多个相关联的所列项的任意一个或所有可能组合。
应理解,尽管这里可使用术语“第一”、“第二”、“第三”等来描述各种信息,但是该信息不应被这些术语限制。这些术语仅被用于将一类信息与另一类信息区分开。例如,在不脱离本公开的范围的情况下,第一信息可被称为第二信息;并且类似地,第二信息也可被称为第一信息。如这里所使用的,取决于上下文,术语“如果”可被理解为意指“当……时”或“在……时”或“响应于”。
在整个说明书中对单数或复数的“一个实施例”、“实施例”、“另一实施例”等的引用意味着结合实施例描述的一个或更多个特定特征、结构或特性被包括在本公开的至少一个实施例中。因此,在整个说明书中的各种位置中以单数或复数出现的短语“在一个实施例中”或“在实施例中”、“在另一实施例中”等不必都指代相同的实施例。此外,一个或更多个实施例中的特定特征、结构或特性可通过任何合适的方式被组合。
在2018年4月10-20日在加利福尼亚州圣地亚哥举行的第10次联合视频专家组(JVET)会议上,JVET定义了通用视频编解码(VVC)的第一草案和VVC测试模型1(VTM-1)编码方法。决定了包括具有嵌套多类型树的四元树(四叉树)结构,具有嵌套多类型树的四元树(四叉树)结构将二分割和三分割编码块结构用作VVC的初始新编解码特征。从那时起,在JVET会议期间已经开发了用于实现编码方法和草案VVC解码过程的参考软件VTM。如在大多数先前的标准中,VVC具有基于块的混合编解码架构,基于块的混合编解码架构将图片间和图片内预测及变换编解码与熵编解码结合。
图1是阐述说明性通用视频编解码测试模型3(VTM-3)编码器100的框图。包括多个图片的输入视频102被应用于第一加法器104和切换器106的非反相输入。第一加法器104的输出被连接到变换/量化块108的输入。变换/量化块108的输出被馈送到熵编码块110的输入,并且还被馈送到反量化/逆变换块111的输入。反量化/逆变换块111的输出被馈送到第二加法器112的第一非反相输入。第二加法器112的输出被连接到环路滤波器120的输入。环路滤波器120的输出被连接到解码图片缓冲器(DPB)122的输入。
切换器106将输入视频102连接到帧内预测块114的输入,或者连接到运动估计/补偿块116的第一输入。帧内预测块114的输出和运动估计/补偿块116的输出都被连接到第一加法器104的反相输入以及第二加法器112的第二非反相输入。DPB 122的输出被连接到运动估计/补偿块116。
在操作中,编码器100将输入图像划分或分割为编码树单元(CTU)的序列。CTU概念基本上类似于高效视频编解码(HEVC)中利用的CTU概念。对于具有三个样点阵列的图片,当使用4:2:0的YUV色度子采样格式时,CTU包括亮度样点的2N×2N块以及色度样点的两个对应N×N块。
图2是使用VVC中的树结构被划分或分割为多个编码树单元(CTU)201、202、203的图片的图形描绘。在HEVC中,通过使用被表示为编码树或四叉树的四元树结构将每个CTU201、202、203分割为编码单元(CU),以适应各种局部特性。在叶CU级做出是使用图片间(时间)预测还是使用图片内(空间)预测对图片区域进行编码的决定。每个叶CU可根据PU分割类型被进一步分割为一个、两个或四个预测单元(PU)。在一个PU内部,应用相同的预测过程,并且基于PU将相关信息发送到解码器。在通过基于PU分割类型应用预测过程来获得残差块之后,可根据与CU的编码树类似的另一四元树结构将叶CU分割为变换单元(TU)。HEVC结构的一个特征是它利用包括CU、PU和TU的多个分割概念。
在VVC中,具有使用二分割和三分割分段结构的嵌套多类型树的四元树(四叉树)代替了多分割单元类型的概念。因此,除了对于最大变换长度来说具有太大尺寸的CU需要CU、PU和TU概念的分离之外,四叉树去除了CU、PU和TU概念的分离,同时针对CU分割形状支持更大的灵活性。在编码树结构中,CU可具有正方形或矩形形状。每个编码树单元(CTU)201、202、203首先按四叉树结构被分割。然后,四叉树叶节点可按多类型树结构被进一步分割。
图3示出具有多个分割模式的多类型树结构。四个分割类型中的任一分割类型存在于图3的多类型树结构中,即,垂直二分割(SPLIT_BT_VER)301、水平二分割(SPLIT_BT_HOR)302、垂直三分割(SPLIT_TT_VER)303和水平三分割(SPLIT_TT_HOR)304。多类型树叶节点被称为编码单元(CU)。除非CU对于最大变换长度来说太大,否则此分割被用于预测和变换处理,而不进行任何进一步分割。这意味着,在大多数情况下,CU、PU和TU在具有嵌套多类型树编码块结构的四叉树中具有相同的块尺寸。当最大支持变换长度小于CU的颜色分量的宽度或高度时,出现例外。
对于每个帧间预测CU,包括运动矢量、参考图片索引和参考图片列表使用索引的运动参数以及VVC的新编解码特征所需的任何附加信息被用于帧间预测样点生成。可通过显式或隐式方式用信号发送运动参数。当CU以跳过模式被编解码时,CU与一个PU相关联并且不具有有效残差系数,不具有编解码运动矢量差量或参考图片索引。合并模式被定义为从邻近CU(包括空间候选和时间候选)获得针对当前CU的运动参数,并且在VVC中引入附加调度。不仅仅是跳过模式,合并模式可被应用于任何帧间预测CU。合并模式的替代方式在于显式地发送运动参数,其中针对每个CU显式地用信号发送运动矢量、针对每个参考图片列表的对应参考图片索引以及参考图片列表使用标志和其它所需信息。
除了HEVC中的帧间编解码特征之外,VTM3还包括如下列出的多个新的和改进的帧间预测编解码工具:
-扩展合并预测
-具有MVD的合并模式(MMVD)
-仿射运动补偿预测
-基于子块的时间运动矢量预测(SbTMVP)
-自适应运动矢量分辨率(AMVR)
-运动场存储:1/16像素亮度样点(1/16th luma sample)MV存储和8×8运动场压缩
-具有加权平均的双预测(BWA)
-双向光流(BDOF)
-三角形分割预测
-组合帧间和帧内预测(CIIP)
以下段落提供关于VVC中指定的所选帧间预测方法的细节。除了HEVC中的帧间编解码特征之外,VTM3还包括如下列出的多个新的和改进的帧间预测编解码工具:
如下在VVC中执行扩展合并预测。在VTM3中,通过按顺序包括以下五种类型的候选来构建合并候选列表:
1)来自空间邻近CU的空间MVP
2)来自同位CU的时间MVP
3)来自FIFO表的基于历史的MVP
4)成对平均MVP
5)零MV。
合并列表的大小在条带头中被用信号发送。在VTM-3中,合并列表的最大允许大小为6。对于合并模式下的每个CU编解码,使用截断一元二值化(TU)对最佳合并候选的索引进行编码。合并索引的第一个二进制位利用上下文被编解码,并且旁路编解码被用于其它二进制位。
如下执行VVC中的仿射运动补偿预测。在HEVC中,只有平移运动模型被应用于运动补偿预测(MCP),尽管事实是在现实世界中存在许多类型的运动,例如,放大/缩小、旋转、透视运动和其他不规则运动。
图4A示出针对VTM-3的基于块的4参数仿射运动模型401的示例,并且图4B示出针对VTM-3的基于块的6参数仿射运动模型402的示例。与针对VTM-3的运动补偿过程结合使用模型401和402。在4参数仿射运动模型401的情况下,使用来自两个控制点v0和v1的运动信息(构成4参数仿射运动模型)来描述给定块的仿射运动场。在6参数仿射运动模型402的情况下,使用来自三个控制点v0、v1和v2的运动信息(构成6参数仿射运动模型)来描述给定块的仿射运动场。
对于4参数仿射运动模型401,如下推导块中的样点位置(x,y)处的运动矢量:
Figure GDA0003227239960000071
对于6参数仿射运动模型402,如下推导块中的样点位置(x,y)处的运动矢量:
Figure GDA0003227239960000072
其中(mv0x,mv0y)是左上角控制点的运动矢量,(mv1x,mv1y)是右上角控制点的运动矢量,并且(mv2x,mv2y)是左下角控制点的运动矢量。
图5是组织为多个子块502、503和504的仿射运动矢量场(MVF)501的图形描绘。为了简化运动补偿预测,应用基于块的仿射变换预测过程。出于说明的目的,假定多个子块502、503和504中的每个子块为4×4亮度子块。为了推导针对每个4×4亮度子块的运动矢量,根据前述等式(1)和(2)计算如图5中所示的每个子块的中心样点的运动矢量,并将其舍入到分数精度1/16。例如,子块502的中心样点的运动矢量被示出为运动矢量505。然后,应用运动补偿插值滤波器以生成具有推导出的运动矢量的每个子块的预测。色度分量的子块尺寸也被设置为4×4。针对4×4色度子块的运动矢量(MV)被计算为四个对应4×4亮度子块的MV的平均值。如在平移运动帧间预测的情况下,还存在两种仿射运动帧间预测模式:仿射合并模式和仿射AMVP模式。
VTM支持VVC中的基于子块的时间运动矢量预测(SbTMVP)方法。类似于HEVC中的时间运动矢量预测(TMVP),SbTMVP使用同位图片中的运动场来改进针对当前图片中的CU的运动矢量预测和合并模式。由TMVP使用的相同同位图片被用于SbTVMP。SbTMVP与TMVP的不同之处在于以下两个方面:
1、TMVP在CU级预测运动,但SbTMVP在子CU级预测运动;
2、TMVP从同位图片中的同位块(同位块是相对于当前CU的右下方块或中心块)提取时间运动矢量,而SbTMVP在从同位图片提取时间运动信息之前应用运动移位,其中运动移位是从来自当前CU的空间邻近块中的一个空间邻近块的运动矢量获得的。
图6A示出在通用视频编解码的上下文中由基于子块的时间运动矢量预测(SbTMVP)过程使用的空间邻近块的集合,并且图6B示出用于通过应用来自空间邻近的运动移位并对来自对应同位子CU的运动信息进行缩放来推导子编码单元(CU)运动场的基于子块的时间运动矢量预测(SbTMVP)过程。SbTMVP在两个步骤中预测当前CU内的子CU的运动矢量。在第一步骤中,按照A1 601、B1 604、B0 603和A0 602的顺序检查图6A中的空间邻近。一旦识别出具有将同位图片用作其参考图片的运动矢量的第一空间邻近块,就选择该运动矢量来表示将被应用的运动移位。如果没有从空间邻近识别出这样的运动,则将运动移位设置为(0,0)。
在第二步骤中,如图6B中所示,在步骤1中识别出的运动移位被应用(即,被加到当前块的坐标)以从同位图片获得子CU级的运动信息(运动矢量和参考索引)。图6B中的示例假定运动移位被设置为块A1 601的运动。然后,针对每个子CU,同位图片中的其对应块(覆盖中心样点的最小运动网格)的运动信息被用于推导针对子CU的运动信息。在识别出同位子CU的运动信息之后,以与HEVC的TMVP过程类似的方式将同位子CU的运动信息转换为当前子CU的运动矢量和参考索引,其中时间运动缩放被应用以将时间运动矢量的参考图片与当前CU的参考图片对准。
在VTM3中,包含SbTVMP候选和仿射合并候选两者的组合的基于子块的合并列表被用于基于子块的合并模式的信令。通过序列参数集(SPS)标志来启用/禁用SbTVMP模式。如果启用SbTMVP模式,则SbTMVP预测因子作为基于子块的合并候选的列表的第一项来被添加,并且SbTMVP预测因子之后是仿射合并候选。基于子块的合并列表的大小在SPS中被用信号发送,并且基于子块的合并列表的最大允许大小在VTM3中为5。
在SbTMVP中使用的子CU尺寸被固定为8×8,并且如仿射合并模式所做的,SbTMVP模式仅适用于宽度和高度两者大于或等于8的CU。附加SbTMVP合并候选的编码逻辑与其它合并候选的编码逻辑相同,也就是说,针对P条带或B条带中的每个CU,执行附加的RD检查以决定是否使用SbTMVP候选。
档次(profile)、层次(tier)和等级(level):诸如H.264/AVC、H.265/HEVC和VVC的视频编解码标准被设计为是通用的,就它们服务于广泛的应用、比特率、分辨率、质量和服务而言。除了其他方面之外,应用应该涵盖数字存储介质、电视广播和实时通信。在创建本说明书的过程中,已经考虑了来自典型应用的各种要求,已经开发了必要算法元素,并且这些已经被集成到包括多个特征集的单个语法中。这些特征集可被独立地实现,或者以各种组合中的任一组合实现。因此,本说明书有利于各种不同应用之间的视频数据交换。
然而,考虑到实现本说明书的全部特征集的实际性,可通过“档次”、“层次”和“等级”来规定这些特征的有限数量的子集。“档次”是本说明书中指定的整个比特流语法的子集。在由给定档次的语法施加的界限内,取决于比特流中的语义元素所取的值(诸如解码图片的指定尺寸),编码器和解码器的性能仍然可能具有非常大的变化。在许多应用中,实现能够处理特定档次内的语法的所有假设使用的解码器目前既不实用也不经济。
为了克服在实现给定档次的语法的所有假设使用中固有的问题,在每个档次内指定“层次”和“等级”。层次的等级是施加在比特流中的语义元素的值上的约束的指定集合。这些约束可以是对值的简单限制。可选地,它们可采取对值的算术组合(例如,图片宽度乘以图片高度乘以每秒解码的图片的数量)的约束的形式。针对较低层次指定的等级比针对较高层次指定的等级更受约束。
由于TMVP的固有性质,需要存储针对参考图片的所有运动信息以便执行时间运动矢量(MV)预测。在HEVC中,存储该运动信息的最小可用块是16×8/8×16。然而,为了减小时间MV缓冲器的大小,可在HEVC中有利地引入运动信息压缩方案。根据该方法,每个图片被划分为16×16块。只有来自每个16×16块中的左上方4×4块的运动信息被用作该16×16块内的所有4×4块的代表性运动。由于存储一个4×4MV来表示16个4×4块,因此该方法可被称为16:1MV压缩。
图7A示出用于在高效视频编解码(HEVC)中使用的16:1运动矢量(MV)压缩的代表性MV,并且图7B示出用于在VTM-3中使用的4:1运动矢量(MV)压缩的代表性MV。如图7A中所示,针对每个16×16块的代表性4×4块被表示为A 701、B 703、C 705和D 707。在当前VVC(VTM-3.0)中,使用4:1MV压缩方案。如图7B中所示,每个8×8块的左上4×4块(被表示为A711、B 713、C 715、……P 717)的MV被用于表示同一8×8块内的所有4×4块的MV。
在当前版本的VVC中,用于MV存储的较高MV精度通常需要较大的MV缓冲器来存储MV。当启用较高MV精度(例如,1/8或1/16)时,我们提出若干方法来减小MV缓冲器的大小。在另一方面,当使用固定比特(例如,针对每个MV分量16个比特)来存储MV时,使用较低MV精度进行MV存储可增加所存储的MV的有效范围。
此外,运动补偿(MC)通常是解码器实现中的存储器访问带宽的最大消耗者。因此,对于视频编解码标准,提供对MC存储器访问带宽要求的合理限制对于促进其成本效益实现并确保其跨行业的成功是极其重要的。针对MC的存储器访问带宽要求通常由将被执行的操作块尺寸和预测类型(例如,单向或双向)来确定。在VVC的当前版本中,在这方面没有限制。结果,最差情况带宽要求大于针对HEVC的对应最差情况带宽的2倍。在VVC中,MC存储器访问带宽的最差情况随着4×4块的双向MC而发生,4×4块的双向MC由在下文中更详细地描述的一些编解码模式利用。
提出的方法
注意,这里描述的提出的方法可被独立地应用,或者以各种组合中的任一组合来被应用。
自适应MV压缩
图8A示出用于垂直8:1运动矢量(MV)压缩的代表性MV,并且图8B示出用于水平8:1运动矢量(MV)压缩的代表性MV。为了在TMVP缓冲器的所需大小与编码效率之间提供改进的权衡,我们提出使用两种压缩方案(被表示为水平8:1MV压缩和垂直8:1MV压缩)中的任一压缩方案。如图8A中所示,针对第一16×8/8×16块801,左上方4×4块811的MV被用作代表性MV。同样,如图8B中所示,针对第二16×8/8×16块802,左上方4×4块821的MV被用作代表性MV。此外,我们提出响应于一个或更多个视频参数(诸如图片分辨率(有时被称作图片尺寸)、档次或参数等级)应用多个不同比率时间MV压缩方案(例如,16:1、4:1、水平8:1或垂直8:1)中的任一压缩方案。
根据一组示例,响应于图片分辨率、档次或参数等级中的任一项,将4:1或16:1MV压缩应用于时间MV缓冲器。在一个示例性实施方式中,当图片分辨率小于或等于(1280×720)时,将4:1MV压缩应用于时间MV缓冲器。当图片分辨率大于(1280×720)时,将16:1MV压缩应用于时间MV缓冲器。
根据另一组示例,响应于图片分辨率、档次或参数等级,将4:1或垂直8:1MV压缩应用于时间MV缓冲器。在一个示例性实施方式中,针对小于或等于(1280×720)的图片分辨率,将4:1MV压缩应用于时间MV缓冲器。针对大于(1280×720)的图片分辨率,将垂直8:1MV压缩应用于时间MV缓冲器。
用于MV存储的自适应MV精度
我们提出以预定义或用信号发送的MV精度将MV存储到MV缓冲器中。
根据一组说明性示例,MV中的每个对应MV响应于一个或更多个视频参数(诸如图片分辨率(有时被称为图片尺寸)、档次或参数等级)而以相应预定义MV精度被存储在MV缓冲器中。应注意,这里提及的MV缓冲器包括空间MV缓冲器、时间MV缓冲器或空间MV行缓冲器中的任一缓冲器。根据提出的示例,多个相应MV精度水平中的每一个可被用于将MV存储到多个对应MV缓冲器中的任一缓冲器中。此外,可响应于对应图片分辨率来选择由MV存储使用的相应MV精度水平。
根据一组示例,当启用高水平的MV精度(例如,1/8或1/16)时,提出的方法基于图片分辨率、档次或参数等级以多个不同MV精度(诸如1/16像素(1/16-pel)、1/8像素、1/4像素、1/2像素或1像素)中的任一精度存储用于时间MV预测的MV。具体地,当重建一个图片/条带内的所有CU时,这些CU中的每一个CU的MV被存储在时间MV缓冲器(称为时间MV缓冲器)中以用作针对一个或更多个后续图片/条带的时间MV预测。我们提出响应于图片分辨率、档次或参数等级使用对应MV精度将相应MV中的每一个MV存储到时间MV缓冲器中。例如,当图片分辨率小于或等于(1280×720)时,1/16-MV精度被用于将MV存储在时间MV缓冲器中。当图片分辨率大于(1280×720)时,使用1/4-MV精度将MV存储在时间MV缓冲器中。
在另一组示例中,通过响应于图片分辨率、档次或参数等级中的任一项,以多个不同MV精度(诸如1/16像素、1/8像素、1/4像素、1/2像素或1像素)中的任一MV精度存储跨CTU行的用于空间MV预测的MV来减小MV行缓冲器的大小。在又一组示例中,响应于图片分辨率、档次或参数等级,存储在空间MV缓冲器中的MV中的每个MV以多个不同MV精度(诸如1/16像素、1/8像素、1/4像素、1/2像素或1像素)中的任一MV精度来被存储。换言之,通过求平均或缩放过程生成的MV中的一些MV可具有较高MV精度(1/16像素或1/8像素),但是用于MV预测的存储在空间MV缓冲器中的MV使用不同且可能较低的MV精度来被存储。如果以这样的较低分辨率存储,则可以减小缓冲器大小。
在又一组示例中,响应于图片分辨率、档次或参数等级,存储在MV缓冲器中的MV中的每个MV以多个不同MV精度(诸如1/16像素、1/8像素、1/4像素、1/2像素或1像素)中的任一MV精度来被存储。换言之,通过求平均或缩放过程生成的MV可具有较高MV精度(1/16像素或1/8像素),但是用于MV预测的存储在MV缓冲器中的每个MV缓冲器中的MV保持不同且可能在较低MV精度。如果以这样的较低分辨率存储,则可以减小缓冲器大小。
在又一组示例中,用于将MV存储到历史MV表(也称为历史MV缓冲器)中的MV精度水平可具有与用于将MV存储在时间MV缓冲器或空间MV缓冲器或MV行缓冲器中的MV精度不同的MV精度。例如,即使在使用较低MV精度水平将MV存储在时间MV缓冲器或空间MV缓冲器中时,也可使用较高MV精度水平(例如,1/16像素)将MV存储在历史MV缓冲器中。
用于运动补偿的最小块尺寸
根据一组示例,响应于诸如图片分辨率(也称为图片尺寸)、档次或参数等级的视频参数,确定用于运动补偿的最小块尺寸。在一个示例中,4×4块可用于针对具有小于或等于(1280×720)的对应分辨率的每个相应图片的运动补偿;并且4×4块不可用于针对具有大于(1280×720)的对应分辨率的每个相应图片的运动补偿。这些块尺寸约束还可包括用于基于子块的帧间模式(诸如仿射运动模式和基于子块的时间运动矢量预测)的子块尺寸约束。
在一个示例中,用于运动补偿的最小块尺寸是根据诸如图片分辨率(也称为图片尺寸)、档次或参数等级的视频参数而确定的。在一个示例中,4×4块可用于针对具有小于或等于(1280×720)的分辨率的每个图片的单向运动补偿和双向运动补偿两者;并且4×4块不可用于针对具有大于(1280×720)的分辨率的每个图片的双向运动补偿。块尺寸约束还可包括用于基于子块的帧间模式(诸如仿射运动模式和基于子块的时间运动矢量预测)的子块尺寸约束。
根据本公开的第一方面,在具有一个或更多个处理器以及存储将由一个或更多个处理器执行的多个程序的存储器的计算设备处执行一种视频编解码方法。所述方法包括:响应于第一图片分辨率、第一档次或第一等级中的任一项,选择第一时间运动矢量预测压缩方案;并且响应于第二图片分辨率、第二档次或第二等级中的任一项,选择第二时间运动矢量预测压缩方案。
在一些示例中,第一时间运动矢量压缩方案使用第一压缩比,并且第二时间运动矢量压缩方案使用与第一压缩比不同的第二压缩比。
在一些示例中,响应于第一图片分辨率小于或等于第二图片分辨率,第一压缩比被选为小于第二压缩比。
在一些示例中,响应于第一图片分辨率大于第二图片分辨率,第一压缩比被选为大于第二压缩比。
在一些示例中,第一压缩比包括16:1、4:1、水平8:1或垂直8:1中的至少一个。
根据本公开的第二方面,在具有一个或更多个处理器以及存储将由一个或更多个处理器执行的多个程序的存储器的计算设备处执行一种视频编解码方法。所述方法包括:选择用于将第一运动矢量存储在运动矢量缓冲器中的第一运动矢量精度水平,其中,该选择是响应于与第一图片相关联的第一图片分辨率、第一档次或第一等级中的任一项被执行的;并且选择用于将第二运动矢量存储在运动矢量缓冲器中的第二运动矢量精度水平,其中,该选择是响应于与第二图片相关联的第二图片分辨率、第二档次或第二等级中的任一项被执行的;其中第一运动矢量精度水平不同于第二运动矢量精度水平。
在一些示例中,运动矢量缓冲器包括空间运动矢量缓冲器、时间运动矢量缓冲器或空间运动矢量行缓冲器中的至少一个。
在一些示例中,第一运动矢量精度水平包括1/16像素、1/8像素、1/4像素、1/2像素或1像素中的任一项。
在一些示例中,多个编码单元在第一图片内或在第一图片的条带内被重建;针对多个编码单元中的每个编码单元的多个运动矢量中的每个运动矢量被存储在时间运动矢量缓冲器中;并且时间运动矢量缓冲器被用于针对在第一图片之后的一个或更多个连续图片或在第一图片的条带之后的一个或更多个连续条带执行预测。
在一些示例中,响应于第一图片分辨率小于或等于第二图片分辨率,将第一运动矢量精度水平选为小于第二运动矢量精度水平。
在一些示例中,空间运动矢量行缓冲器存储跨编码树单元的多个运动矢量,多个运动矢量至少包括第一运动矢量和第二运动矢量,其中第一运动矢量以第一运动矢量精度水平被存储在空间运动矢量行缓冲器中,并且第二运动矢量以第二运动矢量精度水平被存储在空间运动矢量行缓冲器中。
在一些示例中,求平均或缩放过程生成至少包括第一运动矢量的一个或更多个运动矢量。所述一个或更多个运动矢量是以第一运动矢量精度水平生成的。所述一个或更多个运动矢量以第二运动矢量精度水平被存储在空间运动矢量行缓冲器中。
在一些示例中,将第二运动矢量精度水平选为小于第一运动矢量精度水平。
在一些示例中,求平均或缩放过程生成至少包括第一运动矢量的一个或更多个运动矢量。所述一个或更多个运动矢量是以第一运动矢量精度水平生成的。所述一个或更多个运动矢量以第二运动矢量精度水平被存储在空间运动矢量缓冲器、时间运动矢量缓冲器和空间运动矢量行缓冲器中。
在一些示例中,将第二运动矢量精度水平选为小于第一运动矢量精度水平。
在一些示例中,历史运动矢量缓冲器以第一运动矢量精度水平存储至少包括第一运动矢量的多个运动矢量。所述多个运动矢量以第二运动矢量精度水平被存储在空间运动矢量缓冲器、时间运动矢量缓冲器或空间运动矢量行缓冲器中的至少一个中。
根据本公开的第三方面,在具有一个或更多个处理器以及存储将由一个或更多个处理器执行的多个程序的存储器的计算设备处执行一种视频编解码方法。所述方法包括:选择用于执行运动补偿的第一最小可允许块尺寸,其中,该选择是响应于与第一图片相关联的第一图片分辨率、第一档次或第一等级中的任一项被执行的;并且选择用于执行运动补偿的第二最小可允许块尺寸,其中,该选择是响应于与第二图片相关联的第二图片分辨率、第二档次或第二等级中的任一项被执行的;其中第一最小可允许块尺寸不同于第二最小可允许块尺寸。
在一些示例中,响应于用于仿射运动预测或基于子块的时间运动矢量预测中的至少一个的子块尺寸约束,选择第一最小可允许块尺寸和第二最小可允许块尺寸。
在一些示例中,响应于用于执行双向运动补偿或单向运动补偿的至少一个约束,选择第一最小可允许块尺寸和第二最小可允许块尺寸。
在一些示例中,当第一图片具有大于1280×720的第一图片分辨率时,第一最小可允许块尺寸大于4×4块。
在一个或更多个示例中,可在硬件、软件、固件或其任一组合中实现这里描述的功能。如果以软件实现,则功能可作为一个或更多个指令或者代码被存储在计算机可读介质上或经由计算机可读介质被发送,并且由基于硬件的处理单元来执行。计算机可读介质可包括与有形介质(诸如数据存储介质)对应的计算机可读存储介质、或者通信介质(包括促进例如根据通信协议将计算机程序从一处传送到另一处的任一介质)。以这种方式,计算机可读介质通常可对应于(1)非暂时性有形计算机可读存储介质或(2)通信介质,诸如信号或载波。数据存储介质可以是可由一个或更多个计算机或者一个或更多个处理器访问以检索用于实现本申请中描述的实施方式的指令、代码和/或数据结构的任一可用介质。计算机程序产品可包括计算机可读介质。
此外,可使用包括一个或更多个电路的装置来实现以上方法,一个或更多个电路包括专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其它电子组件。该装置可使用与其他硬件或软件组件组合的电路来执行上述方法。上面公开的每个模块、子模块、单元或子单元可至少部分地使用一个或更多个电路来实现。
通过考虑这里公开的本发明的说明书和实践,本发明的其它实施例对于本领域技术人员将是显而易见的。本申请旨在覆盖本发明的遵循其一般原理且包括本领域已知或惯常实践内的与本公开的这样的偏离的任何变化、运用或改编。在本发明的真实范围和精神由所附权利要求指示的情况下,本说明书和实施例旨在被认为仅是示例性的。
将理解,本发明不限于上述和附图中所示的明确示例,并且可在不脱离其范围的情况下进行各种修改和改变。本发明的范围旨在仅受所附权利要求的限制。

Claims (15)

1.一种视频编解码方法,包括:
响应于与第一图片相关的第一图片分辨率、第一档次或第一等级中的任一项,选择第一时间运动矢量预测压缩方案应用于时间运动矢量缓冲器以存储第一运动矢量;并且
响应于与第二图片相关的第二图片分辨率、第二档次或第二等级中的任一项,选择第二时间运动矢量预测压缩方案应用于时间运动矢量缓冲器以存储第二运动矢量,
其中,所述时间运动矢量预测压缩方案是指将块中的左上子块的运动矢量作为所述块中的所有子块的代表性运动矢量,其中,所述块和所述子块的大小根据所述时间运动矢量预测压缩方案使用的压缩比确定,并且所述第一时间运动矢量预测压缩方案使用的第一压缩比不同于所述第二时间运动矢量预测压缩方案使用的第二压缩比,
其中,所述第一运动矢量和所述第二运动矢量是使用求平均或缩放过程来生成的,并且所述第一运动矢量在使用求平均或缩放过程生成时的运动矢量精度水平高于在所述时间运动矢量缓冲器中存储时的运动矢量精度水平,所述第二运动矢量在使用求平均或缩放过程生成时的运动矢量精度水平高于在所述时间运动矢量缓冲器中存储时的运动矢量精度水平。
2.如权利要求1所述的视频编解码方法,还包括:响应于所述第一图片分辨率小于或等于所述第二图片分辨率,将所述第一压缩比选为小于所述第二压缩比。
3.如权利要求1所述的视频编解码方法,还包括:响应于所述第一图片分辨率大于所述第二图片分辨率,将所述第一压缩比选为大于所述第二压缩比。
4.如权利要求1所述的视频编解码方法,其中所述第一压缩比和所述第二压缩比包括16:1、4:1、水平8:1或垂直8:1中的至少一个。
5.一种视频编解码方法,包括:
响应于与第一图片相关联的第一图片分辨率、第一档次或第一等级中的任一项,选择第一运动矢量精度水平以将第一运动矢量存储在运动矢量缓冲器中;并且
响应于与第二图片相关联的第二图片分辨率、第二档次或第二等级中的任一项,选择第二运动矢量精度水平以将第二运动矢量存储在运动矢量缓冲器;
其中所述第一运动矢量精度水平不同于所述第二运动矢量精度水平,
其中所述第一运动矢量和所述第二运动矢量是使用求平均或缩放过程来生成的,并且所述第一运动矢量在使用求平均或缩放过程生成时的运动矢量精度水平高于所述第一运动矢量精度水平,并且所述第二运动矢量在使用求平均或缩放过程生成时的运动矢量精度水平高于所述第二运动矢量精度水平。
6.如权利要求5所述的视频编解码方法,其中所述运动矢量缓冲器包括空间运动矢量缓冲器、时间运动矢量缓冲器或空间运动矢量行缓冲器中的至少一个。
7.如权利要求6所述的视频编解码方法,其中所述第一运动矢量精度水平包括1/16像素、1/8像素、1/4像素、1/2像素或1像素中的任一项。
8.如权利要求7所述的视频编解码方法,还包括:
重建所述第一图片内或所述第一图片的条带内的多个编码单元;
将所述多个编码单元中的每个编码单元的多个运动矢量中的每个运动矢量存储在所述时间运动矢量缓冲器中;并且
使用所述时间运动矢量缓冲器来针对在所述第一图片之后的一个或更多个连续图片执行预测,或针对在所述第一图片之后的图片中的一个或更多个连续条带执行预测。
9.如权利要求7所述的视频编解码方法,还包括:响应于所述第一图片分辨率小于或等于所述第二图片分辨率,将所述第一运动矢量精度水平选为小于所述第二运动矢量精度水平。
10.如权利要求6所述的视频编解码方法,还包括:利用所述空间运动矢量行缓冲器来存储跨编码树单元的运动矢量,其中所述运动矢量为第一运动矢量或第二运动矢量,其中所述第一运动矢量以所述第一运动矢量精度水平被存储在所述空间运动矢量行缓冲器中,并且所述第二运动矢量以所述第二运动矢量精度水平被存储在所述空间运动矢量行缓冲器中。
11.如权利要求6所述的视频编解码方法,其中,使用与所述第一运动矢量精度水平不同的精度水平来将所述第一运动矢量存储到历史运动矢量缓冲器;使用与所述第二运动矢量精度水平不同的精度水平来将所述第二运动矢量存储到历史运动矢量缓冲器。
12.一种视频编解码方法,包括:
响应于与第一图片相关联的第一图片分辨率、第一档次或第一等级中的任一项,选择第一最小可允许块尺寸以用于执行运动补偿;并且
响应于与第二图片相关联的第二图片分辨率、第二档次或第二等级中的任一项,选择第二最小可允许块尺寸以用于执行运动补偿;
其中所述第一最小可允许块尺寸不同于所述第二最小可允许块尺寸,
其中所述第一图片中的块的第一运动矢量和所述第二图片中的块的第二运动矢量是使用求平均或缩放过程来生成的,并且所述第一运动矢量在使用求平均或缩放过程生成时的运动矢量精度水平高于在运动矢量缓冲器中存储时的运动矢量精度水平,所述第二运动矢量在使用求平均或缩放过程生成时的运动矢量精度水平高于在运动矢量缓冲器中存储时的运动矢量精度水平。
13.如权利要求12所述的视频编解码方法,其中,用于执行运动补偿的块尺寸约束包括用于仿射运动预测或基于子块的时间运动矢量预测中的至少一个的子块尺寸约束。
14.如权利要求12所述的视频编解码方法,还包括:响应于用于执行双向运动补偿或单向运动补偿的至少一个约束,选择所述第一最小可允许块尺寸和所述第二最小可允许块尺寸。
15.如权利要求12所述的视频编解码方法,其中当所述第一图片具有大于1280×720的第一图片分辨率时,所述第一最小可允许块尺寸大于4×4块。
CN201980092938.1A 2018-12-31 2019-12-30 用于视频编解码的依赖图片分辨率的配置 Active CN113498609B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862787240P 2018-12-31 2018-12-31
US62/787,240 2018-12-31
PCT/US2019/069009 WO2020142468A1 (en) 2018-12-31 2019-12-30 Picture resolution dependent configurations for video coding

Publications (2)

Publication Number Publication Date
CN113498609A CN113498609A (zh) 2021-10-12
CN113498609B true CN113498609B (zh) 2023-06-20

Family

ID=71407416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980092938.1A Active CN113498609B (zh) 2018-12-31 2019-12-30 用于视频编解码的依赖图片分辨率的配置

Country Status (2)

Country Link
CN (1) CN113498609B (zh)
WO (1) WO2020142468A1 (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05227525A (ja) * 1991-10-31 1993-09-03 Toshiba Corp 画像符号化装置
JP2008053875A (ja) * 2006-08-23 2008-03-06 Sony Corp 画像処理装置および方法、プログラム、並びにプログラム格納媒体
GB201104035D0 (en) * 2011-03-09 2011-04-20 Canon Kk Video encoding and decoding
WO2013002105A1 (ja) * 2011-06-28 2013-01-03 ソニー株式会社 画像処理装置および方法
WO2017157264A1 (en) * 2016-03-14 2017-09-21 Mediatek Singapore Pte. Ltd. Method for motion vector storage in video coding and apparatus thereof

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6487249B2 (en) * 1998-10-09 2002-11-26 Matsushita Electric Industrial Co., Ltd. Efficient down conversion system for 2:1 decimation
CN1265649C (zh) * 2002-01-24 2006-07-19 株式会社日立制作所 运动图像的编码方法、解码方法、编码装置及解码装置
CA2574590C (en) * 2004-07-20 2013-02-19 Qualcomm Incorporated Method and apparatus for motion vector prediction in temporal video compression
KR20110017302A (ko) * 2009-08-13 2011-02-21 삼성전자주식회사 움직임 벡터의 정확도 조절을 이용한 영상 부호화, 복호화 방법 및 장치
US8594200B2 (en) * 2009-11-11 2013-11-26 Mediatek Inc. Method of storing motion vector information and video decoding apparatus
KR101752418B1 (ko) * 2010-04-09 2017-06-29 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
US9325990B2 (en) * 2012-07-09 2016-04-26 Qualcomm Incorporated Temporal motion vector prediction in video coding extensions
EP3217663A4 (en) * 2014-11-06 2018-02-14 Samsung Electronics Co., Ltd. Video encoding method and apparatus, and video decoding method and apparatus
WO2016165069A1 (en) * 2015-04-14 2016-10-20 Mediatek Singapore Pte. Ltd. Advanced temporal motion vector prediction in video coding
US10979732B2 (en) * 2016-10-04 2021-04-13 Qualcomm Incorporated Adaptive motion vector precision for video coding
CN110651472B (zh) * 2017-05-17 2023-08-18 株式会社Kt 用于视频信号处理的方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05227525A (ja) * 1991-10-31 1993-09-03 Toshiba Corp 画像符号化装置
JP2008053875A (ja) * 2006-08-23 2008-03-06 Sony Corp 画像処理装置および方法、プログラム、並びにプログラム格納媒体
GB201104035D0 (en) * 2011-03-09 2011-04-20 Canon Kk Video encoding and decoding
WO2013002105A1 (ja) * 2011-06-28 2013-01-03 ソニー株式会社 画像処理装置および方法
WO2017157264A1 (en) * 2016-03-14 2017-09-21 Mediatek Singapore Pte. Ltd. Method for motion vector storage in video coding and apparatus thereof

Also Published As

Publication number Publication date
CN113498609A (zh) 2021-10-12
WO2020142468A1 (en) 2020-07-09

Similar Documents

Publication Publication Date Title
US10701360B2 (en) Method and device for determining the value of a quantization parameter
CN114765685A (zh) 基于多帧内预测模式的用于解码或编解码图像的技术
TW202044837A (zh) 視訊寫碼中之三角合併模式索引之發信
CN110719470A (zh) 视频编码的块尺寸限制
CN110677668B (zh) 空间运动压缩
EP3646589A1 (en) Method and apparatus for most probable mode (mpm) sorting and signaling in video encoding and decoding
US20230396760A1 (en) Inter prediction encoding and decoding method using combination of prediction blocks, and computer-readable storage medium bitstream to be decoded thereby
KR102616714B1 (ko) 광학 흐름 정제를 위한 조기 종료
CN112703732A (zh) 使用存储的参数对视频编码和解码进行局部照明补偿
US20230283780A1 (en) BVD Sign Inference in IBC based on BV and BVP Components
JP2023169288A (ja) エンコーダ、デコーダ、および対応するブロック解除フィルタ適応の方法
CN114827619A (zh) 运动信息的编解码
WO2020139903A1 (en) Video coding with triangular shape prediction units
US20240129543A1 (en) Adaptive Block Level Bit-Depth Prediction
US11871034B2 (en) Intra block copy for screen content coding
CN110730349A (zh) 用于微块的约束
CN113498609B (zh) 用于视频编解码的依赖图片分辨率的配置
TWI720470B (zh) 用於視訊編解碼中的獨立編碼樹的語法交錯方法和裝置
CN110677650A (zh) 降低非相邻Merge设计的复杂度
US20220201283A1 (en) Chroma Prediction from Luma for Video Coding
US20230095946A1 (en) Block Vector Difference Signaling for Intra Block Copy
WO2024010943A1 (en) Template matching prediction with block vector difference refinement
WO2023133245A1 (en) Boundary based asymmetric reference line offsets
WO2024076549A1 (en) Candidate list selection for template matching prediction
WO2023133205A1 (en) Asymmetric offset multiple reference line coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant