CN105814895A - 用于并行运动估计区域的可缩放实施方案 - Google Patents

用于并行运动估计区域的可缩放实施方案 Download PDF

Info

Publication number
CN105814895A
CN105814895A CN201480064114.0A CN201480064114A CN105814895A CN 105814895 A CN105814895 A CN 105814895A CN 201480064114 A CN201480064114 A CN 201480064114A CN 105814895 A CN105814895 A CN 105814895A
Authority
CN
China
Prior art keywords
candidate
motion vector
vector candidates
video
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480064114.0A
Other languages
English (en)
Inventor
全才洪
钟仁肃
哈里哈兰·加内什·拉古迪
王翔林
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN105814895A publication Critical patent/CN105814895A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种根据本发明的一些方面配置的视频译码装置包含经配置以存储多个运动向量候选者的存储器。每一运动向量候选者可对应于在并行运动估计区域MER中分割的多个预测单元PU中的至少一者。所述视频译码装置还包含与存储器通信的处理器。所述处理器经配置以选择所述多个运动向量候选者的子集以包含于合并候选者列表中。所述选择可基于每一运动向量候选者的优先级。所述处理器可经进一步配置以产生所述合并候选者列表以包含所述选定运动向量候选者。

Description

用于并行运动估计区域的可缩放实施方案
技术领域
本发明大体上涉及用于编码和解码视频信息的技术,且明确地说,涉及可缩放视频译码。
背景技术
数字视频能力可并入到广泛范围的装置中,包括数字电视、数字直播***、无线广播***、个人数字助理(PDA)、膝上型或台式计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置和类似者。数字视频装置实施视频压缩技术(例如,由MPEG-2、MPEG-4、ITU-TH.263或ITU-TH.264/MPEG-4第10部分高级视频译码(AVC)定义的标准和这些标准的扩展中所描述的视频压缩技术),以更高效地发射和接收数字视频信息。
视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测来减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片分割成视频块,视频块还可被称作树块、译码单元(CU)和/或译码节点。使用关于同一图片中的相邻块中的参考样本的空间预测编码图片的经帧内编码(I)切片中的视频块。图片的经帧间译码(P或B)切片中的视频块可使用关于同一图片中的相邻块中的参考样本的空间预测或关于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测导致用于待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本块的运动向量和指示经译码块与预测性块之间的差的残余数据来编码。经帧内译码块是根据帧内译码模式和残余数据来编码。为了进一步压缩,可将残余数据从像素域变换到变换域,从而导致残余变换系数,接着可量化残余变换系数。可扫描一开始按二维阵列布置的经量化变换系数,以便产生变换系数的一维向量,并且可应用熵译码以达成更多的压缩。
发明内容
一种根据本发明的一些方面配置的视频译码装置包含经配置以存储多个运动向量候选者的存储器。每一运动向量候选者可对应于在并行运动估计区域(MER)中分割的多个预测单元(PU)中的至少一者。视频译码装置还包含与存储器通信的处理器。所述处理器经配置以选择所述多个运动向量候选者的子集以包含于合并候选者列表中。选择可基于每一运动向量候选者的优先级。处理器可经进一步配置以产生所述合并候选者列表以包含所述多个运动向量候选者的所述选定子集。
在另一实施例中,一种解码视频数据的方法包含接收从经编码视频位流提取的语法元素,选择运动向量候选者以包含在合并候选者列表中,和产生所述合并候选者列表。所述语法元素可包含与多个运动向量候选者相关联的信息。每一运动向量候选者可对应于在并行运动估计区域(MER)中分割的多个预测单元(PU)中的至少一者。选择所述合并候选者列表包含选择所述多个运动向量候选者的子集以包含在合并候选者列表中。选择可基于所述多个运动向量候选者中的每一者的优先级。所述合并候选者列表经产生以包含所述多个运动向量候选者的所述选定子集。
在另一实施例中,一种编码视频数据的方法包含:确定与多个运动向量候选者相关联的信息,所述多个运动向量候选者中的每一者对应于在并行运动估计区域(MER)中分割的多个预测单元(PU)中的至少一者,所述多个运动向量候选者中的每一者包括可用运动数据;选择所述多个运动向量候选者的子集以包含在合并候选者列表中,其中选择是基于所述多个运动向量候选者中的每一者的优先级;以及产生所述合并候选者列表以包含所述多个运动向量候选者的所述选定子集。
在另一实施例中,一种视频译码设备包含:用于确定与多个运动向量候选者相关联的信息的装置,所述多个运动向量候选者中的每一者对应于在并行运动估计区域(MER)中分割的多个预测单元(PU)中的至少一者,所述多个运动向量候选者中的每一者包括可用运动数据;用于选择所述多个运动向量候选者的子集以包含在合并候选者列表中的装置,其中选择是基于所述多个运动向量候选者中的每一者的优先级;以及产生所述合并候选者列表以包含所述多个运动向量候选者的所述选定子集。
在另一实施例中,一种非暂时性计算机可读媒体包含存储于其上的代码,所述代码在经执行时使设备:接收与多个运动向量候选者相关联的信息,所述多个运动向量候选者中的每一者对应于在并行运动估计区域(MER)中分割的多个预测单元(PU)中的至少一者,所述多个运动向量候选者中的每一者包括可用运动数据;选择所述多个运动向量候选者的子集以包含在合并候选者列表中,其中选择是基于所述多个运动向量候选者中的每一者的优先级;以及产生所述合并候选者列表以包含所述多个运动向量候选者的所述选定子集。
附图和以下描述中阐明一或多个实例的细节。其它特征、目标和优势将从描述和图式和从权利要求书显而易见。
附图说明
图1是说明实例视频译码***的框图。
图2是说明视频编码器的实例配置的框图。
图3是说明视频解码器的实例配置的框图。
图4展示最大译码单元(LCU)到译码单元(CU)的分解的实例。
图5A到5D展示CU到预测单元(PU)的分解的实例。
图6是说明实例运动向量(MV)候选者位置的框图。
图7A到7C说明展示用于一些PU的MV候选者位置的实例CU分解。
图8A到8C说明展示用于一些PU的MV候选者位置的另一实例CU分解。
图9A到9C说明展示用于一些PU的MV候选者位置的另一实例CU分解。
图10A到10C说明展示用于一些PU的MV候选者位置的另一实例CU分解。
图11A到11C说明展示用于一些PU的MV候选者位置的另一实例CU分解。
图12说明展示对应于CU中分割的任一PU的每一MV候选者的32×32CU的实例。
图13说明展示对应于运动估计区域(MER)中分割的任一PU的每一时间或外部空间MV候选者的32×32MER的实例。
图14说明展示对应于MER中分割的任一PU的每一时间或外部空间MV候选者的实例加权频率的32×32MER的实例。
图15说明展示对应于MER中分割的任一PU的每一时间或外部空间MV候选者的实例优先级的32×32MER的实例。
图16为说明基于非冗余状态选择MV候选者用于包含在合并候选者列表中的实例过程的流程图。
图17为说明基于优先级选择MV候选者用于包含在合并候选者列表中的实例过程的流程图。
具体实施方式
当前HEVC合并模式设计高度依序,且在不同译码单元(CU)中的相邻预测单元(PU)当中引入相依性。HEVC合并模式设计的依序本质可为在编码器侧上的运动估计(ME)创造困难(对于流水线架构),其中可针对多个PU并行地估计运动向量。归因于处理量或实施成本的考虑,可能需要并行运动估计。然而,并行运动估计还可导致显著的译码效率损失。因为对于在并行MER内部的给定PU(例如,在32×32并行MER内部的8×8PU),作为并行处理的结果,并非所有其相邻运动数据都可用于包含在合并候选者列表中,所以可造成损失。
并行地进行对于不同PU的运动估计的区也被称作运动估计区域(MER)。HEVC允许高阶语法元素传信并行合并模式。在并行合并模式中,可将LCU划分成许多MER。在此情况下,只允许属于不同MER的那些外部相邻运动向量(MV)包含在用于MER中的PU的合并候选者列表中。MV候选者的改善的选择以用于包含在合并候选者列表中(如本文中所描述)可改善译码效率且降低计算复杂性。
视频译码标准包含ITU-TH.261、ISO/IECMPEG-1Visual、ITU-TH.262或ISO/IECMPEG-2Visual、ITU-TH.263、ISO/IECMPEG-4Visual和ITU-TH.264(也被称为ISO/IECMPEG-4AVC),包含其可缩放视频译码(SVC)和多视图视频译码(MVC)扩展。此外,存在一种新的视频译码标准,即,高效率视频译码(HEVC),其正由ITU-T视频译码专家组(VCEG)与ISO/IEC运动图片专家组(MPEG)的关于视频译码的联合合作小组(JCT-VC)进行开发。被称作“HEVC工作草案6”的HEVC标准的草案可从http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC-H1003-v6.zip下载。对HEVC工作草案6的充分引用为文档JCTVC-H1003,布洛斯(Bross)等人“高效率视频译码(HEVC)文本规范草案6”,ITU-TSG16WP3与ISO/IECJTC1/SC29/WG11的关于视频译码的联合合作小组(JCT-VC),第7次会议:瑞士日内瓦,2011年11月21日到2011年11月30日。另外,从2012年6月7日起,HEVC标准的稍后草案可从http://wg11.sc29.org/jct/doc_end_user/current_document.php?id=5885/JCTVC-I1003-v2获得。另外,从2012年6月7日起,HEVC标准的稍后草案(被称作“HEVC工作草案7”)可从http://phenix.it-sudparis.eu/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v3.zip获得。对HEVC工作草案7的充分引用为文档HCTVC-I1003,布洛斯等人“高效率视频译码(HEVC)文本规范草案7”,ITU-TSG16WP3与ISO/IECJTC1/SC29/WG11的关于视频译码的联合合作小组(JCT-VC),第9次会议:瑞士日内瓦,2012年4月27日到2012年5月7日。另外,HEVC标准的稍后草案(被称作HEVCWD8(工作草案8))可从http://phenix.int-evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J1003-v8.zip获得。这些参考中的每一者被以引用的方式全部并入。
下文参看附图更充分地描述新颖***、设备和方法的各种方面。然而,本发明可以许多不同形式来体现,且不应将其解释为限于贯穿本发明所提出的任何特定结构或功能。相反地,提供这些方面以使得本发明将透彻且完整,并且将向所属领域的技术人员充分传达本发明的范围。基于本文中的教示,所属领域的技术人员应了解,本发明的范围希望涵盖无论是独立于本发明的任何其它方面而实施还是与之组合而实施的本文中所揭示的新颖***、设备和方法的任何方面。举例来说,可使用本文中所阐明的任何数目个方面来实施设备或实践方法。另外,本发明的范围希望涵盖使用除本文中所阐明的本发明的各种方面之外的或不同于本文中所阐明的本发明的各种方面的其它结构、功能性或结构与功能性来实践的此设备或方法。应理解,可由权利要求书的一或多个要素来体现本文中所揭示的任何方面。
尽管本文描述了特定方面,但这些方面的许多变化和排列属于本发明的范围。尽管提到了优选方面的一些益处和优势,但本发明的范围不希望限于特定益处、用途或目标。相反地,本发明的方面希望宽泛地适用于可供(例如)不同无线技术、***配置、网络和发射协议使用的不同视频滤波器和视频译码器,其中的一些在图中和在特定方面的以下描述中通过实例说明。详细描述和图式仅说明本发明,而不限制,本发明的范围由所附权利要求书和其等效内容界定。
视频译码***
图1是说明可利用本发明中描述的技术的实例视频译码***10的框图。在本发明中,术语“视频译码”可指视频编码和视频解码。如图1中所示,视频译码***10包含源装置12和目的地装置14。源装置12将经编码视频数据提供到目的地装置14。目的地装置14可稍后解码经编码视频数据。源装置12和目的地装置14可包括广泛范围的装置中的任一者,包含台式计算机、笔记本(即,膝上型)计算机、平板计算机、机顶盒、移动电话、电话手持机、“智能”板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或能够编码和解码视频数据的多种类型的计算装置。
目的地装置14可经由通信信道16接收经编码视频数据。通信信道16可包括能够将经编码视频数据从源装置12移动到目的地装置14的媒体或装置。在一个实例中,通信信道16可包括使源装置12能够实时将经编码视频数据直接传输到目的地装置14的通信媒体。源装置12或另一装置可根据通信标准(例如,无线通信协议)调制经编码视频数据。通信媒体可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一或多个物理发射线。通信信道16可形成基于数据包的网络(例如,局域网、广域网或例如因特网的全球网络)的部分。通信信道16可包含路由器、交换器、基站或可用于促进将经编码视频数据从源装置12传达到目的地装置14的任何其它装备。
在一些实例中,源装置12和目的地装置14可经装备以用于无线通信。然而,本发明的技术不必限于无线应用或设置。相反地,所述技术可应用于支持多种多媒体应用中的任一者的视频译码,例如,空中协议电视广播、有线电视发射、***发射、例如经由因特网的流式传输视频发射、数字视频的编码以供存储在数据存储媒体上、存储在数据存储媒体上的数字视频的解码或其它应用。在一些实例中,源装置12和目的地装置14可经配置以支持单向或双向视频发射,以支持例如视频流式传输、视频回放、视频广播和/或视频电话的应用。
此外,在一些实例中,源装置12可将经编码视频数据输出到存储***34。类似地,目的地装置14可存取存储在存储***34上的经编码视频数据。在各种实例中,存储***34可包含各种分散式或局部存取的数据存储媒体。数据存储媒体的实例类型包含(但不限于)硬盘驱动器、蓝光光盘、DVD、CD-ROM、固态存储器单元、易失性或非易失性存储器或适合于存储经编码视频数据的其它数字存储媒体。
在一些实例中,存储***34可包括可保持由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可从存储***34经由流式传输或下载来存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包含因特网连接)来存取经编码视频数据。此可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,数字订户线(DSL)、电缆调制解调器等)或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码视频数据从存储***34的发射可为流式发射、下载发射或两者的组合。
在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。在一些实例中,输出接口22还可包含调制器和/或发射器。视频源18将视频数据提供到视频编码器20。在各种实例中,视频源18可包括各种类型的装置和/或***用于提供视频数据。举例来说,视频源18可包括视频俘获装置,例如,摄像机。在另一实例中,视频源18可包括含有先前俘获的视频的视频存档。在又一实例中,视频源18可包括从视频内容提供者接收视频的视频馈入接口。在又一实例中,视频源18可包括用于产生计算机图形数据的计算机图形***。
如下详细地描述,视频编码器20可编码由视频源18提供的视频数据。在一些实例中,源装置12可经由输出接口22将经编码视频数据直接发射到目的地装置14。此外,在一些实例中,存储***34可存储经编码视频数据用于稍后由目的地装置14或其它装置存取。
本发明可大体涉及视频编码器20将某些信息“用信号发送”到例如视频解码器30的另一装置。然而,应理解,视频编码器20可通过使某些语法元素与视频数据的各种经编码部分相关联来用信号发送信息。也就是说,视频编码器20可通过将某些语法元素存储到视频数据的各种经编码部分的标头来“用信号发送”数据。在一些情况下,这些语法元素可在由视频解码器30接收和解码前经编码和存储(例如,存储到存储***34)。因此,术语“用信号发送”可大体指用以解码经压缩视频数据的语法或其它数据的传达。此传达可实时地或近实时地发生。替代地,此传达可在一定时间跨度上发生,例如,可当在编码同时将语法元素存储到媒体时发生,其接着可由解码装置在存储到此媒体之后的任何时间检索。
在图1的实例中,目的地装置14包含输入接口28、视频解码器30和显示装置32。在一些情况下,输入接口28可包含接收器和/或调制解调器。目的地装置14的输入接口28从通信信道16和/或存储***34接收经编码视频数据。视频解码器30解码由输入接口28接收的经编码视频数据。目的地装置14可显现经解码视频数据用于在显示装置32上显示。
显示装置32可与目的地装置14集成在一起或可在目的地装置14的外部。在一些实例中,目的地装置14可包含集成显示装置且还可经配置以与外部显示装置介接。在各种实例中,显示装置32可包括各种类型的显示装置。举例来说,显示装置32可包括液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
尽管图1中未展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当的多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件和软件,以处置对共同数据流或单独数据流中的音频和视频两者的编码。在一些实例中,如果适用的话,多路复用器-多路分用器单元可遵守ITUH.223多路复用器协议,或例如用户数据报协议(UDP)的其它协议。
视频编码器20和视频解码器30各自可实施为多种合适的电路中的任一者,例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当部分地用软件实施所述技术时,装置可将用于所述软件的指令存储于合适的非暂时性计算机可读媒体中且使用一或多个处理器用硬件执行所述指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中,所述编码器或解码器中的任一者可集成为相应装置中的组合编码器/解码器(编码解码器)的部分。
视频编码器20和视频解码器30可根据视频压缩标准(例如,目前正在开发的高效率视频译码(HEVC)标准)来操作,且可遵守HEVC测试模型(HM)。替代地,视频编码器20和视频解码器30可根据其它专有或行业标准来操作,所述标准例如ITU-TH.264标准,替代地被称为MPEG-4第10部分先进视频译码(AVC),或此类标准的扩展。对标准的实例扩展包含对H.264/AVC标准的可缩放视频译码(SVC)和多视图视频译码(MVC)扩展。视频压缩标准的其它实例包含MPEG-2和ITU-TH.263。本发明的技术不限于任何特定译码标准。
如上文简要提到,视频编码器20编码视频数据。所述视频数据可包括一或多个图片序列。所述图片中的每一者为静态图像。在一些情况下,图片可被称作视频“帧”。当视频编码器20编码视频数据时,视频编码器20可产生位流。位流包含形成经译码图片和相关联数据的表示的一连串位。经译码图片是图片的经译码表示。
为产生位流,视频编码器20可针对视频数据中的图片序列执行编码操作。当视频编码器20针对图片序列执行编码操作时,视频编码器20可产生一系列经译码图片和相关联数据。此外,视频编码器20可产生含有适用于图片序列的参数的序列参数集。此外,视频编码器20可产生含有适用于作为整体的图片的图片参数集(PPS)。在一些实例中,视频编码器20可产生自适应参数集(APS)。APS可含有适用于作为整体的图片的参数。
为产生经译码图片,视频编码器20可将图片分割成一或多个树块(有时被称作“块”)。树块为二维(2D)视频数据块。在一些情况下,树块也可被称作最大译码单元(LCU)。HEVC的树块可广泛类似于例如H.264/AVC的先前标准的宏块。然而,树块不必限于特定大小,且可包含一或多个译码单元(CU)。
在一些实例中,视频编码器20可将图片分割成多个切片。所述切片中的每一者可包含整数数目个CU。在一些情况下,切片包括整数数目个树块。在其它情况下,切片的边界可在树块内。在一些实例中,视频编码器20可根据切片的大小(以字节计)或根据切片中的树块的数目来编码切片。
作为针对图片执行编码操作的部分,视频编码器20可针对图片的每一切片执行编码操作。针对切片的编码操作可产生与所述切片相关联的经编码数据。与切片相关联的经编码数据可被称作“经译码切片”。经译码切片可包含切片标头和切片数据。切片数据可包含呈译码顺序的一系列连续译码单元。切片标头可含有关于切片的第一或所有树块的数据元素。
为产生用于切片的经译码切片数据,视频编码器20可对切片中的每一树块执行编码操作。当视频编码器20对树块执行编码操作时,视频编码器20可产生经译码树块。经译码树块可包括表示树块的经编码型式的数据。
为产生经译码树块,视频编码器20可对树块递归地执行四叉树分割以将树块划分成逐渐更小的CU。举例来说,视频编码器20可将树块分割成四个大小相等的子CU,将子CU中的一或多者分割成四个大小相等的子子CU,等等。位流中的一或多个语法元素可指示视频编码器20可分割树块的最大次数。CU形状可为正方形。
视频编码器20可对树块中的每一未分割CU执行编码操作。作为对未分割的CU执行编码操作的部分,视频编码器20可产生用于CU的预测数据。视频编码器20可使用帧内预测或帧间预测来产生用于CU的预测数据。当视频编码器20使用帧内预测来产生用于CU的预测数据时,视频编码器20从含有CU的图片的经解码样本导出用于CU的预测数据。当视频编码器20使用帧间预测来产生用于CU的预测数据时,视频编码器20从不同于含有所述CU的图片的参考图片的经解码值导出用于所述CU的预测数据。
在视频编码器20产生用于CU的预测数据之后,视频编码器20可计算用于CU的残余数据。用于CU的残余数据可指示用于CU的预测数据中的像素值与CU的原始像素值之间的差。
树块的每一未分割CU可具有一或多个变换单元(TU)。CU的每一TU可与所述CU的残余数据的不同部分相关联。视频编码器20可针对CU的每一TU执行变换操作。当视频编码器20针对TU执行变换操作时,视频编码器20可至少部分通过将变换应用到与所述TU相关联的残余数据而产生系数块。
视频编码器20可量化系数块中的系数且对系数块执行熵编码操作。在视频编码器20对系数块执行熵编码后,视频编码器20可在用于视频数据的位流中包含表示经熵编码系数块的数据。位流可为形成经译码图片和相关联数据的表示的一连串位。
当视频解码器30接收到经编码位流时,视频解码器30执行与由视频编码器20执行的编码操作大体互逆的解码操作。举例来说,视频解码器30可对图片的每一切片执行解码操作。当视频解码器30对图片的切片执行解码操作时,视频解码器30可对切片中的树块执行解码操作。当视频解码器30完成对树块的解码操作时,视频解码器30已解码树块的像素值。当视频解码器30已解码了用于切片的每一树块的像素值时,视频解码器30已重建用于所述切片的像素值。
合并模式指对于被译码的当前视频块继承相邻视频块的运动信息(例如,运动向量、参考帧索引、预测方向或其它信息)的一或多个视频译码模式。可使用索引值识别候选者邻居的列表,当前视频块从候选者邻居(例如,相对于当前块或来自时间上邻近的框的处于相同位置块的顶部、右上、左、左下块)继承其运动信息(例如,时间运动向量预测符或TMVP,如下文更详细地论述)。这些候选者可存储在列表(有时被称作合并候选者列表)中。合并候选者列表可一开始具有预定大小。然而,作为精简(例如,去除冗余或重复列表项)的结果或通过截短(例如,如果视频经译码以使用特定合并候选者列表大小),可减小列表大小。随着列表大小减小和删除候选者(或在于TMVP前***较多候选者的情形中),TMVP可从列表去除或在一些情况下不添加到列表。然而,当在并行运动估计区域上进行合并模式时,例如下文更详细地描述的技术的各种技术可用以产生合并候选者列表。举例来说,这些技术可由图2中说明的合并/MVP列表产生模块121执行。以下关于图4到17更详细地描述这些技术的实施例。
跳过模式可包括一种类型的合并模式(或类似于合并模式的模式)。在跳过模式下,运动信息被继承,但不译码残余信息。残余信息可大体指指示待译码的块与运动信息继承自的块之间的像素差的像素差信息。引导模式可为另一类型的合并模式(或类似于合并模式的模式)。引导模式与跳过模式类似之处在于运动信息被继承,但在引导模式下,视频块经译码以包含残余信息。短语“合并模式”在本文中用以指可被叫作跳过模式、引导模式或合并模式的这些模式中的任一者。
在当前视频块的译码中使用相邻视频块的运动向量的另一情况为所谓的运动向量预测或高级运动向量预测(AMVP)。在这些情况下,应用运动向量的预测性译码以减小传达所述运动向量所需要的数据量。举例来说,并不编码和传达运动向量自身,视频编码器20编码和传达相对于已知(或可知)运动向量的运动向量差(MVD)。在H.264/AVC中,可供MVD用以定义当前运动向量的已知运动向量可由所谓的运动向量预测符(MVP)定义,可将MVP作为与相邻块相关联的运动向量的中值导出。然而,例如自适应运动向量预测(AMVP)的更高级的MVP技术可允许视频编码器20选择定义MVP所根据的邻居。因此,合并模式的使用可指使用来自另一块的运动信息以在具有或无指示待译码的块与其它块之间的像素差的残余信息的情况下译码当前块。AMVP的使用可指使用来自另一块的运动向量信息,其中使用MVD值以指示待译码的块的MVP与实际MV之间的差。用于选择候选块以获得运动向量信息的技术对于合并模式和AMVP可相同或类似。作为一般背景,在多数视频译码***中,使用运动估计和运动补偿减少视频序列中的时间冗余,以便达成数据压缩。在此情况下,可产生运动向量以便识别预测性视频数据块(例如,从另一视频帧或切片),预测性视频数据块可用以预测正被译码的当前视频块的值。从当前视频块的值减去预测性视频块的值以产生残余数据的块。将运动向量与残余数据一起从视频编码器20传达到视频解码器30。视频解码器30可定位相同预测性块(基于运动向量)且通过组合残余数据与预测性块的数据来重建经编码视频。还可使用许多其它压缩技术(例如,变换和熵译码),以进一步改善视频压缩。
视频编码器20通常执行运动估计过程。视频编码器20可将运动信息(例如,运动向量、运动向量标引、预测方向或其它信息)发射到视频解码器30,使得视频解码器30能够识别用以编码给定视频块的预测性块。
已提议AMVP通过在空间和时间方向上包含若干相邻块作为用于MVP的候选者来建置运动向量候选者集合。在此情况下,视频编码器20基于编码速率和失真的分析从候选者集合选择最准确的预测符(例如,使用所谓的速率-失真成本分析)。视频编码器20也可将运动向量预测符索引(mvp_idx)用信号发送到视频解码器30以通知视频解码器30何处定位MVP。视频编码器20也可用信号发送MVD。视频解码器30可组合MVD与MVP(由运动向量预测符索引定义)以便重建运动向量。视频解码器30(如同视频编码器20)可基于各种准则定义将索引应用到的候选者MVP的集合。
视频编码器
图2是说明视频编码器20的实例配置的框图。图2是为了解释的目的而提供且关于如广泛地在本发明中举例说明和描述的技术并不受限制。出于解释的目的,本发明在HEVC译码的上下文中描述视频编码器20。然而,本发明的技术可适用于其它译码标准或方法。
在图2的实例中,视频编码器20包含多个功能组件。视频编码器20的功能组件包含预测模块100、残余产生模块102、变换模块104、量化模块106、反量化模块108、反变换模块110、重建模块112和经解码图片缓冲器114、熵编码模块116和分割模块118。预测模块100包含合并/MVP列表产生模块121、运动估计模块122、运动补偿模块124和帧内预测模块126。合并/MVP列表产生模块121可产生MV候选者列表。举例来说,对于对应于在MER中分割的多个PU中的至少的多个MV候选者,合并/MVP列表产生模块121可选择所述多个MV候选者的子集以包含在合并候选者列表中且产生合并候选者列表以包含所述多个运动向量候选者的选定子集,如以下关于图4到17更详细地描述。
在其它实例中,视频编码器20可包含更多、更少或不同功能组件。举例来说,视频编码器20可包含解块滤波器以滤波重建模块112的输出以从重建的视频去除成块效应伪影。此外,合并/MVP列表产生模块121、运动估计模块122和运动补偿模块124可高度集成,但出于解释的目的,在图2的实例中分开来表示。
视频编码器20可接收视频数据。在各种实例中,视频编码器20可从各种来源接收视频数据。举例来说,视频编码器20可从视频源18(图3)或另一来源接收视频数据。视频数据可表示图片序列。图片可包含纹理视图和深度视图。为编码视频数据,视频编码器20可对每一图片序列执行编码操作。作为对图片序列执行编码操作的部分,视频编码器20可对图片序列内的每一图片执行编码操作。作为对图片执行编码操作的部分,视频编码器20可对图片中的每一切片执行编码操作。当视频编码器20对切片执行编码操作时,视频编码器20产生经译码切片。经译码切片为呈其经编码形式的切片。经译码切片可包含切片标头和切片数据。切片标头可含有与切片相关联的语法元素。
作为对切片执行编码操作的部分,视频编码器20可对切片中的树块执行编码操作。当视频编码器20对树块执行编码操作时,视频编码器20可产生经译码树块。经译码树块可包括表示树块的经编码型式的数据。换句话说,经译码树块可为呈其经编码形式的树块。
作为对树块执行编码操作的部分,分割模块118可对树块执行四叉树分割以将树块划分成逐渐更小的CU。举例来说,分割模块118可将树块分割成四个大小相等的子CU,将子CU中的一或多者分割成四个大小相等的子子CU,等等。
CU的大小可范围从8×8个像素到多达具有最大64×64个像素或更大的树块的大小。在本发明中,“N×N”与“N乘N”可互换地使用以指就垂直尺寸和水平尺寸来说的视频块的像素尺寸,例如,16×16个像素或16乘16个像素。一般来说,16×16块将在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样,N×N块通常在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。
作为针对树块执行编码操作的部分,分割模块118可产生用于树块的阶层式四叉树数据结构。举例来说,树块可对应于四叉树数据结构的根节点。如果分割模块118将树块分割成四个子CU,那么根节点在四叉树数据结构中具有四个子节点。子节点中的每一者对应于子CU中的一者。如果分割模块118将子CU中的一者分割成四个子子CU,那么对应于子CU的节点可具有四个子节点,子节点中的每一者对应于子子CU中的一者。
四叉树数据结构的每一节点可提供用于对应的CU的语法数据。举例来说,四叉树中的节点可包含***旗标,其指示对应于节点的CU是否分割(例如,***)成四个子CU。用于CU的语法元素可递归地定义,且可取决于CU是否***成子CU。未分割的CU可对应于四叉树数据结构中的叶节点。四叉树数据结构中的叶节点可被称作“译码节点”。经译码树块可包含基于用于对应的树块的四叉树数据结构的数据。经译码树块为呈其经编码形式的树块。当经译码树块为呈其经编码形式的树块时,经译码树块对应于树块。
视频编码器20可对树块的每一未分割的CU执行编码操作。当视频编码器20对未分割的CU执行编码操作时,视频编码器20产生表示未分割的CU的经编码型式的数据。
作为对CU执行编码操作的部分,运动估计模块122和运动补偿模块124可对CU执行帧间预测。换句话说,运动估计模块122和运动补偿模块124可基于不同于含有CU的图片的参考图片的经解码样本而产生用于CU的预测数据。帧间预测可提供时间压缩。
为了对CU执行帧间预测,运动估计模块122可将CU分割成一或多个预测单元(PU)。视频编码器20和视频解码器30可支持各种PU大小。假定特定CU的大小为2N×2N,视频编码器20和视频解码器30可支持2N×2N或N×N的PU大小,和呈2N×2N、2N×N、N×2N、N×N、2N×nU、nL×2N、nR×2N或类似大小的对称PU大小的帧间预测。视频编码器20和视频解码器30还可支持用于2N×nU、2N×nD、nL×2N和nR×2N的PU大小的不对称分割。在一些实例中,运动估计模块122可沿着不按直角与CU的边会合的边界将CU分割成PU。
运动估计模块122可关于CU的每一PU执行运动估计操作。当运动估计模块122关于PU执行运动估计操作时,运动估计模块122可产生用于所述PU的一或多个运动向量。举例来说,切片可为I切片、P切片或B切片。运动估计模块122和运动补偿模块124可取决于CU处于I切片、P切片还是B切片中而对CU的PU执行不同操作。在I切片中,所有CU经帧内预测。因此,如果CU在I切片中,那么运动估计模块122和运动补偿模块124不对CU执行帧间预测。
如果CU在P切片中,那么含有所述CU的图片与被称作“列表0”的参考图片列表相关联。列表0中的参考图片中的每一者含有可用于按解码次序对后续图片进行帧间预测的样本。当运动估计模块122关于P切片中的PU执行运动估计操作时,运动估计模块122搜索列表0中的参考图片以找出用于PU的参考样本。PU的参考样本可为最紧密对应于PU的像素值的一组像素值。运动估计模块122可使用多种度量来确定参考图片中的一组像素值对应于PU的像素值的紧密程度。举例来说,运动估计模块122可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异度量来确定参考图片中的一组像素值对应于PU的像素值的紧密程度。
在识别出P切片中的CU的PU的参考样本后,运动估计模块122可产生指示列表0中含有参考样本的参考图片的参考索引和指示PU与参考样本之间的空间位移的运动向量。在各种实例中,运动估计模块122可以变化的精确度产生运动向量。举例来说,运动估计模块122可以四分之一像素精确度、八分之一像素精确度或其它分数像素精确度产生运动向量。运动估计模块122可将用于PU的运动信息输出到熵编码模块116和运动补偿模块124。用于PU的运动信息可包含PU的参考索引和运动向量。运动补偿模块124可使用CU的PU的运动信息来识别和检索PU的参考样本。运动补偿模块124可接着使用PU的参考样本的像素值来产生用于CU的预测数据。
如果CU在B切片中,那么含有所述CU的图片可与被称作“列表0”和“列表1”的两个参考图片列表相关联。列表0中的参考图片中的每一者含有可用于按解码次序对后续图片进行帧间预测的样本。列表1中的参考图片按解码次序出现在所述图片之前,但按呈现次序在所述图片之后。在一些实例中,含有B切片的图片可与为列表0与列表1的组合的列表组合相关联。
此外,如果CU在B切片中,那么运动估计模块122可对CU的PU执行单向预测或双向预测。当运动估计模块122针对PU执行单向预测时,运动估计模块122可搜索列表1的参考图片以找出用于PU的参考样本。运动估计模块122可接着产生指示列表1中的含有参考样本的参考图片的参考索引和指示PU与参考样本之间的空间位移的运动向量。运动估计模块122可将用于CU的PU的运动信息输出到熵编码模块116和运动补偿模块124。用于PU的运动信息可包含PU的参考索引、预测方向指示符和运动向量。预测方向指示符可指示参考索引指示列表0还是列表1中的参考图片。运动补偿模块124可使用CU的PU的运动信息来识别和检索PU的参考样本。运动补偿模块124可接着使用PU的参考样本的像素值来产生用于CU的预测数据。
当运动估计模块122针对PU执行双向预测时,运动估计模块122可搜索列表0中的参考图片以找出用于所述PU的参考样本,且还可搜索列表1中的参考图片以找出用于所述PU的另一参考样本。运动估计模块122可接着产生指示所述参考样本的参考索引和指示参考样本与PU之间的空间位移的运动向量。运动估计模块122可将PU的运动信息输出到熵编码模块116和运动补偿模块124。用于PU的运动信息可包含PU的参考索引和运动向量。运动补偿模块124可使用运动信息来识别和检索PU的参考样本。运动补偿模块124可接着内插来自CU的PU的参考样本中的像素值的所述CU的预测数据的像素值。
在一些情况下,运动估计模块122不将PU的运动信息的完整集合输出到熵编码模块116。相反地,运动估计模块122可参考另一PU的运动信息用信号发送PU的运动信息。举例来说,运动估计模块122可确定PU的运动信息充分类似于相邻PU的运动信息。在此实例中,运动估计模块122可在用于CU的四叉树节点中指示对视频解码器30指示PU具有与相邻PU相同的运动信息的值。在另一实例中,运动估计模块122可在与CU相关联的四叉树节点中识别相邻PU和运动向量差(MVD)。运动向量差指示PU的运动向量与所指示的相邻PU的运动向量之间的差。视频解码器30可使用所指示的相邻PU的运动向量和运动向量差来预测PU的运动向量。
作为对CU执行编码操作的部分,帧内预测模块126可对CU执行帧内预测。换句话说,帧内预测模块126可基于其它CU的经解码像素值产生用于CU的预测数据。帧内预测可提供空间压缩。
为对CU执行帧内预测,帧内预测模块126可使用多个帧内预测模式来产生用于CU的多组预测数据。当帧内预测模块126使用帧内预测模式来产生用于CU的一组预测数据时,帧内预测模块126可在与所述帧内预测模式相关联的方向和/或梯度上将像素值从相邻CU跨越所述CU延伸。相邻CU可在所述CU的上方、右上方、左上方或左方,假定对于CU和树块采用从左到右、从上到下的编码次序。帧内预测模块126可取决于CU的大小而使用各种数目个帧内预测模式,例如,33个方向帧内预测模式。
帧内预测模块126可选择用于CU的预测数据组中的一者。在各种实例中,帧内预测模块126可以各种方式选择用于CU的预测数据组。举例来说,帧内预测模块126可通过计算预测数据组的失真率且选择具有最低失真率的预测数据组来选择用于CU的预测数据组。
预测模块100可从由运动补偿模块124针对CU产生的预测数据或由帧内预测模块126针对CU产生的预测数据当中选择用于CU的预测数据。在一些实例中,预测模块100基于预测数据组的误差(例如,失真)来选择用于CU的预测数据。
在预测模块100选择用于CU的预测数据后,残余产生模块102可通过从CU的像素值减去CU的选定预测数据来产生用于CU的残余数据。CU的残余数据可包含对应于CU中的像素的不同像素分量的2D残余块。举例来说,残余数据可包含对应于CU的预测数据中的像素的亮度分量与CU的原始像素中的像素的亮度分量之间的差的残余块。此外,CU的残余数据可包含对应于CU的预测数据中的像素的色度分量与CU的原始像素的色度分量之间的差的残余块。
CU可具有一或多个变换单元(TU)。CU的每一TU可对应于所述CU的残余数据的不同部分。CU的TU的大小可或可不基于CU的PU的大小。在一些实例中,可使用被称为“残余四叉树”(RQT)的四叉树结构将CU细分成更小单元。TU可对应于RQT的节点。
变换模块104可通过将变换应用于对应于未分割的TU的残余数据来产生用于CU的每一未分割的TU的一或多个系数块。系数块中的每一者可为系数的2D矩阵。在各种实例中,变换模块104可将各种变换应用到对应于TU的残余数据。举例来说,变换模块可应用离散余弦变换(DCT)、方向变换或概念上类似的变换。
在变换模块104产生用于TU的系数块后,量化模块106可量化系数块中的系数。量化大体指系数块中的系数经量化以可能减少用以表示系数的数据量从而提供进一步压缩的过程。量化可减小与系数中的一些或全部相关联的位深度。举例来说,n位值可在量化期间被下舍入到m位值,其中n大于m。
反量化模块108和反变换模块110可分别对系数块应用反量化和反变换,以从系数块重建残余数据。重建模块112可将经重建的残余数据添加到由运动补偿模块124或帧内预测模块126产生的预测数据以产生经重建视频块用于存储在经解码图片缓冲器114中。运动估计模块122和运动补偿模块124可使用含有经重建视频块的参考图片对后续图片的CU执行帧间预测。此外,帧内预测模块126可使用当前图片的CU的经重建像素值执行帧内预测。
熵编码模块116可从视频编码器20的其它功能组件接收数据。举例来说,熵编码模块116可从量化模块106接收系数块,且可从预测模块100接收语法元素。当熵编码模块116接收到数据时,熵编码模块116可执行一或多个熵编码操作以产生经熵编码数据。举例来说,视频编码器20可对数据执行上下文自适应可变长度译码(CAVLC)操作、上下文自适应二进制算术译码(CABAC)操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作或另一类型的熵编码操作。
为执行CABAC,熵编码模块116可向待发射的符号指派上下文模型内的上下文。所述上下文可涉及(例如)符号的相邻值是否为非零。为执行CAVLC,熵编码模块116可选择用于待发射的符号的可变长度码。VLC中的码字可经构建而使得相对较短的代码对应于可能性较高的符号,而相对较长的代码对应于可能性较低的符号。以此方式,VLC的使用可达成较之对待发射的每一符号使用相等长度码字的位节省。概率确定可基于指配给符号的上下文。
熵编码模块116可输出位流。位流可为形成经译码图片和相关联数据的表示的一连串位。位流可包括一连串网络抽象层(NAL)单元。所述NAL单元中的每一者可为含有NAL单元中的数据类型的指示和含有所述数据的字节的语法结构。举例来说,NAL单元可含有表示PPS、APS、经译码切片、辅助增强信息、存取单元分隔符、填充符数据或另一类型的数据的数据。NAL单元的数据可呈穿插有模仿防止位的原始字节序列有效负载(RBSP)的形式。RBSP可为含有囊封在NAL单元内的整数数目个字节的语法结构。
熵编码模块116输出包含一系列NAL单元的位流。如上所论述,NAL单元中的每一者可为含有NAL单元中的数据类型的指示和含有数据的字节的语法结构。位流中的每一经译码切片NAL单元含有经译码切片。经译码切片包含经译码切片标头和切片数据。切片数据可包含经译码树块。经译码树块可包含一或多个经译码CU。每一经译码CU可包含一或多个经熵编码系数块。
视频解码器
图3是说明视频解码器30的实例配置的框图。图3是为了解释的目的而提供且关于如广泛地在本发明中举例说明和描述的技术并不受限制。出于解释的目的,本发明在HEVC译码的上下文中描述视频解码器30。然而,本发明的技术可适用于其它译码标准或方法。
在图3的实例中,视频解码器30包含多个功能组件。视频解码器30的功能组件包含熵解码模块150、预测模块152、反量化模块154、反变换模块156、重建模块158和经解码图片缓冲器160。预测模块152包含合并/MVP列表产生模块161、运动补偿模块162和帧内预测模块164。合并/MVP列表产生模块161可产生MV候选者列表。在一些实例中,视频解码器30可执行大体与关于图2的视频编码器20描述的编码遍次互逆的解码遍次。在其它实例中,视频解码器30可包含更多、更少或不同的功能组件。举例来说,视频解码器30可包含解块滤波器以滤波重建模块158的输出以从经重建视频去除成块效应伪影。
视频解码器30可接收包括经编码视频数据的位流。当视频解码器30接收到位流时,熵解码模块150对所述位流执行剖析操作。作为对位流执行剖析操作的结果,熵解码模块150可产生经熵解码语法元素。经熵解码语法元素可包含经熵解码的系数块。预测模块152、反量化模块154、反变换模块156和重建模块158可执行使用语法元素产生经解码视频数据的解码操作。
如上所论述,位流可包括一系列NAL单元。位流的NAL单元可包含序列参数集NAL单元、图片参数集NAL单元、SEINAL单元等等。作为对位流执行剖析操作的部分,熵解码模块150可执行剖析操作,所述剖析操作从序列参数集NAL单元提取且熵解码序列参数集、从图片参数集NAL单元提取且熵解码图片参数集、从SEINAL单元提取且熵解码SEI数据等等。序列参数集为含有应用于零或多个全部译码的视频序列的语法元素的语法结构。图片参数集为可含有应用于零或多个全部经译码图片的语法元素的语法结构。与给定图片相关联的图片参数集可包含识别与给定图片相关联的序列参数集的语法元素。
此外,位流的NAL单元可包含经译码切片NAL单元。作为对位流执行剖析操作的部分,熵解码模块150可执行剖析操作,所述剖析操作从经译码切片NAL单元提取且熵解码经译码切片。经译码切片中的每一者可包含切片标头和切片数据。切片标头可含有关于切片的语法元素。切片标头中的语法元素可包含识别与含有所述切片的图片相关联的图片参数集的语法元素。熵解码模块150可对经译码切片标头执行熵解码操作(例如,CAVLC解码操作),以恢复所述切片标头。
在从经译码切片NAL单元提取切片数据之后,熵解码模块150可从所述切片数据提取经译码树块。熵解码模块150可接着从经译码树块提取经译码CU。熵解码模块150可执行剖析操作,所述剖析操作从经译码CU提取语法元素。提取的语法元素可包含经熵编码的系数块。熵解码模块150可接着对语法元素执行熵解码操作。举例来说,熵解码模块150可对系数块执行CABAC操作。
当熵解码模块150对一组数据执行熵解码操作时,熵解码模块150可选择上下文模型。在熵解码模块150使用CABAC的实例中,上下文模型可指示特定频率仓(bin)的概率。在熵解码模块150使用CAVLC的实例中,上下文模型可指示码字与对应的数据之间的映射。熵解码模块150可接着使用选定上下文模型对所述一组数据执行熵解码操作。
在熵解码模块150对未分割的CU执行剖析操作之后,视频解码器30可对未分割的CU执行解码操作。为对未分割的CU执行解码操作,视频解码器30可在CU的残余四叉树的每一层级处对CU的每一TU执行解码操作。通过针对CU的每一TU执行解码操作,视频解码器30可重建CU的残余数据。
作为对未分割的TU执行解码操作的部分,反量化模块154可反量化(即,解量化)与TU相关联的系数块。反量化模块154可以类似于针对HEVC所提议或由H.264解码标准定义的反量化过程的方式来反量化系数块。反量化模块154可使用由视频编码器20针对系数块的CU所计算的量化参数QPY来确定量化程度,且同样地,使用反量化程度来供反量化模块154应用。
在反量化模块154反量化系数块后,反变换模块156可产生用于与系数块相关联的TU的残余数据。反变换模块156可至少部分通过对系数块应用反变换来产生用于TU的残余数据。举例来说,反变换模块156可将反DCT、反整数变换、反卡亨南-洛维(Karhunen-Loeve)变换(KLT)、反旋转变换、反方向变换或另一反变换应用到系数块。在一些实例中,反变换模块156可基于从视频编码器20的用信号发送而确定应用于变换系数块的反变换。在这些实例中,反变换模块156可基于在用于与系数块相关联的树块的四叉树的根节点处的用信号发送的变换来确定反变换。在其它实例中,反变换模块156可从一或多个译码特性(例如,块大小、译码模式或类似者)推断反变换。在一些实例中,反变换模块156可应用级联的反变换。
如果CU是使用帧间预测编码,那么运动补偿模块162可执行运动补偿以产生用于CU的预测数据。运动补偿模块162可使用用于CU的PU的运动信息来识别用于PU的参考样本。用于PU的运动信息可包含运动向量、参考图片索引和预测方向。运动补偿模块162可接着使用用于PU的参考样本来产生用于CU的预测数据。
在一些实例中,运动补偿模块162可通过基于内插滤波器执行内插而改进用于CU的预测数据。用于将用于以子像素精确度进行运动补偿的内插滤波器的识别符可包含在语法元素中。运动补偿模块162可使用由视频编码器20在产生CU的预测数据期间使用的相同内插滤波器来计算用于参考块的子整数像素的内插值。运动补偿模块162可根据所接收的语法信息而确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测数据。
如果使用帧内预测编码CU,那么帧内预测模块164可执行帧内预测以产生用于CU的预测数据。举例来说,帧内预测模块164可基于位流中的语法元素确定用于CU的帧内预测模式。帧内预测模块164可接着使用所述帧内预测模式来基于相邻CU的像素值产生用于CU的预测数据(例如,经预测像素值)。
重建模块158可使用CU的残余数据和用于CU的预测数据重建用于CU的像素值。在一些实例中,视频解码器30可应用解块滤波器以从切片或图片的经重建像素值滤波器去除成块效应伪影。经解码图片缓冲器160可存储用于视频数据的图片的经解码像素值。经解码图片缓冲器160可提供参考图片用于后续运动补偿、帧内预测和在显示装置(例如,图3的显示装置34)上呈现。认识到,取决于实施例,本文中描述的方法中的任何者的某些动作或事件可以不同序列执行,可添加、合并或完全省略(例如,对于方法的实践,并非所有描述的动作或事件都是必要的)。此外,在某些实施例中,可(例如)经由多线程处理、中断处理或多个处理器同时而非依序执行动作或事件。
合并运动向量(MV)候选者
如上所论述,在各种实施例中,CU的大小可范围从8×8个像素直到具有最大64×64个像素或更大的树块的大小。图4展示分割成译码单元(CU)的最大译码单元(LCU)400的实例。举例来说,LCU400可分割成CU块4i和4h,每一者具有大小32×32个像素。类似地,32×32CU块可分割成四个16×16CU块。举例来说,CU4a、4b、4c、4j、4k、4l和4m可各对应于16×16CU。类似地,16×16CU块可分割成四个8×8像素CU块。举例来说,CU4d、4e、4f和4g可各对应于8×8CU。
图5A到5D展示分割成不同预测单元(PU)的CU的实例。明确地说,CU500可分割成若干不同PU。举例来说,如图5A中所展示,2N×2NCU500可分割成单一2N×2NPU。此外,如图5B中所展示,2N×2NCU500还可分割成两个2N×NPU——左2N×NPU5a和右2N×NPU5b。如图5C中所展示,2N×2NCU500还可分割成两个N×2NPU——顶部N×2NPU5c和底部N×2NPU5d。如图5D中所展示,2N×2NCU500还可分割成四个N×NPU——左上N×NPU5e、右上N×NPU5f、左下N×NPU5g和右下N×NPU5h。
如上所论述,在某些译码模式期间,可产生运动向量候选者的列表,且可使用运动向量中的一或多者确定当前视频块的值。如图6中所展示,运动向量候选者可包含来自一或多个空间相邻视频块的运动向量信息(例如,左下(BL640)、左(L630)、左上(TL620)、顶部(T650)和右上(TR660))以及一个时间上相邻的处于相同位置的视频块(例如,时间运动向量预测符或TMVP(T670))。这些空间相邻视频块620、630、640、650和660和TMVP670说明于图6中。在一些实施例中,当前视频块610(例如,正被译码的视频块)可继承或另外使用选定相邻视频块的运动信息(例如,运动向量)。举例来说,如图6中所说明,视频编码器(例如,视频编码器20)不针对在合并模式中译码的视频块610用信号发送运动向量自身。相反地,可使用索引值(例如,索引值0到4)识别相邻视频块(例如,左下相邻者640、左相邻者630、左上相邻者620、上方相邻者650或右上相邻者660),当前视频块610从相邻视频块继承其运动向量和运动信息。
在一些实施例中,合并候选者列表(也叫作合并MV候选者列表或MV候选者列表)可具有五个项和添加到所述合并候选者列表的多达四个空间运动向量候选者(但在其它实施例中,候选者列表可具有多于或少于五个项,且具有添加到所述合并候选者列表的多于或少于四个空间候选者)。合并候选者列表中的五个项的索引值开始于0且结束于4。合并候选者可包含空间候选者(例如,如在HEVC中所定义)和其它类型的候选者。每一空间MV可等于与当前视频块(例如,块610)空间上相邻的任一视频块(例如,块620、630、640、650、660)或从所述任一视频块导出。在一些实施例中,如果一些合并候选者不可用(或如果其经精简或另外从MV候选者列表去除),那么可选择其它候选者。
对应于给定CU的MV候选者的确定
在并行运动估计中,可针对用于CU中的多个PU或用于LCU中的多个CU的跳过模式、合并模式和规则或正常帧内预测模式并行地执行运动估计。通过并行运动估计,可并行地进行针对在CU内部的PU的运动估计,同时CU到CU之间的运动估计是依序的。
图7A到7C说明分割成PU且展示用于一些PU的MV候选者位置的实例CU。明确地说,作为实例,图7A到7C说明32×32CU700。本文中关于CU700描述的方法适用于确定用于在其它大小的CU(其中包含64×64CU、16×16CU和8×8CU)内分割的PU的MV候选者位置。
如图7A中所展示,可在32×32CU700内分割的最大PU为具有大小32×32的PU7a。可产生对应于PU7a的MV候选者。举例来说,对应于PU7a的MV候选者包含空间候选者左上MV候选者7b、顶部MV候选者7c、右上MV候选者7d、左MV候选者7e和时间MV候选者7f。在此实例中,MV候选者中的每一者具有4×4的大小,包含左上MV候选者7b、顶部MV候选者7c、右上MV候选者7d和左MV候选者7e。在其它实施例中,MV候选者可具有变化大小。
如图7B中所展示,CU700可分割成各具有大小32×16的左PU7g和右PU7h。对应于PU7g的可产生的MV候选者包含空间候选者左上MV候选者7i、顶部MV候选者7j、右上MV候选者7k、左MV候选者7n和时间MV候选者7o。对应于PU7h的可产生的MV候选者包含空间候选者左上MV候选者7j、顶部MV候选者7l、右上MV候选者7m、左MV候选者7g和时间MV候选者7p。单一MV候选者可充当用于一个以上PU的MV候选者。举例来说,MV候选者7j为用于PU7g的顶部MV候选者,而MV候选者7j也是用于PU7h的左上MV候选者。
如图7C中所展示,CU700可分割成各具有大小16×32的顶部PU7q和底部PU7r。对应于PU7q的可产生的MV候选者包含空间候选者左上MV候选者7s、顶部MV候选者7t、右上MV候选者7u、左MV候选者7v、左下MV候选者7x和时间MV候选者7y。对应于PU7r的可产生的MV候选者包含空间候选者左上MV候选者7v、顶部MV候选者7w、左MV候选者7z和时间MV候选者7ab。如先前,单一MV候选者可充当用于一个以上PU的MV候选者。举例来说,MV候选者7v为用于PU7q的左MV候选者,而MV候选者7v也是用于PU7r的左上MV候选者。
在此实例中,具有32×32的大小的CU700可分割成四个较小的不重叠16×16CU。举例来说,CU700可分割成左上16×16CU710、右上16×16CU720、左下16×16CU730和右下16×16740,如图8到15中所展示。
图8A到8C说明分割成PU且展示用于一些PU的MV候选者位置的实例CU。明确地说,作为实例,图8A到8C说明左上16×16CU710。
如图8A中所展示,可在16×16CU710内分割的最大PU为具有大小16×16的PU8a。可产生对应于PU8a的MV候选者。举例来说,对应于PU8a的MV候选者包含空间候选者左上MV候选者8b、顶部MV候选者8c、右上MV候选者8d、左MV候选者8e、左下MV候选者8f和时间MV候选者8g。在此实例中,MV候选者中的每一者具有4×4的大小,包含左上MV候选者8b、顶部MV候选者8c、右上MV候选者8d、左MV候选者8e和左下MV候选者8f。在其它实施例中,MV候选者可具有不同大小。
如图8B中所展示,CU710可分割成各具有大小16×8的左PU8h和右PU8i。对应于PU8h的可产生的MV候选者包含空间候选者左上MV候选者8j、顶部MV候选者8k、右上MV候选者8l、左MV候选者8n、左下MV候选者8p和时间MV候选者8q。并无必要每一空间MV候选者与对应PU的边界直接相邻。举例来说,即使用于PU8h的右上MV候选者8l不与PU8h的边界直接相邻,候选者8l仍可充当关于PU8h的空间MV候选者。对应于PU8i的可产生的MV候选者包含空间候选者左上MV候选者8k、顶部MV候选者8l、右上MV候选者8m、左MV候选者8o和时间MV候选者8r。单一MV候选者可充当用于一个以上PU的MV候选者。举例来说,MV候选者8k为用于PU8h的顶部MV候选者,而MV候选者8k也是用于PU8i的左上MV候选者。
如图8C中所展示,CU710可分割成各具有大小8×16的顶部PU8s和底部PU8t。对应于PU8s的可产生的MV候选者包含空间候选者左上MV候选者8u、顶部MV候选者8v、右上MV候选者8w、左MV候选者8x、左下MV候选者8z和时间MV候选者8ab。对应于PU8t的可产生的MV候选者包含空间候选者左上MV候选者8x、顶部MV候选者8y、左MV候选者8ac、左下MV候选者8ad和时间MV候选者8ae。如先前,单一MV候选者可充当用于一个以上PU的MV候选者。举例来说,MV候选者8x为用于PU8s的左MV候选者,而MV候选者8x也是用于PU8t的左上MV候选者。
图9A到9C说明分割成PU且展示用于一些PU的MV候选者位置的实例CU。明确地说,作为实例,图9A到9C说明右上16×16CU720。
如图9A中所展示,可在16×16CU720内分割的最大PU为具有大小16×16的PU9a。可产生对应于PU9a的MV候选者。举例来说,对应于PU9a的MV候选者包含空间候选者左上MV候选者9b、顶部MV候选者9d、右上MV候选者9e、左MV候选者9f和时间MV候选者9g。在此实例中,MV候选者中的每一者具有4×4的大小,包含左上MV候选者9b、顶部MV候选者9d、右上MV候选者9e和左MV候选者9f。在其它实施例中,MV候选者可具有不同大小。
如图9B中所展示,CU720可分割成各具有大小16×8的左PU9h和右PU9i。对应于PU9h的可产生的MV候选者包含空间候选者左上MV候选者9j、顶部MV候选者9k、右上MV候选者9l、左MV候选者9n和时间MV候选者9p。对应于PU9i的可产生的MV候选者包含空间候选者左上MV候选者9k、顶部MV候选者9l、右上MV候选者9m、左MV候选者9o和时间MV候选者9q。单一MV候选者可充当用于一个以上PU的MV候选者。举例来说,MV候选者9k为用于PU9h的顶部MV候选者,而MV候选者9k也是用于PU9i的左上MV候选者。
如图9C中所展示,CU720可分割成各具有大小8×16的顶部PU9r和底部PU9s。对应于PU9r的可产生的MV候选者包含空间候选者左上MV候选者9t、顶部MV候选者9u、右上MV候选者9v、左MV候选者9w、左下MV候选者9y和时间MV候选者9z。对应于PU9s的可产生的MV候选者包含空间候选者左上MV候选者9w、顶部MV候选者9x、左MV候选者9ab和时间MV候选者9ac。如先前,单一MV候选者可充当用于一个以上PU的MV候选者。举例来说,MV候选者9w为用于PU9r的左MV候选者,而MV候选者9w也是用于PU9s的左上MV候选者。
图10A到10C说明分割成PU且展示用于一些PU的MV候选者位置的实例CU。明确地说,作为实例,图10A到10C说明左下16×16CU730。
如图10A中所展示,可在16×16CU730内分割的最大PU为具有大小16×16的PU10a。可产生对应于PU10a的MV候选者。举例来说,对应于PU10a的MV候选者包含空间候选者左上MV候选者10b、顶部MV候选者10c、右上MV候选者10d、左MV候选者10e和时间MV候选者10f。在此实例中,MV候选者中的每一者具有4×4的大小,包含左上MV候选者10b、顶部MV候选者10c、右上MV候选者10d和左MV候选者10e。在其它实施例中,MV候选者可具有不同大小。
如图10B中所展示,CU730可分割成各具有大小16×8的左PU10g和右PU10h。对应于PU10g的可产生的MV候选者包含空间候选者左上MV候选者10i、顶部MV候选者10j、右上MV候选者10k、左MV候选者10n和时间MV候选者10o。对应于PU10h的可产生的MV候选者包含空间候选者左上MV候选者10j、顶部MV候选者10l、右上MV候选者10m、左MV候选者10g和时间MV候选者10p。单一MV候选者可充当用于一个以上PU的MV候选者。举例来说,MV候选者10j为用于PU10g的顶部MV候选者,而MV候选者10j也是用于PU10h的左上MV候选者。
如图10C中所展示,CU730可分割成各具有大小8×16的顶部PU10q和底部PU10r。对应于PU10q的可产生的MV候选者包含空间候选者左上MV候选者10s、顶部MV候选者10t、右上MV候选者10u、左MV候选者10v、左下MV候选者10x和时间MV候选者10y。对应于PU10r的可产生的MV候选者包含空间候选者左上MV候选者10v、顶部MV候选者10w、左MV候选者10z和时间MV候选者10ab。如先前,单一MV候选者可充当用于一个以上PU的MV候选者。举例来说,MV候选者10v为用于PU10q的左MV候选者,而MV候选者10v也是用于PU10r的左上MV候选者。
图11A到11C说明分割成PU且展示用于一些PU的MV候选者位置的实例CU。明确地说,作为实例,图11A到11C说明右下16×16CU740。
如图11A中所展示,可在16×16CU740内分割的最大PU为具有大小16×16的PU11a。可产生对应于PU11a的MV候选者。举例来说,对应于PU11a的MV候选者包含空间候选者左上MV候选者11b、顶部MV候选者11c、左MV候选者11d和时间MV候选者11e。在此实例中,MV候选者中的每一者具有4×4的大小,包含左上MV候选者11b、顶部MV候选者11c和左MV候选者11d。在其它实施例中,MV候选者可具有不同大小。
如图11B中所展示,CU740可分割成各具有大小16×8的左PU11f和右PU11g。对应于PU11f的可产生的MV候选者包含空间候选者左上MV候选者11h、顶部MV候选者11i、右上MV候选者11j、左MV候选者11l和时间MV候选者11m。对应于PU11g的可产生的MV候选者包含空间候选者左上MV候选者11i、顶部MV候选者11k和时间MV候选者11n。单一MV候选者可充当用于一个以上PU的MV候选者。举例来说,MV候选者11i为用于PU11f的顶部MV候选者,而MV候选者11i也是用于PU11g的左上MV候选者。
如图11C中所展示,CU740可分割成各具有大小8×16的顶部PU11o和底部PU11p。对应于PU11o的可产生的MV候选者包含空间候选者左上MV候选者11q、顶部MV候选者11r、左MV候选者11s、左下MV候选者11u和时间MV候选者11v。对应于PU11p的可产生的MV候选者包含空间候选者左上MV候选者11s、顶部MV候选者11t、左MV候选者11w和时间MV候选者11x。如先前,单一MV候选者可充当用于一个以上PU的MV候选者。举例来说,MV候选者11s为用于PU11o的左MV候选者,而MV候选者11s也是用于PU11p的左上MV候选者。
图12说明32×32CU700的实例,其展示对应于在CU700以及CU710、720、730和740中分割的任一PU的每一MV候选者。举例来说,图12包含对应于以下PU的MV候选者:32×32PU7a、32×16PU7g、32×16PU7h、16×32PU7q、16×32PU7r、16×16PU8a、16×8PU8h、16×8PU8i、8×16PU8s、8×16PU8t、16×16PU9a、16×8PU9h、16×8PU9i、8×16PU9r、8×16PU9s、16×16PU10a、16×8PU10g、16×8PU10h、8×16PU10q、8×16PU10r、16×16PU11a、16×8PU11f、16×8PU11g、8×16PU11o和8×16PU11p。明确地说,图12说明定位于CU700外部的13个空间MV候选者E1到E13、定位于CU700内部的24个空间MV候选者I1到i24和6个时间MV候选者T1到T6。13个外部空间MV候选者E1到E13、24个内部空间MV候选者I1到I24和6个时间MV候选者T1到T6对应于用于CU700内的PU的MV候选者。在许多情况下,MV候选者对应于一个以上PU。举例来说,外部空间MV候选者E1对应于六个PU:32×32PU7a的左上MV候选者7b、32×16PU7g的左上MV候选者7i、16×32PU7q的左上MV候选者7s、16×16PU8a的左上MV候选者8b、16×8PU8h的左上MV候选者8j和8×16PU8s的左上MV候选者8u。
对应于MER内的PU的MV候选者的选择
图13说明其中实施MER的32×32CU700的实例。举例来说,可实施对应于同一32×32CU块700的32×32MER区域。在其它实施例中,MER的大小可相同或与LCU大小不同。在实施MER的情况下,仅考虑在MER外部的空间MV候选者以及处于相同位置的时间MV候选者包含在合并候选者列表中。举例来说,将只考虑定位在MER外部的13个空间MV候选者E1到E13以及六个时间MV候选者T1到T6包含在合并候选者列表中。因此,在此实施例中,考虑包含在合并候选者列表中的合并运动向量候选者的总数为19。
在一些实施例中,根据本发明的一些方面配置的例如图1和2的视频编码器20的视频译码装置包含经配置以存储多个运动向量候选者的存储器。所述多个运动向量候选者可包括具有初始列表大小的初始列表。举例来说,包括定位于MER外部的13个空间MV候选者E1到E13以及6个时间MV候选者T1到T6的初始列表可具有初始列表大小19。19个运动向量候选者中的每一者对应于在MER中分割的多个预测单元(PU)中的至少一者。举例来说,19个运动向量候选者中的每一者对应于以下PU中的至少一者:32×32PU7a、32×16PU7g、32×16PU7h、16×32PU7q、16×32PU7r、16×16PU8a、16×8PU8h、16×8PU8i、8×16PU8s、8×16PU8t、16×16PU9a、16×8PU9h、16×8PU9i、8×16PU9r、8×16PU9s、16×16PU10a、16×8PU10g、16×8PU10h、8×16PU10q、8×16PU10r、16×16PU11a、16×8PU11f、16×8PU11g、8×16PU11o和8×16PU11p。与图12中说明的全部43个运动向量候选者的选择相比,仅19个运动向量候选者E1到E13和T1到T6的选择可减小总计算成本。
视频译码装置还可包含与存储器通信的处理器。处理器可经配置以选择多个运动向量候选者E1到E13和T1到T6中的一或多者以包含于具有小于初始列表大小的列表大小的合并候选者列表中。列表大小和初始列表大小可为任何数目。举例来说,初始列表大小可为19,且列表大小可为1与10之间的任何数目,包含1、4、5、6、8和10。
选择可基于每一运动向量候选者的优先级。在实施例中,多个运动向量候选者E1到E13和T1到T6中的每一者的优先级可基于运动向量候选者对应于在MER中分割的多个PU中的任一者的频率,其中较高频率对应于较高优先级。举例来说,根据一实施例,外部空间MV候选者E1可具有基于E1对应于七个PU的频率七:32×32PU7a的左上MV候选者7b、32×16PU7g的左上MV候选者7i、16×32PU7q的左上MV候选者7s、16×16PU8a的左上MV候选者8b、16×8PU8h的左上MV候选者8j、8×16PU8s的左上MV候选者8u和在PU8a的左上部中分割的8×8PU(未图示)的左上候选者。处理器可经进一步配置以产生合并候选者列表以包含选定运动向量候选者。
图13中说明的19个MV候选者就其在针对处于给定MER内部的不同CU和PU分割区的导出合并模式成本中的贡献未必同等重要。举例来说,归因于不同CU或PU的候选者位置重叠,一些MV候选者可具有比其它MV候选者高的频率。MV候选者关于给定MER的频率大体为静态。
在实施例中,基于MV候选者的频率,可将优先权或加权因数指派到每一候选者。对于具有较高频率的MV候选者,可指派较高优先权或加权因数。基于优先权或加权因数,可获得在合并候选者列表中支持的合并候选者的数目与译码性能之间的折衷。举例来说,在一些实施例中,发现当仅考虑19个MV候选者中的10个(基于其优先权)时,与考虑所有19个MV合并候选者相比,性能下降可小于0.5%。类似地,当只考虑19个MV候选者中的5个(基于其优先权)时,已发现与考虑所有19个MV合并候选者相比小于2%的性能下降。
图14说明展示对应于MER中分割的任一PU的每一时间或外部空间MV候选者的实例加权频率的32×32MER的实例。如上所述,多个运动向量候选者E1到E13和T1到T6中的每一者的优先级可至少部分基于运动向量候选者对应于在MER中分割的多个PU中的任一者的频率,其中较高频率对应于较高优先级。此外,多个运动向量候选者E1到E13和T1到T6中的每一者的优先级可进一步基于用于所述多个PU中的每一者的加权因数。举例来说,加权因数可取决于运动向量候选者对应于的每一PU的大小,其中较大大小PU接收较大加权因数。因此,如果MV候选者充当用于较大PU的合并候选者,那么其可接收比仅用于较小PU的候选者高的加权。
在一些实施例中,用于所述多个PU中的每一者的加权因数可与每一PU的大小成正比。举例来说,如果某人假定考虑的最小PU大小为8×8,那么对于PU内的每一8×8区域,PU可具有加权因数1。因此,32×32PU包含16个8×8区域且将具有加权因数16。同样地,16×32PU可具有加权因数8,32×16PU可具有加权因数8,16×16PU可具有加权因数4,8×16PU可具有加权因数2,16×8PU可具有加权因数2,且8×8PU可具有加权因数1。
图14中带编号的正方形对应于MV候选者E1到E13和T1到T6。因此,举例来说,具有加权的优先级41的左上MV候选者对应于E1。在此实施例中的E1的加权优先级41可如下计算:32×32PU7a的左上MV候选者7b具有加权因数16,32×16PU7g的左上MV候选者7i具有加权因数8,16×32PU7q的左上MV候选者7s具有加权因数8,16×16PU8a的左上MV候选者8b具有加权因数4,16×8PU8h的左上MV候选者8j具有加权因数2,8×16PU8s的左上MV候选者8u具有加权因数2,且在PU8a的左上部中分割的8×8PU(未图示)的左上MV候选者具有加权因数1——16+8+8+4+2+2+1为41。每一其它MV候选者的加权的优先权可类似地计算。举例来说,根据一实施例,对应于32×32MER的MV候选者的加权的优先权如下:E1具有加权的优先权41;E2具有加权的优先权8;E3具有加权的优先权35;E4具有加权的优先权23;E5具有加权的优先权46;E6具有加权的优先权41;E7具有加权的优先权6;E8具有加权的优先权3;E9具有加权的优先权32;E10具有加权的优先权17;E11具有加权的优先权6;E12具有加权的优先权3;E13具有加权的优先权41;T1具有加权的优先权1;T2具有加权的优先权4;T3具有加权的优先权3;T4具有加权的优先权24;T5具有加权的优先权60;且T6具有加权的优先权14。
基于每一MV候选者的加权的优先级,每一MV候选者可按优先权的次序进行排名。图15说明32×32MER的实例,其展示对应于MER中分割的任一PU的每一时间或外部空间MV候选者的实例优先级排名。明确地说,图15说明按加权的优先级的相反次序指派到每一MV候选者的索引值。因此,因为T5具有最高加权的优先权60,所以其具有最高优先权,且具有索引0。举例来说,如果处理器经配置以在合并候选者列表中只包含单一MV候选者(例如,列表大小为1),那么其将包含MV候选者T5。按加权的优先权的次序,在T5后为E5、E13、E6、E1、E3、E9、T4、E4、E10、T6、E2、E7、E11、T2、T3、E8、E12和T1。类似地,如果处理器经配置以在合并候选者列表中包含五个MV候选者(例如,列表大小为5),那么其可包含MV候选者T5、E5、E13、E6和E1。
基于优先级的MV候选者的选择的优势在于,包含加权的频率值的频率值和导出的优先级可独立于相邻PU(例如,块内/块间和PU大小)。因此,例如,未必需要针对每一LCU重新产生优先权列表。
在其它实施例中,MV候选者的优先级可取决于位置加权因数。位置加权因数可取决于空间MV候选者相对于对应的PU的相对位置。举例来说,用于MV候选者的加权因数可取决于候选者是否为用于PU的左候选者、右候选者、顶部候选者等等。用于PU的不同候选者可具有基于候选者与PU的相对位置选择的差异机会。举例来说,对应于用于PU的左位置候选者的空间MV候选者可具有比用于PU的左上方位置MV候选者高的位置加权因数。
图16为说明基于非冗余状态选择MV候选者用于包含在合并候选者列表中的过程800的实施例且可分别由图2或3的合并/MVP列表产生模块121或161执行的流程图。可单独地或除了本文中其它处描述的任一其它选择过程(包含,基于优先级、频率和加权的频率选择MV候选者)外或结合本文中其它处描述的任一其它选择过程,应用过程800。举例来说,过程800开始于块810。在块820,识别对应于在并行MER中分割的PU的MV候选者。对于(例如)32×32MER,识别19个MV候选者。过程800接着继续到块830,且确定任一特定MV候选者是否冗余。举例来说,当候选者PU内含有MV候选者时,处理器可经配置以基于候选者PU的状态确定MV候选者是否冗余。明确地说,举例来说,处理器可经配置以如果候选者PU是在帧内模式中译码,那么确定MV候选者是冗余的。此外,处理器可经配置以如果MV候选者包含与一或多个MV候选者中的另一者的运动信息相同的运动信息,那么其为冗余的。又,处理器可经配置以如果MV候选者具有零运动向量,那么确定MV候选者是冗余的。过程800接着继续到块840且排除来自运动向量列表的已发现为冗余的MV候选者。在块850,过程800检查是否已识别所有MV候选者。如果不,那么过程800循环回到块830。如果是,那么过程800继续到块860且选择尚未被排除的一或多个MV候选者用于包含在合并候选者列表中。过程800结束于块870。
图17为说明基于优先级选择MV候选者用于包含在合并候选者列表中的过程900的实施例且可分别由图2或3的合并/MVP列表产生模块121或161执行的流程图。可单独地或除了本文中其它处描述的任一其它选择过程外或结合本文中其它处描述的任一其它选择过程,应用过程900。举例来说,过程900开始于块910。在块920,识别对应于在并行MER中分割的PU的MV候选者。对于(例如)32×32MER,识别19个MV候选者。过程900接着继续到块930且确定MV候选者对应于MER中分割的PU中的任一者的频率f。过程900继续进行到块940且部分基于频率f确定MV候选者的优先级。举例来说,在MV候选者的优先级仅基于频率f的实施例中,基于E1对应于七个PU,外部空间MV候选者E1可具有的频率f为七:32×32PU7a的左上MV候选者7b、32×16PU7g的左上MV候选者7i、16×32PU7q的左上MV候选者7s、16×16PU8a的左上MV候选者8b、16×8PU8h的左上MV候选者8j、8×16PU8s的左上MV候选者8u和在PU8a的左上部中分割的8×8PU(未图示)的左上候选者。替代地,在MV候选者的优先级进一步取决于加权因数的实施例中,MV候选者E1可具有如下计算的优先级41:32×32PU7a的左上MV候选者7b具有加权因数16,32×16PU7g的左上MV候选者7i具有加权因数8,16×32PU7q的左上MV候选者7s具有加权因数8,16×16PU8a的左上MV候选者8b具有加权因数4,16×8PU8h的左上MV候选者8j具有加权因数2,8×16PU8s的左上MV候选者8u具有加权因数2,且在PU8a的左上部中分割的8×8PU(未图示)的左上MV候选者具有加权因数1——16+8+8+4+2+2+1为41。在块940中还可应用任一其它加权因数。过程900继续进行到块960且确定是否已识别所有MV候选者。如果不,那么过程900循环回到块930。如果是,那么过程900继续到块970且基于MV候选者的优先级选择MV候选者用于包含在合并候选者列表中。过程900结束于块980。
以上描述的所有技术也可应用于选择MV候选者用于包含在合并候选者列表中。此外,关于32×32CU的实例描述本发明的一些技术和实例。应理解,本文中描述的所有技术可应用于具有含有呈变化数目的行和列的或多或少个像素的CU块的实例。
应认识到,取决于实例,本文中所描述的技术中的任一者的某些动作或事件可以不同顺序来执行,可添加、合并或完全省略(例如,对于实践所述技术,并非所有所描述动作或事件都是必要的)。此外,在某些实例中,可(例如)通过多线程处理、中断处理或多个处理器同时而非依序地执行动作或事件。
在一或多个实例中,描述的功能可用硬件、软件、固件或其任何组合来实施。如果用软件实施,那么所述功能可作为一或多个指令或代码在计算机可读媒体上存储或发射,且可由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体的有形媒体),或包含促进将计算机程序从一处传送到另一处(例如,根据通信协议)的任何媒体的通信媒体。以此方式,计算机可读媒体大体可对应于(1)为非暂时性的有形计算机可读存储媒体,或(2)通信媒体,例如,信号或载波。数据存储媒体可为可由一或多个计算机或一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
以实例说明且非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、闪存或可用来存储呈指令或数据结构的形式的所要的程序代码并且可由计算机存取的任何其它媒体。又,任何连接被恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波的无线技术从网站、服务器或其它远程源发射指令,那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波的无线技术包含在媒体的定义中。然而,应理解,所述计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体,而是取而代之针对非暂时性的有形存储媒体。如本文所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。以上的组合也应包含在计算机可读媒体的范围内。
指令可由一或多个处理器执行,所述一或多个处理器例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效的集成或离散逻辑电路。因此,如本文中所使用的术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。此外,在一些方面,本文中所描述的功能性可在经配置用于编码和解码的专用硬件和/或软件模块内提供,或并入于组合编码解码器中。并且,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可在广泛多种装置或设备中实施,包括无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述的各种组件、模块或单元是为了强调经配置以执行所揭示的技术的装置的功能方面,但未必需要由不同硬件单元实现。相反地,如上所述,各种单元可与合适的软件和/或固件一起组合在编码解码器硬件单元中,或由互操作硬件单元的集合来提供,所述硬件单元包含如上所述的一或多个处理器。
已描述了各种实例。这些和其它实例在所附权利要求书的范围内。

Claims (30)

1.一种经配置以译码视频数据的设备,所述设备包括:
存储器,其经配置以存储多个运动向量候选者,所述多个运动向量候选者中的每一者对应于在并行运动估计区域MER中分割的多个预测单元PU中的至少一者,所述多个运动向量候选者中的每一者包括可用运动数据;以及
与所述存储器通信的处理器,所述处理器经配置以:
选择所述多个运动向量候选者的子集以包含在合并候选者列表中,其中选择是基于所述多个运动向量候选者中的每一者的优先级;以及
产生所述合并候选者列表以包含所述多个运动向量候选者的所述选定子集。
2.根据权利要求1所述的设备,其中所述多个运动向量候选者中的每一者的所述优先级是基于所述运动向量候选者对应于在所述MER中分割的所述多个PU中的任一者的频率,较高频率对应于较高优先级。
3.根据权利要求2所述的设备,其中所述多个运动向量候选者中的每一者的所述优先级进一步基于用于所述多个PU中的每一者的加权因数,所述加权因数取决于每一PU的大小,较大大小对应于较大加权因数。
4.根据权利要求3所述的设备,其中所述多个PU中的每一者的所述加权因数与每一PU的所述大小成正比。
5.根据权利要求2所述的设备,其中:
所述多个运动向量候选者中的每一者包括空间运动向量候选者和时间运动向量候选者中的一者,且
每一空间运动向量候选者的位置位于所述MER外。
6.根据权利要求5所述的设备,其中每一空间运动向量候选者的所述优先级进一步基于取决于所述空间运动向量候选者与对应的PU的相对位置的位置加权因数。
7.根据权利要求6所述的设备,其中对应于用于PU的左位置候选者的空间运动向量候选者具有比用于PU的左上方位置候选者高的位置加权因数。
8.根据权利要求1所述的设备,其中所述处理器经进一步配置以:
针对所述多个运动向量候选者中的每一者确定所述运动向量候选者对于所述多个运动向量候选者中的另一者是否冗余;以及
从所述合并候选者列表排除冗余运动向量候选者。
9.根据权利要求8所述的设备,其中所述处理器经进一步配置以基于运动冗余检查确定所述运动向量候选者是否冗余。
10.根据权利要求8所述的设备,其中:
候选者PU内含有所述运动向量候选者;且
所述处理器经进一步配置以基于所述候选者PU的状态确定所述运动向量候选者冗余。
11.根据权利要求8所述的设备,其中所述处理器经进一步配置以如果所述运动向量候选者具有与所述多个运动向量候选者的所述选定子集中的另一者相同的运动信息,那么确定所述运动向量候选者是冗余的。
12.根据权利要求1所述的设备,其中所述设备包括编码器。
13.根据权利要求1所述的设备,其中所述设备包括解码器。
14.根据权利要求1所述的设备,所述设备进一步包括以下各者中的至少一者:数字电视、数字直播***、无线广播***、个人数字助理PDA、膝上型或台式计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话和包括所述存储器和所述处理器的视频电话会议装置。
15.一种编码视频数据的方法,所述方法包括:
确定与多个运动向量候选者相关联的信息,所述多个运动向量候选者中的每一者对应于在并行运动估计区域MER中分割的多个预测单元PU中的至少一者,所述多个运动向量候选者中的每一者包括可用运动数据;
选择所述多个运动向量候选者的子集以包含在合并候选者列表中,其中选择是基于所述多个运动向量候选者中的每一者的优先级;以及
产生所述合并候选者列表以包含所述多个运动向量候选者的所述选定子集。
16.根据权利要求15所述的方法,其中所述多个运动向量候选者中的每一者的所述优先级是基于所述运动向量候选者对应于在所述MER中分割的所述多个PU中的任一者的频率,较高频率对应于较高优先级。
17.根据权利要求16所述的方法,其中所述多个运动向量候选者中的每一者的所述优先级进一步基于用于所述多个PU中的每一者的加权因数,所述加权因数取决于每一PU的大小,较大大小对应于较大加权因数。
18.根据权利要求17所述的方法,其中所述多个PU中的每一者的所述加权因数与每一PU的所述大小成正比。
19.根据权利要求16所述的方法,其中:
所述多个运动向量候选者中的每一者包括空间运动向量候选者和时间运动向量候选者中的一者,且
每一空间运动向量候选者的位置位于所述MER外。
20.根据权利要求19所述的方法,其中每一空间运动向量候选者的所述优先级进一步基于取决于所述空间运动向量候选者与对应的PU的相对位置的位置加权因数。
21.根据权利要求20所述的方法,其中对应于用于PU的左位置候选者的空间运动向量候选者具有比用于PU的左上方位置候选者高的位置加权因数。
22.根据权利要求15所述的方法,其进一步包括:
针对所述多个运动向量候选者中的每一者确定所述运动向量候选者对于所述多个运动向量候选者中的另一者是否冗余;以及
从所述合并候选者列表排除冗余运动向量候选者。
23.根据权利要求22所述的方法,其中确定所述运动向量候选者是否冗余是基于运动冗余检查。
24.根据权利要求22所述的方法,其中:
候选者PU内含有所述运动向量候选者;且
确定所述运动向量候选者是否冗余是基于所述候选者PU的状态。
25.根据权利要求24所述的方法,其中如果所述候选者PU是在帧内模式中译码,那么确定所述运动向量候选者是冗余的。
26.根据权利要求22所述的方法,其中如果所述运动向量候选者具有与所述多个运动向量候选者的所述选定子集中的另一者相同的运动信息,那么确定所述运动向量候选者是冗余的。
27.一种视频译码设备,所述设备包括:
用于确定与多个运动向量候选者相关联的信息的装置,所述多个运动向量候选者中的每一者对应于在并行运动估计区域MER中分割的多个预测单元PU中的至少一者,所述多个运动向量候选者中的每一者包括可用运动数据;
用于选择所述多个运动向量候选者的子集以包含在合并候选者列表中的装置,其中选择是基于所述多个运动向量候选者中的每一者的优先级;以及
用于产生所述合并候选者列表以包含所述多个运动向量候选者的所述选定子集的装置。
28.根据权利要求27所述的设备,其中所述多个运动向量候选者中的每一者的所述优先级是基于所述运动向量候选者对应于在所述MER中分割的所述多个PU中的任一者的频率,较高频率对应于较高优先级。
29.一种非暂时性计算机可读媒体,其具有存储于其上的代码,所述代码在经执行时使设备:
接收与多个运动向量候选者相关联的信息,所述多个运动向量候选者中的每一者对应于在并行运动估计区域MER中分割的多个预测单元PU中的至少一者,所述多个运动向量候选者中的每一者包括可用运动数据;
选择所述多个运动向量候选者的子集以包含在合并候选者列表中,其中选择是基于所述多个运动向量候选者中的每一者的优先级;以及
产生所述合并候选者列表以包含所述多个运动向量候选者的所述选定子集。
30.根据权利要求29所述的非暂时性计算机可读媒体,其中所述多个运动向量候选者中的每一者的所述优先级是基于所述运动向量候选者对应于在所述MER中分割的所述多个PU中的任一者的频率,较高频率对应于较高优先级。
CN201480064114.0A 2013-12-06 2014-11-14 用于并行运动估计区域的可缩放实施方案 Pending CN105814895A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/099,800 2013-12-06
US14/099,800 US9432685B2 (en) 2013-12-06 2013-12-06 Scalable implementation for parallel motion estimation regions
PCT/US2014/065757 WO2015084567A1 (en) 2013-12-06 2014-11-14 Scalable implementation for parallel motion estimation regions

Publications (1)

Publication Number Publication Date
CN105814895A true CN105814895A (zh) 2016-07-27

Family

ID=52469891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480064114.0A Pending CN105814895A (zh) 2013-12-06 2014-11-14 用于并行运动估计区域的可缩放实施方案

Country Status (7)

Country Link
US (1) US9432685B2 (zh)
EP (1) EP3078197A1 (zh)
JP (1) JP6426184B2 (zh)
KR (1) KR20160095098A (zh)
CN (1) CN105814895A (zh)
BR (1) BR112016012826A2 (zh)
WO (1) WO2015084567A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109644272A (zh) * 2016-09-06 2019-04-16 高通股份有限公司 用于建构候选列表的几何型优先级
CN110719488A (zh) * 2018-07-13 2020-01-21 腾讯美国有限责任公司 视频解码的方法和装置、计算机设备及存储介质
CN110832869A (zh) * 2019-01-02 2020-02-21 深圳市大疆创新科技有限公司 用于视频编码或解码的运动信息获取方法与装置
CN110944184A (zh) * 2018-09-25 2020-03-31 华为技术有限公司 视频解码方法及视频解码器

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107197272B (zh) 2011-08-29 2019-12-06 苗太平洋控股有限公司 以合并模式对图像编码的方法
KR102278501B1 (ko) 2011-10-18 2021-07-16 엘지전자 주식회사 인트라 예측 방법 및 그 장치
EP3085085A4 (en) * 2014-01-29 2017-11-08 MediaTek Inc. Method and apparatus for adaptive motion vector precision
US9854261B2 (en) * 2015-01-06 2017-12-26 Microsoft Technology Licensing, Llc. Detecting markers in an encoded video signal
CN108293131B (zh) 2015-11-20 2021-08-31 联发科技股份有限公司 基于优先级运动矢量预测子推导的方法及装置
CN105763600B (zh) * 2016-01-29 2019-06-18 华南理工大学 一种Cache支持的粒通信***及其粒通信方法
US10560718B2 (en) * 2016-05-13 2020-02-11 Qualcomm Incorporated Merge candidates for motion vector prediction for video coding
CN107820038A (zh) * 2017-06-06 2018-03-20 深圳市维海德技术股份有限公司 视频传输方法、视频接收设备及图像采集设备
WO2019164031A1 (ko) 2018-02-22 2019-08-29 엘지전자 주식회사 영상 코딩 시스템에서 블록 분할 구조에 따른 영상 디코딩 방법 및 장치
WO2020009960A1 (en) * 2018-07-02 2020-01-09 Futurewei Technologies, Inc. Method and apparatus for motion vector prediction
US10735763B2 (en) * 2018-07-27 2020-08-04 Tencent America LLC Method and apparatus for motion vector prediction using spatial and temporal combination
WO2020044253A1 (en) 2018-08-28 2020-03-05 Beijing Bytedance Network Technology Co., Ltd. Redundancy removal of partitioning methods
CN114205593B (zh) * 2018-09-14 2022-07-08 北京达佳互联信息技术有限公司 用于视频编码的方法和装置及用于视频解码的方法和装置
MX2021003247A (es) * 2018-09-22 2021-05-12 Lg Electronics Inc Metodo y aparato para procesar se?ales de video usando inter prediccion.
CN111010571B (zh) 2018-10-08 2023-05-16 北京字节跳动网络技术有限公司 组合仿射Merge候选的生成和使用
WO2020192726A1 (en) 2019-03-27 2020-10-01 Beijing Bytedance Network Technology Co., Ltd. History-based motion vector prediction
KR20220016839A (ko) 2019-06-04 2022-02-10 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 기하학적 분할 모드 코딩을 갖는 모션 후보 리스트
EP3963890A4 (en) 2019-06-04 2022-11-02 Beijing Bytedance Network Technology Co., Ltd. BUILDING A LIST OF MOVEMENT CANDIDATES USING NEIGHBOR BLOCK INFORMATION
EP3967040A4 (en) 2019-06-06 2022-11-30 Beijing Bytedance Network Technology Co., Ltd. CONSTRUCTION OF MOTION CANDIDATE LISTS FOR VIDEO ENCODING
EP3984215A4 (en) 2019-07-14 2022-08-24 Beijing Bytedance Network Technology Co., Ltd. TRANSFORM BLOCK SIZE RESTRICTION IN VIDEO CODING
WO2021057996A1 (en) 2019-09-28 2021-04-01 Beijing Bytedance Network Technology Co., Ltd. Geometric partitioning mode in video coding

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120257678A1 (en) * 2011-04-11 2012-10-11 Minhua Zhou Parallel Motion Estimation in Video Coding
CN102835113A (zh) * 2010-04-09 2012-12-19 Lg电子株式会社 处理视频信号的方法和设备
CN102934434A (zh) * 2010-07-12 2013-02-13 联发科技股份有限公司 时间运动矢量预测的方法与装置
CN103139564A (zh) * 2011-11-23 2013-06-05 数码士有限公司 使用不对称分区的公共合并候选组编码/解码视频的方法
CN103202014A (zh) * 2010-11-23 2013-07-10 联发科技股份有限公司 空间运动向量预测的方法及其装置
US20130188720A1 (en) * 2012-01-24 2013-07-25 Qualcomm Incorporated Video coding using parallel motion estimation
CN103238319A (zh) * 2010-11-29 2013-08-07 联发科技股份有限公司 扩展的运动向量预测项的方法及装置
CN103299642A (zh) * 2011-01-07 2013-09-11 Lg电子株式会社 编码和解码图像信息的方法和使用该方法的装置
WO2013155428A1 (en) * 2012-04-12 2013-10-17 Qualcomm Incorporated Common spatial candidate blocks for parallel motion estimation

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112012019560B1 (pt) 2010-02-05 2021-08-24 Telefonaktiebolaget Lm Ericsson Método para gerenciar candidatos a vetor de movimento predito, e, aparelhos de codificação e de decodificação de vídeo
US9866859B2 (en) 2011-06-14 2018-01-09 Texas Instruments Incorporated Inter-prediction candidate index coding independent of inter-prediction candidate list construction in video coding
KR20140004209A (ko) 2011-06-15 2014-01-10 미디어텍 인크. 3d 비디오 코딩에서의 텍스처 이미지 압축 방법 및 장치
CN103621090B (zh) 2011-06-24 2017-09-15 寰发股份有限公司 移除运动向量预测子中冗余的方法与装置
CN107105267B (zh) * 2011-09-23 2020-09-04 株式会社Kt 解码视频信号的方法
AU2012325419B2 (en) 2011-10-19 2015-11-05 Hfi Innovation Inc. Method and apparatus for derivation of motion vector predictor candidate set
US9143802B2 (en) * 2011-10-31 2015-09-22 Qualcomm Incorporated Fragmented parameter set for video coding
JP2013121167A (ja) * 2011-12-09 2013-06-17 Jvc Kenwood Corp 画像符号化装置、画像符号化方法及び画像符号化プログラム
US9800869B2 (en) * 2012-06-15 2017-10-24 Google Technology Holdings LLC Method and apparatus for efficient slice header processing

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102835113A (zh) * 2010-04-09 2012-12-19 Lg电子株式会社 处理视频信号的方法和设备
CN102934434A (zh) * 2010-07-12 2013-02-13 联发科技股份有限公司 时间运动矢量预测的方法与装置
CN103202014A (zh) * 2010-11-23 2013-07-10 联发科技股份有限公司 空间运动向量预测的方法及其装置
CN103238319A (zh) * 2010-11-29 2013-08-07 联发科技股份有限公司 扩展的运动向量预测项的方法及装置
CN103299642A (zh) * 2011-01-07 2013-09-11 Lg电子株式会社 编码和解码图像信息的方法和使用该方法的装置
US20120257678A1 (en) * 2011-04-11 2012-10-11 Minhua Zhou Parallel Motion Estimation in Video Coding
CN103139564A (zh) * 2011-11-23 2013-06-05 数码士有限公司 使用不对称分区的公共合并候选组编码/解码视频的方法
US20130188720A1 (en) * 2012-01-24 2013-07-25 Qualcomm Incorporated Video coding using parallel motion estimation
WO2013155428A1 (en) * 2012-04-12 2013-10-17 Qualcomm Incorporated Common spatial candidate blocks for parallel motion estimation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MCCANN K ET AL: "High Efficiency Video Coding (HEVC) Test Mode 12(HM12)Encoder Description", 《JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109644272A (zh) * 2016-09-06 2019-04-16 高通股份有限公司 用于建构候选列表的几何型优先级
CN109644272B (zh) * 2016-09-06 2021-10-22 高通股份有限公司 用于建构候选列表的几何型优先级
CN110719488A (zh) * 2018-07-13 2020-01-21 腾讯美国有限责任公司 视频解码的方法和装置、计算机设备及存储介质
CN110719488B (zh) * 2018-07-13 2022-03-25 腾讯美国有限责任公司 视频解码的方法和装置、计算机设备及存储介质
CN110944184A (zh) * 2018-09-25 2020-03-31 华为技术有限公司 视频解码方法及视频解码器
CN110944184B (zh) * 2018-09-25 2022-05-31 华为技术有限公司 视频解码方法及视频解码器
CN110832869A (zh) * 2019-01-02 2020-02-21 深圳市大疆创新科技有限公司 用于视频编码或解码的运动信息获取方法与装置
WO2020140218A1 (zh) * 2019-01-02 2020-07-09 深圳市大疆创新科技有限公司 用于视频编码或解码的运动信息获取方法与装置

Also Published As

Publication number Publication date
EP3078197A1 (en) 2016-10-12
JP2017504243A (ja) 2017-02-02
US20150163506A1 (en) 2015-06-11
BR112016012826A2 (pt) 2017-08-08
JP6426184B2 (ja) 2018-11-21
KR20160095098A (ko) 2016-08-10
US9432685B2 (en) 2016-08-30
WO2015084567A1 (en) 2015-06-11

Similar Documents

Publication Publication Date Title
CN105814895A (zh) 用于并行运动估计区域的可缩放实施方案
CN104704833B (zh) 多视图或3维视频译码中的高级视图间残差预测
CN107211156B (zh) 一种译码视频数据的方法、装置及计算机可读存储媒体
CN105580372B (zh) 用于3d视频译码的组合式双向预测合并候选者
CN105393536B (zh) 使用位移向量从预测性块的帧内预测
CN104170380B (zh) 视频译码中的视差矢量预测
CN104365105B (zh) 视频译码中的外部图片
CN105874797B (zh) 视频数据的编解码方法、装置、设备和存储媒体
CN103947207B (zh) 用于图片分割方案的统一设计
CN104170381B (zh) 在高效率视频译码及其扩展中的运动矢量译码及双向预测
CN103797799B (zh) 用于视频译码的运动向量确定
CN103828374B (zh) 参考图片信令和经解码图片缓冲器管理
CN103650505B (zh) 视频译码中的运动向量预测
CN109891890A (zh) 视频译码中基于子pu的双向运动补偿
CN104756499B (zh) 用于视频译码的方法、设备及计算机可读存储媒体
CN104365106B (zh) 发信用于视频译码的长期参考图片的数据
CN104662920B (zh) 在视频译码中长期参考图片的发信
CN110024401A (zh) 用于时间扩缩性支持的修改适应性环路滤波器时间预测
CN107211144A (zh) 用于预测残差的增强型多重变换
CN109792533A (zh) 在视频译码中用于仿射运动模型的运动向量预测
CN110024403A (zh) 用于视频译码的仿射运动模型的运动向量生成
CN110100436A (zh) 使用导出色度模式译码视频数据
CN104272742B (zh) 加权预测参数译码
CN109716774A (zh) 用于视频译码的可变数目的帧内模式
CN108141596A (zh) 用于视频译码的非可分离二次变换

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20190903

AD01 Patent right deemed abandoned