CN103718551A - 在视频译码中用信号发出图片大小 - Google Patents

在视频译码中用信号发出图片大小 Download PDF

Info

Publication number
CN103718551A
CN103718551A CN201280035512.0A CN201280035512A CN103718551A CN 103718551 A CN103718551 A CN 103718551A CN 201280035512 A CN201280035512 A CN 201280035512A CN 103718551 A CN103718551 A CN 103718551A
Authority
CN
China
Prior art keywords
decoding unit
picture
size
unit size
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280035512.0A
Other languages
English (en)
Other versions
CN103718551B (zh
Inventor
陈盈
马尔塔·卡切维奇
王益魁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN103718551A publication Critical patent/CN103718551A/zh
Application granted granted Critical
Publication of CN103718551B publication Critical patent/CN103718551B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明提供一种视频编码器,其经配置以确定包含于视频序列中的一个或一个以上图片的图片大小。与所述视频序列相关联的所述图片大小可为所述视频序列的对准译码单元大小的倍数。在一个实例中,所述视频序列的所述对准译码单元大小可包括最小译码单元大小,其中所述最小译码单元大小是选自对应于所述视频序列中的不同图片的多个最小的译码单元大小。一种视频解码器经配置以获得语法元素以便确定所述视频序列的所述图片大小和所述对准译码单元大小。所述视频解码器以所述图片大小解码包含于所述视频序列中的所述图片,且将所述经解码图片存储于经解码图片缓冲器中。

Description

在视频译码中用信号发出图片大小
本申请案主张以下各者的权利:
2011年7月17日申请的第61/508,659号美国临时申请案;
2011年9月2日申请的第61/530,819号美国临时申请案;以及
2011年10月20日申请的第61/549,480号美国临时申请案,以上各案中的每一者的全部内容在此以引用的方式并入本文中。
技术领域
本发明涉及视频译码领域。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播***、无线广播***、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流装置等等。数字视频装置实施视频压缩技术,例如以下各者中所描述的那些视频压缩技术:由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4(第10部分、高级视频译码(AVC))定义的标准、目前正在开发的高效视频译码(HEVC)标准,和所述标准的扩展。视频装置可通过实施所述视频压缩技术而更有效率地发射、接收、编码、解码及/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测及/或时间(图片间)预测以减少或去除视频序列中固有的冗余。对于基于块的视频译码,可将视频切片(即,视频帧或视频帧的一部分)分割为视频块,所述视频块也可称作树块、译码单元(CU)和/或译码节点。使用相对于同一图片中的相邻块中的参考样本的空间预测来编码图片的经帧内译码(I)切片中的视频块。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可称作帧,且参考图片可称作参考帧。
空间或时间预测产生用于待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。经帧间译码块是根据指向形成预测性块的参考样本的块的运动向量进行编码,且残余数据指示经译码块与预测性块之间的差。经帧内译码块是根据帧内译码模式和残余数据进行编码。为了进行进一步压缩,可将残余数据从像素域变换到变换域,从而产生可接着进行量化的残余变换系数。可扫描最初以二维阵列布置的经量化的变换系数以便产生变换系数的一维向量,且可应用熵译码以实现更多压缩。
发明内容
一股来说,本发明描述用于译码包含于视频序列的图片或帧中的视频数据的技术。明确地说,本发明描述可基于所述视频序列的对准译码单元大小来译码所述视频序列中的一群组图片的图片大小的技术。所述视频序列的所述对准译码单元大小可选自所述视频译码方案所支持的若干可能译码单元大小。本发明的技术包含用信号发出所述视频序列中的所述图片中的一者或一者以上的对准译码单元大小,以及将所述一个或一个以上图片的大小译码为最小译码单元的倍数。
在本发明的一个实例中,一种用于编码视频数据的方法包括:确定定义视频序列的多个图片中的每一者的最小译码单元大小,其中最小译码单元大小是选自包含最大的可能译码单元大小的多个可能译码单元大小;基于所述多个可能译码单元大小来确定所述视频序列的对准译码单元大小;确定与所述视频序列相关联的图片大小,其中与所述视频序列相关联的所述图片大小为所述对准译码单元大小的倍数;以及在序列层级语法信息中用信号发出所述对准译码单元大小值。
在另一实例中,一种解码视频数据的方法包括:获得经译码的视频序列,所述经译码的视频序列包含使用第一最小译码单元大小译码的第一图片和使用第二最小译码单元大小译码的第二图片;获得待存储于经解码图片缓冲器中的经解码图片的图片大小,其中所述图片大小为所述第一译码单元大小、所述第二译码单元大小或最大译码单元大小中的一者的倍数;以及将所述经解码图片存储于经解码图片缓冲器中。
在另一实例中,一种用于编码视频数据的设备包括视频编码装置,所述视频编码装置经配置以进行以下操作:确定定义视频序列的多个图片中的每一者的最小译码单元大小,其中最小译码单元大小是选自包含最大的可能译码单元大小的多个可能译码单元大小;基于所述多个可能译码单元大小来确定所述视频序列的对准译码单元大小;确定与所述视频序列相关联的图片大小,其中与所述视频序列相关联的所述图片大小为所述对准译码单元大小的倍数;以及在序列层级语法信息中用信号发出所述对准译码单元大小值。
在另一实例中,一种用于解码视频数据的设备包括视频解码装置,所述视频解码装置经配置以进行以下操作:获得经译码的视频序列,所述经译码的视频序列包含使用第一最小译码单元大小译码的第一图片和使用第二最小译码单元大小译码的第二图片;获得待存储于经解码图片缓冲器中的经解码图片的图片大小,其中所述图片大小为所述第一译码单元大小、所述第二译码单元大小或最大译码单元大小中的一者的倍数;以及将所述经解码图片存储于经解码图片缓冲器中。
在另一实例中,一种用于编码视频数据的装置包括:用于确定定义视频序列的多个图片中的每一者的最小译码单元大小的装置,其中最小译码单元大小是选自包含最大的可能译码单元大小的多个可能译码单元大小;用于基于所述多个可能译码单元大小来确定所述视频序列的对准译码单元大小的装置;用于确定与所述视频序列相关联的图片大小的装置,其中与所述视频序列相关联的所述图片大小为所述对准译码单元大小的倍数;以及用于在序列层级语法信息中用信号发出所述对准译码单元大小值的装置。
在另一实例中,一种用于解码视频数据的装置包括:用于获得经译码的视频序列的装置,所述经译码的视频序列包含使用第一最小译码单元大小译码的第一图片和使用第二最小译码单元大小译码的第二图片;用于获得待存储于经解码图片缓冲器中的经解码图片的图片大小的装置,其中所述图片大小为所述第一译码单元大小、所述第二译码单元大小或最大译码单元大小中的一者的倍数;以及用于将所述经解码图片存储于经解码图片缓冲器中的装置。
在另一实例中,一种计算机可读存储媒体包括存储于其上的指令,所述指令在经执行时致使用于编码视频数据的装置的处理器进行以下操作:确定定义视频序列的多个图片中的每一者的最小译码单元大小,其中最小译码单元大小是选自包含最大的可能译码单元大小的多个可能译码单元大小;基于所述多个可能译码单元大小来确定所述视频序列的对准译码单元大小;确定与所述视频序列相关联的图片大小,其中与所述视频序列相关联的所述图片大小为所述对准译码单元大小的倍数;以及在序列层级语法信息中用信号发出所述对准译码单元大小值。
在另一实例中,一种计算机可读存储媒体包括存储于其上的指令,所述指令在经执行时致使用于解码视频数据的装置的处理器进行以下操作:获得经译码的视频序列,所述经译码的视频序列包含使用第一最小译码单元大小译码的第一图片和使用第二最小译码单元大小译码的第二图片;获得待存储于经解码图片缓冲器中的经解码图片的图片大小,其中所述图片大小为所述第一译码单元大小、所述第二译码单元大小或最大译码单元大小中的一者的倍数;以及将所述经解码图片存储于经解码图片缓冲器中。
一个或一个以上实例的细节陈述于随附图式和以下描述中。其它特征、目标及优势将从所述描述和所述图式以及从权利要求书显而易见。
附图说明
图1为说明实例视频编码及解码***的框图。
图2为说明可实施本发明中所描述的技术的实例视频编码器的框图。
图3为说明用于根据本发明的技术来编码视频数据的实例技术的流程图。
图4为说明可实施本发明中所描述的技术的实例视频解码器的框图。
图5为说明用于根据本发明的技术来解码视频数据的实例技术的流程图。
具体实施方式
视频序列可包含一群组图片。图片群组中的每一图片可具有最小译码单元大小。在一个实例中,所述最小译码单元大小可为具有以下像素或样本尺寸中的一者的矩形或正方形:4个像素、8个像素、16个像素、32个像素及64个像素。为了增加视频序列的译码效率,确定视频序列的最小译码单元大小且指定图片群组的图片大小可为有用的,其中图片大小为视频序列的最小译码单元大小的最小值的倍数。
图1为说明可实施本发明的技术的视频编码及解码***10的一个实例的框图。如图1中所展示,***10包含源装置12,源装置12经由通信信道15将经编码视频发射到目的地装置16。源装置12和目的地装置16可包括广泛范围的装置中的任一者。在一些情况下,源装置12和目的地装置16可包括无线通信装置手机,例如所谓的蜂窝式或卫星无线电电话等。然而,可将一股应用于编码及解码的本发明的技术应用于包含视频编码及/或解码能力的非无线装置。源装置12和目的地装置16仅仅为可支持本文中所描述的技术的译码装置的实例。
在图1的实例中,源装置12可包含视频源20、视频编码器22、调制器/解调器(调制解调器)23和发射器24。目的地装置16可包含接收器26、调制解调器27、视频解码器28和显示装置30。
视频源20可包括视频俘获装置,例如视频摄影机、含有先前所俘获视频的视频存档、来自视频内容提供者或另一视频源的视频馈入等。作为另一替代例,视频源20可产生作为源视频的基于计算机图形的数据,或实况视频、经存档视频及计算机产生的视频的组合。在一些情况下,如果视频源20为视频摄影机,那么源装置12和目的地装置16可形成所谓的照相手机或视频电话。在每一种情况下,可由视频编码器22来编码所俘获、预先俘获或计算机产生的视频。
在一些实例(但并非所有情况)中,一旦由视频编码器22编码了视频数据,就可接着由调制解调器23根据通信标准来调制经编码的视频信息,所述通信标准例如码分多址(CDMA)、正交频分多路复用(OFDM)或任何其它通信标准或技术。经编码且经调制的数据可接着经由发射器24而发射到目的地装置16。调制解调器23可包含各种混频器、滤波器、放大器或经设计以用于信号调制的其它组件。发射器24可包含经设计以用于发射数据的电路,所述电路包含放大器、滤波器及一个或一个以上天线。目的地装置16的接收器26经由信道15接收信息,且调制解调器27解调制所述信息。由视频解码器28执行的视频解码过程可包含与由视频编码器22执行的编码技术互逆的技术。
通信信道15可包括任何无线或有线通信媒体(例如射频(RF)频谱或一个或一个以上物理传输线,或无线与有线媒体的任何组合)。通信信道15可形成基于包的网络(例如,局域网、广域网或例如因特网等全球网络)的部分。通信信道15一股表示用于将视频数据从源装置12发射到目的地装置16的任何合适通信媒体或不同通信媒体的集合。此外,图1仅仅为实例,且本发明的技术可适用于未必包含编码装置与解码装置之间的任何数据通信的视频译码设置(例如,视频编码或视频解码)。在其它实例中,可从本地存储器检索数据,经由网络流式传输数据等等。编码装置可编码数据且将数据存储到存储器,及/或解码装置可从存储器检索及解码数据。在许多情况下,编码及解码是由非相关装置执行,所述非相关装置彼此不通信,而是仅将数据编码到存储器及/或从存储器检索及解码数据。举例来说,在编码视频数据之后,可将视频数据包化以用于发射或存储。可遵照多种标准中的任一者(例如,国际标准化组织(ISO)基础媒体文件格式及其扩展(例如AVC等))将视频数据汇编成视频文件。
在一些情况下,视频编码器22和视频解码器28可实质上根据例如新兴HEVC标准等视频压缩标准进行操作。然而,本发明的技术也可在多种其它视频译码标准的情境中应用,包含一些旧标准或新的或新兴标准。虽然未展示于图1中,但在一些情况下,视频编码器22和视频解码器28可各自与音频编码器和解码器集成,且可包含适当MUX-DEMUX单元或其它硬件和软件以处置共同数据流或单独数据流中的音频和视频两者的编码。在适用的情况下,MUX-DEMUX单元可遵照ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
视频编码器22和视频解码器28各自可实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其组合。视频编码器22和视频解码器28中的每一者可包含于一个或一个以上编码器或解码器中,编码器或解码器中的任一者可集成为各别移动装置、用户装置、广播装置、服务器等等中的组合式编码器/解码器(CODEC)的部分。在本发明中,术语译码器指编码器、解码器或CODEC,且术语译码器、编码器、解码器及CODEC皆指经设计用于符合本发明的视频数据的译码(编码及/或解码)的特定机器。在本发明中,术语“译码”可指编码及/或解码中的任一者或两者。
在一些情况下,源装置12和目的地装置16可以实质上对称的方式操作。举例来说,源装置12和目的地装置16中的每一者可包含视频编码及解码组件。因此,***10可支持源装置12与目的地装置16之间的单向或双向视频发射(例如,以用于视频流式传输、视频播放、视频广播或视频电话)。
视频编码器22和视频解码器28可执行预测性译码,其中将正被译码的视频块与一个或一个以上预测性候选者进行比较以便识别预测性块。视频块可存在于个别视频帧或图片(或其它独立定义的视频单元,例如切片等)内。可将帧、切片、帧的部分、图片群组或其它数据结构定义为包含视频块的视频信息单元。预测性译码的过程可为帧内的(在所述情况下,预测性数据是基于同一视频帧或切片内的相邻帧内数据产生)或帧间的(在所述情况下,预测性数据是基于先前或后续帧或切片中的视频数据产生)。视频编码器22和视频解码器28可支持若干不同预测性译码模式。视频编码器22可选择所要视频译码模式。在预测性译码中,在识别预测性块之后,将正被译码的当前视频块与所述预测性块之间的差译码为残余块,且将预测语法(例如,在帧间译码的情况下的运动向量,或在帧内译码的情况下的预测性模式)用以识别预测性块。在一些情况下,可将残余块变换及量化。变换技术可包括DCT过程或概念上类似的过程、整数变换、小波变换或其它类型的变换。在DCT过程中,作为实例,变换过程将像素值(例如,残余像素值)的集合转换成变换系数,所述变换系数可表示在频域中的像素值的能量。视频编码器22和视频解码器28可将量化应用于变换系数。量化一股地涉及限制与任一给定变换系数相关联的位的数目的过程。
在变换及量化之后,视频编码器22和视频解码器28可对经量化且经变换的残余视频块执行熵译码。作为编码过程的部分,视频编码器22可产生将由视频解码器28在解码过程中使用的语法元素。视频编码器22也可熵编码语法元素且在经编码的位流中包含语法元素。一股来说,熵译码包括共同地压缩一序列经量化的变换系数和/或其它语法信息的一个或一个以上过程。视频编码器22和视频解码器28可对经量化的变换系数执行扫描技术以便根据二维视频块定义系数的一个或一个以上串行化一维向量。接着可(例如)经由上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进位算术译码(CABAC)或另一熵译码过程来熵译码经扫描的系数连同任何语法信息。
在一些实例中,作为编码过程的部分,视频编码器22可解码经编码的视频块以便产生用于后续视频块的后续基于预测的译码的视频数据。此过程时常被称作编码过程的解码回路,且一股地模拟由解码器装置执行的解码。在编码器或解码器的解码回路中,可使用滤波技术以改善视频质量,且(例如)使像素边界平滑且有可能从经解码视频去除假影。此滤波可为回路内滤波或回路后滤波。在回路内滤波的情况下,经重建构的视频数据的滤波发生于译码回路中,此意谓经滤波的数据由编码器或解码器存储以供随后用于预测后续图像数据。与此对比,在回路后滤波的情况下,经重建构的视频数据的滤波发生于译码回路之外,此意谓数据的未经滤波版本由编码器或解码器存储以供随后用于预测后续图像数据。回路滤波时常在单独解块滤波过程之后,所述解块滤波过程通常将滤波应用于在邻近视频块的边界上或附近的像素以便去除出现于视频块边界处的方块效应假影。
目前正进行努力以开发新的视频译码标准,目前称作高效视频译码(HEVC)。所述即将到来的标准也称作H.265。HEVC标准的新近草案(称作“HEVC工作草案3”或“WD3”)描述于伟根(Wiegand)等人的文献JCTVC-E603“高效视频译码(HEVC)文本规范草案3(High efficiency video coding(HEVC)text specification draft3)”(ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11的视频译码联合协作小组(JCT-VC),第五次会议:日内瓦,瑞士联邦,2011年3月16日到23日)中,所述文献的全部内容在此以引用的方式并入本文中。所述标准化努力是基于称作HEVC测试模型(HM)的视频译码装置的模型。所述HM假定超越经配置以根据ITU-T H.264/AVC来译码视频数据的装置的视频译码装置的若干能力。举例来说,尽管H.264提供九个帧内预测编码模式,但HM提供多达三十四个帧内预测编码模式。视频编码器22可对符合HEVC标准和HEVC测试模型的视频数据的块进行操作。
HEVC标准包含视频数据的块的特定术语和块大小。明确地说,HEVC包含以下术语:最大译码单元(LCU)、译码单元(CU)、预测单元(PU)和变换单元(TU)。在本发明的意义内,LCU、CU、PU和TU皆为视频块。本发明也使用术语块来指LCU、CU、PU或TU中的任一者。在HEVC中,可在LCU层级、CU层级、PU层级和TU层级定义语法元素。在HEVC中,LCU指最大大小的译码单元,其为在给定情形下所支持的就像素数目来说的最大译码单元。一股来说,在HEVC中,除了CU不具有大小区别外,CU具有与H.264的宏块类似的用途。因此,可将CU***为子CU且可将LCU分割为较小CU。另外,出于预测的目的,可将CU分割为预测单元(PU)。PU可表示对应CU的全部或一部分,且可包含用于检索PU的参考样本的数据。PU可具有正方形或矩形形状。TU表示像素差值或像素残余的集合,其可经变换以产生可经量化的变换系数。在HEVC标准中,变换并非固定的,而是根据变换单元(TU)大小进行定义,所述变换单元(TU)大小可为与给定CU相同的大小,或有可能更小。
在HEVC中,LCU可与四叉树数据结构相关联。另外,在一些实例中,可使用四叉树分割方案将对应于CU的残余样本再分为更小单元,所述四叉树分割方案包含称为“残余四叉树”(RQT)的四叉树结构。一股来说,四叉树数据结构包含每一CU一个节点,其中根节点可对应于LCU。举例来说,CU0可指LCU,且CU1到CU4可包括LCU的子CU。如果CU被***为四个子CU,那么对应于所述CU的节点包含四个叶节点,所述四个叶节点中的每一者对应于所述子CU中的一者。四叉树数据结构的每一节点可提供对应CU的语法数据。举例来说,四叉树中的节点可包含CU层级语法中的***旗标以指示对应于所述节点的CU是否被***为子CU。可递归地定义CU的语法元素,且语法元素可取决于CU是否被***为子CU。如果CU未被进一步***,那么将其称作叶CU。在本发明中,也可将叶CU的4个子CU称作叶CU,但不存在原始叶CU的显式***。举例来说,如果16×16大小的CU不进一步***,那么四个8×8子CU也将称作叶CU,尽管所述16×16CU从未***过。
RQT的叶节点或叶CU可对应于TU。即,叶CU可包含四叉树,其指示所述叶CU如何分割为TU。叶CU可包含一个或一个以上变换单元(TU)。本发明可将指示如何分割LCU的四叉树称作CU四叉树,且将指示如何将叶CU分割为TU的四叉树称作TU四叉树。TU四叉树的根节点一股地对应于叶CU,而CU四叉树的根节点一股地对应于LCU。TU四叉树的未经***的TU称作叶TU。***旗标可指示叶CU是否***为四个变换单元。接着,可进一步将每一变换单元***为4个子TU。当TU不被进一步***时,其可称作叶TU。
另外,叶节点或叶CU可包含一个或一个以上预测单元(PU)。举例来说,当PU经帧间模式编码时,PU可包含定义PU的运动向量的数据。定义运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考帧,和/或运动向量的参考列表(例如,列表0或列表1)。叶CU的定义PU的数据也可描述(例如)将CU分割为一个或一个以上PU。分割模式可取决于CU是未经译码、经编码的帧内预测模式还是经编码的帧间预测模式而不同。对于帧内译码,可将PU视为与以下所描述的叶变换单元相同。
一股来说,对于HEVC中的帧内译码,属于叶CU的所有叶TU共享同一帧内预测模式。即,一股地应用同一帧内预测模式以计算叶CU的所有TU的经预测值。对于帧内译码,视频编码器22可使用帧内预测模式来计算每一叶TU的残余值,作为对应于TU的预测值的部分与原始块之间的差。可变换、量化及扫描所述残余值。对于HEVC中的帧间译码,视频编码器22可在PU层级执行预测,且可计算每一PU的残余。可变换、量化及扫描对应于叶CU的残余值。对于帧间译码,叶TU可大于或小于PU。对于帧内译码,PU可与对应的叶TU并置。在一些实例中,叶TU的最大大小可为对应的叶CU的大小。
如以上所描述,HEVC标准允许根据变换单元(TU)的变换,对于不同CU来说,所述变换单元(TU)可不同。通常基于针对经分割LCU定义的给定CU内的PU的大小确定TU的大小,但可能并非总是如此情况。TU通常与PU大小相同或小于PU。与TU相关联的像素差值可经变换以产生变换系数,所述变换系数可经量化。另外,可根据在LCU层级定义的量化参数(QP)应用量化。因此,可将相同级别的量化应用于与LCU内的CU的不同PU相关联的TU中的所有变换系数。然而,不同于用信号发出QP自身,可随LCU用信号发出QP的改变或差(即,差量)以指示QP相对于先前LCU的QP的改变。
视频编码器22可通过将根据HEVC标准定义的LCU、CU、PU和TU用作视频译码信息的单元而执行图片、帧、切片、帧的部分、图片的群组或其它视频数据的视频编码。
举例来说,视频编码器22可编码包括最大译码单元(LCU)的视频数据的一个或一个以上图片,其中LCU是根据四叉树分割方案分割为块大小的经译码单元(CU)的集合。视频编码器22和视频解码器28可使用具有符合HEVC标准的不同大小的CU。举例来说,视频编码器22可使用64×64、32×32、16×16、8×8和4×4像素的可能CU大小。对于给定视频序列,视频编码器22可针对视频序列中的所有图片使用64×64像素的最大CU大小,而同时可使用4×4像素的最小可能CU大小来编码视频序列中的一些图片而可使用8×8像素的最小CU大小来编码视频序列中的其它图片。
如以上所描述,本发明中对CU的引用可指图片的最大译码单元或LCU的子CU。视频编码器22可将LCU***为子CU,且每一子CU可进一步***为子CU。视频编码器22可包含用于位流的语法数据,所述语法数据经定义以指示分割LCU的最大次数。***LCU的次数可称作CU深度。
另外,视频编码器22也可定义用于视频序列中的每一图片的最小译码单元(SCU)。SCU可指在若干可能CU大小可用时用以译码图片的最小译码单元。举例来说,视频编码器22可经配置以使用可能CU大小64×64、32×32、16×16、8×8和4×4像素中的一者来编码视频序列中的图片。在一个实例中,可使用相同SCU大小(例如,4×4像素或8×8像素)来编码视频序列中的所有图片。在其它实例中,可使用4×4像素的SCU大小来编码视频序列中的一些图片,而同时可使用8×8像素的SCU大小来编码视频序列中的其它图片。因此,在此实例中,视频序列中的图片可具有4×4像素和8×8像素的各别SCU,即,SCU大小可在帧间改变。视频编码器22可确定视频序列的最小SCU或最大SCU。在此实例中,最小SCU将为4×4,而最大SCU将为8×8。
视频编码器22可包含位流内的各种层级的语法数据,所述语法数据定义LCU、CU、PU、TU和SCU的大小。举例来说,视频编码器22可使用序列层级语法来用信号发出LCU的大小。
除了用信号发出用以编码视频序列中的图片的CU的大小以外,视频编码器22也可使用各种技术用信号发出视频序列中的图片的大小。与视频序列相关联的图片的大小可等于存储于经解码图片缓冲器(DPB)中的经解码图片的图片大小。图片可具有单位大小,例如,具有选定高度和宽度的块。图片大小可为由HEVC或另一视频标准支持的图片大小,例如,图片大小可包含320×240、1920×1080和7680×4320。另外,视频编码器22可用信号发出用于译码切片标头中的纹理视图分量的语法元素。因此,视频编码器22可使用各种语法元素来用信号发出与视频序列相关联的图片的大小和/或与所述视频序列相关联的最小的最小译码单元大小。同样,视频解码器28可获得指示与经译码的视频序列相关联的图片的大小和/或与所述经译码的视频序列相关联的最小的最小译码单元大小的各种语法元素,且将此类语法元素用于解码经译码的视频序列。在一个实例中,视频编码器22可在序列层级语法信息中用信号发出与视频序列相关联的最小的最小译码单元大小和图片的大小,其中所述图片大小为最小的最小译码单元大小的倍数。在一个实例中,视频解码器28可获得包含一个或一个以上经译码图片的经译码的视频序列,和在序列层级语法信息中的针对所述视频序列的最小的最小译码单元大小。视频解码器28可解码经译码的视频序列中的经译码图片,且以等于最小的最小译码单元大小的倍数的图片大小将经解码图片存储于经解码图片缓冲器中。
在利用固定大小的宏块(例如,16×16)的一些视频压缩技术中,可以宏块为单位来用信号发出图片的大小。当宽度或高度不等于固定大小的宏块的倍数时,可使用裁剪窗。举例来说,1920×1080图片可在位流中经译码为1920×1088,但裁剪窗用信号通知真实窗以使得所述图片显示为1920×1080。在其它技术中,可以像素为单位用信号发出图片的大小。以像素为单位用信号发出图片的大小的一个实例是由HEVC标准提供。
在一个实例中,视频编码器22和视频解码器28可译码视频数据,其中根据经译码单元(CU)的特定类型来定义图片序列中的经译码图片的大小。如以上所描述,所述特定类型的经译码块可为图片的序列中的每一图片的LCU、SCU、最小的最小CU或最大的最小CU。更具体来说,视频编码器22可指示用以相对于图片的译码单元(CU)的大小来用信号发出所述图片的大小的单位。在一个实例中,所述单位可等于在经译码的视频序列中所允许的最小CU大小的大小。在一些情况下,对于视频序列中的所有图片来说,最小CU大小为相同的。在其它情况下,视频序列中的每一图片的最小CU大小可不同。在那种情况下,视频序列中的每一图片的最小CU大小可能不小于所述视频序列的最小可能CU大小。在另一实例中,由视频编码器22指示的单位可等于一群组图片的最大译码单元(LCU)的大小。在一些实例中,可由视频编码器22或视频解码器28将裁剪窗应用于图片以减小图片的大小。举例来说,裁剪窗可裁剪图片的右侧或底侧中的至少一者。
在另一实例中,视频编码器22可相对于对准CU(ACU)大小来用信号发出图片大小。对准CU大小可为用以指定存储于经解码图片缓冲器(DPB)中的经解码图片的图片大小的CU大小。此图片大小可具有均为对准CU大小的宽度和高度的倍增的宽度和高度。类似地,图片高度可为对准CU的高度的倍增。可以与在其它替代例中相同的方式用信号发出对准CU的大小(宽度和高度)。举例来说,视频编码器22可在各种语法层级用信号发出对准CU。
可根据以下实例来定义ACU大小:如果视频序列中的所有图片皆具有相同的SCU大小,那么可将ACU定义为SCU大小。另一方面,如果视频序列中的图片具有不同SCU大小,那么可将ACU定义为所有图片当中的最大或最小SCU大小。无关于如何定义ACU,可由视频编码器22在与视频序列相关联的序列参数集(SPS)或图片参数集(PPS)中显式地用信号发出ACU大小。在一些情况下,可限制ACU大小以使得其等于或小于视频序列的LCU大小且等于或大于视频序列的SCU大小。
另外,在一些实例中,视频编码器22可以LCU为单位或以SCU为单位来用信号发出图片大小。在一些实例中,可在SPS中用信号发出用以用信号发出经编码图片的大小的单位。此单位可等于经译码的视频序列所允许的最小CU大小的大小。在PPS中,可由视频编码器22来用信号发出参考此PPS的图片的最小CU大小的相对大小。在视频序列中的所有图片皆具有相同SCU大小的情况下,可不必另外在PPS中用信号发出最小CU的相对大小。在最小CU大小在视频序列中的图片之间变化的情况下,可在PPS中用信号发出视频序列中的图片的一部分的相对最小CU大小,其中所述相对最小CU大小大于视频序列的最小的最小CU。可在PPS中用信号发出相对最小CU大小以作为图片的所述部分的所述相对最小CU大小与视频序列的最小的最小CU大小之间的差。
或者,可由视频编码器22在SPS中以LCU为单位用信号发出图片大小。然而,因为可由视频编码器22进一步用信号发出裁剪窗,所以使用裁剪窗可帮助视频解码器识别图片大小,只要ACU大小已知即可。
或者,当对于视频序列中的图片来说SCU大小变化时,所述单位可等于在经译码的视频序列中的图片中所允许的最大的最小CU大小的大小。在最大CU大小为64×64像素且一些图片具有4×4像素的CU大小而其它图片具有8×8像素的最小CU大小的实例中,图片大小的单位可为8×8像素。在此实例中,如果图片具有64×65像素的大小,那么图片大小将由视频编码器22用信号发出为8×8像素乘9×8像素。可使用帧裁剪语法元素来裁剪图片中的超过64×65像素大小的像素。
在一些实例中,最大CU大小为64×64像素,且一些图片具有4×4像素的最小可能CU大小而同时其它图片具有8×8像素的最小CU大小。对于此实例,如果特定类型的CU为最小可能的最小CU,那么图片大小的单位为4×4像素。继续此实例,如果特定类型的CU为最大可能的最小CU,那么图片大小的单位为8×8像素。
以下表1到7提供了可由视频编码器22和视频解码器28实施以执行本文中所描述的技术的实例语法。实例语法可由视频编码器22和视频解码器28使用硬件、软件、固件或其任何组合来实施。
如以上所描述,视频编码器22可在序列参数集(SPS)中用信号发出用以用信号发出经译码图片的大小的单位。在一个实例中,此单位可等于在经译码的视频序列中所允许的最小CU大小的大小。在此实例中,如果最小CU大小可在经译码的位流中在一群组图片中的图片之间变化,那么最小CU大小将不小于此单位的大小。以下表1提供用以用信号发出视频序列中的经译码图片的最小的最小CU大小的SPS原始字节序列有效负载(RBSP)语法的实例。在图片参数集(PPS)中,可用信号发出参考此PPS的图片的最小CU大小的相对大小。
Figure BDA0000458175990000121
Figure BDA0000458175990000131
表1:序列参数集RBSP语法
在表1中,语法元素log2_max_coding_block_size_minus3可指定译码块的最大大小。变量Log2MaxCUSize可经设置而等于:log2_max_coding_block_size_minus3+3。
在表1中,语法元素log2_diff_max_pic_alligned_min_coding_block_size可指定整个经译码的视频序列中的译码块的最小大小与译码块的最大大小之间的差。在一些情况下,图片的群组可经定义以使得一群组图片中的图片将不具有小于所述差值的最小译码CU大小。
变量Log2SeqMinCUSize可经设置而等于:
log2_minmax_coding_block_size_minus3+3-log2_diff_max_pic_alligned_min_coding_block_size。
此值可在从0到log2_max_coding_block_size_minus3的范围中。变量Log2MaxCUSize和Log2SeqMinCUSize可由视频编码器22和视频解码器28用以进行用于视频译码的处理。
应注意,表1包含以具有删除线的形式出现于表l中的语法元素pic_width_in_luma_samples、pic_height_in_luma_samples和log2_min_coding_block_size_minus3。这些语法元素表示替代实例,其中图片的大小可由视频编码器22以像素为单位用信号发出。在一个实例中(如以上所描述,其中图片大小具有均为ACU大小的宽度和高度的倍增的宽度和高度,其中ACU大小等于视频序列的最小SCU),视频解码器28可基于pic_width_in_luma_samples、pic_height_in_luma_samples的值为log2_min_coding_block_size_minus3的值的整数倍的条件是否成立而确定位流是否合格。
以下表2提供根据可由视频编码器22和视频解码器28执行的技术的SPS RBSP语法的另一实例。
Figure BDA0000458175990000141
Figure BDA0000458175990000151
表2:序列参数集RBSP语法
根据表2,图片的宽度和高度可由视频编码器22相对于对准CU的宽度和高度加以指示。如以上所描述,对准CU可为由视频编码器22和视频解码器28用以指定图片大小的CU。即,图片宽度可为对准CU的宽度的倍增。如以上所描述,对准CU大小可为用以指定存储于经解码图片缓冲器(DPB)中的经解码图片的图片大小的大小。在一些实例中,图片可含有一个或一个以上完整的对准CU。在一些实例中,所述对准CU为对准的最小CU(SCU)。
表2将图片的高度指定为pic_height_in_alligned_scu且将图片的宽度指定为pic_width_in_alligned_scu。pic_width_in_alligned_cu可以对准CU为单位指定经译码的视频序列中的图片的宽度。pic_height_in_alligned_cu可以对准CU为单位指定经译码的视频序列中的图片的高度。
log2_max_coding_block_size_minus3可指定译码块的最大大小。变量Log2MaxCUSize可经设置而等于log2_max_coding_block_size_minus3+3。
log2_difi_max_pic_alligned_min_coding_block_size可指定整个经译码的视频序列中的译码块的最小大小与译码块的最大大小之间的差。在一些实例中,任何图片皆可能不具有小于所述变量的最小译码CU大小。
以下表3提供PPS RBSP的额外语法元素,所述额外语法元素可由视频编码器22和视频解码器28结合在表1或表2中提供的SPS RBSP加以实施。
Figure BDA0000458175990000152
表3:图片参数集RBSP语法
在表3中,pic_scu_size_delta可指定参考此图片参数集的图片的译码单元的最小大小。此值可在从0到log2_diff_max_pic_alligned_min_coding_block_size的范围中。
变量Log2MinCUSize可经设置而等于Log2SeqMinCUSize+pic_scu_size_delta。或者,如果对准CU的大小为所有图片的最小CU大小中的最大者,那么变量Log2MinCUSize可经设置而等于Log2SeqMinCUSize-pic_scu_size_delta。或者,如果对准CU大小可为任何可能的CU大小,则在此情况下,pic_scu_size_delta可为带正负号的值(se(v)),且变量Log2MinCUSize可经设置而等于Log2SeqMinCUSize-pic_scu_size_delta。
除了以上所描述的实例以外,在一个实例中,可将视频序列的LCU大小定义为N乘N,且可将根据以上所描述的实例中的一者选定的ACU大小定义为M乘M。在此情况下,图片大小可由视频编码器22以LCU大小为单位用信号发出,所述LCU大小可被定义为WL乘HL。因此,相对于对准CU大小的图片大小可由视频解码器28根据以下等式导出:(WL*N-crop_right_offset+M-1)/M*M乘(HL*N-crop_bottom_offset+M-1)/M*M,其中crop_right_offset和crop_bottom_offset由视频编码器22在裁剪窗中用信号发出,且分别为从右边界和底边界裁剪掉的像素的数目。应注意,在以下表5中,WL可为pic_width_in_LCU的值,且WH为pic_height_in_LCU的值。也应注意,以上等式中的运算(例如,除法)可为整数计算。
以下表4提供seq_parameter_set_rbsp()的额外语法元素的另一实例。在此实例中,一个或一个以上图片的大小可由视频编码器22相对于最大译码单元(LCU)的大小来用信号发出。举例来说,一个或一个以上图片的大小可由视频编码器22在序列参数集中用信号发出。
图片大小也可由视频编码器22通过num_right_offset_ACU和num_bottom_offset_ACU用信号发出,因而图片大小为(WL*N-M*num_right_offset_ACU)乘(HL*N-M*num_bottom_offset_ACU)。这些两个参数可在SPS或PPS中用信号发出。经解码图片将以相对于对准CU的图片存储于经解码图片缓冲器中,大小为(WL*N-num_crop_acu_right*M)乘(HL*N-num_crop_acu_right*M)。
在一些实例中,可进一步由视频编码器22用信号发出裁剪窗。裁剪窗可定义待裁剪的图片或其它者的至少右侧或底侧。然而,因为可进一步用信号发出裁剪窗,所以当对准CU大小已知时,裁剪窗可用以识别图片大小。
Figure BDA0000458175990000171
表4:序列参数集RBSP语法
在表4中所展示的实例中,根据最大译码单元(LCU)给出图片的宽度和高度方面的大小。即,pic_width_in_LCU可指定一个或一个以上图片的相对于LCU的以像素计的大小。类似地,pic_height_in_LCU可指定一个或一个以上图片的相对于LCU的以像素计的大小。语法元素num_crop_acu_right可在裁剪窗中用信号发出且定义将在图片或其它视频块的右侧上裁剪的像素的数目。类似地,语法元素num_crop_acu_bottom可在裁剪窗中用信号发出且定义将在图片或其它视频块的底侧上裁剪的像素的数目。在其它实例中,用信号发出裁剪窗的其它侧。
仅仅出于说明性目的而提供实例。在此实例中,LCU大小为N乘N,且对准CU大小为M乘M。图片大小是以LCU大小为单位用信号发出,所述LCU大小被给定为WL乘HL。在此实例中,WL为pic_width_in_LCU的值,且HL为pic_height_in_LCU的值。Crop_right_offset可定义将在右侧上裁剪的像素的数目,且可等于num_crop_acu_right。Crop_bottom_offset可定义将在底侧上裁剪的像素的数目,且可等于num_crop_acu_bottom。
根据相对于LCU大小的图片大小和对准CU大小,可从以下等式来确定相对于对准CU(ACU)大小的图片大小:
Figure BDA0000458175990000191
应注意,等式1和2中的运算可为整数计算。
表5提供pic_parameter_set_rbsp()的额外语法元素的另一实例。在此实例中,可用信号发出num_right_offset_ACU和num_bottom_offset_ACU中的至少一者。表6展示在SPS中用信号发出num_right_offset_ACU和num_bottom_offset_ACU,然而,可于别处用信号发出这些值。举例来说,可在PPS中用信号发出num_right_offset_ACU和num_bottom_offset_ACU中的至少一者。
Figure BDA0000458175990000192
Figure BDA0000458175990000201
表5:序列参数集RBSP语法
表5中的值num_crop_acu_right可指定将从右侧从LCU对准图片裁剪掉的对准CU大小的数目。经裁剪图片可存储于DPB中。值num_crop_acu_bottom可指定将从底部从LCU对准图片裁剪掉以获得待存储于DPB中的图片的对准CU大小的数目。
在对应于表5的实例中,也可通过num_right_offset_ACU和num_bottom_offset_ACU用信号发出图片大小。可将图片大小确定为:
相对于ACU的图片宽度=WL(N-M)(num_right_offset_ACU)  (3)
相对于ACU的图片高度=WL(N-M)(num_bottom_offset_ACU)  (4)
可如下给定可存储于经解码图片缓冲器中的具有相对于对准CU的图片大小的经解码图片:
(WL*N-num_crop_aCU_right*M)乘(HL*N-num_crop_aCU_bottom*M)  (5)
因此,可以与上文关于图片大小的实例中相同的方式来用信号发出对准CU的大小(以像素计的高度和宽度)。举例来说,如果所有图片皆具有相同的最小CU(SCU)大小,那么对准CU的大小可为SCU大小。作为另一实例,如果所述图片具有不同SCU大小,那么对准CU大小可为所有图片当中的最大或最小SCU大小。可在SPS或PPS中的至少一者中显式地用信号发出对准CU大小。对准CU大小可等于或小于LCU的大小且等于或大于SCU的大小。
以下表6提供帧裁剪语法的一个实例,所述帧裁剪语法可结合上文所描述的实例实施例中的任一者使用。在一个实例中,裁剪窗可在序列参数集中且遵循与H.264/AVC中的语义相同的语义。
Figure BDA0000458175990000211
表6:帧裁剪语法
图2为说明可经配置以执行本发明中所描述的技术的实例视频编码器的框图。视频编码器50可经配置以确定定义视频序列的多个图片中的每一者的最小译码单元大小,其中最小译码单元大小选自多个可能译码单元大小。另外,视频编码器50可经配置以基于针对定义视频序列的多个图片中的每一者所确定的最小译码单元来确定视频序列的最小译码单元大小。另外,视频编码器50可经配置以确定与视频序列相关联的图片大小,其中与视频序列相关联的图片大小为最小译码单元大小值的倍数。此外,视频编码器50可经配置以在序列层级语法信息中用信号发出最小译码单元大小值。
视频编码器50可对应于装置20的视频编码器22,或不同装置的视频编码器。如图2中所展示,视频编码器50可包含预测编码模块32、四叉树分割模块31、加法器48和51,以及存储器34。视频编码器50也可包含变换模块38和量化模块40,以及逆量化模块42和逆变换模块44。视频编码器50也可包含熵译码模块46和滤波器模块47,所述滤波器模块可包含解块滤波器及回路后和/或回路内滤波器。经编码的视频数据和定义编码的方式的语法信息可被传达到熵编码模块46,所述熵编码模块对位流执行熵编码。
如图2中所展示,预测编码模块32可支持用于视频块的编码的多个不同译码模式35。预测编码模块32也可包括运动估计(ME)模块36和运动补偿(MC)模块37。
在编码过程期间,视频编码器50接收输入视频数据。四叉树分割模块31可将视频数据的单元分割为更小单元。举例来说,四叉树分割模块31可根据上文所描述的HEVC分割将LCU分解为更小的CU和PU。预测编码模块32对视频块(例如,CU和PU)执行预测性译码技术。对于帧间译码,预测编码模块32比较CU或PU与一个或一个以上视频参考帧或切片(例如,参考数据的一个或一个以上“列表”)中的各种预测性候选者以便定义预测性块。对于帧内译码,预测编码模块32基于同一视频帧或切片内的相邻数据产生预测性块。预测编码模块32输出所述预测块,且加法器48从正被译码的CU或PU减去所述预测块以便产生残余块。可使用HEVC中所描述的高级运动向量预测(AMVP)来译码至少一些视频块。
在一些情况下,预测编码模块可包含速率-失真(R-D)模块,其比较不同模式下的视频块(例如,CU或PU)的译码结果。在此情况下,预测编码模块32也可包含模式选择模块,所述模式选择模块用以依据译码速率(即,块所需的译码位)和失真(例如,表示经译码块相对于原始块的视频质量)分析译码结果以便进行针对视频块的模式选择。以此方式,R-D模块可提供对不同模式的结果的分析以允许模式选择模块选择不同视频块的所要模式。
再次参看图2,在预测编码模块32输出预测块之后,且在加法器48从正被译码的视频块减去预测块以便产生残余像素值的残余块之后,变换模块38将变换应用于残余块。所述变换可包括离散余弦变换(DCT)或概念上类似的变换(例如,由ITU H.264标准或HEVC标准定义的变换等)。可定义所谓的“蝶形”结构以执行所述变换,或也可使用基于矩阵的倍增。在一些实例中,在符合HEVC标准的情况下,变换的大小可针对不同CU而变化,例如,取决于关于给定LCU发生的分割的级别。可定义变换单元(TU)以便设置由变换模块38应用的变换大小。也可使用小波变换、整数变换、次能带变换或其它类型的变换。在任何情况下,变换模块38将变换应用于残余块,从而产生残余变换系数的块。一股来说,所述变换可将残余信息从像素域转换到频域。
量化模块40接着量化所述残余变换系数以进一步减小位速率。举例来说,量化模块40可限制用以译码所述系数中的每一者的位的数目。明确地说,量化模块40可应用针对LCU定义的QP差量,以便定义待应用的量化的级别(例如,通过组合QP差量与先前LCU的QP或某一其它已知QP)。在对残余样本执行了量化之后,熵译码模块46可扫描及熵编码数据。
CAVLC为由ITU H.264标准和新兴HEVC标准支持的一种类型的熵译码技术,其可由熵译码模块46基于向量化来应用。CAVLC以有效地压缩系数和/或语法元素的串行化“延行(run)”的方式使用可变长度译码(VLC)表。CABAC为由ITU H.264标准或HEVC标准支持的另一类型的熵译码技术,其可由熵译码模块46基于向量化来应用。CABAC可涉及若干阶段,包含二进制化、上下文模型选择和二进制算术译码。在此情况下,熵译码模块46根据CABAC译码系数和语法元素。许多其它类型的熵译码技术也存在,且新的熵译码技术将很可能在未来出现。本发明不限于任何特定熵译码技术。
在由熵编码模块46进行熵译码之后,可将经编码的视频发射到另一装置或存档以供稍后发射或检索。经编码视频可包括经熵译码的向量和各种语法信息。所述信息可由解码器用以适当地配置解码过程。逆量化模块42和逆变换模块44分别应用逆量化和逆变换,以在像素域中重建构残余块。求和器51将经重建构的残余块加到由预测编码模块32产生的预测块,以产生经重建构的视频块以存储于存储器34中。存储器34可包含经解码图片缓冲器,且经重建构的视频块可形成经解码图片。然而,在所述存储之前,滤波器模块47可将滤波应用于视频块以改善视频质量。由滤波器模块47应用的滤波可减少假影及使像素边界平滑。此外,滤波可通过产生包括被译码的视频块的紧密匹配的预测性视频块而改善压缩。
图3为说明可由视频编码器22或视频编码器50执行的用于编码视频数据的实例技术的流程图。视频编码器20或视频编码器50可确定定义视频序列的多个图片中的每一者的最小译码单元大小(302)。在一些情况下,最小译码单元大小可选自多个可能译码单元大小。举例来说,最小译码单元可为4×4、8×8、16×16、32×32或64×64中的一者,其中64×64为最大的可能译码单元大小。视频编码器20或视频编码器50可根据所确定的最小译码单元确定视频序列的对准译码单元大小(304)。视频编码器50的视频编码器20可基于上文所描述的技术确定对准译码大小。视频编码器20或视频编码器50确定与视频序列相关联的图片大小,其中与视频序列相关联的图片大小为对准译码单元大小值的倍数(306)。在一些情况下,与视频序列相关联的图片大小可为存储于经解码图片缓冲器中的经解码图片的图片大小。视频编码器20或视频编码器50可在序列层级语法信息中用信号发出对准译码单元大小值(308)。
图4为说明视频解码器60的实例的框图,所述视频解码器解码以本文中所描述方式编码的视频序列。在一些实例中,本发明的技术可由视频解码器60执行。视频解码器60可经配置以获得经译码的视频序列,所述经译码的视频序列包含使用第一最小译码单元大小译码的第一图片和使用第二最小译码单元大小译码的第二图片。另外,视频解码器60可经配置以获得待存储于经解码图片缓冲器中的经解码图片的图片大小,其中所述图片大小为第一译码单元大小和第二译码单元大小中的一者的倍数。另外,视频解码器60可经配置以将经解码图片存储于经解码图片缓冲器中。
视频解码器60包含熵解码模块52,所述熵解码模块执行与由图2的熵编码模块46执行的编码互逆的解码功能。明确地说,熵解码模块52可执行CAVLC或CABAC解码,或由视频编码器50使用的任何其它类型的熵解码。视频解码器60也包含预测解码模块54、逆量化模块56、逆变换模块58、存储器62和求和器64。明确地说,如同视频编码器50,视频解码器60包含预测解码模块54和滤波器模块57。视频解码器60的预测解码模块54可包含运动补偿模块86,所述运动补偿模块解码经帧间译码的块,且有可能包含一个或一个以上内插滤波器以用于运动补偿过程中的子像素内插。预测解码模块54也可包含用于解码帧内模式的帧内预测模块。预测解码模块54可支持复数种模式35。滤波器模块57可对求和器64的输出进行滤波,且可接收经熵解码的滤波器信息以便定义在回路滤波中应用的滤波器系数。
在接收到经编码的视频数据后,熵解码模块52即执行与由熵编码模块46(图2中的编码器50的熵编码模块)执行的编码互逆的解码。在解码器处,熵解码模块52剖析位流以确定LCU和与LCU相关联的对应分割。在一些实例中,LCU或LCU的CU可定义所使用的译码模式,且这些译码模式可包含双向预测性合并模式。因此,熵解码模块52可将语法信息转递到识别双向预测性合并模式的预测单元。存储器62可包含经解码图片缓冲器。经解码图片缓冲器可存储经解码图片。经解码图片可与视频序列相关联,使得在预测解码期间参考解码器图片。视频解码器60可使用语法信息根据本文中所描述的技术来确定待存储于经解码图片缓冲器中的经解码图片的大小。
图5为说明可由视频解码器28或视频解码器60执行的用于解码视频数据的实例技术的流程图。视频解码器28或视频解码器60可获得经译码的视频序列,所述经译码的视频序列包含使用第一最小译码单元大小译码的第一图片和使用第二最小译码单元大小译码的第二图片(502)。在一个实例中,可使用4×4的最小译码单元大小来译码第一图片,且可使用8×8的最小译码单元大小来译码第二图片。视频解码器28或视频解码器60可获得待存储于经解码图片缓冲器中的经解码图片的图片大小,其中所述图片大小为第一译码单元大小、第二译码单元大小或最大译码单元大小中的一者的倍数(504)。在一个实例中,图片大小可为1920×1080。视频解码器28或视频解码器60可将经解码图片存储于经解码图片缓冲器中(506)。另外,视频解码器28或视频解码器60可基于所获得的图片大小是否为对准译码单元大小的倍数来确定包含视频序列的位流是否为合格位流。
在一个或一个以上实例中,所描述功能可以硬件、软件、固件或其任何组合予以实施。如果以软件予以实施,那么所述功能可作为一个或一个以上指令或代码而存储于计算机可读媒体上或经由计算机可读媒体进行发射,且通过基于硬件的处理单元来执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体等有形媒体)或通信媒体,通信媒体包含(例如)根据通信协议促进将计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体一股可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一个或一个以上计算机或一个或一个以上处理器存取以检索指令、代码和/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
作为实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,快闪存储器,或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。又,将任何连接适当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字用户线(DSL)或无线技术(例如,红外线、无线电和微波)而从网站、服务器或其它远程源发射指令,那么同轴电缆、光缆、双绞线、DSL或无线技术(例如,红外线、无线电和微波)包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而是针对非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘和蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘通过激光以光学方式再生数据。以上各物的组合也应包含于计算机可读媒体的范围内。
可通过一个或一个以上处理器来执行指令,例如,一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效积体或离散逻辑电路。因此,如本文中所使用,术语“处理器”可指前述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文所描述的功能性提供于经配置以用于编码及解码的专用硬件和/或软件模块内,或并入于组合式编码解码器中。又,所述技术可完全实施于一个或一个以上电路或逻辑元件中。
本发明的技术可以广泛多种装置或设备予以实施,所述装置或设备包含无线手机、集成电路(IC)或一组IC(例如,芯片组)。在本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元予以实现。实情为,如以上所描述,可将各种单元组合于编码解码器硬件单元中,或由互操作性硬件单元(包含如以上所描述的一个或一个以上处理器)的集合结合合适软件和/或固件来提供所述单元。
已描述了本发明的各种方面。这些和其它方面在随附权利要求书的范围内。

Claims (40)

1.一种编码视频数据的方法,其包括:
确定定义视频序列的多个图片中的每一者的最小译码单元大小,其中最小译码单元大小是选自包含最大的可能译码单元大小的多个可能译码单元大小;
基于所述多个可能译码单元大小来确定所述视频序列的对准译码单元大小;
确定与所述视频序列相关联的图片大小,其中与所述视频序列相关联的所述图片大小为所述对准译码单元大小的倍数;以及
在序列层级语法信息中用信号发出所述对准译码单元大小值。
2.根据权利要求1所述的方法,其中所述对准译码单元大小为所述最大的可能译码单元大小。
3.根据权利要求2所述的方法,其中所述多个可能译码单元大小包含为64×64像素的最大译码单元大小。
4.根据权利要求1所述的方法,其中确定所述多个图片中的每一者的最小译码单元大小包含确定第一图片的为4×4像素的第一最小译码单元大小及确定第二图片的为8×8像素的第二最小译码单元大小;且其中所述视频序列的所述对准译码单元大小为4×4像素。
5.根据权利要求1所述的方法,其中确定所述多个图片中的每一者的最小译码单元大小包含确定第一图片的为4×4像素的第一最小译码单元大小及确定第二图片的为8×8像素的第二最小译码单元大小;且其中所述视频序列的所述对准译码单元大小为8×8像素。
6.根据权利要求1所述的方法,其中所述图片大小指定存储于经解码图片缓冲器中的经解码图片的图片大小。
7.一种经配置以编码视频数据的装置,其包括:
用于确定定义视频序列的多个图片中的每一者的最小译码单元大小的装置,其中最小译码单元大小是选自包含最大的可能译码单元大小的多个可能译码单元大小;
用于基于所述多个可能译码单元大小来确定所述视频序列的对准译码单元大小的装置;
用于确定与所述视频序列相关联的图片大小的装置,其中与所述视频序列相关联的所述图片大小为所述对准译码单元大小的倍数;以及
用于在序列层级语法信息中用信号发出所述对准译码单元大小值的装置。
8.根据权利要求7所述的装置,其中所述对准译码单元大小为所述最大的可能译码单元大小。
9.根据权利要求7所述的装置,其中所述多个可能译码单元大小包含为64×64像素的最大译码单元大小。
10.根据权利要求7所述的装置,其中确定多个图片中的每一者的最小译码单元大小包含确定第一图片的为4×4像素的第一最小译码单元大小及确定第二图片的为8×8像素的第二最小译码单元大小;且其中所述视频序列的所述对准译码单元大小为4×4像素。
11.根据权利要求7所述的装置,其中确定多个图片中的每一者的最小译码单元大小包含确定第一图片的为4×4像素的第一最小译码单元大小及确定第二图片的为8×8像素的第二最小译码单元大小;且其中所述视频序列的所述对准译码单元大小为8×8像素。
12.根据权利要求7所述的装置,其中所述图片大小指定存储于经解码图片缓冲器中的经解码图片的图片大小。
13.一种包括视频编码器的装置,所述视频编码器经配置以进行以下操作:
确定定义视频序列的多个图片中的每一者的最小译码单元大小,其中最小译码单元大小是选自包含最大的可能译码单元大小的多个可能译码单元大小;
基于所述多个可能译码单元大小来确定所述视频序列的对准译码单元大小;
确定与所述视频序列相关联的图片大小,其中与所述视频序列相关联的所述图片大小为所述对准译码单元大小的倍数;以及
在序列层级语法信息中用信号发出所述对准译码单元大小值。
14.根据权利要求13所述的装置,其中所述对准译码单元大小为所述最大的可能译码单元大小。
15.根据权利要求14所述的装置,其中所述多个可能译码单元大小包含为64×64像素的最大译码单元大小。
16.根据权利要求13所述的装置,其中确定多个图片中的每一者的最小译码单元大小包含确定第一图片的为4×4像素的第一最小译码单元大小及确定第二图片的为8×8像素的第二最小译码单元大小;且其中所述视频序列的所述对准译码单元大小为4×4像素。
17.根据权利要求13所述的装置,其中确定多个图片中的每一者的最小译码单元大小包含确定第一图片的为4×4像素的第一最小译码单元大小及确定第二图片的为8×8像素的第二最小译码单元大小;且其中所述视频序列的所述对准译码单元大小为8×8像素。
18.根据权利要求13所述的装置,其中所述图片大小指定存储于经解码图片缓冲器中的经解码图片的图片大小。
19.一种包括存储于其上的指令的计算机可读媒体,所述指令在经执行时致使处理器进行以下操作:
确定定义视频序列的多个图片中的每一者的最小译码单元大小,其中最小译码单元大小是选自包含最大的可能译码单元大小的多个可能译码单元大小;
基于所述多个可能译码单元大小来确定所述视频序列的对准译码单元大小;
确定与所述视频序列相关联的图片大小,其中与所述视频序列相关联的所述图片大小为所述对准译码单元大小的倍数;以及
在序列层级语法信息中用信号发出所述对准译码单元大小值。
20.根据权利要求19所述的计算机可读媒体,其中所述对准译码单元大小为所述最大的可能译码单元大小。
21.根据权利要求20所述的计算机可读媒体,其中所述多个可能译码单元大小包含为64×64像素的最大译码单元大小。
22.根据权利要求19所述的计算机可读媒体,其中确定多个图片中的每一者的最小译码单元大小包含确定第一图片的为4×4像素的第一最小译码单元大小及确定第二图片的为8×8像素的第二最小译码单元大小;且其中所述视频序列的所述最小译码单元大小为4×4像素。
23.根据权利要求19所述的计算机可读媒体,其中确定多个图片中的每一者的最小译码单元大小包含确定第一图片的为4×4像素的第一最小译码单元大小及确定第二图片的为8×8像素的第二最小译码单元大小;且其中所述视频序列的所述最小译码单元大小为8×8像素。
24.根据权利要求19所述的计算机可读媒体,其中所述图片大小指定存储于经解码图片缓冲器中的经解码图片的图片大小。
25.一种解码视频数据的方法,其包括:
获得经译码的视频序列,所述经译码的视频序列包含使用第一最小译码单元大小译码的第一图片和使用第二最小译码单元大小译码的第二图片;
获得待存储于经解码图片缓冲器中的经解码图片的图片大小,其中所述图片大小为所述第一译码单元大小、所述第二译码单元大小或最大译码单元大小中的一者的倍数;以及
将所述经解码图片存储于经解码图片缓冲器中。
26.根据权利要求25所述的方法,其中所述第一最小译码单元大小为4×4像素,且所述第二译码单元大小为8×8像素,且所述图片大小为所述第一译码单元大小的倍数。
27.根据权利要求25所述的方法,其中所述第一最小译码单元大小为4×4像素,且所述第二译码单元大小为8×8像素,且所述图片大小为所述第二译码单元大小的倍数。
28.根据权利要求25所述的方法,其中所述最大译码单元大小为64×64像素,且所述图片大小为所述最大译码单元大小的倍数。
29.一种经配置以解码视频数据的装置,其包括:
用于获得经译码的视频序列的装置,所述经译码的视频序列包含使用第一最小译码单元大小译码的第一图片和使用第二最小译码单元大小译码的第二图片;
用于获得待存储于经解码图片缓冲器中的经解码图片的图片大小的装置,其中所述图片大小为所述第一译码单元大小、所述第二译码单元大小或最大译码单元大小中的一者的倍数;以及
用于将所述经解码图片存储于经解码图片缓冲器中的装置。
30.根据权利要求29所述的装置,其中所述第一最小译码单元大小为4×4像素,且所述第二译码单元大小为8×8像素,且所述图片大小为所述第一译码单元大小的倍数。
31.根据权利要求29所述的装置,其中所述第一最小译码单元大小为4×4像素,且所述第二译码单元大小为8×8像素,且所述图片大小为所述第二译码单元大小的倍数。
32.根据权利要求29所述的装置,其中所述最大译码单元大小为64×64像素,且所述图片大小为所述最大译码单元大小的倍数。
33.一种包括视频解码器的装置,所述视频解码器经配置以进行以下操作:
获得经译码的视频序列,所述经译码的视频序列包含使用第一最小译码单元大小译码的第一图片和使用第二最小译码单元大小译码的第二图片;
获得待存储于经解码图片缓冲器中的经解码图片的图片大小,其中所述图片大小为所述第一译码单元大小、所述第二译码单元大小或最大译码单元大小中的一者的倍数;以及
将所述经解码图片存储于经解码图片缓冲器中。
34.根据权利要求33所述的装置,其中所述第一最小译码单元大小为4×4像素,且所述第二译码单元大小为8×8像素,且所述图片大小为所述第一译码单元大小的倍数。
35.根据权利要求33所述的装置,其中所述第一最小译码单元大小为4×4像素,且所述第二译码单元大小为8×8像素,且所述图片大小为所述第二译码单元大小的倍数。
36.根据权利要求33所述的装置,其中所述最大译码单元大小为64×64像素,且所述图片大小为所述最大译码单元大小的倍数。
37.一种包括存储于其上的指令的计算机可读媒体,所述指令在经执行时致使处理器进行以下操作:
获得经译码的视频序列,所述经译码的视频序列包含使用第一最小译码单元大小译码的第一图片和使用第二最小译码单元大小译码的第二图片;
获得待存储于经解码图片缓冲器中的经解码图片的图片大小,其中所述图片大小为所述第一译码单元大小、所述第二译码单元大小或最大译码单元大小中的一者的倍数;以及
将所述经解码图片存储于经解码图片缓冲器中。
38.根据权利要求37所述的计算机可读媒体,其中所述第一最小译码单元大小为4×4像素,且所述第二译码单元大小为8×8像素,且所述图片大小为所述第一译码单元大小的倍数。
39.根据权利要求37所述的计算机可读媒体,其中所述第一最小译码单元大小为4×4像素,且所述第二译码单元大小为8×8像素,且所述图片大小为所述第一译码单元大小的倍数。
40.根据权利要求37所述的计算机可读媒体,其中所述最大译码单元大小为64×64像素,且所述图片大小为所述最大译码单元大小的倍数。
CN201280035512.0A 2011-07-17 2012-07-17 在视频译码中用信号发出图片大小 Active CN103718551B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201161508659P 2011-07-17 2011-07-17
US61/508,659 2011-07-17
US201161530819P 2011-09-02 2011-09-02
US61/530,819 2011-09-02
US201161549480P 2011-10-20 2011-10-20
US61/549,480 2011-10-20
US13/550,384 2012-07-16
US13/550,384 US20130016769A1 (en) 2011-07-17 2012-07-16 Signaling picture size in video coding
PCT/US2012/047066 WO2013012864A1 (en) 2011-07-17 2012-07-17 Signaling picture size in video coding

Publications (2)

Publication Number Publication Date
CN103718551A true CN103718551A (zh) 2014-04-09
CN103718551B CN103718551B (zh) 2017-06-30

Family

ID=47518908

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280035512.0A Active CN103718551B (zh) 2011-07-17 2012-07-17 在视频译码中用信号发出图片大小

Country Status (20)

Country Link
US (3) US20130016769A1 (zh)
EP (1) EP2732629B1 (zh)
JP (1) JP5792388B2 (zh)
KR (1) KR101497882B1 (zh)
CN (1) CN103718551B (zh)
AU (1) AU2012284120B2 (zh)
BR (1) BR112014000941B1 (zh)
CA (1) CA2841953C (zh)
DK (1) DK2732629T3 (zh)
ES (1) ES2639030T3 (zh)
HU (1) HUE030661T2 (zh)
IL (1) IL230248A (zh)
MX (1) MX2014000720A (zh)
MY (1) MY165045A (zh)
PL (1) PL2732629T3 (zh)
PT (1) PT2732629T (zh)
RU (1) RU2586027C2 (zh)
SI (1) SI2732629T1 (zh)
TW (1) TWI502967B (zh)
WO (1) WO2013012864A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016205999A1 (en) * 2015-06-23 2016-12-29 Mediatek Singapore Pte. Ltd. Adaptive coding group for image/video coding
WO2021143413A1 (en) * 2020-01-14 2021-07-22 Mediatek Inc. Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding
CN113597762A (zh) * 2019-03-25 2021-11-02 高通股份有限公司 视频译码中具有非线性自适应环路滤波器的固定滤波器
CN113794880A (zh) * 2015-05-12 2021-12-14 三星电子株式会社 视频编码方法、视频解码方法以及计算机可读介质
US11438611B2 (en) 2019-12-11 2022-09-06 Hfi Innovation Inc. Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding
CN115550648A (zh) * 2019-01-09 2022-12-30 华为技术有限公司 视频译码中的子图像大小

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106658014B (zh) * 2011-06-30 2021-01-08 三菱电机株式会社 图像编码装置及方法、图像解码装置及方法
US20130016769A1 (en) 2011-07-17 2013-01-17 Qualcomm Incorporated Signaling picture size in video coding
JP2013085096A (ja) * 2011-10-07 2013-05-09 Sony Corp 画像処理装置および方法
US10212444B2 (en) * 2016-01-15 2019-02-19 Qualcomm Incorporated Multi-type-tree framework for video coding
CN107820077B (zh) * 2016-09-14 2019-06-28 北京金山云网络技术有限公司 一种最大可用编码单元尺寸确定方法及装置
WO2018217024A1 (ko) 2017-05-26 2018-11-29 에스케이텔레콤 주식회사 다양한 블록 크기를 지원하는 영상 부호화 또는 복호화를 위한 장치 및 방법
KR102435881B1 (ko) 2017-05-26 2022-08-24 에스케이텔레콤 주식회사 영상 부호화 또는 복호화하기 위한 장치 및 방법
US11297349B2 (en) * 2017-05-31 2022-04-05 Sharp Kabushiki Kaisha Video decoding device and video encoding device
KR102336987B1 (ko) * 2017-07-04 2021-12-08 엘지전자 주식회사 360도 비디오의 영역 기반 처리 방법 및 장치
WO2019172202A1 (ja) * 2018-03-05 2019-09-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置及び符号化方法
US11290734B2 (en) * 2019-01-02 2022-03-29 Tencent America LLC Adaptive picture resolution rescaling for inter-prediction and display
US11159795B2 (en) * 2019-03-04 2021-10-26 Tencent America LLC Max transform size control
US11012710B2 (en) 2019-03-06 2021-05-18 Tencent America LLC Techniques for intra prediction for 360 image and video coding
US11575941B2 (en) * 2021-03-23 2023-02-07 Tencent America LLC Parallel processing in video coding

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3844844B2 (ja) 1997-06-06 2006-11-15 富士通株式会社 動画像符号化装置及び動画像符号化方法
WO2003053066A1 (en) 2001-12-17 2003-06-26 Microsoft Corporation Skip macroblock coding
US7170937B2 (en) 2002-05-01 2007-01-30 Texas Instruments Incorporated Complexity-scalable intra-frame prediction technique
MY137061A (en) 2002-06-11 2008-12-31 Nokia Corp Spatial prediction based intra coding
US6795584B2 (en) 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
WO2004080084A1 (en) 2003-03-03 2004-09-16 Agency For Science, Technology And Research Fast mode decision algorithm for intra prediction for advanced video coding
US7822123B2 (en) * 2004-10-06 2010-10-26 Microsoft Corporation Efficient repeat padding for hybrid video sequence with arbitrary video resolution
US7852919B2 (en) 2003-09-07 2010-12-14 Microsoft Corporation Field start code for entry point frames with predicted first field
EP1558039A1 (en) 2004-01-21 2005-07-27 Deutsche Thomson-Brandt Gmbh Method and apparatus for generating/evaluating prediction information in picture signal encoding/decoding
US7586924B2 (en) 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
JP4501631B2 (ja) 2004-10-26 2010-07-14 日本電気株式会社 画像符号化装置及び方法、画像符号化装置のコンピュータ・プログラム、並びに携帯端末
JP2007043651A (ja) 2005-07-05 2007-02-15 Ntt Docomo Inc 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
US20080095228A1 (en) 2006-10-20 2008-04-24 Nokia Corporation System and method for providing picture output indications in video coding
FR2908007A1 (fr) 2006-10-31 2008-05-02 Thomson Licensing Sas Procede de codage d'une sequence d'images
FR2916931A1 (fr) 2007-05-29 2008-12-05 Thomson Licensing Sas Procede de selection d'une donnee de codage et dispositif de codage implementant ledit procede
JP4523625B2 (ja) 2007-08-07 2010-08-11 パナソニック株式会社 画像符号化装置および方法
TW200910971A (en) 2007-08-22 2009-03-01 Univ Nat Cheng Kung Direction detection algorithms for H.264 intra prediction
DE102007049351A1 (de) 2007-10-15 2009-04-16 Siemens Ag Verfahren und Vorrichtung zum Erstellen eines kodierten Ausgangsvideostroms aus mindestens zwei kodierten Eingangsvideoströmen, sowie Verwendung der Vorrichtung und kodierter Eingangsvideostrom
US8121197B2 (en) 2007-11-13 2012-02-21 Elemental Technologies, Inc. Video encoding and decoding using parallel processors
KR101306834B1 (ko) 2008-09-22 2013-09-10 에스케이텔레콤 주식회사 인트라 예측 모드의 예측 가능성을 이용한 영상 부호화/복호화 장치 및 방법
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
US8634456B2 (en) 2008-10-03 2014-01-21 Qualcomm Incorporated Video coding with large macroblocks
US20100098156A1 (en) 2008-10-16 2010-04-22 Qualcomm Incorporated Weighted prediction based on vectorized entropy coding
JP5169978B2 (ja) 2009-04-24 2013-03-27 ソニー株式会社 画像処理装置および方法
US9154798B2 (en) 2009-09-14 2015-10-06 Thomson Licensing Methods and apparatus for efficient video encoding and decoding of intra prediction mode
KR101457894B1 (ko) 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
WO2011099792A2 (ko) 2010-02-10 2011-08-18 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
US20110194613A1 (en) * 2010-02-11 2011-08-11 Qualcomm Incorporated Video coding with large macroblocks
KR102124495B1 (ko) 2010-04-09 2020-06-19 엘지전자 주식회사 비디오 데이터 처리 방법 및 장치
US8902978B2 (en) 2010-05-30 2014-12-02 Lg Electronics Inc. Enhanced intra prediction mode signaling
US8654860B2 (en) * 2010-11-01 2014-02-18 Mediatek Inc. Apparatus and method for high efficiency video coding using flexible slice structure
PL3595303T3 (pl) 2010-11-25 2022-01-31 Lg Electronics Inc. Sposób dekodowania informacji o obrazie, urządzenie dekodujące, sposób kodowania informacji o obrazie, urządzenie kodujące i nośnik pamięci
KR20120070479A (ko) 2010-12-21 2012-06-29 한국전자통신연구원 화면 내 예측 방향 정보 부호화/복호화 방법 및 그 장치
CN103299622B (zh) 2011-01-07 2016-06-29 联发科技(新加坡)私人有限公司 编码方法与装置以及解码方法与装置
BR112013014371B8 (pt) 2011-01-07 2022-05-24 Hfi Innovation Inc Método e aparelho de codificação aperfeiçoada de modo de predição intra crominância
JP5781313B2 (ja) 2011-01-12 2015-09-16 株式会社Nttドコモ 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム
JP2012147332A (ja) 2011-01-13 2012-08-02 Sony Corp 符号化装置および符号化方法、並びに復号装置および復号方法
CN102595121A (zh) 2011-01-15 2012-07-18 华为技术有限公司 帧内预测模式二进制化的方法、解码方法、装置和***
CN102685474B (zh) 2011-03-10 2014-11-05 华为技术有限公司 预测模式的编解码方法、编解码设备及网络***
AU2011201336B2 (en) 2011-03-23 2013-09-05 Canon Kabushiki Kaisha Modulo embedding of video parameters
HUE042699T2 (hu) 2011-04-21 2019-07-29 Hfi Innovation Inc Eljárás és készülék továbbfejlesztett hurokszûréshez
KR101383775B1 (ko) 2011-05-20 2014-04-14 주식회사 케이티 화면 내 예측 방법 및 장치
WO2012164902A1 (ja) 2011-05-30 2012-12-06 株式会社Jvcケンウッド 画像符号化装置、画像符号化方法及び画像符号化プログラム、並びに画像復号装置、画像復号方法及び画像復号プログラム
EP2533537A1 (en) 2011-06-10 2012-12-12 Panasonic Corporation Transmission of picture size for image or video coding
US20130016769A1 (en) 2011-07-17 2013-01-17 Qualcomm Incorporated Signaling picture size in video coding

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11973934B2 (en) 2015-05-12 2024-04-30 Samsung Electronics Co., Ltd. Method and device for encoding or decoding image by using blocks determined by means of adaptive order
US11973935B2 (en) 2015-05-12 2024-04-30 Samsung Electronics Co., Ltd. Method and device for encoding or decoding image by using blocks determined by means of adaptive order
CN113794880A (zh) * 2015-05-12 2021-12-14 三星电子株式会社 视频编码方法、视频解码方法以及计算机可读介质
CN113794879A (zh) * 2015-05-12 2021-12-14 三星电子株式会社 视频编码方法、视频解码方法以及计算机可读介质
CN113810688A (zh) * 2015-05-12 2021-12-17 三星电子株式会社 视频编码方法、视频解码方法以及计算机可读介质
CN113891073A (zh) * 2015-05-12 2022-01-04 三星电子株式会社 视频编码方法、视频解码方法以及计算机可读介质
US11962752B2 (en) 2015-05-12 2024-04-16 Samsung Electronics Co., Ltd. Method and device for encoding or decoding image by using blocks determined by means of adaptive order
US11956419B2 (en) 2015-05-12 2024-04-09 Samsung Electronics Co., Ltd. Method and device for encoding or decoding image by using blocks determined by means of adaptive order
US11956422B2 (en) 2015-05-12 2024-04-09 Samsung Electronics Co., Ltd. Method and device for encoding or decoding image by using blocks determined by means of adaptive order
CN113794880B (zh) * 2015-05-12 2023-04-14 三星电子株式会社 视频编码方法、视频解码方法以及计算机可读介质
CN113794879B (zh) * 2015-05-12 2023-04-18 三星电子株式会社 视频编码方法、视频解码方法以及计算机可读介质
WO2016205999A1 (en) * 2015-06-23 2016-12-29 Mediatek Singapore Pte. Ltd. Adaptive coding group for image/video coding
CN115550648B (zh) * 2019-01-09 2023-09-01 华为技术有限公司 视频译码中的子图像大小
US11917173B2 (en) 2019-01-09 2024-02-27 Huawei Technologies Co., Ltd. Sub-picture sizing in video coding
CN115550648A (zh) * 2019-01-09 2022-12-30 华为技术有限公司 视频译码中的子图像大小
CN113597762A (zh) * 2019-03-25 2021-11-02 高通股份有限公司 视频译码中具有非线性自适应环路滤波器的固定滤波器
US11438611B2 (en) 2019-12-11 2022-09-06 Hfi Innovation Inc. Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding
US11445176B2 (en) 2020-01-14 2022-09-13 Hfi Innovation Inc. Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding
WO2021143413A1 (en) * 2020-01-14 2021-07-22 Mediatek Inc. Method and apparatus of scaling window constraint for worst case bandwidth consideration for reference picture resampling in video coding

Also Published As

Publication number Publication date
AU2012284120A1 (en) 2014-02-13
BR112014000941B1 (pt) 2022-06-07
US20220295076A1 (en) 2022-09-15
IL230248A (en) 2016-12-29
US20130016769A1 (en) 2013-01-17
CA2841953A1 (en) 2013-01-24
KR20140024482A (ko) 2014-02-28
CA2841953C (en) 2017-01-03
AU2012284120B2 (en) 2016-03-03
TWI502967B (zh) 2015-10-01
US11700384B2 (en) 2023-07-11
MX2014000720A (es) 2014-02-27
KR101497882B1 (ko) 2015-03-02
SI2732629T1 (sl) 2016-12-30
JP5792388B2 (ja) 2015-10-14
US20140341275A1 (en) 2014-11-20
WO2013012864A1 (en) 2013-01-24
PL2732629T3 (pl) 2017-07-31
EP2732629A1 (en) 2014-05-21
EP2732629B1 (en) 2016-10-05
HUE030661T2 (en) 2017-05-29
BR112014000941A2 (pt) 2017-02-14
JP2014521281A (ja) 2014-08-25
RU2014105655A (ru) 2015-08-27
MY165045A (en) 2018-02-28
TW201313027A (zh) 2013-03-16
RU2586027C2 (ru) 2016-06-10
PT2732629T (pt) 2017-01-13
CN103718551B (zh) 2017-06-30
ES2639030T3 (es) 2017-10-25
DK2732629T3 (da) 2017-01-02

Similar Documents

Publication Publication Date Title
CN103718551B (zh) 在视频译码中用信号发出图片大小
CN103947207B (zh) 用于图片分割方案的统一设计
CN103891279B (zh) 用于帧内预测译码的最大概率变换
CN103329529B (zh) 用于高效视频译码(hevc)中的经译码单元的信令量化参数改变
CN102369731B (zh) 基于视频译码中的活动度量的滤波预测
CN103493488B (zh) 用于视频译码的变换系数的译码
CN103299620B (zh) 在视频译码中使用最可能扫描次序对用于视频块的扫描次序信息进行有效译码
CN104067524B (zh) 具有精简的初始化值集合的上下文自适应熵译码
CN103636224B (zh) 用于视频压缩中的系数等级译码的上下文
CN103270754A (zh) 对视频数据块的系数的模式相依扫描
CN103636207B (zh) 用于明度及色度块的可变长度译码系数译码
CN103999460A (zh) 在变换跳过模式中译码有效系数信息
CN104054339A (zh) 用信号通知视频译码中的解块滤波器参数
CN103460695A (zh) 视频译码中基于单预测相邻者的双预测合并模式
CN103597832A (zh) 用于使用相邻模式的视频译码的增强的帧内预测模式信令
CN104205829A (zh) 合并信令及环路滤波器开/关信令
CN103636208A (zh) 在视频译码中用于非正方形块的上下文自适应熵译码
CN103931182A (zh) 帧内预测视频译码中的非正方形变换
CN104247421A (zh) 用于系数扫描的系数群及系数译码
CN104054344A (zh) 对色度数据进行解块以用于视频译码
CN104471935A (zh) 具有变换跳过的视频译码中的预测残余块的旋转
CN103609118A (zh) 用于视频译码的并行化友好合并候选者
CN104685876A (zh) 用于视频译码中的4:2:2样本格式的经译码块旗标(cbf)译码
CN103283230B (zh) 使用一维切换滤波器与一维自适应滤波器的组合的视频滤波
CN104126301A (zh) 在视频译码中使用码簿对环路滤波器参数进行译码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1192087

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1192087

Country of ref document: HK