CN103797802B - 用于视频译码中的短距离帧内预测的线缓冲器减少 - Google Patents

用于视频译码中的短距离帧内预测的线缓冲器减少 Download PDF

Info

Publication number
CN103797802B
CN103797802B CN201280045204.6A CN201280045204A CN103797802B CN 103797802 B CN103797802 B CN 103797802B CN 201280045204 A CN201280045204 A CN 201280045204A CN 103797802 B CN103797802 B CN 103797802B
Authority
CN
China
Prior art keywords
video
current
sdip
entropy coding
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201280045204.6A
Other languages
English (en)
Other versions
CN103797802A (zh
Inventor
郭立威
马尔塔·卡切维奇
翔林·王
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN103797802A publication Critical patent/CN103797802A/zh
Application granted granted Critical
Publication of CN103797802B publication Critical patent/CN103797802B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

例如视频编码器或视频解码器等视频译码器在一组一个或一个以上熵译码上下文中识别一熵译码上下文。所述视频译码器在不参考在当前图片中的当前译码单元上方的相邻译码单元的情况下识别所述熵译码上下文。所述视频译码器随后使用所述所识别的熵译码上下文对译码单元CU的短距离帧内预测SDIP语法元素进行熵译码。所述SDIP语法元素至少部分地界定借以将所述CU分割为一组一个或一个以上变换单元的模式。

Description

用于视频译码中的短距离帧内预测的线缓冲器减少
本申请案主张2011年9月16日申请的第61/535,797号美国临时专利申请案以及2011年11月3日申请的第61/555,354号美国临时专利申请案的权益,所述两个申请案中的每一者的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码,且特定来说,涉及视频译码中的熵译码。
背景技术
数字视频能力可并入到大范围的装置中,包含数字电视、数字直播***、无线广播***、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频会议装置、视频串流装置等等。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)、目前在开发中的高效率视频译码(HEVC)标准定义的标准和所述标准的扩展部分中所描述的那些视频压缩技术。视频装置可通过实施此些视频压缩技术来更高效地发射、接收、编码、解码和/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测以减少或移除视频序列中所固有的冗余。对于基于块的视频译码,可将视频切片(即,图片或图片的一部分)分割为若干视频块,所述视频块还可被称作树块、译码单元(CU)和/或译码节点。使用空间预测相对于同一图片中的相邻块中的参考样本来编码图片的经帧内译码(I)切片中的视频块。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测导致对待译码的块的预测性视频块。残余数据表示待译码的原始块与预测性视频块之间的像素差。根据指向形成预测性视频块的参考样本块的运动向量以及指示经译码块与所述预测性视频块之间的差的残余数据来编码经帧间译码块。根据帧内译码模式和残余数据来编码经帧内译码块。为了进一步压缩,可将残余数据从像素域变换为变换域,从而产生残余变换系数,所述残余变换系数随后可被量化。起初布置在二维阵列中的经量化变换系数可依序扫描以产生变换系数的一维向量,且可应用熵译码以实现更多的压缩。
发明内容
一股来说,本发明描述用于视频译码过程中的帧内预测的技术。视频译码器(例如,视频编码器或视频解码器)可在一组一个或一个以上熵译码上下文中识别一熵译码上下文。视频译码器在不参考在当前图片中的当前译码单元(CU)上方的任何相邻译码单元的情况下识别所述熵译码上下文。视频译码器可随后使用所述所识别的熵译码上下文对当前CU的短距离帧内预测(SDIP)语法元素进行熵译码。SDIP语法元素至少部分地界定借以将当前CU分割为一组一个或一个以上预测单元的模式。在一些实例中,在不参考在当前图片中的当前CU上方的任何相邻CU的情况下识别熵译码上下文可准许编码器或解码器避免缓冲与定位在当前CU上方的CU相关联的信息。此可减少编码器或解码器的复杂性。
在一个实例中,本发明描述一种视频译码方法,其包括在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在一组一个或一个以上熵译码上下文中识别一熵译码上下文。所述方法还包括使用所述所识别的熵译码上下文对SDIP语法元素进行熵译码,所述SDIP语法元素至少部分地界定借以将当前CU分割为一组一个或一个以上PU的模式。
在另一实例中,本发明描述一种视频译码设备,其包括一个或一个以上处理器,所述一个或一个以上处理器经配置以在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在一组一个或一个以上熵译码上下文中识别一熵译码上下文。所述一个或一个以上处理器还经配置以使用所述所识别的熵译码上下文对SDIP语法元素进行熵译码,所述SDIP语法元素至少部分地界定借以将当前CU分割为一组一个或一个以上PU的模式。
在另一实例中,本发明描述一种视频译码设备,其包括用于在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在一组一个或一个以上熵译码上下文中识别一熵译码上下文的装置。所述视频译码设备还包括用于使用所述所识别的熵译码上下文对SDIP语法元素进行熵译码的装置,所述SDIP语法元素至少部分地界定借以将当前CU分割为一组一个或一个以上PU的模式。
在另一实例中,本发明描述一种计算机可读存储媒体,其包括指令,所述指令在被执行时致使用于视频译码的装置的一个或一个以上处理器在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在一组一个或一个以上熵译码上下文中识别一熵译码上下文。所述指令还致使所述一个或一个以上处理器使用所述所识别的熵译码上下文对SDIP语法元素进行熵译码,所述SDIP语法元素至少部分地界定借以将当前CU分割为一组一个或一个以上PU的模式。
一个或一个以上实例的细节陈述于附图及以下描述中。从描述内容、图式和权利要求书中将了解其它特征、目的和优点。
附图说明
图1是说明可利用本发明中所描述的技术中的一者或一者以上的实例性视频译码***的框图。
图2是说明经配置以实施本发明中所描述的技术中的一者或一者以上的实例性视频编码器的框图。
图3是说明经配置以实施本发明中所描述的技术中的一者或一者以上的实例性视频解码器的框图。
图4A到4D是说明在CU是经帧内预测CU时将译码单元(CU)分割为预测单元的实例性模式的概念图。
图5A是说明实例性CU的概念图,视频译码器可从所述实例性CU识别用于对当前CU的短距离帧内预测(SDIP)语法元素进行熵译码的熵译码上下文。
图5B是说明其它实例性CU的概念图,视频译码器可从所述实例性CU识别用于对当前CU的SDIP语法元素进行熵译码的熵译码上下文。
图6是说明实例性帧内预测模式的概念图。
图7是说明根据本发明的一种或一种以上技术的视频译码器的实例性操作的流程图。
图8是说明根据本发明的一种或一种以上技术的视频编码器的实例性操作的流程图。
图9是说明根据本发明的一种或一种以上技术的视频解码器的实例性操作的流程图。
具体实施方式
当例如视频编码器或视频解码器等视频译码器对视频数据的译码单元(CU)进行译码时,视频译码器可根据分割模式将所述CU分割为一个或一个以上预测单元(PU)。为了易于阐释,本发明可将视频译码器当前译码的CU称作当前CU。类似地,本发明可将视频译码器当前译码的图片称作当前图片。举例来说,如果视频编码器正使用帧内预测对当前CU进行译码,那么视频译码器可根据2N×2N分割模式、N×N分割模式、2N×hN分割模式或hN×2N分割模式将当前CU分割为一个或一个以上PU。2N×hN分割模式和hN×2N分割模式可被称作短距离帧内预测(SDIP)分割模式。
当视频译码器根据2N×2N分割模式对当前CU进行分割时,视频译码器不对当前CU进行分割。而是,当视频译码器根据2N×2N分割模式对当前CU进行分割时,仅存在与当前CU相关联的单一PU。当视频译码器根据N×N分割模式对当前CU进行分割时,视频译码器产生与当前CU相关联的四个正方形PU。当视频译码器根据2N×hN分割模式对当前CU进行分割时,视频译码器可产生与当前CU相关联的多个矩形、水平定向的PU。当视频译码器根据hN×2N分割模式对当前CU进行分割时,视频译码器可产生与当前CU相关联的多个矩形、垂直定向的PU。
当视频译码器使用帧内预测对当前CU进行译码时,一个或一个以上SDIP语法元素可界定借以将当前CU分割为PU的模式。举例来说,当前CU的SDIP语法元素可包含SDIP旗标以及SDIP方向旗标。SDIP旗标的第一值(例如,0)可指示将当前CU分割为一个或一个以上正方形PU。SDIP旗标的第二值(例如,1)可指示将当前CU分割为多个矩形PU。SDIP方向旗标的第一值(例如,0)可指示将当前CU分割为多个垂直定向的矩形PU。SDIP方向旗标的第二值(例如,1)可指示将当前CU分割为多个水平定向的矩形PU。
为了减少用于表示SDIP语法元素的位的数目,视频编码器可对SDIP语法元素执行一个或一个以上熵译码操作,例如上下文自适应二进制算术译码(CABAC)。视频编码器可产生包含SDIP语法元素的经编码表示的位流。当从位流解析所述SDIP语法元素时,视频解码器可执行一个或一个以上熵解码操作。
为了对SDIP语法元素执行熵译码操作(即,熵编码操作或熵解码操作),视频译码器可识别熵译码上下文。所述熵译码上下文可指示视频译码器在执行熵译码操作时可使用的预定义上下文相依数据。举例来说,用于CABAC的熵译码上下文可指示对特定为进行译码的概率。举例来说,一个熵译码上下文可指示对0值位进行译码的0.6概率以及对1值位进行译码的0.4概率。在此实例中,另一熵译码上下文可指示对0值位进行译码的0.7概率以及对1值位进行译码的0.3概率。
视频译码器可随后使用所识别的熵译码上下文对SDIP元素进行熵译码。一些视频译码器可基于与在当前图片中的当前CU上方的CU相关联的信息来识别熵译码上下文。为了支持以此方式对熵译码上下文的选择,视频译码器可将与在当前CU上方的CU相关联的信息(例如,SDIP语法元素)存储在线缓冲器中。所述线缓冲器可包括存储器单元,例如寄存器或随机存取存储器(RAM)单元。举例来说,如果当前CU在行k中,那么视频译码器可将与行k-1中的CU相关联的信息存储在线缓冲器中,其中k随着行从图片中的顶部下降到底部而增加,且其中k=0对应于图片中的CU的最顶行。此线缓冲器可增加与设计和实施视频译码器相关联的复杂性和成本。
根据本发明的技术,视频译码器可在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在一组一个或一个以上熵译码上下文中识别一熵译码上下文。视频译码器可随后使用所识别的熵译码上下文对SDIP语法元素进行熵译码。因为视频译码器在不参考与在当前CU上方的任何相邻CU相关联的信息的情况下识别所述熵译码上下文,所以视频译码器可不需要线缓冲器来存储与当前CU上方的CU相关联的信息或可使用减小大小的线缓冲器。此可简化视频译码器的设计和实施。
为了易于阐释,本发明可将CU、PU或变换单元(TU)描述为与其它CU、PU或TU具有各种空间关系。可将此描述解释为意指CU、PU和TU与对应于其它CU、PU或TU的视频块具有各种空间关系。另外,本发明可将某些CU、PU和TU描述为具有某些大小。可将此描述解释为意指对应于所述CU、PU和TU的视频块可具有所述大小。此外,本发明可将视频译码器当前译码的PU称作当前PU。本发明可将视频译码器当前译码的CU称作当前CU。本发明可将视频译码器当前译码的图片称作当前图片。
附图说明实例。在以下描述中,由附图中的参考数字指示的元件对应于由相同参考数字指示的元件。在本发明中,具有以序数词(例如,“第一”、“第二”、“第三”等)开始的名称的元件不一定暗示所述元件具有特定次序。而是,所述序数词仅用于指代相同或类似类型的不同元件。
图1是说明可利用本发明的技术中的一者或一者以上的实例性视频译码***10的框图。如本文中所描述,术语“视频译码器”一股指代视频编码器和视频解码器两者。在本发明中,术语“视频译码”或“译码”可一股指代视频编码或视频解码。
如图1中所示,视频译码***10包含源装置12和目的地装置14。源装置12产生经编码视频数据。因此,源装置12可被称作视频编码装置。目的地装置14可对由源装置12产生的经编码视频数据进行解码。因此,目的地装置14可被称作视频解码装置。源装置12及目的地装置14可为视频译码装置或设备的实例。
源装置12和目的地装置14可包括广泛范围的装置,包含桌上型计算机、移动计算装置、笔记本(例如,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如,所谓的“智能”电话)、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、汽车内计算机等。在一些实例中,源装置12和目的地装置14可经装备以用于无线通信。
目的地装置14可经由通道16从源装置12接收经编码视频数据。通道16可包括能够将经编码视频数据从源装置12移动到目的地装置14的类型的媒体或装置。在一个实例中,通道16可包括使得源装置12能够实时地将经编码视频数据直接发射到目的地装置14的通信媒体。在此实例中,源装置12可根据例如无线通信协议等通信标准来调制经编码视频数据,且可将经调制视频数据发射到目的地装置14。所述通信媒体可包括无线或有线通信媒体,例如射频(RF)频谱或一条或一条以上物理传输线。通信媒体可形成例如局域网、广域网或例如因特网的全球网络的基于包的网络的部分。通信媒体可包含促进从源装置12到目的地装置14的通信的路由器、交换器、基站或其它设备。
在另一实例中,通道16可对应于存储由源装置12产生的经编码视频数据的存储媒体。在此实例中,目的地装置14可经由磁盘存取或卡存取而存取存储媒体。所述存储媒体可包含多种本地存取的数据存储媒体,例如蓝光光盘、DVD、CD-ROM、快闪存储器,或用于存储经编码视频数据的其它合适的数字存储媒体。在进一步的实例中,通道16可包含文件服务器或存储由源装置12产生的经编码视频的另一中间存储装置。在此实例中,目的地装置14可经由流式传输或下载来存取存储于文件服务器或其它中间存储装置处的经编码视频数据。文件服务器可为能够存储经编码视频数据和将所述经编码视频数据发射到目的地装置14的类型的服务器。实例性文件服务器包含网络服务器(例如,用于网站)、文件传递协议(FTP)服务器、网络附接式存储(NAS)装置,或本地磁盘驱动器。目的地装置14可通过标准的数据连接(包含因特网连接)来存取经编码视频数据。数据连接的实例性类型可包含无线通道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器,等等),或适合于存取存储于文件服务器上的经编码视频数据的以上两者的组合。经编码视频数据从文件服务器的传输可为流式传输、下载传输,或两者的组合。
本发明的技术不限于无线应用或环境。所述技术可应用于支持多种多媒体应用(例如,空中电视广播、有线电视传输、***发射、流式视频传输(例如,经由因特网))中的任一者的视频译码、供存储于数据存储媒体上的数字视频的编码、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,视频译码***10可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频回放、视频广播和/或视频电话等应用。
在图1的实例中,源装置12包含视频源18、视频编码器20和输出接口22。在一些情况下,输出接口22可包含调制器/解调器(调制解调器)和/或发射器。在源装置12中,视频源18可包含例如视频俘获装置(例如,摄像机、含有先前俘获的视频数据的视频存档、用以从视频内容提供者接收视频数据的视频馈送接口)的源,和/或用于产生视频数据的计算机图形***的源,或此些源的组合。
视频编码器20可对所俘获的、预先俘获的或计算机产生的视频数据进行编码。可经由源装置12的输出接口22将经编码视频数据直接发射到目的地装置14。还可将经编码视频数据存储到存储媒体或文件服务器上以供稍后由目的地装置14存取以进行解码和/或回放。
在图1的实例中,目的地装置14包含输入接口28、视频解码器30和显示装置32。在一些情况下,输入接口28可包含接收器和/或调制器。目的地装置14的输入接口28经由通道16接收经编码视频数据。经解调视频数据可包含由视频编码器20产生的表示视频数据的多种语法元素。此些语法元素可与在通信媒体上发射、存储于存储媒体上或存储于文件服务器上的经编码视频数据包含在一起。
显示装置32可与目的地装置14一起集成,或可在所述目的地装置外部。在一些实例中,目的地装置14可包含集成式显示装置,且还可经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。一股来说,显示装置32向用户显示经解码视频数据。显示装置32可包括多种显示装置中的任一者,例如,液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20和视频解码器30可根据视频压缩标准来操作,例如目前在开发中的高效率视频译码(HEVC)标准,且可符合HEVC测试模型(HM)。被称作“HEVC工作草案”或“WD7”的即将到来的HEVC标准的最近草案描述于布洛斯(Bross)等人的文献JCTVC-I1003_d54“高效率视频译码(HEVC)文本规范草案7(High efficiency video coding (HEVC)textspecification draft7)”中,ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11的联合合作视频译码小组(JCT-VC)第九次会议:日内瓦,瑞士,2012年5月,其至2012年7月19日为止可从http://phenix.int-evry.fr/jct/doc_end_user/documents/9_Geneva/wg11/JCTVC-I1003-v6.zip下载,所述文献的全部内容以引用的方式并入本文中。或者,视频编码器20和视频解码器30可根据例如ITU-T H.264标准(或者被称作MPEG4第10部分,高级视频译码(AVC))或此类标准的扩展等其它专有或产业标准而操作。然而,本发明的技术不限于任何特定译码标准或技术。视频压缩标准和技术的其它实例包含MPEG-2、ITU-T H.263以及专有或开放源压缩格式,例如VP8和相关格式。
尽管图1的实例中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当的MUX-DEMUX单元或其它硬件及软件,以处置对共同数据流或单独数据流中的音频与视频两者的编码。在一些实例中,如果适用,MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
再次,图1仅是实例,且本发明的技术可应用于在编码装置与解码装置之间不一定包含任何数据通信的视频译码环境(例如,视频编码或视频解码)。在其它实例中,可从本地存储器检索数据,经由网络流式传输数据等。编码装置可编码数据且将数据存储到存储器,且/或解码装置可从存储器检索并解码数据。在许多实例中,编码和解码是由彼此不通信而是仅将数据编码到存储器和/或从存储器检索并解码数据的装置执行。
视频编码器20和视频解码器30各自可经实施为例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、硬件或其任何组合等多种合适电路中的任一者。当所述技术部分地在软件中实施时,一装置可将用于软件的指令存储于合适的非暂时性计算机可读存储媒体中,且可在硬件中使用一个或一个以上处理器来执行所述指令以执行本发明的技术。可将前述内容(包含硬件、软件、硬件与软件的组合等)中的任一者视为一个或一个以上处理器。视频编码器20和视频解码器30中的每一者可包含于一个或一个以上编码器或解码器中,所述视频编码器和视频解码器中的任一者可在相应装置中被集成为组合式编码器/解码器(CODEC)的一部分。
本发明可一股涉及视频编码器20将某一信息“用信号发送”到另一装置,例如视频解码器30。然而,应理解,视频编码器20可通过使某些语法元素与视频数据的各个经编码部分关联来用信号发送信息。也就是说,视频编码器20可通过将某些语法元素存储到视频数据的各个经编码部分的标头来“用信号发送”数据。一些情况下,可对此些语法元素进行编码和存储(例如,存储在存储***中),之后由视频解码器30接收和解码。因此,术语“信令”可一股指代用于对经压缩视频数据进行解码的语法或其它数据的通信。此通信可实时地或准实时地发生。替代地,此通信可在一段时间内发生,例如可能在编码时将语法元素存储到经编码位流中的媒体时发生,所述语法元素随后可由解码装置在被存储到此媒体之后的任何时间处检索。
如上文简要提及,视频编码器20对视频数据进行编码。所述视频数据可包括一个或一个以上图片。所述图片中的每一者可为形成视频的部分的静态图像。在一些例子中,可将图片称作视频“帧”。当视频编码器20对视频数据进行编码时,视频编码器20可产生位流。所述位流可包含形成视频数据的经译码表示的位序列。所述位流可包含经译码图片和相关联的数据。经译码图片可为图片的经译码表示。
为了产生位流,视频编码器20可对视频数据中的每个图片执行编码操作。当视频编码器20对图片执行编码操作时,视频编码器20可产生一系列经译码图片和相关联的数据。所述相关联的数据可包含序列参数集、图片参数集、调适参数集以及其它语法结构。序列参数集(SPS)可含有适用于零或更多图片序列的参数。图片参数集(PPS)可含有适用于零或更多图片的参数。调适参数集(APS)可含有适用于零或更多图片的参数。APS中的参数可为比PPS中的参数更有可能改变的参数。
为了产生经译码图片,视频编码器20可将图片分割为相等大小的视频块。视频块可为二维样本阵列。视频块中的每一者可对应于树块。在一些例子中,可将树块称作最大译码单元(LCU)或“译码树块”。HEVC的树块可广义上类似于先前标准(例如,H.264/AVC)的宏块。然而,树块不一定受限于特定大小,且可包含一个或一个以上译码单元(CU)。视频编码器20可使用四叉树分割来将树块的视频块分割为对应于CU的视频块,因此称为“树块”。
在一些实例中,视频编码器20可将图片分割为多个切片。所述切片中的每一者可包含整数数目的CU。在一些例子中,切片包括整数数目的树块。在其它例子中,切片的边界可在树块内。
作为对图片执行编码操作的部分,视频编码器20可对图片的每一切片执行编码操作。当视频编码器20对切片执行编码操作时,视频编码器20可产生所述切片的经编码表示。与所述切片相关联的经编码数据可被称作“经译码切片”。
为了产生经译码切片,视频编码器20可对切片中的每个树块执行编码操作。当视频编码器20对树块执行编码操作时,视频编码器20可产生经译码树块。所述经译码树块可为树块的经编码表示。
当视频编码器20产生经译码切片时,视频编码器20可根据光栅扫描次序或波前扫描次序对切片中的树块(其在此情况下表示最大译码单元)执行编码操作(即,编码)。换句话说,视频编码器20可以以下次序对切片的树块进行编码:越过切片中的树块的最顶行从左进行到右,随后越过树块的下一较低行从左进行到右,且以此类推,直到视频编码器20已对切片中的树块中的每一者进行编码为止。
作为根据光栅扫描次序或波前扫描次序对树块进行编码的结果,可能已对给定树块的左上方的树块进行编码,但尚未对给定树块的右下方的树块进行编码。因此,视频编码器20可能够在对给定树块进行编码时存取通过对给定树块的左上方的树块进行编码而产生的信息。然而,视频编码器20可不能够在对给定树块进行编码时存取通过对给定树块的右下方的树块进行编码而产生的信息。
为了产生经译码树块,视频编码器20可对树块的视频块递归地执行四叉树分割以将视频块划分为渐进更小的视频块。较小的视频块中的每一者可对应于不同的CU。举例来说,视频编码器20可将树块的视频块分割为四个相等大小的子块,将子块中的一者或一者以上分割为四个相等大小的子子块,以此类推。经分割的CU可为其视频块被分割为对应于其它CU的视频块的CU。未经分割的CU可为其视频块未被分割为对应于其它CU的视频块的CU。
位流中的一个或一个以上语法元素可指示视频编码器20可将树块的视频块进行分割的最大倍数。CU的视频块可为正方形形状。CU的视频块的大小(即,CU的大小)的范围可从8×8像素直到具有64×64像素或更大的树块的视频块的大小(即,树块的大小)。
视频编码器20可根据z扫描次序对树块的每一CU执行编码操作(即,编码)。换句话说,视频编码器20可以所述次序对左上CU、右上CU、左下CU以及随后右下CU进行编码。当视频编码器20对经分割的CU执行编码操作时,视频编码器20可根据z扫描次序对对应于经分割的CU的视频块的子块的CU进行编码。换句话说,视频编码器20可以所述次序对对应于左上子块的CU、对应于右上子块的CU、对应于左下子块的CU以及对应于右下子块的CU进行编码。
作为根据z扫描次序对树块的CU进行编码的结果,可已对当前CU上方、左上方、右上方、左边以及左下方的CU进行编码。尚未对当前CU的下方或右边的CU进行编码。因此,视频编码器20可能够在对当前CU进行编码时存取通过对与当前CU相邻的一些CU进行编码而产生的信息。然而,视频编码器20可不能够在对当前CU进行编码时存取通过对与当前CU相邻的其它CU进行编码而产生的信息。
当对当前CU进行编码时,视频编码器20可将当前CU分割为一个或一个以上预测单元(PU)。换句话说,视频编码器20可产生与当前CU相关联的一个或一个以上PU,其中所述一个或一个以上PU对应于与当前CU相对应的视频块的分区(例如,非重叠的子块)。视频编码器20可产生当前CU的每一PU的预测性视频块。对应于PU的预测性视频块可为样本块。本发明还可将对应于PU的预测性视频块称作PU的预测性视频块。视频编码器20可使用帧内预测或帧间预测来产生对应于当前CU的PU的预测性视频块。
当视频编码器20使用帧内预测来产生PU的预测性视频块时,视频编码器20可基于当前图片的样本来产生PU的预测性视频块。如果视频编码器20使用帧内预测来产生CU的PU的预测性视频块,那么CU是经帧内预测CU。
当视频编码器20使用帧间预测来产生PU的预测性视频块时,视频编码器20可基于除了当前图片之外的一个或一个以上图片的样本来产生PU的预测性视频块。如果视频编码器20使用帧间预测来产生CU的PU的预测性视频块,那么CU是经帧间预测CU。
此外,当视频编码器20使用帧间预测来产生PU的预测性视频块时,视频编码器20可产生PU的运动信息。PU的运动信息可指示一个或一个以上参考块。每一参考块可为参考图片内的视频块或从参考图片中的样本合成(例如,内插)的样本块。参考图片可为除了当前图片之外的图片。视频编码器20可基于参考块而产生PU的预测性视频块。
视频编码器20可根据各种分割模式将当前CU分割为一个或一个以上PU。举例来说,如果当前CU是经帧内预测CU,那么视频译码器20可根据2N×2N分割模式、N×N分割模式、2N×hN分割模式或hN×2N分割模式将当前CU分割为一个或一个以上PU。2N×hN分割模式和hN×2N分割模式可被称作短距离帧内预测(SDIP)分割模式。在这些分割模式的名义下,N可表示视频块的宽度或高度的二分之一,且h可指示大于0以及小于1的值。下文所描述的图4A到4D是说明在CU是经帧内预测CU时将CU分割为PU的实例性模式的概念图。
当视频编码器20根据2N×2N分割模式对当前CU进行分割时,视频编码器20不对当前CU进行分割。而是,当视频编码器20根据2N×2N分割模式对当前CU进行分割时,仅存在与当前CU相关联的单一PU。当视频编码器20根据N×N分割模式对当前CU进行分割时,视频译码器产生与当前CU相关联的四个正方形PU。正方形PU可为对应于正方形预测性视频块的PU。
当视频译码器根据2N×hN分割模式对当前CU进行分割时,视频译码器可产生与当前CU相关联的多个矩形、水平定向的PU。矩形、水平定向的PU可为对应于非正方形矩形预测性视频块的PU,其具有等于对应于当前CU的视频块的宽度的宽度。当视频译码器根据hN×2N分割模式对当前CU进行分割时,视频译码器可产生对应于当前CU的多个矩形、垂直定向的PU。矩形、垂直定向的PU可为对应于非正方形矩形预测性视频块的PU,其具有等于对应于当前CU的视频块的高度的高度。
视频编码器20可产生一个或一个以上SDIP语法元素,所述一个或一个以上SDIP语法元素界定借以在当前CU是经帧内预测CU时将当前CU分割为PU的模式。举例来说,所述SDIP语法元素可包含SDIP旗标以及SDIP方向旗标。SDIP旗标的第一值(例如,0)可指示将当前CU分割为一个或一个以上正方形PU。举例来说,SDIP旗标的第一值可指示根据2N×2N或N×N分割模式将当前CU分割为PU。SDIP旗标的第二值(例如,1)可指示将当前CU分割为多个矩形PU。SDIP方向旗标的第一值(例如,0)可指示将当前CU分割为多个垂直定向的矩形PU。SDIP方向旗标的第二值(例如,1)可指示将当前CU分割为多个水平定向的矩形PU。
在视频编码器20产生了对应于当前CU的一个或一个以上PU的预测性视频块之后,视频编码器20可产生对应于当前CU的残余视频块。残余视频块中的每一样本可具有等于当前CU的原始视频块中的对应样本与当前CU的PU的预测性视频块中的对应样本之间的差的值。原始视频块和预测性视频块中的每一样本可为与特定像素相关联的亮度或色度值。换句话说,当前CU的残余视频块可指示当前CU的PU的预测性视频块与当前CU的原始视频块中的样本之间的差。
此外,作为对当前CU执行编码操作的部分,视频编码器20可将当前CU分割为一个或一个以上变换单元(PU)。TU中的每一者可对应于不同的残余视频块。对应于TU的残余视频块可为对应于当前CU的残余视频块内的残余样本的非重叠块。
视频译码器20可向对应于TU的残余视频块应用一个或一个以上变换以产生对应于TU的变换系数块(即,变换系数的块)。在概念上,变换系数块可为变换系数的二维(2D)矩阵。
在产生变换系数块之后,视频编码器20可对变换系数块执行量化过程。量化一股指代其中将变换系数的层级量化以可能地减少用于表示变换系数的数据量从而提供进一步压缩的过程。量化过程可减少与变换系数中的一些或全部相关联的位深度。举例来说,n位变换系数可在量化期间下舍入到m位变换系数,其中n大于m。
视频编码器20可使每一CU与量化系数(QP)值相关联。与CU相关联的QP值可确定视频编码器20如何量化与CU相关联的变换系数块。视频编码器20可通过调整与CU相关联的QP值来调整向对应于CU的TU的变换系数块应用的量化的程度。
在视频编码器20量化变换系数块之后,视频编码器20可产生表示经量化变换系数块中的变换系数的多组语法元素。视频编码器20可对至少一些这些语法元素应用熵编码操作,例如CABAC编码操作。
为了将CABAC编码应用于语法元素,视频编码器20可首先识别CABAC上下文。CABAC上下文可识别对具有特定值的位进行译码的概率。举例来说,一CABAC上下文可指示对0值位进行译码的0.7概率以及对1值位进行译码的0.3概率。在识别CABAC上下文之后,视频编码器20可将区间划分为下部子区间和上部子区间。所述子区间中的一者可与值0相关联,且另一子区间可与值1相关联。子区间的宽度可与通过所识别的CABAC上下文针对相关联的值所指示的概率成比例。如果语法元素的位具有与下部子区间相关联的值,那么经编码值可等于下部子区间的下部边界。如果语法元素的相同位具有与上部子区间相关联的值,那么经编码值可等于上部子区间的下部边界。为了对语法元素的下一位进行编码,视频编码器20可在区间是与经编码位的值相关联的子区间的情况下重复这些步骤。当视频解码器20针对下一位重复这些步骤时,视频编码器20可基于由所识别的CABAC上下文指示的概率以及经编码的位的实际值来使用经修改的概率。
视频解码器30可接收由视频编码器20产生的位流。所述位流可包含由视频编码器20编码的视频数据的经译码表示。当视频解码器30接收位流时,视频解码器30可对所述位流执行解析操作。当视频解码器30执行所述解析操作时,视频解码器30可从所述位流提取语法元素。作为从所述位流提取语法元素的部分,视频解码器30可对至少一些所述语法元素执行熵解码操作。举例来说,视频解码器30可对至少一些所述语法元素(例如,SDIP语法元素)执行CABAC解码。
当视频解码器30对语法元素执行CABAC解码时,视频解码器30可识别CABAC上下文。视频解码器30可随后将区间划分为下部子区间和上部子区间。所述子区间中的一者可与值0相关联,且另一子区间可与值1相关联。子区间的宽度可与通过所识别的CABAC上下文针对相关联的值所指示的概率成比例。如果经编码值在下部子区间内,那么视频解码器30可对具有与所述下部子区间相关联的值的位进行解码。如果经编码值在上部子区间内,那么视频解码器30可对具有与所述上部子区间相关联的值的位进行解码。为了对语法元素的下一位进行解码,视频解码器30可在区间是含有经编码值的子区间的情况下重复这些步骤。当视频解码器30针对下一位重复这些步骤时,视频解码器30可基于由所识别的CABAC上下文指示的概率以及经解码的位来使用经修改的概率。
视频解码器30可基于从位流提取的语法元素来重构视频数据的图片。基于语法元素来重构视频数据的过程可一股与由视频编码器20执行以产生语法元素的过程互逆。
在视频解码器30提取与当前CU相关联的语法元素之后,视频解码器30可基于所述语法元素而产生对应于当前CU的PU的预测性视频块。另外,视频解码器30可对对应于当前CU的TU的变换系数块进行反量化。视频解码器30可对变换系数块执行反量化以重构对应于当前CU的TU的残余视频块。在产生预测性视频块并且重构残余视频块之后,视频解码器30可基于预测性视频块和残余视频块而重构当前CU的视频块。以此方式,视频解码器30可基于位流中的语法元素来重构对应于CU的视频块。
如上文所描述,如果当前CU是经帧内预测CU,那么视频编码器20可产生SDIP语法元素,所述SDIP语法元素至少部分地界定借以将当前CU分割为一组一个或一个以上PU的模式。根据本发明的一种或一种以上技术,视频编码器20可在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在一组一个或一个以上熵译码上下文中识别一熵译码上下文。视频编码器20可随后使用所识别的熵译码上下文对SDIP语法元素进行熵编码。
类似地,当视频解码器30从位流解析当前CU的SDIP语法元素时,视频解码器30可在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在所述组一个或一个以上熵译码上下文中识别一熵译码上下文。视频解码器30可随后使用所识别的熵译码上下文对SDIP语法元素进行熵解码。
因为视频编码器20和视频解码器30在不参考在当前图片中的当前CU上方的任何相邻CU的情况下识别熵译码上下文,所以可不需要视频编码器20或视频解码器30存储与在当前CU上方的CU相关联的信息来用于选择熵译码上下文的目的。因此,可不需要视频编码器20或视频解码器30包含线缓冲器来存储此信息。
视频译码器(例如,视频编码器20或视频解码器30)可以各种方式识别熵译码上下文以用于对当前CU的SDIP语法元素进行熵译码。举例来说,视频译码器可基于来自先前经译码的CU的SDIP语法元素来识别熵译码上下文。在此实例中,先前经译码的CU可为定位在当前图片内的当前CU的左边的CU。来自先前经译码的CU的SDIP语法元素可至少部分地界定其中将先前经译码的CU分割为PU的模式。在此实例中,先前经译码的CU可为与当前CU相同的大小。也就是说,对应于先前经译码的CU的视频块可为与对应于当前CU的视频块相同的大小。
在其它实例中,可存在定位在当前CU的左边的两个或两个以上先前经译码的CU。在此些实例中,视频译码器可基于在当前CU的左边的CU中的一者或一者以上的SDIP语法元素中的一者或一者以上的函数来识别用于对当前CU的SDIP语法元素进行熵译码的熵译码上下文。举例来说,视频译码器可基于两个或两个以上先前经译码的CU的SDIP语法元素的总和来识别熵译码上下文。举例来说,两个或两个以上先前经译码的CU的SDIP语法元素的总和可为识别用于对当前CU的对应SDIP语法元素进行熵译码的熵译码上下文的上下文索引。上下文索引可为在一组一个或一个以上熵译码上下文中识别一熵译码上下文的识别符,例如数字。
在另一实例中,视频译码器可基于两个或两个以上先前经译码的CU的SDIP语法元素的平均值来识别熵译码上下文。举例来说,两个或两个以上先前经译码的CU的SDIP语法元素的平均值可与识别用于对当前CU的对应SDIP语法元素进行熵译码的熵译码上下文的上下文索引相关联。在一些实例中,视频译码器可将SDIP语法元素的平均值四舍五入为最近的上下文索引。在其它实例中,不同的范围可与不同的上下文索引相关联。在此些实例中,视频译码器可在SDIP语法元素的平均值属于与上下文索引中的特定一者相关联的范围内的情况下识别上下文索引中的所述特定一者。
在另一实例中,视频译码器可基于两个或两个以上先前经译码的CU中的最大者的SDIP语法元素来识别熵译码上下文。举例来说,视频译码器可使用最大的先前经译码的CU的SDIP语法元素作为识别用于对当前CU的对应SDIP语法元素进行熵译码的熵译码上下文的上下文索引。
在另一实例中,视频译码器可基于两个或两个以上先前经译码的CU中的最高者的SDIP语法元素来识别熵译码上下文。举例来说,视频译码器可使用最高的先前经译码的CU的SDIP语法元素作为识别用于对当前CU的对应SDIP语法元素进行熵译码的熵译码上下文的上下文索引。
在另一实例中,视频译码器可基于定位在当前CU的左边缘的中心处或周围的两个或两个以上先前经译码的CU中的一者的SDIP语法元素来识别熵译码上下文。举例来说,视频译码器可使用当前CU的左边缘的中心处或周围的先前经译码的CU的SDIP语法元素作为识别用于对当前CU的对应SDIP语法元素进行熵译码的熵译码上下文的上下文索引。
在一些以上实例中,视频译码器可基于两个或两个以上先前经译码的CU的SDIP旗标中的一者或一者以上的函数来识别用于当前CU的SDIP旗标的熵译码上下文。类似地,在一些实例中,视频译码器可基于两个或两个以上先前经译码的CU的SDIP方向旗标中的一者或一者以上的函数来识别用于当前CU的当前SDIP方向旗标的熵译码上下文。
在另一实例中,视频译码器可基于当前CU的大小来识别用于对当前CU的SDIP语法元素进行熵编码的熵译码上下文。举例来说,如果当前CU是8×8CU,那么视频编码器可识别具有上下文索引0的熵译码上下文。在此实例中,如果当前CU是16×16CU,那么视频编码器可识别具有上下文索引1的熵译码上下文。此外,在此实例中,如果当前CU是32×32CU,那么视频编码器可识别具有上下文索引2的熵译码上下文。在一些实例中,视频译码器可使用相同的熵译码上下文对具有不同大小的CU的SDIP语法元素进行熵译码。
在另一实例中,视频译码器可基于当前CU的深度来识别用于对当前CU的SDIP语法元素进行熵译码的熵译码上下文。当前CU的深度可指示与当前CU相关联的树块的四叉树中的当前CU的层级。处于四叉树的不同深度处的CU可具有不同的大小。举例来说,如果当前CU处于第一层级(例如,CU_depth=1),那么视频编码器可识别具有上下文索引2的熵译码上下文。如果当前CU处于第二层级(例如,CU_depth=2),那么视频编码器可识别具有上下文索引1的熵译码上下文。如果当前CU处于第三层级(例如,CU_depth=3),那么视频编码器可识别具有上下文索引0的熵译码上下文。在一些实例中,视频译码器可使用相同的熵译码上下文对处于不同深度的CU的SDIP语法元素进行熵译码。
在另一实例中,视频译码器可基于当前CU的PU的帧内预测模式来识别用于对当前CU的SDIP语法元素进行熵译码的熵译码上下文。在此实例中,所识别的熵译码上下文的上下文索引可为当前CU的PU的帧内预测模式的函数。举例来说,视频译码器可针对具有类似方向的帧内预测模式而识别相同的熵译码上下文。举例来说,视频译码器可针对具有垂直或几乎垂直的方向的帧内预测模式(例如,帧内预测模式12、22、1、23,以此类推)而识别具有上下文索引0的熵译码上下文。视频译码器可针对具有水平或几乎水平的方向的帧内预测模式(例如,帧内预测模式2、30、31,以此类推)而识别具有上下文索引1的熵译码上下文。视频译码器可针对不具有较强的方向性的帧内预测模式(例如,模式3(帧内DC模式))而识别具有上下文索引2的熵译码上下文。下文所描述的图6是说明实例性帧内预测模式的概念图。
在另一实例中,所述组一个或一个以上熵译码上下文仅包含单个熵译码上下文。在此实例中,由视频译码器识别的熵译码上下文不取决于任何边信息。而是,视频译码器可使用单个熵译码上下文来用于对每个CU的SDIP语法元素进行熵译码。
FIG.图2是说明经配置以实施本发明的技术中的一者或一者以上的实例性视频编码器20的框图。图2是为了阐释的目的而提供,且不应被视为对本发明中广义上示范和描述的技术的限制。为了阐释的目的,本发明在HEVC译码的上下文中描述视频编码器20。然而,本发明的技术可适用于其它译码标准或方法。
在图2的实例中,视频编码器20包含多个功能组件。视频编码器20的功能组件包含预测处理单元100、残差产生单元102、变换处理单元104、量化单元106、反量化单元108、反变换处理单元110、重构单元112、过滤器单元113、经解码图片缓冲器114以及熵编码单元116。预测处理单元100包含帧间预测处理单元121、运动估计单元122、运动补偿单元124以及帧内预测处理单元126。在其它实例中,视频编码器20可包含更多、更少或不同的功能组件。此外,运动估计单元122与运动补偿单元124可高度集成,但出于阐释的目的而在图2的实例中分开地表示。
虽然本发明将视频编码器20的功能组件描述为单元,但将理解,可以各种方式实施与此些单元相关联的功能性,例如软件、硬件或硬件与软件的各种组合。此外,在一些实例中,与此类单元相关联的功能性未由离散模块单元提供。
视频编码器20可接收视频数据。视频编码器20可接收从各种源接收视频数据。举例来说,视频编码器20可从视频源18(图1)或另一源接收视频数据。所述视频数据可表示一系列图片。为了对视频数据进行编码,视频编码器20可对图片中的每一者执行编码操作。作为对图片执行编码操作的部分,视频编码器20可对图片的每一切片执行编码操作。作为对切片执行编码操作的部分,视频编码器20可对切片中的树块执行编码操作。
作为对树块执行编码操作的部分,预测处理单元100可对树块的视频块执行四叉树分割以将视频块划分为渐进更小的视频块。较小的视频块中的每一者可对应于不同的CU。举例来说,预测处理单元100可将对应于树块的视频块分割为四个相等大小的子块,将子块中的一者或一者以上分割为四个相等大小的子子块,以此类推。
对应于CU的视频块的大小的范围可从8×8样本直到具有最大64×64样本或更大的树块的大小。在本发明中,“N×N”与“N乘N”可以可互换地使用,以在垂直和水平尺寸方面指代视频块的样本尺寸,例如16×16样本或16乘16样本。一股来说,16×16视频块具有在垂直方向上的十六个样本(y=16)和在水平方向上的十六个样本(x=16)。同样地,N×N块一股具有在垂直方向上的N个样本和在水平方向上的N个样本,其中N表示非负整数值。
视频编码器20可对树块的每一未分割的CU执行编码操作。当视频编码器20对未分割的CU执行编码操作时,视频编码器20可产生所述未分割的CU的经编码表示。
作为对当前CU执行编码操作的部分,预测处理单元100可将当前CU分割为一个或一个以上PU。视频编码器20可根据各种分割模式对当前CU进行分割。假设当前CU的大小是2N×2N,视频编码器20可根据用于帧内预测的2N×2N、N×N、2N×hN或hN×2N分割模式对当前CU进行分割。如果视频编码器20使用帧内预测对当前CU进行编码,那么视频编码器20可产生指示用于将当前CU分割为一个或一个以上PU的分割模式的一个或一个以上SDIP语法元素。视频编码器20可根据用于帧内预测的2N×2N、2N×N、N×2N、N×N或类似分割模式对当前CU进行分割。视频编码器20还可支持用于帧间预测的不对称分割模式,例如2N×nU、2N×nD、nL×2N和nR×2N分割模式。在一些实例中,视频编码器20可通过使用至少一些所述分割模式对当前CU进行编码并且比较速率-失真结果来选择用于当前CU的分割模式。
帧间预测处理单元121可对当前CU的每一PU执行帧间预测。帧间预测可提供依赖于时间冗余的压缩。当帧间预测处理单元121对PU执行帧间预测时,帧间预测处理单元121可产生PU的预测性数据。PU的预测性数据可包含对应于PU的预测性视频块以及PU的运动信息。帧间预测处理单元121可基于除了当前图片之外的一个或一个以上图片(即,参考图片)的样本来产生预测性视频块。
切片可为I切片、P切片或B切片。运动估计单元122和运动补偿单元124可依据PU在I切片、P切片还是B切片中而对CU的PU执行不同的操作。在I切片中,所有PU都被帧内预测。因此,如果PU在I切片中,那么运动估计单元122和运动补偿单元124不对PU执行帧间预测。
当PU在P切片中时,运动估计单元122可搜索第一参考图片列表(例如,列表0)中的参考图片以寻找最紧密对应于PU的视频块的样本块。在一些实例中,列表0中所列举的每一参考图片以显示次序出现在当前图片之前。在一些例子中,运动估计单元122可对来自参考图片中的实际亮度或色度样本的所识别的样本块进行内插。在识别样本块之后,运动估计单元122可产生指示列表0中的含有所识别的样本块的参考图片的参考图片索引以及指示PU与所识别的样本块之间的空间移位的运动向量。运动估计单元122可输出数据,视频解码器可使用所述数据来确定参考图片索引和PU的运动向量。运动补偿单元124可基于由参考图片索引和PU的运动向量指示的样本块而产生对应于PU的预测性视频块。举例来说,运动补偿单元124可产生对应于PU的预测性视频块,使得所述预测性视频块与所识别的样本块匹配。
运动估计单元122可根据不同的精确程度产生运动向量。举例来说,运动估计单元122可以四分之一样本精度、八分之一样本精度或其它分数样本精度产生运动向量。在分数样本精度的情况下,运动补偿单元124可从参考图片中的整数位置样本值内插用于产生预测性视频块的样本块。
如果当前CU在B切片中,那么运动估计单元122可对当前CU的PU执行单向帧间预测或双向帧间预测。当运动估计单元122对B切片中的PU执行单向帧间预测时,运动估计单元122可搜索列表0或第二参考图片列表(例如,列表1)的参考图片以寻找对应于与PU相对应的视频块的样本块。运动估计单元122可随后产生指示列表0或列表1中的含有所识别的样本块的参考图片的参考图片索引(ref_idx)以及指示所识别的样本块与PU之间的空间移位的运动向量。运动估计单元122还可产生预测方向(pred_dir)指示符,其指示PU是基于列表0中的参考图片被单向帧间预测还是基于列表1中的参考图片被单向帧间预测。运动估计单元122可输出数据,所述数据使得视频解码器能够确定参考图片索引、预测方向指示符和PU的运动向量。运动补偿单元124可基于由参考图片索引、预测方向指示符和PU的运动向量指示的样本块而产生对应于PU的预测性视频块。
当运动估计单元122对PU执行双向帧间预测时,运动估计单元122可搜索列表0中的参考图片以及列表1中的参考图片以寻找对应于PU的视频块的样本块。运动估计单元122可随后产生指示列表0和列表1中的含有所识别的样本块的参考图片的参考图片索引以及指示所识别的样本块与PU之间的空间移位的运动向量。运动估计单元122还可产生指示PU被双向帧间预测的一个或一个以上预测方向指示符。运动估计单元122可输出数据,视频解码器可使用所述数据来确定参考图片索引、运动向量以及一个或一个以上预测方向指示符以作为PU的运动信息。运动补偿单元124可基于由参考图片索引、预测方向指示符和PU的运动向量指示的样本块而产生对应于PU的预测性视频块。
作为对CU执行编码操作的部分,帧内预测处理单元126可对CU的PU执行帧内预测。帧内预测可提供空间压缩帧内预测处理单元126可对I切片、P切片和B切片中的PU执行帧内预测。当帧内预测处理单元126对PU执行帧内预测时,帧内预测处理单元126可基于相同图片中的其它PU的经解码样本而产生PU的预测性数据。PU的预测性数据可包含预测性视频块和各种语法元素。
为了对PU执行帧内预测,帧内预测处理单元126可使用多个帧内预测模式来产生PU的多组预测性数据。当帧内预测处理单元126使用帧内预测模式来产生PU的一组预测性数据时,帧内预测处理单元126可在与帧内预测模式相关联的方向和/或梯度上越过PU的视频块来扩展来自相邻PU的视频块的样本。假设用于PU、CU和树块的从左到右、从上到下译码次序,所述相邻PU可在PU的上方、右上方、左上方,或左边。帧内预测处理单元126可使用各种数目的帧内预测模式,例如33个方向性帧内预测模式。在一些实例中,帧内预测模式的数目可取决于PU的大小。
预测处理单元100可从由运动补偿单元124针对PU产生的预测性数据或者由帧内预测处理单元126针对PU产生的预测性数据中选择PU的预测性数据。在一些实例中,预测处理单元100基于多组预测性数据的速率/失真度量来选择PU的预测性数据。
如果预测处理单元100选择由帧内预测处理单元126产生的预测性数据,那么预测处理单元100可用信号通知曾用于产生PU的预测性数据的帧内预测模式,即选定的帧内预测模式。预测处理单元100可以各种方式用信号通知选定的帧内预测模式。举例来说,选定的帧内预测模式与相邻PU的帧内预测模式相同可为可能的。换句话说,相邻PU的帧内预测模式可为当前PU的最可能模式(MPM)。因此,预测处理单元100可产生语法元素来指示选定的帧内预测模式与相邻PU的帧内预测模式相同。
在预测处理单元100选择了当前CU的PU的预测性数据之后,残差产生单元102可通过从当前CU的视频块减去当前CU的PU的预测性视频块来产生当前CU的残余数据。CU的残余数据可包含对应于当前CU的视频块中的样本的不同样本分量的2D残余视频块。举例来说,残余数据可包含对应于当前CU的PU的预测性视频块中的样本的亮度分量与当前CU的原始视频块中的样本的亮度分量之间的差的残余视频块。另外,当前CU的残余数据可包含对应于当前CU的PU的预测性视频块中的样本的色度分量与当前CU的原始视频块中的样本的色度分量之间的差的残余视频块。
预测处理单元100可执行四叉树分割以将当前CU的残余视频块分割为子块。每一未划分的残余视频块可对应于当前CU的不同TU。对应于当前CU的TU的残余视频块的大小和位置可基于或可不基于对应于当前CU的PU的预测性视频块的大小和位置。被称为“残余四叉树”(RQT)的四叉树结构可包含与残余视频块中的每一者相关联的节点。当前CU的TU可对应于RQT的叶节点。
对于I模式以及P或B模式两者,将预测误差(即,正被编码的块中的样本与所预测的块中的样本之间的差)表示为某一离散变换(例如,离散余弦变换(DCT))的一组经加权基础函数。对于当前CU的每一TU,变换处理单元104可通过将一个或一个以上变换应用于对应于TU的残余视频块而产生对应于TU的一个或一个以上变换系数块。变换系数块中的每一者可为变换系数的2D矩阵。变换处理单元104可将各种变换应用于残余视频块。举例来说,变换处理单元104可对残余视频块应用离散余弦变换(DCT)、方向性变换或概念上类似的变换。所述变换可经配置以将空间域残余像素值变换到变换域(例如,频域)中的系数。所述变换系数可形成基本变换的基础函数的权数。
在变换处理单元104产生对应于TU的变换系数块之后,量化单元106可量化变换系数块中的变换系数。量化单元106可基于与当前CU相关联的QP值来量化对应于CU的TU的变换系数块。
视频编码器20可以各种方式使QP值与当前CU相关联。举例来说,视频编码器20可对与当前CU相关联的树块执行速率-失真分析。在速率-失真分析中,视频编码器20可通过使用不同模式多次对树块执行编码操作来产生所述树块的多个经译码表示。当视频编码器20产生树块的不同的经编码表示时,视频编码器20可使不同的QP值与当前CU相关联。在一些实例中,在给定QP值与具有最低的位速率和失真度量的树块的经译码表示中的当前CU相关联时,视频编码器20可用信号通知给定QP值与当前CU相关联。在其它实例中,视频编码器20可测试各种QP值以确定产生满足阈值的CU的经编码表示的QP值,甚至在CU的经编码表示不具有最佳位速率和失真度量的情况下也如此。
反量化单元108及反变换处理单元110可分别向变换系数块应用反量化及反变换,以从变换系数块重构残余视频块。重构单元112可将经重构的残余视频块添加到来自由预测处理单元100产生的一个或一个以上预测性视频块的对应样本,从而产生对应于TU的经重构视频块。通过以此方式重构当前CU的每一TU的视频块,视频编码器20可重构当前CU的视频块。
在重构单元112(表示为求和器)重构当前CU的视频块之后,过滤器单元113可执行解块操作以减少对应于当前CU的视频块中的成块性假影。在执行一个或一个以上解块操作之后,过滤器单元113可将当前CU的经重构视频块存储在经解码图片缓冲器114中以用于当前图片中的其它CU的帧内预测译码或其它图片中的CU的帧间预测译码。运动估计单元122和运动补偿单元124可使用含有经重构视频块的参考图片来对后续图片的PU执行帧间预测。另外,帧内预测处理单元126可使用经解码图片缓冲器114中的经重构视频块来对当前图片中的其它PU执行帧内预测。
熵编码单元116可从视频编码器20的其它功能组件接收数据。举例来说,熵编码单元116可从量化单元106接收变换系数块,且可从预测处理单元100接收语法元素。当熵编码单元116接收数据时,熵编码单元116可执行一个或一个以上熵编码操作以产生经熵编码数据。举例来说,视频编码器20可对数据执行上下文自适应可变长度译码(CAVLC)操作、CABAC操作、可变-可变(V2V)长度译码操作、基于语法的上下文自适应二进制算术译码(SBAC)操作、概率区间分割熵(PIPE)译码操作,或另一类型的熵编码操作。熵编码单元116可输出包含经熵编码数据的位流。
作为对数据执行熵编码操作的部分,熵编码单元116可选择上下文模型。如果熵编码单元116执行CABAC操作,那么所述上下文模型可指示对具有特定值的特定二进位进行译码的概率的估计。在CABAC的上下文中,术语“二进位”用于指代语法元素的二进制化版本的位。举例来说,根据本发明的技术,熵译码单元116可在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在一组一个或一个以上熵译码上下文中识别一熵译码上下文。熵译码单元116可随后使用所识别的熵译码上下文对当前CU的SDIP语法元素进行熵编码。
图3是说明经配置以实施本发明的技术中的一者或一者以上的实例性视频解码器30的框图。图3是为了阐释的目的而提供,且不对本发明中广义上示范和描述的技术进行限制。为了阐释的目的,本发明在HEVC译码的上下文中描述视频解码器30。然而,本发明的技术可适用于其它译码标准或方法。
在图3的实例中,视频解码器30包含多个功能组件。视频解码器30的功能组件包含熵解码单元150、预测处理单元152、反量化单元154、反变换处理单元156、重构单元158、过滤器单元159以及经解码图片缓冲器160。预测处理单元152包含运动补偿单元162和帧内预测处理单元164。在其它实例中,视频解码器30可包含更多、更少或不同的功能组件。
虽然本发明将视频解码器30的功能组件描述为模块,但将理解,可以各种方式实施与此类模块相关联的功能性,例如软件、硬件或硬件与软件的各种组合。此外,在一些实例中,与此类模块相关联的功能性未由离散模块单元提供。
视频解码器30可接收包括经编码视频数据的位流。所述位流可包含多个语法元素。当视频解码器30接收位流时,熵解码单元150可对所述位流执行解析操作。作为对位流执行解析操作的结果,熵解码单元150可从所述位流提取语法元素。作为执行所述解析操作的部分,熵解码单元150可对所述位流中的经熵编码语法元素进行熵解码。预测处理单元152、反量化单元154、反变换处理单元156、重构单元158以及过滤器单元159可执行重构操作,所述重构操作基于从位流提取的语法元素而产生经解码视频数据。
作为从所述位流提取语法元素的部分,熵解码单元150可执行从经译码CU提取语法元素的解析操作。熵解码单元150可随后对至少一些所述语法元素执行熵解码操作。举例来说,根据本发明的技术,熵解码单元150可在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在一组一个或一个以上熵译码上下文中识别一熵译码上下文。在此实例中,熵解码单元150可使用所识别的熵译码上下文对当前CU的SDIP语法元素进行熵解码。
在熵解码单元150提取了当前CU的语法元素之后,视频解码器30可对当前CU执行重构操作。为了对当前CU执行重构操作,视频解码器30可对当前CU的每一TU执行重构操作。通过对当前CU的每一TU执行重构操作,视频解码器30可重构与当前CU相关联的残余视频块。
作为对TU执行重构操作的部分,反量化单元154可将对应于TU的变换系数块反量化,即,解量化。反量化单元154可以类似于针对HEVC而提出或由H.264解码标准界定的反量化过程的方式将变换系数块反量化。反量化单元154可使用由视频编码器20针对当前CU计算的量化参数QP以确定量化程度,以及同样反量化单元154要应用的反量化的程度。
在反量化单元154将对应于TU的变换系数块反量化之后,反变换处理单元156可依序应用一个或一个以上变换以产生对应于TU的残余视频块。举例来说,反变换处理单元156可依序向变换系数块应用反DCT、反整数变换、反卡胡嫩-罗孚(Karhunen-Loeve)变换(KLT)、反旋转变换、反方向性变换,或另一反变换,以便产生残余视频块。
在一些实例中,反变换处理单元156可基于来自视频编码器20的信令来确定要应用于变换系数块的反变换。在其它实例中,反变换处理单元156可从一个或一个以上译码特性(例如,块大小、译码模式等)来推断反变换。在一些实例中,反变换处理单元156可应用级联反变换。
在一些实例中,运动补偿单元162可通过基于内插过滤器执行内插来细化PU的预测性视频块。待用于具有子样本精度的运动补充的内插过滤器的识别符可包含在语法元素中。运动补偿单元162可使用由视频编码器20在PU的预测性视频块的产生期间所使用的相同内插过滤器来计算参考块的子整数样本的内插值。运动补偿单元162可根据所接收的语法信息来确定由视频编码器20使用的内插过滤器且使用所述内插过滤器来产生预测性视频块。
如果使用帧内预测对PU进行编码,那么帧内预测处理单元164可执行帧内预测来产生PU的预测性数据块。举例来说,帧内预测处理单元164可基于位流中的语法元素来确定PU的帧内预测模式。所述位流可包含帧内预测处理单元164可用于确定PU的帧内预测模式的语法元素。
重构单元158可使用对应于当前CU的TU的残余视频块以及CU的PU的预测性视频块来重构当前CU的视频块。举例来说,重构单元158可将残余视频块添加到预测性视频块以重构对应于当前CU的视频块。
在重构单元158重构CU的视频块之后,过滤器单元159可执行解块操作以减少经重构视频块中的成块性假影。在过滤器单元159执行解块操作之后,视频解码器30可将CU的视频块存储在经解码图片缓冲器160中。经解码图片缓冲器160可提供参考图片以用于后续的运动补偿、帧内预测以及在显示装置(例如,图1的显示装置32)上的呈现。
图4A到4D是说明在CU是经帧内预测CU时将译码单元(CU)分割为PU的实例性模式的概念图。如图4A的实例中所说明,根据2N×2N分割模式对CU200进行分割。因此,CU200仅与和CU200相同大小的单个PU202相关联。如图4B的实例中所说明,根据N×N分割模式对CU210进行分割。因此,CU210与四个正方形PU212A-212D相关联。如图4C的实例中所说明,根据2N×hN分割模式对CU220进行分割。因此,在图4C的实例中,CU220与四个水平定向的矩形PU222A-222D相关联。在图4D的实例中,根据hN×2N分割模式对CU230进行分割。因此,在图4D的实例中,CU230与四个垂直定向的矩形PU232A-232D相关联。
图5A是说明实例性CU250的概念图,视频译码器可从所述实例性CU识别用于对当前CU252的SDIP语法元素进行熵译码的熵译码上下文。在图5A的实例中,CU250定位在当前CU252的左边。因此,CU250是先前经译码的CU。在一些实例中,视频译码器可基于CU250的语法元素来识别用于对当前CU252的SDIP语法元素进行熵译码的熵译码上下文。举例来说,视频译码器可基于CU250的SDIP旗标来识别用于对当前CU252的SDIP旗标进行熵译码的熵译码上下文。类似地,视频译码器可基于CU250的SDIP方向旗标来识别用于对当前CU252的SDIP方向旗标进行熵译码的熵译码上下文。以此方式,视频译码器可在不参考当前CU252上方的CU的情况下识别用于对当前CU252的SDIP语法元素进行熵译码的熵译码上下文。
FIG.图5B是说明其它实例性CU的概念图,视频译码器可从所述实例性CU识别用于对当前CU260的SDIP语法元素进行熵译码的熵译码上下文。在图5B的实例中,CU262、264和266定位在当前CU260的左边。在一些实例中,视频译码器可基于CU262、264和266的SDIP语法元素中的一者或一者以上的函数来识别用于对当前CU260的SDIP语法元素进行熵译码的熵译码上下文。举例来说,视频译码器可基于CU262、264和266的SDIP旗标或SDIP方向旗标的总和或平均值来识别熵译码上下文。在另一实例中,视频译码器可基于在当前CU260左边的CU中的最大者(即,CU266)的SDIP语法元素来识别用于对当前CU260的SDIP语法元素进行熵译码的熵译码上下文。在另一实例中,视频译码器可基于定位在当前CU260左边的最高CU(即,CU262)的SDIP语法元素来识别用于对当前CU260的SDIP语法元素进行熵译码的熵译码上下文。在另一实例中,视频译码器可基于定位在当前CU260的左边缘的中心处或周围的CU(即,CU264或CU266)的SDIP语法元素来识别用于对当前CU260的SDIP语法元素进行熵译码的熵译码上下文。
图6是说明实例性帧内预测模式的概念图。在一些实例中,视频译码器可基于当前CU的帧内预测模式来识别用于对当前CU的SDIP语法元素进行熵译码的熵译码上下文。在一些此类实例中,在当前CU具有垂直或几乎垂直的帧内预测模式(例如,帧内预测模式4、20、11、21、0、22、12、23和5)时,视频译码器可识别第一熵译码上下文。在当前CU具有水平或几乎水平的帧内预测模式(例如,帧内预测模式7、28、15、29、1、30、16、31和8)时,视频译码器可识别第二熵译码上下文。在当前CU具有不具有较强的方向性的帧内预测模式(例如,帧内预测模式2、34、33、17、32、27、14、26、3、18、10、19、24、13和25)时,视频译码器可识别第三熵译码上下文。
图7是说明根据本发明的一种或一种以上技术的视频译码器的实例性操作300的流程图。在图7的实例中,视频译码器可在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在一组一个或一个以上熵译码上下文中识别一熵译码上下文(302)。另外,视频译码器可使用所识别的熵译码上下文对SDIP语法元素进行熵译码(304)。SDIP语法元素可至少部分地界定借以将当前CU分割为一组一个或一个以上PU的模式。举例来说,SDIP语法元素可指示是否将当前CU分割为一个或一个以上正方形PU。在另一实例中,SDIP语法元素可指示是否将当前CU分割为多个垂直定向或水平定向的矩形PU。
图8是说明根据本发明的一种或一种以上技术的视频编码器20的实例性操作350的流程图。虽然参考图1的视频编码器20来描述操作350,但操作350不受如此限制。为了易于阐释,图8的实例假设当前CU是经帧内预测CU。
在图8的实例中,视频编码器20可选择其中将当前CU分割为一个或一个以上PU的模式(352)。视频编码器20可随后产生当前CU的SDIP语法元素(354)。SDIP语法元素可至少部分地界定借以将当前CU分割为一组一个或一个以上PU的模式。视频编码器20可随后执行帧内预测来产生对应于当前CU的PU的预测性视频块(356)。视频编码器20可基于所述预测性视频块以及当前CU的视频块来产生对应于当前CU的TU的残余视频块(358)。在产生对应于当前CU的TU的一个或一个以上残余视频块之后,视频编码器20可应用一个或一个以上变换以将残余视频块转换为对应于当前CU的TU的变换系数块(360)。
视频编码器20可在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在一组一个或一个以上熵译码上下文中识别一熵译码上下文(362)。另外,视频编码器20可使用所识别的熵译码上下文对当前CU的SDIP语法元素进行熵编码(364)。举例来说,视频编码器20可使用所识别的熵译码上下文对SDIP语法元素执行CABAC编码操作。随后,视频编码器20可输出位流,所述位流包含SDIP语法元素、变换系数块以及其它语法元素的经编码表示(366)。
图9是说明根据本发明的一种或一种以上技术的视频解码器30的实例性操作400的流程图。虽然参考图1的视频解码器30来描述操作400,但操作400不受如此限制。为了易于阐释,图9的此实例假设当前CU是经帧内预测CU。
在图9的实例中,视频解码器30可在不参考在当前图片中的当前CU上方的任何相邻CU的情况下在一组一个或一个以上熵译码上下文中识别一熵译码上下文(402)。另外,视频解码器30可使用所识别的熵译码上下文对当前CU的SDIP语法元素进行熵解码(404)。举例来说,视频解码器30可使用所识别的熵译码上下文对SDIP语法元素执行CABAC解码操作。
视频解码器30可随后至少部分地基于当前CU的SDIP语法元素来确定其中将当前CU分割为一个或一个以上PU的模式(406)。视频解码器30可随后执行帧内预测来产生对应于与当前CU相关联的一个或一个以上PU的预测性视频块(408)。另外,视频解码器30可应用一个或一个以上变换以将对应于当前CU的TU的变换系数块转换为对应于当前CU的TU的残余视频块(410)。随后,视频解码器30可基于对应于当前CU的TU的残余视频块以及对应于当前CU的PU的预测性视频块来产生对应于当前CU的样本块(412)。视频解码器30可随后输出对应于当前CU的样本块以供显示(414)。
在一个或一个以上实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么所述功能可作为一个或一个以上指令或代码存储在计算机可读媒体上或经由计算机可读媒体进行传输且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体(其对应于例如数据存储媒体等有形媒体)或通信媒体,通信媒体包含促进(例如)根据通信协议将计算机程序从一处传递到另一处的任何媒体。以此方式,计算机可读媒体一股可对应于(1)非暂时性的有形计算机可读存储媒体或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一个或一个以上计算机或一个或一个以上处理器存取以检索指令、代码和/或数据结构来用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
举例来说且并非限制,所述计算机可读媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,快闪存储器,或可用于存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。同样,可适当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波的无线技术从网站、服务器或其它远程源传输软件,则同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电及微波的无线技术包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它瞬时媒体,而是针对于非瞬时的、有形存储媒体。如本文中所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘及蓝光光盘,其中磁盘通常磁性地重现数据,而光盘使用激光光学地重现数据。以上各者的组合也应包含在计算机可读媒体的范围内。
可由例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一个或一个以上处理器来执行所述指令。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可提供于经配置以用于编码及解码的专用硬件模块和/或软件模块内,或并入组合式编解码器中。并且,可将所述技术完全实施于一个或一个以上电路或逻辑元件中。
本发明的技术可实施于广泛多种装置或设备中,包含无线手持机、集成电路(IC)或IC组(例如,芯片组)。本发明中描述各种组件、模块或单元来强调经配置以执行所揭示的技术的装置的若干功能性方面,但不一定需要通过不同的硬件或软件单元来实现。而是,如上文所描述,各种组件、模块和单元可联合合适的软件和/或固件而组合于编解码器硬件单元中或通过互操作的硬件单元的集合(包含如上文所描述的一个或一个以上处理器)来提供。
已描述了各种实例。这些及其它实例属于所附权利要求书的范围内。

Claims (14)

1.一种视频解码方法,其包括:
接收经编码视频数据;
在一组一个或多个熵译码上下文中识别一熵译码上下文,其中识别所述熵译码上下文包括基于当前译码单元CU的预测单元PU的帧内预测模式来识别所述熵译码上下文,所述当前CU具有一个或多个PU;以及
使用所识别的熵译码上下文对短距离帧内预测SDIP语法元素进行熵解码,所述SDIP语法元素至少部分地界定借以将所述当前CU分割为所述一个或多个PU的模式。
2.根据权利要求1所述的视频解码方法,其中对所述SDIP语法元素进行熵解码包括使用所述所识别的熵译码上下文对所述SDIP语法元素执行上下文自适应二进制算术译码CABAC。
3.根据权利要求1所述的视频解码方法,其中识别所述熵译码上下文包括在不存取存储与所述当前CU上方的CU相关联的信息的线缓冲器的情况下,在所述一组一个或多个熵译码上下文中识别所述熵译码上下文。
4.根据权利要求1所述的视频解码方法,其进一步包括:
在对所述SDIP语法元素进行熵解码之后,至少部分地基于所述SDIP语法元素来确定借以将所述当前CU分割为所述一个或多个PU的所述模式;
应用一个或多个变换以将对应于所述当前CU的变换单元TU的变换系数块转换为对应于所述当前CU的所述TU的残余视频块;
执行帧内预测以产生对应于与所述当前CU相关联的所述一个或多个PU的预测性视频块;
基于所述残余视频块和所述预测性视频块来产生对应于所述当前CU的样本块;以及
输出对应于所述当前CU的所述样本块以供显示。
5.根据权利要求1所述的视频解码方法,
其中所述SDIP语法元素的第一值指示将所述当前CU分割为一个或一个以上正方形PU,且
其中所述SDIP语法元素的第二值指示将所述当前CU分割为多个矩形PU。
6.根据权利要求1所述的视频解码方法,
其中所述SDIP语法元素的第一值指示将所述当前CU分割为多个垂直定向的矩形PU,且
其中所述SDIP语法元素的第二值指示将所述当前CU分割为多个水平定向的矩形PU。
7.一种视频解码设备,其包括
数据存储媒体,其存储经编码视频数据;以及
一个或多个处理器,所述一个或多个处理器经配置以:
接收所述经编码视频数据;
在一组一个或多个熵译码上下文中识别一熵译码上下文,其中所述一个或多个处理器基于当前译码单元CU的预测单元PU的帧内预测模式来识别所述熵译码上下文,所述当前CU具有一个或多个PU;以及
使用所识别的熵译码上下文对短距离帧内预测SDIP语法元素进行熵解码,所述SDIP语法元素至少部分地界定借以将所述当前CU分割为所述一个或多个PU的模式。
8.根据权利要求7所述的视频解码设备,其中所述一个或一个以上处理器经配置以使用所述所识别的熵译码上下文对所述SDIP语法元素执行上下文自适应二进制算术译码CABAC。
9.根据权利要求7所述的视频解码设备,其中所述一个或多个处理器经配置以在不存取存储与所述当前CU上方的CU相关联的信息的线缓冲器的情况下,在所述一组一个或多个熵译码上下文中识别所述熵译码上下文。
10.根据权利要求7所述的视频解码设备,其中所述一个或多个处理器经配置以:
在对所述SDIP语法元素进行熵解码之后,至少部分地基于所述SDIP语法元素来确定借以将所述当前CU分割为所述一个或多个PU的所述模式;
应用一个或多个变换以将对应于所述当前CU的变换单元TU的变换系数块转换为对应于所述当前CU的所述TU的残余视频块;
执行帧内预测以产生对应于与所述当前CU相关联的所述一个或多个PU的预测性视频块;
基于所述残余视频块和所述预测性视频块来产生对应于所述当前CU的样本块;以及
输出对应于所述当前CU的所述样本块以供显示。
11.根据权利要求7所述的视频解码设备,
其中所述SDIP语法元素的第一值指示将所述当前CU分割为一个或一个以上正方形PU,且
其中所述SDIP语法元素的第二值指示将所述当前CU分割为多个矩形PU。
12.根据权利要求7所述的视频解码设备,
其中所述SDIP语法元素的第一值指示将所述当前CU分割为多个垂直定向的矩形PU,且
其中所述SDIP语法元素的第二值指示将所述当前CU分割为多个水平定向的矩形PU。
13.一种视频解码设备,其包括:
用于接收经编码视频数据的装置;
用于在一组一个或多个熵译码上下文中识别一熵译码上下文的装置,其中识别所述熵译码上下文包括基于当前译码单元CU的预测单元PU的帧内预测模式来识别所述熵译码上下文,所述当前CU具有一个或多个PU;以及
用于使用所识别的熵译码上下文对短距离帧内预测SDIP语法元素进行熵解码的装置,所述SDIP语法元素至少部分地界定借以将所述当前CU分割为所述一个或多个PU的模式。
14.根据权利要求13所述的视频解码设备,其中所述用于识别所述熵译码上下文的装置包括用于在不存取存储与所述当前CU上方的CU相关联的信息的线缓冲器的情况下,在所述一组一个或多个熵译码上下文中识别所述熵译码上下文的装置。
CN201280045204.6A 2011-09-16 2012-09-14 用于视频译码中的短距离帧内预测的线缓冲器减少 Expired - Fee Related CN103797802B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201161535797P 2011-09-16 2011-09-16
US61/535,797 2011-09-16
US201161555354P 2011-11-03 2011-11-03
US61/555,354 2011-11-03
US13/613,382 2012-09-13
US13/613,382 US9800870B2 (en) 2011-09-16 2012-09-13 Line buffer reduction for short distance intra-prediction
PCT/US2012/055442 WO2013040370A1 (en) 2011-09-16 2012-09-14 Line buffer reduction for short distance intra - prediction in video coding

Publications (2)

Publication Number Publication Date
CN103797802A CN103797802A (zh) 2014-05-14
CN103797802B true CN103797802B (zh) 2017-02-15

Family

ID=47880650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280045204.6A Expired - Fee Related CN103797802B (zh) 2011-09-16 2012-09-14 用于视频译码中的短距离帧内预测的线缓冲器减少

Country Status (6)

Country Link
US (1) US9800870B2 (zh)
EP (1) EP2756677A1 (zh)
JP (1) JP5815877B2 (zh)
KR (1) KR101568626B1 (zh)
CN (1) CN103797802B (zh)
WO (1) WO2013040370A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140169452A1 (en) * 2012-12-14 2014-06-19 Electronics And Telecommunications Research Institute Video encoding method and apparatus using the same
US20150124871A1 (en) * 2013-11-06 2015-05-07 Mitsubishi Electric Research Laboratories, Inc. Visual Perceptual Transform Coding of Images and Videos
KR102057369B1 (ko) 2013-12-13 2020-01-22 퀄컴 인코포레이티드 3d 비디오 코딩에서 깊이 인트라-예측 및 인터-예측 모드들을 위한 단순화된 깊이 코딩 (sdc) 의 시그널링
US10630977B2 (en) 2015-04-08 2020-04-21 Lg Electronics Inc. Method and apparatus for encoding/decoding a video signal
US10212444B2 (en) * 2016-01-15 2019-02-19 Qualcomm Incorporated Multi-type-tree framework for video coding
WO2017188780A2 (ko) * 2016-04-29 2017-11-02 인텔렉추얼디스커버리 주식회사 영상 신호 부호화/복호화 방법 및 장치
CN116708775A (zh) * 2016-07-18 2023-09-05 韩国电子通信研究院 图像编码/解码方法和装置以及存储比特流的记录介质
US10880564B2 (en) * 2016-10-01 2020-12-29 Qualcomm Incorporated Transform selection for video coding
EP3306927A1 (en) 2016-10-05 2018-04-11 Thomson Licensing Encoding and decoding methods and corresponding devices
WO2018124855A1 (ko) * 2017-01-02 2018-07-05 한양대학교 산학협력단 화면 간 예측을 이용한 영상 복호화 방법 및 장치
US10506242B2 (en) * 2018-01-30 2019-12-10 Google Llc Efficient context model computation design in transform coefficient coding
US10869060B2 (en) * 2018-01-30 2020-12-15 Google Llc Efficient context model computation design in transform coefficient coding
JP7187566B2 (ja) * 2018-02-09 2022-12-12 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン パーティションベースのイントラ符号化概念
KR20210027477A (ko) * 2018-07-13 2021-03-10 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 분할 인트라 코딩 개념
CN117676165A (zh) * 2018-09-10 2024-03-08 华为技术有限公司 视频解码方法及视频解码器
US11178399B2 (en) * 2019-03-12 2021-11-16 Qualcomm Incorporated Probability initialization for video coding
AU2020302017A1 (en) * 2019-06-22 2022-02-17 Xris Corporation Image signal encoding/decoding method and device therefor
US11431974B2 (en) * 2019-10-09 2022-08-30 Apple Inc. Method for encoding/decoding image signal, and device for same
CA3153168A1 (en) * 2019-11-20 2021-05-27 Bae Keun Lee Method for encoding/decoding image signal, and device for same

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1794818A (zh) * 2005-12-01 2006-06-28 西安交通大学 可伸缩视频编码中的高性能三维码率控制方法
CN1857001A (zh) * 2003-05-20 2006-11-01 Amt先进多媒体科技公司 混合视频压缩方法
CN101411196A (zh) * 2006-03-27 2009-04-15 高通股份有限公司 用于对与视频压缩相关联的信息进行编码及解码的方法及***

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009231914A (ja) * 2008-03-19 2009-10-08 Sony Corp 復号装置、復号処理方法およびプログラム
KR101456498B1 (ko) 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101457894B1 (ko) * 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
KR101768207B1 (ko) 2010-01-19 2017-08-16 삼성전자주식회사 축소된 예측 움직임 벡터의 후보들에 기초해 움직임 벡터를 부호화, 복호화하는 방법 및 장치
KR101495724B1 (ko) 2010-02-02 2015-02-25 삼성전자주식회사 계층적 데이터 단위의 스캔 순서에 기반한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
WO2011126277A2 (en) 2010-04-05 2011-10-13 Samsung Electronics Co., Ltd. Low complexity entropy-encoding/decoding method and apparatus
KR101784031B1 (ko) * 2010-04-26 2017-10-10 선 페이턴트 트러스트 주변 블록의 통계로부터 추론되는 인트라 예측을 위한 필터링 모드
US9215470B2 (en) * 2010-07-09 2015-12-15 Qualcomm Incorporated Signaling selected directional transform for video coding
US8976861B2 (en) * 2010-12-03 2015-03-10 Qualcomm Incorporated Separately coding the position of a last significant coefficient of a video block in video coding
US20120163456A1 (en) * 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
KR101457397B1 (ko) * 2011-01-06 2014-11-04 삼성전자주식회사 계층적 구조의 데이터 단위를 이용한 비디오의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US9066097B2 (en) * 2011-02-01 2015-06-23 Sony Corporation Method to optimize the transforms and/or predictions in a video codec
WO2012122495A1 (en) * 2011-03-10 2012-09-13 Huawei Technologies Co., Ltd. Using multiple prediction sets to encode extended unified directional intra mode numbers for robustness
US8494290B2 (en) * 2011-05-05 2013-07-23 Mitsubishi Electric Research Laboratories, Inc. Method for coding pictures using hierarchical transform units
US9762918B2 (en) * 2011-05-27 2017-09-12 Hfi Innovation Inc. Method and apparatus for line buffer reduction for video processing
US9532058B2 (en) 2011-06-03 2016-12-27 Qualcomm Incorporated Intra prediction mode coding with directional partitions
EP2727363B1 (en) * 2011-06-28 2020-11-18 HFI Innovation Inc. Method and apparatus of intra mode coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1857001A (zh) * 2003-05-20 2006-11-01 Amt先进多媒体科技公司 混合视频压缩方法
CN1794818A (zh) * 2005-12-01 2006-06-28 西安交通大学 可伸缩视频编码中的高性能三维码率控制方法
CN101411196A (zh) * 2006-03-27 2009-04-15 高通股份有限公司 用于对与视频压缩相关联的信息进行编码及解码的方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Line-based Image Coding using Adaptive Prediction Filters";Xiulian Peng等;《IEEE INTERNATIONAL SYMPOSIUM ON CIRCUITS AND SYSTEMS》;20100530;摘要、第III-IV部分 *

Also Published As

Publication number Publication date
US20130070848A1 (en) 2013-03-21
CN103797802A (zh) 2014-05-14
JP2014530544A (ja) 2014-11-17
KR20140071419A (ko) 2014-06-11
WO2013040370A1 (en) 2013-03-21
JP5815877B2 (ja) 2015-11-17
EP2756677A1 (en) 2014-07-23
US9800870B2 (en) 2017-10-24
KR101568626B1 (ko) 2015-12-07

Similar Documents

Publication Publication Date Title
CN103797802B (zh) 用于视频译码中的短距离帧内预测的线缓冲器减少
JP6882560B2 (ja) 画像予測方法および装置
CN109076230A (zh) 二值化二次变换指数
CN104205829B (zh) 合并信令及环路滤波器开/关信令
CN104488267B (zh) 用于译码视频的方法和装置
CN104247424B (zh) 已译码的区块旗标译码
CN103931182B (zh) 帧内预测视频译码中的非正方形变换
CN103999460B (zh) 在变换跳过模式中译码有效系数信息的方法和装置
CN104396243B (zh) 用于视频压缩的自适应上取样滤波器
CN103190147B (zh) 用于视频译码的语法元素的联合译码方法及设备
CN104247420A (zh) 转换系数译码
CN103959775A (zh) 帧内模式视频译码
CN103563378A (zh) 存储器高效的上下文建模
CN107211125A (zh) 预测单元的灵活分割
CN103636215A (zh) 对视频数据应用非正方形变换
CN103609123A (zh) 统一合并模式和自适应运动向量预测模式候选者选择
CN104221380A (zh) 用于并行运动估计的共同空间候选块
CN103329523A (zh) 使用经映射变换和扫描模式的视频译码
CN103636208A (zh) 在视频译码中用于非正方形块的上下文自适应熵译码
CN104205835B (zh) 导出最末位置译码的上下文以供视频译码
CN103238323A (zh) 在视频译码中基于视频块的扫描次序对块内的最后有效系数的位置进行译码
CN104137546A (zh) 用信号发送用于视频译码的量化矩阵
CN103797801A (zh) 视频译码中的非正方形变换单元和预测单元
CN104969555A (zh) 在视频译码中具有时间可扩缩性支持的渐进式改进
CN103238322A (zh) 在视频译码中单独地译码视频块的最后有效系数的位置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170215

Termination date: 20190914