CN103636208B - 在视频译码中用于非正方形块的上下文自适应熵译码 - Google Patents

在视频译码中用于非正方形块的上下文自适应熵译码 Download PDF

Info

Publication number
CN103636208B
CN103636208B CN201280032600.5A CN201280032600A CN103636208B CN 103636208 B CN103636208 B CN 103636208B CN 201280032600 A CN201280032600 A CN 201280032600A CN 103636208 B CN103636208 B CN 103636208B
Authority
CN
China
Prior art keywords
block
coding
video
coordinate
width
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201280032600.5A
Other languages
English (en)
Other versions
CN103636208A (zh
Inventor
霍埃尔·索赖·罗哈斯
拉詹·雷克斯曼·乔希
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN103636208A publication Critical patent/CN103636208A/zh
Application granted granted Critical
Publication of CN103636208B publication Critical patent/CN103636208B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • H04N19/45Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder performing compensation of the inverse transform mismatch, e.g. Inverse Discrete Cosine Transform [IDCT] mismatch
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/93Run-length coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W88/00Devices specially adapted for wireless communication networks, e.g. terminals, base stations or access point devices
    • H04W88/02Terminal devices

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明揭示用于对具有由宽度及高度界定的非正方形的形状的视频块的系数进行译码的技术,所述技术包括:对指示根据相关联的扫描次序在所述块内的最后非零系数的位置的x坐标及y坐标中的一者或一者以上进行译码,包含:通过基于对应于所述坐标的所述宽度及所述高度中的一者确定用以对所述坐标进行译码的一个或一个以上上下文来对每一坐标进行译码,及通过基于所述上下文执行上下文自适应熵译码过程来对所述坐标进行译码。还揭示用于对识别所述块内的非零系数的位置的信息进行译码的技术,所述技术包含:基于所述宽度及所述高度中的一者或一者以上确定用以对所述信息进行译码的一个或一个以上上下文,及通过基于所述上下文执行上下文自适应熵译码过程来对所述信息进行译码。

Description

在视频译码中用于非正方形块的上下文自适应熵译码
本申请案主张2011年7月1日申请的第61/503,716号美国临时申请案及2011年11月1日申请的第61/554,301号美国临时申请案的权利,所述申请案中的每一者的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码,且更确切地说,涉及对由视频译码过程产生的残余变换系数的块进行译码。
背景技术
数字视频能力可并入到各种各样的装置中,包含数字电视、数字直播***、无线广播***、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流式传输装置等。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(高级视频译码(AVC))定义的标准,目前处于开发下的高效视频译码(HEVC)标准,以及所述标准的扩展部分中所描述的视频压缩技术。视频装置可通过实施这些视频压缩技术而更高效地发射、接收、编码、解码及/或存储数字视频信息。
视频压缩技术执行空间(帧内图片)预测及/或时间(帧间图片)预测以减少或移除视频序列中所固有的冗余。对于基于块的视频译码,视频切片(即,视频帧或视频帧的一部分)可分割为视频块,视频块还可称作树块、译码单元(CU)及/或译码节点。图片的经帧内译码(I)的切片中的视频块相对于同一图片中的相邻块中的参考样本使用空间预测而编码。图片的经帧间译码(P或B)的切片中的视频块可相对于同一图片中的相邻块中的参考样本使用空间预测或相对于其它参考图片中的参考样本使用时间预测。图片可称作帧,且参考图片可称作参考帧。
空间或时间预测产生用于将要译码的块的预测块。残余数据表示将要译码的原始块与预测块之间的像素差。根据指向形成预测块的参考样本的块的运动向量,及指示经译码的块与预测块之间的差的残余数据来对经帧间译码的块进行编码。根据帧内译码模式及残余数据来对经帧内译码的块进行编码。为了进一步压缩,残余数据可从像素域变换为变换域,从而产生残余变换系数,残余变换系数接着可被量化。可扫描最初布置成二维阵列的经量化的变换系数以便产生变换系数的一维向量。接着可应用熵译码以达成甚至更多的压缩。
发明内容
本发明描述用于在视频译码过程期间对非正方形的视频数据块的残余变换系数进行译码的技术。本文中所描述的技术可包含以下技术中的一者或一者以上:(1)用于选择扫描次序来扫描非正方形的视频数据块的残余变换系数的技术;(2)用于确定用于对用于非正方形的视频数据块的最后有效系数位置信息进行熵译码的上下文的技术;(3)用于确定用于对用于非正方形的视频数据块的有效系数位置信息进行熵译码的上下文的技术;及(4)用于对非正方形的视频数据块的残余变换系数的值或“层级”进行译码的技术。
本发明的技术可相对于其它方法改进用于对非正方形的视频数据块的残余变换系数进行译码的效率。特定来说,所述技术可在对非正方形的块的残余变换系数及相关语法信息进行译码时改进所述系数及所述信息的压缩。另外,本发明的技术可使得能够使用相对于其它***具有较低的复杂性的译码***来对所述系数及相关语法信息进行译码。以此方式,当使用本发明的技术时,对于包含经译码的系数及相关语法信息的经译码的位流可存在相对位节省,且用以对系数及相关语法信息进行译码的***的复杂性可相对降低。
在一个实例中,一种在视频译码过程期间对与视频数据块相关联的变换系数进行译码的方法,(其中所述块具有由宽度及高度界定的非正方形的形状),包含:对指示根据与所述块相关联的扫描次序在所述块内的最后非零系数的位置的x坐标及y坐标中的一者或一者以上进行译码,其中对所述x坐标及y坐标中的所述一者或一者以上中的每一者进行译码包含至少部分基于对应于坐标的块的宽度及高度中的一者,确定用以对相应的坐标进行译码的一个或一个以上上下文;及通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对相应的坐标进行译码。
在另一实例中,一种在视频译码过程期间对与视频数据块相关联的变换系数进行译码的方法(其中所述块具有由宽度及高度界定的非正方形的形状)包含:对识别在所述块内的非零系数的位置的信息进行译码,其中对所述信息进行译码包括至少部分基于所述块的所述宽度及所述高度中的一者或一者以上确定用以对所述信息进行译码的一个或一个以上上下文;及通过至少部分基于所述所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对所述信息进行译码。
本发明的技术还在以下方面进行描述:设备、包括用于执行所述技术的装置的装置及存储在执行时致使一个或一个以上处理器执行所述技术的指令的计算机可读存储媒体。
一个或一个以上实例的细节陈述于附图及以下描述中。其它特征、目标及优势将从描述及附图和从权利要求书中显而易见。
附图说明
图1为说明与本发明的技术一致的视频编码及解码***的实例的框图,所述视频编码及解码***可执行用于对非正方形的视频数据块的残余变换系数进行译码的技术。
图2为说明与本发明的技术一致的视频编码器的实例的框图,所述视频编码器可执行用于对非正方形的视频数据块的残余变换系数进行编码的技术。
图3为说明与本发明的技术一致的视频解码器的实例的框图,所述视频解码器可执行用于对非正方形的视频数据块的经编码的残余变换系数进行解码的技术。
图4A到图4C为说明使用对角线、水平及垂直扫描次序扫描的正方形视频数据块的实例的概念图。
图5A到5C为说明与本发明的技术一致的非正方形的视频数据块以及对应有效系数位置信息及最后有效系数位置信息的实例的概念图。
图6A到图6F为说明与本发明的技术一致的使用曲折、水平、垂直及对角线扫描次序扫描的非正方形的视频数据块的实例的概念图。
图7A到图7B为说明与本发明的技术一致的已转置的非正方形的视频数据块的实例的概念图。
图8A到图8B为说明与本发明的技术一致的正方形视频数据块及非正方形的视频数据块的实例的概念图,其中使用共同的一个或一个以上上下文来对有效系数位置信息进行译码。
图9A到图9B为说明与本发明的技术一致的非正方形的视频数据块的实例的概念图,其中已根据对角线扫描次序来对残余变换系数进行分组。
图10A到图10B为说明与本发明的技术一致的对非正方形的视频数据块的残余变换系数进行译码的方法的实例的流程图。
具体实施方式
本发明描述用于在视频译码过程期间对非正方形的视频数据块的残余变换系数进行译码的技术。本文中所描述的技术可包含以下技术中的一者或一者以上:(1)用于选择扫描次序来扫描非正方形的视频数据块的残余变换系数的技术;(2)用于确定用于对用于非正方形的视频数据块的最后有效系数位置信息进行熵译码的上下文的技术;(3)用于确定用于对用于非正方形的视频数据块的有效系数位置信息进行熵译码的上下文的技术;及(4)用于对非正方形的视频数据块的残余变换系数的值或“层级”进行译码的技术。
本发明的技术可相对于其它方法改进用于对非正方形的视频数据块的残余变换系数进行译码的效率。特定来说,所述技术可在对非正方形的块的残余变换系数及相关语法信息进行译码时改进所述系数及所述信息的压缩。另外,本发明的技术可使得能够使用相对于其它***具有较低的复杂性的译码***来对所述系数及相关语法信息进行译码。以此方式,当使用本发明的技术时,对于包含经译码的系数及相关语法信息的经译码的位流可存在相对位节省,且用以对系数及相关语法信息进行译码的***的复杂性可相对降低。
图1为说明与本发明的技术一致的视频编码及解码***的实例的框图,所述视频编码及解码***可执行用于对非正方形的视频数据块的残余变换系数进行译码的技术。如图1中所示,***10包含源装置12,源装置12产生稍后待由目的地装置14解码的经编码的视频数据。源装置12及目的地装置14可包括各种各样的装置中的任一者,包括桌上型计算机、笔记本(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如,所谓的“智能”电话)、所谓的“智能”板、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置等。在一些状况下,源装置12及目的地装置14可经配备以用于无线通信。
目的地装置14可经由链路16接收待解码的经编码的视频数据。链路16可包括能够将经编码的视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,链路16可包括通信媒体以使得源装置12能够实时地将经编码的视频数据直接发射到目的地装置14。经编码的视频数据可根据例如无线通信协议等通信标准来调制,且经发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如射频(RF)频谱或一个或一个以上物理传输线。通信媒体可形成例如局域网、广域网或例如因特网等全球网络等基于包的网络的部分。通信媒体可包含可用于促进从源装置12到目的地装置14的通信的路由器、交换器、基站或任何其它设备。
或者,经编码的数据可从输出接口22输出到存储装置24。类似地,经编码的数据可通过输入接口26从存储装置24来存取。存储装置24可包含多种分布式或本地存取的数据存储媒体中的任一者,例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或用于存储经编码的视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置24可对应于文件服务器或可保存由源装置12产生的经编码的视频的另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置24存取所存储的视频数据。文件服务器可为能够存储经编码的视频数据且将所述经编码的视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包括网页服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可经由包含因特网连接的任何标准数据连接存取经编码的视频数据。这可包含适用于存取存储于文件服务器上的经编码的视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等)或两者的组合。经编码的视频数据从存储装置24的发射可为流式传输发射、下载发射或两者的组合。
本发明的技术不一定限于无线应用或设定。所述技术可应用于支持例如以下各者的多种多媒体应用中的任一者的视频译码:空中电视广播、有线电视发射、***发射、流式传输视频发射(例如,经由因特网)、对数字视频进行编码以用于存储于数据存储媒体上、对存储于数据存储媒体上的数字视频进行解码,或其它应用。在一些实例中,***10可经配置以支持单向或双向视频发射以支持例如视频流式传输、视频播放、视频广播及/或视频电话等应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。在一些状况下,输出接口22可包含调制器/解调器(调制解调器)及/或发射器。在源装置12中,视频源18可包含源,例如视频俘获装置(例如,摄像机)、含有先前所俘获的视频的视频存档、用以从视频内容提供者接收视频的视频馈入接口,及/或用于产生计算机图形数据作为源视频的计算机图形***,或此些源的组合。作为一个实例,如果视频源18为摄像机,那么源装置12及目的装置14可形成所谓的相机电话或视频电话。然而,本发明中描述的技术大体上可适用于视频译码,且可适用于无线及/或有线应用。
可由视频编码器20来对经俘获的、经预先俘获的或计算机产生的视频进行编码。经编码的视频数据可经由源装置12的输出接口22直接发射到目的地装置14。经编码的视频数据还可(或替代地)存储于存储装置24上以供稍后由目的地装置14或其它装置存取以进行解码及/或播放。
目的地装置14包含输入接口26、视频解码器30及显示装置28。在一些状况下,输入接口26可包含接收器及/或调制解调器。目的地装置14的输入接口26经由链路16接收经编码的视频数据。经由链路16传达或在存储装置24上提供的经编码的视频数据可包含由视频编码器20产生的多种语法元素以供视频解码器(例如,视频解码器30)在对视频数据进行解码时使用。此些语法元素可包含于发射于通信媒体上、存储于存储媒体上或存储于文件服务器中的经编码的视频数据内。
显示装置28可与目的地装置14集成或在目的地装置14外部。在一些实例中,目的地装置14可包含集成显示装置且还经配置以与外部显示装置集成。在其它实例中,目的地装置14可为显示装置。一般来说,显示装置28向用户显示经解码的视频数据,且可包括多种显示装置中的任一者,例如液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20及视频解码器30可根据视频压缩标准来操作,例如当前由ITU-T视频译码专家组(VCEG)及ISO/IEC动画专家组(MPEG)的视频译码联合协作小组(JCT-VC)开发的高效视频译码(HEVC)标准,且可遵照HEVC测试模型(HM)。或者,视频编码器20和视频解码器30可根据其它专有或工业标准(例如,ITU-T H.264标准,或者称为MPEG-4第10部分,高级视频译码(AVC))或此些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。视频压缩标准的其它实例包含MPEG-2及ITU-T H.263。被称作“HEVC工作草案6”或“WD6”的HEVC标准的新近草案描述于Bross等人的文件JCTVC-H1003“高效视频译码(HEVC)文本规范草案6”(ITU-T SGI 6 WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合协作小组(JCT-VC),第8次会议:美国,加利福尼亚,圣何塞,2012年2月)中,所述文件自2012年6月1日起可从http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wgll/JCTVC-H1003-v22.zip下载得到。
尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当的MUX-DEMUX单元或其它硬件及软件,以处理对共同数据流或单独数据流中的音频与视频两者的编码。如果适用,那么在一些实例中,MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
视频编码器20及视频解码器30各自可经实施为例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合的多种合适编码器电路中的任一者。当技术是部分以软件来实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且使用一个或一个以上处理器执行硬件中的指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包含于一个或一个以上编码器或解码器中,其中任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。
HEVC标准化努力是基于视频译码装置的演进模型,其被称作HEVC测试模型(HM)。HM假设视频译码装置相对于根据(例如)ITU-T H.264/AVC的现有装置的若干额外能力。举例来说,尽管H.264提供九个帧内预测编码模式,但HM可提供多达三十三个帧内预测编码模式。
一般来说,HM的工作模型描述视频帧或图片可划分成包含亮度及色度样本两者的树块或最大译码单元(LCU)的序列。树块具有与H.264标准的宏块类似的目的。切片包含按译码次序的数个连续树块。视频帧或图片可分割成一个或一个以上切片。每一树块可根据四分树***为译码单元(CU)。举例来说,树块作为四分树的根节点可***为四个子节点,且每一子节点又可为父节点且***为另四个子节点。最终未经***的子节点作为四分树的叶节点包括译码节点,即经译码的视频块。与经译码的位流相关联的语法数据可定义树块可***的最大次数,且还可定义译码节点的最小大小。
CU包含译码节点及预测单元(PU)以及与译码节点相关联的变换单元(TU)。CU的大小对应于译码节点的大小,且形状必须为正方形。CU的大小范围可在8x8像素直到具有最大64x64像素或更大的树块的大小之间。每一CU可含有一个或一个以上PU及一个或一个以上TU。举例来说,与CU相关联的语法数据可描述将CU分割成一个或一个以上PU。在CU是经跳过或直接模式编码、经帧内预测模式编码还是经帧间预测模式编码之间,分割模式可不同。PU可经分割而在形状上为非正方形的。举例来说,与CU相关联的语法数据还可描述根据四分树将CU分割成一个或一个以上TU。TU的形状可为正方形或非正方形。
HEVC标准允许根据TU进行变换,对于不同CU而言,所述变换可为不同的。TU通常是基于针对经分割LCU而定义的给定CU内的PU的大小而设定大小,但这可不总是这样。TU通常与PU大小相同或小于PU。在一些实例中,对应于CU的残余样本可使用称作“残余四分树”(RQT)的四分树结构细分为较小单元。RQT的叶节点可被称作变换单元(TU)。与TU相关联的像素差值可经变换以产生变换系数,所述变换系数可经量化。
一般来说,PU包含与预测过程相关的数据。举例来说,当PU是经帧内模式编码时,PU可包含描述所述PU的帧内预测模式的数据。作为另一实例,当PU是经帧间模式编码时,PU可包含界定所述PU的运动向量的数据。定义用于PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量指向的参考图片及/或用于运动向量的参考图片列表(例如,列表0、列表1或列表C)。
一般来说,TU是用于变换及量化过程。具有一个或一个以上PU的给定CU还可包含一个或一个以上变换单元(TU)。在预测之后,视频编码器20可计算对应于PU的残余值。残余值包括像素差值,像素差值可使用TU经变换成变换系数、经量化及扫描,以产生串行化变换系数以进行熵译码。本发明通常使用术语“视频块”来指CU的译码节点。在一些具体状况下,本发明还可使用术语“视频块”来指树块,即LCU或CU,其包含译码节点及PU以及TU。
视频序列通常包含一系列视频帧或图片。图片组(GOP)通常包括一系列视频图片中的一者或一者以上。GOP可将描述GOP中所包含的图片的数目的语法数据包含在GOP的标头、图片中的一者或一者以上的标头中或其它地方。图片的每一切片可包含描述用于相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作,以便对视频数据进行编码。视频块可对应于CU内的译码节点。所述视频块可具有固定的或变化的大小,且可根据指定的译码标准而大小不同。
作为实例,HM支持在各种PU大小下的预测。假定特定CU的大小为2Nx2N,HM支持在2Nx2N或NxN的PU大小下的帧内预测,及在2Nx2N、2NxN、Nx2N或NxN的对称PU大小下的帧间预测。HM还支持用于在2NxnU、2NxnD、nLx2N及nRx2N的PU大小下的帧间预测的非对称分割。在非对称分割中,CU的一个方向未经分割,而另一方向被分割成25%及75%。对应于25%分割的CU的部分由“n”指示,接着是“上”、“下”、“左”或“右”的指示。因此,例如,“2NxnU”是指经水平地分割的2Nx2N CU,其中2Nx0.5N PU在上且2Nx1.5N PU在下。
在本发明中,“NxN”和“N乘N”可互换地使用以指视频块在垂直和水平尺寸方面的像素尺寸(例如,16x16像素或16乘16像素)。一般来说,16x16块将在垂直方向上具有16个像素(y=16)且在水平方向上具有16个像素(x=16)。同样,NxN块通常在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。一块中的像素可布置成若干行及若干列。此外,块不必在水平方向具有与在垂直方向上相同数目的像素。举例来说,块可包括NxM个像素,其中M不必等于N。
在使用CU的PU进行帧内预测或帧间预测译码之后,视频编码器20可计算用于CU的TU的残余数据。PU可包括空间域(亦被称作像素域)中的像素数据,且TU可包括在将变换(例如,离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换)应用于残余视频数据之后在变换域中的系数。残余数据可对应于未经编码的图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包含用于CU的残余数据的TU,且接着对TU进行变换以产生用于CU的变换系数。
在进行任何变换以产生变换系数之后,视频编码器20可执行变换系数的量化。量化通常是指将变换系数量化以可能地减少用于表示系数的数据量从而提供进一步压缩的过程。量化过程可减少与系数中的一些或全部相关联的位深度。举例来说,在量化期间,可将n位值向下舍入到m位值,其中n大于m。
在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数,以产生可经熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化的变换系数以形成一维向量之后,视频编码器20可对一维向量进行熵编码,例如,根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法。视频编码器20还可对与经编码的视频数据相关联的语法元素进行熵编码以用于视频解码器30在对视频数据进行解码时使用。
为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待发射的符号。举例来说,上下文可涉及符号的相邻值是否为非零。为了执行CAVLC,视频编码器20可选择用于待发射的符号的可变长度码。可建构VLC中的码字以使得相对较短的码对应于更大概率的符号,而较长的码对应于更小概率的符号。以此方式,VLC的使用可(例如)使用用于待发射的每一符号的相等长度码字而达成位节省。概率确定可是基于经指派给符号的上下文。
在H.264及新兴的HEVC标准中,当使用CABAC熵译码时,在对系数的绝对值或“层级”进行译码之前,对视频数据块内的有效(即,非零)残余变换系数的位置进行译码。对块内的有效系数的位置进行译码的过程被称作有效图(SM)译码。通常将用于视频数据块的SM表示为二进制值(即,1及0)的2D阵列,其中1指示块内的有效系数的位置,且0指示块内的非有效的或零值的系数的位置。1及0可被称作“有效系数旗标”。在一些状况下,仅在位流中用信号发出的1及0可被称作“有效系数旗标”,例如,根据如下文所描述的与块相关联的扫描次序在最后有效系数旗标之前的1及0,且有时包含最后有效系数旗标自身。
另外,在一些状况下,可进一步使用1及0的另一2D阵列来表示SM,其中1指示根据与块相关联的扫描次序在块内的最后有效系数的位置,且0指示块内的所有其它系数的位置。在此些状况下,1及0可被称作“最后有效系数旗标”。再一次,在一些实例中,仅在位流中用信号发出的1及0可被称作“最后有效系数旗标”。举例来说,在使用序数(例如,根据扫描次序串行化的2D阵列的一串0及1)来表示最后有效系数的位置的状况下,仅根据扫描次序在1之前的0以及1自身可被称作“最后有效系数旗标”。在其它实例中,可使用根据扫描次序在块内的最后有效系数的坐标(例如,x坐标及y坐标)来表示最后有效系数的位置。
一般来说,用于视频数据块的SM译码通常消耗用以对块进行译码的视频位速率的显著百分比。举例来说,在一些技术(例如,HEVC)中,以下三个扫描次序可用于SM译码:对角线扫描次序400、水平扫描次序402及垂直扫描次序404,如图4A到图4C内的对应块所示。
在对用于块的SM进行译码之后,对块的每一非零残余变换系数的值或“层级”(例如,表示为绝对值及正负号)进行译码。举例来说,为了使用先前在H.264标准中所指定的CABAC过程来对用于视频数据块的SM信息及残余变换系数层级进行译码,每一非零残余变换系数的绝对值经转换成二进制形式,或(例如)使用包括一个或一个以上位或“二进制值”的一元(例如,截短一元)及/或哥伦布(例如,指数哥伦布或莱斯哥伦布)码字来“二进制化”。用于块的每一有效系数旗标及最后有效系数旗标(如上文所解释,其可为有效系数旗标中的一者)已经包括单个二进制值,且因此绕过二进制化。用于块的每一有效系数(例如,用于每一有效系数旗标及最后有效系数旗标)的CABAC上下文推导包含考虑块的类型(例如,块大小)及块内的系数(例如,对应于相应旗标)的位置,及可能根据与块相关联的扫描次序的系数的位置,以及先前经译码的系数的值。用于经二进制化的残余变换系数绝对值的每一二进制值的CABAC上下文包含表示系数的绝对值及先前经译码的系数的值的一元(例如,截短一元)及/或哥伦布(例如,指数哥伦布或莱斯哥伦布)码字内的二进制值的位置。
根据一些视频译码技术,基于块的帧内译码可使用CU的NxN正方形分割作为PU。在一些实例中,在PU的给定正方形分割内部的像素可从相邻经重构的PU的边界(即,边缘像素)来预测,有时对在(例如)PU的右下部分中的像素比对PU的其它部分产生不良的预测。
为了更佳地利用空间相关,已提出所谓的“短距离帧内预测”(SDIP)译码技术。举例来说,SDIP技术可包含将NxN正方形块分割成若干线或具有矩形形状的非正方形的块。在块中,可逐行地或逐矩形地预测及重构像素。结果,可缩短预测距离。
在使用SDIP的一些技术中,可将CU分割成PU作为线或具有矩形形状的非正方形的块。举例来说,可将32x32CU分割成四个8x32PU或四个32x8PU。类似地,可将16x16CU分割成四个8x8PU以及分割成四个4x16PU或四个16x4PU。此外,可进一步将4x16或16x4PU分割成四个1x16PU或四个16x1PU。并且,还可将8x8CU分割成四个2x8PU或四个8x2PU。
另外,一些技术还可使用非正方形的TU。举例来说,包含所谓的帧间“非正方形的变换”或帧间NSQT的技术可使用非正方形的TU。因此,在一些译码技术中,上文所描述的帧间NSQT及SDIP技术可引入非正方形的变换(NSQT)以用于分别帧间预测及帧内预测,及更一般来说非正方形的视频数据块。
根据使用非正方形的视频数据块的一些此些技术,当对非正方形的视频数据块进行译码时,可出于对系数进行熵译码的目的将特定非正方形的块的残余变换系数从非正方形的块映射到正方形块,如先前所描述。可能需要此映射,因为特定技术内所使用的熵译码过程可仅经配置以处理正方形块。换句话说,虽然可以如上文所描述的类似方式来对非正方形的块执行先前所描述的预测、变换及量化步骤,但使用非正方形的块的技术可要求在对系数进行熵译码之前将块的残余变换系数映射到正方形块。
上文所描述的做法具有若干缺点。作为一个实例,上文所描述的映射在使用CABAC过程时是有问题的,CABAC过程可基于视频数据块的残余变换系数在块内的位置来对所述残余变换系数进行译码。举例来说,出于对系数进行熵译码的目的将非正方形的块的残余变换系数从非正方形的块映射到正方形块可导致固有地存在于非正方形的块中的系数之间的相关的损失。作为一个实例,非零残余变换系数可集中或分组于非正方形的块的子集内,例如在通常被称作“DC”位置的块的左上角附近。将非正方形的块的残余变换系数映射到正方形块可消除此集中或分组。然而,此些分组可在选择用以对块进行译码的扫描次序时是有利的。举例来说,因为分组,所以某些扫描次序可用以比其它扫描次序更有效地对块进行译码。作为另一实例,上文所描述的做法还对译码过程增加复杂性,所述译码过程与在对系数进行熵编码之前将非正方形的块的残余变换系数从非正方形的块映射到正方形块,且随后在对系数进行熵译码之后从正方形块映射到非正方形的块相关联。
本发明描述可在一些状况下减少或消除上文所描述的缺点中的一些的若干技术。特定来说,本文中所描述的技术可使得能够在执行上下文自适应熵译码过程(例如,CABAC、PIPE等)时有效地对非正方形的视频数据块的残余变换系数进行熵译码。另外,本发明的技术可使得译码***能够具有相对于其它***较低的复杂性来对系数进行译码。
作为一个实例,本发明提出用于确定用以对非正方形视频数据块的残余变换系数进行译码的扫描次序的技术。举例来说,根据一些视频译码技术(例如,HEVC),用以对视频数据块进行译码的扫描次序通常包含曲折、水平、对角线及垂直扫描次序,如先前所描述。本发明的技术提出:取决于用以对块进行译码的帧内预测模式,使用曲折、水平、对角线或垂直扫描次序(如图6A到图6F中所说明)来对特定非正方形的视频数据块进行译码。另外,本发明的技术提出:在块包含64或更少的残余变换系数时,使用曲折、水平、对角线或垂直扫描次序来对块进行译码,而不管用以对块进行译码的帧内预测模式如何。其它实例技术包含:在块包含64个以上残余变换系数时,使用单个固定扫描次序来对块进行扫描,而不管用以对块进行译码的帧内预测模式如何。
作为另一实例,本发明还提出用于使用上下文自适应熵译码(例如,CABAC)来对根据与块相关联的扫描次序在非正方形视频数据块内的最后有效系数的位置进行译码的技术,其中使用块的宽度及高度中的一者或一者以上来确定上下文。作为一般实例,在使用2D块的x坐标及y坐标来对用于块的最后有效系数位置进行译码的状况下,可使用块的对应尺寸的对应于块位置的数目的长度来确定用于对每一坐标进行译码的上下文。举例来说,用于对x坐标进行译码的上下文可包含在块的水平尺寸(即,宽度)中的块位置的数目,而可使用在块的垂直尺寸(即,高度)中的块位置的数目来确定用于对y坐标进行译码的上下文。在图5A到图5C中说明了根据与块相关联的扫描次序在非正方形视频数据块内的最后有效系数的位置的实例以及用于非正方形块的有效图(SM)及非正方形块自身。
在其中块的尺寸中的一者包含单个位置(例如,块包括单个行或列)而块的另一尺寸包含多个位置(例如,多个行或列)的实例中,仅对对应于具有多个位置的尺寸的坐标进行译码。举例来说,对于包括M个列及单个行的Mx1块,可能仅对x坐标进行译码。类似地,对于包括1个列及N个行的1xN块,可能仅对y坐标进行译码。
在块的尺寸中的一者包含两个位置(例如,块包括两个行或列)而块的另一尺寸包含(例如)两个以上位置的实例中,使用上下文来对对应于包含两个以上位置的尺寸的坐标进行译码,所述上下文是使用对应于包含两个位置的尺寸的坐标的值来确定。举例来说,对于包括M个列及2个行的Mx2块,可使用指示y坐标是对应于第一行还是第二行的信息确定上下文来对x坐标进行译码。类似地,对于包括2个列及N个行的2xN块,可使用指示x坐标是对应于第一列还是第二列的信息确定上下文来对y坐标进行译码。在此些实例中,确定用于对每一坐标进行译码的上下文仍可包含考虑块的对应尺寸的长度,如先前所描述。
作为又一实例,本发明提出用于使用上下文自适应熵译码(例如,CABAC)来对用于非正方形的视频数据块的有效图进行译码的技术。特定来说,本发明提出使用上下文自适应熵译码来对用于块的有效系数旗标(即,有效系数位置信息)进行译码的技术。可在对用于不同大小的其它块的有效系数位置信息进行译码时共享用以对用于块的有效系数位置信息进行译码的上下文模型(即,一个或一个以上上下文)。举例来说,可在对用于NxM及MxN块的有效系数位置信息进行译码时使用共同上下文模型。为了对用于NxM块的有效系数位置信息进行译码,可直接应用共同上下文模型,即可直接使用一个或一个以上上下文来对用于NxM块的有效系数位置信息进行译码。另一方面,为了对用于MxN块的有效系数位置信息进行译码,可通过将MxN块转置为类似于NxM块来应用共同上下文模型及包含于其中的一个或一个以上上下文,如图7A到图7B中所说明。在此状况下,块的经转置尺寸及根据扫描次序在块内的每一有效系数的经转置位置可对应于共同上下文模型及包含于其中的一个或一个以上上下文。此外,可使用用于NxM块及MxN块两者的有效系数位置信息来更新共同上下文模型及一个或一个以上上下文。再一次,在MxN块的状况下,可使用用于经转置而非原始MxN块的有效系数位置信息来更新共同上下文模型,或反之亦然。在另一实例中,MxN块的每一系数的x坐标及y坐标可在对用于块的有效系数位置信息进行译码(如上文所描述)之前经转置或“交换”,而不是转置MxN块自身。
此所提出的技术利用用于NxM块及MxN块的统计之间的经验测试期间发现的类似性,所述统计指示含有有效系数的相应块内的每一位置的概率。此类似性允许使用共同上下文模型(及包含于其中的一个或一个以上上下文),所述共同上下文模型包含用以对NxM块及MxN块两者进行译码的统计。作为共享共同上下文模型以对用于多个大小的非正方形的块的有效系数位置信息进行译码的结果,在对应译码***中用以对非正方形的视频数据块进行译码的上下文模型(及上下文)的数目与其它译码***相比较可能减少,因此可能导致对***资源的更有效使用。
在一个实例中,对用于包含64个或更少残余变换系数的非正方形的块的有效系数位置信息进行译码使用块内的每一系数的位置来确定上下文。在另一实例中,对用于包含64个或更少残余变换系数的非正方形的块的有效系数位置信息进行译码使用根据与块相关联的扫描次序在块内的每一系数的位置来确定上下文。对于包含16个以上系数的块,对有效系数位置信息进行译码使用针对多个相邻系数确定的译码上下文。举例来说,四个邻近系数可共享共同上下文。以此方式,针对对应于较小块内的系数的有效系数旗标个别地确定的上下文可“映射”到较大块以用来对对应于较大块内的多个邻近系数的有效系数旗标进行译码。对于包含64个以上系数的块,对有效系数位置信息进行译码使用由有效相邻系数的数目确定的译码上下文。举例来说,添加五个相邻系数的有效性来计算所述上下文。
作为另一实例,对于包括16个列及单个行的16x1块,用于对特定有效系数旗标进行译码的上下文可使用对应于根据与块相关联的扫描次序在块内的对应系数的位置的列数来确定。在此状况下,扫描次序为从最左块位置进行到最右位置的水平扫描次序。对于包括单个列及16个行的1x16块,用于对特定有效系数旗标进行译码的上下文可与上文所描述的一样,因为在对用于块的有效系数旗标进行译码之前,块经转置为类似于16x1块。在此实例中,用于对用于16x1块或经转置1x16块的特定有效系数旗标进行译码的上下文可使用以下关系导出:
Ctx(x)=x;
其中ctx(x)指示用于经译码的特定有效系数旗标的上下文索引,且“x”指示对应于块内的旗标的系数的位置的x坐标。
作为另一实例,对于包括8列及2行的8x2块,用于对特定有效系数旗标进行译码的上下文可使用以下关系来导出:
其中ctx(x,y)指示用于经译码的特定有效系数旗标的上下文索引,其中指示左移运算符,且“y”指示对应于块内的旗标的系数的位置的y坐标。换句话说,ctx(x,y)指示用于经译码的有效系数旗标的上下文索引,其中所述旗标对应于位于由x坐标及y坐标指示的块内的位置处的系数。因此,用于对特定有效系数旗标进行译码的上下文可使用对应于块内的旗标的系数的位置的x坐标及y坐标来导出。类似地,对于包括2个列及8个行的2x8块,再一次,在块经转置为类似于8x2块之后,如先前所描述,用于对特定有效系数旗标进行译码的上下文可使用相同关系导出。
作为又一实例,对于包括16列及4行的16x4块,用于对特定有效系数旗标进行译码的上下文可使用以下关系来导出:
其中,指示右移运算符。
如由此关系所说明,针对对应于位于16x4块的不同子集或子块中的系数的有效系数旗标不同地确定上下文。举例来说,上下文可取决于对应于经译码的特定有效系数旗标的系数是否位于2x2子块内而变化,所述2x2子块起源于由块内的x坐标及y坐标(0,0)、(0,1)、(1,0)及(1,1)指示的块内的DC位置。对于对应于位于2x2子块之外但在由小于8的x坐标界定的子块内的系数的旗标,及对于块内的所有其它位置,上下文可进一步变化。类似地,对于包括4个列及16个行的4x16块,再一次,在块经转置为类似于16x4块之后,如先前所描述,用于对特定有效系数旗标进行译码的上下文可使用相同关系导出。
以如上文所描述的类似方式,对于包括32个列及8个行的32x8块,及其对应物8x32块,可以如当前在HEVC中执行的类似方式来计算用于对特定有效系数旗标进行译码的上下文,如先前所描述。
另外,如更详细参看图8A到图8B所描述,本发明还提出用于使用共同上下文模型(即,相同一个或一个以上上下文)来对用于正方形的视频数据块及非正方形的视频数据块中的每一者的有效系数位置信息进行译码的技术。
最终,本发明还提出用于对非正方形的视频数据块的残余变换系数的值或“层级”信息(例如,表示为绝对值及正负号)进行译码的技术,如图9A到图9B中所说明。举例来说,根据一些视频译码技术(例如,HEVC),为了对正方形块的残余变换系数层级进行译码,将块划分成各自包括16个系数的4x4子块。随后根据与子块相关联的扫描次序来对在每一4x4子块内的系数进行译码。本发明提出通过首先使用与块相关联的扫描次序将系数串行化及接着沿着扫描次序将串行化系数划分成16个系数的群组来对非正方形的视频数据块的残余变换系数层级进行译码。接着在每一群组内对系数层级进行译码。
因此,在与本发明的技术一致的一些实例中,源装置12的视频编码器20可经配置以对某些视频数据块(例如,CU的一个或一个以上TU)进行编码,且目的地装置14的视频解码器30可经配置以从视频编码器20接收经编码的视频数据。作为一个实例,视频编码器20及/或视频解码器30可经配置以在视频译码过程期间对与视频数据块相关联的变换系数进行译码,其中所述块具有由宽度及高度界定的非正方形的形状。举例来说,视频编码器20及/或视频解码器30可经配置以对指示根据与块相关联的扫描次序在块内的最后非零系数的位置的x坐标及y坐标中的一者或一者以上进行译码。在此实例中,为了对x坐标及y坐标中的一者或一者以上中的每一者进行译码,视频编码器20及/视频解码器30可经配置以至少部分基于对应于坐标的块的宽度及高度中的一者来确定用以对相应的坐标进行译码的一个或一个以上上下文。视频编码器20及/或视频解码器30可经进一步配置以通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对相应的坐标进行译码。
作为另一实例,视频编码器20及/或视频解码器30可再一次经配置以在视频译码过程期间对与视频数据块相关联的变换系数进行译码,其中所述块具有由宽度及高度界定的非正方形的形状。举例来说,视频编码器20及/或视频解码器30可经配置以对识别块内的非零系数的位置的信息进行译码,其中为了对信息进行译码,视频编码器20及/或视频解码器30可经配置以至少部分基于块的宽度及高度中的一者或一者以上来确定用以对信息进行译码的一个或一个以上上下文。视频编码器20及/或视频解码器30可经进一步配置以通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对信息进行译码。
在上文所描述的实例中,用以对x坐标及y坐标中的相应者进行译码的一个或一个以上上下文是至少部分基于对应于坐标的块的宽度及高度中的一者来确定,及用以对识别块内的非零系数的位置的信息进行译码的一个或一个以上上下文是至少部分基于块的宽度及高度中的一者或一者以上来确定可导致包含于每一实例的一个或一个以上上下文内的概率估计相对于使用其它技术确定的概率估计更为准确。结果,视频编码器20及/或视频解码器30可更有效地对指示根据与块相关联的扫描次序在块内的最后非零系数的位置的x坐标及y坐标中的一者或一者以上中的每一者及识别块内的非零系数的位置的信息进行译码。举例来说,与使用其它技术来对坐标及信息进行译码的情况(例如,并未考虑块的宽度及高度且可导致较不准确的概率估计的技术)相比,视频编码器20及/或视频解码器30可使用较少的位来对x坐标及y坐标以及信息进行译码。
此外,如下文参看图2及图3更详细所描述,通过使用共同上下文来对用于具有经转置尺寸(例如,4x8及8x4)或不同尺寸(例如,4x4及2x8)的多个块中的每一者的信息进行译码,本发明的技术还可使得视频编码器20及/或视频解码器30能够尤其在对识别块内的非零系数的位置的信息进行译码时具有相对于其它***较低的复杂性。此外,本发明进一步包含用于扫描非正方形的视频数据块的变化系数的新颖技术,以及用于对识别块内的非零系数的值或“层级”的信息进行译码的技术,还如下文参看图2及图3更详细所描述。
因此,与使用其它方法的情况相比,本发明的技术可使得视频编码器20及/或视频解码器30能够更有效地对与块相关联的变化系数进行译码。特定来说,所述技术可在对块的变化系数及相关语法信息(例如,块的最后有效系数位置信息及有效系数位置信息)进行译码时改进对所述系数及所述信息的压缩。另外,所述技术可使得视频编码器20及/或视频解码器30能够具有相对于其它***较低的复杂性来对系数及相关语法信息进行译码。以此方式,当使用本发明的技术时,对于包含经译码的系数及相关语法信息的经译码的位流可存在相对位节省,且用以对系数及相关语法信息进行译码的视频编码器20及/或视频解码器30的复杂性可相对降低。
视频编码器20和视频解码器30在适用时各自可经实施为例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合的多种合适编码器或解码器电路中的任一者。视频编码器20和视频解码器30中的每一者可包含于一个或一个以上编码器或解码器中,其中任一者可集成为组合式视频编码器/解码器(CODEC)的部分。包含视频编码器20和/或视频解码器30的设备可包括集成电路、微处理器,和/或例如蜂窝式电话等无线通信装置。
图2为说明视频编码器20的实例的框图,视频编码器20可实施本发明中所描述的与对非正方形的视频数据块的残余变换系数进行译码相关的技术。视频编码器20可执行视频切片内的视频块的帧内译码及帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指若干基于空间的压缩模式中的任一者。帧间模式(例如,单向预测(P模式)或双向预测(B模式))可指若干基于时间的压缩模式中的任一者。
在图2的实例中,视频编码器20包含分割单元35、预测模块41、参考图片存储器64、求和器50、变换模块52、量化单元54及熵编码单元56。预测模块41包含运动估计单元42、运动补偿单元44及帧内预测模块46。对于视频块重构,视频编码器20还包含反量化单元58、反变换模块60,及求和器62。还可包含解块滤波器(图2中未展示)以将块边界滤波,以从经重构的视频移除成块假影。在需要时,解块滤波器通常对求和器62的输出进行滤波。除了解块滤波器之外还可使用额外回路滤波器(回路内或回路后)。
如图2中所示,视频编码器20接收视频数据,且分割单元35将数据分割成视频块。此分割还可包含分割成切片、平铺块或其它较大单元以及视频块分割(例如,根据LCU及CU的四分树结构)。视频编码器20通常说明对视频切片内的待编码的视频块进行编码的组件。切片可划分成多个视频块(且可能划分成被称作平铺块的视频块集合)。预测模块41可能基于错误结果(例如,译码速率及失真程度)选择用于当前视频块的多个可能的译码模式中的一者,例如,多个帧内译码模式中的一者或多个帧间译码模式中的一者。预测模块41可将所得经帧内译码或经帧间译码的块提供到求和器50以产生残余块数据,及提供到求和器62以重构经编码的块以用作参考图片。
预测模块41内的帧内预测模块46可相对于与待译码的当前块在同一帧或切片中的一个或一个以上相邻块执行对当前的视频块的帧内预测译码以提供空间压缩。预测模块41内的运动估计单元42及运动补偿单元44相对于一个或一个以上参考图片中的一个或一个以上预测块执行对当前的视频块的帧间预测译码以提供时间压缩。
运动估计单元42可经配置以根据用于视频序列的预定模式确定用于视频切片的帧间预测模式。预定模式可将序列中的视频切片指定为P切片、B切片或GPB切片。运动估计单元42与运动补偿单元44可高度集成,但出于概念上的目的而分开予以说明。由运动估计单元42所执行的运动估计为产生估计视频块的运动的运动向量的过程。举例来说,运动向量可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测块的移位。
预测块是经发现在像素差方面密切地匹配待译码的视频块的PU,其可通过绝对差总和(SAD)、平方差总和(SSD)或其它差量度来确定。在一些实例中,视频编码器20可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可对参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值进行内插。因此,运动估计单元42可执行相对于全像素位置及分数像素位置的运动搜寻,且输出具有分数像素精度的运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测块的位置来计算经帧间译码的切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述列表中的每一者识别存储于参考图片存储器64中的一个或一个以上参考图片。运动估计单元42将经计算的运动向量发送到熵编码单元56及运动补偿单元44。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计确定的运动向量来提取或产生预测块,可能对子像素精度执行内插。在接收到用于当前视频块的PU的运动向量之后,运动补偿单元44可将运动向量所指向的预测块定位在参考图片列表中的一者中。视频编码器20通过从经译码的当前视频块的像素值减去预测块的像素值而形成残余视频块,从而形成像素差值。像素差值形成用于块的残余数据,且可包含亮度及色度差分量两者。求和器50表示执行此减法运算的一个或一个以上组件。运动补偿单元44还可产生与视频块及视频切片相关联的语法元素以用于视频解码器30在对视频切片的视频块进行解码时使用。
帧内预测模块46可帧内预测当前块,以作为如上文描述的由运动估计单元42和运动补偿单元44执行的帧间预测的替代方案。特定来说,帧内预测模块46可确定用以对当前块进行编码的帧内预测模式。在一些实例中,帧内预测模块46可(例如)在单独编码遍次期间使用各种帧内预测模式来对当前块进行编码,且帧内预测模块46(或模式选择单元40,在一些实例中)可从所测试的模式选择适当的帧内预测模式来使用。举例来说,帧内预测模块46可使用针对各种所测试的帧内预测模式的速率失真分析来计算速率失真值,且在所测试的模式之间选择具有最佳速率失真特性的帧内预测模式。速率失真分析通常确定经编码的块与曾经被编码的原始的未经编码的块之间的失真(或误差)量以产生经编码的块,以及用以产生经编码的块的位速率(即,位的数目)。帧内预测模块46可计算用于各种经编码的块的失真及速率的比率以确定哪一帧内预测模式展现块的最佳速率失真值。
在任何情况下,在选择用于块的帧内预测模式之后,帧内预测模块46可将指示用于块的选定帧内预测模式的信息提供到熵编码单元56。熵编码单元56可根据本发明的技术对指示选定帧内预测模式的信息进行编码。视频编码器20可在所发射的位流配置数据(其可包含多个帧内预测模式索引表及多个经修改的帧内预测模式索引表(也被称作码字映射表))中包含用于各种块的编码上下文的定义,及用于所述上下文中的每一者的最有可能的帧内预测模式、帧内预测模式索引表及经修改的帧内预测模式索引表的指示。
在预测模块41经由帧间预测或帧内预测产生用于当前视频块的预测块之后,视频编码器20通过从当前视频块减去预测块而形成残余视频块。残余块中的残余视频数据可包含于一个或一个以上TU中且应用于变换模块52。变换模块52使用例如离散余弦变换(DCT)或概念上类似的变换等变换来将残余视频数据变换成残余变换系数。变换模块52可将残余视频数据从像素域转换到变换域(例如,频域)。
变换模块52可将所得变换系数发送到量化单元54。量化单元54对变换系数进行量化以进一步减小位速率。量化过程可减少与系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化的程度。在一些实例中,量化单元54接着可执行对包含经量化的变换系数的矩阵的扫描。或者,熵编码单元56可执行扫描。
在量化之后,熵编码单元56对经量化变换系数进行熵编码。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法或技术。在由熵编码单元56进行熵编码之后,可将经编码的位流发射到视频解码器30或存档以供稍后由视频解码器30发射或检索。熵编码单元56还可对用于正被译码的当前视频切片的运动向量及其它语法元素进行熵编码。
反量化单元58和反变换模块60分别应用反量化和反变换,以重构像素域中的残余块,以用于稍后用作参考图片的参考块。运动补偿单元44可通过将残余块添加到参考图片列表中的一者内的参考图片中的一者的预测块来计算参考块。运动补偿单元44也可将一个或一个以上内插滤波器应用于经重构的残余块来计算子整数像素值以用于运动估计。求和器62将经重构的残余块添加到由运动补偿单元44所产生的经运动补偿的预测块以产生参考块以供存储于参考图片存储器64中。参考块可由运动估计单元42及运动补偿单元44用作用于对后续视频帧或图片中的块进行帧间预测的参考块。
作为一个实例,视频编码器20可经配置以在视频译码过程期间对与视频数据块相关联的变换系数进行译码,其中所述块具有由宽度及高度界定的非正方形的形状。在此实例中,块可为CU的TU,如先前所描述。
举例来说,视频编码器20可经配置以对指示根据与块相关联的扫描次序在块内的最后非零系数的位置的x坐标及y坐标中的一者或一者以上(即,用于块的最后有效系数位置信息)进行译码。为了对x坐标及y坐标中的一者或一者以上中的每一者进行译码,视频编码器20可经配置以至少部分基于对应于坐标的块的宽度及高度中的一者来确定用以对相应的坐标进行译码的一个或一个以上上下文。视频编码器20可经进一步配置以通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程(例如,CABAC过程)来对相应的坐标进行译码。
在一些实例中,块的宽度可对应于x坐标,且块的高度可对应于y坐标。换句话说,为了对x坐标进行译码,视频编码器20可经配置以使用块的宽度来确定用于对x坐标进行译码的一个或一个以上上下文。类似地,为了对y坐标进行译码,视频编码器20可经配置以使用块的高度来确定用于对y坐标进行译码的一个或一个以上上下文。
在其它实例中,为了对x坐标及y坐标中的一者或一者以上进行译码,视频编码器20可经配置以在块的宽度及高度中的一者等于“1”从而指示宽度及高度中的一者包括单个块位置的情况下不对对应于宽度及高度中的一者的x坐标及y坐标中的一者进行译码。
在又其它实例中,为了对x坐标及y坐标中的一者或一者以上进行译码,视频编码器20可经配置以在块的宽度及高度中的一者等于“2”从而指示宽度及高度中的一者包括两个块位置的情况下,且在块的宽度及高度中的另一者等于大于“2”的值从而指示宽度及高度中的另一者包括两个以上块位置的情况下,至少部分基于对应于等于“2”的宽度及高度中的一者的x坐标及y坐标中的一者,进一步确定用以对对应于等于大于“2”的值的宽度及高度中的另一者的x坐标及y坐标中的另一者进行译码的一个或一个以上上下文。
作为另一实例,视频编码器20可再一次经配置以在视频译码过程期间对与视频数据块相关联的变换系数进行译码,其中所述块具有由宽度及高度界定的非正方形的形状。在此实例中,再一次,块可为CU的TU,如先前所描述。
举例来说,视频编码器20可经配置以对识别块内的非零系数的位置的信息(即,用于块的有效系数位置信息)进行译码,其中为了对信息进行译码,视频编码器20可经配置以至少部分基于块的宽度及高度中的一者或一者以上来确定用以对信息进行译码的一个或一个以上上下文。视频编码器20可经进一步配置以通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程(例如,CABAC过程)来对信息进行译码。
在一些实例中,视频编码器20可经进一步配置以针对块内的非零系数的位置中的一者或一者以上中的每一者,在对识别块内的非零系数的位置的信息进行译码之前互换指示块内的相应的位置的x坐标及y坐标。
在其它实例中,视频编码器20可经进一步配置以在对识别块内的非零系数的位置的信息进行译码之前将块转置。在此些实例中,块的宽度及高度中的一者或一者以上可包括经转置块的宽度及高度中的一者或一者以上。作为一个实例,为了在对信息进行译码之前将块转置,视频编码器20可经配置以在块的宽度大于块的高度的情况下将块转置。作为另一实例,为了在对信息进行译码之前将块转置,视频编码器20可经配置以在块的高度大于块的宽度的情况下将块转置。
在一些实例中,块可为第一块。在此些实例中,视频编码器20可经进一步配置以对识别第二块内的非零系数的位置的信息进行译码,其中第二块不同于第一块,且其中第二块具有由大小界定的正方形形状。在此些实例中,为了对信息进行译码,视频编码器20可经配置以通过至少部分基于用以对识别第一块内的非零系数的位置的信息进行译码的所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对信息进行译码。
以此方式,如先前所描述,尤其在对识别块内的非零系数的位置的信息进行译码时,视频编码器20可具有相对于其它***较小的复杂性。具体来说,如上文所描述,视频编码器20可使用相同一个或一个以上上下文来对识别具有经转置尺寸或不同尺寸的多个块内的非零系数的位置的信息进行译码。
在此些实例中,视频编码器20可经进一步配置以基于第一块的宽度及高度且基于第二块的大小来确定第一块及第二块包含相同数目个系数,且将第一块内的系数的至少一个位置及第二块内的系数的至少一个位置映射到所确定的一个或一个以上上下文的至少一个共同上下文。并且,在此些实例中,视频编码器20可经进一步配置以基于识别第一块内的非零系数的位置的信息及识别第二块内的非零系数的位置的信息来更新所确定的一个或一个以上上下文。
在另外实例中,视频编码器20还可经配置以在块包括预定数目个系数或更少的系数时基于与块相关联的帧内预测模式从扫描次序群组中选择扫描次序作为与块相关联的扫描次序,且在块包括多于预定数目个系数时选择固定扫描次序作为与块相关联的扫描次序。视频编码器20可经进一步配置以使用与块相关联的选定扫描次序来对变换系数进行译码。
在一些实例中,预定数目个系数可包括六十四个系数。在其它实例中,扫描次序的群组及固定扫描次序可各自包括曲折扫描次序、水平扫描次序、垂直扫描次序及对角线扫描次序中的至少一者。作为一个实例,对角线扫描次序可从块的宽度及高度中的较小者开始扫描块。作为另一实例,对角线扫描次序可从块的宽度及高度中的较大者开始扫描块。
在又其它实例中,视频编码器20还可经配置以对识别块内的非零变换系数的值的信息进行译码,包含使用与块相关联的扫描次序将与块相关联的变换系数串行化,将串行化变换系数分割成各自包含预定数目个串行化变换系数的一个或一个以上群组,及对识别每一群组内的非零变换系数的值的信息进行译码。
在一些实例中,预定数目个系数可包括十六个系数。在其它实例中,为了对识别块内的非零变换系数的值的信息进行译码,视频编码器20可经配置以在块的宽度及高度中的至少一者不等于“4”的整数倍数的值时对信息进行译码。
因此,如上文所描述,与使用其它方法的情况相比,本发明的技术可使得视频编码器20能够更有效地对与块相关联的变化系数进行编码。特定来说,所述技术可在对块的变化系数及相关语法信息(即,块的最后有效系数位置信息及有效系数位置信息)进行编码时改进对所述系数及所述信息的压缩。另外,所述技术可使得视频编码器20能够具有相对于其它***较低的复杂性来对系数及相关语法信息进行编码。以此方式,当使用本发明的技术时,对于包含经编码的系数及相关语法信息的经译码的位流可存在相对位节省,且用以对系数及相关语法信息进行编码的视频编码器20的复杂性可相对降低。
以此方式,视频编码器20表示包含于设备内的用于在视频译码过程期间对与视频数据块相关联的变换系数进行译码的视频译码器的实例,其中所述块具有由宽度及高度界定的非正方形的形状,其中视频译码器经配置以对指示根据与块相关联的扫描次序在块内的最后非零系数的位置的x坐标及y坐标中的一者或一者以上进行译码,其中为了对x坐标及y坐标中的一者或一者以上中的每一者进行译码,视频译码器经配置以至少部分基于对应于坐标的块的宽度及高度中的一者确定用以对相应的坐标进行译码的一个或一个以上上下文,且通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对相应的坐标进行译码。另外,视频编码器20还表示包含于设备内的用于在视频译码过程期间对与视频数据块相关联的变换系数进行译码的视频译码器的实例,其中块具有由宽度及高度界定的非正方形的形状,其中视频译码器经配置以对识别块内的非零系数的位置的信息进行译码,其中为了对信息进行译码,视频译码器经配置以至少部分基于块的宽度及高度中的一者或一者以上来确定用以对信息进行译码的一个或一个以上上下文,且通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对信息进行译码。
图3为说明视频解码器30的实例的框图,视频解码器30可实施本发明中所描述的与对非正方形的视频数据块的残余变换系数进行译码相关的技术。在图3的实例中,视频解码器30包含熵解码单元80、预测模块81、反量化单元86、反变换模块88、求和器90及参考图片存储器92。预测模块81包含运动补偿单元82及帧内预测模块84。视频解码器30在一些实例中可执行一般与关于来自图2的视频编码器20所描述的编码遍次互逆的解码遍次。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码的视频切片的视频块及相关联的语法元素的经编码的视频位流。视频解码器30的熵解码单元80对位流进行熵解码以产生经量化的系数、运动向量及其它语法元素。熵解码单元80将运动向量及其它语法元素转发到预测模块81。视频解码器30可接收在视频切片层级及/或视频块层级处的语法元素。
当将视频切片译码为经帧内译码(I)的切片时,预测模块81的帧内预测模块84可基于来自当前帧或图片的先前经解码的块的用信号发出的帧内预测模式及数据来产生用于当前视频切片的视频块的预测数据。当将视频帧译码为经帧间译码(即,B、P或GPB)的切片时,预测模块81的运动补偿单元82基于从熵解码单元80接收的运动向量及其它语法元素产生用于当前视频切片的视频块的预测块。可从参考图片列表中的一者内的参考图片中的一者产生预测块。视频解码器30可基于存储于参考图片存储器92中的参考图片使用默认建构技术来建构参考帧列表,列表0及列表1。
运动补偿单元82通过剖析运动向量及其它语法元素来确定用于当前视频切片的视频块的预测信息,且使用预测信息来产生用于经解码的当前视频块的预测块。举例来说,运动补偿单元82使用所接收的语法元素中的一些来确定用以对视频切片的视频块进行译码的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、用于切片的参考图片列表中的一者或一者以上的建构信息、用于切片的每一经帧内译码的视频块的帧间预测状态,以及用以对当前视频切片中的视频块进行解码的其它信息。
运动补偿单元82还可基于内插滤波器执行内插。运动补偿单元82可使用如由视频编码器20在视频块的编码期间所使用的内插滤波器来计算参考块的子整数像素的内插值。在此状况下,运动补偿单元82可从所接收的语法元素来确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测块。
反量化单元86将提供于位流中且由熵解码单元80解码的经量化的变换系数反量化(即,解量化)。反量化过程可包含由视频编码器20针对视频切片中的每一视频块计算的量化参数的使用以确定量化的程度,且同样确定应被应用的反量化的程度。反变换模块88对变换系数应用反变换(例如,反DCT、反整数变换,或概念上类似的反变换过程),以便产生像素域中的残余块。
在运动补偿单元82基于运动向量及其它语法元素产生用于当前视频块的预测块之后,视频解码器30通过对来自反变换模块88的残余块与由运动补偿单元82产生的对应预测块求和来形成经解码的视频块。求和器90表示执行此求和运算的一个或一个以上组件。如果需要的话,还可应用去块滤波器以对经解码块进行滤波,以便移除成块假影。其它回路滤波器(在译码回路中或在译码回路之后)还可用以使像素转变平缓或以其它方式改进视频质量。接着将给定帧或图片中的经解码的视频块存储于参考图片存储器92中,参考图片存储器92存储用于后续运动补偿的参考图片。参考图片存储器92还存储经解码的视频以供稍后呈现于显示装置(例如,图1的显示装置28)上。
作为一个实例,视频解码器30可经配置以在视频译码过程期间对与视频数据块相关联的变换系数进行译码,其中所述块具有由宽度及高度界定的非正方形的形状。在此实例中,块可为CU的TU,如先前所描述。
举例来说,视频解码器30可经配置以对指示根据与块相关联的扫描次序在块内的最后非零系数的位置的x坐标及y坐标中的一者或一者以上(即,用于块的最后有效系数位置信息)进行译码,其中为了对x坐标及y坐标中的一者或一者以上中的每一者进行译码,视频解码器30可经配置以至少部分基于对应于坐标的块的宽度及高度中的一者来确定用以对相应的坐标进行译码的一个或一个以上上下文。视频解码器30可经进一步配置以通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程(例如,CABAC过程)来对相应的坐标进行译码。
在一些实例中,块的宽度可对应于x坐标,且块的高度可对应于y坐标。换句话说,为了对x坐标进行译码,视频解码器30可经配置以使用块的宽度来确定用于对x坐标进行译码的一个或一个以上上下文。类似地,为了对y坐标进行译码,视频解码器30可经配置以使用块的高度来确定用于对y坐标进行译码的一个或一个以上上下文。
在其它实例中,为了对x坐标及y坐标中的一者或一者以上进行译码,视频解码器30可经配置以在块的宽度及高度中的一者等于“1”从而指示宽度及高度中的一者包括单个块位置的情况下不对对应于宽度及高度中的一者的x坐标及y坐标中的一者进行译码。
在又其它实例中,为了对x坐标及y坐标中的一者或一者以上进行译码,视频解码器30可经配置以在块的宽度及高度中的一者等于“2”从而指示宽度及高度中的一者包括两个块位置的情况下,且在块的宽度及高度中的另一者等于大于“2”的值从而指示宽度及高度中的另一者包括两个以上块位置的情况下,至少部分基于对应于等于“2”的宽度及高度中的一者的x坐标及y坐标中的一者,进一步确定用以对对应于等于大于“2”的值的宽度及高度中的另一者的x坐标及y坐标中的另一者进行译码的一个或一个以上上下文。
作为另一实例,视频解码器30可再一次经配置以在视频译码过程期间对与视频数据块相关联的变换系数进行译码,其中所述块具有由宽度及高度界定的非正方形的形状。在此实例中,再一次,块可为CU的TU,如先前所描述。
举例来说,视频解码器30可经配置以对识别块内的非零系数的位置的信息(即,用于块的有效系数位置信息)进行译码,其中为了对信息进行译码,视频解码器经配置以至少部分基于块的宽度及高度中的一者或一者以上来确定用以对信息进行译码的一个或一个以上上下文。视频解码器30可经进一步配置以通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程(例如,CABAC过程)来对信息进行译码。
在一些实例中,视频解码器30可经进一步配置以针对块内的非零系数的位置中的一者或一者以上中的每一者,在对识别块内的非零系数的位置的信息进行译码之前互换指示块内的相应的位置的x坐标及y坐标。
在其它实例中,视频解码器30可经进一步配置以在对识别块内的非零系数的位置的信息进行译码之前将块转置。在此些实例中,块的宽度及高度中的一者或一者以上可包括经转置块的宽度及高度中的一者或一者以上。作为一个实例,为了在对信息进行译码之前将块转置,视频解码器30可经配置以在块的宽度大于块的高度的情况下将块转置。作为另一实例,为了在对信息进行译码之前将块转置,视频解码器30可经配置以在块的高度大于块的宽度的情况下将块转置。
在一些实例中,块可为第一块。在此些实例中,视频解码器30可经进一步配置以对识别第二块内的非零系数的位置的信息进行译码,其中第二块不同于第一块,且其中第二块具有由大小界定的正方形形状。在此些实例中,为了对信息进行译码,视频解码器30可经配置以通过至少部分基于用以对识别第一块内的非零系数的位置的信息进行译码的所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对信息进行译码。
以此方式,如先前所描述,尤其在对识别块内的非零系数的位置的信息进行编码时,视频解码器30可具有相对于其它***较小的复杂性。具体来说,如上文所描述,视频解码器30可使用相同一个或一个以上上下文来对识别具有经转置尺寸或不同尺寸的多个块内的非零系数的位置的信息进行译码。
在此些实例中,视频解码器30可经进一步配置以基于第一块的宽度及高度且基于第二块的大小来确定第一块及第二块包含相同数目个系数,且将第一块内的系数的至少一个位置及第二块内的系数的至少一个位置映射到所确定的一个或一个以上上下文的至少一个共同上下文。并且,在此些实例中,视频解码器30可经进一步配置以基于识别第一块内的非零系数的位置的信息及识别第二块内的非零系数的位置的信息来更新所确定的一个或一个以上上下文。
在另外实例中,视频解码器30还可经配置以在块包括预定数目个系数或更少的系数时基于与块相关联的帧内预测模式从扫描次序群组中选择扫描次序作为与块相关联的扫描次序,且在块包括多于预定数目个系数时选择固定扫描次序作为与块相关联的扫描次序。视频解码器20可经进一步配置以使用与块相关联的选定扫描次序来对变换系数进行译码。
在一些实例中,预定数目个系数可包括六十四个系数。在其它实例中,扫描次序的群组及固定扫描次序可各自包括曲折扫描次序、水平扫描次序、垂直扫描次序及对角线扫描次序中的至少一者。作为一个实例,对角线扫描次序可从块的宽度及高度中的较小者开始扫描块。作为另一实例,对角线扫描次序可从块的宽度及高度中的较大者开始扫描块。
在又其它实例中,视频解码器30还可经配置以对识别块内的非零变换系数的值的信息进行译码,包含对识别各自包含预定数目个变换系数的一个或一个以上群组中的每一者内的非零变换系数的值的信息进行译码,将用于一个或一个以上群组的值接合成串行化值,且使用与块相关联的扫描次序将所述值解串行化。
在一些实例中,预定数目个系数可包括十六个系数。在其它实例中,为了对识别块内的非零系数的值的信息进行译码,视频解码器30可经配置以在块的宽度及高度中的至少一者不等于“4”的整数倍数的值时对信息进行译码。
因此,如上文所描述,与使用其它方法的情况相比,本发明的技术可使得视频解码器30能够更有效地对与块相关联的经编码的变化系数进行解码。特定来说,所述技术可在对块的变化系数及相关语法信息(即,块的最后有效系数位置信息及有效系数位置信息)进行编码且随后解码时改进对所述系数及所述信息的压缩。另外,所述技术可使得视频解码器30能够具有相对于其它***较低的复杂性来对系数及相关语法信息进行解码。以此方式,当使用本发明的技术时,对于包含经编码的系数及相关语法信息的经译码的位流可存在相对位节省,且用以对来自经译码的位流的系数及相关语法信息进行解码的视频解码器30的复杂性可相对降低。
以此方式,视频解码器30表示包含于设备内的用于在视频译码过程期间对与视频数据块相关联的变换系数进行译码的视频译码器的实例,其中所述块具有由宽度及高度界定的非正方形的形状,其中视频译码器经配置以对指示根据与块相关联的扫描次序在块内的最后非零系数的位置的x坐标及y坐标中的一者或一者以上进行译码,其中为了对x坐标及y坐标中的一者或一者以上中的每一者进行译码,视频译码器经配置以至少部分基于对应于坐标的块的宽度及高度中的一者确定用以对相应的坐标进行译码的一个或一个以上上下文,且通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对相应的坐标进行译码。另外,视频解码器30还表示包含于设备内的用于在视频译码过程期间对与视频数据块相关联的变换系数进行译码的视频译码器的实例,其中块具有由宽度及高度界定的非正方形的形状,其中视频译码器经配置以对识别块内的非零系数的位置的信息进行译码,其中为了对信息进行译码,视频译码器经配置以至少部分基于块的宽度及高度中的一者或一者以上来确定用以对信息进行译码的一个或一个以上上下文,且通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对信息进行译码。
图5A到5C为说明与本发明的技术一致的非正方形的视频数据块以及对应有效系数位置信息及最后有效系数位置信息的实例的概念图。在图5A到图5C的实例中,块500为使用图6E中所示的对角线扫描次序扫描的8x4块。以如上文参看NxN视频数据块描述的类似方式,块502及504分别为用于块500的有效系数旗标及最后有效系数旗标的块。举例来说,块500内的块位置506对应于根据对角线扫描次序在块500内的最后有效系数。此外,块位置508对应于根据对角线扫描次序的块502的等于“1”的有效系数旗标中的最后一者。类似地,块位置510对应于块504的等于“1”的最后有效系数旗标。
图6A到图6F为说明与本发明的技术一致的使用曲折、水平、垂直及对角线扫描次序扫描的非正方形的视频数据块的实例的概念图。作为本发明的技术的一个方面,图6A到图6F描绘可用以对包括N个列及M个行的NxM视频数据块进行译码的曲折、水平、垂直及对角线扫描次序的实例,其中N及M具有不同的值(即,块为非正方形)。
举例来说,图6A到图6E中的每一者中所描绘的块(即,块600到608)为8x4块。作为另一实例,图6F中所描绘的块(即,块610)为4x8块。图6A到图6F中所说明的扫描次序中的每一者开始于块600到610中的相应者内的左上角位置(通常被称作“DC”位置)处,且从DC位置进行到块内的右下位置。举例来说,使用曲折扫描次序的一个变化来扫描块600,使用曲折扫描次序的另一变化来扫描块602,使用水平扫描次序来扫描块604,使用垂直扫描次序来扫描块606,且使用对角线扫描次序来扫描块608及块610,如由每一块内的箭头所说明。在其它实例中,与本发明的技术一致,曲折、水平、垂直及对角线扫描次序或其它扫描次序的其它变化可用以对非正方形的视频数据块进行译码。
图7A到图7B为说明与本发明的技术一致的已转置的非正方形的视频数据块的实例的概念图。如图7A到图7B中所示,8x4的视频数据块(块700)可经转置以产生4x8的视频数据块(块702)。图7A到图7B的实例仅为将非正方形的视频数据块转置的一个实例。在其它实例中,与本发明的技术一致,可使用不同技术来将非正方形的视频数据块转置。
图8A到图8B为说明与本发明的技术一致的正方形视频数据块及非正方形的视频数据块的实例的概念图,其中使用共同的一个或一个以上上下文来对有效系数位置信息进行译码。举例来说,如先前所解释,根据本发明的技术的另一方面,具有不同几何形状(例如,正方形及非正方形)及/或定向(例如,垂直及水平)但具有相同数目的残余变换系数的视频数据块可共享相同上下文模型,即相同一个或一个以上上下文。作为一个实例,本发明的技术提供可用以确定用于对特定块的每一有效系数旗标进行熵译码的上下文的块之间的映射。举例来说,映射可将相同或类似概率(或频率)值指派给具有各种几何形状及/或定向的块中的每一者内的特定位置。如先前所描述,概率或频率值可使用上下文索引来指示。
根据使用NxN(即,正方形)视频数据块的一些技术,用以对特定块的每一有效系数旗标进行熵译码的上下文是取决于根据与块相关联的扫描次序在块内的旗标的位置。作为一个实例,对于4x4视频数据块及水平扫描次序,用于对特定有效系数旗标进行译码的上下文可使用以下关系导出:
CtxInc=4*PosY+PosX
CtxInc指示用于经译码的特定有效系数旗标的上下文索引,且“PosY”及“PosX”分别指示对应于NxN块内的旗标的系数的位置的y坐标及x坐标。
根据本发明的技术,以下关系定义用于8x2及2x8块的上文所描述的映射的实例:
If(PosX<4)CtxInc=4*PosY+PosX;
否贝,CtxInc=4+4*PosY+PosX;
此映射假定非正方形的块具有比高度长的宽度,但在其它实例中,非正方形的块可具有比宽度长的高度。
图8A说明使用上文描述的关系(即“CtxInc=4*PosY+PosX”)针对4x4块(块800)的有效系数旗标确定的上下文索引。图8B又说明还使用上文所描述的关系(即,“If(PosX<4)CtxInc=4*PosY+PosX;否则,CtxInc=4+4*PosY+PosX”)针对8x2块(块802)的有效系数旗标确定的上下文索引。
上文所描述的技术还可用以确定用于对包含64个系数或任何数目个系数的非正方形的块的有效系数旗标进行熵译码的上下文。
应注意,可使用“左位移”运算实现以2为因子(例如,2、4、8、16等)的乘法。举例来说,左位移运算等效于“8*a”。类似地,可使用“右位移”运算实现以2为因子的除法。举例来说,右位移运算等效于“a/8”,四舍五入到较低整数。作为一个实例,一些技术可使用以下关系以用于确定用于8x8块的上文所描述的上下文:
根据本发明的技术,用于16x4及4x16块的上文所描述的上下文可使用以下关系来确定:
类似地,用于32x2块的上文所描述的上下文可使用以下关系来确定:
以此方式,对应于每一上下文的概率或频率对于32x2及2x32块以及对于16x4及4x16块可能相当密切地匹配8x8块的概率或频率。因此,与本发明的技术一致,可共享用于所有以上块大小的上下文。
图9A到图9B为说明与本发明的技术一致的非正方形的视频数据块的实例的概念图,其中已根据对角线扫描次序来对残余变换系数进行分组。如图9A中所示,使用对角线扫描次序来扫描8x4视频数据块(块900),所述对角线扫描次序从块的较小尺寸(即,高度)开始扫描块900。在其它实例中,对角线扫描次序可从较大尺寸(即,长度)开始扫描块900。如图9B中所示,将块900的系数串行化成两个系数群组,群组902及群组904,其中在此实例中,每一群组包括块900的十六个系数。在其它实例中,块900可包括更多或更少的系数,且可将系数分组成各自包括任何数目个系数的更多或更少的群组。在任何状况下,随后可对每一群组(在此实例中,群组902及群组904)内的有效系数的值或“层级”(例如,绝对值及正负号)进行译码,如上文所描述。
图10A到图10B为说明与本发明的技术一致的对非正方形的视频数据块的残余变换系数进行译码的方法的实例的流程图。图10A到图10B的技术可大体上由任何处理单元或处理器执行,无论是以硬件、软件、固件还是其组合来实施,且在以软件或固件实施时,可提供对应的硬件来执行软件或固件的指令。为举例说明,相对于视频编码器20(图1和2)及/或视频解码器30(图1和3)来描述图10A到图10B的技术,但应理解,其它装置也可经配置以执行类似技术。此外,图10A到图10B中说明的步骤可按不同次序或并行地执行,且可添加额外步骤以及省略某些步骤,而不会脱离本发明的技术。
在一些实例中,视频编码器20及/或视频解码器30可在视频译码过程期间对与视频数据块相关联的变换系数进行译码,其中所述块具有由宽度及高度界定的非正方形的形状。举例来说,块可为CU的TU,如先前所描述。
最初,视频编码器20及/或视频解码器30可对指示根据与块相关联的扫描次序在块内的最后非零系数的位置的x坐标及y坐标中的一者或一者以上进行译码。举例来说,为了对x坐标及y坐标中的一者或一者以上中的每一者进行译码,视频编码器20及/视频解码器30可至少部分基于对应于坐标的块的宽度及高度中的一者来确定用以对相应的坐标进行译码的一个或一个以上上下文(1000A)。视频编码器20及/或视频解码器30可进一步通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对相应的坐标进行译码(1002A)。
在一些实例中,块的宽度可对应于x坐标,且块的高度可对应于y坐标。换句话说,为了对x坐标进行译码,视频编码器20及/或视频解码器30可使用块的宽度来确定用于对x坐标进行译码的一个或一个以上上下文。类似地,为了对y坐标进行译码,视频编码器20及/或视频解码器30可使用块的高度来确定用于对y坐标进行译码的一个或一个以上上下文。
在其它实例中,为了对x坐标及y坐标中的一者或一者以上进行译码,视频编码器20及/或视频解码器30可在块的宽度及高度中的一者等于“1”从而指示宽度及高度中的一者包括单个块位置的情况下不对对应于宽度及高度中的一者的x坐标及y坐标中的一者进行译码。
在又其它实例中,为了对x坐标及y坐标中的一者或一者以上进行译码,视频编码器20及/或视频解码器30可在块的宽度及高度中的一者等于“2”从而指示宽度及高度中的一者包括两个块位置的情况下,且在块的宽度及高度中的另一者等于大于“2”的值从而指示宽度及高度中的另一者包括两个以上块位置的情况下,至少部分基于对应于等于“2”的宽度及高度中的一者的x坐标及y坐标中的一者,进一步确定用以对对应于等于大于“2”的值的宽度及高度中的另一者的x坐标及y坐标中的另一者进行译码的一个或一个以上上下文。
最后,在一些实例中,视频编码器20及/或视频解码器30可进一步对识别块内的非零系数的位置的信息(即,用于块的有效系数位置信息)进行译码(1004A)。
在其它实例中,视频编码器20及/或视频解码器30可再一次在视频译码过程期间对与视频数据块相关联的变换系数进行译码,其中所述块具有由宽度及高度界定的非正方形的形状。在此些实例中,再一次,块可为CU的TU,如先前所描述。
最初,在一些实例中,视频编码器20及/或视频解码器30可对识别根据与块相关联的扫描次序在块内的最后非零系数的位置的信息(即,用于块的最后有效系数位置信息)进行译码(1000B)。
此外,视频编码器20及/或视频解码器30可对识别块内的非零系数的位置的信息(即,用于块的有效系数位置信息)进行译码,其中为了对信息进行译码,视频编码器20及/或视频解码器30可至少部分基于块的宽度及高度中的一者或一者以上来确定用以对信息进行译码的一个或一个以上上下文(1002B)。视频编码器20及/或视频解码器30可进一步通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对信息进行译码(1004B)。
在一些实例中,视频编码器20及/或视频解码器30可进一步针对块内的非零系数的位置中的一者或一者以上中的每一者,在对识别块内的非零系数的位置的信息进行译码之前互换指示块内的相应的位置的x坐标及y坐标。
在其它实例中,视频编码器20及/或视频解码器30可进一步在对识别块内的非零系数的位置的信息进行译码之前将块转置。在此些实例中,块的宽度及高度中的一者或一者以上可包括经转置块的宽度及高度中的一者或一者以上。作为一个实例,为了在对信息进行译码之前将块转置,视频编码器20及/或视频解码器30可在块的宽度大于块的高度的情况下将块转置。作为另一实例,为了在对信息进行译码之前将块转置,视频编码器20及/或视频解码器30可在块的高度大于块的宽度的情况下将块转置。
在一些实例中,块可为第一块。在此些实例中,视频编码器20及/或视频解码器30可进一步对识别第二块内的非零系数的位置的信息进行译码,其中第二块不同于第一块,且其中第二块具有由大小界定的正方形形状。在此些实例中,为了对信息进行译码,视频编码器20及/或视频解码器30可通过至少部分基于用以对识别第一块内的非零系数的位置的信息进行译码的所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对信息进行译码。
在此些实例中,视频编码器20及/或视频解码器30可进一步基于第一块的宽度及高度且基于第二块的大小来确定第一块及第二块包含相同数目个系数,且将第一块内的系数的至少一个位置及第二块内的系数的至少一个位置映射到所确定的一个或一个以上上下文的至少一个共同上下文。并且,在此些实例中,视频编码器20及/或视频解码器30可进一步基于识别第一块内的非零系数的位置的信息及识别第二块内的非零系数的位置的信息来更新所确定的一个或一个以上上下文。
在另外实例中,视频编码器20及/或视频解码器30还可在块包括预定数目个系数或更少的系数时基于与块相关联的帧内预测模式从扫描次序群组中选择扫描次序作为与块相关联的扫描次序,且在块包括多于预定数目个系数时选择固定扫描次序作为与块相关联的扫描次序。视频编码器20及/或视频解码器30可进一步使用与块相关联的选定扫描次序来对变换系数进行译码。
在一些实例中,预定数目个系数可包括六十四个系数。在其它实例中,扫描次序的群组及固定扫描次序可各自包括曲折扫描次序、水平扫描次序、垂直扫描次序及对角线扫描次序中的至少一者。作为一个实例,对角线扫描次序可从块的宽度及高度中的较小者开始扫描块。作为另一实例,对角线扫描次序可从块的宽度及高度中的较大者开始扫描块。
在又其它实例中,视频编码器20及/或视频解码器30还可对识别块内的非零变换系数的值的信息进行译码,包含使用与块相关联的扫描次序将与块相关联的变换系数串行化,将串行化变换系数分割成各自包含预定数目个串行化变换系数的一个或一个以上群组,及对识别每一群组内的非零变换系数的值的信息进行译码。
在一些实例中,预定数目个系数可包括十六个系数。在其它实例中,为了对识别块内的非零变换系数的值的信息进行译码,视频编码器20及/或视频解码器30可在块的宽度及高度中的至少一者不等于“4”的整数倍数的值时对信息进行译码。
以此方式,图10A的方法表示一种在视频译码过程期间对与视频数据块相关联的变换系数进行译码的方法的实例,(其中所述块具有由宽度及高度界定的非正方形的形状),所述方法包括:对指示根据与所述块相关联的扫描次序在所述块内的最后非零系数的位置的x坐标及y坐标中的一者或一者以上进行译码,其中对所述x坐标及y坐标中的所述一者或一者以上中的每一者进行译码包含至少部分基于对应于坐标的块的宽度及高度中的一者,确定用以对相应的坐标进行译码的一个或一个以上上下文;及通过至少部分基于所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对相应的坐标进行译码。此外,图10B的方法表示一种在视频译码过程期间对与视频数据块相关联的变换系数进行译码的方法的实例,(其中所述块具有由宽度及高度界定的非正方形的形状),所述方法包括:对识别在所述块内的非零系数的位置的信息进行译码,其中对所述信息进行译码包括至少部分基于所述块的所述宽度及所述高度中的一者或一者以上确定用以对所述信息进行译码的一个或一个以上上下文;及通过至少部分基于所述所确定的一个或一个以上上下文执行上下文自适应熵译码过程来对所述信息进行译码。
另外,应注意,与本发明的技术一致,与对非正方形的视频数据块的残余变换系数进行译码有关的上文所描述的所有技术可单独地、一起或以其任何组合执行。
在一个或一个以上实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,那么功能可作为一个或一个以上指令或代码存储在计算机可读媒体上或经由计算机可读媒体传输,且由基于硬件的处理单元执行。计算机可读媒体可包含对应于例如数据存储媒体等有形媒体的计算机可读存储媒体,或包含促进计算机程序例如根据通信协议从一处传送到另一处的任何媒体的通信媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波等通信媒体。数据存储媒体可以是可由一个或一个以上计算机或一个或一个以上处理器存取以检索用于实施本发明中所述的技术的指令、代码及/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
举例来说且并非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来以指令或数据结构的形式存储所要程序代码且可由计算机存取的任何其它媒体。同样,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源传输指令,那么同轴电缆、光缆、双绞线、DSL或例如红外线、无线电及微波等无线技术包含于媒体的定义中。然而,应理解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它暂态媒体,而是改为针对非暂态、有形的存储媒体。如本文中所使用,磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘和蓝光光盘,其中磁盘通常磁性地复制数据,而光盘使用激光光学地复制数据。上文的组合也应包含在计算机可读媒体的范围内。
指令可由一个或一个以上处理器来执行,例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA),或其它等效的集成或离散的逻辑电路。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文描述的功能性可提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入在组合式编解码器中。并且,可将所述技术完全实施于一个或一个以上电路或逻辑元件中。
本发明的技术可实施在各种各样的装置或设备中,包含无线手持机、集成电路(IC)或IC的集合(例如,芯片集)。本发明中描述了各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但不一定要求通过不同硬件单元来实现。而是,如上所述,各种单元可在编解码器硬件单元中组合或由互操作硬件单元(包含如上所述的一个或一个以上处理器)的集合结合合适软件和/或固件来提供。
已描述了各种实例。这些及其它实例属于所附权利要求书的范围内。

Claims (45)

1.一种在视频译码过程期间对与视频数据的一个或多个块相关联的变换系数进行译码的方法,其中所述一个或多个块中的第一块具有由宽度及高度界定的非正方形的形状,且其中所述第一块的所述宽度或所述高度中的一者等于“1”块位置,所述方法包括:
对指示根据与所述块相关联的扫描次序在所述第一块内的最后非零系数的位置的x坐标或y坐标中的一者或多者进行译码,其中对所述x坐标或y坐标中的一者或多者进行译码包括:
确定所述宽度或所述高度中的一者包括单个块位置;
至少部分基于不具有所述单个块位置的块的宽度或高度确定用以对相应的x坐标或y坐标进行译码的一个或多个上下文,所述宽度或所述高度对应于所述相应的x坐标或y坐标;及
通过至少部分基于所确定的一个或多个上下文执行上下文自适应熵译码过程来仅对所述相应的x坐标或y坐标进行译码。
2.根据权利要求1所述的方法,其中,
所述第一块的所述宽度对应于所述x坐标,及所述第一块的所述高度对应于所述y坐标。
3.根据权利要求1所述的方法,其进一步包括:
在所述一个或多个块中的第二块的所述宽度或所述高度中的一者等于“2”从而确定所述宽度或所述高度中的一者包括两个块位置的情况下,且在所述第二块的所述宽度或所述高度中的另一者等于大于“2”的值从而指示所述宽度或所述高度中的所述另一者包括两个以上块位置的情况下,
至少部分基于对应于等于“2”的所述宽度或所述高度中的所述一者的所述x坐标或所述y坐标中的一者,进一步确定用以对对应于等于大于“2”的值的所述宽度或所述高度中的所述另一者的所述x坐标或所述y坐标中的另一者进行译码的所述一个或多个上下文。
4.根据权利要求1所述的方法,其中译码包括编码,所述方法进一步包括:
对视频数据的所述第一块进行编码以产生残余数据;及
变换所述残余数据以产生所述变换系数。
5.根据权利要求1所述的方法,其中译码包括解码,所述方法进一步包括:
反变换所述变换系数以产生残余数据;及
对所述残余数据进行解码以产生视频数据所述第一块。
6.根据权利要求1所述的方法,所述方法能够在无线通信装置上执行,其中所述无线通信装置包括:
存储器,其经配置以存储所述视频数据;
处理器,其经配置以执行指令来处理存储在所述存储器中的所述视频数据;以及
接收器,其经配置以接收所述视频数据。
7.根据权利要求6所述的方法,其中所述无线通信装置为蜂窝电话,视频数据的所述一个或多个块由所述接收器接收并根据蜂窝通信标准进行调制。
8.一种在视频译码过程期间对与视频数据块相关联的变换系数进行译码的方法,其中所述块具有由宽度及高度界定的非正方形的形状,所述方法包括:
对识别所述块内的非零系数的位置的信息进行译码,其中对所述信息进行译码包括:
至少部分基于所述块的所述宽度和所述高度的一者或多者确定用以对所述信息进行译码的一个或多个上下文;及
通过至少部分基于所述所确定的一个或多个上下文执行上下文自适应熵译码过程来对所述信息进行译码。
9.根据权利要求8所述的方法,其进一步包括:
针对所述块内的所述非零系数的所述位置中的一者或多者中的每一者,在对识别所述块内的所述非零系数的所述位置的所述信息进行译码之前互换指示所述块内的相应的位置的x坐标及y坐标。
10.根据权利要求8所述的方法,其进一步包括:
在对识别所述块内的所述非零系数的所述位置的所述信息进行译码之前将所述块转置,及
其中在对所述信息进行译码之前将所述块转置包括在所述块的宽度大于所述块的高度的情况下将所述块转置及在所述块的所述高度大于所述块的所述宽度的情况下将所述块转置中的一者。
11.根据权利要求8所述的方法,其中所述块为第一块,所述方法进一步包括:
对识别第二块内的非零系数的位置的信息进行译码,其中所述第二块不同于所述第一块,且其中所述第二块具有由大小界定的正方形形状,其中对所述信息进行译码包括:
通过至少部分基于用以对识别所述第一块内的所述非零系数的所述位置的所述信息进行译码的所述所确定的一个或多个上下文执行上下文自适应熵译码过程来对所述信息进行译码。
12.根据权利要求11所述的方法,其进一步包括:
基于所述第一块的宽度及高度且基于所述第二块的所述大小确定所述第一块及所述第二块包含相同数目个系数;及
将所述第一块内的系数的至少一个位置及所述第二块内的系数的至少一个位置映射到所述所确定的一个或多个上下文中的至少一个共同上下文。
13.根据权利要求11所述的方法,其进一步包括:
基于识别所述第一块内的所述非零系数的所述位置的所述信息及识别所述第二块内的所述非零系数的所述位置的所述信息来更新所述所确定的一个或多个上下文。
14.根据权利要求8所述的方法,其进一步包括:
在所述块包括预定数目个系数或更少的系数时,基于与所述块相关联的帧内预测模式从扫描次序群组中选择扫描次序作为与所述块相关联的扫描次序,及
在所述块包括多于所述预定数目个系数时选择固定扫描次序作为与所述块相关联的所述扫描次序;及
使用与所述块相关联的所述选定扫描次序来对所述变换系数进行译码。
15.根据权利要求14所述的方法,其中所述预定数目个系数包括六十四个系数。
16.根据权利要求14所述的方法,其中所述扫描次序群组及所述固定扫描次序各自包括曲折扫描次序、水平扫描次序、垂直扫描次序及对角线扫描次序中的至少一者。
17.根据权利要求16所述的方法,其中所述对角线扫描次序从所述块的宽度及高度中的较小者及所述块的所述宽度及所述高度中的较大者中的一者开始扫描所述块。
18.根据权利要求8所述的方法,其进一步包括:
对识别所述块内的非零变换系数的值的信息进行译码包含:
使用与所述块相关联的扫描次序将与所述块相关联的所述变换系数串行化;
将所述串行化变换系数分割成各自包含预定数目个所述串行化变换系数的一个或多个群组;及
对识别每一群组内的非零变换系数的值的信息进行译码。
19.根据权利要求18所述的方法,其中所述预定数目个系数包括十六个系数。
20.根据权利要求18所述的方法,其中对识别所述块内的所述非零变换系数的所述值的所述信息进行译码包括在所述块的宽度及高度中的至少一者不等于“4”的整数倍数的值时对所述信息进行译码。
21.根据权利要求8所述的方法,其中译码包括编码,所述方法进一步包括:
对所述视频数据块进行编码以产生残余数据;及
变换所述残余数据以产生所述变换系数。
22.根据权利要求8所述的方法,其中译码包括解码,所述方法进一步包括:
反变换所述变换系数以产生残余数据;及
对所述残余数据进行解码以产生所述视频数据块。
23.一种经配置以在视频译码过程期间对与视频数据的一个或多个块相关联的变换系数进行译码的设备,其中所述一个或多个块中的第一块具有由宽度及高度界定的非正方形的形状,且其中所述第一块的所述宽度或所述高度中的一者等于“1”块位置,所述设备包括:
视频存储器,其经配置以存储视频数据的第一块;以及
视频译码器,其与所述视频存储器进行通信,所述视频译码器经配置以:
对指示根据与所述块相关联的扫描次序在所述第一块内的最后非零系数的位置的x坐标或y坐标中的一者或多者进行译码,其中为了对所述x坐标或所述y坐标中的一者或多者进行译码,所述视频译码器经配置以:
确定所述宽度或所述高度中的一者包括单个块位置;
至少部分基于不具有所述单个块位置的块的宽度或高度,确定用以对相应的x坐标或y坐标进行译码的一个或多个上下文,所述宽度或所述高度对应于所述相应的x坐标或y坐标;及
通过至少部分基于所确定的一个或多个上下文执行上下文自适应熵译码过程来仅对所述相应的x坐标或所述y坐标进行译码。
24.根据权利要求23所述的设备,其中,
所述第一块的所述宽度对应于所述x坐标,及所述第一块的所述高度对应于所述y坐标。
25.根据权利要求23所述的设备,其中所述视频译码器进一步经配置以:
在所述一个或多个块中的第二块的所述宽度或所述高度中的一者等于“2”从而确定所述宽度或所述高度中的所述一者包括两个块位置的情况下,且在所述第二块的所述宽度或所述高度中的另一者等于大于“2”的值从而指示所述宽度或所述高度中的所述另一者包括两个以上块位置的情况下,至少部分基于对应于等于“2”的所述宽度或所述高度中的所述一者的所述x坐标或所述y坐标中的一者,进一步确定用以对对应于等于大于“2”的值的所述宽度或所述高度中的所述另一者的所述x坐标或所述y坐标中的另一者进行译码的所述一个或多个上下文。
26.根据权利要求23所述的设备,其中所述设备包括以下至少一者:
集成电路;
微处理器;及
包含所述视频译码器的无线通信装置。
27.根据权利要求23所述的设备,其中所述视频译码器包括视频编码器,且其中所述视频编码器经进一步配置以:
对视频数据的所述第一块进行编码以产生残余数据;及
变换所述残余数据以产生所述变换系数。
28.根据权利要求23所述的设备,其中所述视频译码器包括视频解码器,且其中所述视频解码器经进一步配置以:
反变换所述变换系数以产生残余数据;及
对所述残余数据进行解码以产生视频数据的所述第一块。
29.根据权利要求23所述的设备,其中所述设备为无线通信装置,所述设备进一步包括:
接收器,其经配置以接收所述视频数据。
30.根据权利要求29所述的设备,其中所述无线通信装置为蜂窝电话,视频数据的所述一个或多个块由所述接收器接收并根据蜂窝通信标准进行调制。
31.一种经配置以在视频译码过程期间对与视频数据块相关联的变换系数进行译码的设备,其中所述块具有由宽度及高度界定的非正方形的形状,所述设备包括视频译码器,所述视频译码器经配置以:
对识别所述块内的非零系数的位置的信息进行译码,其中为了对所述信息进行译码,所述视频译码器经配置以:
至少部分基于所述块的宽度和高度中的一者或多者确定用以对所述信息进行译码的一个或多个上下文;及
通过至少部分基于所述所确定的一个或多个上下文执行上下文自适应熵译码过程来对所述信息进行译码。
32.根据权利要求31所述的设备,其中所述视频译码器经进一步配置以:
针对所述块内的所述非零系数的所述位置中的一者或多者中的每一者,在对识别所述块内的所述非零系数的所述位置的所述信息进行译码之前互换指示所述块内的相应的位置的x坐标及y坐标。
33.根据权利要求31所述的设备,其中所述视频译码器经进一步配置以:
在对识别所述块内的所述非零系数的所述位置的所述信息进行译码之前将所述块转置,及
其中为了在对所述信息进行译码之前将所述块转置,所述视频译码器经配置以执行在所述块的宽度大于所述块的高度的情况下将所述块转置及在所述块的所述高度大于所述块的所述宽度的情况下将所述块转置中的一者。
34.根据权利要求31所述的设备,其中所述块为第一块,且其中所述视频译码器经进一步配置以:
对识别第二块内的非零系数的位置的信息进行译码,其中所述第二块不同于所述第一块,且其中所述第二块具有由大小界定的正方形形状,其中为了对所述信息进行译码,所述视频译码器经配置以:
通过至少部分基于用以对识别所述第一块内的所述非零系数的所述位置的所述信息进行译码的所述所确定的一个或多个上下文执行上下文自适应熵译码过程来对所述信息进行译码。
35.根据权利要求34所述的设备,其中所述视频译码器经进一步配置以:
基于所述第一块的宽度及高度且基于所述第二块的所述大小确定所述第一块及所述第二块包含相同数目个系数;及
将所述第一块内的系数的至少一个位置及所述第二块内的系数的至少一个位置映射到所述所确定的一个或多个上下文中的至少一个共同上下文。
36.根据权利要求34所述的设备,其中所述视频译码器经进一步配置以:
基于识别所述第一块内的所述非零系数的所述位置的所述信息及识别所述第二块内的所述非零系数的所述位置的所述信息来更新所述所确定的一个或多个上下文。
37.根据权利要求31所述的设备,其中所述设备包括以下至少一者:
集成电路;
微处理器;及
包含所述视频译码器的无线通信装置。
38.根据权利要求31所述的设备,其中所述视频译码器包括视频编码器,且其中所述视频编码器经进一步配置以:
对所述视频数据块进行编码以产生残余数据;及
变换所述残余数据以产生所述变换系数。
39.根据权利要求31所述的设备,其中所述视频译码器包括视频解码器,且其中所述视频解码器经进一步配置以:
反变换所述变换系数以产生残余数据;及
对所述残余数据进行解码以产生所述视频数据块。
40.一种经配置以在视频译码过程期间对与视频数据的一个或多个块相关联的变换系数进行译码的装置,其中所述一个或多个块中的第一块具有由宽度及高度界定的非正方形的形状,且其中所述第一块的所述宽度或所述高度中的一者等于“1”块位置,所述装置包括:
用于对指示根据与所述块相关联的扫描次序在所述第一块内的最后非零系数的位置的x坐标或y坐标中的一者或多者进行译码的装置,其中所述用于对所述x坐标或所述y坐标中的所述一者或多者进行译码的装置包含:
用于确定所述宽度或所述高度中的一者包括单个块位置的装置;
用于至少部分基于不具有所述单个块位置的块的宽度或高度确定用以对相应的x坐标或y坐标进行译码的一个或多个上下文的装置,所述宽度或所述高度对应于所述相应的x坐标或y坐标;以及
用于通过至少部分基于所确定的一个或多个上下文执行上下文自适应熵译码过程来仅对所述相应的x坐标或所述y坐标进行译码的装置。
41.根据权利要求40所述的装置,其进一步包括:
用于在所述一个或多个块中的第二块的所述宽度或所述高度中的一者等于“2”从而确定所述宽度及所述高度中的所述一者包括两个块位置的情况下,且在所述第二块的所述宽度或所述高度中的另一者等于大于“2”的值从而指示所述宽度或所述高度中的所述另一者包括两个以上块位置的情况下,
至少部分基于对应于等于“2”的所述宽度或所述高度中的所述一者的所述x坐标或所述y坐标中的一者,进一步确定用以对对应于等于大于“2”的值的所述宽度或所述高度中的所述另一者的所述x坐标或所述y坐标中的另一者进行译码的所述一个或多个上下文的装置。
42.一种经配置以在视频译码过程期间对与视频数据块相关联的变换系数进行译码的装置,其中所述块具有由宽度及高度界定的非正方形的形状,所述装置包括:
用于对识别所述块内的非零系数的位置的信息进行译码的装置,其中所述用于对所述信息进行译码的装置包括:
用于至少部分基于所述块的所述宽度和所述高度的一者或多者确定用以对所述信息进行译码的一个或多个上下文的装置;及
用于通过至少部分基于所述所确定的一个或多个上下文执行上下文自适应熵译码过程来对所述信息进行译码的装置。
43.根据权利要求42所述的装置,其进一步包括:
用于针对所述块内的所述非零系数的所述位置中的一者或多者中的每一者在对识别所述块内的所述非零系数的所述位置的所述信息进行译码之前互换指示所述块内的相应的位置的x坐标及y坐标的装置。
44.根据权利要求42所述的装置,其中所述块为第一块,进一步包括:
用于对识别第二块内的非零系数的位置的信息进行译码的装置,其中所述第二块不同于所述第一块,且其中所述第二块具有由大小界定的正方形形状,其中所述用于对所述信息进行译码的装置包括:
用于通过至少部分基于用以对识别所述第一块内的所述非零系数的所述位置的所述信息进行译码的所述所确定的一个或多个上下文执行上下文自适应熵译码过程来对所述信息进行译码的装置。
45.根据权利要求44所述的装置,其进一步包括:
用于基于所述第一块的宽度及高度且基于所述第二块的所述大小确定所述第一块及所述第二块包含相同数目个系数的装置;及
用于将所述第一块内的系数的至少一个位置及所述第二块内的系数的至少一个位置映射到所述所确定的一个或多个上下文中的至少一个共同上下文的装置。
CN201280032600.5A 2011-07-01 2012-06-29 在视频译码中用于非正方形块的上下文自适应熵译码 Expired - Fee Related CN103636208B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201161503716P 2011-07-01 2011-07-01
US61/503,716 2011-07-01
US201161554301P 2011-11-01 2011-11-01
US61/554,301 2011-11-01
US13/536,834 2012-06-28
US13/536,834 US9392301B2 (en) 2011-07-01 2012-06-28 Context adaptive entropy coding for non-square blocks in video coding
PCT/US2012/044967 WO2013006446A1 (en) 2011-07-01 2012-06-29 Context adaptive entropy coding for non-square blocks in video coding

Publications (2)

Publication Number Publication Date
CN103636208A CN103636208A (zh) 2014-03-12
CN103636208B true CN103636208B (zh) 2017-07-11

Family

ID=46506632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280032600.5A Expired - Fee Related CN103636208B (zh) 2011-07-01 2012-06-29 在视频译码中用于非正方形块的上下文自适应熵译码

Country Status (6)

Country Link
US (2) US9392301B2 (zh)
EP (1) EP2727350A1 (zh)
JP (1) JP5869114B2 (zh)
KR (1) KR101641439B1 (zh)
CN (1) CN103636208B (zh)
WO (1) WO2013006446A1 (zh)

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8976861B2 (en) * 2010-12-03 2015-03-10 Qualcomm Incorporated Separately coding the position of a last significant coefficient of a video block in video coding
US20120163456A1 (en) 2010-12-22 2012-06-28 Qualcomm Incorporated Using a most probable scanning order to efficiently code scanning order information for a video block in video coding
US9106913B2 (en) 2011-03-08 2015-08-11 Qualcomm Incorporated Coding of transform coefficients for video coding
US10499059B2 (en) 2011-03-08 2019-12-03 Velos Media, Llc Coding of transform coefficients for video coding
US9167253B2 (en) 2011-06-28 2015-10-20 Qualcomm Incorporated Derivation of the position in scan order of the last significant transform coefficient in video coding
US9392301B2 (en) * 2011-07-01 2016-07-12 Qualcomm Incorporated Context adaptive entropy coding for non-square blocks in video coding
JP5712825B2 (ja) * 2011-07-07 2015-05-07 富士通株式会社 座標コード化装置、座標コード化方法、距離算出装置、距離算出方法、プログラム
CA2836161C (en) * 2011-08-23 2017-12-19 Mediatek Singapore Pte. Ltd. Method and system of transform block processing according to quantization matrix in video coding
US20130114692A1 (en) * 2011-11-04 2013-05-09 Texas Instruments Incorporated Simplified Coefficient Scans for Non-Square Transforms (NSQT) in Video Coding
WO2013175736A1 (ja) * 2012-05-25 2013-11-28 パナソニック株式会社 動画像符号化方法、動画像符号化装置、動画像復号方法、動画像復号装置、および、動画像符号化復号装置
BR112014000369B1 (pt) 2012-05-25 2023-04-25 Sun Patent Trust Método de decodificação de imagem em movimento, aparelho de decodificação de imagem em movimento, método de codificação de imagem em movimento e aparelho de codificação de imagem em movimento
MX2013014976A (es) 2012-05-25 2014-04-02 Panasonic Corp Metodo de codificacion de imagenes, aparato de codificacion de imagenes, metodo de decodificacion de imagenes, aparato de decodificacion de imagenes y aparato de codificacion y decodificacion de imagenes.
AU2013273044B2 (en) 2012-06-04 2016-09-15 Sun Patent Trust Video image encoding method, video image encoding device, video image decoding method, and video image decoding device
US9350998B2 (en) 2012-06-29 2016-05-24 Qualcomm Incorporated Coding of significance flags
US9215464B2 (en) 2013-09-19 2015-12-15 Blackberry Limited Coding position data for the last non-zero transform coefficient in a coefficient group
US9813737B2 (en) * 2013-09-19 2017-11-07 Blackberry Limited Transposing a block of transform coefficients, based upon an intra-prediction mode
CN104853196B (zh) * 2014-02-18 2018-10-19 华为技术有限公司 编解码方法和装置
US9716884B2 (en) * 2014-03-20 2017-07-25 Hfi Innovation Inc. Method of signaling for mode selection in 3D and multi-view video coding
CN106134192B (zh) * 2014-03-25 2020-08-11 株式会社索思未来 图像解码装置、图像解码方法及集成电路
JP6341756B2 (ja) * 2014-05-26 2018-06-13 キヤノン株式会社 画像処理装置、画像処理装置の制御方法
EP3292690B1 (en) 2015-06-23 2020-05-06 MediaTek Singapore Pte Ltd. Method and apparatus for transform coefficient coding of non-square blocks
CN114222139A (zh) * 2016-05-28 2022-03-22 世宗大学校产学协力团 视频信号的解码方法
WO2018012660A1 (ko) * 2016-07-15 2018-01-18 엘지전자(주) 예측 유닛 분할을 위한 변환 도메인 예측을 이용하여 비디오 신호를 인코딩, 디코딩하는 방법 및 장치
CN110089115B (zh) * 2016-08-26 2021-07-06 夏普株式会社 图像解码装置、图像编码装置
EP3306924A1 (en) * 2016-10-05 2018-04-11 Thomson Licensing Method and device for context-adaptive binary arithmetic coding a sequence of binary symbols representing a syntax element related to picture data
WO2018174593A1 (ko) 2017-03-22 2018-09-27 김기백 적응적인 화소 분류 기준에 따른 인루프 필터링 방법
AU2018252853A1 (en) * 2017-04-13 2019-12-05 Lg Electronics Inc. Image encoding/decoding method and device therefor
WO2019027241A1 (ko) * 2017-07-31 2019-02-07 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
WO2019025341A1 (en) * 2017-08-04 2019-02-07 Bayer Animal Health Gmbh QUINOLINE DERIVATIVES FOR THE TREATMENT OF INFECTIONS BY HELMINTHES
WO2019029951A1 (en) * 2017-08-08 2019-02-14 Thomson Licensing METHOD AND APPARATUS FOR VIDEO ENCODING AND DECODING
EP3490253A1 (en) 2017-11-23 2019-05-29 Thomson Licensing Encoding and decoding methods and corresponding devices
JP6982525B2 (ja) * 2018-03-16 2021-12-17 Kddi株式会社 動画像の符号化装置および方法、復号装置および方法ならびに符号化復号システム
US10778971B2 (en) * 2018-06-01 2020-09-15 Tencent America LLC Method and apparatus for video coding
US10382772B1 (en) 2018-07-02 2019-08-13 Tencent America LLC Method and apparatus for video coding
BR122021011813A2 (pt) * 2018-11-12 2021-08-10 Lg Electronics Inc. Método de decodificação de imagens através de um aparelho de decodificação, método de codificação de imagens através de um aparelho de codificação e mídia de armazenamento legível por computador não transitória
WO2020130577A1 (ko) * 2018-12-18 2020-06-25 엘지전자 주식회사 이차 변환에 기반한 영상 코딩 방법 및 그 장치
WO2020149594A1 (ko) * 2019-01-15 2020-07-23 엘지전자 주식회사 영상 코딩 시스템에서 고주파 제로잉을 기반으로 레지듀얼 정보를 코딩하는 영상 디코딩 방법 및 그 장치
KR102456938B1 (ko) * 2019-03-12 2022-10-20 엘지전자 주식회사 변환에 기반한 영상 코딩 방법 및 그 장치
US11218735B2 (en) 2019-04-02 2022-01-04 Qualcomm Incorporated Context derivation for last position coding for video coding
EP3935836A4 (en) 2019-04-12 2022-06-08 Beijing Bytedance Network Technology Co., Ltd. INTRA PREDICTION CALCULATION BASED ON A MATRIX
CN117097912A (zh) * 2019-05-01 2023-11-21 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的上下文编码
WO2020239017A1 (en) 2019-05-31 2020-12-03 Beijing Bytedance Network Technology Co., Ltd. One-step downsampling process in matrix-based intra prediction
WO2020244610A1 (en) 2019-06-05 2020-12-10 Beijing Bytedance Network Technology Co., Ltd. Context determination for matrix-based intra prediction
CN112449192B (zh) * 2019-08-27 2022-09-16 杭州海康威视数字技术股份有限公司 解码方法、编码方法及装置
US20230078100A1 (en) * 2021-08-30 2023-03-16 Tencent America LLC Scan order of secondary transform coefficients

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1665303A (zh) * 2005-03-18 2005-09-07 清华大学 图像/视频编码中变换系数的熵编码方法
US20090080532A1 (en) * 2004-01-30 2009-03-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video frame encoding and decoding
CN101427584A (zh) * 2006-03-27 2009-05-06 高通股份有限公司 用于在视频压缩中进行有效系数编码的方法及***

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0769958B2 (ja) * 1988-09-20 1995-07-31 沖電気工業株式会社 画像変換処理方法
JP3679512B2 (ja) * 1996-07-05 2005-08-03 キヤノン株式会社 画像抽出装置および方法
US6047088A (en) * 1996-12-16 2000-04-04 Sharp Laboratories Of America, Inc. 2D mesh geometry and motion vector compression
US6545687B2 (en) * 1997-01-09 2003-04-08 Canon Kabushiki Kaisha Thumbnail manipulation using fast and aspect ratio zooming, compressing and scaling
US6707948B1 (en) * 1997-11-17 2004-03-16 The Regents Of The University Of California Image compression for memory-constrained decoders
JP3250507B2 (ja) * 1997-12-10 2002-01-28 株式会社日立製作所 画像データの符号量制御方法および装置
ES2277174T3 (es) * 2002-05-02 2007-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificacion aritmetica de coeficientes de transformacion.
US8085850B2 (en) * 2003-04-24 2011-12-27 Zador Andrew M Methods and apparatus for efficient encoding of image edges, motion, velocity, and detail
FR2855001A1 (fr) * 2003-05-14 2004-11-19 St Microelectronics Sa Procede de reception de deux signaux de correles transmis sur un unique canal et recepteur pour la mise en oeuvre dudit procede
DE602004022548D1 (de) * 2003-06-25 2009-09-24 Thomson Licensing Decodierungsverfahren und -vorrichtung zum erkennen von wasserzeichen in einem komprimierten videobitstrom
US7286614B2 (en) * 2003-07-29 2007-10-23 Pctel, Inc. Pilotless, wireless, telecommunications apparatus, systems and methods
JP4229323B2 (ja) * 2003-09-05 2009-02-25 株式会社リコー 符号化装置、符号化方法及びプログラム
US7688894B2 (en) * 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
US7646814B2 (en) * 2003-12-18 2010-01-12 Lsi Corporation Low complexity transcoding between videostreams using different entropy coding
US7394861B1 (en) * 2004-04-05 2008-07-01 National Semiconductor Corporation Apparatus for generating signal gain coefficients for a SIMO/MISO transceiver for providing packet data communication with a SISO transceiver
EP1628484B1 (en) * 2004-08-18 2019-04-03 STMicroelectronics Srl Method for transcoding compressed video signals, related apparatus and computer program product therefor
US8422546B2 (en) * 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
US8116576B2 (en) * 2006-03-03 2012-02-14 Panasonic Corporation Image processing method and image processing device for reconstructing a high-resolution picture from a captured low-resolution picture
TW200808067A (en) * 2006-07-31 2008-02-01 Univ Nat Cheng Kung Prediction module
KR101356733B1 (ko) 2007-03-07 2014-02-05 삼성전자주식회사 컨텍스트 기반 적응적 이진 산술 부호화, 복호화 방법 및장치
US8488668B2 (en) 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
KR101375664B1 (ko) * 2007-10-29 2014-03-20 삼성전자주식회사 영상의 디퓨전 특성을 이용한 영상 부호화/복호화 방법 및장치
US9008171B2 (en) 2008-01-08 2015-04-14 Qualcomm Incorporated Two pass quantization for CABAC coders
US8000546B2 (en) 2008-08-01 2011-08-16 National Cheng Kung University Adaptive scan method for image/video coding
US8660193B2 (en) * 2009-01-12 2014-02-25 Maxim Integrated Products, Inc. Parallel, pipelined, integrated-circuit implementation of a computational engine
EP2485490B1 (en) * 2009-10-01 2015-09-30 SK Telecom Co., Ltd. Method and apparatus for encoding/decoding image using split layer
US20110090952A1 (en) * 2009-10-21 2011-04-21 Cohen Robert A Directional Transforms for Video and Image Coding
US20110090954A1 (en) * 2009-10-21 2011-04-21 Cohen Robert A Video Codes with Directional Transforms
US20120044987A1 (en) * 2009-12-31 2012-02-23 Broadcom Corporation Entropy coder supporting selective employment of syntax and context adaptation
US20110176611A1 (en) * 2010-01-15 2011-07-21 Yu-Wen Huang Methods for decoder-side motion vector derivation
US8913666B2 (en) * 2010-10-01 2014-12-16 Qualcomm Incorporated Entropy coding coefficients using a joint context model
US10499059B2 (en) * 2011-03-08 2019-12-03 Velos Media, Llc Coding of transform coefficients for video coding
US9392301B2 (en) * 2011-07-01 2016-07-12 Qualcomm Incorporated Context adaptive entropy coding for non-square blocks in video coding
US9807401B2 (en) * 2011-11-01 2017-10-31 Qualcomm Incorporated Transform unit partitioning for chroma components in video coding
US9813701B2 (en) * 2012-01-20 2017-11-07 Google Technology Holdings LLC Devices and methods for context reduction in last significant coefficient position coding

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090080532A1 (en) * 2004-01-30 2009-03-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Video frame encoding and decoding
CN1665303A (zh) * 2005-03-18 2005-09-07 清华大学 图像/视频编码中变换系数的熵编码方法
CN101427584A (zh) * 2006-03-27 2009-05-06 高通股份有限公司 用于在视频压缩中进行有效系数编码的方法及***

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Cheung Auyeung et al.Context reduction of the last transform position in JCTVC-D262 for CE11.1.《Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 5th Meeting no. JCTVC-E344》.2011,第1-2页第1-2节;附图1-2. *
Context-Based Adaptive Binary Arithmetic Coding in the H.264/AVC Video Compression Standard;Detlev Marpe et al;《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY》;IEEE;20030731;第13卷(第7期);全文 *
J. Sole et al.CE11: Parallel Context Processing for the significance map in high coding efficiency.《Joint Collaborative Team on Video Coding (JCT-VC) no. JCTVC-E388》.2011,全文. *
Peng Wang et al.Proposal of Non-Square Coding Unit Structure.《Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 2th Meeting no. JCTVC-B082》.2010,第3-5页第3节;附图4.1.1,4.1.2. *

Also Published As

Publication number Publication date
EP2727350A1 (en) 2014-05-07
US20160295242A1 (en) 2016-10-06
WO2013006446A1 (en) 2013-01-10
WO2013006446A9 (en) 2013-02-28
JP5869114B2 (ja) 2016-02-24
KR101641439B1 (ko) 2016-07-20
KR20140028118A (ko) 2014-03-07
US9832485B2 (en) 2017-11-28
US9392301B2 (en) 2016-07-12
US20130064294A1 (en) 2013-03-14
JP2014521255A (ja) 2014-08-25
CN103636208A (zh) 2014-03-12

Similar Documents

Publication Publication Date Title
CN103636208B (zh) 在视频译码中用于非正方形块的上下文自适应熵译码
KR101721302B1 (ko) 비디오 코딩에서 변환 계수 데이터를 코딩하기 위한 콘텍스트들의 결정
CN108965872B (zh) 用于视频译码中的4:2:2样本格式的经译码块旗标(cbf)译码
KR101825793B1 (ko) 컨텍스트 적응 멀티-레벨 유의도 코딩을 위한 컨텍스트 도출
AU2013249427A1 (en) Transform coefficient coding
KR20140120341A (ko) 비디오 코딩에서의 계수들의 코딩
EP2810437A2 (en) Residual quad tree (rqt) coding for video coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170711

Termination date: 20210629

CF01 Termination of patent right due to non-payment of annual fee