CN108141590A

CN108141590A - 用于矩形变换单元的量化的增量qp、基于短距离帧内预测sdip的视频译码

Info

Publication number: CN108141590A
Application number: CN201680056226.0A
Authority: CN
Inventors: 钱威俊; 庞超; 张莉; 陈建乐; 马尔塔·卡切维奇
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2015-09-29
Filing date: 2016-09-29
Publication date: 2018-06-08
Also published as: US20170094274A1; JP2018534835A; KR20180059893A; WO2017059044A1; US10218975B2; BR112018006412A2; EP3357240A1

Abstract

实例装置包含存储器装置，其经配置以存储经编码视频数据，以及耦合到所述存储器装置的处理电路。所述处理电路经配置以：确定所述所存储视频数据的矩形变换单元TU包含由第一整数值‘K’表示的像素行数目，以及由第二整数值‘L’表示的像素列数目，其中K具有等于整数值‘m’左移位一的值，且其中L具有等于整数值‘n’左移位一的值；确定n与m的总和为奇数；且基于n与m的总和为所述奇数，将增量量化参数值与所述矩形TU的量化参数QP值相加，以获得所述矩形TU的经修改QP值。

Description

用于矩形变换单元的量化的增量QP、基于短距离帧内预测 SDIP的视频译码

本申请案主张2015年9月29日申请的第62/234,589号美国临时专利申请案的权益，所述临时专利申请案的全部内容以引用的方式并入本文中。

技术领域

本发明涉及视频译码，且更明确地说，涉及用于在译码视频数据时执行帧内预测的技术。

背景技术

数字视频能力可并入到广泛范围的装置中，包含数字电视、数字直播***、无线广播***、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频电话会议装置，及其类似者。数字视频装置实施视频压缩技术，例如通过MPEG-2、MPEG-4、ITU-T H.263、ITU-TH.264/MPEG-4第10部分、高级视频译码(AVC)、目前正在开发的高效视频译码(HEVC)标准以及此类标准的扩展部分定义的标准中描述的技术，以便更高效地发射、接收和存储数字视频信息。

视频压缩技术包含空间预测和/或时间预测，以减少或去除视频序列中固有的冗余。对于基于块的视频译码，视频帧或切片可分割成若干块。每一块可被进一步分割。使用相对于同一帧或切片中的相邻块中的参考样本的空间预测来对经帧内译码(I)帧或切片中的块进行编码。经帧间译码(P或B)帧或片段中的块可使用相对于相同帧或片段中的相邻块中的参考样本的空间预测，或相对于其它参考帧中的参考样本的时间预测。空间或时间预测产生待译码块的预测性块。残余数据表示待译码原始块与预测性块之间的像素差。

经帧间译码块是根据指向形成预测性块的参考样本块的运动向量以及指示经译码块与预测性块之间的差的残余数据来编码。经帧内译码块是根据帧内译码模式和残余数据来编码的。为了进一步压缩，可将残余数据从像素域变换到变换域，从而产生残余变换系数，可接着量化所述残余变换系数。可用特定次序扫描最初布置成二维阵列的经量化变换系数以产生变换系数的一维向量用于熵译码。

发明内容

一般来说，本发明描述用于使用短距离帧内预测(SDIP)来对数据进行帧内译码的技术。本发明的各方面涉及帧内模式相关处理次序、经译码块旗标(CBF)预测、确定最低有效系数(LSC)，且通过增量量化参数(增量-QP或dQP)来变换精度操纵。相对于基于SDIP的视频译码来描述本发明的各种技术，但将了解，所述技术也可适用于根据其它模式的视频译码。

在一个实例中，一种解码经编码视频数据的方法包含：确定矩形变换单元(TU)包括由第一整数值‘K’表示的像素行数目，其中K等于(1<<n)，以及由第二整数值‘L’表示的像素列数目，其中L等于(1<<m)；确定n与m的总和为奇数；以及基于n与m的总和为奇数，将增量量化参数(增量QP)值与矩形TU的量化参数(QP)值相加，以获得矩形TU的经修改QP值。

在另一实例中，一种视频解码装置包含：存储器装置，其经配置以存储经编码视频数据；以及处理电路，其耦合到所述存储器装置。所述处理电路经配置以：确定存储到所述存储器装置的经编码视频数据的矩形变换单元(TU)包括由第一整数值‘K’表示的像素行数目，其中K等于(1<<n)，以及由第二整数值‘L’表示的像素列数目，其中L等于(1<<m)；确定n与m的总和为奇数；以及基于n与m的总和为奇数，将增量量化参数(增量QP)值与矩形TU的量化参数(QP)值相加，以获得矩形TU的经修改QP值。

在另一实例中，一种视频解码装置包含：存储器装置，其经配置以存储经编码视频数据；以及处理电路，其耦合到所述存储器装置。所述处理电路经配置以：确定存储到所述存储器装置的经编码视频数据的子块是根据短距离帧内预测(SDIP)来解码的；确定与存储到所述存储器装置的经编码视频数据的子块相关联的帧内预测方向；响应于确定所述帧内预测方向包括左下方向，确定所述子块的基于SDIP的解码的处理次序包括从下到上处理次序；以及响应于确定帧内预测方向包括右上方向，确定所述子块的基于SDIP的解码的处理次序包括从右到左处理次序。

在另一实例中，一种编码视频数据的方法包含：确定将根据短距离帧内预测(SDIP)来编码视频数据的子块；确定与所述视频数据的所述子块相关联的帧内预测方向；以及执行以下各项中的一者：响应于确定所述帧内预测方向包括左下方向，确定所述子块的基于SDIP的编码的处理次序包括从下到上处理次序；或响应于确定帧内预测方向包括右上方向，确定所述子块的基于SDIP的编码的处理次序包括从右到左处理次序。

在附图和以下描述中陈述本发明的各种方面的细节。本发明中所描述的技术的其它特征、目标和优点将从描述和图式且此所附权利要求书而显而易见。

附图说明

图1是说明可实施本发明的技术的实例视频编码和解码***的框图。

图2是说明可实施本发明的技术的实例视频编码器的框图。

图3是说明可实施本发明的技术的实例视频解码器的框图。

图4A和4B是说明实例四叉树和对应最大译码单元(LCU)的概念图。

图5是说明实例帧内预测模式方向的概念图。

图6是说明用于预测视频数据的实例分区模式的概念图。

图7A是说明根据短距离帧内预测(SDIP)分区成线或非正方形(例如矩形)块的译码单元(CU)的概念图。

图7B是说明包含短距离帧内预测(SDIP)所预测的CU的实例最大译码单元(LCU)的概念图。

图8是说明使用SDIP的不对称分区模式来分区的块的各种实例的概念图。

图9是说明非正方形四叉树分割的实例分割结构的概念图。

图10A和10B是说明根据本发明的各个方面的视频译码装置可实施来修改基于SDIP的译码的自适应处理次序改变的概念图。

图11是说明视频解码装置可借此实施本发明的技术的实例过程的流程图。

图12是说明视频编码装置可借此实施本发明的技术的实例过程的流程图。

图13是说明视频译码装置可借此实施本发明的一或多个变换操纵技术的实例过程的流程图。

具体实施方式

视频译码装置实施视频压缩技术以高效地对视频数据进行编码和解码。视频压缩技术可包含应用空间(帧内)预测和/或时间(帧间)预测技术来减少或去除视频序列中所固有的冗余。视频编码器通常将原始视频序列的每一图片分割成被称作视频块或译码单元(下文更详细描述)的矩形区。这些视频块可使用帧内模式(I模式)或使用帧间模式(P模式或B模式)来编码。

对于P模式和B模式，视频编码器首先搜索与在另一时间位置中的帧(其被称作参考帧且表示为F_ref)中正被编码的块类似的块。视频编码器可将搜索限于距待编码块的某一空间位移。可使用二维(2D)运动向量(Δx，Δy)来定位最佳匹配，其中Δx是水平移位，且Δy是垂直移位。因此，视频编码器可根据以下等式，使用所述运动向量和最佳匹配所属的参考图片来建构经预测块F_pred：

F_pred(x,y)＝F_ref(x+Δx，y+Δy)

其中图片内的像素的位置由(x，y)表示。

对于在I模式中编码的块，视频编码器可基于来自同一图片内的先前编码的相邻块的数据，使用空间预测技术来形成经预测块。

在任何情况下，对于I模式和P或B模式两者，预测误差(即，正被编码的块和经预测块中的像素值之间的差可表示为离散变换(例如离散余弦变换(DCT))的一组经加权基础函数。可使用不同大小的块(例如4×4、8×8或16×16和更大)来执行变换。变换块的形状无需总是为正方形。举例来说，还可使用矩形变换块，例如大小为16x4、32x8等的变换块。

在变换之后，随后量化权重(即，变换系数)：量化引入信息的损耗，且由此，经量化系数具有比原始变换系数低的精度。可通过调整量化变换系数时使用的量化参数(QP)的值，来控制压缩比，即用以表示原始序列和经压缩序列的位数目的比率。

经量化变换系数和运动向量是语法元素的实例，且连同控制信息一起，形成视频序列的经译码表示。在一些例子中，视频编码器可对语法元素进行熵译码，从而进一步减少其表示所需的位数目。熵译码是旨在通过利用语法元素的分布的特性(例如认识到一些符号比其它符号更频繁地出现)来最小化表示所发射或所存储的符号(例如语法元素)所需的位数目的无损操作。

视频解码器可使用上文所论述的语法元素和控制信息来建构用于解码当前帧的预测性数据(例如预测性块)。举例来说，视频解码器可将经预测块与经压缩预测误差相加。视频解码器可通过使用经量化系数对变换基础函数进行加权来确定经压缩预测误差。经重建帧与原始帧之间的差可被称作重构误差。

视频译码联合协作团队已开发了被称作高效视频译码(HEVC)的新译码标准。在HEVC中，图片可分区成包含亮度和色度样本两者的树块或最大译码单元(LCU)的序列。位流内的语法数据可定义LCU(就像素数目来说，其为最大译码单元)的大小。切片包含按译码次序的若干连续树块。视频帧或图像可分区成一或多个切片。每一树块可根据四叉树***成若干译码单元(CU)。一般来说，四叉树数据结构包含每CU一个节点，其中根节点对应于树块。如果CU***成四个子CU，那么对应于CU的节点包含四个叶节点，其中叶节点中的每一者对应于所述子CU中的一者。译码单元(CU)大体上是指充当对其应用各种译码工具以进行视频压缩的基本单元的图像区域。CU通常具有一个亮度分量，指示为Y，以及两个色度分量，指示为U和V。

CU通常包含一或多个预测单元(PU)，其描述如何预测用于CU的数据。CU可包含指示CU的PU的预测模式的信息；例如用于CU的信息可指示所述CU的一或多个部分的预测模式。在一些实例中，出于预测的目的，可将CU划分或分区为多于一个部分。

如本发明中所描述，预测分区模式(或预测分割模式)可通常指代出于预测的目的而划分块(例如CU，例如，叶节点CU)的方式。举例来说，假定特定CU的大小为2N×2N，可使用2N×2N PU来整体预测所述CU(被称作2N×2N分区模式)。在另一实例中，可使用大小为N×N的四个相等大小的PU来预测所述CU(被称作N×N分区模式)。

在一些实例中，短距离帧内预测(SDIP)模式可用于译码经帧内预测块。SDIP描述于各种参照案中，例如X.曹(X.Cao)等人的“关于短距离帧内预测(SDIP)方法的简化的CE6.c报告(CE6.c Report on Simplification of Short Distance Intra Prediction(SDIP)Method)”，JCTVC-G556，2011年11月；X.曹等人的“用于高效视频译码的短距离帧内译码方案(Short Distance Intra Coding Scheme for High Efficiency VideoCoding)”，IEEE图像处理学报，2013年2月，第2期，第22卷；以及X.曹等人的“用于HEVC的短距离帧内译码方案(Short Distance Intra Coding Scheme for HEVC)”，2012图片译码会议，2010年5月7日到9日。HEVC标准化中还研究SDIP。SDIP的技术是将N×N块划分成排(例如单像素行或单像素列)或非正方形块，以便通过减小所预测像素与其参考像素的距离来减少预测残余物的能量。在SDIP模式下，小于64×64维度的一个CU可分割为排或非正方形块，其具有如图7A和7B中示出的矩形形状。图7A说明基于HM和/或基于X.曹等人的“关于短距离帧内预测(SDIP)方法的简化的CE6.c报告”(JCTVC-G556，2011年11月)的SDIP块分区。根据SDIP，一个32×32CU可分割成四个8×32PU或四个32×8PU。另外，16×16CU可分成四个8×8PU(如HEVC测试模型“HM”)中所描述，或可分成四个4×16PU，或四个16×4PU。另外，根据SDIP，4×16PU或16×4PU可进一步***成四个1×16分区或四个16×1分区。类似地，一个8×8CU可分成四个2×8PU或四个8×2PU。反过来每4×4PU可进一步分成四个1×4分区或四个4×1分区。因此，SDIP中支持两种类型的PU。第一种所支持类型的PU是矩形PU，在本文中被称作具有hN×2N维度或2N×hN维度。在上文的描述中，‘h’表示一半(1/2)。第二种所支持类型的PU是基于排的PU，在本文中被称作具有l×N维度或N×l维度。对于32×32CU，仅使用矩形SDIP PU。对于16×16或8×8CU，支持矩形和基于排的PU两者。举例来说，根据SDIP，对于16×16和8×8CU，可支持矩形和基于排的PU两者，因为这些种类的CU中存在较多纹理。

根据实例SDIP技术，视频编码器和/或视频解码器可将CU划分为若干个平行的非正方形PU。举例来说，SDIP技术可用于将CU分成多个平行PU，其大小为2N×hN或hN×2N，其中“h”表示二分之一。换句话说，“hN”等效于N/2。在一实例中，出于说明的目的，可将8×8CU分成四个8×2PU，其中在此实例中，“N×M”是指垂直N个像素和水平M个像素。在此实例中，可从到CU的相邻像素预测第一PU，且可从包含第一PU的像素的相邻像素预测第二PU，可从包含第二PU的像素的相邻像素预测第三PU，且可从包含第三PU的像素的相邻像素预测第四PU。以此方式，并非从与CU相邻的经先前译码块的像素预测CU的所有像素，而是可使用SDIP，使用所述CU内的像素来预测同一CU内的其它像素。

可以多种方式提供关于分割模式的信息。举例来说，可使用分区模式表来提供分区信息，例如，是否针对经帧内译码块使用大小为2N×2N和N×N的PU或针对经帧间译码块使用大小为2N×2N、2N×N、N×2N、N×N的PU来预测CU。分区模式表可将所述模式中的每一者映射到语法元素。在一些实例中，语法元素可为可由熵译码器译码的二进制数串(位的二进制串)。在任何情况下，可将表维持在编码器和解码器两者处。因此，可根据分区模式表中的条目来识别特定CU的分区信息。

在其它实例中，可使用一或多个其它语法元素(不与模式表相关联)来发信号通知分区信息。举例来说，视频编码器可在经编码位流中提供使用SDIP来预测特定CU的指示。因此，视频解码器可确定在解码此信令后，已使用SDIP来对特定CU进行帧内预测。在一些实例中，用于SDIP模式的语法可包含以下元素：

1.SDIP_Flag：用于发信号通知将CU作为正方形预测(2N×2N、N×N)或SDIP类型(2N×hN和hN×2N)来编码的旗标。举例来说，如果SDIP_Flag等于零，那么将CU作为正方形预测单元来编码。然而，如果SDIP_Flag等于一，那么使用SDIP分区来编码所述CU。

2.SDIP_direction_Flag：用于发信号通知使用哪一SDIP模式的旗标。举例来说，如果SDIP_direction_Flag等于零，那么可使用hN×2N模式。然而，如果SDIP_direction_Flag等于一，那么可使用2N×hN模式。

在以上实例中，可使用CABAC(上下文自适应二进制算术译码)来译码SDIP_Flag和SDIP_direction_Flag两者。

在以上实例中，除由分区模式表(上文所述)定义的语法元素之外，还提供SDIP_Flag和SDIP_direction_Flag语法元素。此外，如上所述，SDIP_Flag和SDIP_direction_Flag可需要定义和维持额外的CABAC上下文。因此，SDIP旗标的信令可在计算上相对较密集和/或按位来说较昂贵。

图1是说明可利用用于执行本发明的SDIP译码和/或变换操纵技术中的一或多者的技术的实例视频编码和解码***10的框图。如图1中所示，***10包含提供稍后将由目的地装置14解码的经编码视频数据的源装置12。明确地说，源装置12经由计算机可读媒体16将视频数据提供到目的地装置14。源装置12和目的地装置14可包括各种装置中的任一者，包含桌上型计算机、笔记本型((即，膝上型)计算机、平板计算机、机顶盒、移动装置、广播接收器装置、电话手持机(例如所谓的“智能”电话)、所谓的“智能”垫、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台、视频流式传输装置或类似者。在一些情况下，可装备源装置12和目的地装置14以用于无线通信。

目的地装置14可经由计算机可读媒体16接收待解码的经编码视频数据。计算机可读媒体16可包括能够将经编码的视频数据从源装置12移动到目的地装置14的任一类型的媒体或装置。在一个实例中，计算机可读媒体16可包括通信媒体，以使源装置12能够实时地将经编码的视频数据直接发射到目的地装置14。经编码视频数据可根据通信标准(例如，无线通信协议)来调制，且发射到目的地装置14。通信媒体可包括任何无线或有线通信媒体，例如射频(RF)频谱或一或多个物理传输线。通信媒体可形成基于包的网络(例如局域网、广域网或全球网络，例如因特网)的部分。通信媒体可包含路由器、交换机、基站或可用于促进从源装置12到目的地装置14的通信的任何其它设备。

在一些实例中，经编码数据可从输出接口22输出到存储装置。类似地，可通过输入接口从存储装置存取经编码数据。存储装置可包含多种分布式或本地存取的数据存储媒体中的任一者，例如硬盘驱动器、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器、或用于存储经编码视频数据的任何其它适合的数字存储媒体。在另一实例中，存储装置可对应于可存储由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可经由流式传输或下载从存储装置存取所存储的视频数据。文件服务器可为能够存储经编码视频数据并且将所述经编码视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包含网络服务器(例如，用于网站)、FTP服务器、网络附接存储(NAS)装置或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包含因特网连接)来存取经编码的视频数据。这可包含无线信道(例如，Wi-Fi连接)、有线连接(例如，DSL、电缆调制解调器等)，或适合于存取存储在文件服务器上的经编码视频数据的两者的组合。经编码视频数据从存储装置的传输可为流式传输、下载传输或其组合。

本发明的技术未必限于无线应用或设置。所述技术可应用于支持多种多媒体应用中的任一者的视频译码，例如空中电视广播、有线电视传输、***传输、因特网流视频传输(例如，HTTP动态自适应流式传输(DASH))、被编码到数据存储媒体上的数字视频，存储在数据存储媒体上的数字视频的解码，或其它应用。在一些实例中，***10可经配置以支持单向或双向视频发射，以支持例如视频串流、视频重放、视频广播和/或视频电话的应用。

在图1的实例中，源装置12包含视频源18、视频编码器20和输出接口22。目的地装置14包含输入接口28、视频解码器30和显示装置32。根据本发明，源装置12的视频编码器20可经配置以应用用于执行基于SDIP的译码和/或用于变换大小操纵的技术。在其它实例中，源装置和目的地装置可包含其它组件或布置。举例来说，源装置12可从外部视频源18(例如，外部相机)接收视频数据。同样地，目的地装置14可与外部显示装置介接，而不是包含集成显示装置。

图1的所说明的***10仅为一个实例。用于执行基于SDIP的译码和/或用于变换大小操纵的技术可由任何数字视频编码和/或解码装置执行。尽管本发明的技术通常由视频编码装置执行，但所述技术也可通过视频编码器/解码器(通常被称作“编解码器”)执行。此外，本发明的技术还可由视频预处理器执行。源装置12和目的地装置14仅为此类译码装置的实例，其中源装置12产生经译码视频数据以用于发射到目的地装置14。在一些实例中，装置12、14可以大体上对称的方式操作，使得装置12、14中的每一者包含视频编码和解码组件。因此，***10可支持视频装置12、14之间的单向或双向视频传输以例如用于视频流式传输、视频重放、视频广播或视频电话。

源装置12的视频源18可包含视频捕获装置，例如摄像机、含有先前所捕获视频的视频存档和/或用于从视频内容提供者接收视频的视频馈送接口。作为再一替代方案，视频源18可产生基于计算机图形的数据作为源视频，或实况视频、存档视频与计算机产生的视频的组合。在一些情况下，如果视频源18为摄像机，那么源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而，如上文所提到，本发明中所描述的技术一般可适用于视频译码，且可应用于无线和/或有线应用。在每种情况下，可通过视频编码器20来编码所捕获、预捕获或计算机产生的视频。经编码视频信息可接着通过输出接口22输出到计算机可读媒体16上。

计算机可读媒体16可包含瞬时媒体，例如无线广播或有线网络传输，或存储媒体(即，非暂时性存储媒体)，例如硬盘、快闪驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中，网络服务器(未图示)可从源装置12接收经编码视频数据，并将所述经编码视频数据提供到目的地装置14，例如，经由网络传输。类似地，媒体生产设施(例如，光盘冲压设施)的计算装置可从源装置12接收经编码的视频数据且生产含有经编码的视频数据的光盘。因此，在各种实例中，计算机可读媒体16可理解为包含各种形式的一或多个计算机可读媒体。

本发明可大体上涉及视频编码器20，其将某些信息“发信号通知”到例如视频解码器30的另一装置。然而，应理解，视频编码器20可通过使某些语法元素与视频数据的各种经编码部分相关联来发信号通知信息。也就是说，视频编码器20可通过将某些语法元素存储到视频数据的各种经编码部分的标头来“发信号通知”数据。在一些情况下，此类语法元素在由视频解码器30接收和解码之前编码和存储(例如存储到计算机可读媒体16)。因而，术语“发信号通知”通常可指代用于解码经压缩的视频数据的语法或其它数据的通信，不论所述通信是实时或准实时发生还是在一段时间内发生，例如可能在编码时将语法元素存储到媒体上的时候发生，接着可在存储到此媒体之后的任何时间由解码装置检索。

目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包含由视频编码器20定义的语法信息，所述语法信息还供视频解码器30使用，所述语法信息包含描述块及其它经译码单元(例如，GOP)的特性和/或处理的语法元素。显示装置32向用户显示经解码的视频数据，且可包括多种显示装置中的任一者，例如，阴极射线管(CRT)、液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。

视频编码器20和视频解码器30各自可实施为可适用的多种合适的编码器或解码器电路中的任一者，例如，一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20和/或视频解码器30可借此实施的编码器电路和/或解码电路的实例包含处理电路，其可包括固定功能电路、可编程电路，或固定功能电路与可编程电路的组合。当所述技术部分地在软件中实施时，装置可将用于所述软件的指令存储在合适的非暂时性计算机可读媒体中，且使用处理电路(例如一或多个处理器)来在硬件中执行所述指令，以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含在一或多个编码器或解码器中，所述编码器或解码器中的任一者可集成为组合式视频编码器/解码器(编解码器)的部分。包含视频编码器20和/或视频解码器30的装置可包括集成电路、处理电路、微处理器和/或无线通信装置，例如蜂窝式电话。

尽管图1中未图示，但在一些方面中，视频编码器20和视频解码器30可各自与音频编码器和解码器集成，且可包含适当的多路复用器-多路分用器单元或其它硬件和软件，以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用的话，多路复用器-多路分用器单元可符合ITU H.223多路复用器协议，或例如用户数据报协议(UDP)等其它协议。

视频编码器20和视频解码器30可根据视频压缩标准(例如ITU-TH.264标准，或者称为MPEG-4；部分10，高级视频译码(AVC)，或此类标准的扩展)来操作。ITU-T H.264/MPEG-4(AVC)标准是作为被称为联合视频小组(JVT)的集体联盟的产品而由ITU-T视频译码专家组(VCEG)连同ISO/IEC移动图片专家组(MPEG)制定。在一些方面，本发明中描述的技术可应用于一般符合H.264标准的装置。H.264标准描述于ITU-T研究组的日期为2005年3月的“ITU-T推荐H.264，用于通用视听服务的高级视频译码(ITU-T Recommendation H.264，Advanced Video Coding for generic audiovisual services)”中，其在本文中可被称作H.264标准或H.264规范或H.264/AVC标准或规范。视频压缩标准的其它实例包含MPEG-2和ITU-T H.263。

虽然本发明的技术不限于任何特定译码标准，但所述技术可与HEVC标准相关。HEVC标准化工作是基于被称作HEVC测试模型(HM)的视频译码装置的演进模型。HM假设视频译码裝置根据例如ITU-T H.264/AVC相对于现有裝置的几个额外能力。举例来说，虽然H.264提供了九个帧内预测编码模式，但是HM可提供多达三十五个帧内预测编码模式。

一般来说，HM的工作模型描述视频帧或图片可划分成包含亮度和色度样本两者的一序列树块或最大译码单元(LCU)。位流内的语法数据可定义LCU(就像素数目来说，其为最大译码单元)的大小。切片包含按译码次序的若干连续树块。视频帧或图像可被分割成一或多个切片。每一树块可根据四叉树***成若干译码单元(CU)。一般来说，四叉树数据结构包含每CU一个节点，其中根节点对应于树块。如果CU***成四个子CU，那么对应于CU的节点包含四个叶节点，其中叶节点中的每一者对应于所述子CU中的一者。

四叉树数据结构的每一节点可提供对应CU的语法数据。举例来说，四叉树中的节点可包含***旗标，从而指示对应于节点的CU是否***成子CU。CU的语法元素可递归地定义，且可取决于所述CU是否***成若干子CU。如果CU未进一步***，那么将其称作叶CU。在本发明中，叶CU的四个子CU也将被称作叶CU，即使不存在原始叶CU的明确***时也是如此。举例来说，如果16×16大小的CU不进一步***，那么尽管16×16CU从未***，四个8×8子CU也将被称作叶CU。

CU具有与H.264标准的宏块类似的目的，除了CU不具有大小区别。举例来说，树块可***成四个子节点(还称为子CU)，并且每一子节点又可为父节点并且可***成另外四个子节点。最后未***的子节点(被称作四叉树的叶节点)包括译码节点，也被称作叶CU。与经译码位流相关联的语法数据可定义树块可***的最大次数，被称作最大CU深度，且还可定义译码节点的最小大小。因此，位流还可定义最小译码单元(SCU)。本发明使用术语“块”来在HEVC的背景下指代CU、PU或TU中的任一者，或在其它标准的背景下指代类似数据结构(例如H.264/AVC中的宏块和其子块)。

CU包含译码节点，以及与所述译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小，且形状必须是正方形。CU的大小范围可从8×8像素到具有最大64×64像素或更大的树块的大小。每一CU可含有一或多个PU和一或多个TU。

举例来说，与CU相关联的语法数据可描述将CU分割成一或多个PU。分割模式可在CU被跳过或经直接模式编码、经帧内预测模式编码或经帧间预测模式编码之间有所不同。PU可被分割成非正方形形状。举例来说，与CU相关联的语法数据还可描述CU根据四叉树划分成一或多个TU。TU的形状可为正方形或非正方形(例如，矩形)。

HEVC标准允许根据TU进行变换，TU可针对不同CU而有所不同。TU通常是基于针对经分割LCU定义的给定CU内的PU的大小而定大小，但情况可能并不总是如此。TU通常与PU大小相同或小于PU。在一些实例中，对应于CU的残余样本可使用一种被称为“残余四叉树”(RQT)的四叉树结构来细分成较小单元。RQT的叶节点可被称为变换单元(TU)。可变换与TU相关联的像素差值以产生变换系数，所述变换系数可经量化。

叶CU可包含一或多个预测单元(PU)。一般来说，PU表示对应于相对应的CU的全部或一部分的空间区域，且可包含用于检索PU的参考样本的数据。此外，PU包含与预测有关的数据。举例来说，当PU经帧内模式编码时，用于PU的数据可包含在残余四分树(RQT)中，残余四分树可包含描述用于对应于PU的TU的帧内预测模式的数据。作为另一实例，当PU经帧间模式编码时，PU可包含定义PU的一或多个运动向量的数据。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如，四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片，及/或运动向量的参考图片列表(例如，列表0、列表1或列表C)。

具有一或多个PU的叶CU还可包含一或多个变换单元(TU)。变换单元可使用RQT(也称为TU四叉树结构)来指定，如上文所论述。举例来说，***旗标可指示叶CU是否***成四个变换单元。接着，每一变换单元可进一步***成更多子TU。当TU未经进一步***时，其可被称作叶TU。通常，对于帧内译码，所有属于一叶CU的叶TU共享相同的帧内预测模式。就是说，一般应用相同的帧内预测模式来计算叶CU的所有TU的所预测值。对于帧内译码，视频编码器可使用帧内预测模式将每一叶TU的残余值计算为CU的对应于TU的部分与原始块之间的差。TU未必限于PU的大小。因而，TU可比PU大或小。对于帧内译码，PU可与相同CU的对应叶TU处于相同位置。在一些实例中，叶TU的最大大小可对应于对应叶CU的大小。

此外，叶CU的TU还可与相应的四叉树数据结构(被称作残余四叉树(RQT))相关联。就是说，叶CU可包含指示叶CU如何分割成TU的四分树。TU四叉树的根节点一般对应于叶CU，而CU四叉树的根节点一般对应于树块(或LCU)。RQT的未***的TU被称作叶TU。一般来说，本发明分别使用术语CU和TU来指代叶CU和叶TU，除非另有指出。

HM支持各种PU大小的预测，还被称作分割模式。假定特定CU的大小为2N×2N，那么HM支持2N×2N或N×N的PU大小的帧内预测，以及2N×2N、2N×N、N×2N或N×N的对称PU大小的帧间预测。

HM还支持用于2N×nU、2N×nD、nL×2N和nR×2N的PU大小中的帧间预测的不对称分割。在不对称分割中，不分割CU的一个方向，但是将另一方向分割成25％和75％。CU的对应于25％分区的部分通过“n”后面跟着“上”、“下”、“左”或“右”的指示来指示。因此，举例来说，“2N×nU”是指水平地分割的2N×2N CU，其中顶部为2N×0.5N PU，且底部为2N×1.5NPU。

在一些实例中，视频编码器20和视频解码器30可实施SDIP模式以使用平行PU来预测CU。在此类实例中，可用hN×2N排列中的四个SDIP PU来预测CU，其中“h”表示二分之一。在其它实例中，可用2N×hN排列中的四个SDIP PU来预测CU。其它分区排列也是可能的，例如与多种不对称SDIP模式相关联的那些分区排列，如下所述。

在任何用以产生变换系数的变换之后，视频编码器20可执行变换系数的量化。量化总体上是指对变换系数进行量化以可能减少用以表示所述系数的数据的量从而提供进一步压缩的过程。量化过程可降低与系数中的一些或全部相关联的位深度。举例来说，可在量化期间将n位值向下舍入到m位值，其中n大于m。

在量化之后，视频编码器可扫描变换系数，从包含经量化变换系数的二维矩阵产生一维向量。所述扫描可经设计以将较高能量(并且因此较低频率)的系数放置在阵列的前面，并且将较低能量(并且因此较高频率)的系数放置在阵列的后面。在一些实例中，视频编码器20可利用预定义扫描次序来扫描经量化变换系数，以产生可熵编码的串行化向量。在其它实例中，视频编码器20可执行自适应扫描。

在扫描经量化变换系数以形成一维向量之后，视频编码器20可以(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法对一维向量进行熵编码。视频编码器还20还可对与经编码视频数据相关联的语法元素进行熵编码，以供视频解码器30在对视频数据进行解码时使用。

视频编码器20可进一步向视频解码器30发送语法数据，例如基于块的语法数据、基于帧的语法数据和基于图片群组(GOP)的语法数据，例如在帧标头、块标头、切片标头或GOP标头中。GOP语法数据可描述相应GOP中的帧的数目，且帧语法数据可指示用以编码对应帧的编码/预测模式。

在接收到经译码视频数据后，视频解码器30可执行通常与相对于视频编码器20描述的编码遍次互逆的解码遍次。下文描述本发明的各种技术。

在一些方面，本发明的技术是针对帧内模式相关处理次序。根据实例SDIP技术，子块的处理次序是从上到下和从左到右。SDIP的一个潜在优点在于与正常帧内预测的情形中相比，经重构的相邻像素趋向于显著更接近经预测像素。因为根据SDIP，从中预测当前像素的经重构的相邻像素定位成更接近当前像素，所以SDIP可改进当前像素的预测的准确性。然而，如果SDIP预测次序总是从上到下和从左到右，那么先前经译码的子块中的经重构像素无法被视频解码器30完全利用。举例来说，如果帧内预测方向是从左下开始，那么帧内预测总是来自(例如总是基于)左下像素。

因此，处理次序的从上到下方面可不增加或以其它方式改进当前像素的预测准确性。举例来说，根据SDIP处理次序的从上到下性质，当预测当前像素时，左下相邻像素可能尚未重构，且因此，帧内预测参考像素是不可用的。类似地，在其中帧内预测是从右上开始的实例中，帧内预测总是来自(例如总是基于)右上像素。在这些情形中，SDIP处理次序的从左到右性质可不增加或以其它方式改进预测准确性。

根据本发明的方面，在各种环境下，视频编码器20和/或视频解码器30可分别将左下帧内预测和右上帧内预测的处理次序改变为从下到上和从右到左。一般来说，视频编码器20和视频解码器30可基于当前CU的帧内预测角度来改变处理次序。举例来说，视频编码器20和视频解码器30可实施本发明的技术，以改变处理次序，从解决其中根据现有SDIP处理次序经重构像素不可用的情形。

通过在帧内预测方向是左下的情况下实施从下到上处理次序，视频编码器20和视频解码器30可实施本发明的技术，以在其中帧内预测方向是左下的实例中增加或改进预测准确性。举例来说，如果现有SDIP技术的从上到下处理次序与左下帧内预测方向组合，那么来自左下块或行的经重构像素可能尚未可用(例如经重构像素可能尚未经译码)。举例来说，归因于现有SDIP技术所提供的处理次序，来自左下块或行的像素可能尚未经重构。因此，为了根据现有技术执行SDIP，视频编码器20和视频解码器30可需要使用已经在另一CU(例如邻近当前CU定位的CU)中重构的像素。如本文相对于SDIP相关技术的描述所使用，术语“左下”当用以描述块或行时，描述位于当前CU下方以及当前CU左侧的块或行。举例来说，“左下相邻块”或“左下相邻像素”可位于当前CU或像素的紧靠着下方和紧靠着左侧。

类似地，通过在帧内预测方向为右上的情况下实施从右到左处理次序，视频编码器20和视频解码器30可实施本发明的技术来在其中帧内预测方向是右上的实例中增加或改进预测准确性。举例来说，如果现有SDIP技术的从左到右处理次序与右上帧内预测方向组合，那么来自右上块或行的经重构像素可能尚未可用。举例来说，归因于现有SDIP技术所提供的处理次序，来自右上块或行的像素可能尚未经重构。因此，为了根据现有技术执行SDIP，视频编码器20和视频解码器30可需要使用已经在另一CU(例如邻近当前CU定位的CU)中重构的像素。如本文相对于SDIP相关技术的描述所使用，术语“右上”当用以描述块或行时，描述位于当前CU上方以及当前CU右侧的块或行。

在其中现有SDIP技术致使视频编码器20和/或视频解码器30使用位于用于当前CU的基于SDIP的译码的不同CU中的像素的实例中，译码准确性可能受损。举例来说，因为与通常在SDIP处理次序根据帧内预测方向/角度提供已经重构的像素时使用的像素相比，正用于SDIP的像素定位成较远离当前CU的当前经译码像素。归因于当前CU的当前经译码像素与正用于SDIP的像素之间增加的距离，相对于当前CU的预测准确性可减弱，因为用于预测的像素之间的较大距离可导致所述像素之间的降低的相关。

视频编码器20和视频解码器30可实施本发明的技术来改进基于SDIP的译码的准确性。更具体地说，视频编码器20和视频解码器30可实施所述技术来减轻或潜在地消除归因于某些帧内预测方向/角度(例如上文所述的那些)而遇到未重构像素所必要的像素到像素距离的增加。举例来说，当响应于某些视频译码特性执行基于SDIP的译码时，视频编码器20和视频解码器30可切换到从下到上和/或从右到左处理次序。举例来说，视频编码器20和视频解码器30可基于特定帧内预测方向/角度的使用来调适基于SDIP的译码的处理次序。

此外，因为本发明的技术是针对仅在帧内预测方向是左下或右上的情况下改变处理次序，因此视频编码器20和视频解码器30可维持SDIP相对于其余帧内预测方向所提供的优点，同时在其中帧内预测方向是左下或右上的情况下，利用改变的处理次序来改进基于SDIP的译码的准确性。换句话说，视频编码器20和视频解码器30可在其中调适将潜在地改进基于SDIP的译码所提供的译码准确性的情形中，实施本发明的SDIP处理次序调适，同时在其中适应可不产生潜在的准确性增强的情形中服从现有SDIP处理次序。以此方式，本文中所描述的技术可使视频编码器20和视频解码器30能够在某些情形中改进基于SDIP的译码的预测准确性，而不会在其余情形中不利地影响SDIP的优点。

本发明的其它方面是针对根据SDIP译码的经译码块旗标(CBF)预测。CBF语法元素指示变换系数块或块(还被称作“变换系数等级”)是否包含任何非零变换系数或等级。通常，残余物位于连续子块处。因此，在许多情形中，连续子块的CBF值可相同。在许多情况下，CBF值对于连续子块的相对较长游程可相同。举例来说，若干连续子块可各自包含至少一个非零变换系数。因此，子块的游程可致使视频编码器20编码并向视频解码器30发信号通知不间断的一连串CBF值‘1’。

举例来说，当前块的每一行或排可与单独CBF相关联。每一CBF可指示其相应相关联排是否包含至少一个非零变换系数或变换系数等级。在许多情况下，借助于在检查以寻找非零变换系数的存在时产生相同结果，块的若干连续排可产生相同CBF值。视频编码器20可实施本发明的技术以基于排到排CBF转变来编码CBF掩码，且向视频解码器30发信号通知所述掩码以重构所述块。因为CBF是旗标，且因此相对于给定排具有值‘0’或‘1’，所以可将CBF值中的任何变化描述为“双态触发”操作。

根据本发明的CBF掩蔽技术，视频编码器20可通过编码和发信号通知当前经译码排的CBF值与经SDIP译码的块的紧接在前的(例如上方)排的CBF值之间的差，来指示经SDIP译码的块的当前经译码排的CBF。举例来说，如果视频编码器20确定当前排的CBF值不同于位于紧靠着当前线上方的排的CBF值，那么视频编码器20可编码具有值1的CBF掩码。换句话说，根据本发明的CBF掩蔽技术，CBF掩蔽值1指示CBF值从紧接在前的经译码SDIP子块(在此实例中，排)的转变。

下文相对于一个特定非限制性实例来描述CBF掩蔽技术。在此实例中，视频编码器20可确定块的最顶部排的CBF值具有值1，从顶部开始第二排的CBF值是0，从顶部开始第三排的CBF值是1，且从顶部开始第四排的CBF值是0。因此，在此实例中，视频编码器20可相对于经SDIP译码的块的顶部四排识别以下一连串CBF值：1010。根据本发明的CBF掩蔽技术，视频编码器20可相对于从顶部开始第二排及以上的CBF值来编码和发信号通知指示转变的值。

举例来说，因为经SDIP译码的块的最顶部排并不具有距其紧接在前的排来执行CBF预测，所以视频编码器20可将最顶部排的CBF值直接编码为CBF掩码。在上文所论述实例中，视频编码器20可将CBF值1编码为所述块的最顶部排的CBF掩码。反过来，视频编码器20可将第二排的CBF掩码译码为相对于第一排的CBF的转变指示符，将第三排的CBF掩码译码为相对于第二排的CBF的转变指示符，等等。在此实例中，因为所述块的从顶部开始第二排具有带零(0)值的CBF，所以视频编码器20可检测从最顶部排的CBF值到第二排的CBF值的转变。因此，视频编码器20可相对于第二排来编码CBF掩码‘1'。

反过来，视频编码器20可确定从顶部开始第三排的CBF值‘0’指示从第二排的CBF值的转变，且可基于所述所检测到的转变来编码第三排的CBF掩码‘1'。另外，视频编码器20可确定从顶部开始第四排的CBF值‘1’指示从第三排的CBF值的转变，且可基于所述所检测到的转变来编码第四排的CBF掩码‘1'。因此，在上文所述的实例中，视频编码器20可编码经SDIP译码的块的前四排的一系列CBF掩码值‘1111’。

与原始CBF值系列‘1010’的直接编码相比，CBF掩码系列‘1111’可实现视频编码器20的更高效编码以及视频解码器30的更高效解码。上文所述的情形表示其中本发明的CBF掩蔽技术使视频编码器20和视频解码器30能够改进其中一系列排的CBF的值交替的情境中的译码效率的实例。将了解，本发明的CBF掩蔽技术还可使视频编码器20和视频解码器30能够在其中经SDIP译码的块的排产生连续相同CBF值的游程的情形中，改进译码效率并保存带宽。举例来说，如果所述块的前十排中的每一者包含至少一个非零变换系数，那么所述前十排全部产生CBF值1。

在此实例中，所述块开头的CBF值系列是‘1111111111’。使用本发明的CBF掩蔽技术，视频编码器20可编码第一排的CBF值‘1’，且接着译码九位系列‘000000000’，以指示缺乏接下来九排上的转变。在执行CBF掩蔽技术的互逆方面时，视频解码器30可解码第一值‘1’，以获得所述第一排的原始CBF值。反过来，视频解码器30可基于缺乏从第一CBF到第十CBF的值转变，使用连续掩码值‘0’来重构九个连续CBF值‘1’。以此方式，本发明的CBF掩蔽技术使视频编码器20和视频解码器30能够使用每一排的经SDIP译码的块作为二进制向量，且从而当与现有的基于SDIP的译码技术相比时，以增强的效率来推断每一排的CBF值。

此外，视频编码器20和视频解码器30可导出经SDIP译码的块的CBF值的CABAC或熵译码的上下文。在上文所述的其中前四个CBF值是‘1010’的实例中，视频编码器20可基于紧接在特定排之前的排的CABAC上下文，来调适所述特定排的CABAC上下文。举例来说，视频编码器20可基于用于先前排的CBF旗标的CABAC上下文，为一排的CBF旗标预测最可能的CABAC上下文。通过从用于译码先前排的CBF的CABAC上下文预测当前排的CBF的CABAC上下文，视频编码器20可保存上下文发信号通知所消耗的位速率。在一些例子中，视频编码器20可通过预测最可能上下文，来将上下文发信号通知所需的位数目从2.3个位减少到0.3个位。以此方式，本发明的CBF掩蔽技术可使视频编码器20能够实施相对于发信号通知的显著位速率减小，且可使视频编码器20和视频解码器30能够相对于导出CABAC上下文保存计算资源和复杂性。

根据本文中所描述的技术，视频编码器20可从一或多个先前经译码子块预测特定子块的CBF。作为一个实例，视频编码器20可从最新经译码子块的CBF值预测当前子块的CBF。根据一些实例实施方案，视频编码器20可发信号通知当前子块的CBF与从一或多个先前经译码子块(或例如，仅最新经译码子块)产生的所预测CBF之间的差。通过发信号通知当前子块的CBF与所预测CBF之间的差，视频编码器20可保存计算资源和带宽，同时使视频解码器30能够准确地导出当前子块的CBF值。在另一实例实施方案中，视频编码器20和/或视频解码器30可为基于先前经译码子块的熵译码设计不同的上下文。

将了解，虽然本文所述的各种实例使用排(例如‘排’表示单像素行或单像素列)来对应于子块，但本发明的技术也适用于不同的子块形状和配置。举例来说，子块可形成一排的不完整部分，可形成一排，或可横跨多排的若干部分，视具体情况。

另外，视频编码器20和视频解码器30可实施本发明的技术来为子块的最低有效系数(last_pos)的位置的CABAC或熵译码选择上下文。last_pos信息可指示TU内的最低有效系数的水平和垂直(x和y)坐标。视频解码器30可使用最低有效系数的位置来确定位流的数据何时表示后续语法元素，也就是说，不表示正重新产生的块的数据的语法元素。除子块的CBF以外，子块的最低有效系数的位置还取决于先前经译码子块的last_pos。根据本文中所描述的技术，视频编码器20和/或视频解码器30可基于一或多个先前经译码(例如先前经编码或先前经解码)子块的last_pos信息的振幅，来计算最低有效系数位置的熵译码的上下文设计。

在一种实例使用情况下，视频编码器20和/或视频解码器30可在“上下文设定1”与“上下文设定2”之间进行选择，以用于对最低有效系数进行熵译码。在此实例中，如果先前经译码子块(例如紧接在前经译码子块)的last_pos值大于零(0)，那么视频编码器20和/或视频解码器30可使用上下文1来对当前子块的最低有效系数进行CABAC或熵译码。否则(例如如果先前经译码子块的last_pos等于或小于零(0))，那么视频编码器20和/或视频解码器30可使用上下文设定2来对当前子块的最低有效系数进行熵译码。以此方式，本发明的技术使视频编码器20和视频解码器30能够利用来自先前经译码子块的last_pos信息来导出用其来译码当前子块的last_pos信息的上下文。

在一些方面，本发明是针对通过使用量化参数的差/增量(在本文中被称作“增量QP”)来变换精度操纵。尽管本文相对于经SDIP译码的块来描述，但将了解，本发明的变换精度操纵技术也适用于其它类型的译码(例如帧内译码和/或帧间预测)。

在一些使用情况情形中，矩形块的使用可导致在使用正方形块时不会产生的相对于计算和/或演算考量的一或多个潜在问题。将TU的QP大小计算为√(w*h)，其中‘√’表示平方根函数，‘w’表示TU的宽度，且‘h’表示TU的高度。在正方形块的情况下，当如上文所述计算时，QP大小总是整数值。更具体地说，因为w和h值针对正方形块相等，所以(w*h)的积的平方根总是等于w且等于h的值。更具体地说，对于常用的正方形块大小，例如64乘64，QP大小趋向于为2的整数倍。由此，归因于矩阵演算和其它因素，量化在正方形块上的分布可涉及2的幂。

然而，对于视频译码中通常使用的大多数矩形块的形状因子，√(w*h)运算的结果是2的平方根的倍数，其等于大约1.414，且在本文中表示为√2。举例来说，矩形块大小中的一者是4×8。在4×8块的情况下，QP大小演算需要√(4*8)运算，其产生值√32。√32是√2的倍数，且明确地说，等于4*√2。类似地，8×16维度的矩形块产生QP大小8*√2，16×32维度的矩形块产生QP大小16*√2，等等。

由此，矩形块的QP大小计算的非整数结果在本文中被称作“√2问题”。√2问题产生QP大小的浮点值，且消除这些值的浮点性质的任何舍入运算均导致译码精度的损失。随着变换大小增加，由√2问题的浮点结果产生的译码精度问题变成更严重。HEVC使用可落在从零(0)到五十一(51)的范围内的按比例缩放参数QP来陈述均匀重构量化。根据HEVC量化技术，QP值中的一(1)的增加可导致对应量化步长(“Qstep”)的大约百分之十二(12％)的增加。举例来说，Qstep的12％的增加可表示二又六分之一(2¹/₆)的原始Qstep值增加。基于QP值的对应增加所导致的递增Qstep增加，Qstep针对QP中的六(6)的每次增加而加倍。在其中Qstep针对QP四(4)等于一(1)的情况下，QP值与用于标准正交变换的对应Qstep之间的关系由下式给出：

Qstep(QP)＝2^(QP-4)/6。

为了解决与许多常用矩形TU大小的量化相关联的√2问题，视频编码器20和/或视频解码器30可实施本发明的变换精度操纵技术中的一或多者。

如果变换单元(TU)大小由表达式2ⁿ×2^m或2ⁿ乘2^m(其中‘2ⁿ’表示行数，且‘2^m’表示列数)表示，那么正向变换由下式表示：

根据用于以上公式的记法，将表示具有‘n’个行和‘m’个列的残余块。因此，以上公式中所使用的术语X₂n_x2m表示具有等于‘2ⁿ’的行数和等于‘2^m’的列数的残余块。T_v和T_h是用于列和行变换的对应2ⁿ×2ⁿ(2ⁿ乘2^m)和2^m×2^m(2^m乘2^m)矩阵，且Y表示系数矩阵。在一些实例中，n或m中的一者等于0。

根据本文中所描述的变换精度操纵技术中的一或多者，当运算(n+m)产生奇数时，视频编码器20和/或视频解码器30可将增量QP值与和用于对应TU数据的量化或去量化的当前变换单元相关联的所导出QP值相加。通过将增量QP与所导出的QP值相加，视频编码器20和视频解码器30可使用为正方形变换定义的原始比例缩放因子。举例来说，针对其定义原始比例缩放因子的正方形变换可表达为具有K乘K维度。在一些实例中，表示正方形变换的一侧的量值的‘K’的值可定义为((n+m)>>1)，或在其它实例中，定义为((n+m+1)>>1)。算子‘>>’表示算术右移位运算，且如上文所描述，‘n’表示残余块的行数，且‘m’表示所述残余块的列数。

举例来说，对于4×8变换，视频编码器20和视频解码器30可继承为4×4变换或8×8变换定义的比例缩放因子。在此实例中，在根据较小变换大小(例如上文所述的实例中的4×4)的比例缩放因子实施量化或去量化之前，视频编码器20和视频解码器30可使变换系数的能量减少(1/√2)，其表示大约30％的减小。反过来，为了补偿减小的能量，视频编码器20和视频解码器30可使对应Qstep减小√2。

如上文所描述，QP增加1可导致对应Qstep的大约12％的增加。因此，QP减小1可导致对应Qstep的大约12％的降低或减小。另外，对于能量已减小大致30％的变换系数，视频编码器20和视频解码器30可通过使对应QP减小3，来补偿能量减小。根据公式上限(30％/12％)来导出QP减小3，其中上限()运算返回运算数的最大可能值。因此，在此实例中，增量QP值总是设定成-3(负三或减三)。或者，视频编码器20和视频解码器30可基于与当前变换单元相关联的所导出的QP值来自适应性地改变增量QP值。

图2是说明可使用如本发明中所描述的用于帧内预测译码的技术的视频编码器20的实例的框图。出于说明的目的，将在HEVC译码的上下文中描述视频编码器20，但本发明关于可能需要扫描变换系数的其它译码标准或方法不受限制。

视频编码器20可执行视频切片内的视频块的帧内和帧间译码。帧内译码依靠空间预测来减少或去除给定视频帧或图片内的视频中的空间冗余。帧间译码依靠时间预测来减少或去除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指若干基于空间压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)的帧间模式可指代若干基于时间的压缩模式中的任一者。

如图2中所示，视频编码器20接收待编码的视频帧内的当前视频块。在图2的实例中，视频编码器20包含模式选择单元40、参考图片存储器64、求和器50、变换处理单元52、量化单元54和熵编码单元56。模式选择单元40又包含运动补偿单元44、运动估计单元42、帧内预测单元46和分割单元48。为了视频块重构，视频编码器20还包含逆量化单元58、逆变换处理单元60和求和器62。还可包含去块滤波器(图2中未图示)来对块边界进行滤波，以将成块效应假影从经重构建视频去除。在需要时，去块滤波器将通常对求和器62的输出进行滤波。除了去块滤波器外，还可使用额外滤波器(回路中或回路后)。为简洁起见未图示这些滤波器，但是必要时，这些滤波器可对求和器50的输出进行滤波(作为环路内滤波器)。

在编码过程期间，视频编码器20接收待译码的视频帧或切片。所述帧或切片可分成多个视频块。运动估计单元42和运动补偿单元44可相对于一或多个参考帧中的一或多个块执行所接收视频块的帧间预测性译码以提供时间压缩。帧内预测单元46可替代地相对于与待译码块相同的帧或切片中的一个或一个以上相邻块执行对所接收的视频块的帧内预测性译码以提供空间压缩。视频编码器20可执行例如多个译码遍次，以针对每一视频数据块选择适当的译码模式。

此外，分割单元48可基于先前译码遍次中的先前分割方案的评估，将视频数据块分割成若干子块。举例来说，分割单元48可起初将帧或切片分割成若干LCU，且基于速率失真分析(例如，速率失真优化)将LCU中的每一者分割成若干子CU。模式选择单元40可进一步产生指示将LCU分割成若干子CU的四叉树数据结构。四叉树的叶节点CU可包含一或多个PU以及一或多个TU。

模式选择单元40可例如基于误差结果来选择译码模式中的一者，帧内或帧间，且将所得的经帧内或帧间译码的块提供到求和器50，以产生残余块数据，且提供到求和器62，以重构经编码块来用作参考帧。模式选择单元40还将语法元素(例如，运动向量、帧内模式指示符、分割信息和其它此类语法信息)提供到熵编码单元56。

运动估计单元42和运动补偿单元44可高度集成，但出于概念的目的分别加以说明。由运动估计单元42执行的运动估计是产生运动向量的过程，所述过程估计视频块的运动。举例来说，运动向量可指示视频块的PU在当前视频帧或图片内的相对于参考帧(或其它经译码单元)内的预测性块，相对于当前帧(或其它经译码单元)内正被译码的当前块的位移。预测块是经发现就像素差来说与待译码的块紧密匹配的块，其可通过绝对差总和(SAD)、平方差总和(SSD)或其它差度量来确定。在一些实例中，视频编码器20可计算存储于参考图片存储器64中的参考图片的子整数像素位置的值。举例来说，视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此，运动估计单元42可相对于全像素位置和分数像素位置执行运动搜索，并且输出具有分数像素精度的运动向量。

运动估计单元42通过将PU的位置与参考图片的预测性块的位置进行比较来计算用于经帧间译码切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1)，其中的每一者识别存储在参考图片存储器64中的一或多个参考图片。运动估计单元42将计算出的运动向量发送到熵编码单元56和运动补偿单元44。

由运动补偿单元44执行的运动补偿可涉及基于由运动估计单元42确定的运动向量来获取或产生预测性块。并且，在一些实例中，运动估计单元42与运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量后，运动补偿单元44可在参考图片列表中的一者中定位所述运动向量指向的预测性块。求和器50通过从正译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值来形成残余视频块，如下文所论述。一般来说，运动估计单元42相对于亮度分量执行运动估计，且运动补偿单元44对于色度分量和亮度分量两者使用基于亮度分量计算的运动向量。模式选择单元40也可产生与视频块和视频切片相关联的语法元素，以供视频解码器30在解码视频切片的视频块时使用。

作为如上文所描述由运动估计单元42和运动补偿单元44执行的帧间预测的替代方案，帧内预测单元46可对当前块进行帧内预测。明确地说，帧内预测单元46可确定用来对当前块进行编码的帧内预测模式。在一些实例中，帧内预测单元46可例如在单独的编码编次期间使用各种帧内预测模式对当前块进行编码，且帧内预测单元46(或在一些实例中为模式选择单元40)可从所述测试模式中选择适当的帧内预测模式来使用。

举例来说，帧内预测单元46可使用速率失真分析计算用于各种经测试帧内预测模式的速率失真值，且从所述经测试模式当中选择具有最佳速率失真特性的帧内预测模式。速率失真分析一般确定经编码块与经编码以产生所述经编码块的原始的未经编码块之间的失真(或误差)的量，以及用于产生经编码块的位速率(也就是说，位数目)。帧内预测单元46可根据用于各种经编码块的失真和速率计算比率，以确定哪种帧内预测模式对于所述块展现最佳速率-失真值。

根据本发明的方面，在一些例子中，当预测视频数据块时，帧内预测单元46可选择SDIP模式。举例来说，如上所述，帧内预测单元46可执行速率失真分析，以确定具有最佳速率失真特性的帧内预测模式。另外，帧内预测单元46可执行速率失真分析，以确定CU到一或多个PU的分割以用于帧内预测。也就是说，假定特定CU的大小是2N×2N，帧内预测单元46可确定是否使用2N×2N PU来整体预测CU，使用四个相等大小的N×N PU来预测CU，或是否使用若干平行PU(例如使用SDIP模式2N×hN或nN×2N)来预测CU。虽然相对于帧内预测单元46来描述，但CU的分割可(或替代地)由分割单元48确定。

在任何情况下，根据本发明的方面，帧内预测单元46可使用一或多个分区模式表来指示特定分割模式，不管所述分割模式如何。举例来说，帧内预测单元46可指示用于使用分区模式表来将CU分割成一或多个PU的预测分区模式，包含针对SDIP模式。

在一些例子中，帧内预测单元46被限制在译码期间不能使用某些帧内预测模式。举例来说，帧内预测单元46可被限制使用一或多个帧内预测模式，除非已满足预定准则。在一实例中，出于说明的目的，帧内预测单元46可不使用SDIP模式，除非CU大于预定大小(例如64×64、32×32等)。在一些此类实例中，分区模式表可包含基于所述准则的单独映射。也就是说，举例来说，特定分区模式可映射到等于或大于64×64的CU的第一二进制数串以及小于64×64的CU的第二不同二进制数串。

在一些例子中，帧内模式预测单元46可维持多于一个分区模式表。举例来说，帧内预测单元46可为所有切片(例如I切片、P切片和B切片)维持单个分区模式表。然而，在另一实例中，帧内预测单元46可为不同切片类型维持单独的分区模式表。也就是说，帧内预测单元46可维持与用于P切片和/或B切片的表分开的用于I切片的表。

在其中帧内预测单元46维持多于一个分区模式表的例子中，帧内预测单元46可基于多种因素来选择分区模式表。举例来说，在其中帧内预测单元46为不同切片类型(例如I/P/B切片)维持单独表的例子中，帧内预测单元46可基于正译码的块的切片类型来选择分区模式表。在其它实例中，帧内预测单元46可基于图片大小、帧速率、量化参数(QP)、CU深度等来选择分区模式表。此类信息通常是视频编码器20和视频解码器30两者已知的。因此，选择准则无需包含于位流中。然而，在其它实例中，可使用一或多个语法元素在位流中发信号通知用于分区模式表的选择的数据，此类一或多个高级语法元素包含于参数集中。

帧内预测单元46可实施本发明的各种技术，以基于检测到一或多个条件而调适SDIP经编码块的子块的处理次序。如上文所论述，根据SDIP，子块的处理次序是从上到下和从左到右。SDIP优于其它帧内预测模式的一个潜在优点在于经重构的相邻像素趋向于显著更接近经预测像素。归因于经重构的相邻像素与当前像素的比较上较接近的接近性，SDIP技术趋向于增强当前像素的预测的准确性。

然而，因为现有SDIP技术的预测次序总是从上到下和从左到右，当编码当前像素时，帧内预测单元46可不总是能够完全利用先前经译码子块中的经编码像素。举例来说，如果帧内预测方向是从左下开始，那么当前像素总是从位于当前像素下方和左侧的一或多个像素(即，相对于当前像素从一或多个“左下”像素)帧内预测。类似地，如果帧内预测方向是从右上开始，当前像素总是从位于当前像素上方和右侧的一或多个像素(即，从相对于当前像素的一或多个“右上”像素)帧内预测。

然而，在某些情形中，从上到下和从左到右处理次序可能不改进当前像素的预测准确性，且可能潜在地削弱或妨碍预测准确性。举例来说，根据SDIP处理次序的从上到下性质，当帧内预测单元46准备好开始预测当前像素时，左下相邻像素可能尚未经重构。类似地，根据SDIP处理次序的从左到右性质，当帧内预测单元46准备好开始预测当前像素时，右上相邻像素可能尚未经重构。因此，在某些情形中，根据SDIP处理次序，在帧内预测单元46准备好预测当前像素时，帧内预测单元46可能不具有对帧内预测参考像素的存取权。

帧内预测单元46可实施本发明的技术，以基于检测特定帧内预测方向相对于当前像素的编码而应用，将左下帧内预测和右上帧内预测的处理次序分别改变为从下到上和从右到左。换句话说，帧内预测单元46可基于当前CU的帧内预测角度来改变处理次序。举例来说，帧内预测单元46可实施本发明的技术以在某些条件下改变处理次序，来解决其中根据现有SDIP处理次序，经编码的参考像素不可用于对当前像素进行帧内预测的情形。

根据本文中所描述的技术，在帧内预测角度是左下的情况下，帧内预测单元46可实施相对于SDIP经编码子块的从下到上处理次序。将了解，在其中帧内预测单元46将处理次序改变为从下到上的情况下，帧内预测单元46可维持现有的基于SDIP的译码技术的从左到右方面。在对应帧内预测角度是左下的情况下，通过将经SDIP译码的块的处理次序改变为从下到上(从左到右方面保持)，帧内预测单元46可实施本发明的技术来增强当前块的预测的准确性。举例来说，如果现有SDIP技术的从上到下处理次序与左下帧内预测角度组合，那么帧内预测单元46可不具有对来自左下块或行的经编码像素的存取权，帧内预测单元46可需要所述经编码像素来对当前像素进行帧内预测。在此情境下，归因于现有SDIP技术所提供的处理次序，来自左下块或行的像素可能尚未经编码。因此，为了根据现有技术执行SDIP，帧内预测单元46可需要使用已经编码在另一块(例如相邻块)中的像素。

然而，通过在帧内预测方向是左下的情况下将经SDIP译码的块的处理次序切换到从下到上，帧内预测单元46可继续利用定位成极接近当前像素的参考像素来实施当前子块的基于SDIP的编码。通过使用相对于经SDIP译码的子块的从下到上处理次序，帧内预测单元46可以经编码的左下相邻像素作为用于对当前像素进行帧内预测的参考像素可用的方式来实施基于SDIP的帧内预测。举例来说，因为帧内预测单元46以从下到上次序处理经SDIP译码的子块的像素，因此按照定义，在帧内预测单元46开始处理当前像素之前，下相邻像素以及其下相邻像素已经编码。由此，在帧内预测角度是左下的情况下，帧内预测单元46可将SDIP处理次序调适为从下到上和从左到右，以根据本发明的各个方面增强预测准确性。

另外，根据本文中所描述的技术，在帧内预测角度是右上的情况下，帧内预测单元46可实施相对于SDIP经编码子块的从右到左处理次序。将了解，在其中帧内预测单元46将处理次序改变为从右到左的情况下，帧内预测单元46可维持现有的基于SDIP的译码技术的从上到下方面。通过在对应角度是右上的情况下，将经SDIP译码的块的处理次序改变为从右到左(从上到下方面保持)，帧内预测单元46可实施本发明的技术来增强当前块的预测的准确性。举例来说，如果现有SDIP技术的从左到右处理次序与右上帧内预测角度组合，那么帧内预测单元46可不具有对来自右上块或行的经编码像素的存取权，帧内预测单元46可需要所述经编码像素来对当前像素进行帧内预测。在此情境下，归因于现有SDIP技术所提供的处理次序，来自右上(或者，“右上方”)块或行的像素可能尚未编码。因此，为了根据现有技术执行SDIP，帧内预测单元46可需要使用已经编码在另一块(例如相邻块)中的像素。

然而，通过在帧内预测方向是右上的情况下将经SDIP译码的块的处理次序切换到从右到左，帧内预测单元46可继续利用定位成极接近当前像素的参考像素来实施当前子块的基于SDIP的编码。通过使用相对于经SDIP译码的子块的从右到左处理次序，帧内预测单元46可以经编码的右上相邻像素作为用于对当前像素进行帧内预测的参考像素可用的方式来实施基于SDIP的帧内预测。举例来说，因为帧内预测单元46以从右到左次序处理经SDIP译码的子块的像素，因此按照定义，在帧内预测单元46开始处理当前像素之前，右相邻像素以及其右相邻像素已经编码。由此，在帧内预测角度是右上的情况下，帧内预测单元46可将SDIP处理次序调适为从右到左和从上到下，以根据本发明的各个方面增强预测准确性。

因为帧内预测单元46可仅在帧内预测角度是左下或右上的情况下实施上文所述的技术来更改处理次序，所以帧内预测单元46可维持SDIP相对于其余帧内预测方向所提供的优点，同时在其中帧内预测方向是左下或右上的情况下，利用改变的处理次序来改进基于SDIP的译码的准确性。换句话说，帧内预测单元46可仅在其中调适将潜在地改进基于SDIP的译码所提供的译码准确性的情形中，实施本发明的SDIP处理次序调适，同时在其中适应可不产生潜在的准确性增强的情形中服从现有SDIP处理次序。以此方式，在某些情形中，帧内预测单元46可实施本文中所描述的技术来增强基于SDIP的译码的预测准确性，而在其余情形中，不会不利地影响SDIP的优点。

在基于SDIP的译码以及其它译码模式的情况下，帧内预测单元46可实施本发明的各种技术来基于CBF值中的子块到子块转变来编码CBF掩码。仅仅为了辅助便于论述，本文中相对于经SDIP译码的块来论述CBF掩蔽技术，但将了解，帧内预测单元46还可相对于使用非SDIP相关技术译码的块来实施本发明的CBF掩蔽技术。

因为CBF是旗标，因此给定CBF相对于给定子块具有值‘0’或‘1'。由此，CBF值中的任何转变表示双态触发操作。根据本发明的CBF掩蔽技术，帧内预测单元46可通过编码当前经译码子块的CBF值与经SDIP译码的块的紧接在前的子块之间的差，来提供当前经译码子块的CBF值的指示。举例来说，如果帧内预测单元46确定当前子块的CBF值不同于位于紧接在当前子块之前(例如，在从上到下处理次序中在上方，或在从下到上处理次序中在下方)的子块的CBF值，那么帧内预测单元46可编码具有值1的CBF掩码。换句话说，根据本发明的CBF掩蔽技术，CBF掩码值1指示来自紧接在前编码的SDIP子块的CBF值的转变。

举例来说，如果经SDIP译码的块的十个第一经编码子块中的每一者包含至少一个非零变换系数，那么帧内预测单元46可确定前十个经编码子块中的每一者产生CBF值1。在此实例中，经SDIP译码的块的开头(例如在从上到下处理次序中在顶部，或在从下到上处理次序中在底部)的CBF值系列为‘1111111111’。使用本发明的CBF掩蔽技术，帧内预测单元46可为第一子块编码原始CBF值‘1'，且接着编码九位系列‘000000000’，以指示缺乏接下来九个子块上的转变。以此方式，帧内预测单元46可实施本发明的CBF掩蔽技术，以使用经SDIP译码的块的每一离散子块作为二进制向量，且从而暗示使用CBF掩码的每一排的CBF值。通过实施本发明的CBF掩蔽技术，与现有的CBF译码技术相比，帧内预测单元46可减少资源消耗且降低编码复杂性，同时维持CBF准确性。

在一些实例中，帧内预测单元46可为经SDIP译码的块的CBF值的CABAC或熵译码导出上下文。在上文所述的其中前十个CBF值是‘1111111111’的实例中，帧内预测单元46可基于紧接在前编码的子块的CABAC上下文，来为特定子块调适CABAC上下文。举例来说，帧内预测单元46可基于用于先前子块(例如从左到右处理次序中的左相邻子块，或从右到左处理次序中的右相邻子块)的CBF旗标的CABAC上下文，来为子块的CBF旗标预测最可能的CABAC上下文。

通过从用于译码紧接在前编码的子块的CBF的CABAC上下文为当前子块的CBF预测CABAC上下文，帧内预测单元46可保存上下文发信号通知所消耗的位速率。在一些例子中，帧内预测单元46可通过从用于先前子块的CABAC译码的上下文为子块预测最可能的上下文，来使上下文发信号通知的所需的位数目从2.3个位减少到0.3个位。以此方式，本发明的CBF掩蔽技术可使视频编码器20能够实施相对于发信号通知的显著位速率减小，且可使视频编码器20能够相对于导出CABAC上下文保存计算资源和复杂性。

在一些实例中，帧内预测单元46可实施本发明的技术，以选择上下文来对经SDIP译码的块的子块的最低有效系数的位置(last_pos)进行基于CABAC的编码或熵编码。除子块的CBF以外，子块的最低有效系数的位置还取决于一或多个先前编经码子块的last_pos。根据本文中所描述的技术，帧内预测单元46可基于一或多个先前经编码子块的last_pos信息的振幅，来计算用于对子块的last_pos进行基于CABAC的编码或熵编码的上下文。

在一个实例使用情况下，帧内预测单元46可在“上下文1”和“上下文2”之间进行选择，以用于最低有效系数的CABAC或熵编码。在此实例中，如果先前经译码子块(例如紧接在前经译码子块)的last_pos值大于零(0)，那么帧内预测单元46可使用上下文1来对当前子块的last_pos信息进行CABAC或熵编码。否则(例如如果先前经译码子块的last_pos等于或小于零(0))，那么帧内预测单元46可使用上下文2来对当前子块的最低有效系数进行熵译码。以此方式，帧内预测单元46可实施本发明的一或多种技术，以利用来自先前经译码子块的last_pos信息来导出用其根据CABAC或熵编码来对当前子块的last_pos信息进行编码的上下文。

在任何情况下，变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化所述变换系数以进一步减小位速率。量化过程可降低与系数中的一些或全部相关联的位深度。可通过调节量化参数来修改量化程度。在一些实例中，量化单元54可接着对包含经量化变换系数的矩阵执行扫描。或者，熵编码单元56可执行扫描。

量化单元54可实施本发明的一或多个变换精度操纵技术，以相对于各种块高宽比改进译码精度，例如视频译码中常用的各种矩形TU的高宽比。举例来说，量化单元54可使用相对于量化参数的差或“增量”(在本文中被称作“增量QP”)。尽管本文相对于经SDIP译码的块来描述，但将了解，本发明的变换精度操纵技术也适用于其它类型的译码(例如帧内译码和/或帧间预测)。

如上文所描述，矩形块的使用可导致在使用正方形块时不会产生的相对于计算和/或演算考量的一或多个潜在问题。将TU的QP大小计算为√(w*h)，其中‘√’表示平方根函数，‘w’表示TU的宽度，且‘h’表示TU的高度。在正方形块的情况下，当如上文所述计算时，QP大小总是整数值。更具体地说，因为w和h值针对正方形块相等，所以(w*h)的积的平方根总是等于w且等于h的值。更具体地说，对于常用的正方形块大小，例如64乘64，QP大小趋向于为2的整数倍。由此，归因于矩阵演算和其它因素，量化在正方形块上的分布可涉及2的幂。

然而，对于视频译码中通常使用的大多数矩形块的形状因子，√(w*h)运算的结果是2的平方根的倍数，其等于大约1.414，且在本文中表示为√2。举例来说，常用矩形块大小中的一者是4×8。在4×8块的情况下，QP大小演算需要√4*8)运算，其产生值√32。√32是√2的倍数，且明确地说，等于4*√2。类似地，8×16维度的矩形块产生QP大小8*√2，16×32维度的矩形块产生QP大小16*√2，等等。

由此，矩形块的QP大小计算的非整数结果在本文中被称作“√2问题”。√2问题产生QP大小的浮点值，且消除这些值的浮点性质的任何舍入运算均导致译码精度的损失。随着变换大小增加，由√2问题的浮点结果产生的译码精度问题变成更严重。HEVC使用可落在从零(0)到五十一(51)的范围内的按比例缩放参数QP来陈述均匀重构量化。根据HEVC量化技术，QP值中的一(1)的增加可导致对应量化步长(“Qstep”)的大约百分之十二(12％)的增加。举例来说，Qstep的12％的增加可表示二又六分之一(2¹/₆)的原始Qstep值增加。基于QP值的对应增加所导致的递增Qstep增加，Qstep针对QP中的六(6)的每次增加而加倍。在其中针对QP四(4)，Qstep等于一(1)的情况下，QP值与用于标准正交变换的对应Qstep之间的关系由下式给出：

Qstep(QP)＝2^(QP-4)/6

为了解决与许多常用矩形TU大小的量化相关联的√2问题，量化单元54可实施本发明的变换精度操纵技术中的一或多者。如果变换单元(TU)大小由表达式2ⁿ×2^m或2ⁿ乘2^m(其中'2ⁿ'表示行数，且‘2^m'表示列数)表示，那么正向变换由下式表示：

根据用于以上公式的记法，X₂ ⁿ×2^m将表示具有‘n’个行和‘m’个列的残余块。因此，以上公式中所使用的术语X₂n_x2m表示具有等于‘2ⁿ’的行数和等于‘2ⁿ'的列数的残余块，T_v和T_h是列和行变换的对应2ⁿ×2ⁿ(2ⁿ乘2^m)和2^m×2^m(2^m乘2^m)矩阵，且Y表示系数矩阵。在一些实例中，n或m中的一者等于0。

根据本文中所描述的变换精度操纵技术中的一或多者，在其中运算(n+m)产生奇数的情况下，量化单元54可将增量QP值与和当前变换单元相关联的所导出的QP值相加，以量化对应TU数据。通过将增量QP与所导出的QP值相加，量化单元54可使用为正方形变换定义的原始比例缩放因子。举例来说，针对其定义原始比例缩放因子的正方形变换可表达为具有K乘K维度。在一些实例中，表示正方形变换的一侧的量值的‘K’的值可定义为((n+m)>>1)，或在其它实例中，定义为((n+m+1)>>1)。算子‘>>’表示算术右移位运算，且如上文所描述，‘n’表示残余块的行数，且‘m’表示所述残余块的列数。

举例来说，对于4×8变换，量化单元54可继承为4×4变换或8×8变换定义的比例缩放因子。在此实例中，在根据用于较小变换大小(例如上文所述的实例中的4×4)的比例缩放因子来量化TU之前，量化单元54可使变换系数的能量减小(1/√2)，其表示大约30％的减小。反过来，为了补偿减小的能量，量化单元54可使对应的Qstep减小√2。

如上文所描述，QP增加1可导致对应Qstep的大约12％的增加。此外，QP减小1可导致对应Qstep的大约12％的降低或减小。另外，对于能量已减小大致30％的变换系数，量化单元54可通过使对应QP减小3来补偿能量减小。根据公式上限(30％/12％)来导出QP减小3，其中上限()运算返回运算数的最大可能值。因此，在此实例中，增量QP值总是设定成-3(负三或减三)。或者，量化单元54可基于与当前变换单元相关联的所导出的QP值来自适应性地改变增量QP值。

在量化后，熵编码单元56对经量化的变换系数进行熵译码。举例来说，熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵译码技术。在基于上下文的熵译码的情况下，上下文可基于相邻块。在通过熵译码单元56进行熵译码之后，可将经编码位流发射到另一装置(例如，视频解码器30)，或者将所述经编码位流存档以用于稍后发射或检索。

根据本发明的方面，熵编码单元56，或另一负责译码的单元(例如固定长度译码器)，可使用分区模式表来编码视频数据块是使用SDIP模式译码的指示。举例来说，如上所述，视频编码器20可维持一或多个分区模式表(还被称作码字映射表)，其将分割模式映射到语法元素，例如表示所述分割模式的二进制化值。因此，熵译码单元56可对对应于分区模式表中的条目的一或多个二进制数串进行熵编码。

逆量化单元58和逆变换单元60分别应用逆量化和逆变换以在像素域中重构残余块，例如以供稍后用作参考块。运动补偿单元44可通过将残余块与参考图片存储器64中的帧中的一者的预测性块相加来计算参考块。运动补偿单元44还可将一或多个内插滤波器应用于经重构的残余块以计算子整数像素值以用于运动估计。求和器62将经重构的残余块添加到由运动补偿单元44产生的经运动补偿的预测块，以产生经重构的视频块以用于存储于参考图片存储器64中。经重构的视频块可由运动估计单元42和运动补偿单元44用作参考块以对后续视频帧中的块进行帧间译码。

图3是说明可实施如本发明中描述的用于帧内预测译码的技术的视频解码器30的实例的框图。在图3的实例中，视频解码器30包含熵解码单元70、运动补偿单元72、帧内预测单元74、逆量化单元76、逆变换单元78、参考图片存储器82和求和器80。

在解码过程期间，视频解码器30从视频编码器20接收表示经编码视频切片的视频块和相关语法元素的经编码视频位流。视频解码器30的熵解码单元70对位流进行熵解码以产生经量化系数、运动向量或帧内预测模式指示符，以及其它语法元素。熵解码单元70将运动向量和其它语法元素转发到运动补偿单元72。视频解码器30可在视频切片层级和/或视频块层级接收语法元素。

举例来说，作为背景，视频解码器30可接收已包封的经压缩视频数据，以经由网络传输到所谓的“网络抽象层单元”或NAL单元中。每一NAL单元可包含标头，其识别存储到NAL单元的数据的类型。存在通常存储到NAL单元的两种类型的数据。存储到NAL单元的第一类型的数据是视频译码层(VCL)数据，所述数据包含经压缩视频数据。存储到NAL单元的第二类型的数据被称作非VCL数据，所述数据包含例如参数集等额外信息，其界定大量NAL单元共用的标头数据和辅助增强信息(SEI)。举例来说，参数集可含有序列等级标头信息(例如，在序列参数集(SPS)中)以及不频繁改变的图片等级标头信息(例如，在图片参数集(PPS)中)。参数集中含有的不频繁改变的信息不需要针对每一序列或图片重复，从而改进译码效率。另外，使用参数集使得标头信息能够带外发射，由此不再需要进行冗余发射以便进行错误恢复。

当将视频帧译码为经帧间译码(即，B、P或GPB)切片时，运动补偿单元72基于从熵解码单元70接收到的运动向量和其它语法元素，产生当前视频切片的视频块的预测性块。可从参考图片列表中的一者内的参考图片中的一者产生预测性块。视频解码器30可基于存储在参考图片存储器82中的参考图片，使用默认建构技术来建构参考帧列表：列表0和列表1。

运动补偿单元72通过剖析运动向量和其它语法元素来确定用于当前视频切片的视频块的预测信息，且使用所述预测信息来产生用于正被解码的当前视频块的预测性块。举例来说，运动补偿单元72使用所述接收到的语法元素中的一些来确定用以译码视频切片的视频块的预测模式(例如帧内或帧间预测)、帧间预测切片类型(例如B切片、P切片或GPB切片)、所述切片的参考图片列表中的一或多者的建构信息、所述切片的每一经帧间编码视频块的运动向量、所述切片的每一经帧间译码视频块的帧间预测状态，以及用以解码当前视频切片中的视频块的其它信息。

运动补偿单元72还可基于内插滤波器执行内插。运动补偿单元72可使用如视频编码器20在视频块的编码期间使用的内插滤波器来计算参考块的子整数像素的经内插值。在此情况下，运动补偿单元72可根据接收到的语法元素来确定由视频编码器20使用的内插滤波器，并使用所述内插滤波器来产生预测性块。

作为运动补偿单元72执行的帧间预测的替代方案，帧内预测单元74可对当前块进行帧内预测，如上文所述。明确地说，帧内预测单元74可确定帧内预测模式以用于解码和重构当前块。在一些实例中，帧内预测单元74可例如，在单独解码遍次期间，使用各种帧内预测模式来解码当前块。帧内预测单元74可基于视频编码器20和/或其组件所使用的帧内预测模式的相应指示来选择适当的帧内预测模式。

举例来说，帧内预测单元74可基于包含于从视频编码器20接收到的经编码视频位流中的指示来为块选择帧内预测模式。在一些实例中，帧内预测单元74可基于视频编码器20发信号通知的指示块是使用一或多个可用的基于SDIP的译码模式中的SDIP译码模式来编码的指示(例如旗标)，来为块选择SDIP模式。

帧内预测单元74可实施本发明的各种技术，以基于检测到一或多个条件而调适SDIP经编码块的子块的处理次序。如上文所论述，根据SDIP，子块的处理次序是从上到下和从左到右。SDIP优于其它帧内预测模式的一个潜在优点在于经重构的相邻像素趋向于显著更接近经预测像素。归因于经重构的相邻像素与当前像素的比较上较接近的接近性，SDIP技术趋向于增强当前像素的预测的准确性。

然而，因为现有SDIP技术的处理次序总是从上到下和从左到右，当编码当前像素时，帧内预测单元74可不总是能够完全利用先前经解码子块中的经重构像素。举例来说，如果帧内预测方向是从左下开始，那么当前像素总是从位于当前像素下方和左侧的一或多个像素(即，相对于当前像素从一或多个“左下”像素)帧内预测。类似地，如果帧内预测方向是从右上开始，当前像素总是从位于当前像素上方和右侧的一或多个像素(即，从相对于当前像素的一或多个“右上”像素)帧内预测。

然而，在某些情形中，从上到下和从左到右处理次序可能不改进当前像素的预测准确性，且可能潜在地削弱或妨碍预测准确性。举例来说，根据SDIP处理次序的从上到下性质，当帧内预测单元74准备好开始预测当前像素时，左下相邻像素可能尚未经重构。类似地，根据SDIP处理次序的从左到右性质，当帧内预测单元74准备好开始预测当前像素时，右上相邻像素可能尚未经重构。因此，在某些情形中，根据SDIP处理次序，在帧内预测单元74准备好预测当前像素时，帧内预测单元74可能不具有对帧内预测参考像素的存取权。

帧内预测单元74可实施本发明的技术，以基于检测到特定帧内预测方向相对于当前像素的重构而应用，而将左下帧内预测和右上帧内预测的处理次序分别改变为从下到上和从右到左。换句话说，帧内预测单元74可基于当前CU的帧内预测角度来改变处理次序。举例来说，帧内预测单元74可实施本发明的技术，以在某些条件下改变处理次序，以解决其中根据现有SDIP处理次序，经重构的参考像素不可用于对当前像素进行帧内预测的情形。

根据本文中所描述的技术，在帧内预测角度是左下的情况下，帧内预测单元74可实施相对于SDIP经编码子块的从下到上处理次序。将了解，在其中帧内预测单元74将处理次序改变为从下到上的情况下，帧内预测单元74可维持现有的基于SDIP的译码技术的从左到右方面。在对应帧内预测角度是左下的情况下，通过将经SDIP译码的块的处理次序改变为从下到上(从左到右方面保持)，帧内预测单元74可实施本发明的技术来增强当前块的预测的准确性。

举例来说，如果现有SDIP技术的从上到下处理次序与左下帧内预测角度组合，那么帧内预测单元74可不具有对来自左下块或行的经重构像素的存取权，帧内预测单元74可需要所述经重构像素来对当前像素进行帧内预测。在此情境下，归因于现有SDIP技术所提供的处理次序，来自左下块或行的像素可能尚未经重构。因此，为了根据现有技术执行SDIP，帧内预测单元74可需要使用另一块(例如相邻块)中已重构的像素。

然而，通过根据本发明的技术，在帧内预测方向是左下的情况下，将经SDIP译码的块的处理次序切换为从下到上，帧内预测单元74可继续利用定位成极接近当前像素的参考像素来实施当前子块的基于SDIP的编码。通过相对于SDLP经译码子块使用从下到上处理次序，帧内预测单元74可以经重构的左下相邻像素作为用于对当前像素进行帧内预测的参考像素可用的方式，实施基于SDIP的帧内预测。举例来说，因为帧内预测单元74以从下到上次序处理经SDIP译码的子块的像素，因此按照定义，在帧内预测单元74开始处理当前像素之前，下相邻像素以及其下相邻像素已经重构。由此，在帧内预测角度是左下的情况下，帧内预测单元74可将SDIP处理次序调适为从下到上和从左到右，以根据本发明的各个方面增强预测准确性。

另外，根据本文中所描述的技术，在帧内预测角度是右上的情况下，帧内预测单元74可实施相对于重构SDIP经编码子块的从右到左处理次序。将了解，在其中帧内预测单元74将处理次序改变为从右到左的情况下，帧内预测单元74可维持现有的基于SDIP的译码技术的从上到下方面。在对应帧内预测角度是右上的情况下，通过将经SDIP译码的块的处理次序改变为从右到左(从从上到下方面保持)，帧内预测单元74可实施本发明的技术来增强当前块的预测的准确性。

举例来说，如果现有SDIP技术的从左到右处理次序与右上帧内预测角度组合，那么帧内预测单元74可不具有对来自右上块或行的经重构像素的存取权，帧内预测单元74可需要所述经重构像素来对当前像素进行帧内预测。在此情境下，归因于现有SDIP技术所提供的处理次序，来自右上(或者，“右上方”)块或行的像素可能尚未重构。因此，为了根据现有技术执行SDIP，帧内预测单元74可需要使用另一块(例如相邻块)中已重构的像素。

然而，通过在帧内预测方向是右上的情况下将经SDIP译码的块的处理次序切换到从右到左，帧内预测单元74可继续利用定位成极接近当前像素的参考像素来实施当前子块的基于SDIP的解码。通过使用相对于经SDIP译码的子块的从右到左处理次序，帧内预测单元74可以经重构的右上相邻像素作为用于对当前像素进行帧内预测的参考像素可用的方式来实施基于SDIP的帧内预测。举例来说，因为帧内预测单元74以从右到左次序处理经SDIP译码的子块的像素，因此按照定义，在帧内预测单元74开始处理当前像素之前，右相邻像素以及其右相邻像素已经重构。由此，在帧内预测角度是右上的情况下，帧内预测单元74可将SDIP处理次序调适为从右到左和从上到下，以根据本发明的各个方面增强预测准确性。

因为帧内预测单元74可仅在帧内预测角度是左下或右上的情况下实施上文所述的技术来更改处理次序，所以帧内预测单元74可维持SDIP相对于其余帧内预测方向所提供的优点，同时在其中帧内预测方向是左下或右上的情况下，利用改变的处理次序来改进基于SDIP的译码的准确性。换句话说，帧内预测单元74可仅在其中调适将潜在地改进基于SDIP的译码所提供的译码准确性的情形中，实施本发明的SDIP处理次序调适，同时在其中适应可不产生潜在的准确性增强的情形中服从现有SDIP处理次序。以此方式，在某些情形中，帧内预测单元74可实施本文中所描述的技术来增强基于SDIP的译码的预测准确性，而在其余情形中，不会不利地影响SDIP技术的优点。

在基于SDIP的解码以及根据其它译码模式的解码的情况下，帧内预测单元74可实施本发明的各种技术来基于CBF值中的子块到子块转变来解码CBF掩码。仅仅为了辅助便于论述，本文中相对于SDIP经编码块来论述基于掩码的CBF重构技术，但将了解，帧内预测单元74还可相对于使用非SDIP相关技术来编码的重构块实施本发明的基于掩码的CBF重构技术。

因为CBF是旗标，因此给定CBF相对于给定子块具有值‘0’或‘1'。由此，CBF值中的任何转变表示双态触发操作。根据本发明的基于掩码的CBF重构技术，帧内预测单元74可通过解码当前经解码子块的CBF值与经SDIP译码的块的紧接在前的子块之间的差，来推断或推知当前经解码子块的CBF值。举例来说，如果帧内预测单元74相对于当前子块对发信号通知的CBF掩蔽值1进行解码，那么帧内预测单元74可确定当前子块的CBF值不同于定位成紧接在当前子块之前(例如在从上到下处理次序中在上方，或在从下到上处理次序中在下方)的子块的CBF值。换句话说，根据本发明的基于掩码的CBF重构技术，CBF掩码值1指示来自紧接在前经解码SDIP子块的CBF值的转变。

举例来说，如果帧内预测单元74接收到CBF掩码的十位串(其读作‘1000000000’)，那么帧内预测单元74可确定SDIP经编码块的所有前十个子块具有值为‘1’的CBF。举例来说，帧内预测单元74可确定为经SDIP译码的块接收到的第一CBF掩码表示所述子块的原始CBF值。换句话说，帧内预测单元74可确定为SDIP经编码块发信号通知的第一CBF掩码不是相对于从另一子块的转变而定义的，而是其相关联子块的CBF值的直接表示。使用本发明的基于掩码的CBF重构技术，帧内预测单元74可为第一子块解码原始CBF值‘1’，且接着基于接下来九个连续‘0’值，推断接下来九个CBF值中无一者从其相应的先前CBF值改变。在此特定实例中，帧内预测单元74确定第二到第十子块(在处理次序中)全部与具有值‘1’的CBF相关联，因为CBF掩码直接或间接地指示并无从第一经处理子块的原始CBF值1的改变。

以此方式，帧内预测单元74可实施本发明的CBF掩蔽技术，以使用经SDIP译码的块的每一离散子块作为二进制向量，且从而推断或推知使用CBF掩码的每一排的CBF值。通过实施本发明的基于掩码的CBF重构技术，与现有的CBF重构技术相比，帧内预测单元74可降低资源消耗和解码复杂性，同时维持CBF准确性。帧内预测单元74还可通过实施本发明的基于掩码的CBF重构技术来减轻带宽消耗要求。

在一些实例中，帧内预测单元74可为SDIP经编码块的CBF值的基于CABAC的解码或熵解码导出上下文。在上文所述的其中前十个CBF值是‘1111111111的实例中，帧内预测单元74可基于紧接在前重构的子块的CABAC上下文，来为特定子块调适CABAC上下文。举例来说，帧内预测单元74可基于用于先前子块(例如从左到右处理次序中的左相邻子块，或从右到左处理次序中的右相邻子块)的CBF旗标的CABAC上下文，来为子块的CBF旗标预测最可能的CABAC上下文。

通过从用于译码紧接在前重构的子块的CBF的CABAC上下文预测当前子块的CBF的CABAC上下文，帧内预测单元74可去除对上下文发信号通知所耗用的位速率的一部分的需要。在一些例子中，帧内预测单元74可通过从用于先前子块的CABAC译码的上下文为子块预测最可能的上下文，来使上下文发信号通知的所需的位数目从2.3个位减少到0.3个位。以此方式，本发明的基于掩码的CBF重构技术可使视频解码器30能够相对于来自视频编码器20的发信号通知要求实施显著位速率减小，且可使视频解码器30能够相对于为解码导出CABAC上下文保存计算资源和复杂性。

在一些实例中，帧内预测单元74可实施本发明的技术，以选择上下文来对SDIP经编码块的子块的最低有效系数的位置(last_pos)进行基于CABAC的解码或熵解码。除子块的CBF以外，子块的最低有效系数的位置还取决于一或多个先前编经码子块的last_pos。根据本文中所描述的技术，帧内预测单元74可基于一或多个先前经重构子块的last_pos信息的振幅，来计算用于对子块的last_pos进行基于CABAC的解码或熵解码的上下文。

在一种实例使用情况下，帧内预测单元74可在“上下文1”和“上下文2”之间进行选择，来用于最低有效系数的基于CABAC的解码或熵解码。在此实例中，如果先前经重构子块(例如紧接在前经重构子块)的last_pos值大于零(0)，那么帧内预测单元74可使用上下文1来对当前子块的last_pos信息进行基于CABAC的解码或熵解码。否则(例如如果先前经译码子块的last_pos等于或小于零(0))，那么帧内预测单元74可使用上下文2来对当前子块的最低有效系数进行解码。以此方式，帧内预测单元74可实施本发明的一或多种技术，以利用来自先前经重构子块的last_pos信息来导出用其根据基于CABAC的解码或熵解码来对当前子块的last_pos信息进行解码的上下文。

逆量化单元76将提供于位流中且由熵解码单元70解码的经量化的变换系数进行逆量化(即，去量化)。逆量化过程可包含使用由视频解码器30针对视频切片中的每一视频块计算以确定应应用的量化程度以及同样的逆量化程度的量化参数QP_Y。

逆量化单元76可实施本发明的一或多个变换精度操纵技术，来相对于各种块高宽比(例如视频译码中常用的各种矩形TU的高宽比)改进解码精度。举例来说，逆量化单元76可使用相对于量化参数的差或“增量”(在本文中被称作“增量QP”)。尽管本文相对于经SDIP译码的块来描述，但将了解，本发明的变换精度操纵技术也适用于其它类型的译码(例如帧内译码和/或帧间预测)。

如上文所描述，矩形块的使用可导致在处理正方形块时不会产生的相对于计算和/或演算考量的一或多个潜在问题。将TU的QP大小计算为√(w*h)，其中‘√’表示平方根函数，‘w’表示TU的宽度，且‘h’表示TU的高度。在正方形块的情况下，当如上文所述计算时，QP大小总是整数值。更具体地说，因为‘w’和‘h’值对于给定正方形块相等，所以(w*h)的积的平方根总是等于w且等于h的值。更具体地说，对于常用的正方形块大小，例如64乘64，QP大小趋向于为2的整数倍。由此，归因于矩阵演算和其它因素，量化在正方形块上的分布可涉及2的幂。

然而，对于视频译码中通常使用的大多数矩形块的形状因子，√(w*h)运算的结果是2的平方根的倍数，其等于大约1.414，且在本文中表示为√2。举例来说，常用矩形块大小中的一者是4×8。在4×8块的情况下，QP大小演算需要√(4*8)运算，其产生值√32。√32是√2的倍数，且明确地说，等于4*√2。类似地，8×16维度的矩形块产生QP大小8*√2，16×32维度的矩形块产生QP大小16*√2，等等。

由此，矩形块的QP大小计算的非整数结果在本文中被称作“√2问题”。√2问题产生QP大小的浮点值，且消除这些值的浮点性质的任何舍入运算均导致译码精度的损失。随着变换大小增加，由√2问题的浮点结果产生的译码精度问题变成更严重。HEVC陈述均匀重构量化，使用可属于从零(0)到五十一(51)(包含端点)的范围内的按比例缩放参数QP。根据HEVC去量化技术，QP值增加一(1)可导致对应量化步长(“Qstep”)增加大约百分之十二(12％)。举例来说，Qstep的12％的增加可表示二又六分之一(2¹/₆)的原始Qstep值增加。基于QP值的对应增加所导致的递增Qstep增加，Qstep针对QP中的六(6)的每次增加而加倍。在其中针对QP四(4)，Qstep等于一(1)的情况下，QP值与用于标准正交变换的对应Qstep之间的关系由下式给出：

Qstep(QP)＝2^(QP-4)/6

为了解决与许多常用矩形TU大小的去量化相关联的√2问题，逆量化单元76可实施本发明的变换精度操纵技术中的一或多者。如果变换单元(TU)大小由表达式2ⁿ×2^m或2ⁿ乘2^m(其中‘2ⁿ’表示行数，且‘2^m'表示列数)表示，那么正向变换由下式表示：

根据用于以上公式的记法，X₂ ⁿ×2^m将表示具有‘n’个行和‘m’个列的残余块。因此，以上公式中所使用的术语X₂n_x2m表示具有等于‘2ⁿ’的行数和等于‘2^m'的列数的残余块。T_v和T_h是用于列和行变换的对应2ⁿ×2ⁿ(2ⁿ乘2^m)和2^m×2^m(2^m乘2^m)矩阵，且Y表示系数矩阵。在一些实例中，n或m中的一者等于0。

根据本文中所描述的变换精度操纵技术中的一或多者，在其中运算(n+m)产生奇数的情况下，逆量化单元76可将增量QP值与和当前变换单元相关联的所导出的QP值相加，以量化对应的TU数据。通过将增量QP与所导出的QP值相加，逆量化单元76可使用为正方形变换定义的原始比例缩放因子。举例来说，针对其定义原始比例缩放因子的正方形变换可表达为具有K乘K维度。在一些实例中，表示正方形变换的一侧的量值的‘K’的值可定义为((n+m)>>1)，或在其它实例中，定义为((n+m+1)>>1)。算子‘>>’表示算术右移位运算，且如上文所描述，‘n’表示残余块的行数，且‘m’表示所述残余块的列数。

举例来说，对于4×8变换，逆量化单元76可继承为4×4变换或8×8变换定义的比例缩放因子。在此实例中，在根据较小变换大小(例如上文所述的实例中的4×4)的比例缩放因子来量化TU之前，逆量化单元76可使变换系数的能量减少(1/√2)，其表示大约30％的减少。反过来，为了补偿减小的能量，逆量化单元76可使对应的Qstep减小√2。

如上文所描述，QP增加1可导致对应Qstep的大约12％的增加。此外，QP减小1可导致对应Qstep的大约12％的降低或减小。另外，对于能量已减小大致30％的变换系数，逆量化单元76可通过使对应QP减小3来补偿能量减小。根据公式上限(30％/12％)来导出QP减小3，其中上限()运算返回运算数的最大可能值。因此，在此实例中，增量QP值总是设定成-3(负三或减三)。或者，逆量化单元76可基于与当前变换单元相关联的所导出的QP值来自适应性地改变增量QP值。

逆变换处理单元78将逆变换(例如，逆DCT、逆整数变换或概念上类似的逆变换过程)应用于变换系数以便产生像素域中的残余块。

在运动补偿单元72基于运动向量和其它语法元素产生当前视频块的预测性块后，视频解码器30通过对来自逆变换处理单元78的残余块与由运动补偿单元72产生的对应预测性块求和来形成经解码的视频块。求和器80表示执行此求和运算的一或多个组件。必要时，还可应用去块滤波器来对经解码块进行滤波以便去除成块效应假象。还可使用其它环路滤波器(在译码环路中或在译码环路之后)来使像素转变变平滑或者以其它方式改进视频质量。接着将给定帧或图片中的经解码视频块存储在参考图片存储器82中，参考图片存储器82存储用于后续运动补偿的参考图片。参考图片存储器82还存储经解码视频以用于稍后呈现在显示装置(例如，图1的显示装置32)上。

图4A和4B是说明实例四叉树98和对应最大译码单元120的概念图。图4A描绘实例四叉树98，其包含以层级方式布置的节点。举例来说，四叉树98可与根据所所提出的HEVC标准的树块相关联。例如四叉树98等四叉树中的每一节点可为没有子节点或具有四个子节点的叶节点。在图4A的实例中，四叉树98包含根节点100。根节点100具有四个子节点，包含叶节点106A到106C(叶节点106)和节点102。因为节点102不是叶节点，所以节点102包含四个子节点，所述四个子节点在此实例中是叶节点108A到108D(叶节点108)。

在此实例中，四叉树98可包含描述对应最大译码单元(LCU)(例如LCU 120)的特性的数据。举例来说，四叉树98通过其结构可描述LCU***为若干子CU。假定LCU 120具有大小2N×2N。在此实例中，LCU 120具有四个子CU 124A到124C(子CU 124)和122，每一者的大小为N×N。子CU 122进一步***成四个子CU 126A到126D(子CU 126)，每一者的大小为N/2×N/2。在此实例中，四叉树98的结构对应于LCU 120的***。也就是说，根节点100对应于LCU120，叶节点106对应于子CU 124，节点102对应于子CU 122，并且叶节点108对应于子CU126。

四叉树98的节点的数据可描述对应于节点的CU是否***。所述CU被***，那么四叉树98中可存在四个额外节点。在一些实例中，四叉树的节点可类似于以下伪码实施：

split_flag值可为表示对应于当前节点的CU是否***的一位值。如果CU未***，那么split_flag值可为‘0’，而如果CU***，那么split_flag值可为‘1’。相对于四叉树98的实例，***旗标值的阵列可为101000000。

如上文所示，CU深度可指代例如LCU 120等LCU已划分的程度。举例来说，根节点100可对应于CU深度零，而节点102和叶节点106可对应于CU深度一。此外，叶节点108可对应于CU深度二。根据本发明的方面，CU和/或TU深度可用作用于对某些语法元素进行熵译码的上下文。在出于解释的目的的实例中，可使用与叶节点108A不同的上下文模型对与叶节点106A相关联的一或多个语法元素进行熵译码，因为叶节点106A位于深度一，而叶节点108A位于深度二。

虽然图4A说明CU四叉树的实例，但应理解，可对叶节点CU的TU应用类似的四叉树。也就是说，叶节点CU可包含TU四叉树(被称作残余四叉树(RQT))，其描述CU的TU的分割。TU四叉树可总体上类似于CU四叉树，但TU四叉树可单独地发信号通知CU的TU的帧内预测模式除外。

图5是通常说明与定向帧内预测模式相关联的预测方向的概念图。举例来说，如上所指出，新兴的HEVC标准可包含三十五种帧内预测模式，包含平面模式(模式0)、DC模式(模式1)和33个方向性预测模式(模式2到34)。在平面模式的情况下，使用所谓的“平面”功能来执行预测。关于DC模式，基于块内的像素值的平均化来执行预测。对于定向预测模式，基于相邻块的沿特定方向(如由所述模式指示)重构的像素来执行预测。

在一些例子中，视频编码装置(例如视频编码器20)可使用最可能模式(MPM)过程来发信号通知块的帧内模式。举例来说，视频编码器20可识别与当前正译码的块(例如位于当前正编码的块上方的块，以及定位在当前正编码的块左侧的块)相邻的块相关联的至多两个MPM候选者。在无法找到两个MPM候选者(例如所述块未经帧内译码，所述块在不同切片中或图片边界外部，所述块具有相同帧内模式)的情况下，视频编码器20可取代DC模式。

如果当前正编码的块的帧内模式等于MPM候选者中的任一个，那么视频编码器20可设定prev_intra_luma_pred_flag。另外，视频编码器20可设定mpm_idx旗标来识别匹配的MPM候选者。然而，如果当前正编码的块的帧内模式不等于MPM候选者中的任一个，那么视频编码器20可设定rem_intra_luma_pred_mode符号，以指示其余帧内模式中的哪些等于当前正编码的块的帧内模式。

根据本发明的方面，相对于图5的实例示出和描述的帧内模式可与图6和8中所示的分割模式中的一或多者结合使用，包含SDIP和/或不对称SDIP模式。

图6通常说明可与预测单元相关联的分割模式(其可定义PU大小)。举例来说，假定特定CU的大小为2N×2N，可使用分割模式2N×2N(140)、N×N(142)、hN×2N(144)、2N×hN(146)、N×2N(148)、2N×N(150)、nL×2N(152)、nR×2N(154)、2N×nU(156)和2N×nD(158)来预测CU。图5的实例中所示的分割模式仅出于说明的目的而呈现，且可使用其它分割模式来指示预测视频数据的方式。

在一些例子中，视频译码器(例如视频编码器20和/或视频解码器30)可使用分割模式140和142来执行帧内预测或帧间预测。举例来说，视频译码器可使用2N×2N PU(分区模式140)来整体预测CU。在另一实例中，视频译码器可使用四个大小为N×N的PU(分区模式142)来预测CU，其中对四个区段中的每一者应用潜在不同的预测技术。

另外，相对于帧内译码，视频译码器可执行被称作短距离帧内预测(SDIP)的技术。如果SDIP可用，那么可使用并行PU(分割模式144和146)来预测CU。也就是说，SDIP通常允许CU分成若干平行PU。通过将译码单元(CU)***成非正方形预测单元(PU)，可缩短所预测的像素与参考像素之间的距离。因此，在一些例子中，当应用定向预测方法(例如图5中所示的定向预测模式2到34)时，帧内预测的准确性可改进。

举例来说，在此实例中，8×8CU可分成四个8×2PU，其中“N×M”是指垂直地N个像素和水平地M个像素。可从到CU的相邻像素预测第一PU，且可从包含第一PU的像素的相邻像素预测第二PU，可从包含第二PU的像素的相邻像素预测第三PU，且可从包含第三PU的像素的相邻像素预测第四PU。以此方式，并非从与CU相邻的经先前译码块的像素预测CU的所有像素，而是可使用SDIP，使用所述CU内的像素来预测同一CU内的其它像素。

在图6中所示的实例中，可用hN×2N排列中的四个SDIP PU来预测CU(分区模式144)，其中“h”表示二分之一。在另一实例中，可用2N×hN排列中的四个SDIP PU来预测CU(分区模式146)。将CU分割成若干SDIP PU可被称为实施SDIP分区模式。在其它实例中，额外预测类型也是可能的。

相对于帧间译码，除了对称分区模式140和142之外，视频译码器还可实施PU的并排式排列(分区模式148和150)或多种AMP(不对称运动分区)模式。相对于AMP模式，视频译码器可使用分区模式nL×2N(152)、nR×2N(154)、2N×nU(156)和2N×nD(158)不对称地分割CU。在不对称分割中，不分割CU的一个方向，但是将另一方向分割成25％和75％。CU的对应于25％分区的部分通过“n”后面跟着“上”、“下”、“左”或“右”的指示来指示。

图7A是说明根据短距离帧内预测(SDIP)分区成线或非正方形(例如矩形)块的译码单元(CU)160的概念图。CU 160的每一子块的维度在图7A被称为出来。当编码或解码CU160时，视频编码器20和/或视频解码器30可实施本文中所描述的技术中的一或多者，例如上文所述的自适应SDIP处理次序技术。

图7B是说明包含SDIP经预测CU的实例LCU 180的概念图。明确地说，在此实例中，LCU 180包含子CU 182、184、186、188、190、192和194。子CU 182、184、186、188、190、192和194中的每一者对应于叶节点CU。在此实例中，非叶节点CU将包含子CU 184、186、188和190。可根据特定预测模式来预测叶节点子CU中的每一者。在此实例中，使用SDIP来预测子CU188。因此，子CU 188包含四个PU 196A到196D(PU 196)。如此实例中示出，PU 196是子CU188的水平PU。

图8是说明使用SDIP的不对称分区模式来分割的块220到226的各种实例的概念图。举例来说，图6包含两个对称SDIP模式144和146。在图8的实例中，每一块220到226分割成两个矩形，其中块220到226中的每一者最初是2N×2N块。一个矩形具有N/2个像素的尺寸(也就是说，长度或宽度)，并且另一矩形具有相同的3N/2个像素的尺寸。

在此实例中，块220、222、224和226中的每一者是64×64像素块，但其它大小的块(例如32×32、16×16、128×128或类似者)也可以类似方式分割。块220通过垂直边缘230A水平地分成两个PU，一个(1/2N)*2N PU 232A和一个(3/2N)*2N PU 234A。块222通过垂直边缘230B水平地分成两个PU，一个(1/2N)*2N PU 234B和一个(3/2N)*2N PU 232B。块224通过水平边缘230C垂直地分成两个PU，一个2N*(3/2N)PU 234C和一个2N*(1/2N)PU 232C。块226通过水平边缘230D垂直分成两个PU，一个2N*(1/2N)PU 232D和一个2N*(3/2N)PU 234D。以此方式，图8的SDIP PU 232、234可被称为不对称SDIP PU。

如同常规SDIP，不对称SDIP PU的像素中的每一者可共享相同的帧内预测方向。此外，不对称SDIP PU不需要一定具有相同的帧内预测方向。举例来说，可使用垂直帧内预测模式(例如图5中的模式1)来预测PU 232A，而可使用对角线帧内预测模式(例如图5中的模式26)来预测PU 234A。

在一些实例中，某些帧内预测模式对于某些不对称PU来说受限。举例来说，视频译码装置(例如视频编码器20或视频解码器30)可经配置以推断不使用相对水平的帧内预测模式(例如模式27到10，在图5中从上到下延伸)来预测相对垂直的不对称SDIP PU，例如PU232A、232B、234A和234B。同样地，在另一实例中，视频译码装置可经配置以推断不使用相对垂直的帧内预测模式(例如模式4到7，在图5中从左到右延伸)来预测相对水平的不对称SDIP PU。例如PU 232C、232C、234D和234D。

在一些实例中，变换单元大小可与对应PU大小相同。因此，块220到226的变换单元可具有与PU 232、234中的对应者相同的大小。举例来说，对于块220，(1/2N)*2N变换可用于PU 232A，且(3/2N)*2N变换可用于PU 234A。或者，在其它实例中，相同大小变换可用于不对称SDIP中的两个PU。举例来说，对于块220，(1/2N)*2N变换可用于PU 232A，且三个(1/2N)*2N变换可用于PU 234A。

图9是说明非正方形四叉树分割的实例分割结构的概念图。如图9中所示出，可使用非正方形四叉树变换(NSQT)来分割块240。一般来说，NSQT允许块(例如CU的TU)分割成第一等级的四个非正方形矩形，其中的任一者或全部可进一步分割成额外等级的四个较小、大小相等的非正方形矩形。在图9的实例中，块240具有大小2N×2N。可将块分割成四个2N×(N/2)或(N/2)×2N矩形242A到242D。这些第一等级块242中的任一者或全部可进一步分割成第二等级的四个较小的大小相等的非正方形块，其具有大小N×(N/4)，例如，块244A到244D(块244，不按比例绘制)。

尽管图9中将块240说明为分割成两个等级的子块(242、244)，但可将块(例如块240)分割成一个等级的块，其不进一步分割。NSQT通常用于分割块的变换单元(TU)，其中TU包含与残余数据相关联的变换系数。

在一些实例中，RQT树状结构，例如图9中所示的树状结构，可用于经不对称SDIP分割的CU。举例来说，对于块220(图8)，PU 232A的变换可一个等级一TU，例如(1/2N)*2N TU(例如块242)；或四个(1/4N)*N TU，例如，四个等级二TU(例如块244)。RQT可包含指示对于每一TU，TU是否进一步***成若干子CU的***旗标语法元素。以此方式，***或不***决策可由***旗标指示。

图10A和10B是根据本发明的各个方面说明视频编码器20和视频解码器30可实施来修改基于SDIP的译码的自适应处理次序改变的概念图。图10A说明经SDIP译码的CU 262。以实线箭头说明帧内预测角度264，且在经SDIP译码的CU 262的特定实例中，帧内预测角度264为左下帧内预测角度。基于检测到帧内预测角度264为左下，视频编码器20和视频解码器30可通过实施本发明的技术来调适经SDIP译码的LCU 262的子块的处理次序，以形成经修改的处理次序266。使用两个单独的短划线箭头来说明经修改的处理次序266，其中一个箭头说明经修改处理次序266的垂直方面，且另一箭头说明经修改处理次序266的水平方面。在经SDIP译码的LCU 262的情况下，基于帧内预测角度264为左下，视频编码器20和视频解码器30可将子块的经修改的处理次序266形成为从下到上和从左到右。更具体地说，根据本发明的技术，响应于检测到帧内预测角度264为左下，视频编码器20和视频解码器30可偏离现有的基于SDIP的译码技术的从上到下、从左到右的处理次序，而是改为对经SDIP译码的CU 262使用经修改处理次序266的从下到上、从左到右方面。

图10B说明经SDIP译码的CU 272。以实线箭头说明帧内预测角度274，且在经SDIP译码的CU 272的特定实例中，帧内预测角度274是右上帧内预测角度。基于检测到帧内预测角度274为右上，视频编码器20和视频解码器30可通过实施本发明的技术来调适经SDIP译码的LCU 272的子块的处理次序，以形成经修改的处理次序276。使用两个单独的短划线箭头来说明经修改的处理次序276，其中一个箭头说明经修改处理次序276的垂直方面，且另一箭头说明经修改处理次序276的水平方面。在经SDIP译码的LCU 272的情况下，基于帧内预测角度274为右上，视频编码器20和视频解码器30可将子块的经修改的处理次序266形成为从上到下和从右到左。更具体地说，根据本发明的技术，响应于检测到帧内预测角度274为右上，视频编码器20和视频解码器30可偏离现有的基于SDIP的译码技术的从上到下、从左到右的处理次序，而是改为对经SDIP译码的CU 272使用经修改处理次序276的从上到下、从右到左方面。

图11是说明视频解码器30可实施以执行本发明的一或多种技术的实例过程300的流程图。视频解码器30可确定将使用SDIP来解码视频数据的经编码子块(302)。反过来，视频解码器30可确定将根据SDIP来解码的子块的帧内预测方向(304)。

视频解码器30可确定帧内预测方向是否为左下方向(决策框306)。基于确定帧内预测方向为左下方向(决策框306的是分支)，视频解码器30可为子块的基于SDIP的解码实施从下到上、从左到右处理次序(308)。另一方面，基于确定帧内预测方向不是左下方向(决策框306的否分支)，视频解码器30可确定帧内预测方向是否为右上方向(决策框310)。

基于确定帧内预测方向是右上方向(决策框310的是分支)，视频解码器30可为子块的基于SDIP的解码实施从上到下、从右到左处理次序(312)。另一方面，基于确定帧内预测方向不是右上方向(决策框310的否分支)，视频解码器30可为子块的基于SDIP的解码实施从上到下、从左到右处理次序(314)。由此，根据本发明的技术，如果SDIP模式的帧内预测角度既不是左下也不是右上，那么视频解码器30可为子块的基于SDIP的解码实施从上到下、从左到右处理次序。

图12是说明视频编码器20可实施以执行本发明的一或多种技术的实例过程320的流程图。视频编码器20可确定将使用SDIP来编码视频数据的子块(322)。反过来，视频编码器20可确定将根据SDIP编码的子块的帧内预测方向(324)。

视频编码器20可确定帧内预测方向是否为左下方向(决策框326)。基于确定帧内预测方向为左下方向(决策框326的是分支)，视频编码器20可为子块的基于SDIP的编码实施从下到上、从左到右处理次序(328)。另一方面，基于确定帧内预测方向不是左下方向(决策框326的否分支)，视频编码器20可确定帧内预测方向是否为右上方向(决策框330)。

基于确定帧内预测方向是右上方向(决策框330的是分支)，视频编码器20可为子块的基于SDIP的编码实施从上到下、从右到左处理次序(332)。另一方面，基于确定帧内预测方向不是右上方向(决策框330的否分支)，视频编码器20可为子块的基于SDIP的编码实施从上到下、从左到右处理次序(334)。

图13是说明视频译码装置可实施以执行本发明的变换操纵方面中的一或多者的实例过程350的流程图。本文相对于视频解码器30来描述过程350。视频解码器30可识别用于解码的矩形变换单元(TU)(352)。反过来，视频解码器30可确定矩形TU具有K乘L的维度(354)。K表示TU中的像素行的数目，且是使用公式(1<<n)获得的整数值，其中‘n’表示整数值。L表示TU中的像素列的数目，且使用公式(1<<m)获得整数值，其中‘m’表示整数值。换句话说，具有等于整数值‘m’左移位一(1)的值，且其中L具有等于整数值‘n’左移位一(1)的值。

视频解码器30可确定n与m的和是否得出奇数(决策框356)。基于确定n与m的和并不得出奇数(决策框356的否分支)，视频解码器30可使用未经修改的量化参数(QP)值来对TU进行去量化(358)。另一方面，如果视频解码器30确定n与m的和得出奇数(决策框356的是分支)，那么视频解码器30可修改QP值，以通过添加增量QP来对矩形TU进行去量化(362)。在各种实例中，视频解码器30可使用预定增量QP值(例如负三)，或可使用正方形TU的QP值自适应性地导出增量QP值。反过来，视频解码器30可使用经修改QP值来使TU去量化(364)。

已经出于说明的目的，相对于HEVC标准和/或一或多个HEVC扩展描述了本发明的某些方面。然而，本发明中描述的技术可能可用于其它视频译码过程，例如根据H.264或其它标准或尚未开发的专有视频译码过程定义的那些过程。

如本发明中所描述，视频译码器可指视频编码器或视频解码器。类似地，视频译码单元可指视频编码器或视频解码器。同样，视频译码可指视频编码或视频解码。

应认识到，取决于实例，本文中所描述的技术中的任一者的某些动作或事件可用不同顺序来执行，可添加、合并或全部省略所述动作或事件(例如，实践所述技术未必需要所有所描述动作或事件)。此外，在某些实例中，可(例如)通过多线程处理、中断处理或多个处理器同时而非依序地执行动作或事件。

在一或多个实例中，所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施，那么所述功能可作为一或多个指令或代码在计算机可读媒体上存储或传输，并且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体，其对应于例如数据存储媒体或通信媒体等有形媒体，通信媒体(例如)根据通信协议包含促进将计算机程序从一处传送到另一处的任何媒体。以此方式，计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体，或(2)通信媒体，例如信号或载波。数据存储媒体可为可由一或多个计算机或者一或多个处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。

作为实例而非限制，此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器，或可用以存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。并且，适当地将任何连接称作计算机可读媒体。举例来说，如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波等无线技术从网站、服务器或其它远程源传输指令，那么同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电和微波等无线技术包含在媒体的定义中。然而，应理解，有形计算机可读存储媒体和数据存储媒体并不包含连接、载波、信号或其它暂时性媒体，而实际上是针对非暂时性有形存储媒体。如本文中所使用，磁盘和光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软性磁盘及蓝光光盘，其中磁盘通常以磁性方式再现数据，而光盘用激光以光学方式再现数据。以上各项的组合也应包含在计算机可读媒体的范围内。

指令可由一或多个处理器执行，所述一或多个处理器例如是一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效的集成或离散逻辑电路。因此，如本文中所使用的术语“处理器”可指代上述结构或适用于实施本文中所描述的技术的任何其它结构中的任一者。另外，在一些方面中，本文中所描述的功能性可在经配置以用于编码和解码的专用硬件和/或软件模块内提供，或并入在组合式编解码器中。并且，所述技术可完全实施于一或多个电路或逻辑元件中。

本发明的技术可在各种各样的装置或设备中实施，包含无线手持机、集成电路(IC)或一组IC(例如芯片组)。本发明中描述各种组件、模块或单元是为了强调经配置以执行所揭示的技术的装置的功能方面，但未必需要通过不同硬件单元实现。确切地，如上文所描述，各种单元可结合合适的软件和/或固件组合在编解码器硬件单元中，或由互操作硬件单元的集合来提供，所述硬件单元包含如上文所描述的一或多个处理器。

已描述了各种实例。这些和其它实例在所附权利要求书的范围内。

Claims

1.一种解码经编码视频数据的方法，所述方法包括：

确定矩形变换单元TU包括由第一整数值‘K’表示的像素行数目和由第二整数值‘L’表示的像素列数目，其中K具有等于整数值‘m’左移位一(1)的值，且其中L具有等于整数值‘n’左移位一(1)的值；

确定n与m的和是奇数；以及

基于n与m的和为奇数，将增量量化参数(增量QP)值与矩形TU的量化参数QP值相加，以获得矩形TU的经修改QP值。

2.根据权利要求1所述的方法，其进一步包括：将比例缩放因子应用于所述矩形PU的像素，所述比例缩放因子与正方形变换大小相关联。

3.根据权利要求2所述的方法，

其中所述正方形变换大小与((n+m)>>1)乘((n+m)>>1)维度相关联，且

其中‘>>’表示算术右移位运算。

4.根据权利要求2所述的方法，

其中所述正方形变换大小与((n+m+l)>>1)乘((n+m+l)>>1)维度相关联，且

其中‘>>’表示算术右移位运算。

5.根据权利要求1所述的方法，其进一步包括：基于具有K乘K维度的正方形变换的QP值来确定所述增量QP值。

6.根据权利要求1所述的方法，其进一步包括：确定所述增量QP值为值-3(负三)。

7.一种视频解码装置，其包括：

存储器装置，其经配置以存储经编码视频数据；以及

处理电路，其耦合到所述存储器装置，且经配置以：

确定存储到所述存储器装置的所述经编码视频数据的矩形变换单元TU包括由第一整数值‘K’表示的像素行数目和由第二整数值‘L’表示的像素列数目，其中K具有等于整数值‘m’左移位一(1)的值，且其中L具有等于整数值‘n’左移位一(1)的值；

确定n与m的和为奇数；以及

基于n与m的所述和为所述奇数，将增量量化参数(增量QP)值与所述矩形TU的量化参数QP值相加，以获得所述矩形TU的经修改QP值。

8.根据权利要求7所述的视频解码装置，其中所述处理电路进一步经配置以将比例缩放因子应用于所述矩形PU的像素，所述比例缩放因子与正方形变换大小相关联。

9.根据权利要求8所述的视频解码装置，

其中‘>>’表示算术右移位运算。

10.根据权利要求8所述的视频解码装置，

其中所述正方形变换大小与((n+m+1)>>1)乘((n+m+1)>>1)维度相关联，且

其中‘>>’表示算术右移位运算。

11.根据权利要求7所述的视频解码装置，其进一步包括基于所述QP值来确定所述增量QP值。

12.根据权利要求7所述的视频解码装置，其进一步包括确定所述增量QP值为值-3(负三)。

13.根据权利要求7所述的视频解码装置，其进一步包括显示器，所述显示器经配置以显示使用所述经修改的QP值和所述矩形TU重构的一或多个图片。

14.一种视频解码装置，其包括：

存储器装置，其经配置以存储经编码视频数据；以及

处理电路，其耦合到所述存储器装置，且经配置以：

确定存储到所述存储器装置的所述经编码视频数据的子块是根据短距离帧内预测SDIP来解码；

确定与存储到所述存储器装置的所述经编码视频数据的所述子块相关联的帧内预测方向；

响应于确定所述帧内预测方向包括左下方向，确定所述子块的基于SDIP的解码的处理次序包括从下到上处理次序；以及

响应于确定所述帧内预测方向包括右上方向，确定所述子块的所述基于SDIP的解码的所述处理次序包括从右到左处理次序。

15.根据权利要求14所述的视频解码装置，其中所述处理电路进一步经配置以：

响应于确定所述帧内预测方向既不包括所述左下方向，也不包括所述右上方向，确定所述子块的所述基于SDIP的解码的所述处理次序包括从上到下处理次序和从左到右处理次序两者。

16.根据权利要求14所述的视频解码装置，

其中所述左下方向与基于所述当前像素的左下方相邻像素来预测所述子块的当前像素相关联，且

其中所述右上方向与基于所述当前像素的右上相邻像素来预测所述子块的所述当前像素相关联。

17.根据权利要求14所述的视频解码装置，其中所述处理电路进一步经配置以：

确定所述子块的经译码块旗标CBF值与根据所述处理次序在所述子块前面的先前经解码子块的CBF值之间的差；以及

使用所述所确定的差来重构所述子块的所述CBF值。

18.根据权利要求17所述的视频解码装置，其中所述先前经解码子块为定位成邻近于所述子块的相邻子块。

19.根据权利要求17所述的视频解码装置，其中所述处理电路进一步经配置以：

基于用于对所述先前经解码的子块的所述CBF进行熵解码的上下文，预测所述子块的所述CBF的熵解码的上下文。

20.根据权利要求14所述的视频解码装置，其中所述处理电路进一步经配置以：

确定根据所述处理次序在所述子块前面的先前经解码子块的最低有效系数的位置的振幅；以及

基于所述先前经解码子块的所述最低有效系数的所述位置的所述所确定的振幅，选择用于解码将根据SDIP解码的所述子块的最低有效系数的位置的上下文。

21.根据权利要求20所述的视频解码装置，其中为了选择用于解码所述子块的所述最低有效系数的所述位置的所述上下文，所述处理电路经配置以：

如果所述先前经解码子块的所述最低有效系数的所述位置大于0(零)，那么选择用于解码所述子块的所述最低有效系数的所述位置的第一上下文设定；或

如果所述先前经解码子块的所述最低有效系数的所述位置小于或等于0(零)，那么选择用于解码所述子块的所述最低有效系数的所述位置的第二上下文设定，

其中所述第一上下文设定不同于所述第二上下文设定。

22.根据权利要求14所述的视频解码装置，其进一步包括相机、计算机、移动装置、广播接收器装置或机顶盒中的一或多者。

23.一种编码视频数据的方法，所述方法包含：

确定将根据短距离帧内预测SDIP来编码所述视频数据的子块；

确定与所述视频数据的所述子块相关联的帧内预测方向；以及

执行以下各项中的一者：

响应于确定所述帧内预测方向包括左下方向，确定所述子块的基于SDIP的编码的处理次序包括从下到上处理次序；或

响应于确定所述帧内预测方向包括右上方向，确定所述子块的所述基于SDIP的编码的所述处理次序包括从右到左处理次序。

24.根据权利要求23所述的方法，其进一步包括：

响应于确定所述帧内预测方向既不包括所述左下方向，也不包括所述右上方向，确定所述子块的所述基于SDIP的编码的所述处理次序包括从上到下处理次序和从左到右处理次序两者。

25.根据权利要求23所述的方法，

26.根据权利要求23所述的方法，其进一步包括：

确定所述子块的经译码块旗标CBF值与根据所述处理次序在所述子块前面的先前经编码子块的CBF值之间的差；以及

发信号通知所述差异作为与所述子块相关联的CBF掩码。

27.根据权利要求26所述的方法，其中所述先前经编码子块是定位成邻近于所述子块的相邻子块。

28.根据权利要求26所述的方法，其进一步包括：

基于用于对所述先前经编码子块的所述CBF进行熵编码的上下文，预测所述子块的所述CBF的熵编码的上下文。

29.根据权利要求23所述的方法，其进一步包括：

确定根据所述处理次序在所述子块前面的先前经编码子块的最低有效系数的位置的振幅；以及

基于所述先前经编码子块的所述最低有效系数的所述位置的所述所确定的振幅，选择用于编码将根据SDIP编码的所述子块的最低有效系数的位置的上下文。

30.根据权利要求29所述的方法，其中选择用于编码所述子块的所述最低有效系数的所述位置的所述上下文包括执行以下各项中的一者：

如果所述先前经编码子块的所述最低有效系数的所述位置大于0(零)，那么选择用于编码所述子块的所述最低有效系数的所述位置的第一上下文设定；或

如果所述先前经编码子块的所述最低有效系数的所述位置小于或等于0(零)，那么选择用于编码所述子块的所述最低有效系数的所述位置的第二上下文设定，

其中所述第一上下文设定不同于所述第二上下文设定。