CN104247422B - 用于改进帧内预测的新的角度表的方法和装置 - Google Patents

用于改进帧内预测的新的角度表的方法和装置 Download PDF

Info

Publication number
CN104247422B
CN104247422B CN201280054317.2A CN201280054317A CN104247422B CN 104247422 B CN104247422 B CN 104247422B CN 201280054317 A CN201280054317 A CN 201280054317A CN 104247422 B CN104247422 B CN 104247422B
Authority
CN
China
Prior art keywords
block
angular
prediction
angtable
eapa
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280054317.2A
Other languages
English (en)
Other versions
CN104247422A (zh
Inventor
刘凌志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of CN104247422A publication Critical patent/CN104247422A/zh
Application granted granted Critical
Publication of CN104247422B publication Critical patent/CN104247422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

一种帧内预测的方法,所述方法包括计算亮度块的预测块,其中计算所述预测块包含使用多个定向帧内预测模式以及使用包括多个条目的角度表(angTable),并且其中每个条目的值是通过数学推导确定的。一种设备,所述设备包括:存储器,其用于存储包括多个条目的angTable,其中每个条目的值是通过数学推导确定的;以及处理器,其用于使用多个定向帧内预测模式以及所述angTable来计算亮度块的预测块。

Description

用于改进帧内预测的新的角度表的方法和装置
相关申请案的交叉参考
本发明要求2011年11月7日由刘灵芝递交的发明名称为“生成用于改进视频编码中帧内预测的角度表的新颖方法(A New Method for Generating the Angular Tablefor Improving the Intra Prediction in Video Coding)”的第61/556,511号美国临时专利申请案的在先申请优先权,该在先申请的内容以引入的方式并入本文本中,如全文再现一般。
关于由联邦政府赞助的
研究或开发的声明
不适用。
参考缩微胶片附录
不适用。
技术领域
背景技术
即使在影片相对较短的情况下也需要对大量的视频数据进行描述,当数据要在带宽容量受限的通信网络中流过或以其他方式传送时,这样可能会造成困难。因此,视频数据通常要先压缩然后在现代电信网络中传送。视频压缩装置通常在源处使用软件和/或硬件,以在传输之前对视频数据进行编码,从而减少用来表示数字视频图像所需的数据量。接着,压缩数据在目的地处由视频解压装置接收,该视频解压装置用于对视频数据进行解码。由于网络资源有限,因此需要开发出能够提高压缩率但不会降低视频质量的压缩和解压技术。
在高性能视频编码(HEVC)中,可以在帧内预测中使用角度表。然而,目前用于HEVC的角度表可能是以特设方式生成的,并且在提供了用于获得角度表的总体框架的情况下是可以得到改进的。
发明内容
在一项实施例中,本发明包含一种帧内预测的方法,所述方法包括针对亮度块来计算预测块,其中计算预测块包含使用多个定向帧内预测模式以及使用包括多个条目的角度表(angTable),并且其中每个条目的值是通过数学推导确定的。
在另一项实施例中,本发明包含一种设备,所述设备包括:存储器,其用于存储包括多个条目的angTable,其中每个条目的值是通过数学推导确定的;以及处理器,其用于使用多个定向帧内预测模式以及angTable来针对亮度块计算预测块。
在又一项实施例中,本发明包含一种方法,所述方法包括:以数学方法获得多个整数;将所述多个整数存储在存储器中;以及针对亮度块来计算预测块,其中计算预测块包含使用多个定向帧内预测模式以及多个整数。
从结合附图和所附权利要求书进行的以下详细描述将更清楚地理解这些和其他特征。
附图说明
为了更完整地理解本发明,现在参考以下结合附图和详细描述进行的简要描述,其中相同参考标号表示相同部分。
图1A和图1B是多个帧内预测模式的图。
图2是统一帧内预测(UIP)帧内预测方案的示意图。
图3是篮球训练视频序列中的视频帧的图像。
图4是UIP方案的一项实施例的示意图。
图5是扇形的一项实施例的图。
图6是扇形的另一项实施例的图。
图7是帧内预测方法的一项实施例的流程图。
图8是视频编码器的一项实施例的示意图。
图9是视频解码器的一项实施例的示意图。
图10是通用计算机***的示意图。
具体实施方式
首先应理解,尽管下文提供了一项或多项实施例的说明性实施方案,但可以使用任何数目的技术,不管是当前已知还是现有的,来实施所揭示的***和/或方法。本发明决不应限于下文所说明的所述说明性实施方案、附图和技术,包含本文所说明并描述的示范性设计和实施方案,而是可以在所附权利要求书的范围以及其等效物的完整范围内进行修改。
通常,视频媒体涉及相对较快地连续显示一系列静态图像或帧,从而让观察者感觉到运动。每个帧可以包括多个图像元素或像素,每个图像元素或像素可以表示帧中的单个参考点。在数字处理期间,每个像素可以被分配一个整数值(例如,0、1、…、255),所述整数值表示对应参考点处的图像质量或颜色。颜色空间可以由三个组分表示,所述三个组分包含一个亮度(亮度或Y)组分和两个色度(色度)组分,表示为Cb和Cr(或者有时表示为U和V)。
在使用中,图像或视频帧可以包括大量的像素(例如,在1920×1080的帧中包括2,073,600个像素),因此对每个像素进行独立的编码和解码(下文中通常称为编码)可能是繁琐且低效的。为了提高编码效率,通常将视频帧分成多个矩形块或宏块,每个矩形块或宏块可以作为编码、预测、变换以及量化等处理的基本单元。例如,典型的NxN块可以包括N2个像素,其中N是大于1的整数,并且通常是四的倍数。在YUV或YCbCr颜色空间中,每个亮度(Y)块对应于包含Cb块和Cr块的两个色度块。Cb块和Cr块也彼此对应。色度块和它们对应的亮度块可以位于视频帧、切片或区域的相同相对位置中。另外,根据用于编码YCbCr组分的采样率,Cb块、其对应的Cr块和/或其对应的Y块的大小可以是相同的或不同的。例如,在4:2:0的采样率中,每个NxN的色度(Cb或Cr)块可以对应于2Nx2N的亮度块,而在4:4:4的采样率中,每个NxN的色度块可以对应于NxN的亮度块。
在国际电信联盟(ITU)电信标准化部门(ITU-T)和国际标准化组织(ISO)/国际电工技术委员会(IEC)HEVC的工作草案中,已经引入了新的块概念,所述HEVC将准备作为下一个视频编码标准。例如,编码单元(CU)可以指将视频帧分为相等大小或不同大小的矩形块的子分区。在HEVC中,CU可以取代先前标准的宏块结构。根据帧间预测或帧内预测的模式,一个CU可以包括一个或多个预测单元(PU),每一个预测单元可以用作预测的基本单元。例如,对于帧内预测而言,一个64x64的CU可以被对称地分为四个32x32的PU。又例如,对于帧间预测而言,一个64x64的CU可以被非对称地分为一个16x64的PU以及一个48x64的PU。类似地,一个PU可以包括一个或多个变换单元(TU),每个变换单元可以用作变换和/或量化的基本单元。例如,一个32x32的PU可以被对称地分为四个16x16的TU。一个PU的多个TU可以共用同一预测模式,但是可以单独地进行变换。本文中术语“块”通常可以指宏块、CU、PU或TU中的任何一者。
视频帧内的块可以在相同的帧内与其他块空间相关,以使得一些块的像素值可能仅略有不同并且/或者呈现出重复的纹理(texture)。现代视频压缩方法使用各种技术来利用这些空间相关性(spatial correlation),这些技术可以共同称为帧内部预测(简称为帧内预测)。在使用帧内预测对当前块(亮度或色度)进行编码时,可以基于一个或多个先前编码的参考块来生成预测块或预测单元。预测块可以是当前块的估计版本。残余块的生成可以通过从预测块中减去当前块,或者从当前块中减去预测块,后者表示了预测残余或误差。由于需要用来表示预测残余的数据的量通常小于需要用来表示原始块的数据的量,所以可以对残余块而非当前块进行编码以获得较高的压缩比。
在邻近块是相同的或者近似相同的视频区域中,使用帧内预测可以生成包括多个零像素值和/或接近零像素值的残余块。此外,残余块的变换、量化和/或扫描可以从编码数据流中移除许多零和/或接近零的系数,从而引起对视频数据的进一步压缩。因此,对原始图像进行的更为精确的预测可以引起更高的编码效率。为了提高帧内预测的精确度,视频/图像编码标准可以利用多个帧内预测模式,每一个帧内预测模式都可以生成独特的纹理。例如,在HEVC中针对亮度组分可以使用多达35个帧内预测模式,而针对色度组分可以使用多达六个帧内预测模式。
图1A图示了多个帧内预测模式100(下文中也称作帧内模式)的图,所述帧内预测模式100可以用于HEVC UIP方案中的亮度块。帧内预测模式100可以包括多达35个帧内预测模式,其包含33个定向模式以及两个非定向模式,例如,直流(DC)预测模式以及平面预测模式。可以给每个模式分配一个模式名称,该名称可以是取决于应用的。在HEVC中,平面模式可以被分配或者指定为模式0、DC模式为模式3、水平模式为模式2等等。在使用中,编码器可以使用率失真优化(RDO)过程来选择能够生成每个当前块的最精确预测的预测模式。例如,在帧内预测模式100中可以计算每个模式的绝对误差之和(SAE),并且可以选择具有最小SAE的一个模式。通常情况下,大量的帧内预测模式可以带来更加精确的帧内预测。例如,最近的研究表明使用35个帧内部预测模式,例如,帧内预测模式100,的约定与使用较少预测模式,例如,最多仅使用九个帧内预测模式的ITU-T H.264/高级视频编码(AVC)标准的约定相比,可以更加精确地预测复杂的纹理。在HEVC中,针对色度组分的六个帧内预测模式可以包含来自亮度预测模式(称作线性模型(LM)模式)、垂直预测模式、水平预测模式、对角线模式、DC预测模式,以及从亮度组分获得的直接模式(DM)的色度。
如图1A所示,33个定向模式可以关于垂直方向、水平方向以及对角线方向对称。相应地,只需要九个方向来表示33个方向,而其他方向可以通过加法、减法和/或移位运算获得。图1B图示了33个定向模式中的九个定向模式,其表示由帧内预测模式100覆盖的π弧度或180度角度范围的四分之一。具体而言,这九个模式包含模式1、23、13、24、6、25、14、26和7,这些模式在45度(零度表示右水平侧)到90度的范围内。这九个模式中的每一个模式都具有与右水平线之间预定的角度。在HEVC中,所述角度可以定义为反余切(k/32),其中k具有分别对应于九个模式1、23、13、24、6、25、14、26和7的值0、2、5、9、13、17、21、26和32。例如,模式14具有的反余切角度(21/32)等于56.7度。如果当前被编码的一个块具有32×32的大小,那么在模式14中,参考像素距离当前块最右列的横向距离为14。使用图1B所示的九个定向模式的角度,所属领域的技术人员将了解图1B中未图示的其他24个定向模式的角度可以通过使用帧内预测模式100的对称特征来确定。
在HEVC中,角度表(本文中表示为angTable)包括可以用在帧内预测中的九个条目,而每个条目的值可以预定义。在HEVC软件模型(HM)的当前的设计中,条目值被定义为:
angTable={0, 2, 5, 9, 13, 17, 21, 26, 32}. (1)
可以认为,例如,在图1B所示的32×32的块中,等式(1)中angTable的每一条目的值可以对应于当前块的最右列与定向模式中的参考像素之间的距离。因此,所述条目是根据定向模式,而不是基于任何数学推导进行配置的。使用等式(1)中的angTable,可以使用加法、移位和乘法运算来生成或者计算所有33个定向模式的预测像素,从而提供性能与复杂度之间的平衡。
图2图示了UIP帧内预测方案200,通过使用左邻近块和上邻近块中的参考像素可以实施该方案来预测当前块中的像素。如果纹理特征具有图2所示的呈角度θ的线210,那么线210可以通过两个参考像素230和240(可以是彼此邻近或并不彼此邻近)而达到像素220。位于线210上的虚构像素250可以被放置在参考像素230与240之间。在这种情况下,可以通过加权预测方法来计算表示为P的像素220的预测值。预测值P可以根据像素230和240的值生成,像素230和240分别表示为Pl和Pr。例如,可以使用以下公式来计算P:
wr=1-wl (3)
P=wlPl+wrPr (4)
其中θe是像素230的角度,可以被视作左起始点,而θs是像素240的角度,可以被视作右结束点。表示为wl的一个加权因子可以根据像素230与250之间的距离来定义,而表示为wr的另一个加权因子可以根据像素240与250之间的距离来定义。假定像素240与220之间的垂直距离是整数L,那么像素240与230之间的横向距离是L(cot(θs)-cot(θe))、而像素240与250之间的横向距离是L(cot(θs)-cot(θ))。应注意wr是可以移除的,因为它可以轻易地被(1-wl)取代。由θs和θe界定的方向可以由图1A所示的33个定向模式中的任意两个邻近方向表示。在当前的HM设计中,等式(1)中的angTable可以用于确定最佳定向模式,而在该过程中可以使用对应于不同angTable条目的不同角度(即,不同的θ值)。另外,在等式(1)中对应于angTable的每一条目的角度(表示为θi),其中i=1、2、…、9是条目标号,可以记为:
θi=arccot(angTable[i]/32) (5)
在等式(5)中,使用分母32是因为角度的精确度是1/32。可以将更高精确度与对应调节过的angTable条目一起使用。例如,如果精确度为1/64,那么可以使用分母64,并且可以相应地对angTable条目进行调节。
然而,在当前设计中可能仍然存在与angTable相关联的争议或问题。例如,angTable的条目的对应角度可以不是针对视频编码进行优化的。如图1A和图1B所示,帧内预测模式的分布示出了垂直方向和水平方向附近最大的方向密度(即,方向之间的角距),针对这两个方向发信号通知最高编码优先级。然而,对角的方向密度相对稀疏。实际上,从90度到45度,邻近方向之间的八个角距是3.6、5.3、6.8、6.4、5.9、5.3、5.8、5.9度。在这种情况下,模式7(45.0度)与模式26(50.9度)之间的角距大于模式21(56.7度)与模式17(62.0度)之间的角距。因此,对于具有变化的对角纹理的图像或视频序列而言,编码性能可能下降,例如,图3所示的篮球训练序列。篮球训练序列(具有832x480的分辨率)是HM的级别C中的标准测试序列之一。在此序列中,篮球场表示场地线等的对角纹理。实际上,在天然的或者其他图像/视频中,具有线特征的纹理在接近于对角线方向,例如,模式26和模式7,可能比在其他方向,例如,模式6和模式25,更容易产生。因此,可能需要赋予对角模式较高的优先级。由于定向模式可能已经是固定的,因此可能需要对angTable条目进行修改以处理对角纹理的编码低效问题。最后,等式(1)中的angTable可能已经在特设的方式下生成。
本文所公开的是用于在视频编码中通过修改angTable来改进帧内预测的***和方法。在一项实施例中,本发明提供了基于均匀概率模型的新angTable。可以使用本文中所公开的数学模型和数学推导来获得新angTable中的部分条目。因此,对于不同的应用,可以获得不同的angTable条目以优化编码性能。在HEVC帧内预测方案的一项实施例中,angTable条目被确定为{0,2,5,9,13,18,23,28,32}。在块的帧内预测中,第一方法是仅使用新表,而第二方法是基于左邻近块和上邻近块的帧内预测模式选择新的angTable或原始的angTable。所公开的angTable的实施例可以改进包括多种纹理的视频序列的编码增益,所述多种纹理例如,对角线特征。
图4图示了UIP方案400的一项实施例,该方案可以在视频编码器或解码器(本文中通常称作编解码器)中实施。UIP方案400的一些方面可以与UIP方案200相同或者类似,为了清晰起见,将主要进一步描述不同方面。本文中图4可以用于图示如何以数学方法获得或者确定angTable的条目。在UIP方案400中,θ位于角度区间[θ01]中,其中θ0是下限角,而θ1是上限角。应注意下限角和/或上限角可以具有任何值,这些值与定向帧内预测模式的角度可以是相同的或者不同的。
在一项实施例中,使用以下等式将区间[θ01]划分为多个等间隔的子区间:
θ(n)=θ0+n·Δθ对于n=1、2、…、N。 (7)
其中N表示多个子区间的数目(N可能较大或者无穷大),n表示范围从1到N的子区间指数,Δθ表示每个子区间的角宽,而θ(n)表示第n个子区间的等效角度。
基于等式(2),可以使用以下等式计算出对应于第n个子区间的加权因子:
对于n=1、2、…、N。 (8)
另外,可以使用以下等式计算N个子区间的平均加权因子wl和wr
对于n=1、2、…、N。 (9)
wr=1-wl (10)
在等式(9)中使用的平均算法(表示为avg)可以取决于wl(n)的分布模式。
在一项实施例中,由θ(n)定义的纹理特征的方向可以位于角度区间[θ01]之间的任何地方,其中θ(n)为任何中间角度的可能性相同。换言之,θ(n)对应于θ0与θ1之间的均匀分布。在这种情况下,平均加权因子wl可以按照如下等式计算:
特别是,当N→∞时,可以通过以下定积分来计算wl
基于等式(2)和等式(12)的类似形式,应注意角度区间[θ01]可以具有等效平均预测角(EAPA,也表示为θequ),其计算方法如下:
因此,我们具有等式:
以及
虽然使用了θ0与θ1之间的θ(n)的均匀分布作为一个实例,但是应理解θ(n)的其他概率分布,例如,正态分布或高斯分布也是可能的。根据所选择的分布模型,可以确定对应的cot(θequ)值,该值可以不同于等式(13)。
图5图示了具有的角度范围按弧度为[π/4,π/2]或按角度为[45,90]的扇形500的一项实施例。由于针对亮度组分在HEVC中可以有多达33个定向帧内预测模式,所以π/4弧度扇形可以对应于33个模式中的九个模式。在一项实施例中,赋予π/4和π/2角度相对较高的优先级,并且这两个度数对应于所公开的angTable中的九个条目中的两个条目。另外七个条目可以通过将扇形500分为七个区间获得,其中每个区间的角宽可以是相等的或者不等的。注意如果使用了不同数目的定向帧内预测模式,例如,在不同的视频编码标准中,那么角度范围可以被分为任何其他适当数目的区间。
如果扇形500被等分为七个区间,那么每个区间的宽度可以表示为:θ_int=(π/2-π/4)/7=π/28。另外,第i个角区间,其中i=0、1、…、6,具有的下限角度为π/4+i*θ_int(即,θ0=π/4+i*θ_int),上限角度为π/4+(i+1)*θ_int(即,θ1=π/4+(i+1)*θ_int)。可以计算出表示为θequ,i的第i个角区间的EAPA。新angTable条目的对应角度随后作为(π/2,θequ,6equ,5,…,θequ,0,π/4)获得。
在一项实施例中,表示为angTable2[7-i],其中i=0、1、…、6的所公开的angTable的中间七个条目可以具有值:
angTable2[7-i]=round(cot(θequ,i)*32) (15)
基于等式(13)和(15),可以计算出对应于中间七个区间的每一个区间的EAPA。例如,如果i=0,那么
对于另一实例,如果i=2,那么
angTable2[6]=round(cot(θequ,2)*32)
=round(0.551*32)
=18 (19)
使用等式(13)和(15),可以将所公开的angTable的一项实施例确定为:
angTable2={0, 2, 5, 9, 13, 18, 23, 29, 32} (20)
实际上,angTable中修改的条目改变了赋予某些定向模式,例如,垂直模式、水平模式以及对角模式的编码优先级,并且同时赋予其他方向均等的概率。应理解,修改的angTable可以与当前定义的帧内预测模式一起工作。因此,无需对帧内预测模式进行修改。虽然,如果需要的话仍可以对帧内预测模式进行修改,例如,为了适应不同的视频编码标准。在这种情况下,可以在本发明的范围内对所述公开的angTable的实施例类似地进行配置。等式(13)和等式(15)是通用等式,因此无论区间是如何在扇形中布置的,这些等式都可以用于计算一组角度表条目。
在使用中,发现角度π/4的编码优先级可能低于角度π/2的编码优先级。因此,为了获得潜在较高的编码增益,也可以将图5所示的扇形500修改为图6所示的扇形600,其中在角度π/4附近扣除角度范围Δstep,其中Δstep具有预配置值(例如,大于零并且小于π/4)。如果在扇形600中将角度范围[π/4+Δstep,π/2]等分为七个区间,那么每个区间的宽度可以调节为:θ_int=(π/2-(π/4+Δstep))/7.另外,第i个角度区间,其中i=0、1、…、6,具有的下限角度为π/4+i*θ_int(即,θ0=π/4+i*θ_int),上限角度为π/4+(i+1)*θ(即,θ1=π/4+(i+1)*θ_int)。可以计算出表示为θequ,i的第i个角区间的EAPA。新angTable条目的对应角度随后作为(π/2,θequ,6equ,5,…,θequ,0,π/4)获得。
类似于参考图5的描述,可以在并入Δstep之后计算出对应于所述中间七个区间的每一个区间的EAPA。例如,基于等式(13)和(15),可以在适当的范围内使用Δstep值来确定不同的角度表。在表1中示出了一些示例性Δstep值以及它们对应的角度表。
Δstep 角度表条目
0 {0,2,5,9,13,18,23,29,32}
0.003 {0,2,5,9,13,18,23,28,32}
0.007 {0,2,5,9,13,18,22,28,32}
0.008 {0,2,5,9,13,17,22,28,32}
0.022 {0,2,5,9,13,17,22,27,32}
0.034 {0,2,5,9,13,17,21,27,32}
0.042 {0,2,5,9,12,17,21,26,32}
0.046 {0,2,5,9,12,16,21,26,32}
表1:示例性Δstep值以及它们对应的角度表条目。
为了确定Δstep的最佳值,可以对使用不同的Δstep构建的angTable进行模拟测试。例如,模拟发现等式(21)中的angTable与等式(20)中的表相比,针对具有多种纹理的视频的作用更大。
angTable={0, 2, 5, 9, 13, 18, 23, 28, 32}. (21)
虽然上文中将针对亮度组分的具有33个定向模式的HEVC帧内预测模式作为一个实例进行描述,但是应理解,根据块的大小和/或帧内预测方案,也可以使用任何其他数目的预测模式。另外,应注意,如果扇形600被等分为表示为K(K是大于1的整数)的不同数目的区间,那么仍然可以在本发明的范围内用预配置的Δstep值获得angTable条目。
就何时可以在帧内预测中使用所公开的angTable而言,可以有多种方法。在一项实施例中,视频编码器或解码器可以用于仅存储所公开的angTable。在这种情况下,所公开的angTable取代了用在HEVC中的原始angTable。在另一项实施例中,编解码器可以用于同时存储所公开的angTable以及原始的angTable。在这种情况下,可以在帧内预测中交替地使用原始的angTable或者新angTable。假定对当前的亮度块进行帧内预测,那么在其不具有任何左邻近块或上邻近块时,或者如果其含有参考像素的左邻近块和/或上邻近块的帧内预测模式是不可用的,或者如果它们的帧内预测模式中的至少一者接近于对角方向(例如,使用模式4、7、10、11、14、15、18、19、26、27或34),则可以使用新的angTable。如果不满足这些条件中的任一者,则可以使用原始的angTable。就色度块的帧内预测而言,如果对应的亮度预测模式接近于对角方向,则可以使用新的表。另外,色度预测可以配置成总是使用新的angTable。
在使用中,可以对所公开的lmDiv查阅表的实施例进行测试并且与HM锚节点(HManchor)进行比较。为了在引入新的angTable之后对编码性能进行评估,在所有帧内高效率(HE)以及所有帧内低复杂度(LC)配置下执行模拟。模拟结果包含针对颜色空间的三个组分(Y、U和V)的多个分辨率级别(级别A、B、C、D和E)上的Bjontegaard Delta(BD)率平均百分比,以及加密(Enc)和解密(Dec)时间。在模拟中,将使用多种公开方案的帧内预测的BD率与HM 4.0锚节点进行比较,HM 4.0锚节点使用angTable{0,2,5,9,13,17,21,26,32}。
在第一测试案例中,将仅使用angTable{0,2,5,9,13,18,23,28,32}的帧内预测与HM 4.0锚节点进行比较。表2示出了第一测试案例的结果,其表明示出的平均BD率没有发生改变或者稍微有所下降。例如,A、B、C、D和E级别的平均BD率在所有帧内HE中针对U组分下降了0.04%,针对V组分下降了0.02%。另外,在所有帧内HE中Enc时间减少了约1%,而Dec时间减少了约5%。
表2:第一测试案例结果与HM 4.0锚节点比较。
在第一测试案例中,针对篮球训练序列获得了更加重要的编码增益,篮球训练序列是级别C中的测试序列之一。表3示出了篮球训练序列与HM 4.0锚节点比较的模拟结果。在所有帧内HE中针对Y组分BD率降低了1.0%,而在所有帧内LC中针对Y组分BD率降低了0.9%。
表3:第一测试案例的篮球训练序列结果与HM 4.0锚节点比较。
在第一测试案例中,所有二十个测试序列中的八个测试序列呈现出编码损失。针对于所有帧内HE以及所有帧内LC而言,在PeopleOnStreet序列中发现最大编码损失分别为0.16%和0.18%。所有其他的编码损失都低于0.12%。第一案例确认了在编码对角纹理,例如,包含在篮球训练序列中的那些纹理时,原始angTable性能下降。
在第二测试案例中,替代性地使用了原始的angTable{0, 2, 5,9, 13, 17, 21,26, 32}和所公开的angTable{0,2,5,9,13,18,23,28,32}的帧内预测与HM 4.0锚节点进行比较。在第二测试案例中,使用新的angTable的条件是:当左色度块和/或上色度块的帧内预测模式不可用时,或者如果它们的模式中的一者为模式4、7、10、11、14、15、18、19、26、27或34。否则,就使用原始的angTable。对于帧内色度预测,仅使用新的表。表4示出了第二测试案例的结果,其表明平均BD率呈现出轻微的下降。例如,A、B、C、D和E级别的平均BD率在所有帧内HE中针对Y组分下降了0.04%,针对U组分下降了0.06%。另外,在所有帧内HE中Enc时间增加了约1%,而Dec时间减少了约5%。
表4:第二测试案例的结果与HM 4.0锚节点比较。
在第二测试案例中,如表5所示,针对篮球训练序列也获得了更加重要的编码增益。在所有帧内HE中针对Y组分BD率降低了0.9%,而在所有帧内LC中针对Y组分BD率降低了0.8%。在第二测试案例中,测试序列中的一者针对所有帧内HE和所有帧内LC呈现出0.06%的编码损失,而大多数其他序列具有与HM 4.0锚节点相同的性能。
表5:第二测试案例的篮球训练序列结果与HM 4.0锚节点比较。
图7图示了帧内预测方法700的一项实施例,其中可以使用angTable的实施例。方法700可以开始于步骤710,其中可以使用上文所描述的等式以数学方法获得多个整数。例如,可以使用等式(13)和(15)来获得整数。接下来,在步骤720中,所获得的整数可以存储在编解码器的存储器中。所述整数可以与其他预定义值(例如,针对HEVC UIP帧内编码方案的0和32)结合起来以形成angTable。一个或多个angTable可以存储在存储器中。在一些实施例中,两个angTable可以存储在存储器中,所述两个angTable包含以数学方法获得的angTable以及用于当前HM中的原始angTable的。
接下来,在步骤730中,可以使用一个或两个angTable来计算包含在图像帧或视频帧中的亮度块和/或色度块的预测块。在一项实施例中,仅一个以数学方法获得的angTable,例如,具有条目{0,2,5,9,13,18,23,28,32}的angTable用于所有亮度块和色度块的帧内预测。在一项替代性实施例中,两个angTable,例如,一个具有条目{0,2,5,9,13,18,23,28,32}以及另一个具有条目{0,2,5,9,13,17,21,26,32},可以替代地用于编码亮度块。编解码器中的处理器可以配置成使用原始的angTable,除非亮度块满足这些条件中的至少一个:亮度块不具有任何左邻近块、亮度块不具有任何上邻近块、亮度块的左邻近块不具有帧内预测模式、亮度块的上邻近块不具有帧内预测模式、左邻近块具有模式4、7、10、11、14、15、18、19、26、27以及34中的帧内预测模式,以及上邻近块具有模式4、7、10、11、14、15、18、19、26、27以及34中的帧内预测模式。此外,在一些实施例中,可以仅使用以数学方法获得的angTable(即使在编解码器中有两个angTable是可用的)对所有的色度块进行帧内预测。
接下来,在步骤740中,可以生成指示预测块与当前块(亮度或色度)之间差异的残余块并且对其进行编码。应理解,方法700可以仅包含用于完成视频编码的必要步骤的一部分,因此其他的步骤或过程,例如确定最佳定向帧内预测模式、残余块的变换、量化等可以在适当的地方并入到编码过程中。
图8图示了视频编码器800的一项实施例,在视频编码器800中可以使用所公开的angTable。视频编码器800可以包括按照图8所示进行布置的率失真优化(RDO)模块810、预测模块820、变换模块830、量化模块840、熵编码器850、去量化模块860、逆变换模块870以及重建模块880。在运行中,视频编码器800可以接收包括视频帧(或切片)序列的输入视频。本文中,帧可以指预测帧(P帧)、帧内编码帧(I帧),或者双向预测帧(B帧)中的任一者。类似地,切片可以指P切片、I切片,或者B切片中的任一者。
RDO模块810可以用于与一个或多个其他模块协作或者为一个或多个其他模块作出逻辑决策。例如,基于一个或多个先前编码的帧,RDO模块810可以确定一个被编码的当前帧(或切片)如何被分为多个编码单元(CU),以及一个CU如何被分为一个或多个预测单元(PU)以及变换单元(TU)。CU、PU和TU是用在HEVC中的块的不同类型。此外,RDO模块810可以确定当前帧是如何被预测的。可以通过帧间预测和/或帧内预测对当前帧进行预测。对于帧内预测,在HEVC中有多个可用的预测模式或方向(例如,针对Y组分的35个模式以及针对U或V组分的六个模式),并且可以通过RDO模块810来确定最佳模式。例如,RDO模块810可以针对每个预测模式来计算绝对误差之和(SAE),并且选择产生最小SAE的预测模式。
预测模块820可以利用帧间预测的参考帧或者帧内预测的当前帧中的参考像素。在一项实施例中,预测模块820配置成使用所公开的angTable计算来自输入视频的当前块的预测块。预测块包括多个预测样品,每个预测样品可以基于位于当前块的左邻近块和上邻近块(已进行解码)中的多个重建样品生成。
在生成预测块之后,可以从预测块中减去当前块,或者从当前块中减去预测块以生成残余块。可以将残余块送入变换模块830中,该模块可以将残余色度样品转化为变换系数的矩阵。所述变换可以是二维正交变换,例如离散余弦变换(DCT)。随后,变换系数的矩阵可以在被送入熵编码器850之前由量化模块840进行量化。量化模块840可以改变变换系数的标度并且将它们四舍五入为整数,从而减少非零变换系数的数目。因此,可以增大压缩比。量化变换系数可以由熵编码器850扫描并且编码为编码比特流。另外,为了协助色度块的连续编码,也可以将量化变换系数送入去量化模块860以恢复变换系数的原始标度。随后,逆变换模块870可以执行变换模块830的逆转,并且生成原始残余块的干扰型式。随后,可以将有损耗的残余块送入重建模块880,该模块可以针对未来色度块的帧内预测生成重建亮度样品和/或色度样品。如果需要,在重建样品用于帧内预测之前可以对重建样品进行滤波。
应注意,图8可能是视频编码器的简化的图示,因此其可能只包含视频编码器中呈现的部分模块。如同所属领域的技术人员所理解,其他模块(例如,滤波器、扫描仪,以及发射器)虽然未在图8中示出,但是也可以包含在内以协助视频编码。此外,根据编码方案,视频编码器中的一些模块可以被略过。例如,在某些视频内容的无损编码中,不允许任何信息损失,因此量化模块840以及去量化模块860可以被略过。又例如,如果直接对残余块进行编码而不将其转化为变换系数,那么变换模块830和逆变换模块870可以被略过。此外,在从编码器处进行传输之前,编码比特流可以配置成包含其他信息,例如视频分辨率、帧率、块分区信息(大小、坐标)、预测模式等,因此视频帧的编码序列可以由视频解码器适当地进行解码。
图9图示了视频解码器900的一项实施例,在视频解码器900中,所公开的angTable可以用于帧内预测。视频解码器900可以对应于视频编码器800,并且可以包括按照图9所示进行布置的熵解码器910、去量化模块920、逆变换模块930、预测模块940,以及重建模块950。在运行中,熵解码器910可以接收含有视频帧序列信息的编码比特流,该熵解码器可以将比特流解码成未压缩格式。可以生成量化变换系数的矩阵,随后该矩阵被送入去量化模块920,所述去量化模块920与图8中的去量化模块860相同或者类似。随后去量化模块920的输出可以被送入逆变换模块930,所述逆变换模块930可以将变换系数转化为残余块的残余值。此外,熵解码器910也可以对含有当前块预测模式(例如,定向帧内预测模式)的信息进行解码。基于预测模式,预测模块940可以生成当前块的预测块。
在一项实施例中,预测模块940配置成使用所公开的angTable针对当前色度块来计算帧内预测块。预测块包括多个预测样品,每个预测样品可以基于位于当前块的左邻近块和上邻近块(已进行解码)中的多个重建样品生成。在针对当前块生成预测块之后,重建模块950可以将残余色度块与预测块结合起来以生成重建块。此外,为了协助继续解码,重建块的一些样品也可以用作相同视频切片或帧内未来块的帧内预测的参考像素。
上述方案可以在任何通用计算机***上实施,例如计算机或特定网络部件,其具有足够的处理能力、存储资源以及网络吞吐能力来处理其上的必要工作量。图10图示了通用计算机***1000的示意图,其适用于实施本文本所公开的方法的一项或多项实施例,例如,帧内预测方法700、视频编码器800,以及视频解码器900。计算机***1000包括处理器1002(可以称作中央处理器单元或CPU),该处理器与包含以下项的存储装置进行通信:辅助存储器1004、只读存储器(ROM)1006、随机存取存储器(RAM)1008、发射器/接收器1010,以及输入/输出(I/O)装置1012。尽管处理器1002被图示为单个处理器,但是它并非受到此类限制而是可以包括多个处理器。处理器1002可以实施为一个或多个CPU芯片、核(例如,多核处理器)、现场可编程门阵列(FPGA)、专用集成电路(ASIC),和/或数字信号处理器(DSP),并且/或者可以是一个或多个ASIC的一部分。处理器1002可以用于实施本文所描述的方案中的任一个,例如帧内预测方法700、视频编码器800,以及视频解码器900。处理器1002可以使用硬件、软件或这两者来实施。
辅助存储器1004通常包括一个或多个磁盘驱动器或磁带驱动器,并且用于数据的非易失性存储,且在RAM 1008大小不足以保持所有工作数据的情况下用作溢流数据存储装置。辅助存储器1004可以用于存储程序,当选择执行这些程序时,所述程序将加载到RAM1008中。ROM 1006用于存储在程序执行期间读取的指令以及可能的数据。ROM 1006为非易失性存储装置,其存储容量相对于辅助存储器1004的较大存储容量而言通常较小。RAM1008用于存储易失性数据,还可能用于存储指令。对ROM 1006和RAM 1008二者的存取通常比对辅助存储器1004的存取快。辅助存储器1004、ROM 1006,和/或RAM 1008可以是非瞬时计算机可读媒体并且不包含瞬时传播的信号。辅助存储器1004、ROM 1006,或RAM 1008中的任何一个可以被称作存储器,或者这些模块可以被统称为存储器。辅助存储器1004、ROM1006,或RAM 1008中的任何一个可以用于存储本文所描述的angTable。处理器1002可以生成angTable并且将angTable存储在存储器中和/或从存储器中检索angTable。
发射器/接收器1010可以用作视频编解码器的输出和/或输入装置。例如,如果发射器/接收器1010作为发射器,那么它可以将数据发射到计算机***1000之外。如果发射器/接收器1010作为接收器,那么它可以将数据接收到计算机***1000中。发射器/接收器1010可以采取以下形式:调制解调器、调制解调器组、以太网卡、通用串行总线(USB)接口卡、串行接口、令牌环卡、光纤分布式数据接口(FDDI)卡、无线局域网络(WLAN)卡、码分多址接入(CDMA)等无线电收发器卡、全球移动通信***(GSM)、长期演进(LTE)、全球微波接入互操作性(WiMAX),和/或其他空中接口协议无线电收发器卡,以及其他熟知的网络装置。发射器/接收器1010可以使处理器1002与互联网或者一个或多个内联网进行通信。I/O装置1012可以包含视频监控器、液晶显示器(LCD)、触摸屏显示器,或者用于显示视频的其他类型的视频显示器,并且还可以包含用于采集视频的录像装置。I/O装置1012还可以包含一个或多个键盘、鼠标,或轨迹球,或者其他熟知的输入装置。
应理解,通过对可执行指令进行编程和/或将其加载到计算机***1000上,处理器1002、RAM 1008和ROM 1006中的至少一者会发生改变,从而将计算机***1000部分地变换为具有本发明所教示的新颖功能的特定的机器或设备,例如,视频编解码器。在电气工程和软件工程领域中的基本原理是通过将可执行软件加载到计算机中实施的功能可以通过熟知的设计规则转化为硬件实施。关于在软件还是硬件中实施一个概念的决定通常取决于对设计的稳定性以及待生产的单元数目的考虑,而不是取决于对涉及从软件领域转化到硬件领域的任何问题的考虑。通常,容易经常发生改变的设计可以优选地在软件中实施,这是因为硬件实施的再次旋压比软件设计的再次旋压更加昂贵。通常,将以较大体积生产的稳定的设计可以优选地在硬件中实施,例如在专用集成电路(ASIC)中实施,这是因为对于大规模生产,运行硬件实施比运行软件实施更加便宜。通常一种设计会以软件形式进行开发和测试,并且稍后由熟知的设计规则在专用集成电路中变换为等效的硬件实施,所述专用集成电路对软件的指令进行固线。特定的机器或设备采用与由新的ASIC控制的机器相同的方式,类似地,已进行编程的计算机和/或已加载有可执行指令的计算机可以被视作特定的机器或设备。
揭示了至少一项实施例,并且所属领域的技术人员对所述实施例和/或所述实施例的特征的变化、组合和/或修改在本发明的范围内。因组合、集成和/或省略所述实施例的特征而产生的替代性实施例也在本发明的范围内。在明确陈述数值范围或限制的情况下,应将这些表达范围或限制理解为包含属于明确陈述的范围或限制内的类似量值的重复范围或限制(例如,从大约1到大约10包含2、3、4等;大于0.10包含0.11、0.12、0.13等)。例如,每当揭示具有下限Rl和上限Ru的数值范围时,具体是揭示落入所述范围内的任何数字。具体而言,特别揭示所述范围内的以下数字:R=Rl+k*(Ru-Rl),其中k为从1%到100%范围内以1%递增的变量,即,k为1%、2%、3%、4%、5%、……、70%、71%、72%、……、95%、96%、97%、98%、99%或100%。此外,还特别揭示了如上文所定义的两个R数字定义的任何数值范围。除非另有说明,否则使用术语“约”是指随后数字的±10%。相对于权利要求的任一元素使用术语“任选地”意味着所述元素是需要的,或者所述元素是不需要的,两种替代方案均在所述权利要求的范围内。使用例如“包括”、“包含”和“具有”等范围较广术语应被理解为提供对例如“由……组成”、“基本上由……组成”以及“大体上由……组成”等范围较窄术语的支持。因此,保护范围不受上文所陈述的描述限制,而是由所附权利要求书界定,所述范围包含所附权利要求书的标的物的所有均等物。每项和每个权利要求作为进一步揭示内容并入说明书中,并且所附权利要求书是本发明的实施例。本发明中的参考的论述并不是承认其为现有技术,尤其是具有在本申请案的在先申请优先权日期之后的公开日期的任何参考。本发明中所引用的所有专利、专利申请案和公开案的揭示内容特此以引用的方式并入本文中,其提供补充本发明的示范性、程序性或其他细节。
虽然本发明中已提供若干项实施例,但是应理解,在不脱离本发明的精神或范围的前提下,所公开的***和方法可以按许多其他特定形式来体现。本发明的实例应被视为说明性的而非限制性的,并且本发明不局限于本文所给出的细节。例如,各种元件或组件可以在另一***中组合或集成,或者某些特征可以被省略或不实施。
此外,在不脱离本发明的范围的情况下,各种实施例中描述和说明为离散或单独的技术、***、子***和方法可以与其他***、模块、技术或方法组合或整合。以彼此耦合或直接耦合或彼此通信方式示出或论述的其他项目也可以以电方式、机械方式或其他方式通过一些接口、装置或中间组件间接地耦合或通信。其他变化、替代和改变的实例可以由所属领域的技术人员确定,并且可以在不脱离本文本所揭示的范围和精神的情况下作出。

Claims (24)

1.一种帧内预测的方法,所述方法包括计算亮度块的预测块,其中计算所述预测块包含使用多个定向帧内预测模式以及使用包括多个条目的角度表angTable,并且其中每个条目的值是通过数学推导确定的;
所述数学推导包括计算角度区间的加权因子,其中计算所述加权因子包括对包含在所述角度区间内的多个子区间的加权因子进行平均;
其中确定至少一个条目值包括:
确定所述角度区间的下限角θ0
确定所述角度区间的上限角θ1
计算ln(sin(θ1))-ln(sin(θ0));
计算所述角度区间的角宽;以及
用所述角宽整除ln(sin(θ1))-ln(sin(θ0))获得等效平均预测角EAPA的余切值,其中所述角度区间是由所述多个定向帧内预测模式覆盖的角度范围的一部分;以及
基于所述EAPA计算至少一个所述条目值,包括用所述EAPA的余切值乘以32再四舍五入取整得到所述条目值;
所述EAPA是在所述加权因子为平均加权因子时计算得到的角。
2.根据权利要求1所述的方法,其中所述亮度块是视频帧的一部分,其中将所述预测块从所述亮度块中减去以生成残余块,其中所述残余块进行变换、量化并且熵编码以生成输出比特流。
3.根据权利要求1所述的方法,其进一步包括:
计算所述预测块与所述亮度块之间的差值以生成残余块;
对所述残余块进行变换以生成多个变换系数;
对所述多个变换系数进行量化以生成多个量化变换系数;以及
对所述多个量化变换系数的至少一部分进行熵编码以生成编码比特流。
4.根据权利要求1所述的方法,其中所述下限角是基于大于零且小于π/4的预配置角宽确定的,所述上限角是基于大于零且小于π/4的预配置角宽确定的,而所述EAPA在角度范围[π/4+Δstep,π/2]的第i个角度区间中,其中Δstep表示大于零且小于π/4的预配置角宽。
5.根据权利要求1所述的方法,其中所述定向帧内预测模式的数目是33个。
6.根据权利要求1所述的方法,其中所述角度范围包括多个角度区间,所述多个角度区间包含所述角度区间。
7.根据权利要求6所述的方法,其中每个角度区间的角宽相等。
8.根据权利要求1所述的方法,其中确定K个条目值包括计算
针对整数i=0、1、…、K-1,
θ0=(π/4+i*(π/4-Δstep))/K,
θ1=(π/4+(i+1)*(π/4-Δstep))/K,以及
其中θequ,i表示角度范围[π/4+Δstep,π/2]的第i个角度区间中的等效平均预测角(EAPA),其中Δstep表示大于零且小于π/4的预配置角宽,其中所述角度范围由所述多个定向帧内预测模式覆盖,并且其中K是大于1的整数。
9.根据权利要求8所述的方法,其中所述多个条目的数目是九个,其中所述九个条目中的两个条目是零和32,其中K=7,并且其中表示为angTable2[7-i]的第(7-i)个条目是使用以下公式计算的:
angTable2[7-i]=round(cot(θequ,i)*32)。
10.根据权利要求1所述的方法,其中所述多个条目的数目等于9,并且其中所述条目值是{0,2,5,9,13,18,23,28,32}、{0,2,5,9,13,18,23,29,32}、{0,2,5,9,13,18,22,28,32}、{0,2,5,9,13,17,22,27,32}、{0,2,5,9,13,17,21,27,32}、{0,2,5,9,12,17,21,26,32}或{0,2,5,9,12,16,21,26,32}。
11.根据权利要求1所述的方法,其进一步包括计算色度块的第二预测块,其中所述色度块对应于所述亮度块,并且其中计算所述第二预测块包含使用所述angTable。
12.根据权利要求5所述的方法,其中所述亮度块满足以下条件中的至少一个条件:
所述亮度块不具有任何左邻近块,
所述亮度块不具有任何上邻近块,
所述亮度块的左邻近块不具有帧内预测模式,
所述亮度块的上邻近块不具有帧内预测模式,
左邻近块具有模式4、7、10、11、14、15、18、19、26、27以及34中的帧内预测模式,以及
上邻近块具有模式4、7、10、11、14、15、18、19、26、27以及34中的帧内预测模式。
13.一种用于帧内预测的设备,其包括:
一个存储器,其用于存储包括多个条目的角度表angTable,其中每个条目的值是通过数学推导确定的;以及
一个处理器,其用于使用多个定向帧内预测模式以及所述angTable来计算亮度块的预测块;
所述数学推导包括计算角度区间的加权因子,其中计算所述加权因子包括对包含在所述角度区间内的多个子区间的加权因子进行平均;
其中确定至少一个条目值包括:
确定所述角度区间的下限角θ0
确定所述角度区间的上限角θ1
计算ln(sin(θ1))-ln(sin(θ0));
计算所述角度区间的角宽;以及
用所述角宽整除ln(sin(θ1))-ln(sin(θ0))获得等效平均预测角EAPA的余切值,其中所述角度区间是由所述多个定向帧内预测模式覆盖的角度范围的一部分;以及
基于所述EAPA计算至少一个所述条目值,包括用所述EAPA的余切值乘以32再四舍五入取整得到所述条目值;
所述EAPA是在所述加权因子为平均加权因子时计算得到的角。
14.根据权利要求13所述的设备,其中所述定向帧内预测模式的数目是33个。
15.根据权利要求13所述的设备,其中所述角度范围包括多个角度区间,所述多个角度区间包含所述角度区间。
16.根据权利要求15所述的设备,其中每个角度区间的角宽相等。
17.根据权利要求13所述的设备,其中确定K个条目值包括计算
针对整数i=0、1、…、K-1,
θ0=(π/4+i*(π/4-Δstep))/K,
θ1=(π/4+(i+1)*(π/4-Δstep))/K,以及
其中θequ,i表示角度范围[π/4+Δstep,π/2]的第i个角度区间中的等效平均预测角(EAPA),其中Δstep表示大于零且小于π/4的预配置角宽,其中所述角度范围由所述多个定向帧内预测模式覆盖,并且其中K是大于1的整数。
18.根据权利要求17所述的设备,其中所述多个条目的数目是九个,其中所述九个条目中的两个条目是零和32,其中K=7,并且其中表示为angTable2[7-i]的第(7-i)个条目是使用以下公式计算的:
angTable2[7-i]=round(cot(θequ,i)*32)。
19.根据权利要求13所述的设备,其中所述多个条目的数目等于9,并且其中所述条目值是{0,2,5,9,13,18,23,28,32}、{0,2,5,9,13,18,23,29,32}、{0,2,5,9,13,18,22,28,32}、{0,2,5,9,13,17,22,27,32}、{0,2,5,9,13,17,21,27,32}、{0,2,5,9,12,17,21,26,32}或{0,2,5,9,12,16,21,26,32}。
20.根据权利要求13所述的设备,其中所述处理器进一步用于计算色度块的第二预测块,其中所述色度块对应于所述亮度块,并且其中计算所述第二预测块包含使用所述angTable。
21.根据权利要求14所述的设备,其中所述存储器进一步用于存储具有条目值{0,2,5,9,13,17,21,26,32}的第二angTable,并且其中所述处理器进一步用于使用所述第二angTable,除非所述亮度块满足以下条件中的至少一个条件:
所述亮度块不具有任何左邻近块,
所述亮度块不具有任何上邻近块,
所述亮度块的左邻近块不具有帧内预测模式,
所述亮度块的上邻近块不具有帧内预测模式,
左邻近块具有模式4、7、10、11、14、15、18、19、26、27以及34中的帧内预测模式,以及
上邻近块具有模式4、7、10、11、14、15、18、19、26、27以及34中的帧内预测模式。
22.一种帧内预测的方法,其包括:
以数学方法获得多个整数;
将所述多个整数存储在存储器中;以及
计算亮度块的预测块,其中计算所述预测块包含使用多个定向帧内预测模式以及所述多个整数;
其中以数学方法获得所述多个整数中的每一个整数包括计算ln(sin(θ1))-ln(sin(θ0)),其中θ0表示角度区间的下限角,其中θ1表示所述角度区间的上限角,并且其中所述角度区间是由所述多个定向帧内预测模式覆盖的角度范围的一部分;
其中确定至少一个条目值包括:
计算所述角度区间的角宽;
用所述角宽整除ln(sin(θ1))-ln(sin(θ0))获得等效平均预测角EAPA的余切值;以及
基于所述EAPA计算至少一个所述条目值,包括用所述EAPA的余切值乘以32再四舍五入取整得到所述条目值;
所述EAPA是在加权因子为平均加权因子时计算得到的角。
23.一种帧内预测的方法,所述方法包括计算亮度块和色度块中至少一者的预测块,其中计算所述预测块包含使用多个定向帧内预测模式以及使用包括多个条目的角度表angTable,并且其中所述angTable是从以下angTable的至少一个中选择出来的:
{0,2,5,9,13,18,23,28,32}、{0,2,5,9,13,18,23,29,32}、{0,2,5,9,13,18,22,28,32}、{0,2,5,9,13,17,22,27,32}、{0,2,5,9,13,17,21,27,32}、{0,2,5,9,12,17,21,26,32}和{0,2,5,9,12,16,21,26,32};
所述angTable根据预配置的Δstep确定,其中Δstep表示大于零且小于π/4的预配置角宽;
其中,所述angTable根据预配置的Δstep确定,具体包括,
确定角度区间的下限角θ0,所述θ0=π/4+i*(π/2-(π/4+Δstep))/7;
确定所述角度区间的上限角θ1,所述θ1=π/4+(i+1)*(π/2-(π/4+Δstep))/7;
计算ln(sin(θ1))-ln(sin(θ0));
计算所述角度区间的角宽;以及
用所述角宽整除ln(sin(θ1))-ln(sin(θ0))获得等效平均预测角EAPA的余切值cot(θequ,i),其中所述角度区间是由所述多个定向帧内预测模式覆盖的角度范围的一部分,θequ,i表示角度范围[π/4+Δstep,π/2]的第i个角度区间中的等效平均预测角;以及
基于所述EAPA计算至少一个条目值,包括用所述EAPA的余切值乘以32再四舍五入取整得到所述angTable的条目值。
24.根据权利要求23所述的方法,其进一步包括:
使用计算出的所述亮度块和所述色度块中至少一者的预测块的结果来对视频帧进行编码。
CN201280054317.2A 2011-11-07 2012-11-06 用于改进帧内预测的新的角度表的方法和装置 Active CN104247422B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201161556511P 2011-11-07 2011-11-07
USUS61/556,511 2011-11-07
US61/556,511 2011-11-07
PCT/US2012/063747 WO2013070629A1 (en) 2011-11-07 2012-11-06 New angular table for improving intra prediction

Publications (2)

Publication Number Publication Date
CN104247422A CN104247422A (zh) 2014-12-24
CN104247422B true CN104247422B (zh) 2018-09-11

Family

ID=47553337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280054317.2A Active CN104247422B (zh) 2011-11-07 2012-11-06 用于改进帧内预测的新的角度表的方法和装置

Country Status (3)

Country Link
US (1) US9344715B2 (zh)
CN (1) CN104247422B (zh)
WO (1) WO2013070629A1 (zh)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2777258B1 (en) * 2011-11-04 2017-01-11 Huawei Technologies Co., Ltd. Binarization of prediction residuals for lossless video coding
KR101654814B1 (ko) 2012-09-28 2016-09-22 브이아이디 스케일, 인크. 비디오 코딩에서 크로마 신호 향상을 위한 교차-평면 필터링
US9300964B2 (en) * 2013-01-24 2016-03-29 Sharp Kabushiki Kaisha Image decoding apparatus and image coding apparatus
US9736487B2 (en) * 2013-03-26 2017-08-15 Mediatek Inc. Method of cross color intra prediction
US10003792B2 (en) 2013-05-27 2018-06-19 Microsoft Technology Licensing, Llc Video encoder for images
US10136140B2 (en) 2014-03-17 2018-11-20 Microsoft Technology Licensing, Llc Encoder-side decisions for screen content encoding
EP3254463A4 (en) 2015-02-06 2018-02-21 Microsoft Technology Licensing, LLC Skipping evaluation stages during media encoding
US10038917B2 (en) * 2015-06-12 2018-07-31 Microsoft Technology Licensing, Llc Search strategies for intra-picture prediction modes
KR102570911B1 (ko) * 2015-07-08 2023-08-24 인터디지털 매디슨 페턴트 홀딩스 에스에이에스 교차 평면 필터링을 이용한 향상된 크로마 코딩
US10136132B2 (en) 2015-07-21 2018-11-20 Microsoft Technology Licensing, Llc Adaptive skip or zero block detection combined with transform size decision
CN115278236A (zh) 2015-08-28 2022-11-01 株式会社Kt 对图像进行解码或编码的方法和非暂态计算机可读介质
CA2998098C (en) * 2015-09-11 2023-05-02 Kt Corporation Method and device for processing video signal
CN105306953A (zh) * 2015-12-10 2016-02-03 腾讯科技(深圳)有限公司 图像编码方法和装置
CN106231318B (zh) * 2016-09-30 2020-04-28 浙江宇视科技有限公司 一种基于量化变换系数的视频加扰方法及装置
US20190089952A1 (en) * 2017-09-19 2019-03-21 Futurewei Technologies, Inc. Bidirectional Weighted Intra Prediction
US11611757B2 (en) * 2018-04-02 2023-03-21 Qualcomm Incorproated Position dependent intra prediction combination extended with angular modes
CN112042190B (zh) 2018-04-24 2024-01-23 三星电子株式会社 视频编码方法和装置以及视频解码方法和装置
US10284844B1 (en) * 2018-07-02 2019-05-07 Tencent America LLC Method and apparatus for video coding
US10404980B1 (en) * 2018-07-10 2019-09-03 Tencent America LLC Intra prediction with wide angle mode in video coding
US10630979B2 (en) * 2018-07-16 2020-04-21 Tencent America LLC Reference sample padding and filtering for intra prediction in video compression
CN110858903B (zh) * 2018-08-22 2022-07-12 华为技术有限公司 色度块预测方法及装置
CN110876061B (zh) * 2018-09-03 2022-10-11 华为技术有限公司 色度块预测方法及装置
CN109640087B (zh) * 2018-12-30 2022-12-09 深圳市网心科技有限公司 一种帧内预测模式判决方法、装置及设备
KR20210114961A (ko) 2019-01-02 2021-09-24 광동 오포 모바일 텔레커뮤니케이션즈 코포레이션 리미티드 예측 방향 결정 방법, 디코더 및 컴퓨터 저장 매체
EP3972258B1 (en) * 2019-06-25 2024-05-29 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Information processing method and device, apparatus, and storage medium
US11375220B2 (en) * 2019-11-27 2022-06-28 Tencent America LLC Method and apparatus for video decoding using a nominal directional mode and an angular offset
US11330266B2 (en) * 2020-05-18 2022-05-10 Tencent America LLC Signaling method for chroma intra prediction mode
US11595644B2 (en) 2020-10-01 2023-02-28 Tencent America LLC Method and apparatus for offset in video filtering
WO2022116317A1 (zh) * 2020-12-03 2022-06-09 Oppo广东移动通信有限公司 帧内预测方法、编码器、解码器以及存储介质
CN115550645A (zh) * 2022-12-02 2022-12-30 杭州未名信科科技有限公司 帧内预测模式的确定方法、装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1859573A (zh) * 2005-10-11 2006-11-08 华为技术有限公司 帧内预测编码方法及其***
CN1984341A (zh) * 2005-12-12 2007-06-20 三星电子株式会社 用于图像的帧内预测编码和解码的方法以及装置
CN101523917A (zh) * 2006-09-29 2009-09-02 汤姆逊许可证公司 几何帧内预测
CN101682781A (zh) * 2008-01-18 2010-03-24 松下电器产业株式会社 图像编码方法以及图像解码方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7386048B2 (en) * 2002-05-28 2008-06-10 Sharp Laboratories Of America, Inc. Methods and systems for image intra-prediction mode organization
JP4542447B2 (ja) * 2005-02-18 2010-09-15 株式会社日立製作所 画像の符号化/復号化装置、符号化/復号化プログラム及び符号化/復号化方法
US8902978B2 (en) * 2010-05-30 2014-12-02 Lg Electronics Inc. Enhanced intra prediction mode signaling
CA3096445C (en) * 2010-07-14 2022-02-22 Ntt Docomo, Inc. Low-complexity intra prediction for video coding
US9532058B2 (en) * 2011-06-03 2016-12-27 Qualcomm Incorporated Intra prediction mode coding with directional partitions
US8811760B2 (en) * 2011-10-25 2014-08-19 Mitsubishi Electric Research Laboratories, Inc. Coding images using intra prediction modes
US10645398B2 (en) * 2011-10-25 2020-05-05 Texas Instruments Incorporated Sample-based angular intra-prediction in video coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1859573A (zh) * 2005-10-11 2006-11-08 华为技术有限公司 帧内预测编码方法及其***
CN1984341A (zh) * 2005-12-12 2007-06-20 三星电子株式会社 用于图像的帧内预测编码和解码的方法以及装置
CN101523917A (zh) * 2006-09-29 2009-09-02 汤姆逊许可证公司 几何帧内预测
CN101682781A (zh) * 2008-01-18 2010-03-24 松下电器产业株式会社 图像编码方法以及图像解码方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Angular intra prediction and ADI simplification;Madhukar Budagavi;《Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11》;20100721;第1页摘要,第2页第3节、附图2 *

Also Published As

Publication number Publication date
WO2013070629A1 (en) 2013-05-16
CN104247422A (zh) 2014-12-24
US9344715B2 (en) 2016-05-17
US20130114696A1 (en) 2013-05-09

Similar Documents

Publication Publication Date Title
CN104247422B (zh) 用于改进帧内预测的新的角度表的方法和装置
CN103650496B (zh) 用于在hevc中编码的基于像素的帧内预测
CN104380741B (zh) 用于lm帧内预测的参考像素缩减
CN103959790B (zh) 高效视频编码中的预测残余的扫描
CN104185989B (zh) 用于帧内预测残差的二值化方案和hevc中无损编码中的改进帧内预测
CN104811714B (zh) 使用平面表达的增强帧内预测编码
CN104094597B (zh) 基于帧内预测的自适应变换方法及使用该方法的装置
CN103797800B (zh) 推导参考模式值以及编码和解码表示预测模式的信息
CN105657419B (zh) 图像编码装置及其方法和图像解码装置及其方法
CN103891281B (zh) 检测用于视频译码的相邻视频单元的可用性
CN107277514B (zh) 解码视频信号的方法
CN104718759B (zh) Lm模式的简化
CN104137546B (zh) 用信号发送用于视频译码的量化矩阵
CN106105198B (zh) 对视频数据译码的方法、装置以及计算机可读介质
CN110024392A (zh) 用于视频译码的低复杂度符号预测
CN104429076B (zh) 用于可缩放视频译码和3d视频译码的一般化残差预测
CN106170092A (zh) 用于无损编码的快速编码方法
CN104255033A (zh) 用于lm模式计算的简化查找表
CN104126303A (zh) 用于高效率视频译码的统一分割结构和信令方法
CN108141612A (zh) 用于编码和解码图像的装置和方法
JP2018113702A (ja) 画像符号化装置、動画像符号化方法、動画像復号装置、動画像復号方法、動画像符号化データ及び記録媒体
CN104205845A (zh) 具有统一位宽乘法器的lm模式
CN109729352A (zh) 确定仿射编码块的运动矢量的方法和装置
CN108353175A (zh) 使用系数引起的预测处理视频信号的方法和装置
CN108432249A (zh) 用于在显示流压缩(dsc)中计算失真的***和方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant