CN1795680B - 采用avc帧内预测以便对数字视频进行编码的方法和装置 - Google Patents

采用avc帧内预测以便对数字视频进行编码的方法和装置 Download PDF

Info

Publication number
CN1795680B
CN1795680B CN2004800069783A CN200480006978A CN1795680B CN 1795680 B CN1795680 B CN 1795680B CN 2004800069783 A CN2004800069783 A CN 2004800069783A CN 200480006978 A CN200480006978 A CN 200480006978A CN 1795680 B CN1795680 B CN 1795680B
Authority
CN
China
Prior art keywords
edge
mode
orientation histogram
directional information
distortion optimization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004800069783A
Other languages
English (en)
Other versions
CN1795680A (zh
Inventor
潘峰
林晓
苏山多·拉哈德贾
林庆帆
李政国
冯革楠
吴达军
吴思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agency for Science Technology and Research Singapore
Original Assignee
Agency for Science Technology and Research Singapore
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency for Science Technology and Research Singapore filed Critical Agency for Science Technology and Research Singapore
Publication of CN1795680A publication Critical patent/CN1795680A/zh
Application granted granted Critical
Publication of CN1795680B publication Critical patent/CN1795680B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种用于AVC帧内预测以便对包括有多个图像的数字视频进行编码的方法(400)和装置。该方法包括以下步骤:为数字图像每一个帧内编码块生成边缘方向信息(410);根据所生成的边缘方向信息选择(420)最有可能的帧内预测模式以便进行率失真优化。可通过给数字图像至少应用一个边缘算子来产生上述的边缘方向信息。可用边缘方向直方图来累加编码块内15个方向上像素的幅值。该方法可进一步包括以下步骤:用所选择的最有可能的帧内预测模式来对数字图像的一个块进行帧内编码(430)。

Description

采用AVC帧内预测以便对数字视频进行编码的方法和装置
技术领域
本发明总的来讲涉及数字视频的处理,特别是数字视频的编码和压缩。
背景技术
为了获得最高的编码效率,高级视频编码(AVC)采用率失真优化(RDO)技术来获得最佳的编码结果,即编码质量最好同时所形成的数据位最小。高级视频编码包括AVC、H.264、MPEG-4Part 10以及JVT。有关AVC的详细信息请参见2002年7月22-26日奥地利克拉根福(Klagenfurt)“联合视频规范的联合最终委员会草案(JFCD)”中的ITU-T录制H.264|ISO/IEC14496-10AVC。为了获得RDO,编码器会用所有的模式组合来对视频进行完全编码。这种模式的组合包括不同的帧内和帧间预测模式。结果,AVC中视频编码的复杂性和计算量都大大增加,因此在实际应用中例如在视频通讯中现有的硬件***很难实现。
现有的报道可以看到人们在AVC视频编码运动估计的快速算法方面付出了诸多的努力。这可参见,Xiang Li和Guowei Wu于2002年12月5-13日在日本淡路岛召开的JVT-F011第6次会议上发表的“快速整数像素运动估计(Fast Integer Pixel Motion Estimation)”,Zhibo Chen、PengZhou和Yun He于2002年12月5-13日在日本淡路岛召开的JVT-F017第6次会议上发表的“快速整数像素分数像素运动估计(Fast Integer Pel andFractional Pel Motion Estimation for JVT)”,以及HyeYeon CheongTourapis、Alexis Michael Tourapis和Pankaj Topiwala于2002年10月9-17日在瑞士Geneva召开的JVT-E023第5次会议上发表的“在JVT编码中快速运动估计(Fast Motion Estimation within the JVT Codec)”。然而,现在还没有关于AVC帧内预测快速算法的报道。
帧内编码所指的是只利用视频图像中的空间冗余的情况。所形成的图像被称为I图像。通常来讲,I图像由图像中所有宏块的直接转换而编码形成,其相对于帧间编码来说会产生更大量的数据位。为了提高帧内编码的效率,在一给定图像中相邻宏块之间的空间关联要在AVC处理中被利用。相关宏块可从周围的宏块预测出来。对实际的宏块与预测宏块之间的差别进行编码。
如果宏块采用帧内模式编码,预测块则根据前面已编码并重建的块形成。对于亮度分量来说,帧内预测可用于每一个4×4子块或者是16×16宏块。对4×4的亮度块来说有九个预测模式,对于16×16的亮度块来说则有4个预测模式。对于色度分量来说,可将四个预测模式用于两个8×8的色度块(U和V)上。对U和V来说,所形成的预测模式应当是一样的。
图1所示为用于4×4亮度块100的帧内预测,其中像素a至p为准备预测的像素,像素A到I为预测时可获得的毗邻像素。如果预测模式选择为0,那么像素a、e、i和m就根据毗邻像素A预测出来,像素b、f、j和n就根据毗邻像素B预测出来,如此重复。除了图1所示的8个方向预测模式150之外,还有一个第9预测模式,即DC预测模式或者是AVC中的模式2。
还有,AVC视频编码是基于率失真优化原理进行的,因此编码器必须用所有的模式组合来对帧内编码块进行编码,并选择一个模式以给出最佳的RDO。在AVC帧内预测结构中,用于宏块中亮度块及色度块的模式组合的数目为M8X(M4X16+M16),其中M8、M4和M6分别表示8×8色度块、4×4亮度块以及16×16亮度块的模式数目。由此,对于一个宏块来说,必须在确定出最佳RDO之前要进行592次RDO计算。结果,编码器的复杂性和计算量就非常大。
发明内容
本发明的一个方面是提供一种AVC帧内预测以便对包括多个图像的数字视频进行编码的方法。该方法包括以下步骤:为数字图像每一个帧内编码块生成边缘方向信息;根据所生成的边缘方向信息选择最有可能的帧内预测模式以便进行率失真优化。
该边缘方向信息可通过给数字图像至少应用一个边缘算子来产生。除了数字图像亮度和色度分量的边界像素之外,该边缘算子可应用到每一个亮度和色度像素,该方法进一步包括以下步骤:确定某一像素边缘矢量的幅值和角度。边缘方向信息可包括计算出的每一个帧内编码块中所有像素的边缘方向直方图。该边缘方向直方图可用于4×4亮度块;预测模式可以包括8个方向预测模式以及一个DC预测模式。该边缘方向直方图用于16×16亮度块和8×8编码块;预测模式可包括2个方向预测模式、一个平面预测模式以及一个DC预测模式。
该边缘方向直方图可用来总合编码块内相同方向上像素的幅值。
该方法可进一步包括以下步骤:如果当前RDO模式计算中非零系数的数目超过前次RDO模式计算中非零系数的数目,那么就终止RDO模式计算并丢弃当前的RDO模式。
该方法可进一步包括以下步骤:用所选择的最有可能的帧内预测模式来对数字图像的一个块进行帧内编码。
本发明的另一个方面是提供一种采用AVC帧内预测以便对包括多个图像的数字视频进行编码的装置。该装置包括:用来为数字图像每一个帧内编码块生成边缘方向信息的设备;以及根据所生成的边缘方向信息选择最有可能的帧内预测模式以便进行率失真优化的设备。本发明的其它方面在实施上与上述方法一样。
附图说明
图1是4×4亮度块的一例帧内预测;
图2是4×4亮度块的一例边缘方向直方图;
图3是帧内8×8和16×16预测模式的方向;
图4是AVC帧内预测以便对包括有多个图像的数字视频进行编码的方法的高级流程图;以及
图5是本发明实施例可实际应用的通用计算机的方块图。
优选实施例
本发明公开了一种用于AVC帧内预测以便对包括有多个图像的数字视频进行编码的方法、装置和计算机程序产品。尽管这里仅公开了少量的几个实施例,但本领域技术人员都明白在不脱离本发明范围和构思的条件下还能得到许多变化和/或替换形式。在其它的举例中,省略了本领域技术人员所公知的那些细节以便使本发明更加清楚。
本发明的实施例提供了一种用于AVC帧内预测的、基于局部边缘方向信息的快速判定算法,其减少了帧内预测的计算量。根据所预测图像块内的边缘信息,可为每个图像块生成一个局部边缘方向信息、边缘方向场或者是其它形式的边缘方向信息。根据该边缘方向信息,就能通过一个机制来选取少量的一些最有可能的帧内预测模式来进行率失真优化计算。也就是说,通过利用图像边缘图所得到的边缘方向直方图,就能选取出少量的一些最有可能的帧内预测模式来进行RDO计算。因此,这种快速判定算法大大提高了帧内编码的速度。沿着局部边缘方向的像素通常都具有相近的值(这包括亮度和色度分量)。因此,如果采用那些与某一边缘在同一方向的毗邻像素来对这些像素预测就可以获得一个好的预测。
本发明的实施例具有以下一个或多个特征:用图像块(4×4、8×8、16×16或者是其它大小的图像块)内的边缘方向信息来引导帧内预测程序;
可将边缘方向直方图用作局部边缘方向信息以便引导帧内预测程序;
边缘方向场可用作局部边缘方向信息以便引导帧内预测程序。
图像块内其它形式的边缘方向信息可用作局部边缘方向信息以便引导帧内预测程序;
具有最大边缘强度的一个边缘方向可用作率失真优化计算的最佳备选方向;
具有较大边缘强度的两个或多个边缘方向可用作率失真优化计算的优选备选方向;
根据整数转换和折线扫描后非零系数的数目来更早地终止RDO模式计算;以及
根据整数转换和折线扫描后零的长度来更早地终止RDO模式计算。
现在有许多方法来获取局部边缘方向信息,如边缘方向直方图(参见Rafael C.Gonzalez,Richard E.Woods在2002年Prentice Hall第P572页上发表的“Digital image processing(数字图像处理)”)、方向场(参见A.M.Bazen和S.H.Gerez在2002年7月IEEE Transactions on PatternAnalysis and Machine Intelligence第24卷第905到919页上发表的“Systematic methods for the computation of the directional fieldsand singular points of fingerprints(用来计算方向场和指纹特征点的***方法)”)等。本发明的快速帧内预测算法可基于边缘方向直方图和方向场来实施,实施结果的好坏通过下面参数的结果对比出来:时间上的节约,2003年12月19日草案第4版的运动估计评估表中JVT测试模型Ad HocGroup所推荐的所有序列的平均PSNR及码率。基于边缘方向直方图的方案提供更优的性能。因此,这里所述的模式判定方案基于的是边缘方向直方图。
边缘图
为了获取与所预测帧内编码块毗邻的边缘信息,可将一个边缘算子如Sobel边缘算子加到一帧内图像上以产生边缘图。然后将帧内图像中的每一个像素都与该边缘图中的一个元素相关联,其中的元素是包含了其边缘方向和幅值的边缘矢量。在进行帧内预测之前,先由该原始图像生成边缘图。
边缘算子具有两个卷积积分核心。图像中的每一个像素均与这两个卷积积分核心卷积。其中一个对应于垂直方向的差度,另一个对应于水平方向的差度。除了图像亮度和色度边界的像素之外,该边缘算子可加到每一个亮度和色度像素上,这是因为该算子不可能加到那些没有8个环绕像素的像素上。对于像素pij来说,在亮度(或色度)图像中,对应的边缘矢量
Figure G2004800069783D00051
被定义为:
dxi,j=pi-1,j+1+2×pi,j+1+pi+1,j+1-pi-1,j-1-2×pi,j-1-pi+1,j-1
dyi,j=pi+1,j-1+2×pi+1,j+pi+1,j+1-pi-1,j-1-2×pi-1,j-pi-1,j+1    (1)
这里,dxi,j和dyi,j表示垂直和水平方向上的差度。因此,边缘适量的幅值可由下式确定:
Amp ( D → i , j ) = | dx i , j | + | dy i , j | - - - ( 2 )
事实上,采用dxi,j和dyi,j平方和的开方可获得更为精确的幅值。然而,在快速算法中,通常采用公式(2)。边缘的方向(度数)由下式确定:
在该算法的一个应用中,公式(3)并不必要,这是因为在AVC中预测只能在有限的一些方向上进行。事实上,可用简单的阈值技术来构建边缘方向直方图。
边缘方向直方图
为了减少RDO中备选预测模式的数目,需将编码块中同向的所有像素的幅值都加起来从而从该编码块的所有像素计算出一个边缘方向直方图。
4×4亮度块边缘方向直方图
在4×4亮度块的情况下,如图1所示有8个方向预测模式加上一个DC预测模式。任何两个相邻方向预测模式之间的边界都是相应两个方向的等分线。例如,模式1(0°)和模式8(26.6°)之间的边界就是13.3°的方向。注意,由于预测模式是圆对称,因此模式3和8相邻。每一个像素的模式均由其边缘方向
Figure G2004800069783D00063
确定。
因此,4×4亮度块的边缘方向直方图由下式确定:
Histo ( k ) = Σ ( m , n ) ∈ SET ( k ) Amp ( D → m , n ) ,
SET ( k ) ∈ { { ( i 0 , j 0 ) } , { ( i 1 , j 1 ) } , { ( i 3 , j 3 ) } , . . . , { ( i u , j u ) } . . . , { ( i 8 , j 8 ) } | Ang ( D → i u , j u ) ∈ a u } ,
while
a0=(-103.3°,-76.7]
a1=(-13.3°,13.3°]
a3=(35.8°,54.2°]
a4=(-35.8°,-54.2°]                (4)
a5=(-54.2°,-76.7°]
a6=(-35.g°,-13.3°]
a7=(54.2°,76.7°]
a8=(13.3°,35.8°]
注意,k=1,...,8,表示的是8个方向预测模式。此外,公式(4)中方向的角度为180°的周期角。图2所示是一例边缘方向直方图200。
16×16亮度和8×8色度块的边缘方向直方图
在16×16亮度和8×8色度块的情况下,只有两个方向预测模式,再加上一个平面预测模式和一个DC预测模式。因此,如图3所示,此时的边缘方向直方图基于三个方向300,即水平、垂直和对角线方向。
它们的边缘方向直方图按下式构建:
Histo ( k ) = Σ ( m , n ) ∈ SET ( k ) Amp ( D → m , n ) ,
SET ( k ) ∈ { { i 1 , j 1 } , . . . , { i n , j u } . . . , { i 3 , j 3 } | Ang ( D → i u , j u ) ∈ a u } ,
同时
                                       (5)
a1=[-22.25°,22.25°]
a2=(-∞,-67.5°)∪(67.5°,+∞,)
a3=Ω-(a1∪a2)
其中k=1表示水平方向预测模式,k=2表示垂直方向预测模式,k=3表示平面预测模式。
基于直方图的帧内预测的快速模式选择
如上所述,边缘方向直方图中每一个柱均是编码块中相同方向像素幅值的总和。最大幅值的柱表示该方向上边缘最强,其可用作最佳预测模式的方向。
4×4亮度块预测模式
所述快速算法不对4×4亮度块进行9模式RDO,其只根据边缘方向直方图选择那些在帧内4×4编码块预测中更有可能成为备选模式的方向预测模式。
由于沿着某一方向上的像素很有可能具有相同的数值,因此最佳预测模式很可能出现在幅值最大的边缘方向上,或者是那些靠近最大幅值的方向上。由此,直方图中幅值最大的柱以及与之相邻的两个柱都是最佳预测模式的备选方向。当边缘方向直方图中所有的柱都具有相同的幅值时,将DC模式选取为第四备选模式。
因此,对于每一个4×4亮度块来说,只有4种模式的RDO计算,而不是9种。
16×16亮度块预测模式
直方图中只有幅值最大的柱才能作为最佳预测模式的备选模式。与上述情况相同,DC模式也被作为下一个备选模式。
因此,对于16×16亮度块来说,只需进行2种模式的RDO计算,而不是4种。
8×8色度块预测模式
对于色度块来说,有两种不同的直方图,一个来自于分量U,一个来自于分量V。因此,直方图中这两个分量幅值最大的柱均是备选模式。与前述情况相同,RDO计算中也包括DC模式。注意,如果两个分量幅值最大的方向是同一个方向时,可能只有2个备选模式用于RDO计算,要不然就有3个。
因此,对于8×8色度块来说,需要进行2或3种模式的RDO计算,而不是4种。
表1综述根据边缘方向直方图选用于RDO计算的备选模式的数目。从表1可以看出,具有快速判定算法的编码器只进行132-198次RDO计算,这一数目大大少于当前AVC视频编码(592)次的计算数目。
表1.所选取的模式数目
  编码块尺寸   模式总数   所选择的模式数目
  亮度(Y)   4×4   9   4
  亮度(Y)   16×16   4   2
  色度(U,Y)   8×8   4   3或2*
*表示由两个色度块所选择的模式可以相同。
模式计算的提前终止
在帧内预测RDO模式的计算中,最耗时的部分是内容自适应二进制算术编码(CABAC)编码。还有,在CABAC编码之后所产生的数据位的数目主要取决于整数转换及折线扫描之后非零系数的数目。因此,在模式计算中采用一种简单的提前终止方案。即如果当前RDO模式计算中非零系数的数目超过前次RDO模式计算中非零系数的数目,那么就提前终止RDO模式计算并丢弃当前的RDO模式。
AVC帧内预测
图4是AVC帧内预测方法400的高级流程图。在步骤410中,为数字视频的一个数字图像的每一个帧内编码块生成边缘方向信息。在步骤420,根据所生成的边缘方向信息选择最有可能的帧内预测模式以便进行率失真优化。在步骤430,用所选择的最有可能的帧内预测模式来对数字图像的一个块进行帧内编码。该方法非常适于用硬件和/或软件来实现。在软件上,可用微处理器或计算机来执行计算机程序。例如,该软件可作为一个应用软件在人个计算机上执行,或者是嵌入到视频编码器中。
以计算机程序来实现
上述实施例的方法和装置可在图5中示意性展示的一计算机***500上实现。在实现形式上可以是软件,如计算机***500中执行的计算机程序,其用来指示计算机***500进行该实施例的方法。
该计算机***500包括一个计算机模块502、多个输入模块如键盘504和鼠标506以及多个输出设备如显示器508和打印机510。
计算机模块502通过一个合适的收发器514连接到计算机网络512上从而接入到例如互联网或其它网络***如局域网(LAN)或广域网(WAN)。
该例中的计算机模块502包括一个处理器518、一个随机存取存储器(RAM)520以及一个只读存储器(ROM)522。计算机模块502还包括多个输入/输出(I/O)接口,例如连接到显示器508上的I/O接口524以及连接到键盘804上的I/O接口526。
计算机模块502的部件通常通过相互连接的总线528并以一种公知的方式来通讯。
该应用程序通常加载到用户的计算机***500并编码到数据存贮介质如CD-ROM或软盘上,并利用与该数据存贮设备530相对应的数据存贮介质读取器来读取。该应用程序由处理器518读取并执行。程序运动的中间数据可用RAM 520保存。
本发明在上文中公开了一种用于AVC帧内预测以例对包括多个图像的数字视频进行编码的方法和装置。尽管其中只公开少量的实施例,但本领域技术人员都清楚在本发明范围构思内还有其它的变化和/或替换形式。

Claims (22)

1.一种进行AVC帧内预测以便对包括多个图像的数字视频进行编码的方法,该方法包括以下步骤:
为数字图像的每一个帧内编码块生成边缘方向信息,其中的边缘方向信息包括将所述每一个帧内编码块中同向的所有像素的幅值加起来从而计算出的每一个帧内编码块中所有像素的边缘方向直方图;并且
根据上述生成的边缘方向信息选择最有可能的帧内预测模式,其中每一个所述最有可能的帧内预测模式包含用作最佳预测模式方向的在边缘方向直方图中具有最大幅值的柱以便进行率失真优化模式计算;
用所选择的最有可能的帧内预测模式来对数字图像的一个块进行帧内编码。
2.如权利要求1的方法,其中所述边缘方向信息通过给所述数字图像加上至少一个边缘算子来产生。
3.如权利要求2的方法,其中至少一个边缘算子至少包括一个Sobel算子。
4.如权利要求2或3的方法,其中除了所述数字图像亮度和色度分量的边界像素之外,所述边缘算子应用到每一个亮度和色度像素上。
5.如权利要求4的方法,其中在生成边缘方向信息之后,还包括以下步骤:确定所述每一个亮度和色度像素边缘矢量的幅值和角度。
6.如权利要求5的方法,其中所述边缘方向直方图用于4X4亮度块。
7.如权利要求6的方法,其中的预测模式包括8个方向预测模式以及一个DC预测模式。
8.如权利要求5的方法,其中所述的边缘方向直方图用于16X16亮度块和8X8色度块。
9.如权利要求8的方法,其中的预测模式包括2个方向预测模式、一个平面预测模式以及一个DC预测模式。
10.如权利要求5到9之一的方法,其中所述边缘方向直方图用来总和所述编码块内相同方向上像素的幅值。
11.如权利要求1所述的方法,其进一步包括以下步骤:如果当前率失真优化模式计算中非零系数的数目超过前次率失真优化模式计算中非零系数的数目,那么就终止率失真优化模式计算并丢弃当前的率失真优化模式。
12.一种采用AVC帧内预测以便对包括多个图像的数字视频进行编码的装置,所述装置包括:
用来为一数字图像的每一个帧内编码块生成边缘方向信息的设备,其中的边缘方向信息包括将所述每一个帧内编码块中同向的所有像素的幅值加起来从而计算出的每一个帧内编码块中所有像素的边缘方向直方图;以及
根据所述生成的边缘方向信息选择最有可能的帧内预测模式的设备,其中每一个所述最有可能的帧内预测模式包含用作最佳预测模式方向的在边缘方向直方图中具有最大幅值的柱以便进行率失真优化模式计算;以及
用所选择的最有可能的帧内预测模式来对数字图像的一个块进行帧内编码的设备。
13.如权利要求12的装置,其中所述边缘方向信息通过给所述数字图像加上至少一个边缘算子来产生。
14.如权利要求13的装置,其中至少一个边缘算子包括至少一个Sobel算子。
15.如权利要求12或13的装置,其中除了所述数字图像亮度和色度分量的边界像素之外,所述边缘算子应用到每一个亮度和色度像素上。
16.如权利要求15的装置,其进一步包括用来确定所述每一个亮度和色度像素边缘矢量幅值和角度的装置。
17.如权利要求16的装置,其中所述边缘方向直方图用于4X4亮度块。
18.如权利要求17的装置,其中的预测模式包括8个方向预测模式以及一个DC预测模式。
19.如权利要求16的装置,其中所述的边缘方向直方图用于16X16亮度块和8X8色度块。
20.如权利要求19的装置,其中的预测模式包括2个方向预测模式、一个平面预测模式以及一个DC预测模式。
21.如权利要求16的装置,其中所述边缘方向直方图用来总和所述编码块内相同方向上像素的幅值。
22.如权利要求12所述的装置,其进一步包括:如果当前率失真优化模式计算中非零系数的数目超过前次率失真优化模式计算中非零系数的数目,那么就终止率失真优化模式计算并丢弃当前的率失真优化模式的装置。
CN2004800069783A 2003-03-03 2004-03-03 采用avc帧内预测以便对数字视频进行编码的方法和装置 Expired - Fee Related CN1795680B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US45155303P 2003-03-03 2003-03-03
US60/451,553 2003-03-03
PCT/SG2004/000047 WO2004080084A1 (en) 2003-03-03 2004-03-03 Fast mode decision algorithm for intra prediction for advanced video coding

Publications (2)

Publication Number Publication Date
CN1795680A CN1795680A (zh) 2006-06-28
CN1795680B true CN1795680B (zh) 2010-06-16

Family

ID=32962601

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800069783A Expired - Fee Related CN1795680B (zh) 2003-03-03 2004-03-03 采用avc帧内预测以便对数字视频进行编码的方法和装置

Country Status (9)

Country Link
US (1) US20070036215A1 (zh)
EP (1) EP1604530A4 (zh)
JP (1) JP4509104B2 (zh)
KR (1) KR101029762B1 (zh)
CN (1) CN1795680B (zh)
AU (1) AU2004217221B2 (zh)
BR (1) BRPI0408087A (zh)
MX (1) MXPA05009250A (zh)
WO (1) WO2004080084A1 (zh)

Families Citing this family (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9330060B1 (en) 2003-04-15 2016-05-03 Nvidia Corporation Method and device for encoding and decoding video image data
US8660182B2 (en) 2003-06-09 2014-02-25 Nvidia Corporation MPEG motion estimation based on dual start points
US7574063B2 (en) * 2003-07-23 2009-08-11 Canon Kabushiki Kaisha Image coding method and apparatus
EP1605706A2 (en) * 2004-06-09 2005-12-14 Broadcom Corporation Advanced video coding (AVC) intra prediction scheme
CN101023674B (zh) * 2004-09-16 2010-08-18 汤姆森特许公司 用于中间帧的快速模式判定的方法和装置
US8571100B2 (en) 2004-11-04 2013-10-29 Thomson Licensing Fast intra mode prediction for a video encoder
CN100461867C (zh) * 2004-12-02 2009-02-11 中国科学院计算技术研究所 一种帧内图像预测编码方法
US7751478B2 (en) 2005-01-21 2010-07-06 Seiko Epson Corporation Prediction intra-mode selection in an encoder
JP2006304102A (ja) * 2005-04-22 2006-11-02 Renesas Technology Corp 画像符号化ユニットと画像符号化方法
US7830961B2 (en) 2005-06-21 2010-11-09 Seiko Epson Corporation Motion estimation and inter-mode prediction
US8731071B1 (en) 2005-12-15 2014-05-20 Nvidia Corporation System for performing finite input response (FIR) filtering in motion estimation
US7843995B2 (en) 2005-12-19 2010-11-30 Seiko Epson Corporation Temporal and spatial analysis of a video macroblock
US8170102B2 (en) 2005-12-19 2012-05-01 Seiko Epson Corporation Macroblock homogeneity analysis and inter mode prediction
KR100739790B1 (ko) 2006-02-02 2007-07-13 삼성전자주식회사 인트라 예측 모드 결정 방법 및 장치
US8724702B1 (en) 2006-03-29 2014-05-13 Nvidia Corporation Methods and systems for motion estimation used in video coding
KR100745765B1 (ko) 2006-04-13 2007-08-02 삼성전자주식회사 화상 데이터의 공간상 예측 장치 및 방법과 그를 이용한부호화 장치 및 방법, 화상 데이터의 공간상 예측 보상장치 및 방법과 그를 이용한 복호화 장치 및 방법
US8000390B2 (en) 2006-04-28 2011-08-16 Sharp Laboratories Of America, Inc. Methods and systems for efficient prediction-mode selection
US8660380B2 (en) 2006-08-25 2014-02-25 Nvidia Corporation Method and system for performing two-dimensional transform on data value array with reduced power consumption
US8111756B2 (en) * 2006-08-30 2012-02-07 Jiun-In Guo Method for reducing computational complexity of video compression standard
US8467448B2 (en) 2006-11-15 2013-06-18 Motorola Mobility Llc Apparatus and method for fast intra/inter macro-block mode decision for video encoding
US8331448B2 (en) * 2006-12-22 2012-12-11 Qualcomm Incorporated Systems and methods for efficient spatial intra predictabilty determination (or assessment)
KR101365569B1 (ko) * 2007-01-18 2014-02-21 삼성전자주식회사 인트라 예측 부호화, 복호화 방법 및 장치
US8756482B2 (en) 2007-05-25 2014-06-17 Nvidia Corporation Efficient encoding/decoding of a sequence of data frames
FR2916931A1 (fr) * 2007-05-29 2008-12-05 Thomson Licensing Sas Procede de selection d'une donnee de codage et dispositif de codage implementant ledit procede
US9118927B2 (en) 2007-06-13 2015-08-25 Nvidia Corporation Sub-pixel interpolation and its application in motion compensated encoding of a video signal
BRPI0813904B1 (pt) 2007-06-29 2020-12-08 Velos Media International Limited dispositivo de codificação de imagem para codificar imagens de entrada e dispositivo de decodificação de imagem para decodificar dados de imagens codificados
US8873625B2 (en) * 2007-07-18 2014-10-28 Nvidia Corporation Enhanced compression in representing non-frame-edge blocks of image frames
TW200910971A (en) * 2007-08-22 2009-03-01 Univ Nat Cheng Kung Direction detection algorithms for H.264 intra prediction
JP5261376B2 (ja) * 2007-09-21 2013-08-14 パナソニック株式会社 画像符号化装置および画像復号化装置
KR100940444B1 (ko) * 2007-12-18 2010-02-10 한국전자통신연구원 공간적 에지 검출을 이용한 인트라 예측 모드 구성 방법
EP2081386A1 (en) 2008-01-18 2009-07-22 Panasonic Corporation High precision edge prediction for intracoding
KR20090095316A (ko) * 2008-03-05 2009-09-09 삼성전자주식회사 영상 인트라 예측 방법 및 장치
KR101353301B1 (ko) * 2008-04-11 2014-01-21 에스케이 텔레콤주식회사 인트라 예측 모드 결정 방법 및 그 장치와 이를 이용한영상 부호화/복호화 방법 및 그 장치
US20090274213A1 (en) * 2008-04-30 2009-11-05 Omnivision Technologies, Inc. Apparatus and method for computationally efficient intra prediction in a video coder
US20090274211A1 (en) * 2008-04-30 2009-11-05 Omnivision Technologies, Inc. Apparatus and method for high quality intra mode prediction in a video coder
CN101350927B (zh) * 2008-07-29 2011-07-13 北京中星微电子有限公司 帧内预测选择最优预测模式的方法及装置
US8666181B2 (en) 2008-12-10 2014-03-04 Nvidia Corporation Adaptive multiple engine image motion detection system and method
WO2010087589A2 (ko) * 2009-01-29 2010-08-05 엘지전자 주식회사 경계 인트라 코딩을 이용한 비디오 신호 처리 방법 및 장치
US8311109B2 (en) * 2009-02-13 2012-11-13 Research In Motion Limited In-loop deblocking for intra-coded images or frames
JP5169978B2 (ja) * 2009-04-24 2013-03-27 ソニー株式会社 画像処理装置および方法
TWI400956B (zh) * 2009-09-14 2013-07-01 Ind Tech Res Inst 影像壓縮系統與方法
WO2011031332A1 (en) * 2009-09-14 2011-03-17 Thomson Licensing Methods and apparatus for efficient video encoding and decoding of intra prediction mode
EP2375751A1 (en) 2010-04-12 2011-10-12 Panasonic Corporation Complexity reduction of edge-detection based spatial interpolation
CN106162171B (zh) 2010-04-13 2020-09-11 Ge视频压缩有限责任公司 解码器及方法、编码方法
CN105915919B (zh) * 2010-04-13 2019-12-06 Ge视频压缩有限责任公司 用于解码、生成及存储数据流的方法
CN105120287B (zh) 2010-04-13 2019-05-17 Ge 视频压缩有限责任公司 解码器、编码器以及用于解码和编码的方法
HUE045579T2 (hu) 2010-04-13 2020-01-28 Ge Video Compression Llc Síkközi predikció
BR112012026391B1 (pt) 2010-04-13 2020-12-15 Ge Video Compression, Llc Herança em amostra de arranjo em subdivisão multitree
CN101877792B (zh) * 2010-06-17 2012-08-08 无锡中星微电子有限公司 帧内模式预测方法与装置、编码器
US9172968B2 (en) 2010-07-09 2015-10-27 Qualcomm Incorporated Video coding using directional transforms
US8787444B2 (en) * 2010-07-16 2014-07-22 Sony Corporation Differential coding of intra directions (DCIC)
CN103477635B (zh) 2010-10-08 2017-01-18 Ge视频压缩有限责任公司 编码器和编码方法与解码器和解码方法
JP5055419B2 (ja) * 2010-12-14 2012-10-24 日立コンシューマエレクトロニクス株式会社 画像の復号化装置、復号化プログラムおよび復号化方法
WO2012090413A1 (ja) 2010-12-27 2012-07-05 日本電気株式会社 映像符号化装置、映像復号装置、映像符号化方法、映像復号方法及びプログラム
US10992958B2 (en) 2010-12-29 2021-04-27 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
UA109312C2 (uk) 2011-03-04 2015-08-10 Імпульсно-кодова модуляція з квантуванням при кодуванні відеоінформації
CN102186081B (zh) * 2011-05-11 2013-09-18 北京航空航天大学 一种基于梯度向量的h.264帧内模式选择方法
US9532058B2 (en) * 2011-06-03 2016-12-27 Qualcomm Incorporated Intra prediction mode coding with directional partitions
US9654785B2 (en) 2011-06-09 2017-05-16 Qualcomm Incorporated Enhanced intra-prediction mode signaling for video coding using neighboring mode
CN102843556B (zh) * 2011-06-20 2015-04-15 富士通株式会社 视频编码方法和***
US20130016769A1 (en) 2011-07-17 2013-01-17 Qualcomm Incorporated Signaling picture size in video coding
US9628789B2 (en) * 2011-11-18 2017-04-18 Qualcomm Incorporated Reference mode selection in intra mode coding
US9014265B1 (en) * 2011-12-29 2015-04-21 Google Inc. Video coding using edge detection and block partitioning for intra prediction
KR102096566B1 (ko) 2012-04-13 2020-04-02 지이 비디오 컴프레션, 엘엘씨 저지연 화상 코딩
CN102724509B (zh) * 2012-06-19 2014-10-22 清华大学 视频序列的最优帧内编码模式选择方法及装置
CA3095638C (en) 2012-06-29 2023-11-14 Ge Video Compression, Llc Video data stream concept
US9332276B1 (en) 2012-08-09 2016-05-03 Google Inc. Variable-sized super block based direct prediction mode
JP2014082639A (ja) * 2012-10-16 2014-05-08 Canon Inc 画像符号化装置およびその方法
US9426473B2 (en) 2013-02-01 2016-08-23 Qualcomm Incorporated Mode decision simplification for intra prediction
US9148667B2 (en) 2013-02-06 2015-09-29 Qualcomm Incorporated Intra prediction mode decision with reduced storage
US9210424B1 (en) 2013-02-28 2015-12-08 Google Inc. Adaptive prediction block size in video coding
JP5856583B2 (ja) * 2013-05-16 2016-02-10 日本電信電話株式会社 イントラ予測方向絞込み方法、イントラ予測方向絞込み装置及びイントラ予測方向絞込みプログラム
WO2014190468A1 (en) 2013-05-27 2014-12-04 Microsoft Corporation Video encoder for images
US9313493B1 (en) 2013-06-27 2016-04-12 Google Inc. Advanced motion estimation
KR102169610B1 (ko) * 2013-08-21 2020-10-23 삼성전자주식회사 인트라 예측 모드 결정 방법 및 장치
CN105359531B (zh) 2014-03-17 2019-08-06 微软技术许可有限责任公司 用于针对屏幕内容编码的编码器侧判定的方法和***
JP6148201B2 (ja) * 2014-05-02 2017-06-14 日本電信電話株式会社 イントラ予測方向絞込み方法及びイントラ予測方向絞込み装置
CN105812799B (zh) * 2014-12-31 2019-03-08 阿里巴巴集团控股有限公司 视频帧内预测模式的快速选择方法及其装置
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
CN106416254B (zh) 2015-02-06 2019-08-02 微软技术许可有限责任公司 在媒体编码期间跳过评估阶段
US10038917B2 (en) 2015-06-12 2018-07-31 Microsoft Technology Licensing, Llc Search strategies for intra-picture prediction modes
US10136132B2 (en) 2015-07-21 2018-11-20 Microsoft Technology Licensing, Llc Adaptive skip or zero block detection combined with transform size decision
CN105187826B (zh) * 2015-07-31 2018-11-16 郑州轻工业学院 针对高效率视频编码标准的快速帧内模式判决方法
US9807416B2 (en) 2015-09-21 2017-10-31 Google Inc. Low-latency two-pass video coding
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
CN117041570A (zh) * 2016-11-29 2023-11-10 韩国电子通信研究院 图像编码/解码方法和用于存储比特流的记录介质
WO2018117892A1 (en) 2016-12-23 2018-06-28 Huawei Technologies Co., Ltd. An intra-prediction apparatus for extending a set of predetermined directional intra-prediction modes
US10630974B2 (en) * 2017-05-30 2020-04-21 Google Llc Coding of intra-prediction modes
CN109587491B (zh) * 2017-09-28 2022-09-23 腾讯科技(深圳)有限公司 一种帧内预测方法、装置及存储介质
CN110324624B (zh) * 2018-03-30 2023-05-09 阿里巴巴集团控股有限公司 一种确定最优编码单元的方法、装置
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding
US20230022215A1 (en) * 2019-12-09 2023-01-26 Nippon Telegraph And Telephone Corporation Encoding method, encoding apparatus and program
WO2023012934A1 (ja) * 2021-08-04 2023-02-09 日本電信電話株式会社 映像符号化装置、映像符号化方法、及び映像符号化プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167162A (en) * 1998-10-23 2000-12-26 Lucent Technologies Inc. Rate-distortion optimized coding mode selection for video coders

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2507204B2 (ja) * 1991-08-30 1996-06-12 松下電器産業株式会社 映像信号符号化装置
US5512956A (en) * 1994-02-04 1996-04-30 At&T Corp. Adaptive spatial-temporal postprocessing for low bit-rate coded image sequences
US6453069B1 (en) * 1996-11-20 2002-09-17 Canon Kabushiki Kaisha Method of extracting image from input image using reference image
US6240208B1 (en) * 1998-07-23 2001-05-29 Cognex Corporation Method for automatic visual identification of a reference site in an image
US6633654B2 (en) 2000-06-19 2003-10-14 Digimarc Corporation Perceptual modeling of media signals based on local contrast and directional edges
US6987893B2 (en) * 2001-01-05 2006-01-17 Lg Electronics Inc. Image interpolation method and apparatus thereof
US6980596B2 (en) * 2001-11-27 2005-12-27 General Instrument Corporation Macroblock level adaptive frame/field coding for digital video content
US7069149B2 (en) * 2001-12-14 2006-06-27 Chevron U.S.A. Inc. Process for interpreting faults from a fault-enhanced 3-dimensional seismic attribute volume
US6823015B2 (en) * 2002-01-23 2004-11-23 International Business Machines Corporation Macroblock coding using luminance date in analyzing temporal redundancy of picture, biased by chrominance data

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167162A (en) * 1998-10-23 2000-12-26 Lucent Technologies Inc. Rate-distortion optimized coding mode selection for video coders

Also Published As

Publication number Publication date
AU2004217221A1 (en) 2004-09-16
US20070036215A1 (en) 2007-02-15
WO2004080084A1 (en) 2004-09-16
KR101029762B1 (ko) 2011-04-19
EP1604530A4 (en) 2010-04-14
JP2006523073A (ja) 2006-10-05
MXPA05009250A (es) 2006-04-18
BRPI0408087A (pt) 2006-02-14
EP1604530A1 (en) 2005-12-14
KR20050109525A (ko) 2005-11-21
JP4509104B2 (ja) 2010-07-21
AU2004217221B2 (en) 2009-09-03
CN1795680A (zh) 2006-06-28

Similar Documents

Publication Publication Date Title
CN1795680B (zh) 采用avc帧内预测以便对数字视频进行编码的方法和装置
KR100739714B1 (ko) 인트라 예측 모드 결정 방법 및 장치
KR101291196B1 (ko) 영상의 부호화, 복호화 방법 및 장치
JP5401009B2 (ja) 映像のイントラ予測符号化、復号化方法及び装置
CN100461867C (zh) 一种帧内图像预测编码方法
KR100739790B1 (ko) 인트라 예측 모드 결정 방법 및 장치
CN111355956B (zh) 一种hevc帧内编码中基于深度学习的率失真优化快速决策***及其方法
KR100727990B1 (ko) 영상의 인트라 예측 부호화 방법 및 그 방법을 사용하는부호화 장치
CN101385347A (zh) 视频帧内预测编码/解码的装置与方法
CN101888546B (zh) 一种运动估计的方法及装置
KR20050053297A (ko) 동영상 부호화 방법 및 장치
JP2005348280A (ja) 画像符号化方法、画像符号化装置、画像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR101989160B1 (ko) 영상 부호화 방법 및 장치
CN110913232B (zh) 一种tu划分模式的选择方法及装置、可读存储介质
Wu et al. Fast intra-coding for H. 264/AVC by using projection-based predicted block residuals
WO2005055612A1 (en) Method and apparatus for video encoding
JP2005348008A (ja) 動画像符号化方法、動画像符号化装置、動画像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR20010073608A (ko) 압축영상의 공간 도메인에서의 효율적인 엣지 예측 방법
KR101761278B1 (ko) 영상 복호화 방법 및 장치
CN102148974A (zh) 一种时域帧编码中的快速空域预测算法
KR101886259B1 (ko) 영상 부호화 방법 및 장치, 및 부호화된 비트스트림을 포함하는 기록 매체
JP2008099175A (ja) 動画符号化装置および動画符号化方法
Cho et al. New intra luma prediction mode in H. 264/AVC using collocated weighted chroma pixel value
JP2009005276A (ja) 画像符号化装置、及び画像符号化方法
Xu et al. Advanced inpainting-based macroblock prediction with regularized structure propagation in video compression

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100616

Termination date: 20130303