CN1285115A - 编码***中基于对象的速率控制装置和方法 - Google Patents

编码***中基于对象的速率控制装置和方法 Download PDF

Info

Publication number
CN1285115A
CN1285115A CN98807064A CN98807064A CN1285115A CN 1285115 A CN1285115 A CN 1285115A CN 98807064 A CN98807064 A CN 98807064A CN 98807064 A CN98807064 A CN 98807064A CN 1285115 A CN1285115 A CN 1285115A
Authority
CN
China
Prior art keywords
frame
bit rate
bit
image
rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN98807064A
Other languages
English (en)
Other versions
CN1177480C (zh
Inventor
翰久·李
蒂浩·张
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sarnoff Corp
Original Assignee
Sarnoff Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sarnoff Corp filed Critical Sarnoff Corp
Publication of CN1285115A publication Critical patent/CN1285115A/zh
Application granted granted Critical
Publication of CN1177480C publication Critical patent/CN1177480C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/127Prioritisation of hardware or computational resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/152Data rate or code amount at the encoder output by measuring the fullness of the transmission buffer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

披露了对帧内各对象选择量化器级数使编码率最佳的方法和装置。对各帧内各区域或“对象”选择量化器级数,以实现该帧的目标比特率,同时在整个帧中保持均匀的可视图象质量。

Description

编码***中基于对象的速率控制装置和方法
本申请要求获得1997年7月10日申请的美国临时申请No.60/052134的利益,该申请在此引证作为参考。
本发明涉及最佳化运动图象编码的装置及其方法。本发明特别涉及在帧内对各区域或“对象”适当地调整量化器级数以保持运动图象总体质量同时最佳化编码速率的装置和方法。
                  发明的背景
ISO/IEC国际标准11172和13818(一般分别称为MPEG-1和MPEG-2格式)建立的运动图象专家组(MPEG)对编码/解码策略建立了标准。尽管这些MPEG标准对产生MPEG允许的比特流规定了一般编码方法和语法,但允许许多变化以适应多种不同的应用,并用于例如台式图象印刷、电视会议、数字存储介质和电视广播。
在速率控制领域中,MPEG对控制编码器比特率未限定特殊的方法。编码器设计者的任务是设计速率控制方法,用以控制比特率以便解码器输入缓冲器即不上溢也不下溢。
目前,控制比特率的一种方式是变更量化处理,该处理将导致输入视频图象的失真。通过变更量化器级数(步长),可以改变和控制比特率。
尽管改变量化器级数是实施编码器速率控制的有效方法,但已经发现,低劣的速率控制处理实际上将降低视频图象的可视质量,即不能按有效的方式变更量化器级数,以致接近图象结束时必须急剧地变更量化器级数,以避免上溢和下溢条件。由于变更量化器级数影响图象质量和压缩效率,所以关键在于速率控制处理,以在不损失图象质量的情况下控制比特率。
在目前的MPEG编码策略(例如,各种MPEG测试模式)中,通过假设相同类型的所有图象在图象组内有相同的复杂性来选择各帧的量化器级数。但是,由于各图象的复杂性将随时间变化,所以按这种标准选择的量化器级数不能获得最佳的编码性能。
因此,在技术上需要在帧内适当地调整各区域或“对象”的量化器级数,以保持运动图象的总体质量,同时使编码速率最佳。
                    发明的概述
本发明的实施例是在各帧内选择各区域或“对象”的量化器级数以保持视频图象的总体质量同时使编码速率最佳的方法和装置。就是说,在各帧(图象)内对各对象选择量化器级数,以便达到图象的目标比特率,同时在图象的整个序列上维持均匀的可视图象质量。
                附图的简要描述
参照结合附图进行的下列详细说明,可以容易地理解本发明的技术,其中:
图1表示本发明装置的方框图;
图2表示根据图象内的对象导出和分配目标比特率的方法流程图;
图3表示确定目标帧比特率方法的流程图;
图4表示对当前图象内的对象确定一个或多个目标对象比特率的方法流程图;
图5表示本发明装置第二实施例的方框图;
图6是小波树的图解表示;和
图7表示本发明的编码***。
为了便于理解,在可能的地方使用相同的参考序号来表示附图中所共有的相同元件。
                  详细描述
图1表示本发明装置100的方框图,用于导出针对各帧内的各“对象”的量化器级数,以保持视频图象的总体质量,同时控制编码速率。尽管本发明在参照MPEG允许的编码器情况下进行了如下说明,但本领域技术人员会意识到本发明可用于其它编码/解码标准允许使用的其它编码器。
在本发明的优选实施例中,装置100是编码器或更复杂的基于块的运动补偿编码***的一部分。装置100包括运动评估模块140、运动补偿模块150、速率控制模块130、DCT模块160、量化(Q)模块170、变长编码(VLC)模块180、缓冲器190、反量化(Q-1)模块175、反DCT(DCT-1)变换模块165、减法器115和加法器155。尽管装置100包括多个模块,但本领域的技术人员会意识到由各个模块完成的功能不需要被隔离成图1所示的分离模块。例如,包括运动补偿模块150、反量化模块175和反DCT模块165的一组模块是众所周知的“嵌入式解码器”。
图1表示根据MPEG标准数字化并表示为亮度和两个色差信号(Y、Cr、Ch)的位于信号通路110上的输入视频图象(图象序列)。这些信号还被分成多层(序列、图象组、图象、片、宏块和块),以致用多个宏块表示各图象(帧)。各宏块包括四(4)个亮度块、一个Cr块和一个Cb块,其中,块限定为八(8)乘八(8)的取样阵列。图象划分成块单元提高了区分两个连续图象之间的变化的能力并且通过消除低幅度变换系数(后面说明)改善了图象压缩。数字化的信号可以任意地进行预处理,例如选择适当窗口、清晰度和输入格式的格式转换。
以下说明使用MPEG标准术语;但是,应该理解,术语宏块或块用于说明任何尺寸或形状的用作编码基础的象素块。一般来说,“宏块”可以象单个象素那样小,或象整个图象帧那样大。
同样,应该理解,术语“对象”用于说明任何尺寸或形状的象素块。一般来说,“对象”可以象单个象素那样小,或象整个图象帧那样大。
通路110上的输入视频图象被评估运动矢量的运动评估模块140接收。运动矢量是两维矢量,该矢量用作运动补偿,把来自当前图象中块的坐标位置的偏移设置在基准帧中的坐标上。基准帧可以是前一帧(P-帧),或前一帧和/或后面的帧(B-帧)。由于仅编码和传送当前帧和基准帧之间的改变,所以通过减少信道上传送的信息量,利用运动矢量可极大地增强图象压缩。
运动补偿模块150接收来自运动评估模块140的运动矢量,以改善取样值预测效率。运动补偿包括利用运动矢量的预测,以把偏移量提供给过去的基准帧和/或后面的基准帧,其中基准帧包含用于形成预测误差的预先解码的取样值。就是说,运动补偿模块150使用预先解码的帧和运动矢量构成当前帧的评估。此外,本领域的技术人员会意识到由运动评估模块和运动补偿模块完成的功能可以用组合模块例如单块运动补偿器来完成。
此外,在对指定的宏块完成运动补偿预测前,必须选择编码模式。在编码模式判定领域中,MPEG提供多个不同的宏块编码模式。MPEG-2特别提供宏块编码模式,该模式包括内部(intra)模式、非运动补偿模式(No MC)、帧/场/双起动运动补偿相互(inter)模式、正向/反向/平均相互(inter)模式和场/帧DCT模式。
一旦选择了编码模式,运动补偿模块150根据过去的和/或后面的基准图象在路径152上产生块内容的运动补偿预测(预测图象)。通过减法器115从当前宏块中路径110上的视频图象中减去路径152上的该运动补偿预测,以在路径153上形成误差信号或预先剩余信号。预先剩余信号的形成有效地消除输入视频图象中的多余信息。应该指出,如果当前帧被编码为I-帧,那么路径153上的信号仅是原来的图象,而不是预先剩余信号。
然后,DCT模块160把正向离散余弦变换处理施加给预先剩余信号的各块,产生DCT系数的一组八(8)乘八(8)的块。DCT基本功能或子波段(subband)分解允许对于量化的下一步骤来说很重要的视觉心理(psychovi sual)准则的有效使用。
由量化DCT系数的量化模块170接收所获得的DCT系数的8×8块。通过把DCT系数除以一组量化值,并适当舍入形成整数值来表示DCT系数,由此量化处理降低了DCT系数的精度。使用基于基本功能可见度(称为视觉加权量化)的准则,对各DCT系数可以单独设定量化值。就是说,量化值对应于给定基本功能可见度的阈值,即由肉眼刚好可检测的系数幅度。通过用该值量化DCT系数,许多DCT系数被转换成“零”值,从而提高图象压缩效率。量化处理是关键操作,并且是获得可视质量和控制编码器使其输出与给定的比特率匹配(速率控制)的重要工具。由于可以把不同的量化值施加给各DCT系数,所以一般把“量化矩阵”建立成基准表,例如亮度量化表或色度量化表。因此,编码器选择确定变换块中各频率系数如何量化的量化矩阵。
但是,量化误差的主观感觉随频率极大地改变,并有利地是对更高频率采用更近似量化值。就是说,对于较高的空间频率来说,量化误差的人为主观敏感性低。结果,用比低频更少的允许值就可更加近似地量化高频。此外,精确的量化矩阵取决于许多外部参数,例如指定显示器的特性、观看距离和电源中的噪声量。因此,可以为应用或甚至对帧的单独序列裁定特定的量化矩阵。一般地,特定的量化矩阵可以象目录那样与压缩视频图象一起存储。由速率控制模块130完成量化器级数的适当选择。
接着,通过信号连接171由变长编码(VLC)模块180接收所获得的量化DCT系数的8×8块,其中量化系数的两维块按“之字”顺序扫描,以把该系数转换成量化的DCT系数的一维字符串。该之字扫描顺序是从最低空间频率至最高空间频率的DCT系数的近似连续顺序。然后,变长编码(VLC)模块180编码量化DCT系数的字符串,并利用变长编码和行程编码对宏块编码所有辅助信息。
在“先入一先出”(FIFO)缓冲器190中接收该数据流。采用不同图象类型和变长编码的结果是,FIFO中的所有比特率是可变的。就是说,用于编码各帧的比特数可以不同。在包括固定速率信道的应用中,FIFO缓冲器用于使编码输出与信道匹配,平滑比特率。因此,路径195上的FIFO缓冲器190的输出信号是路径110上的输入视频图象的压缩表示(或输入图象和预测图象之间的压缩差别信号),其中,把该信号送入存储介质或通过路径295送入电信信道。
速率控制模块130用于监视和调整进入FIFO缓冲器190的数据流的比特率,防止数据流传送后在解码器侧(在接收器或目标存储装置,未示出)上溢或下溢。因此,速率控制模块130的任务是监视缓冲器190的状态,以控制编码器产生的比特数。
在本发明的优选实施例中,速率控制模块130在各帧内对各区域或“对象”选择量化器级数,以保持视频图象的总体质量,同时控制编码速率。就是说,可以测定帧,以确定该帧内某些区域是否需要更大或更小的比特率分配。已经看到,对于不同的应用来说,变化的区域比其它区域更重要,例如,对于观察者来说,电视电话中人的面部一般比背景更重要。其它实例包括医学上的应用,其中某些图象区域即潜在的肿瘤比周围组织更重要,或在监视应用中,其中某些图象区域即军事评估比周围的伪装更重要等等。因此,实际的应用将规定限定帧内有关区域或对象的重要性规则。在本发明中,在各帧内对各区域或对象选择量化器级数,以便达到图象的目标比特率,同时在图象的整个序列上保持均匀的可视质量。
应该理解,尽管用进行时间(例如,运动评估/补偿)和空间编码(例如,离散余弦变换)的编码器说明了本发明,但本发明不限于此。可以采用其它时间和空间编码方法,包括不采用任何时间和空间编码。
特别是,速率控制模块130包括帧速率分配器131和对象速率分配器132。帧速率分配器131对当前帧分配比特预算(目标帧比特率),而对象速率分配器132对当前帧内各限定对象分配比特预算(目标对象比特率)。
简单地说,帧速率分配器131从预先编码的图象中或通过实施各种MPEG测试模式初步获得特定类型图象(I、P、B)的复杂性的大致评估。该评估的复杂性用于导出编码各帧所需的预测比特数。利用这种认识,根据具有多项式的复杂性量度,计算帧的量化器级数。导出该复杂性量度,以满足对帧选择的量化器级数应该达到图象目标比特率的限制。一旦帧被编码,速率控制模块就通过使用多项式回归处理递归地调整复杂性量度。就是说,编码宏块所需的实际比特数用于限定复杂性量度,以改善对后续帧的量化器级数的预测。在计算量化器级数中,“目标帧比特率”也被递归地更新。在1998年2月11日申请的序列号为09/022349(代理编号SAR12459)的专利申请“编码***中速率控制最佳化的装置和方法”中披露了这种帧速率分配方法,该申请在此引证作为参考。应该理解,本发明可以采用其它帧比特率分配方法,例如,根据失真量度等的帧比特率分配方法。
简单地说,接着,对象速率分配器132应用计算过的目标帧比特率来确定一个或多个目标对象比特率,其中目标帧比特率的比特与对象的绝对差(MAD)均方成正比分布。下面,参照图4进行目标对象比特率和对应的量化器级数选择方法的详细说明。
应该指出,由可选择的对象分类或分段模块120确定各帧内的对象。对象分类或分段模块120包括必要的规则以限定各帧内的对象。可采用各种对象分类或分段方法,例如,MPEG-4标准附件FISO/IEC 14496-2所述的。
另一方面,可以直接从路径112上的图象序列中获得“基于对象的”信息,例如,哪些象素值组成对象、这些象素值的位置等。就是说,如果图象序列被预先处理和存储在存储介质中,例如,在服务器上存储的图象序列或程序,那么产生存储图象序列的编码器可传递“基于对象的”的信息。换句话说,“基于对象的”信息可以与图象序列一起传送至编码器100。在这种情况下,可以省略对象分类和分段模块120。
再参照图1,通过信号连接线172由反量化模块175接收由量化模块170量化的DCT系数的8×8块。在该阶段,编码器通过编码数据重新产生输入视频图象的I-帧和P-帧,以便它们被用作后续编码的基准帧。
所获得的DCT系数的反量化8×8块传到反DCT模块165上,其中反DCT被提供给各宏块,产生解码误差信号。该误差信号通过加法器155反加在来自运动补偿模块的预测信号上,产生解码基准图象(重现的图象)。
图2表示根据图象内的对象对图象导出和分配比特的方法200的流程图。更具体地说,方法200在步骤205开始,并进入步骤210,在该步骤210中,为当前帧确定目标帧比特率。在优选实施例中,利用通过使用多项式回归处理(参见图3)的递归调整的复杂性量度来确定目标帧比特率。
图3表示确定目标帧比特率的方法300的流程图。参照图3,该方法在步骤305开始,并进入步骤310,其中该方法如下确定帧的目标比特率(目标帧比特率)Tframe T frame = R Nf × ( 1 - past _ percent ) + T previous frame × past _ percent - - - ( 1 )
其中,R是帧序列的剩余比特数,Nf是该序列中剩余的帧数,Tprevious frame是用于编码前一帧的比特数,而past_percent是常数。在优选实施例中,把常数past_percent选择为0.05。但是,本发明不限于此。根据特定的应用或图象的内容,可以采用其它值。实际上,可以临时调整这些值。
总之,公式(1)允许根据可得到的比特和最新编码的帧比特计算目标帧比特率。如果最新的帧复杂并使用许多比特,那么导致应该把更多比特分配给当前的帧。但是,这种增加的分配将减少编码剩余帧的比特的有效数,从而限制对该帧增加分配。如公式(1)中第二项所示,加权平均反映这两个系数的综合平衡。
在步骤320中,方法300按当前缓冲器填满度(fullness)把目标帧比特率Tframe调整如下: T ′ frame = ( a + c × b ) ( c × a + b ) × T frame - - - - - - ( 2 )
其中,T'frame是调整的目标比特率,“a”是当前缓冲器填满度(包括待传送至解码器的比特的缓冲器部分),b是(物理缓冲器大小-缓冲器填满度(a)),而c是选择的值为2(可以使用其它值)的常数。因此,这样的“b”表示缓冲器中的剩余空间。公式(2)指出,如果缓冲器被填满一半以上,那么调整的目标比特率T'frame下降。相反,如果缓冲器未被填满到一半,那么调整的目标比特率T'frame增加。如果缓冲器正好填满一半,那么由于公式(2)简化为T'frame=Tframe,所以不需要调整。
然后,在步骤330中,方法300随意地验证如下保持的目标帧比特率(Rs/30)的下边界:
Tframe=Max(Rs/30,Tframe)    (3)
应该指出,公式(3)允许Tframe采用两个可能值中较大(max)的,其中,Rs是序列(段)的比特率(例如,24000比特/秒)。就是说,目标速率的下边界(Rs/30)被用于保持或保证最小量,例如,可以把800比特/帧设定为最小。如果不能保持最小量,那么解码器可选择完全越过当前帧。然后,方法300在步骤340中结束。
应该理解,在本发明的情况下,可以采用其它帧比特率分配方法,例如,MPEG TM4和TM5。但是,由于目标对象比特率是利用目标帧比特率推导出来的,所以因采用的帧比特率分配方法会影响目标对象比特率的计算操作量(overhead)和精度。例如,如果期望以性能为代价使计算的复杂性最小,那么可适当地采用MPEG TM4和TM5的帧比特率分配方法。相反,如果期望以增加计算复杂性为代价使性能最大,那么可以采用专利申请(代理编号SAR12459)的帧比特率分配方法,或其它更复杂的帧比特率分配方法。
返回到图2,一旦Tframe被确定,那么方法200在下面的图4所示的当前图象内确定对象的一个或多个目标对象比特率。然后,方法200在步骤230中结束。
图4表示在当前图象内确定对象的一个或多个目标对象比特率的方法400的流程图。该方法从步骤405开始并进入步骤410,其中,对于每个对象i(i=1,2,3…),目标对象比特率Vi确定如下:
Vi=Ki×Tframe    (4) K i = ( Ma d i ) 2 Σ k = i n ( Ma d k ) 2 - - - ( 5 )
其中,Madi是对象i的平均绝对差(MAD),n是帧中的对象数,而Vi是对对象i导出的目标对象比特率。就是说,在整个区域或在图象中限定“对象”的区域进行计算,获得对象的平均象素值。
更具体地说,对对象内限定的象素计算各象素值(在原图象中)和对应的象素值(在预测的图象中)之间的绝对差。接着,计算对象象素的所有绝对差之和(SAD)。最后,SAD除以对象中的象素数,以产生对象的平均绝对差象素值(MAD)。因此,目标帧比特Tframe与对象的平均绝对差(MAD)的平方成正比地分布。
例如,如果对象“a”的Mada为2,对象“b”的Madb为3,而Tframe被确定为100,那么Va和Vb分别为: V a = 2 2 2 2 + 3 2 × 100 V b = 3 2 2 2 + 3 2 × 100
在步骤420中,方法400询问Vi是否足够大,以传送对象i的形状信息。就是说,对象比特Vi用于编码三组信息:1)语法信息(例如,标题信息),2)对象i的运动信息(运动矢量)和3)形状信息,该信息限定图象内对象i的形状。
在优选实施例中,利用限定图象内对象位置的“alpha面”提供形状信息。例如,如果图象被限定为有两个对象a和b,那么图象上的象素值由量化器量化,产生仅有0和1值的“alpha面”(在本例中,为二进制alpha面),其中,用“0”占据的区域表示对象“a”,而用“1”占据的区域表示对象“b”。通过把图象量化为三个或多个等级等,alpha面可以依次构成有大于两个对象的图象。
因此,alpha面的大小与原图象的大小相同。因此,目标对象比特率Vi的一部分必须被用于把该形状信息传送至解码器。
但是,为了避免目标对象比特的重要部分被用于编码运动矢量和/或对象形状信息,取代用于编码对象内容或结构的有效比特的情况,方法400采用对象形状控制机构(称为“alpha_thi”的阈值),以增加或降低地改变分配给形状编码的比特数。
更具体地说,如果在步骤420中的询问被否定地回答,那么方法400到达步骤423,其中阈值alpha_thi按下式调整:
如果(Vi≤syntaxi+montioni+shapei)那么
alpha_thi=min(35,alpha_thi+d)    (6)
其中syntaxi表示编码对象i的语法信息(例如,标题信息)所需要的比特;montioni表示编码对象i的运动信息(例如,运动矢量)所需要的比特;shapei表示编码对象i的形状信息所需要的比特;而“d”是设定值为5的常数。常数“d”可以根据特定的应用设定为其它值。
开始,对对象i来说把阈值alpha_thi设定为零,而一旦对对象建立了alpha_thi,那么它从帧到帧通用(并且可变更)。应该指出,公式(6)中的shapei最初取自前一帧中对应的shapei。这允许方法400迅速地测定Vi是否足以编码syntaxi、montioni和shapei,从而控制如何调整alpha_thi
在操作中,alpha面一般被下取样,例如,降至四分之一,以减少用于传送形状信息的比特数。但是,由于下取样是有损失的处理,所以误差被导入对象的位置或边界。因此,方法400通过计算原alpha面和下取样然后上取样的alpha面之间各对象的绝对差SADi的和来测量该误差。然后,把SADi与alpha_thi比较如下:
如果SADi>(16×alpha_thi),那么
减小下取样因子    (6a)
然后,使用新的下取样因子重复公式(6a),例如,因子2,然后利用公式(6a)等将SADi再次与alpha_thi进行比较。在某些点上,SADi将小于16×alpha_thi的值,在这种点上,当前下取样因子被用于产生shapei的比特数。因此,变化alpha_thi影响分配给形状信息的比特数。常数16是实验性推定的,但该常数可根据不同的应用来变更。
更具体地说,如果确定目标对象比特率Vi小于对前一帧中对象i编码syntaxi、montioni和shapei所需要的比特,那么alpha_thi增加5。增加alpha_thi降低了对象i的位置精度,即在对象边界上导入失真。应该指出,公式(6)有最大(max)函数,其中,把alpha_thi设定为35或alpha_thi+5。因此,在某些情况下,即使步骤420中的询问是否定的回答,也可以适当维持alpha_thi的值。
如果步骤420中的询问是肯定的回答,那么方法400进入步骤425,其中,阈值alpha_thi按下式调整:
如果(Vi>syntaxi+montioni+shapei)那么
alpha_thi=max(0,alpha_thi-d)    (7)其中,“d”是也设定为值5的常数。再有,常数d也可以根据特定的应用设定为其它值。因此,如果确定目标对象比特率Vi大于对前一帧中的对象i进行编码Hi(即syntaxi+montioni+shapei)所需要的比特,那么alpha_thi减小5。减小alpha_thi提高了对象i的位置精度,即失真在对象的边界上最小。应该指出,公式(7)有最小(min)函数,其中,把alpha_thi选择为小于0或alpha_thi-5。
在步骤430中,方法400根据下列式(8a-b)调整Vi
如果(缓冲器填满度+Vi>容限)那么
Vi=Max(Rs/30/对象数、容限缓冲器填满度)    (8a)
如果(缓冲器填满度-Bpp+Vi≤安全容限×缓冲器容量)那么
Vi=Bpp-Vi-缓冲器填满度+安全容限×缓冲器容量(8b)其中,把“容限”定义为:
容限=最高限度((1.0-安全容限)×缓冲器填满度)    (9)其中,“缓冲器填满度”是当前缓冲器填满度(即包括要传送至解码器的比特的缓冲器部分),“安全容限”是设定为0.1的常数(根据应用可以使用其它值),Rs是序列(或段)的比特率,“对象数”是图象中的对象数,“缓冲器容量”是缓冲器的大小,而Bpp是信道输出速率。就是说,如果方法400检测由式(8a)定义的缓冲器条件,那么调低Vi至用较大的比特率除以30(视频的显示帧速率)再除以图象中的对象数或缓冲器中空间剩余部分的值,减去由“容限”限定的部分即容限缓冲器填满度。
另一方面,如果方法400检测由式(8b)定义的缓冲条件,那么把Vi调整至计算信道输出速率。总之,根据缓冲器的当前状态即缓冲器的填满度来调整Vi。在该步骤中,方法400对图象中各对象完成计算目标对象比特率Vi的任务。
一旦确定图象中各对象的Vi,那么可以使用目标对象比特率Vi,影响其它编码参数,例如,如下所述对各对象确定量化器级数。或者,可以提供其它编码参数,例如计算资源的分配。就是说,如果确定特定的对象有大的Vi,那么可以分配更多的处理能力,例如,在编码特定对象中致力于多个处理编码***中的更多的处理。
回到图4,在步骤440中,方法400计算各对象i的量化级数Qi,接着利用量化级数Qi在步骤450中编码对象i。然后,方法400在步骤460中结束。
在优选实施例中,按照序号为09/022349(代理编号SAR12459)的美国专利披露的失真测量,计算量化级数Qi。简单地说,量化级数Qi可按如下表示的二次速率失真方法导出:(Ri-Hi)=X1EiQi -1+X2EiQi -2其中 Σ i R i = T frame - - - ( 10 ) 其中,Ri是对象i使用的实际比特,Hi是语法、运动和形状编码使用的标题比特,Qi表示对对象i选择的量化等级或级数,Ei表示失真量度。在优选实施例中,Ei表示完成运动补偿后当前对象的平均绝对差。就是说,该量度Ei提供调整对象比特的预算以计算序列中连续帧之间的对象差的方法。通过求出当前对象和来自从块到块的前一帧中相同对象之差的和并计算平均绝对差量度来计算Ei。换句话说,当前帧中的对象与前一帧中相同对象之间的差越大,当前帧中需要编码对象的比特数就越大。此外,可以采用其它失真量度,以致Ei可以表示均方误差或正好变明显的差(jnd)。
在初始化期间,式(10)中的Ri被计算出的Vi代替以产生Qi。但是,在实际编码后,Ri和Qi被用于更新采用多项式回归模型或二次回归模型的参数X1和X2,以改善参数X1和X2。就是说,变更常数X1和X2,计算对对象分配的比特与相对于量化器等级或级数编码对象所需要的实际比特数之间与的偏差。回归模型在现有技术中是众所周知的。对于各种回归模型的详细论述例如可参见Bowerman及0'Connell,Forecasting and Time Series,3rd Edition,DuxburyPress,(1993,chapter4)。
参数X1和X2被如下初始化:
X1=(Rs *Ns)/2
X2=0         (11)
Rs表示序列(或段)的比特率,例如,每秒24000比特。Ns表示编码帧之间的距离。就是说,因使用低比特率,所以序列内的某些帧可以不被编码(跳越),例如,编码器仅编码所有的第四帧。应该理解,跳越帧的数可以按实际应用的需要来增减。
更具体地说,在编码下帧前,编码器也可以检验当前缓冲器填满度,和检验下帧的估计的目标帧比特率Tframe。如果缓冲器填满度加下帧的目标帧比特率在缓冲器容量的80%以上,那么下帧在不编码的情况下将被跳越,并通过信道输出速率变更缓冲器填满度。帧跳越条件可用公式表示如下:
如果(缓冲器填满度+Tprevious frame-Bpp)>(缓冲器容量x跳越容限)
那么跳越下帧    (12)
其中,“跳越容限”被设定为0.8(根据应用,可以采用其它值)。在序列号09/022349(代理编号SAR12459)的美国专利申请中也披露了这种跳越方法。
尽管本发明说明了量化计算方法和帧跳越方法,但应该理解,在目前的基于对象的速率控制方法情况下,可以使用其它量化计算方法和帧跳越方法。
图5表示包括本发明的基于小波(wavelet)的编码器500。该编码器包括块运动补偿器(BMC)和运动矢量编码器504、减法器502、离散小波变换(DWT)编码器506、比特率控制器510、DWT解码器512和输出缓冲器514。
一般地,如上所述,输入信号是视频图象(在视频序列中定义帧的两维象素阵列)。为了通过低比特率信道准确地传送图象,必须显著地降低视频帧序列中空间和时间的冗余量。这一般通过编码和传送连续帧之间的差来完成。编码器有三个功能:第一,使用BMC和其编码器504产生表示出现在帧之间的运动的多个运动矢量;第二,与运动矢量组合地使用前一帧的重构模型预测当前的帧;第三,从当前帧中减去预测的帧,产生与运动矢量一起被编码和传送至接收器的剩余帧。
离散小波变换完成小波分级的子波段(subband)分解,以产生表示输入图象的普通小波树。为了实现这种图象分解,利用双倍子取样为高水平-高垂直(HH)、(高水平-低垂直(HL)、低水平-高垂直(LH)和低水平-低垂直(LL)频率子波段来分解图象。接着,LL子波段再被双倍子取样(subsampling),以产生一组HH、HL、LH和LL子波段。递归地完成这种子取样,以产生例如图6所示的已经进行三次子取样的一系列子波段。实际上,最好进行六次子取样。子波段之间父子相关性如从父节点的子波段指向子节点的子波段的箭头所示。最低频率子波段是上部左边的LL1,而最高频率子波段在底部右边的HH3处。在本实例中,所有子节点有一个父体。子波段分解的详细论述可参见J.M.Shapiro,“Embedded Image Coding UsingZerotrees of Wavelet Coefficients”,IEEE信号处理学报,Vol.41,No.12,pp.3445-62,1993年12月。
图5所示的DWT编码器按“横向优先”或“深度优先”模式编码小波树的系数。横向优先模式在比特平面中按比特平面模式横切小波树,即量化所有父节点,接着量化所有子节点,然后量化所有第三代节点等。相反,深度优先模式从低-低子波段(LL1)的根节点到子节点(顶部向下)或从子节点到低-低子波段(底部向上)横切各树。如上所述,通过速率控制器510进行适当量化等级的选择,以在序列的各帧内控制各对象的比特率。因此,本发明可适合于采用不同变换的编码器的各种类型。
图7表示本发明的编码***700。该编码***包括通用计算机710和各种输入/输出装置720。通用计算机包括中央处理单元(CPU)712、存储器714和接收和编码图象序列的编码器716。
在该优选实施例中,编码器716简单地为上述那样的编码器100和/或编码器500。编码器716可以是通过通信信道与CPU712连接的物理装置。另一方面,编码器716可以用存储装置装载的和由计算机的存储器712中存储的应用软件(或软件和硬件的组合,例如,采用特定的集成电路(ASIC))来表示。因此,本发明的编码器100和500可以被存储在计算机可读的介质中,例如存储器或存储装置中。
计算机710可以与多个输入和输出装置720耦接,例如,键盘、鼠标器、摄象机、camcorder、视频监视器、多个图象装置或存储装置,但不限于此,还有磁带驱动器、软盘驱动器、硬磁盘或小型磁盘驱动器。输入装置把输入提供给计算机,以便产生编码的视频比特流或接收来自存储装置或图象装置的视频图象序列。最后,通信信道730显示来自编码***的编码信号被传送至解码***(未示出)。
由此,已经展示和说明了在各帧内对各区域或“对象”选择量化器级数以保持视频图象的总体质量同时使编码速率最佳的新颖装置和方法。但是,对于本领域技术人员来说,在研究本说明书和披露其实施例的附图后,显然可以进行属于本发明的许多改变、改进、变更和各种其它应用。不脱离本发明的精神和范围的所有这些改变、改进、变更和各种其它应用都被认为包括在本发明内。

Claims (10)

1.一种分配比特以编码图象序列的各帧的方法,各所述帧至少有一个对象,所述方法包括以下步骤:
(a)对该帧确定目标帧比特率;和
(b)在至少一个对象中分配所述目标帧比特率。
2.如权利要求1的方法,其中,所述分配步骤(b)包括按照至少一个对象的目标对象帧比特率分配所述目标帧比特率的步骤。
3.如权利要求2的方法,其中,按照所述对象的平均绝对差(Mad)选择至少一个对象的所述目标对象比特率。
4.如权利要求3的方法,其中,所述目标对象比特率按下式确定:Vi=Ki×Tframe K i = ( Ma d i ) 2 Σ k = i n ( Ma d k ) 2
其中,Madi是对象i的平均绝对差(Mad),n是该帧中所述对象数,而Vi是对象i的所述目标对象比特率。
5.如权利要求2的方法,其中,按照缓冲器填满度的量度调整所述目标对象比特率。
6.如权利要求1的方法,其中,所述目标帧比特率Tframe可按下式推出: T frame = R Nf × ( 1 - past _ percent ) + T previous frame × past _ percent
其中,R是图象序列的剩余比特数,Nf是图象序列中剩余帧数,Tprevious frame是用于编码前一帧的比特数,而past_percent是常数。
7.如权利要求2的方法,其中,所述目标对象比特率被分配,用以编码对象的语法信息、运动信息和形状信息。
8.如权利要求2的方法,还包括以下步骤:
(c)按照所述目标对象比特率产生所述至少一个对象的量化器级数。
9.一种编码图象序列各帧的装置,所述帧有至少一个对象,所述装置包括:
运动补偿器,用于产生当前帧的预测图象:
变换模块,用于对当前帧和所述预测图象之间的差分信号进行变换,其中,所述变换产生多个系数;
量化器,用于按至少一个量化器级数量化所述多个系数;和
控制器,用于根据至少一个对象的目标对象比特率,有选择地调整当前帧的所述至少一个量化器级数。
10.如权利要求9的装置,其中,按照所述对象的平均绝对差(Mad)选择至少一个对象的所述目标对象比特率。
CNB988070642A 1997-07-10 1998-07-09 编码***中基于对象的速率控制装置和方法 Expired - Lifetime CN1177480C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US5213497P 1997-07-10 1997-07-10
US60/052,134 1997-07-10
US09/094,645 1998-06-15
US09/094,645 US6023296A (en) 1997-07-10 1998-06-15 Apparatus and method for object based rate control in a coding system

Publications (2)

Publication Number Publication Date
CN1285115A true CN1285115A (zh) 2001-02-21
CN1177480C CN1177480C (zh) 2004-11-24

Family

ID=26730228

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB988070642A Expired - Lifetime CN1177480C (zh) 1997-07-10 1998-07-09 编码***中基于对象的速率控制装置和方法

Country Status (7)

Country Link
US (2) US6023296A (zh)
EP (1) EP1010329A4 (zh)
JP (1) JP4187405B2 (zh)
CN (1) CN1177480C (zh)
AU (1) AU8386698A (zh)
CA (1) CA2295689C (zh)
WO (1) WO1999003279A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100455007C (zh) * 2002-11-15 2009-01-21 汤姆森特许公司 错开统计多路复用的***和方法
CN102202220A (zh) * 2010-03-25 2011-09-28 佳能株式会社 编码设备及其控制方法
CN101069432B (zh) * 2004-12-02 2015-10-21 汤姆逊许可公司 用于视频编码器速率控制的量化参数的确定方法和设备

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ID21557A (id) * 1996-11-28 1999-06-24 Thomson Multimedia Sa Proses untuk pengkodean dengan daerah informasi
US6633609B1 (en) * 1996-12-24 2003-10-14 Intel Corporation Method and apparatus for bit rate control in a digital video environment for arbitrary bandwidth
US6023296A (en) * 1997-07-10 2000-02-08 Sarnoff Corporation Apparatus and method for object based rate control in a coding system
US6173079B1 (en) * 1997-09-17 2001-01-09 Samsung Electronics Co., Ltd. Buffer data control circuit and method in image compression system using wavelet system using wavelet transform
US6215916B1 (en) * 1998-02-04 2001-04-10 Intel Corporation Efficient algorithm and architecture for image scaling using discrete wavelet transforms
US6252905B1 (en) * 1998-02-05 2001-06-26 International Business Machines Corporation Real-time evaluation of compressed picture quality within a digital video encoder
US6108447A (en) * 1998-03-26 2000-08-22 Intel Corporation Method and apparatus for estimating frame rate for data rate control
US6434196B1 (en) * 1998-04-03 2002-08-13 Sarnoff Corporation Method and apparatus for encoding video information
US6496607B1 (en) * 1998-06-26 2002-12-17 Sarnoff Corporation Method and apparatus for region-based allocation of processing resources and control of input image formation
US6166664A (en) * 1998-08-26 2000-12-26 Intel Corporation Efficient data structure for entropy encoding used in a DWT-based high performance image compression
JP3393595B2 (ja) * 1998-09-25 2003-04-07 日本電信電話株式会社 動画像符号化装置および動画像符号化方法
GB9822094D0 (en) * 1998-10-09 1998-12-02 Snell & Wilcox Ltd Improvements in data compression
US6850565B2 (en) * 1998-12-18 2005-02-01 Intel Corporation Real time bit rate control system
US6414992B1 (en) * 1999-01-27 2002-07-02 Sun Microsystems, Inc. Optimal encoding of motion compensated video
US6539124B2 (en) * 1999-02-03 2003-03-25 Sarnoff Corporation Quantizer selection based on region complexities derived using a rate distortion model
US7181073B1 (en) * 1999-03-08 2007-02-20 Texas Instruments Incorporated Image coding using embedded zerotree patterns and bitplanes
GB2350512A (en) * 1999-05-24 2000-11-29 Motorola Ltd Video encoder
US6351491B1 (en) * 1999-06-23 2002-02-26 Sarnoff Corporation Apparatus and method for optimizing the rate control for multiscale entropy encoding
DE10083046D2 (de) * 1999-10-07 2002-03-07 Deutsche Post Ag Verfahren zur Erstellung und Überprüfung fälschungssicherer Dokumente
US6765962B1 (en) * 1999-12-02 2004-07-20 Sarnoff Corporation Adaptive selection of quantization scales for video encoding
US6954499B2 (en) * 2000-03-15 2005-10-11 Victor Company Of Japan, Ltd Moving picture coding, coded-moving picture bitstream conversion and coded-moving picture bitstream multiplexing
GB0019121D0 (en) * 2000-08-03 2000-09-27 Wave Limited M Signal compression and decompression
US7418007B1 (en) 2000-09-20 2008-08-26 General Instrument Corporation Method and apparatus for determining a transmission bit rate in a statistical multiplexer
US6731685B1 (en) * 2000-09-20 2004-05-04 General Instrument Corporation Method and apparatus for determining a bit rate need parameter in a statistical multiplexer
US7616690B2 (en) * 2000-10-31 2009-11-10 Imec Method and apparatus for adaptive encoding framed data sequences
WO2002037826A2 (en) * 2000-11-01 2002-05-10 Webcast Technologies Inc Encoding and decoding of video signals
JP4534106B2 (ja) * 2000-12-26 2010-09-01 日本電気株式会社 動画像符号化システム及び方法
US20020118746A1 (en) * 2001-01-03 2002-08-29 Kim Hyun Mun Method of performing video encoding rate control using motion estimation
US20020122482A1 (en) * 2001-01-03 2002-09-05 Kim Hyun Mun Method of performing video encoding rate control using bit budget
US7209519B2 (en) * 2001-04-16 2007-04-24 Mitsubishi Electric Research Laboratories, Inc. Encoding a video with a variable frame-rate while minimizing total average distortion
US6671324B2 (en) * 2001-04-16 2003-12-30 Mitsubishi Electric Research Laboratories, Inc. Estimating total average distortion in a video with variable frameskip
JP4765194B2 (ja) * 2001-05-10 2011-09-07 ソニー株式会社 動画像符号化装置、動画像符号化方法、動画像符号化プログラム格納媒体及び動画像符号化プログラム
US6504494B1 (en) * 2001-11-06 2003-01-07 Motorola, Inc. Software, method and apparatus for rate controlled image compression
DE10158691C1 (de) * 2001-11-29 2003-06-26 Siemens Ag Verfahren und Vorrichtung zur Codierung von Videosequenzen
US7603610B2 (en) * 2002-02-18 2009-10-13 Koninklijke Philips Electronics N.V. Coding a video data stream with unequal error protection based activity
DE10211265A1 (de) * 2002-03-13 2003-10-09 Deutsche Post Ag Verfahren und Vorrichtung zur Erstellung prüfbar fälschungssicherer Dokumente
WO2003084076A1 (en) * 2002-04-02 2003-10-09 Nokia Corporation Coding transform coefficients in image / video encoder and/or decoders
US7418037B1 (en) * 2002-07-15 2008-08-26 Apple Inc. Method of performing rate control for a compression system
US6711300B2 (en) * 2002-08-15 2004-03-23 Envivio, Inc. Quantization and compression of information in a direct acyclic graph
US7042943B2 (en) * 2002-11-08 2006-05-09 Apple Computer, Inc. Method and apparatus for control of rate-distortion tradeoff by mode selection in video encoders
US7266133B2 (en) * 2002-11-13 2007-09-04 General Instrument Corporation Methods and apparatus for statistical multiplexing with distributed multiplexers
US8840475B2 (en) * 2002-12-10 2014-09-23 Ol2, Inc. Method for user session transitioning among streaming interactive video servers
US7804897B1 (en) * 2002-12-16 2010-09-28 Apple Inc. Method for implementing an improved quantizer in a multimedia compression and encoding system
US7940843B1 (en) 2002-12-16 2011-05-10 Apple Inc. Method of implementing improved rate control for a multimedia compression and encoding system
KR100703421B1 (ko) * 2003-01-20 2007-04-03 삼성전자주식회사 트랜스코딩을 이용한 동영상메일 통신장치 및 방법
US6954501B2 (en) * 2003-02-17 2005-10-11 Xvd Corporation Method and apparatus for object based motion compensation
US7266147B2 (en) * 2003-03-31 2007-09-04 Sharp Laboratories Of America, Inc. Hypothetical reference decoder
KR100543453B1 (ko) * 2003-04-24 2006-01-23 삼성전자주식회사 디지털 비디오 스트림의 역재생시 비트율을 제어하기 위한 장치 및 그 방법
WO2005004487A1 (ja) * 2003-06-30 2005-01-13 Mitsubishi Denki Kabushiki Kaisha 画像符号化装置及び画像符号化方法
FR2862168B1 (fr) * 2003-11-06 2006-05-19 Canon Kk Procede et dispositif de regulation de debit d'une sequence d'images.
US8005139B2 (en) 2004-06-27 2011-08-23 Apple Inc. Encoding with visual masking
US8406293B2 (en) * 2004-06-27 2013-03-26 Apple Inc. Multi-pass video encoding based on different quantization parameters
US7319469B2 (en) * 2004-07-26 2008-01-15 Sony Corporation Copy protection arrangement
US20060120612A1 (en) * 2004-12-08 2006-06-08 Sharath Manjunath Motion estimation techniques for video encoding
US20060143678A1 (en) * 2004-12-10 2006-06-29 Microsoft Corporation System and process for controlling the coding bit rate of streaming media data employing a linear quadratic control technique and leaky bucket model
US20060146929A1 (en) * 2005-01-06 2006-07-06 Lg Electronics Inc. Method and system for acceleration of lossy video encoding owing to adaptive discarding poor-informative macroblocks
US7403562B2 (en) * 2005-03-09 2008-07-22 Eg Technology, Inc. Model based rate control for predictive video encoder
US8208536B2 (en) * 2005-04-28 2012-06-26 Apple Inc. Method and apparatus for encoding using single pass rate controller
US7593026B2 (en) * 2005-05-11 2009-09-22 L-3 Communications Corporation Dynamic display optimization method and system with image motion
US8265141B2 (en) * 2005-05-17 2012-09-11 Broadcom Corporation System and method for open loop spatial prediction in a video encoder
JP4040052B2 (ja) * 2005-05-24 2008-01-30 株式会社日立国際電気 画像データ圧縮装置
TWI279143B (en) * 2005-07-11 2007-04-11 Softfoundry Internat Ptd Ltd Integrated compensation method of video code flow
US8231443B1 (en) * 2011-02-11 2012-07-31 Tyson Foods, Inc. Method and apparatus for processing a neck bone
US8379721B2 (en) * 2005-09-22 2013-02-19 Qualcomm Incorported Two pass rate control techniques for video coding using a min-max approach
US8761259B2 (en) * 2005-09-22 2014-06-24 Qualcomm Incorporated Multi-dimensional neighboring block prediction for video encoding
KR100750138B1 (ko) * 2005-11-16 2007-08-21 삼성전자주식회사 인간의 시각 특성을 이용한 영상의 부호화, 복호화 방법 및장치
JP4795223B2 (ja) * 2006-01-31 2011-10-19 キヤノン株式会社 画像処理装置
US20070230586A1 (en) * 2006-03-31 2007-10-04 Masstech Group Inc. Encoding, decoding and transcoding of audio/video signals using combined parallel and serial processing techniques
US20070230579A1 (en) * 2006-03-31 2007-10-04 Masstech Group Inc. Serial processing of video signals using a programmable hardware device
JP2009545935A (ja) * 2006-08-04 2009-12-24 トムソン ライセンシング 符号化及び復号方法、その方法を実行する装置、並びにビットストリーム
KR100928324B1 (ko) * 2007-10-02 2009-11-25 주식회사 아이브이넷 압축된 동영상을 복원하기 위한 프레임 버퍼 메모리 운영방법 및 이에 적합한 디코딩 장치
US20090129473A1 (en) * 2007-11-19 2009-05-21 Samsung Electronics Co., Ltd. System and method for adjusting compression noise reduction based on global and local motion detection
CN100563336C (zh) * 2008-01-03 2009-11-25 上海广电(集团)有限公司中央研究院 一种基于手机电视的恒定码率控制方法
CN102484695A (zh) 2009-08-31 2012-05-30 惠普发展公司,有限责任合伙企业 减少视频数据的通信延迟
US8711933B2 (en) 2010-08-09 2014-04-29 Sony Computer Entertainment Inc. Random access point (RAP) formation using intra refreshing technique in video coding
CN103329532B (zh) * 2011-03-10 2016-10-26 日本电信电话株式会社 量子化控制装置和方法以及量子化控制程序
JP5950157B2 (ja) * 2012-05-18 2016-07-13 ソニー株式会社 画像処理装置および方法、並びに、プログラム
CN103428523B (zh) * 2012-05-22 2015-07-08 华为技术有限公司 评估视频质量的方法和装置
WO2015071865A1 (en) * 2013-11-14 2015-05-21 Riversilica Technologies Pvt Ltd Method and system to control bit rate in video encoding
JP6289076B2 (ja) * 2013-12-18 2018-03-07 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US10419760B2 (en) 2014-09-29 2019-09-17 Sony Interactive Entertainment Inc. Picture quality oriented rate control for low-latency streaming applications
CN104469386B (zh) * 2014-12-15 2017-07-04 西安电子科技大学 一种基于dof的恰可察觉误差模型的感知立体视频编码方法
US10200716B2 (en) 2015-06-25 2019-02-05 Sony Interactive Entertainment Inc. Parallel intra-prediction encoding/decoding process utilizing PIPCM and/or PIDC for selected sections
US10142049B2 (en) * 2015-10-10 2018-11-27 Dolby Laboratories Licensing Corporation Near optimal forward error correction system and method
US20170244894A1 (en) * 2016-02-22 2017-08-24 Seastar Labs, Inc. Method and Apparatus for Managing Latency of Remote Video Production
US10178390B2 (en) 2016-03-30 2019-01-08 Sony Interactive Entertainment Inc. Advanced picture quality oriented rate control for low-latency streaming applications
JP6857973B2 (ja) * 2016-06-14 2021-04-14 キヤノン株式会社 画像符号化装置及びその制御方法
EP3376766B1 (en) * 2017-03-14 2019-01-30 Axis AB Method and encoder system for determining gop length for encoding video
CN107071514B (zh) * 2017-04-08 2018-11-06 腾讯科技(深圳)有限公司 一种图片文件处理方法及智能终端
US10567768B2 (en) * 2017-04-14 2020-02-18 Apple Inc. Techniques for calculation of quantization matrices in video coding
WO2022036678A1 (en) * 2020-08-21 2022-02-24 Alibaba Group Holding Limited Multi-level region-of-interest quality controllable video coding techniques
CN112738515B (zh) * 2020-12-28 2023-03-24 北京百度网讯科技有限公司 用于自适应量化的量化参数调整方法和装置

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5144426A (en) 1989-10-13 1992-09-01 Matsushita Electric Industrial Co., Ltd. Motion compensated prediction interframe coding system
US5134476A (en) * 1990-03-30 1992-07-28 At&T Bell Laboratories Video signal encoding with bit rate control
US5291282A (en) 1990-04-19 1994-03-01 Olympus Optical Co., Ltd. Image data coding apparatus and method capable of controlling amount of codes
JPH0813138B2 (ja) 1990-11-28 1996-02-07 松下電器産業株式会社 画像符号化装置
GB2252002B (en) * 1991-01-11 1995-01-04 Sony Broadcast & Communication Compression of video signals
DE69230268T2 (de) 1991-02-21 2000-04-13 Nec Corp., Tokio/Tokyo Kodierungsgerät zur Kompression von bewegten Bilddaten
US5214507A (en) 1991-11-08 1993-05-25 At&T Bell Laboratories Video signal quantization for an mpeg like coding environment
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
JPH05167998A (ja) 1991-12-16 1993-07-02 Nippon Telegr & Teleph Corp <Ntt> 画像の符号化制御処理方法
US5253059A (en) * 1992-05-15 1993-10-12 Bell Communications Research, Inc. Method and circuit for adjusting the size of a video frame
KR0134871B1 (ko) * 1992-07-17 1998-04-22 사또오 후미오 고능률 부호화 복호화 시스템
WO1994018799A1 (en) * 1993-02-03 1994-08-18 Qualcomm Incorporated Interframe video encoding and decoding system
US5440346A (en) * 1993-06-16 1995-08-08 Intel Corporation Mode selection for method and system for encoding images
BE1007807A3 (nl) * 1993-11-30 1995-10-24 Philips Electronics Nv Inrichting voor het coderen van een videosignaal.
US5566208A (en) * 1994-03-17 1996-10-15 Philips Electronics North America Corp. Encoder buffer having an effective size which varies automatically with the channel bit-rate
US5594504A (en) * 1994-07-06 1997-01-14 Lucent Technologies Inc. Predictive video coding using a motion vector updating routine
US5764805A (en) 1995-10-25 1998-06-09 David Sarnoff Research Center, Inc. Low bit rate video encoder using overlapping block motion compensation and zerotree wavelet coding
KR100355375B1 (ko) 1995-11-01 2002-12-26 삼성전자 주식회사 영상부호화장치에있어서양자화간격결정방법및회로
EP0804857B1 (en) 1995-11-15 2001-09-26 Koninklijke Philips Electronics N.V. Method and device for global bitrate control of a plurality of encoders
US5745178A (en) * 1996-01-22 1998-04-28 Lucent Technologies Inc. Global rate control for model-assisted coding of low bit rate video
US5731835A (en) 1996-02-26 1998-03-24 David Sarnoff Research Center, Inc. Dynamic coding rate control in a block-based video coding system
US6055330A (en) * 1996-10-09 2000-04-25 The Trustees Of Columbia University In The City Of New York Methods and apparatus for performing digital image and video segmentation and compression using 3-D depth information
US6243497B1 (en) 1997-02-12 2001-06-05 Sarnoff Corporation Apparatus and method for optimizing the rate control in a coding system
US5790196A (en) * 1997-02-14 1998-08-04 Mitsubishi Electric Information Technology Center America, Inc. Adaptive video coding method
US6112202A (en) 1997-03-07 2000-08-29 International Business Machines Corporation Method and system for identifying authoritative information resources in an environment with content-based links between information resources
US6023296A (en) * 1997-07-10 2000-02-08 Sarnoff Corporation Apparatus and method for object based rate control in a coding system
US6112203A (en) 1998-04-09 2000-08-29 Altavista Company Method for ranking documents in a hyperlinked environment using connectivity and selective content analysis

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100455007C (zh) * 2002-11-15 2009-01-21 汤姆森特许公司 错开统计多路复用的***和方法
CN101069432B (zh) * 2004-12-02 2015-10-21 汤姆逊许可公司 用于视频编码器速率控制的量化参数的确定方法和设备
CN102202220A (zh) * 2010-03-25 2011-09-28 佳能株式会社 编码设备及其控制方法
CN102202220B (zh) * 2010-03-25 2015-05-13 佳能株式会社 编码设备及其控制方法

Also Published As

Publication number Publication date
CN1177480C (zh) 2004-11-24
US7372903B1 (en) 2008-05-13
AU8386698A (en) 1999-02-08
US6023296A (en) 2000-02-08
JP4187405B2 (ja) 2008-11-26
WO1999003279A1 (en) 1999-01-21
CA2295689A1 (en) 1999-01-21
JP2001510311A (ja) 2001-07-31
CA2295689C (en) 2003-12-09
EP1010329A1 (en) 2000-06-21
EP1010329A4 (en) 2004-08-18

Similar Documents

Publication Publication Date Title
CN1177480C (zh) 编码***中基于对象的速率控制装置和方法
CN1223959C (zh) 编码***中基于宏块的速率控制装置和方法
CN1151685C (zh) 编码***中用于优化速率控制的装置和方法
US6895050B2 (en) Apparatus and method for allocating bits temporaly between frames in a coding system
JP3659353B2 (ja) ビデオ画像符号化方法
CN1164123C (zh) 视频编码的量化方法和装置
US6160846A (en) Apparatus and method for optimizing the rate control in a coding system
CN1145363C (zh) 静画和动画编码的量化矩阵
JP2000511366A6 (ja) 4分割ツリーベースの可変ブロックサイズ動き推定装置および方法
CN102484703A (zh) 通过使用大型变换单元编码和解码图像的方法和设备
JP5166435B2 (ja) 画像符号化方法及び係る方法を実現する装置
CN1949877A (zh) 自适应量化控制器及其方法
CN1738424A (zh) 基于h.264的精细颗粒可伸缩编码的码率控制方法
CN1198465C (zh) 代码转换器和代码转换方法
GB2308768A (en) Video encoding based on inter block redundancy
KR100384327B1 (ko) 블록-기반코딩시스템에서코딩모드를선택하기위한방법및장치
US8478060B2 (en) Method and device for compressing an image and storage medium carrying an image compressed by said method
GB2308771A (en) Video encoding based on inter block correlation
KR20050028499A (ko) 스캔 테이블을 이용한 영상 주사방법과 그를 적용한 이산코사인 변환 장치
Bao et al. L∞-Constrained near-lossless image compression using weighted finite automata encoding
CN1843035A (zh) 使用预解码器的可伸缩视频编码方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20041124

CX01 Expiry of patent term