CN1166213C

CN1166213C - 选择b帧编码模式的视频编码方法和***

Info

Publication number: CN1166213C
Application number: CNB008007454A
Authority: CN
Inventors: D・斯努克; D·斯努克; 蘖欣; F·格罗列雷; 炊; J·戈贝尔
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 1999-04-30
Filing date: 2000-04-18
Publication date: 2004-09-08
Anticipated expiration: 2020-04-18
Also published as: US6442204B1; CN1302510A; JP2002543714A; WO2000067486A1; EP1092321A1; KR20010071706A

Abstract

H.263+建议中的方案之一，是在改善的PB帧模式里可对一个B帧的宏块按照前向、反向或双向预测模式进行编码。本发明涉及一种对图像序列编码的方法，在编码B宏块的三种可能的预测模式中可确定一个策略来选择出一种预测模式。该策略基于SAD(绝对差值总和)计算和运动矢量相关性，并当发生镜头切换时容许应用反向预测。这里的计算针对原图像实施，可以使计算量较少，并减轻CPU的负担。本发明还涉及一种编码***，用于实现所述方法，并包括有一种用以存储指令的计算机可读介质，可由指令来实施本方法。

Description

选择B帧编码模式的视频编码方法和***

本发明涉及一种对信源图像序列进行编码的方法，包含有步骤：

将信源图像序列划分成一种图像组集合，每个图像组中包含有一个此后称为I帧的第一帧，后随有至少一对此后称为PB帧的图像帧；

将每个I帧和PB帧划分成若干个在空间上不重叠的像素块；

对所述I帧中来的、此后称为I块的各像素块进行编码，诸I块与该图像组中任一其它帧之间没有相关性；

对于所述PB帧中时间上为第二帧内来的、此后称为P块的各像素块，根据先前之I帧中的I块或者先前之PB帧中的P块，推导出各个运动矢量和相应的预测值；

对于所述PB帧之第一帧中来的、此后称为B块的每个像素块，从具有与其相同位置的所述P块之运动矢量中推导出一个前向运动矢量，对每个B块可得到先前之I帧中一个相关联的I块或者先前之PB帧中一个相关联的P块，此后它们分别称为If块或Pf块；

对于所述PB帧之第一帧中来的每个B块，从具有与其相同位置的所述P块之运动矢量中推导出一个反向运动矢量，对每个B块可得到所述PB帧之P帧中一个相关联的P块，它此后称为Pb块；

对于每个B块的编码，选择一种预测模式；

根据先前之I帧中的I块或者先前之PB帧中的P块对所述PB帧之第二帧中的各P块进行预测编码；

按照所选择定的预测模式对B块进行预测编码。

本发明还涉及一种实现所述方法的***。

例如，本发明可应用于甚低比特率的视频编码中。

ITU(国际电信联盟)制定的低比特率可视电话产品和技术方面的标准汇编于ITU标准H.320和H.324中。这些标准说明了能满足各种成分即音频、视频、复用器、控制协议和调制解调器等所要求的一切方面。H.320专用于通过ISDN(综合业务数据网)电话线的会议电视或可视电话中。H.324的应用目标是通过GSTN(全球交换电话网)模拟电话线传输可视电话。这两个标准都支持H.263建议中的视频编码，H.263建议中说明了低比特事视频信号的压缩。H.263建议中包含有视频编码器内的四种可选模式。这些可选模式之一称为PB帧模式，它给出了一种对PB帧进行编码的方法。H.263建议的第二版本称为H.263+，其开发在于改善图像质量，它包含一些新的可选方案。因此，一种对原来的PB帧模式作出改善的所谓改善型PB帧模式之方案，提供出了一种对PB帧进行编码的新方法。

一个图像帧序列可由一系列I帧和PB帧组成。图像中的I帧按照帧内模式编码，这意味着，I帧利用图像内的空间冗余进行编码，它不参考另一帧图像。P帧是根据先前之P图像或I图像进行预测编码的。因此，当编码一帧P图像时，除了象编码I图像那样利用空间冗余之外，还利用了该P图像与用作参考图像(基本上为先前的I图像或P图像)的先前图像之间的时间冗余。一帧B图像有两帧时间上先后的参考图像，它通常是根据一帧先前的P或I图像和当前在重建的P图像进行预测编码的。一个PB帧由相继的两帧图像构成，即一个首先的B帧和一个随后的P帧，它们编码成一个单元。

一种按照PB帧模式来对一个PB帧进行编码的方法示例于图1中。图中示明，一个PB帧由一个B帧的B和一个P帧的P2组成。该B帧的B之前后分别为一个先前的P图像P1和当前在重建的P图像P2。本例子中示明的P1是一个P图像，但P1也可以是一个I图像，它用作为编码P图像P2和编码B图像B时的参考图像。在PB帧模式中，B帧内的一个B块可以是按前向预测或按双向预测进行编码的。B块按前向预测进行编码时，是基于先前的I或P图像P1；B块按双向预测进行编码时，是基于先前的I或P图像P1和当前在重建的P图像P2两者的。对于PB帧的P图像P2而言，是参考了图像P1来推导出一个运动矢量集合MV的。事实上，对于P2中的每个宏块，通过块匹配法使它与P1中的一个宏块相关联，并推导出一个相应的运动矢量MV。B块的运动矢量是从先前对P1得出的运动矢量集合中推导出的。所以，对于一个B块可如下地计算其前向运动矢量MVf和反向运动矢量MVb：

式中，TRb是在先前的P帧P1为准下B图像在时间基准上的增量值，TRd是在先前的I或P图像P1为准下当前的P帧P2在时间基准上的增量值。

考虑图1上B图像内的一个宏块AB。此宏块AB的位置与先前重建的P2内宏块A2B2即Prec的位置相同。前向运动矢量MV与属于P1之宏块A1B1来的宏块A2B2相关联。与宏块AB相关联的前向运动矢量MVf和反向运动矢量MVb两者是按式(1)中所示自MV中导出的。如图1上所示，通过前向运动矢量MVf和反向运动矢量MVb而与宏块AB相关联的P1和P2内的宏块分别是K1M1和K2M2。

对于双向预测与前向预测之间的选择，是在B图像中的宏块层级上作出的，它取决于MVb点的位置所在。具体地，在B块上AB里的MB部分处，因MVb点位于Prec之内，该MB部分为双向预测，B块上该MB部分的预测公式为：

MB(i，j)＝[A1M1(i，j)+A2M2(i，j)]/2式中，i和j为各像素的空间座标值。

另外，在B块上AB里的AM部分处，因MVb点位于Prec之外，该AM部分为前向预测，B块上该AM部分的预测公式为：

AM(i，j)＝K1A1(i，j)

按照PB帧模式中的一种改善型编码PB帧的方法，说明于欧洲专利申请EP 0782343A2中。它公开了一种在双向预测帧中编码各宏块时的预测方法。该方法介绍了一种增量运动矢量，针对导出的前向和反向运动矢量分别用增量运动矢量作相加或相减。当图像序列中的运动不为线性形态时，所介绍的方法或许是适当的；然而，对于发生镜头切换的图像序列，该方法是完全不合适的。确实，当先前的P帧与一个PB帧中的B帧部分之间有镜头切换时，双向预测和前向预测将给出错误的编码。除了增量运动矢量在实现上会十分加重CPU的负担外，还将导致不必要的耗费和复杂的计算。

本发明的一个目的是改进现有编码方法的效率，同时降低CPU的负担。更准确地，本发明的一个目的是提供一种高效的策略或方法，它对于一个给定的B帧宏块之编码可给出最合适的预测模式选择。

因此，编码每个B块时在预测模式的选择中，对每个B块包含有下面一系列步骤：

推导出该B块与一个像素块之间的绝对差值总和，该像素块内诸像素值是Pb块内诸像素值和Pf块或If块内诸像素之平均值，此绝对差值总和此后称为SADbidir(SAD双向)；

推导出该B块与位置同该B块一样的PB帧之第二帧内的P块之间的绝对差值总和，它此后称为SADb(SAD反向)；

当SADb大于SADbidir时，根据具有与B块相同位置的所述P块来对B块的预测编码模式作出选择；

当SADb小于SADbidir时：

推导出所述运动矢量与具有与该B块那样相同位置的所述PB帧之P帧中所述P块的预测值两者间的差值；

当所得到的差值小于一个预定阈值时，根据所述PB帧之第二帧内的P块、以及I块或先前之PB帧内的P块来对B块的预测编码模式作出选择；

当所得到的差值大于该预定阈值时，根据先前之I帧中的I块或者根据先前之PB帧中的P块推导出该B块之绝对差值总和的最小值，并根据该I块或先前之PB帧中的P块来对B块的预测编码模式作出选择。

对于B块的编码，本权利要求之方法给出了一种预测模式的选择策略，以供在前向模式、反向模式和双向模式中作选择应用。该选择是基于SAD(绝对差值总和)计算和运动矢量相关性的。选择策略依据于一种特定的规则，它比较三种预测模式的SAD值，并引入运动矢量相关性。此外，对于编码B帧时的预测模式选择，是在任何P或B图像编码之前作出的。因此，由于所提出的选择策略是在原来的图像上实施的，所以在SAD计算、特别是SADbidir计算中，不需要进行耗费CPU能力的、对B帧的预先双向预测。所提出之方法的主要优点不仅有利于双向预测，并在无运动状态对也能实现反向预测。因此，本方法对于一个给定的B帧宏块，可导得一种合适的预测模式选择。

本发明的一个优选实施例中，按照本发明之一种方法，或是可以由一种电子电路所构成的硬体***来实现，它能完成所建议之方法中的各个步骤，或是可以部分地依靠计算机可读出介质中存储的一个指令集来完成。

现在，参考后面说明的实施例并结合考虑各个附图，对本发明的具体情况作出阐述，各个附图中，

图1示例出按照PB帧模式的一种先有技术解码方法；

图2示明一个用于编码的图像序列；

图3是编码***中由各部分组成的一个方框图；

图4表明对运动矢量预测值是如何确定的；

图5是一个流程图，示明按照本发明对B块进行编码的各个步骤，它们导向预测模式的选择。

下面各节段中可能发生对名词“块”的误解。当读到“块”字时，应理解为它是ITU标准中所定义的“宏块”。

图2示明一个信源图像帧序列，它们必须按照本发明之方法进行编码。这个所示的序列由第一个I帧I0以及在时间上后随的一系列PB帧组成。每个PB帧PB1、PB2、PB3由称为B帧的一个第一帧和称为P帧的一个第二帧构成。因此，PB1由B帧B1和随后的P帧P2组成，PB2由B帧B3和随后的P帧P4组成，PB3由B帧B5和随后的P帧P6组成，……。

各个帧将以下面给出的次序编码。I0按照帧内模式首先编码，也即编码中不参考任何其它图像帧。然后，P2参考I0进行预测编码；接着，B1参考I0和P1进行编码，B1是在编码器之内于内部重建出来的；再后，P4参考P2进行编码，接着，P3参考P2和P4进行编码，B3也是于内部重建出来的。因此，在一个PB帧的B块之前使序列中该PB帧的每个P块先传输，并参考先前的I或P图像进行编码。在相应的该PB帧的P图像之后再对每个B图像进行编码，这是参考所述相应之PB帧中的P图像和先前已编码的I或P图像进行编码的。

图2中提出的图像序列决不意味着是对可以按照本发明之一种方法进行编码的图像序列种类的一个限制。事实上，图像序列中也可以在两个P帧之间包含两个或多个接连的B帧。此种场合下，各个B帧按它们传输中的同样次序参考先前的I或P帧(它们先前已经编码好)以及次后一个P帧(它是当前重建出的)进行编码。

诸如图2中示明的一种图像序列是经由图3之***内各级编码措施逐帧图像地通过的，所述***可以实现一种按照本发明之方法。首先，为了编码方便，由一个电路DIV(I，P，B)将每个传输的帧划分成在空间上不重叠的N×M个像素(比如说16×16个像素)组成的诸多宏块。I、P和B帧是不以同样的方式编码的，所以，它们通过***时不遵循相同的信号路径。每一种类的各帧沿着一条它们所适应的路径前进。

编码时不需要参考任何其它图像的I帧，是从电路DIV(I，P，B)直通至电路DCT/Q上的。这个电路DCT/Q将空间域内接收到的一个帧变换成频率域内的一个帧。它对划分成像素块的图像实施离散余弦变换，得到一个变换系数集，然后对该系数集进行量化。接着，自DCT/Q电路给出的已量化的系数通过到电路COD上进一步编码，并同时通过到电路IDCT/Q^-1上。电路IDCT/Q^-1先实施反量化，再通过反离散余弦变换将反量化的系数变换回到空间域中。由电路REC(P)重建出I帧的每个像素块，然后将I图像存储入电路MV(P)中的一个存储器部分里。

对于P帧，在由DIV(I，P，B)将它划分成像素块后，传输至一个运动估值器MV(P)上。MV(P)中包含一个存储器部分，在那里又存储入了先前已传输来的I图像或P图像。对于P图像内此后称为P块的每个宏块，参考当前已存储的先前之I或P图像来推导出一个运动矢量MV。此运动矢量MV可以对原来诸宏块而不是重建出的诸宏块计算出其最小化的函数值SAD(绝对差值总和)来推导得到。SAD值给出于下面：

SAD = Σ_{m = 1}^{16} Σ_{n = 1}^{16} | B_{i, j} (m, n) - B_{i - u, j - v} (m, n) |

式中，B_ij(m，n)表示在空间位置(i，j)上16×16像素之P块中的第(m，n)个像素，B_i-u，j-v(m，n)表示在空间位置(i，j)受矢量(u，v)偏移后的位置上先前之I或P图像中一个备选宏块内的第(m，n)个像素。运动矢量便是给出最小SAD值的P块与该备选宏块之间的偏移量。同时，在电路MV(P)中，对每个运动矢量MV推导出一个关联的预测值MVpred。推导出MVpred的一种可能方法由H.263建议给出，如图4中所示例，它示明了一个P块以及其相邻的邻接块。MVpred定义为MV1、MV2、MV3的中间值，其中，MV1是该MV左前方之宏块的运动矢量，MV2是该MV正上方之宏块的运动矢量，MV3是该MV右上方之宏块的运动矢量。除了对一个给定的P块推导出MV和MVpred之外，还按照在式(1)中给出的公式推导出一个前向运动矢量MVf和一个反向运动矢量MVb。这两个运动矢量与位置同该P块一样的PB帧之B帧中的一个B块相关联。此外，与这个B块相关联MVf确定了一个先前之I或P帧内、此后称为If块或Pf块的I或P块。类似地，与这个B块相关联的MVb确定了一个该PB帧之P帧内、此后称为Pb块的P块。在这个已运动补偿的P帧与MV(P)之存储器部分中存储的先前之I或P帧之间，通过有分支的加法器S来实施相减，将差值传输至DCT/Q运算单元上，形成一个经DCT变换和量化了的系数帧。然后，这个系数帧通过到COD单元上进一步编码，并同时通过到IDCT/Q^-1和REC(P)单元上。这里，REC(P)根据从电路IDCT/Q^-1中接收到的差值帧、从运动估值器MV(P)中接收到的运动矢量、以及在MV(P)之存储器部分中已存储的先前之I或P帧这三者的关联性，重建出该P帧中的每一个宏块。在重建之后，MV(P)中的存储器部分以当前的P帧数据进行更新。

B帧直接通过到一个预测器PRED(B)上，用以按照前向、反向或双向预测模式进行预测编码。当于PRED(B)内进行编码时，在加法器S上从初始宏块中减去已运动补偿的宏块，差值通过DCT/Q，然后到达COD进一步编码。对于B帧的每个宏块，必须在三种可能的预测模式中作出一个选择。事实上，在有效地开始编码B图像之前，先对所有宏块顺序地作出这些预测模式的选择。这些选择是根据从MV(P)中接收到的关于原先的I或P图像以及PB帧中原来的P图像之数据作出的，两类图像数据都存储于MV(P)之存储器部分中。PB帧中的P图像是当前在REC(P)中重建的，并且与PB帧中的B图像作为一个单元进行编码。确实，在REC(P)中重建一个P块之后，B帧中相同位置上的B块也按照对该宏块先前已选择的预测模式在PRED(B)中进行预测编码。

对于B帧的一个宏块来说，按照本发明之策略来作出预测模式选择的过程示明于图5的流程图中。人们可回想到，与每个B块相关联的几个运动矢量，是先前在MV(P)中计算出的下列运动矢量：PB帧之P帧中具有象B块那样相同位置的P块之运动矢量MV及其预测值MVpred；确定出Pf块的前向运动矢量MVf；以及确定出Ib或Pb块的反向运动矢量MVb。

对于传输至PRED(B)上的一个B帧之每个宏块Mbck[n]来说，步骤1中，在Mbck[n]与一个宏块之间推导出SAD值，该宏块具有的像素值是PB帧之P帧中相关Pb块的像素值以及先前的I或P帧中If或Pf块的像素值之平均值。此后，这个SAD称为SADbidir。同时，步骤2中，在Mbck[n]与该Pb块之间推导出SAD值，并称之为SADb。随后，步骤3中，将SADbidir与SADb进行比较，在SADbidir大于SADb的场合下，对Mbck[n]作出反向预测模式的选择。这意味着，在对所有B块作出选择之后，Mbck[n]将参考PB帧中的P图像进行预测编码。如图5中的反馈连接线所示，现在提供出一个新的B块，需对它作出预测模式选择。

另一种场合下，也即当SADbidir小于SADb时，便实施一项运动矢量相关性测试。在步骤4和5中，将运动矢量MV与其预测值MVpred进行比较，它们是分别与PB帧之P帧中具有B块那样相同位置的P块相关联的，以及与先前MV(P)中计算出的值相关联的。当MV-MVpred之差值小于一个预定阈值t1时，在步骤7中选择双向预测模式。编码B帧时，随后需参考先前的I或P图像以及PB帧中的P图像对B块Mbck[n]进行预测编码。当M-MVpred之差值大于t1时，在步骤8中选择前向预测模式。此种场合下，需参考先前的I或P图像对B块Mbck[n]进行预测编码。然后，提供出一个新的B帧宏块。按照前向预测模式编码一个B块时，在步骤6中实施一种前向运动估值MVF。它的要点是参考先前的I或P图像对B块推导出一个前向运动矢量，推导中借助于对参考先前的I或P图像计算出的B块使其绝对差值总和SAD最小化。

应当指出，关于所说明的编码方法和***，可对之提出修正或改进而偏离不开本发明的范畴。例如，很显然，此种编码方法可以用几种方式来实现，诸如依靠电子电路硬件，或者，另一种方式是依靠在计算机可读介质中存储入一个指令集，所述指令集可取代至少一部分所述电路，并能在一个计算机或数字处理器的控制下予以执行，以便实现如所述被取代电路中可完成的同样功能。此种场合下，这些指令在一个计算机程序中组合于一起，该程序可装载和存储于所述介质中，使得任何编码***，诸如上面叙述的并包括所述介质的编码***，依靠实施被取代电路可完成的那些同样的功能来实现所说明的编码方法。

Claims

1.一种对信源图像序列进行编码的方法，包含有步骤：

将每个I帧和PB帧划分成若干个在空间上不重叠的像素块；

对于所述PB帧之第一帧中来的、此后称为B块的每个像素块，从具有与之相同位置的所述P块之运动矢量中推导出一个前向运动矢量，对每个B块可得到先前之I帧中一个相关联的I块或者先前之PB帧中一个相关联的P块，此后它们分别称为If块或Pf块；

对于所述PB帧之第一帧中来的每个B块，从具有与之相同位置的所述P块之运动矢量中推导出一个反向运动矢量，对每个B块可得到所述PB帧之P帧中一个相关联的P块，它此后称为Pb块；

对于每个B块的编码选择一种预测模式；

按照所选择定的预测模式对B块进行预测编码，

其中，编码每个B块时预测模式的选择中，对于每个B块包含有下面一系列步骤：

推导出该B块与一个像素块之间的绝对差值总和，该像素块内诸像素值是Pb块内诸像素值和Pf块或If块内诸像素值之平均值，此绝对差值总和此后称为SAD双向；

推导出该B块与位置同该B块一样的PB帧之第二帧内的P块之间的绝对差值总和，它此后称为SAD反向；

当SAD反向大于SAD双向时，根据具有与该B块相同位置的所述P块对该B块的预测编码模式作出选择；

当SAD反向小于SAD双向时：

当所得到的差值小于一个预定阈值时，根据所述PB帧之第二帧内的P块、以及I块或先前之PB帧内的P块对该B块的预测编码作出选择；

当所得到的差值大于该预定阈值时，根据先前之I帧中的I块或者根据先前之PB帧中的P块推导出该B块之绝对差值总和的最小值，并根据该I块或先前之PB帧中的P块对该B块的预测编码模式作出选择。

2.一种对一个图像序列进行编码的***，它包含有：

一种装置，用于将信源图像序列划分成一种图像组集合，每个图像组中包含有一个此后称为I帧的第一帧，后随有至少一对此后称为PB帧的预测编码帧；

一种装置，用于将每个I帧和PB帧划分成若干个在空间上不重叠的像素块；

一个运动估值器，用于对所述PB帧中时间上为第二帧内的、此后称为P块的宏块，根据先前之I帧中的I块或者先前之PB帧中的P块推导出运动矢量以及相应的预测值，并用于对所述PB帧之第一帧中此后称为B块的每个宏块，从具有与之相同位置之P块的所述运动矢量中推导出一个前向运动矢量，这可以为每个B块得到在先前之I帧中一个相关联的I块，或者在先前之PB帧中一个相关联的P块，它们此后分别称为If块或Pf块，又用于从具有与之相同位置之P块的所述运动矢量中对每个B块推导出一个反向运动矢量，这可以为每个B块得到一个此后称为Pb块的相关联的P块；

用于在编码每个B块时选择出一个预测模式的装置；

用于对所述I帧中来的、此后称为I块的各宏块进行编码的装置，诸I块与该图像组中的任一其它帧之间没有相关性，并用于根据先前之I帧中的I块或者先前之PB帧中的P块对所述PB帧之第二帧中的P块进行预测编码，又用于对所述PB帧之第一帧中的B块进行预测编码，

其中，用于编码每个B块时选择出预测模式的装置，对每个B块实施下面一系列步骤：

推导出该B块与一个像素块之间的绝对差值总和，该像素块内诸像素值是Pb块内诸像素值和Pf块或If块内诸像素之平均值，此绝对差值总和此后称为SAD双向；

推导出该B块与Pb块之间的绝对差值总和，它此后称为SAD反向；

当SAD反向大于SAD双向时，根据具有与B块那样相同位置的所述P块对该B块的预测编码模式作出选择；

当SAD反向小于SAD双向时：

当所得到的差值小于一个预定阈值时，根据该P块以及I块或先前之PB帧内的P块对该B块的预测编码模式作出选择；