CN1159922C

CN1159922C - 编码二进制形状信号的方法

Info

Publication number: CN1159922C
Application number: CNB971170452A
Authority: CN
Inventors: 韩锡源
Original assignee: Daewoo Electronics Co Ltd
Current assignee: Fengye Vision Technology Co., Ltd.
Priority date: 1997-08-30
Filing date: 1997-10-07
Publication date: 2004-07-28
Anticipated expiration: 2017-10-07
Also published as: GB9721072D0; FR2768003A1; KR100255754B1; GB2328821A; KR19990020622A; US6133955A; DE19744859B4; DE19744859A1; JP3976854B2; FR2768003B1; CN1210429A; GB2328821B; JPH1175179A

Abstract

一种基于当前帧和前一帧对当前帧内的一二进制字母块(BAB)编码的方法。BAB的偶数号水平行被取样来生成第一个块，第一块的偶数号垂直行再被取样生成第一取样块。然后，通过分别在奇数号垂直行和水平行处顺序***重构的垂直行和水平行来生成重构的第一个块和重构的BAB。上述过程中，重构的垂直和水平行的第一和第二二进制象素的二进制值分别基于预定的概率表利用相应的第一和第二上下文值得到。

Description

编码二进制形状信号的方法

技术领域

本发明关于一种编码二进制形状信号的编码方法，特别地，关于利用基于上下文的编码技术的编码二进制形状信号的方法。

背景技术

在诸如可视电话和电视会议***的数字视频***中，需要大量的数字数据来定义每个视频帧信号，因为视频帧信号包括称为象素值的一系列的数字数据。

但是由于传统的传输通道的可用频带宽度是有限的，为了通过该通道传输大量的数字数据，需要通过使用各种的数据压缩技术来压缩或减少数据量，特别是在诸如可视电话和电视会议***这样低比特率的视频信号编码器的情况中。

用于低比特率的编码***的这种编码视频信号的技术之一是面向目标的分析一综合编码技术，其中输入视频图象被分割成多个目标；并通过不同的编码通路对定义每个目标的运动、轮廓和象素数据的三组参数进行处理。

这种面向目标的编码方案的一个例子是所谓的MPEG(运动图象专家组)阶段4(MPEG-4)，它设计用于提供一个音频-视频编码标准，用于使得可进行基于内容的交互活动、提高编码效率和/或在诸如低比特率通信、交互式多媒体(例如：游戏、交互式电视等等)和在区域监视的应用中具有广泛的可用性。

根据MPEG-4，输入视频图象被分割成多个视频目标平面(UOP)，这些视频目标平面对应于用户可以访问及控制的比特流中的各实体。VOP可称之为目标，可由包围该目标的其宽和高最小可为16的最小倍数的象素(一个宏块的尺寸)的有界的矩形表示，使得编码器可以逐个VOP地即逐个目标地处理输入视频图象。

MPEG-4中所描述的VOP包括形状信息和颜色信息，颜色信息包括亮度和色度，其中形状信息由例如二进制息掩码表示并且与亮度数据有关。在二进制中，一个二进值，例如0，用于表示一个象素，即位于VOP中的目标外边的背景象素，而另一个二进值，例如1用于表示一个象素，即目标中的目标象素。

一个二进制形状信号，代表目标的位置和形状，可以表示为一帧或VOP中的一个二进制字母块(BAB)，例如16×16的二进制象素的块，其中每个二进制象素有一个二进制值，例如0或1，代表一个目标象素或一个背景象素。

BAB可以用传统的基于位图的形状编码方法来进行编码，诸如基于上下文的算术编码(CAE)方法(参见MPEG-4视频辨识模型版2.0，国际标准组织，ISO/IECJTC1/SC29/WG11 N1260，Mar，1996)。

例如，在内部模式中，BAB用传统的CAE方法编码，由此产生编码的BAB。而在相互模式中，代表当前帧(或VOP)中的BAB与前一帧(或VOP)中的最相似的BAB之间的位移的运动矢量及代表二者之间的差异的误差数据一起通过运动估计和运动补偿来找到。误差数据用传统的CAE进行编码以由此产生编码的误差数据。然后，编码的误差数据及运动矢量组合以形成编码的BAB。

但是，如上得到的编码的BAB在一解码器中解码成只有预置分辨率的重构图象。因此，若需要更高分辨率的BAB的图象，BAB传统上被编码为带有可变倍性，它逐步地增加BAB的解码图象的分辨率。即，具有低分辨率的代表BAB的图象的底层被编码；基于该底层，附加的信息被加至其上以产生BAB增强层，然后再作编码。

编码的数据，即如上述的带有可变倍性的编码的BAB被发送给解码器以待在那里被解码。解码器解码这种数据有多种方法。一种方法是只有编码的较低层(例如编码的底层)被解码以获得一较低分辨率的图象。但是为了提高图象的分辨率，底层和少数几个较高层可被解码。要进一步提高分辨率，可解码发送来的所有层，以获得具有与原始图象相同的分辨率的图象，假定即使较高层可能不被解码较低层在较高层之前被解码。

如这里所述的带有可变倍性的编码和解码方法不仅能减少误差，而且可防止位丢失，由此可进行具有相当高分辨率的图象的传送。本技术领域的人熟知，无论是底层还是增强层编码，有效的CAE方法均是十分重要的。

现在参见图1A-1C，示出了具有上下文值的二进制象素组以解释传统的CAE方法。后面，参考图1A-1C说明传统CAE方法的一个方面。

CAE方法是一种编码一帧或VOP内的BAB的技术。每个BAB是一个M×N的(如16×16)二进制象素的块，其中M、N是正偶数。编码一VOP或帧内的BAB的顺序通常是根据所谓的光栅扫描顺序。

该CAE方法首先计算待编码的BAB内的每个二进制象素的上下文值。一个BAB内的二进制象素的上下文值代表该二进制象素位于一个具有以预置的顺序存储的概率值的预定的概率表内的位置的索引。因此，通过参考由二进制象素的上下文值所表示的概率值就可确认该二进制象素是一具有二制值0的背景象素还是一具有二进制值1的目标象素。

此后，该BAB内的所有二进制象素的上下文值被编码以生成包括编码的上下文值的编码的BAB以待经过一个发送器发送到一解码器。

解码器对编码的上下文值进行解码以得到重构的上下文值。基于每个重构的上下文值，在解码器处从概率表(与上述的编码过程中使用的相同)中找到相应二进制象素的概率值，来重构具有如0或1值的每个二进制象素，由此来产生该BAB的重构的BAB。

本技术领域公知的是环绕每个二进制象素周围的二进制象素的上下文值可被用于计算该二进制象素的上下文值，由此改变CAE编码BAB的效率。传统的CAE编码方法中使用的利用环绕在该二进制象素周围的二进制象素的上下文值来计算一二进制象素的上下文值的方法将在下面结合附图1A-1C详细说明。

在图1A中，示出了一BAB或一原始BAB内的二进制象素组100，包括具有上下文值C0-C9的二进制象素和位于X处的二进制象素，X处的二进制象素称为二进制象素X，二进制象素组100将用于计算二进制象素X的上下文值。在内部模式中，二进制象素X的上下文值(称为C)根据公式(1)利用10个上下文值C0-C9来计算：

C = Σ_{k = 0}^{9} (C_{k}) 2^{k}

公式(1)

公式(1)中，C_k代表具有上下文值C_k的二进制象素的二进制值1或0。

在图1B中，示出了当前帧(或VOP)内的BAB中的二进制象素组110，其中二进制象素组110包括具有上下文值C’0～C’3的二进制象素和位于Y处的一个二进制象素，Y处的二进制象素称为二进制象素Y。在相互模式中，在当前帧内，二进制象素组110中的二进制象素的上下文值C’0～C’3用于计算二进制象素Y的上下文值C’。

在图1C中，示出了包含在当前帧(或VOP)的最相似前一帧(或VOP)内的BAB中的二进制象素组120，其中在相互模式中，上下文值C’4～C’8是前一帧(或VOP)中要考虑的计算上下文值C’的上下文值。假定前一帧内的BAB中的具有上下文值C’6的二进制象素对应于或匹配图1B中的二进制象素Y。

现参考图1B和1C，上下文值C’如公式(2)利用上下文值C’0-C’8来计算，其中C’_k代表具有上下文值C’_k的二进制象素的二进制值1或0。

C^{'} = Σ_{k = 0}^{8} ({C^{'}}_{k}) 2^{k}

公式(2)

然后BAB内的每个二进制象素的概率值就基于如上求得的上下文值利用预定的概率表找到，来由此产生包括如1或0二进制值的每个BAB的重构的BAB。重构的BAB与原始的BAB作比较以提供一个分别包括例如1和0的第一和第二二进制值的误差数据块。在这种情况中，第一二进制值代表BAB中的二进制象素的值与重构的BAB中的位于同一位置的二进制象素的值不同。

接下来，利用传统的编码方法(如基于参考轮廓)(RCB)编码方法)来编码误差数据块以通过发送器将编码的误差数据块耦合到解码器。

此外，为了提高传统CAE方法中的编码效率，编码多个模式信号以逐个基于BAB发送而不是对BAB的二进制象素的所有的编码的上下文值进行发送。例如，根据一传统的模式编码方法中，一个相互/内部模式信号(它表示编码器是处于相互模式还是内部模式)、一个模式信号(它表明BAB内的所有象素是背景象素还是目标象素)、和一个模式信号(它表明相互模式中的运动矢量为0)可被编码以进行发送。解码器根据编码的上下文值、编码的误差数据块和编码的模式信号(如上所述的)尽量与原始BAB近似地生成重构的BAB。

但是，在如上所述的传统的CAE方法中，因为存在大量的表示重构的BAB和原始的BAB间的差异的误差数据，因此就不可避免地要分配相当大的数据位以编码和发送BAB。并且上述的传统模式编码方法限制了BAB的编码效率。

发明内容

因此，本发明的一个主要目的是提供一种基于上下文的编码二进制形状信号的方法，它能进一步提高编码效率。

根据本发明提供了一种基于当前帧和包括多个二进制字母块的前一帧、对当前帧中的二进制字母块进行编码的方法，其中该二进制字母块具有M×N个二进制象素，M，N分别为正偶数，每个二进制象素具有一个或者代表目标象素或者代表背景象素的二进制值，所述方法包括：

(a)从二进制字母块的第一或第二水平行开始每隔一水平行取样二进制字母块的水平行，以产生(M/2)×N的二进制象素的第一个块，其中，第一水平行是二进制字母块的最上面的水平行；(b)从第一个块的第一或第二垂直行开始每隔一行地取样第一个块的垂直行，以产生(M/2)×(N/2)的二进制象素的第一取样块作为一个底层，其中第一垂直行是第一个块的最左边的行；(c)在相互模式下，若(N/2)条第一取样块的垂直行位于步骤(b)取样的垂直行处，则通过在步骤(b)中未被取样的垂直行的位置处顺序***(N/2)数目的重构的垂直行来产生一个重构的(M/2)×N的二进制象素的第一个块，重构的垂直行是基于第一取样块的垂直行产生的，重构的垂直行的称为第一目的象素的每个二进制象素是通过利用相应的第一上下文值基于一预定的概率表而生成的，其中第一目的象素的相应的第一上下文值是通过8个二进制象素的上下文值计算出的，这8个象素包括位于前一帧中的第一目的象素同一位置处的一个二进制象素及位于重构的第一个块内的第一目的象素的分别左上角、左边、左下角、上方、右上角、右边和右下角处的7个二进制象素，所述的预定的概率表按预先设定的顺序存储有多个概率值；及(d)在相互模式下，若重构的第一个块的(M/2)数目的水平行位于步骤(a)中被取样的水平行处，则通过在步骤(a)中未被取样的水平行处顺序***(M/2)数目的重构的水平行来产生一称之为第一重构的二进制字母块的M×N的二进制象素的重构的二进制字母块，重构的水平行基于重构的第一个块的水平行产生，称为第二目的象素的每个二进制象素基于预定的概率表根据相应的上下文值来产生，其中第二目的象素的相应的上下文值是通过8个象素的上下文值计算出的，这8个象素包括与位于前一帧中的第二目的象素同一位置处的一个二进制象素及位于重构的二进制字母块内的第二目的象素的分别左上角、上方、右上角、左边、左下角、下边和右下角处的7个二进制象素；其中，如果在重构的二进制字母块和原始的二进制字母块之间没有误差，则不对重构的二进制字母块作编码；否则，对重构的二进制字母块编码。

附图说明

本发明的上述及其它目的和特征将从下面的结合附图的优选实施例的说明中变得显而易见，其中：

图1A-1C表示的是标有他们的上下文值的二进制象素组来描述一种传统的基于上下文的算述编码(CAE)方法。

图2A-2D表示的是标有他们的上下文值的二进制象素组来说明根据本发明的基于上下文的算述编码(CAE)方法。

根据本发明，提供了一种利用基于上下文的算术编码(CAE)方法的编码二进制形状信号的方法。在图2A～2D中，显示了标有他们的上下文值的二进制象素组，在描述根据本发明的优选实施例的CAE方法中将用到它们。

下面，参考图2A～2D，将说明基于当前帧和包括多个BAB的前一帧的对当前帧或视频目标平面(VOP)内的M×N的二进制象素(例如16×16的二进制象素)的二进制字母块(BAB)或原始BAB进行编码的CAE方法，其中每个二进制象素具有一个表示目标象素或背景象素的二进制值，M、N分别为正偶数。

为编码M×N的二进制象素的BAB，BAB首先被取样或再取样。即，在BAB的水平取样过程中，从BAB的第一或第二水平行开始每隔一行地取样BAB的水平行来生成(M/2)×N的二进制象素的第一个块，其中第一水平行是BAB的最上面的水平行。然后，在第一个块的垂直取样过程中，从第一个块的第一或第二垂直行开始每隔一行地取样第一个块的垂直行来生成(M/2)×(N/2)的二进制象素的第一取样块作为底层，其中第一垂直行是第一个块的最左边一行。利用传统的CAE方法对底层编码来产生编码的底层。

详细地说，在内部模式中，第一取样块即该底层是利用传统的基于位图的方法(例如CAE方法)来编码以提供编码的底层。而在相互模式中，第一取样块是基于前一帧内的相应的BAB以上述描述的产生当前帧内的第一取样块相同的方式获取，然后前一帧内的第一取样块被存储起来。之后，与当前帧内的第一取样块最相似的前一帧内的第一取样块被检测出来作为预测的第一取样块，这是通过比较当前帧内的第一取样块与前一帧内的各第一取样块检测出的。

然后，得到一由具有水平分量和垂直分量的二维矢量表示的运动矢量，其中该运动矢量表示当前帧内的第一取样块与前一帧内的预测第一取样块之间的位移。编码该运动矢量以生成一编码的运动矢量。表示当前帧内的第一取样块与预测的第一取样块之间的差异的误差数被编码，由此产生编码的误差数据。然后，编码的运动矢量和编码的误差数据被组合来提供编码的底层。

此外，基于编码的误差数据和预测的第一取样块得到当前帧内的重构的第一取样块，其中当前帧内的重构的第一取样块被存储并用于下一帧的第一取样块的运动估计过程。

之后，将描述的BAB增强层编码过程。首先，在内部模式中，利用传统的重构方法(如利用传统CAE方法的扫描内插(SI)技术)来得到重构的BAB。也就是，通过例如利用传统的CAE方法的SI技术来生成重构的(M/2)×N的二进制象素的第一个块。详细地说，若第一取样块的(N/2)数目的垂直行位于垂直取样过程中取样的垂直行处则通过在第一个块的垂直取样过程中未被取样的垂直行处顺序***(N/2)数目的重构的垂直行来生成重构的第一个块，其中重构的垂直行是基于第一取样块的垂直行生成的，重构的垂直行的每个二进制象素是通过由传统的CAE方法生成的相应的上下文值而获得的。

于是，若重构的第一个块的(M/2)数目的水平行位于在水平取样过程中被取样水平行处则通过在BAB的水平取样过程中未被取样的水平行处顺序地***(M/2)数目的重构的水平行来获得重构的M×N的二进制象素的BAB，其中重构的水平行是基于重构的第一个块的水平行生成的，重构的水平行的各二进制象素是通过由传统的CAE方法生成的相应的上下文值而得到。

同时，在相互模式中，重构的BAB是通过利用根据本发明的一个优选实施例中的重构方法而得到的。详细地讲，若第一取样块的(N/2)数目的垂直行位于垂直取样过程中被取样的垂直行处则通过在第一个块的垂直取样过程中未被取样的垂直行处顺序***重构的(N/2)数目的垂直行而得到重构的第一个块，其中重构的垂直行是基于第一取样块的垂直行生成的，重构的垂直行的每个二进制象素是通过根据本发明的CAE方法所生成的相应的上下文值而得到的。

那么，若重构的第一个块的(M/2)数目的水平行位于水平取样过程中被取样的水平行处则在BAB的水平取样过程中未被取样的水平行处顺序***重构的(M/2)数目的水平行来得到重构的M×N的二进制象素的BAB，其中重构的水平行是基于重构的第一个块的各水平行产生的，重构的各水平行的每个二进制象素是通过根据本发明的CAE方法所生成的相应的上下文值来得到的。

下面将详细描述根据本发明的优选实施例的CAE方法。此后，重构的垂直行的每个二进制象素都将称为第一目的象素，相似地，重构的水平行的每个二进制象素都被称为第二目的象素。为简化起见，后面假定上述采样的水平行和垂直行都为偶数号行。

参见图2A和2B，示出了二进制象素组200和205，其中二进制象素200和205中的未划线的区域分别代表当前帧和前一帧内的重构的第一个块的二进制象素组；二进制象素组200中的划线区域代表将被重构为重构的水平行的象素的二进制象素组，二进制象素组205中的划线区域代表已被重构为前一帧内的重构的水平行的象素的二进制象素组。

在图2A中，示出了第一目的象素A，代表位于重构的第一个块内的第一目的象素A的左上方、左边、左下方、上边和右上方、右边、右下方的V0～V3和V5～V7也示于其中。这些上下文值是已知的。但第一目的象素A下方的二进制象素的上下文值是未知的，因此空着。

称之为第一上下文值V的第一目的象素A的上下文值是根据下述公式(3)利用上下文值V0～V3和V5～V7及位于前一帧(或VOP)中的第一目的象素A的同一位置处的二进制象素的上下文值(称为A4，如图2B所示)计算出来的。

公式(3)：

V = Σ_{k = 0}^{7} (V_{k}) 2^{k}

在公式(3)中，V_k代表具有上下文值V_k的二进制象素的二进制值1或0。当没有其上下文值为V_k的二进制象素时，V_k设为0。根据公式(3)求得的第一上下文值V可能具有0～255范围内的一个值。用这种方法，重构的垂直行上的二进制值未知的所有二进制象素的上下文值都求出来。然后在一预定义的概率表内查找求得的上下文值，生成重构的第一块。

在上述的本发明的优选实施例中，k代表计算第一目的象素A的第一上下文值中用到的8个上下文值中的上下文值V_k的顺序。它的顺序为左垂直行和上水平行在先。这也可替换为例如称为光栅扫描顺序的顺序，这时预定的概率表也要相应地改变。

参见图2C和2D，分别示出了当前帧和前一帧内的二进制象素组210和215。在图2C中，示出了第二目的象素B，也示出了分别代表位于第二目的象素B的左上方、上方、右上方、左边和左下方、下方和右下方的二进制象素的上下文值的V’0～V’3和V’5～V’7。这些上下文值是已知的。但第二目的象素B的右边的二进制象素的上下文值是未知的，因此空着。

称之为第二上下文值的第二目的象素B的上下文值是根据下边的公式(4)通过上下文值V’0～V’3和V’5～V’7及位于前一帧内(或VOP)的第二目的象素B的同一位置的二进制象素的上下文值(称之为V’4，如图2D所示)计算的；

公式(4)：

V^{'} = Σ_{k = 0}^{7} ({V^{'}}_{k}) 2^{k}

在公式(4)中，V’_k代表其上下文值为V’_k的二进制象素的二进制值1或0。当没有其上下文值为Vk’听二进制象素时，V’_k设为0。根据公式(4)求得的第二上下文值V’可以具有0～255范围内的一个值。用这种方法，重构的水平行上的其二进制值未知的所有二进制象素的上下文值均可求得。然后在预定的概率表中查找求得的上下文值生成重构的BAB。

在本发明的上述优选实施例中，k代表计算第二目的象素B的第二上下文值中用到的8个上下文值V’_k的顺序，它遵从光栅扫描顺序。这可改变为例如上边水平行和左边垂直行在先的顺序。这时预定的概率表要相应地改变。因此应当注意，预定的概率表上的上下文值的记录的顺序在预定的概率表是根据该顺序而准备的条件下可以改变。

在相互模式中，根据本发明的CAE方法得到的重构的BAB(本发明的方法可称之为一种内插方法)与传统的方法相比能减小重构的BAB与原始的BAB之间的误差。根据本发明的内插方法得到的重构的BAB以后将被之为第一重构的BAB。

然而，在相互模式的某些情况中，利用***而不是内插的方法的本发明的CAE方法将更能减小重构的BAB与原始的BAB之间的误差。因此，根据本发明的优选实施例，选择***和内插方法中更好的一种来提高编码效率。

例如，在相互模式中，通过下面说明的***方法可得到M×N的二进制象素的重构的BAB。详细地讲，首先，从前一帧(或VOP)内的各相应的(M/2)×N的二进制象素的第一个块中减去前一帧(或VOP)内的(M/2)×(N/2)的二进制象素的第二取样块。从前一帧(或VOP)内的各相应的BAB中减去前一帧(或VOP)内的各相应的第一个块来产生并存储前一帧(或VOP)内的(M/2)×N的二进制象素的第二个块。

通过从基于当前帧(或VOP)中的BAB或原始的BAB得到的(M/2)×N的二进制象素的第一个块中减去(M/2)×(N/2)的二进制象素的第一取样块得到当前帧内的(M/2)×(N/2)的二进制象素的第二取样块。然后，基于运动矢量，在前一帧内的各第二取样块中找出与当前帧内的第二取样块最相似的一个第二取样块作为预测的第二取样块。

若当前帧内的第一取样块的垂直行位于其偶数号垂直行，则将预测的第二取样块的垂直行顺序放到或***到其奇数号垂直行。结果，通过***方法就生成了当前帧内的(M/2)×N的二进制象素的重构的第一个块。

之后，在相互模式中，通过从M×N的二进制象素的BAB中减去(M/2)×N的二进制象素的第一个块可得到当前帧(或VOP)内的(M/2)×N的二进制象素的第二个块。然后，基于运动矢量，在前一帧内的各第二个块中找到与当前帧内的第二个块最相似的一个第二个块作为预测的第二个块。若当前帧内的BAB的水平行位于其偶数号水平行则将预测的第二个块的水平行顺序地放到或***其奇数号行。结果，通过***方法就生成了M×N的二进制象素的重构的BAB，它将被称为第二重构的BAB。

根据本发明的优选实施例，分别对第一和第二重构的BAB进行编码来分别产生编码的第一和第二重构的BAB，然后分别计算编码的第一和第二数据位数。并将二者进行比较。

若第一数据位数等于或小于第二数据位数，选择第一重构的BAB和编码的第一重构的BAB作为选择的重构的BAB和选择的编码的重构的BAB。否则，即第一数据位数大于第二数据位数，则分别选择第二重构的BAB和编码的第二重构的BAB作为选择的重构的BAB和选择的编码的重构的BAB。

然后编码代表当前帧内的BAB二进制象素原始的BAB与选择的重构的BAB之间的差异的误差数据，由此来利用传统的误差数据块编码方法(例如基于参考轮廓的编码(RCB)方法)生成编码的误差数据块。

同时，在相互模式中，与第一和第二重构的BAB和误差数据块的编码相关地生成模式信号，其中该模式信号代表以下四种模式之一。即，四种模式信号中的每一个是代表下述四种模式之一的模式信号：

(1)第一模式，表明第一重构的BAB被选择为选择的重构的BAB；在选择的重构的BAB和原始的BAB之间没有误差，因此不必要对选择的重构的BAB作编码；所以选择的重构的BAB未作编码；(2)第二模式，表示第一重构的BAB被选择为选择的重构的BAB；在选择的重构的BAB和原始的BAB之间存在一些误差，由此使得必需编码选择的重构的BAB；因此选择的重构的BAB已被编码；(3)第三模式，表明第二重构的BAB被选择为选择的重构的BAB；在选择的重构的BAB和原始的BAB之间不存在误差，不需要对选择的重构的BAB编码；因此选择的重构的BAB未被编码；(4)第四模式，表示第二重构的BAB被选择为选择的重构的BAB；在选择的重构的BAB和原始的BAB之间存在一些误差，因此需要对选择的重构的BAB编码；所以已对选择的重构的BAB编码。

然后，模式信号被编码以产生编码的模式信号。然后，与上述四种模式之一相关的编码的模式信号、选择的编码的重构的BAB、及编码的误差数据块被合成来产生编码的增强层。

根据本发明，增强层编码效率可以通过在CAE方法中使用改进的上下文值和恰当地在编码二进制形状信号(例如BAB)中组合模式信号来提高。

虽然仅关于特定的优选的实施例对本发明进行了描述，但在不脱离后面的权利要求中所限定的本发明的精神和范围的情况下可以做出各种修改和变化。

Claims

1、一种基于当前帧和包括多个二进制字母块的前一帧、对当前帧中的二进制字母块进行编码的方法，其中该二进制字母块具有M×N个二进制象素，M，N分别为正偶数，每个二进制象素具有一个或者代表目标象素或者代表背景象素的二进制值，所述方法包括：

(a)从二进制字母块的第一或第二水平行开始每隔一水平行取样二进制字母块的水平行，以产生(M/2)×N的二进制象素的第一个块，其中，第一水平行是二进制字母块的最上面的水平行；

(b)从第一个块的第一或第二垂直行开始每隔一行地取样第一个块的垂直行，以产生(M/2)×(N/2)的二进制象素的第一取样块作为一个底层，其中第一垂直行是第一个块的最左边的行；

(c)在相互模式下，若(N/2)条第一取样块的垂直行位于步骤(b)取样的垂直行处，则通过在步骤(b)中未被取样的垂直行的位置处顺序***(N/2)数目的重构的垂直行来产生一个重构的(M/2)×N的二进制象素的第一个块，重构的垂直行是基于第一取样块的垂直行产生的，重构的垂直行的称为第一目的象素的每个二进制象素是通过利用相应的第一上下文值基于一预定的概率表而生成的，其中第一目的象素的相应的第一上下文值是通过8个二进制象素的上下文值计算出的，这8个象素包括位于前一帧中的第一目的象素同一位置处的一个二进制象素及位于重构的第一个块内的第一目的象素的分别左上角、左边、左下角、上方、右上角、右边和右下角处的7个二进制象素，所述的预定的概率表按预先设定的顺序存储有多个概率值；及

(d)在相互模式下，若重构的第一个块的(M/2)数目的水平行位于步骤(a)中被取样的水平行处，则通过在步骤(a)中未被取样的水平行处顺序***(M/2)数目的重构的水平行来产生一称之为第一重构的二进制字母块的M×N的二进制象素的重构的二进制字母块，重构的水平行基于重构的第一个块的水平行产生，称为第二目的象素的每个二进制象素基于预定的概率表根据相应的上下文值来产生，其中第二目的象素的相应的上下文值是通过8个象素的上下文值计算出的，这8个象素包括与位于前一帧中的第二目的象素同一位置处的一个二进制象素及位于重构的二进制字母块内的第二目的象素的分别左上角、上方、右上角、左边、左下角、下边和右下角处的7个二进制象素；

其中，如果在重构的二进制字母块和原始的二进制字母块之间没有误差，则不对重构的二进制字母块作编码；否则，对重构的二进制字母块编码。

2、根据权利要求1的方法，其中步骤(a)取样二进制字母块的偶数号水平行来生成该第一个块，步骤(b)取样第一个块的偶数号的水平行来生成第一取样块。

3、根据权利要求2的方法，其中当前帧和前一帧分别由当前视频目标平面和前一视频目标平面替换。

4、根据权利要求2的方法，其中在步骤(C)中，称为V的第一相应上下文值根据下面的公式(1)利用所述的8个二进制象素的上下文值V0～V7来计算：

V = Σ_{k = 0}^{7} (V_{k}) 2^{k}

公式(1)

其中Vk代表具有上下文值Vk的二进制象素的一二进制值0或1，当没有具有上下文值Vk的二进制象素时，Vk设为0。

5、根据权利要求4的方法，其中在步骤(d)中，称为V’的第二相应上下文值是根据下面的公式(2)利用所述的8个二进制象素的上下文值V’0～V’7来计算：

V^{'} = Σ_{k = 0}^{7} ({V^{'}}_{k}) 2^{k}

公式(2)

其中V’_k代表具有上下文值V’_k的二进制象素的二进制值，当没有具有上下文值V’_k的二进制象素时，V’_k设置为0。

6、根据权利要求5的方法，还包括在步骤(d)后的以下步骤：

(e)在内部模式，利用基于位图的编码方法编码第一取样块来产生编码的底层；及

(f)在相互模式，基于前一帧内的相应二进制字母块，以步骤(a)和(b)中描述的生成当前帧内的第一取样块的相同的方式获得第一取样块，然后存储前一帧内的第一取样块；比较当前帧内的第一取样块和前一帧内的第一取样块来检测前一帧内的与当前帧内的第一取样块最相似的第一取样块作为预测的第一取样块；得到一由具有水平和垂直分量的二维矢量表示的运动矢量，它表示当前帧内的第一取样块与预测的第一取样块间的位移；编码该运动矢量来生成一编码的运动矢量；编码表示当前帧内的第一取样块与预测的第一取样块之间的差异的误差数据来产生编码的误差数据；及组合编码的运动矢量及编码的误差数据来提供编码的底层数据。

7、根据权利要求6的方法，在步骤(f)之后，在相互模式中还包括以下的步骤：

(g)从前一帧内的每个(M/2)×N的二进制象素的相应第一个块中减去前一帧内的每个(M/2)×(N/2)的二进制象素的第二取样块，从前一帧内的每个相应的二进制字母块中减去前一帧内的每个相应的第一个块来生成并存储前一帧内的(M/2)×N的二进制象素的第二个块；

(h)从当前帧内的(M/2)×N的二进制象素的第一个块中减去当前帧内的(M/2)×(N/2)的二进制象素的第一取样块来生成当前帧内的(M/2)×(N/2)的二进制象素的第二取样块；

(i)基于运动矢量在前一帧内的各第二取样块中找出与当前帧内的第二取样块最相似的一个第二取样块作为预测的第二取样块；

(j)若当前帧内的第一取样块的垂直行位于偶数号的垂直行则将预测的第二取样块的垂直行顺序地放于其奇数号行处作为奇数号的垂直行；

(k)从当前帧内的M×N的二进制象素的二进制字母块中减去当前帧内的(M/2)×N的二进制象素的第一个块来生成当前帧内的(M/2)×N的二进制象素的第二个块；

(1)基于运动矢量在前一帧内的各第二个块中找出与当前帧内的第二个块最相似的一个第二个块作为预测的第二个块；及

(m)若当前帧内的第一个块的水平行位于偶数号水平行则通过将预测的第二个块的水平行顺序地放于奇数号行处作为其奇数号行来生成称为第二重构的二进制字母块的重构的M×N的二进制象素的二进制字母块。

8、根据权利要求7的方法，在相互模式中，在(m)步之后还包括以下的步骤：

(n)分别地编码第二和第二重构的二进制字母块来生成第一和第二编码的重构二进制字母块；

(o)分别计算第一和第二编码的重构的二进制字母块的第一和第二数据位数；

(p)比较第一和第二数据位数，若第一数据位数小于或等于第二数据位数则选择第一重构的二进制字母块和第一编码的重构的二进制字母块分别作为选择的重构的二进制字母块和选择的编码的重构的二进制字母块；若第一数据位数大于第二数据位数则选择第二重构的二进制字母块和第二编码的重构的二进制字母块分别作为选择的重构的二进制字母块和选择的编码的重构的二进制字母块；及

(q)编码表示称为原始二进制字母块的当前帧内的二进制字母块与选择的重构的二进制字母块之间的差异的误差数据块来产生一编码的误差数据块。

9、根据权利要求8的方法，在相互模式中，在步骤(q)之后还包括下面一步骤：

(r)产生模式信号，每个模式信号是代表以下四种模式之一的一个模式信号：(1)第一模式，表明第一重构的二进制字母块被选择为选择的重构的二进制字母块；在选择的重构的二进制字母块和原始的二进制字母块之间没有误差，因此不必要对选择的重构的二进制字母块作编码；所以选择的重构的二进制字母块未作编码；(2)第二模式，表示第一重构的二进制字母块被选择为选择的重构的二进制字母块；在选择的重构的二进制字母块和原始的二进制字母块之间存在一些误差，由此使得必需编码选择的重构的二进制字母块；因此选择的重构的二进制字母块已被编码；(3)第三模式，表明第二重构的二进制字母块被选择为选择的重构的二进制字母块；在选择的重构的二进制字母块和原始的二进制字母块之间不存在误差，不需要对选择的重构的二进制字母块编码；因此选择的重构的二进制字母块未被编码；(4)第四模式，表示第二重构的二进制字母块被选择为选择的重构的二进制字母块；在选择的重构的二进制字母块和原始的二进制字母块之间存在一些误差，因此需要对选择的重构的二进制字母块编码；所以已对选择的重构的二进制字母块编码。

10、根据权利要求9的方法，在相互模式中，在步骤(r)之后还包括以下的一步：

(s)编码模式信号来产生编码的模式信号；及

(t)组合与四种模式之一有关的编码的模式信号、选择的编码的重构的二进制字母块和编码的误差信号块来提供一编码的增强层。

11、根据权利要求10的方法，其中M和N均为16。