CN102271256A

CN102271256A - 基于模式决策的自适应帧组分布式视频编码和解码方法

Info

Publication number: CN102271256A
Application number: CN2011102754654A
Authority: CN
Inventors: 朱金秀; 李莉; 邵永琴; 孟雨
Original assignee: Changzhou Campus of Hohai University
Current assignee: Changzhou Campus of Hohai University
Priority date: 2011-09-16
Filing date: 2011-09-16
Publication date: 2011-12-07
Anticipated expiration: 2031-09-16
Also published as: CN102271256B

Abstract

本发明公开了一种能够提高率失真性能的基于模式决策的自适应帧组编解码方法，帧组编码为把帧分为关键帧、准关键帧、WZ帧；对准关键帧的块采用帧间模式、帧内模式或Skip模式进行编码；对WZ帧的块采用WZ模式、帧内/WZ模式或Skip/WZ模式进行编码；帧组解码分为关键帧解码、准关键帧解码和WZ帧解码；对关键帧采用传统的帧内解码方法；对准关键帧分为帧间模式、帧内模式、Skip模式解码；对WZ帧分为WZ块模式、粗糙帧内块模式、Skip块模式解码；存储器内存储一个GOP中的解码后的关键帧和准关键帧。本发明能够提高整个***的编码效率和最终的解码质量，在计算量略微提高的条件下，很大程度地提高了其率失真性能。

Description

基于模式决策的自适应帧组分布式视频编码和解码方法

技术领域

本发明涉及一种基于模式决策的自适应帧组分布式视频编码和解码方法，属于视频编码方法领域。

背景技术

随着无线多媒体通信及无线视频传感网络等新技术的出现和应用，对视频的编解码***提出了新的要求：由于无线视频编码器电池容量、数字处理能力和运算能力有限，要求无线视频编码器低功耗、低复杂度；由于传输速率的限制，要求编码器具有高压缩效率；由于采用无线接入与传输，要求视频信号传输具备强健壮性。当今的视频压缩编码（MPEG-x系列与H.26x系列）因编码器承担了运动估计、变换、量化、熵编码及相应解码等大量高复杂计算，使得编码复杂度是解码的5～10倍以上，所以传统视频编码技术已不再适用于这些应用场合，须寻找新的编码压缩方法。

分布式视频编码DVC理论基础是信息论中的Slepian-Wolf（SF）和Wyner-Ziv（WZ）两定理。虽然在20世纪70年代从理论上证明了多个相关信源独立编码联合解码同样可以达到联合编码联合解码的编码效率，但直至2002年才开始有学者进行分布式视频编码的实现算法研究，且取得了一定成果并逐渐引起关注。基于SF与WZ理论的分布式视频编码，在编码端把各帧图像看成“独立信源”，各帧之间进行独立编码，编码方式类似于传统的帧内编码。在解码端，利用时域相邻帧的高度相关性，通过对已解码重建帧运动估计进行时域内(外)差求取边信息，利用边信息和解码器联合迭代解码以重构当前待解码帧图像。

目前分布式视频编码的研究已经获得到了很多较有意义的成果，如欧洲DOSCOVER项目组提出的DOSCOVER分布式编码器，然而距离实际应用还有不小的差距， Ramchandran等提出的PRISM(power-efficient robust high- compression syndrome-base multimedia)方案的研究结果显示，将运动估计的复杂度在编码器和解码器之间任意分担，不会造成率失真性能上限的损失；如果将帧间相关估计全部移至解码端，则编码端的码率估计与码率控制必须通过反馈信道即依赖于解码端。

发明内容

本发明所要解决的技术问题是提供一种基于模式决策的自适应帧组分布式视频编码和解码方法，能够提高整个***的编码效率和最终的解码质量，在计算量略微提高的条件下，很大程度地提高了其率失真性能。

为了解决上述技术问题，本发明所采用的技术方案是：一种基于模式决策的自适应帧组分布式视频编码方法，其特征在于：包括如下步骤：

（1）读取一个帧组所包含的最大图像帧的个数L及时间相关性判断准则的门限值T1 和T2，然后以帧为单位读取图像值；

（2）每个图像组的第一帧作为关键帧进行H.264帧内编码，生成H.264帧内码流，并发送到解码端；

（3）对关键帧采用H.264帧内解码，用解码恢复关键帧来生成参考帧

，即

　　　　　（1）

其中为当前编码帧相邻的前一个已解码的关键帧；

（4）用当前编码帧X与其参考帧

的差值来生成残差帧D，即残差帧为：

　　　　（2）

其中为帧像素的坐标；

（5）对步骤（4）中得到的残差帧进行8×8块划分，分别计算各块的绝对残差和SAD，第K块的绝对残差和为；

（6）根据步骤（5）中计算得到的

利用公式（4）对当前编码帧中的块进行块模式

判断，块分为三种类型：Skip块、WZ块和

块；

　　　　　（4）

其中T1、T2是通过实验预先设定的门限值；

（7）根据步骤（6）中的块分类，对当期编码帧中的块进行块模式统计，根据块类型的数量来确定当前帧的模式，当Skip块或WZ块数量最多，当前帧的模式设置为WZ帧；当：

块数量大于Skip块和WZ块数量之和，设置当前帧为关键帧；

（8）自适应帧组方式编码：在连续WZ帧个数大于L-1的情况下,强制设置第L-1的WZ帧为关键帧，该情况下帧组长度

＝L；在连续WZ帧个数不大于L-1的情况下，根据步骤（7）判断的结果，若当前编码帧为关键帧，并且前一帧为WZ帧的情况下，则强制设置前一帧为准关键帧，否则不强制设置准关键帧，并根据帧数设置该情况下GOP长度

；并对关键帧采用帧内编码方式，对准关键帧采用基于块的帧内、帧间混合编码方式；对WZ帧采用基于块的混合分布式编码方式；

（9）对模式信息码流的熵编码：按照帧的次序以头信息方式对每帧进行模式信息编码，对于关键帧，只需设置帧级头信息，对于准关键帧和WZ帧，需设置帧级头信息和块级头信息，对于块头信息采用“从左到右，从上到下”的顺序进行扫描，形成块模式信息码流，模式信息码流包括帧组长度

、帧级头信息和块级头信息，模式码流采用熵编码压缩后发送到解码端。

前述的基于模式决策的自适应帧组分布式视频编码方法，其特征在于：步骤（5）中所述的绝对残差和为

利用公式（3）计算得到，即：

　　　　　（3）

其中

为残差帧第K个8×8块像素的坐标。

前述的基于模式决策的自适应帧组分布式视频编码方法，其特征在于：步骤（8）中所述的准关键帧的编码方法为在准关键帧中设置与步骤（6）中Skip块、WZ块和

块相对应的Skip块、Inter块和Intra块,对Skip块无需进行编码，只需向解码端发送块的编码模式信息；对WZ块采用传统的帧间编码模式；对

块，采用H.264帧内编码方式。　

前述的基于模式决策的自适应帧组分布式视频编码方法，其特征在于：步骤（8）中所述的WZ帧的编码方法为对Skip块无需进行编码，只需向解码端发送块的编码模式信息；对WZ块采用目前分布式编码中的Wyner-Ziv编码模式；对

块采用编码质量低于关键帧的粗糙帧内编码方式。

前述的基于模式决策的自适应帧组分布式视频编码方法，其特征在于：所述的Wyner-Ziv编码模式为：对WZ块的残差进行8×8 DCT变换，统一量化后提取位平面，输出频域系数

，并送入LDPC编码器编码，采用编码端码率控制器ERC来控制哪些部分校验码需要传输，通过编码端码率控制，得出LDPC编码器产生的校验信息需要传送到解码端的位平面数N和每个位平面需要传输到解码端的码率。

一种基于模式决策的自适应帧组分布式视频解码方法，其特征在于：帧解码分为关键帧解码、准关键帧解码和WZ帧解码；对关键帧采用传统的帧内解码方法；对准关键帧根据块信息解码，分为帧间模式、帧内模式、Skip模式解码；对WZ帧根据块信息解码，分为WZ模式、粗糙帧内模式、Skip模式解码；存储器内存储一个GOP中的解码后的关键帧和准关键帧，包括如下步骤：

（1）读取帧组长度

，对关键帧采用用H.264的帧内解码器解码；

（2）对准关键帧的块模式信息码流采用熵解码，分为Inter块、Intra块和Skip块；根据公式（1）利用解码的关键帧生成参考帧

，Skip块通过参考帧

的相同位置的块来恢复，即

；Intra块通过传统的帧内解码方式恢复；Inter块通过传统的帧间解码方式恢复, 准关键帧解码后保存在存储器中；

（3）产生边信息帧：在解码端，以帧组为单位，一组帧组产生一个边信息帧；对应与编码端，一个帧组有两种情况组成：包含头尾一个关键帧和一个准关键帧;或包含头尾两个关键帧，第一种情况下，边信息帧Y由解码的关键帧

和准关键帧

之间通过基于8×8块的双向运动补偿内插法来产生，前向运动估计和后向运动估计产生的块最小绝对残差和

、

保存在缓冲器中；

第二种情况下，边信息帧Y由解码的关键帧

和

之间通过基于8×8块的双向运动补偿内插法来产生，同样，前向运动估计和后向运动估计产生的块最小绝对残差和、

保存在缓冲器中；

（4）WZ帧中Skip块和块的解码：Skip块通过其相邻关键帧解码后的相同位置的块来恢复，即

，

块通过帧内解码方式恢复,　解码后保存在存储器中，由

块和Skip块解码部分重构WZ帧

；

（5）边信息的修正：利用部分重构WZ帧，对边信息进行修正，用部分重构WZ帧的像素值在帧内块和Skip块的位置上来替代边信息帧Y中的像素值，产生新的边信息帧Y’，即

　　　　　　（7）

接下来在WZ块的位置，对解码的关键帧

以边信息帧Y’为参考帧基于8×8块进行前向运动估计，产生运动矢量和块最小绝对残差和

保存在缓冲器中；同样，在WZ块的位置，对解码的关键帧以边信息帧Y’为参考帧基于8×8块进行后向运动估计，产生运动矢量和块最小绝对残差和

保存在缓冲器中；比较四个绝对残差和

、

、

和

的大小，通过式（8）来修正边信息，即

（8）

其中为边信息帧中WZ块的坐标，一组帧组产生的修正边信息帧Y’的个数等于该帧组WZ帧的个数；

（6）解码端的残差帧

，在生成残差帧中，仅对与当前解码WZ块相同位置的块进行DCT变换和量化，形成频域系数；

（7）WZ块的解码：WZ块解码首先根据接受到的校验位和解码器端的边信息用信道解码方式恢复频域信息，经过Skip块、WZ块和

块的解码的过程，可以得到恢复的频域码流，恢复的频域码流含有编码端传送的信息

，通过公式（9），即通过恢复的频域码流来精细重构最终的频域系数

，

（9）

其中

和

分别为根据恢复的频域信息推断的

的最大值和最小值。此方法用恢复的

的位平面信息限制了单纯由

位平面重构

而产生的失真。对

反量化，逆离散余弦变换（IDCT），恢复残差值D'。原始像素W'由式（10）来获得

（10）

其中

为WZ块的坐标；

（8）恢复WZ帧，并通过去h.264中方块滤波器滤波后显示。

前述的基于模式决策的自适应帧组分布式视频解码方法，其特征在于：步骤（3）中所述的第一种情况下的边信息帧Y通过公式（5）计算得到：

（5）

其中

为内插帧像素的坐标；

和

解码的关键帧和准关键帧之间的前向和后向的运动矢量，

和

与公式（5）相等。

所述的第二种情况下的边信息帧Y通过公式（6）计算得到：

（6）

其中

和

解码的关键帧之间的前向和后向的运动矢量，

、

和与公式（5）相同。

本发明从权衡编码复杂度和编码压缩性能的角度来设计实用视频编码***，所带来的有益效果是：

（1）提出根据帧模式和最大帧组数进行自适应组合帧组的编码方法，保证同一帧组的图像之间有较强的时间相关性，从而提高编码性能；

（2）提出三种帧模式：关键帧、准关键帧和WZ帧；对准关键帧基于块的帧内、帧间混合编码算法，与关键帧帧内编码相比，该算法提高编码速度并减少码流，提出对WZ帧的基于块的混合分布式编码算法，与现有的算法相比，在码流基本不增加的情况下提高了率失真性能；

（3）在解码端提出利用部分重构WZ帧对边信息进行修正的算法，该算法利用图像的空间相关性，提高了解码性能。

附图说明

图1是本发明的***结构框图；

图2是本发明的编码器结构框图；

图3是本发明的解码器结构框图；

图4是本发明的Foreman序列的帧不同类型块统计图；

图5是本发明的Carphone序列的帧不同类型块统计图；

图6是本发明的Football序列的帧不同类型块统计图；

图7是本发明的自适应帧组示意图；

图8是本发明的基于块的自适应帧组编码算法程序流程图；

图9是本发明的基于块的解码编码算法程序流程图；

图10 DOSCOVER分布式编码器Forman序列测试结果示意图；

图11 DOSCOVER分布式编码器Carphone序列测试结果示意图。

具体实施方式

下面将结合说明书附图，对本发明做进一步的说明。

本发明提出的基于模式决策的自适应帧组DVC***，既可以用软件完成，也可以用嵌入式硬件***来实现。图1给出了本发明提出DVC***的结构框图，其中的摄像头可以是手机摄像头，传感网络摄像头等一些低能量设备的视频输入终端；编码器可以用软件实现，一般情况是DSP或其他嵌入式并行机；解码器一般情况是高性能PC机，可以是DSP或其他嵌入式并行机；网络可以是有线也可以是无线网络。

编码器框图如图2所示，编码器对输入图像进行帧模式判断，把帧分为关键帧、准关键帧、WZ帧进行自适应帧组编码。采用了基于块的4种编码模式：帧内模式、Skip模式、粗糙帧内模式、WZ模式。对关键帧采用帧内模式编码；对准关键帧的块采用帧间模式、帧内模式或Skip模式进行编码。对WZ帧的块采用WZ模式、帧内/WZ模式或SKIP/WZ模式进行编码，其中WZ模式采用编码端码率控制器来控制传送的比特位。存储器内存储一个GOP中的所有帧以及解码后的关键帧和准关键帧。

基于块模式决策的自适应帧组分布式视频编码方法，其特征是包括如下步骤：

本发明中的编码器算法，主要有下列部分组成：一是对图像的块模式及帧模式判断；二是根据帧模式和最大帧组数自适应组合帧组；三是对关键帧的帧内编码；四是对准关键帧基于块的帧内、帧间混合编码；五是对WZ帧的基于块的混合分布式编码。在帧模式判断时取消了运算量巨大的运动估计，所以编码器的复杂度与传统视频编码器相比大大降低，从而保留了“低复杂度编码”的特性。

第一步：读取L, T1、T2:其中L是一个帧组（GOP）所包含的最大图像帧的个数，T1 、T2是时间相关性判断准则的门限值。

第二步：每个图像组的第一帧作为关键帧进行H.264帧内编码，生成H.264帧内码流，然后发送到解码端。

第三步：生成参考帧：对关键帧采用H.264帧内解码，解码后保存在存储器中。用解码恢复关键帧来生成参考帧

，即在编码端使用一个与帧内编码算法对应的帧内解码器来恢复关键帧

，我们在实施中采用了H.264帧内解码算法，

　　　　　　（1）

其中为当前编码帧相邻的前一个已解码的关键帧。

第四步：生成残差帧：用当前编码帧X与其参考帧

的差值来生成残差帧D，即残差帧为：

　　　　（2）

其中

为残差帧的坐标。

第五步：对残差帧进行8×8块划分，分别计算各块的绝对残差和SAD，第K块的绝对残差和

的计算如下：

　　　　（3）

其中

为残差帧第K个8×8块像素的坐标。

第六步：根据

对当前编码帧中的块进行块模式

判断

当

时，把该块设置的模式为Skip，即Skip块；当时，把该块设置的模式

为WZ，即WZ块；当

时，把该块设置的模式

为

，即

块。模式

用式（4）表示：

　　　　　　　　　（4）

其中T1、T2是通过实验预先设定的门限值。本发明相比现有的DVC技术增加了对块模式的判断，由于采用式（4）作为判断依据而没有采用传统编码器中的运动估计来进行判断，增加运算量不大。

第七步：对当前编码帧进行帧模式判断

根据当前编码帧中8×8块的模式来判断帧的模式。首先对当前编码帧中的块进行块模式统计，根据块类型的数量来确定当前帧的模式。情况1：Skip块数量最多，表明当前编码帧和相邻关键帧之间的相关性很强，把当前帧的模式设置为WZ帧可以减少编码码流；情况2：WZ块数量最多，表明当前编码帧和相邻关键帧之间的相关性较强，把当前帧的模式设置为WZ帧可以减少编码码流；情况3：块数量大于Skip块和WZ块数量之和，表明当前编码帧和相邻关键帧之间的相关性很弱，若当前帧的模式设置为WZ帧进行编码码流减少不明显，反而增加编码复杂度，所以设置当前帧为关键帧。在这种情况下，对整帧采用第二步的帧内编码模式，而不再对块进行第六步所述的分类编码处理。

在T1＝10*82＝640、T2＝30*82＝1920情况下实验统计，对于运动程度较小的图像序列Foreman,Carphone（见图4、5），Skip块比例平均高达70％，

的比例平均在20％以下。对于运动剧烈，图像复杂的图像序列football（见图6），Skip块比例平均也在40％以上，

的比例平均在40％以下；因此，本发明采用对WZ帧的块分类为Skip块，可以有效降低计算量；分类为

块，可以在增加少量码流的情况下有效提高编码质量。

第八步：自适应帧组方式编码

为了防止误差积累，一般情况设置L＝8，情况1：在连续WZ帧个数大于L-1的情况下,则强制设置第L-1的WZ帧为关键帧，该情况下帧组（GOP）长度

＝L；情况2：在连续WZ帧个数不大于L-1的情况下，本发明根据第七步自适应设置该图像为WZ帧或关键帧，若当前编码帧为关键帧，并且前一帧为WZ帧的情况下，则强制设置前一帧为准关键帧，否则不强制设置准关键帧，并根据帧数设置当前该情况下GOP长度

。自适应帧组如图7所示，由于强制关键帧和关键帧的编码方式相同，统称关键帧，所以一个帧组有两种情况组成：包含头尾两个关键帧， GOP长度

;或包含头尾一个关键帧和一个准关键帧， GOP长度

。需要说明的是如果前后帧分别为强制关键帧和关键帧情况下，则这两帧不构成独立的GOP，关键帧作为下一个GOP的起始帧。

本发明对关键帧、准关键帧、WZ帧采用不同的编码方式：对关键帧采用第二步所述的帧内编码方式，对准关键帧采用第十步所述的基于块的帧内、帧间混合编码方式；对WZ帧采用第十二步所述的基于块的混合分布式编码方式。

这种编码方式和现有DVC方法不同，现有DVC方法一般采用固定帧组方式编码，本发明采用自适应帧组方式编码，根据帧之间的时间相关性来设置帧组，并和现有的自适应帧组编码方法不同，现有的自适应帧组编码方法仅仅根据相关性确定关键帧，而本发明采用增加设置准关键帧类型的方式，保证每个帧组的帧之间有较强的相关性，这样时间相关性能被更充分的使用，因此取得了较好的效果。

第九步：对模式信息码流的熵编码

按照帧的次序以头信息方式对每帧进行模式信息编码，对于关键帧，只需设置帧级头信息，对于准关键帧和WZ帧，需设置帧级头信息和块级头信息。对于块头信息采用“从左到右，从上到下”的顺序进行扫描，形成模式信息码流（00表示Skip块，01表示WZ块,10表示

块）。模式码流包括帧组长度

第十步：准关键帧的编码

当前编码帧为准关键帧时，按照第六步，块分为三种类型：Skip块、WZ块和

块，为了与WZ帧块编码方式区别，在准关键帧中对应设置为Skip块、Inter块和Intra块,　对不同类型的块采用不同的编码方式。情况1：Skip块，此情况下当前编码帧和参考帧对应位置的像素块的差距很小，相关性很大，因此本发明采用H.264编码中的Skip编码模式，无需进行编码，只需向解码端发送块的编码模式信息，大大减少了运算量；情况2：WZ块，此情况下当前编码帧和参考帧对应位置的像素块的差距较小，相关性较大，采用传统的帧间编码模式，即对块的残差进行DCT、量化、熵编码；情况3：

块，表明当前编码帧和参考帧对应位置的像素块的差距较大，相关性较小，采用H.264帧内编码方式。

第十一步：准关键帧的解码　

对准关键帧中的Skip块，通过其相邻关键帧解码后的相同位置的块来恢复，Inter块通过传统的帧间解码方式恢复、Intra块通过传统的帧内解码方式恢复,　解码后保存在存储器中。

第十二步：WZ帧的编码

当前编码帧为WZ帧时，对不同类型的块采用不同的编码方式。情况1：Skip块，此情况下当前编码帧和参考帧对应位置的像素块的差距很小，相关性很大，因此本发明采用H.264编码中的Skip编码模式，无需进行编码，只需向解码端发送块的编码模式信息，大大减少了运算量；情况2：WZ块，此情况下当前编码帧和参考帧对应位置的像素块的差距较小，相关性较大，采用目前分布式编码中的Wyner-Ziv编码模式（见第十三步）；情况3：

块，表明当前编码帧和参考帧对应位置的像素块的差距较大，相关性较小，为提高编码质量，采用类似关键帧的帧内编码模式，为了减少码流，对该模式用较少的码流表示，采用编码质量低于关键帧的粗糙帧内编码方式。

第十三步：WZ块的编码

对WZ块的残差进行8×8 DCT变换，统一量化后提取位平面，输出频域系数

，并送入LDPC编码器编码，编码器产生的校验信息只有部分根据编码器的需要进行传输，采用现有的编码端码率控制技术来控制哪些部分需要传输，而不是传统的通过解码器的反馈通道来控制。采用编码端进行码率控制可以解决反馈机制不能实现或者代价过高的场合，为了不增加编码器的复杂度，采用低复杂度的边信息估计和校验码率估计方法。另外由于WZ块比例平均在15％以下，数量较少，采用编码端码率控制器对编码器复杂度增加不大。

编码端码率控制算法：

第1步：　产生边信息估计

情况1：当前WZ帧所在的GOP起始帧为关键帧和准关键帧时，则使用解码的关键帧和准关键帧产生边信息估计

　　　　　　　　　　　　　　　（5）

其中，

和

分别为当前WZ帧相邻的前一个已解码的关键帧和下一个已解码的准关键帧；

，

，其中

为当前编码帧与前一个关键帧

之间的距离，即帧数，

便是这个帧组中所有帧的个数。

情况2：当前WZ帧所在的GOP起始帧都为关键帧时，则使用GOP头尾解码的关键帧产生边信息估计

　　　　　　　　　　　　（6）

其中，

和

分别为当前WZ帧相邻的前一个已解码的关键帧和下一个已解码的关键帧,其他参数和式（5）相同；

第2步：对

进行8×8DCT变换

第3步：计算需要传输到解码端的位平面数N

估计WZ块每个变换量化后的系数需要传输到解码端的位平面个数，步骤如下：

设X和为原始WZ块和估计边信息，误差Z＝X-

作为相关性噪声满足拉普拉斯分布

　　　　　　　　　　　　　　（7）

其中

为Z的标准差，

，　　　　　　　　　　　　　　（8）

式（8）中

为原始WZ块系数值，

为WZ块估计系数值，n为当前WZ块的像素个数， 8×8块情况下n＝64。则失真

用式（9）计算：

　　　　　　　　　　　　（9）

其中

，M为位平面的总个数，N为传送到解码端的位平面数，在给定失真

情况下，可以通过式（9）获得

值，从而由

得出N，即得出需要传送到解码端的位平面数；

第4步：计算位平面的码率

接下来估计在每个位平面需要传输到解码端的码率，计算如下：

以第j个位平面为例说明。按照Slepian-Wolf定理，最小校验码率

等于位平面的条件熵

，

由式（8）计算：

　　　　　　　　　　（10）

其中

为第j个位平面错误概率，即第j个位平面的估计边信息

和原始值

不相等的概率，由式（11）计算：

　　　　　　　　　　（11）

得出第j个位平面的码率

。

通过编码端码率控制，得出LDPC编码器产生的校验信息需要传送到解码端的位平面数N和每个位平面需要传输到解码端的码率。

基于块模式决策的自适应帧组分布式视频解码方法，其特征是包括如下步骤：

解码器框图如图3所示，解码器根据对模式信息码流解码，读出GOP长度

，帧解码分为关键帧解码、准关键帧解码和WZ帧解码；对关键帧采用传统的帧内解码方法；对准关键帧根据块信息解码，分为帧间模式、帧内模式、Skip模式解码；对WZ帧根据块信息解码，分为WZ模式、粗糙帧内模式、Skip模式解码；存储器内存储一个GOP中的解码后的关键帧和准关键帧。

解码算法由LDPC迭代解码、四次运动估计补偿、去方块滤波等环节来实现，因此具有较高的解码复杂度。具体包括如下步骤：

第一步：从传输信道接收码流，对模式码流进行熵解码，帧分为关键帧、关键帧和WZ帧；读出帧组GOP的长度信息

；对关键帧采用用H.264的帧内解码器解码；

第二步：生成参考帧

解码端的参考帧运用和编码端相同的方法来产生，即用解码的关键帧根据公式（1）生成参考帧

，并保存在存储器中；

第三步：准关键帧的解码

对准关键帧的块模式信息码流采用熵解码，分为Inter块、Intra块和Skip块。Skip块通过参考帧

的相同位置的块来恢复，即

；Intra块通过传统的帧内解码方式恢复,　解码后保存在存储器中；Inter块通过传统的帧间解码方式恢复，即对码流熵解码、反量化、反变换得到残差

，则Inter块的值为残差

加上参考帧

相同位置的块的像素值，即

　　　　　　　　　　　　　　（12）

其中

为Intra块像素的坐标。准关键帧解码后一方面通过h.264去方块滤波器滤波后显示，另一方面保存在存储器中；

第四步：产生边信息帧

在解码端，根据GOP长度，以GOP为单位，一组帧组产生一个边信息帧。对应与编码端，一个帧组有两种情况组成：包含头尾一个关键帧和一个准关键帧;或包含头尾两个关键帧。第一种情况下，边信息帧Y由解码的关键帧

和准关键帧

之间通过基于8×8块的双向运动补偿内插法来产生，即

　　（13）

其中

为内插帧像素的坐标；

和

解码的关键帧和准关键帧之间的前向和后向的运动矢量，

和

与公式（5）相等；

第二种情况下，边信息帧Y由解码的关键帧

和之间通过基于8×8块的双向运动补偿内插法来产生，即

　　（14）

其中

和

解码的关键帧之间的前向和后向的运动矢量，

、

和

与公式（5）相等；

第五步：WZ帧中Skip块和块的解码

对WZ帧的块模式码流采用熵解码：分为Skip块、WZ块和

块。Skip块通过其相邻关键帧解码后的相同位置的块来恢复，即

。

块通过帧内解码方式恢复,　解码后保存在存储器中。由帧内块和Skip块解码部分重构WZ帧

；

第六步：边信息的修正

针对当前解码WZ帧，利用部分重构WZ帧，对边信息进行修正，这个边信息对后续的WZ块重构产生好的效果。具体的边信息进行修正步骤为：

用部分重构WZ帧的像素值在帧内块和Skip块的位置上来替代边信息帧Y中的像素值，产生新的边信息帧Y’，即

　　　　　　　（15）

接下来在WZ块的位置，对解码的关键帧

以边信息帧Y’为参考帧基于8×8块进行前向运动估计，产生运动矢量

和块最小绝对残差和

保存在缓冲器中。同样，在WZ块的位置，对解码的关键帧以边信息帧Y’为参考帧基于8×8块进行后向运动估计，产生运动矢量

和块最小绝对残差和

，比较四个绝对残差和

、

、

和的大小，通过式（16）来修正边信息。即

　（16）

其中

为边信息帧中WZ块的坐标，本专利采用部分重构WZ帧来修正边信息，充分利用了WZ帧中已解码帧内块和Skip块的信息，如果部分重构WZ帧与关键帧或准关键帧之间的相关性比关键帧之间或关键帧与准关键帧之间的相关性强，则选择用部分重构WZ帧来修正边信息。可以看出，Y’由当前解码WZ帧产生，不同的WZ帧产生不同的Y’，一组帧组产生的修正边信息帧Y’的个数和该帧组WZ帧的个数相等；

第七步：生成残差帧

与编码端残差帧相对应，解码端的残差帧为：

；

第八步：在生成残差帧中，仅对与当前解码WZ块相同位置的块进行DCT变换和量化，形成频域系数

；

第九步：WZ块的解码

WZ块解码根据接受到的校验位和解码器端的边信息用信道解码方式恢复频域信息，边信息指中与当前WZ块相同位置的系数块。接下来对WZ块频域系数进行精细重构：经过Skip块、WZ块和

块的解码的过程，可以得到恢复的频域码流，假设此恢复是无差错的。由于恢复的频域码流含有编码端传送的信息，并且

与

有很强的相关性，本专利通过采用公式（17），即通过恢复的频域码流来精细重构最终的频域系数

；

（17）

其中

和

分别为根据恢复的频域信息推断的

的最大值和最小值。次方法用恢复的

的位平面信息限制了单纯由

位平面重构

而产生的失真；对

反量化，逆离散余弦变换（IDCT），恢复残差值D'。　

最后，参考帧被用于恢复WZ块原始像素W'，即

（18）

其中

为WZ块的坐标；

第十步：恢复WZ帧，并通过h.264去方块滤波器滤波后显示。

图8为本发明的编码算法的程序实现流程图，下面对其编码算法的实施步骤进行详细说明：

步骤1：由摄像头从传输信道接收码流，设定帧组（GOP）的最大帧数L, 设定门限值T1、T2；

步骤2：每个图像组的第一帧作为关键帧进行H.264帧内编码，生成关键帧码流通过传输网络发送到解码端；

步骤3：对关键帧采用H.264帧内解码，解码后保存在存储器中；

步骤4：用解码恢复关键帧来生成参考帧

；　

步骤5：用当前编码帧与其参考帧的差值来生成残差帧D，对残差帧进行8×8块划分，用公式（3）分别计算各块的绝对残差和

；

步骤6：根据

，利用公式（3）对当前编码帧中的块进行块模式

判断，块分为三种类型：Skip块、WZ块和

块；

步骤7：根据帧中的块模式统计结果来确定当前帧的模式： Skip块或WZ块数量最多情况下帧的模式设置为WZ帧，

块数量最多，则当前帧的模式为帧内帧；

步骤8：自适应帧组方式：根据步骤（7）自适应设置图像为WZ帧或关键帧，并强制设置关键帧前WZ帧为准关键帧，结合相同设定的最大（GOP）长度L来设计帧组。自适应帧组有两种情况组成：包含头尾两个关键帧，组（GOP）长度

;或包含头尾一个关键帧和一个准关键帧，帧组（GOP）长度

；

步骤9：模式码流采用熵编码压缩后发送到解码端；

步骤10：对准关键帧采用基于块的帧内、帧间混合编码方式编码，形成帧间、帧内码流发送到解码端；

步骤11：对准关键帧采用基于块的帧内、帧间混合解码方式解码，解码后保存在存储器中；

步骤12：对WZ帧采用基于块的混合分布式编码方式编码，首先形成Intra/WZ 码流发送到解码端；

步骤13：WZ块采用基于编码端码率控制算法的Wyner-Ziv编码，形成WZ码流发送到解码端；

图9为本发明的解码算法的程序实现流程图，下面对其解码算法的实施步骤进行详细说明：

步骤1：从传输信道接收码流，对模式码流进行熵解码；

步骤2：读出帧组GOP的长度信息

；

步骤3：读取帧模式信息，分为关键帧、关键帧和WZ帧；

步骤4：对关键帧采用用H.264的帧内解码器解码；

步骤5：用解码的关键帧根据公式（1）生成参考帧

，并保存在存储器中；

步骤6：准关键帧的解码：读取准关键帧的块模式信息，分为Inter块、Intra块和Skip块，Skip块通过参考帧

的相同位置块来恢复，Intra块通过传统的帧内解码方式恢复,Inter块通过传统的帧间解码方式恢复，准关键帧解码重构后保存在存储器中；

步骤7：产生边信息帧： GOP为单位产生一个边信息帧。帧组有两种情况组成：包含头尾两个关键帧，该情况下通过公式（13）产生边信息帧Y;或包含头尾一个关键帧和一个准关键帧，该情况下通过公式（14）产生边信息帧Y;

步骤8：WZ帧中Skip块和

块的解码：读取WZ帧的块模式信息，分为Skip块、WZ块和

块。Skip块通过参考帧

的相同位置块来恢复，块通过粗糙帧内解码方式恢复,由帧内块和Skip块解码部分重构WZ帧

；

步骤9：利用部分重构WZ帧和边信息帧Y,利用公式（15）和公式（16），生成修正的边信息帧Y’；

步骤10：生成残差帧，并离散余弦变换（DCT）、量化，形成频域系数

；

步骤11：WZ块解码根据接收到的校验位和边信息解码恢复频域信息，并利用公式（17）对WZ块频域系数进行精细重构,并反量化、反变换，重构出WZ块数据；

步骤12：按块位置对WZ帧的Skip块、WZ块和

块数据进行复接、恢复出WZ帧。

对本发明提出的DVC方案在假设无损传输信道下做了初步测试实验，采用标准测试序列：Forman和Carphone做输入视频，以QCIF分辨率和15帧/秒进行测试。一些相关对比实验包括：

（1）PDDVC-ERC:像素域编码器端码率控制的DVC

（2）h.264 的帧间编码（I-B-B-B）

（3）h.263+的帧内编码（I-I-I-I）

（4）欧洲DOSCOVER项目组提出的DOSCOVER分布式编码器

Forman序列和Carphone序列测试结果如图10和11所示。

第一，与DOSCOVER相比，本发明算法在对Forman序列实验中可获得2.5分贝的改善和对Carphone序列实验中可获得3分贝的改善。本专利在编码过程中利用了序列的时间相关性，Carphone序列的时间相关性比Forman序列强，所以改善效果更明显。

第二，与PDDVC-ERC相比，本发明算法在对Forman序列实验中可获得1.8分贝的改善和Carphone序列实验中可获得1.5分贝的改善。像素域编码器端码率控制的DVC（PDDVC-ERC）已经考虑了序列的时间相关性，本发明利用空间相关性对边信息进行修正，使PSNR进一步提高。同时实验发现，本专利的编码时间与PDDVC-ERC编码时间大致相同，体现了“低复杂度编码”的特点。

综上所述，本发明从权衡编码复杂度和编码压缩性能的角度来设计实用视频编码***：提出在基本不增加运算量的情况下，编码端进行部分帧间相关估计的方法，另外，通过设置关键帧和WZ帧之间的数量来获得各种要求的编码效果，并考虑K帧数量和辅助信息质量之间的权衡，提高整个***的编码效率和最终的解码质量。与现有的一些DVC***相比，在计算量略微提高的条件下，很大程度地提高了其率失真性能。

以上显示和描述了本发明的基本原理、主要特征及优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界。

Claims

1.一种基于模式决策的自适应帧组分布式视频编码方法，其特征在于：包括如下步骤：

，即

　　　　　（1）

其中为当前编码帧相邻的前一个已解码的关键帧；

（4）用当前编码帧X与其参考帧

的差值来生成残差帧D，即残差帧为：

　　　　（2）

其中

为帧像素的坐标；

（5）对步骤（4）中得到的残差帧进行8×8块划分，分别计算各块的绝对残差和SAD，第K块的绝对残差和为

；

（6）根据步骤（5）中计算得到的

利用公式（4）对当前编码帧中的块进行块模式判断，块分为三种类型：Skip块、WZ块和

块；

　　　　　（4）

其中T1、T2是通过实验预先设定的门限值；

块数量大于Skip块和WZ块数量之和，设置当前帧为关键帧；

（9）对模式信息码流的熵编码：按照帧的次序以头信息方式对每帧进行模式信息编码，对于关键帧，只需设置帧级头信息，对于准关键帧和WZ帧，需设置帧级头信息和块级头信息，对于块头信息采用“从左到右，从上到下”的顺序进行扫描，形成块模式信息码流，模式信息码流包括帧组长度、帧级头信息和块级头信息，模式码流采用熵编码压缩后发送到解码端。

2.根据权利要求1所述的基于模式决策的自适应帧组分布式视频编码方法，其特征在于：步骤（5）中所述的绝对残差和为

利用公式（3）计算得到，即：

　　　　　（3）

其中

为残差帧第K个8×8块像素的坐标。

3.根据权利要求1或2所述的基于模式决策的自适应帧组分布式视频编码方法，其特征在于：步骤（8）中所述的准关键帧的编码方法为在准关键帧中设置与步骤（6）中Skip块、WZ块和

块，采用H.264帧内编码方式。

4.根据权利要求3所述的基于模式决策的自适应帧组分布式视频编码方法，其特征在于：步骤（8）中所述的WZ帧的编码方法为对Skip块无需进行编码，只需向解码端发送块的编码模式信息；对WZ块采用目前分布式编码中的Wyner-Ziv编码模式；对

块采用编码质量低于关键帧的粗糙帧内编码方式。

5.根据权利要求4所述的基于模式决策的自适应帧组分布式视频编码方法，其特征在于：所述的Wyner-Ziv编码模式为：对WZ块的残差进行8×8 DCT变换，统一量化后提取位平面，输出频域系数

，并送入LDPC编码器编码，采用编码端码率控制器ERC来控制哪些部分校验码需要传输，通过编码端码率控制，得出LDPC编码器产生的校验信息需要传送到解码端的位平面数N和每个位平面需要传输到解码端的码率

。

6.一种基于模式决策的自适应帧组分布式视频解码方法，其特征在于：帧解码分为关键帧解码、准关键帧解码和WZ帧解码；对关键帧采用传统的帧内解码方法；对准关键帧根据块信息解码，分为帧间模式、帧内模式、Skip模式解码；对WZ帧根据块信息解码，分为WZ模式、粗糙帧内模式、Skip模式解码；存储器内存储一个GOP中的解码后的关键帧和准关键帧，包括如下步骤：

（1）读取帧组长度

，对关键帧采用用H.264的帧内解码器解码；