CN1067832C

CN1067832C - 视频编码器实现的改进方法

Info

Publication number: CN1067832C
Application number: CN97104376A
Authority: CN
Inventors: 朱雪龙; 谢波
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 1997-05-23
Filing date: 1997-05-23
Publication date: 2001-06-27
Anticipated expiration: 2017-05-23
Also published as: CN1200629A

Abstract

本发明属运动图象编码技术领域。本发明包括运动估计、帧预测与预测误差生成，变换与量化、图象重建、熵编码四部分；其特征在于，在运动估计部分，对分级搜索过程中每级搜索结果都进入判决器G，在编码部分中，在对预测误差PE进行DCT之前进入判决器L，可省去大量变换和搜索的运算，从而大大提高了编码的速度。

Description

视频编码器实现的改进方法

本发明属运动图象编码技术领域。

(1)在当今信息化时代，图象的存储和传输变得愈来愈重要。由于图象原始数据信息量十分巨大，要在有限容量的存储介质存储图象和有限容量的信息通道传输图象，图象数据的压缩，也就是对运动图象进行编码是必不可少的。运动图象编码是通过综合利用图象信号在时间、空间、统计三方面的冗余度，以及场景的知识、人的视觉特性来实现的。目前较为成熟的编码方法是综合了预测编码、变换编码、熵编码几种编码方法以及运动补偿技术的混合编码方法。

其中一种编码实现方法如图1所示，包括以下步骤：

(1)对输入的当前图象和上一重建图象作运动估计ME，运动估计得到运动矢量MV；

(2)根据运动矢量对上一重建帧作预测P，获得对当前图象的预测图象；

(3)将当前图象减去当前图象的预测图象得到预测误差PE；

(4)对预测误差作离散余弦变换DCT和量化Q；

(5)对(4)的结果作变长编码VLC得到当前编码图象；和

(6)对(4)的结果作逆量化IQ、逆离散余弦变换IDCT得到重建的预测误差，再与当前预测图象相加得到当前重建图象，经帧存储器FM变成上一重建图象。

图1中各步骤的功能如下：

运动估计、预测及预测误差的计算(减法器)构成预测编码，是为了消除图象信号在时间上的相关性。图象在时间上的相关性表现为当前帧图象的某一部分是由上一帧图象的某一部分经过运动而得到的。而运动是通过运动矢量来描述的，运动估计就是要求得运动矢量，而预测则是根据运动矢量来补偿、抵消当前帧图象与上一帧图象部分之间因运动而产生的信号的变化。

离散余弦变换DCT构成变换编码，目的是为了消除图象信号在空间上的相关性。量化Q既是后面熵编码的需要，又是利用了人的视觉特性来提高编码的质量。

变长编码VLC构成熵编码，进一步消除了图象信号的统计的相关性。

逆量化IQ、逆离散余弦变换IDCT、加法器实现图象重建，为预测提供参照物。

现有实现上述混合编码方法的编码器如图2所示。图中块DCT、块Q、块IQ、块IDCT、块VLC是指一帧(一幅)图象中一块(按国际标准为8×8象素)为单位进离散余弦变换DCT，量化Q、逆量化IQ、逆离散余弦变换IDCT、变长编码VLC。宏块P是指以一帧图象中一个宏块(按国际标准为6个块)为单位进行预测P。宏块MV指宏块的运动矢量。0块是指块中8×8个元素都为0。

该编码器实现的工作过程为：首先，一帧(一幅)图象是以一块(8×8象素)或一宏块(6个块)为单位进行编码的。其次，整个编码过程分为两部分：运动估计和编码核心如图2虚框。当前帧宏块首先进入运动估计部分作运动估计，运动估计得到运动矢量MV，输入到编码核心对当前帧宏块进行编码，具体分为如下步骤：

首先，对当前帧宏块和上一重建帧宏块作运动估计。运动估计分为整象素搜索和半象素搜索两步。整象素搜索采用分级运动搜索方法，即将搜索域分级：静止点、小搜索域、大搜索域。这是典型的3级，具体实现可以有变化，如2级：静止点、小搜索域，即将小搜索域与大搜索域合并；或4级：静止点、小搜索域、大搜索域、更大搜索域，即将大搜索域再细分两级，但至少要两级。在前两级搜索域搜索结束后要进入判决器A、B进行判断，判断是否满足判据而可以停止整象素搜索进入到半象素搜索和后面的编码核心，具体的判决准则可能是多种多样的。

其次，进到编码核心以后，根据运动估计得到宏块的运动矢量对上一重建帧宏块进行预测得到当前预测帧宏块，然后用减法器将当前帧宏块减去当前预测帧宏块计算预测误差，接着做DCT、Q。

最后，DCT和Q结束后要进入判决器，判断当前数据块是否为0块，由于0块对后续的熵编码和图象重建毫无作用，所以当判决出当前数据块是0块，则当前块的编码过程结束，返回到预测和减法器去进行下一块的处理；若为非0块，则进行熵编码和图象重建。

这种编码器的实现方法的不足在于编码速度不够高。对QCIF格式简单运动图象序列(如Claire序列)，利用Pentium-133 PC仍无法做到软件实时编码(25帧/秒)。

本发明的目的在于克服已有技术的不足之处，在原有编码方法的基础上增设对图象中大量零数据的判断，在基本不或少许降低其他性能的前提下，提高编码器速度。

本发明提出一种视频编码器实现的改进方法，其特征在于，包括以下各步骤：

(1)对当前帧宠块和上一重建帧宠块作运动估计，运动估计包括整象素搜索和半象素搜索，整象素搜索采用分级运动搜索方法，将搜索域分级：静止点、小搜索域、大搜索域(这是典型的3级，具有实现可以有变化，同前)，每一级搜索域搜索结束后，都进入判决器G，判断在当前这一级搜索得到的运动\矢量经预后计算预测误差，那么当前预测误差宏块是否经DCT、Q变为0宏块(宏块中6个块都为0块)，若是则当前宏块的编码过程结束，转到下一宏块；否则则继续下一级的搜索，整象素搜索完成后进入半象素搜索，半象素搜索结束后得到运动矢量，进入编码核心：

(2)进到编码核心以后，根据运动估计得到宏块MV的运动矢量对上一重建帧宏块进行预测得到当前预测帧宏块，然后用当前帧宏块减去当前预测帧宏块计算预测误差；

(3)对预测误差先不作DCT、Q而提前进入判决器L进行判断，判断当前误差块经DCT、Q是否变为0块，若是则结束当前块的编码过程，转到当前宏块的下一块；若为非0块，则进行DCT、Q。

(4)由于判决器L不能保证将所有经DCT、Q变为0的预测误差全部提前判断出来，故在DCT、Q之后仍保留一判决器，判断经DCT、Q以后当数据块是否为0块，若是则不必进行后续处理过程，转到下一块；若否则对这些非0块作熵编码与图象重建。

本发明与现有技术相比有如下特点：

第一，在编码核心部分，在进行DCT、Q之前增加了一个变换前判决器L，该判决器L可以将那些大多数经DCT、Q变为0块的预测误差块提前判断出来而不必做DCT、Q，这样可省去大量做DCT、Q的运算。

第二，在运动估计中的每一级搜索结束后设置全局判决器G，全局判决器G中判据是一旦满足，则对该宏块的整个编码过程就结束了，也就是不但结束整象素搜索过程，而且连半象素搜索、整个编码核心都不必做了，从而大大提高了编码的速度。

附图的简要说明：

图1为混合编码方法框图。

图2为已有的视频编码器结构框图。

图3为本发明的视频编码器结构框图。

图4为本实施例的判决器L的实现流程图。

图5为本实施例的判决器G的实现流程图。

采用本发明编码方法实现视频编码器的一种实施例如图3一图5所示。结合各图，详细描述如下：

本发明所述的新型视频编码器的实现框图如图3所示，其工作包括以下步骤：

1、对当前帧宏块和上一重建帧宏块作运动估计即运动矢量的搜索。运动矢量的搜索包括整象素搜索和半象素搜索。首先进行整象素搜索。整象素采用分级运动搜索方法，步骤如下：

a．静止点搜索，判断当前预测误差宏块是否满足判决器G中的判据，即是否经DCT变换，量化Q后变为0宏块(宏块中6个块都为0块)，如果满足则执行2，否则继续；

b．小搜索域搜索，判断当前预测误差宏块是否满足判决器G中的判据，如果满足则执行2，否则继续；

c．大搜索域搜索，判断当前预测误差宏块是否满足判决器G中的判据，如果满足则执行2，否则执行3；

2、由当前搜索到的运动矢量和上一重建帧得到当前预测宏块，当前预测宏块即为当前的重建宏块，执行6；

3、进行半象素搜索，得到运动矢量，由运动矢量和上一重建帧得到当前预测宏块，然后用当前帧宏块减去当前预测宏块计算预测误差，判断预测误差是否满足判决器L的判据，如果满足，当前预测宏块即为当前的重建宏块，执行6，否则继续；

4、作DCT变换，量化Q，判断经DCT、量化Q后当前数据块是否为0块，如果是，当前预测宏块即为当前的重建宏块，执行6，否则继续；

5、反量化IQ，反DCT变换，得到的结果和当前预测宏块相加得到当前重建宏块；

6、进行熵编码，当前宏块编码结束，进入下一宏块的编码。

本发明的判决器L、G的具体实现框图如图4、5所示，分别描述如下：

判决器L依赖于一个块判决准则(可称为序判据)，该准则为：对一8×8块数据，用集{f(x,y)｜x,y=0,1,…,7}来表示，具体到图3为预测误差块，用集{f(x,y)｜x,y=0,1,…,7}来表示。当满足

((x_{i_{0}} + y_{i_{0}}) \cdot \cos^{2} \frac{π}{16} + (x_{i_{1}} + y_{i_{1}}) \cdot \cos^{2} \frac{3 π}{16} + (x_{i_{2}} + y_{i_{2}}) \cdot \cos^{2} \frac{5 π}{16} +

(x_{i_{3}} + y_{i_{3}}) \cdot \cos^{2} \frac{7 π}{16}) < 20 QP

，则当前块经DCT、Q变为0块。其中，

x_{i_{0}} &GreaterEqual; x_{i_{1}} &GreaterEqual; x_{i_{2}} &GreaterEqual; x_{i_{3}}, i_{0}, i_{1,} i_{2}, i_{3} ϵ {0,1,2,3}

且互不相同，

x_{j} = Σ_{i = 0}^{7} | i, j | + Σ_{i = 0}^{7} | f (i, 7 - j) |, j = 0,1,2,3,

y_{i_{0}^{'}} &GreaterEqual; y_{i_{1}^{'}} &GreaterEqual; y_{i_{2}^{'}} &GreaterEqual; y_{i_{3}^{'}}, i_{0}^{'}, i_{1}^{'}, i_{2}^{'}, i_{3}^{'} ϵ {0,1,2,3}

且互不相同，

y_{i} = Σ_{j = 0}^{7} | f (i, j) | + Σ_{j = 0}^{7} | f (7 - i, j) |, i = 0,1,2,3 .

QP为该块所在宏块的两化参数，为一个量化步长的一半(对宏块编码而言，QP是确定的)。这样，判决器L的实现流程图如图4所示。图4：

对预测误差块{f(x,y)｜x,y=0,1,…,7}做行和列的分别处理：对行，首先计算各行绝对值之和

Σ_{y = 0}^{7} | f (x, y) | = u_{x}, x = 0,1, \cdot \cdot \cdot, 7

接着，u_x=u_x+u_7-x,x=0,1,2,3，对u₀,u₁,u₂,u₃按从大到小的顺序排列

x_{i_{0}}, x_{i_{1}}, x_{i_{2}}, x_{i_{3}};

对列，计算各列绝对值之和

Σ_{x = 0}^{7} f (x, y) = v_{y}, y = 0,1, \cdot \cdot \cdot, 7

计算v_y=v_y+v_7-y,y=0,1,2,3，对按从大到小的顺序排列

y_{i_{0}^{'}}, y_{i_{1}^{'}}, y_{i_{2}^{'}}, y_{i_{3}^{'}},

计算

最后作比较：sum＜20QP？当sum＜20QP，则满足判据，当前DFD块经DCT、Q变为0块；sum≥20QP，则不满足判据。

判决器G实现方法：

判决器G实现的是宏块的判决，而一个宏块为6个块，所以宏块的判决可分为6个块的判决，而块的判决可以用前面判决器L的方法。图5是判决器G的实现流程图。

图5中：

首先计算当前预测误差PE宏块，

PE宏块=当前帧宏块一当前预测帧宏块，其次利用序判据对PE宏块中6个块每个块作判决：当前块经DCT、Q变为0块，当6个块都满足序判据，则整个宏块满足判据。

下面给出在Pentium-133PC机上对QCIF格式的简单序列Claire序列和复杂序列Foreman序列的编码参数及编码速度。Claire序列：I帧量化参数为5,P帧量化参数为7(即前面公式

QP=7)，运动估计中的整象素搜索采用两级搜索：静止点、

小搜索域，区域长度为5，每一级搜索算法为采样法，采样

间隔为3，块匹配运算采用亚采样方法。

结果：编码帧率(速率)达到平均25帧/秒。Foreman序列：I帧量化参数为15,P帧量化参数为15(即前面公

式QP=15)，运动估计中的整象素搜索采用三级搜索：静止

点、小运动区域(区域长度为4)，大搜索域(区域长度为10)，

每一级搜索算法为采样法，采样间隔为3，块匹配运算采用

亚采样方法。

结果：编码帧率(速率)达到平均10帧砂。

Claims

1、一种视频编码器实现的改进方法，其特征在于，包括以下各步骤：

(1)对当前帧宠块和上一重建帧宠块作运动估计，运动估计包括整象素搜索和半象素搜索，整象素搜索采用分级运动搜索方法，将搜索域分级：静止点、小搜索域、大搜索域(这是典型的3级，具有实现可以有变化，同前)，每一级搜索域搜索结束后，都进入判决器G，判断在当前这一级搜索得到的运动\矢量经预后计算预测误差，那么当前预测误差宏块是否经DCT、Q变为0宏块(宏块中6个块都为0块)，若是则当前宏块的编码过程结束，转到下一宏块；否则则继续下一级的搜索，整象素搜索完成后进入半象素搜索，半象素搜索结束后得到运动矢量，进入编码核心；