CN1832562A

CN1832562A - Dvd编码方法和编码器

Info

Publication number: CN1832562A
Application number: CN 200510135615
Authority: CN
Inventors: 刘永平
Original assignee: SHENZHEN ZHONGKENUO DIGITAL TECHNOLOGY Co Ltd
Current assignee: SHENZHEN ZHONGKENUO DIGITAL TECHNOLOGY Co Ltd
Priority date: 2005-12-31
Filing date: 2005-12-31
Publication date: 2006-09-13

Abstract

一种用于DVD的H.264编码方法，包括以下步骤：首先把当前帧Fn划分成宏块，宏块有帧内和帧间两种模式，其中帧内模式使用当前帧内已编码的宏块进行预测，帧间模式使用以往一个或多个帧作为参考，通过运动位移估计ME以及运动补偿MC，进行运动预测；然后，对预测值和原始值的差值进行变换T、量化Q、重新排序和熵编码；对量化系数X进行逆量化Q^－1、逆变换T^－1后，与预测系数相加，得到未经滤波的uF’帧，对uF’帧进行块间滤波，得到当前重构帧Fn’。本发明还同时公开了一种实现上述方法的H.264编码器，该方法和编码器能够适应更高图像质量和低速码率应用的需求。

Description

DVD编码方法和编码器

技术领域

本发明涉及视频压缩解码技术，尤指一种用于DVD高清解码板的视频压缩编码方法和装置。

背景技术

数字视频技术在通信和视听领域获得了日益广泛的应用，特别是20世纪90年以来，随着Internet和移动通讯的迅猛发展，视频信息和多媒体信息在Internet和移动网络中的处理和传输技术成为了当前我国信息化中的热点。

众所周知，视频信息具有一系列优点，如直观性、确定性、高效性、广泛性等。但视频编码信息的信息量太大，要使视频得到有效的应用，必须首先解决视频压缩编码问题，其次解决压缩后视频质量保证问题。

为此，人们付出了巨大的辛勤的劳动，如今已结出了***的成果。从1984年CCITT公布第1个视频编码国际标准以来，迄今为止的21年中，ITU-T等国际标准化组织陆续颁布了将近10个视频编码国际标准，大大推动了视频通讯和视听技术的发展，但是严格地讲，视频通信和视听这两大领域至今的发展不能令人满意，总起来讲，应用的范围不广，主要是视频压缩与质量之间的矛盾不能很好的解决。例如：可视电话一直被认为是一种理想的通信设备，可近30年来至今未能普及，就是因为性能价格比不高。

1984年，CCITT第15研究组发布了数字基群电视会议编码标准H.120建议。1988年CCITT通过了视像编码标准H.261建议，被称为视频压缩编码的一个里程碑。从此，ITU-T，ISO等公布的基于波形的一系列视频编码标准的编码方法都是基于H.261中的混和编码方法。

1986年，ISO和CCITT成立了***际专家组。研究连续色调静止国际压缩算法国际标准，1992年7月通过了JPEG标准。

1988年，ISO/IEC信息技术联合委员会成立了图像专家组。1991年公布了MPEG-1视频编码标准，码率为1.5Mbit/S，主要应用于家庭VCD的视频压缩。1994年11月，公布了MPEG-2标准，用于数字视频广播(DVB)，家用DVD的视频压缩及高清晰度电视(HDVT)。码率从4Mbit/S、15Mbit/S直至100Mbit/S，分别用于不同标准和不同级别的视频压缩中。

1995年，ITU-T推出H.263标准，用于低于64Kbit/S的低码率视频传输，如PSTN信道中的可视会议，多媒体通讯等。2000年，又分别公布了H.263+，H.263++等标准。

1999年12月份，ISO/IEC通过了“视听对象的编码标准——MPEG-4，它除了定义视听压缩编码标准外，还强调了多媒体通信的交互性和灵活性。

2003年3月，ITU-T/ISO正式公布H.264视频压缩标准，由于其具有比以往标准更出色的性能，被人们称为新一代视频编码标准。具体而言，与H.263或MPEG-4相比，在同等质量下，其数码率能降低一半左右，或者说在同样码率下，其信价比能得到明显提高。由此，H.264标准在国际上受到广泛的重视与推广，其不仅显著提高了压缩比，而且具有良好的网络亲和性，已经广泛应用于网络通信、多媒体通信、高清电视中，同样也为高清DVD的性能提高与普及，带来了革命性的机遇和挑战。然而，作为高端视听产品——DVD，如何采用H.264编码标准，则成为一个亟待解决的问题。

发明内容

有鉴于此，本发明的主要目的在于提供一种适用于DVD的H.264编码方法，实现简单、方便、灵活。

本发明的另一目的在于提供一种适用于DVD的H.264编码器，能够适应更高图像质量和低速码率应用的需求。

为达到上述目的，本发明的技术方案是这样实现的：

一种用于DVD的H.264编码方法，其特征在于至少包括以下步骤：

a.首先把当前帧Fn划分成宏块，宏块有帧内和帧间两种模式，其中帧内模式使用当前帧内已编码的宏块进行预测，帧间模式使用以往一个或多个帧作为参考，通过运动位移估计ME以及运动补偿MC，进行运动预测；

b.然后，对预测值和原始值的差值进行变换T、量化Q、重新排序和熵编码；

c.对量化系数X进行逆量化Q^-1、逆变换T^-1后，与预测系数相加，得到未经滤波的uF’帧，对uF’帧进行块间滤波，得到当前重构帧Fn’。

为实现上述目的，本发明还提供一种用于DVD的H.264编码器，其特征在于包括：

帧内频测选择单元，把当前帧Fn划分成宏块，宏块有帧内和帧间两种模式；

帧内预测单元，对于所述帧内模式，使用当前帧内已编码的宏块进行预测，

运动位移估计单元和运动补偿单元，对于所述帧间模式，使用以往一个或多个帧作为参考，通过运动位移估计ME以及运动补偿MC，进行运动预测；

变换单元和量化单元，对预测值和原始值的差值进行变换T、量化Q；重新排序和熵编码单元，对量化后的信号进行重新排序和熵编码；

逆量化单元和逆变换单元，对量化系数X进行逆量化Q^-1、逆变换T^-1；

重构帧单元，与预测系数相加，得到未经滤波的uF’帧，对uF’帧进行块间滤波，得到当前重构帧Fn’。

根据本发明的优选实施例，其中所述H.264编码器，还包括滤波器，对所得到的uF’帧进行滤波。

附图说明

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步的详细描述，其中：

图1为本发明的采用H.264编解码***的高清DVD解码板的示意图；

图2为本发明的解码主芯片AM3418的方框图；

图3为本发明的H.264编解码***的示意图；

图4为本发明视频压缩解码方法的实现流程图；

图5为本发明的片层码流结构的示意图；

图6为本发明以及现有技术的帧存放结构的示意图；

图7为本发明的全局变量结构的示意图；

图8为本发明的INTRA16×16宏块解码的示意图；

图9为本发明的INTRA4×4宏块解码的示意图；

图10为本发明的INTRA宏块解码的流程图；

图11为本发明的1/4像素插值；

图12为本发明的H.264编码器的详细方框图；和

图13为本发明的H.264解码器的详细方框图。

具体实施方式

众所周知，MPEG-4技术的重点是灵活，具有很好的扩展性，可进行时域和空域的扩展。MPEG-4为了支持高新压缩，基于内容交互和基于内容分级扩展。而H.264支持3个不同档次的应用：

①、基本档次：主要用于“视频会话”

②、扩展档次：主要用于网络的视频交流

③、主要档次：主要用于消费电子应用，如数字电视广播，数字视频

存储、播放——DVD产品。

H.264/AVC标准自公布之日起，已成为数字电视，视频通信。网络媒体，多媒体短信息等领域的领先技术，并在以上领域均已成功导入，创造了明显的经济效益，使其应用到的电子产品及传输质量得到了极大提高。由于H.264并不明确地规定一个编码器如何实现，而是规定了一个编了码的视频比特流的句法，和该比特流的解码方法。各个制造厂商的编码器和解码器在此框架下应能互通，在实现上具有较大的灵活性，因此同为视听领域的DVD技术，完全具备导入H.264的一切条件，技术上是非常可靠的。然而如何导入H.264，需要在DVD的编码以及解码方式上，从硬件到软件做非常细致的设计与改进。

参见图1，本发明的高清DVD解码板采用H.264编解码***。该DVD解码板至少包括：电机驱动单元，伺服控制单元VT7208，解码及DSP处理AM3418，视频处理单元，音频处理单元，SDRAM4X16M，FLASH ROM，以及EPROM29LV800。其中主芯片AM3418控制的电机驱动***控制光头的进给和主轴的转动，伺服控制芯片VT7208完成光头的聚焦和循迹控制，同时检测和自动增益***也由VT7208来完成，从而得到信号幅度及相位正确的RF信号，又经VT7208处理解调后得到音视频信号。解调后的信号经由DSP信号处理，得到64位的数字信号。信号由SDRAM存储，缓冲并经由数字滤波后送经AM3418进行编解码处理。在本实施例中，***的所有运作和控制均是由EPROM29LV800所存储的微码来执行的。

参照图2，经由解码后的数字音视频信号经由AM3418内部D/A转换，视频输出，视频分量输出，音频输出，数字音频信号以及各种所需的模拟分量输出。

参照图3，示出了本发明的H.264编解码***，其中所有的编解码***都由主芯片AM3418来完成。一个视频编解码***包括图像的采集、编码传输以及图像的解码、回放。在图3的H.264编解码***中，RF信号经由解调及数字信号处理(DSP)之后，输入给数字滤波网络。数字滤波网络对该信号进行数字滤波，以得到合适的数字信号输入视频编码器。在H.264编码器中，完成输入信号的帧内预测，运动估计和扩展内存控制。

H.264/AVC中引入了一些新的压缩方法，以提高压缩效率，它具有如下特点：

(1)增强的运动补偿性能。采用树状结构的运动补偿和1/4像素精度的运动向量预测技术，使预测帧更接近原始帧，减少相互间的差异，去除时间上的数据冗余，提高编码的压缩率；

(2)采用更小块进行变换编码。以往的8×8DCT变换会引起系数失真，使重构帧与原始帧间存在误差。H.264使用4×4整型变换，保证逆变换系数不失真，并降低了运算复杂度；

(3)采用块间滤波器提高性能。由于编码是有损的，会引起重构以后块间亮度落差大、图像出现马赛克等现象，影响人的视觉感受。在块间使用滤波器，以平滑块间的亮度落差，可使重构后的图像更贴近原始图像；

(4)高性能的熵编码由于块间的DCT系数相关性大，H.264使用内容自适应变长度熵编码，减少了块间的相关性冗余，提高编码效率；

(5)采用SP和SI帧支持视频流间切换。H.264引入切换帧SP和SI的概念。解码器可以根据当前网络的状况使用切换帧，在不同质量的视频流间进行有效切换，解决切换过程中预测帧因缺乏参考帧而引起的解码错误。

以下将参照图12，图13，对本发明的H.264编码器和H.264解码器进行更为详细的说明。

如图12所示，编码时，首先把当前帧Fn划分成宏块。宏块有帧内和帧间两种模式。帧内模式使用当前帧内已编码的宏块进行预测；帧间模式使用以往一个或多个帧作为参考，通过运动位移估计ME以及运动补偿MC，进行运动预测。然后，对预测值和原始值的差值进行变换T、量化Q、重新排序和熵编码。对量化系数X进行逆量化Q^-1、逆变换T^-1后，与预测系数相加，得到未经滤波的uF’帧，对uF’帧进行块间滤波，得到当前重构帧Fn’。

如图13所示，解码过程相对比较简单，对应于编码器的各部分进行逆向操作，即可输出重构图像数据。

以下将参照图4至图11，分别从H.264解码器的框架、数据结构及其流程、码表及程序的优化作详细的阐述。

参照图4，H.264解码器总体框架主要包括主模块、入口模块、以及Slice、宏块解码的各个模块。解码通常可分成3个主要独立模块：取码、解码、输出(包括后处理)。

取码模块包括从码流中将数据读入缓冲，以及从缓冲中获得当前码值，在整个流程中要循环使用，是影响解码速度的一个关键模块。可以在一帧解码前读入足够一帧的码流以供解码；也可以设定一定大小的缓冲，并在每次取码时判断是否到达缓冲结尾处，如已至结尾处则更新缓冲内容。前一种方案要求缓冲较大，也难估计一帧码流的大小，但若***内存足够，建议采用此种方案，可避免像第二种方案中那样每次取码时的判断，从而影响解码速度。

解码模块是整个解码器中的核心，在H.264编码码流中，Slice是最小的字节对齐的单元，一个Slice的编码结构如图5所示。在Slice头结构中包括帧号、图像大小、参考帧号、量化参数(QP)等信息，宏块头中包括宏块类型、帧内预测模式、运动向量(MVD)，CBP(Coded Block Pattern)、量化参数微调(delta-QP)等信息。由此决定了整个解码的流程为：读Slice头信息→读宏块头(完成帧内预测或运动补偿)→残余系数解码。解码过程如图4所示。

图像输出模块包括图像滤波、图像输出格式的转换、图像插值等，这不是H.264解码器的特有部分，在此不再赘述。

图6示出了当前帧与参考帧的存放结构。其中图6a是现有的jm50c的帧存放结构，图6b是本发明解码器的帧存放结构，对每帧的亮度和色度分别加入一定大小的边框，可以简化程序设计。

在运动补偿中，1/2像素插值由周边6个像素亮度值按(1，-5，20，20，-5，1)加权中值滤波得到。考虑到四周边界上的像素插值，对图6b中的边框只要拷贝最靠近边界上的像素值即可。这样，在一定程度上简化了程序设计，是程序结构清晰。对图像加边，亦可支持无限制运动补偿。

参考帧与当前帧的存放采用同样的结构，一帧解码完成之后，只要交换参考帧与当前帧的起始存放地址即可，这样可避免如jm50c大块数据的移动，在一定程度上加快了解码的速度。其程序如下。

Tmp_frame＝frame_ref；

frame_ref＝frame_curr；

frame_curr＝tmp_frame；

程序将所有全局变量存放于三个结构中，如图7所示。其中H264_TABLES包括所有解码所用的码表，以数组存放，并在解码开始前驻入内存，相当于jm50c中将码表分别在各程序模块中定义，解码效率有所提高。

H264_IMAGE包括SLICE_HEADER和MAC-ROBLOCK两个结构，其中SLICE_HEADER存放解码当前Slice所用的全局变量，通常是从Slice头中得到的全局变量。MACROBLOCK则通常是当前宏块的全局变量。在主程序对所有全局变量分配整块内存，有助于提高内存使用效率。

需要注意的是，上述全局变量数据是为了编程上的方便，如考虑多路解码等，为避免命名上的冲突，除H.264_TABLES结构外，其它数据建议采用函数的参数传递方法实现，不要采用全局变量。

在jm50c中，I，P，B帧的解码采用同一模块，这需要大量的I，P，B帧及其INTRA，INTER宏块的重复判断，使解码速度受限。为此，并考虑到可扩展性，本发明的解码器将I帧、P帧(暂不包含B帧)分别独立解码。宏块解码亦分成INTRA16*16，INTRA4*4，IN-TER三个解码模块，以省去中间的重复判断，有效地提高了解码速度，程序结构也显得更为清晰，且由于各个模块地相对独立，有利于程序模的扩展。以下分别介绍各类宏块解码过程：

由于帧内预测是像素亮度或色度值的直接预测，它与系数反变换是两个完全独立地过程，因此，对于INTRA16*16宏块，如图8所示，首先完成帧内预测，然后解码变换系数，将帧内预测值直接加入前面所述地存储图像地内存，最后将整数反变换之后的值加入，即完成一个宏块地解码；对于INTRA4*4宏块，如图9所示，是一个4*4的块的解码过程，基于方法同INTRA16*16，通过16次循环，完成一个宏块的解码。

对于INTER宏块，如图10所示，主要包括运动向量的预测、宏块重建及运动残余的变换系数解码。运动向量预测包括宏块模式与子宏块模式，宏块重建有1/4像素插值，预测方式复杂，直接影响解码速度，程序各细节上的优化显得尤为重要。

对于宏块重建中1/4像素插值，如图11所示，G，H，M，N为整像素，其它a，b，......，r分别为1/2或1/4像素插值，a，b，......，r其插值方法各不相同，本实施例采用了函数指针，对各个插值分别采用独立的函数完成，一定程度上增加了代码的大小，但有效提高了解码速度。

H.264编码标准与以往采用的视频压缩标准最大的不同在于，在运动估计过程中采用了多参考帧预测来提高预测精度。多参考帧预测就是在编解码端建一个存储M个重建帧的缓存，当前的待编码块可以在缓存内的所有重建帧中寻找最优的匹配块进行运动补偿。

本发明的H.264编码和解码技术适用于DVD的视频压缩，并且具有以下技术特点：支持隔行视频，采用B片的帧间编码和采用加权预测的帧内编码；支持利用基于上下文的自适应的算术编码(CABAC)；支持利用基于上下文的自适应的可变长编码(CAVLC)；得到高的视频压缩比，约为MPEG-4的2倍；基于帧间预测的运动补偿预测编码，能够参照不同参数帧重构出相同的图像——即SP帧编码；采用自适应边界滤波器，点级滤波器，片级滤波器实现去方块滤波。

本发明的主要技术指标为：参考帧可达5～15帧，节约5％-10％的比特率；自适应搜索范围的快速算法是全局搜索算法的287倍，三步搜索算法的2.8倍；使用1/4分数像索精度搜索；信道误码率≤10-4；支持4:2:0的连续或隔行视频的编码和解码；运动向量的精度≥1/4像素；亮度最大值QP＝51，色度最大值QP＝39；输出亮度色度分量的信噪此比MPEG-4提高3dB。

通过各项参数对比，环境试验，导入H.264后的DVD产品，成本无太多的成本增加，但性能及视频质量有了极大的提高，完全可以与数字电视匹配，形成真正的数字家庭娱乐。H.264的导入能够使DVD产品真正进步高清时代。

尽管通过参照本发明的某些优选实施例，已经对本发明进行了图示和描述，但本领域的普通技术人员应当理解，可以在形式上和细节上对其作出各种各样的改变，而不偏离所附权利要求书所限定的本发明的精神和范围。

Claims

1、一种用于DVD的H.264编码方法，其特征在于至少包括以下步骤：

2、一种用于DVD的H.264编码器，其特征在于包括：

变换单元和量化单元，对预测值和原始值的差值进行变换T、量化Q；

重新排序和熵编码单元，对量化后的信号进行重新排序和熵编码；

3.根据权利要求2所述的H.264编码器，还包括滤波器，对所得到的uF’帧进行滤波。