CN1316824C

CN1316824C - 运动向量解交错的方法

Info

Publication number: CN1316824C
Application number: CNB2004100035064A
Authority: CN
Inventors: 陈岳勇; 朱健
Original assignee: Ali Corp
Current assignee: Ali Corp
Priority date: 2004-02-02
Filing date: 2004-02-02
Publication date: 2007-05-16
Anticipated expiration: 2024-02-02
Also published as: CN1652598A

Abstract

本发明涉及一种运动向量解交错的方法，该方法包括将一图像内容解码成为多个宏块数据，计算图像内容的每个宏块数据的一运动向量以获得该运动向量成为的一判断值，根据该判断值与宏块数据的运动向量之间的比较产生多个解交错标志，然后对生成的解交错标志实现时态延伸动作，其中该时态延伸动作进一步包括设复数个解交错旗标缓冲器，判断当前解交错旗标是否为场合并格式(Weave)，判断其余解交错旗标缓冲器是否都为单场插值格式(BOB)，及设定该解交错旗标为衍生单场插值格式(BOB2)；及执行破坏性动作，将该多个孤立的解交错标志破坏并使之在空间运动上有其相关性。通过本发明，可以更大程度地避免老鼠牙的现象。

Description

运动向量解交错的方法

技术领域

本发明涉及一种运动向量解交错的方法，特别关于一种对MPEG-2影像的解码方法。

背景技术

目前，多媒体的来源对于我们而言是相当广泛的，举凡电视节目、电影、激光视盘片(VCD)及数字多功能光盘片(DVD)等等。在如此多的来源中，我们不乏发现可以将这些来源大致分为逐行(非交错式)影像及隔行(交错式)影像两大类。这些影像大都跟随MPEG-2的编码原则来编码这些影像。

在MPEG-2的影像编/解码的过程中，将交错式影片内容成为解交错格式(De-interlacing)是目前一般处理的方式，而解交错格式中比较常见就是场合并格式(Weave)和单场插值格式(BOB)，场合并格式(Weave)是简单的将两场的数据合为一帧，而单场插值格式(BOB)是用一场的数据来生成一帧(Frame)。

显然，用场合并格式(Weave)的方法生成的帧含有更多的信息量，图像会更清晰，而单场插值格式(BOB)生成的帧会比较模糊，且对于一些静止的区域会出现一定的跳动，比如电视台的标志(Logo)。当然，场合并格式(Weave)也有其弊端，当视频宏块是基于交错的(Interlaced)，那么场合并格式(Weave)合成的帧图像中，在运动的区域往往会出现一些梳状的瑕疵，又称之为老鼠牙(Mice Teeth)。

在一定程度上，我们可以利用这两种方法的优点，将它们结合起来，在图像运动的区域使用单场插值格式(BOB)，从而达到消除老鼠牙的目的，而在图像相对静止的区域使用场合并格式(Weave)从而得到更多的清晰度。这就是所谓的运动自适应式解交错(Motion Adaptive De-interlacing)。

如美国专利第6269484号“在压缩的视频流上使用运动向量来解除交错的内容的方法及装置”，该专利利用MPEG码流中的运动向量(MotionVector)和一些运动预测(Motion Estimation)的残余量，去判断一个宏块(Macro Block)的区域是否有运动。事实上，在MPEG编码器中使用的运动预测算法，是为了在参考图中按一定标准去寻找一个最相似的宏块，从而得到最大的压缩率，也就是说，运动预测算法并不是用来判断当前宏块是否运动的。所以，简单的利用这种算法得出的一些结果(如码流中的运动向量和残余量)，来判断当前一个宏块是否有运动的是不太可靠的。

图1为现有的使用动态向量解码影像视频流的方框图，也就是上述专利的代表图，包括一音频/视频解交错影像编码器10，一编码压缩音频/视频影像102，一音频/视频解交错装置104，一音频/视频解交错影像解码器106，一音频/视频解码器的运动向量截取单元108，一基于运动向量的解交错决定单元110，一基于运动向量的解交错位图单元112，一宏块数据的子集合信息114，一解码运动向量数据116，一解压缩的宏块数据118，一使用解码运动向量位图的解交错影像转换单元120及一显示单元122。

该音频/视频解交错影像编码器10为一MPEG-2编码器，根据MPEG-2标准来编码交错式图形数据，将该编码压缩音频/视频影像102传输至该音频/视频解交错装置104内，该音频/视频解交错装置104包含音频/视频解交错影像解码器106，及使用解码运动向量位图的解交错影像转换单元120，该音频/视频解交错影像解码器106包括该音频/视频解码器的运动向量截取单元108，该基于运动向量解交错决定单元110，及该基于运动向量的解交错位图单元112。

其中，该音频/视频解码器的运动向量截取单元108在解码阶段产生并且输出该宏块数据的子集合信息114及该解码运动向量数据116，传输给该基于运动向量的解交错决定单元110。该基于运动向量的解交错决定单元110产生该基于运动向量的解交错位图单元112，该基于运动向量的解交错位图单元112包含两位，来代表一图片的每一个宏块是否为运动的或非运动的。

该音频/视频解码器的运动向量截取单元108解码该压缩的宏块数据和输出解压缩的宏块数据118，到该使用解码运动向量位图的解交错影像转换单元120，最后将处理过的影像传送至该显示单元122上。

发明内容

本发明即为解决上述现有技术的缺失，而提供了一种运动向量解交错的方法。

为了达到本发明的目的，本发明提供了一种运动向量解交错的方法，该方法包括：解码一图像内容成为多个宏块数据(Macro Block)；计算图像内容的每个宏块数据的运动向量，以获得每一运动向量的一判断值；根据该判断值与所述宏块数据的运动向量的比较以产生多个解交错标志；实现时态延伸动作(Temporal Extension)，是依据该判断值将该多个宏块数据间作该时态延伸动作；及执行破坏性动作(Devour)，将该多个孤立的解交错标志破坏并使之在空间运动上有其相关性。

其中，该图像内容可为一静态图像或一动态图像；该实现时态延伸动作步骤中，进一步包括下列步骤：设多个标志缓冲器，判断第一个解交错标志是否为场合并格式(Weave)，判断其余标志缓冲器是否都为单场插值格式(BOB)，及设定该解交错标志为衍生单场插值格式(BOB2)；该执行破坏性动作步骤中，进一步包括下列步骤：设定该宏块数据的影像垂直及水平大小；计算该影像中当前宏块附近一定范围内的单场插值格式(BOB)的数量值；及设定该解交错标志为场合并格式(Weave)；该设定该宏块数据步骤中还包含判断解交错标志是否为单场插值格式，并且当判断的结果为是，则进行下一个步骤，若所判断的结果为否，则进一步包括下列步骤：计算该影像中当前宏块附近一定范围内的场合并格式的数量值，检测计算值是否小于该场合并格式的判断值；及设定该解交错标志为单场插值格式；该计算步骤中还包含检测计算值是否小于该单场插值格式的判断值。

本发明的特点为：利用编/解码流中的运动向量的信息来判断宏块(MacroBlock)级的运动。由于本发明利用运动的连续性和相关性加入了一时态延伸动作(Temporal Extension)及破坏性动作(Devour)模块，从而使得判断更保守，更大程度地杜绝了老鼠牙(Mice Teeth)的现象。

附图说明

图1为现有的使用动态向量解码影像视频流的方框图；

图2为本发明的运动向量解交错的方法的流程图；

图3为视频流的帧图片结构解交错标志产生及时态延伸的流程图；

图4A及图4B为视频流的场图片结构解交错标志产生的流程图；及

图5为本发明的破坏性动作的流程图。

其中，附图标记说明如下：

10音频/视频解交错影像编码器

102编码压缩音频/视频影像

104音频/视频解交错装置

106音频/视频解交错影像解码器

108音频/视频解码器的运动向量截取单元

110基于运动向量解交错决定单元

112基于运动向量的解交错位图单元

114宏块数据的子集合信息

116解码运动向量数据

118解压缩的宏块数据

120使用解码运动向量位图的解交错影像转换单元

122显示单元

具体实施方式

为了使本发明为达成发明目的所采取的技术、手段及功效得到进一步地了解，以下结合附图对本发明作详细说明，然而所附图式仅提供参考与说明用，并非用来对本发明加以限制。

图2为本发明的运动向量解交错的方法的流程图，该方法包括将图像内容解码成为多个宏块数据(S200)，将该多个宏块数据中计算图像的运动向量并成为一判断值(S202)，依据该判断值来判断该宏块位置是否为活动的(S204)，若判断的结果为是，将所得的该判断值做为多个解交错标志产生的依据(S206)，实现时态延伸动作(S208)，及执行破坏性动作(S210)。

图3为视频流的帧图片结构解交错标志产生及时态延伸的流程图，包括设多个解交错标志缓冲器储存影像数据(S300)，判断是否为I图像(S302)，若判断结果为否，则检测是否为图像内的宏块数据(S304)，若判断结果为是，则将解交错标志设为单场插值格式(S306)。

该判断是否为I图像(S302)中，若判断结果为是，则进一步包括判断该图像是否为第一帧(Frame)(S316)，若所判断结果为是，则将解交错标志设为衍生单场插值格式(BOB2)(S318)，若所判断结果为否，则将解交错标志设为先前帧标志(S320)，判断解交错标志是否等于场合并格式(S322)，若判断结果为否，则结束本流程。若判断结果为是，则检测该多个解交错标志缓冲器的相同位置是否存在一定数量的单场插值格式(S310)，若判断结果为是，则将解交错标志设为单场插值格式(S314)，否则将解交错标志设为场合并格式(S312)。

其中，该检测是否为图像内的宏块(Intra Macro Block)数据(S304)中，若判断结果为否则进一步包括判断取绝对值的运动向量值是否大于判断值且为存在(S308)，若判断结果为是，则将解交错标志设为单场插值格式(S306)，若判断结果为否，则检测该多个标志缓冲器的相同位置是否存在一定数量的单场插值格式(S310)，若判断结果为是，则将解交错标志设为单场插值格式(S314)，否则将解交错标志设为场合并格式(S312)。另一方面，图3所示的检测该多个解交错标志缓冲器的相同位置是否存在一定数量的单场插值格式(S310)的步骤，将解交错标志设为场合并格式(S312)的步骤以及将解交错标志设为单场插值格式(S314)的步骤等，亦即为之后的图4中的将解交错标志设为时态延伸标志(S410)步骤的求解方法。

图4A及图4B为视频流的场图片结构解交错标志产生的流程图，包括判断是否为I图像(S400)，若判断结果为是，则检测是否为第一帧(S402)，若判断结果为是，则将解交错标志设为衍生单场插值格式(S406)，若判断结果为否，则将解交错标志设为先前帧标志(S404)，判断解交错标志是否等于场合并格式(S408)，若判断结果为否，则结束本流程。若判断结果为是，则将解交错标志设为时态延伸标志(S410)，将解交错标志的垂直坐标加一阶或减一阶并存入该解交错标志(S412)。

该判断是否为I图像(S400)中，若判断结果为否，则进一步包括检测是否为图像内的宏块数据(S414)，若判断结果为是，则判断该宏块数据是否为顶场(S416)，若判断结果为是，则将宏块解交错标志设为单场插值格式(S418)，将宏块解交错标志的垂直坐标加一阶并设为单场插值格式(S420)，若判断结果为否，则将宏块解交错标志设为单场插值格式(S422)，将宏块解交错标志的垂直坐标减一阶并设为单场插值格式(S424)。

该检测是否为图像内的宏块(Intra Macro Block)数(S414)中，若判断结果为否，则包括判断取绝对值的运动向量值是否大于判断值且为存在(S426)，若判断结果为是，则判断该宏块数据是否为顶场(S416)，若判断结果为是，则将宏块解交错标志设为单场插值格式(S418)，将宏块解交错标志的垂直坐标加一阶并设为单场插值格式(S420)，若判断结果为否，则将宏块解交错标志设为单场插值格式(S422)，将宏块解交错标志的垂直坐标减一阶并设为单场插值格式(S424)。

该判断取绝对值的运动向量值是否大于判断值且为存在(S426)中，若判断结果为否，则判断该宏块数据是否为顶场(S428)，若判断结果为是，则将解交错标志设为时态延伸标志(S430)，将解交错标志的垂直坐标加一阶并存入该解交错标志(S432)，若判断结果为否，则判断解交错标志是否等于场合并格式(S434)，若判断结果为否，则结束本流程，若判断结果为是，将解交错标志设为时态延伸标志(S436)，将解交错标志的垂直坐标减一阶并存入该解交错标志(S438)。

图5为本发明的破坏性动作的流程图，包括设定宏块数据的影像垂直大小(S500)，设定宏块数据的影像水平大小(S502)，判断解交错标志是否为单场插值格式(S504)，若判断结果为是，则计算该影像中当前宏块附近一定范围内的单场插值格式的数量值(S506)，检测计算值是否小于该单场插值格式的判断值(S508)，将解交错标志设为场合并格式(S510)。

其中，在该判断解交错标志是否为单场插值格式(S504)中，若所判断的结果为否，则计算该影像中当前宏块附近一定范围内的场合并格式的数量值(S512)，检测计算值是否小于该场合并格式的判断值(S514)，将解交错标志设为衍生单场插值格式(S516)。

上述所公开的附图、实施方式仅为说明本发明而已，并非用以限制本发明，凡本领域的技术人员当可依据上述的说明作其它种种的改良，而这些改变仍属于本发明的发明精神及权利要求书所界定的专利保护范围中。

Claims

1.一种运动向量解交错的方法，该方法包括：

解码一图像内容成为多个宏块数据；

计算图像内容的每个所述宏块数据的运动向量，以获得每一运动向量的一判断值；

根据该判断值与所述宏块数据的运动向量之间的比较以产生多个解交错标志；

实现时态延伸动作，是依据该判断值将该多个宏块数据间作该时态延伸动作，其中该时态延伸动作包括下列步骤：

设多个标志缓冲器；

判断第一个解交错标志是否为场合并格式；

判断其余标志缓冲器是否均为单场插值格式；及

设定该解交错标志为衍生单场插值格式；及

执行破坏性动作，是将该多个孤立的解交错标志破坏并使之在空间运动上有其相关性，其中该破坏性动作包括：

设定该宏块数据的影像垂直及水平大小；

计算该影像中当前宏块附近一定范围内的单场插值格式的数量值；及；

设定该解交错标志为场合并格式。

2.如权利要求1所述的运动向量解交错的方法，其中，该图像内容可为一静态图像或一动态图像。

3.如权利要求1所述的运动向量解交错的方法，其中，该设定该宏块数据步骤中还包含判断解交错标志是否为单场插值格式。

4.如权利要求3所述的运动向量解交错的方法，其中，该判断的结果为是，则进行下一个步骤，若所判断的结果为否，则进一步包括下列步骤：

计算该影像中当前宏块附近一定范围内的场合并格式的数量值；

检测计算值是否小于该场合并格式的判断值；及

设定该解交错标志为单场插值格式。

5.如权利要求1所述的运动向量解交错的方法，其中，该计算步骤中还包含检测计算值是否小于该单场插值格式的判断值。