CN1316824C - 运动向量解交错的方法 - Google Patents

运动向量解交错的方法 Download PDF

Info

Publication number
CN1316824C
CN1316824C CNB2004100035064A CN200410003506A CN1316824C CN 1316824 C CN1316824 C CN 1316824C CN B2004100035064 A CNB2004100035064 A CN B2004100035064A CN 200410003506 A CN200410003506 A CN 200410003506A CN 1316824 C CN1316824 C CN 1316824C
Authority
CN
China
Prior art keywords
release
interleave
motion vector
macro block
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100035064A
Other languages
English (en)
Other versions
CN1652598A (zh
Inventor
陈岳勇
朱健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ali Corp
Original Assignee
Ali Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ali Corp filed Critical Ali Corp
Priority to CNB2004100035064A priority Critical patent/CN1316824C/zh
Publication of CN1652598A publication Critical patent/CN1652598A/zh
Application granted granted Critical
Publication of CN1316824C publication Critical patent/CN1316824C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种运动向量解交错的方法,该方法包括将一图像内容解码成为多个宏块数据,计算图像内容的每个宏块数据的一运动向量以获得该运动向量成为的一判断值,根据该判断值与宏块数据的运动向量之间的比较产生多个解交错标志,然后对生成的解交错标志实现时态延伸动作,其中该时态延伸动作进一步包括设复数个解交错旗标缓冲器,判断当前解交错旗标是否为场合并格式(Weave),判断其余解交错旗标缓冲器是否都为单场插值格式(BOB),及设定该解交错旗标为衍生单场插值格式(BOB2);及执行破坏性动作,将该多个孤立的解交错标志破坏并使之在空间运动上有其相关性。通过本发明,可以更大程度地避免老鼠牙的现象。

Description

运动向量解交错的方法
技术领域
本发明涉及一种运动向量解交错的方法,特别关于一种对MPEG-2影像的解码方法。
背景技术
目前,多媒体的来源对于我们而言是相当广泛的,举凡电视节目、电影、激光视盘片(VCD)及数字多功能光盘片(DVD)等等。在如此多的来源中,我们不乏发现可以将这些来源大致分为逐行(非交错式)影像及隔行(交错式)影像两大类。这些影像大都跟随MPEG-2的编码原则来编码这些影像。
在MPEG-2的影像编/解码的过程中,将交错式影片内容成为解交错格式(De-interlacing)是目前一般处理的方式,而解交错格式中比较常见就是场合并格式(Weave)和单场插值格式(BOB),场合并格式(Weave)是简单的将两场的数据合为一帧,而单场插值格式(BOB)是用一场的数据来生成一帧(Frame)。
显然,用场合并格式(Weave)的方法生成的帧含有更多的信息量,图像会更清晰,而单场插值格式(BOB)生成的帧会比较模糊,且对于一些静止的区域会出现一定的跳动,比如电视台的标志(Logo)。当然,场合并格式(Weave)也有其弊端,当视频宏块是基于交错的(Interlaced),那么场合并格式(Weave)合成的帧图像中,在运动的区域往往会出现一些梳状的瑕疵,又称之为老鼠牙(Mice Teeth)。
在一定程度上,我们可以利用这两种方法的优点,将它们结合起来,在图像运动的区域使用单场插值格式(BOB),从而达到消除老鼠牙的目的,而在图像相对静止的区域使用场合并格式(Weave)从而得到更多的清晰度。这就是所谓的运动自适应式解交错(Motion Adaptive De-interlacing)。
如美国专利第6269484号“在压缩的视频流上使用运动向量来解除交错的内容的方法及装置”,该专利利用MPEG码流中的运动向量(MotionVector)和一些运动预测(Motion Estimation)的残余量,去判断一个宏块(Macro Block)的区域是否有运动。事实上,在MPEG编码器中使用的运动预测算法,是为了在参考图中按一定标准去寻找一个最相似的宏块,从而得到最大的压缩率,也就是说,运动预测算法并不是用来判断当前宏块是否运动的。所以,简单的利用这种算法得出的一些结果(如码流中的运动向量和残余量),来判断当前一个宏块是否有运动的是不太可靠的。
图1为现有的使用动态向量解码影像视频流的方框图,也就是上述专利的代表图,包括一音频/视频解交错影像编码器10,一编码压缩音频/视频影像102,一音频/视频解交错装置104,一音频/视频解交错影像解码器106,一音频/视频解码器的运动向量截取单元108,一基于运动向量的解交错决定单元110,一基于运动向量的解交错位图单元112,一宏块数据的子集合信息114,一解码运动向量数据116,一解压缩的宏块数据118,一使用解码运动向量位图的解交错影像转换单元120及一显示单元122。
该音频/视频解交错影像编码器10为一MPEG-2编码器,根据MPEG-2标准来编码交错式图形数据,将该编码压缩音频/视频影像102传输至该音频/视频解交错装置104内,该音频/视频解交错装置104包含音频/视频解交错影像解码器106,及使用解码运动向量位图的解交错影像转换单元120,该音频/视频解交错影像解码器106包括该音频/视频解码器的运动向量截取单元108,该基于运动向量解交错决定单元110,及该基于运动向量的解交错位图单元112。
其中,该音频/视频解码器的运动向量截取单元108在解码阶段产生并且输出该宏块数据的子集合信息114及该解码运动向量数据116,传输给该基于运动向量的解交错决定单元110。该基于运动向量的解交错决定单元110产生该基于运动向量的解交错位图单元112,该基于运动向量的解交错位图单元112包含两位,来代表一图片的每一个宏块是否为运动的或非运动的。
该音频/视频解码器的运动向量截取单元108解码该压缩的宏块数据和输出解压缩的宏块数据118,到该使用解码运动向量位图的解交错影像转换单元120,最后将处理过的影像传送至该显示单元122上。
发明内容
本发明即为解决上述现有技术的缺失,而提供了一种运动向量解交错的方法。
为了达到本发明的目的,本发明提供了一种运动向量解交错的方法,该方法包括:解码一图像内容成为多个宏块数据(Macro Block);计算图像内容的每个宏块数据的运动向量,以获得每一运动向量的一判断值;根据该判断值与所述宏块数据的运动向量的比较以产生多个解交错标志;实现时态延伸动作(Temporal Extension),是依据该判断值将该多个宏块数据间作该时态延伸动作;及执行破坏性动作(Devour),将该多个孤立的解交错标志破坏并使之在空间运动上有其相关性。
其中,该图像内容可为一静态图像或一动态图像;该实现时态延伸动作步骤中,进一步包括下列步骤:设多个标志缓冲器,判断第一个解交错标志是否为场合并格式(Weave),判断其余标志缓冲器是否都为单场插值格式(BOB),及设定该解交错标志为衍生单场插值格式(BOB2);该执行破坏性动作步骤中,进一步包括下列步骤:设定该宏块数据的影像垂直及水平大小;计算该影像中当前宏块附近一定范围内的单场插值格式(BOB)的数量值;及设定该解交错标志为场合并格式(Weave);该设定该宏块数据步骤中还包含判断解交错标志是否为单场插值格式,并且当判断的结果为是,则进行下一个步骤,若所判断的结果为否,则进一步包括下列步骤:计算该影像中当前宏块附近一定范围内的场合并格式的数量值,检测计算值是否小于该场合并格式的判断值;及设定该解交错标志为单场插值格式;该计算步骤中还包含检测计算值是否小于该单场插值格式的判断值。
本发明的特点为:利用编/解码流中的运动向量的信息来判断宏块(MacroBlock)级的运动。由于本发明利用运动的连续性和相关性加入了一时态延伸动作(Temporal Extension)及破坏性动作(Devour)模块,从而使得判断更保守,更大程度地杜绝了老鼠牙(Mice Teeth)的现象。
附图说明
图1为现有的使用动态向量解码影像视频流的方框图;
图2为本发明的运动向量解交错的方法的流程图;
图3为视频流的帧图片结构解交错标志产生及时态延伸的流程图;
图4A及图4B为视频流的场图片结构解交错标志产生的流程图;及
图5为本发明的破坏性动作的流程图。
其中,附图标记说明如下:
10音频/视频解交错影像编码器
102编码压缩音频/视频影像
104音频/视频解交错装置
106音频/视频解交错影像解码器
108音频/视频解码器的运动向量截取单元
110基于运动向量解交错决定单元
112基于运动向量的解交错位图单元
114宏块数据的子集合信息
116解码运动向量数据
118解压缩的宏块数据
120使用解码运动向量位图的解交错影像转换单元
122显示单元
具体实施方式
为了使本发明为达成发明目的所采取的技术、手段及功效得到进一步地了解,以下结合附图对本发明作详细说明,然而所附图式仅提供参考与说明用,并非用来对本发明加以限制。
图2为本发明的运动向量解交错的方法的流程图,该方法包括将图像内容解码成为多个宏块数据(S200),将该多个宏块数据中计算图像的运动向量并成为一判断值(S202),依据该判断值来判断该宏块位置是否为活动的(S204),若判断的结果为是,将所得的该判断值做为多个解交错标志产生的依据(S206),实现时态延伸动作(S208),及执行破坏性动作(S210)。
图3为视频流的帧图片结构解交错标志产生及时态延伸的流程图,包括设多个解交错标志缓冲器储存影像数据(S300),判断是否为I图像(S302),若判断结果为否,则检测是否为图像内的宏块数据(S304),若判断结果为是,则将解交错标志设为单场插值格式(S306)。
该判断是否为I图像(S302)中,若判断结果为是,则进一步包括判断该图像是否为第一帧(Frame)(S316),若所判断结果为是,则将解交错标志设为衍生单场插值格式(BOB2)(S318),若所判断结果为否,则将解交错标志设为先前帧标志(S320),判断解交错标志是否等于场合并格式(S322),若判断结果为否,则结束本流程。若判断结果为是,则检测该多个解交错标志缓冲器的相同位置是否存在一定数量的单场插值格式(S310),若判断结果为是,则将解交错标志设为单场插值格式(S314),否则将解交错标志设为场合并格式(S312)。
其中,该检测是否为图像内的宏块(Intra Macro Block)数据(S304)中,若判断结果为否则进一步包括判断取绝对值的运动向量值是否大于判断值且为存在(S308),若判断结果为是,则将解交错标志设为单场插值格式(S306),若判断结果为否,则检测该多个标志缓冲器的相同位置是否存在一定数量的单场插值格式(S310),若判断结果为是,则将解交错标志设为单场插值格式(S314),否则将解交错标志设为场合并格式(S312)。另一方面,图3所示的检测该多个解交错标志缓冲器的相同位置是否存在一定数量的单场插值格式(S310)的步骤,将解交错标志设为场合并格式(S312)的步骤以及将解交错标志设为单场插值格式(S314)的步骤等,亦即为之后的图4中的将解交错标志设为时态延伸标志(S410)步骤的求解方法。
图4A及图4B为视频流的场图片结构解交错标志产生的流程图,包括判断是否为I图像(S400),若判断结果为是,则检测是否为第一帧(S402),若判断结果为是,则将解交错标志设为衍生单场插值格式(S406),若判断结果为否,则将解交错标志设为先前帧标志(S404),判断解交错标志是否等于场合并格式(S408),若判断结果为否,则结束本流程。若判断结果为是,则将解交错标志设为时态延伸标志(S410),将解交错标志的垂直坐标加一阶或减一阶并存入该解交错标志(S412)。
该判断是否为I图像(S400)中,若判断结果为否,则进一步包括检测是否为图像内的宏块数据(S414),若判断结果为是,则判断该宏块数据是否为顶场(S416),若判断结果为是,则将宏块解交错标志设为单场插值格式(S418),将宏块解交错标志的垂直坐标加一阶并设为单场插值格式(S420),若判断结果为否,则将宏块解交错标志设为单场插值格式(S422),将宏块解交错标志的垂直坐标减一阶并设为单场插值格式(S424)。
该检测是否为图像内的宏块(Intra Macro Block)数(S414)中,若判断结果为否,则包括判断取绝对值的运动向量值是否大于判断值且为存在(S426),若判断结果为是,则判断该宏块数据是否为顶场(S416),若判断结果为是,则将宏块解交错标志设为单场插值格式(S418),将宏块解交错标志的垂直坐标加一阶并设为单场插值格式(S420),若判断结果为否,则将宏块解交错标志设为单场插值格式(S422),将宏块解交错标志的垂直坐标减一阶并设为单场插值格式(S424)。
该判断取绝对值的运动向量值是否大于判断值且为存在(S426)中,若判断结果为否,则判断该宏块数据是否为顶场(S428),若判断结果为是,则将解交错标志设为时态延伸标志(S430),将解交错标志的垂直坐标加一阶并存入该解交错标志(S432),若判断结果为否,则判断解交错标志是否等于场合并格式(S434),若判断结果为否,则结束本流程,若判断结果为是,将解交错标志设为时态延伸标志(S436),将解交错标志的垂直坐标减一阶并存入该解交错标志(S438)。
图5为本发明的破坏性动作的流程图,包括设定宏块数据的影像垂直大小(S500),设定宏块数据的影像水平大小(S502),判断解交错标志是否为单场插值格式(S504),若判断结果为是,则计算该影像中当前宏块附近一定范围内的单场插值格式的数量值(S506),检测计算值是否小于该单场插值格式的判断值(S508),将解交错标志设为场合并格式(S510)。
其中,在该判断解交错标志是否为单场插值格式(S504)中,若所判断的结果为否,则计算该影像中当前宏块附近一定范围内的场合并格式的数量值(S512),检测计算值是否小于该场合并格式的判断值(S514),将解交错标志设为衍生单场插值格式(S516)。
上述所公开的附图、实施方式仅为说明本发明而已,并非用以限制本发明,凡本领域的技术人员当可依据上述的说明作其它种种的改良,而这些改变仍属于本发明的发明精神及权利要求书所界定的专利保护范围中。

Claims (5)

1.一种运动向量解交错的方法,该方法包括:
解码一图像内容成为多个宏块数据;
计算图像内容的每个所述宏块数据的运动向量,以获得每一运动向量的一判断值;
根据该判断值与所述宏块数据的运动向量之间的比较以产生多个解交错标志;
实现时态延伸动作,是依据该判断值将该多个宏块数据间作该时态延伸动作,其中该时态延伸动作包括下列步骤:
设多个标志缓冲器;
判断第一个解交错标志是否为场合并格式;
判断其余标志缓冲器是否均为单场插值格式;及
设定该解交错标志为衍生单场插值格式;及
执行破坏性动作,是将该多个孤立的解交错标志破坏并使之在空间运动上有其相关性,其中该破坏性动作包括:
设定该宏块数据的影像垂直及水平大小;
计算该影像中当前宏块附近一定范围内的单场插值格式的数量值;及;
设定该解交错标志为场合并格式。
2.如权利要求1所述的运动向量解交错的方法,其中,该图像内容可为一静态图像或一动态图像。
3.如权利要求1所述的运动向量解交错的方法,其中,该设定该宏块数据步骤中还包含判断解交错标志是否为单场插值格式。
4.如权利要求3所述的运动向量解交错的方法,其中,该判断的结果为是,则进行下一个步骤,若所判断的结果为否,则进一步包括下列步骤:
计算该影像中当前宏块附近一定范围内的场合并格式的数量值;
检测计算值是否小于该场合并格式的判断值;及
设定该解交错标志为单场插值格式。
5.如权利要求1所述的运动向量解交错的方法,其中,该计算步骤中还包含检测计算值是否小于该单场插值格式的判断值。
CNB2004100035064A 2004-02-02 2004-02-02 运动向量解交错的方法 Expired - Fee Related CN1316824C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2004100035064A CN1316824C (zh) 2004-02-02 2004-02-02 运动向量解交错的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2004100035064A CN1316824C (zh) 2004-02-02 2004-02-02 运动向量解交错的方法

Publications (2)

Publication Number Publication Date
CN1652598A CN1652598A (zh) 2005-08-10
CN1316824C true CN1316824C (zh) 2007-05-16

Family

ID=34867566

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100035064A Expired - Fee Related CN1316824C (zh) 2004-02-02 2004-02-02 运动向量解交错的方法

Country Status (1)

Country Link
CN (1) CN1316824C (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102256096A (zh) * 2011-08-04 2011-11-23 北京世纪鼎点软件有限公司 一种基于区域划分的视频解交错方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269484B1 (en) * 1997-06-24 2001-07-31 Ati Technologies Method and apparatus for de-interlacing interlaced content using motion vectors in compressed video streams
CN1328405A (zh) * 2000-06-13 2001-12-26 三星电子株式会社 采用双向运动矢量的格式转换器及其方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6269484B1 (en) * 1997-06-24 2001-07-31 Ati Technologies Method and apparatus for de-interlacing interlaced content using motion vectors in compressed video streams
CN1328405A (zh) * 2000-06-13 2001-12-26 三星电子株式会社 采用双向运动矢量的格式转换器及其方法

Also Published As

Publication number Publication date
CN1652598A (zh) 2005-08-10

Similar Documents

Publication Publication Date Title
Cao et al. Video steganalysis exploiting motion vector reversion-based features
TW443066B (en) System and method for DCT domain inverse motion compensation using shared information
TW301098B (zh)
CN101283600B (zh) 参考图像选择方法以及装置
Zhang et al. A steganalytic approach to detect motion vector modification using near-perfect estimation for local optimality
CN105338364B (zh) 图像预测解码装置、图像预测解码方法
US20100283892A1 (en) System and method for reducing visible halo in digital video with covering and uncovering detection
JP2009201112A (ja) 直接モード符号化及び復号化方法
TW201127067A (en) Motion vector processing
CN104718758A (zh) 变换域帧内预测
KR20110008653A (ko) 움직임 벡터 예측 방법과 이를 이용한 영상 부호화/복호화 장치 및 방법
TW201143458A (en) Dynamic image encoding device and dynamic image decoding device
CN1226781A (zh) 用于隔行数字视频信号的视频目标平面的运动估算和补偿
JP2010154490A5 (zh)
Liu et al. An HEVC steganalytic approach against motion vector modification using local optimality in candidate list
JP2022515875A (ja) ビデオエンコーディング/デコーディングシステムにおけるサイド動き精細化
TWI225372B (en) Method of detecting motion vector
JP2003259377A (ja) 動画像符号化方法、動画像復号化方法および符号列フォーマット
CN1316824C (zh) 运动向量解交错的方法
KR101810118B1 (ko) 프로파일 정보 기반 움직임 추정장치 및 방법
KR101777776B1 (ko) 표본 프로파일 정보 기반 움직임 추정장치 및 방법
JP3732760B2 (ja) 物体認識装置及び物体認識方法
Pei et al. A video watermarking scheme based on motion vectors and mode selection
JP2010278519A (ja) 動きベクトル検出装置
TW200524428A (en) De-interlacing method of motion vector

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070516

Termination date: 20140202