CN1328747A

CN1328747A - 高清晰度电视编码器中检测场景改变与调节画面编码类型的方法与装置

Info

Publication number: CN1328747A
Application number: CN99813804A
Authority: CN
Inventors: 胡少伟
Original assignee: General Instrument Corp
Current assignee: Arris Technology Inc
Priority date: 1998-09-29
Filing date: 1999-08-27
Publication date: 2001-12-26
Also published as: CA2344915C; EP1119979B1; EP1119979A1; KR20010099660A; WO2000019726A1; AU5793199A; BR9914117A; CA2344915A1

Abstract

提供了用于检测数字电视信号中的接连的场之间的场景改变的方法与装置。在检测到包含闪光或由不适当剪辑导致的不良场在内的场景改变时,调整画面编码类型来优化视频编码器的编码效率。将开始新的GOP的I帧与场景改变对齐来极大地改进MPEG编码器(100)的编码效率。在预处理级(205,210)中,为每一个接连的输入场计算接连的奇数场或接连的偶数场之间的象素差之和中的改变。当其中和的改变中的大正值后随大负值时,便检测到场景改变。在最终的编码级(225、235)之前不作出采用哪一种画面类型的决定。当编码器缓冲器水平太高时能禁止I帧。计数器(倒计数)复位场景改变指示以免从静止到运动的转变的永久性场景改变状态。对于确定为场景改变帧的MPEG影片模式帧画面,当在场边界上可能出现场景改变时(如画面中不存在冗余场),便撤消MPEG推荐的基于帧的离散余弦变换(DCT)与预测编码。

Description

高清晰度电视编码器中检测场景改变与调节画面编码类型的方法与装置

发明背景

本申请要求1998年9月29日提交的美国临时申请号60/102,234的权益。

本发明涉及视频压缩，更具体地涉及检测场景改变与调整画面编码类型以优化视频编码器的编码效率的方法与装置。本发明对数字HDTV编码器中的画面编码类型决定与场景改变检测特别有用。

将内编码的(intra-coded)(I)帧与场景改变对齐能极大地改进MPEG(活动图像专家组)视频编码器的编码效率。过去，这种场景改变检测是例如通过检测亮度值的变化提供的。

在一些现有的场景改变检测建议中，在场景改变完成及新GOP(画面组)开始之前避免I帧的编码。然而，场景改变检测是在逐帧基础上执行的。因此，当存在不良剪辑、特技或摄象闪光时，这一方法能产生不正确的结果，这时场景改变可能出现在同一帧的奇/偶场边界上。

从而，提供用于检测包含闪光或从不适当剪辑得出的不良的场的场景改变，及调整画面编码类型而无上述先有技术遇到的问题的***是有利的。在场景改变期间更好地优化视频编码器的编码效率是更有利的。也希望提供用于根据场景改变的检测调度新的GOP的高效***。两者，该***应在接连的场之间检测场景改变。

该***应利用提供所要求的超前延迟来避免在场景改变附近发布调度的I帧的编码处理流水线***结构，同时减少提供超前能力所需的帧缓冲存储器量。

该方案应与不同的HDTV模式/象素分辨率兼容，其中包含1920×1080 I(隔行扫描)、1440×1080I、及1280×720P(逐行扫描)、以及标准清晰度(SDTV)视频。

该***应与包含MPEG—2在内的任何数字视频编码方案兼容。

当编码器缓冲器水平在太高时该***应禁止编码I帧。

该***应提供监视计数器，它复位场景改变指示来避免从静止到运动的转换的永久性场景改变状态。

对于确定为场景改变帧的MPEG影片模式帧画面，为了改进编码精确性与效率，当在场边界上出现场景改变时，该***应撤消MPEG推荐的基于帧的离散余弦变换(DCT)与预测编码。

发明概述

本发明提供具有上述与其它优点的场景改变与调整方案。

本发明涉及检测包含闪光或从不适当剪辑得出的不良场在内的接连的场之间的场景改变，并对其作出响应调整画面编码类型与GOP边界。从而这里一般地使用的名词“场景改变”包括有正常场景改变(在帧边界上)、在同一帧的场边界上的场景改变、不良剪辑或闪光、或视频图象序列中的任何其它突然改变等事件。

按照本发明，场景改变检测是在视频编码器的预处理级上执行的。在最终编码级之前不作出将帧作为I或P帧编码的最后决定。这便是，将编码器的处理流水线用作超前缓冲器来减少所需的帧缓冲存储器量。

具体地，视频编码器的预处理级为每一个接连的输入场计算接连的奇数场或接连的偶数场之间的象素差之和中的变化。然后通过在和中的改变中寻找大的正值(超过正阈值)后面跟随大的负值(小于负阈值)来检测场景改变。

检测到场景改变时在处理流水线的编码级上立即禁止I帧。当场景改变帧到达流水线的编码级且在流水线中没有其它场景改变时，开始新的GOP。

场景改变计数器用于记录当前在处理流水线中的未编码的场景改变帧的数目。只要场景改变计数器具有大于零的值便禁止I帧，但除场景改变帧的信号列(burst)(连续)中的最后场景改变帧外。

此外，利用场景改变递减计数器或“监视”计数器来说明从静止帧到运动帧的转变以保证不永久性设定场景改变。

再者，对于确定为场景改变帧的MPEG影片模式画面，当在场边界上指示场景改变时(例如当在画面中没有冗余场时)，便撤消MPEG推荐的基于帧的离散余弦变换及预测编码。在这种撤消时，可在画面中逐个宏块的基础上使用基于帧或场的DCT与预测。这便允许在同一帧的奇/偶场边界上出现场景改变时可利用场预测来处理不良剪辑。

本发明适用于高清晰度电视(HDTV)编码器与标准清晰度电视(SDTV)编码器两者。

附图简述

图1为展示按照本发明的HDTV编码器的框图。

图2示出按照本发明的视频编码器处理流水线。

图3示出按照本发明确定场景改变得分增量(score delta)、最近使用的场景改变得分、及接连的重复场数目的流程图。

图4示出按照本发明确定检测到场景改变的帧及激活场景改变递减计数定时器的流程图。

图5示出按照本发明设置场景改变标志的流程图。

图6示出按照本发明确定一帧的最终画面编码类型的流程图。

发明详述

本发明涉及检测接连的场之间的场景改变并根据它调整画面编码类型与GOP边界的高效视频压缩方案。

使用了下列术语：术语说明CountDown 将ScDet设置成伪以前剩余的帧数

(对静止到运动转变序列)；d1 第一场的接连场景改变得分中的增量；d2 第二场的接连场景改变得分中的增量；FrameCount Gop中到此为止编码的帧数；GopLen 标称GOP长度；MaxCount 接连重复场的最大允许数目；MaxGopLen 最大允许GOP长度；picture_type 画面类型，可能根据场景改变检测修改；PreType 预先画面类型—名义上指定的画面类型；Rfc 重复场计数—接连的重复场的数目；sc1 场景得分1—第一场的场景改变量度；sc2 场景得分2—第一场的场景改变量度；ScCount 场景改变计数—当前在处理流水线中的场景改变帧

数；ScDet 检测到的场景改变帧；scene_change 宣布的场景改变帧；sclast 最后场景得分；ScPending 场景改变暂停；start_new_gop 以当前帧开始新GOP；ThO 场景得分sc1、sc2的零阈值；ThBuf 用于确定是否能开始新GOP的缓冲器水平阈值；ThNeg 场景得分sc1、sc2的负阈值；及ThPos 场景得分sc1、sc2的正阈值。

图1为展示按照本发明的HDTV编码器的框图。

编码器100包括接收输入HDTV视频流的HDTV屏面分离器110。分离器110将数据分给8个分开的视频压缩器120—127。压缩器120与***部件互联(PCI)总线130通信。视频缓冲器140(诸如先进先出即FIFO缓冲器)接收来自该总线的压缩视频数据并将其提供给分组处理器150以提供输出的压缩位流。包含循环缓冲器165的主压缩控制器(MCC)160控制数据的流动并同步视频压缩器120—127。结合图6进一步讨论缓冲器165的功能。

注意本发明是以多压缩器HDTV实施例说明的，但也同样能用于SDTV数据。再者，采用8个压缩器120—127只是一个示例，因为可采用任何数目的压缩器。

将输入HDTV画面分成8个屏面。各屏面由一个视频压缩引擎处理。压缩引擎120—127将压缩的视频数据转储到视频缓冲器140中。分组处理器150在由配置的输出带宽确定的速率上从缓冲器140中抽取压缩的数据，并将数据分组成例如MPEG传输分组。

图2示出按照本发明的视频编码器处理流水流。视频压缩器120—127用流水线***结构200处理视频帧。流水线200的第一级包含预处理级205，它执行视频滤波、向下抽样(可选的)、及计算供在撤消电视电影(detelecine)与场景改变检测功能210中使用的统计。

流水线200的后面级包含延迟与重新排序视频帧的P/B帧重新排序延迟功能215。这样做是因为有时不按显示次序编码P帧供在预测B帧中使用的。运动估算级220进行运动估算。最后级包含执行视频帧的实际编码以提供输出位流的编码级225。

为了方便随后的重新排序与运动估算级，预处理级205判定预处理的帧是否B帧。如果不将一帧分类为B帧，编码器(编码级225)在流水线的最后级中紧接在实际编码画面之前判定它是I帧还是P帧。由I帧开始新的GOP。

在流水线的预处理级中，场景改变检测功能210检测接连的帧之间的场景改变。场景改变处理的主要目的是如果在原来调度的I帧附近检测到场景改变，便将新GOP的调度开始的位置改变成以新场景的开始对齐。一旦在场景改变检测功能210上检测到场景改变，便将控制信号(ScDet标志)发送给编码级225以防止它为当前在编码器的处理流水线中等待编码的帧生成I帧。当对应的场景改变帧随后到达编码级225时，将它作为I帧编码，假定在流水线中没有其它场景改变帧，在这一情况中将流水线中上一场景改变帧作为I帧编码。

具体地，将场景改变标志提供给延迟230以便计入在重新排序延迟功能215与运动估算级220中处理对应的帧的延迟，并提供给画面编码类型决定功能235。功能235发送对应的画面类型控制信号给编码级225去设定要编码的当前帧的画面类型。

万一在接连的帧中的一行中检测到多个场景改变(如摄象机闪光、特技、不适当剪辑产生的不良帧/场)，开始新GOP决定功能235等待发送开始新GOP控制信号给编码级225。从而，编码级225等待编码I帧及开始新的GOP直到最后的场景改变结束为止。

这是与先有技术方案不同的，后者在预处理级中执行场景改变检测与画面编码类型决定两者，从而需要大量的超前帧缓冲器，或者在编码级中执行场景改变检测与画面编码类型决定两者而并不提供任何超前能力。有利地，本流水线***结构200提供必要的超前延迟以避免在场景改变附近发布调度的I帧，同时减少提供超前能力所需的帧缓冲存储器量。

场景改变计数器240维护流水线200中的场景改变帧的数目的计数ScCount。对于场景改变检测功能210上指定的每一新场景改变帧增量该计数，而对于到达画面编码类型决定功能235的每一场景改变帧则减量该计数。

预处理级205确定初始画面类型信息(pre Type)并在整个流水线200中将其标记在该视频帧上。当该帧到达编码级225时，检索这一信息供在确定要采用的最终画面类型(picture_type)时使用。主要是，当检测到场景改变时，一帧的预先指定的画面类型可以按照本发明修改，如下面在“场景改变实例”中进一步讨论的。

对于每一预处理的帧，场景改变检测功能210计算当前输入帧与前一输入帧的对应屏面的象素之间的绝对差。在第一与第二场上求和这些绝对差并换算成符合16位无符号整数以构成一对场景改变度量，即sc1(对于第一场)及sc2(对于第二场)。有可能诸如通过在计算场景改变度量之前空间向下抽样该帧而从输入象素的子集中生成场景改变度量来简化实现。场景改变检测功能210可通过令MCC160从视频压缩器120—127读取场景改变测度来检测场景改变来实现。根据场景改变检测结果、编码器的输出视频FIFO水平、及该GOP中到此为止编码的帧数，画面编码类型决定功能235(可用MCC160实现)对处理流水线的编码级225上的帧的画面编码类型作出最终决定。

图3示出按照本发明确定场景改变得分增量、最近使用的场景改变得分、及接连的重复场的数目的流程图。

为了检测场景改变，用MCC160实现的场景改变检测功能210首先通过求出该帧中所有屏面上的MAD值之和而为各帧的整个奇数场与偶数场计算出场景改变得分sc1与sc2(框300)。

场景改变检测功能210通过寻找场景得分中的陡升后的陡降来检测场景改变。在框305上，测试sc1＞阈值Th0，而在框310与315上测试sc2＞Th0。

当sc1与sc2两者都超过Th0时，设置d1、d2、scLast及rfc，如框320上所示，或者当sc1超过Th0但sc2不超过时，将它们设置成如框325上所示，或者当sc2超过Th0但sc1不超过时将它们设置成如框330上所示，在框335上，作出关于接连的重复场的数目(rfc)是否超过最大值(maxcount)的判定。如果框335为真或伪，分别在框340与框350上相应地设置d1、d2、scLast与rfc。

在这里的图与正文中，“是”、“真”、与“1”是同义的，而“否”、“伪”、与“0”是同义的。

通常，定义了三种阈值(ThPos、ThNeg、Th0)，它们的值取决于下述视频格式：

	1920×1080 I	1440×1080 I	1280×720 P
	1920×1080 I	1440×1080 I	1280×720 P	ThPos	24,480	17,952	10,240
ThNeg	-16,320	-11,968	-5,120	ThPos	24,480	17,952	10,240
ThNeg	-16,320	-11,968	-5,120	Th0	6,120	4,488	1,920

视频格式指称水平X垂直分辨率及视频是隔行扫描(I)还是逐行扫描(P)。不应将这一记号与I及P帧类型混淆。从上下文中应明白其含义。本发明容纳隔行扫描与逐行扫描的帧两者。逐行扫描图象是在第一与第二场中处理的。这些只是建议的阈值，并例如可通过用不同视频序列的实验调整它们的值。

场景改变检测功能210为第一与第二输入场分别计算接连的场景改变得分之间的差d1与d2。变量scLast保持最近使用的场景改变得分。在计算差d1与d2时，跳过最多可达最大计数(maxCount)的重复的场。

维护变量rfc来记录接连的重复场数。对于1080I模式可将接连的重复场的最大数目maxCount设定为诸如14个场，而对于720P模式则设定为24个场。然而也能采用其它值。每当rfc超过maxCount(框335)，假定存在着真正的静止画面，从而正常地更新d1、d2、与rfc(框340)。

作为sc1与sc2之间的差计算d1。取决于场景得分是否在Th0以上且rfc是否小于最大计数，作为sc2与sc1或scLast之间的差计算d2。

当诸如在卡通、慢动作剪辑与使消除电视电影处理失败的不良胶片中有重复场时，排除直到最大计数(maxCount)的小场景改变得分(框325、330与350)以避免伪检测。消除电视电影处理指称消除3∶2下拉视频序列中的冗余场。如果电视电影(从胶片传送到视频)过程是有噪声的，该编码器的消除电视电影过程便不能检测冗余的场。

另一种情况是编码器根据用户的命令仔细地保留冗余的场(如，如果用户仔细地截止编码器上的消除电视电影过程)，或在不可丢弃冗余的场的剪辑点上(如，当在两个接连的帧中存在冗余场时)。也存在不遵循正规的3∶2下拉模式的特殊影片，例如，3∶3∶2；2而不是3∶2∶3∶2。

在3场影片帧的情况中，我们只检验第一与第二场之间的场景改变，因为第三场是在编码器上丢弃的。

在框400上，如结合图3中框320、325、330、340或350说明的，计算d1、d2与scLast。

MCC维护指示已出现场景改变的标志ScDet。每当场景得分d1或d2中的改变超过正阈值时(框430)，将ScDet设定为真(即1)(框435)。每当d1与d2中的改变为负且小于负阈值时(框440)，将ScDet复位成零(框425与445)。当d1与d2接近Th0时，即d1与d2都不超过ThPos或小于ThNeg，则不改变ScDet(框450)。

维护监视计数器CountDown来记录自从上一次场景得分超过正阈值以来流逝的帧数。对于那时以后的每一个帧将计数器减1(框410)直到它到达零为止(框405)。当计数器到达零时将ScDet复位到零(框415)。在场景得分中的大的负改变并不跟随大的正骤增的情况中这一机制强制ScDet复位，当物体开始在静止图象中运动时可能出现这一情况(即在静止到运动序列中)。

图5示出按照本发明设置场景改变标志的流程图。

在框500上确定ScDet，如结合图4中框415、425、435、445与450讨论的。

MCC利用在编码流水线200的预处理级205上确定的初始画面类型(B帧或非B帧)(框505)来指示在当前帧上可能开始新的GOP。如果在预处理的B帧上检测到场景改变(框510)，将ScPending设定为真，但不设置对B帧的场景改变(框515)。如果在预处理的B帧上未检测到场景改变(框510)，便将该B帧的ScPending与Scene_change标志设定为伪(框520)。

对于预处理的B帧后面的下一个P帧，当ScDet或ScPending为真时(框525)，将场景改变标志设定为真(框530)。对于预处理的B帧后面的下一个P帧，当ScDet与ScPending都非真时(框525)，将场景改变标志设定为伪(框535)。

这样，MCC通过ScCount记录当前在处理流水线中的场景改变的数目。如果置位Scene_change标志，则将ScCount的值增加1(框530)，而如果编码级上的当前画面为场景改变帧，则减1(图6中框610)。将预处理的帧的Scene_change标志与preType存储在MCC160的循环缓冲器165中，并在以后检索来确定编码该帧时的最终画面类型。循环缓冲器165是用临时参照标记索引的，该标记是指示各帧的输入次序的序号。注意对循环缓冲器165的输入是按显示次序的，而输出是按编码次序的(B/P帧重新排序之后)。

图6示出按照本发明为一帧确定最终画面编码类型的流程图。

当一帧到达流水线的(最终)编码级时，MCC从其循环缓冲器中检索该帧的preType与Scene_change标志的值(框600)。这是为要在视频压缩器的编码级225上编码的帧执行的。如果当前帧的Scene_change设定为真(框605)，便将ScCount减1(框610)。这些值用来在框670、675或685中确定该帧的最终画面编码类型(Picture_type)。

维护GOP中到目前为止已编码的帧数的计数(FrameCount)。如果FrameCount到达用户配置的GOP标称长度(GopLen)(框655)，或者如果在当前帧上检测到场景改变且当前在处理流水线中不存在其它场景改变帧(如用ScCount＝伪指示的)(框645)，则通过将P帧转换成I帧(框675)开始新的GOP(框620)。

然而，即使满足上述条件，如果在编码流水线中任何未编码的帧上检测到场景改变(框635)，或者如果在位流缓冲器140(图1)中没有足够的空间来容纳一个I帧(框625)，则不开始新的GOP(框640)。例外是当FrameCount超过GOP的最大允许长度(MaxGopLen)时(框615)，在这一情况中无论如何都开始新的GOP(框620)。

在框665上，如果preType为B帧，则不存在改变(框670)。如果preType为P帧，则在start_new_gop为真时(框680)将其改变成I帧(框675)。如果preType为P帧，当start_new_gop为伪时(框680)则不改变它(框685)。注意直到编码级为止，I与P帧在整个流水线中是同样对待的。在编码级之前没有必要判定一帧是I还是P帧。

利用start_new_gop标志(框620与640)来发出是否用要编码的当前帧开始新的GOP的信号。如流程图中所示确定start-_new_gop与piture_type的最终值。

用来确定是否开始新的GOP的缓冲器水平阈值的计算如下：

ThBuf＝target_buffer_level＋(0.5*GopLen*bit_rate/frame_rate)

对于1920×1080I模式将target_buffer_level(目标缓冲器水平)设定为max_decoder_buffer_level(最大解码器缓冲器水平)的1/6，及对于1280*720 P模式，将其设定为max_decoder_buffer_level的1/5。max_decoder_buffer_level为接收编码的位流的解码器缓冲器能保持的最大位数。此外，将ThBuf的值封顶成不超过max_decoder_buffer_level的一半。场景改变实例

表A—D示出四种可能的场景改变情况。其它情况也是可能的。在这些情况中，使用下列记号：

X1：第一场景X的第一场

X2：第一场景X的第二场

Y1：第二场景Y的第一场

Y2：第二场景Y的第二场

xx：场景X中的场之间的sumMAD

xy：场景X与场景Y(假定xy＞＞xx)中的场之间的sumMAD

0：ThNeg＜delta＜ThPos

+＝delta＞ThPos

-＝delta＜ThNeg

例如，在表A中，各帧具有第一与第二场。对于帧1与2，X1为第一场而X2为第二场。对于帧3～5，Y1为第一场而Y2为第二场。从而，场景X与场景Y之间的边界是在帧3上。因此帧3为场景改变帧(ScDet＝1)。场景改变帧是通过观察增量值确定的。对于表A，在帧3的第一场(Y1)上增量(delfa)从“0”(表示小或零值)变到“+”(表示大的正值)。在帧3的第二场(Y2)上，增量变回到“0”，然后在帧4的第一场(Y1)上到大的负值(-)，然后在帧4的第二场及以后回到小或零值(0)。

注意对于下述增量序列0，0，+，0，0，0，…，对带有“+”增量值的帧将ScDet设置成“1”，而对于各后面的帧，将其保持在“1上。即使增量并不改变到“-”，10帧之后上述监视计数器(CountDown)也导致将ScDet设回到“0”以免保持在永久性场景改变状态中。当物体开始在静止图象中运动时，可能出现这一增量序列。反之，当运动场景停止并成为静止画面时，得出增量序列，0，0，0，-，0，0，…。在这一情况中，不会检测到伪场景改变。

作为该记号的实例，表A中，帧、2场X1的“xx‘记号指定帧1的X1与帧2的X1之间的sumMAD。帧3、场Y1的“xy”记号指定帧2的X1与帧3的Y1之间的sumMAD。帧4、场Y1的“yy”记号指示帧3的Y1与帧4的Y1之间的sumMAD。

情况1—A表示根据对帧序列B、P、B、P、B的场景改变检测的画面类型的重设。具体地在帧4中，将P帧改为I帧。这指示新的GOP的开始

情况1—B表示根据对帧序列P、B、P、B、P的场景改变检测的画面类型的重设。具体地，在帧3中将P帧改为I帧

各种其它帧序列也是可能的。

注意即使检测是根据检验各场的增量的，ScDet是为整个帧设置的。

在表B中，场景在帧3的场边界上改变(在第一场X1与第二场Y2之间)。X1是场景X的一部分，而Y2是第二场景Y的一部分。

表C示出不良剪辑，其中X、Y与Z表示三个独立的场景。场景改变是对帧3指示的，其中Y1是场景Y的第一场，而帧2的X2是场景X是最后场。没有对帧4检测场景改变，因为帧3的第二场(Z2)与帧4的第一场是同一场景(Z)的部分。

表4示出不良剪辑或闪光。帧3的第一场(Y1)是闪光或不良剪辑场景。

通常，当检测到场景改变帧且该场景改变帧为P帧时，将其改变成I帧。如果场景改变帧不是P帧，则将该场景改变帧后面的第一个P帧改变成I帧。

注意这些情况显示开放GOP，其中各I或P帧是用一或多个B帧分隔的。然而，并不要求开放的GOP。

表A—正常场景改变(在帧边界上)：

帧1 帧2 帧3 帧4 帧5输入场： X1 X2 X1 X2 Y1 Y2 Y1 Y2 Y1 Y2SumMADa：xx xx xx xx xy xy yy yy yy yyDelta 0 0 0 + 0 - 0 0 0ScDet 0 1 0 0情况1-A：preType B P B P BPicture_type B P B I B情况2-A：preType P B P B PPicture_type P B I B P

表B—同一帧的场边界上的场景改变：

帧1 帧2 帧3 帧4 帧5输入场： X1 X2 X1 X2 X1 Y2 Y1 Y2 Y1 Y2SumMADa：xx xx xx xx xx xy xy yy yy yyDelta 0 0 0 0 + 0 - 0 0ScDet 0 1 0 0情况1-B：preType B P B P BPicture_type B P B I B情况2-B：preType P B P B PPicture_type P B I B P

表C—不良剪辑：

帧1 帧2 帧3 帧4 帧5 帧6输入场： X1 X2 X1 X2 Y1 Z2 Z1 Z2 Z1 Z2 Z1 Z2SumMADa：xx xx xx xx xy xz yz zz zz zz zz zzDelta 0 0 0 + + + - 0 0 0 0ScDet 0 1 0 0 0情况1-C：preType B P B P B PPicture_type B P B I B P情况2-C：preType P B P B P PPicture_type P B I B P B

表D—不良剪辑或闪光：

帧1 帧2 帧3 帧4 帧5 帧6输入场： X1 X2 X1 X2 Y1 X2 X1 X2 X1 X2 X1 X2SumMADa： xx xx xx xx xy xx xy xx xx xx xx xxDelta 0 0 0 + - + - 0 0 0 0ScDet 0 1 0 0 0情况1-D：preType B P B P B PPicture_type B P B I B P情况2-D：preType P B P B P BPicture_type P B I B P B

Frame_Pred_Frame_DCT(帧预测—帧DCT)决定：

MPEG—2编码器对影片模式画面只使用基于帧的预测与DCT。这是通过在位流语法中设定标志Frame_Pred_Frame_dct＝1达到的。如果Frame_Pred_Frame_dct＝0，则能对该画面在逐个宏块的基础上采用基于场或帧的预测与DCT。

此外，MPEG—2提供repeat_first_field(重复第一场)标志来发出信号，当将其设定为1时，则当前帧属于影片并包含冗余的第一场，使该帧由三个输入场组成。具体地，第一场(由MPEG值top_field_first(上面场在前)标识的上或下场)后面跟随另一场，然后重复第一场。

本发明人已确定，如果影片帧包含冗余的第一场(repeat_first_field＝1)，不大可能在该帧的奇数与偶数场之间的边界上出现场景改变。更有可能在帧边界上存在清楚的场景改变。因此，按照传统的MPEG—2方案设置frame_pred_frame_dct＝1，并用基于帧的DCT与预测编码整个帧。

然而，为了处理在影片模式帧的奇偶场边界上出现的场景改变时的特殊情况，按照本发明取消frame_pred_frame_dct标志以便允许在逐个宏块的基础上的基于帧或场的预测与DCT。即使带有指定正在对各宏块使用的是基于场还是基于帧的预测与DCT所需的位的增加的开销，这还是改进了编码效率，因为预先场景改变场的相关性是高的，且后场景改变场的相关性是高的，但包含预先与后场景改变场两者的帧与只包含预先或后场景改变场的其它帧的相关性是低的。

从而，当在影片模式帧中存在不良剪辑时，编码器不限于在转换帧上只使用基于帧的预测与DCT。

从而，如果在特定的帧上检测到场景改变，将frame_pred_frame_dct标志的值设定为与repeat_first_field(重复第一场)标志相同的值。否则，frame_pred_frame_dct标志完全由电视电影检测结果确定，使得如果检测到影片便将frame_pred_frame_dct设定为真，而如果未检测到影片便设定为零。

现在应理解，本发明提供了用于在逐个场的基础上检测场景改变，及调整画面编码类型来优化视频编码器的编码效率的***。通过将I帧与场景改变对齐，极大地改进了MPEG编码器的编码效率。本发明对HDTV与SDTV信号都是有利的。在检测到包含闪光或由不适当剪辑导致的不良场在内的场景改变时，便调整画面编码类型来优化视频编码器的编码效率。将新的GOP的开始画面(即I帧)与场景改变对齐，以便极大地改进MPEG编码器的编码效率。在预处理级中，为每一接连的输入场计算接连的奇数场或接连的偶数场之间的象素差之和中的改变。当和的变化中的大的正值后面跟随大的负值时，便检测到场景改变。在最终编码级之前不作出采用哪一种画面类型的决定。当编码器缓冲器水平太高时能禁止I帧。

监视计数器复位场景改变指示以避免从静止到运动的转换的永久场景改变状态。

对于确定为场景改变帧的MPEG影片模式帧，当在场界边上可能已出现场景改变时，(如在画面中没有冗余场时)，便撤消MPEG推荐的基于帧的离散余弦变换(DCT)与预测编码。在这种撤消时，可在画面中逐个宏块的基础上使用基于帧或场之一的DCT与预测。

虽然已结合各种特定实施例描述了本发明，熟悉本技术的人员会理解可对其作出许多适应与修改而不脱离权利要求中所提出的发明精神的与范围。

例如，虽然这里已讨论了各种语法单元，注意它们只是示例而已，并且可以采用任何语法。

Claims

1.一种编码具有接连的视频帧的数字视频信号的方法，包括下述步骤：

预处理视频信号来为各接连的帧计算该帧的第一场与前一帧的第一场之间的象素差的第一和，及该帧的第二场与前一帧的第二场之间的象素差的第二和；

为各接连的帧分别计算其第一与第二和相对于该前一帧的第一与第二和的改变；以及

当其第一或第二和中至少一个中的改变超过正阈值，且后继帧的第一或第二和中至少一个中的改变小于负阈值时，指定接连的帧中特定的一帧为场景改变帧。

2.权利要求1的方法，包括进一步的步骤：

当已指定了场景改变帧时禁止内编码(I)帧的编码。

3.权利要求1的方法，包括下述进一步的步骤：

维护接连的场景改变帧的数目的计数；及

终止其计数超过最大值的场景改变帧的场景改变指定，以免对静止到运动视频转换保持在永久性场景改变状态中。

4.权利要求1的方法，包括进一步的步骤：

维护当前在视频编码器的处理流水线中的未编码的场景改变帧的数目的计数。

5.权利要求4的方法，包括进一步的步骤：

除外场景改变帧的信号列中最后的场景改变帧，只要该计数具有大于零的值便禁止内编码(I)帧的编码。

6.权利要求1的方法，其中该视频信号是用包含下述级的流水线***结构处理的：(a)预处理级，在其中进行所述预处理、计算与指定步骤，及(b)编码级，在其中编码各帧，所述方法包括进一步的步骤：

在编码级中响应所述指定步骤改变这些帧之一的预指定的画面类型。

7.权利要求6的方法，其中：

将用于为P帧的场景改变帧的预指定的画面类型在所述改变步骤中改成I帧。

8.权利要求6的方法，其中：

该场景改变帧为B帧，及在所述改变步骤中将下一个接连的P帧的预指定的画面类型改成I帧。

9.权利要求6的方法，其中：

该流水线***结构提供用于编码接连的视频帧的超前缓冲存储能力。

10.权利要求1的方法，包括进一步的步骤：

按照已指定了场景改变帧时开始编码新的画面组(GOP)。

11.权利要求10的方法，其中该场景改变帧为影片模式帧，包括下述进一步步骤：

确定是否指示了该影片模式帧的第一与第二场之间的场景改变边界；以及

当在所述确定步骤中指定了所述边界时，允许在逐个宏块的基础上基于帧与场两者的预测与离散余弦变换(DCT)编码该影片模式帧。

12.权利要求11的方法，其中：

当在该影片模式帧中不存在重复场时，所述确定步骤确定指示了该影片模式帧的第一与第二场之间的场景改变边界。

13.权利要求11的方法，包括进一步的步骤：

当所述确定步骤确定未指示该影片模式帧的第一与第二场之间的场景改变边界时，只允许基于帧的预测与离散余弦变换(DCT)编码该影片模式帧。

14.权利要求13的方法，其中：

当在该影片模式帧中存在重复场时，所述确定步骤确定未指示该影片模式帧的第一与第二场之间的场景改变边界。

15.权利要求1的方法，包括进一步的步骤：

监视接收视频信号的编码数据的缓冲器的充满水平，以及

按照充满水平超过最大值时，禁止内编码(I)帧的编码。

16.权利要求1的方法，包括进一步的步骤：

当已指定了场景改变帧时禁止内编码(I)帧的编码，直到编码了该场景改变帧且不存在其它指定的但尚未编码的场景改变帧为止。

17.一种用于编码具有接连的视频帧的数字视频信号的方法，包括下述步骤：

根据场景改变标准指定接连的帧中特定的一帧作为场景改变帧；

其中该场景改变帧为影片模式帧；

当在所述确定步骤中指示了所述边界时，允许在逐个宏块的基础上基于帧与场两者的预测与离散余弦变换(DCT)编码该影片模式帧。

18.权利要求17的方法，其中：

当在影片模式帧中不存在重复的场时，所述确定步骤确定指示了该影片模式帧的第一与第二场之间的场景改变边界。

19.权利要求17的方法，包括进一步的步骤：

20.权利要求19的方法，其中：

当在该影片模式帧中存在重复的场时，所述确定步骤确定未指示该影片模式帧的第一与第二场之间的场景改变边界。

21.一种用于编码具有接连的视频帧的数字视频信号的装置，包括：

预处理器，用于预处理该视频信号来为各接连的帧计算该帧的第一场与前一帧的第一场之间的象素差的第一和，及该帧的第二场与前一帧的第二场之间的象素差的第二和；

用于为各接连的帧计算其第一与第二和分别相对于前一帧的第一与第二和的改变的装置；以及

场景改变检测器，用于当其第一和或第二和中至少一个中的改变超过正阈值，且后续帧的第一或第二和中至少一个的改变小于负阈值[SWU34]时，指定接连的帧中特定的一帧为场景改变帧。

22.一种用于编码具有接连的视频帧的数字视频信号的装置，包括：

用于按照场景改变标准指定接连的帧中特定的一帧作为场景改变帧的装置；

其中该场景改变帧为影片模式帧；

场景改变检测器，用于确定是否指示了该影片模式帧的第一与第二场之间的场景改变边界；以及

用于当所述场景改变检测器确定指示了所述边界时，允许在逐个宏块的基础上基于帧与场两者的预测与离散余弦变换(DCT)编码该影片模式帧的装置。