CN1774930A

CN1774930A - 视频转码

Info

Publication number: CN1774930A
Application number: CNA2004800102870A
Authority: CN
Inventors: D·布拉泽罗维
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2003-04-17
Filing date: 2004-04-13
Publication date: 2006-05-17
Also published as: DE602004008763T2; JP2006524000A; EP1618744A1; EP1618744B1; ATE372646T1; US20070036218A1; WO2004093461A1; KR20050112130A; DE602004008763D1

Abstract

本发明涉及在第一和第二视频标准(比如H.264和MEPG－2)之间的视频转码。视频转码器(201)包括接收遵循第一视频编码标准的视频信号的接口(203)。该视频信号在解码器(207)中被解码。提取处理器(209)从第一视频信号中提取运动估计数据，这优选地作为该解码处理的一部分。运动估计数据处理器(211)从第一运动估计数据产生遵循第二视频编码标准的第二运动估计数据，该第二视频编码标准具有不同的一组运动估计选项。第二运动估计数据是通过在参考画面之间投影运动估计块位置、将预测块与一个块位置框架对准以及调节预测块大小而产生的。将第二运动估计数据馈送给编码器(213)，该编码器使用第二运动估计数据、按照第二视频编码标准对该解码信号进行编码。

Description

视频转码

发明领域

本发明涉及一种视频转码器和相应的视频转码方法，并且尤其(但并非专门)涉及H.264视频信号到MPEG2视频信号的视频转码。

发明背景

近年来，数字存储和视频信号分发的应用变得越来越普及。为了减小发送数字视频信号所需的带宽，公知的方法是使用包括视频数据压缩的高效数字视频编码，从而可以充分减小数字视频信号的数据速率。

为了确保互操作性，在推动数字视频在很多专业和民用应用中的采用方面，视频编码标准扮演着很重要的角色。最有影响的标准传统上是由国际电信联盟(ITU-T)或ISO/IEC(国际标准化组织/国际电工学委员会)的MPEG(运动画面专家组)委员会开发的。ITU-T标准(称为推荐)典型地针对实时通信(例如电视会议)，而大多数MPEG标准是针对存储(例如针对数字通用盘(DVD))和广播(例如针对数字视频广播(DVB)标准)而优化的。

当前，得到最广泛采用的视频压缩技术中的一种称为MPEG-2(运动画面专家组)标准。MPEG-2是基于块的压缩方案，其中将帧分为多个块，每个块包括八个垂直像素和八个水平像素。为了压缩亮度数据，使用离散余弦变换(DCT)单独对各个块进行压缩，随后进行量化，从而将大量经过变换的数据的值减小为零。为了压缩色度数据，通常首先通过下采样减少色度数据量，以使得对于每四个亮度块得到两个色度块(4:2:0格式)，然后使用DCT和量化对其进行类似的压缩。仅仅基于帧内压缩的帧称为内部帧(1帧)。

除了帧内压缩之外，MPEG-2使用帧间压缩来进一步减小数据速率。帧间压缩包括根据先前的I帧产生预测帧(P帧)。此外，在I帧和P帧之间一般来说还会***双向预测帧(B帧)，其中压缩是通过仅仅传输B帧和周边的I帧和P帧之间的差异来实现的。此外，MPEG-2使用运动估计，其中在处于不同位置上的后续帧中找出的一帧的宏块的图像是简单地利用运动矢量进行传送的。运动估计数据总地来说指的是运动估计处理期间所采用的数据。进行运动估计是为了确定用于运动补偿处理的参数，或者是为了确定帧间预测的参数。在基于块的视频编码(例如由诸如MPEG-2和H.264之类的标准规定)中，运动估计数据一般来说包括候选运动矢量、预测块大小(H.264)、对于某一宏块的参考画面选择或运动估计类型(向后、向前或双向)，在这些数据当中进行选择，以构成实际得到编码的运动补偿数据。

这些压缩技术的结果是，能够以大约2-4Mbps的数据速率发送标准电视工作室广播质量水平的视频信号。

近来，推出了一种新的ITU-T标准，称为H.26L。H.26L正在逐渐受到广泛关注，因为它与现有的标准(比如MPEG-2)相比具有更高的编码效率。虽然H.26L的增益一般会与画面大小成比例地减小，但是它用在大范围的应用中的潜力是确定无疑的。这种潜力已经通过联合视频组(JVT)论坛的形成得到了认可，该论坛负责将H.26L最终确定为新的联合ITU-T/MPEG标准。新的标准称为H.264或MPEG-4AVC(高级视频编码)。而且，基于H.264的解决方案正不断在其它标准化团体中受到考虑，比如DVB和DVD论坛。

H.264标准采用与从已经建立起来的标准(比如MPEG-2)获知的基于块的运动补偿混合变换编码相同的原理。因此H.264语法是按照报头(比如画面、片段和宏块报头)和数据(比如运动矢量、块变换系数、量化器标度等)的通常的分级结构组织的。不过，H.264标准将视频编码层(VCL)(代表视频数据的内容)和网络适配层(NAL)(格式化数据并提供报头信息)分开。

而且，H.264为编码参数的更多选择做好了准备。例如，它为16×16宏块的更细划分和操作做好了准备，从而例如能够对小到4×4的宏块分段进行运动补偿处理。而且，用于对样本块的运动补偿预测的选择处理可以涉及多个已存储的、之前进行过解码的画面(也称为帧)，而不仅仅是相邻的画面(或帧)。即使在单一帧内的帧内编码的情况下，也有可能使用来自同一帧的之前经过解码的样本形成对块的预测。而且，伴随着运动补偿而最终得到的预测误差也可以基于4×4块大小加以变换和量化，而不是传统的8×8大小。

MPEG-2广泛用于数字视频分发、存储和播放，并且由于新的视频编码标准(比如H.264)已经推出，因此提供用于对使用新标准的设备和使用现有标准的设备进行接口的措施是很有益处的。具体来说，由于MPEG-2和H.264的应用范围非常大，因此对用于在这两种标准进行转换的便宜且有效的方法将会有不断增长的需求。特别地，将H.264转换成MPEG-2将是延长现有的基于MPEG-2的***的使用时间所必需的，并且这样能够将H.264逐渐引入到现有的视频***中。

因此，用于在不同视频标准之间(尤其是H.264和MPEG-2视频标准之间)进行转换的转码器应当是很有用的。

将H.264视频信号转换成MPEG-2格式的方法是，在H.264解码器中将其完全解码，随后在MPEG-2编码器中对解码信号进行重新编码。不过，这种方法有一个主要的缺点，即它需要相当多的资源。这种级联的实现方式趋于复杂且昂贵，因为需要独立地实现这两个完整的解码器和编码器。这可能例如会使得它对于消费者实时实现来说无法得到实际应用，因为所需的计算资源致使方案非常复杂且昂贵。一般来说，视频信号的独立解码和编码可能还会导致视频质量的下降，因为重新编码期间做出的决定没有考虑原始编码的参数。

因此，已知的转码器往往复杂、昂贵、不灵活、对资源要求苛刻、效率低、延迟高、数据速率兼容性降低和/或性能并非最佳。因此，经过改进的转码***会是很有前景的。

发明概要

因此，本发明设法提供一种用于转码的改进***，并且优选地设法单独地或以任意组合方式减轻、缓解或消除上面提到的缺点。

按照本发明的第一方面，提供了一种视频转码器，包括：用于接收按照第一视频编码格式编码的第一视频信号的装置；用于按照第一视频编码格式对第一视频信号进行解码、以产生解码信号的装置；用于从第一视频信号中提取第一运动估计数据的装置，该第一运动估计数据遵循第一视频编码格式；用于由第一运动估计数据产生第二运动估计数据的装置，该第二运动估计数据遵循第二视频编码格式，该第二视频编码格式具有与第一视频编码格式不同的运动估计选项组；和用于使用第二运动估计数据按照第二视频编码格式对该解码信号进行编码、以产生经过转码的视频信号的装置。

本发明的发明人认识到，视频信号的运动估计数据可以用在转码处理中，尽管一种格式的运动估计参数不具有第二种视频编码格式中的直接对应关系。这样，本发明的发明人认识到，运动估计数据可以用在两种具有不同运动估计选项组的格式之间的转码处理中。例如，产生第二运动估计数据的步骤可以包括将第一运动估计数据转换成与第二视频编码格式的运动估计选项相应的运动估计数据参数以及响应于所述运动估计数据参数确定第二运动估计数据。

第一视频编码格式可以是第一视频编码标准，类似地，第二视频编码格式可以是第二视频编码标准。

本发明能够实现具有降低的复杂度、成本、得到减少的资源要求、得到增加的灵活性、得到减小的延迟、得到增加的数据速率能力和/或得到改善的性能的转码器。具体来说，确定用于编码该解码信号的运动估计数据所需的处理可以通过根据第一运动估计数据产生第二运动估计数据而得到明显的简化，尽管这些标准包括不同的运动估计选项。例如，确定适当的运动估计参考块所需的操作可以通过在第一视频信号中使用并且包括在第一运动估计数据中的运动估计块的基础上进行而得到明显减少。这能够实现计算要求较低的实现方式，从而实现更加便宜的实现方式、功耗降低和/或复杂度降低。替换地或附加地，计算要求的减少可以实现具有低延迟的实现方式和/或具有高数据速率的实时处理能力的转码器。使用第一运动估计数据可以进一步提高第二运动估计数据的精度，并且因此得到了提高的编码画面的编码视频质量。

对于大多数视频编码标准，编码处理比解码处理明显更加复杂且资源需求更多。运动估计一般来说是视频编码的最复杂且资源需求最多的处理之一，因此通过在转码器中简化运动估计，能够获得非常显著的改善。据此，本发明允许对转码的最关键方面进行改善和/或简化。

用于从第一视频信号中提取第一运动估计数据的装置可以是用于对第一视频信号进行解码的装置的集成部分。例如，可以作为解码处理的一部分自动地产生和提取第一运动估计数据。

按照本发明的一个特征，第二视频编码格式包括与第一视频编码格式不同的一组可能的预测块大小。因此，本发明能够通过响应于第一运动估计数据产生第二运动估计数据来实现具有低计算要求的转码器，尽管相关的视频编码格式具有不同组的可能预测大小。例如，第一视频信号可以包括比对于遵循第二视频格式的经过转码的信号可能的预测块大小要小的预测块大小。不过，这些较小的预测块大小可用于产生遵循第二视频标准的运动估计数据，从而明显简化了用于编码的装置的运动估计处理。

按照本发明的一个不同的特征，第二视频编码格式包括与第一视频编码格式不同的一组可能的参考画面。因此，本发明能够通过响应于第一运动估计数据来产生第二运动估计数据而实现具有低计算要求的转码器，尽管相关的视频编码格式具有不同组的可能参考画面。例如，第一视频信号可以包括这样的参考画面，其与正被编码的画面的距离比遵循第二视频格式的经过转码的信号的可能距离更远。不过，这些更远的参考画面可以用于产生遵循第二视频格式的运动估计数据，从而明显简化了用于编码的装置的运动估计处理。

按照本发明的一个不同特征，第二视频编码格式允许将与第一视频编码格式不同数量的预测块用于编码块。因此，本发明能够通过响应于第一运动估计数据来产生第二运动估计数据而实现具有低计算要求的转码器，尽管相关的视频编码格式对于编码块允许不同数量的预测块。例如，编码块可以是宏块，第一视频信号对于给定宏块可以包括比遵循第二视频格式的经过转码的信号的可能预测块数量更多的预测块。不过，这些额外的预测块可以用于产生遵循第二视频格式的运动估计数据，从而明显简化了用于编码的装置的运动估计处理。

按照本发明的一个不同特征，所述用于转换的装置包括用于将第一参考画面的第一运动估计块位置投影到第二参考画面中的第二运动估计块位置的装置。例如，用于编码的装置可以包括用于通过在第二参考画面中投影第二运动估计块位置来确定第一运动估计块在第一参考画面中的位置的装置。在与给定参考画面相关的运动估计数据中的运动估计块位置可以用于确定在与一个不同参考画面相关的第二运动估计数据中的运动估计块位置，这是通过在所述参考画面之间投影运动估计块位置来实现的。这能够实现非常有效和/或复杂度非常低的用于确定第二运动估计数据的方法。这尤其适用于第一视频编码标准比起第二视频编码标准允许更多种参考画面的应用，因为第二视频编码标准所不允许的第一视频信号中的参考画面的运动估计数据可以通过将运动估计块位置投影到所允许的参考画面上而得到使用。因此，在某些应用中，所述投影可以在具有不同运动估计选项组的视频编码标准之间实现对运动估计数据的再利用，并且因此能够实现前面提到的一个、多个或全部优点。

按照本发明的一个不同特征，第一参考画面具有与第二参考画面不同的相对于编码画面的位置。这允许视频转码在按照一种视频标准对视频信号进行编码的过程中再利用来自其中画面与相关参考画面之间具有较大距离的视频信号的运动估计数据，而该种视频标准是不允许画面之间有这样的距离的。

按照本发明的一个不同的特征，第一参考画面不与编码画面相邻，并且第二参考画面与该编码画面相邻。这能够实现非常低复杂度和/或有效的对非相邻参考画面的运动估计数据的再利用，其中所述非相邻参考画面的运动估计数据要在相邻参考画面中再利用。这尤其适用于例如H.264(允许非相邻参考画面)到MPEG-2(仅允许相邻参考画面)转码器。在这种情况下，在MPEG-2编码中可以再利用来自非相邻参考画面的运动估计数据。

按照本发明的一个不同特征，所述用于投影的装置能够通过缩放第一运动估计数据的至少一个运动矢量以产生第二运动估计数据的至少一个运动矢量来实现所述投影操作。这能够实现非常有效、精确和/或复杂度非常低的用于投影的装置的实现方式。

按照本发明的一个不同特征，所述用于转换的装置此外还包括用于将第二运动估计块位置与第二视频编码格式的块位置框架对准的装置。这有助于(并且在某些应用中能够实现)在第一和第二视频编码标准具有不同块位置框架的情况下对运动估计数据的再利用。

按照本发明的一个不同特征，第一视频补偿数据包括至少一个小于第二视频编码格式的最小预测块大小的第一预测块，并且所述用于转换的装置能够选择第二运动估计数据的预测块以使其包括该第一预测块。这有助于(并且在某些应用中能够实现)在按照第一视频编码格式的预测块大小可能小于第二视频格式中允许的大小的情况下的转码处理，并且确保了所使用的预测块被包括在用于确定第二运动估计块的预测块中。

按照本发明的一个不同特征，所述用于转换的装置能够通过将第一运动估计数据的多个预测块一起分组到一组中来选择第二运动估计数据的预测块以及对该组确定单个运动矢量。这进一步简化并且减少了转码的复杂度。

按照本发明的一个不同特征，所述用于转换的装置能够进行这样的操作：通过响应于第一运动估计数据的多个预测块的预测块大小来选择所述多个预测块的一个子集，从而选择第二运动估计数据的预测块。这进一步简化并且减少了转码的复杂度。

按照本发明的一个不同特征，所述用于编码的装置能够产生具有与解码信号的画面大小不同的画面大小的经转码的信号。这能够实现此外还能够改变画面大小的有效转码。

按照本发明的一个不同特征，所述用于编码的装置能够产生具有与解码信号的画面频率不同的画面频率的经转码的信号。这能够实现此外还能够修改画面频率的有效转码。

优选地，第一视频编码标准是国际电信联盟推荐H.264或者也可以是由ISO/IEC(国际标准化组织/国际电工学委员会)制定的ISO/IEC14496-10 AVC标准。第二视频标准优选地是国际标准化组织/国际电工学委员会运动画面专家组MPEG-2标准。因此，本发明能够实现用于将H.264视频信号转码为MPEG-2视频信号的有效转码器。

按照本发明的第二个方面，提供了一种转码方法，包括：接收按照第一视频编码格式编码的第一视频信号；按照第一视频编码格式对第一视频信号进行解码、以产生解码信号；从第一视频信号中提取第一运动估计数据，该第一运动估计数据遵循第一视频编码格式；由第一运动估计数据产生第二运动估计数据，该第二运动估计数据遵循第二视频编码格式，该第二视频编码格式具有与第一视频编码格式不同的运动估计选项组；和使用第二运动估计数据按照第二视频编码格式对该解码信号进行编码、以产生经过转码的视频信号。

通过下文中介绍的(多种)实施例，本发明的这些和其它的方面、特征和优点将会显而易见，并且将参照下文中介绍的(多种)实施例阐述本发明的这些和其它的方面、特征和优点。

附图简述

下面将参照附图仅以举例的方式介绍本发明的一种实施例，其中：

附图1表示按照H.264标准将宏块分割成运动估计块的可能方式；

附图2表示按照本发明一种实施例的转码器的框图；

附图3表示按照本发明一种实施例的将视频信号从第一视频编码标准转码为第二视频编码标准的方法的流程图；

附图4表示按照本发明一种实施例的将预测块的运动估计块位置从一个参考画面投影到另一个画面上的实例；

附图5表示按照本发明一种实施例的对准预测块的运动估计块位置的实例；和

附图6表示按照本发明一种实施例的选择预测块的实例。

具体实施例描述

下面的说明将集中在可应用于转码器的本发明的实施例上，该转码器用于把在编码参数选择方面具有高自由度的第一视频编码标准的信号转码到在编码参数选择方面具有较低自由度的第二视频编码标准的信号。具体来说，本说明书将集中在用于将H.264编码视频信号转码为MPEG-2编码视频信号的转码器上。不过，应意识到，本发明并不局限于这种应用，并且还可以与很多其它的视频编码算法、规格或标准结合起来使用。

在下文中，所提到的H.264包括等价的ISO/IEC 14496-10AVC标准。

大多数已经建立的视频编码标准(例如MPEG-2)固有地使用基于块的运动补偿作为利用视频中的相继图像之间的相关性的方法。例如，MPEG-2通过相邻参考画面中的一个密切匹配来试图预测某一画面中的宏块(16×16像素)。如果该宏块与相邻参考画面中的它的相关预测块之间在像素方面的差异足够小，则对该差异进行编码，而不对宏块本身编码。预测块相对于实际宏块的坐标的相对位移由运动矢量表示。运动矢量是被分开编码的，并且包含在经过编码的视频数据流中。在MPEG-2中，各16×16块(或宏块)一般来说是通过单个相同大小的预测块来预测的，该预测块是根据画面的类型从前面的或后续的画面或者它们二者中获取的。

新的视频编码标准(比如H.26L、H.264或MPEG-4AVC)通过提高的质量对数据速率的比值来保证视频编码性能得到提高。由这些标准实现的数据速率减小很大程度上可归功于运动补偿方法的改良。这些方法大多扩展了以前标准(比如MPEG-2)的基本原理。

一种相关的扩展是使用多个参考画面来进行预测，从而预测块可以由更远的未来画面或者过去画面来产生。这允许在更远的画面中找到适当的预测块，并且这样增大了找到紧密匹配的概率。

另一种更加有效的扩展是使用可变块大小来预测宏块的可能性。从而可以将宏块(仍然是16×16像素)划分成多个较小的块，并且可以对这些子块中的每一个单独进行预测。因此，不同的子块可以具有不同的运动矢量并且可以从不同的参考画面中取得。预测块的数量、大小和指向是由帧间预测模式的定义唯一确定的，帧间预测模式的定义描述了从宏块到8×8块的可能划分方式和各个8×8子块的进一步划分方式。附图1表示按照H.264的从宏块到预测块的可能划分方式。

这样，H.264不仅使得更远的画面能够用作预测用的参考画面，而且能够实现从宏块到更小的块的划分，并且使得单独预测能够用于各个子块。因此，各个预测子块在原理上可以具有不同的相关运动矢量，并且可以从不同的参考画面中获取。这样，H.264对于每个宏块规定了与MPEG-2不同的一组可能的预测块大小、不同的一组可能的参考画面和不同的可能预测块数量。具体来说，参考画面并不局限于紧邻或相邻的画面，并且各个宏块可以分为多个较小的预测块，每个较小的预测块可以具有独立相关的运动矢量。

由于MPEG-2和H.264的应用范围很广，因此将会有不断增长的对在这两种格式之间进行转换的便宜且有效的方法的需求。具体来说，将会需要将H.264转换成MPEG-2来延长现有的基于MPEG-2的***的使用时间，并且需要将H.264设备逐渐地引入到现有的视频***中。虽然这样的转码可以通过在H.264解码器中完全解码H.264信号、随后在MPEG-2编码器中完全重新编码所得到的信号来实现，但是这往往需要相当多的资源。虽然H.264解码一般来说需要大量的计算，但是转码的瓶颈一般来说是MPEG-2重新编码处理，并且具体来说是其运动补偿处理。

附图2表示按照本发明的一种实施例的转码器201的框图。所介绍的转码器能够将H.264视频信号转换成MPEG-2视频信号。

该转码器包括接口203，它能够接收H.264编码的视频信号。在所示的实施例中，H.264视频信号是从外部视频源205接收的。按照其它一些实施例，视频信号可以从其它的源接收，比如内部视频源。

接口203与H.264解码器207相耦合，该解码器可对H.264信号进行解码以产生解码信号。解码器207与提取处理器209相耦合，该处理器可从H.264视频信号中提取第一运动估计数据。所提取出来的运动估计数据是包括在H.264视频信号中的H.2***估计数据的一部分或全部。因此，所提取出来的第一运动估计数据是按照H.264标准的运动估计数据。

本领域技术人员很清楚，虽然前面的说明和附图2表明提取处理器209是独立的功能实体，但是提取处理器209的功能优选地可以由解码器207提供。这样，第一运动估计数据优选地是作为解码处理的一部分由解码器207产生的。这降低了复杂度，因为运动估计数据不管是怎样从H.264信号中提取的，都是为了进行解码。

编码处理器213与运动估计数据处理器211相耦合，该运动估计数据处理器211可从按照H.264标准的第一运动估计数据产生按照MPEG-2标准的第二运动估计数据。这样，运动估计数据具有不同的运动估计选项组，具体来说，与MPEG-2标准所允许的相比，H.264视频信号可以使用更多和更远的参考画面以及更多和更小的预测块。

运动估计数据处理器211对第一运动估计数据进行处理，比如用来提供按照MPEG-2标准所允许的运动估计数据。具体来说，运动估计数据处理器211可以将H.264信号的运动估计数据转换成由MPEG-2规定的运动估计数据选项。

在该优选实施例中，对MPEG-2运动估计数据的初始估计是通过数学、函数或算法转换直接产生的，并且随后根据所述初始估计进行微调和搜索，从而可以产生最终的MPEG-2运动估计数据。MPEG-2信号的运动估计数据的确定基于来自H.264信号的运动估计数据，这导致复杂度明显降低以及运动估计数据确定处理的资源要求明显减少，并且可以进一步使运动估计得到改善，因为将H.254信号的原始信息考虑了进来。

运动估计数据处理器211与MPEG-2编码器213相耦合。MPEG-2编码器213此外还与解码器207相耦合，并且可以从那里接收解码信号。MPEG-2编码器213能够使用从运动估计数据处理器211接收到的第二运动估计数据、按照MPEG-2视频编码标准对该解码信号进行编码。因此，编码处理得到了较大地简化，因为运动估计处理是基于来自原始的H.264信号的现有运动估计数据。MPEG-2编码器213此外还能够从该转码器输出最终得到的经过转码的MPEG-2信号。

在该优选实施例中，运动估计数据处理器211产生对MPEG-2运动估计数据的初始估计，并且由MPEG-2编码器213进行后续的微调和搜索，以便产生最终的运动估计数据。为了在这些估计当中有效地选择出最终的运动估计数据，优选地计算所有估计的误差，从而由适当的标准或算法进行比较。估计误差可以被计算为所要编码的原始画面中的某一宏块与从相应参考画面(即先前已经进行了编码的画面(可以是先前的画面，也可以是后续的画面))取得的对该宏块的估计之间的差异。这样，对于这样的计算来说，来自原始画面的数据和来自该已经编码的画面的数据都可能被使用。MPEG-2编码器213得到与这两种画面相关的数据，并且一般来说包括用来存储中间编码结果的存储装置。因此，所述微调和搜索优选地是在MPEG-2编码器213中进行的。

这样，所介绍的实施例能够降低将H.264视频信号转码成MPEG-2格式的复杂度。虽然该方法仍然使用完全H.264解码，但是它减少了MPEG-2重新编码的最复杂的部分，这个部分是运动估计。这是通过将某些运动数据从H.264解码器传递到MPEG-2编码器来实现的。

此外，也可以将与画面大小、画面频率、画面组(GOP)结构等相关的高层次信息传递给MPEG-2编码器，并且不用修改即可重新使用该信息。这可以进一步降低编码器的复杂度和资源要求。

附图3表示按照本发明一种实施例的将视频信号从第一视频编码标准(比如H.264)转码为第二视频编码标准(比如MPEG-2)的方法的流程图。该方法可应用于附图2的设备，并且将参照附图2加以介绍。

该方法开始于步骤301，其中转码器201的接口203从外部视频源205接收H.264视频信号。

步骤301之后是步骤303，其中将H.264视频信号从接口203馈送到解码器207，该解码器207按照H.264标准对该信号进行解码，以产生解码信号。对H.264信号进行解码的算法和方法在本领域中是公知的，并且可以使用任何适当的方法和算法来进行。

步骤303之后是步骤305，其中提取处理器209从H.264视频信号中提取第一运动估计数据。在该优选实施例中，步骤303和305是集合在一起的，第一运动估计数据的提取作为解码处理的一部分。按照该实施例，可以将解码器207看成包括提取处理器209。运动估计数据优选地包括与用来对H.264信号进行编码和解码的预测块、运动矢量和参考画面有关的信号。

步骤305之后是步骤307，其中运动估计数据处理器211根据第一运动估计数据产生第二运动估计数据。第二运动估计数据遵循MPEG-2标准，并且因此可以用于根据该解码信号来编码MPEG-2信号。

按照所介绍的实施例，步骤307包括多个子步骤309-315。

在步骤309，将第一参考画面的第一运动估计块的位置投影到第二参考画面中的第二运动预测块的位置。按照该优选实施例，将一个参考画面中的预测块的运动估计块位置投影到具有与当前画面不同的偏移量的参考画面中的运动估计块位置。优选地，将H.264视频信号的不与当前画面紧邻的参考画面中的运动估计块位置投影到与当前画面紧邻(或相邻)的画面上。该投影优选地是通过运动矢量的缩放来实现的。

更加具体地讲，对于该优选实施例来说，宏块的每个预测子块在H.264中可以由不同的参考画面产生。不过，在MPEG-2中，在运动补偿期间，只有最近解码的画面可以被参考，这样就将预测块限定在了紧邻或相邻的画面中。因此，步骤309包括将所有的预测子块从远距离的参考画面投影到最近的参考画面的透视图上。这是通过缩放相应的运动矢量来实现的。按照该优选实施例，并不使用预测块本身，而是仅使用其位置和大小。通过将远距离画面的预测块位置投影到紧邻画面内的一个位置，确定了一个可能与该紧邻画面中的与原始预测块相应的块相匹配的位置。

附图4表示将预测块的运动估计块位置从一个参考画面投影到另一个参考画面的具体例子。该图展示了这样一个例子：画面P_i403中的宏块401的上半部分是从画面P_i-1407中的预测块405预测的，而同一宏块401的两个底部四分之一部分是由来自画面P_i-2413和P_i-m415中的预测块409、411预测的。最大的预测块405已经在最近的参考画面P_i-1403中，因此在这方面满足MPEG-2标准。其它的两个预测块409、411在较远的参考画面413、415中，因此被投影到该紧邻画面407中。这两个预测块409、411的投影是由该紧邻画面407中的附加块417、419表示的。

这些投影是通过用与相应画面离目标画面的对应距离成比例的系数对运动矢量MV₂ 421和MV₃ 423进行缩放而获得的。例如，画面P_i-2413和画面P_i 403之间的时间间隔是画面P_i-1 407和画面P_i 403之间的时间间隔的两倍。因此，块409在画面中的运动很有可能处于画面P_{i- 2}413中的该块的位置与画面P_i 403中的位置之间的半路上(假设是直线运动)。因此，将运动矢量MV₂ 421缩小一半。这样，经过缩放的运动矢量可以指向该紧邻画面中的那些很可能是用作MPEG-2编码的预测块的适当候选的预测块。

步骤309之后是步骤311，其中将所产生的运动估计块位置与MPEG-2编码标准的块位置框架对准。该对准优选地是通过按照MPEG-2编码标准的框架来量化所确定的运动估计块位置而实现的。该量化可以例如包括对所确定的运动估计块位置进行截断。

具体来说，H.264能够以1/4像素的分辨率实现预测块的内插(该标准的较高规格甚至可以使用1/8像素分辨率)，而MPEG-2对预测块估计位置使用1/2像素分辨率。按照该优选实施例，步骤311因此包括将运动估计块位置的1/4像素坐标转换成最接近的有效整数或1/2像素坐标，例如在正被预测的宏块位置的方向上。这在附图5中加以图解说明。左手边的图表示步骤309的投影之后的三个预测块501、503、505的可能位置。右手边的图示出在向MPEG-2的1/2像素栅格对准之后这三个预测块501、503、505的所确定位置。

步骤311之后是步骤313，其中对MPEG-2预测块进行选择，这些预测块包括在步骤307和/或309中确定的预测块。具体来说，在MPEG-2中，必须将宏块作为整体加以预测(每宏块一个运动矢量)。在H.264中，可以对给定宏块使用多个较小的预测块。这样，第一视频补偿数据可以包括小于MPEG-2的最小预测块大小(对应于一个宏块)的一个或多个预测块。因此在步骤311中，预测块候选是对整个宏块确定的，从而所确定的第二运动估计数据的预测块包括在步骤309和/或311中确定的预测块。这样，以这种方式确定其大小与宏块相等的预测块：每个候选的一部分的坐标与先前确定的H.264预测子块的投影的坐标重合。

附图6图解说明按照本发明一种实施例的预测块选择的实例。左手边的图表示在步骤311中确定的附图5的三个预测块501、503、505的预测块位置。右手边的图表示遵循MPEG-2的预测块候选601、603、605，它们全都具有与宏块相等的大小。例如，预测块候选603的位置是这样的：其左下角的四分之一与左手边的图中的预测块503的位置重合。同样，预测块候选605的右下角的四分之一的位置和预测块候选601的上半部分的位置分别与左手边图中的相应预测块605、601的位置重合。

因此，通过简单的处理和使用低复杂度的操作，从H.264视频信号的运动估计数据中确定出多个遵循MPEG-2标准的预测块候选。

按照该优选实施例，步骤313之后是步骤315。按照其它一些实施例，可以跳过步骤315，该方法直接进行到步骤317。按照某些实施例，步骤315可以处于例如步骤311、309或307之前。

在步骤305中，通过将预测块分组在一起来确定至少一个预测块。为该预测块候选组确定单个运动矢量。如前面提到的那样，在H.264中，可以根据多达16个散布在不同参考画面上的4×4块来预测单个宏块。因此，所介绍的方法可以得到多达16个用于MPEG-2运动估计的候选。优选地通过对所确定的预测块候选进行分组来减小这个值。例如，如果H.264宏块使用8×8预测块，再将这种预测块进一步划分成更小的子块，则可以通过对各个更小子块的运动矢量求平均来产生与该8×8预测块相应的单个运动矢量。在这种情况下，该平均运动矢量将涉及一个8×8预测块，它很可能是用于按照MPEG-2进行编码的适当预测块，并且用于运动估计的可能候选的数量将会被减少到最多四个预测块。

替换地或附加地，可以通过选择从H.264信号中确定的预测块的子集来减少MPEG预测块候选的数量。所述选择优选地响应于H.264信号的每个预测块的预测块大小。按照该优选实施例，该子集包括仅仅一个预测块，并且对所选择的块确定单个运动矢量。按照一些优选实施例，可以选择多个预测块，并且可以对该子集确定单个运动矢量，这例如是通过对与该子集的各个块相关的运动矢量求平均。该选择优选地是这样的：具有较大预测块大小的预测块优先于具有较小预测块大小的预测块。这能够使得宏块的尽可能大的比例由所选的预测块覆盖。这样，可以优先选择较大的预测块并且可以丢弃较小的预测块，以进一步减少预测块候选的数量。

步骤315(从而步骤307)之后是步骤317。在步骤317中，编码器213使用由运动估计数据处理器211产生的运动估计数据、按照MPEG-2视频标准对所述解码信号进行编码。这样，在步骤315中产生了来自外部视频源205的H.264视频信号的经过转码的MPEG-2视频信号。本领域技术人员对视频编码、尤其是MPEG-2视频编码器是很熟悉的，因此不详细对此进行介绍。

按照该优选实施例，所产生的预测块候选由编码器的运动估计功能使用，以便确定运动估计预测块。具体来说，对于一个给定宏块确定的预测块候选可以全部得到处理，并且该宏块与每个预测块之间的差异可以得到确定。然后可以选择导致最低残余误差的预测块作为该宏单元的预测块。按照某些实施例，编码器213此外还可以根据由运动估计数据处理器211确定的候选执行对适当预测块的搜索。因此，所确定的预测块和/或预测块大小和/或预测块位置可以被用作进行搜索的初始估计。

步骤317之后是步骤319，其中将经过转码的MPEG-2视频信号从转码器中输出。这样，实现了具有低计算要求、高数据速率和/或低延迟的低复杂度、易于实现的转码器。该转码器尤其适用于H.264与MPEG-2视频设备之间的接口。

按照某些实施例，所述转码此外还可以包括对视频信号的一个或多个特性进行修改。例如，该编码器可以产生具有与原始(或经转码的)信号不同的大小或画面频率的转码信号。

具体来说，编码器(213)可以调整来自解码器(207)的画面的大小。在这种情况下，可以对于原始解码的画面的经过缩放的画面再次使用所述原始解码的画面的运动估计数据。例如，在放大(放大成更大的大小)的情况下，为原始解码画面中的某个宏块产生的运动估计数据可用于多个与由该原始画面中的原始宏块占据的画面区域相应的宏块。这可以通过可被看作对宏块指数的缩放来实现。例如，如果在每个方向上(水平和垂直)将画面大小增加1倍，则为原始宏块mb(0，0)产生的运动估计数据可以用于四个宏块MB(0，0)、MB(0，1)、MB(1，0)和MB(1，1)，这些宏块占据了与由原始宏块占据的原始画面中的画面区域相应的经转码画面中的画面区域。

在缩小的情况下，可以对为多个原始宏块产生的运动数据求平均，来获得用于单个经转码的宏块的运动估计数据。

可以使用类似的对初始运动估计数据求平均和再利用的程序来改变画面频率(即，每秒的画面数量)。例如，如果增大了画面频率，则运动矢量可以用于多个画面(可能通过内插)，如果降低了画面频率，则可以对来自多个画面的运动矢量求平均。

显然也可以想到使用其它的算法来对运动估计数据进行再利用，在使用非整数缩放倍数的情况下，这些算法可能是优选的。

本发明可以以任何适当的形式实现，包括硬件、软件、固件或它们的任意组合。不过，优选地，将本发明实现为运行在一个或多个数据处理器和/或数字信号处理器上的计算机软件。本发明的实施例的各元件或组件可以以任何适当的方式在物理上、功能上和逻辑上实现。实际上，所述功能可以在单个单元中、在多个单元中或作为其它功能单元的一部分来实现。这样，本发明可以在单个单元中实现，或者可以在物理上和功能上分布于不同的单元和处理器之间。

虽然已经结合优选实施例对本发明进行了介绍，但是这并非想要将本发明限制于本文所给出的具体形式。相反地，本发明的范围仅仅由所附权利要求书限定。在权利要求书中，术语“包括”并不排除其它元件或步骤的存在。而且，虽然是单独列出的，但是多个装置、元件或方法步骤可以由例如单个单元或处理器来实现。此外，虽然各单独特征可以包括在不同的权利要求中，但是有可能将这些特征有益地组合，并且这些特征被包括在不同权利要求中这一事实并不意味着这些特征的组合是不可行的和/或没有益处的。除此之外，单数并不排除多个。因此“一个”、“第一”、“第二”等用语并不排除多个的情况。

Claims

1、一种视频转码器(201)，包括：

用于接收按照第一视频编码格式编码的第一视频信号的装置(203)；

用于按照该第一视频编码格式对该第一视频信号进行解码、以产生解码信号的装置(207)；

用于从该第一视频信号中提取第一运动估计数据的装置(209)，该第一运动估计数据遵循该第一视频编码格式；

用于从该第一运动估计数据产生第二运动估计数据的装置(211)，该第二运动估计数据遵循第二视频编码格式，该第二视频编码格式具有与该第一视频编码格式不同的一组运动估计选项；和

用于使用该第二运动估计数据并按照该第二视频编码格式对该解码信号进行编码、以产生经转码的视频信号的装置(213)。

2、按照权利要求1所述的视频转码器(201)，其中该第一视频编码格式是第一视频编码标准，并且其中该第二视频编码格式是第二视频编码标准。

3、按照权利要求1所述的视频转码器(201)，其中该第二视频编码格式包括与第一视频编码格式不同的一组可能的预测块大小。

4、按照权利要求1所述的视频转码器(201)，其中该第二视频编码格式包括与第一视频编码格式不同的一组可能的参考画面。

5、按照权利要求1所述的视频转码器(201)，其中该第二视频编码格式允许将与第一视频编码格式不同数量的预测块用于一个正在编码的块。

6、按照权利要求1所述的视频转码器(201)，其中该用于产生的装置(211)包括用于将第一参考画面的第一运动估计块位置投影到第二参考画面中的第二运动估计块位置的装置。

7、按照权利要求6所述的视频转码器(201)，其中该第一参考画面具有与第二参考画面不同的相对于一个用于编码的画面的位置。

8、按照权利要求6所述的视频转码器(201)，其中该第一参考画面不与该用于编码的画面相邻，并且第二参考画面与该用于编码的画面相邻。

9、按照权利要求6所述的视频转码器(201)，其中该用于投影的装置适于通过缩放该第一运动估计数据的至少一个运动矢量以产生该第二运动估计数据的至少一个运动矢量来执行所述投影。

10、按照权利要求6所述的视频转码器(201)，其中该用于产生的装置(211)此外还包括用于将该第二运动估计块位置与该第二视频编码格式的块位置框架对准的装置。

11、按照权利要求1所述的视频转码器(201)，其中该第一视频补偿数据包括至少一个小于该第二视频编码格式的最小预测块大小的第一预测块，并且该用于产生的装置(211)适于选择该第二运动估计数据的一个预测块，以使其包括该第一预测块。

12、按照权利要求1所述的视频转码器(201)，其中该用于产生的装置(211)适于通过将该第一运动估计数据的多个预测块一起分组到一个组中来选择该第二运动估计数据的一个预测块，以及适于为该组确定单个运动矢量。

13、按照权利要求1所述的视频转码器(201)，其中该用于产生的装置(211)适于通过响应于所述多个预测块的预测块大小来选择该第一运动估计数据的多个预测块的一个子集，从而选择该第二运动估计数据的一个预测块。

14、按照权利要求1所述的视频转码器(201)，其中该用于编码的装置(213)适于产生具有与该解码信号的画面大小不同的画面大小的经转码信号。

15、按照权利要求1所述的视频转码器(201)，其中该用于编码的装置(213)适于产生具有与该解码信号的画面频率不同的画面频率的经转码信号。

16、一种转码方法，包括：

接收(301)按照第一视频编码格式编码的第一视频信号；

按照该第一视频编码格式对该第一视频信号进行解码(303)，以产生解码信号；

从该第一视频信号中提取(305)第一运动估计数据，该第一运动估计数据遵循该第一视频编码格式；

从该第一运动估计数据产生(307)第二运动估计数据，该第二运动估计数据遵循第二视频编码格式，该第二视频编码格式具有与该第一视频编码格式不同的一组运动估计选项；和

使用该第二运动估计数据并按照该第二视频编码格式对该解码信号进行编码(317)，以产生经转码的视频信号。

17、一种能够执行如权利要求16所述的方法的计算机程序。

18、一种包括如权利要求17所述的计算机程序的记录载体。