CN100496129C

CN100496129C - 基于h.264多路视频转码复用的方法

Info

Publication number: CN100496129C
Application number: CN200710023476.7A
Authority: CN
Inventors: 方怀东; 柳翀; 鹿宝生; 严肃; 陈启美
Original assignee: Nanjing University
Current assignee: Nanjing University
Priority date: 2007-06-05
Filing date: 2007-06-05
Publication date: 2009-06-03
Anticipated expiration: 2027-06-05
Also published as: CN101068366A

Abstract

基于H.264多路视频转码复用的方法，输入是多路MPEG-2单节目流，输出是一路H.264多节目流，实现MPEG-2到H.264的视频转码、音视频的解复用与复用、多路H.264节目的复用，其视频转码包括码率、分辨率及格式转换；MPEG-2到H.264的视频转码算法采用MPEG-2到H.264码的快速转换方法，利用H.264的宏块模式选择与MPEG-2运动补偿残差间的相关性，利用MPEG-2解码得到的运动补偿残差、MB模式、直接映射成H.264的宏块模式；并且合成TS流，在多路MPEG-2节目流以ASI接口通过PCI总线输入转码复用服务器，转码复用后的单路H.264视频流通过PCI总线以ASI接口方式输出。

Description

基于H.264多路视频转码复用的方法

技术领域

本发明属于数字电视中的视频压缩编码与复用领域。尤其是涉及基于H.264多路视频转码复用的方法和复用器。

背景技术

近年来移动数字电视在国内迅速发展，但图像带宽束缚了数字视频业务的拓展。为了兼顾码流传输效率和视频图像质量，***通常的传输速率在6～10Mbps。而数字电视视频录像节目多采用MPEG-2视频压缩标准，图像尺寸较大。比如，标清的MPEG-2码率约为4Mbps，高清的MPEG-2码率约为10Mbps。移动数字电视用户的带宽一般难以满足多路高码率的视频流的实时传输，为了使用户能在较低带宽的情况下能顺利收看更多的移动数字电视节目，需要降低视频流的码率。再加上储存容量的限制和各种不同数字电视终端的出现，使数字电视用户对高效的视频编码技术需求越来越迫切。

在数字电视信源未采用低码率、高清晰度的压缩编码标准之前，上述问题目前的解决办法有两个，其一是将高码率的MPEG-2等数字视频进行高压缩，转为低码率的MPEG-2数字视频；其二是将高码率的MPEG-2等数字视频进行转码，转为H.264数字视频。第一种方法将会导致图象质量大幅度下降，显然不可取，第二种方法则会在几乎不降低图象质量的情况下，获得更高压缩效率和更低传输码率。

与MPEG-2相比，H.264在同等图像质量下，能够提高4倍以上的压缩效率。可见上述第二种方法比较可取。但H.264作为单纯的视频压缩标准，没有关于音视频合成及多路复用传输等方面的内容。目前也没有专用的设备实现MPEG-2到H.264的视频转码以及复用。考虑到电视台原有的MPEG-2前端设备数量多且非常昂贵，摒弃已有大量的MPEG-2前端设备，包括数码摄像机、非线性图像节目编辑器，这是不现实的。如何保障图像质量，同时大幅度降低图像的带宽，即构建转码复用专用设备已成当务之急。

现有技术中未涉及基于H.264多路视频转码复用的方法和复用器。如CN1745573图像拾取设备及其运动图片拍摄方法，在运动图片拍摄模式下工作的图像拾取装置，其中运动图片拍摄开始之前，通过在键输入部分(12)上的快门按钮来指示，将控制部分(10)的时钟频率设置为普通频率，从而减小监控状态下的电力消耗以延长电池寿命，而且其中，当指示运动图片拍摄开始时，由时钟转换控制部分(101)将该时钟频率大幅增加，从而使得在对运动图片数据进行解码处理期间，MPEG转换器(7)能够高速访问存储YUV数据，例如参考数据，搜索数据等的SDRAM(8)，并能够对运动图片进行实时压缩。

CN1567271具备高速网络接口的MPEG码流变换采集方法及装置，在设备内实现传输流的数据过滤、PID修改、服务信息***和码率变换，设备具有高速以太网接口用于将变换后的目标传输流传送到计算机中。实现码流的直接采集，也能够对码流进行处理。

CN1633180基于变换和数据融合的多描述视频编码方法，包括对要编码的信号实施变换1～n；分别对变换1～n后的信号进行量化和熵编码；分别按照各自的路径1～n对量化和熵编码后的信号1～n进行解码；分别对解码后的信号1～n进行逆变换；逆变换后分别得到边描述1～n，将1～n个逆变换后的数据融合成为中心描述等步骤。它能将基于变换和数据融合的多描述编码和视频编码结合起来，对一组视频序列，这种编码方法能产生多个MPEG码流，从每一个码流中都可以还原出一个失真较大的视频序列；当多个码流被收到时，一个失真较小的视频序列将被还原出来。

发明内容

本发明提出了在原有的MPEG-2移动数字电视的基础上，增加专用的H.264视频转码复用服务器，并采用变换域的视频转码算法，降低转码复杂度。用软件方式实现了多路MPEG-2到H.264的转码、H.264视频与音频的复用与解复用及多路H.264节目的复用与解复用。

本转码复用器的实现所采用的技术方案如下：基于H.264多路视频转码复用的方法和复用器，输入是多路MPEG-2单节目流，输出是一路H.264多节目流，实现MPEG-2到H.264的视频转码、音视频的解复用与复用、多路H.264节目的复用，其视频转码包括码率、分辨率及格式转换。MPEG-2到H.264的视频转码算法采用基于机器学习的转码算法，实现码率、分辨率可调，帧内、帧间采用不同的算法。MPEG-2到H.264码的快速转换方法如下述。在合成TS流时按一定规律重新改写PID值，以避免PID冲突引起的解码器不能正确解码。在合成TS流时对PMT表的流类型字段作相应的修改。多路MPEG-2节目流以ASI接口通过PCI总线输入转码复用服务器，转码复用后的单路H.264视频流通过PCI总线以ASI接口方式输出，并使用FIFO提供的半满信号来读取FIFO数据或写FIFO，以避免CPU频繁访问PCI接口。MPEG-2到H.264的转码以及多路转码后的H.264视频流与音频流复用在同一服务器中完成。

TS流由编码后的基本数据流(ES)根据一定的格式打包形成PES包，再加入一些***信息而构成，在发送端，基本流的PES打包由音/视频编码器完成，复用器接收编码端的音、视频数据流以及辅助数据流，按照一定的复用方法将其交织成为单一的TS流。为了实现音、视频同步，在码流中还必须加入各种时间的标志和***的控制信息。对于接收端，则正好和发送端过程相反。

MPEG-2到H.264的视频转码：从MPEG-2视频到H.264视频的转码，目前主要有两种架构：基于像素域的级联体系转码(CPDT)和基于DCT域的转码(DDT)。基于像素域的级联体系转码就是先完全解码，在像素域做处理，再重新编码。由于二次编码时编码部分和解码部分在结构上完全独立，因此转码具有很大的灵活性，但是对宏块数据的运动矢量和编码模式都重新作了计算，转码效率低，如全靠软件来实现，难以达到实时的要求。基于DCT域的转码(DDT)直接在DCT域对DCT系数、运动失量等重估计，计算复杂度低，但灵活性受到限制，当要求改变运动矢量、码率、分辨率等，就很难采用这种体系结构。

本发明MPEG-2到H.264码的快速转换方法，利用H.264的宏块模式选择与MPEG-2运动补偿残差间的相关性，将H.264宏块模式选择问题转化为数据分类问题，利用MPEG-2解码得到的运动补偿残差、MB模式、编码块模式(CBPC)直接映射成H.264的宏块模式；在MPEG-2码解码时，保存相关的MB信息，包括MB编码模式、编码块类型(CBPC)、MB残差的均值和方差(以4×4的sub-MB分别计算，共16个均值和方差)，其解码后采用标准的H.264编码器对YUV图像编码，并保存H.264MB编码模式，采用机器学习算法得到决策树，用于H.264编码模式的分类；在MPEG-2码流解码时，获取MPEG-2的MC残差、宏块模式、编码块模式(CBPC)，并计算出4×4子块MC残差的均值和方差；通过决策树获取H.264中宏块编码模式；在H.264编码时，对MB的编码模式直接赋值；H.264编码器的输入为MPEG-2解码后的YUV数据以及MB编码模式，并没有使用MPEG-2的运动矢量，在运动估计时，使用由决策树得到的MB编码模式。其转码算法框图如图1所示。

得到决策树的方法是：决策树分类应遵循一下原则：

1)将输入序列分成Intra、Skip、Inter16×16和Inter8×8的分类器；

2)将Inter16×16分成16×16、16×8、8×16的分类器；

3)将inter8×8分成8×8、8×4、4×8、4×4的分类器。

决策树生成应遵循一下原则：

1)如果MPEG-2MB的MC没有编码，即没有非零MV，4个8×8块没有编码系数，H.264MB将被编码成16×16，需通过决策树二级判别，选择最优模式；

2)如果MPEG-2MB为intra模式，则在H.264中，该MB编码成intra或inter8×8，若编码成intra，算法终止；若为inter8×8，需通过二级判决，选择最优模式；

3)如果MPEG-2MB为skip模式，在H.264中，该MB也为skip模式。

4)决策树通过WEKA数据挖掘工具生成。WEKA的数据挖掘程序的文件格式为ARFF(Attribute-Relation File Format)。一个ARFF文件采用ASCII代码书写，反映一组属性间的相互关系。一般包括两个不同的段：1)文件头，包括关系的名称、属性和类型；2)数据。

5)训练集由高码率的MPEG-2序列组成，不包括B帧。决策集由MPEG-2码流解码后，H.264重新编码得到。在H.264编码过程中，量化参数为25，使用RD优化得到宏块编码模式。

转码决策树包括三个等级，采用3个不同的WEKA树，如图2所示：

1)将输入序列分成Intra、Skip、Inter16×16和Inter8×8的分类器；

2)将Inter16×16分成16×16、16×8、8×16的分类器；

3)将inter8×8分成8×8、8×4、4×8、4×4的分类器。

第一个WEKA决策树，训练数据集使用了MPEG-2一个宏块内16个4×4子块残差的均值和方差、宏块模式(skip、intra和3种non-intra，分别以0、1、2、4、8标识)、编码块模式(CBPC)和H.264MB的编码模式。

ARFF数据段的实例行样本用于训练决策树模型，一行代表一个宏块样本。

第二个决策树，训练样本集使用了MPEG-2一个宏块内16个4×4子块残差的均值和方差、宏块模式(3种non-intra)、编码块模式(CBPC)和H.264MB的16×16的子编码模式(16×16，16×8，8×16)。该决策树决定了inter 16×16的最终编码模式。

第三个决策树，训练样本集使用了MPEG-2一个宏块内4个4×4子块残差的均值和方差、宏块模式(3种non-intra)、编码块模式(CBPC)和H.264MB的8×8的子编码模式(8×8，8×4，4×8，4×4)。

基于这些训练文件，通过WEKA数据挖掘工具使用J48算法生成决策树。J48算法由Ross Quinlan提出，在数据挖掘领域有着广泛的应用。

TS流复用

对于转码后多路节目的H.264视频，和原来节目的音频按照MPEG-2***层来实现音、视频数据的复用和同步，并把多路节目合成一路TS流(传输流)进行传输。TS流由编码后的基本数据流(ES)根据一定的格式打包形成PES包，再加入一些***信息而构成，在发送端，基本流的PES打包由音/视频编码器完成，复用器接收编码端的音、视频数据流以及辅助数据流，按照一定的复用方法将其交织成为单一的TS流。为了实现音、视频同步，在码流中还必须加入各种时间的标志和***的控制信息。对于接收端，则正好和发送端过程相反。

传输流可由多个节目构成，而每一个节目可由多个流复合在一起，包括视频流、音频流、节目特殊信息流(PSI)等。其中PSI有四种类型：节目关联表(PAT)、节目映射表(PMT)、网络信息表(NIT)和条件访问表(CAT)。复用器将转码后的H.264视频和原音频按传输流的格式打包。TS包的长度为188字节，分成包头和包负荷两部分。包头4字节前缀是链接字头，包括同步字节0×47和数据包标识PID，从PID可以判断其后面负载的数据类型，是视频流、音频流、PSI还是其它数据包。包负荷是包的实际内容，根据具体情况，可以放置PES包或PSI包。

PSI用来描述传送流的组成结构，在***中担任极其重要的角色，在多路复用中尤为重要的是PAT表和PMT表。PAT表中给出了一路TS流中有多少套节目，以及它与PMT表PID之间的对应关系；PMT表给出了一套节目的具体组成及与视频、音频等PID的对应关系。

在转码复用器中，采用软件方式将多路单一节目的MPEG-2传送流(SPTS)转码后复用成多节目一路H.264传送流(MPTS)，它的***组成框图如图3所示。

多路单节目MPEG-2的TS流以ASI接口方式接入，通过PCI总线将节目数据传给转码复用服务器。服务器主要功能是接收4路MPEG-2单路节目传输流，将其视频转成H.264视频，然后复用成一个多路节目的传输流，并且除去空包，重新改写PID值和流类型字段；抽取和处理任何一个接收到的PSI和业务信息(SI)，将其和本地产生的这类数据集成起来；另外，还需要用***时钟STC来进行节目时钟参考PCR的再标识处理。为完成以上功能，并且尽可能提高***工作速度，在具体实现考虑了以下几点：

1)为了避免主机CPU频繁访问PCI接口，利用FIFO提供的半满信号，CPU读取FIFO数据或写FIFO。对于输入FIFO，半满时产生中断，CPU响应中断，将FIFO中的数据一次性读入内存缓冲；对于输出FIFO，情况类似，一次性将FIFO写至半满。

2)节目同步字的识别。要获取一个节目的数据，必须先找到TS流数据包的同步字，由于同步头并非满足唯一透明原则，即负荷中有可能恰为其值，因此需搜索检测。

3)PID冲突的解决。PID是TS流中负载类型的唯一标识。不同支路MPEG-2码流的PID值可能相同，如果不加修改往往会导致不能正确译码，解决的办法是在合成TS流时按一定的规律重新改写PID值。例如，若节目1的PID为100，以后每检测一道节目，新的PID加1，依次类推。

4)流类型的修改。由于输入的MPEG-2TS流的视频格式为MPEG-2，而重新合成的TS流的视频格式为H.264，因此需要对PMT表的流类型字段作相应的修改，修改前MPEG-2的流类型字段为0x02，修改后的流类型字段为0x1b。

TS流解复用

TS流的解复用与复用的流程刚好相反，其流程如图4所示。接收端通过检测PID为0包来建立PAT表，由PAT表得到该路TS流所包含各套节目的PMT表的PID，从而建立PMT表。最后由PMT表得到每套节目所对应的音视频包的PID。接收端通过这些PID将对应的音频、视频数据放入缓冲区，以便音视频解码器的解码。

附图说明

图1是MPEG-2到H.264的视频转码算法框图。

图2MPEG-2到H.264视频转码器决策树框图。

图3是多路单节目传送流的转码复用框图。

图4是TS流解复用流程图。

图5是视频转码在移动数字电视中的应用框图。

图6是TS流各表PID的对应关系图。

具体实施方式

在基于MPEG-2的移动数字电视***中，视频内容主要来自于MPEG-2节目库、***，以及视频直播节目，通过复用器将多个MPEG-2节目流复用后，进行信道编码调制，然后进行数字电视无线发射。

引入基于H.264的视频转码复用器后，***构架如图5所示。它实际上是将MPEG-2节目库与MPEG-2节目流前移，一方面，通过静态转码建立H.264视频节目库，供播放***选用；另一方面，对***和视频直播的MPEG-2节目流进行动态实时转码，降低视频流的码率，改变视频流的空间分辨率、帧率，适应后端的传输需求。转码后通过软件复用将多套H.264节目合成一路TS流进行传输。

多路单节目MPEG-2的TS流以ASI接口方式接入视频转码复用器，通过PCI总线将节目数据传给转码复用服务器。服务器接收多路MPEG-2单路节目传输流，将其视频转成H.264视频，然后复用成一个多路节目的传输流，并通过ASI接口输出。

在输入的MPEG-2单路节目流中，检测到的第一套节目的PID为100，以后每检测到一套节目，在合成TS流时，新的PID加1。由于输入的MPEG-2TS流的视频格式为MPEG-2，而重新合成的TS流的视频格式为H.264，需要对PMT表的流类型字段作相应的修改，修改前MPEG-2的流类型字段为0x02，修改后的流类型字段为0x1b。

MPEG-2到H.264码的快速转换方法中采用的基于决策树的分类：

使用开源的数据挖掘工具WEKA分析MPEG-2宏块残差的均值与方差、编码模式、编码块类型(CBPC)，获取H.264宏块编码模式。该转码器的决策树包括3个WEKA决策树，在图2中以灰色标识。第一个WEKA决策树用于判别skip、Intra、8×8、16×16模式，如果是8×8模式或16×16模式，则使用第二个或第三个决策树判决该MB的最终模式。通过WEKA工具计算出决策树中均值和方差的判决电平。决策树的工作如下：

节点1：输入该节点的是MPEG-2编码MB。通过检测MPEG-2MB的残差大小，将MB的编码方式分成4类：skip、Intra、8×8或16×16。Intra决策过程不在专利中讨论，其他情况需根据前面的分类情况进行第二次决策分类。在生成决策树时，将使用以下规则：

1)如果MPEG-2MB的MC没有编码，即没有非零MV，4个8×8块没有编码系数。H.264MB将被编码成16×16。需通过决策树二级判别，选择最优模式。

2)如果MPEG-2MB为intra模式，则在H.264中，该MB编码成intra或inter8×8。若编码成intra，算法终止；若为inter8×8，需通过二级判决，选择最优模式。

3)如果MPEG-2MB为skip模式，在H.264中，该MB也为skip模式。

节点2：输入该节点是由节点1分出的16×16MB，该节点用第二个WEKA决策树，对H.264MB的模式(16×16，16×8或8×16)分类。检测16×8或8×16子块是否生成更好的预测，若判别为16×8或8×16，则为最终的编码模式，否则，将由节点4继续判别。

节点3：输入该节点的由节点1分出的8×8MB。该节点用第三个WEKA决策树，对H.2648×8子宏块选择最优模式：8×8，8×4，4×8，4×4。该决策树执行4次，分别对一个宏块内的4个8×8子块进行判别一次，该部分只使用8×8子块内的4个4×4块的均值和方差。

节点4：输入该节点的是由节点1分出的skip模式块或由节点2分出的16×16模式块。该节点估计H.26416×16模式(不包括16×8和8×16模式)，选择最优模式是skip或inter16×16。

MB模式的判决和门限值的选择由H.264的量化参数(QP)决定，随着QP的不同，均值和方差的门限值也不同。解决这种情况可以有两种方法：1)对每个QP生成一个决策树，在H.264编码时，根据所用的QP值，选择相应的决策树；2)只生成一个决策树，根据QP值调整均值和方差的门限。对于第一种方法，在一个转码器中需生成52个不同的决策树，而每一个又需3个WEKA决策树，因此共需156个WEKA决策树。在H.264中，QP值与量化步长有一定的关系，QP每增加6，量化步长增加一倍，因此可以通过这种关系调整均值和方差的门限值。在该转码器中，采用了第二种方法。生成了QP为25的决策树，其他QP值可以通过调整门限电平来实现。当QP增加6时，门限值提高2.5％，反之降低2.5％。

在接收端的TS流解复用，通过检测PID为0的包建立PAT表，由PAT表得到该路TS流所包含各套节目的PMT表的PID，从而建立PMT表。最后由PMT表得到每套节目所对应的音视频包的PID，如图6所示。接收端通过这些PID将对应的音频、视频数据放入缓冲区，由音视频解码器解码。

合成TS流时按一定规律重新改写PID值，例如，若节目1的PID为100，以后每检测一道节目，新的PID加1，依次类推；在合成TS流时对PMT表的流类型字段作相应的修改，修改前MPEG-2的流类型字段为0x02，修改后的流类型字段为0x1b。

基本数据流(ES)根据一定的格式打包形成PES包，再加入一些***信息(如业务信息(SI)、***时钟信息等)而构成。

PSI用来描述传送流的组成结构，在多路复用中PAT表中给出了一路TS流中有多少套节目，以及它与PMT表PID之间的对应关系；PMT表给出了一套节目的具体组成及与视频、音频等PID的对应关系；并采用流类型的修改：由于输入的MPEG-2TS流的视频格式为MPEG-2，而重新合成的TS流的视频格式为H.264，对PMT表的流类型字段作相应的修改，修改前MPEG-2的流类型字段为0x02，修改后的流类型字段为0x1b。

多路单节目MPEG-2的TS流以ASI接口方式接入，通过PCI总线将节目数据传给转码复用服务器；服务器接收4路MPEG-2单路节目传输流，将其视频转成H.264视频，然后复用成一个多路节目的传输流，并且除去空包，重新改写PID值和流类型字段；抽取和处理任何一个接收到的PSI和业务信息(SI)，将其和本地产生的这类数据集成起来。另外，还需要用***时钟STC来进行节目时钟参考PCR的再标识处理。TS流解复用时，接收端通过检测PID为0包来建立PAT表，由PAT表得到该路TS流所包含各套节目的PMT表的PID，从而建立PMT表；最后由PMT表得到每套节目所对应的音视频包的PID。接收端通过这些PID将对应的音频、视频数据放入缓冲区，由音视频解码器解码。

本发明实施流程还包括：基于H.264多路视频转码复用的方法，输入是多路MPEG-2单节目流，输出是一路H.264多节目流，实现MPEG-2到H.264的视频转码、音视频的解复用与复用、多路H.264节目的复用，其视频转码包括码率、分辨率及格式转换；MPEG-2到H.264的视频转码算法采用MPEG-2到H.264码的快速转换方法，利用H.264的宏块模式选择与MPEG-2运动补偿残差间的相关性，将H.264宏块模式选择问题转化为数据分类问题，利用MPEG-2解码得到的运动补偿残差、MB模式、编码块模式(CBPC)直接映射成H.264的宏块模式；在MPEG-2码流解码时，保存相关的MB信息，包括MB编码模式、编码块类型、MB残差的均值和方差，其解码后采用标准的H.264编码器对YUV图像编码，并保存H.264MB编码模式，采用机器学习算法得到决策树，用于H.264编码模式的分类；在MPEG-2码流解码时，获取MPEG-2的MC残差、宏块模式、编码块模式(CBPC)，并计算出4×4子块MC残差的均值和方差；通过决策树获取H.264中宏块编码模式；在H.264编码时，对MB的编码模式直接赋值；H.264编码器的输入为MPEG-2解码后的YUV数据以及MB编码模式：在运动估计时，使用由决策树得到的MB编码模式；实现码率、分辨率可调，帧内、帧间采用不同的算法；并且合成TS流，在多路MPEG-2节目流以ASI接口通过PCI总线输入转码复用服务器，转码复用后的单路H.264视频流通过PCI总线以ASI接口方式输出；TS流由编码后的基本数据流(ES)根据一定的格式打包形成PES包，再加入***信息而构成，在发送端，基本流的PES打包由音/视频编码器完成，复用器接收编码端的音、视频数据流以及辅助数据流，按照一定的复用方法将其交织成为单一的TS流；在码流中加入各种时间的标志和***的控制信息；对于接收端，则正好和发送端过程相反。合成TS流时重新改写PID值。

在MPEG-2码流解码时利用FIFO提供的半满信号，CPU读取FIFO数据或写FIFO；对于输入FIFO，半满时产生中断，CPU响应中断，将FIFO中的数据一次性读入内存缓冲；对于输出FIFO，一次性将FIFO写至半满。

传输流可由多个节目构成，而每一个节目可由多个流复合在一起，包括视频流、音频流、节目特殊信息流PSI；其中节目特殊信息流PSI有四种类型：节目关联表PAT、节目映射表PMT、网络信息表(NIT)和条件访问表(CAT)；复用器将转码后的H.264视频和原音频按传输流的格式打包。TS包的长度为188字节，分成包头和包负荷两部分；包头4字节前缀是链接字头，包括同步字节0×47和数据包标识PID，从PID判断其后面负载的数据类型，是视频流、音频流、PSI还是其它数据包；包负荷是包的实际内容，放置PES包或PSI包。

多路单节目MPEG-2的TS流以ASI接口方式接入，通过PCI总线将节目数据传给转码复用服务器；服务器接收4路MPEG-2单路节目传输流，将其视频转成H.264视频，然后复用成一个多路节目的传输流，并且除去空包，重新改写PID值和流类型字段；抽取和处理任何一个接收到的PSI和业务信息(SI)，将其和本地产生的这类数据集成起来。

还需要用***时钟STC来进行节目时钟参考PCR的再标识处理。

TS流解复用时，接收端通过检测PID为0包来建立PAT表，由PAT表得到该路TS流所包含各套节目的PMT表的PID，从而建立PMT表；最后由PMT表得到每套节目所对应的音视频包的PID；接收端通过这些PID将对应的音频、视频数据放入缓冲区，由音视频解码器解码。

Claims

1、基于H.264多路视频转码复用的方法，其特征是输入是多路MPEG-2单节目流，输出是一路H.264多节目流，实现MPEG-2到H.264的视频转码、音视频的解复用与复用、多路H.264节目的复用，其视频转码包括码率、分辨率及格式转换；MPEG-2到H.264的视频转码算法采用MPEG-2到H.264码的快速转换方法，利用H.264的宏块模式选择与MPEG-2运动补偿残差间的相关性，将H.264宏块模式选择问题转化为数据分类问题，利用MPEG-2解码得到的运动补偿残差、MB模式、编码块模式(CBPC)直接映射成H.264的宏块模式；在MPEG-2码流解码时，保存相关的MB信息，包括MB编码模式、编码块类型、MB残差的均值和方差，其解码后采用标准的H.264编码器对YUV图像编码，并保存H.264MB编码模式，采用机器学习算法得到决策树，用于H.264编码模式的分类；在MPEG-2码流解码时，获取MPEG-2的MC残差、宏块模式、编码块模式(CBPC)，并计算出4×4子块MC残差的均值和方差；通过决策树获取H.264中宏块编码模式；在H.264编码时，对MB的编码模式直接赋值；H.264编码器的输入为MPEG-2解码后的YUV数据以及MB编码模式：在运动估计时，使用由决策树得到的MB编码模式；实现码率、分辨率可调，帧内、帧间采用不同的算法；并且合成TS流，在多路MPEG-2节目流以ASI接口通过PCI总线输入转码复用服务器，转码复用后的单路H.264视频流通过PCI总线以ASI接口方式输出；TS流由编码后的基本数据流(ES)根据一定的格式打包形成PES包，再加入***信息而构成，在发送端，基本流的PES打包由音/视频编码器完成，复用器接收编码端的音、视频数据流以及辅助数据流，按照一定的复用方法将其交织成为单一的TS流；在码流中加入各种时间的标志和***的控制信息；对于接收端，则正好和发送端过程相反。

2、根据权利要求1所述的基于H.264多路视频转码复用的方法，其特征是为在MPEG-2码流解码时利用FIFO提供的半满信号，CPU读取FIFO数据或写FIFO；对于输入FIFO，半满时产生中断，CPU响应中断，将FIFO中的数据一次性读入内存缓冲；对于输出FIFO，一次性将FIFO写至半满。

3、根据权利要求1所述的基于H.264多路视频转码复用的方法，其特征是合成TS流时重新改写PID值。

4、根据权利要求1所述的基于H.264多路视频转码复用的方法，其特征是传输流可由多个节目构成，而每一个节目可由多个流复合在一起，包括视频流、音频流、节目特殊信息流PSI；其中节目特殊信息流PSI有四种类型：节目关联表PAT、节目映射表PMT、网络信息表(NIT)和条件访问表(CAT)；复用器将转码后的H.264视频和原音频按传输流的格式打包。

5、根据权利要求4所述的基于H.264多路视频转码复用的方法，其特征是TS包的长度为188字节，分成包头和包负荷两部分；包头4字节前缀是链接字头，包括同步字节0×47和数据包标识PID，从PID判断其后面负载的数据类型，是视频流、音频流、PSI还是其它数据包；包负荷是包的实际内容，放置PES包或PSI包。

6、根据权利要求1所述的基于H.264多路视频转码复用的方法，其特征是PSI用来描述传送流的组成结构，在多路复用中PAT表中给出了一路TS流中有多少套节目，以及它与PMT表PID之间的对应关系；PMT表给出了一套节目的具体组成及与视频、音频等PID的对应关系；并采用流类型的修改：由于输入的MPEG-2TS流的视频格式为MPEG-2，而重新合成的TS流的视频格式为H.264，对PMT表的流类型字段作相应的修改，修改前MPEG-2的流类型字段为0x02，修改后的流类型字段为0x1b。

7、根据权利要求1所述的基于H.264多路视频转码复用的方法，其特征是多路单节目MPEG-2的TS流以ASI接口方式接入，通过PCI总线将节目数据传给转码复用服务器；服务器接收4路MPEG-2单路节目传输流，将其视频转成H.264视频，然后复用成一个多路节目的传输流，并且除去空包，重新改写PID值和流类型字段；抽取和处理任何一个接收到的PSI和业务信息(SI)，将其和本地产生的这类数据集成起来。

8、根据权利要求7所述的基于H.264多路视频转码复用的方法，其特征是还需要用***时钟STC来进行节目时钟参考PCR的再标识处理。

9、根据权利要求1所述的基于H.264多路视频转码复用的方法，其特征是TS流解复用时，接收端通过检测PID为0包来建立PAT表，由PAT表得到该路TS流所包含各套节目的PMT表的PID，从而建立PMT表；最后由PMT表得到每套节目所对应的音视频包的PID；接收端通过这些PID将对应的音频、视频数据放入缓冲区，由音视频解码器解码。