CN111314706B - 一种视频转码方法及装置 - Google Patents

一种视频转码方法及装置 Download PDF

Info

Publication number
CN111314706B
CN111314706B CN201811510054.7A CN201811510054A CN111314706B CN 111314706 B CN111314706 B CN 111314706B CN 201811510054 A CN201811510054 A CN 201811510054A CN 111314706 B CN111314706 B CN 111314706B
Authority
CN
China
Prior art keywords
transcoding
path
video
path information
source video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811510054.7A
Other languages
English (en)
Other versions
CN111314706A (zh
Inventor
李庆文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Youku Culture Technology Beijing Co ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811510054.7A priority Critical patent/CN111314706B/zh
Priority to PCT/CN2019/124232 priority patent/WO2020119670A1/zh
Publication of CN111314706A publication Critical patent/CN111314706A/zh
Application granted granted Critical
Publication of CN111314706B publication Critical patent/CN111314706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440218Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本申请实施方式公开了一种视频转码方法及装置,其中,所述方法包括:获取源视频;确定从所述源视频转码为目标视频的路径信息;其中,所述路径信息中包括转码路径和所述转码路径中节点之间的转码方式;基于确定的所述路径信息,对所述源视频进行转码。本申请提供的技术方案,能够提高视频转码的效率。

Description

一种视频转码方法及装置
技术领域
本申请涉及互联网技术领域,特别涉及一种视频转码方法及装置。
背景技术
随着互联网技术的不断发展,涌现出越来越多的视频播放平台。为了向用户提供不同画质的视频,视频播放平台通常需要对源视频进行转码,从而生成具备不同分辨率和不同码率的多份视频。
当前,针对一些多层级依赖的转码场景,例如,生产高帧率视频的场景,通常需要通过多台转码机器分别执行不同的转码任务。例如,在对源视频进行转码之前,需要先对源视频进行高帧率转换,生成一个中间结果,然后对这个中间结果进行转码,从而生成具备不同分辨率和不同码率的多份视频。在这种依赖中间结果的转码场景中,生成中间结果的转码任务完成后,通常需要将这个中间结果上传至外部存储平台,后续在基于这个中间结果进行多次转码任务时,需要从外部存储平台中多次读取该中间结果,这些上传过程和从外部存储平台中读取的过程都比较耗时,导致视频转码的效率较低。
因此,亟需提供一种更快速的视频转码方法。
发明内容
本申请实施方式的目的是提供一种视频转码方法及装置,能够提高视频转码的效率。
为实现上述目的,本申请实施方式提供一种视频转码方法,所述方法包括:获取源视频;确定从所述源视频转码为目标视频的路径信息;其中,所述路径信息中包括转码路径和所述转码路径中节点之间的转码方式;基于获取的所述路径信息,对所述源视频进行转码。
为实现上述目的,本申请实施方式还提供一种视频转码装置,所述装置包括:视频获取单元,用于获取源视频;路径确定单元,用于确定从所述源视频转码为目标视频的路径信息;其中,所述路径信息中包括转码路径和所述转码路径中节点之间的转码方式;转码单元,用于基于获取的所述路径信息,对所述源视频进行转码。
为实现上述目的,本申请实施方式还提供一种视频转码装置,所述装置包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现上述的视频转码方法。
由上可见,本申请提供的技术方案,在获取源视频之后,针对待输出的目标视频,可以确定从所述源视频转码为目标视频的路径信息。其中,所述路径信息中包括转码路径和所述转码路径中节点之间的转码方式。这样,便可以按照所述转码路径,通过所述转码路径中节点之间的转码方式,依次对所述源视频和所述转码路径中的其他中间节点进行转码,输出所述目标视频。如此,整个转码过程可以在一台转码机器完成,减少了上传过程和从外部存储平台中读取的过程,从而减少了视频转码的时间,提高视频转码的效率。
附图说明
为了更清楚地说明本申请实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施方式中视频转码方法示意图;
图2为本申请实施方式中有向无环转码架构的示意图;
图3为本申请实施方式中一种视频转码装置的结构示意图;
图4为本申请实施方式中另一种视频转码装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都应当属于本申请保护的范围。
本申请提供一种视频转码方法,所述方法可以应用于具备图像处理功能的终端设备中。所述终端设备例如可以是台式电脑、笔记本电脑、平板电脑、工作站等。此外,所述方法还可以应用于视频播放网站的业务服务器中,所述业务服务器可以是独立的服务器,也可以是由多个服务器构成的服务器集群。
请参阅图1,本申请提供的视频转码方法包括以下步骤。
S11:获取源视频。
在本实施方式中,通过对源视频进行转码,可以生成具备不同分辨率和不同码率的多份视频。
在本实施方式中,获取所述源视频的方式可以包括根据提供的存储路径,从所述存储路径下读取所述源视频或者接收其它终端设备发来的所述源视频。
S13:确定从所述源视频转码为目标视频的路径信息;其中,所述路径信息中包括转码路径和所述转码路径中节点之间的转码方式。
在本实施方式中,在实际应用场景中,针对待输出的目标视频,从所述源视频转码至所述目标视频,可能需要经过多个节点之间的转码过程。例如,针对一些多层级依赖的转码场景,比如,生产高帧率视频的场景,需要先通过帧率转换技术(Frame RateConversion,FRC)将源视频转换为高帧率的源视频,即生成一个中间结果,然后对这个中间结果进行转码,生成具备指定分辨率的视频,最后对该视频进行转码,生成具备指定视频格式和指定分辨率的目标视频。如此,为了输出具备所述指定视频格式和指定分辨率的目标视频,需要经过两个中间节点,整个转码过程可以分为四个层级,分别为以源视频为根节点的第一层级、以高帧率的源视频为子节点的第二层级、以具备指定分辨率的视频为三级节点的第三层级,和以具备指定分辨率和指定视频格式的目标视频为叶子节点的第四层级。其中,第二层级的节点的输出依赖于第一层级的节点,第三层级的节点的输出依赖于第二层级的节点,第四层级的节点的输出依赖于第三层级的节点。为了在所述终端设备中实现这种多层级依赖的复杂转码过程,可以先确定从所述源视频转码为目标视频的路径信息。其中,所述路径信息中可以包括转码路径和所述转码路径中各个节点之间的转码方式。这样,后续便可以基于确定的所述路径信息,在一台终端设备中实现对所述源视频的转码过程,以得到所述目标视频。
在一个实施方式中,从所述源视频转码为目标视频的转码过程可能是实际应用中已经存在的多层级依赖的转码过程,那么,便可以从已有的分离的多个转码任务中,获取转码任务之间的依赖关系,并可以将这些转码任务中的输入和输出作为一条转码路径中的各个节点。这样,便可以得到从所述源视频转码为目标视频的转码路径,以及转码路径中的各个节点。各个节点之间的转码方式也可以直接通过各个分离的转码任务中获取。如此,便可以确定从所述源视频转码为目标视频的路径信息。在本实施方式中,所述转码方式与一个视频转码至另一个视频所需的视频转码参数相对应,该视频转码参数的参数值可以根据这两个视频的视频参数和音频参数的参数值确定。所述转码参数例如可以包括保真度、分辨率、传输码率等。在设置了这些转码参数后,便可以对视频进行转码,从而得到符合这些转码参数的转码后的视频。
在一个实施方式中,考虑到从所述源视频转码为目标视频的转码过程可能无法从已存在的多层级依赖的转码过程中找到,为此,在实际应用过程中,可以采用深度学习的方法,构建用于识别转码路径信息的路径识别模型。例如,可以通过支持向量机(supportvector machine,SVM)对由所述源视频和所述目标视频构成的视频组对应的路径信息进行识别。其中,可以将所述源视频和所述目标视频分别作为所述路径识别模型中的路径起始节点和路径结束节点。具体地,在构建所述路径识别模型时,可以预先获取训练样本集,所述训练样本集可以用于对所述路径识别模型进行训练,以使得所述路径识别模型能够识别出输入的视频组对应的路径信息。所述训练样本集中可以包括对应的转码路径符合所述路径信息的样本视频组以及对应的转码路径不符合所述路径信息的样本视频组。所述样本视频组中可以包括所述路径起始节点和所述路径结束节点分别对应的样本视频。这样,在训练过程中,可以依次将所述训练样本集中的样本视频组输入路径识别模型。该路径识别模型中可以构建初始的神经网络,神经网络中可以预先设置初始预测参数。通过所述初始预测参数对输入的所述样本视频组进行处理后,可以得到所述样本视频组的预测结果,所述预测结果可以用于表征所述样本视频组对应的转码路径是否符合所述路径信息。具体地,所述路径识别模型在对样本视频组进行处理时,首先可以分别提取所述源视频的参数信息对应的第一特征向量和所述目标视频的参数信息对应的第二特征向量。所述第一特征向量中的元素可以是所述源视频的各个参数的参数值,例如,视频参数或音频参数的参数值,视频参数可以包括视频分辨率、视频码率、视频帧率和视频格式等等。类似地,所述第一特征向量中的元素可以是所述目标视频的各个参数的参数值。这样,所述路径识别模型可以读取所述样本视频组中路径起始节点对应的源视频中每个参数的参数值,以及路径结束节点对应的目标视频中每个参数的参数值,并按照读取的顺序,将参数值构成所述第一特征向量和所述第二特征向量。在实际应用中,由于参数的个数通常较多,会导致提取的特征向量的维数也较大,这样,会耗费较多的资源来对特征向量进行处理。鉴于此,在本实施方式中还可以采用卷积神经网络(Convolutional Neural Network,CNN)对样本视频组进行处理,从而得到维数较小的特征向量,以便后续的识别处理。
在本实施方式中,经过所述神经网络对输入的样本视频组的数据进行处理之后,可以得到该样本视频组的概率值向量。在所述概率值向量中可以包括针对指定路径信息的概率值。所述概率值向量中可以包括两个概率值,这两个概率值分别表示转码路径符合指定路径信息的概率以及不符合指定路径信息的概率。例如,在输入一组对应的转码路径符合指定路径信息的样本视频组之后,经过所述路径识别模型可以得到(0.4,0.8)这样的概率值向量,其中,0.4表示转码路径符合指定路径信息的概率,0.8表示转码路径不符合指定路径信息的概率。由于路径识别模型中的初始预测参数可能设置得不够准确,因此经过路径识别模型预测得到的概率结果可能与实际情况不符。例如,上述输入的是转码路径符合指定路径信息的样本视频组,但是得到的概率向量中,表示转码路径符合指定路径信息的概率仅为0.4,而表示转码路径不符合指定路径信息的概率为0.8。在这种情况下,表明预测结果不正确。此时,可以根据所述预测结果与正确结果之间的差异值,对所述路径识别模型中的初始预测参数进行调整。具体地,所述样本视频组可以具备理论的概率值结果。例如,转码路径符合指定路径信息的理论的概率值结果可以为(1,0),其中1表示转码路径符合指定路径信息的概率值。此时,可以将预测得到的概率值结果与理论的概率值结果进行相减,从而得到两者的差值,然后可以利用得到的差值对神经网络的初始预测参数进行调整,最终使得通过调整后的预测参数再次对所述样本视频组进行处理后,得到的预测结果与正确结果相符。这样,通过对大量的训练样本进行训练之后,该路径识别模型便可以区分样本视频组对应的转码路径是否符合指定转码路径,从而可以识别出符合样本视频组对应的实际转码路径的路径信息。
S15:基于获取的所述路径信息,对所述源视频进行转码。
在本实施方式中,在确定从所述源视频转码为待输出的目标视频的路径信息之后,便可以基于确定的所述路径信息,在一台终端设备中实现对所述源视频的转码过程,以得到所述目标视频。具体地,可以按照所述路径信息中包括的转码路径,通过所述转码路径中节点之间的转码方式,对所述源视频进行转码,从而可以得到所述目标视频。例如,所述转码路径中包括四个节点,按照转码顺序分别为根节点、子节点、三级节点和四级节点。其中,根节点为所述源视频,所述四级节点为所述目标视频。那么,便可以先通过根节点与子节点之间的转码方式,对根节点进行转码,得到子节点对应的视频。接着通过子节点与三级节点之间的转码方式,对子节点对应的视频进行转码,得到三级节点对应的视频。最后通过三级节点与四级节点之间的转码方式,对三级节点对应的视频进行转码,得到所述目标视频。如此,整个多层级依赖的转码过程在一台终端设备中完成,减少了中间节点对应的视频的上传过程和从外部存储平台中读取的这些视频过程,从而可以减少视频转码的时间,提高视频转码的效率。
在本实施方式中,在一些复杂的转码场景中,待输出的视频中往往包括至少两种目标视频,这样,便会出现针对这些目标视频的多条转码路径。当这些转码路径中存在重叠路径时,为了避免重复进行这些重叠路径中的转码过程,可以先判断针对各个目标视频的转码路径中是否存在重叠路径,若存在,可以先按照所述重叠路径对所述源视频进行转码,得到中间节点,再分别按照各个转码路径中的非重叠路径对所述中间节点进行转码。具体地,针对两种目标视频,第一目标视频和第二目标视频,在确定从源视频转码为第一目标视频的第一路径信息,以及从源视频转码为第二目标视频的第二路径信息之后,若第一目标视频对应的第一路径信息与第二目标视频对应的第二路径信息之间存在重叠路径,可以先按照所述重叠路径对所述源视频进行转码,得到中间节点后,再分别按照所述第一路径信息和所述第二路径信息中的非重叠路径对所述中间节点进行转码。为了实现上述过程,可以根据针对这些目标视频的路径信息中的各个节点之间的上下依赖关系,构建包括这些节点的有向无环图(Directed Acyclic Graph,DAG)的转码结构。
例如,针对通过源视频转码为具备杜比音效的目标视频的应用场景中,需要输出多种具备不同杜比音效的目标视频。而这些目标视频对应的路径信息中的转码路径中包括部分重叠路径。那么,可以根据这些路径信息中各个节点之间的上下依赖关系,构建对应的DAG转码结构,以合并这些重叠路径,后续可以直接按照这个DAG转码结构,在一台终端设备中完成需要输出多种目标视频的复杂转码过程。如图2所示,针对最终输出的目标视频的节点中,具备杜比音效11的节点Node11、具备杜比音效12的节点Node12和具备杜比音效13的节点Node13分别对应的路径中,都包括从根节点root到具备杜比音效1的节点Node1的路径。那么,便可以将重叠的这部分路径合并,这样,所述终端设备可以先按照这部分重叠路径对所述源视频进行转码,得到中间节点Node1,再分别按照非重叠的路径对中间节点Node1进行转码,得到节点Node11、Node12和Node13。类似地,针对其他最终输出的目标视频的节点,具备杜比音效21的节点Node21、具备杜比音效22的节点Node22,也可以按照上述方式进行重叠路径合并,从而可以构建出DAG转码结构的转码路径。在图2中,根节点root为第一层级,节点Node1和节点Node2构成第二层级,节点Node11、Node12、Node13、Node21和Node22构成第三层级,各个层级之间存在依赖关系。第一层级作为输入,输出第二层级,接着便可以将第二层级作为输入,输出第三层级。在本实施方式中,在构建DAG转码结构完成之后,还可以根据增加的转码业务需求,对构建DAG转码结构进行横向和纵向的扩展。如图2中虚线方框部分所示,为了增加输出具备杜比音效211、具备杜比音效212、具备杜比音效213、具备杜比音效221和具备杜比音效311的视频的转码业务需求,根据确定的这些待输出的视频的路径信息,可以从横向增加节点Node3,从纵向增加节点Node211、Node212、Node213和Node221,以及节点Node3 1和Node311。这样,便可以构建的DAG转码结构的转码路径,便可以在一台终端设备中实现复杂的转码业务需求。而且在转码过程中,这些中间节点直接在终端设备的本地存储,这样,无需将中间节点对应的视频上传至外部存储设备,也无需从外部存储设备中多次读取该视频,进行后续转码过程。
在本实施方式中,上述方法步骤中实现的功能,可以由计算机程序实现,所述计算机程序可以被存储于计算机存储介质中。具体的,所述计算机存储介质可以与处理器进行耦合,处理器从而可以读取计算机存储介质中的计算机程序。所述计算机程序被处理器执行时,可以实现以下功能:
S11:获取源视频;
S12:确定从所述源视频转码为目标视频的路径信息;其中,所述路径信息中包括转码路径和所述转码路径中节点之间的转码方式;
S13:基于确定的所述路径信息,对所述源视频进行转码。
在一个实施方式中,所述计算机程序被所述处理器执行时,还实现以下步骤:
按照所述转码路径,通过所述转码路径中节点之间的转码方式,对所述源视频进行转码,以得到所述目标视频。
在一个实施方式中,所述计算机程序被所述处理器执行时,当待输出的视频中包括至少两种目标视频时,还实现以下步骤:
当第一目标视频对应的第一路径信息与第二目标视频对应的第二路径信息之间存在重叠路径时,按照所述重叠路径对所述源视频进行转码,得到中间节点,再分别按照所述第一路径信息和所述第二路径信息中的非重叠路径对所述中间节点进行转码。
在一个实施方式中,所述计算机程序被所述处理器执行时,还实现以下步骤:
将所述源视频和所述目标视频构成的视频组输入路径识别模型中,确定从所述源视频转码为所述目标视频的路径信息;其中,将所述源视频和所述目标视频分别作为所述路径识别模型中的路径起始节点和路径结束节点。
在一个实施方式中,所述计算机程序被所述处理器执行时,还实现以下步骤:
将所述源视频和所述目标视频构成的视频组输入路径识别模型中,以通过所述特征识别模型分别提取所述源视频的参数信息对应的第一特征向量和所述目标视频的参数信息对应的第二特征向量,并通过所述路径识别模型确定所述第一特征向量和所述第二特征向量构成的向量组对应的预测值;
将所述预测值表征的路径信息作为从所述源视频转码为所述目标视频的路径信息。
在一个实施方式中,所述计算机程序被所述处理器执行时,还实现以下步骤:
获取训练样本集,所述训练样本集中包括对应的转码路径符合所述路径信息的样本视频组以及对应的转码路径不符合所述路径信息的样本视频组;所述样本视频组中包括所述路径起始节点和所述路径结束节点分别对应的样本视频;
将所述训练样本集中的样本视频组输入路径识别模型,所述路径识别模型中包括初始预测参数;
通过所述初始预测参数对输入的所述样本视频组进行处理,得到所述样本视频组的预测结果,所述预测结果用于表征所述样本视频组对应的转码路径是否符合所述路径信息;
若所述预测结果不正确,根据所述预测结果与正确结果之间的差异值,对所述路径识别模型中的初始预测参数进行调整,以使得通过调整后的预测参数再次对所述样本视频组进行处理后,得到的预测结果与正确结果相符。
请参阅图3,本申请还提供一种视频转码装置,所述装置包括:
视频获取单元100,用于获取源视频;
路径确定单元200,用于确定从所述源视频转码为目标视频的路径信息;其中,所述路径信息中包括转码路径和所述转码路径中节点之间的转码方式;
转码单元300,用于基于获取的所述路径信息,对所述源视频进行转码。
在一个实施方式中,所述转码单元还用于按照所述转码路径,通过所述转码路径中节点之间的转码方式,对所述源视频进行转码,以得到所述目标视频。
在一个实施方式中,当待输出的视频中包括至少两种目标视频时,
所述转码单元还用于当第一目标视频对应的第一路径信息与第二目标视频对应的第二路径信息之间存在重叠路径时,按照所述重叠路径对所述源视频进行转码,得到中间节点,再分别按照所述第一路径信息和所述第二路径信息中的非重叠路径对所述中间节点进行转码。
在一个实施方式中,所述路径确定单元还用于将所述源视频和所述目标视频构成的视频组输入路径识别模型中,确定从所述源视频转码为所述目标视频的路径信息;其中,将所述源视频和所述目标视频分别作为所述路径识别模型中的路径起始节点和路径结束节点。
本说明书实施方式提供的视频转码装置,其中各个单元模块的具体功能,可以与本说明书中的前述方法实施方式相对照解释,并能够达到前述方法实施方式的技术效果,这里便不再赘述。
请参阅图4,本申请还提供一种视频转码装置,所述装置包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现以下步骤:
S11:获取源视频;
S12:确定从所述源视频转码为目标视频的路径信息;其中,所述路径信息中包括转码路径和所述转码路径中节点之间的转码方式;
S13:基于确定的所述路径信息,对所述源视频进行转码。
在本实施方式中,所述存储器可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方法的媒体加以存储。本实施方式所述的存储器又可以包括:利用电能方式存储信息的装置,如RAM、ROM等;利用磁能方式存储信息的装置,如硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘;利用光学方式存储信息的装置,如CD或DVD。当然,还有其他方式的存储器,例如量子存储器、石墨烯存储器等等。
在本实施方式中,所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。
在一个实施方式中,所述计算机程序被所述处理器执行时,还实现以下步骤:
按照所述转码路径,通过所述转码路径中节点之间的转码方式,对所述源视频进行转码,以得到所述目标视频。
在一个实施方式中,所述计算机程序被所述处理器执行时,当待输出的视频中包括至少两种目标视频时,还实现以下步骤:
当第一目标视频对应的第一路径信息与第二目标视频对应的第二路径信息之间存在重叠路径时,按照所述重叠路径对所述源视频进行转码,得到中间节点,再分别按照所述第一路径信息和所述第二路径信息中的非重叠路径对所述中间节点进行转码。
在一个实施方式中,所述计算机程序被所述处理器执行时,还实现以下步骤:
将所述源视频和所述目标视频构成的视频组输入路径识别模型中,确定从所述源视频转码为所述目标视频的路径信息;其中,将所述源视频和所述目标视频分别作为所述路径识别模型中的路径起始节点和路径结束节点。
在一个实施方式中,所述计算机程序被所述处理器执行时,还实现以下步骤:
将所述源视频和所述目标视频构成的视频组输入路径识别模型中,以通过所述特征识别模型分别提取所述源视频的参数信息对应的第一特征向量和所述目标视频的参数信息对应的第二特征向量,并通过所述路径识别模型确定所述第一特征向量和所述第二特征向量构成的向量组对应的预测值;
将所述预测值表征的路径信息作为从所述源视频转码为所述目标视频的路径信息。
在一个实施方式中,所述计算机程序被所述处理器执行时,还实现以下步骤:
获取训练样本集,所述训练样本集中包括对应的转码路径符合所述路径信息的样本视频组以及对应的转码路径不符合所述路径信息的样本视频组;所述样本视频组中包括所述路径起始节点和所述路径结束节点分别对应的样本视频;
将所述训练样本集中的样本视频组输入路径识别模型,所述路径识别模型中包括初始预测参数;
通过所述初始预测参数对输入的所述样本视频组进行处理,得到所述样本视频组的预测结果,所述预测结果用于表征所述样本视频组对应的转码路径是否符合所述路径信息;
若所述预测结果不正确,根据所述预测结果与正确结果之间的差异值,对所述路径识别模型中的初始预测参数进行调整,以使得通过调整后的预测参数再次对所述样本视频组进行处理后,得到的预测结果与正确结果相符。
由上可见,本申请提供的技术方案,本申请提供的技术方案,在获取源视频之后,针对待输出的目标视频,可以确定从所述源视频转码为目标视频的路径信息。其中,所述路径信息中包括转码路径和所述转码路径中节点之间的转码方式。这样,便可以按照所述转码路径,通过所述转码路径中节点之间的转码方式,依次对所述源视频和所述转码路径中的其他中间节点进行转码,输出所述目标视频。如此,整个转码过程可以在一台转码机器完成,减少了上传过程和从外部存储平台中读取的过程,从而减少了视频转码的时间,提高视频转码的效率。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog2。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现视频图像转码装置以外,完全可以通过将方法步骤进行逻辑编程来使得视频图像转码装置以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种视频图像转码装置可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
本说明书中的各个实施方式均采用递进的方式描述,各个实施方式之间相同相似的部分互相参见即可,每个实施方式重点说明的都是与其他实施方式的不同之处。尤其,针对视频图像转码装置的实施方式来说,均可以参照前述方法的实施方式的介绍对照解释。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施方式描绘了本申请,本领域普通技术人员知道,本申请有许多变形和变化而不脱离本申请的精神,希望所附的权利要求包括这些变形和变化而不脱离本申请的精神。

Claims (11)

1.一种视频转码方法,其特征在于,所述方法包括:
获取源视频;
确定从所述源视频转码为目标视频的路径信息;其中,所述路径信息中包括转码路径和所述转码路径中节点之间的转码方式,所述转码路径用于表示从源视频至目标视频经过的多个转码任务,所述多个转码任务之间具有依赖关系;
基于确定的所述路径信息,对所述源视频进行转码,以通过所述依赖关系实现从源视频至目标视频的多层级的转码过程。
2.根据权利要求1所述的方法,基于确定的所述路径信息对所述源视频进行转码包括:
按照所述转码路径,通过所述转码路径中节点之间的转码方式,对所述源视频进行转码,以得到所述目标视频。
3.根据权利要求1所述的方法,当待输出的视频中包括至少两种目标视频时,基于确定的所述路径信息对所述源视频进行转码包括:
当第一目标视频对应的第一路径信息与第二目标视频对应的第二路径信息之间存在重叠路径时,按照所述重叠路径对所述源视频进行转码,得到中间节点,再分别按照所述第一路径信息和所述第二路径信息中的非重叠路径对所述中间节点进行转码。
4.根据权利要求1所述的方法,其特征在于,所述路径信息按照下述方式确定:
将所述源视频和所述目标视频构成的视频组输入路径识别模型中,确定从所述源视频转码为所述目标视频的路径信息;其中,将所述源视频和所述目标视频分别作为所述路径识别模型中的路径起始节点和路径结束节点。
5.根据权利要求4所述的方法,其特征在于,所述路径信息按照下述方式确定:
将所述源视频和所述目标视频构成的视频组输入路径识别模型中,以通过所述特征识别模型分别提取所述源视频的参数信息对应的第一特征向量和所述目标视频的参数信息对应的第二特征向量,并通过所述路径识别模型确定所述第一特征向量和所述第二特征向量构成的向量组对应的预测值;
将所述预测值表征的路径信息作为从所述源视频转码为所述目标视频的路径信息。
6.根据权利要求4所述的方法,其特征在于,所述路径识别模型按照下述方式确定:
获取训练样本集,所述训练样本集中包括对应的转码路径符合所述路径信息的样本视频组以及对应的转码路径不符合所述路径信息的样本视频组;所述样本视频组中包括所述路径起始节点和所述路径结束节点分别对应的样本视频;
将所述训练样本集中的样本视频组输入路径识别模型,所述路径识别模型中包括初始预测参数;
通过所述初始预测参数对输入的所述样本视频组进行处理,得到所述样本视频组的预测结果,所述预测结果用于表征所述样本视频组对应的转码路径是否符合所述路径信息;
若所述预测结果不正确,根据所述预测结果与正确结果之间的差异值,对所述路径识别模型中的初始预测参数进行调整,以使得通过调整后的预测参数再次对所述样本视频组进行处理后,得到的预测结果与正确结果相符。
7.一种视频转码装置,其特征在于,所述装置包括:
视频获取单元,用于获取源视频;
路径确定单元,用于确定从所述源视频转码为目标视频的路径信息;其中,所述路径信息中包括转码路径和所述转码路径中节点之间的转码方式,所述转码路径用于表示从源视频至目标视频经过的多个转码任务,所述多个转码任务之间具有依赖关系;
转码单元,用于基于获取的所述路径信息,对所述源视频进行转码,以通过所述依赖关系实现从源视频至目标视频的多层级的转码过程。
8.根据权利要求7所述的装置,其特征在于,所述转码单元还用于按照所述转码路径,通过所述转码路径中节点之间的转码方式,对所述源视频进行转码,以得到所述目标视频。
9.根据权利要求7所述的装置,其特征在于,当待输出的视频中包括至少两种目标视频时,
所述转码单元还用于当第一目标视频对应的第一路径信息与第二目标视频对应的第二路径信息之间存在重叠路径时,按照所述重叠路径对所述源视频进行转码,得到中间节点,再分别按照所述第一路径信息和所述第二路径信息中的非重叠路径对所述中间节点进行转码。
10.根据权利要求7所述的装置,其特征在于,所述路径确定单元还用于将所述源视频和所述目标视频构成的视频组输入路径识别模型中,确定从所述源视频转码为所述目标视频的路径信息;其中,将所述源视频和所述目标视频分别作为所述路径识别模型中的路径起始节点和路径结束节点。
11.一种视频转码装置,其特征在于,所述装置包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1至6中任一所述的方法。
CN201811510054.7A 2018-12-11 2018-12-11 一种视频转码方法及装置 Active CN111314706B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811510054.7A CN111314706B (zh) 2018-12-11 2018-12-11 一种视频转码方法及装置
PCT/CN2019/124232 WO2020119670A1 (zh) 2018-12-11 2019-12-10 一种视频转码方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811510054.7A CN111314706B (zh) 2018-12-11 2018-12-11 一种视频转码方法及装置

Publications (2)

Publication Number Publication Date
CN111314706A CN111314706A (zh) 2020-06-19
CN111314706B true CN111314706B (zh) 2023-08-25

Family

ID=71075341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811510054.7A Active CN111314706B (zh) 2018-12-11 2018-12-11 一种视频转码方法及装置

Country Status (2)

Country Link
CN (1) CN111314706B (zh)
WO (1) WO2020119670A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112653892B (zh) * 2020-12-18 2024-04-23 杭州当虹科技股份有限公司 一种利用视频特征实现转码测试评估的方法
CN115396683B (zh) * 2022-08-22 2024-04-09 广州博冠信息科技有限公司 视频优化处理方法、装置、电子设备及计算机可读介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104168488A (zh) * 2014-08-29 2014-11-26 北京奇艺世纪科技有限公司 一种视频转码方法及装置
CN104935955A (zh) * 2015-05-29 2015-09-23 腾讯科技(北京)有限公司 一种传输直播视频流的方法、装置和***
CN107124635A (zh) * 2017-06-06 2017-09-01 北京奇艺世纪科技有限公司 一种视频的上线方法、视频管理***和直播***

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102916989B (zh) * 2011-08-02 2018-02-13 腾讯科技(深圳)有限公司 一种视频下载方法、服务端及客户端
US20130091207A1 (en) * 2011-10-08 2013-04-11 Broadcom Corporation Advanced content hosting
US9417921B2 (en) * 2014-07-31 2016-08-16 Istreamplanet Co. Method and system for a graph based video streaming platform
CN106161599A (zh) * 2016-06-24 2016-11-23 电子科技大学 一种存在数据依赖关系时降低云存储整体开销的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104168488A (zh) * 2014-08-29 2014-11-26 北京奇艺世纪科技有限公司 一种视频转码方法及装置
CN104935955A (zh) * 2015-05-29 2015-09-23 腾讯科技(北京)有限公司 一种传输直播视频流的方法、装置和***
CN107124635A (zh) * 2017-06-06 2017-09-01 北京奇艺世纪科技有限公司 一种视频的上线方法、视频管理***和直播***

Also Published As

Publication number Publication date
CN111314706A (zh) 2020-06-19
WO2020119670A1 (zh) 2020-06-18

Similar Documents

Publication Publication Date Title
Liu et al. Yolactedge: Real-time instance segmentation on the edge
CN111314706B (zh) 一种视频转码方法及装置
CN111314737B (zh) 一种视频转码方法及装置
WO2022150401A1 (en) Summarization of video artificial intelligence method, system, and apparatus
CN116884391B (zh) 基于扩散模型的多模态融合音频生成方法及装置
US10685264B2 (en) Visual data processing using energy networks
US20230075893A1 (en) Speech recognition model structure including context-dependent operations independent of future data
CN116189172B (zh) 一种3d目标检测方法、设备、存储介质和芯片
CN111079944A (zh) 迁移学习模型解释实现方法及装置、电子设备、存储介质
CN115146601A (zh) 语言处理任务的执行方法、装置、可读存储介质以及设备
CN116206314A (zh) 模型训练方法、公式识别方法、装置、介质及设备
CN116579413A (zh) 时序数据预训练模型微调方法及装置、时序数据预测模型
US7830284B2 (en) Entropy encoding apparatus, entropy encoding method, and computer program
CN113096638B (zh) 语音合成模型训练方法、语音合成方法及装置
CN114022955A (zh) 一种动作识别方法及装置
CN113409803B (zh) 语音信号处理方法、装置、存储介质及设备
CN116630480B (zh) 一种交互式文本驱动图像编辑的方法、装置和电子设备
JP6622369B1 (ja) 訓練データを生成する方法、コンピュータおよびプログラム
CN113726692B (zh) 一种基于生成对抗网络的虚拟网络映射方法及装置
CN113194270B (zh) 视频处理方法、装置、电子设备及存储介质
CN115600090A (zh) 一种模型的所有权验证方法、装置、存储介质及电子设备
CN110719487A (zh) 视频预测方法和装置、电子设备及车辆
JP2019021218A (ja) 学習装置、プログラムパラメータ、学習方法およびモデル
CN113256765A (zh) Ai主播视频的生成方法、装置、电子设备及存储介质
CN111988615B (zh) 一种解码方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240618

Address after: Room 201, No. 9 Fengxiang East Street, Yangsong Town, Huairou District, Beijing

Patentee after: Youku Culture Technology (Beijing) Co.,Ltd.

Country or region after: China

Address before: Greater Cayman, British Cayman Islands

Patentee before: ALIBABA GROUP HOLDING Ltd.

Country or region before: Cayman Islands