CN111105817A - 面向智能节目制作的训练数据生成方法及装置 - Google Patents
面向智能节目制作的训练数据生成方法及装置 Download PDFInfo
- Publication number
- CN111105817A CN111105817A CN201811251494.5A CN201811251494A CN111105817A CN 111105817 A CN111105817 A CN 111105817A CN 201811251494 A CN201811251494 A CN 201811251494A CN 111105817 A CN111105817 A CN 111105817A
- Authority
- CN
- China
- Prior art keywords
- program
- training data
- program content
- segments
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 104
- 238000000034 method Methods 0.000 title claims abstract description 25
- 239000000463 material Substances 0.000 claims abstract description 110
- 239000012634 fragment Substances 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 16
- 230000011218 segmentation Effects 0.000 claims description 21
- 238000005538 encapsulation Methods 0.000 claims description 10
- 238000004806 packaging method and process Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/34—Indicating arrangements
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Stored Programmes (AREA)
Abstract
本发明公开了一种面向智能节目制作的训练数据集生成方法及装置。该方法包括:根据节目内容,获取节目内容片段;根据节目编目信息,获取节目语义片段;从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息;按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集;输出所述训练数据集。根据本发明实施例,可以快速生成用于智能化节目制作模型的训练数据集,节省了大量的人工成本和时间,提高了训练数据集的生成效率。
Description
技术领域
本发明涉及多媒体服务技术领域,更具体地,涉及一种面向智能节目制作的训练数据生成方法及装置。
背景技术
当前,云计算、大数据等技术的发展推动了广播电视媒体融合进程,电台电视台等技术***IP化,云平台化,提升了生产效率,生产出海量的视音频节目素材,创新出多种多样的媒体无副模式,推动了广播电视行业转型升级,也为人工智能向广播电视行业的渗透提供基础支撑。
目前,可以基于人工智能等技术,实现充分利用海量的节目素材快速、高效的制作出高质量的广播电视节目的目的。但基于人工智能的节目智能化制作方法需要标注大量的训练数据用于节目智能化制作模型的训练、验证与测试,这些数据的标注往往需要人工耗费大量的时间来实现。
因此,发明人认为,有必要对上述现有技术中存在的至少一个问题进行改进。
发明内容
本发明的一个目的是提供一种面向智能节目制作的训练数据生成的新技术方案。
根据本发明的第一方面,提供了一种面向智能节目制作的训练数据集生成方法,所述方法包括:
根据节目内容,获取节目内容片段;
根据节目编目信息,获取节目语义片段;
从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息;
按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集;
输出所述训练数据集。
可选的,所述根据节目内容,获取节目内容片段的步骤,包括:
将所述节目内容按照节目镜头进行分割,获取所述节目内容片段。
可选的,所述根据节目编目信息,获取节目语义片段的步骤,包括:
将所述节目编目信息按照语义进行分割,获取所述节目语义片段。
可选的,所述从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息的步骤,包括:
向所述媒资库发送检索请求,所述检索请求中包含所述节目内容片段;
接收来自所述媒资库的与所述节目内容片段匹配的素材以及与所述素材对应的素材编目信息。
可选的,所述按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集的步骤,包括:
将所述节目编目信息、所述节目语义片段以及所述素材编目信息按照JSON语法格式进行拼接,生成训练数据描述信息;
将所述节目内容、所述节目内容片段以及所述素材依次封装,生成训练数据;
根据所述训练数据描述信息和所述训练数据生成所述训练数据集。
根据本发明的第二方面,提供了一种面向智能节目制作的训练数据集生成装置,所述装置包括:
节目内容分割模块,用于根据节目内容,获取节目内容片段;
编目信息语义分割模块,用于根据节目编目信息,获取节目语义片段;
素材检索模块,用于从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息;
训练数据封装模块,用于按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集;
输出模块,用于输出所述训练数据集。
可选的,所述节目内容分割模块具体用于:
将所述节目内容按照节目镜头进行分割,获取所述节目内容片段。
可选的,所述编目信息语义分割模块具体用于:
将所述节目编目信息按照语义进行分割,获取所述节目语义片段。
可选的,所述素材检索模块具体用于:
向所述媒资库发送检索请求,所述检索请求中包含所述节目内容片段;
接收来自所述媒资库的与所述节目内容片段匹配的素材以及与所述素材对应的素材编目信息。
可选的,所述训练数据封装模块具体用于:
将所述节目编目信息、所述节目语义片段以及所述素材编目信息按照JSON语法格式进行拼接,生成训练数据描述信息;
将所述节目内容、所述节目内容片段以及所述素材依次封装,生成训练数据;
根据所述训练数据描述信息和所述训练数据生成所述训练数据集。
根据本发明的一个实施例,可以快速生成用于智能化节目制作模型的训练数据集,节省了大量的人工成本和时间,提高了训练数据集的生成效率。
通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
图1示出了根据本发明实施例的面向智能节目制作的训练数据集生成方法的示意性流程图。
图2示出了根据本发明实施例的训练数据集的组成结构示意图。
图3示出了根据本发明实施例的面向智能节目制作的训练数据集生成装置的示意性框图。
图4示出了根据本发明实施例的一个例子的示意性框图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
下面,参照附图描述根据本发明的各个实施例和例子。
<方法>
图1示出了根据本发明实施例的面向智能节目制作的训练数据集生成方法的示意性流程图。
如图1所示,在步骤1100,根据节目内容,获取节目内容片段。
具体的,在本步骤中,可以将所述节目内容按照节目镜头进行分割,获取所述节目内容片段。例如,可以根据节目镜头的切换,在时间轴上标记镜头切换点,对节目内容标记完成后,将节目按照镜头切换点进行分割,以获取节目内容片段。
步骤1200,根据节目编目信息,获取节目语义片段。
具体的,可以将所述节目编目信息按照语义进行分割,获取所述节目语义片段。
步骤1300,从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息。
本步骤中,向所述媒资库发送检索请求,所述检索请求中包含所述节目内容片段;接收来自所述媒资库的与所述节目内容片段匹配的素材以及与所述素材对应的素材编目信息。
其中,所述媒资库在接收到包含节目内容片段的检索请求后,根据视频特征比对,查找与所述节目内容片段匹相匹配的素材以及与所述素材对应的素材编目信息。
步骤1400,按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集。
其中,将所述节目编目信息、所述节目语义片段以及所述素材编目信息按照JSON语法格式进行拼接,生成训练数据描述信息;将所述节目内容、所述节目内容片段以及所述素材依次封装,生成训练数据;根据所述训练数据描述信息和所述训练数据生成所述训练数据集。
具体的,如图2所示,所述训练数据集中包含节目存储位置、节目编目信息、节目内容片段储存位置、节目语义片段、素材存储位置以及素材编目信息。
步骤1500,输出所述训练数据集。
本实施例的面向智能节目制作的训练数据集生成方法,通过根据节目内容,获取节目内容片段;根据节目编目信息,获取节目语义片段;从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息;按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集;输出所述训练数据集。可以快速生成用于智能化节目制作模型的训练数据集,节省了大量的人工成本和时间,提高了训练数据集的生成效率。
<装置>
图3示出了根据本发明实施例的面向智能节目制作的训练数据集生成装置的示意性框图。
如图3所示,本实施例的面向智能节目制作的训练数据集生成装置3000可以包括:节目内容分割模块3100,编目信息语义分割模块3200,素材检索模块3300,训练数据封装模块3400,以及输出模块3500。
其中,节目内容分割模块3100用于根据节目内容,获取节目内容片段。
编目信息语义分割模块3200用于根据节目编目信息,获取节目语义片段。
素材检索模块3300用于从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息。
训练数据封装模块3400用于按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集。
输出模块3500用于输出所述训练数据集。
实际应用中,所述节目内容分割模块3100具体用于将所述节目内容按照节目镜头进行分割,获取所述节目内容片段。
所述编目信息语义分割模块3200具体用于将所述节目编目信息按照语义进行分割,获取所述节目语义片段。
所述素材检索模块3300具体用于向所述媒资库发送检索请求,所述检索请求中包含所述节目内容片段;接收来自所述媒资库的与所述节目内容片段匹配的素材以及与所述素材对应的素材编目信息。
所述训练数据封装模块3400具体用于将所述节目编目信息、所述节目语义片段以及所述素材编目信息按照JSON语法格式进行拼接,生成训练数据描述信息;将所述节目内容、所述节目内容片段以及所述素材依次封装,生成训练数据;根据所述训练数据描述信息和所述训练数据生成所述训练数据集。
本实施例的面向智能节目制作的训练数据集生成装置,可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
本领域技术人员应当明白,可以通过各种方式来实现面向智能节目制作的训练数据集生成装置。例如,可以通过指令配置处理器来实现面向智能节目制作的训练数据集生成装置。例如,可以将指令存储在ROM中,并且当启动设备时,将指令从ROM读取到可编程器件中来实现面向智能节目制作的训练数据集生成装置。例如,可以将面向智能节目制作的训练数据集生成装置固化到专用器件(例如ASIC)中。可以将面向智能节目制作的训练数据集生成装置分成相互独立的单元,或者可以将它们合并在一起实现。面向智能节目制作的训练数据集生成装置可以通过上述各种实现方式中的一种来实现,或者可以通过上述各种实现方式中的两种或更多种方式的组合来实现。
<例子>
下面结合附图4对本实施例的面向智能节目制作的训练数据集生成的工作流程进行说明。
图4示出了根据本发明实施例的一个例子的示意性框图。
如图4所示,该面向智能节目制作的训练数据集生成装置4000包括:节目镜头分割模块4100、编目信息语义分割模块4200、基于节目内容片段的素材检索模块4300、训练数据封装模块4400。
实际应用中,节目镜头分割模块4100接收节目内容,将节目内容按照节目镜头进行分割,获取节目内容片段。将节目内容片段发送给基于节目内容片段的素材检索模块4300和训练数据封装模块4400。
编目信息语义分割模块4200接收节目编目信息,将节目编目信息按照语义进行分割,获取节目语义片段。将节目语义片段发送给训练数据封装模块4400。
基于节目内容片段的素材检索模块4300接收来自节目镜头分割模块4100的节目内容片段,并在媒资库中对节目内容片段对应的素材进行查找,检索到与节目内容片段相匹配的素材。将素材和素材所对应的素材编目信息发送到训练数据封装模块4400。
训练数据封装模块4400接收节目内容、节目编目信息,以及来自于节目镜头分割模块4100的节目内容片段,来自编目信息语义分割模块4200的节目语义片段,来自基于节目内容片段的素材检索模块4300的素材和素材编目信息,将视频和信息分别打包。
其中,节目编目信息、节目语义片段以及素材编目信息按照JSON语法格式进行拼接,生成训练数据描述信息;将节目内容、节目内容片段以及素材依次封装,生成训练数据;根据训练数据描述信息和训练数据生成训练数据集。
其中,训练数据集包含节目存储位置、节目编目信息、节目内容片段存储位置、节目片段语义、素材存储位置和素材编目信息。具体的数据组成结构可以参照上述图2所示。
在一个例子中,训练数据集的示例如下所示:
其中,Program表示节目,purl表示节目存储位置,pdescription表示节目编目信息。fragments表示节目内容片段,因为节目内容片段为多个,fragment表示其中的一个节目内容片段,furl表示节目内容片段存储位置,fdescription表示节目语义片段。matreials表示节目内容片段所对应的素材,因为material为多个,murl表示素材存储位置,mdescription表示素材编目信息,position表示对应节目内容片段的位置。
本例提供的面向智能节目制作的训练数据集生成装置,可以快速生成用于智能化节目制作模型的训练数据集,节省了大量的人工成本和时间,提高了训练数据集的生成效率。
本领域技术人员公知的是,随着诸如大规模集成电路技术的电子信息技术的发展和软件硬件化的趋势,要明确划分计算机***软、硬件界限已经显得比较困难了。因为,任何操作可以软件来实现,也可以由硬件来实现。任何指令的执行可以由硬件完成,同样也可以由软件来完成。对于某一机器功能采用硬件实现方案还是软件实现方案,取决于价格、速度、可靠性、存储容量、变更周期等非技术性因素。对于技术人员来说,软件实现方式和硬件实现方式是等同的。技术人员可以根据需要选择软件或硬件来实现上述方案。因此,这里不对具体的软件或硬件进行限制。
本发明可以是设备、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
Claims (10)
1.一种面向智能节目制作的训练数据集生成方法,其特征在于,所述方法包括:
根据节目内容,获取节目内容片段;
根据节目编目信息,获取节目语义片段;
从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息;
按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集;
输出所述训练数据集。
2.根据权利要求1所述的方法,其特征在于,所述根据节目内容,获取节目内容片段的步骤,包括:
将所述节目内容按照节目镜头进行分割,获取所述节目内容片段。
3.根据权利要求1所述的方法,其特征在于,所述根据节目编目信息,获取节目语义片段的步骤,包括:
将所述节目编目信息按照语义进行分割,获取所述节目语义片段。
4.根据权利要求1所述的方法,其特征在于,所述从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息的步骤,包括:
向所述媒资库发送检索请求,所述检索请求中包含所述节目内容片段;
接收来自所述媒资库的与所述节目内容片段匹配的素材以及与所述素材对应的素材编目信息。
5.根据权利要求1所述的方法,其特征在于,所述按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集的步骤,包括:
将所述节目编目信息、所述节目语义片段以及所述素材编目信息按照JSON语法格式进行拼接,生成训练数据描述信息;
将所述节目内容、所述节目内容片段以及所述素材依次封装,生成训练数据;
根据所述训练数据描述信息和所述训练数据生成所述训练数据集。
6.一种面向智能节目制作的训练数据集生成装置,其特征在于,所述装置包括:
节目内容分割模块,用于根据节目内容,获取节目内容片段;
编目信息语义分割模块,用于根据节目编目信息,获取节目语义片段;
素材检索模块,用于从媒资库中获取与所述节目内容片段匹配的素材,以及与所述素材对应的素材编目信息;
训练数据封装模块,用于按照预设规则处理所述节目内容、所述节目内容片段、所述素材、所述节目编目信息、所述节目语义片段、所述素材编目信息,得到训练数据集;
输出模块,用于输出所述训练数据集。
7.根据权利要求6所述的装置,其特征在于,所述节目内容分割模块具体用于:
将所述节目内容按照节目镜头进行分割,获取所述节目内容片段。
8.根据权利要求6所述的装置,其特征在于,所述编目信息语义分割模块具体用于:
将所述节目编目信息按照语义进行分割,获取所述节目语义片段。
9.根据权利要求6所述的装置,其特征在于,所述素材检索模块具体用于:
向所述媒资库发送检索请求,所述检索请求中包含所述节目内容片段;
接收来自所述媒资库的与所述节目内容片段匹配的素材以及与所述素材对应的素材编目信息。
10.根据权利要求6所述的装置,其特征在于,所述训练数据封装模块具体用于:
将所述节目编目信息、所述节目语义片段以及所述素材编目信息按照JSON语法格式进行拼接,生成训练数据描述信息;
将所述节目内容、所述节目内容片段以及所述素材依次封装,生成训练数据;
根据所述训练数据描述信息和所述训练数据生成所述训练数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811251494.5A CN111105817B (zh) | 2018-10-25 | 2018-10-25 | 面向智能节目制作的训练数据生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811251494.5A CN111105817B (zh) | 2018-10-25 | 2018-10-25 | 面向智能节目制作的训练数据生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111105817A true CN111105817A (zh) | 2020-05-05 |
CN111105817B CN111105817B (zh) | 2021-08-17 |
Family
ID=70417866
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811251494.5A Active CN111105817B (zh) | 2018-10-25 | 2018-10-25 | 面向智能节目制作的训练数据生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111105817B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111970416A (zh) * | 2020-08-29 | 2020-11-20 | 赣州圣享区块链技术有限公司 | 一种智能化广播电视节目制作经营方法 |
CN113794930A (zh) * | 2021-09-10 | 2021-12-14 | 中国联合网络通信集团有限公司 | 视频生成方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102510445A (zh) * | 2011-10-14 | 2012-06-20 | 上海文广科技(集团)有限公司 | 节目源智能信息制作***及制作方法 |
CN102547139A (zh) * | 2010-12-30 | 2012-07-04 | 北京新岸线网络技术有限公司 | 一种新闻视频节目切分方法、新闻视频编目方法及*** |
CN104935983A (zh) * | 2015-05-28 | 2015-09-23 | 福建新大陆通信科技股份有限公司 | 一种机顶盒节目编辑及播放时间控制方法 |
CN106445894A (zh) * | 2015-08-13 | 2017-02-22 | 中国科学院计算技术研究所 | 新媒体智能在线编辑方法、装置及网络信息发布平台 |
CN107241618A (zh) * | 2017-08-07 | 2017-10-10 | 苏州市广播电视总台 | 收录方法和收录装置 |
CN107369450A (zh) * | 2017-08-07 | 2017-11-21 | 苏州市广播电视总台 | 收录方法和收录装置 |
-
2018
- 2018-10-25 CN CN201811251494.5A patent/CN111105817B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102547139A (zh) * | 2010-12-30 | 2012-07-04 | 北京新岸线网络技术有限公司 | 一种新闻视频节目切分方法、新闻视频编目方法及*** |
CN102510445A (zh) * | 2011-10-14 | 2012-06-20 | 上海文广科技(集团)有限公司 | 节目源智能信息制作***及制作方法 |
CN104935983A (zh) * | 2015-05-28 | 2015-09-23 | 福建新大陆通信科技股份有限公司 | 一种机顶盒节目编辑及播放时间控制方法 |
CN106445894A (zh) * | 2015-08-13 | 2017-02-22 | 中国科学院计算技术研究所 | 新媒体智能在线编辑方法、装置及网络信息发布平台 |
CN107241618A (zh) * | 2017-08-07 | 2017-10-10 | 苏州市广播电视总台 | 收录方法和收录装置 |
CN107369450A (zh) * | 2017-08-07 | 2017-11-21 | 苏州市广播电视总台 | 收录方法和收录装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111970416A (zh) * | 2020-08-29 | 2020-11-20 | 赣州圣享区块链技术有限公司 | 一种智能化广播电视节目制作经营方法 |
CN113794930A (zh) * | 2021-09-10 | 2021-12-14 | 中国联合网络通信集团有限公司 | 视频生成方法、装置、设备及存储介质 |
CN113794930B (zh) * | 2021-09-10 | 2023-11-24 | 中国联合网络通信集团有限公司 | 视频生成方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111105817B (zh) | 2021-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10771417B2 (en) | Control of messages in publish/subscribe system | |
CN107643984B (zh) | 用于输出信息的方法和装置 | |
CN110704749B (zh) | 推荐引擎定制***、推荐方法及推荐***、电子设备 | |
CN111105817B (zh) | 面向智能节目制作的训练数据生成方法及装置 | |
US11095957B2 (en) | Method and apparatus for publishing information, and method and apparatus for processing information | |
CN110909185B (zh) | 智能化广播电视节目制作方法及装置 | |
US11086899B2 (en) | On demand synchronization of information | |
CN113780847A (zh) | 基于物联网的智慧社区信息处理方法及服务器 | |
US10937012B2 (en) | Remote document generation | |
US10120661B2 (en) | Multi-flavored software execution from a singular code base | |
CN111104545A (zh) | 背景音乐的配置方法、设备、客户端装置及电子设备 | |
CN105471871A (zh) | 用于提供视频片段集合的方法和装置 | |
CN115063123A (zh) | 智能制造方法、***及电子设备 | |
CN112307723B (zh) | 生成代码文档的方法、装置和电子设备 | |
CN114090662A (zh) | 基于虚拟现实的用户信息处理方法及服务*** | |
CN110309294B (zh) | 内容集合的标签确定方法及装置 | |
CN109286823B (zh) | 多媒体内容的获取方法及装置 | |
CN113724014A (zh) | 基于互联网的广告推荐方法及服务器 | |
CN117992258B (zh) | Im卡片消息流转方法、电子设备及可读存储介质 | |
CN111291199B (zh) | 信息查询方法和装置 | |
CN114155382A (zh) | 基于人工智能的图像处理方法及服务器 | |
CN114501165A (zh) | 视频结构化表示方法、装置及电子设备 | |
CN113625591A (zh) | 基于物联网的家居远程控制方法及*** | |
CN117951542A (zh) | 看板数据处理的方法、装置、电子设备和存储介质 | |
CN115408044A (zh) | 一种多应用管理方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100866, 2, Fuxing Avenue, Xicheng District, Beijing Applicant after: Research Institute of Radio and Television Science, State Administration of Radio and Television Address before: 100866, 2, Fuxing Avenue, Xicheng District, Beijing Applicant before: ACADEMY OF BROADCASTING SCIENCE, SAPPRFT |
|
GR01 | Patent grant | ||
GR01 | Patent grant |