发明内容
本公开实施例至少提供一种视频展示、生成方法及装置。
第一方面,本公开实施例提供了一种视频展示方法,所述方法包括:
响应触发操作,获取基于目标多媒体内容生成的目标视频;其中,所述目标多媒体内容包括文本内容、图片内容、视频内容中的一项或多项;
展示所述目标视频;其中,所述目标视频的各视频帧包括从所述目标多媒体内容中提取的目标图片内容和目标文本内容。
在一种可能的实施方式中,所述目标视频上展示有搜索框;所述搜索框中包括与所述目标多媒体内容关联的搜索信息;
所述方法还包括:
响应针对所述搜索框的触发操作,展示所述目标多媒体内容。
在一种可能的实施方式中,所述目标多媒体内容与待生成视频的目标媒体信息相匹配。
在一种可能的实施方式中,所述目标视频上展示有描述所述目标视频对应热点事件的核心信息;
所述方法还包括:
响应针对所述核心信息的触发操作,展示所述热点事件对应的聚合信息页面。
第二方面,本公开实施例提供了一种视频生成方法,所述方法包括:
获取待生成视频的目标媒体信息,确定与所述目标媒体信息匹配的目标多媒体内容;其中,所述目标多媒体内容包括文本内容、图片内容、视频内容中的一项或多项;
根据所述目标多媒体内容确定目标视频模板;
基于所述目标视频模板和所述目标多媒体内容,生成所述目标媒体信息对应的目标视频。
在一种可能的实施方式中,获取待生成视频的目标媒体信息,包括:
获取来自至少一个热点来源渠道的多个热点媒体信息;所述热点媒体信息用于描述热点事件;
根据所述热点媒体信息描述的热点事件的事件属性信息,确定目标媒体信息。
在一种可能的实施方式中,确定与所述目标媒体信息匹配的目标多媒体内容,包括:
获取与所述目标媒体信息对应的目标热点事件关联的多个多媒体内容;
基于所述多个多媒体内容的属性信息,从所述多个多媒体内容中选择与所述目标媒体信息匹配的目标多媒体内容。
在一种可能的实施方式中,根据所述目标多媒体内容确定目标视频模板,包括:
根据所述目标多媒体内容的类别标签,和/或,所述目标多媒体内容对应的目标情绪属性标签,确定与所述目标多媒体内容匹配的视频模板内容。
在一种可能的实施方式中,根据以下步骤确定所述目标多媒体内容对应的目标情绪属性标签:
根据所述目标多媒体内容的类别标签,和/或,所述目标多媒体内容与各情绪属性标签对应的参考内容之间的匹配度,确定所述目标多媒体内容对应的目标情绪属性标签。
在一种可能的实施方式中,基于所述目标视频模板和所述目标多媒体内容,生成所述目标媒体信息对应的目标视频,包括:
基于所述目标多媒体内容确定目标文本内容和目标图片内容,将所述目标文本内容和目标图片内容分别***所述目标视频模板中对应展示模块位置处,得到若干目标视频帧;
根据所述目标视频模板对应的音频元素以及各所述目标视频帧中的所述目标文本内容,生成各所述目标视频帧的音频;所述音频元素包括视频背景配乐和/或视频字幕的音色属性信息;
基于若干所述目标视频帧以及各所述目标视频帧对应的音频,生成所述目标媒体信息对应的目标视频。
在一种可能的实施方式中,所述基于所述目标多媒体内容确定目标文本内容和目标图片内容,将所述目标文本内容和目标图片内容分别***所述目标视频模板中对应展示模块位置处,包括:
确定所述目标多媒体内容对应的目标文本内容,以及与所述目标文本内容匹配的至少一张目标图片内容;
基于所述目标文本内容、至少一张目标图片内容、以及所述目标视频模板中的文本内容展示区域可展示的文本字符数,确定在若干视频帧中的每帧视频帧中的一张目标图片内容及其对应的目标文本内容;
将确定的每帧视频帧中的一张目标图片内容及其对应的目标文本内容分别***所述目标视频模板中对应展示模块位置处。
在一种可能的实施方式中,确定所述目标多媒体内容对应的目标文本内容,以及与所述目标文本内容匹配的至少一张目标图片内容,包括:
若所述目标多媒体内容中包括文本内容,从所述文本内容中提取用于描述所述目标媒体信息对应的热点事件的目标文本内容,并基于所述目标文本内容,搜索得到与所述目标文本内容匹配的目标图片内容;
若所述目标多媒体内容中包括图片内容,从所述图片内容中选取至少一张与所述目标媒体信息对应的热点事件匹配的目标图片内容,并基于所述目标图片内容,搜索得到与所述目标图片内容匹配的目标文本内容;
若所述目标多媒体内容中包括文本内容和图片内容,从所述文本内容和图片内容中分别提取用于描述所述目标媒体信息对应的热点事件的所述目标文本内容和与所述目标媒体信息对应的热点事件匹配的所述目标图片内容。
在一种可能的实施方式中,在所述音频元素包括视频字幕的音色属性信息的情况下,根据所述目标视频模板对应的音频元素以及各所述目标视频帧中的所述目标文本内容,生成各所述目标视频帧的音频,包括:
基于所述音色属性信息、以及所述目标文本内容,生成所述目标文本内容对应的音频内容;
配置所述音频内容的播放时间和所述目标文本内容的展示时间,使得对应同一内容的所述音频内容的播放时间和所述目标文本内容的展示时间相同。
在一种可能的实施方式中,在所述音频元素还包括视频背景配乐的情况下,所述生成各所述目标视频帧的音频,还包括:
根据若干所述目标视频帧分别对应的所述音频内容的播放时间或所述目标文本内容的展示时间,配置所述目标视频中与所述目标视频帧对应的背景配乐的播放时间。
在一种可能的实施方式中,生成所述目标媒体信息对应的目标视频之后,所述方法还包括:
将所述目标视频按照预设的至少一种分发方式推送给终端。
第三方面,本公开实施例提供了一种视频展示装置,包括:
响应模块,用于响应触发操作,获取基于目标多媒体内容生成的目标视频;其中,所述目标多媒体内容包括文本内容、图片内容、视频内容中的一项或多项;
展示模块,用于展示所述目标视频;其中,所述目标视频的各视频帧包括从所述目标多媒体内容中提取的目标图片内容和目标文本内容。
在一种可能的实施方式中,所述目标视频上展示有搜索框;所述搜索框中包括与所述目标多媒体内容关联的搜索信息;所述展示模块,还用于响应针对所述搜索框的触发操作,展示所述目标多媒体内容。
在一种可能的实施方式中,所述目标多媒体内容与待生成视频的目标媒体信息相匹配。
在一种可能的实施方式中,所述目标视频上展示有描述所述目标视频对应热点事件的核心信息;所述展示模块,还用于响应针对所述核心信息的触发操作,展示所述热点事件对应的聚合信息页面。
第四方面,本公开实施例还提供了一种视频生成装置,包括:
获取模块,用于获取待生成视频的目标媒体信息,确定与所述目标媒体信息匹配的目标多媒体内容;其中,所述目标多媒体内容包括文本内容、图片内容、视频内容中的一项或多项;
确定模块,用于根据所述目标多媒体内容确定目标视频模板;
生成模块,用于基于所述目标视频模板和所述目标多媒体内容,生成所述目标媒体信息对应的目标视频。
在一种可能的实施方式中,所述获取模块,具体用于获取来自至少一个热点来源渠道的多个热点媒体信息;所述热点媒体信息用于描述热点事件;根据所述热点媒体信息描述的热点事件的事件属性信息,确定目标媒体信息。
在一种可能的实施方式中,所述获取模块,具体用于获取与所述目标媒体信息对应的目标热点事件关联的多个多媒体内容;基于所述多个多媒体内容的属性信息,从所述多个多媒体内容中选择与所述目标媒体信息匹配的目标多媒体内容。
在一种可能的实施方式中,所述确定模块,具体用于根据所述目标多媒体内容的类别标签,和/或,所述目标多媒体内容对应的目标情绪属性标签,确定与所述目标多媒体内容匹配的视频模板内容。
在一种可能的实施方式中,所述确定模块,具体用于根据所述目标多媒体内容的类别标签,和/或,所述目标多媒体内容与各情绪属性标签对应的参考内容之间的匹配度,确定所述目标多媒体内容对应的目标情绪属性标签。
在一种可能的实施方式中,所述生成模块,具体用于基于所述目标多媒体内容确定目标文本内容和目标图片内容,将所述目标文本内容和目标图片内容分别***所述目标视频模板中对应展示模块位置处,得到若干目标视频帧;根据所述目标视频模块对应的音频元素以及各所述目标视频帧中的所述目标文本内容,生成各所述目标视频帧的音频;所述音频元素包括视频背景配乐和/或视频字幕的音色属性信息;基于若干所述目标视频帧以及各所述目标视频帧对应的音频,生成所述目标媒体信息对应的目标视频。
在一种可能的实施方式中,所述生成模块,具体用于确定所述目标多媒体内容对应的目标文本内容,以及与所述目标文本内容匹配的至少一张目标图片内容;基于所述目标文本内容、至少一张目标图片内容、以及所述目标视频模板中的文本内容展示区域可展示的文本字符数,确定在若干视频帧中的每帧视频帧中的一张目标图片内容及其对应的目标文本内容;将确定的每帧视频帧中的一张目标图片内容及其对应的目标文本内容分别***所述目标视频模板中对应展示模块位置处。
在一种可能的实施方式中,所述生成模块,具体用于若所述目标多媒体内容中包括文本内容,从所述文本内容中提取用于描述所述目标媒体信息对应的热点事件的目标文本内容,并基于所述目标文本内容,搜索得到与所述目标文本内容匹配的目标图片内容;若所述目标多媒体内容中包括图片内容,从所述图片内容中选取至少一张与所述目标媒体信息对应的热点事件匹配的所述目标图片内容,并基于所述目标图片内容,搜索得到与所述目标图片内容匹配的所述目标文本内容;若所述目标多媒体内容中包括文本内容和图片内容,从所述文本内容和图片内容中分别提取用于描述所述目标媒体信息对应的热点事件的所述目标文本内容和与所述目标媒体信息对应的热点事件匹配的所述目标图片内容。
在一种可能的实施方式中,在所述音频元素包括视频字幕的音色属性信息的情况下,所述生成模块,具体用于基于所述音色属性信息、以及所述目标文本内容,生成所述目标文本内容对应的音频内容;配置所述音频内容的播放时间和所述目标文本内容的展示时间,使得对应同一内容的所述音频内容的播放时间和所述目标文本内容的展示时间相同。
在一种可能的实施方式中,在所述音频元素还包括视频背景配乐的情况下,所述生成模块,具体用于根据若干所述目标视频帧分别对应的所述音频内容的播放时间或所述目标文本内容的展示时间,配置所述目标视频中与所述目标视频帧对应的背景配乐的播放时间。
在一种可能的实施方式中,所述装置还包括:推送模块,用于将所述目标视频按照预设的至少一种分发方式推送给终端。
第五方面,本公开可选实现方式还提供一种计算机设备,处理器、存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述处理器用于执行所述存储器中存储的机器可读指令,所述机器可读指令被所述处理器执行时,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤,或执行上述第二方面,或第二方面中任一种可能的实施方式中的步骤。
第六方面,本公开可选实现方式还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤,或执行上述第二方面,或第二方面中任一种可能的实施方式中的步骤。
本公开实施例提供的一种视频展示、生成方法及装置,可以在获取到想向用户展示的目标媒体信息后,通过搜索与该目标媒体信息匹配的目标多媒体内容,来生成目标视频;采用这种方式,可以在产生有价值的目标媒体信息后,及时将该目标媒体信息对应的热点事件自动转换为目标视频,用户可以获取到视频形式的时效性较强的多媒体内容,提高了用户获取到时效性较高的多媒体内容的机会,尤其对于一些喜爱刷视频的用户,可以在打开的视频推送页面中及时获取到这些多媒体内容,进而提高了媒体内容资源的有效利用率。
关于上述视频展示装置、视频生成装置、计算机设备、及计算机可读存储介质的效果描述参见上述视频展示方法、及视频生成方法的说明,这里不再赘述。
为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
具体实施方式
为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
由于当前大部分热度较高、时效性较强、较为重要的媒体内容一般以图文形式呈现给用户,很多用户对图文类媒体内容的关注度较低,会自动将其作为不重要内容过滤掉,从而降低了一些时效性较强、较重要的媒体内容资源的有效利用率。
综上,为了提高对一些时效性较强、较为重要的媒体内容资源的有效利用率,可以采用传统的方式将图文文本形式的媒体内容制作为视频内容,当前通过人工对图文形式的媒体内容进行分析,提取图文形式媒体内容的摘要,并且人工选择合适的配图,在使用剪辑工具将上述摘要、配图加工为该图文媒体内容对应的视频内容;在上述将图文媒体内容制作成视频的过程,每一步都需要人工操作,制作时间较长,制作效率较低,从而导致一些时效性较强的媒体内容失去了时效性,用户无法及时获取到时效性较强、且较为重要的媒体内容。
基于上述研究,本公开实施例提供了一种视频展示、生成方法及装置,可以在获取到有价值的目标媒体信息后,及时将该目标媒体信息对应的热点事件自动转换为目标视频,用户可以在打开的视频推送页面中及时获取到时效性较强、热度较高、较为重要的媒体内容,使用户能够及时了解到这些媒体内容,进而提高了媒体内容资源的有效利用率。
上述对问题的分析及解决方式,均是发明人在经过实践并仔细研究后得出的结果,因此,上述问题的发现过程以及下文中本公开针对上述问题所提出的解决方案,都应该是发明人在本公开过程中对本公开做出的贡献。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
为便于对本实施例进行理解,首先对本公开实施例所公开的一种视频展示、生成方法进行详细介绍,本公开实施例所提供的视频展示、生成方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该视频展示、生成方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
实施例一
下面以执行主体为终端设备为例对本公开实施例提供的一种视频展示方法加以说明。
参见图1所示,为本公开实施例提供的一种视频展示方法的流程图,所述方法包括步骤S101~S102,其中:
S101、响应触发操作,获取基于目标多媒体内容生成的目标视频;其中,所述目标多媒体内容包括文本内容、图片内容、视频内容中的一项或多项。
这里,目标视频可以为长视频,也可以为短视频。
这里,触发操作可以为打开视频推送页面的操作,可以包括单击、双击等点击操作。
在具体实施中,当用户打开视频播放软件的视频推送页面后,可以获取到基于目标多媒体内容生成的目标视频,这里,目标视频的具体生成方法参见下述步骤S701~S703所示。
在基于步骤S101获取到目标视频之后,可以基于步骤S102展示该目标视频。
S102、展示所述目标视频;其中,所述目标视频的各视频帧包括从所述目标多媒体内容中提取的目标图片内容和目标文本内容。
其中,目标文本内容包括标题内容、字幕内容、推荐搜索内容和描述目标视频对应的热点事件的核心信息;目标视频由若干帧组成,各视频帧中包括图片内容、标题内容、字幕内容、音频内容、视频背景配乐、以及推荐搜索内容(或描述目标视频对应的热点事件的核心信息);这里,目标图片内容和目标文本内容可以是从目标多媒体内容中提取的。
在具体实施中,终端设备在播放目标视频时,可以在目标视频模板中的视频展示模块展示目标视频的图片内容;并在目标视频模板中的标题展示模块展示该目标视频的标题内容;并在目标视频模板中的字幕展示模块展示该目标视频的字幕内容;终端设备在播放目标视频时,各视频帧的字幕内容、字幕内容对应的音频内容、以及该字幕内容对应的图片内容同时播放;当一条字幕内容对应多张图片内容时,会根据该字幕内容对应的图片内容的数量、以及该字幕内容播放时长,确定该字幕内容对应的每张图片内容的切换时间,以使在播放字幕内容以及该字幕内容的音频内容时,切换展示与该字幕内容对应的多张图片内容;当一张图片内容对应多条字幕内容时,会根据该图片内容对应的字幕内容的条数、以及每条字幕内容的播放时长,确定展示该图片内容时字幕内容以及与字幕内容对应的音频内容的切换时间,以使在播放该图片内容时,切换播放该图片内容对应的多条字幕内容、以及每条字幕内容对应的音频内容。
在一种可能的实施方式中,在播放目标视频时,目标视频的展示页面中还可以展示有搜索框,即在目标视频模板中的搜索框位置处,展示指定样式的搜索框。
其中,搜索框中包括与目标多媒体内容关联的搜索信息,即搜索框中可以展示有与目标多媒体内容关联的推荐搜索内容;这里,推荐搜索内容可以为该目标多媒体内容对应的概要介绍信息、标题信息(也即锚点标题)等。
示例性的,若目标视频中包含推荐搜索内容,则在播放目标视频时,展示该目标视频中各视频帧分别对应的标题内容、字幕内容、图片内容、音频内容以及视频背景配乐、以及包含推荐搜索内容的搜索框;具体的目标视频播放时的展示页面可以如图2所示,以终端设备为手机为例,具体的展示页面中包括:在标题展示模块中展示的该目标视频的标题内容、以及在视频展示模块中展示的该目标视频的图片内容、以及在字幕展示模块中展示的该目标视频的字幕内容、以及携带有推荐搜索内容的搜索框,目标视频播放时的展示页面中还包括该目标视频的发布用户名称、以及目标视频的描述信息和配乐信息、以及用于指示关注该发布用户的关注按钮、以及点赞触发按钮、评论展示触发按钮、分享按钮、用户喜爱量、评论量。
在一种可能的实施方式中,当目标视频中展示有携带有推荐搜索内容的搜索框时,在用户触发搜索框中指示发起搜索的目标位置后,终端设备响应针对该搜索框的触发操作,可以直接在目标视频的展示页面上展示目标多媒体内容;也可以从目标视频的展示页面跳转到目标多媒体内容的展示页面。
示例性的,当用户对目标视频的展示页面中展示的搜索框中指示发起搜索的“搜索”按钮进行触发操作后,可以跳转到该目标视频对应的目标多媒体内容的展示页面,该展示页面中包括该目标多媒体内容的标题、该目标多媒体内容的作者名称、该目标多媒体内容的发布时间、以及该目标多媒体内容的详情内容、以及用于关注该目标多媒体内容的发布作者的关注按钮、以及用于对该目标多媒体内容进行点赞的点赞触发按钮、以及用于触发展示该目标多媒体内容对应的评论内容的评论展示触发按钮、以及用于收藏该目标多媒体内容的收藏按钮、以及用于分享该目标多媒体内容的分享按钮、以及点赞数量、评论数量,具体展示页面如图3所示,以终端设备为手机为例。
作为一种可选的实施方式,当用户对目标视频的展示页面中展示的搜索框中指示发起搜索的“搜索”按钮进行触发操作后,也可以直接在目标视频播放时的展示页面中展示目标多媒体内容,具体的展示页面可以如图4所示,以终端设备为手机为例,该展示页面中可以包括:目标视频的标题内容、目标视频的图片内容、目标视频的字幕内容、以及目标多媒体内容的详情内容、目标视频的发布用户名称、目标视频的描述信息、以及该目标视频选用的配乐信息、以及用于关注该目标视频的发布作者的关注按钮、以及用于对该目标视频进行点赞的点赞按钮、以及用于触发展示该目标视频对应的评论内容的评论展示触发按钮、以及用于分享该目标视频的分享按钮、以及用户喜爱量、评论量。
这里,终端设备在播放目标视频时,可以同步在目标视频的播放页面展示携带有推荐搜索内容的搜索框,以使用户在观看目标视频时,可以通过触发目标视频播放页面中展示的搜索框,获取到该目标视频对应的目标多媒体内容,这样,用户可以通过该目标多媒体内容,了解到该目标视频对应的事件的详情内容,从而提高了信息的获取效率,节约了获取信息的时间,同时提高了媒体内容资源的有效利用率。
在一种可能的实施方式中,目标多媒体内容是基于待生成视频的目标媒体信息确定的,即目标多媒体内容与待生成视频的目标媒体信息相匹配,具体的根据待生成视频的目标媒体信息,确定目标多媒体内容的方法可以参见下述步骤S701所示。
其中,目标媒体信息为描述热点事件的核心信息,可以包括热点事件的标题信息,也可以包括热点事件的描述信息,还可以包括热点事件的关键词信息。
在播放目标视频时,目标视频的展示页面中还可以展示有描述目标视频对应热点事件的核心信息。
其中,描述目标视频对应热点事件的核心信息可以包括热点事件的标题信息、热点事件的描述信息、热点事件的关键词信息中的至少一种,该核心信息可以与目标媒体信息相同,也可以不同。
示例性的,若目标视频中包含描述目标视频对应热点事件的核心信息,则在播放目标视频时,展示该目标视频中各视频帧分别对应的标题内容、图片内容、字幕内容、音频内容以及视频背景配乐、以及描述目标视频对应热点事件的核心信息的展示框;具体的目标视频播放时的展示页面可以如图5所示,以终端设备为手机为例,具体的展示页面包括:在标题展示模块中展示的该目标视频的标题内容、以及在视频展示模块中展示的该目标视频的图片内容、以及在字幕展示模块中展示的该目标视频的字幕内容、以及描述该目标视频对应热点事件的核心信息,目标视频播放时的展示页面中还包括该目标视频的发布用户名称、以及目标视频的描述信息和配乐信息、以及用于指示关注该发布用户的关注按钮、以及用于对该目标视频进行点赞的点赞触发按钮、以及用于触发展示该目标视频对应的评论内容的评论展示触发按钮、以及用于分享该目标视频的分享按钮、以及用户喜爱量、评论量。
在具体实施中,当目标视频中展示有描述目标事件对应的热点事件的核心信息时,在用户触发该核心信息后,终端设备响应针对该核心信息的触发操作,可以在目标视频的展示页面跳转到热点事件的聚合信息页面的展示页面。
这里,热点事件的聚合信息页面中包括与该热点事件对应的多个聚合维度、以及各聚合维度下的至少一个多媒体内容;其中,聚合维度可以包括事件相关百科、事件详情、事件当事人视角、事件评论中的一个或多个;聚合维度可以是基于目标聚类结果的属性信息确定的。
其中,属性信息中可以包含热点事件的事件类型信息;这里,事件类型可以包括娱乐类型、社会类型、民生类型、法律类型等多种。
比如,当热点事件的属性信息中包含的热点事件的事件类型信息为娱乐类型、且该热点事件涉及多个明星时,则该热点事件对应的聚合维度可以包含:每个明星的相关百科、该热点事件的事件详情、事件当事人视角、事件评论等。
具体的,当目标视频播放页面中展示有描述目标事件对应的热点事件的核心信息时,用户点击目标视频播放页面中展示的该核心信息后,终端设备响应用户针对该核心信息的点击操作,从服务器获取与该核心信息匹配的热点事件对应的聚合信息页面,并将包含多个聚合维度的聚合信息页面展示给用户。
示例性的,当用户对目标视频的展示页面中展示的描述该目标视频对应热点事件的核心信息的触发操作后,可以跳转到该目标视频对应的热点事件的聚合信息页面,若该热点事件对应的聚合维度包括:事件详情、事件当事人视角、事件评论;则该热点事件的聚合信息页面的具体展示页面可以为如图6所示,以终端设备为手机为例,具体的聚合信息页面的展示页面中可以包括:该热点事件的标题、该热点事件对应的事件缩略图、以及该热点事件的事件详情聚合维度、以及该事件详情聚合维度下包含的事件详情多媒体内容、该热点事件的事件当事人视角聚合维度、以及该事件当事人视角聚合维度下包含的多媒体内容、以及该热点事件的事件评论聚合维度、以及该事件评论聚合维度下包含的事件评论多媒体内容。
这里,终端设备在播放目标视频时,可以同步在目标视频的播放页面展示描述目标视频对应的热点事件的核心信息,以使用户在观看目标视频时,可以通过触发该核心信息,获取到该目标视频对应的热点事件的聚合信息页面,这样,用户可以根据该聚合信息页面中包含的多个聚合维度下的多个多媒体内容,获取到该目标视频对应的事件的详情内容,从而提高了信息的获取效率,节约了获取信息的时间,同时提高了媒体内容资源的有效利用率。
本公开实施例提供的视频展示方法,用户在打开视频推送页面时,可以直接获取到一些热度较高、时效性强、且较为重要的目标媒体信息对应的视频,可以让更多的用户关注到这些较为重要的媒体内容,从而提高媒体内容资源的有效利用率;终端设备在展示一些热度较高、时效性强且较为重要的目标媒体信息对应的视频,可以将携带有搜索推荐内容的搜索框同步展示给用户,用户可以通过触发目标视频中的搜索框,获取到该目标视频对应的目标多媒体内容;另外,终端设备在展示一些热度较高、时效性强且较为重要的目标媒体信息对应的视频,还可以将描述目标事件对应的热点事件的核心信息同步展示给用户,用户可以通过触发该核心信息,获取到目标视频对应的热点事件的聚合信息页面,从而获取到目标视频对应的事件详情信息;使得用户可以进一步阅读该目标视频对应的图文文本内容,实现了通过视频的形式,引导用户关注相关的图文文本多媒体内容资源。
实施例二
下面以执行主体为服务器为例对本公开实施例提供的一种视频生成方法加以说明。
参见图7所示,为本公开实施例提供的视频生成方法的流程图,所述方法包括步骤S701~S703,其中:
S701、获取待生成视频的目标媒体信息,确定与所述目标媒体信息匹配的目标多媒体内容。
其中,目标媒体信息用来表征描述热点事件的核心信息,可以包括热点事件的描述信息、热点事件的标题信息、热点事件的关键词信息中的至少一种;这里,热点事件为热度值大于预设热度值的事件;目标多媒体内容为与目标媒体信息对应的热点事件关联的多个多媒体内容,可以包括文本内容、图片内容、视频内容中的一项或多项。
这里,多媒体内容库中可以实时存储并更新各多媒体内容的相关信息,比如每个多媒体内容对应的标识信息(用于唯一标识对应多媒体内容,比如多媒体内容对应的作品名称)、所属事件类型、多媒体内容简介、关键词信息等;其中,所属事件类型可以包括国际类事件、社会类事件、财经类事件、科技类事件、法律类事件和娱乐类事件等。
本公开实施例是为了使更多用户能够浏览到有价值的信息,从而将以图文形式展示的信息转换为视频形式,增加了信息的展现形式,以使一些不太喜欢浏览图文内容的用户,可以通过视频获取到有价值的信息;这里,一般热点事件的信息阅读价值较高,且当前一些热点事件是通过图文形式展示给用户的,这样就会导致一些不太喜欢浏览图文内容的用户,无法及时获取到热点事件的相关信息,因此,可以将热点事件对应的多媒体内容转换为视频,从而增加热点事件的信息展现形式,使一些不太喜欢浏览图文多媒体内容的用户可以通过视频及时获取到热度较高的事件的相关信息。
因此,可以在多个热点事件中,根据各热点事件的事件属性信息,选取待生成视频的目标热点事件,并通过步骤S701~S703生成该目标热点事件对应的目标视频,这里,可以将目标事件对应的热点媒体信息,作为待生成视频的目标媒体信息,具体的可以通过下述方法确定待生成视频的目标热点事件、以及该目标热点事件的目标媒体信息,具体描述如下:服务器可以获取来自至少一个热点来源渠道的多个热点媒体信息;根据该热点媒体信息描述的热点事件的事件属性信息,确定待生成视频的目标热点事件的目标媒体信息。
其中,热点来源渠道可以包括热点推送渠道、热搜渠道、热榜渠道中的至少一种,且热点推送渠道、热搜渠道、以及热榜渠道中均展示有多个热点事件分别对应的热点媒体信息。
这里,热点媒体信息用来描述热点事件,不同热点来源渠道中展示的热点媒体信息的类型可以相同,也可以不同;其中,热点媒体信息的类型可以包括热点事件对应的关键词信息、热点事件的标题信息、以及热点事件的描述信息中的至少一种;比如,当热点来源渠道为热点推送渠道时,则可以将各热点事件的描述信息作为该热点推送渠道中展示的热点媒体信息,即该热点推送渠道中可以展示有每个热点事件分别对应的描述信息;当热点来源渠道为热搜渠道时,则可以将各热点事件的关键词信息作为该热搜渠道中展示的热点媒体信息,即该热搜渠道中可以展示有各热点事件分别对应的关键词信息;当热点来源渠道为热榜渠道时,则可以将各热点事件的标题信息、或各热点事件的关键词信息作为该热榜渠道中展示的热点媒体信息,即该热榜渠道中可以展示有各热点事件分别对应的标题信息、或各热点事件分别对应的关键词信息。
其中,事件属性信息可以包括事件关注度、事件类型中的至少一种;这里,事件关注度是基于用户交互数据计算出来的;其中,用户交互数据可以包括用户的浏览量、用户的点赞量、用户的评论量等;事件类型可以包括国际类事件、社会类事件、财经类事件、科技类事件、法律类事件和娱乐类事件等。
具体的,在获取到热点推送渠道、热搜渠道以及热榜渠道中展示的多个热点事件分别对应的热点媒体信息后,可以根据各热点媒体信息描述的热点事件的事件关注度和事件类型,从多个热点媒体信息分别对应的多个热点事件中,选取事件关注度大于预设事件关注度阈值的第一热点事件,和/或选取事件类型符合预设视频生成事件类型的第二热点事件,并将上述选取的第一热点事件和/或第二热点事件作为目标热点事件,将该目标热点事件对应的热点媒体信息作为目标媒体信息。
在具体实施中,在确定待生成视频的目标热点事件的目标媒体信息之后,可以通过下述方法确定与该目标媒体信息匹配的目标多媒体内容,具体描述如下:获取与该目标媒体信息对应的目标热点事件关联的多个多媒体内容;基于多个多媒体内容的属性信息,从多个多媒体内容中选择与该目标媒体信息匹配的目标多媒体内容。
其中,多媒体内容的属性信息可以包括该多媒体内容与事件之间的匹配度、该多媒体内容对应的用户关注度、该媒体内容中是否包含图文内容中的至少一种;这里,可以通过提取目标媒体信息对应的第一关键词,并提取多媒体内容对应的第二关键词,计算第一关键词与第二关键词的相似度,从而确定该多媒体内容与事件之间的匹配度;这里,可以通过分析多媒体内容的用户评论量、用户浏览量、用户点赞量等用户交互数据,确定该多媒体内容对应的用户关注度。
具体的,提取目标媒体信息对应的第一关键词,基于该目标媒体信息的第一关键词,确定与该第一关键词语义相似的第三关键词;将第一关键词与第三关键词作为目标关键词;计算多媒体内容库中,各多媒体内容对应的第二关键词与该目标关键词之间的匹配度;提取匹配度大于第一预设匹配度阈值的多媒体内容,作为与该目标媒体信息对应的目标热点事件关联的多个多媒体内容;基于上述提取到的多个多媒体内容中各多媒体内容与该目标热点事件之间的匹配度、各多媒体内容对应的用户关注度、以及每个媒体内容中是否包含图文内容等属性信息,从多个多媒体内容中,选取匹配度大于第二预设匹配度阈值的第一多媒体内容,和/或选取用户关注度大于预设用户关注度阈值的第二多媒体内容,和/或选取包含图文内容的第三多媒体内容;将第一多媒体内容、和/或第二多媒体内容、和/或第三多媒体内容作为与目标媒体信息匹配的目标多媒体内容。
在具体实施中,在基于S701获取到待生成视频的目标媒体信息,并确定与该目标媒体信息匹配的目标多媒体内容之后,可以通过步骤S702为该目标多媒体内容匹配对应的目标视频模板,具体描述如下步骤S702所示。
S702、根据所述目标多媒体内容确定目标视频模板。
这里,预先设置多种类型的视频模板,可以包括国际类视频模板、社会类视频模板、财经类视频模板、科技类视频模板、法律类视频模板和娱乐类视频模板等。一般国际类视频模板、社会类视频模板、财经类视频模板、科技类视频模板、法律类视频模板对应的情绪属性标签为中性情绪,娱乐类视频目标对应的情绪属性标签为积极情绪。
具体的视频模板的展示页面可以为如图8所示,以视频模板为娱乐类视频模板为例;一般各类视频模板中均包括各视频帧的排版布局、字幕的音色属性信息、以及背景配乐;其中,不同类型的视频模板中包括的各视频帧的排版布局可以相同,也可以不同;一般各视频帧的排版布局中可以包括:用于展示各视频帧对应的图片内容的视频展示模块,和用于展示目标视频的标题内容的标题展示模块,和用于展示各视频帧对应的字幕内容的字幕展示模块,以及多个展示模板之间的位置关系,以及各展示模块的背景颜色,以及各展示模块的背景图片,以及标题展示模块中展示的标题内容的标题字体、标题颜色、标题展示尺寸、标题透明度、以及标题内容的缩放动效,以及视频展示模块展示的图片内容的动画特效,以及字幕展示模块展示的字幕内容的字幕字体、字幕颜色、字幕展示尺寸、字幕透明度、以及字幕内容的缩放动效,以及指定样式的挂件中的至少一种。
这里,指定样式的挂件可以包括指定样式的搜索框(这里,搜索框中展示有与目标多媒体内容关联的推荐搜索内容;其中,推荐搜索内容是基于与目标媒体信息匹配的目标多媒体内容确定的,可以为该目标多媒体内容对应的概要介绍信息、标题信息、关键词信息中的至少一种)和用于展示描述目标视频对应的热点事件的核心信息的展示框(这里,描述目标视频对应的热点事件的核心信息是基于目标媒体信息确定的,可以为热点事件的标题信息、热点事件的描述信息、以及热点事件对应的关键词信息中的至少一种)中的至少一种;其中,指定样式可以为气泡形状、云朵形状等多种形状、款式。
这里,字幕的音色属性信息可以包括字幕的发音音色;字幕的发音音色可以包括沉稳男声、轻快女声、轻快男声、沉稳女声、童声等多种类型音色中的至少一种;不同类型的视频模板对应的字幕发音音色可以相同,也可以不同;比如,娱乐类视频模板对应的字幕发音音色一般为轻快女声;国际类视频模板对应的字幕发音音色一般为沉稳男声。
这里,背景配乐可以包括欢快类音乐、低沉类音乐、轻缓类音乐、沉稳类音乐等多种类型的音乐中的至少一种;不同类型的视频模板对应的背景配乐可以相同,也可以不同;比如,娱乐类视频模板对应的背景配乐一般为欢快类音乐;国际类视频模板对应的背景配乐一般为沉稳类音乐。
在具体实施中,在基于步骤S701确定目标媒体信息匹配的目标多媒体内容之后,可以根据该目标多媒体内容的类别标签,和/或,该目标多媒体内容对应的目标情绪属性标签,确定与该目标多媒体内容匹配的视频模板内容。
这里,可以根据目标多媒体内容所属事件类型,确定目标多媒体内容的类别标签;其中,类别标签可以包括国际类、社会类、财经类、科技类、法律类和娱乐类等,比如,当目标多媒体内容所属事件类型为国际类,则该目标多媒体内容的类别标签为国际类;当目标多媒体内容所属事件类型为娱乐类,则该目标多媒体内容的类别标签为娱乐类;当目标目标多媒体内容所属事件类型为社会类,则该目标多媒体内容的类别标签为社会类;目标多媒体内容所属事件类型为财经类,则该目标多媒体内容的类别标签为财经类。
在一种可能的实施方式中,可以根据目标多媒体内容的类别标签,在预先设置的多种类型的视频模板中,选取与目标多媒体内容的类别标签对应的视频模板,从而确定与该目标多媒体内容匹配的视频模板内容;比如,当目标多媒体内容的类别标签为国际类时,则确定与该目标多媒体内容匹配的视频模板为国际类视频模板,并将国际类视频模板对应的各视频帧的排版布局、字幕的音色属性信息、以及背景配乐作为与该目标多媒体内容匹配的视频模板内容;当目标多媒体内容的类别标签为娱乐类时,则确定与该目标多媒体内容匹配的视频模板为娱乐类视频模板;并将娱乐类视频模板对应的各视频帧的排版布局、字幕的音色属性信息、以及背景配乐作为与该目标多媒体内容匹配的视频模板内容。
其中,情绪属性标签可以包括积极情绪、中性情绪、消极情绪等多种情绪中的至少一种。
这里,可以根据以下步骤确定目标多媒体内容对应的目标情绪属性标签,具体描述如下:可以根据该目标多媒体内容的类别标签,和/或,该目标多媒体内容与各情绪属性标签对应的参考内容之间的匹配度,确定该目标多媒体内容对应的目标情绪属性标签。
这里,可以基于目标多媒体内容的类别标签,确定该目标多媒体内容的情绪属性标签;比如,一般国际类、社会类、财经类、科技类、法律类的多媒体内容的情绪属性标签为中性情绪,一般娱乐类多媒体内容的情绪属性标签为积极情绪。
其中,各情绪属性标签对应的参考内容可以包括:积极情绪对应的参考内容、中性情绪对应的参考内容以及消极情绪对应的参考内容等;这里,积极情绪对应的参考内容可以包括:庆祝、欢迎、祝福等关键词,消极情绪对应的参考内容可以包括悼念、哀悼等关键词。
这里,还可以通过自然语言处理技术,对目标多媒体内容进行语义分析,确定目标多媒体内容的情绪关键词,并分析该情绪关键词与各情绪属性标签对应的参考内容之间的语义相似度,当语义相似度大于预设语义相似度阈值时,则将该情绪属性标签作为该目标多媒体内容对应的目标情绪属性标签。
具体的,可以根据目标多媒体内容的类别标签、以及该目标多媒体内容对应的目标情绪属性标签,在预先设置的多种类型的视频模板中选择与该目标多媒体内容的类别、以及该目标多媒体内容对应的目标情绪属性标签匹配的视频模板;将该视频模板对应的各视频帧的排版布局、字幕的音色属性信息、以及背景配乐作为与该目标多媒体内容匹配的视频模板内容。
比如,当目标多媒体内容为:“某某明星被拍过夜,女方回应:朋友聚会”的娱乐类多媒体内容时,则可以根据该目标多媒体的类别标签:娱乐类,在预先设置的多种类型的视频模板中,选取娱乐类视频模板作为与该目标多媒体内容匹配的视频模板,该娱乐类视频模板中可以包括各视频帧的排版布局、音色属性信息、以及背景配乐;具体的展示页面可以为如图8所示,以终端设备为手机为例,具体的展示页面中可以包括:位于中部的用于展示各视频帧对应的图片内容的视频展示模块,和位于顶部的用于展示目标视频的标题内容的标题展示模块,和位于底部的用于展示各视频帧对应的字幕内容的字幕展示模块,以及各展示模块的背景颜色:白色,以及标题展示模块中展示的标题内容的标题字体:宋体、标题内容颜色:黑色、标题字号:小四号,以及字幕展示模块展示的字幕内容的字幕字体:宋体、字幕内容颜色:黑色、字幕字号:小四号,以及包含推荐搜索内容的搜索框,以及背景配乐:轻快音乐、以及字幕内容的发音音色:轻快女声。
在具体实施中,在基于S702确定与该目标多媒体内容匹配的目标视频模板后,可以通过步骤S703,基于目标多媒体内容以及该目标视频模板,生成该目标媒体信息对应的目标视频,具体描述如下步骤S703所示。
S703、基于所述目标视频模板和所述目标多媒体内容,生成所述目标媒体信息对应的目标视频。
其中,目标多媒体内容可以包括文本内容、图片内容、视频内容中的一项或多项。
在具体实施中,可以基于目标多媒体内容确定目标文本内容和目标图片内容,将目标文本内容和目标图片内容分别***目标视频模板中对应展示模块位置处,得到若干目标视频帧。
其中,目标视频模板中对应展示模块可以包括:标题展示模块、和视频展示模块、以及字幕展示模块;这里,标题展示模块用于展示目标视频的标题内容,视频展示模块用于展示目标视频的图片内容,字幕展示模块用于展示目标视频的字幕内容。
这里,目标文本内容可以包括:标题内容和和字幕内容。
在具体实施中,可以确定目标多媒体内容对应的目标文本内容,以及与目标文本内容匹配的至少一张目标图片内容;并基于确定的目标文本内容、以及至少一张目标图片内容、以及目标视频模板中的文本内容展示区域可展示的文本字符数,确定在若干视频帧中的每帧视频帧中的一张目标图片内容及其对应的目标文本内容;将确定的每帧视频帧中的一张目标图片内容及其对应的目标文本内容分别***目标视频模板中对应展示模块位置处。
具体的,若与目标媒体信息匹配的目标多媒体内容中仅包括文本内容,则可以基于标题展示模块可展示的标题字符数,在多个目标多媒体内容分别对应的标题内容中,选取目标标题内容;按照预设的最大字幕字符数,通过自然语言处理技术(Natural LanguageProcessing,NLP),对目标多媒体内容进行语义分析,从目标多媒体内容中提取表征该目标多媒体内容的事件起因、事件经过等概要内容,并将上述概要内容作为字幕内容,按照字幕展示模块可展示的字幕字符数,将字幕内容进行拆分,得到多条目标字幕内容;提取各条目标字幕内容的关键词信息,基于该关键词信息,在预先标注关键词信息的图片内容库中,获取与各条目标字幕内容匹配的目标图片内容;基于目标标题内容、多条目标字幕内容、以及与各条目标字幕内容分别匹配的目标图片内容,确定目标视频中每帧视频帧中包括的目标标题内容、目标字幕内容以及与目标字幕内容匹配的目标图片内容,将确定的每帧视频帧中的目标标题内容***到目标视频模板中对应的标题展示模块中,并将确定的每帧视频帧中的目标字幕内容***到目标视频模板中对应的字幕展示模块中,并将确定的每帧视频帧中与目标字幕内容匹配的目标图片内容***到目标视频模板中对应的视频展示模块中。
具体的,若与目标媒体信息匹配的目标多媒体内容中仅包括图片内容或视频内容时(这里,需要说明的是,当目标媒体内容为视频内容时,在生成目标视频时仅需要视频内容中的视频帧,而视频帧本质上是一张张图片,因此可以将视频内容作为图片内容的一种表现形式),则可以对图片内容进行图像算法处理,基于图像算法处理结果,选取图片内容中包含的图像信息大于预设图像信息阈值的多张图片作为目标图片内容;对目标图片内容进行语义分析,基于语义分析结果,在多媒体内容库中,选取与该语义分析结果匹配的目标文本内容,可以基于标题展示模块可展示的标题字符数,基于目标文本内容的标题,确定目标标题内容;按照预设的最大字幕字符数,通过自然语言处理技术NLP,对目标文本内容进行语义分析,从目标文本内容中提取表征该目标文本内容的事件起因、事件经过等概要内容,并将上述概要内容作为字幕内容,按照字幕展示模块可展示的字幕字符数,将字幕内容进行拆分,得到与目标图片内容匹配的多条目标字幕内容;基于多张目标图片内容、目标标题内容、以及多条目标字幕内容,确定目标视频中每帧视频帧中包括的目标标题内容、目标图片内容、以及目标图片内容对应的目标字幕内容,将确定的每帧视频帧中的目标标题内容***到目标视频模板中对应的标题展示模块中,并将确定的每帧视频帧中的目标图片内容***到目标视频模板中对应的视频展示模块中,并将确定的每帧视频帧中目标图片内容对应的目标字幕内容***到目标视频模板中对应的视频展示模块中。
具体的,若与目标媒体信息匹配的目标多媒体内容中包括文本内容和图片内容时,可以基于标题展示模块可展示的标题字符数,在文本内容对应的标题内容中,确定目标标题内容;通过NLP,对文本内容进行语义分析,从文本内容中提取表征事件起因、事件经过等概要内容,并将上述概要内容作为字幕内容,按照字幕展示模块可展示的字幕字符数,将字幕内容进行拆分,得到多条目标字幕内容;对各条目标字幕内容和图片内容进行语义分析,确定与各条字幕内容分别匹配的目标图片内容;基于目标标题内容、多条目标字幕内容、以及与各条目标字幕内容分别匹配的目标图片内容,确定目标视频中每帧视频帧中包括的目标标题内容、目标字幕内容以及与目标字幕内容匹配的目标图片内容,将确定的每帧视频帧中的目标标题内容***到目标视频模板中对应的标题展示模块中,并将确定的每帧视频帧中的目标字幕内容***到目标视频模板中对应的字幕展示模块中,并将确定的每帧视频帧中与目标字幕内容匹配的目标图片内容***到目标视频模板中对应的视频展示模块中。
这里,目标文本内容还包括:推荐搜索内容或描述目标视频对应的热点事件的核心信息。
在具体实施中,在将确定的每帧视频帧中的一张目标图片内容、及其目标标题内容、以及目标字幕内容分别***目标视频模板中对应展示模块位置处之后,可以对目标多媒体内容、用户在浏览目标多媒体内容后的评论内容、以及用户在浏览目标多媒体内容后的搜索内容进行语义分析,确定每帧目标视频帧对应的推荐搜索内容;在确定每帧目标视频帧对应的推荐搜索内容后,可以将上述每帧目标视频帧对应的推荐搜索内容***到目标视频模板中的搜索框中,以使用户在观看该目标视频过程中,可以能够通过点击搜索框,获取到该目标视频对应的目标多媒体内容。
这里,目标多媒体内容对应的推荐搜索内容可以包括目标多媒体内容对应的概要介绍信息、目标多媒体内容的标题信息、目标多媒体内容对应的关键词信息中的至少一种。
在一种可能的实施方式中,在将确定的每帧视频帧中的一张目标图片内容、及其目标标题内容、以及目标字幕内容分别***目标视频模板中对应展示模块位置处之后,还可以基于目标多媒体内容对应的目标媒体信息、以及目标视频对应的热点事件的标题信息、以及目标视频对应的热点事件的描述信息、以及目标视频对应的热点事件的关键词信息,确定每帧目标视频帧对应的描述目标视频对应的热点事件的核心信息;在确定每帧目标视频帧对应的描述目标视频对应的热点事件的核心信息之后,可以将上述每帧目标视频帧对应的描述目标视频对应的热点事件的核心信息***到目标视频模板中的展示描述目标视频对应的热点事件的核心信息的展示框中,以使用户在观看该目标视频过程中,可以能够通过点击该展示框,获取到该目标视频对应的热点事件的聚合信息页面。
在具体实施中,在将确定的每帧视频帧中的一张目标图片内容及其对应的目标文本内容分别***所述目标视频模板中对应展示模块位置处,得到若干目标视频帧后,可以根据目标视频模板对应的音频元素以及各目标视频帧中的目标文本内容,生成各目标视频帧的音频。
其中,音频元素可以包括视频背景配乐和/或视频字幕的音色属性信息;这里,视频背景配乐可以包括欢快的音乐、低沉的音乐、轻缓的音乐等多种类型音乐中的至少一种;视频字幕的音色属性信息可以包括视频字幕的发音音色;其中,发音音色可以包括沉稳男声、轻快女声、童声等多种发音音色中的至少一种。
在音频元素包括视频字幕的音色属性信息的情况下,则可以基于该音色属性信息以及基于上述方法确定的目标字幕内容,生成目标字幕内容对应的音频内容;配置音频内容的播放时间和目标字幕内容的展示时间,使得对应同一内容的音频内容的播放时间和目标字幕内容的展示时间相同。
具体的,在视频模板内容中指示的音频元素包括字幕的发音音色的情况下,基于该发音音色,通过从文本到语音(Text To Speech,TTS)技术,将确定的目标字幕内容转换为音频内容,并配置音频内容的播放时间与目标字幕内容的展示时间,使音频内容以及该音频内容对应的目标字幕内容的播放进度对齐,以使在播放目标视频时,目标字幕内容与该目标字幕内容对应的音频内容能够同步播放。
在具体实施中,在基于上述方法生成每帧目标视频帧中包含的目标字幕内容对应的音频内容之后,可以根据每帧目标视频帧的音频内容的播放时间或目标字幕内容的展示时间,配置目标视频中与每帧目标视频对应的背景配乐的播放时间。
基于上述步骤S703确定目标视频包括的若干目标视频帧中每帧目标视频帧对应的目标标题内容、和目标字幕内容、以及与目标字幕内容匹配的目标图片内容、以及推荐搜索内容(或描述目标视频对应的热点事件的核心信息)、以及目标字幕内容对应的音频内容、以及背景配乐,从而生成目标媒体信息对应的目标视频。
示例性的,当根据步骤S701获取待生成的目标媒体信息为:某某男星暴瘦10斤;基于步骤S701确定的与该目标媒体信息匹配的目标多媒体内容包括:图片内容1、图片内容2、图片内容3、图片内容4、文本内容5;在确定与目标媒体信息匹配的目标多媒体内容之后,可以根据步骤S702基于目标多媒体内容对应的类别标签:娱乐类、以及目标多媒体内容对应的目标情绪属性标签:积极情绪,确定该目标多媒体内容对应的目标视频模板为:娱乐类视频模板,将娱乐类视频模板中包括的各帧视频的排版布局(即位于中部的用于展示各视频帧对应的图片内容的视频展示模块,和位于顶部的用于展示目标视频的标题内容的标题展示模块,和位于底部的用于展示各视频帧对应的字幕内容的字幕展示模块,以及各展示模块的背景颜色:白色,以及标题展示模块中展示的标题内容的标题字体:宋体、标题内容颜色:黑色、标题字号:小四号,以及字幕展示模块展示的字幕内容的字幕字体:宋体、字幕内容颜色:黑色、字幕字号:小四号,以及气泡样式的搜索框(该搜索框中包含推荐搜索内容的))、音色属性信息(即字幕内容的发音音色:轻快女声)、以及背景配乐(即轻快音乐)作为与目标多媒体内容匹配的视频模板内容。
在确定目标多媒体内容匹配的目标视频模板之后,可以根据步骤S703基于上述确定目标视频模板、以及上述确定的目标多媒体内容,生成目标媒体信息对应的目标视频,具体生成目标视频的步骤如下所示:可以基于目标视频模板(即娱乐类视频模板)中的标题展示模块可展示的标题字符数,对文本内容5的标题或文本内容5的关键词信息进行处理,确定目标视频的目标标题内容;通过NLP,对文本内容5进行语义分析,从文本内容5中提取表征事件起因、事件经过等概要内容,并将上述概要内容作为字幕内容,按照娱乐类视频模板中字幕展示模块可展示的字幕字符数,将字幕内容进行拆分,得到目标视频的4条目标字幕内容(即目标字幕内容1、目标字幕内容2、目标字幕内容3、目标字幕内容4);对各条目标字幕内容和图片内容1、图片内容2、图片内容3、图片内容4进行语义分析,确定与目标字幕内容1匹配的目标图片内容为:图片内容1,确定与目标字幕内容2匹配的目标图片内容为:图片内容2,确定与目标字幕内容3匹配的目标图片内容为:图片内容3,确定与目标字幕内容4匹配的目标图片内容为:图片内容4;在确定各条目标字幕内容分别对应的目标图片内容之后,基于目标标题内容、多条目标字幕内容、以及与各条目标字幕内容分别匹配的目标图片内容,确定目标视频中每帧视频帧中包括的目标标题内容、目标字幕内容以及与目标字幕内容匹配的目标图片内容(即第一帧视频帧中包括:目标标题内容、目标字幕内容1、目标图片内容1,第二帧视频帧中包括:目标标题内容、目标字幕内容2、目标图片内容2,第三帧视频帧中包括:目标标题内容、目标字幕内容3、目标图片内容3,以及第四帧视频帧中包括:目标标题内容、目标字幕内容4、目标图片内容4),将确定的每帧视频帧中的目标标题内容***到目标视频模板中对应的标题展示模块中,并将确定的每帧视频帧中的目标字幕内容***到目标视频模板中对应的字幕展示模块中,并将确定的每帧视频帧中与目标字幕内容匹配的目标图片内容***到目标视频模板中对应的视频展示模块中。
在将确定的每帧视频帧中的目标图片内容及其对应的目标字幕内容、及其目标标题内容分别***目标视频模板中对应展示模块位置处后,可以提取文本内容5的标题信息和文本内容5对应的关键词信息、和用户在浏览文本内容5后的评论内容、以及用户在浏览文本内容5后的搜索内容,并对提取的文本内容5的标题信息和关键词信息、和评论内容、以及搜索内容进行分析,生成每帧目标视频帧对应的推荐搜索内容:某某男星暴瘦10斤,并将该每帧目标视频帧对应的推荐搜索内容***到娱乐类视频模板中的气泡样式的搜索框中,从而得到若干目标视频帧。
在得到若干目标视频帧之后,可以根据娱乐类视频模板对应的音频元素(即字幕内容的发音音色:轻快女声、以及背景配乐:轻快音乐)和各目标视频帧中的目标字幕内容,生成各目标视频帧的音频,具体描述如下:基于该轻快女声的发音音色,通过TTS技术,将确定的每帧目标视频帧中的目标字幕内容分别转换为对应的音频内容,并配置每帧目标视频帧中目标字幕内容对应音频内容的播放时间与该目标字幕内容的展示时间,使音频内容以及该音频内容对应的目标字幕内容的播放进度对齐;并根据每帧目标视频帧的音频内容的播放时间或目标字幕内容的展示时间,配置目标视频中与每帧目标视频对应的背景配乐:轻快音乐的播放时间,从而生成各目标视频帧的音频。
基于上述方法得到若干目标视频帧,并得到各目标视频帧对应的音频之后,从而生成目标媒体信息:某某男星暴瘦10斤对应的目标视频。
在具体实施中,在基于目标视频模板和目标多媒体内容,生成目标媒体信息对应的目标视频之后,可以使用短视频引擎(Vision Engine,VE)将上述目标视频渲染为可以在视频软件中播放的视频。
在具体实施中,通过VE引擎将目标视频渲染为可播放的视频后,将该视频自动送入到审核平台,审核人员对该视频的标题内容、字幕内容、图片内容、音频等内容进行人工审核,具体需要人工审核的内容一般可以包括:字幕内容是否通顺、图片内容的清晰程度以及图片内容与字幕内容的匹配度、视频描述的事件的流畅程度以及可理解程度、音频内容中人声读音的准确程度以及流畅度、该视频是否符合视频平台发布规范;如果审核人员判定该视频审核通过后,会将该视频发布到视频平台中该目标多媒体内容的发布作者的账户下;若审核人员判定该视频未通过审核后,则会对该视频中不合格的内容进行进一步优化,来提高视频的审核通过率。
这里,如果确定该视频的音频内容读音不流畅或遇到多音字读错时,则可以设置相应的音频读词规则,比如,若视频中的字幕内容包含的信息为“19岁”,音频内容会将“19”拆开读,读成一、九,这里审核人员将该视频作为不合格视频,服务器会根据预设的读音规则中的“若数字表征的为年龄时,则不能拆开读的规则”,对该视频中的音频内容进行优化,并将优化后的视频再次进行人工审核,确定是否能够发布该视频内容。
在具体实施中,可以将审核通过的视频按照预设的至少一种分发方式推送给终端设备。
其中,分发方式可以包括热榜、热搜、信息流推送、搜索等;这里,信息流推送为根据前端工程设计(Front End Engineering Design,FEED)技术,将目标视频进行分析,得到能够以信息流的呈现方式呈现在页面上的聚合卡片,并将该聚合卡片推送给终端设备的发布方式;这里,聚合卡片中可以包括图片、文本等;这里,信息流为FEED流,即将目标视频以流的呈现方式在页面上呈现。
具体的,可以将审核通过的目标视频按照热榜的分发方式发送给用户,用户可以在热榜榜单中获取到该目标视频对应的热点事件的核心信息(该核心信息可以包括:热点事件的描述信息、目标媒体信息、与目标媒体信息匹配的目标多媒体内容的标题信息、热点事件对应的关键词信息中的至少一种),当用户触发该核心信息后,可以将目标视频展示给用户;还可以在信息流中展示该目标视频对应的聚合卡片,当用户点击信息流中该目标视频对应的聚合卡片后,可以将目标视频展示给用户;还可以通过反馈搜索结果的方式,将目标视频发送给用户,当用户发起针对该目标视频对应的热点事件的相关信息的搜索时,可以将该目标视频作为搜索结果返回给用户。
在具体实施中,在将该视频发布到视频平台中该目标多媒体内容的发布作者的账户下之后,可以对该视频在最近时间段内的点赞量、评论量、转发量等互动指标数据进行统计,确定该视频是否可以作为热点/热搜媒体内容;也可以根据运营人员对该视频未来一段时间的点赞量、评论量、转发量等互动指标数据、以及热度增长趋势的判断,确定是否将该视频作为热点/热搜媒体内容;当该视频在最近时间段内的点赞量、评论量、转发量等互动指标数据大于预设指标数据阈值,或者运营人员判断该视频的热度增长趋势大于预设增长趋势阈值时,则将该视频作为热点/热搜媒体内容,以扩大视频对应的该热点事件信息的传播范围和影响力。
本公开实施例提供的视频生成方法,可以在获取到想向用户展示的目标媒体信息后,通过搜索与该目标媒体信息匹配的目标多媒体内容,来生成目标视频;采用这种方式,可以在产生有价值的目标媒体信息后,及时自动转换为目标视频,用户可以获取到视频形式的时效性较强的媒体内容,提高了用户获取到时效性较高的媒体内容的机会,尤其对于一些喜爱刷视频的用户,可以在打开的视频推送页面中及时获取到这些媒体内容,进而提高了媒体内容资源的有效利用率。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
基于同一发明构思,本公开实施例中还提供了与视频展示、生成方法对应的视频展示、生成装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述视频展示、生成方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
实施例三
参照图9所示,为本公开实施例提供的一种视频展示装置900的示意图,所述装置包括:响应模块901和展示模块902;其中,
响应模块901,用于响应触发操作,获取基于目标多媒体内容生成的目标视频;其中,所述目标多媒体内容包括文本内容、图片内容、视频内容中的一项或多项。
展示模块902,用于展示所述目标视频;其中,所述目标视频的各视频帧包括从所述目标多媒体内容中提取的目标图片内容和目标文本内容。
在一种可能的实施方式中,所述目标视频上展示有搜索框;所述搜索框中包括与所述目标多媒体内容关联的搜索信息;展示模块902,还用于响应针对所述搜索框的触发操作,展示所述目标多媒体内容。
在一种可能的实施方式中,所述目标多媒体内容与待生成视频的目标媒体信息相匹配。
在一种可能的实施方式中,所述目标视频上展示有描述所述目标视频对应热点事件的核心信息;展示模块902,还用于响应针对所述核心信息的触发操作,展示所述热点事件对应的聚合信息页面。
本公开实施例提供的视频展示方法,用户在打开视频推送页面时,可以直接获取到一些热度较高、时效性强、且较为重要的目标媒体信息对应的视频,可以让更多的用户关注到这些较为重要的媒体内容,从而提高媒体内容资源的有效利用率;终端设备在展示一些热度较高、时效性强且较为重要的目标媒体信息对应的视频,可以将携带有搜索推荐内容的搜索框同步展示给用户,用户可以通过触发目标视频中的搜索框,获取到该目标视频对应的目标多媒体内容;另外,终端设备在展示一些热度较高、时效性强且较为重要的目标媒体信息对应的视频,还可以将描述目标事件对应的热点事件的核心信息同步展示给用户,用户可以通过触发该核心信息,获取到目标视频对应的热点事件的聚合信息页面,从而获取到目标视频对应的事件详情信息;使得用户可以进一步阅读该目标视频对应的图文文本内容,实现了通过视频的形式,引导用户关注相关的图文文本多媒体内容资源。
实施例四
参照图10所示,为本公开实施例还提供的一种视频生成装置1000的示意图,所述装置包括:获取模块1001、确定模块1002和生成模块1003;其中,
获取模块1001,用于获取待生成视频的目标媒体信息,确定与所述目标媒体信息匹配的目标多媒体内容;其中,所述目标多媒体内容包括文本内容、图片内容、视频内容中的一项或多项。
确定模块1002,用于根据所述目标多媒体内容确定目标视频模板。
生成模块1003,用于基于所述目标视频模板和所述目标多媒体内容,生成所述目标媒体信息对应的目标视频。
在一种可能的实施方式中,获取模块1001,具体用于获取来自至少一个热点来源渠道的多个热点媒体信息;所述热点媒体信息用于描述热点事件;根据所述热点媒体信息描述的热点事件的事件属性信息,确定目标媒体信息。
在一种可能的实施方式中,获取模块1001,具体用于获取与所述目标媒体信息对应的目标热点事件关联的多个多媒体内容;基于所述多个多媒体内容的属性信息,从所述多个多媒体内容中选择与所述目标媒体信息匹配的目标多媒体内容。
在一种可能的实施方式中,确定模块1002,具体用于根据所述目标多媒体内容的类别标签,和/或,所述目标多媒体内容对应的目标情绪属性标签,确定与所述目标多媒体内容匹配的视频模板内容。
在一种可能的实施方式中,确定模块1002,具体用于根据所述目标多媒体内容的类别标签,和/或,所述目标多媒体内容与各情绪属性标签对应的参考内容之间的匹配度,确定所述目标多媒体内容对应的目标情绪属性标签。
在一种可能的实施方式中,生成模块1003,具体用于基于所述目标多媒体内容确定目标文本内容和目标图片内容,将所述目标文本内容和目标图片内容分别***所述目标视频模板中对应展示模块位置处,得到若干目标视频帧;根据所述目标视频模块对应的音频元素以及各所述目标视频帧中的所述目标文本内容,生成各所述目标视频帧的音频;所述音频元素包括视频背景配乐和/或视频字幕的音色属性信息;基于若干所述目标视频帧以及各所述目标视频帧对应的音频,生成所述目标媒体信息对应的目标视频。
在一种可能的实施方式中,生成模块1003,具体用于确定所述目标多媒体内容对应的目标文本内容,以及与所述目标文本内容匹配的至少一张目标图片内容;基于所述目标文本内容、至少一张目标图片内容、以及所述目标视频模板中的文本内容展示区域可展示的文本字符数,确定在若干视频帧中的每帧视频帧中的一张目标图片内容及其对应的目标文本内容;将确定的每帧视频帧中的一张目标图片内容及其对应的目标文本内容分别***所述目标视频模板中对应展示模块位置处。
在一种可能的实施方式中,生成模块1003,具体用于若所述目标多媒体内容中包括文本内容,从所述文本内容中提取用于描述所述目标媒体信息对应的热点事件的目标文本内容,并基于所述目标文本内容,搜索得到与所述目标文本内容匹配的目标图片内容;若所述目标多媒体内容中包括图片内容,从所述图片内容中选取至少一张与所述目标媒体信息对应的热点事件匹配的所述目标图片内容,并基于所述目标图片内容,搜索得到与所述目标图片内容匹配的所述目标文本内容;若所述目标多媒体内容中包括文本内容和图片内容,从所述文本内容和图片内容中分别提取用于描述所述目标媒体信息对应的热点事件的所述目标文本内容和与所述目标媒体信息对应的热点事件匹配的所述目标图片内容。
在一种可能的实施方式中,在所述音频元素包括视频字幕的音色属性信息的情况下,生成模块1003,具体用于基于所述音色属性信息、以及所述目标文本内容,生成所述目标文本内容对应的音频内容;配置所述音频内容的播放时间和所述目标文本内容的展示时间,使得对应同一内容的所述音频内容的播放时间和所述目标文本内容的展示时间相同。
在一种可能的实施方式中,在所述音频元素还包括视频背景配乐的情况下,生成模块1003,具体用于根据若干所述目标视频帧分别对应的所述音频内容的播放时间或所述目标文本内容的展示时间,配置所述目标视频中与所述目标视频帧对应的背景配乐的播放时间。
在一种可能的实施方式中,所述装置还包括:推送模块,用于将所述目标视频按照预设的至少一种分发方式推送给终端。
本公开实施例中,可以在获取到想向用户展示的目标媒体信息后,通过搜索与该目标媒体信息匹配的目标多媒体内容,来生成目标视频;采用这种方式,可以在产生有价值的目标媒体信息后,及时自动转换为目标视频,用户可以获取到视频形式的时效性较强的多媒体内容,提高了用户获取到时效性较高的多媒体内容的机会,尤其对于一些喜爱刷视频的用户,可以在打开的视频推送页面中及时获取到这些多媒体内容,进而提高了媒体内容资源的有效利用率。
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
基于同一技术构思,本申请实施例还提供了一种计算机设备。参照图11所示,为本申请实施例提供的计算机设备1100的结构示意图,包括处理器1101、存储器1102、和总线1103。其中,存储器1102用于存储执行指令,包括内存11021和外部存储器11022;这里的内存11021也称内存储器,用于暂时存放处理器1101中的运算数据,以及与硬盘等外部存储器11022交换的数据,处理器1101通过内存11021与外部存储器11022进行数据交换,当计算机设备1100运行时,处理器1101与存储器1102之间通过总线1103通信,使得处理器1101执行以下指令:
响应触发操作,获取基于目标多媒体内容生成的目标视频;其中,所述目标多媒体内容包括文本内容、图片内容、视频内容中的一项或多项;展示所述目标视频;其中,所述目标视频的各视频帧包括从所述目标多媒体内容中提取的目标图片内容和目标文本内容。
或者,使得处理器1101执行以下指令,
获取待生成视频的目标媒体信息,确定与所述目标媒体信息匹配的目标多媒体内容;其中,所述目标多媒体内容包括文本内容、图片内容、视频内容中的一项或多项;根据所述目标多媒体内容确定目标视频模板;基于所述目标视频模板和所述目标多媒体内容,生成所述目标媒体信息对应的目标视频。
上述指令的具体执行过程可以参考本公开实施例中所述的视频展示、生成方法的步骤,此处不再赘述。
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的视频展示、生成方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
本公开实施例还提供一种计算机程序产品,该计算机程序产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的视频展示、生成方法的步骤,具体可参见上述方法实施例,在此不再赘述。
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(Software Development Kit,SDK)等等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。