CN110121116A

CN110121116A - 视频生成方法及装置

Info

Publication number: CN110121116A
Application number: CN201810119436.0A
Authority: CN
Inventors: 李东
Original assignee: Shanghai Quan Toodou Cultural Communication Co Ltd
Current assignee: Alibaba China Co Ltd
Priority date: 2018-02-06
Filing date: 2018-02-06
Publication date: 2019-08-13

Abstract

本公开涉及一种视频生成方法及装置。该方法包括：响应于终端设备发送的生成视频的请求，确定请求包含的语义内容对应的关键词；获取与关键词相匹配的视频片段；根据视频片段，生成目标视频；控制终端设备展示目标视频。根据本公开实施例，能够响应于终端设备发送的生成视频的请求，确定请求包含的语义内容对应的关键词，以分析用户希望生成的视频的内容，通过获取与关键词相匹配的视频片段，根据视频片段，生成目标视频，并控制终端设备展示该目标视频，从而便利用户快速地生成符合意愿的视频，降低视频创作的成本。

Description

视频生成方法及装置

技术领域

本公开涉及计算机技术领域，尤其涉及一种视频生成方法及装置。

背景技术

如今，已经进入全民视频时代，视频在日常生活中随处可见，人们不仅可以随时随地通过各种设备(例如，手机、相机等)拍摄视频，还可以根据自己的创意制作各类视频，视频已经渐渐成为人们沟通、娱乐的一种社交工具。

发明内容

有鉴于此，本公开提出了一种视频生成方法及装置，能够便利用户快速地生成符合意愿的视频，降低视频创作的成本。

根据本公开的一方面，提供了一种视频生成方法，所述方法包括：

响应于终端设备发送的生成视频的请求，确定所述请求包含的语义内容对应的关键词；

获取与所述关键词相匹配的视频片段；

根据所述视频片段，生成目标视频；

控制终端设备展示所述目标视频。

在一种可能的实现方式中，所述请求包括文本请求、语音请求以及图片请求中的至少一种，

其中，响应于终端设备发送的生成视频的请求，确定所述请求包含的语义内容对应的关键词，包括：

响应于终端设备发送的生成视频的请求，确定所述请求对应的文字信息；

根据所述文字信息包含的语义内容，确定所述关键词。

在一种可能的实现方式中，所述文字信息包含多个语义内容，

其中，根据所述文字信息包含的语义内容，确定所述关键词，包括：

确定各语义内容对应的关键词；

其中，获取与所述关键词相匹配的视频片段，包括：

获取与多个语义内容中各语义内容对应的关键词相匹配的视频片段。

在一种可能的实现方式中，根据所述视频片段，生成目标视频，包括：

根据所述请求包含的语义内容，对视频片段进行排序，并根据排序后的视频片段生成所述目标视频。

对于所述请求包含的任一语义内容，根据与该语义内容对应的关键词相匹配的视频片段，生成该语义内容对应的目标视频。

在一种可能的实现方式中，获取与所述关键词相匹配的视频片段，包括：

在视频片段的内容与关键词的语义相符的情况下，确定所述视频片段与所述关键词相匹配。

在一种可能的实现方式中，所述方法还包括：

获取与所述关键词相匹配的音频内容；

其中，根据所述视频片段，生成目标视频，包括：

根据所述视频片段以及所述音频内容，生成所述目标视频。

在一种可能的实现方式中，所述方法还包括：

响应于终端设备对所述目标视频的第一视频片段的替换请求，确定与所述第一视频片段相匹配的关键词对应的候选视频片段；

控制终端设备展示所述候选视频片段；

根据终端设备选中的候选视频片段，重新生成目标视频。

在一种可能的实现方式中，所述方法还包括：

响应于终端设备对所述目标视频的剪辑请求，确定剪辑信息；

根据所述剪辑信息，重新生成目标视频。

根据本公开的另一方面，提供了一种视频生成装置，所述装置包括：

关键词确定模块，用于响应于终端设备发送的生成视频的请求，确定所述请求包含的语义内容对应的关键词；

视频片段获取模块，用于获取与所述关键词相匹配的视频片段；

第一视频生成模块，用于根据所述视频片段，生成目标视频；

第一控制模块，用于控制终端设备展示所述目标视频。

其中，所述关键词确定模块包括：

文字信息确定子模块，用于响应于终端设备发送的生成视频的请求，确定所述请求对应的文字信息；

第一关键词确定子模块，用于根据所述文字信息包含的语义内容，确定所述关键词。

其中，所述第一关键词确定子模块包括：

第二关键词确定子模块，用于确定各语义内容对应的关键词；

其中，所述视频片段获取模块包括：

视频片段获取子模块，用于获取与多个语义内容中各语义内容对应的关键词相匹配的视频片段。

在一种可能的实现方式中，所述第一视频生成模块包括：

第一视频生成子模块，用于根据所述请求包含的语义内容，对视频片段进行排序，并根据排序后的视频片段生成所述目标视频。

在一种可能的实现方式中，所述第一视频生成模块包括：

第二视频生成子模块，用于对于所述请求包含的任一语义内容，根据与该语义内容对应的关键词相匹配的视频片段，生成该语义内容对应的目标视频。

在一种可能的实现方式中，所述视频片段获取模块包括：

确定子模块，用于在视频片段的内容与关键词的语义相符的情况下，确定所述视频片段与所述关键词相匹配。

在一种可能的实现方式中，所述装置还包括：

音频内容获取模块，用于获取与所述关键词相匹配的音频内容；

其中，所述第一视频生成模块包括：

第三视频生成子模块，用于根据所述视频片段以及所述音频内容，生成所述目标视频。

在一种可能的实现方式中，所述装置还包括：

候选视频片段确定模块，用于响应于终端设备对所述目标视频的第一视频片段的替换请求，确定与所述第一视频片段相匹配的关键词对应的候选视频片段；

第二控制模块，用于控制终端设备展示所述候选视频片段；

第二视频生成模块，用于根据终端设备选中的候选视频片段，重新生成目标视频。

在一种可能的实现方式中，所述装置还包括：

剪辑信息确定模块，用于响应于终端设备对所述目标视频的剪辑请求，确定剪辑信息；

第三视频生成模块，用于根据所述剪辑信息，重新生成目标视频。

根据本公开的另一方面，提供了一种视频生成装置，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为执行上述方法。

根据本公开的另一方面，提供了一种非易失性计算机可读存储介质，其上存储有计算机程序指令，其中，所述计算机程序指令被处理器执行时实现上述视频生成方法。

根据本公开实施例，能够响应于终端设备发送的生成视频的请求，确定请求包含的语义内容对应的关键词，以分析用户希望生成的视频的内容，通过获取与关键词相匹配的视频片段，根据视频片段，生成目标视频，并控制终端设备展示该目标视频，从而便利用户快速地生成符合意愿的视频，降低视频创作的成本。

根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面，并且用于解释本公开的原理。

图1是根据一示例性实施例示出的一种视频生成方法的流程图。

图2是根据一示例性实施例示出的一种视频生成方法的流程图。

图3是根据一示例性实施例示出的一种视频生成方法的流程图。

图4是根据一示例性实施例示出的一种视频生成方法的流程图。

图5是根据一示例性实施例示出的一种视频生成方法的流程图。

图6是根据一示例性实施例示出的一种视频生成方法的应用场景的示意图。

图7是根据一示例性实施例示出的一种视频生成方法的应用场景的示意图。

图8是根据一示例性实施例示出的一种视频生成装置的框图。

图9是根据一示例性实施例示出的一种视频生成装置的框图。

图10是根据一示例性实施例示出的一种视频生成装置的框图。

具体实施方式

以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面，但是除非特别指出，不必按比例绘制附图。

在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。

另外，为了更好的说明本公开，在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解，没有某些具体细节，本公开同样可以实施。在一些实例中，对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述，以便于凸显本公开的主旨。

图1是根据一示例性实施例示出的一种视频生成方法的流程图。该方法可应用于服务器中。如图1所示，根据本公开实施例的视频生成方法包括：

在步骤S101中，响应于终端设备发送的生成视频的请求，确定所述请求包含的语义内容对应的关键词；

在步骤S102中，获取与所述关键词相匹配的视频片段；

在步骤S103中，根据所述视频片段，生成目标视频；

在步骤S104中，控制终端设备展示所述目标视频。

根据本公开实施例，通过确定终端设备发送的生成视频的请求包含的语义内容对应的关键词，获取与关键词相匹配的视频片段，根据视频片段，生成目标视频，并控制终端设备展示所述目标视频，这样，服务器可以根据终端设备发送的生成视频的请求，通过确定请求包含语义内容对应的关键词，以分析用户希望生成的视频的内容，通过获取与所述关键词相匹配的视频片段，生成目标视频，便利用户快速地生成符合意愿的视频，降低视频创作的成本。

举例来说，用户产生了视频创作灵感，其视频创作灵感可能来自于其阅读的某本小说、某个网页、观看的某个视频等，其想按照其视频创作灵感来创作视频。然而，视频创作过程往往较复杂，需要自己拍摄视频素材、对视频素材进行剪辑处理等，视频创作成本较高。此时，用户可以通过其终端设备发送生成视频的请求，例如，可以通过其手机、电脑等终端设备发送生成视频的请求。服务器响应于终端设备发送的生成视频的请求，确定所述请求包含的语义内容对应的关键词。

在一种可能的实现方式中，所述请求包括文本请求、语音请求以及图片请求中的至少一种。

举例来说，生成视频的请求可以为文本请求。例如，用户通过其电脑发起生成视频的请求，其可以输入与其视频创作灵感相关的文字信息。例如，用户的视频创作灵感来自于其阅读的某本小说的某段话，用户可以输入这一段话，发起生成视频的请求。生成视频的请求还可以为语音请求。例如，用户可以通过语音方式将其希望生成的视频场景、视频细节等相关信息通过终端设备发送给服务器。例如，用户可以向其终端设备发出一段语音，该语音详细描述其视频创作灵感或其希望生成的视频所包括的内容等。生成视频的请求还可以为图片请求。例如，用户可以通过其手机对小说中的某段话进行拍照，并通过其手机发送生成视频的图片请求。生成视频的请求还可以为文本请求、语音请求以及图片请求中的多种，例如，用户通过其手机对小说中的某段话进行拍照，并通过其手机发送生成视频的图片请求后，还可以通过语音请求、文本请求等方式对生成视频的请求进行补充。

通过这种方式，可以丰富生成视频的请求的形式，满足不同用户的使用习惯，便利用户依照其使用习惯通过终端设备发送生成视频的请求。本领域技术人员应理解，生成视频的请求还可以包括其他形式，本公开对此不作限制。

在一种可能的实现方式中，请求包含的语义内容可通过对请求本身或请求对应的文字信息进行语义分析来获得。

举例来说，服务器可以根据请求本身或请求对应的文字信息进行语义分析来获得请求包含的语义内容。例如，服务器可以通过对请求本身进行语义分析来获得请求包含的语义内容，例如，请求本身包括文字信息时，服务器可以对该文字信息进行语义分析来获得请求包含的语义内容等。另外，服务器还可以获取请求对应的文字信息，并通过对该文字信息进行语义分析获得请求包含的语义内容。这样，可以通过多种方式获得请求包含的语义内容，以确定请求包含的语义内容对应的关键词。本领域技术人员应理解，可以通过多种方式确定请求包含的语义内容，语义分析可采用相关技术手段实现，例如，可以基于深度学习技术和各种神经网络，提取训练数据的潜在特征，并训练得到可用于进行语义分析的目标模型。可以利用该目标模型获取请求包含的语义内容。例如，一段文字信息输入到该目标模型中，可以输出该段话的一个或多个语义内容，实现根据请求本身或请求对应的文字信息进行语义分析，获得请求包含的语义内容。只要可以对请求本身或请求对应的文字信息进行语义分析获得请求包含的语义内容即可，本公开对此不作限制。

图2是根据一示例性实施例示出的一种视频生成方法的流程图。在一种可能的实现方式中，如图2所示，步骤S101可以包括：

在步骤S1011中，响应于终端设备发送的生成视频的请求，确定所述请求对应的文字信息。

举例来说，服务器可以响应于终端设备发送的生成视频的请求，对该请求进行文字识别，确定所述请求对应的文字信息。例如，服务器接收到的请求为语音请求时，服务器可以识别出该语音请求所对应的文字信息。例如，服务器可以通过自动语音识别技术ASR(Automatic Speech Recognition)、基于深度学习技术的语音识别技术等对语音请求进行语音识别，确定该语音请求对应的文字信息。服务器接收到的请求为图片请求时，服务器可以识别出图片请求所对应的文字信息。例如，服务器可以对图片请求的图片内容进行文字识别，例如，服务器可以通过利用光学字符识别OCR(Optical Character Recognition)技术对该图片内容进行文字识别，例如，通过OCR的中文识别技术，确定该图片请求所对应的文字信息。服务器接收到的请求为文本请求时，服务器可以直接获取到文本请求对应的文字信息。

通过这种方式，服务器可以响应于终端设备发送的生成视频的请求，确定所述请求对应的文字信息，以实现准确获取生成视频的请求包含的语义内容，并进一步确定该语义内容对应的关键词，从而了解用户希望生成的视频的内容。本领域技术人员应理解，服务器可以通过多种方式确定生成视频的请求对应的文字信息，针对不同形式的请求，可以通过相应的方式确定请求对应的文字信息，不限于上述示例，只要可以响应于终端设备发送的生成视频的请求，确定请求对应的文字信息即可，本公开对此不作限制。

在步骤S1012中，根据所述文字信息包含的语义内容，确定所述关键词。

举例来说，服务器可以如前文所述，通过对与请求对应的文字信息进行语义分析来获得请求包含的语义内容。服务器可以根据该语义内容，确定关键词。例如，服务器可以对文字信息进行分词处理，提取出该文字信息的关键词，并根据文字信息包含的语义内容，确定请求包含的语义内容对应的关键词。例如，服务器对请求对应的文字信息进行分词处理，提取出该文字信息的多个关键词，服务器可以将这些关键词中符合请求包含的语义内容的一个或多个关键词，确定为请求包含的语义内容对应的关键词。例如，服务器对文字信息进行分词处理，提取出该文字信息的10个关键词，服务器可以根据相关算法确定符合语义内容的关键词，例如，可以计算这10个关键词的语义针对该语义内容的权重，将权重大于或等于权重阈值的关键词，确定为语义内容对应的关键词，例如，10个关键词中存在5个关键词针对语义内容的权重大于或或等于权重阈值，则服务器可以将这5个关键词确定为请求包含的语义内容对应的关键词。权重可表示关键词对语义表达的重要性，可通过相关的权重算法来计算。

通过这种方式，服务器可以在接收到终端设备发送的生成视频的请求时，较准确地确定该请求包含的语义内容对应的关键词，从而更加精确地获取用户希望生成的视频的内容。本领域技术人员应理解，可以通过多种方式根据文字信息包含的语义内容，确定关键词，不限于上述示例，只要响应于终端设备发送的生成视频的请求，确定所述请求对应的文字信息，并根据所述文字信息包含的语义内容，确定关键词即可，本公开对此不作限制。

本领域技术人员应理解，服务器响应于终端设备发送的生成视频的请求，可以通过多种方式确定请求包含的语义内容对应的关键词，不限于上述示例，确定的关键词可以为一个或多个，只要可以响应于终端设备发送的生成视频的请求，确定所述请求包含的语义内容对应的关键词即可，本公开对此不作限制。

在一种可能的实现方式中，所述文字信息包含多个语义内容。

举例来说，服务器响应于终端设备发送的生成视频的请求，确定所述请求对应的文字信息可能包含多个语义内容。例如，用户输入一段武侠小说中的比武片段的文字内容，该段文字内容包括多句话(例如，先是A派别某弟子如何和B派别某弟子比武，接着B派别某弟子如何和C派别某弟子比武，最后B派别某弟子如何和D派别某弟子比武)，并通过其手机发送生成视频的文本请求。服务器响应于该请求，确定该文本请求对应的文字信息，确定的文字信息包括多个语义内容，例如，确定该文字信息包括3个语义内容，分别为3组比武过程。本领域技术人员应理解，服务器确定与请求对应的文字信息可能包括一个语义内容，也可能包括多个语义内容，本公开对此不作限制。

在一种可能的实现方式中，根据所述文字信息包含的语义内容，确定所述关键词(步骤S1012)，可以包括：确定各语义内容对应的关键词。

举例来说，服务器响应于终端设备发送的生成视频的请求，确定所述请求对应的文字信息包括多个语义内容时，服务器可以确定各语义内容对应的关键词。例如，用户通过其终端设备发送的生成视频的请求为图片请求，服务器通过OCR的中文识别技术，确定该图片请求所对应的文字信息为一段话(例如，包括多个语义内容)，则服务器可以确定各语义内容对应的关键词。本领域技术人员应理解，文字信息包括多个语义内容时，服务器可以通过多种方式确定各语义内容对应的关键词，例如，服务器可以根据文字信息，确定请求对应的多个关键词，并按照相应的语义内容将多个关键词划分为各语义内容对应的关键词，服务器也可以分别确定各语义内容对应的关键词，例如，先确定语义内容1对应的关键词，再确定语义内容2对应的关键词，直到确定各语义内容对应的关键词，只要可以确定各语义内容对应的关键词即可，本公开对此不作限制。

在一种可能的实现方式中，获取与所述关键词相匹配的视频片段(步骤S102)，可以包括：获取与多个语义内容中各语义内容对应的关键词相匹配的视频片段。

举例来说，服务器确定请求包含多个语义内容时，服务器可以获取与多个语义内容中各语义内容对应的关键词相匹配的视频片段。例如，服务器确定请求对应的文字信息包括3个语义内容，依次为语义内容1、语义内容2和语义内容3。服务器可以获取这3个语义内容中各语义内容对应的关键词相匹配的视频片段。例如，服务器可以获取与语义内容1对应的关键词相匹配的视频片段d1，获取与语义内容2对应的关键词相匹配的视频片段d2以及获取与语义内容3对应的关键词相匹配的视频片段d3。

本领域技术人员应理解，服务器可以通过多种方式获取与多个语义内容中各语义内容对应的关键词相匹配的视频片段。例如，服务器可以确定请求对应的文字信息所包含的语义内容1，并确定语义内容1对应的关键词，获取与语义内容1对应的关键词相匹配的视频片段d1。之后，服务器再去确定请求对应的文字信息所包含的语义内容2，并确定语义内容2对应的关键词，获取与语义内容2对应的关键词相匹配的视频片段d2，直到获取到与多个语义内容中各语义内容对应的关键词相匹配的视频片段。服务器还可以如前文所述，先确定请求对应的文字信息包含的多个语义内容，并获取各语义内容对应的关键词相匹配的视频片段，例如，分别获取各语义内容对应的关键词相匹配的视频片段，或者，同时获取各语义内容对应的关键词相匹配的视频片段。只要可以获取与多个语义内容中各语义内容对应的关键词相匹配的视频片段即可，本公开对此不作限制。

本领域技术人员应理解，请求包含一个语义内容时，服务器可以获取与该语义内容对应的关键词相匹配的视频片段，请求包含多个语义内容时，服务器可以获取与多个语义内容中各语义内容对应的关键词相匹配的视频片段。其中，服务器可以通过多种方式获取与关键词相匹配的视频片段，例如，服务器可以在各视频平台搜索标签与关键词相关的视频片段，并确定与关键词相匹配的视频片段。其中，关键词与视频片段的标签相匹配，可以是标签与关键词一致，例如，标签命中全部或部分关键词，或标签与关键词语义相符等，本公开不限制匹配的具体规则。另外，与关键词相匹配的视频片段也可以包括多种形式，例如，与关键词相匹配的视频片段可以包括一个或多个视频片段，还可以包括一组或多组视频片段，只要获取与关键词相匹配的视频片段即可，本公开对此不作限制。

现以获取与一个语义内容对应的关键词相匹配的视频片段为例，示例性说明获取与关键词相匹配的视频片段的一种方法。

在一种可能的实现方式中，可以设置有视频平台，该视频平台中存储有大量的视频，服务器可以对视频平台中的视频进行结构化处理。

举例来说，服务器可以对视频平台中的视频进行结构化处理，例如，服务器可以对这些视频进行视频镜头分割，分别获得各视频的多个视频片段，并分别确定各视频片段对应的标签。其中，各视频片段对应的标签可用于表示各视频片段所包含的多种信息，例如，该视频片段内容的分类信息、该视频片段场景、人物、发生的事件等与视频片段内容相关的信息、该视频片段拍摄地点、拍摄演员等与视频片段相关的周边信息等。

需要说明的是，服务器对视频进行视频镜头分割时，可以是将该视频分割为多个视频片段(例如，将视频剪裁为5个视频片段，生成或存储为视频片段1到视频片段5)，也可以是通过记录每个视频片段的起始时间点和结束时间点来对视频进行视频镜头分割，确定视频的多个视频片段的。此时，并非真正切分视频，而是通过记录多组起始时间点和结束时间点，来对视频进行视频镜头分割。例如，针对视频1，可以在服务器数据库中记录视频1的多个视频片段对应的多组起始时间点和结束时间点(例如，第一组起始时间点和结束时间点分别为00:00和02:00、第二组起始时间点和结束时间点分别为02:00和03:00等)。服务器可以将数据库中记录各视频片段的起始时间点和结束时间点，作为获取与关键词相匹配的视频片段的基础。

这样，服务器通过对视频平台中的视频进行结构化处理，并确定可用于准确、全面表示各视频片段所包含的多种信息的标签，可以保证准确地获取与关键词相匹配的视频片段。本领域技术人员应理解，可以通过多种方式对视频平台中的视频进行结构化处理，举例来说，服务器可以对这些视频的画面进行逐帧检测，例如，对画面内容进行特征提取、场景识别等，当画面内容差异较大时，进行视频镜头分割，获得视频的多个视频片段。服务器可以通过多种方式确定各视频片段对应的标签，例如，通过对各视频片段的音频信息进行语音识别、对各视频片段关键帧图像进行文字识别、图像识别等方式，确定各视频片段对应的标签，本公开对此不作限制。

在一种可能的实现方式中，服务器可以在该视频平台中搜索与关键词相关的视频片段，并确定与所述关键词相匹配的视频片段。

举例来说，服务器可以在该视频平台中搜索与关键词相关的视频片段，例如，服务器搜索到多个与这几个关键词相关的视频片段，服务器可以从这多个视频片段中，确定与所述关键词相匹配的视频片段。例如，该语义内容对应5个关键词，服务器可以将标签命中关键词最多的视频片段，确定为与该语义内容对应的关键词相匹配的视频片段。例如，服务器搜索到视频片段d1，该视频片段d1的标签同时命中这5个关键词(例如，视频片段d1有10个标签，其中5个标签与请求对应5个关键词相同)，则服务器可以将视频片段d1确定为与关键词相匹配的视频片段。

在一种可能的实现方式中，获取与所述关键词相匹配的视频片段，可包括：在视频片段的内容与关键词的语义相符的情况下，确定所述视频片段与所述关键词相匹配。

例如，服务器可以综合视频片段的标签命中关键词的数量、视频片段的内容以及关键词的语义，确定与所述关键词相匹配的视频片段，以使得视频片段的内容与关键词的语义一致。

举例来说，语义内容1为：召开了武林大会，各路武林人士均出席。服务器确定该语义内容对应的关键词包括5个(例如，武林人士、出席、聚会、某派以及热闹)。该视频片段d1的标签同时命中这5个关键词，然而，服务器确定该视频片段d1虽然命中这5个关键词，但并不符合关键词的语义。例如，服务器可以获取到该视频片段d1所有的标签，例如，获取到该视频片段d1的20个标签，服务器可以根据视频片段d1的20个标签，确定该视频片段d1的视频内容，例如，视频片段d1的视频内容为武林人士某某结婚，某派人士均出席，场面热闹非凡。可见，视频片段d1虽然命中语义内容1对应的5个关键词，然而，视频片段d1命中的5个关键词的语义是武林人士结婚，某派人士均出席，而非语义内容1中这5个关键词的语义(各路武林人士均出席武林大会)。此时，服务器可以重新确定与所述关键词相匹配的视频片段。例如，可以将标签命中4个关键词的视频片段d2(例如，视频片段d2的视频内容为召开了武林大会，各路武林人士均出席)确定与所述关键词相匹配的视频片段。

通过这种方式，服务器可以较准确地获取与关键词相匹配的视频片段。本领域技术人员应理解，服务器可以通过多种方式确定与所述关键词相匹配的视频片段，例如，服务器还可以在各视频平台搜索标签与关键词相匹配的视频片段，不限于上述示例。另外，与所述关键词相匹配的视频片段也可以包括多种形式，只要服务器可以获取与关键词相匹配的视频片段即可，本公开对此不作限制。

在一种可能的实现方式中，根据所述视频片段，生成目标视频(步骤S103)，可以包括：根据所述请求包含的语义内容，对视频片段进行排序，并根据排序后的视频片段生成所述目标视频。

举例来说，服务器可以根据请求包含的语义内容，对视频片段进行排序，并生成目标视频。例如，服务器确定请求包含一个语义内容，确定该语义内容对应的关键词，并获取与关键词相匹配的视频片段(例如，一组视频片段，包括视频片段a5和视频片段a6)。服务器可以根据请求包含的语义内容，对视频片段进行排序，例如，确定请求包含的语义内容对应5个关键词，其中，视频片段a5是与第1到第4个关键词相匹配的视频片段，视频片段a6是与第5个关键词相匹配的视频片段，则根据请求包含的语义内容，对这组视频片段排序，顺序为：先是视频片段a5，再是视频片段a6，服务器可以根据排序后的视频片段生成目标视频。

在一种可能的实现方式中，服务器确定请求包含多个语义内容。服务器可以获取与多个语义内容中各语义内容对应的关键词相匹配的视频片段。例如，服务器获取到与语义内容1对应的关键词相匹配的视频片段d1、与语义内容2对应的关键词相匹配的视频片段d2以及与语义内容3对应的关键词相匹配的视频片段d3。服务器可以根据所述请求包含的语义内容，对视频片段进行排序。例如，用户通过终端设备发送的请求的语义内容的顺序为：语义内容1、语义内容2以及语义内容3，则服务器可以根据该请求的语义内容，对视频片段进行排序，例如，顺序为：视频片段d1、视频片段d2以及视频片段d3。服务器可以根据排序后的多个视频片段，生成目标视频。例如，按照视频片段d1、视频片段d2以及视频片段d3的顺序，生成目标视频。

通过这种方式，可以按照用户希望生成的视频的内容，生成目标视频。本领域技术人员应理解，可以通过多种方式根据所述请求包含的语义内容，对视频片段进行排序，并根据排序后的视频片段生成所述目标视频，本公开对此不作限制。

在一种可能的实现方式中，根据所述视频片段，生成目标视频(步骤S103)，可以包括：对于所述请求包含的任一语义内容，根据与该语义内容对应的关键词相匹配的视频片段，生成该语义内容对应的目标视频。

举例来说，服务器可以对于所述请求包含的任一语义内容，根据与该语义内容对应的关键词相匹配的视频片段，生成该语义内容对应的目标视频。例如，请求包含一个语义内容时，服务器可以根据与该语义内容对应的关键词相匹配的视频片段，生成该语义内容对应的目标视频。

在一种可能的实现方式中，服务器确定请求包含多个语义内容(例如，包含3个语义内容)，服务器获取多个语义内容中各语义内容对应的关键词相匹配的视频片段，例如，语义内容1对应关键词相匹配的视频片段可以包括视频片段d1，语义内容2对应关键词相匹配的视频片段可以包括视频片段d2和视频片段d3，语义内容3对应关键词相匹配的视频片段可以包括视频片段d4。服务器可以对于请求包含的任一语义内容，根据与该语义内容对应的关键词相匹配的视频片段，生成该语义内容对应的目标视频。例如，服务器可以根据视频片段d1生成语义内容1对应的目标视频，服务器可以根据视频片段d2和视频片段d3，生成语义内容2对应的目标视频，服务器可以根据视频片段d4生成语义内容3对应的目标视频，最终生成这3个语义内容对应的目标视频。

通过这种方式，服务器可以对于请求包含的任一语义内容，根据与该语义内容对应的关键词相匹配的视频片段，生成该语义内容对应的目标视频，供用户选择。本领域技术人员应理解，可以通过多种方式可以对于请求包含的任一语义内容，根据与该语义内容对应的关键词相匹配的视频片段，生成该语义内容对应的目标视频，本公开对此不作限制。

本领域技术人员应理解，可以通过多种方式根据与关键词相匹配的视频片段，生成目标视频。例如，可以是根据请求包含的多个语义内容对应的关键词相匹配的视频片段，生成目标视频，也可以根据请求包含的任一语义内容对应的关键词相匹配的视频片段，生成该语义内容对应的目标视频，其中，生成的目标视频的数量可以为一个或多个。例如，语义内容对应的关键词相匹配的视频片段包括多个或多组视频片段时，可以分别生成多个目标视频，也可以将多个或多组视频片段拼接生成一个目标视频。另外，服务器还可以获取语义内容对应关键词相匹配的一个或多个视频片段，并控制用户的终端设备显示视频片段，服务器可以获取用户选中的视频片段，并根据相应视频片段，生成目标视频。只要可以根据服务器获取的与关键词相匹配的视频片段，生成目标视频即可，本公开对此不作限制。

在一种可能的实现方式中，如图2所示，在步骤S104中，控制终端设备展示所述目标视频。

举例来说，服务器在生成目标视频后，可以控制终端设备展示该目标视频。例如，服务器可以在生成目标视频后，控制用户的终端设备展示该目标视频。在用户触发该目标视频的播放控件时，播放该目标视频。

通过这种方式，可以便利用户观看目标视频，了解服务器生成的目标视频的情况。本领域技术人员应理解，可以通过相关技术中公知的方式控制终端设备展示所述目标视频，本公开对此不作限制。

图3是根据一示例性实施例示出的一种视频生成方法的流程图。在一种可能的实现方式中，如图3所示，所述方法还包括：

在步骤S105中，获取与所述关键词相匹配的音频内容。

举例来说，服务器可以获取与所述关键词相匹配的音频内容。例如，服务器确定与请求包含的语义内容对应的关键词，并获取与关键词相匹配的音频内容。本领域技术人员应理解，可以通过多种方式获取与所述关键词相匹配的音频内容，例如，请求包含多个语义内容时，服务器可以确定各语义内容对应的关键词，并获取与各语义内容对应的关键词相匹配的音频内容等，只要可以获取与关键词相匹配的音频内容即可，本公开对此不作限制。

在一种可能的实现方式中，如图4所示，步骤S103可以包括：

在步骤S1031中，根据所述视频片段以及所述音频内容，生成所述目标视频。

举例来说，服务器可以根据所述视频片段以及所述音频内容，生成所述目标视频。例如，服务器获取与关键词相匹配的视频片段包括：视频片段d1、视频片段d2以及视频片段d3，服务器获取与关键词相匹配的音频内容包括：音频内容1、音频内容2以及音频内容3，服务器可以根据其获取的与关键词相匹配的视频片段以及音频内容，生成目标视频。例如，生成的目标视频开始部分的内容为视频片段d1的内容，与视频片段d1的内容同步的背景音乐可以为音频内容1，目标视频中间部分的内容为视频片段d2的内容，与视频片段d2的内容同步的背景音乐可以为音频内容2，目标视频最后部分的内容为视频片段d3的内容，与视频片段d3的内容同步的背景音乐可以为音频内容3。

通过这种方式，可以丰富生成的目标视频的形式，提高目标视频的娱乐性。本领域技术人员应理解，可以通过多种方式获取与所述关键词相匹配的音频内容，并根据所述视频片段以及所述音频内容，生成所述目标视频，本公开对此不作限制。

图4是根据一示例性实施例示出的一种视频生成方法的流程图。在一种可能的实现方式中，如图4所示，所述方法还包括：

在步骤S106中，响应于终端设备对所述目标视频的第一视频片段的替换请求，确定与所述第一视频片段相匹配的关键词对应的候选视频片段。

举例来说，用户在预览服务器生成的目标视频后，可能希望对该目标视频的部分视频内容进行替换，此时，其可以通过终端设备发送对目标视频的第一视频片段的替换请求，其中，第一视频片段可为服务器用于生成目标视频的视频片段。例如，服务器根据视频片段d1、视频片段d2和视频片段d3生成目标视频。用户在预览该目标视频后，对视频片段d1对应的视频内容不满意，其可以发起针对视频片段d1的替换请求。

在一种可能的实现方式中，服务器响应于终端设备对所述目标视频的第一视频片段的替换请求，可以确定与所述第一视频片段相匹配的关键词对应的候选视频片段。

举例来说，如前文所述，服务器确定语义内容1对应的关键词，并获取与语义内容1的关键词相匹配的视频片段d1。例如，服务器在视频平台搜索语义内容1对应的关键词，此时，服务器可能搜索出多个视频片段(例如，包括视频片段d1、视频片段d11以及视频片段d111)，并确定多个视频片段中的视频片段d1为与语义内容1的关键词相匹配的视频片段(例如，视频片段d1是这几个视频片段中标签命中关键词最多的视频片段)。服务器可以将视频片段d11和视频片段d111确定为与所述第一视频片段(视频片段d1)相匹配的关键词对应的候选视频片段。当用户发起针对视频片段d1的替换请求时，服务器可以直接确定视频片段d11和视频片段d111为候选视频片段。

通过这种方式，可以快速地确定候选视频片段，以供用户选择。本领域技术人员应理解，服务器可以通过多种方式确定与第一视频片段相匹配的关键词对应的候选视频片段，例如，确定与第一视频片段相匹配的关键词，并根据确定的关键词重新搜索候选视频片段等，不限于上述示例。其中，候选视频片段可以包括一个或多个，本公开对此不作限制。

在步骤S107中，控制终端设备展示所述候选视频片段。

举例来说，服务器在确定候选视频片段后，可以控制用户终端设备展示候选视频片段。此时，用户可以进行预览该候选视频片段、选中候选视频片段等相关操作。

通过这种方式，便利于用户预览候选视频片段，供其选择符合其需要的候选视频片段进行替换。本领域技术人员应理解，服务器可以通过相关技术中公知的方式控制终端设备展示所述候选视频片段，本公开对此不作限制。

在步骤S108中，根据终端设备选中的候选视频片段，重新生成目标视频。

举例来说，服务器可以获取用户终端设备选中的候选视频片段，例如，服务器控制用户终端设备展示了3个候选视频片段，用户在预览3个候选视频片段后认为候选视频片段1符合其需求，可以通过其终端设备选中候选视频片段1。服务器可以根据终端设备选中的候选视频片段1替换之前生成的目标视频的视频片段d1，重新生成目标视频。

通过这种方式，可以根据用户的需要，生成目标视频。本领域技术人员应理解，可以采用相关技术中公知的方式根据终端设备选中的候选视频片段，重新生成目标视频，本公开对此不作限制。

图5是根据一示例性实施例示出的一种视频生成方法的流程图。在一种可能的实现方式中，如图5所示，所述方法还包括：

在步骤S109中，响应于终端设备对所述目标视频的剪辑请求，确定剪辑信息；

在步骤S110中，根据所述剪辑信息，重新生成目标视频。

举例来说，用户可能对目标视频中某个视频片段的部分内容有剪辑需求，例如，用户只希望保留目标视频中视频片段d1的前10分钟的内容，并且希望该10分钟内容重复2次，此时，其可以通过终端设备发送对目标视频的剪辑请求。

服务器可以响应于终端设备对所述目标视频的剪辑请求，确定剪辑信息。例如，服务器可以确定用户对目标视频的剪辑信息是：视频片段d1保留前10分钟的内容，且重复2次。服务器可以根据确定的剪辑信息，重新生成目标视频。

通过这种方式，可以便利用户按照其需求对服务器生成的目标视频进行剪辑处理，以实现按照用户的需求来生成目标视频。本领域技术人员应理解，可以通过多种方式响应于终端设备对所述目标视频的剪辑请求，确定剪辑信息，并根据所述剪辑信息，重新生成目标视频。其中，剪辑信息可以包括对目标视频某个视频片段的剪辑信息，也可以包括对目标视频的某个音频内容的剪辑信息，剪辑信息的内容可以包括但不限于剪切、重复、移动等操作，本公开对此不作限制。

应用示例1

以下结合“用户进行视频创作”作为一个示例性应用场景，给出根据本公开实施例的应用示例，以便于理解视频生成方法的流程。本领域技术人员应理解，以下应用示例仅仅是出于便于理解本公开实施例的目的，不应视为对本公开实施例的限制。

图6是根据一示例性实施例示出的一种视频生成方法的应用场景的示意图。如图6所示，在该应用示例中，用户阅读一本武侠小说的过程中，在阅读到一个比武片段时，产生了视频创作灵感。该用户可以通过其手机发送生成视频的请求。例如，用户用其手机对武侠小说的比武片段进行拍照，并通过其手机发送生成视频的请求(例如，图片请求)。

在该应用示例中，服务器响应于用户手机发送的生成视频的图片请求，确定所述图片请求对应的文字信息。例如，服务器可以通过利用OCR技术对该图片内容的图片进行文字识别，确定与该图片请求所对应的文字信息。例如，服务器确定图片请求对应的文字信息包括多个语义内容中的语义内容1为：召开了武林大会，各路武林人士均出席。

在该应用示例中，服务器确定语义内容1对应的关键词。例如，服务器可以对文字信息进行分词处理，提取出该文字信息的关键词。例如，提取出10个关键词，服务器根据语义内容1，确定关键词，例如，服务器可以将符合语义内容1的关键词确定为语义内容1对应的关键词，例如10个关键词中的5个关键词为语义内容1对应的关键词。

在该应用示例中，服务器可以根据语义内容1对应的关键词，获取相匹配的视频片段。例如，服务器可以在各视频平台已经发布的相关武侠类电影、电视剧片段中搜索与语义内容1对应的关键词相关的视频片段，并获取相匹配的视频片段。例如，服务器可以将标签命中所有与语义内容1对应的关键词的视频片段d1确定为与语义内容1对应的关键词相匹配的视频片段。

在该应用示例中，服务器依次确定图片请求对应的文字信息包含的多个语义内容中各语义内容对应的关键词，并依次获取与各语义内容对应的关键词相匹配的视频片段，例如，包括视频片段d1、视频片段d2以及视频片段d3。

在该应用示例中，服务器还可以获取与关键词相匹配的音频内容。例如，服务器获取到音频内容1与这3个语义内容对应的关键词均匹配。在该应用示例中，服务器可以根据获取的与各语义内容对应的关键词相匹配的视频片段d1、视频片段d2、视频片段d3以及音频内容1，生成目标视频。例如，用户发送的图片请求中多个语义内容的顺序为语义内容1、语义内容2以及语义内容3，则可以根据多个语义内容的顺序，对多个视频片段进行排序，顺序为：视频片段d1、视频片段d2以及视频片段d3，按照各视频片段的顺序以及音频内容1为背景音乐，生成目标视频。

在该应用示例中，服务器控制终端设备展示该目标视频。此时，用户可以通过其手机预览播放该目标视频。

在该应用示例中，用户认为视频片段d1不符合其预期，其可以通过手机发送对目标视频的第一视频片段(视频片段d1)的替换请求，例如，如图6所示，用户触发标记有d1的控件，发起针对视频片段d1的替换请求。服务器响应于该替换请求，确定与视频片段d1相匹配的关键词对应的候选视频片段。例如，服务器在生成目标视频之前，在各视频平台搜索与语义内容1对应的关键词相关的视频片段，例如，获取到4个相关的视频片段。其中，服务器将标签命中5个关键词的视频片段d1确定为与语义内容1对应的关键词相匹配的视频片段，服务器还可以将另外3个视频片段确定为候选视频片段，并在用户通过手机发出针对视频片段d1的替换请求时，直接向用户展示3个候选视频片段。在该应用示例中，服务器控制用户的手机展示3个候选视频片段。例如，如图6所示，展示r1、r2以及r3这3个候选视频片段，供用户预览、挑选。

在该应用示例中，用户预览了3个候选视频片段后，认为r1符合其预期，则可以通过其手机选中r1，服务器可以根据手机选中的r1，重新生成目标视频。例如，按照r1、视频片段d2、视频片段d3的顺序，背景音乐为音频内容1，重新生成目标视频。

在该应用示例中，用户对生成的目标视频有剪辑需求。例如，用户认为视频片段d3的最后5分钟内容价值不大，其可以剪掉该部分内容，另外，用户认为视频片段d2中间有个比武镜头非常精彩，用户想要这个比武镜头重复3次。此时，其可以通过手机发起对目标视频的剪辑请求，服务器可以响应该剪辑请求，并确定剪辑信息。例如，服务器确定的剪辑信息包括：1、d2中第XX分钟XX秒到第X分钟X秒的镜头重复3次。2、d3最后5分钟剪掉。服务器可以根据该剪辑信息，重新生成目标视频。

在该应用示例中，用户对重新生成的目标视频非常满意，其可以将服务器生成的目标视频在各视频平台进行发布，也可以将生成的目标视频发送给其好友。

应用示例2

以下结合“用户处理文字信息，生成相应视频”作为一个示例性应用场景，给出根据本公开实施例的应用示例，以便于理解视频生成方法的流程。本领域技术人员应理解，以下应用示例仅仅是出于便于理解本公开实施例的目的，不应视为对本公开实施例的限制。

图7是根据一示例性实施例示出的一种视频生成方法的应用场景的示意图。如图7所示，在该应用示例中，用户希望通过其终端设备观看视频。例如，该视频为根据某某小说拍摄的电影、电视剧等。在该应用示例中，用户的终端设备可显示有该视频的播放界面，用户可以通过触发播放控件，来播放该视频。同时，用户的终端设备还显示有该视频对应的文字信息，其中，与视频对应的文字信息可以是视频拍摄依据的小说内容等，也可以是根据视频的内容，确定的相应文字描述等。例如，如图7所示，该电影是根据小说Z拍摄的，用户的终端设备上显示有该电影，以及小说Z的内容。

在该应用示例中，用户可能希望根据该视频，重新生成其希望的目标视频。例如，该用户认为播放完整版电影会耗费过长的时间，或者该小说的内容过于拖拉，相应电影的部分内容完全可以剪掉等。在该应用示例中，用户可以对视频对应的部分文字信息进行删除、调整等相应处理，例如，用户可以留下视频对应的文字信息中其感兴趣的部分。例如，用户觉得小说的第一章内容过于无聊，用户可以直接选中并删除终端设备所显示的小说的第一章。用户觉得小说中间部分描述的内容过于拖拉、重复，用户也可以对其认为可以删除的内容进行删除。用户还可能对小说的某两部分内容的顺序不满意，其可以调整这两部分内容的顺序。总之，用户可以按照其个性化需求对视频对应的文字信息进行删除、调整等相应处理。

在该应用示例中，用户认为其处理后的小说内容简洁、清楚，其可以通过终端设备发送生成视频的请求，例如，发送按照其处理后的小说内容，生成相应视频的请求。在该应用示例中，服务器响应于用户终端设备发送的该请求，可以确定请求包含的语义内容对应的关键词。例如，服务器可以确定用户希望生成的视频请求对应的文字信息。在该应用示例中，服务器可以根据其确定的文字信息的语义内容，确定关键词，并获取关键词相匹配的视频片段。例如，服务器可以从该小说对应的视频中获取关键词相匹配的视频片段。例如，电影是按照小说拍摄的，电影包括多个视频片段，这些视频片段分别对应小说的各文字信息，服务器可以根据请求对应的文字信息，从该电影的多个视频片段中确定相匹配的视频片段。

在该应用示例中，服务器根据视频片段，生成目标视频。例如，小说包括5章，第1章节对应该电影的开头10分钟。用户删除了小说第1章的内容后，发送生成视频的请求，服务器相应该请求，确定请求包含的语义内容对应的关键词，在该电影中获取与关键词相匹配的视频片段，并根据视频片段生成目标视频，例如，生成的目标视频是删除了原电影开头10分钟的目标视频。

在该应用示例中，服务器控制终端设备展示该目标视频。例如，在用户的终端设备上展示根据用户的需要，生成的目标视频。

图8是根据一示例性实施例示出的一种视频生成装置的框图。如图8所示，所述视频生成装置包括：

关键词确定模块701，用于响应于终端设备发送的生成视频的请求，确定所述请求包含的语义内容对应的关键词；

视频片段获取模块702，用于获取与所述关键词相匹配的视频片段；

第一视频生成模块703，用于根据所述视频片段，生成目标视频；

第一控制模块704，用于控制终端设备展示所述目标视频。

图9是根据一示例性实施例示出的一种视频生成装置的框图。如图9所示，在一种可能的实现方式中，所述请求包括文本请求、语音请求以及图片请求中的至少一种，

其中，所述关键词确定模块701包括：

文字信息确定子模块7011，用于响应于终端设备发送的生成视频的请求，确定所述请求对应的文字信息；

第一关键词确定子模块7012，用于根据所述文字信息包含的语义内容，确定所述关键词。

其中，所述第一关键词确定子模块7012包括：

其中，所述视频片段获取模块702包括：

在一种可能的实现方式中，所述第一视频生成模块703包括：

在一种可能的实现方式中，所述视频片段获取模块702包括：

如图9所示，在一种可能的实现方式中，所述装置还包括：

音频内容获取模块705，用于获取与所述关键词相匹配的音频内容；

其中，所述第一视频生成模块703包括：

第三视频生成子模块7031，用于根据所述视频片段以及所述音频内容，生成所述目标视频。

如图9所示，在一种可能的实现方式中，所述装置还包括：

候选视频片段确定模块706，用于响应于终端设备对所述目标视频的第一视频片段的替换请求，确定与所述第一视频片段相匹配的关键词对应的候选视频片段；

第二控制模块707，用于控制终端设备展示所述候选视频片段；

第二视频生成模块708，用于根据终端设备选中的候选视频片段，重新生成目标视频。

如图9所示，在一种可能的实现方式中，所述装置还包括：

剪辑信息确定模块709，用于响应于终端设备对所述目标视频的剪辑请求，确定剪辑信息；

第三视频生成模块710，用于根据所述剪辑信息，重新生成目标视频。

图10是根据一示例性实施例示出的一种视频生成装置的框图。例如，装置1900可以被提供为一服务器。参照图10，装置1900包括处理组件1922，其进一步包括一个或多个处理器，以及由存储器1932所代表的存储器资源，用于存储可由处理组件1922的执行的指令，例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件1922被配置为执行指令，以执行上述方法。

装置1900还可以包括一个电源组件1926被配置为执行装置1900的电源管理，一个有线或无线网络接口1950被配置为将装置1900连接到网络，和一个输入输出(I/O)接口1958。装置1900可以操作基于存储在存储器1932的操作***，例如Windows ServerTM，MacOS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

在示例性实施例中，还提供了一种非易失性计算机可读存储介质，例如包括计算机程序指令的存储器1932，上述计算机程序指令可由装置1900的处理组件1922执行以完成上述方法。

本公开可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质，其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器，从而生产出一种机器，使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时，产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中，这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作，从而，存储有指令的计算机可读介质则包括一个制造品，其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上，使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤，以产生计算机实现的过程，从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分，所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种视频生成方法，其特征在于，所述方法包括：

获取与所述关键词相匹配的视频片段；

根据所述视频片段，生成目标视频；

控制终端设备展示所述目标视频。

2.根据权利要求1所述的方法，其特征在于，所述请求包括文本请求、语音请求以及图片请求中的至少一种，

根据所述文字信息包含的语义内容，确定所述关键词。

3.根据权利要求2所述的方法，其特征在于，所述文字信息包含多个语义内容，

确定各语义内容对应的关键词；

其中，获取与所述关键词相匹配的视频片段，包括：

4.根据权利要求1至3中任意一项所述的方法，其特征在于，根据所述视频片段，生成目标视频，包括：

5.根据权利要求1至3中任意一项所述的方法，其特征在于，根据所述视频片段，生成目标视频，包括：

6.根据权利要求1所述的方法，其特征在于，获取与所述关键词相匹配的视频片段，包括：

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取与所述关键词相匹配的音频内容；

其中，根据所述视频片段，生成目标视频，包括：

根据所述视频片段以及所述音频内容，生成所述目标视频。

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

控制终端设备展示所述候选视频片段；

根据终端设备选中的候选视频片段，重新生成目标视频。

9.根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据所述剪辑信息，重新生成目标视频。

10.一种视频生成装置，其特征在于，所述装置包括：

第一控制模块，用于控制终端设备展示所述目标视频。

11.根据权利要求10所述的装置，其特征在于，所述请求包括文本请求、语音请求以及图片请求中的至少一种，

其中，所述关键词确定模块包括：

12.根据权利要求11所述的装置，其特征在于，所述文字信息包含多个语义内容，

其中，所述第一关键词确定子模块包括：

其中，所述视频片段获取模块包括：

13.根据权利要求10至12中任意一项所述的装置，其特征在于，所述第一视频生成模块包括：

14.根据权利要求10至12中任意一项所述的装置，其特征在于，所述第一视频生成模块包括：

15.根据权利要求10所述的装置，其特征在于，所述视频片段获取模块包括：

16.根据权利要求10所述的装置，其特征在于，所述装置还包括：

其中，所述第一视频生成模块包括：

17.根据权利要求10所述的装置，其特征在于，所述装置还包括：

第二控制模块，用于控制终端设备展示所述候选视频片段；

18.根据权利要求10所述的装置，其特征在于，所述装置还包括：

19.一种视频生成装置，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：执行权利要求1至9中任意一项所述的方法。

20.一种非易失性计算机可读存储介质，其上存储有计算机程序指令，其特征在于，所述计算机程序指令被处理器执行时实现权利要求1至9中任意一项所述的方法。