CN111491184B

CN111491184B - 情景化字幕的生成方法、装置、电子设备及存储介质

Info

Publication number: CN111491184B
Application number: CN201910078246.3A
Authority: CN
Inventors: 李玉; 侯明强; 宋健
Original assignee: Beijing Youguan Network Technology Co ltd
Current assignee: Beijing Youguan Network Technology Co ltd
Priority date: 2019-01-25
Filing date: 2019-01-25
Publication date: 2022-11-01
Anticipated expiration: 2039-01-25
Also published as: CN111491184A

Abstract

本发明实施例公开了一种情景化字幕的生成方法、装置、电子设备及存储介质；所述方法包括：在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求；确定所述情景化字幕的生成请求对应的情景化字幕；将所述情景化字幕添加到所述当前播放视频中。情景化字幕更加多样化，方便用户使用，提升用户收听体验。

Description

情景化字幕的生成方法、装置、电子设备及存储介质

技术领域

本发明涉及互联网技术领域，尤其涉及一种情景化字幕的生成方法、装置、电子设备及存储介质。

背景技术

随着互联网的普及，用户可以通过便捷的渠道获取到想要观看的视频。而录像带和碟片等视频承载介质已经渐渐淡出了大众的视野，网络下载和在线观看等视频传播方式则被越来越多的用户所接受。在情景化字幕的生成过程中，可以将情景化字幕添加到播放内容中，该情景化字幕用于对视频内容进行解释和说明，添加字幕与原视频文件融合，成为视频本身的一部分，这样可以增加用户观看体验，提升用户感受。

目前，一般采用如下两种情景化字幕的生成方式：第一、人工生成方式。这样主观性太强，准确性较差，容易产生不合适的配对；第二、服务器生成方式。首先由服务器确定出目标视频中各个播放内容对应的情景化字幕，然后将各个播放内容对应的情景化字幕固定地添加到各个播放内容中。由于服务器固定地将情景化字幕添加到各个播放内容中，针对不同的观看用户展现的情景化字幕是固定不变的，不能动态地在各个播放内容中添加情景化字幕。

在实现本发明的过程中，发明人发现现有技术中至少存在如下问题：

在现有的第一种情景化字幕的生成方法中，主观性太强，准确性较差，容易产生不合适的配对；在现有的第二种情景化字幕的生成方法中，服务器固定地将情景化字幕添加到各个播放内容中，针对不同的观看用户展现的情景化字幕是固定不变的，用户观看效果较差，影响用户观看体验。

发明内容

为解决上述技术问题，本发明实施例提供一种情景化字幕的生成方法、装置、电子设备及存储介质，情景化字幕更加多样化，方便用户使用，提升用户收听体验。

为达到上述目的，本发明实施例的技术方案是这样实现的：

第一方面，本发明实施例提供了一种情景化字幕的生成方法，所述方法包括：

在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求；

确定所述情景化字幕的生成请求对应的情景化字幕；

将所述情景化字幕添加到所述当前播放视频中。

在上述实施例中，所述确定所述情景化字幕的生成请求对应的情景化字幕，包括：

在所述情景化字幕的生成请求中提取出当前用户预先设置的情景化字幕；将所述当前用户预先设置的情景化字幕确定为所述情景化字幕的生成请求对应的情景化字幕；或者，

响应于所述情景化字幕的生成请求对所述当前播放视频进行图像识别，获取到所述当前播放视频对应的图像识别结果；根据所述当前播放视频对应的图像识别结果确定所述情景化字幕的生成请求对应的情景化字幕；或者，将通过策略确定出的用户评论转换为所述情景化字幕的生成请求对应的情景化字幕；或者，将所述当前用户浏览页面的特征转换为所述情景化字幕的生成请求对应的情景化字幕；或者，将所述当前用户通过消费数据在所述当前播放视频选择的字幕确定为所述情景化字幕的生成请求对应的情景化字幕。

在上述实施例中，所述响应于所述情景化字幕的生成请求对所述当前播放视频进行图像识别，获取到所述当前播放视频对应的图像识别结果，包括：

响应于所述情景化字幕的生成请求对所述当前播放视频进行物体识别，获取到当前播放视频对应的物体识别结果；或者，

响应于所述情景化字幕的生成请求对所述当前播放视频进行人脸识别，获取到当前播放视频对应的人脸识别结果；或者，

响应于所述情景化字幕的生成请求对所述当前播放视频进行场景识别，获取到当前播放视频对应的场景识别结果。

在上述实施例中，所述将所述情景化字幕添加到所述当前播放视频中，包括：

将所述情景化字幕转换为预设格式的目标情景化字幕；其中，所述预设格式包括：预设字体、预设大小和预设颜色；

将所述目标情景化字幕添加到所述当前播放视频中。

第二方面，本发明实施例提供了一种情景化字幕的生成装置，所述装置包括：接收模块、确定模块和添加模块；其中，

所述接收模块，用于在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求；

所述确定模块，用于确定所述情景化字幕的生成请求对应的情景化字幕；

所述添加模块，用于将所述情景化字幕添加到所述当前播放视频中。

在上述实施例中，所述确定模块，具体用于在所述情景化字幕的生成请求中提取出当前用户预先设置的情景化字幕；将所述当前用户预先设置的情景化字幕确定为所述情景化字幕的生成请求对应的情景化字幕；或者，响应于所述情景化字幕的生成请求对所述当前播放视频进行图像识别，获取到所述当前播放视频对应的图像识别结果；根据所述当前播放视频对应的图像识别结果确定所述情景化字幕的生成请求对应的情景化字幕；或者，将通过策略确定出的用户评论转换为所述情景化字幕的生成请求对应的情景化字幕；或者，将所述当前用户浏览页面的特征转换为所述情景化字幕的生成请求对应的情景化字幕；或者，将所述当前用户通过消费数据在所述当前播放视频选择的字幕确定为所述情景化字幕的生成请求对应的情景化字幕。

在上述实施例中，所述确定模块，具体用于响应于所述情景化字幕的生成请求对所述当前播放视频进行物体识别，获取到当前播放视频对应的物体识别结果；或者，响应于所述情景化字幕的生成请求对所述当前播放视频进行人脸识别，获取到当前播放视频对应的人脸识别结果；或者，响应于所述情景化字幕的生成请求对所述当前播放视频进行场景识别，获取到当前播放视频对应的场景识别结果。

在上述实施例中，所述添加模块，具体用于将所述情景化字幕转换为预设格式的目标情景化字幕；其中，所述预设格式包括：预设字体、预设大小和预设颜色；将所述目标情景化字幕添加到所述当前播放视频中。

第三方面，本发明实施例提供了一种电子设备，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明任意实施例所述的情景化字幕的生成方法。

第四方面，本发明实施例提供了一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明任意实施例所述的情景化字幕的生成方法。

本发明实施例提出了一种情景化字幕的生成方法、装置、电子设备及存储介质，可以在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求；然后确定情景化字幕的生成请求对应的情景化字幕；再将情景化字幕添加到当前播放视频中。也就是说，在本发明的技术方案中，可以在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求；然后确定出不同的情景化字幕的生成请求对应的情景化字幕。而在现有的第一种情景化字幕的生成方法中，主观性太强，准确性较差，容易产生不合适的配对；在现有的第二种情景化字幕的生成方法中，服务器固定地将情景化字幕添加到各个播放内容中，针对不同的观看用户展现的情景化字幕是固定不变的，用户观看效果较差，影响用户观看体验。因此，和现有技术相比，本发明实施例提出的情景化字幕的生成方法、装置、电子设备及存储介质，情景化字幕更加多样化，方便用户使用，提升用户收听体验；并且，本发明实施例的技术方案实现简单方便、便于普及，适用范围更广。

附图说明

图1为本发明实施例一提供的情景化字幕的生成方法的流程示意图；

图2为本发明实施例二提供的情景化字幕的生成方法的流程示意图；

图3为本发明实施例三提供的情景化字幕的生成方法的流程示意图；

图4为本发明实施例四提供的情景化字幕的生成方法的流程示意图；

图5为本发明实施例五提供的情景化字幕的生成装置的结构示意图；

图6为本发明实施例六提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

实施例一

图1为本发明实施例一提供的情景化字幕的生成方法的流程示意图。如图1所示，情景化字幕的生成方法可以包括以下步骤：

步骤101、在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求。

在本发明的具体实施例中，电子设备可以在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求。具体地，电子设备可以接收当前播放视频的编辑用户通过客户端发送的情景化字幕的生成请求；或者，电子设备也可以接收当前播放视频的观看用户通过客户端发送的情景化字幕的生成请求；或者，电子设备还可以接收机器理解模块通过客户端发送的情景化字幕的生成请求；或者，电子设备还可以接收视频理解模块通过客户端发送的情景化字幕的生成请求。

步骤102、确定情景化字幕的生成请求对应的情景化字幕。

在本发明的具体实施例中，电子设备可以在情景化字幕的生成请求中提取出当前用户预先设置的情景化字幕；将当前用户预先设置的情景化字幕确定为情景化字幕的生成请求对应的情景化字幕；或者，电子设备也可以响应于情景化字幕的生成请求对当前播放视频进行图像识别，获取到当前播放视频对应的图像识别结果；根据当前播放视频对应的图像识别结果确定情景化字幕的生成请求对应的情景化字幕；或者，电子设备还可以将通过策略确定出的用户评论转换为情景化字幕的生成请求对应的情景化字幕；或者，电子设备还可以将当前用户浏览页面的特征转换为情景化字幕的生成请求对应的情景化字幕；或者，电子设备还可以将当前用户通过消费数据在当前播放视频选择的字幕确定为情景化字幕的生成请求对应的情景化字幕。

步骤103、将情景化字幕添加到当前播放视频中。

在本发明的具体实施例中，电子设备可以将情景化字幕添加到当前播放视频中。具体地，电子设备可以先将情景化字幕转换为预设格式的目标情景化字幕；其中，预设格式包括：预设字体、预设大小和预设颜色；然后将目标情景化字幕添加到当前播放视频中。

本发明实施例提出的情景化字幕的生成方法，可以在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求；然后确定情景化字幕的生成请求对应的情景化字幕；再将情景化字幕添加到当前播放视频中。也就是说，在本发明的技术方案中，可以在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求；然后确定出不同的情景化字幕的生成请求对应的情景化字幕。而在现有的第一种情景化字幕的生成方法中，主观性太强，准确性较差，容易产生不合适的配对；在现有的第二种情景化字幕的生成方法中，服务器固定地将情景化字幕添加到各个播放内容中，针对不同的观看用户展现的情景化字幕是固定不变的，用户观看效果较差，影响用户观看体验。因此，和现有技术相比，本发明实施例提出的情景化字幕的生成方法，情景化字幕更加多样化，方便用户使用，提升用户收听体验；并且，本发明实施例的技术方案实现简单方便、便于普及，适用范围更广。

实施例二

图2为本发明实施例二提供的情景化字幕的生成方法的流程示意图。如图2所示，情景化字幕的生成方法可以包括以下步骤：

步骤201、在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求。

步骤202、在情景化字幕的生成请求中提取出当前用户预先设置的情景化字幕；将当前用户预先设置的情景化字幕确定为情景化字幕的生成请求对应的情景化字幕。

在本发明的具体实施例中，电子设备可以在情景化字幕的生成请求中提取出当前用户预先设置的情景化字幕；将当前用户预先设置的情景化字幕确定为情景化字幕的生成请求对应的情景化字幕。具体地，当前用户可以上传视频的编辑页面，点击字下方字幕按钮，可进入字幕添加页面；在字幕添加页面，点击某一个字幕，视频预览框出现字幕输入框，点击字幕可掉起键盘输入情景字幕；支持多个字幕样式与颜色，对于编辑态字幕，点击其他字幕样式可变换样式与颜色；一个视频可以添加多个字幕；字幕出现时间可以人为控制，可操作下方的时间轴，选择字幕开始的时间点与字幕持续时间，两个字幕出现时间可以全部或者部分重叠。此外，当前用户在浏览视频过程中，对于自己感兴趣的内容，可点击添加字幕按钮，进入字幕添加页面；在字幕添加页面，点击某一个字幕，视频预览框出现字幕输入框，点击字幕可掉起键盘输入情景字幕；支持多个字幕样式与颜色，对于编辑态字幕，点击其他字幕样式可变换样式与颜色；一个视频可以添加多个字幕；字幕出现时间可以人为控制，可操作下方的时间轴，选择字幕开始的时间点与字幕持续时间，两个字幕出现时间可以全部或者部分重叠。因此，在当前播放视频的播放过程中，电子设备可以在情景化字幕的生成请求中提取出当前用户预先设置的情景化字幕；然后将当前用户预先设置的情景化字幕确定为情景化字幕的生成请求对应的情景化字幕。

步骤203、将情景化字幕添加到当前播放视频中。

实施例三

图3为本发明实施例三提供的情景化字幕的生成方法的流程示意图。如图3所示，情景化字幕的生成方法可以包括以下步骤：

步骤301、在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求。

步骤302、响应于情景化字幕的生成请求对当前播放视频进行图像识别，获取到当前播放视频对应的图像识别结果；根据当前播放视频对应的图像识别结果确定情景化字幕的生成请求对应的情景化字幕。

在本发明的具体实施例中，电子设备可以响应于情景化字幕的生成请求对当前播放视频进行图像识别，获取到当前播放视频对应的图像识别结果。具体地，电子设备可以响应于情景化字幕的生成请求对当前播放视频进行物体识别，获取到当前播放视频对应的物体识别结果；或者，电子设备还可以响应于情景化字幕的生成请求对当前播放视频进行人脸识别，获取到当前播放视频对应的人脸识别结果；或者，电子设备还可以响应于情景化字幕的生成请求对当前播放视频进行场景识别，获取到当前播放视频对应的场景识别结果；然后根据当前播放视频对应的图像识别结果确定情景化字幕的生成请求对应的情景化字幕。

步骤303、将情景化字幕转换为预设格式的目标情景化字幕；其中，预设格式包括：预设字体、预设大小和预设颜色。

在本发明的具体实施例中，电子设备可以将情景化字幕转换为预设格式的目标情景化字幕；其中，预设格式包括：预设字体、预设大小和预设颜色。具体地，用户可以将情景化字幕进行格式转换，将情景化字幕从当前格式转换为目标格式。例如，用户可以将情景化字幕进行字体转换；或者，将情景化字幕进行大小转换；或者，将情景化字幕进行颜色转换。

步骤304、将目标情景化字幕添加到当前播放视频中。

在本发明的具体实施例中，电子设备可以将目标情景化字幕添加到当前播放视频中。此外，电子设备还可以接收用户发送的字幕选择指令，然后响应于该字幕选择指令在当前播放视频中选择相对应的情景化字幕。

实施例四

图4为本发明实施例四提供的情景化字幕的生成方法的流程示意图。如图4所示，情景化字幕的生成方法可以包括以下步骤：

步骤401、在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求。

步骤402、将通过策略确定出的用户评论转换为情景化字幕的生成请求对应的情景化字幕；或者，将当前用户浏览页面的特征转换为情景化字幕的生成请求对应的情景化字幕；或者，将当前用户通过消费数据在当前播放视频选择的字幕确定为情景化字幕的生成请求对应的情景化字幕。

在本发明的具体实施例中，电子设备可以将通过策略确定出的用户评论转换为情景化字幕的生成请求对应的情景化字幕；或者，还可以将当前用户浏览页面的特征转换为情景化字幕的生成请求对应的情景化字幕；或者，还可以将当前用户通过消费数据在当前播放视频选择的字幕确定为情景化字幕的生成请求对应的情景化字幕。具体地，电子设备可以先将全部用户评论进行排名，然后将排名靠前的若干个用户评论转换为情景化字幕的生成请求对应的情景化字幕。

步骤403、将情景化字幕转换为预设格式的目标情景化字幕；其中，预设格式包括：预设字体、预设大小和预设颜色。

步骤404、将目标情景化字幕添加到当前播放视频中。

实施例五

图5为本发明实施例五提供的情景化字幕的生成装置的结构示意图。如图5所示，本发明实施例所述的情景化字幕的生成装置可以包括：接收模块501、确定模块502和添加模块503；其中，

所述接收模块501，用于在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求；

所述确定模块502，用于确定所述情景化字幕的生成请求对应的情景化字幕；

所述添加模块503，用于将所述情景化字幕添加到所述当前播放视频中。

进一步的，所述确定模块502，具体用于在所述情景化字幕的生成请求中提取出当前用户预先设置的情景化字幕；将所述当前用户预先设置的情景化字幕确定为所述情景化字幕的生成请求对应的情景化字幕；或者，响应于所述情景化字幕的生成请求对所述当前播放视频进行图像识别，获取到所述当前播放视频对应的图像识别结果；根据所述当前播放视频对应的图像识别结果确定所述情景化字幕的生成请求对应的情景化字幕；或者，将通过策略确定出的用户评论转换为所述情景化字幕的生成请求对应的情景化字幕；或者，将所述当前用户浏览页面的特征转换为所述情景化字幕的生成请求对应的情景化字幕；或者，将所述当前用户通过消费数据在所述当前播放视频选择的字幕确定为所述情景化字幕的生成请求对应的情景化字幕。

进一步的，所述确定模块502，具体用于响应于所述情景化字幕的生成请求对所述当前播放视频进行物体识别，获取到当前播放视频对应的物体识别结果；或者，响应于所述情景化字幕的生成请求对所述当前播放视频进行人脸识别，获取到当前播放视频对应的人脸识别结果；或者，响应于所述情景化字幕的生成请求对所述当前播放视频进行场景识别，获取到当前播放视频对应的场景识别结果。

进一步的，所述添加模块503，具体用于将所述情景化字幕转换为预设格式的目标情景化字幕；其中，所述预设格式包括：预设字体、预设大小和预设颜色；将所述目标情景化字幕添加到所述当前播放视频中。

上述情景化字幕的生成装置可执行本发明任意实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明任意实施例提供的情景化字幕的生成方法。

实施例六

图6为本发明实施例六提供的电子设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性电子设备的框图。图6显示的电子设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，***存储器28，连接不同***组件(包括***存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，***总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。

电子设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被电子设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

***存储器28可以包括易失性存储器形式的计算机***可读介质，例如随机存取存储器(RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例，存储***34可以用于读写不可移动的、非易失性磁介质(图6未显示，通常称为“硬盘驱动器”)。尽管图6中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM，DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该电子设备12交互的设备通信，和/或与使得该电子设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与电子设备12的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。

处理单元16通过运行存储在***存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的情景化字幕的生成方法。

实施例七

本发明实施例七提供了一种计算机存储介质。

本发明实施例的计算机可读存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。

Claims

1.一种情景化字幕的生成方法，应用于电子设备，其特征在于，所述方法包括：

在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求；其中，所述请求方包括机器理解模块或视频理解模块；

确定所述情景化字幕的生成请求对应的情景化字幕；

将所述情景化字幕添加到所述当前播放视频中；

接收用户发送的字幕选择指令，并响应于所述字幕选择指令在所述当前播放视频中选择相对应的情景化字幕；

其中，所述确定所述情景化字幕的生成请求对应的情景化字幕，包括：

2.根据权利要求1所述的方法，其特征在于，所述响应于所述情景化字幕的生成请求对所述当前播放视频进行图像识别，获取到所述当前播放视频对应的图像识别结果，包括：

3.根据权利要求1所述的方法，其特征在于，所述将所述情景化字幕添加到所述当前播放视频中，包括：

将所述目标情景化字幕添加到所述当前播放视频中。

4.一种情景化字幕的生成装置，应用于电子设备，其特征在于，所述装置包括：接收模块、确定模块和添加模块；其中，

所述接收模块，用于在当前播放视频的播放过程中接收不同的请求方通过客户端发送的情景化字幕的生成请求；其中，所述请求方包括机器理解模块或视频理解模块；

所述添加模块，用于将所述情景化字幕添加到所述当前播放视频中；接收用户发送的字幕选择指令，并响应于所述字幕选择指令在所述当前播放视频中选择相对应的情景化字幕；

其中，所述确定模块，具体用于在所述情景化字幕的生成请求中提取出当前用户预先设置的情景化字幕；将所述当前用户预先设置的情景化字幕确定为所述情景化字幕的生成请求对应的情景化字幕；或者，响应于所述情景化字幕的生成请求对所述当前播放视频进行图像识别，获取到所述当前播放视频对应的图像识别结果；根据所述当前播放视频对应的图像识别结果确定所述情景化字幕的生成请求对应的情景化字幕；或者，将通过策略确定出的用户评论转换为所述情景化字幕的生成请求对应的情景化字幕；或者，将所述当前用户浏览页面的特征转换为所述情景化字幕的生成请求对应的情景化字幕；或者，将所述当前用户通过消费数据在所述当前播放视频选择的字幕确定为所述情景化字幕的生成请求对应的情景化字幕。

5.根据权利要求4所述的装置，其特征在于：

所述确定模块，具体用于响应于所述情景化字幕的生成请求对所述当前播放视频进行物体识别，获取到当前播放视频对应的物体识别结果；或者，响应于所述情景化字幕的生成请求对所述当前播放视频进行人脸识别，获取到当前播放视频对应的人脸识别结果；或者，响应于所述情景化字幕的生成请求对所述当前播放视频进行场景识别，获取到当前播放视频对应的场景识别结果。

6.根据权利要求4所述的装置，其特征在于：

所述添加模块，具体用于将所述情景化字幕转换为预设格式的目标情景化字幕；其中，所述预设格式包括：预设字体、预设大小和预设颜色；将所述目标情景化字幕添加到所述当前播放视频中。

7.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1至3中任一项所述的情景化字幕的生成方法。

8.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至3中任一项所述的情景化字幕的生成方法。