CN111797273B

CN111797273B - 用于调整参数的方法和装置

Info

Publication number: CN111797273B
Application number: CN201910277782.6A
Authority: CN
Inventors: �田�浩; 卢大明; 陈曦; 王健宇
Original assignee: Baidu com Times Technology Beijing Co Ltd; Baidu USA LLC
Current assignee: Baidu com Times Technology Beijing Co Ltd; Baidu USA LLC
Priority date: 2019-04-08
Filing date: 2019-04-08
Publication date: 2024-04-23
Anticipated expiration: 2039-04-08
Also published as: JP6921925B2; JP2020174341A; US10699127B1; CN111797273A

Abstract

本申请实施例公开了用于调整参数的方法和装置。该方法的一具体实施方式包括：获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数；对至少一个参数的当前取值进行特征提取，得到特征表示；将特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数；将特征表示和预测视频评价分数输入预先训练的行动网络，得到当前行动信息；根据当前行动信息，调整至少一个参数的当前取值。该实施方式实现根据所生成的视频的视频评价分数，对为新闻簇生成解说词对应的视频过程中的至少一个参数进行调整。

Description

用于调整参数的方法和装置

技术领域

本申请实施例涉及计算机技术领域，具体涉及用于调整参数的方法和装置。

背景技术

随着网络技术的发展，世界各地的各类新闻可以通过各种媒体发布给用户。对于同一个新闻事件，各种媒体(例如新闻类网站或者新闻类应用)会编辑出不同的新闻，不同媒体发出的新闻的侧重点会存在一定的差异，但是报道同一新闻事件的各个新闻中也会存在或多或少的重合信息。

对于用户来说，可能需要阅读多篇新闻报道才能从中提取出自己想要的信息，这就会导致用户的获取新闻的效率较低。为了帮助用户提高新闻获取的效率，可以对同一新闻事件的多篇新闻进行聚合，去除多篇新闻中的冗余信息，提取针对新闻事件的解说词。

发明内容

本申请实施例提出了用于调整参数的方法和装置。

第一方面，本申请实施例提供了一种用于调整参数的方法，该方法包括：获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数；对至少一个参数的当前取值进行特征提取，得到特征表示；将特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数；将特征表示和预测视频评价分数输入预先训练的行动网络，得到当前行动信息；根据当前行动信息，调整至少一个参数的当前取值。

在一些实施例中，在调整至少一个参数的当前取值之后，方法还包括：按照至少一个参数的当前取值，生成与目标新闻簇的解说词对应的视频。

在一些实施例中，行动网络和评价网络是通过如下训练步骤预先训练得到的：确定初始行动网络的网络结构以及初始化初始行动网络的网络参数；确定初始评价网络的网络结构以及初始化初始评价网络的网络参数；初始化至少一个参数的当前取值；执行以下参数调整步骤直到满足预设训练结束条件：获取与至少一个参数的当前取值对应的标注视频评价分数，其中，所获取的标注视频评价分数为基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数；将样本特征表示和标注视频评价分数输入初始评价网络，得到样本预测视频评价分数；将样本特征表示和样本预测视频评价分数输入初始行动网络，得到预测行动信息；根据预测行动信息调整至少一个参数的当前取值；根据样本预测视频评价分数和所获取的标注视频评价分数之间的差异调整评价网络的网络参数，以及以最大化所获取的标注视频评价分数为优化目标，调整行动网络的网络参数；将初始行动网络和初始评价网络分别确定为预先训练的行动网络和评价网络。

在一些实施例中，该方法还包括：响应于接收到终端设备发送的用于指示播放与目标新闻簇的解说词对应的视频的播放请求，将与目标新闻簇的解说词对应的视频发送给终端设备。

在一些实施例中，在将与目标新闻簇的解说词对应的视频发送给终端设备之后，该方法还包括：控制终端设备对所收到的视频进行呈现。

在一些实施例中，确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数，包括：获取至少一个用户观看至少一个目标视频的观看行为信息，其中，目标视频为基于新闻簇按照至少一个参数的当前取值生成的视频；对于所获取的每个观看行为信息，确定与该观看行为信息对应的视频评价分数；将所确定的各个视频评价分数的平均值确定为基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数。

在一些实施例中，观看行为信息包括以下至少一项：视频标识、用户标识、用户画像信息、是否打开视频、视频观看总时长、关闭视频时的视频播放时间。

第二方面，本申请实施例提供了一种用于调整参数的装置，该装置包括：参数当前取值获取单元，被配置成获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；视频评价分数确定单元，被配置成确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数；特征提取单元，被配置成对至少一个参数的当前取值进行特征提取，得到特征表示；第一输入单元，被配置成将特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数；第二输入单元，被配置成将特征表示和预测视频评价分数输入预先训练的行动网络，得到当前行动信息；调整单元，被配置成根据当前行动信息，调整至少一个参数的当前取值。

在一些实施例中，该装置还包括：视频生成单元，被配置成在调整至少一个参数的当前取值之后，按照至少一个参数的当前取值，生成与目标新闻簇的解说词对应的视频。

在一些实施例中，该装置还包括：视频发送单元，被配置成响应于接收到终端设备发送的用于指示播放与目标新闻簇的解说词对应的视频的播放请求，将与目标新闻簇的解说词对应的视频发送给终端设备。

在一些实施例中，该装置还包括：控制单元，被配置成在将与目标新闻簇的解说词对应的视频发送给终端设备之后，控制终端设备对所收到的视频进行呈现。

在一些实施例中，视频评价分数确定单元包括：观看行为信息获取模块，被配置成获取至少一个用户观看至少一个目标视频的观看行为信息，其中，目标视频为基于新闻簇按照至少一个参数的当前取值生成的视频；第一确定模块，被配置成对于所获取的每个观看行为信息，确定与该观看行为信息对应的视频评价分数；第二确定模块，被配置成将所确定的各个视频评价分数的平均值确定为基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数。

第三方面，本申请实施例提供了一种服务器，包括：一个或多个处理器；存储装置，其上存储有一个或多个程序，当上述一个或多个程序被上述一个或多个处理器执行时，使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，其中，该计算机程序被一个或多个处理器执行时实现如第一方面中任一实现方式描述的方法。

第五方面，本申请实施例提供了另一种服务器，包括：接口；存储器，其上存储有一个或多个程序；以及一个或多个处理器，在操作上连接到上述接口和上述存储器，用于：获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数；对至少一个参数的当前取值进行特征提取，得到特征表示；将特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数；将特征表示和预测视频评价分数输入预先训练的行动网络，得到当前行动信息；根据当前行动信息，调整至少一个参数的当前取值。

第六方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，其中，当上述计算机程序被一个或多个处理器执行时，使得上述一个或多个处理器：获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数；对至少一个参数的当前取值进行特征提取，得到特征表示；将特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数；将特征表示和预测视频评价分数输入预先训练的行动网络，得到当前行动信息；根据当前行动信息，调整所述至少一个参数的当前取值。

为了提高用户获取新闻的效率，现有技术中往往会为新闻簇生成解说词，用户需要阅读文字形式的解说词来获取新闻摘要，没有为解说词生成对应的视频。而本申请实施例提供的用于调整参数的方法和装置，通过首先获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值，再确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数，而后对至少一个参数的当前取值进行特征提取，得到特征表示，接着将特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数，然后将特征表示和预测视频评价分数输入预先训练的行动网络，得到当前行动信息，最后根据当前行动信息，调整至少一个参数的当前取值。从而可以实现根据为新闻簇生成解说词对应的视频的视频评价分数，对视频生成过程中的至少一个参数进行调整，进而可以提高后续按照调整后的参数所生成的与新闻簇的解说词对应的视频的视频评价。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请的一个实施例可以应用于其中的示例性***架构图；

图2是根据本申请的用于调整参数的方法的一个实施例的流程图；

图3是根据本申请的训练步骤的一个实施例的流程图；

图4是根据本申请的用于调整参数的方法的一个应用场景的示意图；

图5是根据本申请的用于调整参数的方法的又一个实施例的流程图；

图6是根据本申请的用于调整参数的装置的一个实施例的结构示意图；

图7是适于用来实现本申请实施例的服务器的计算机***的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的用于调整参数的方法或用于调整参数的装置的实施例的示例性***架构100。

如图1所示，***架构100可以包括终端设备101、102、103，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是硬件，也可以是软件。当终端设备101、102、103为硬件时，可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时，可以安装在上述所列举的电子设备中。其可以实现成多个软件或软件模块，也可以实现成单个软件或软件模块。在此不做具体限定。

服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上显示的新闻类网站提供支持的后台网站服务器。后台网站服务器可以对接收到的新闻类页面请求等数据进行分析等处理，并将处理结果(例如新闻类网页页面数据)反馈给终端设备。

需要说明的是，本申请实施例所提供的用于调整参数的方法一般由服务器105执行，相应地，用于调整参数的装置一般设置于服务器105中。

需要说明的是，服务器105可以是硬件，也可以是软件。当服务器105为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器105为软件时，可以实现成多个软件或软件模块(例如用来提供新闻网页页面服务)，也可以实现成单个软件或软件模块，在此不做具体限定。

应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。

继续参考图2，其示出了根据本申请的用于调整参数的方法的一个实施例的流程200。该用于调整参数的方法，包括以下步骤：

步骤201，获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值。

在本实施例中，用于调整参数的方法的执行主体(例如图1所示的服务器)可以本地或者远程地从与上述执行主体网络连接的其他电子设备获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值。

这里，新闻簇中的各个新闻针对同一个新闻事件，不同新闻簇所针对的新闻事件不同。新闻事件可以是最近第一预设时长内(例如，三个月之内)发生的事件。

这里，新闻可以是各种形式的针对新闻事件的电子数据，且新闻均可以对应标记有对应的生成时间。新闻可以包括以下至少一项：文本、图像、音频和视频。例如，新闻可以是网页，新闻也可以是各种文档，文档中可以包括以下至少一项：文本、图像、音频和视频。新闻还可以仅仅是文本、图像或者视频。

实践中，所获取的新闻可以标记有对应的新闻事件。这样，上述执行主体可以首先获取最近第二预设时长内(例如，一天之内)所生成的新闻，然后将所获取的至少一个新闻按照对应的新闻事件的不同组成不同的新闻簇。

可以理解的是，当所获取的新闻没有标记对应的新闻事件时，上述执行主体可以首先获取最近第二预设时长内(例如，一天之内)所生成的新闻，然后对所获取的新闻采用各种实现方式进行聚类，将聚类到同一类别的新闻组成一个新闻簇，不同聚类的新闻属于不同的新闻簇，继而可以得到至少一个新闻簇。例如，实践中，新闻一般都会有新闻标题，上述执行主体可以对所获取的各个新闻的新闻标题进行聚类，将新闻标题的聚类作为该新闻标题对应的新闻的聚类。

由于新闻簇中的各个新闻针对同一个新闻事件，为了提高用户获取新闻的效率，可以采用各种实现方式基于新闻簇生成新闻簇的解说词对应的视频。在基于新闻簇生成新闻簇的解说词对应的视频的过程中，会涉及到一些参数，参数的取值不同，所生成的视频也会不同，继而用户观看所生成的视频的评价也会不同。为了使得用户愿意观看所生成的视频，可以调整基于新闻簇生成新闻簇的解说词对应的视频的过程中的至少一个参数的参数取值，以使得基于新闻簇生成的新闻簇的解说词对应的视频是用户愿意观看的。这里，可以首先获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值。

作为示例，至少一个参数可以包括以下至少一项：至少一个预设新闻类别中每个类别的偏好指数，图像类型的素材资源在视频中的预设播放时长，语音合成过程中的预设最快语速，所要生成的视频的最长播放时长，视频类型素材资源的预设最短播放时长，候选素材资源与解说词之间的匹配度的最小匹配度阈值。

步骤202，确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数。

在本实施例中，上述执行主体可以采用各种实现方式确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数。这里，视频的视频评价分数反映了用户对视频的各方面进行评价的综合分数，例如，视频评价分数可以反映以下至少一项：用户是否愿意观看该视频、所生成的视频与解说词的匹配程度，所生成的视频与人工剪辑的视频的匹配程度，所生成的视频与新闻簇所针对的新闻事件的匹配程度。

在本实施例的一些可选实现方式中，可以在上述执行主体或者与上述执行主体网络连接的其他电子设备上为用户提供针对基于新闻簇按照至少一个参数的当前取值生成的视频进行评价的用户界面。然后上述执行主体可以本地或者远程地从上述电子设备接收用户在上述用户界面上针对基于新闻簇按照至少一个参数的当前取值生成的视频输入的评价分数。这样，上述执行主体可以获取至少一个用户观看基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数，再将所获取的各视频评价分数的均值确定为基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数。

在本实施例的一些可选实现方式中，步骤202也可以如下进行：

首先，获取至少一个用户观看至少一个目标视频的观看行为信息。这里，目标视频为基于新闻簇按照至少一个参数的当前取值生成的视频。其中，观看行为信息用于表征用户观看目标视频过程中的各种行为。

在一些实现方式中，观看行为信息可以包括以下至少一项：视频标识、用户标识、用户画像信息、是否打开视频标识、视频观看总时长、关闭视频时的视频播放时间。其中，视频标识用于唯一指示基于新闻簇按照至少一个参数的当前取值生成的视频。用户标识用于唯一指示观看基于新闻簇按照至少一个参数的当前取值生成的视频的用户。用户画像信息用于描述用户的各种相关信息。例如，用户画像信息可以包括但不限于用户的性别、年龄、兴趣爱好、出生地、工作地点、生活地点、职业、消费习惯、生活习惯等等。是否打开视频标识用于指示用户标识所指示的用户是否打开了视频标识所指示的视频。视频观看总时长用于指示用户标识所指示的用户观看视频标识所指示的视频的总时长。关闭视频时的视频播放时间用于指示用户标识所指示的用户关闭视频标识所指示的视频时该视频的当前播放时间。

然后，对于所获取的每个观看行为信息，确定与该观看行为信息对应的视频评价分数。

这里，可以采用各种实现方式对于所获取的每个观看行为信息，确定与该观看行为信息对应的视频评价分数。

在一些实现方式中，可以为观看行为信息所包括的视频评价有关的每一项预设对应的权重，然后计算观看行为信息中与视频评价有关的每一项的取值和对应权重的加权求和结果，并将加权求和结果确定为该观看行为信息对应的视频评价分数。例如，当是否打开视频标识为0表示用户没有打开视频，当是否打开视频标识为1表示用户打开了视频，可以设置与是否打开视频标识对应的权重使得是否打开视频标识与视频评价分数正相关。又例如，也可以设置与视频观看总时长对应的权重使得视频观看总时长与视频评价分数正相关，还可以设置与关闭视频时的视频播放时间对应的权重使得关闭视频时的视频播放时间与视频评价分数正相关。又例如，当观看行为信息可以包括是否转发标识、是否点赞标识等用于表明用户喜欢该视频继而作出了相应的喜欢该视频的操作时，也可类似于是否打开视频标识一样，当是否转发标识为0表示用户没有转发视频，当是否转发标识为1表示用户转发了视频，可以设置与是否转发标识对应的权重使得是否转发标识与视频评价分数正相关。同样的操作也可以应用于是否点赞标识，在此不再赘述。

在一些实现方式中，还可以将视频观看总时长与视频标识所指示的视频的播放时长的比值确定为与该观看行为信息对应的视频评价分数。

最后，将所确定的各个视频评价分数的平均值确定为基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数。

步骤203，对至少一个参数的当前取值进行特征提取，得到特征表示。

在本实施例中，上述执行主体可以采用各种实现方式对至少一个参数的当前取值进行特征提取，得到特征表示。这里，特征表示可以是各种形式的，例如特征表示可以是向量形式的，即特征向量。实践中，特征表示相对于至少一个参数的当前取值呈现维数更低以及可计算的特点。

可以理解的是，由于生成与新闻簇的解说词对应的视频过程中的所涉及的参数不同，相应的对至少一个参数的当前取值进行特征提取的方法也可以不同。例如，可以采用主成分分析(Principal Component Analysis，PCA)、独立分量分析(Independent ComponentAnalysis，ICA)和线性判别分析(Linear Discriminant Analysis，LDA)等方法进行特征提取。

步骤204，将特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数。

在本实施例中，上述执行主体可以将步骤203所生成的特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数。其中，上述评价网络可以为人工神经网络(Artificial Neural Network，ANN)。需要说明的是，上述评价网络用于表征特征表示和视频评价分数二者与预测视频评价分数之间的对应关系。

步骤205，将特征表示和预测视频评价分数输入预先训练的行动网络，得到当前行动信息。

在本实施例中，上述执行主体可以将步骤203所生成的特征表示和步骤204所生成的预测视频评价分数输入预先训练的行动网络，得到当前行动信息。这里，上述行动网络也可以为人工神经网络。需要说明的是，上述行动网络用于表征特征表示和视频评价分数二者与行动信息之间的对应关系，这里，行动信息用于指示如何调整基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值。

在一些实现方式中，上述行动网络和评价网络可以是通过训练步骤预先训练得到的。请参考图3，图3示出了根据本申请的预先训练行动网络和评价网络的训练步骤的一个实施例的流程300。该训练步骤可以包括以下步骤301到步骤305：

步骤301，确定初始行动网络的网络结构以及初始化初始行动网络的网络参数。

这里，训练步骤的执行主体可以与用于调整参数的方法的执行主体相同或者不同。如果相同，则训练步骤的执行主体可以在训练得到行动网络和评价网络后将训练好的行动网络和评价网络的网络结构信息和网络参数的参数值存储在本地。如果不同，则训练步骤的执行主体可以在训练得到行动网络和评价网络后将训练好的行动网络和评价网络的网络结构信息和网络参数的参数值发送给用于调整参数的方法的执行主体。

这里，训练步骤的执行主体可以首先确定初始行动网络的网络结构。这里，初始行动网络可以为人工神经网络，则这里可以确定初始行动网络包括哪些层，层与层之间的连接顺序关系，以及每层都包括哪些神经元，每个神经元对应的权重和偏置，每层的激活函数等等。可以理解的是，初始行动网络可以包括各种类型的神经网络，对于不同类型的神经网络所需要确定的网络结构也不相同。

然后，训练步骤的执行主体可以初始化初始行动网络的网络参数。实践中，可以将初始行动网络的各个网络参数(例如，权重参数和偏置参数)用一些不同的小随机数进行初始化。“小随机数”用来保证网络不会因权重过大而进入饱和状态，从而导致训练失败，“不同”用来保证网络可以正常地学习。

步骤302，确定初始评价网络的网络结构以及初始化初始评价网络的网络参数。

这里，训练步骤的执行主体可以首先确定初始评价网络的网络结构。然后，训练步骤的执行主体可以初始化初始评价网络的网络参数。

这里，初始评价网络也可以为人工神经网络，关于如何确定人工神经网络的网络结构和初始化人工神经网络的网络参数可以参考步骤301中的相关说明，在此不再赘述。

步骤303，初始化至少一个参数的当前取值。

这里，训练步骤的执行主体可以对基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值进行初始化。

步骤304，执行参数调整步骤直到满足预设训练结束条件。

这里，训练步骤的执行主体可以执行参数调整步骤直到满足预设训练结束条件，而参数调整步骤可以包括子步骤3041到子步骤3046：

子步骤3041，对至少一个参数的当前取值进行特征提取，得到样本特征表示。

子步骤3042，获取与至少一个参数的当前取值对应的标注视频评价分数。

这里，训练步骤的执行主体可以本地或者远程地从与训练步骤的执行主体网络连接的其他电子设备获取与至少一个参数的当前取值对应的标注视频评价分数。这里，与至少一个参数的当前取值对应的标注视频评价分数可以是由人工在观看基于新闻簇按照至少一个参数的当前取值生成的视频之后，对所观看的视频进行标注的视频评价分数，其中，基于新闻簇按照至少一个参数的当前取值生成的视频可以是训练步骤的执行主体生成的，也可以是与训练步骤的执行主体网络连接的其他电子设备生成的。

子步骤3043，将样本特征表示和标注视频评价分数输入初始评价网络，得到样本预测视频评价分数。

这里，可以将子步骤3041中所得到的样本特征表示和子步骤3042中所得到的标注视频评价分数输入初始评价网络，得到样本预测视频评价分数。

子步骤3044，将样本特征表示和样本预测视频评价分数输入初始行动网络，得到预测行动信息。

这里，可以将子步骤3041中所得到的样本特征表示和子步骤3043中所得到的样本预测视频评价分数输入初始行动网络，得到预测行动信息。

子步骤3045，根据预测行动信息调整至少一个参数的当前取值。

这里，由于行动信息用于指示如何调整基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值，则这里可以根据子步骤3044中所得到的预测行动信息，调整至少一个参数的当前取值。

子步骤3046，根据样本预测视频评价分数和所获取的标注视频评价分数之间的差异调整评价网络的网络参数，以及以最大化所获取的标注视频评价分数为优化目标，调整行动网络的网络参数。

这里，可以采用各种实现方式根据样本预测视频评价分数和所获取的标注视频评价分数之间的差异调整评价网络的网络参数，以及以最大化所获取的标注视频评价分数为优化目标，调整行动网络的网络参数。

例如，可以采用随机梯度下降(SGD，Stochastic Gradient Descent)、牛顿法(Newton's Method)、拟牛顿法(Quasi-Newton Methods)、共轭梯度法(ConjugateGradient)、启发式优化方法以及其他现在已知或者未来开发的各种优化算法。

例如，这里预设训练结束条件可以包括以下至少一项：训练时间超过第三预设时长，训练次数超过预设次数，样本预测视频评价分数和所获取的标注视频评价分数之间的差异小于预设差异阈值。

步骤305，将初始行动网络和初始评价网络分别确定为预先训练的行动网络和评价网络。

经过步骤205，就得到了当前行动信息。

步骤206，根据当前行动信息，调整至少一个参数的当前取值。

在本实施例中，由于行动信息用于指示如何调整基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值，那么步骤204中所得到的当前行动信息中也包括了如何调整基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值的信息，则在本实施例中，上述执行主体可以采用各种实现方式，根据当前行动信息，调整至少一个参数的当前取值。例如，当前行动信息可以指示将某个参数的当前取值增加多少数值，减少多少数值，乘以一个系数，或者直接设置成多少等等。

经过步骤206，基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值得到了调整。

继续参见图4，图4是根据本实施例的用于调整参数的方法的应用场景的一个示意图。在图4的应用场景中，对新闻类网站提供支持的服务器401可以首先获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值402，而后服务器401可以再确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数403，随后服务器401可以对至少一个参数的当前取值402进行特征提取，得到特征表示404，接着服务器401可以将特征表示404和所确定的视频评价分数403输入预先训练的评价网络405，得到预测视频评价分数406，之后服务器401可以将特征表示404和预测视频评价分数406输入预先训练的行动网络407，得到当前行动信息408，最后服务器401可以根据当前行动信息408，调整至少一个参数的当前取值402。

本申请的上述实施例提供的方法通过首先获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值，再确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数，而后对至少一个参数的当前取值进行特征提取，得到特征表示，接着将特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数，然后将特征表示和预测视频评价分数输入预先训练的行动网络，得到当前行动信息，最后根据当前行动信息，调整至少一个参数的当前取值。从而可以实现根据为新闻簇生成解说词对应的视频的视频评价分数，对视频生成过程中的至少一个参数进行调整，进而可以提高后续按照调整后的参数所生成的与新闻簇的解说词对应的视频的视频评价。

进一步参考图5，其示出了用于调整参数的方法的又一个实施例的流程500。该用于调整参数的方法的流程500，包括以下步骤：

步骤501，获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值。

步骤502，确定基于新闻簇按照至少一个参数的当前取值生成的视频的视频评价分数。

步骤503，对至少一个参数的当前取值进行特征提取，得到特征表示。

步骤504，将特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数。

步骤505，将特征表示和预测视频评价分数输入预先训练的行动网络，得到当前行动信息。

步骤506，根据当前行动信息，调整至少一个参数的当前取值。

在本实施例中，步骤501、步骤502、步骤503、步骤504、步骤505和步骤506的具体操作与图2所示的实施例中步骤201、步骤202、步骤203、步骤204、步骤205和步骤206的操作基本相同，在此不再赘述。

步骤507，按照至少一个参数的当前取值，生成与目标新闻簇的解说词对应的视频。

在本实施例中，用于调整参数的方法的执行主体(例如图1所示的服务器)可以按照步骤506中调整后的至少一个参数的当前取值，生成与目标新闻簇的解说词对应的视频。

这里，目标新闻簇可以是任何针对同一新闻事件的解说词，本申请对此不做具体限定。

而生成与目标新闻簇的解说词对应的视频的过程可以是各种各样的，本申请对此也不做具体限定。可以理解的是，这里生成与目标新闻簇的解说词对应的视频的过程与步骤501到步骤506中所描述的基于新闻簇生成与新闻簇的解说词对应的视频的过程可以是相同的，所涉及的参数也可以是相同的。而由于已经在步骤506中对至少一个参数的参数值进行了调整，调整后的参数相对于调整前更加优化了，而由行动网络和评价网络的优化目标可以知道，按照调整后的参数所生成的目标新闻簇的解说词对应的视频的视频评价分数相对于按照调整前的参数所生成的目标新闻簇的解说词对应的视频的视频评价分数会更高。

步骤508，响应于接收到终端设备发送的用于指示播放与目标新闻簇的解说词对应的视频的播放请求，将与目标新闻簇的解说词对应的视频发送给终端设备。

在本实施例中，上述执行主体可以在接收到终端设备发送的用于指示播放步骤507中所生成的与目标新闻簇的解说词对应的视频的播放请求的情况下，将与目标新闻簇的解说词对应的视频发送给终端设备。

步骤509，控制终端设备对所收到的视频进行呈现。

在本实施例中，上述执行主体可以采用各种实现方式控制终端设备对所收到的视频进行呈现。例如，上述执行主体可以向终端设备发送用于控制终端设备直接播放所收到的视频的控制指令，以实现控制终端设备直接播放所收到的视频。

从图5中可以看出，与图2对应的实施例相比，本实施例中的用于调整参数的方法的流程500多出了按照至少一个参数的当前取值，生成与目标新闻簇的解说词对应的视频，在接收到终端设备发送的用于指示播放与目标新闻簇的解说词对应的视频的播放请求的情况下，将与目标新闻簇的解说词对应的视频发送给终端设备，以及控制终端设备对所收到的视频进行呈现的步骤。由此，本实施例描述的方案可以控制终端设备呈现在视频生成过程的参数经过调整之后所生成的目标新闻簇的解说词对应的视频。用户可以在终端设备上观看到视频评价分数更高的目标新闻簇的解说词对应的视频，继而扩展了终端设备的呈现信息的功能。

进一步参考图6，作为对上述各图所示方法的实现，本申请提供了一种用于调整参数的装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图6所示，本实施例的用于调整参数的装置600包括：参数当前取值获取单元601、视频评价分数确定单元602、特征提取单元603、第一输入单元604、第二输入单元605和调整单元606。其中，参数当前取值获取单元601，被配置成获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；视频评价分数确定单元602，被配置成确定基于新闻簇按照上述至少一个参数的当前取值生成的视频的视频评价分数；特征提取单元603，被配置成对上述至少一个参数的当前取值进行特征提取，得到特征表示；第一输入单元604，被配置成将上述特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数；第二输入单元605，被配置成将上述特征表示和上述预测视频评价分数输入预先训练的行动网络，得到当前行动信息；调整单元606，被配置成根据上述当前行动信息，调整上述至少一个参数的当前取值。

在本实施例中，用于调整参数的装置600的参数当前取值获取单元601、视频评价分数确定单元602、特征提取单元603、第一输入单元604、第二输入单元605和调整单元606的具体处理及其所带来的技术效果可分别参考图2对应实施例中步骤201、步骤202、步骤203、步骤204、步骤205和步骤206的相关说明，在此不再赘述。

在本实施例的一些可选的实现方式中，上述装置600还可以包括：视频生成单元607，被配置成在调整上述至少一个参数的当前取值之后，按照上述至少一个参数的当前取值，生成与目标新闻簇的解说词对应的视频。

在本实施例的一些可选的实现方式中，上述行动网络可以是通过如下训练步骤预先训练得到的：确定初始行动网络的网络结构以及初始化上述初始行动网络的网络参数；确定初始评价网络的网络结构以及初始化上述初始评价网络的网络参数；初始化上述至少一个参数的当前取值；执行以下参数调整步骤直到满足预设训练结束条件：获取与上述至少一个参数的当前取值对应的标注视频评价分数，其中，所获取的标注视频评价分数为基于新闻簇按照上述至少一个参数的当前取值生成的视频的视频评价分数；将上述样本特征表示和上述标注视频评价分数输入上述初始评价网络，得到样本预测视频评价分数；将上述样本特征表示和上述样本预测视频评价分数输入上述初始行动网络，得到预测行动信息；根据上述预测行动信息调整上述至少一个参数的当前取值；根据上述样本预测视频评价分数和所获取的标注视频评价分数之间的差异调整上述评价网络的网络参数，以及以最大化所获取的标注视频评价分数为优化目标，调整上述行动网络的网络参数；将上述初始行动网络和上述初始评价网络分别确定为预先训练的行动网络和评价网络。

在本实施例的一些可选的实现方式中，上述装置600还可以包括：视频发送单元608，被配置成响应于接收到终端设备发送的用于指示播放上述与目标新闻簇的解说词对应的视频的播放请求，将上述与目标新闻簇的解说词对应的视频发送给终端设备。

在本实施例的一些可选的实现方式中，上述装置600还可以包括：控制单元609，被配置成在将上述与目标新闻簇的解说词对应的视频发送给终端设备之后，控制上述终端设备对所收到的视频进行呈现。

在本实施例的一些可选的实现方式中，上述视频评价分数确定单元602可以包括：观看行为信息获取模块6021，被配置成获取至少一个用户观看至少一个目标视频的观看行为信息，其中，目标视频为基于新闻簇按照上述至少一个参数的当前取值生成的视频；第一确定模块6022，被配置成对于所获取的每个观看行为信息，确定与该观看行为信息对应的视频评价分数；第二确定模块6023，被配置成将所确定的各个视频评价分数的平均值确定为基于新闻簇按照上述至少一个参数的当前取值生成的视频的视频评价分数。

在本实施例的一些可选的实现方式中，观看行为信息可以包括以下至少一项：视频标识、用户标识、用户画像信息、是否打开视频、视频观看总时长、关闭视频时的视频播放时间。

需要说明的是，本申请实施例提供的用于调整参数的装置中各单元的实现细节和技术效果可以参考本申请中其它实施例的说明，在此不再赘述。

下面参考图7，其示出了适于用来实现本申请实施例的服务器的计算机***700的结构示意图。图7示出的服务器仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图7所示，计算机***700包括一个或多个中央处理单元(CPU，CentralProcessing Unit)701，其可以根据存储在只读存储器(ROM，Read Only Memory)702中的程序或者从存储部分708加载到随机访问存储器(RAM，Random Access Memory)703中的程序而执行各种适当的行动和处理。在RAM 703中，还存储有***700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O，Input/Output)接口705也连接至总线704。

以下部件连接至I/O接口705：包括键盘、鼠标等的输入部分706；包括诸如阴极射线管(CRT，Cathode Ray Tube)、液晶显示器(LCD，Liquid Crystal Display)等以及扬声器等的输出部分707；包括硬盘等的存储部分708；以及包括诸如LAN(局域网，Local AreaNetwork)卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器710上，以便于从其上读出的计算机程序根据需要被安装入存储部分708。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分709从网络上被下载和安装，和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时，执行本申请的方法中限定的上述功能。需要说明的是，本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码，上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括参数当前取值获取单元、视频评价分数确定单元、特征提取单元、第一输入单元、第二输入单元和调整单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，参数当前取值获取单元还可以被描述为“获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值的单元”。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该装置执行时，使得该装置：获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；确定基于新闻簇按照上述至少一个参数的当前取值生成的视频的视频评价分数；对上述至少一个参数的当前取值进行特征提取，得到特征表示；将上述特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数；将上述特征表示和上述预测视频评价分数输入预先训练的行动网络，得到当前行动信息；根据上述当前行动信息，调整上述至少一个参数的当前取值。

作为又一方面，本申请实施例还提供了另一种服务器，包括：接口；存储器，其上存储有一个或多个程序；以及一个或多个处理器，在操作上连接到上述接口和上述存储器，用于：获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；确定基于新闻簇按照上述至少一个参数的当前取值生成的视频的视频评价分数；对上述至少一个参数的当前取值进行特征提取，得到特征表示；将上述特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数；将上述特征表示和上述预测视频评价分数输入预先训练的行动网络，得到当前行动信息；根据上述当前行动信息，调整上述至少一个参数的当前取值。

作为又一方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，其中，当上述计算机程序被一个或多个处理器执行时，使得上述一个或多个处理器：获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；确定基于新闻簇按照上述至少一个参数的当前取值生成的视频的视频评价分数；对上述至少一个参数的当前取值进行特征提取，得到特征表示；将上述特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数；将上述特征表示和上述预测视频评价分数输入预先训练的行动网络，得到当前行动信息；根据上述当前行动信息，调整上述至少一个参数的当前取值。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种用于调整参数的方法，包括：

获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；

确定基于新闻簇按照所述至少一个参数的当前取值生成的视频的视频评价分数；

对所述至少一个参数中的每个参数，通过该参数对应的特征提取方法对该参数的当前取值进行特征提取，得到特征表示；

将所述特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数；

将所述特征表示和所述预测视频评价分数输入预先训练的行动网络，得到当前行动信息，其中，所述当前行动信息用于指示如何调整基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；

根据所述当前行动信息，调整所述至少一个参数的当前取值。

2.根据权利要求1所述的方法，其中，在调整所述至少一个参数的当前取值之后，所述方法还包括：

按照所述至少一个参数的当前取值，生成与目标新闻簇的解说词对应的视频。

3.根据权利要求2所述的方法，其中，所述行动网络和所述评价网络是通过如下训练步骤预先训练得到的：

确定初始行动网络的网络结构以及初始化所述初始行动网络的网络参数；

确定初始评价网络的网络结构以及初始化所述初始评价网络的网络参数；

初始化所述至少一个参数的当前取值；

执行以下参数调整步骤直到满足预设训练结束条件：对所述至少一个参数的当前取值进行特征提取，得到样本特征表示；获取与所述至少一个参数的当前取值对应的标注视频评价分数，其中，所获取的标注视频评价分数为基于新闻簇按照所述至少一个参数的当前取值生成的视频的视频评价分数；将所述样本特征表示和所述标注视频评价分数输入所述初始评价网络，得到样本预测视频评价分数；将所述样本特征表示和所述样本预测视频评价分数输入所述初始行动网络，得到预测行动信息；根据所述预测行动信息调整所述至少一个参数的当前取值；根据所述样本预测视频评价分数和所获取的标注视频评价分数之间的差异调整所述评价网络的网络参数，以及以最大化所获取的标注视频评价分数为优化目标，调整所述行动网络的网络参数；

将所述初始行动网络和所述初始评价网络分别确定为预先训练的行动网络和评价网络。

4.根据权利要求3所述的方法，其中，所述方法还包括：

响应于接收到终端设备发送的用于指示播放所述与目标新闻簇的解说词对应的视频的播放请求，将所述与目标新闻簇的解说词对应的视频发送给终端设备。

5.根据权利要求4所述的方法，其中，在将所述与目标新闻簇的解说词对应的视频发送给终端设备之后，所述方法还包括：

控制所述终端设备对所收到的视频进行呈现。

6.根据权利要求5所述的方法，其中，所述确定基于新闻簇按照所述至少一个参数的当前取值生成的视频的视频评价分数，包括：

获取至少一个用户观看至少一个目标视频的观看行为信息，其中，目标视频为基于新闻簇按照所述至少一个参数的当前取值生成的视频；

对于所获取的每个观看行为信息，确定与该观看行为信息对应的视频评价分数；

将所确定的各个视频评价分数的平均值确定为基于新闻簇按照所述至少一个参数的当前取值生成的视频的视频评价分数。

7.根据权利要求6所述的方法，其中，观看行为信息包括以下至少一项：视频标识、用户标识、用户画像信息、是否打开视频、视频观看总时长、关闭视频时的视频播放时间。

8.一种用于调整参数的装置，包括：

参数当前取值获取单元，被配置成获取基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；

视频评价分数确定单元，被配置成确定基于新闻簇按照所述至少一个参数的当前取值生成的视频的视频评价分数；

特征提取单元，被配置成对所述至少一个参数中的每个参数，通过该参数对应的特征提取方法对该参数的当前取值进行特征提取，得到特征表示；

第一输入单元，被配置成将所述特征表示和所确定的视频评价分数输入预先训练的评价网络，得到预测视频评价分数；

第二输入单元，被配置成将所述特征表示和所述预测视频评价分数输入预先训练的行动网络，得到当前行动信息，其中，所述当前行动信息用于指示如何调整基于新闻簇生成与新闻簇的解说词对应的视频过程中的至少一个参数的当前取值；

调整单元，被配置成根据所述当前行动信息，调整所述至少一个参数的当前取值。

9.根据权利要求8所述的装置，其中，所述装置还包括：

视频生成单元，被配置成在调整所述至少一个参数的当前取值之后，按照所述至少一个参数的当前取值，生成与目标新闻簇的解说词对应的视频。

10.根据权利要求9所述的装置，其中，所述行动网络和所述评价网络是通过如下训练步骤预先训练得到的：

初始化所述至少一个参数的当前取值；

11.根据权利要求10所述的装置，其中，所述装置还包括：

视频发送单元，被配置成响应于接收到终端设备发送的用于指示播放所述与目标新闻簇的解说词对应的视频的播放请求，将所述与目标新闻簇的解说词对应的视频发送给终端设备。

12.根据权利要求11所述的装置，其中，所述装置还包括：

控制单元，被配置成在将所述与目标新闻簇的解说词对应的视频发送给终端设备之后，控制所述终端设备对所收到的视频进行呈现。

13.根据权利要求12所述的装置，其中，所述视频评价分数确定单元包括：

观看行为信息获取模块，被配置成获取至少一个用户观看至少一个目标视频的观看行为信息，其中，目标视频为基于新闻簇按照所述至少一个参数的当前取值生成的视频；

第一确定模块，被配置成对于所获取的每个观看行为信息，确定与该观看行为信息对应的视频评价分数；

第二确定模块，被配置成将所确定的各个视频评价分数的平均值确定为基于新闻簇按照所述至少一个参数的当前取值生成的视频的视频评价分数。

14.根据权利要求13所述的装置，其中，观看行为信息包括以下至少一项：视频标识、用户标识、用户画像信息、是否打开视频、视频观看总时长、关闭视频时的视频播放时间。

15.一种服务器，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

16.一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被一个或多个处理器执行时实现如权利要求1-7中任一所述的方法。