CN109104620B

CN109104620B - 一种短视频推荐方法、装置和可读介质

Info

Publication number: CN109104620B
Application number: CN201810837633.6A
Authority: CN
Inventors: 刘龙坡
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2018-07-26
Filing date: 2018-07-26
Publication date: 2020-05-19
Anticipated expiration: 2038-07-26
Also published as: CN109104620A

Abstract

本发明公开了一种短视频推荐方法、装置和可读介质，属于视频推荐技术领域，本发明提供的方法及装置中，在接收到短视频拉取请求后，获取用户历史观看的短视频列表和未观看的短视频列表构成的短视频序列；根据短视频序列和训练得到的用于表征所有短视频特征的短视频特征矩阵，确定用于表征所述短视频序列中的短视频特征的序列向量；根据序列向量和训练得到的短视频推荐模型，确定未观看的短视频列表中各个短视频的概率；并根据各个短视频的概率，向用户推荐感兴趣的短视频。通过实施上述方法，实现了从海量短视频中确定出用户感兴趣的短视频，并推荐给用户，不仅满足了用户对短视频的观看需求，而且提高了用户对短视频应用程序的使用率。

Description

一种短视频推荐方法、装置和可读介质

技术领域

本发明涉及视频推荐技术领域，尤其涉及一种短视频推荐方法、装置和可读介质。

背景技术

当前短视频应用程序，例如抖音、火山小视频、快手和微视等，作为一种新的视频观看平台，视频及作者较多，目前缺乏较为有效的内容组织推荐方式来为用户从海量的短视频中选取感兴趣的内容。

因此，如何从海量的短视频中向用户推荐用户感兴趣的短视频成为现有技术中亟待解决的技术问题之一。

发明内容

本发明实施例提供一种短视频推荐方法、装置和可读介质，用以从海量的短视频中向用户推荐用户感兴趣的短视频。

第一方面，本发明实施例提供一种短视频推荐方法，包括：

在接收到短视频拉取请求后，获取用户历史观看的短视频列表和未观看的短视频列表构成的短视频序列，所述短视频序列中包含各个短视频的标识信息；

根据所述短视频序列和训练得到的用于表征所有短视频特征的短视频特征矩阵，确定用于表征所述短视频序列中的短视频特征的序列向量；

根据所述序列向量和训练得到的短视频推荐模型，确定所述未观看的短视频列表中各个短视频的概率；并

根据各个短视频的概率，向所述用户推荐感兴趣的短视频。

通过利用用户历史观看的短视频列表和未观看的短视频和本发明提供的短视频推荐模型，可以从海量短视频中确定出用户感兴趣的短视频，并推荐给用户。

较佳地，所述短视频的标识信息为所述短视频的编号；以及根据所述短视频序列和训练得到的用于表征所有短视频特征的短视频特征矩阵，确定用于表征所述短视频序列中的短视频特征的序列向量，具体包括：

针对短视频序列中每一短视频，从所述短视频特征矩阵中提取出与该短视频的编号相同的行向量，并将该行向量确定为该短视频的视频向量；

将基于所述短视频序列中各个短视频得到的视频向量构成用于表征所述短视频序列中的短视频特征的序列向量。

较佳地，所述用于表征所有短视频特征的短视频特征矩阵为利用用户历史观看的短视频列表，对嵌入embedding学习算法进行训练得到的。

优选地，按照下述方法对所述短视频推荐模型进行训练：

获取训练样本，所述训练样本为历史观看的短视频和未来观看短视频及所述未来观看短视频的标签结果构成，其中，所述未来观看短视频为以采集时间点为基准未来时间段内产生的短视频；

对所述训练样本进行embedding处理得到用于表征训练样本中的短视频特征的训练特征矩阵；

利用所述训练特征矩阵对所述短视频推荐模型进行训练。

进一步地，所述短视频推荐模型由两个长短期记忆LSTM模型和深度神经网络DNN模型构成；以及利用所述训练特征矩阵对所述短视频推荐模型进行训练，具体包括：

将所述训练特征矩阵输入到第一层LSTM模型中；并

将所述第一层LSTM模型的输出结果输入到第二层LSTM模型中，从第二层LSTM模型的输出结果中提取所述未来观看短视频对应的输出结果；并

将所述未来观看短视频对应的输出结果输入到DNN模型中；

根据所述DNN模型的输出结果以及所述未来观看短视频的标签结果，对所述embedding学习算法、第一层LSTM模型、第二层LSTM模型和/或DNN模型中的神经元的权重进行调整，直至DNN模型的输出结果与所述未来观看短视频的标签结果达到模型训练结束条件为止。

第二方面，本发明实施例提供一种短视频推荐装置，包括：

获取单元，用于在接收到短视频拉取请求后，获取用户历史观看的短视频列表和未观看的短视频列表构成的短视频序列，所述短视频序列中包含各个短视频的标识信息；

第一确定单元，用于根据所述短视频序列和训练得到的用于表征所有短视频特征的短视频特征矩阵，确定用于表征所述短视频序列中的短视频特征的序列向量；

第二确定单元，用于根据所述序列向量和训练得到的短视频推荐模型，确定所述未观看的短视频列表中各个短视频的概率；并

推荐单元，用于根据各个短视频的概率，向所述用户推荐感兴趣的短视频。

较佳地，所述短视频的标识信息为所述短视频的编号；以及

所述第一确定单元，具体用于针对短视频序列中每一短视频，从所述短视频特征矩阵中提取出与该短视频的编号相同的行向量，并将该行向量确定为该短视频的视频向量；将基于所述短视频序列中各个短视频得到的视频向量构成用于表征所述短视频序列中的短视频特征的序列向量。

较佳地，所述装置，还包括：

模型训练单元，用于按照下述方法对所述短视频推荐模型进行训练：获取训练样本，所述训练样本为历史观看的短视频和未来观看短视频及所述未来观看短视频的标签结果构成，其中，所述未来观看短视频为以采集时间点为基准未来时间段内产生的短视频；对所述训练样本进行embedding处理得到用于表征训练样本中的短视频特征的训练特征矩阵；利用所述训练特征矩阵对所述短视频推荐模型进行训练。

进一步地，所述短视频推荐模型由两个长短期记忆LSTM模型和深度神经网络DNN模型构成；以及

所述模型训练单元，具体用于将所述训练特征矩阵输入到第一层LSTM模型中；并将所述第一层LSTM模型的输出结果输入到第二层LSTM模型中，从第二层LSTM模型的输出结果中提取所述未来观看短视频对应的输出结果；并将所述未来观看短视频对应的输出结果输入到DNN模型中；根据所述DNN模型的输出结果以及所述未来观看短视频的标签结果，对所述embedding学习算法、第一层LSTM模型、第二层LSTM模型和/或DNN模型中的神经元的权重进行调整，直至DNN模型的输出结果与所述未来观看短视频的标签结果达到模型训练结束条件为止。

第三方面，本发明实施例提供一种计算机可读介质，存储有计算机可执行指令，所述计算机可执行指令用于执行本申请提供的短视频推荐方法。

第四方面，本发明实施例提供一种计算装置，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请提供的短视频推荐方法。

本发明有益效果：

本发明实施例提供的短视频推荐方法、装置和可读介质，在接收到短视频拉取请求后，获取用户历史观看的短视频列表和未观看的短视频列表构成的短视频序列，所述短视频序列中包含各个短视频的标识信息；根据所述短视频序列和训练得到的用于表征所有短视频特征的短视频特征矩阵，确定用于表征所述短视频序列中的短视频特征的序列向量；根据所述序列向量和训练得到的短视频推荐模型，确定所述未观看的短视频列表中各个短视频的概率；并根据各个短视频的概率，向所述用户推荐感兴趣的短视频。通过实施上述方法，通过利用用户历史观看的短视频列表和未观看的短视频和本发明提供的短视频推荐模型，可以从海量短视频中确定出用户感兴趣的短视频，并推荐给用户，不仅满足了用户对短视频的观看需求，而且提高了用户对短视频应用程序的使用率。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为本发明实施例提供的短视频推荐方法的应用场景示意图；

图2为本发明实施例提供的短视频推荐方法的流程示意图之一；

图3为本发明实施例提供的短视频推荐方法的流程示意图之二；

图4为本发明实施例提供的确定用于表征本发明短视频序列中的短视频特征的序列向量的流程示意图；

图5为本发明实施例提供的训练短视频推荐模型的流程示意图之一；

图6为本发明实施例提供的训练短视频推荐模型的流程示意图之二；

图7为本发明实施例提供的利用训练特征矩阵对短视频推荐模型进行训练的流程示意图；

图8为本发明实施例提供的短视频推荐装置的结构示意图；

图9为本发明实施例提供的实施短视频推荐方法的计算装置的硬件结构示意图。

具体实施方式

本发明实施例提供的短视频推荐方法、装置和可读介质，用以从海量的短视频中向用户推荐用户感兴趣的短视频。

以下结合说明书附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明，并且在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

为了便于理解本发明，本发明涉及的技术术语中：

1、嵌入embedding，用于将输入数据转换成具有固定大小的向量。通过利用用户历史观看的短视频列表对embedding学习算法进行训练，可以得到用于表征所有短视频特征的短视频特征矩阵，然后基于该训练得到的用于表征所有短视频特征的短视频特征矩阵，可以将输入的短视频序列转换为低维的、用于表征短视频序列中的短视频特征的序列向量。

2、长短期记忆模型，(Long Short Term Memory，LSTM)，一种改进之后的循环神经网络，可以解决RNN无法处理长距离的依赖问题。本发明通过利用两层LSTM可以捕获短视频序列中短视频的时序关系，在此基础上可以更好地确定出用户当前时间内更感兴趣的短视频。

3、深度神经网络，(Deep Neural Network，DNN)，是一种具备至少一个隐层的神经网络。与浅层神经网络类似，深度神经网络也能够为复杂非线性***提供建模，但多出的层次为模型提供了更高的抽象层次，因而提高了模型的能力。

4、用户历史观看的短视频列表，以当前短视频总数为10000个为例进行说明，在对这10000个短视频进行编号后，假设用户观看过第2个，第6个，第8个短视频等等，则该用户历史观看的短视频列表为：[2,6,8,……]。

5、用户设备，为可以安装各类应用程序，并且能够将已安装的应用程序中提供的对象进行显示的设备，该电子设备可以是移动的，也可以是固定的，例如，手机、平板电脑、各类可穿戴设备、车载设备、个人数字助理(personal digital assistant，PDA)、销售终端(point of sales，POS)、能够进行短视频推荐的设备或其它能够实现上述功能的电子设备等。

6、应用程序，为可以完成某项或多项特定工作的计算机程序，它具有可视的显示界面，能与用户进行交互，比如电子地图和微信等都可以称为应用程序。

7、在本发明实施例的描述中，“第一”、“第二”等词汇，仅用于区分描述的目的，而不能理解为指示或暗示相对重要性，也不能理解为指示或暗示顺序。

为了能够从海量的短视频中向用户推荐用户感兴趣的短视频，本发明实施例给出了解决方案，参考图1所示的应用场景示意图，用户设备11上安装有具有短视频播放功能的应用程序，然后用户通过用户设备11中安装的上述应用程序向服务器12发送短视频拉取请求，服务器12在接收到短视频拉取请求后，获取用户历史观看的短视频列表和未观看的短视频列表构成的短视频序列，短视频序列中包含各个短视频的标识信息；根据短视频序列和训练得到的用于表征所有短视频特征的短视频特征矩阵，确定用于表征短视频序列中的短视频特征的序列向量；根据序列向量和训练得到的短视频推荐模型，确定未观看的短视频列表中各个短视频的概率；并根据各个短视频的概率，确定用户感兴趣的短视频，并通过用户设备11中的应用程序向用户推荐用户感兴趣的短视频，从而用户可以播放上述短视频。这样，通过采用本发明提供的方法，可以根据用户历史观看的短视频列表和未观看的短视频列表，利用训练得到的短视频推荐模型从海量短视频中确定出用户比较感兴趣的短视频，不仅满足了用户对短视频的需求，而且提高了用户对应用程序的满意度和使用率。

需要说明的是，用户设备11与服务器12之间通过网络进行通信连接，该网络可以为局域网、广域网等。用户设备11可以为便携设备(例如：手机、平板、笔记本电脑等)，也可以为个人电脑(PC，Personal Computer)，服务器12可以为任何能够提供互联网服务的设备，用户设备11中的应用程序可以为具有短视频播放功能的应用程序，可以为抖音、快手和微视等等。

本发明中服务器12可以在同时接收到多个用户的短视频拉取请求后，通过执行本发明提供的方法同时为多个用户确定感兴趣的短视频并进行推荐。

需要说明的是，若用户设备11具有强大的存储能力和处理能力，也可以由用户设备11执行本发明提供的短视频推荐方法，向用户10推荐感兴趣的短视频。

下面结合图1的应用场景，来描述根据本发明示例性实施方式提供的短视频推荐方法。需要注意的是，上述应用场景仅是为了便于理解本发明的精神和原理而示出，本发明的实施方式在此方面不受任何限制。相反，本发明的实施方式可以应用于适用的任何场景。

如图2所示，为本发明实施例提供的短视频推荐方法的流程示意图，可以包括以下步骤：

S21、在接收到短视频拉取请求后，获取用户历史观看的短视频列表和未观看的短视频列表构成的短视频序列。

其中，本发明中的短视频序列中包含各个短视频的标识信息。

本步骤中，当用户打开用户设备11中的具有短视频播放功能的应用程序时，会触发一个短视频拉取请求，或者当用户在应用程序正在观看短视频时，通过下滑主界面也可以触发短视频拉取请求，这样应用程序在接收到短视频拉取请求后，即可将上述短视频拉取请求发送给服务器12。为了能够保证服务器12确定用户感兴趣的短视频，在上述短视频拉取请求中携带用户在应用程序的标识信息，如用户的用户名，这样保证了服务器通过利用本发明提供的短视频推荐方法为用户从海量短视频中确定用户感兴趣的短视频，并通过上述应用程序展示给用户。

具体地，服务器12在接收到短视频拉取请求后，可以根据短视频拉取请求中携带的用户的标识信息，获取用户在当前时刻之前预设时间段内观看的短视频构成的短视频列表，即本发明中用户历史观看的短视频列表，然后服务器12中汇总了所有的短视频，通过将所有的短视频和用户历史观看的短视频列表中的短视频进行比对，可以确定出用户未观看的短视频列表。为了执行后续过程，需要将这两个短视频列表拼接在一起得到短视频序列，即图3中的输入序列。

需要说明的是，本发明中的所有短视频可以理解为自短视频应用程序开始被使用至当前时刻产生的所有短视频。但由于短视频也有时效性，而且用户一般比较喜欢比较新、比较热的短视频，故本发明中所有短视频可以理解为当前时刻之前预设时间段内产生的所有短视频，而非自短视频应用程序开始被使用至当前时刻产生的所有短视频。

较佳地，为了方便计算，本发明中短视频序列中可以只存储各个短视频的标识信息，如短视频的视频ID。

S22、根据短视频序列和训练得到的用于表征所有短视频特征的短视频特征矩阵，确定用于表征短视频序列中的短视频特征的序列向量。

本步骤中，通过确定出能够表征短视频序列中用户观看的和未观看的短视频特征的序列向量，这样在输入到短视频推荐模型后，可以基于用户观看的短视频的短视频特征，预测出未观看的短视频中包含上述短视频特征的短视频，也即用户比较感兴趣的短视频。

实际应用中，由于视频ID一般比较长，故为了节省处理资源，本发明中的短视频的标识信息可以为短视频的编号。具体地，可以将所有短视频进行编号，保证每一短视频对应唯一的编号，并建立短视频的视频ID与短视频的编号之间的对应关系，在短视频序列中只存储短视频的编号，一方面方便计算，另一方面根据上述对应关系也能快速且准确地找到编号对应的短视频。

在此基础之上，可以按照图4所示的方法执行步骤S22，即确定用于表征本发明短视频序列中的短视频特征的序列向量，包括以下步骤：

S31、针对短视频序列中每一短视频，从短视频特征矩阵中提取出与该短视频的编号相同的行向量，并将该行向量确定为该短视频的视频向量。

本步骤中，以短视频特征矩阵为M_m*n，以短视频序列为[X1，X2，X3，X4，X5，X6,……]为例进行说明，其中，m大于等于所有短视频的数量。则针对短视频Xi，则从短视频特征矩阵M_m*n中提取第Xi行对应的行向量，然后将该行向量确定为该短视频Xi的视频向量Li。基于上述描述，可以确定出短视频序列中各个短视频的视频向量，即图3中的视频向量。本发明中m和n的值可以根据实际情况而定，本发明在此不对其值进行限定。

S32、将基于短视频序列中各个短视频得到的视频向量构成用于表征短视频序列中的短视频特征的序列向量。

本步骤中，结合图3进行说明，可以将基于步骤S31得到的短视频序列中各个短视频的视频向量拼接得到能够表征短视频序列中的短视频特征的序列向量。例如，步骤S31中得到的短视频序列中各个短视频的视频向量分别为：L1，L2，L3，L4，L5，L6,……，则基于此得到的序列向量可以为[L1，L2，L3，L4，L5，L6,……]^T，该序列向量即为图3中的序列向量。

较佳地，本发明中用于表征所有短视频特征的短视频特征矩阵为利用用户历史观看的短视频列表，对嵌入embedding学习算法进行训练得到的。

具体地，在对应用程序的短视频进行编号后，可以获取用户最近一段时间观看的短视频的编号构成用户历史观看的短视频列表，假设当前短视频总数为10000个，用户历史观看的短视频为：2,4,6,8,10,12,14,20,40,45,56,66,……。由于每个用户在当前时刻之前预设时间段内观看的短视频数量不一致，而且数量可能较多，本发明对用户历史观看列表的长度进行限制，比如，每个用户历史观看的短视频按照时间进行排序，取距离当前时刻最近的k个短视频的编号构成用户历史观看的短视频列表，以k为10为例进行说明，则上述用户历史的短视频构成的短视频列表为:[2,4,6,8,10,12,14,20,40,45,56,66]。需要说明的是，若用户在预设时间段内观看的短视频数量小于k，则在该用户历史观看的短视频列表中末端补0。使得各个用户观看的短视频列表的长度一致。

基于上述描述，可以获得各个用户历史观看的短视频列表，然后利用各个用户的短视频列表对embedding学习算法进行序列，从而可以让embedding学习算法学习各个短视频的特征，进而得到用于表征所有短视频的短视频特征的短视频特征矩阵。当所有短视频为10000个时，则得到的用于表征所有短视频特征的短视频特征矩阵为10000*128的矩阵，也即M_m*n＝M_10000*128。

在得到上述短视频特征矩阵后，当基于步骤S11获取到的用户历史观看的短视频和未观看的短视频构成的短视频序列为:[3,5,7,12,20,32,45,46,56,58，78]时，其中，编号78为未观看的短视频，得到步骤S32中的序列向量的过程为：还以短视频总数为10000，短视频特征矩阵为M_10000*128为例进行说明，由于短视频总数为10000，则用户历史观看的短视频列表的特征空间为10000维，矩阵展开非常稀疏，故通过利用embedding技术可以将短视频列表映射到低维矩阵，例如维度为128的矩阵中，即用户历史观看的短视频列表为[3,5,7,12,20,32,45,46,56,58]时，则可以利用embedding技术得到一个10*128的低维矩阵。具体地，将用户原始矩阵展开为10*10000的稀疏矩阵，通过embedding技术训练后嵌入到10*128的低维稠密矩阵。映射过程为：通过embedding技术学习到一个10000*128的短视频特征矩阵M，而用户历史观看的短视频列表为M_u＝[3,5,7,12,20,32,45,46,56,58,78]^T，即M_u为一个10*1的矩阵，则针对编号3的短视频矩阵，则从短视频特征矩阵M_10000*128中提取出第3行数据，得到用于表征编号3的短视频的特征的视频向量，从而可以得到用户历史观看的短视频列表中各个编号的短视频的视频向量，即构成10*128的矩阵；然后针对未观看的短视频78，则从短视频特征矩阵M中提取第78行数据，得到用于表征编号78的短视频的特征的视频向量，将该视频向量与10*128的矩阵构成11*128的序列向量。

S23、根据序列向量和训练得到的短视频推荐模型，确定未观看的短视频列表中各个短视频的概率。

本步骤中，通过将包含用户历史观看的短视频和未观看的短视频输入到预先训练的短视频推荐模型中，可以确定出未观看的短视频列表中各个短视频的概率，这样服务器12可以将概率较高的短视频发送给用户的用户设备11，并基于用户设备11中的应用程序优先将这些短视频推荐给用户，实现了从海量短视频中确定用户感兴趣的短视频。具体地，基于步骤S22得到序列向量后，可以将该序列向量输入到图3中的短视频推荐模型，从而得到未观看的短视频的概率。

较佳地，本发明中的短视频推荐模型为按照图5所示的流程训练得到的，可以包括以下步骤：

S41、获取训练样本。

本发明中的训练样本为历史观看的短视频和未来观看短视频及未来观看短视频的标签结果构成，其中，本发明中的未来观看短视频为以采集时间点为基准未来时间段内产生的短视频。

本步骤中，本发明中的训练样本，对于每个用户，采集用户未来一段时间看过的，而过去从未看过的短视频作为正样本，而对于用户未来一段时间没有看过，过去也从未看过的短视频作为负样本。基于此原理，对未来观看短视频添加标签。本发明训练样本是由历史观看的短视频列表和未来观看短视频及其标签结果拼接得到。例如，用户历史观看的短视频序列为：[3,5,7,12,20,32,45,46,56,58]，未来观看短视频为78，若用户观看过编号为78的短视频，则该短视频为正样本，即编号78的短视频的标签结果为1，若用户没看过，则表明该短视频为负样本，即编号78的短视频的标签结果为0。

具体地，基于某一采集时间点，获取用户历史观看的短视频列表和未来观看短视频列表，即以10:00为基准，可以将9:30～10:00之间用户观看的短视频确定为用户历史观看的短视频，例如为[3,5,7,12,20,32,45,46,56,58]，将10:00～10:30之间的短视频确定为未观看的短视频，然后从10:00～10:30之间的短视频列表中随机抽取一个短视频，例如抽取的短视频为78，则确定短视频78的标签结果，并将[3,5,7,12,20,32,45,46,56,58]、78及编号78的标签结果拼接得到训练样本，即训练样本为：[3,5,7,12,20,32,45,46,56,58,78^标签结果]。

S42、对训练样本进行embedding处理得到用于表征训练样本中的短视频特征的训练特征矩阵。

本步骤中，将步骤S41中得到的训练样本进行embedding降维处理，可以得到11*128的训练特征矩阵，即从短视频特征矩阵M_10000*128中分别提取编号3、5、7、12、20、32、45、46、56、58和78行的数据并转换为11*128的训练特征矩阵。

S43、利用训练特征矩阵对短视频推荐模型进行训练。

本步骤中，可以将基于步骤S42得到的训练特征矩阵输入到短视频模型中进行训练，从而得到用于实现短视频推荐功能的短视频推荐模型，以实现利用本发明提供的方法向用户推荐用户感兴趣的短视频。

优选地，本发明中的短视频推荐模型由两个长短期记忆LSTM模型和深度神经网络DNN模型构成；参考图6所示的短视频推荐模型的结构示意图，可以按照图7所示的方法执行步骤S43，可以包括以下步骤：

S51、将训练特征矩阵输入到第一层LSTM模型中。

本步骤中，第一层LSTM模型的各个参数的参数配置可以参考表1所示：

表1

参数配置	参数值
		神经元数量	64
输入序列长度	11
		激活函数	relu
dropout系数	0.5

通过按照上述参数设置第一层LSTM模型，可以防止过拟合。本发明中的输入序列长度设置为11，也可以设置为其他值，以输入序列长度为11为例进行说明，则可以先将步骤S41中的训练样本输入到图6中的embedding学习算法中可以得到11*128的训练特征矩阵，然后将该训练特征矩阵输入到图6中的第一层LSTM模型中，可以将11*128的训练特征矩阵转变为11*64的矩阵，同时可以捕获这11个短视频之间的时序关系。

S52、将第一层LSTM模型的输出结果输入到第二层LSTM模型中，从第二层LSTM模型的输出结果中提取未来观看短视频对应的输出结果。

本步骤中，第二层LSTM模型的各个参数的参数配置可以参考表2所示：

表2

参数配置	参数值
		神经元数量	32
输入序列长度	11
		激活函数	relu
dropout系数	0.5

通过按照上述参数设置第二层LSTM模型，可以防止过拟合。通过将第一层LSTM模型的输出结果---11*64的矩阵输入到图6中的第二层LSTM模型中，可以将维度从64降到32。但此时不输出11*32的矩阵，而是只输出第11行表征的未观看的短视频的输出结果，而将第11行表征的数据输入到32个神经元后，每个神经元可以得到一个结果，从而可以得到一个32*1的矩阵，表征未观看的短视频对应的输出结果。

S53、将未来观看短视频对应的输出结果输入到DNN模型中。

本步骤中，DNN模型的各个参数的参数配置可以参考表3所示：

表3

参数配置	参数值
		神经元数量	1
输入序列长度	32
		激活函数	sigmod
输出维度	1

通过按照上述参数设置DNN模型，保证输出结果在[0,1]之间。在按照上述参数设置DNN模型后，通过将步骤S53中得到的32*1的矩阵输入到图6所示的DNN模型中，可以得到一个未观看的短视频的概率，即模型对用户未来是否观看第11个视频的预测分数。

S54、根据DNN模型的输出结果以及未来观看短视频的标签结果，对embedding学习算法、第一层LSTM模型、第二层LSTM模型和/或DNN模型中的神经元的权重进行调整，直至DNN模型的输出结果与未来观看短视频的标签结果达到模型训练结束条件为止。

本步骤中，由于DNN模型的输出结果表征了用户未来是否观看未来观看短视频的概率，则通过将该输出结果与该未来观看短视频的标签结果进行比较，若输出结果与标签结果满足模型训练结果条件，则表明无需对当前的模型进行调整，可以直接进行短视频推荐；否则表明当前的模型推荐结果不正确，需要对embedding学习算法、第一层LSTM模型、第二层LSTM模型和/或DNN模型中的神经元的权重进行调整。例如，输出结果与标签结果在允许的差距范围内，则表明该模型是可用；若输出结果与标签结果不在允许的差距范围内，则表明该模型预测结果不准确，需要调整。例如，输出结果为0.988，标签结果为1，可以看出输出结果与标签结果十分接近，在允许的差距范围内，则表明该模型是可用的，无需调整，可以直接进行短视频推荐。

例如，若输出结果为0.8，标签结果为1，可以看出输出结果与标签结果差距较大，表明该模型推荐结果不正确，则调整embedding学习算法、第一层LSTM模型、第二层LSTM模型和/或DNN模型中的神经元的权重，以保证DNN模型的输出结果与未来观看短视频的标签结果达到模型训练结束条件为止。

实际应用中，可能会需要大量的训练样本训练短视频模型，本发明在此不再一一描述。

需要说明的是，本发明中的两层LSTM和DNN模型中的参数可以根据实际情况进行调整，例如调整输入序列长度，若输入序列长度为11，则每次只能预测一个未观看的短视频的概率，需要多次执行本发明提供的方法来确定未观看的短视频列表中各个短视频的概率；如输入序列长度足够，则可以只执行一次就可以预测出未观看的短视频列表中所有短视频的概率，具体实施时可以根据实际情况来调整短视频推荐模型的参数。

通过实施步骤S51～S54可以得到训练好的embedding、两层LSTM和DNN模型，基于此模型执行步骤S23时，在基于步骤S22得到序列向量后，通过将序列向量输入到第一层LSTM、第二层LSTM和DNN模型中，可以得到未观看的短视频列表中各个未观看的短视频的概率。

S24、根据各个短视频的概率，向用户推荐感兴趣的短视频。

本步骤中，服务器12基于步骤S23中确定出的未观看的短视频列表中各个短视频的概率，可以按照概率由高到低的顺序对未观看的短视频列表中的短视频进行排序，然后按照这个排序通过用户设备11中的应用程序向用户推荐用户感兴趣的短视频。

较佳地，本发明在确定出序列向量后，可以按行求取平均得到用户的用户向量，然后利用用户向量和步骤S31得到的各个视频向量进行相似度计算，然后按照计算结果向用户进行短视频推荐。当然还可以将用户向量和各个视频向量进行聚类分群处理，然后以此处理结果向用户推荐用户感兴趣的短视频。

本发明提供的短视频推荐方法，在接收到短视频拉取请求后，获取用户历史观看的短视频列表和未观看的短视频列表构成的短视频序列；根据短视频序列和训练得到的用于表征所有短视频特征的短视频特征矩阵，确定用于表征短视频序列中的短视频特征的序列向量；根据序列向量和训练得到的短视频推荐模型，确定未观看的短视频列表中各个短视频的概率；并根据各个短视频的概率，向用户推荐感兴趣的短视频。通过实施上述方法，通过利用用户历史观看的短视频列表和未观看的短视频和本发明提供的短视频推荐模型，可以从海量短视频中确定出用户感兴趣的短视频，并推荐给用户，不仅满足了用户对短视频的观看需求，而且提高了用户对短视频应用程序的使用率。

基于同一发明构思，本发明实施例中还提供了一种短视频推荐装置，由于上述装置解决问题的原理与短视频推荐方法相似，因此上述装置的实施可以参见方法的实施，重复之处不再赘述。

如图8所示，为本发明实施例提供的短视频推荐装置的结构示意图，包括：

获取单元61，用于在接收到短视频拉取请求后，获取用户历史观看的短视频列表和未观看的短视频列表构成的短视频序列，所述短视频序列中包含各个短视频的标识信息；

第一确定单元62，用于根据所述短视频序列和训练得到的用于表征所有短视频特征的短视频特征矩阵，确定用于表征所述短视频序列中的短视频特征的序列向量；

第二确定单元63，用于根据所述序列向量和训练得到的短视频推荐模型，确定所述未观看的短视频列表中各个短视频的概率；并

推荐单元64，用于根据各个短视频的概率，向所述用户推荐感兴趣的短视频。

较佳地，所述短视频的标识信息为所述短视频的编号；以及

所述第一确定单元62，具体用于针对短视频序列中每一短视频，从所述短视频特征矩阵中提取出与该短视频的编号相同的行向量，并将该行向量确定为该短视频的视频向量；将基于所述短视频序列中各个短视频得到的视频向量构成用于表征所述短视频序列中的短视频特征的序列向量。

较佳地，所述装置，还包括：

为了描述的方便，以上各部分按照功能划分为各模块(或单元)分别描述。当然，在实施本发明时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。

在介绍了本发明示例性实施方式的短视频推荐方法、装置和可读介质之后，接下来，介绍根据本发明的另一示例性实施方式的计算装置。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为***、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“***”。

在一些可能的实施方式中，根据本发明的计算装置可以至少包括至少一个处理单元、以及至少一个存储单元。其中，所述存储单元存储有程序代码，当所述程序代码被所述处理单元执行时，使得所述处理单元执行本说明书上述描述的根据本发明各种示例性实施方式的短视频推荐方法中的步骤。例如，所述处理单元可以执行如图2所示的步骤S11～S14中短视频推荐流程。

下面参照图9来描述根据本发明的这种实施方式的计算装置70。图9显示的计算装置70仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图9所示，计算装置70以通用计算设备的形式表现。计算装置70的组件可以包括但不限于：上述至少一个处理单元71、上述至少一个存储单元72、连接不同***组件(包括存储单元72和处理单元71)的总线73。

总线73表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、***总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储单元72可以包括易失性存储器形式的可读介质，例如随机存取存储器(RAM)721和/或高速缓存存储器722，还可以进一步包括只读存储器(ROM)723。

存储单元72还可以包括具有一组(至少一个)程序模块724的程序/实用工具725，这样的程序模块724包括但不限于：操作***、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

计算装置70也可以与一个或多个外部设备74(例如键盘、指向设备等)通信，还可与一个或者多个使得用户能与计算装置70交互的设备通信，和/或与使得该计算装置70能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口75进行。并且，计算装置70还可以通过网络适配器76与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器76通过总线73与用于计算装置70的其它模块通信。应当理解，尽管图中未示出，可以结合计算装置70使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。

在一些可能的实施方式中，本发明提供的短视频推荐方法的各个方面还可以实现为一种程序产品的形式，其包括程序代码，当所述程序产品在计算机设备上运行时，所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本发明各种示例性实施方式的短视频推荐方法中的步骤，例如，所述计算机设备可以执行如图2所示的步骤S11～S14中短视频推荐流程。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本发明的实施方式的用于短视频推荐方法的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码，并可以在计算设备上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了装置的若干单元或子单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白，本发明的实施例可提供为方法、***、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种短视频推荐方法，其特征在于，包括：

根据所述序列向量和训练得到的短视频推荐模型，确定所述未观看的短视频列表中各个短视频的概率；所述短视频推荐模型由两个长短期记忆LSTM模型和深度神经网络DNN模型构成；所述短视频推荐模型的训练样本为历史观看的短视频和未来观看短视频及所述未来观看短视频的标签结果构成，其中，所述未来观看短视频为以采集时间点为基准未来时间段内产生的短视频；所述短视频推荐模型的模型训练结束条件为输出结果与所述未来观看短视频的标签结果在允许的差距范围内；

根据各个短视频的概率，向所述用户推荐感兴趣的短视频。

2.如权利要求1所述的方法，其特征在于，所述短视频的标识信息为所述短视频的编号；以及根据所述短视频序列和训练得到的用于表征所有短视频特征的短视频特征矩阵，确定用于表征所述短视频序列中的短视频特征的序列向量，具体包括：

3.如权利要求2所述的方法，其特征在于，所述用于表征所有短视频特征的短视频特征矩阵为对各个用户历史观看的短视频列表，利用嵌入embedding学习算法进行训练得到的。

4.如权利要求1所述的方法，其特征在于，按照下述方法对所述短视频推荐模型进行训练：

获取训练样本；

利用所述训练特征矩阵对所述短视频推荐模型进行训练。

5.如权利要求4所述的方法，其特征在于，利用所述训练特征矩阵对所述短视频推荐模型进行训练，具体包括：

将所述训练特征矩阵输入到第一层LSTM模型中；并

将所述未来观看短视频对应的输出结果输入到DNN模型中；

6.一种短视频推荐装置，其特征在于，包括：

第二确定单元，用于根据所述序列向量和训练得到的短视频推荐模型，确定所述未观看的短视频列表中各个短视频的概率；所述短视频推荐模型由两个长短期记忆LSTM模型和深度神经网络DNN模型构成；所述短视频推荐模型的训练样本为历史观看的短视频和未来观看短视频及所述未来观看短视频的标签结果构成，其中，所述未来观看短视频为以采集时间点为基准未来时间段内产生的短视频；所述短视频推荐模型的模型训练结束条件为输出结果与所述未来观看短视频的标签结果在允许的差距范围内；

7.如权利要求6所述的装置，其特征在于，所述短视频的标识信息为所述短视频的编号；以及

8.如权利要求7所述的装置，其特征在于，所述用于表征所有短视频特征的短视频特征矩阵为对各个用户历史观看的短视频列表，利用嵌入embedding学习算法进行训练得到的。

9.如权利要求6所述的装置，其特征在于，还包括：

模型训练单元，用于按照下述方法对所述短视频推荐模型进行训练：获取训练样本；对所述训练样本进行embedding处理得到用于表征训练样本中的短视频特征的训练特征矩阵；利用所述训练特征矩阵对所述短视频推荐模型进行训练。

10.如权利要求9所述的装置，其特征在于，所述模型训练单元，具体用于：将所述训练特征矩阵输入到第一层LSTM模型中；并将所述第一层LSTM模型的输出结果输入到第二层LSTM模型中，从第二层LSTM模型的输出结果中提取所述未来观看短视频对应的输出结果；并将所述未来观看短视频对应的输出结果输入到DNN模型中；根据所述DNN模型的输出结果以及所述未来观看短视频的标签结果，对所述embedding学习算法、第一层LSTM模型、第二层LSTM模型和/或DNN模型中的神经元的权重进行调整，直至DNN模型的输出结果与所述未来观看短视频的标签结果达到模型训练结束条件为止。

11.一种计算机可读介质，存储有计算机可执行指令，其特征在于，所述计算机可执行指令用于执行如权利要求1至5任一权利要求所述的方法。

12.一种计算装置，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求1至5任一权利要求所述的方法。