CN113032589B

CN113032589B - 多媒体文件推荐方法、装置、电子设备及可读存储介质

Info

Publication number: CN113032589B
Application number: CN202110336117.7A
Authority: CN
Inventors: 查强
Original assignee: Beijing QIYI Century Science and Technology Co Ltd
Current assignee: Beijing QIYI Century Science and Technology Co Ltd
Priority date: 2021-03-29
Filing date: 2021-03-29
Publication date: 2024-01-23
Anticipated expiration: 2041-03-29
Also published as: CN113032589A

Abstract

本发明实施例提供了多媒体文件推荐方法、装置、电子设备及可读存储介质，涉及计算机技术领域，可以向用户推荐用户感兴趣的多媒体文件。本发明实施例包括：获取待推荐用户的历史访问记录，历史访问记录为待推荐用户在指定时间段内访问过的多媒体文件。然后基于历史访问记录包括的多媒体文件，生成待推荐用户的历史访问标签集合。同时获取每个待推荐多媒体文件的标签集合。再基于预设深度语义匹配模型，确定历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度。接着根据历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，选择为待推荐用户推荐的待推荐文件。

Description

多媒体文件推荐方法、装置、电子设备及可读存储介质

技术领域

本发明涉及计算机技术领域，特别是涉及多媒体文件推荐方法、装置、电子设备及可读存储介质。

背景技术

随着网络技术的发展，用户越来越频繁地访问各种网站，以通过网站来浏览自己感兴趣的多媒体文件。例如，用户常常通过访问视频网站来观看自己喜爱的视频。

但是，网站向每个用户所推荐的内容是一样的。而对于不同用户而言，每个用户感兴趣的多媒体文件是不相同的。这样，使得网站所推荐的内容无法满足用户的个性化需求。

发明内容

本发明实施例的目的在于提供多媒体文件推荐方法、装置、电子设备及可读存储介质，以向用户推荐用户感兴趣的多媒体文件，从而实现个性化推荐。具体技术方案如下：

第一方面，本发明实施例提供了一种多媒体文件推荐方法，可以包括：

获取待推荐用户的历史访问记录，所述历史访问记录为所述待推荐用户在指定时间段内访问过的多媒体文件；

基于所述历史访问记录包括的多媒体文件，生成所述待推荐用户的历史访问标签集合；

获取每个待推荐多媒体文件的标签集合；

基于预设深度语义匹配模型，确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度；其中，所述预设深度语义匹配模型为基于样本训练集对初始深度语义匹配模型训练得到的模型，所述样本训练集包括每个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合；针对每个样本用户，该样本用户的样本历史访问标签集合包括：该样本用户在历史时间段内访问过的多媒体文件对应的标签；该样本用户的正样本标签集合包括：该样本用户最近一次访问的多媒体文件对应的标签；该样本用户的负样本标签集合包括：预设数量的其他样本用户在所述历史时间段内访问过的多媒体文件对应的标签；

根据所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，选择为所述待推荐用户推荐的待推荐文件。

在一种可能的实现方式中，所述预设深度语义匹配模型通过以下步骤训练获得：

构建所述样本训练集；

将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型，获取所述初始深度语义模型输出的第一相似度和第二相似度，所述第一相似度为样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度，所述第二相似度为样本用户的样本历史访问标签集合与负样本标签之间的语义相似度；

基于所述第一相似度和所述第二相似度计算损失函数值，根据所述损失函数值，判断所述初始深度语义匹配模型是否收敛；

如果所述初始深度语义匹配模型未收敛，则根据所述损失函数值调整所述初始深度语义匹配模型的网络参数，并返回将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型的步骤；

如果所述初始深度语义匹配模型收敛，则将当前的初始深度语义匹配模型作为所述预设深度语义匹配模型。

在一种可能的实现方式中，所述构建所述样本训练集，包括：

针对每个样本用户，获取该样本用户在所述历史时间段内访问过的多媒体文件；

对获取到的多媒体文件的属性信息进行分词，得到该样本用户的样本历史访问标签集合；

对该样本用户最近一次访问的多媒体文件的属性信息进行分词，得到该样本用户的正样本标签集合；

对所有样本用户中，除该样本用户之外的其他样本用户进行随机负采样，获取预设数量的其他样本用户的样本历史访问标签集合，作为该样本用户的负样本标签集合；

将多个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合构建为所述样本训练集。

在一种可能的实现方式中，所述基于预设深度语义匹配模型，确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，包括：

针对每个待推荐多媒体文件，将该待推荐多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义匹配模型，获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的语义向量与所述历史访问标签集合对应的语义向量之间的相似度。

针对每个待推荐多媒体文件，将该多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义模型，获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的第一语义向量，以及所述历史访问标签集合对应的第二语义向量；基于预设相似度算法，计算所述第一语义向量与所述第二语义向量之间的相似度。

针对每个待推荐多媒体文件，从缓存文件中获取该多媒体文件的标签集合中的每个标签的词向量，根据获取到的每个标签的词向量计算该多媒体文件对应的语义向量；所述缓存文件中缓存有多个标签的词向量，所述多个标签的词向量为：将各多媒体文件的标签集合输入所述预设深度语义匹配模型后，所述预设深度语义模型的词向量表达层输出的每个标签对应的词向量；

从所述缓存文件中获取所述历史访问标签集合包括的每个标签的词向量，根据所述历史访问标签集合包括的每个标签的词向量，计算所述历史访问标签集合对应的语义向量；

基于预设相似度算法，计算该多媒体文件对应的语义向量与所述历史访问标签集合对应的语义向量之间的相似度。

第二方面，本发明实施例提供了一种多媒体文件推荐装置，包括：

获取模块，用于获取待推荐用户的历史访问记录，所述历史访问记录为所述待推荐用户在指定时间段内访问过的多媒体文件；

生成模块，用于基于所述获取模块获取的所述历史访问记录包括的多媒体文件，生成所述待推荐用户的历史访问标签集合；

所述获取模块，还用于获取每个待推荐多媒体文件的标签集合；

确定模块，用于基于预设深度语义匹配模型，确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度；其中，所述预设深度语义匹配模型为基于样本训练集对初始深度语义匹配模型训练得到的模型，所述样本训练集包括每个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合；针对每个样本用户，该样本用户的样本历史访问标签集合包括：该样本用户在历史时间段内访问过的多媒体文件对应的标签；该样本用户的正样本标签集合包括：该样本用户最近一次访问的多媒体文件对应的标签；该样本用户的负样本标签集合包括：预设数量的其他样本用户在所述历史时间段内访问过的多媒体文件对应的标签；

选择模块，用于根据所述确定模块确定的所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，选择为所述待推荐用户推荐的待推荐文件。

在一种可能的实现方式中，所述装置还包括训练模块，所述训练模块用于：

构建所述样本训练集；

在一种可能的实现方式中，所述训练模块，具体用于：

在一种可能的实现方式中，所述确定模块，具体用于：

第三方面，本发明实施例还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现第一方面任一所述的方法步骤。

第四方面，本发明实施例还提供了一种可读存储介质，可读存储介质内存储有计算机程序，计算机程序被电子设备的处理器执行时实现第一方面任一项所述的方法步骤。

第五方面，本发明实施例还提供了一种计算机程序产品，当其在电子设备上运行时，使得电子设备的处理器执行时实现第一方面任一项所述的方法步骤。

本发明实施例提供的多媒体文件推荐方法、装置、电子设备及可读存储介质，可以根据用户历史访问过的多媒体文件，生成历史访问标签集合，然后根据历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，按照相似度选择为用户推荐的文件。即本发明实施例基于用户历史访问过的多媒体文件与待推荐多媒体文件之间的相似度，为用户推荐与用户历史访问的多媒体文件相似的文件，由于用户对历史访问的文件感兴趣，所以用户对与历史访问的多媒体文件相似的文件感兴趣的可能性较高，因此本发明实施例可以向用户推荐其感兴趣的多媒体文件，实现了个性化推荐。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的一种多媒体文件推荐方法的流程图；

图2为本发明实施例提供的一种预设深度语义匹配模型训练方法的流程图；

图3为本发明实施例提供的一种构建训练样本集方法的流程图；

图4为本发明实施例提供的一种预设深度语义匹配模型训练过程的示例性示意图；

图5为本发明实施例提供的一种多媒体文件推荐装置的结构示意图；

图6为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

在相关技术中，网站向每个用户所推荐的内容是一样的。而对于不同用户而言，每个用户感兴趣的多媒体文件是不相同的。这使得网站所推荐的内容无法满足用户的个性化需求。

为了解决上述技术问题，本发明实施例提供了一种多媒体文件推荐方法、装置、电子设备及可读存储介质。

下面先对本发明实施例提供的多媒体文件推荐方法进行说明。

可以理解的是，本发明实施例提供的多媒体文件推荐方法应用于电子设备。该电子设备包括但并不局限于台式电脑、笔记本、手机和服务器。图1为本发明实施例提供的一种多媒体文件推荐方法的流程图。参见图1，该方法可以包括如下步骤：

S101，获取待推荐用户的历史访问记录。其中，历史访问记录为待推荐用户在指定时间段内访问过的多媒体文件。

S102，基于历史访问记录包括的多媒体文件，生成待推荐用户的历史访问标签集合。

S103，获取每个待推荐多媒体文件的标签集合。

S104，基于预设深度语义匹配模型，确定历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度。

其中，预设深度语义匹配模型为基于样本训练集对初始深度语义匹配模型训练得到的模型，样本训练集包括每个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合；针对每个样本用户，该样本用户的样本历史访问标签集合包括：该样本用户在历史时间段内访问过的多媒体文件对应的标签；该样本用户的正样本标签集合包括：该样本用户最近一次访问的多媒体文件对应的标签；该样本用户的负样本标签集合包括：预设数量的其他样本用户在历史时间段内访问过的多媒体文件对应的标签。

S105，根据历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，选择为待推荐用户推荐的待推荐文件。

本发明实施例提供的多媒体文件推荐方法，可以根据用户历史访问过的多媒体文件，生成历史访问标签集合，然后根据历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，按照相似度选择为用户推荐的文件。即本发明实施例基于用户历史访问过的多媒体文件与待推荐多媒体文件之间的相似度，为用户推荐与用户历史访问的多媒体文件相似的文件，由于用户对历史访问的文件感兴趣，所以用户对与历史访问的多媒体文件相似的文件感兴趣的可能性较高，因此本发明实施例可以向用户推荐其感兴趣的多媒体文件，实现了个性化推荐。

下面结合具体示例，对本发明实施例提供的多媒体文件推荐方法进行说明。

针对上述S101，获取待推荐用户的历史访问记录。其中，历史访问记录为待推荐用户在指定时间段内访问过的多媒体文件。

可以理解的是，多媒体文件包括但并不局限于视频、音频和图片。举例而言，获取的待推荐用户在历史上访问过的多媒体文件为：电视剧视频1、电视剧视频2、电影视频3、广告视频4和广告视频5。

指定时间段可以是最近一周、或者最近一个月、或者从待推荐用户访问第一个多媒体文件开始至当前时刻。

可选的，待推荐用户在指定时间段内访问过的多媒体文件满足预设的感兴趣条件。设置感兴趣条件能够更准确地筛选出用户历史访问过的该用户感兴趣的多媒体文件，减少用户历史访问过的不感兴趣的多媒体文件对确定推荐的多媒体文件的影响。

例如，感兴趣条件包括但不限于：待推荐用户对多媒体文件的访问时长超过预设时长、待推荐用户对多媒体文件的访问次数超过预设次数、以及待推荐用户对多媒体文件设置有感兴趣标记中的任意一种或多种。

其中，预设时长可以设置为10秒，预设次数可以设置为2次。可以理解的是，用户对多媒体文件的访问时长超过10秒，可以认为用户对该多媒体文件的访问行为是有效观看行为，用户对所观看的多媒体文件感兴趣。

针对上述S102，基于历史访问记录包括的多媒体文件，生成待推荐用户的历史访问标签集合。

一种实施方式中，针对历史访问记录包括的每个多媒体文件，可以基于词典分词算法对该多媒体文件的属性信息进行分词。从而得到待推荐用户的历史访问标签集合。

词典分词算法能够按照预设的分词策略，对多媒体文件的属性信息进行分词，分词后得到多个汉字字符串。将汉字字符串与预设的词典中的词条进行匹配。若在词典中找到与字符串相同的词条，则匹配成功。将各匹配成功的字符串作为标签，构建为历史访问标签集合。

其中，将汉字字符串与预设的词典中的词条进行匹配时，可以利用正向匹配、逆向匹配算法、最大匹配或者最小匹配算法。当然，对多媒体文件的属性信息进行分词的方法并不局限于此。

多媒体文件的属性信息包括但不限于：标题信息、简介信息、发布者信息、格式信息和时长信息中的任意一种或多种。

以多媒体文件为视频为例，多媒体文件的属性信息可以包括：标题信息、简介信息、发布者信息、格式信息和时长信息中的任意一种或多种。

例如，待推荐用户在指定时间段内访问过视频A，视频A的属性信息包括标题信息时，可以基于词典分词算法对该标题信息进行分词，得到分词结果。从而获得待推荐用户的历史访问标签集合。

针对上述S103，获取每个待推荐多媒体文件的标签集合。

一种实施方式中，针对每个待推荐多媒体文件，可以基于词典分词算法对该待推荐多媒体文件的属性信息进行分词。从而得到每个待推荐多媒体文件的标签集合。

对待推荐多媒体文件的分词方法可参考上述S102中的分词方法，此处不再赘述。

针对上述S104，基于预设深度语义匹配模型(Deep Structured SemanticModels，DSSM)，确定历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度。

在本发明实施例中，可以基于DSSM，计算历史访问标签集合对应的语义向量，以及每个待推荐多媒体文件的标签集合对应的语义向量。其中，历史访问标签集合对应的语义向量可以记为待推荐用户的嵌入(embedding)向量，每个待推荐多媒体文件的标签集合对应的语义向量可以记为每个待推荐多媒体文件的embedding向量。之后计算待推荐用户的embedding向量分别与每个待推荐多媒体文件的embedding向量之间的相似度。

针对上述S105，根据历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，选择为待推荐用户推荐的待推荐文件。

一种实施方式中，可以确定与待推荐用户的embedding向量相似度大于预设相似度的待推荐多媒体文件的embedding向量，将确定的待推荐多媒体文件的embedding向量对应的多媒体文件，作为为待推荐用户推荐的待推荐文件。

通过本发明实施例提供的多媒体文件推荐方法，基于用户历史上访问过的多媒体文件，给用户推荐与用户历史上访问过的多媒体文件较为相似的多媒体文件，可以给用户推荐该用户感兴趣的多媒体文件，实现了个性化推荐。与给每个用户推荐的相同的多媒体文件的方式相比，本发明实施例可以实现更为精准地推荐，提高推荐成功率。

参见图2，上述S104中的深度语义匹配模型可以通过以下步骤训练获得：

S201，构建样本训练集。

S202，将样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入初始深度语义匹配模型，获取初始深度语义模型输出的第一相似度和第二相似度。

其中，第一相似度为样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度，第二相似度为样本用户的样本历史访问标签集合与负样本标签之间的语义相似度。

在本发明实施例中，初始深度语义匹配模型可以是DSSM模型。

S203，基于第一相似度和第二相似度计算损失函数值，根据损失函数值，判断初始深度语义匹配模型是否收敛。如果初始深度语义匹配模型未收敛，则执行S204；如果初始深度语义匹配模型收敛，则执行S205。

在本发明实施例中，第一相似度与损失函数值负相关，第二相似度与损失函数值正相关。损失函数值越小，初始深度语义匹配模型的识别结果越准确。因此在损失函数值最小时，确定初始深度语义匹配模型收敛。

一种实施方式中，可以计算本次计算的损失函数值与迭代过程中上次计算的损失函数值之间的差值，确定该差值是否小于预设差值。若是，则确定初始深度语义匹配模型收敛；若否，则确定初始深度语义匹配模型未收敛。

另一种实施方式中，可以确定本次计算的损失函数值是否小于预设阈值。若是，则确定初始深度语义匹配模型收敛；若否，则确定初始深度语义匹配模型未收敛。

S204，根据损失函数值调整初始深度语义匹配模型的网络参数，并返回 S202。

一种实施方式中，可以根据损失函数值，采用梯度下降的方式调整初始深度语义匹配模型的网络参数，并基于调整后的初始深度语义匹配模型，执行 S202。

S205，将当前的初始深度语义匹配模型作为预设深度语义匹配模型。

在本发明实施例中，由于第一相似度与损失函数值负相关，第二相似度与损失函数值正相关，因此最小化损失函数，能够使得第一损失函数越大，且第二损失函数越小，也就是使得利用初始深度语义匹配模型，得到的样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度更高，并且样本用户的样本历史访问标签集合与负样本标签集合之间的语义相似度更低。从而提高预设深度语义匹配模型的识别准确性。

针对上述S201，参见图3，构建样本训练集的方式包括以下步骤：

S2011，针对每个样本用户，获取该样本用户在历史时间段内访问过的多媒体文件。

S2011获取多媒体文件的方式与上述S101获取多媒体文件的方式相同，可参考上述S101中的描述，此处不再赘述。

S2012，对获取到的多媒体文件的属性信息进行分词，得到该样本用户的样本历史访问标签集合。

针对S2011和S2012举例，样本用户包括样本用户1、样本用户2、…、样本用户10000。其中，样本用户1在历史时间段内访问了视频1、视频2和视频3。其中，对视频1的标题进行分词，对视频2的标题进行分词，对视频3的标题进行分词。从而，可以获得样本用户1的样本历史访问标签集合。

S2012对多媒体文件的属性信息进行分词的方式，与上述S102的分词方式相同，可参考上述S102中的描述，此处不再赘述。

S2013，对该样本用户最近一次访问的多媒体文件的属性信息进行分词，得到该样本用户的正样本标签集合。

可以理解的是，用户最近一次访问的多媒体文件一般是用户目前最感兴趣的多媒体文件。因此将该样本用户最近一次访问的多媒体文件的属性信息的分词结果，作为该样本用户的正样本标签集合。

可选的，样本用户最近一次访问的多媒体文件满足预设的感兴趣条件。例如，感兴趣条件包括但不限于：待推荐用户对多媒体文件的访问时长超过预设时长、待推荐用户对多媒体文件的访问次数超过预设次数、以及待推荐用户对多媒体文件设置有感兴趣标记中的任意一种或多种。

S2013对多媒体文件的属性信息进行分词的方式，与上述S102的分词方式相同，可参考上述S102中的描述，此处不再赘述。

S2014，对所有样本用户中，除该样本用户之外的其他样本用户进行随机负采样，获取预设数量的其他样本用户的样本历史访问标签集合，作为该样本用户的负样本标签集合。

可以理解的是，每个用户的兴趣大部分集中于某一类多媒体文件，例如游戏类视频。因此对于一个样本用户，其他样本用户感兴趣的多媒体文件，大概率是该样本用户不感兴趣的。因此将预设数量的其他样本用户的样本历史访问标签集合，作为该样本用户的负样本标签集合。

例如，预设数量为4。

S2015，将多个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合构建为样本训练集。

由于每个用户的兴趣大部分集中于一类多媒体文件，而其他类型的多媒体文件一般是该用户不感兴趣的，因此本发明实施例可以设置较大的预设数量，得到数据量较大的负样本标签集合，从而提升训练初始深度语义匹配模型的准确性。

以下结合图4，对本发明实施例训练预设深度语义匹配模型的整体流程进行说明：

参见图4，在一种实施方式中，图4中的三个虚线方框组成的整体结构表示初始深度语义匹配模型。

针对一个样本用户，图4中左边的虚线方框表示对该样本用户的正样本标签集合的处理过程，可以记作正向项目(item)塔。正向item塔下方的t1至tn 表示输入正向item塔的标签集合。中间的虚线方框表示对该样本用户的样本历史访问标签集合的处理过程，可以记作用户(user)塔。user塔下方的t1至tm表示输入user塔的标签集合。右边的虚线方框表示对该样本用户的负样本标签集合的处理过程，可以记作负向item塔。负向item塔下方的t1至tl表示输入负向item 塔的标签集合。初始深度语义匹配模型对每个标签集合的处理过程相同，输入的标签集合从下往上依次经过嵌入层(embedding layer)、堆积层(cumulate layer)、隐藏层(hidden layer)和表达层(representation layer)。

其中，embedding layer的处理包括词嵌入(word embedding)。cumulate layer的处理包括词袋模型(bag of words，BOW)和逆文本频率指数(Inverse DocumentFrequency，IDF)。hidden layer的处理包括线性整流函数(Rectified Linear Unit，ReLU)。representation layer的处理包括ReLU。

针对一个样本用户，经过左边虚线方框对该样本用户的正样本标签集合处理后，得到正样本语义向量；经过中间虚线方框对该样本用户的样本历史访问标签集合处理后，得到历史访问语义向量；经过右边虚线方框对该样本用户的负样本标签集合处理后，得到负样本语义向量。然后经过相似度计算层，计算正样本语义向量和历史访问语义向量之间的余弦相似度(cosine similarity)得到R⁺，并计算历史访问语义向量与负样本语义向量之间的cosine similarity得到 R^-。之后在合页损失(hinge loss)层基于R⁺和R^-，利用排序损失(Ranking loss) 的方式计算损失函数值。

基于损失函数值确定初始深度语义匹配模型是否收敛。如果初始深度语义匹配模型未收敛，则根据损失函数值调整初始深度语义匹配模型的网络参数，并将另一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入初始深度语义匹配模型继续训练。如果初始深度语义匹配模型收敛，则将当前的初始深度语义匹配模型的user塔和正向item塔作为预设深度语义匹配模型，或者将当前的初始深度语义匹配模型的user塔和负向item塔作为预设深度语义匹配模型。

在这种情况下，上述S104可以实现为：电子设备针对每个待推荐多媒体文件，将该多媒体文件的标签集合和待推荐用户的历史访问标签集合输入预设深度语义模型，获取预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的第一语义向量，以及历史访问标签集合对应的第二语义向量。然后电子设备再基于预设相似度算法，计算第一语义向量与第二语义向量之间的相似度。

例如，预设相似度算法可以是余弦相似度算法、杰卡德相似系数算法或者皮尔森相关系数算法等，本发明实施例对此不作具体限定。

在本发明实施例中，将该待推荐多媒体文件的标签集合输入预设深度语义匹配模型的item塔，将待推荐用户的历史访问标签集合输入预设深度语义匹配模型的user塔。

参见图4，在本发明实施例的另一种实施方式中，图4中的三个虚线方框以及相似度计算层组成的整体结构表示初始深度语义匹配模型。在初始深度语义匹配模型训练完成后，将当前的初始深度语义匹配模型中，user塔、正向item 塔以及相似度计算层作为预设深度语义匹配模型，或者将user塔、负向item塔以及相似度计算层作为预设深度语义匹配模型。

在这种情况下，上述S104可以实现为：电子设备针对每个待推荐多媒体文件，将该待推荐多媒体文件的标签集合和待推荐用户的历史访问标签集合输入预设深度语义匹配模型，获取预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的语义向量与历史访问标签集合对应的语义向量之间的相似度。

参见图4，在本发明实施例的另一种实施方式中，图4中的三个嵌入层组成的整体结构表示初始深度语义匹配模型。此时，正向item塔包括左边的嵌入层， user塔包括中间的嵌入层，负向item塔包括右边的嵌入层。在初始深度语义匹配模型训练完成后，将当前的初始深度语义匹配模型中，user塔和正向item塔作为预设深度语义匹配模型，或者将user塔和负向item塔作为预设深度语义匹配模型。

在这种情况下，上述S104可以实现为以下三个步骤：

步骤一，针对每个待推荐多媒体文件，从缓存文件中获取该多媒体文件的标签集合中的每个标签的词向量，根据获取到的每个标签的词向量计算该多媒体文件对应的语义向量。

其中，缓存文件中缓存有多个标签的词向量，多个标签的词向量为：将各多媒体文件的标签集合输入预设深度语义匹配模型后，预设深度语义模型的词向量表达层输出的每个标签对应的词向量。参见图4，预设深度语义模型的词向量表达层为嵌入层。

可以理解的是，由于多媒体文件的属性信息一般是不变的，因此对多媒体文件的属性信息进行分词得到的多媒体文件的标签集合，以及每个标签对应的词向量是不变的。为了减少确定推荐的多媒体文件的计算量，提高多媒体文件的推荐速度，可以预先将各多媒体文件的标签集合输入预设深度语义匹配模型，得到预设深度语义模型的词向量表达层输出的每个标签对应的词向量，并将得到的词向量缓存在缓存文件中。

然后电子设备根据获取到的每个标签的词向量，经过如图4所示的堆积层、隐藏层和表达层，计算得到该多媒体文件对应的语义向量。

步骤二，从缓存文件中获取历史访问标签集合包括的每个标签的词向量，根据历史访问标签集合包括的每个标签的词向量，计算历史访问标签集合对应的语义向量。

步骤二计算历史访问标签集合对应的语义向量的方式，与步骤一计算待推荐多媒体文件对应的语义向量的方式相同，可参考步骤一中的描述，此处不再赘述。

步骤三，基于预设相似度算法，计算该多媒体文件对应的语义向量与历史访问标签集合对应的语义向量之间的相似度。

电子设备经过如图4所示的相似度计算层，基于预设相似度算法，计算该多媒体文件对应的语义向量与历史访问标签集合对应的语义向量之间的相似度。

本发明实施例可以模拟DSSM模型应用于自然语言处理领域时，对于查询 (query)和点击(doc)相关性的计算方式，使用DSSM模型来计算用户历史访问过的多媒体文件与待推荐多媒体文件之间的相似性，从而给用户推荐与用户历史访问过的多媒体文件相似度较高的待推荐多媒体文件。

基于相同的发明构思，对应于上述方法实施例，本发明实施例还提供了一种多媒体文件推荐装置，参见图5，该装置包括：获取模块501、生成模块502、确定模块503和选择模块504；

获取模块501，用于获取待推荐用户的历史访问记录，历史访问记录为待推荐用户在指定时间段内访问过的多媒体文件；

生成模块502，用于基于获取模块501获取的历史访问记录包括的多媒体文件，生成待推荐用户的历史访问标签集合；

获取模块501，还用于获取每个待推荐多媒体文件的标签集合；

确定模块503，用于基于预设深度语义匹配模型，确定历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度；其中，预设深度语义匹配模型为基于样本训练集对初始深度语义匹配模型训练得到的模型，样本训练集包括每个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合；针对每个样本用户，该样本用户的样本历史访问标签集合包括：该样本用户在历史时间段内访问过的多媒体文件对应的标签；该样本用户的正样本标签集合包括：该样本用户最近一次访问的多媒体文件对应的标签；该样本用户的负样本标签集合包括：预设数量的其他样本用户在历史时间段内访问过的多媒体文件对应的标签；

选择模块504，用于根据确定模块503确定的历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，选择为待推荐用户推荐的待推荐文件。

可选的，该装置还包括训练模块，训练模块用于：

构建样本训练集；

将样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入初始深度语义匹配模型，获取初始深度语义模型输出的第一相似度和第二相似度，第一相似度为样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度，第二相似度为样本用户的样本历史访问标签集合与负样本标签之间的语义相似度；

基于第一相似度和第二相似度计算损失函数值，根据损失函数值，判断初始深度语义匹配模型是否收敛；

如果初始深度语义匹配模型未收敛，则根据损失函数值调整初始深度语义匹配模型的网络参数，并返回将样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入初始深度语义匹配模型的步骤；

如果初始深度语义匹配模型收敛，则将当前的初始深度语义匹配模型作为预设深度语义匹配模型。

可选的，训练模块，具体用于：

针对每个样本用户，获取该样本用户在历史时间段内访问过的多媒体文件；

将多个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合构建为样本训练集。

可选的，确定模块503，具体用于：

针对每个待推荐多媒体文件，将该待推荐多媒体文件的标签集合和待推荐用户的历史访问标签集合输入预设深度语义匹配模型，获取预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的语义向量与历史访问标签集合对应的语义向量之间的相似度。

可选的，确定模块503，具体用于：

针对每个待推荐多媒体文件，将该多媒体文件的标签集合和待推荐用户的历史访问标签集合输入预设深度语义模型，获取预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的第一语义向量，以及历史访问标签集合对应的第二语义向量；基于预设相似度算法，计算第一语义向量与第二语义向量之间的相似度。

可选的，确定模块503，具体用于：

针对每个待推荐多媒体文件，从缓存文件中获取该多媒体文件的标签集合中的每个标签的词向量，根据获取到的每个标签的词向量计算该多媒体文件对应的语义向量；缓存文件中缓存有多个标签的词向量，多个标签的词向量为：将各多媒体文件的标签集合输入预设深度语义匹配模型后，预设深度语义模型的词向量表达层输出的每个标签对应的词向量；

从缓存文件中获取历史访问标签集合包括的每个标签的词向量，根据历史访问标签集合包括的每个标签的词向量，计算历史访问标签集合对应的语义向量；

基于预设相似度算法，计算该多媒体文件对应的语义向量与历史访问标签集合对应的语义向量之间的相似度。

相应于上述方法实施例，本发明实施例还提供了一种电子设备，参见图6，可以包括处理器601、通信接口602、存储器603和通信总线604，其中，处理器 601，通信接口602，存储器603通过通信总线604完成相互间的通信；

存储器603，用于存放计算机程序；

处理器601，用于执行存储器603上所存放的程序时，实现上述方法实施例中的方法步骤。

相应于上述方法实施例，本发明实施例还提供了一种可读存储介质，该可读存储介质为计算机可读存储介质，可读存储介质内存储有计算机程序，计算机程序被电子设备的处理器执行时实现上述任一项多媒体文件推荐方法的方法步骤。

相应于上述方法实施例，本发明实施例还提供了一种计算机程序产品，当其在电子设备上运行时，使得电子设备的处理器执行时实现上述任一项多媒体文件推荐方法的方法步骤。

上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，简称RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(Digital Signal Processing，简称DSP)、专用集成电路(Application SpecificIntegrated Circuit，简称ASIC)、现场可编程门阵列(Field－Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置、电子设备和可读存储介质实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种多媒体文件推荐方法，其特征在于，包括：

获取每个待推荐多媒体文件的标签集合；

根据所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，选择为所述待推荐用户推荐的待推荐文件；

所述基于所述历史访问记录包括的多媒体文件，生成所述待推荐用户的历史访问标签集合，包括：

针对所述历史访问记录包括的每个多媒体文件，基于词典分词算法对该多媒体文件的属性信息进行分词，得到所述待推荐用户的历史访问标签集合；

所述获取每个待推荐多媒体文件的标签集合，包括：

针对每个待推荐多媒体文件，基于词典分词算法对该待推荐多媒体文件的属性信息进行分词，得到每个待推荐多媒体文件的标签集合；

其中，词典分词算法为：按照预设的分词策略，对多媒体文件的属性信息进行分词，得到多个汉字字符串，将每个汉字字符串与预设的词典中的词条进行匹配，将各匹配成功的字符串作为标签，构建为标签集合；其中，多媒体文件的属性信息包括：标题信息、简介信息、发布者信息、格式信息和时长信息中的任意一种或多种。

2.根据权利要求1所述的方法，其特征在于，所述预设深度语义匹配模型通过以下步骤训练获得：

构建所述样本训练集；

3.根据权利要求2所述的方法，其特征在于，所述构建所述样本训练集，包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，所述基于预设深度语义匹配模型，确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，包括：

5.根据权利要求1-3任一项所述的方法，其特征在于，所述基于预设深度语义匹配模型，确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，包括：

6.根据权利要求1-3任一项所述的方法，其特征在于，所述基于预设深度语义匹配模型，确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，包括：

7.一种多媒体文件推荐装置，其特征在于，包括：

选择模块，用于根据所述确定模块确定的所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度，选择为所述待推荐用户推荐的待推荐文件；

所述生成模块，具体用于：

所述获取模块，具体用于：

8.根据权利要求7所述的装置，其特征在于，所述装置还包括训练模块，所述训练模块用于：

构建所述样本训练集；

9.根据权利要求8所述的装置，其特征在于，所述训练模块，具体用于：

10.根据权利要求7-9任一项所述的装置，其特征在于，所述确定模块，具体用于：

11.根据权利要求7-9任一项所述的装置，其特征在于，所述确定模块，具体用于：

12.根据权利要求7-9任一项所述的装置，其特征在于，所述确定模块，具体用于：

13.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

所述存储器，用于存放计算机程序；

所述处理器，用于执行所述存储器上所存放的程序时，实现权利要求1-6任一所述的方法步骤。

14.一种可读存储介质，其特征在于，所述可读存储介质内存储有计算机程序，所述计算机程序被电子设备的处理器执行时实现权利要求1-6任一所述的方法步骤。