CN111737558A

CN111737558A - 一种资讯推荐方法、装置及计算机可读存储介质

Info

Publication number: CN111737558A
Application number: CN202010436120.1A
Authority: CN
Inventors: 何旭; 何肖明
Original assignee: Suning Financial Technology Nanjing Co Ltd
Current assignee: Suning Financial Technology Nanjing Co Ltd
Priority date: 2020-05-21
Filing date: 2020-05-21
Publication date: 2020-10-02

Abstract

本发明公开了一种资讯推荐方法、装置及计算机可读存储介质，涉及互联网技术领域，方法包括：基于当前用户的历史行为数据相关的资讯以及预先构建的第一相似度矩阵，生成对应于当前用户的第一资讯推荐列表，其中，第一相似度矩阵中的每个相似度表征每两个资讯之间的内容相似程度；基于预先构建的用户资讯偏好矩阵以及第二相似度矩阵，生成对应于当前用户的第二资讯推荐列表，其中，第二相似度矩阵中的每个相似度是基于每两个资讯拥有的共同的偏好用户的数量而获得的；对第一资讯推荐列表和第二资讯推荐列表进行融合，获得最终的资讯推荐列表以推荐给当前用户。本发明实施例能够提高资讯推荐效果。

Description

一种资讯推荐方法、装置及计算机可读存储介质

技术领域

本发明涉及互联网技术领域，特别涉及一种资讯推荐方法、装置及计算机可读存储介质。

背景技术

随着大数据技术和人工智能技术的飞速发展，从海量资讯数据中找出用户感兴趣的主题并将相关资讯推荐给用户成为研究热点。但由于文章种类和数量多、用户数量多等原因，如何给用户个性化推荐相对应的资讯文章是一个难点。

现有技术中，在向用户个性化推荐资讯时，可以根据用户自己过去的行为习惯进行资讯推荐，但是，这种方式只能向用户推荐与历史行为中存在的偏好相关的资讯文章，而无法更好地满足用户的兴趣探索需求，导致推荐效果不佳，即无法保证向用户推荐的资讯文章符合用户的兴趣的同时，还能够提高推荐资讯文章的多样性。

发明内容

为了解决相关技术中存在的问题，本发明实施例提供了一种资讯推荐方法、装置及计算机可读存储介质，不仅能够保证向用户推荐的资讯文章符合用户的兴趣，而且能够提高推荐资讯文章的多样性，从而提高资讯推荐效果。

本发明实施例提供的具体技术方案如下：

第一方面，提供了一种资讯推荐方法，所述方法包括：

基于当前用户的历史行为数据相关的资讯以及预先构建的第一相似度矩阵，生成对应于所述当前用户的第一资讯推荐列表，其中，所述第一相似度矩阵中的每个相似度表征每两个资讯之间的内容相似程度；

基于预先构建的用户资讯偏好矩阵以及第二相似度矩阵，生成对应于所述当前用户的第二资讯推荐列表，其中，所述第二相似度矩阵中的每个相似度是基于每两个资讯拥有的共同的偏好用户的数量而获得的；

对所述第一资讯推荐列表和所述第二资讯推荐列表进行融合，获得最终的资讯推荐列表以推荐给所述当前用户。

进一步地，所述第一相似度矩阵通过如下方式构建得到：

提取资讯集合中各个资讯的关键词以及对应的关键词词频；

对各所述资讯的关键词按关键词词频的值大小进行排序，得到各所述资讯对应的关键词排序列表；

根据各所述资讯对应的关键词排序列表，按第一计算公式计算所有所述资讯之间的相似度，构建初始的资讯相似度矩阵；

对所述初始的资讯相似度矩阵中的每一行相似度按大小进行排序，并将排序后的所述初始的资讯相似度矩阵确定为所述第一相似度矩阵。

优选地，所述第一计算公式为：

Score_ij＝∑w_in×w_jm T_in＝T_jm；

其中，Score_ij为资讯i和资讯j之间的相似度，w_in为资讯i的第n个关键词的词频，w_jm为资讯j的第m个关键词的词频，T_in为资讯i的第n个关键词，T_jm为资讯j的第m个关键词。

进一步地，所述提取资讯集合中各个资讯的关键词以及对应的关键词词频，包括：

针对所述资讯集合中的每一个所述资讯，对所述资讯进行分词处理并过滤掉停用词，得到所述资讯的多个候选词；以及

对所述多个候选词与预设的关键词词库进行匹配，将匹配成功的候选词确定为所述资讯的关键词，并统计所述资讯的每个关键词对应的关键词词频。

优选地，所述方法还包括：

根据每个所述资讯的每个关键词对应的关键词词频，获取每个所述资讯的平均词频数；

基于每个所述资讯的平均词频数，对每个所述资讯的关键词进行过滤处理。

进一步地，所述用户资讯偏好矩阵通过如下方式构建得到：

针对用户集合中的每个用户的历史行为数据，执行如下操作：

从所述用户的历史行为数据中提取所述用户对应于资讯集合中每个资讯的多个偏好行为数据；

根据各所述偏好行为数据对应的预设权重，对所述用户对应于每个所述资讯的各所述偏好行为数据进行加权计算，获得所述用户对每个所述资讯的兴趣程度值；

基于每个所述用户对每个所述资讯的兴趣程度值，构建所述用户资讯偏好矩阵。

进一步地，所述第二相似度矩阵通过如下方式构建得到：

根据资讯集合中每个资讯对应的用户历史行为数据，统计每个所述资讯的偏好用户的数量：

根据每个资讯的偏好用户的数量以及每两个所述资讯共同的偏好用户的数量，按第二计算公式计算每两个所述资讯之间的相似度，以构建所述第二相似度矩阵。

优选地，所述第二计算公式为：

其中，w_ij为资讯i和资讯j之间的相似度，N_i为偏好资讯i的用户数，N_j为偏好资讯j的用户数，N_i∩N_j为同时偏好资讯i和资讯j的用户数。

进一步地，所述基于预先构建的用户资讯偏好矩阵以及第二相似度矩阵，生成对应于所述当前用户的第二资讯推荐列表，包括：

从资讯集合中确定出所述当前用户无历史行为的多个候选资讯；

对每一个所述候选资讯，从所述第二相似度矩阵中确定出与所述候选资讯之间的相似度排在前K位的相似资讯，并确定所述相似资讯与所述相关的资讯之间的共同的资讯；

针对每一个所述候选资讯，根据所述候选资讯与每一个所述共同的资讯之间的相似度以及所述用户资讯偏好矩阵中所述当前用户对每一个所述共同的资讯的兴趣程度值，按第三计算公式计算所述当前用户对每一个所述候选资讯的兴趣程度值；

对所述当前用户对每一个所述候选资讯的兴趣程度值按大小进行排序，生成所述第二资讯推荐列表。

优选地，所述第三计算公式为：

Scores_tj＝∑_{i∈N(t)∩S(j,k)}w_jiγ_ti；

其中，Scores_tj为用户t对资讯j的兴趣程度值，N(t)为具有积极用户行为的资讯集合，S(j,k)为与资讯j的相似度排在前k位的资讯的集合，w_ji为资讯i和资讯j的相似度，γ_ti为用户t对资讯i的兴趣程度值。

进一步地，所述对所述第一资讯推荐列表和所述第二资讯推荐列表进行融合，获得最终的资讯推荐列表以推荐给所述当前用户，包括：

抽取所述第一资讯推荐列表与所述第二资讯推荐列表中共同的资讯；

对所述共同的资讯进行排序，并将所述第一资讯推荐列表和/或所述第二资讯推荐列表中的部分剩余资讯顺序添加至排序后的所述共同的资讯之后，得到所述最终的资讯推荐列表。

进一步地，所述方法还包括：

当所述当前用户为新用户时，获取基于牛顿冷却定律以及资讯集合中各个资讯对应的用户历史行为数据而计算得到的各个所述资讯的当天热度值；

根据各个所述资讯的当天热度值，对所述资讯集合中的所有资讯进行排序，生成资讯推荐列表并推荐给所述当前用户。

第二方面，提供了一种资讯推荐装置，所述装置包括：

第一生成模块，用于基于当前用户的历史行为数据相关的资讯以及预先构建的第一相似度矩阵，生成对应于所述当前用户的第一资讯推荐列表，其中，所述第一相似度矩阵中的每个相似度表征每两个资讯之间的内容相似程度；

第二生成模块，用于基于预先构建的用户资讯偏好矩阵以及第二相似度矩阵，生成对应于所述当前用户的第二资讯推荐列表，其中，所述第二相似度矩阵中的每个相似度是基于每两个资讯拥有的共同的偏好用户的数量而获得的；

资讯融合模块，用于对所述第一资讯推荐列表和所述第二资讯推荐列表进行融合，获得最终的资讯推荐列表；

资讯推荐模块，用于将所述最终的资讯推荐列表推荐给所述当前用户。

第三方面，提供了一种资讯推荐装置，所述装置包括：

一个或者多个处理器；

存储器；

所述存储在所述存储器中的程序，当被所述一个或者多个处理器执行时，所述程序使所述处理器执行如上述第一方面任意一项所述的资讯推荐方法的步骤。

第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有程序，当所述程序被处理器执行时，使得所述处理器执行如上述第一方面任意一项所述的资讯推荐方法的步骤。

本发明实施例提供一种资讯推荐方法、装置及计算机可读存储介质，由于第一相似度矩阵中的每个相似度表征每两个资讯之间的内容相似程度，因此通过将基于用户的历史行为数据相关的资讯以及预先构建的第一相似度矩阵生成的第一资讯推荐列表推荐给当前用户，能够确保推荐给用户的资讯文章符合用户兴趣；而且，由于第二相似度矩阵中的每个相似度是基于每两个资讯拥有的共同的偏好用户的数量而获得的，即当同时偏好两个资讯的用户越多时，该两个资讯之间的相似度较高，若当前用户偏好过这两个资讯中的其中一个时，可以推断当前用户对这两个资讯中的另一个资讯也有偏好需求，因此通过将基于用户资讯偏好矩阵以及第二相似度矩阵生成的第二资讯推荐列表推荐给当前用户，能够保证向用户推荐的资讯文章符合用户的兴趣，同时也保证了推荐资讯文章的多样性，也有利于实现跨领域的资讯推荐，如此将对第一资讯推荐列表和第二资讯推荐列表得到的资讯推荐列表推荐给用户，使得资讯推荐结果更加多样化、精度更高，从而能够提高资讯推荐效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一个实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例所提供的一种资讯推荐方法的流程示意图；

图2为图1中所示步骤102构建第一相似度矩阵的流程示意图；

图3为图2中所示步骤201的流程示意图；

图4为图1中所示步骤102构建用户资讯偏好矩阵的流程示意图；

图5为图1中所示步骤102构建第二相似度矩阵的流程示意图；

图6为图1中所示步骤102的流程示意图；

图7为图1中所示步骤103的流程示意图；

图8为本发明实施例所提供的一种资讯推荐装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，除非上下文明确要求，否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义；也就是说，是“包括但不限于”的含义。

此外，在本发明的描述中，需要理解的是，术语“第一”、“第二”等仅用于描述目的，而不能理解为指示或暗示相对重要性。此外，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

图1为本发明实施例所提供的资讯推荐方法的流程示意图。本发明实施例以该资讯推荐方法应用于于资讯推荐装置中来举例说明，该资讯推荐装置可以被配置于任一计算机设备中，以使该计算机设备可以执行资讯推荐方法。

参照图1所示，本发明实施例提供的资讯推荐方法可以包括如下步骤：

101，基于当前用户的历史行为数据相关的资讯以及预先构建的第一相似度矩阵，生成对应于当前用户的第一资讯推荐列表，其中，第一相似度矩阵中的每个相似度表征每两个资讯之间的内容相似程度。

这里，当前用户可以是当前时刻通过客户端刷新信息流的用户。其中，用户的历史行为数据即用户进行行为操作的资讯，该资讯可以是该用户当前时刻之前的上一时刻进行行为操作的资讯，也可以是该用户当前时刻之前的其他时刻进行行为操作的资讯，其中，行为操作包括但不限于用户对于资讯的浏览、点击、评论、收藏、转发、分享等多种操作行为。其中，资讯可以是股票资讯、基金资讯等金融类资讯，也可以是科技类、娱乐类以及其他类别的资讯。

其中，构建第一相似度矩阵的过程可以是先提取各个资讯的关键词以及关键词词频，再对关键词按关键词词频进行排序，基于每两个资讯之间的关键词排序列表结合关键词词频进行计算每两个资讯之间的相似度，构建得到第一相似度矩阵。此外，还可以采用其他方式进行构建，本实施例对具体过程不作限定。

本实施例中，可以确定当前用户的历史行为数据相关的资讯，根据第一相似度矩阵中的相似度，确定出与该历史行为数据相关的资讯最相似的若干个待推荐资讯，生成第一资讯推荐列表，其中，若待推荐资讯与当前用户的历史行为数据相关的资讯之间的相似度越大，则待推荐资讯在第一资讯推荐列表中的位置越靠前。

102，基于预先构建的用户资讯偏好矩阵以及第二相似度矩阵，生成对应于当前用户的第二资讯推荐列表，其中，第二相似度矩阵中的每个相似度是基于每两个资讯拥有的共同的偏好用户的数量而获得的。

其中，用户资讯偏好矩阵中的每个兴趣程度值表征用户对资讯的兴趣程度。

其中，构建用户资讯偏好矩阵的过程可以是：通过从用户集合中的各个用户在一个预设时间段内的历史行为数据中提取各个用户对各个资讯的若干个偏好行为数据，通过对若干个偏好行为数据进行加权计算得到用户对资讯的兴趣程度值，进而构建得到用户资讯偏好矩阵，这里的偏好行为数据可以包括浏览次数、点击次数、评论次数、收藏次数、转发次数以及分享次数中的一个或多个。此外，还可以采用其他方式构建用户资讯偏好矩阵，本实施例对具体过程不作限定。

其中，构建第二相似度矩阵的过程可以是：在计算两个资讯之间的相似度时，利用该两个资讯各自的偏好用户的数量以及该两个资讯拥有的共同的偏好用户的数量进行计算该两个资讯之间的相似度，进而构建得到第二相似度矩阵。这里，当某个用户同时偏好不同的两个资讯时，该用户即为这两个资讯拥有的共同的偏好用户。

本实施例中，可以从用户资讯偏好矩阵中确定当前用户感兴趣的资讯，根据第二相似度矩阵中的相似度，确定出与当前用户感兴趣的资讯最相似的若干个待推荐资讯，生成第二资讯推荐列表，其中，待推荐资讯与当前用户感兴趣的资讯之间的相似度越大，则候选资讯在第二资讯推荐列表中的位置越靠前。

103，对第一资讯推荐列表和第二资讯推荐列表进行融合，获得最终的资讯推荐列表以推荐给当前用户。

本实施例中，可以先抽取出包含在第一资讯推荐列表且包含在第二资讯推荐列表中的若干个待推荐资讯，并对若干个待推荐资讯排序生成最终的资讯推荐列表以推荐给用户，此外，当抽取出的若干个待推荐资讯的数量较少时，也可以将第一资讯推荐列表和/或第二资讯推荐列表中的部分剩余资讯排序在若干个待推荐资讯之后，从而得到最终的资讯推荐列表以推荐给用户。

本发明实施例提供了一种资讯推荐方法，由于第一相似度矩阵中的每个相似度表征每两个资讯之间的内容相似程度，因此通过将基于用户的历史行为数据相关的资讯以及预先构建的第一相似度矩阵生成的第一资讯推荐列表推荐给当前用户，能够确保推荐给用户的资讯文章符合用户兴趣；而且，由于第二相似度矩阵中的每个相似度是基于每两个资讯拥有的共同的偏好用户的数量而获得的，即当同时偏好两个资讯的用户越多时，该两个资讯之间的相似度较高，若当前用户偏好过这两个资讯中的其中一个时，可以推断当前用户对这两个资讯中的另一个资讯也有偏好需求，因此通过将基于用户资讯偏好矩阵以及第二相似度矩阵生成的第二资讯推荐列表推荐给当前用户，能够保证向用户推荐的资讯文章符合用户的兴趣，同时也保证了推荐资讯文章的多样性，也有利于实现跨领域的资讯推荐，如此将对第一资讯推荐列表和第二资讯推荐列表得到的资讯推荐列表推荐给用户，资讯推荐结果更加多样化、精度更高，从而能够提高资讯推荐效果。

此外，考虑到不存在当前用户的历史行为数据，即冷启动时，当前用户是第一次登陆查看资讯的新用户，上述实施例不适用对新用户进行资讯推荐，因此为了避免冷启动的问题，本发明实施例提供的方法除了上述步骤之外，还可以包括基于热度预测的推荐算法进行资讯推荐的步骤。

在本发明的一个实施例中，方法还可以包括：

当当前用户为新用户时，获取基于牛顿冷却定律以及资讯集合中各个资讯对应的用户历史行为数据而计算得到的各个资讯的当天热度值；

根据各个资讯的当天热度值，对资讯集合中的所有资讯进行排序，生成资讯推荐列表并推荐给当前用户。

具体地，当埋点数据库中不存在当前用户对资讯的历史行为数据时，则确定当前用户为新用户。

其中，资讯集合中各个资讯的当天热度值的计算过程可以是：获取资讯集合中的所有资讯在过去一个时间段(例如前7天)内的浏览、点赞和收藏等各种类型的用户行为数据，并按照用户行为数据的类型分配不同的权重值，例如对收藏、点赞和浏览赋上由高到低的权重，计算各个资讯的热度数据。

由于一个资讯在其生命周期中，除了出示状态以外，热度是逐渐降低的，与自然界中的牛顿冷却定律相似，所以可以利用牛顿冷却定律对当日的热度进行预测，具体可以采用如下计算公式计算资讯的当天热度值：

其中，Score_i为第i天的热度，ratio为冷却系数，interval为时间间隔，Score为由前D天热度得到的当天的资讯热度。优选地，ratio取值为0.02，interval取值为24。

如此，通过计算得到各个资讯的当天热度值，对所有资讯进行排序，找到当日热度预测最大的N个资讯，在新用户登录客户端浏览资讯时，将当日热度预测最大的资讯展示给用户，可以避免冷启动问题，能够实现对无历史偏好行为数据的用户进行资讯推荐。

在本发明的一个实施例中，如图2所示，步骤102中的第一相似度矩阵通过如下方式构建得到，该过程可以包括步骤：

201，提取资讯集合中各个资讯的关键词以及对应的关键词词频。

202，对各资讯的关键词按关键词词频的值大小进行排序，得到各资讯对应的关键词排序列表。

203，根据各资讯对应的关键词排序列表，按第一计算公式计算所有资讯之间的相似度，构建初始的资讯相似度矩阵。

优选地，第一计算公式为：

Score_ij＝∑w_in×w_jm T_in＝T_jm；

可以理解的是，还可以通过其他计算方式计算资讯之间的相似度，本实施例对此不作限定。

本发明实施例中在计算资讯相似度的过程中，相比较于现有的推荐算法中，通过获取的长句并转为向量，再计算词向量间的距离而言，本发明通过提取资讯的关键词及其词频，并对各资讯的关键词按词频的值由大到小进行排序得到关键词排序列表，进而可以直接基于资讯的关键词排序列表，计算资讯间的相似度，减少了数据计算量，简单高效且精度高，能够提高相似度计算效果。

204，对初始的资讯相似度矩阵中的每一行相似度按大小进行排序，并将排序后的初始的资讯相似度矩阵确定为第一相似度矩阵。

本实施例中，第一相似度矩阵中的每个相似度表征每两个资讯之间的内容相似程度，且矩阵中的每一行相似度是按相似度大小排序得到的，因此当确定当前用户的历史行为数据相关的资讯为资讯i(例如，当前用户在当前时刻的前一个时刻内浏览、转发、点赞或者收藏过资讯i)时，可以通过确定出第一相似度矩阵中资讯i所对应的矩阵行，并从该矩阵行的首位开始，在该矩阵行中依序确定出与资讯i的相似度最高的若干个待推荐资讯，生成第一资讯推荐列表。

可以理解的是，当资讯集合中增加新的资讯时，则需要针对新的资讯，执行步骤201至步骤204，以更新第一相似度矩阵。

在本发明的一个实施例中，如图3所示，上述步骤201中提取资讯集合中各个资讯的关键词以及对应的关键词词频，该过程可以包括步骤：

301，针对资讯集合中的每一个资讯，对资讯进行分词处理并过滤掉停用词，得到资讯的多个候选词。

具体地，基于字符串匹配的中文分词算法对各个资讯文章的正文部分进行分词处理。例如，可以利用基于字符串匹配中的双向最大匹配算法，即使用正向最大匹配和逆向最大匹配同时计算，得到各个资讯的分词结果，并利用构建的停用词词库对各个资讯的分词结果进行过滤停用词，得到各个资讯的多个候选词。

其中，停用词词库包括使用频率很高的但是无代表意义的词和常见的标点符号，例如逗号、句号、冒号、数字、“我的”、“我们”、“也”、“的”等。

302，对多个候选词与预设的关键词词库进行匹配，将匹配成功的候选词确定为资讯的关键词，并统计资讯的每个关键词对应的关键词词频。

具体地，预设的关键词词库可以基于实际资讯推荐目的构建得到，关键词词库可以是一个或多个，当关键词词库的数量为多个时，需要对一个资讯的多个候选词分别与每个关键词词库进行匹配，将每个关键词词库对应的匹配成功的候选词作为该资讯的关键词。例如，若资讯推荐目的是推荐基金、股票类的资讯文章，可以通过提取国内上市公司的公司名称、股票代码、高管姓名、重要股东名等词，形成上市公司词库；通过提取国内基金数据，包括基金名称、基金简称、基金代码、基金经理等词，形成基金产品词库。

在确定出各个资讯的关键词后，可以对各个资讯的每个关键词所对应的关键词词频进行统计，这样得到各个资讯的每个关键词及其对应的词频，以词典形式保存下来。

本实施例中，通过结合关键词词库对资讯内容进行关键词提取，以有限量的关键词去代表资讯内容，减少了数据量，并便于后续的资讯间的相似度的计算。

此外，为了避免由于分词模型存在误差，导致部分资讯中的关键词出现过多噪声而影响后续资讯相似度计算的准确性，因此上述步骤201的实现过程，在确定出各个资讯的关键词以及对应的关键词词频之后，还可以包括步骤303至步骤304。

303，根据每个资讯的每个关键词对应的关键词词频，获取每个资讯的平均词频数。

其中，w_ik为资讯i的第k个关键词对应的词频，n为资讯i的关键词数，

为计算得到的平均词频数。

304，基于每个资讯的平均词频数，对每个资讯的关键词进行过滤处理。

具体地，对资讯i的关键词进行过滤处理时，可以将资讯i中关键词词频比

小的关键词全部过滤，保留关键词词频不小于

的关键词，对过滤处理后的每个资讯的关键词按关键词词频的值大小进行排序，得到每个资讯的关键词排序列表。

本实施例中，通过对资讯的关键词按关键词词频进行低频过滤等处理，再利用词频排序得到关键词列表，进而计算资讯之间的相似度，如此通过特征工程的粗排序，能够提高相似度计算效果。

在本发明的一个实施例中，如图4所示，上述步骤102中的用户资讯偏好矩阵通过如下方式构建得到，该过程可以包括步骤：

401，针对用户集合中的每个用户的历史行为数据，从用户的历史行为数据中提取用户对应于资讯集合中每个资讯的多个偏好行为数据。

具体地，针对用户集合中的每一个用户，从存储有埋点数据的数据库中，获取该用户在预设历史时间段内对资讯集合中每个资讯的历史行为数据，从历史行为数据中提取用户对应于该资讯的偏好行为数据，这里的偏好行为数据是指能够表征用户对资讯具有偏好行为的数据，例如用户对于资讯的浏览、收藏、转发、分享、点赞等行为数据。

402，根据各偏好行为数据对应的预设权重，对用户对应于每个资讯的各偏好行为数据进行加权计算，获得用户对每个资讯的兴趣程度值。

其中，可以预先对不同类型的偏好行为分配不同的权重。

具体地，统计各类型的偏好行为数据的值域分布，将用户的偏好行为数据中的异常值剔除，根据各偏好行为数据对应的预设权重，对用户对应于每个资讯的各偏好行为数据进行加权计算，获得用户对每个资讯的兴趣程度值。

示例性地，例如选取三种偏好行为数据：浏览、点赞和收藏，对应的权重大小可以设置为：收藏行为对应的权重最高，其次是点赞，最低为浏览。

上述用户对资讯的兴趣程度值可以通过如下计算公式计算得到：

Score_ij＝Favorite_ij*α+Like_ij*β+Browse_ij*γ；

其中，i为第i个用户，j为资讯j，Favorite_ij为i用户对资讯j的收藏次数，Like_ij为i用户对资讯j的点赞次数，Browse_ij为i用户对资讯j的浏览次数。优选地，α、β、γ分别对应取值为10、5、1。

需要说明的是，尽管本实施例中以浏览、点赞和收藏三种偏好行为作为示例计算用户对资讯的兴趣程度值，但是，可以理解的是，本发明实施例提供的方法并不限于此，本领域技术人员还可以采用更多类型的偏好行为计算用户对资讯的兴趣程度值。

403，基于每个用户对每个资讯的兴趣程度值，构建用户资讯偏好矩阵。

本实施例中，通过计算得到每个用户对每个资讯的兴趣程度值，最终形成“用户-资讯”的用户偏好资讯矩阵，其中，矩阵的列为“用户编号”，矩阵的行为“资讯编号”，矩阵中的值为“用户对资讯的兴趣程度值”。

在本发明的一个实施例中，如图5所示，上述步骤102中的第二相似度矩阵通过如下方式构建得到，包括步骤：

501，根据资讯集合中每个资讯对应的用户历史行为数据，统计每个资讯的偏好用户的数量。

具体地，从每个资讯在预设历史时间段内对应的历史行为数据中提取不同的用户对应于每个资讯的偏好行为数据，根据不同的用户对应于每个资讯的偏好行为数据，统计每个资讯的偏好用户的数量。

这里的偏好行为数据是指能够表征用户对资讯具有偏好行为的数据，例如用户对于资讯的浏览、收藏、转发、分享、点赞等行为数据。

502，根据每个资讯的偏好用户的数量以及每两个资讯共同的偏好用户的数量，按第二计算公式计算每两个资讯之间的相似度，以构建第二相似度矩阵。

优选地，第二计算公式为：

通过第二计算公式可获知，当资讯i和资讯j拥有的共同的偏好用户的数量越大，即偏好资讯i和资讯j的用户数越多，资讯i和资讯j之间的相似度w_ij越高。

可以理解的是，当资讯集合中增加新的资讯时，则需要针对新的资讯，执行步骤501至步骤502，以更新第二相似度矩阵。

在本发明的一个实施例中，如图6所示，上述步骤102中基于预先构建的用户资讯偏好矩阵以及第二相似度矩阵，生成对应于当前用户的第二资讯推荐列表，该过程可以包括：

601，从资讯集合中确定出当前用户无历史行为的多个候选资讯。

602，对每一个候选资讯，从第二相似度矩阵中确定出与候选资讯之间的相似度排在前K位的相似资讯，并从相似资讯与相关的资讯中确定出共同的资讯。

本实施例中，可以在第二相似度矩阵中，确定各个候选资讯分别所在的矩阵行，并针对每一个候选资讯，在定位出的矩阵行中确定与该候选资讯之间的相似度排在前k位的k个相似资讯，从k个相似资讯与当前用户对相关的资讯中确定出二者共同的资讯，k为不小于1的正整数。

603，针对每一个候选资讯，根据候选资讯与每一个共同的资讯之间的相似度以及用户资讯偏好矩阵中当前用户对每一个共同的资讯的兴趣程度值，按第三计算公式计算当前用户对每一个候选资讯的兴趣程度值。

具体地，根据当前用户的历史行为数据相关的资讯，确定当前用户对应的用户编号和资讯编号，根据确定出的用户编号和资讯编号，从用户资讯偏好矩阵中确定当前用户对相关的资讯的兴趣程度值。

针对每一个候选资讯，对该候选资讯与每个共同的资讯之间的相似度对应乘以当前用户对每个共同的资讯的兴趣程度值，并对得到的相乘结果进行求和，求和结果作为当前用户对该候选资讯的兴趣程度值，依此类推，得到当前用户对，每一个候选资讯的兴趣程度值。

优选地，第三计算公式为：

Scores_tj＝∑_{i∈N(t)∩s(j,k)}w_jiγ_ti；

其中，Scores_tj为用户t对资讯j的兴趣程度值，N(t)为具有积极用户行为的资讯集合，S(j,k)为与资讯j的相似度排在前k位的资讯的集合，w_ji为资讯i和资讯j的相似度，γ_ti为用户t对资讯i的兴趣程度值。这里，积极用户行为具体可以为浏览、收藏、转发、分享、点赞等行为。

示例性地，假设k取值为3，资讯集合为{A，B，C，D，E，F}，若当前用户偏好行为对应的资讯为{A，B，C，D}，那么候选资讯则为{E，F}。针对候选资讯E，从第二相似度矩阵中确定与资讯E的相似度排在前3位的资讯依次为资讯A、资讯F、资讯B；确定出{A，B，C，D}与{A，F，B}之间共同的资讯为{A，B}；接着根据用户资讯偏好矩阵，获取当前用户对资讯A的兴趣程度值以及当前用户对资讯B的兴趣程度值，并根据第二相似度矩阵，确定候选资讯E分别与资讯A、B之间的相似度，然后按照第三计算公式计算出当前用户对候选资讯E的兴趣程度值，依此类推，可以计算当前用户对候选资讯F的兴趣程度值。

604，对当前用户对每一个候选资讯的兴趣程度值按大小进行排序，生成第二资讯推荐列表。

本实施例中，通过基于当前用户对相关的资讯的兴趣程度值以及从第二相似度矩阵中确定出的相关的资讯与多个候选资讯之间的相似度，计算当前用户对每一个候选资讯的兴趣程度值，由于第二相似度矩阵中的每个相似度是基于每两个资讯拥有的共同的偏好用户的数量而获得的，若当前用户偏好过相似的两个资讯中的其中一个时，可以推断当前用户对这相似的两个资讯中的另一个资讯(即候选资讯)也有偏好需求，因此通过基于候选资讯的兴趣程度值排序生成第二资讯推荐列表推荐给用户，能够保证向用户推荐的第二资讯推荐列表中的资讯符合用户兴趣探索需求，也有利于实现跨领域的资讯推荐。

在本发明的一个实施例中，如图7所示，上述步骤103对第一资讯推荐列表和第二资讯推荐列表进行融合，获得最终的资讯推荐列表以推荐给当前用户，包括：

701，抽取第一资讯推荐列表与第二资讯推荐列表中共同的资讯。

这里，当某个资讯即包含在第一资讯推荐列表中，也包含在第二资讯推荐列表中，则该资讯为第一资讯推荐列表与第二资讯推荐列表共同的资讯。

702，对共同的资讯进行排序，并将第一资讯推荐列表和/或第二资讯推荐列表中的部分剩余资讯顺序添加至排序后的共同的资讯之后，得到最终的资讯推荐列表。

具体地，可以根据预设资讯推荐数量，抽取第一资讯推荐列表和/或第二资讯推荐列表中的部分剩余资讯，并顺序添加至排序后的共同的资讯后，得到最终的资讯推荐列表。这里，预设资讯推荐数量可以根据实际需要进行设定，例如设置最终的资讯推荐列表中的资讯数量为10个。

本发明实施例中，通过对第一资讯推荐列表和第二资讯推荐列表进行融合，获得最终的资讯推荐列表以推荐给当前用户，不仅能够保证向用户推荐的资讯文章符合用户的兴趣，而且能够提高推荐资讯文章的多样性，从而提高资讯推荐效果。

图8为本发明实施例所提供的资讯推荐装置的结构示意图。请参考图8所示，本发明实施例还提供了一种资讯推荐装置，该装置包括：

第一生成模块81，用于基于当前用户的历史行为数据相关的资讯以及预先构建的第一相似度矩阵，生成对应于当前用户的第一资讯推荐列表，其中，第一相似度矩阵中的每个相似度表征每两个资讯之间的内容相似程度；

第二生成模块82，用于基于预先构建的用户资讯偏好矩阵以及第二相似度矩阵，生成对应于当前用户的第二资讯推荐列表，其中，第二相似度矩阵中的每个相似度是基于每两个资讯拥有的共同的偏好用户的数量而获得的；

资讯融合模块83，用于对第一资讯推荐列表和第二资讯推荐列表进行融合，获得最终的资讯推荐列表；

资讯推荐模块84，用于将最终的资讯推荐列表推荐给当前用户。

在本发明的一个实施例中，该装置还包括第一构建模块，第一构建模块用于：

提取资讯集合中各个资讯的关键词以及对应的关键词词频；

对各资讯的关键词按关键词词频的值大小进行排序，得到各资讯对应的关键词排序列表；

根据各资讯对应的关键词排序列表，按第一计算公式计算所有资讯之间的相似度，构建初始的资讯相似度矩阵；

对初始的资讯相似度矩阵中的每一行相似度按大小进行排序，并将排序后的初始的资讯相似度矩阵确定为第一相似度矩阵；

优选地，第一计算公式为：

Score_ij＝∑w_in×w_jm T_in＝T_jm；

在本发明的一个实施例中，第一构建模块具体用于：

获取资讯集合中各个资讯对应的关键词以及关键词词频，包括：

针对资讯集合中的每一个资讯，对资讯进行分词处理并过滤掉停用词，得到资讯的多个候选词；以及

对多个候选词与预设的关键词词库进行匹配，将匹配成功的候选词确定为资讯的关键词，并统计资讯的每个关键词对应的关键词词频；

优选地，第一构建模块具体还用于：

根据每个资讯的每个关键词对应的关键词词频，获取每个资讯的平均词频数；

基于每个资讯的平均词频数，对每个资讯的关键词进行过滤处理。

在本发明的一个实施例中，该装置还包括第二构建模块，第二构建模块用于：

从用户的历史行为数据中提取用户对应于资讯集合中每个资讯的多个偏好行为数据；

根据各偏好行为数据对应的预设权重，对用户对应于每个资讯的各偏好行为数据进行加权计算，获得用户对每个资讯的兴趣程度值；

基于每个用户对每个资讯的兴趣程度值，构建用户资讯偏好矩阵。

在本发明的一个实施例中，该装置还包括第三构建模块，第三构建模块用于：

根据资讯集合中每个资讯对应的用户历史行为数据，统计每个资讯的偏好用户的数量：

根据每个资讯的偏好用户的数量以及每两个资讯共同的偏好用户的数量，按第二计算公式计算每两个资讯之间的相似度，以构建第二相似度矩阵；

优选地，第二计算公式为：

在本发明的一个实施例中，第二生成模块具体用于：

对所述当前用户对每一个所述候选资讯的兴趣程度值按大小进行排序，生成所述第二资讯推荐列表；

优选地，第三计算公式为：

Scores_tj＝∑_{i∈N(t)∩S(j,k)}w_jiγ_ti；

在本发明的一个实施例中，资讯融合模块83具体用于：

抽取第一资讯推荐列表与第二资讯推荐列表中共同的资讯；

对共同的资讯进行排序，并将第一资讯推荐列表和/或第二资讯推荐列表中的部分剩余资讯顺序添加至排序后的共同的资讯之后，得到最终的资讯推荐列表。

在本发明的一个实施例中，装置还包括第三生成模块，第三生成模块用于：

根据各个资讯的当天热度值，对资讯集合中的所有资讯进行排序，生成资讯推荐列表。

资讯推荐模块84具体还用于：

将第三生成模块生成的资讯推荐列表推荐给当前用户。

本发明实施例提供一种资讯推荐装置，与本发明实施例所提供的资讯推荐方法属于同一发明构思，可执行本发明实施例所提供的资讯推荐方法，具备执行资讯推荐方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明实施例提供的资讯推荐方法，此处不再加以赘述。

此外，本发明实施例还提供一种资讯推荐装置，装置包括：

一个或者多个处理器；

存储器；

存储在存储器中的程序，当被一个或者多个处理器执行时，程序使处理器执行上述实施例中任一所述的资讯推荐方法的步骤。

此外，本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质存储有程序，当程序被处理器执行时，使得处理器执行上述实施例中任一所述的资讯推荐方法的步骤。

本领域内的技术人员应明白，本发明实施例中的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例中是参照根据本发明实施例中实施例的方法、装置(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例中的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例中范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种资讯推荐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述第一相似度矩阵通过如下方式构建得到：

提取资讯集合中各个资讯的关键词以及对应的关键词词频；

对所述初始的资讯相似度矩阵中的每一行相似度按大小进行排序，并将排序后的所述初始的资讯相似度矩阵确定为所述第一相似度矩阵；

优选地，所述第一计算公式为：

Score_ij＝∑w_in×w_jm T_in＝T_jm；

3.根据权利要求2所述的方法，其特征在于，所述提取资讯集合中各个资讯的关键词以及对应的关键词词频，包括：

对所述多个候选词与预设的关键词词库进行匹配，将匹配成功的候选词确定为所述资讯的关键词，并统计所述资讯的每个关键词对应的关键词词频；

优选地，所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，所述用户资讯偏好矩阵通过如下方式构建得到：

5.根据权利要求1所述的方法，其特征在于，所述第二相似度矩阵通过如下方式构建得到：

根据每个资讯的偏好用户的数量以及每两个所述资讯共同的偏好用户的数量，按第二计算公式计算每两个所述资讯之间的相似度，以构建所述第二相似度矩阵；

优选地，所述第二计算公式为：

6.根据权利要求1所述的方法，其特征在于，所述基于预先构建的用户资讯偏好矩阵以及第二相似度矩阵，生成对应于所述当前用户的第二资讯推荐列表，包括：

优选地，所述第三计算公式为：

Scores_tj＝∑_{i∈N(t)∩S(}j_,k)w_jiγ_ti；

7.根据权利要求1所述的方法，其特征在于，所述对所述第一资讯推荐列表和所述第二资讯推荐列表进行融合，获得最终的资讯推荐列表以推荐给所述当前用户，包括：

8.根据权利要求1至7任一所述的方法，其特征在于，所述方法还包括：

9.一种资讯推荐装置，其特征在于，所述装置包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有程序，当所述程序被处理器执行时，使得所述处理器执行如权利要求1至8任一所述的资讯推荐方法的步骤。