CN109190024A

CN109190024A - 信息推荐方法、装置、计算机设备及存储介质

Info

Publication number: CN109190024A
Application number: CN201810948488.9A
Authority: CN
Inventors: 吴壮伟
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2018-08-20
Filing date: 2018-08-20
Publication date: 2019-01-11
Anticipated expiration: 2038-08-20
Also published as: WO2020037930A1; CN109190024B

Abstract

本申请实施例公开了一种信息推荐方法、装置、计算机设备及存储介质。该方法包括获取多个用户在第一预设时间段和第二预设时间段内的第一浏览数据和第二浏览数据；根据第一浏览数据和第二浏览数据确定多个用户关键词和每个用户对每个用户关键词的兴趣程度并根据多个用户关键词和相应的兴趣程度生成每个用户的兴趣向量；获取多个待推荐文档并获取每个待推荐文档的文档关键词和每个文档关键词的权重值；根据待推荐文档的文档关键词和权重值生成每个待推荐文档的推荐向量；计算用户的兴趣向量与每个待推荐文档的推荐向量之间的距离值并根据每个所述距离值将满足预设条件的待推荐文档作为推送信息推送给所述用户。该方法可以提高信息推荐的准确性。

Description

信息推荐方法、装置、计算机设备及存储介质

技术领域

本申请涉及计算机技术领域，尤其涉及一种信息推荐方法、装置、计算机设备及存储介质。

背景技术

推荐***是为解决信息过载问题而提出的一种智能代理***，其能从大量信息中向用户自动推荐出符合其兴趣偏好或需求的资源。随着互联网的飞速发展，推荐***已被应用在各个领域，尤其是应用在电子商务网站等领域。

目前的推荐***大多是基于用户评分矩阵的协同过滤***，根据用户以往对浏览过的新闻等文档的评分来向用户推荐其可能感兴趣的新闻、文档等信息。然而，很多用户在看完新闻等文档信息后，一般都没有对所浏览的新闻等进行评分的习惯，这就导致用户评分矩阵存在严重的稀疏性，使得后续向用户推荐信息的准确性和合理性都较低，用户体验较差。

发明内容

本申请提供了一种信息推荐方法、装置、计算机设备及存储介质，以提高信息推荐的准确性和合理性。

第一方面，本申请提供了一种信息推荐方法，其包括：获取多个用户在第一预设时间段内的第一浏览数据以及在第二预设时间段内的第二浏览数据，其中，所述第一浏览数据和第二浏览数据为多个所述用户浏览网页时的用户行为数据；根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度，并根据多个所述用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度生成每个所述用户对应的兴趣向量；获取多个待推荐文档，并基于预设关键词信息技术获取每个所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值；根据所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值生成每个所述待推荐文档对应的推荐向量；以及计算所述用户的兴趣向量与每个所述待推荐文档的推荐向量之间的距离值，并根据每个所述距离值将满足预设条件的待推荐文档作为推送信息推送给所述用户。

第二方面，本申请提供了一种信息推荐装置，其包括：浏览数据获取单元，用于获取多个用户在第一预设时间段内的第一浏览数据以及在第二预设时间段内的第二浏览数据，其中，所述第一浏览数据和第二浏览数据为多个所述用户浏览网页时的用户行为数据；兴趣向量生成单元，用于根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度，并根据多个所述用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度生成每个所述用户对应的兴趣向量；关键词获取单元，用于获取多个待推荐文档，并基于预设关键词信息技术获取每个所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值；推荐向量生成单元，用于根据所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值生成每个所述待推荐文档对应的推荐向量；以及推荐单元，用于计算所述用户的兴趣向量与每个所述待推荐文档的推荐向量之间的距离值，并根据每个所述距离值将满足预设条件的待推荐文档作为推送信息推送给所述用户。

第三方面，本申请又提供了一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现第一方面提供的所述的信息推荐方法。

第四方面，本申请还提供了一种计算机可读存储介质，其中所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行第一方面提供的所述的信息推荐方法。

本申请提供一种信息推荐方法、装置、计算机设备及存储介质。该信息推荐方法可以结合用户在第一预设时间段和第二预设时间段内的浏览数据向用户进行推荐，提高信息推荐的准确性和合理性。

附图说明

为了更清楚地说明本申请实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种信息推荐方法的示意流程图；

图2为本申请实施例提供的一种信息推荐方法的具体示意流程图；

图3为本申请实施例提供的一种信息推荐方法的具体示意流程图；

图4为本申请实施例提供的一种信息推荐方法的具体示意流程图

图5为本申请实施例提供的一种信息推荐装置的示意性框图；

图6为本申请实施例提供的一种计算机设备的示意性框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参阅图1，图1是本申请实施例提供的一种信息推荐方法的示意流程图。该信息推荐方法包括步骤S101～S105。

S101、获取多个用户在第一预设时间段内的第一浏览数据以及在第二预设时间段内的第二浏览数据，其中，所述第一浏览数据和第二浏览数据为多个所述用户浏览网页时的用户行为数据。

在本实施例中，第一预设时间段和第二预设时间段的时间长度不相同。譬如，第一预设时间段的时间长度可以小于第二预设时间段的时间长度，例如，第一预设时间段为近7天时间，第二预设时间段为近90天时间。这样第一预设时间段内的第一浏览数据就相当于短期的数据，第二预设时间段内的第二浏览数据就相当于长期的数据，从而实现结合长期和短期内的数据向用户推荐信息，提高信息推荐的准确性，同时也可以解决用户评分矩阵存在稀疏性的问题。

在一实施例中，获取用户浏览网页时的用户行为数据，即获取用户的第一浏览数据和第二浏览数据的具体方式可为通过Web服务器日志的方式来获取，或者通过运行在客户端的软件进行隐性获取等，在此不对获取用户的第一浏览数据和第二浏览数据的方式做限制。

在一实施例中，该第一浏览数据可以包括多个用户在第一预设时间段内浏览的所有文档和多个用户对第一预设时间段内的每篇文档的浏览行为参数，其中，浏览行为参数可以包括每个用户对第一浏览数据中的每篇文档的点击参数、每个用户在浏览第一浏览数据中的每篇文档时的起始时间和终止时间等等。同理，该第二浏览数据中也包括多个用户在第二预设时间段内浏览的所有文档和多个用户对第二预设时间段内的每个文档的浏览行为参数，其中，浏览行为参数可以包括每个用户对第二浏览数据中的每篇文档的点击参数、每个用户在浏览第二浏览数据中的每篇文档时的起始时间和终止时间等等。当然，该第一浏览数据或第二浏览数据还可以包括其他数据，譬如，还可以包括用户的网络地址、文档的URL(英文全称：Uniform Resource Locator，中文名称：统一资源定位符)链接等信息，在此不做具体限制。

S102、根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度，并根据多个所述用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度生成每个所述用户对应的兴趣向量。

在获得第一浏览数据和第二浏览数据后，将根据第一浏览数据和第二浏览数据确定多个用户关键词以及每个用户对每个用户关键词的兴趣程度。

具体地，在一实施例中，如图2所示，图2是本申请实施例提供的一种信息推荐方法的具体示意流程图。在该实施例中，第一浏览数据包括多个所述用户在所述第一预设时间段内浏览的文档和多个所述用户对所述第一预设时间段内的每个文档的浏览行为参数；第二浏览数据包括多个所述用户在所述第二预设时间段内浏览的文档和多个所述用户对所述第二预设时间段内的每个文档的浏览行为参数。该步骤S102中的根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度，具体包括步骤S1021至S1025。

S1021、基于文档主题生成模型，获取所述第一浏览数据中的多个文档对应的多个第一主题以及每个所述第一主题对应的第一关键词列表，以及获取所述第二浏览数据中的多个文档对应的多个第二主题以及每个所述第二主题对应的第二关键词列表，其中，所述第一关键词列表和第二关键词列表均包括相应的主题对应的多个主题关键词以及每个所述主题关键词对应的权重值。

在该实施例中，将采用文档主题生成模型(英文名称：Latent DirichletAllocation，简称：LDA)获得第一浏览数据和第二浏览数据中每篇文档对应的主题以及每个主题对应的关键词列表。

具体地，将第一浏览数据中的多个文档输入至文档主题生成模型中以获得多个文档对应的多个第一主题和每个第一主题对应的第一关键词列表，其中，该第一关键词列表包括每个第一主题对应的多个主题关键词以及每个主题关键词对应的权重值。同理，可以获得第二浏览数据中多个文档对应的多个第二主题和每个第二主题对应的第二关键词列表，其中，该第二关键词列表包括每个第二主题对应的多个主题关键词以及每个主题关键词对应的权重值。

需要说明的是，该主题关键词为相应主题对应的多个词汇中权重值按从大到小排列的前预设数量的词汇。譬如，该主题关键词为相应主题对应的多个词汇中权重值较大的前10个词汇。

S1022、将所述第一浏览数据中的多个主题关键词和所述第二浏览数据中的多个主题关键词进行并集运算以获得多个用户关键词。

由于第一浏览数据和第二浏览数据是用户在不同时间段内浏览网页时的用户行为数据，因此第一浏览数据和第二浏览数据是可以体现出用户在不同时间段内的兴趣偏好的。随着时间的变化，用户在第一预设时间段内和第二预设时间段内所偏好的文档类型、文档内容等可能是一样的，也可能存在差异，因此，第一浏览数据中多个第一主题与第二浏览数据中多个第二主题可能存在相同的主题和不相同的主题，相应的多个第一主题中的主题关键词与多个第二主题中的主题关键词也可能存在相同的关键词和不同的关键词。为了可以根据用户在不同时间段内的偏好向用户推荐更为准确的信息，在该实施例中，需要将第一浏览数据中的多个主题关键词和第二浏览数据中的多个主题关键词进行并集运算以获得多个用户关键词。譬如，第一浏览数据中多个主题关键词包括“科比”和“张柏芝”，第二浏览数据中多个主题关键词包括“科比”、“血压”和“投资理财”，这样通过进行并集运算得到的多个用户关键词包括“科比”、“张柏芝”、“血压”和“投资理财”。

S1023、基于预设计算规则，分别根据所述第一浏览数据中的文档和浏览行为参数计算每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度，以及根据所述第二浏览数据中的文档和浏览行为参数计算每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度。

在分别获得第一浏览数据和第二浏览数据中的多个主题关键词后，需要分别计算每个用户对第一浏览数据中的每个主题关键词的兴趣程度和对第二浏览数据中的每个主题关键词的兴趣程度。

具体地，在一实施例中，如图3所示，图3是本申请实施例提供的一种信息推荐方法的具体示意流程图。该步骤S1023包括步骤S10231至S10238。

S10231、根据每个所述用户的浏览行为参数、每篇文档的字数以及当前浏览时间，计算每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度以及对所述第二浏览数据中的每篇文档的兴趣程度。

其中，当前浏览时间可以理解为用户终端中的应用程序当前需要从服务器中获取用户感兴趣的文档的时间。譬如，当前浏览时间可以为用户点击终端中某应用程序的图标时，应用程序向对应的服务器发送请求以获取用户感兴趣的文档的时间，也可以理解为用户在浏览应用程序的页面的过程当中，应用程序向对应的服务器发送请求以获取用户感兴趣的文档的时间，等等。

具体地，在一实施例中，如图4所示，图4是本申请实施例提供的一种信息推荐方法的具体示意流程图。在该实施例中，该浏览行为参数包括每个用户对第一浏览数据或第二浏览数据中的每篇文档的点击参数I_ij、每个用户在浏览每篇文档时的起始时间T_0ij和终止时间T_ij。该步骤S10231包括步骤S10231a至S10231i。

S10231a、获取每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，以及获取每个所述用户在所述第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间。

在该实施例中，用户对每篇文档的点击参数I_ij用于表示用户是否对文档进行了点击阅读，若用户点击了谋篇文档，则该篇文档的点击参数I_ij的取值为1，若用户未点击谋篇文档，则该篇文档的点击参数I_ij的取值为0。

由于第一浏览数据中的多篇文档是由多个用户在第一预设时间段内所浏览的全部文档的集合，因此，对于某个用户来说，其可能只阅读了第一浏览数据中的部分文档，而其他文档是其他用户所阅读的文档，因此，在计算每个用户的浏览速度时，需要获取每个用户在第一预设时间段内所浏览的所有文档，即从第一浏览数据中筛选出每个用户所浏览过的所有文档。

具体地，可以通过判断点击参数I_ij是否为1来筛选出每个用户所浏览过的所有文档。当然，也可以通过每篇文档的起始时间和终止时间是否为非空值来筛选出每个用户所浏览过的所有文档。在筛选出每个用户在第一预设时间段内所浏览的所有文档之后，还需要获取这些文档对应的起始时间和终止时间。同理，可以获得每个用户在第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间。

S10231b、根据每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数以及所耗的总时间。

在该实施例中，在统计每个用户在第一预设时间段内所浏览的所有文档所耗的总时间时，先计算用户所浏览的每篇文档的时间。具体地，可以用每篇文档的终止时间与起始时间作差值计算以得到用户浏览每篇文档所耗的时间。然后，再将用户所浏览的所有文档的所耗的时间求和以得到用户浏览所有文档所耗的总时间。同理，在统计每个用户所浏览的所有文档的总字数时，可以先统计用户所浏览的每篇文档的字数，然后对用户所浏览的所有文档的字数求和以得到用户浏览所有文档的总字数。

在一实施例中，在一些情况下，用户浏览文档的所耗的时间有时会出现异常，比如，用户点击进入文档页面后，就立刻退出来了，这样浏览文档所耗的时间是异常时间，又比如，用户点击进入文档页面后，去做其他事情，长时间停留在该文档页面上，这样浏览该文档所耗的时间也是异常时间。为了可以准确地计算出用户的第一浏览速度和第二浏览速度，在步骤S10231b之前，需对用户浏览每篇文档的所耗时间进行筛选。

具体地，在步骤S10231b之前还包括：根据所述用户浏览每篇文章的起始时间和终止时间，计算每个所述用户对所述第一预设时间段内浏览的每篇文档的时长，以及计算每个所述用户对所述第二预设时间段内浏览的每篇文档的时长；通过正态分布分别提取出所述第一预设时间段和第二预设时间段内每个所述用户的有效时长以及有效时长对应的文档。也就是说，先计算每个用户对第一预设时间段内所浏览的每篇文档的时长，以及计算每个用户对第二预设时间段内所浏览的每篇文档的时长，然后通过正态分布分别提取第一预设时间段内和第二预设时间段内的处于[-3σ,+3σ]之间的时长分别作为第一预设时间段内和第二预设时间段内的有效时长，这样可以将异常时间去掉。最后获取第一预设时间段和第二预设时间段内每个用户的有效时长以及有效时长对应的文档。

这样，步骤S10231b具体为：根据每个所述用户在所述第一预设时间段内浏览的所有的有效时长对应的文档以及对应的有效时长，统计每个所述用户在所述第一预设时间段内所有的有效时长对应的文档的总字数以及所有有效时长对应的总时间。这样后续就可以根据有效时长对应的文档的总字数和有效时长对应的总时间计算第一浏览速度。

S10231c、根据每个所述用户在所述第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第二预设时间段内所浏览的所有文档的总字数以及所耗的总时间。

根据步骤S10231b的统计方法同理可以统计得到每个用户在第二预设时间段内所浏览的所有文档的总字数以及所耗的总时间。

在一实施例中，当在步骤S10231b之前对用户浏览第二预设时间段内的每篇文档的所耗时间进行筛选后，步骤S10231b具体为：根据每个所述用户在所述第二预设时间段内浏览的所有的有效时长对应的文档以及对应的有效时长，统计每个所述用户在所述第二预设时间段内所有的有效时长对应的文档的总字数以及所有有效时长对应的总时间。

S10231d、根据每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数和总时间，计算每个所述用户的第一浏览速度。

具体地，采用每个用户在第一预设时间段内所浏览的所有文档的总字数除以所耗的总时间得到每个用户的第一浏览速度。

S10231e、根据每个所述用户在所述第二预设时间段内所浏览的所有文档的总字数和所耗总时间，计算每个所述用户的第二浏览速度。

具体地，采用每个用户在第二预设时间段内所浏览的所有文档的总字数除以所耗的总时间得到每个用户的第二浏览速度。

S10231f、根据每个所述用户的第一浏览速度、在所述第一预设时间段内浏览每篇文档的起始时间和终止时间以及每篇文档的字数，计算每个所述用户对所述第一预设时间段内所浏览的每篇文档的关注程度。

具体地，可以采用如下公式(1)计算每个用户对第一预设时间段内所浏览的每篇文档的关注程度。计算公式(1)如下：

其中，C_ij表示第i个用户对第一预设时间段内所浏览的第j篇文档的关注程度，Speed_i表示第i个用户的第一浏览速度，T_0ij和T_ij分别表示第i个用户在浏览第j篇文档时的起始时间和终止时间，Size_j表示第j篇文档的字数。

S10231g、根据每个所述用户的第二浏览速度、在所述第二预设时间段内浏览每篇文档的起始时间和终止时间、以及每篇文档的字数，计算每个所述用户对所述第二预设时间段内浏览的每篇文档的关注程度。

根据上述计算公式(1)，将Speed_i替换成第i个用户的第二浏览速度，就可以计算出每个用户对第二预设时间段内浏览的每篇文档的关注程度。

S10231h、根据每个所述用户对所述第一预设时间段内浏览的每篇文档的关注程度、每个所述用户对所述第一浏览数据中每篇文档的点击参数、浏览每篇文档的起始时间和当前浏览时间，计算每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度。

具体地，可以采用如下计算公式(2)计算每个用户对第一浏览数据中每篇文档的兴趣程度R。计算公式(2)如下：

其中，R_ij表示第i个用户对第j篇文档的兴趣程度，C_ij表示第i个用户对第j篇文档的关注程度，I_ij表示第i个用户对第j篇文档的点击参数，λ为时间衰减常数，表示时间衰减因子，T表示当前浏览时间，T_0ij表示第i个用户浏览第j篇文档的起始时间。

S10231i、根据每个所述用户对所述第二预设时间段内浏览的每篇文档的关注程度、每个所述用户对所述第二浏览数据中每篇文档的点击参数、浏览每篇文档的起始时间和当前浏览时间，计算每个所述用户对所述第二浏览数据中的每篇文档的兴趣程度。

基于上述的计算公式(2)，同理可以计算出每个用户对第二浏览数据中的每篇文档的兴趣程度。

S10232、基于所述预设关键词信息技术分别获取所述第一浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值，以及获取所述第二浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值。

该预设关键词信息技术可以例如为TF-IDF(英文全称：Term Frequency-InverseDocumentFrequency，中文名称：词频-逆向文件频率)。基于TF-IDF获取第一浏览数据中每篇文档的浏览关键词和每个浏览关键词对应的权重值。同理，可以基于TF-IDF获取第二浏览数据中每篇文档的浏览关键词和每个浏览关键词对应的权重值。

譬如，基于TF-IDF获取第一浏览数据中每篇文档的权重值较大的前10个浏览关键词和每个浏览关键词对应的权重值，以及获取第二浏览数据中每篇文档的权重值较大的前10个浏览关键词和每个浏览关键词对应的权重值。

S10233、根据所述第一浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值、以及所述第一浏览数据中的多个所述第一主题以及每个所述第一主题对应的第一关键词列表，计算所述第一浏览数据中的每篇文档在每个所述第一主题上的概率。

譬如，第一浏览数据中的A文档对应有两个浏览关键词和对应的权重值，这两个浏览关键词以及对应的权重值分别表示为(中国，0.4)和(国旗，0.6)。假设第一主题的个数为两个，其中一个第一主题包括主题关键词以及对应的权重值表示为(中国，0.6)，另外一个第一主题包括主题关键词以及对应的权重值分别表示为(中国，0.7)和(国旗，0.3)。那么计算该A文档在两个第一主题上的概率具体为：计算“中国”这个浏览关键词在两个第一主题上的概率分别为0.4*0.6＝0.24和0.4*0.7＝0.28。再计算“国旗”这个浏览关键词在两个第一主题上的概率分别为0.6*0＝0和0.6*0.3＝0.18。然后计算A文档在第一个第一主题上的概率为0.24+0＝0.24，在第二个第一主题上的概率为0.28+0.18＝0.46。根据上述计算方法可以计算出每篇文档在不同第一主题上的概率。

S10234、根据所述第二浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值、以及所述第二浏览数据中的多个所述第二主题以及每个所述第二主题对应的第二关键词列表，计算所述第二浏览数据中的每篇文档在每个所述第二主题上的概率。

根据步骤S10233中的计算方法同理可以计算第二浏览数据中每篇文档在每个第二主题上的概率。

S10235、根据每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度以及所述第一浏览数据中的每篇文档在每个所述第一主题上的概率，获得每个所述用户对每个所述第一主题的兴趣程度。

在该实施例中，假设第一浏览数据中包括n篇文档，第一浏览数据中包括m个第一主题。第i个用户对第j篇文档的兴趣程度表示为R_ij，其中，j取值为1至n的整数。第j篇文档在第k个第一主题上的概率表示为P_jk，其中，k取值为1至m的整数。这样，第i个用户对第k个第一主题上的兴趣程度Q_ik表达式如公式(3)所示：

通过上述公式(3)可以依次计算出每个用户对每个第一主题的兴趣程度。

S10236、根据每个所述用户对所述第二浏览数据中的每篇文档的兴趣程度以及所述第二浏览数据中的每篇文档在每个所述第二主题上的概率，获得每个所述用户对每个所述第二主题的兴趣程度。

根据上述公式(3)，同理可以计算出每个用户对每个第二主题的兴趣程度。

S10237、根据每个所述用户对每个所述第一主题的兴趣程度以及每个所述第一主题的第一关键词列表中多个主题关键词以及每个主题关键词对应的权重值，计算出每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度。

由于每个第一主题都有对应的主题关键词以及主题关键词对应的权重值，首先可以计算出每个用户对不同主题关键词的兴趣程度。具体地，将每个用户对每个第一主题的兴趣程度乘以第一主题的主题关键词的权重值，以得到用户对每个第一主题中每个主题关键词的兴趣程度，然后对多个第一主题中相同的主题关键词的兴趣程度进行求和，得到每个用户对第一浏览数据中每个主题关键词的兴趣程度，采用表示第i个用户对第一浏览数据中第j个主题关键词的兴趣程度。

S10238、根据每个所述用户对每个所述第二主题的兴趣程度以及每个所述第二主题的第二关键词列表中多个主题关键词以及每个主题关键词对应的权重值，计算出每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度。

根据步骤S10237中的计算方式同理可以计算出每个用户对第二浏览数据中的每个主题关键词的兴趣程度，采用表示第i个用户对第二浏览数据中第j个主题关键词的兴趣程度。

S1024、获取预设的所述第一预设时间段对应的第一权重值以及所述第二预设时间段对应的第二权重值。

其中，该第一权重值和第二权重值是预先设置的分别用于表征第一预设时间段内的第一浏览数据和第二预设时间段内的第二浏览数据对最后推荐的信息的重要程度。该第一权重值和第二权重值可以根据实际需求进行设置，譬如，可以设置第一权重值和第二权重值均为0.5，或者设置第一权重值为0.6，第二权重值为0.4。

S1025、将所述第一权重值作为所述第一浏览数据中的每个主题关键词的兴趣程度的权重以及将所述第二权重值作为所述第二浏览数据中的每个主题关键词的兴趣程度的权重，并根据预设计算公式计算每个所述用户对每个所述用户关键词的兴趣程度。其中，该预设计算公式为如下公式(4)：

其中，F_ij表示第i个用户对第j个用户关键词的兴趣程度，x为第一权重值，y为第二权重值，表示在第一浏览数据中第i个用户对第j个用户关键词的兴趣程度，表示在第二浏览数据中第i个用户对第j个用户关键词的兴趣程度。

譬如，第一浏览数据中多个主题关键词包括“科比”和“张柏芝”，步骤S1023计算出A用户对“科比”的兴趣程度为0.2，对“张柏芝”的兴趣程度为0.8。第二浏览数据中多个主题关键词包括“科比”、“血压”和“投资理财”，步骤S1023计算出A用户对“科比”的兴趣程度为0.4，对“血压”的兴趣程度为0.5，对“投资理财”的兴趣程度为0.1。假设第一权重值x为0.4，第二权重值y为0.6。这样在多个用户关键词中，A用户对“科比”的兴趣程度为：F＝0.4*0.2+0.6*0.4＝0.32，同理，A用户对“张柏芝”的兴趣程度为：F＝0.4*0.8+0.6*0＝0.32，以此类推，可以根据上述预设计算公式依次得到“血压”和“投资理财”的兴趣程度。

在步骤S102根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度之后，再将多个用户关键词以及每个用户对每个用户关键词的兴趣程度输入至词向量模型中以生成每个用户对应的预设维数的兴趣向量。譬如，该兴趣向量可以为256维的向量。

S103、获取多个待推荐文档，并基于预设关键词信息技术获取每个所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值。

当需要向用户推荐文档时，获取多个待推荐文档，其中，多个待推荐文档可以是最新更新的文档。然后基于预设关键词信息技术，譬如，基于TF-IDF技术对获取到的每个待推荐文档进行关键词提取，从而获得每个待推荐文档对应的多个文档关键词，同时，获得每个文档关键词对应的权重值，即每个文档关键词对应的TF-IDF值。

S104、根据所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值生成每个所述待推荐文档对应的推荐向量。

在获得每个待推荐文档对应的文档关键词以及每个文档关键词对应的权重值后，将根据文档关键词和对应的权重值生成每个待推荐文档对应的推荐向量。

具体地，在一实施例中，可以将每个待推荐文档对应的多个文档关键词和每个文档关键词对应的权重值输入至词向量模型中以生成预设维数的推荐向量。譬如，该推荐向量可以为256维的向量。

S105、计算所述用户的兴趣向量与每个所述待推荐文档的推荐向量之间的距离值，并根据每个所述距离值将满足预设条件的待推荐文档作为推送信息推送给所述用户。

在通过步骤S102获得每个用户的兴趣向量和通过步骤S104获得每个待推荐文档对应的推荐向量后，将计算用户的兴趣向量与每个待推荐文档的推荐向量之间的距离值。

具体地，在一实施例中，可以通过预设余弦相似度计算公式计算用户的兴趣向量与每个待推荐文档的推荐向量之间的距离值。其中，该预设余弦相似度计算公式可例如为如下公式(5)：

在公式(5)所示的预设余弦相似度计算公式中，该表示用户的兴趣向量，该表示待推荐文档的推荐向量，cosθ表示用户的兴趣向量与待推荐文档的推荐向量之间的距离值。

在计算完用户的兴趣向量与每个待推荐文档的推荐向量之间的距离值之后，将会获得多个距离值，然后根据每个距离值将满足预设条件的待推荐文档作为推送信息推送给所述用户。

具体地，在一实施例中，可以将多个距离值中预设个数的最小的距离值对应的推荐向量的待推荐文档作为推荐信息推荐给所述用户。将多个距离值按从小到大的顺序进行排列，并将其中前预设个数的距离值对应的推荐向量的待推荐文档作为推荐信息推荐给用户。其中，该预设个数可以根据实际需求进行设置，譬如，该预设个数可以设置为5个，那么就从多个距离值中获取最小的5个距离值对应的推荐向量的待推荐文档作为推荐信息，并将5个推荐信息推荐给相应的用户，从而完成信息推荐。

本实施例中的信息推荐方法，可以结合用户在第一预设时间段和第二预设时间段内的浏览数据向用户进行推荐，提高信息推荐的准确性和合理性。

本申请实施例还提供一种信息推荐装置，该信息推荐装置用于执行前述任一项信息推荐方法。具体地，请参阅图5，图5是本申请实施例提供的一种信息推荐装置的示意性框图。信息推荐装置300包括浏览数据获取单元301、兴趣向量生成单元302、关键词获取单元303、推荐向量生成单元304和推荐单元305。

浏览数据获取单元301，用于获取多个用户在第一预设时间段内的第一浏览数据以及在第二预设时间段内的第二浏览数据，其中，所述第一浏览数据和第二浏览数据为多个所述用户浏览网页时的用户行为数据。

兴趣向量生成单元302，用于根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度，并根据多个所述用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度生成每个所述用户对应的兴趣向量。

在一实施例中，该第一浏览数据包括多个所述用户在所述第一预设时间段内浏览的文档和多个所述用户对所述第一预设时间段内的每个文档的浏览行为参数；所述第二浏览数据包括多个所述用户在所述第二预设时间段内浏览的文档和多个所述用户对所述第二预设时间段内的每个文档的浏览行为参数。该兴趣向量生成单元302在根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度时，具体用于基于文档主题生成模型，获取所述第一浏览数据中的多个文档对应的多个第一主题以及每个所述第一主题对应的第一关键词列表，以及获取所述第二浏览数据中的多个文档对应的多个第二主题以及每个所述第二主题对应的第二关键词列表，其中，所述第一关键词列表和第二关键词列表均包括相应的主题对应的多个主题关键词以及每个所述主题关键词对应的权重值；将所述第一浏览数据中的多个主题关键词和所述第二浏览数据中的多个主题关键词进行并集运算以获得多个用户关键词；基于预设计算规则，分别根据所述第一浏览数据中的文档和浏览行为参数计算每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度，以及根据所述第二浏览数据中的文档和浏览行为参数计算每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度；获取预设的所述第一预设时间段对应的第一权重值以及所述第二预设时间段对应的第二权重值；以及将所述第一权重值作为所述第一浏览数据中的每个主题关键词的兴趣程度的权重以及将所述第二权重值作为所述第二浏览数据中的每个主题关键词的兴趣程度的权重，并根据预设计算公式计算每个所述用户对每个所述用户关键词的兴趣程度。

进一步地，在一实施例中，该兴趣向量生成单元302在基于预设计算规则，分别根据所述第一浏览数据中的文档和浏览行为参数计算每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度，以及根据所述第二浏览数据中的文档和浏览行为参数计算每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度时，具体用于根据每个所述用户的浏览行为参数、每篇文档的字数以及当前浏览时间，计算每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度以及对所述第二浏览数据中的每篇文档的兴趣程度；基于所述预设关键词信息技术分别获取所述第一浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值，以及获取所述第二浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值；根据所述第一浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值、以及所述第一浏览数据中的多个所述第一主题以及每个所述第一主题对应的第一关键词列表，计算所述第一浏览数据中的每篇文档在每个所述第一主题上的概率；根据所述第二浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值、以及所述第二浏览数据中的多个所述第二主题以及每个所述第二主题对应的第二关键词列表，计算所述第二浏览数据中的每篇文档在每个所述第二主题上的概率；根据每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度以及所述第一浏览数据中的每篇文档在每个所述第一主题上的概率，获得每个所述用户对每个所述第一主题的兴趣程度；根据每个所述用户对所述第二浏览数据中的每篇文档的兴趣程度以及所述第二浏览数据中的每篇文档在每个所述第二主题上的概率，获得每个所述用户对每个所述第二主题的兴趣程度；根据每个所述用户对每个所述第一主题的兴趣程度以及每个所述第一主题的第一关键词列表中多个主题关键词以及每个主题关键词对应的权重值，计算出每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度；以及根据每个所述用户对每个所述第二主题的兴趣程度以及每个所述第二主题的第二关键词列表中多个主题关键词以及每个主题关键词对应的权重值，计算出每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度。

进一步地，在一实施例中，该浏览行为参数包括每个所述用户对所述第一浏览数据或第二浏览数据中的每篇文档的点击参数、每个所述用户在浏览每篇文档时的起始时间和终止时间。兴趣向量生成单元302在根据每个所述用户的浏览行为参数、每篇文档的字数以及当前浏览时间，计算每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度以及对所述第二浏览数据中的每篇文档的兴趣程度时，具体用于获取每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，以及获取每个所述用户在所述第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间；根据每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数以及所耗的总时间；根据每个所述用户在所述第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第二预设时间段内所浏览的所有文档的总字数以及所耗的总时间；根据每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数和总时间，计算每个所述用户的第一浏览速度；根据每个所述用户在所述第二预设时间段内所浏览的所有文档的总字数和所耗总时间，计算每个所述用户的第二浏览速度；根据每个所述用户的第一浏览速度、在所述第一预设时间段内浏览每篇文档的起始时间和终止时间、以及每篇文档的字数，计算每个所述用户对所述第一预设时间段内所浏览的每篇文档的关注程度；根据每个所述用户的第二浏览速度、在所述第二预设时间段内浏览每篇文档的起始时间和终止时间、以及每篇文档的字数，计算每个所述用户对所述第二预设时间段内浏览的每篇文档的关注程度；根据每个所述用户对所述第一预设时间段内浏览的每篇文档的关注程度、每个所述用户对所述第一浏览数据中每篇文档的点击参数、浏览每篇文档的起始时间和当前浏览时间，计算每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度；以及根据每个所述用户对所述第二预设时间段内浏览的每篇文档的关注程度、每个所述用户对所述第二浏览数据中每篇文档的点击参数、浏览每篇文档的起始时间和当前浏览时间，计算每个所述用户对所述第二浏览数据中的每篇文档的兴趣程度。

进一步地，在一实施例中，兴趣向量生成单元302在根据每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数以及所耗的总时间之前，还用于根据所述用户浏览每篇文章的起始时间和终止时间，计算每个所述用户对所述第一预设时间段内浏览的每篇文档的时长，以及计算每个所述用户对所述第二预设时间段内浏览的每篇文档的时长；通过正态分布分别提取出所述第一预设时间段和第二预设时间段内每个所述用户的有效时长以及有效时长对应的文档。

这样，兴趣向量生成单元302在根据每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数以及所耗的总时间时，具体用于根据每个所述用户在所述第一预设时间段内浏览的所有的有效时长对应的文档以及对应的有效时长，统计每个所述用户在所述第一预设时间段内所有的有效时长对应的文档的总字数以及所有有效时长对应的总时间；

同理，兴趣向量生成单元302在执行根据每个所述用户在所述第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第二预设时间段内所浏览的所有文档的总字数以及所耗的总时间时，具体用于根据每个所述用户在所述第二预设时间段内浏览的所有的有效时长对应的文档以及对应的有效时长，统计每个所述用户在所述第二预设时间段内所有的有效时长对应的文档的总字数以及所有有效时长对应的总时间。

关键词获取单元303，用于获取多个待推荐文档，并基于预设关键词信息技术获取每个所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值。

推荐向量生成单元304，用于根据所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值生成每个所述待推荐文档对应的推荐向量。

推荐单元305，用于计算所述用户的兴趣向量与每个所述待推荐文档的推荐向量之间的距离值，并根据每个距离值将满足预设条件的待推荐文档作为推送信息推送给所述用户。

在一实施例中，该推荐单元305具体用于将多个距离值中预设个数的最小的距离值对应的推荐向量的待推荐文档作为推荐信息推荐给所述用户。

需要说明的是，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的信息推荐装置300和各单元的具体工作过程，可以参考前述信息推荐方法实施例中的对应过程，在此不再赘述。

本实施例中的信息推荐装置300，可以结合用户在第一预设时间段和第二预设时间段内的浏览数据向用户进行推荐，提高信息推荐的准确性和合理性。

上述信息推荐装置可以实现为一种计算机程序的形式，该计算机程序可以在如图6所示的计算机设备上运行。请参阅图6，图6是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500包括通过***总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。该非易失性存储介质503可存储操作***5031和计算机程序5032。该计算机程序5032包括程序指令，该程序指令被执行时，可使得处理器502执行一种信息推荐方法。该处理器502用于提供计算和控制能力，支撑整个计算机设备500的运行。该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行一种信息推荐方法。该网络接口505用于进行网络通信，如发送分配的任务等。本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现如下功能：获取多个用户在第一预设时间段内的第一浏览数据以及在第二预设时间段内的第二浏览数据，其中，所述第一浏览数据和第二浏览数据为多个所述用户浏览网页时的用户行为数据；根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度，并根据多个所述用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度生成每个所述用户对应的兴趣向量；获取多个待推荐文档，并基于预设关键词信息技术获取每个所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值；根据所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值生成每个所述待推荐文档对应的推荐向量；以及计算所述用户的兴趣向量与每个所述待推荐文档的推荐向量之间的距离值，并根据每个距离值将满足预设条件的待推荐文档作为推送信息推送给所述用户。

在一实施例中，所述第一浏览数据包括多个所述用户在所述第一预设时间段内浏览的文档和多个所述用户对所述第一预设时间段内的每个文档的浏览行为参数；所述第二浏览数据包括多个所述用户在所述第二预设时间段内浏览的文档和多个所述用户对所述第二预设时间段内的每个文档的浏览行为参数；处理器502在执行根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度时，具体实现如下功能：基于文档主题生成模型，获取所述第一浏览数据中的多个文档对应的多个第一主题以及每个所述第一主题对应的第一关键词列表，以及获取所述第二浏览数据中的多个文档对应的多个第二主题以及每个所述第二主题对应的第二关键词列表，其中，所述第一关键词列表和第二关键词列表均包括相应的主题对应的多个主题关键词以及每个所述主题关键词对应的权重值；将所述第一浏览数据中的多个主题关键词和所述第二浏览数据中的多个主题关键词进行并集运算以获得多个用户关键词；基于预设计算规则，分别根据所述第一浏览数据中的文档和浏览行为参数计算每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度，以及根据所述第二浏览数据中的文档和浏览行为参数计算每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度；获取预设的所述第一预设时间段对应的第一权重值以及所述第二预设时间段对应的第二权重值；以及将所述第一权重值作为所述第一浏览数据中的每个主题关键词的兴趣程度的权重以及将所述第二权重值作为所述第二浏览数据中的每个主题关键词的兴趣程度的权重，并根据预设计算公式计算每个所述用户对每个所述用户关键词的兴趣程度。

在一实施例中，处理器502在执行基于预设计算规则，分别根据所述第一浏览数据中的文档和浏览行为参数计算每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度，以及根据所述第二浏览数据中的文档和浏览行为参数计算每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度时，具体实现如下功能：根据每个所述用户的浏览行为参数、每篇文档的字数以及当前浏览时间，计算每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度以及对所述第二浏览数据中的每篇文档的兴趣程度；基于所述预设关键词信息技术分别获取所述第一浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值，以及获取所述第二浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值；根据所述第一浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值、以及所述第一浏览数据中的多个所述第一主题以及每个所述第一主题对应的第一关键词列表，计算所述第一浏览数据中的每篇文档在每个所述第一主题上的概率；根据所述第二浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值、以及所述第二浏览数据中的多个所述第二主题以及每个所述第二主题对应的第二关键词列表，计算所述第二浏览数据中的每篇文档在每个所述第二主题上的概率；根据每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度以及所述第一浏览数据中的每篇文档在每个所述第一主题上的概率，获得每个所述用户对每个所述第一主题的兴趣程度；根据每个所述用户对所述第二浏览数据中的每篇文档的兴趣程度以及所述第二浏览数据中的每篇文档在每个所述第二主题上的概率，获得每个所述用户对每个所述第二主题的兴趣程度；根据每个所述用户对每个所述第一主题的兴趣程度以及每个所述第一主题的第一关键词列表中多个主题关键词以及每个主题关键词对应的权重值，计算出每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度；以及根据每个所述用户对每个所述第二主题的兴趣程度以及每个所述第二主题的第二关键词列表中多个主题关键词以及每个主题关键词对应的权重值，计算出每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度。

在一实施例中，所述浏览行为参数包括每个所述用户对所述第一浏览数据或第二浏览数据中的每篇文档的点击参数、每个所述用户在浏览每篇文档时的起始时间和终止时间；处理器502在执行根据每个所述用户的浏览行为参数、每篇文档的字数以及当前浏览时间，计算每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度以及对所述第二浏览数据中的每篇文档的兴趣程度时，具体实现如下功能：获取每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，以及获取每个所述用户在所述第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间；根据每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数以及所耗的总时间；根据每个所述用户在所述第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第二预设时间段内所浏览的所有文档的总字数以及所耗的总时间；根据每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数和总时间，计算每个所述用户的第一浏览速度；根据每个所述用户在所述第二预设时间段内所浏览的所有文档的总字数和所耗总时间，计算每个所述用户的第二浏览速度；根据每个所述用户的第一浏览速度、在所述第一预设时间段内浏览每篇文档的起始时间和终止时间、以及每篇文档的字数，计算每个所述用户对所述第一预设时间段内所浏览的每篇文档的关注程度；根据每个所述用户的第二浏览速度、在所述第二预设时间段内浏览每篇文档的起始时间和终止时间、以及每篇文档的字数，计算每个所述用户对所述第二预设时间段内浏览的每篇文档的关注程度；根据每个所述用户对所述第一预设时间段内浏览的每篇文档的关注程度、每个所述用户对所述第一浏览数据中每篇文档的点击参数、浏览每篇文档的起始时间和当前浏览时间，计算每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度；以及根据每个所述用户对所述第二预设时间段内浏览的每篇文档的关注程度、每个所述用户对所述第二浏览数据中每篇文档的点击参数、浏览每篇文档的起始时间和当前浏览时间，计算每个所述用户对所述第二浏览数据中的每篇文档的兴趣程度。

在一实施例中，处理器502在执行所述根据每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数以及所耗的总时间之前，还实现如下功能：根据所述用户浏览每篇文章的起始时间和终止时间，计算每个所述用户对所述第一预设时间段内浏览的每篇文档的时长，以及计算每个所述用户对所述第二预设时间段内浏览的每篇文档的时长；通过正态分布分别提取出所述第一预设时间段和第二预设时间段内每个所述用户的有效时长以及有效时长对应的文档。相应的，处理器502在执行根据每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数以及所耗的总时间时，具体实现如下功能：根据每个所述用户在所述第一预设时间段内浏览的所有的有效时长对应的文档以及对应的有效时长，统计每个所述用户在所述第一预设时间段内所有的有效时长对应的文档的总字数以及所有有效时长对应的总时间；处理器502在执行根据每个所述用户在所述第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第二预设时间段内所浏览的所有文档的总字数以及所耗的总时间时，具体实现如下功能：根据每个所述用户在所述第二预设时间段内浏览的所有的有效时长对应的文档以及对应的有效时长，统计每个所述用户在所述第二预设时间段内所有的有效时长对应的文档的总字数以及所有有效时长对应的总时间。

在一实施例中，处理器502在执行根据每个距离值将满足预设条件的待推荐文档作为推送信息推送给所述用户时，具体实现如下功能：将多个距离值中预设个数的最小的距离值对应的推荐向量的待推荐文档作为推荐信息推荐给所述用户。

应当理解，在本申请实施例中，处理器502可以是中央处理单元(CentralProcessing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器、专用集成电路、现成可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述信息推荐方法实施例中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。该计算机程序可存储于一计算机可读存储介质中。该计算机程序被该计算机***中的至少一个处理器执行，以实现包括如上述各信息推荐方法的实施例的流程步骤。

该存储介质可以是U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本申请实施例装置中的单元可以根据实际需要进行合并、划分和删减。该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，终端，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种信息推荐方法，其特征在于，包括：

获取多个用户在第一预设时间段内的第一浏览数据以及在第二预设时间段内的第二浏览数据，其中，所述第一浏览数据和第二浏览数据为多个所述用户浏览网页时的用户行为数据；

根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度，并根据多个所述用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度生成每个所述用户对应的兴趣向量；

获取多个待推荐文档，并基于预设关键词信息技术获取每个所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值；

根据所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值生成每个所述待推荐文档对应的推荐向量；以及

计算所述用户的兴趣向量与每个所述待推荐文档的推荐向量之间的距离值，并根据每个所述距离值将满足预设条件的待推荐文档作为推送信息推送给所述用户。

2.根据权利要求1所述的信息推荐方法，其特征在于，所述第一浏览数据包括多个所述用户在所述第一预设时间段内浏览的文档和多个所述用户对所述第一预设时间段内的每个文档的浏览行为参数；所述第二浏览数据包括多个所述用户在所述第二预设时间段内浏览的文档和多个所述用户对所述第二预设时间段内的每个文档的浏览行为参数；

所述根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度，包括：

基于文档主题生成模型，获取所述第一浏览数据中的多个文档对应的多个第一主题以及每个所述第一主题对应的第一关键词列表，以及获取所述第二浏览数据中的多个文档对应的多个第二主题以及每个所述第二主题对应的第二关键词列表，其中，所述第一关键词列表和第二关键词列表均包括相应的主题对应的多个主题关键词以及每个所述主题关键词对应的权重值；

将所述第一浏览数据中的多个主题关键词和所述第二浏览数据中的多个主题关键词进行并集运算以获得多个用户关键词；

基于预设计算规则，分别根据所述第一浏览数据中的文档和浏览行为参数计算每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度，以及根据所述第二浏览数据中的文档和浏览行为参数计算每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度；

获取预设的所述第一预设时间段对应的第一权重值以及所述第二预设时间段对应的第二权重值；以及

将所述第一权重值作为所述第一浏览数据中的每个主题关键词的兴趣程度的权重以及将所述第二权重值作为所述第二浏览数据中的每个主题关键词的兴趣程度的权重，并根据预设计算公式计算每个所述用户对每个所述用户关键词的兴趣程度。

3.根据权利要求2所述的信息推荐方法，其特征在于，所述基于预设计算规则，分别根据所述第一浏览数据中的文档和浏览行为参数计算每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度，以及根据所述第二浏览数据中的文档和浏览行为参数计算每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度，包括：

根据每个所述用户的浏览行为参数、每篇文档的字数以及当前浏览时间，计算每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度以及对所述第二浏览数据中的每篇文档的兴趣程度；

基于所述预设关键词信息技术分别获取所述第一浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值，以及获取所述第二浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值；

根据所述第一浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值、以及所述第一浏览数据中的多个所述第一主题以及每个所述第一主题对应的第一关键词列表，计算所述第一浏览数据中的每篇文档在每个所述第一主题上的概率；

根据所述第二浏览数据中的每篇文档的浏览关键词和每个所述浏览关键词对应的权重值、以及所述第二浏览数据中的多个所述第二主题以及每个所述第二主题对应的第二关键词列表，计算所述第二浏览数据中的每篇文档在每个所述第二主题上的概率；

根据每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度以及所述第一浏览数据中的每篇文档在每个所述第一主题上的概率，获得每个所述用户对每个所述第一主题的兴趣程度；

根据每个所述用户对所述第二浏览数据中的每篇文档的兴趣程度以及所述第二浏览数据中的每篇文档在每个所述第二主题上的概率，获得每个所述用户对每个所述第二主题的兴趣程度；

根据每个所述用户对每个所述第一主题的兴趣程度以及每个所述第一主题的第一关键词列表中多个主题关键词以及每个主题关键词对应的权重值，计算出每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度；以及

根据每个所述用户对每个所述第二主题的兴趣程度以及每个所述第二主题的第二关键词列表中多个主题关键词以及每个主题关键词对应的权重值，计算出每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度。

4.根据权利要求3所述的信息推荐方法，其特征在于，所述浏览行为参数包括每个所述用户对所述第一浏览数据或第二浏览数据中的每篇文档的点击参数、每个所述用户在浏览每篇文档时的起始时间和终止时间；

所述根据每个所述用户的浏览行为参数、每篇文档的字数以及当前浏览时间，计算每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度以及对所述第二浏览数据中的每篇文档的兴趣程度，包括：

获取每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，以及获取每个所述用户在所述第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间；

根据每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数以及所耗的总时间；

根据每个所述用户在所述第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第二预设时间段内所浏览的所有文档的总字数以及所耗的总时间；

根据每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数和总时间，计算每个所述用户的第一浏览速度；

根据每个所述用户在所述第二预设时间段内所浏览的所有文档的总字数和所耗总时间，计算每个所述用户的第二浏览速度；

根据每个所述用户的第一浏览速度、在所述第一预设时间段内浏览每篇文档的起始时间和终止时间以及每篇文档的字数，计算每个所述用户对所述第一预设时间段内所浏览的每篇文档的关注程度；

根据每个所述用户的第二浏览速度、在所述第二预设时间段内浏览每篇文档的起始时间和终止时间以及每篇文档的字数，计算每个所述用户对所述第二预设时间段内浏览的每篇文档的关注程度；

根据每个所述用户对所述第一预设时间段内浏览的每篇文档的关注程度、每个所述用户对所述第一浏览数据中每篇文档的点击参数、浏览每篇文档的起始时间和当前浏览时间，计算每个所述用户对所述第一浏览数据中的每篇文档的兴趣程度；以及

根据每个所述用户对所述第二预设时间段内浏览的每篇文档的关注程度、每个所述用户对所述第二浏览数据中每篇文档的点击参数、浏览每篇文档的起始时间和当前浏览时间，计算每个所述用户对所述第二浏览数据中的每篇文档的兴趣程度。

5.根据权利要求4所述的信息推荐方法，其特征在于，在所述根据每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数以及所耗的总时间之前，还包括：根据所述用户浏览每篇文章的起始时间和终止时间，计算每个所述用户对所述第一预设时间段内浏览的每篇文档的时长，以及计算每个所述用户对所述第二预设时间段内浏览的每篇文档的时长；通过正态分布分别提取出所述第一预设时间段和第二预设时间段内每个所述用户的有效时长以及有效时长对应的文档；

所述根据每个所述用户在所述第一预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第一预设时间段内所浏览的所有文档的总字数以及所耗的总时间，包括：根据每个所述用户在所述第一预设时间段内浏览的所有的有效时长对应的文档以及对应的有效时长，统计每个所述用户在所述第一预设时间段内所有的有效时长对应的文档的总字数以及所有有效时长对应的总时间；

所述根据每个所述用户在所述第二预设时间段内浏览的所有文档以及浏览每篇文档的起始时间和终止时间，统计每个所述用户在所述第二预设时间段内所浏览的所有文档的总字数以及所耗的总时间，包括：根据每个所述用户在所述第二预设时间段内浏览的所有的有效时长对应的文档以及对应的有效时长，统计每个所述用户在所述第二预设时间段内所有的有效时长对应的文档的总字数以及所有有效时长对应的总时间。

6.根据权利要求1所述的信息推荐方法，其特征在于，所述根据每个所述距离值将满足预设条件的待推荐文档作为推送信息推送给所述用户，包括：将多个距离值中预设个数的最小的距离值对应的推荐向量的待推荐文档作为推荐信息推荐给所述用户。

7.一种信息推荐装置，其特征在于，包括：

浏览数据获取单元，用于获取多个用户在第一预设时间段内的第一浏览数据以及在第二预设时间段内的第二浏览数据，其中，所述第一浏览数据和第二浏览数据为多个所述用户浏览网页时的用户行为数据；

兴趣向量生成单元，用于根据所述第一浏览数据和第二浏览数据确定多个用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度，并根据多个所述用户关键词以及每个所述用户对每个所述用户关键词的兴趣程度生成每个所述用户对应的兴趣向量；

关键词获取单元，用于获取多个待推荐文档，并基于预设关键词信息技术获取每个所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值；

推荐向量生成单元，用于根据所述待推荐文档对应的文档关键词以及每个所述文档关键词对应的权重值生成每个所述待推荐文档对应的推荐向量；以及

推荐单元，用于计算所述用户的兴趣向量与每个所述待推荐文档的推荐向量之间的距离值，并根据每个所述距离值将满足预设条件的待推荐文档作为推送信息推送给所述用户。

8.根据权利要求7所述的信息推荐装置，其特征在于，所述第一浏览数据包括多个所述用户在所述第一预设时间段内浏览的文档和多个所述用户对所述第一预设时间段内的每个文档的浏览行为参数；所述第二浏览数据包括多个所述用户在所述第二预设时间段内浏览的文档和多个所述用户对所述第二预设时间段内的每个文档的浏览行为参数；

所述兴趣向量生成单元，具体用于基于文档主题生成模型，获取所述第一浏览数据中的多个文档对应的多个第一主题以及每个所述第一主题对应的第一关键词列表，以及获取所述第二浏览数据中的多个文档对应的多个第二主题以及每个所述第二主题对应的第二关键词列表，其中，所述第一关键词列表和第二关键词列表均包括相应的主题对应的多个主题关键词以及每个所述主题关键词对应的权重值；将所述第一浏览数据中的多个主题关键词和所述第二浏览数据中的多个主题关键词进行并集运算以获得多个用户关键词；基于预设计算规则，分别根据所述第一浏览数据中的文档和浏览行为参数计算每个所述用户对所述第一浏览数据中的每个主题关键词的兴趣程度，以及根据所述第二浏览数据中的文档和浏览行为参数计算每个所述用户对所述第二浏览数据中的每个主题关键词的兴趣程度；获取预设的所述第一预设时间段对应的第一权重值以及所述第二预设时间段对应的第二权重值；以及将所述第一权重值作为所述第一浏览数据中的每个主题关键词的兴趣程度的权重以及将所述第二权重值作为所述第二浏览数据中的每个主题关键词的兴趣程度的权重，并根据预设计算公式计算每个所述用户对每个所述用户关键词的兴趣程度。

9.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6中任一项的信息推荐方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至6中任一项所述的信息推荐方法。