CN111797321A

CN111797321A - 一种面向不同场景的个性化知识推荐方法及***

Info

Publication number: CN111797321A
Application number: CN202010646490.8A
Authority: CN
Inventors: 史玉良; 李琳; 程林; 张坤; 孔凡玉
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2020-07-07
Filing date: 2020-07-07
Publication date: 2020-10-20
Anticipated expiration: 2040-07-07
Also published as: CN111797321B

Abstract

本公开提供了一种面向不同场景的个性化知识推荐方法及***，获取用户数据信息，判断其所处使用场景；若为短期会话型场景，建立会话学习模型，提取会话内用户交互项作为输入，通过注意力机制对每个交互行为进行建模，并输出会话内容的偏好；建立边缘信息学习模块，利用图结构信息，通过挖掘项目的边缘信息，预测当前用户需求；若为长期连续型场景，采用分类‑分层的注意力机制进行编码，在知识项和类别两个层次上进行偏好学习，预测用户需求；根据预测的用户需求，推荐相关信息，推荐信息更为准确。

Description

一种面向不同场景的个性化知识推荐方法及***

技术领域

本公开属于数据信息处理方法，涉及一种面向不同场景的个性化知识推荐方法及***。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息，不必然构成在先技术。

随着互联网技术的革新和快速发展，互联网信息资源急剧增加，对网络用户来说，如何在海量信息资源中准确获取到所需的内容是一件非常困难的事情；对于互联网平台来说，如何准确地为用户提供合适的信息服务，提高用户访问的效率以及优化用户的体验，也是一件极具挑战性的事情。而推荐***的出现在缓解信息超载方面发挥了关键作用，目前已经被电子商务、在线学***台广泛使用。随着互联网信息资源越来越多，推荐***的实际价值也越来越高。推荐***的关键是根据用户历史的访问信息(如评分和点击)，对用户的偏好进行建模，预测用户的需求或兴趣偏好，从而帮助用户从海量数据中更加快速地获得自己感兴趣的内容或服务。

对于软件知识学***台的数据量大，知识体系和类别多样，如视频类教程和文档型内容。同时，知识数据结构不一，组织形式各异。面对以上问题，为了提供个性化的服务，提升用户体验，加强用户和平台之间的交互性，需要结合平台和用户两个方面，更好地进行个性化的知识推荐。具体来说，一方面，需要考虑平台上异构数据的组织和处理，如使用知识图谱组织异构知识项；另一方面，需要考虑不同用户间的知识水平差异，通过建模用户当前的知识水平信息，可以更好的学习用户当前的需求和偏好。

据发明人了解，在当前的推荐方法研究中，基于RNN的序列建模方法没有考虑到交互项目与其他项目之间的潜在关系，难以捕获更深入的用户需求。在本公开中，通过结合软件知识学***台的目的性很强，呈主题式访问。长期连续型场景是指用户的访问是一般性、连续性的访问，用户会继续之前的学***的个性化推荐，当前的序列推荐模型难以捕获到跨类别间的。

发明内容

本公开为了解决上述问题，提出了一种面向不同场景的个性化知识推荐方法及***，本公开针对短期会话型和长期连续型两个场景进行有针对性的处理，可以更深入的学***表示和当前的知识需求，从而进行更准确的知识推荐。

根据一些实施例，本公开采用如下技术方案：

一种面向不同场景的个性化知识推荐方法，包括以下步骤：

获取用户数据信息，判断其所处使用场景；

若为短期会话型场景，建立会话学习模型，提取会话内用户交互项作为输入，通过注意力机制对每个交互行为进行建模，并输出会话内容的偏好；建立边缘信息学习模块，利用图结构信息，通过挖掘项目的边缘信息，预测当前用户需求；

若为长期连续型场景，采用分类-分层的注意力机制进行编码，在知识项和类别两个层次上进行偏好学习，预测用户需求；

根据预测的用户需求，推荐相关信息。

作为可选择的实施方式，获取用户数据信息，若所述用户具有超过设定值的历史数据，则认为该用户处于长期连续型场景，否则认为其处于短期会话型场景。

作为可选择的实施方式，短期会话型场景时，基于用户在会话中一系列随时间变化的连续交互行为，将交互项映射到知识图谱的对应实体中，通过聚合该实体的属性及边缘相关实体，得到相应的边缘信息向量表示，从而实现边缘信息学习。

作为可选择的实施方式，短期会话型场景时，基于用户会话行为向量和边缘信息向量，引入一个协同注意力机制，计算每个交互的重要性，量化会话项目和知识图谱中项目之间的相关性，并获得用户偏好的综合向量表示；

利用用户偏好的综合向量，构建softmax函数；计算softmax函数输出值的损失函数，采用反向传播算法训练门控循环单元的学习参数，完成模型的训练。

作为可选择的实施方式，长期连续型场景时，基于用户历史访问学习平台的信息序列，通过嵌入操作将信息序列映射成相应的向量表示，实现对用户序列信息编码。

作为可选择的实施方式，基于用户序列的信息编码，通过门控循环单元获取每个时间步的隐藏状态来得到历史序列中的信息传递情况，从而得到隐含状态向量集合。

作为可选择的实施方式，基于得到的隐含状态向量集合，按照原标签进行分类，得到相同类别的知识对应的隐含向量；将用户嵌入向量转换为类别查询向量，引入知识敏感注意力机制计算用户对各类别知识的注意力权重；

利用得到的用户对各类别知识的注意力权重和已知的候选项集进行内积操作，构建softmax函数；计算softmax函数输出值的损失函数，采用反向传播算法训练门控循环单元的学习参数，完成模型的训练。

一种面向不同场景的个性化知识推荐***，包括：

场景判断模块，被配置为获取用户数据信息，判断其所处使用场景；

短期会话型场景处理模块，被配置为建立会话学习模型，提取会话内用户交互项作为输入，通过注意力机制对每个交互行为进行建模，并输出会话内容的偏好；建立边缘信息学习模块，利用图结构信息，通过挖掘项目的边缘信息，预测当前用户需求；

长期连续型场景处理模块，被配置为采用分类-分层的注意力机制进行编码，在知识项和类别两个层次上进行偏好学习，预测用户需求；

信息推荐模块，被配置为根据预测的用户需求，推荐相关信息。

作为可选择的实施方式，所述短期会话型场景处理模块，包括：

会话信息学习模块，其用于利用上下文关联的GRU网络对会话中用户的顺序交互进行建模，并对传统GRU单元中的操作进行修改，将用户的交互行为添加到各个门函数中，获得用户会话行为向量表示；

边缘信息学习模块，其用于基于用户在会话中一系列随时间变化的连续交互行为，将交互项映射到知识图谱(KG)的对应实体中，通过聚合该实体的属性及边缘相关实体，得到相应的边缘信息向量表示；

综合向量获取模块，其用于基于用户会话行为向量和边缘信息向量，引入一个协同注意力机制，计算每个交互的重要性，量化会话项目和知识图谱中项目之间的相关性，并获得用户偏好的综合向量表示；

推荐模型训练模块，其用于利用用户偏好的综合向量，构建softmax函数；计算softmax函数输出值的损失函数，采用反向传播算法训练GRU的学习参数，完成模型的训练；

反馈更新模块，其用于模型训练完成后，输出实验样本集的推荐结果，与实际的用户行为进行对比，反馈更新底层数据信息，不断优化数据的权重值，完善用户行为推荐结果。

作为可选择的实施方式，所述长期连续型场景处理模块，包括：

用户序列信息编码模块，其用于利用用户历史访问学习平台的信息序列，通过嵌入操作，将用户序列信息映射成相应的向量表示；

隐含状态向量学习模块，其用于基于用户序列信息的编码向量，通过GRU方法来得到历史序列中的信息传递情况；

用户知识水平学***的注意力权重；

推荐模型训练模块，其用于利用用户对各类别知识的注意力权重和已知的候选项集进行内积操作，构建softmax函数；计算softmax函数输出值的损失函数，采用反向传播算法训练GRU的学习参数，完成模型的训练；

一种计算机可读存储介质，其中存储有多条指令，所述指令适于由终端设备的处理器加载并执行所述的一种面向不同场景的个性化知识推荐方法。

一种终端设备，包括处理器和计算机可读存储介质，处理器用于实现各指令；计算机可读存储介质用于存储多条指令，所述指令适于由处理器加载并执行所述的一种面向不同场景的个性化知识推荐方法。

与现有技术相比，本公开的有益效果为：

(1)本公开从短期会话型场景和长期连续型场景两个角度分别进行推荐研究，从而达到个性化推荐的目的；

(2)针对短期会话型场景，本公开以用户在历史会话中一系列随时间变化的连续交互行为数据(例如浏览、点击等)为基础，考虑了用户会话信息学习和边缘信息学习两个方面，更好的挖掘出用户潜在的偏好信息。对于用户会话信息学习，基于用户历史访问会话的序列，使用上下文关联的GRU网络对会话中用户的顺序交互进行建模，获得用户会话行为向量表示；对于边缘信息学习，发明人将会话中的交互项映射到知识图谱的对应实体中，通过聚合该实体的属性及边缘相关实体，获得相应的边缘信息向量表示；

(3)针对短期会话型场景，本公开考虑到用户会话内的项目与项目在知识图谱中的信息存在着相关性，基于用户会话行为向量和边缘信息向量，引入一个协同注意力机制，计算每个交互的重要性，量化会话项目和知识图谱中项目之间的相关性，并获得用户偏好的综合向量表示，从而提高推荐效果；

(4)针对长期连续型场景，本公开以用户历史访问知识平台的信息序列为基础，为了学***变化情况，将用户嵌入向量转换为类别查询向量，引入知识敏感注意力机制，并计算用户对各类别知识的注意力权重，从而完成更适合的推荐。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。

图1为本公开实施例提供的面向不同场景的个性化推荐方法的整体流程图；

图2为本公开实施例提供的基于协同注意力的用户行为推荐的处理流程图；

图3为本公开实施例提供的基于知识水平感知的注意力网络推荐的处理流程图；

图4为本公开实施例提供的注意力机制推荐效果图；

图5为本公开实施例提供的面向不同场景的推荐实施例流程图；

图6为本公开实施例提供的面向不同场景的推荐装置结构示意图。

具体实施方式：

下面结合附图与实施例对本公开作进一步说明。

应该指出，以下详细说明都是例示性的，旨在对本公开提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本公开的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1至图5所示，本实施例的一种面向不同场景的个性化推荐方法，包括：

针对短期会话型场景而言，

A.对用户会话数据的采集，包含历史数据和当前交互数据，对获取的海量用户会话交互数据进行数据预处理，包含数据清洗、缺失数据补全、数据定义并存储。

具体地，基于某在线购买平台获取用户的交互数据为应用实例，分别获得音乐类交互数据和电商类交互数据，并将数据集分为训练数据和测试数据。如表1所示，为用户在历史会话中的交互数据集。

表1数据集的基本统计信息

B.基于用户在会话中一系列随时间变化的连续交互行为(例如浏览、点击等)，使用上下文关联的GRU网络对会话中用户的顺序交互进行建模，并对传统GRU单元中的操作进行修改，将用户的交互行为添加到各个门函数中，获得用户会话行为向量表示，从而实现会话信息学习。

具体地，所述步骤B中用户会话信息学习的一般生成过程为：

B1.会话行为学习(SBL)是对给定用户u的短期会话行为进行建模，更具体地说，对于给定用户访问会话序列S_u＝{(x₁,b₁),(x₂,b₂),…,(x_i,b_i)}，x_i表示会话内的第i项,_i表示用户在第i项的交互方式(如click、purchase等)。首先，根据用户在会话中连续的交互行为(例如浏览、点击等)进行建模，得到用户当前会话内的偏好信息。

B2.使用上下文关联的GRU网络对会话中用户的顺序交互进行建模，并对传统GRU单元中的操作进行修改，将b_i的交互行为分别添加到各个门函数中。先前的研究证明了GRU在基于会话推荐中比LSTM有更好的性能。GRU中的隐藏状态h_t可以是前一个隐藏状态h_t-1与候选隐藏状态

之间的线性插值：

z_t＝σ(W_zx_t+V_zb_t+U_zh_t-1) (2)

r_t＝σ(W_rx_t+V_rb_t+U_rh_t-1) (4)

其中z_t为更新门函数；

为候选激活函数；r_t为重置门函数；W_z,V_z,U_z,W_r,V_r,U_r分别为权重系数。

如上所述，使用隐含状态h_t保存当前会话中用户的意图信息，可以得到用户会话偏好集合I_u:

I_u＝{h_s,1,h_s,2,…,h_s,t} (5)

其中I_u∈R^D×t，D是隐含状态的维度，R表示实数集合。

C.在边缘信息学习中，将交互项映射到知识图谱(KG)中的对应实体，通过聚合该实体的属性及边缘相关实体，得到相应邻域信息表示N(x_n)，进行相关潜在兴趣学习。但是在真实世界的知识图谱中，实体的邻居的数量和关系可能会有很大的差异。为了保持每个批处理的计算稳定且有效，随机选择固定大小的邻居集，而不使用它的完整邻居。

具体地，所述步骤C中用户边缘信息学习的一般生成过程为：

C1.基于用户历史会话序列，将交互项映射到知识图谱(KG)中的对应实体，通过聚合该实体的属性及边缘相关实体，得到相应邻域信息表示N(x_n)。计算实体v的邻域表示vⁱN(v)为：

其中

表示实体间的关系权重得分。

C2.对于每个交互项i_n，逐层计算i_n的接受域，并以邻居聚合的形式表示实体item的邻域信息：

agg_neighbor＝σ(W·v_N(v)+b) (7)

聚合是获取邻域信息表示的关键步骤，本实施对会话内每个实体聚合后得到邻域信息集合N_u,表示会话内交互项目的边缘信息集合：

N_u＝{agg_neighbor,1,agg_neighbor,2,…,agg_neighbor,t} (8)

D.基于用户会话行为向量和边缘信息向量，引入一个协同注意力机制，计算每个交互的重要性，量化会话项目和知识图谱中项目之间的相关性，并获得用户偏好的综合向量表示：

将步骤B获得的会话行为向量I_u和步骤C获得的边缘信息向量N_u作为协同注意网络的输入，计算关联矩阵c:

其中，W_c为权重系数，f是tanh函数。

然后把关联矩阵c当做一个特征，计算会话内偏好和边缘信息的注意力为：

P^s＝f₁(W_NN_u+(W_iI_u+W_ih_s,t)C^T) (10)

同样的，

P^u＝f₁(W_iI_u+(W_NN_u+W_tagg_neighbor,t)C^T) (12)

其中，f₁,f₂分别为tanh函数和softmax函数，W_s,W_t,W_t为权重系数。

根据注意力的权重，用户长期和短期偏好的相互依赖表征可以计算为其交互表征的加权和:

和

为了着重考虑当前项对用户偏好的影响，本实施用P_u＝[I_co-u；h_s,t],P_s＝[P_co-u；agg_neighbor,t]分别来表示最终的会话内偏好与边缘信息潜在偏好。

最后，将以上二者与候选项目集结合，并获得用户偏好的综合向量表示

E.对待预测样本进行用户行为推荐，将步骤D中的输出

输入softmax层得到输出值，如下：

其中，y′表示模型的输出向量，表示候选项目的概率分布，每个概率表示该项目是下一个访问的概率。

F.采用交叉熵作为损失函数，若y为真实的类别分布，则损失函数定义如下：

然后，使用随机梯度下降优化器进行优化。

对待测试样本进行用户行为推荐，将推荐结果进行推送，并与实际的用户行为进行结果对比，表2描述了用户行为推荐中方法的性能比较：

表2用户行为推荐的性能比较

基于表2中的结果可得，本实施例所提出的用户行为推荐模型的性能优于其他方法。

针对长期连续型场景推荐而言，

A.对用户访问知识平台数据的采集，包含历史数据和当前数据，对获取的海量用户访问数据进行数据预处理，包含数据清洗、缺失数据补全、数据定义并存储。

具体地，基于某知识软件知识学习平台获取用户历史访问数据为应用实例，获取到的用户访问数据主要包括用户ID、用户访问课程ID、用户访问课程的时间T、用户访问进度P、用户访问课程的难易程度H、用户访问课程所属的类别C等。首先，对获取到的数据进行了处理，将过少和过长的用户数据样本进行了筛选，得到了统一长度的用户访问数据。具体用户数据描述如表3所示。

表3数据集的基本统计信息

记录	数量	筛选后数量
			用户记录	114827	109696
课程	837	445
			用户	12600	10398
章节	3227	2164
			课程类别	26	26

B.基于用户访问软件知识学***以及推测用户当前所需的知识。

令u表示用户，用户历史学习的路线：初始全序列为:

S(u)＝{k₁,k₂,…,k_n} (1)

进一步的，根据知识所属类别标签分类得到内部(隐含)序列：

c_i＝{k₁,k₂,…,k_m}，其中m＜n (2)

需要注意的是，k₁,k_i并不一定是初始全序列中的连续项。

所以，用户历史学习全序列可以表示为：

C.对于给定用户user的历史访问序列S_k＝{k₁,k₂,…,k_n}，n为用户历史访问的项的个数。然后，将序列K通过嵌入层转换成空间向量表示E＝{e₁,e₂,…,e_n}，e_i为D维向量，D是所有项的个数，同时，UserID也通过嵌入转换成空间向量表示。

D.基于步骤C获得的用户序列信息编码，利用基于GRU的方法获取每个时间步的隐藏状态h_t，h_t可以是前一个隐藏状态h_t-1与候选隐藏状态

之间的线性插值：

其中，

z_t＝σ(W_zx_t+U_zh_t-1) (5)

同时，候选激活函数

为：

其中，重置门函数r_t计算如下：

r_t＝σ(W_rx_t+U_rh_t-1) (7)

W,U,W_z,U_z,W_r,U_r为权重系数。

如上所述，通过获取每个时间步的隐含状态h_i来得到历史序列中的信息传递情况，可以得到隐含状态向量集合H_S＝{h_s,1,h_s,2,…,h_s,t}，I_u∈R^D×t，其中R表示自然数据集，D是隐含状态的维度。

E.基于步骤D得到的隐含状态向量集合，按原标签进行分类，得到相同类别的知识对于的隐含向量，其中的一类表示为：

C_n＝{h_s,i,h_s,j,…,h_s,k} (8)

其中，n,i,j,k均为常数。

然后，将同一类别内的隐含向量进行串联接：

C_n＝[h_s,ih_s,j,…,h_s,k] (9)

其中，n,i,j,k均为常数。

为了得到用户当前的知识水平表示，首先将用户嵌入向量转换为类别查询向量q_c，其表达式为：

q_c＝RelU(V_c×e_u+b_c) (10)

那么，类别层次知识敏感注意力得分计算如下：

α_p(c_i)＝c^Tσ(W_p×q_c+b_p) (11)

则最终用户知识水平表示u_p是各类别的注意力表示的总和，这些类别根据它们的注意权重进行加权:

为了验证注意力机制对于推荐效果的提升，可以通过比较LSTM+attention和LSTM的性能差异，如图4所示。从LSTM+attention结果优于LSTM来看，可以证明注意力机制在序列建模中具有一定的学习能力，可以在序列推荐中提升模型的效果。

F.这里本文采用负抽样技术，在模型训练中联合预测K+1个候选集的点击得分。K+1个候选集由一个用户的一个正样本组成和K个随机选择的负样本组成。

是由候选集k_i和用户当前知识水平表示u_p的内积，然后通过softmax函数计算得出：

基于上文描述，给出了基于知识水平感知的注意力网络个性化推荐算法。

基于知识水平感知的注意力网络个性化推荐算法过程如下：

输入：用户访问记录序列K，用户嵌入向量u，候选集V

输出：每个候选知识项的得分

01.模型初始化

02.for k in sequence do

03.v＝Embedding{k}

04.Dense{v},then GRU-based{v_i}

05.获取GRU网络中的hidden state

06.end for

07.for c in C:

08.for h in c:

09.Concat{h_i}

10.Attention layer{category-level}

11.通过公式(12)，在类别层次上计算各类知识对当前知识水平的贡献得分

12.通过公式(13)，得到当前用户的知识水平表示

13.通过公式(14)(15)，候选知识项k_c-i与用户表示u_p点积计算推荐得分

算法的核心思想是基于用户序列访问信息和其分类的特征信息进行建模，学***状态，从而更加合理地进行知识推荐。具体地，首先通过基于GRU的方法进行序列建模，学***的贡献得分(行7-10)；最后，得到当前用户的知识水平表示，并计算每个候选项的推荐得分(行11-13)。

G.采用交叉熵作为损失函数，若y为真实的类别分布，则损失函数定义如下：

然后，使用随机梯度下降优化器进行优化。

本实施采用TensorFlow和Keras来实现提出的模型和基线模型的架构，为了防止过拟合，使用了两个dropout层：第一个dropout层用在知识项目嵌入层和GRU层之间，其中的丢弃率设置为20％；第二个dropout层在用户知识水平表示前，其中的丢弃率设置为30％。为了将GRU中的隐含状态准确分类，本文按位置获取对应时间步的类别特征标签。在训练过程中，设置learning rate为0.001，batch size设置为128。在优化过程中，使用Adam优化器进行参数优化。

对待测试样本进行用户行为推荐，将推荐结果进行推送，并与实际的用户行为进行结果对比，表4描述了用户行为推荐中方法的性能比较：

表4性能比较

基于表4中的结果可得，本实施例所提出的推荐模型(KLAN)的性能优于其他方法。

本实施例提出的短期会话型推荐场景，一般是用户在一定时间内频繁访问平台的内容或知识，目的性很强。而长期会话型推荐场景，往往是针对具有进阶层次的知识学习场景，具有长期连续性。比如每一知识体系的由浅及深的学习历程。

如图6所示，本实施例提供了一种面向不同场景的个性化推荐装置，包括：

针对短期会话型场景推荐而言，

(1)会话信息学习模块，其用于利用上下文关联的GRU网络对会话中用户的顺序交互进行建模，并对传统GRU单元中的操作进行修改，将用户的交互行为添加到各个门函数中，获得用户会话行为向量表示，从而实现会话信息学习；

(2)边缘信息学习模块，其用于基于用户在会话中一系列随时间变化的连续交互行为(例如浏览、点击等)，将交互项映射到知识图谱(KG)的对应实体中，通过聚合该实体的属性及边缘相关实体，得到相应的边缘信息向量表示，从而实现边缘信息学习。

(3)综合向量获取模块，其用于基于用户会话行为向量和边缘信息向量，引入一个协同注意力机制，计算每个交互的重要性，量化会话项目和知识图谱中项目之间的相关性，并获得用户偏好的综合向量表示；

(4)推荐模型训练模块，其用于利用用户偏好的综合向量，构建softmax函数；计算softmax函数输出值的损失函数，采用反向传播算法训练GRU的学习参数，完成模型的训练；

具体地，在所述推荐模型训练模块中，采用交叉熵作为推荐模型的损失函数，实现模型的训练。

(5)反馈更新模块，其用于模型训练完成后，输出实验样本集的推荐结果，与实际用户行为进行对比，反馈更新底层数据信息，不断优化数据的权重值，从而不断完善用户行为推荐。

针对长期连续型场景推荐而言，

(1)用户序列信息编码模块，其用于利用用户历史访问学习平台的信息序列，通过嵌入操作，将用户序列信息映射成相应的向量表示，从而实现用户序列信息编码；

(2)隐含状态向量学习模块，其用于基于用户序列信息的编码向量，通过GRU方法来得到历史序列中的信息传递情况，从而学习隐含状态向量集合，

(3)用户知识水平学***表示，将用户嵌入向量转换为类别查询向量，并引入知识敏感注意力机制计算用户对各类别知识水平的注意力权重；

(4)推荐模型训练模块，其用于利用用户对各类别知识的注意力权重和已知的候选项集进行内积操作，构建softmax函数；计算softmax函数输出值的损失函数，采用反向传播算法训练GRU的学习参数，完成模型的训练；

(5)反馈更新模块，其用于模型训练完成后，输出实验样本集的推荐结果，与实际的用户行为进行对比，反馈更新底层数据信息，不断优化数据的权重值，从而不断完善用户行为推荐。

在另一实施例中，一种面向不同场景的个性化推荐装置，其特征在于，还包括：

预处理模块，其用于对海量历史用户数据进行数据预处理，包含数据清洗、缺失数据补全、数据定义以及规范化处理。

在另一实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如图1所示的推荐方法中的步骤。

在另一实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如图1所示的推荐方法中的步骤。

本领域内的技术人员应明白，本公开的实施例可提供为方法、***、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本公开的优选实施例而已，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

上述虽然结合附图对本公开的具体实施方式进行了描述，但并非对本公开保护范围的限制，所属领域技术人员应该明白，在本公开的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims

1.一种面向不同场景的个性化知识推荐方法，其特征是：包括以下步骤：

获取用户数据信息，判断其所处使用场景；

根据预测的用户需求，推荐相关信息。

2.如权利要求1所述的一种面向不同场景的个性化知识推荐方法，其特征是：获取用户数据信息，若所述用户具有超过设定值的历史数据，则认为该用户处于长期连续型场景，否则认为其处于短期会话型场景。

3.如权利要求1所述的一种面向不同场景的个性化知识推荐方法，其特征是：短期会话型场景时，基于用户在会话中一系列随时间变化的连续交互行为，将交互项映射到知识图谱的对应实体中，通过聚合该实体的属性及边缘相关实体，得到相应的边缘信息向量表示，从而实现边缘信息学习；

或，短期会话型场景时，基于用户会话行为向量和边缘信息向量，引入一个协同注意力机制，计算每个交互的重要性，量化会话项目和知识图谱中项目之间的相关性，并获得用户偏好的综合向量表示；

4.如权利要求1所述的一种面向不同场景的个性化知识推荐方法，其特征是：长期连续型场景时，基于用户历史访问学习平台的信息序列，通过嵌入操作将信息序列映射成相应的向量表示，实现对用户序列信息编码；

或，基于用户序列的信息编码，通过门控循环单元获取每个时间步的隐藏状态来得到历史序列中的信息传递情况，从而得到隐含状态向量集合。

5.如权利要求1所述的一种面向不同场景的个性化知识推荐方法，其特征是：基于得到的隐含状态向量集合，按照原标签进行分类，得到相同类别的知识对应的隐含向量；将用户嵌入向量转换为类别查询向量，引入知识敏感注意力机制计算用户对各类别知识的注意力权重；

6.一种面向不同场景的个性化知识推荐***，其特征是：包括：

7.如权利要求6所述的一种面向不同场景的个性化知识推荐***，其特征是：所述短期会话型场景处理模块，包括：

边缘信息学习模块，其用于基于用户在会话中一系列随时间变化的连续交互行为，将交互项映射到知识图谱的对应实体中，通过聚合该实体的属性及边缘相关实体，得到相应的边缘信息向量表示；

8.如权利要求6所述的一种面向不同场景的个性化知识推荐***，其特征是：所述长期连续型场景处理模块，包括：

用户知识水平学***的注意力权重；

9.一种计算机可读存储介质，其特征是：其中存储有多条指令，所述指令适于由终端设备的处理器加载并执行权利要求1-5中任一项所述的一种面向不同场景的个性化知识推荐方法。

10.一种终端设备，其特征是：包括处理器和计算机可读存储介质，处理器用于实现各指令；计算机可读存储介质用于存储多条指令，所述指令适于由处理器加载并执行权利要求1-5中任一项所述的一种面向不同场景的个性化知识推荐方法。