CN109213951A

CN109213951A - 一种基于信任计算和矩阵分解的推荐算法

Info

Publication number: CN109213951A
Application number: CN201810614359.6A
Authority: CN
Inventors: 王瑞琴
Original assignee: Individual
Current assignee: Individual
Priority date: 2018-06-07
Filing date: 2018-06-07
Publication date: 2019-01-15

Abstract

本发明公开了一种基于信任计算和矩阵分解的推荐算法。矩阵分解推荐模型是目前广泛使用的个性化推荐技术，然而普遍存在数据稀疏性、冷启动和抗攻击能力差等问题。本发明以社交网络中的社会同质性原理作为理论依据，根据用户的兴趣偏好是由其自身特质和朋友影响结果的启发式思想，提出一种简单有效的信任度量方法和一个信任加强的矩阵分解推荐算法。信任计算过程综合考虑了全局信任、局部信任、信任传递、多路信任组合等因素。在基于矩阵分解的用户建模过程中，利用信任邻居用户对当前用户的潜在因子向量加以扩展，同时利用用户间的信任关系对参数求解目标函数进行规格化约束，从而极大缓解了数据稀疏性和冷启动问题，并具有良好的抗攻击能力。

Description

一种基于信任计算和矩阵分解的推荐算法

技术领域：

本发明属于计算机人工智能领域，具体涉及基于用户信誉度的信任扩展方法和信任加强的矩阵分解协同推荐模型，用于解决推荐***中的数据稀疏性问题和新用户的冷启动问题。

背景技术：

在这个信息***的时代，推荐***作为一种有效的信息过滤技术在各种电子商务平台和社交网络中被广泛使用，如Amazon,eBay，Netflix等。自从2009年Netflix Prize百万美金竞赛以来，基于矩阵分解的协同推荐技术以其在大赛中的优异表现得到了业界的广泛关注。矩阵分解的核心思想认为用户的兴趣只受少数几个决定性因素的影响，因此通过将稀疏且高维的用户-项目评分矩阵分解为两个低维的矩阵，即用户特征矩阵和项目特征矩阵，然后用重构的低维矩阵就可以预测用户对项目的评分，这样可以在减少计算复杂度的同时提高推荐性能。

然而在现实环境中，用户-项目评分矩阵往往非常稀疏，评分矩阵的极端稀疏性使得矩阵分解方法无法准确获得用户的偏好模型，从而影响评分预测和推荐的精度。鉴于此，研究者们纷纷提出各种改进策略，如矩阵填充、带偏置的矩阵分解、上下文感知的矩阵分解、联合矩阵分解等。然而以上方法并没有从根本上解决协同推荐中的数据稀疏性问题，因为它们使用的数据源并没有改变。

根据社会影响理论中的“从众”性，用户在社交环境中的行为一方面是由用户自身的兴趣偏好决定的，另一方面则会受到周围人群的影响。近年来，随着社交网络的兴起和蓬勃发展，社交网络中产生了大量的用户数据，信任关系就是其中之一。用户间的信任关系和用户-项目间的交互行为是两个相对独立的数据源，利用社交信任关系来改善推荐***的性能是本发明的主要动机。

传统的协同过滤技术还存在冷启动问题，对于那些具有极少甚至没有历史评分数据的新用户，该方法往往很难为其做出正确的推荐。社交信任的引入可以缓解这一难题，根据社交选择与社会影响理论中的同质性原理，朋友之间往往具有相似的兴趣爱好，所以可以利用用户之间的信任关系辅助构建用户的偏好模型。

抗攻击能力也是推荐***需要关注的问题之一，基于历史评分的协同推荐技术显然存在安全隐患。恶意用户前期通过效仿目标用户的行为成为其相似邻居，后期通过实施恶意行为来对目标用户造成伤害。基于信任关系的协同推荐可以避免这个问题，只要恶意用户不属于目标用户的可信任朋友圈，他们就不可能对目标用户的评分预测产生任何影响。

基于以上原因，我发明提出一种信任加强的推荐方法，采用低时高效的矩阵分解模型作为主框架，利用信任关系作为附加数据源，采用信任同质性原理对推荐模型进行扩展和约束，有效解决数据稀疏性问题、冷启动问题，全面提高推荐***的性能和抗攻击能力。

发明内容：

首先，提出一种基于用户全局信誉度的信任计算方法，用以扩展用户的社会关系，缓解社交推荐中信任数据的稀疏性问题；然后，提出一种信任加强的矩阵分解模型，使用Top-K信任用户对当前用户的特征向量进行扩展，解决评分数据的稀疏性问题和新用户的冷启动问题；最后，进一步利用用户间的信任关系，对矩阵分解的目标优化函数进行规格化约束，提高评分预测和推荐的准确性。

本发明的具体步骤为：

1.信誉度敏感的信任计算

众所周知，信任关系的引入是为了解决协同推荐***中的数据稀疏性问题，然而在实际的应用环境中，信任关系本身也非常稀疏，很多评分数量极少的用户其维护的信任关系往往也很少，所以传统社交推荐算法的性能并不理想。为了缓解社交推荐中信任数据的稀疏性问题，本发明提出一种信誉度敏感的信任计算方法，来推理用户之间的间接信任度S_ij，计算公式如下：

其中，Trustee(u_i)表示用户u_i的直接信任用户集，rep(u_k)表示用户u_i的全局信誉度。在社交网络中，用户信誉度的度量方法有很多种，如基于网络结构分析的中心度指标Degree,Closeness, Betweenness和Eigenvector，以及PageRank,Hits等图论计算方法。

以上信任扩展方法原理简单却含义丰富，其计算过程全面考虑了用户间的局部信任关系以及用户的全局信誉度在信任传递过程中的作用，而且分子项中的求和运算体现了多路信任的合成原理，计算得到的信任度处于[0,1]区间。

2.基于矩阵分解的社交推荐

鉴于PMF模型在协同推荐中的优异表现，本发明继续采用PMF作为评分预测的主框架，同时基于社会同质性原理，充分利用用户间的社交信任关系对矩阵分解模型进行扩展和约束。

由社交同质性原理可知，社交网络中人们的行为不仅是由其自身的兴趣偏好决定，而且会受到其周围人群的影响，尤其是其所信任的朋友。因此，本发明在利用矩阵分解模型对用户特征进行建模时，将社交信任关系作为辅助信息，对当前用户的潜在特征向量进行扩展，扩展后的用户评分条件概率分布如下：

其中，u表示评分均值，b_i和b_j分别表示用户u_i和项目v_j的偏置，T^k(i)表示用户u_i的Top-K信任用户集，x_l表示u_i的第1个信任用户在u_i特征建模过程中的贡献权重，该参数由训练过程学习得到。 Trust-MF建模过程的图形描述如图1所示。

本发明与已有方法具有本质区别，已有方法将社交信任作为附加信息对评分预测的计算过程进行调整，并没有对用户向量本身进行修改，而本发明方法是对用户特征向量的扩展，将原用户向量U_i变为U_i′，其中这样一来，用户建模过程中就隐含了信任传递的过程。

根据概率分布原理，评分预测后验概率分布的对数形式如下：

其中，N(i)是与用户u_i具有信任关系的用户集，C是参数无关的常数项。最大化以上后验概率等价于求以下目标函数的极小值：

其中，这里为了简单起见，设λ_U＝λ_V＝λ。目标函数的最后一项是基于信任关系的规格化约束因子，目的是使信任用户之间的特征向量尽量相似：当用户u_i和u_l之间的信任度比较高时，他们的特征向量U_i和U_l应该比较相似，即差值应该很小；当他们之间的信任度比较低时，其特征向量U_i和U_l之间可以具有较大差距。

以上目标函数是非凸的，很难求得最优解，这里使用随机梯度下降法(SGD)来求其局部最优解。记当前评分预测误差为e_ij，通过遍历所有已知评分对超参数进行迭代更新。对于一个给定的训练样本R_ij，各参数的更新规则如下：

b_i＝b_i+γ(e_ij-λb_i) 公式(7)

b_j＝b_j+γ(e_ij-λb_j) 公式(8)

其中，T(i)是用户u_i的信任用户集，B(i)是信任用户u_i的用户集，γ是学习率，λ_S和λ是规格化因子， k是信任用户的个数。

本发明的实验结果：

实验测试选择Epinions通用数据集，该数据集由49,289个用户对139,738个项目的664,823个评分组成，同时包含用户声明的478,183个信任关系。实验比较使用两种测试指标：平均绝对误差 (MAE)和均方根误差(RMSE)。

为了说明本发明提出的Trust-MF算法在推荐性能方面的改善效果，在相同的实验环境下，将本发明与一系列当前流行的社交推荐算法和基于矩阵分解的推荐算法进行了比较，其中包括：

·TrustCF：为了验证矩阵分解推荐方法的优越性，我们设计实现了一个基于用户信任关系的协同推荐算法，其中使用基于信任用户的KNN方法进行推荐；

·bPMF：带偏置的矩阵分解算法，它在PMF算法的基础上增加了用户和项目的偏置调节因子对用户进行建模。该算法只利用用户-项目评分矩阵作为数据源进行推荐；

·SoRec：基于联合矩阵分解的社交推荐算法，该算法使用矩阵分解技术将评分矩阵和信任矩阵同时进行分解来对用户进行建模，矩阵分解过程中共享了用户特征向量空间；

·TrustPMF：该算法利用PMF技术对评分矩阵和信任矩阵进行分解，与SoRec算法不同的是，该算法并没有共享用户向量空间，而是将用户间的信任关系作为目标函数的约束项，以此来建立评分行为和信任关系之间的联系；

·TrustSVD：该算法利用信任信息对SVD算法进行扩展，信任用户作为附加信息辅助进行用户建模，同时增加信任正则化项对目标函数进行约束。该方法与本发明有类似之处，但在用户信任度的计算方法上具有本质区别，而且二者对用户潜在特征向量的扩展方式也完全不同。

实验1.不同推荐算法之间的性能比较

将原始数据集随机分成80％的训练集和20％的测试集，在相同的实验环境下，基于不同规模的潜在因子数量，采用交叉验证方法对各推荐算法进行实验评测。实验结果如表1所示，表中最后一行表示本发明较已有方法最好性能的改进程度。

从表1中可以看出，在不同规模的潜在因子数量下，本发明Trust-MF的评分预测性能均优于其它对比算法。总的来说，结合信任关系的矩阵分解推荐算法(SoRec,TrustPMF,TrustSVD)的性能比只依赖于评分数据的bPMF算法性能好，这说明社交关系对用户行为具有一定影响，也说明信任关系可以作为辅助信息提高用户建模的准确度。此外，bPMF算法的推荐性能优于TrustCF算法，这说明Model-based推荐方法比Memory-based推荐方法性能优越，也间接说明了原始信任网络的数据稀疏性严重影响了推荐的性能。另外，因为TrustCF算法只依赖于信任关系，没有使用矩阵分解方法，所以潜在因子数量的改变对其性能并没有造成任何影响。从表中还可以看出，矩阵分解中潜在因子的数量越大，对用户建模的准确性就越高，推荐性能也越好，但是随着潜在因子数量的增加，计算复杂度也会相应增加。

表1不同算法间的性能比较

实验2.不同训练集规模下的推荐性能比较

为了进一步对本发明和对比算法的推荐性能进行全面的比较，我们分别在不同的训练集规模下对其推荐性能进行测试。具体来说，就是将原始数据集按照不同的比例划分为训练集和测试集，从而模拟出不同规模的数据稀疏度，在矩阵分解推荐模型中将潜在因子数固定为20，实验结果如表2 所示。

从表2中可以看出，随着训练集规模的不断增加，所有推荐方法的推荐性能都有所提高。在数据比较稀疏的情况下，信任加强的推荐算法(TrustCF,SoRec,TrustPMF,TrustSVD)比仅依赖于评分信息的bPMF算法具有明显优势。其中，TrustCF算法由于基于信任邻居进行推荐，所以受评分数据规模影响不大。本发明Trust-MF无论在何种数据规模下都具有显著优势，其推荐性能明显优于其它对比算法，尤其是在数据极端稀疏的情况下，性能优势更为明显。究其原因，在于Trust-MF算法中用户模型扩展和目标函数优化的有效性，而这些都归因于本发明提出的信任度计算方法RepTrust的合理性和有效性。精确的信任度度量使得用户建模的准确性提高，从而改善了推荐精度。隐式信任关系的挖掘扩展了已有信任网络，极大缓解了数据的稀疏性问题。

表2不同训练集规模下的推荐性能比较

实验3.对不同类型用户的推荐性能比较

传统协同推荐***的一大挑战就是很难为具有极少评分历史的用户做出有效的推荐。为了验证本发明和对比算法对于此类用户的推荐能力，根据历史评分数对所有用户进行分类，然后观察不同算法在不同类型用户组中的性能表现，实验结果如图2所示。其中所有用户被分为5组：“1-10”、“11-20”、“21-30”、“31-40”、“>40”，分组中的数值表示用户评分数量的范围。

从图2(a)和2(b)均可以看出，各算法的性能排序在不同类型用户中基本保持不变。整体而言，信任加强的推荐算法TrustCF,SoRec,TrustPMF和TrustSVD与仅基于评分数据的算法bPMF相比，受用户评分数影响较小。与对比算法相比，本发明Trust-MF对不同类型用户的推荐能力都具有明显优势，尤其是对于评分数量极少的用户，这就是通常所说的“冷启动”用户。而TrustCF方法的推荐性能在所有类型的用户中基本保持稳定，同样是因为其只依赖于信任信息进行推荐，和用户的评分数量无关。该实验结果不仅验证了本发明的稳定性，而且说明本发明可以有效缓解协同推荐中的冷启动问题。

总结：

本发明以社交网络中用户所信任的朋友会对用户的社交行为产生影响的社会同质性原理作为理论依据，根据用户的兴趣偏好是由自身特质和朋友影响结果的启发式思想，提出一种全新的基于矩阵分解的社交推荐算法，对传统矩阵分解推荐算法中的用户模型加以扩展，同时对参数求解目标函数进行规格化约束，从而极大缓解了协同推荐中的数据稀疏性问题和新用户的冷启动问题，而且具有良好的抗攻击能力。

此外，本发明提出的用户信任度计算方法简单有效，计算过程中全面考虑了全局信誉、局部信任、信任传递和多路信任等几个决定性因素。基于Epinions数据集的对比实验研究结果表明，本发明方法的推荐性能较已有社交推荐算法和矩阵分解推荐方法具有明显优势，尤其是在数据稀疏和冷启动的情况下。

在有些社交网络中，用户不但可以维护其信任朋友的列表，而且还可以构建其不信任的用户列表。本发明在用户信任度的计算过程中，虽然未提及用户间的不信任关系，但是只要将其中用户信誉度的定义修改为信任该用户的用户数与不信任该用户的用户数之差，本发明就可以适用于具有不信任关系的社交推荐***中，因此本发明具有普遍适用性。

附图说明：

图1是信任加强的矩阵分解推荐模型图

图2是不同类型用户的推荐性能比较图。

Claims

1.一种基于信任计算和矩阵分解的协同推荐方法，其特征在于：包括信誉度敏感的信任计算模块和信任加强的矩阵分解模块，其中：

所述信誉度敏感的信任计算模块，用于隐式信任关系的发现，进而扩展信任网络，解决信任数据的稀疏性问题；

所述信任加强的矩阵分解模块，用于基于社会同质性原理，使用信任关系对传统的矩阵分解推荐方法进行扩展与约束，从而提高推荐性能。

2.根据权利要求1所述的信誉度敏感的信任计算方法，其特征是：全面考虑了用户间的局部信任关系以及用户的全局信誉度在信任传递过程中的作用，而且充分体现了多路信任的合成原理。

3.根据权利要求1所述的信任加强的矩阵分解方法，其特征是：充分利用社交信任关系对矩阵分解推荐模型进行全面改进，具体包括：对用户潜在因子向量进行扩展和对目标优化函数进行规格化约束，从而解决了传统协同推荐的数据稀疏性问题和新用户冷启动问题，而且增强了***的抗攻击能力。