CN108573041B

CN108573041B - 基于加权信任关系的概率矩阵分解推荐方法

Info

Publication number: CN108573041B
Application number: CN201810307183.XA
Authority: CN
Inventors: 于鑫; 刘毅
Original assignee: Nanjing University of Science and Technology
Current assignee: Nanjing University of Science and Technology
Priority date: 2018-04-08
Filing date: 2018-04-08
Publication date: 2022-09-27
Anticipated expiration: 2038-04-08
Also published as: CN108573041A

Abstract

本发明公开了一种基于加权信任关系的概率矩阵分解推荐方法，首先要获取用户项目评分信息矩阵和用户间信任关系评分矩阵，将信任信息矩阵进行信任数据的填充；对于用户项目评分信息矩阵根据相似度计算公式计算目标用户和每个用户的相似度；将得到的用户间相似度融入到信任评分数据中得到加权信任评分数据；将得到的加权信任评分数据结合概率矩阵分解方法得到基于加权信任关系的概率矩阵分解推荐模型，最终根据得到的推荐模型成功预测出目标用户感兴趣的项目。本发明主要针对带有评分信息和信任数据的社交网站，主要应用于电子商务***中，有效的对目标用户形成高质量，高准确率的推荐。

Description

基于加权信任关系的概率矩阵分解推荐方法

技术领域

本发明涉及概率矩阵分解方法，特别是一种基于加权信任关系的概率矩阵分解方法。

背景技术

随着web2.0的飞速发展，世界开始从信息匮乏走入信息过载，我们已经开始步入大数据时代。一些国际知名公司都存在着信息过载但是无法从中找到有效的信息来满足用户需求创造价值的问题。

目前，推荐***已经被广泛使用在电影、书籍、音乐、新闻、网页、图像等领域，在每个领域也有针对该领域的推荐算法。推荐算法面临的最严重的的两个问题就是冷启动和数据稀疏性，而且，传统的推荐***忽略了用户之间的社会关系或信任关系。但实际情况是，在现实世界中，人们总是求助于信任的朋友，这样选择很容易受到信任的朋友的影响。因此，传统的纯粹针对用户项目评分矩阵的协同过滤推荐***，并不会提供实际产出。而且目前的推荐算法还不成熟，也是众多学者的研究热点。最初推荐***被分为基于内容的推荐***和基于协同过滤的推荐***，基于内容的推荐因为仅仅考虑用户本身的特征(爱好，性别等) 和项目的特征(类别，价格等)，所以存在推荐精度不准确的问题。而目前使用最广泛的是基于模型的协同过滤推荐算法，这种方法通过观察到的用户项目之间的评分数据，使用机器学习等方法去训练一个模型，然后用训练出来的模型去预测用户的空缺评分，根据评分信息进行个性化推荐。基于信任关系的概率矩阵分解模型就是一种即可以解决冷启动问题，也可以有效解决数据稀疏性问题，同时提高推荐精确度的方法。

发明内容

本发明的目的在于提供一种基于加权信任关系的概率矩阵分解推荐方法，能够较准确的将目标用户感兴趣的项目推荐给用户。

实现本发明目的的技术解决方案为：一种基于加权信任关系的概率矩阵分解推荐方法，包括以下步骤：

步骤1、根据信任的弱传递性，首先要找到每个用户最信任的用户的集合也称为相似用户集合，然后根据相似用户集合中用户的信任关系，去填充目标用户对之前没有信任评分的用户的信任度；

步骤2、根据用户项目评分矩阵使用改进的Jaccard相似度计算公式计算出用户间相似度；

步骤3、将计算出的用户间相似度与信任关系矩阵融合，生成加权的信任关系矩阵；

步骤4、将信任信息结合到概率矩阵分解算法中生成基于加权信任关系的概率矩阵分解模型；

步骤5、根据基于加权信任关系的概率矩阵分解模型对目标用户进行合理的推荐；

本发明与现有技术相比，其显著优点为：(1)本发明有效的利用了社交信任信息，根据信任的弱传递性，将信任信息融入概率矩阵分解模型；(2)对于信任信息稀疏的信任关系矩阵，本发明有效的进行信任信息矩阵的填充，有效解决了数据稀疏性问题；(3)本发明可以有效的应用在存在信任数据和项目评分数据的各大***中。

附图说明

图1为本发明的一种结合评分信息和信任信息的推荐方法的流程图。

图2为本发明实施Epinions数据集的部分信任数据示意图。

图3为本发明实施Epinions数据集的部分评分数据示意图。

图4中的(a)为本发明实施的一种基于加权信任关系的概率矩阵分解推荐方法的算法流程图第一部分，图4中的(b)为本发明实施的一种基于加权信任关系的概率矩阵分解推荐方法的算法流程图第二部分，图4中的(c)为本发明实施的一种基于加权信任关系的概率矩阵分解推荐方法的算法流程图第三部分。

图5为本发明实施例的使用MAE值作为评价指标的结果的示意图。

具体实施方式

下面结合附图对本发明作进一步说明。

步骤1、根据信任的弱传递性，首先寻找到信任矩阵中每个用户信任的用户的集合，然后根据相似用户集合中用户的信任关系，去填充目标用户对之前没有信任评分的用户的信任度；具体包括以下步骤：

步骤1-1、初始设T＝[Tuv]N×N来表示描述用户之间信任关系的信任矩阵，Tuv表示用户之间的信任评分，T(u)＝{(v∈U)|T_uv＝1}为用户u的信任用户集合；

步骤1-2、计算用户间相似度，

式中S(u,v)表示用户u与用户v之间的相似度。T(u)和T(v)分别表示用户u的信任用户数量和用户v的信任用户数量。那么|T(u)∩T(v)|则表示用户u和用户v 共同信任的用户数量，t为设定的阈值表示最少共同信任用户数量；

步骤1-3、根据信任的弱传递性，求得用户u和用户v之间的预测信任评分，

式中，S(u)表示经过选取后所形成的用户u的相似用户集合，|S(u)|表示用户u相似用户的数量。S(u,k)表示用用户u与用户k共同信任用户数所衡量的相似度值，Isim_jacard(k,v)表示用户k与用户v的改进Jaccard相似度，T_kv表示用户k 和用户v原始评分矩阵中的信任度。

步骤1-4、遍历信任关系矩阵执行步骤1-3，得到新的填充后的信任关系矩阵。

步骤2、根据用户项目评分矩阵使用我们改进的Jaccard相似度计算公式计算出用户间相似度；具体包括以下步骤：

步骤2-1、假设用户项目评分矩阵的评分值为0,1,2,3,4,5六个值，其中矩阵的行表示用户，列表式项目；

步骤2-2、根据公式

计算两个用户间的相似度

A和B分别表示用户A和用户B，|A∪B|表示用户A和用户B评分项目并集中包含项目数量，

似度表示根据上面公式计算出的用户A和用户B共同评分项目的加权值；

步骤3、将计算出的用户间相似度与信任关系矩阵融合，生成新的加权的信任关系矩阵；具体包括以下步骤：

步骤3-1、输入用户项目评分矩阵R和信任矩阵T，根据步骤2我们可以得出对于任意用户的邻居用户的相似度值，使用公式

可以得到新的加权信任关系矩阵W；

步骤4、将信任信息结合到概率矩阵分解算法中生成基于填充信任关系的概率矩阵分解模型；具体包括以下步骤：

步骤4-1、设Uv是用户v的潜在特征向量，W为加权信任关系矩阵，R为用户项目评分矩阵，Vi为项目i的潜在特征向量，构建融合了加权信任的用户偏移量，通过两个重要的调节因子控制信任信息所占比重的条件分布如下；

步骤4-2、目标用户的行为会受到信任用户的影响，设

根据步骤4-1得到的信任信息所占比重，我们构建概率矩阵分解模型如下：

步骤4-3、分别对U_u，V_i，b_u，b_i四个参数进行梯度下降，可以得到目标函数的局部最小值，求得用户u对项目i的预测评分值；

步骤5、根据基于填充信任关系的概率矩阵分解模型对目标用户进行合理的推荐；具体包括以下步骤：

步骤5-1、对所有目标用户没有评分的项目循环求得预测评分值，将这些评分值及项目从大到小排序；

步骤5-2、设***的推荐项目数量为t，则推荐预测评分值前t个项目给目标用户；

下面结合图1至图4，通过仿真实验的实施例及其效果评价来进一步说明本发明。

在本次实施例中，如图2所示，实验图像为Epinions数据集的信任评分数据的部分数据截图，其中1代表信任，0代表不信任。从图中可以看出，信任评分矩阵中数据信任数据缺失严重。我们根据步骤1信任具有弱传递性，首先根据步骤1-2计算用户间相似度，然后根据步骤1-3对信任信息矩阵进行填充得到填充后的信任信息矩阵。如图3所示，实验图像为Epinions数据集的用户项目评分数据的部分数据截图，数据取值为0,1,2,3,4,5，数值越大代表评分越高。从图中可以看出评分数据也存在缺失严重问题。传统的概率矩阵分解方法将项目评分矩阵直接进行概率矩阵分解，构建推荐模型，这样的推荐准度很低。本发明则是融入了填充后的加权信任信息进行改进。根据步骤2中改进的Jaccard相似度计算公式

计算出用户间相似度，再使用步骤3中的加权信任关系公式

根据步骤1中得到的填充后的信任信息矩阵T_uv和步骤2中求得的用户间相似度求得加权信任关系矩阵W。根据步骤4我们将信任信息融合到概率矩阵分解模型中。首先求得控制信任信息所占比重的条件分布如下；

根据条件分布我们构建概率矩阵分解模型如下：

分别对Uu，Vi，bu，bi四个参数进行梯度下降，可以得到目标函数的局部最小值，求得用户u对项目i的预测评分值。最后根据步骤5对所有目标用户没有评分的项目循环求得预测评分值，最终对目标用户进行合理的推荐。

根据本发明的算法流程图如图4所示进行实验，得到的实验结果如图5。实验使用MAE值作为性能评价指标，与概率矩阵分解算法和社交化概率矩阵分解算法作对比。从图5可以看出，对比三种算法的最低MAE值时，本发明中基于填充信任关系的概率矩阵分解推荐算法(YPMF)比PMF算法在准确度上提高了7.5％，比socialMF算法提高了4％，我们使用的Epinions数据集存在稀疏度很高的问题，我们可以看出我们提出的基于填充信任关系的概率矩阵分解推荐算法(YPMF)很大程度缓解了数据稀疏性问题。由此可以得出，融合了基于填充信任关系的概率矩阵分解算法在处理稀疏数据集时有很大改进。为带有评分信息和信任信息的电子商务网站提供了高精度的推荐方法。

Claims

1.一种基于加权信任关系的概率矩阵分解推荐方法，其特征在于包括以下步骤：

步骤1、根据信任的弱传递性，首先寻找到信任关系矩阵中每个用户信任的用户的集合，称为相似用户集合，然后根据相似用户集合中用户的信任关系，去填充目标用户对之前没有信任评分的用户的信任度；步骤1中找到相似用户集合，填充用户的信任关系具体包括以下步骤：

步骤1-1、初始设T＝[T_uv]_N×N来表示描述用户之间信任关系的信任关系矩阵，T_uv表示用户之间的信任评分，T(u)＝{(v∈U)|T_uv＝1}为用户u的信任用户集合；U是用户的集合；

步骤1-2、计算用户间相似度

式中，S(u,v)表示用户u与用户v之间的相似度，T(u)和T(v)分别表示用户u的信任用户数量和用户v的信任用户数量，|T(u)∩T(v)|则表示用户u和用户v共同信任的用户数量，t为设定的阈值，表示最少共同信任的用户数量；

式中，S(u)表示经过选取后所形成的用户u的相似用户集合，|S(u)|表示用户u相似用户的数量，S(u,k)表示用用户u与用户k共同信任的用户数量所衡量的相似度值，Isim_jacard(k,v)表示用户k与用户v的改进Jaccard相似度，T_kv表示用户k和用户v在原始评分矩阵中的信任度；

步骤1-4、遍历信任关系矩阵执行步骤1-3，得到每个用户与其他用户的信任值，得到新的填充后的信任关系矩阵；

步骤3、将计算出的用户间相似度与新的信任关系矩阵融合，生成新的加权的信任关系矩阵；

步骤4、将加权的信任关系矩阵结合到概率矩阵分解算法中，生成基于加权信任关系的概率矩阵分解模型；

步骤5、根据基于加权信任关系的概率矩阵分解模型对目标用户进行推荐。

2.根据权利要求1所述的基于加权信任关系的概率矩阵分解推荐方法，其特征在于：步骤2中根据用户项目评分矩阵使用改进的Jaccard相似度计算公式计算出用户间相似度具体包括以下步骤：

步骤2-1、假设用户项目评分矩阵的评分值为0,1,2,3,4,5六个值，其中矩阵的行表示用户，列表示项目；

步骤2-2、根据公式

计算两个用户间的相似度

表示根据上面公式计算出的用户A和用户B共同评分项目的加权值。

3.根据权利要求1或2所述的基于加权信任关系的概率矩阵分解推荐方法，其特征在于，步骤3中将计算出的用户间相似度与新的信任关系矩阵融合，生成新的加权的信任关系矩阵具体为：

输入用户项目评分矩阵R和信任关系矩阵T，根据步骤2得出对于任意用户的邻居用户的相似度值，使用公式

得到新的加权信任关系矩阵W，式中|I_uv|代表用户u和用户v共同评分的项目数量，T_uv表示用户之间的信任评分。

4.根据权利要求1所述的基于加权信任关系的概率矩阵分解推荐方法，其特征在于：步骤5中根据基于加权信任关系的概率矩阵分解模型对目标用户进行推荐包括以下步骤：

步骤5-2、设***的推荐项目数量为t，则推荐预测评分值前t个项目给目标用户。