CN108573041B - 基于加权信任关系的概率矩阵分解推荐方法 - Google Patents
基于加权信任关系的概率矩阵分解推荐方法 Download PDFInfo
- Publication number
- CN108573041B CN108573041B CN201810307183.XA CN201810307183A CN108573041B CN 108573041 B CN108573041 B CN 108573041B CN 201810307183 A CN201810307183 A CN 201810307183A CN 108573041 B CN108573041 B CN 108573041B
- Authority
- CN
- China
- Prior art keywords
- user
- trust
- users
- matrix
- trust relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 239000011159 matrix material Substances 0.000 title claims abstract description 84
- 238000000354 decomposition reaction Methods 0.000 title claims abstract description 37
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000004364 calculation method Methods 0.000 claims abstract description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 19
- 238000012163 sequencing technique Methods 0.000 claims description 2
- 238000001914 filtration Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于加权信任关系的概率矩阵分解推荐方法,首先要获取用户项目评分信息矩阵和用户间信任关系评分矩阵,将信任信息矩阵进行信任数据的填充;对于用户项目评分信息矩阵根据相似度计算公式计算目标用户和每个用户的相似度;将得到的用户间相似度融入到信任评分数据中得到加权信任评分数据;将得到的加权信任评分数据结合概率矩阵分解方法得到基于加权信任关系的概率矩阵分解推荐模型,最终根据得到的推荐模型成功预测出目标用户感兴趣的项目。本发明主要针对带有评分信息和信任数据的社交网站,主要应用于电子商务***中,有效的对目标用户形成高质量,高准确率的推荐。
Description
技术领域
本发明涉及概率矩阵分解方法,特别是一种基于加权信任关系的概率矩阵分解方法。
背景技术
随着web2.0的飞速发展,世界开始从信息匮乏走入信息过载,我们已经开始步入大数据时代。一些国际知名公司都存在着信息过载但是无法从中找到有效的信息来满足用户需求创造价值的问题。
目前,推荐***已经被广泛使用在电影、书籍、音乐、新闻、网页、图像等领域,在每个领域也有针对该领域的推荐算法。推荐算法面临的最严重的的两个问题就是冷启动和数据稀疏性,而且,传统的推荐***忽略了用户之间的社会关系或信任关系。但实际情况是,在现实世界中,人们总是求助于信任的朋友,这样选择很容易受到信任的朋友的影响。因此,传统的纯粹针对用户项目评分矩阵的协同过滤推荐***,并不会提供实际产出。而且目前的推荐算法还不成熟,也是众多学者的研究热点。最初推荐***被分为基于内容的推荐***和基于协同过滤的推荐***,基于内容的推荐因为仅仅考虑用户本身的特征(爱好,性别等) 和项目的特征(类别,价格等), 所以存在推荐精度不准确的问题。而目前使用最广泛的是基于模型的协同过滤推荐算法,这种方法通过观察到的用户项目之间的评分数据,使用机器学习等方法去训练一个模型,然后用训练出来的模型去预测用户的空缺评分,根据评分信息进行个性化推荐。基于信任关系的概率矩阵分解模型就是一种即可以解决冷启动问题,也可以有效解决数据稀疏性问题,同时提高推荐精确度的方法。
发明内容
本发明的目的在于提供一种基于加权信任关系的概率矩阵分解推荐方法,能够较准确的将目标用户感兴趣的项目推荐给用户。
实现本发明目的的技术解决方案为:一种基于加权信任关系的概率矩阵分解推荐方法,包括以下步骤:
步骤1、根据信任的弱传递性,首先要找到每个用户最信任的用户的集合也称为相似用户集合,然后根据相似用户集合中用户的信任关系,去填充目标用户对之前没有信任评分的用户的信任度;
步骤2、根据用户项目评分矩阵使用改进的Jaccard相似度计算公式计算出用户间相似度;
步骤3、将计算出的用户间相似度与信任关系矩阵融合,生成加权的信任关系矩阵;
步骤4、将信任信息结合到概率矩阵分解算法中生成基于加权信任关系的概率矩阵分解模型;
步骤5、根据基于加权信任关系的概率矩阵分解模型对目标用户进行合理的推荐;
本发明与现有技术相比,其显著优点为:(1)本发明有效的利用了社交信任信息,根据信任的弱传递性,将信任信息融入概率矩阵分解模型;(2)对于信任信息稀疏的信任关系矩阵,本发明有效的进行信任信息矩阵的填充,有效解决了数据稀疏性问题;(3)本发明可以有效的应用在存在信任数据和项目评分数据的各大***中。
附图说明
图1为本发明的一种结合评分信息和信任信息的推荐方法的流程图。
图2为本发明实施Epinions数据集的部分信任数据示意图。
图3为本发明实施Epinions数据集的部分评分数据示意图。
图4中的(a)为本发明实施的一种基于加权信任关系的概率矩阵分解推荐方法的算法流程图第一部分,图4中的(b)为本发明实施的一种基于加权信任关系的概率矩阵分解推荐方法的算法流程图第二部分,图4中的(c)为本发明实施的一种基于加权信任关系的概率矩阵分解推荐方法的算法流程图第三部分。
图5为本发明实施例的使用MAE值作为评价指标的结果的示意图。
具体实施方式
下面结合附图对本发明作进一步说明。
步骤1、根据信任的弱传递性,首先寻找到信任矩阵中每个用户信任的用户的集合,然后根据相似用户集合中用户的信任关系,去填充目标用户对之前没有信任评分的用户的信任度;具体包括以下步骤:
步骤1-1、初始设T=[Tuv]N×N来表示描述用户之间信任关系的信任矩阵,Tuv表示用户之间的信任评分,T(u)={(v∈U)|Tuv=1}为用户u的信任用户集合;
步骤1-2、计算用户间相似度,
式中S(u,v)表示用户u与用户v之间的相似度。T(u)和T(v)分别表示用户u的信任用户数量和用户v的信任用户数量。那么|T(u)∩T(v)|则表示用户u和用户v 共同信任的用户数量,t为设定的阈值表示最少共同信任用户数量;
步骤1-3、根据信任的弱传递性,求得用户u和用户v之间的预测信任评分,
式中,S(u)表示经过选取后所形成的用户u的相似用户集合,|S(u)|表示用户u相似用户的数量。S(u,k)表示用用户u与用户k共同信任用户数所衡量的相似度值,Isimjacard(k,v)表示用户k与用户v的改进Jaccard相似度,Tkv表示用户k 和用户v原始评分矩阵中的信任度。
步骤1-4、遍历信任关系矩阵执行步骤1-3,得到新的填充后的信任关系矩阵。
步骤2、根据用户项目评分矩阵使用我们改进的Jaccard相似度计算公式计算出用户间相似度;具体包括以下步骤:
步骤2-1、假设用户项目评分矩阵的评分值为0,1,2,3,4,5六个值,其中矩阵的行表示用户,列表式项目;
步骤3、将计算出的用户间相似度与信任关系矩阵融合,生成新的加权的信任关系矩阵;具体包括以下步骤:
步骤3-1、输入用户项目评分矩阵R和信任矩阵T,根据步骤2我们可以得出对于任意用户的邻居用户的相似度值,使用公式
可以得到新的加权信任关系矩阵W;
步骤4、将信任信息结合到概率矩阵分解算法中生成基于填充信任关系的概率矩阵分解模型;具体包括以下步骤:
步骤4-1、设Uv是用户v的潜在特征向量,W为加权信任关系矩阵,R为用户项目评分矩阵,Vi为项目i的潜在特征向量,构建融合了加权信任的用户偏移量,通过两个重要的调节因子控制信任信息所占比重的条件分布如下;
步骤4-3、分别对Uu,Vi,bu,bi四个参数进行梯度下降,可以得到目标函数的局部最小值,求得用户u对项目i的预测评分值;
步骤5、根据基于填充信任关系的概率矩阵分解模型对目标用户进行合理的推荐;具体包括以下步骤:
步骤5-1、对所有目标用户没有评分的项目循环求得预测评分值,将这些评分值及项目从大到小排序;
步骤5-2、设***的推荐项目数量为t,则推荐预测评分值前t个项目给目标用户;
下面结合图1至图4,通过仿真实验的实施例及其效果评价来进一步说明本发明。
在本次实施例中,如图2所示,实验图像为Epinions数据集的信任评分数据的部分数据截图,其中1代表信任,0代表不信任。从图中可以看出,信任评分矩阵中数据信任数据缺失严重。我们根据步骤1信任具有弱传递性,首先根据步骤1-2计算用户间相似度,然后根据步骤1-3对信任信息矩阵进行填充得到填充后的信任信息矩阵。如图3所示,实验图像为Epinions数据集的用户项目评分数据的部分数据截图,数据取值为0,1,2,3,4,5,数值越大代表评分越高。从图中可以看出评分数据也存在缺失严重问题。传统的概率矩阵分解方法将项目评分矩阵直接进行概率矩阵分解,构建推荐模型,这样的推荐准度很低。本发明则是融入了填充后的加权信任信息进行改进。根据步骤2中改进的Jaccard相似度计算公式
计算出用户间相似度,再使用步骤3中的加权信任关系公式
根据步骤1中得到的填充后的信任信息矩阵Tuv和步骤2中求得的用户间相似度求得加权信任关系矩阵W。根据步骤4我们将信任信息融合到概率矩阵分解模型中。首先求得控制信任信息所占比重的条件分布如下;
根据条件分布我们构建概率矩阵分解模型如下:
分别对Uu,Vi,bu,bi四个参数进行梯度下降,可以得到目标函数的局部最小值,求得用户u对项目i的预测评分值。最后根据步骤5对所有目标用户没有评分的项目循环求得预测评分值,最终对目标用户进行合理的推荐。
根据本发明的算法流程图如图4所示进行实验,得到的实验结果如图5。实验使用MAE值作为性能评价指标,与概率矩阵分解算法和社交化概率矩阵分解算法作对比。从图5可以看出,对比三种算法的最低MAE值时,本发明中基于填充信任关系的概率矩阵分解推荐算法(YPMF)比PMF算法在准确度上提高了7.5%,比socialMF算法提高了4%,我们使用的Epinions数据集存在稀疏度很高的问题,我们可以看出我们提出的基于填充信任关系的概率矩阵分解推荐算法(YPMF)很大程度缓解了数据稀疏性问题。由此可以得出,融合了基于填充信任关系的概率矩阵分解算法在处理稀疏数据集时有很大改进。为带有评分信息和信任信息的电子商务网站提供了高精度的推荐方法。
Claims (4)
1.一种基于加权信任关系的概率矩阵分解推荐方法,其特征在于包括以下步骤:
步骤1、根据信任的弱传递性,首先寻找到信任关系矩阵中每个用户信任的用户的集合,称为相似用户集合,然后根据相似用户集合中用户的信任关系,去填充目标用户对之前没有信任评分的用户的信任度;步骤1中找到相似用户集合,填充用户的信任关系具体包括以下步骤:
步骤1-1、初始设T=[Tuv]N×N来表示描述用户之间信任关系的信任关系矩阵,Tuv表示用户之间的信任评分,T(u)={(v∈U)|Tuv=1}为用户u的信任用户集合;U是用户的集合;
步骤1-2、计算用户间相似度
式中,S(u,v)表示用户u与用户v之间的相似度,T(u)和T(v)分别表示用户u的信任用户数量和用户v的信任用户数量,|T(u)∩T(v)|则表示用户u和用户v共同信任的用户数量,t为设定的阈值,表示最少共同信任的用户数量;
步骤1-3、根据信任的弱传递性,求得用户u和用户v之间的预测信任评分,
式中,S(u)表示经过选取后所形成的用户u的相似用户集合,|S(u)|表示用户u相似用户的数量,S(u,k)表示用用户u与用户k共同信任的用户数量所衡量的相似度值,Isimjacard(k,v)表示用户k与用户v的改进Jaccard相似度,Tkv表示用户k和用户v在原始评分矩阵中的信任度;
步骤1-4、遍历信任关系矩阵执行步骤1-3,得到每个用户与其他用户的信任值,得到新的填充后的信任关系矩阵;
步骤2、根据用户项目评分矩阵使用改进的Jaccard相似度计算公式计算出用户间相似度;
步骤3、将计算出的用户间相似度与新的信任关系矩阵融合,生成新的加权的信任关系矩阵;
步骤4、将加权的信任关系矩阵结合到概率矩阵分解算法中,生成基于加权信任关系的概率矩阵分解模型;
步骤5、根据基于加权信任关系的概率矩阵分解模型对目标用户进行推荐。
4.根据权利要求1所述的基于加权信任关系的概率矩阵分解推荐方法,其特征在于:步骤5中根据基于加权信任关系的概率矩阵分解模型对目标用户进行推荐包括以下步骤:
步骤5-1、对所有目标用户没有评分的项目循环求得预测评分值,将这些评分值及项目从大到小排序;
步骤5-2、设***的推荐项目数量为t,则推荐预测评分值前t个项目给目标用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810307183.XA CN108573041B (zh) | 2018-04-08 | 2018-04-08 | 基于加权信任关系的概率矩阵分解推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810307183.XA CN108573041B (zh) | 2018-04-08 | 2018-04-08 | 基于加权信任关系的概率矩阵分解推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108573041A CN108573041A (zh) | 2018-09-25 |
CN108573041B true CN108573041B (zh) | 2022-09-27 |
Family
ID=63574170
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810307183.XA Expired - Fee Related CN108573041B (zh) | 2018-04-08 | 2018-04-08 | 基于加权信任关系的概率矩阵分解推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108573041B (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110968773B (zh) * | 2018-09-29 | 2023-04-28 | ***通信集团终端有限公司 | 应用推荐方法、装置、设备及存储介质 |
CN109918562B (zh) * | 2019-01-18 | 2022-10-18 | 重庆邮电大学 | 一种基于用户社区和评分联合社区的推荐方法 |
CN110032677A (zh) * | 2019-03-05 | 2019-07-19 | 四川大学 | 一种基于深度神经网络和概率矩阵分解的混合推荐算法 |
CN110175286B (zh) * | 2019-05-17 | 2021-05-11 | 山东师范大学 | 结合成对优化和矩阵分解的产品推荐方法及*** |
CN110955829B (zh) * | 2019-11-19 | 2023-05-23 | 江西财经大学 | 融合信任度和度量因子矩阵分解的兴趣点推荐方法及*** |
CN111368203A (zh) * | 2020-03-09 | 2020-07-03 | 电子科技大学 | 一种基于图神经网络的新闻推荐方法及其*** |
CN111626819B (zh) * | 2020-05-20 | 2023-04-28 | 长沙理工大学 | 一种基于信任相关度的快速矩阵分解推荐方法及*** |
CN112883289B (zh) * | 2021-04-16 | 2022-05-06 | 河北工程大学 | 一种基于社交信任和标签语义相似度的pmf推荐方法 |
CN113344671B (zh) * | 2021-06-23 | 2023-04-07 | 昆明理工大学 | 一种融合信任因素的个性化推荐模型及构建方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110184977A1 (en) * | 2008-09-27 | 2011-07-28 | Jiachun Du | Recommendation method and system based on collaborative filtering |
CN102779182A (zh) * | 2012-07-02 | 2012-11-14 | 吉林大学 | 融合偏好和信任关系的协同过滤推荐方法 |
US20140081996A1 (en) * | 2001-05-10 | 2014-03-20 | International Business Machines Corporation | System and method for item recommendations |
CN103761237A (zh) * | 2013-12-04 | 2014-04-30 | 南京邮电大学 | 一种基于用户特征及其信任度的协同过滤推荐方法 |
-
2018
- 2018-04-08 CN CN201810307183.XA patent/CN108573041B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140081996A1 (en) * | 2001-05-10 | 2014-03-20 | International Business Machines Corporation | System and method for item recommendations |
US20110184977A1 (en) * | 2008-09-27 | 2011-07-28 | Jiachun Du | Recommendation method and system based on collaborative filtering |
CN102779182A (zh) * | 2012-07-02 | 2012-11-14 | 吉林大学 | 融合偏好和信任关系的协同过滤推荐方法 |
CN103761237A (zh) * | 2013-12-04 | 2014-04-30 | 南京邮电大学 | 一种基于用户特征及其信任度的协同过滤推荐方法 |
Non-Patent Citations (2)
Title |
---|
An approach for recommending services based on user profile and interest similarity;Liu Junju等;《2014 IEEE 5th International Conference on Software Engineering and Service Science》;20141023;第983-986页 * |
一种融合项目特征和移动用户信任关系的推荐算法;胡勋等;《软件学报》;20140516;第1817-1830页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108573041A (zh) | 2018-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108573041B (zh) | 基于加权信任关系的概率矩阵分解推荐方法 | |
US20220222920A1 (en) | Content processing method and apparatus, computer device, and storage medium | |
CN112581191B (zh) | 行为预测模型的训练方法及装置 | |
CN108256093B (zh) | 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法 | |
WO2020147594A1 (zh) | 获取实体间关系表达的方法、***和设备、广告召回*** | |
JP2022508163A (ja) | ユーザタグ生成方法並びにその、装置、コンピュータプログラム及びコンピュータ機器 | |
CN112119388A (zh) | 训练图像嵌入模型和文本嵌入模型 | |
CN105138653B (zh) | 一种基于典型度和难度的题目推荐方法及其推荐装置 | |
CN107944035B (zh) | 一种融合视觉特征和用户评分的图像推荐方法 | |
JP6261547B2 (ja) | 判定装置、判定方法及び判定プログラム | |
CN104268142B (zh) | 基于可拒绝策略的元搜索结果排序方法 | |
CN104063481A (zh) | 一种基于用户实时兴趣向量的电影个性化推荐方法 | |
CN109471982B (zh) | 一种基于用户和服务聚类QoS感知的Web服务推荐方法 | |
WO2020233432A1 (zh) | 一种信息推荐方法及装置 | |
CN112074828A (zh) | 训练图像嵌入模型和文本嵌入模型 | |
CN113051468B (zh) | 一种基于知识图谱和强化学习的电影推荐方法及*** | |
CN112000763B (zh) | 兴趣点竞争关系确定方法、装置、设备和介质 | |
CN112131261B (zh) | 基于社区网络的社区查询方法、装置和计算机设备 | |
CN112989169A (zh) | 目标对象识别方法、信息推荐方法、装置、设备及介质 | |
CN112765484A (zh) | 短视频推送方法、装置、电子设备及存储介质 | |
US11947616B2 (en) | Systems and methods for implementing session cookies for content selection | |
CN113343077A (zh) | 一种融合用户兴趣时序波动的个性化推荐方法及*** | |
CN104123321B (zh) | 一种确定推荐图片的方法及装置 | |
CN109977304A (zh) | 一种基于兴趣点相似度迁移的电视节目推荐方法 | |
CN110825967B (zh) | 一种提高推荐***多样性的推荐列表重排名方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20220927 |
|
CF01 | Termination of patent right due to non-payment of annual fee |