CN109213951A - 一种基于信任计算和矩阵分解的推荐算法 - Google Patents

一种基于信任计算和矩阵分解的推荐算法 Download PDF

Info

Publication number
CN109213951A
CN109213951A CN201810614359.6A CN201810614359A CN109213951A CN 109213951 A CN109213951 A CN 109213951A CN 201810614359 A CN201810614359 A CN 201810614359A CN 109213951 A CN109213951 A CN 109213951A
Authority
CN
China
Prior art keywords
trust
user
matrix decomposition
social
trusting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810614359.6A
Other languages
English (en)
Inventor
王瑞琴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201810614359.6A priority Critical patent/CN109213951A/zh
Publication of CN109213951A publication Critical patent/CN109213951A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于信任计算和矩阵分解的推荐算法。矩阵分解推荐模型是目前广泛使用的个性化推荐技术,然而普遍存在数据稀疏性、冷启动和抗攻击能力差等问题。本发明以社交网络中的社会同质性原理作为理论依据,根据用户的兴趣偏好是由其自身特质和朋友影响结果的启发式思想,提出一种简单有效的信任度量方法和一个信任加强的矩阵分解推荐算法。信任计算过程综合考虑了全局信任、局部信任、信任传递、多路信任组合等因素。在基于矩阵分解的用户建模过程中,利用信任邻居用户对当前用户的潜在因子向量加以扩展,同时利用用户间的信任关系对参数求解目标函数进行规格化约束,从而极大缓解了数据稀疏性和冷启动问题,并具有良好的抗攻击能力。

Description

一种基于信任计算和矩阵分解的推荐算法
技术领域:
本发明属于计算机人工智能领域,具体涉及基于用户信誉度的信任扩展方法和信任加强的矩阵分解协同推荐模型,用于解决推荐***中的数据稀疏性问题和新用户的冷启动问题。
背景技术:
在这个信息***的时代,推荐***作为一种有效的信息过滤技术在各种电子商务平台和社交网络中被广泛使用,如Amazon,eBay,Netflix等。自从2009年Netflix Prize百万美金竞赛以来,基于矩阵分解的协同推荐技术以其在大赛中的优异表现得到了业界的广泛关注。矩阵分解的核心思想认为用户的兴趣只受少数几个决定性因素的影响,因此通过将稀疏且高维的用户-项目评分矩阵分解为两个低维的矩阵,即用户特征矩阵和项目特征矩阵,然后用重构的低维矩阵就可以预测用户对项目的评分,这样可以在减少计算复杂度的同时提高推荐性能。
然而在现实环境中,用户-项目评分矩阵往往非常稀疏,评分矩阵的极端稀疏性使得矩阵分解方法无法准确获得用户的偏好模型,从而影响评分预测和推荐的精度。鉴于此,研究者们纷纷提出各种改进策略,如矩阵填充、带偏置的矩阵分解、上下文感知的矩阵分解、联合矩阵分解等。然而以上方法并没有从根本上解决协同推荐中的数据稀疏性问题,因为它们使用的数据源并没有改变。
根据社会影响理论中的“从众”性,用户在社交环境中的行为一方面是由用户自身的兴趣偏好决定的,另一方面则会受到周围人群的影响。近年来,随着社交网络的兴起和蓬勃发展,社交网络中产生了大量的用户数据,信任关系就是其中之一。用户间的信任关系和用户-项目间的交互行为是两个相对独立的数据源,利用社交信任关系来改善推荐***的性能是本发明的主要动机。
传统的协同过滤技术还存在冷启动问题,对于那些具有极少甚至没有历史评分数据的新用户,该方法往往很难为其做出正确的推荐。社交信任的引入可以缓解这一难题,根据社交选择与社会影响理论中的同质性原理,朋友之间往往具有相似的兴趣爱好,所以可以利用用户之间的信任关系辅助构建用户的偏好模型。
抗攻击能力也是推荐***需要关注的问题之一,基于历史评分的协同推荐技术显然存在安全隐患。恶意用户前期通过效仿目标用户的行为成为其相似邻居,后期通过实施恶意行为来对目标用户造成伤害。基于信任关系的协同推荐可以避免这个问题,只要恶意用户不属于目标用户的可信任朋友圈,他们就不可能对目标用户的评分预测产生任何影响。
基于以上原因,我发明提出一种信任加强的推荐方法,采用低时高效的矩阵分解模型作为主框架,利用信任关系作为附加数据源,采用信任同质性原理对推荐模型进行扩展和约束,有效解决数据稀疏性问题、冷启动问题,全面提高推荐***的性能和抗攻击能力。
发明内容:
首先,提出一种基于用户全局信誉度的信任计算方法,用以扩展用户的社会关系,缓解社交推荐中信任数据的稀疏性问题;然后,提出一种信任加强的矩阵分解模型,使用Top-K信任用户对当前用户的特征向量进行扩展,解决评分数据的稀疏性问题和新用户的冷启动问题;最后,进一步利用用户间的信任关系,对矩阵分解的目标优化函数进行规格化约束,提高评分预测和推荐的准确性。
本发明的具体步骤为:
1.信誉度敏感的信任计算
众所周知,信任关系的引入是为了解决协同推荐***中的数据稀疏性问题,然而在实际的应用环境中,信任关系本身也非常稀疏,很多评分数量极少的用户其维护的信任关系往往也很少,所以传统社交推荐算法的性能并不理想。为了缓解社交推荐中信任数据的稀疏性问题,本发明提出一种信誉度敏感的信任计算方法,来推理用户之间的间接信任度Sij,计算公式如下:
其中,Trustee(ui)表示用户ui的直接信任用户集,rep(uk)表示用户ui的全局信誉度。在社交网络中,用户信誉度的度量方法有很多种,如基于网络结构分析的中心度指标Degree,Closeness, Betweenness和Eigenvector,以及PageRank,Hits等图论计算方法。
以上信任扩展方法原理简单却含义丰富,其计算过程全面考虑了用户间的局部信任关系以及用户的全局信誉度在信任传递过程中的作用,而且分子项中的求和运算体现了多路信任的合成原理,计算得到的信任度处于[0,1]区间。
2.基于矩阵分解的社交推荐
鉴于PMF模型在协同推荐中的优异表现,本发明继续采用PMF作为评分预测的主框架,同时基于社会同质性原理,充分利用用户间的社交信任关系对矩阵分解模型进行扩展和约束。
由社交同质性原理可知,社交网络中人们的行为不仅是由其自身的兴趣偏好决定,而且会受到其周围人群的影响,尤其是其所信任的朋友。因此,本发明在利用矩阵分解模型对用户特征进行建模时,将社交信任关系作为辅助信息,对当前用户的潜在特征向量进行扩展,扩展后的用户评分条件概率分布如下:
其中,u表示评分均值,bi和bj分别表示用户ui和项目vj的偏置,Tk(i)表示用户ui的Top-K信任用户集,xl表示ui的第1个信任用户在ui特征建模过程中的贡献权重,该参数由训练过程学习得到。 Trust-MF建模过程的图形描述如图1所示。
本发明与已有方法具有本质区别,已有方法将社交信任作为附加信息对评分预测的计算过程进行调整,并没有对用户向量本身进行修改,而本发明方法是对用户特征向量的扩展,将原用户向量Ui变为Ui′,其中这样一来,用户建模过程中就隐含了信任传递的过程。
根据概率分布原理,评分预测后验概率分布的对数形式如下:
其中,N(i)是与用户ui具有信任关系的用户集,C是参数无关的常数项。最大化以上后验概率等价于求以下目标函数的极小值:
其中,这里为了简单起见,设λU=λV=λ。目标函数的最后一项是基于信任关系的规格化约束因子,目的是使信任用户之间的特征向量尽量相似:当用户ui和ul之间的信任度比较高时,他们的特征向量Ui和Ul应该比较相似,即差值应该很小;当他们之间的信任度比较低时,其特征向量Ui和Ul之间可以具有较大差距。
以上目标函数是非凸的,很难求得最优解,这里使用随机梯度下降法(SGD)来求其局部最优解。记当前评分预测误差为eij,通过遍历所有已知评分对超参数进行迭代更新。对于一个给定的训练样本Rij,各参数的更新规则如下:
bi=bi+γ(eij-λbi) 公式(7)
bj=bj+γ(eij-λbj) 公式(8)
其中,T(i)是用户ui的信任用户集,B(i)是信任用户ui的用户集,γ是学习率,λS和λ是规格化因子, k是信任用户的个数。
本发明的实验结果:
实验测试选择Epinions通用数据集,该数据集由49,289个用户对139,738个项目的664,823个评分组成,同时包含用户声明的478,183个信任关系。实验比较使用两种测试指标:平均绝对误差 (MAE)和均方根误差(RMSE)。
为了说明本发明提出的Trust-MF算法在推荐性能方面的改善效果,在相同的实验环境下,将本发明与一系列当前流行的社交推荐算法和基于矩阵分解的推荐算法进行了比较,其中包括:
·TrustCF:为了验证矩阵分解推荐方法的优越性,我们设计实现了一个基于用户信任关系的协同推荐算法,其中使用基于信任用户的KNN方法进行推荐;
·bPMF:带偏置的矩阵分解算法,它在PMF算法的基础上增加了用户和项目的偏置调节因子对用户进行建模。该算法只利用用户-项目评分矩阵作为数据源进行推荐;
·SoRec:基于联合矩阵分解的社交推荐算法,该算法使用矩阵分解技术将评分矩阵和信任矩阵同时进行分解来对用户进行建模,矩阵分解过程中共享了用户特征向量空间;
·TrustPMF:该算法利用PMF技术对评分矩阵和信任矩阵进行分解,与SoRec算法不同的是,该算法并没有共享用户向量空间,而是将用户间的信任关系作为目标函数的约束项,以此来建立评分行为和信任关系之间的联系;
·TrustSVD:该算法利用信任信息对SVD算法进行扩展,信任用户作为附加信息辅助进行用户建模,同时增加信任正则化项对目标函数进行约束。该方法与本发明有类似之处,但在用户信任度的计算方法上具有本质区别,而且二者对用户潜在特征向量的扩展方式也完全不同。
实验1.不同推荐算法之间的性能比较
将原始数据集随机分成80%的训练集和20%的测试集,在相同的实验环境下,基于不同规模的潜在因子数量,采用交叉验证方法对各推荐算法进行实验评测。实验结果如表1所示,表中最后一行表示本发明较已有方法最好性能的改进程度。
从表1中可以看出,在不同规模的潜在因子数量下,本发明Trust-MF的评分预测性能均优于其它对比算法。总的来说,结合信任关系的矩阵分解推荐算法(SoRec,TrustPMF,TrustSVD)的性能比只依赖于评分数据的bPMF算法性能好,这说明社交关系对用户行为具有一定影响,也说明信任关系可以作为辅助信息提高用户建模的准确度。此外,bPMF算法的推荐性能优于TrustCF算法,这说明Model-based推荐方法比Memory-based推荐方法性能优越,也间接说明了原始信任网络的数据稀疏性严重影响了推荐的性能。另外,因为TrustCF算法只依赖于信任关系,没有使用矩阵分解方法,所以潜在因子数量的改变对其性能并没有造成任何影响。从表中还可以看出,矩阵分解中潜在因子的数量越大,对用户建模的准确性就越高,推荐性能也越好,但是随着潜在因子数量的增加,计算复杂度也会相应增加。
表1不同算法间的性能比较
实验2.不同训练集规模下的推荐性能比较
为了进一步对本发明和对比算法的推荐性能进行全面的比较,我们分别在不同的训练集规模下对其推荐性能进行测试。具体来说,就是将原始数据集按照不同的比例划分为训练集和测试集,从而模拟出不同规模的数据稀疏度,在矩阵分解推荐模型中将潜在因子数固定为20,实验结果如表2 所示。
从表2中可以看出,随着训练集规模的不断增加,所有推荐方法的推荐性能都有所提高。在数据比较稀疏的情况下,信任加强的推荐算法(TrustCF,SoRec,TrustPMF,TrustSVD)比仅依赖于评分信息的bPMF算法具有明显优势。其中,TrustCF算法由于基于信任邻居进行推荐,所以受评分数据规模影响不大。本发明Trust-MF无论在何种数据规模下都具有显著优势,其推荐性能明显优于其它对比算法,尤其是在数据极端稀疏的情况下,性能优势更为明显。究其原因,在于Trust-MF算法中用户模型扩展和目标函数优化的有效性,而这些都归因于本发明提出的信任度计算方法RepTrust的合理性和有效性。精确的信任度度量使得用户建模的准确性提高,从而改善了推荐精度。隐式信任关系的挖掘扩展了已有信任网络,极大缓解了数据的稀疏性问题。
表2不同训练集规模下的推荐性能比较
实验3.对不同类型用户的推荐性能比较
传统协同推荐***的一大挑战就是很难为具有极少评分历史的用户做出有效的推荐。为了验证本发明和对比算法对于此类用户的推荐能力,根据历史评分数对所有用户进行分类,然后观察不同算法在不同类型用户组中的性能表现,实验结果如图2所示。其中所有用户被分为5组:“1-10”、“11-20”、“21-30”、“31-40”、“>40”,分组中的数值表示用户评分数量的范围。
从图2(a)和2(b)均可以看出,各算法的性能排序在不同类型用户中基本保持不变。整体而言,信任加强的推荐算法TrustCF,SoRec,TrustPMF和TrustSVD与仅基于评分数据的算法bPMF相比,受用户评分数影响较小。与对比算法相比,本发明Trust-MF对不同类型用户的推荐能力都具有明显优势,尤其是对于评分数量极少的用户,这就是通常所说的“冷启动”用户。而TrustCF方法的推荐性能在所有类型的用户中基本保持稳定,同样是因为其只依赖于信任信息进行推荐,和用户的评分数量无关。该实验结果不仅验证了本发明的稳定性,而且说明本发明可以有效缓解协同推荐中的冷启动问题。
总结:
本发明以社交网络中用户所信任的朋友会对用户的社交行为产生影响的社会同质性原理作为理论依据,根据用户的兴趣偏好是由自身特质和朋友影响结果的启发式思想,提出一种全新的基于矩阵分解的社交推荐算法,对传统矩阵分解推荐算法中的用户模型加以扩展,同时对参数求解目标函数进行规格化约束,从而极大缓解了协同推荐中的数据稀疏性问题和新用户的冷启动问题,而且具有良好的抗攻击能力。
此外,本发明提出的用户信任度计算方法简单有效,计算过程中全面考虑了全局信誉、局部信任、信任传递和多路信任等几个决定性因素。基于Epinions数据集的对比实验研究结果表明,本发明方法的推荐性能较已有社交推荐算法和矩阵分解推荐方法具有明显优势,尤其是在数据稀疏和冷启动的情况下。
在有些社交网络中,用户不但可以维护其信任朋友的列表,而且还可以构建其不信任的用户列表。本发明在用户信任度的计算过程中,虽然未提及用户间的不信任关系,但是只要将其中用户信誉度的定义修改为信任该用户的用户数与不信任该用户的用户数之差,本发明就可以适用于具有不信任关系的社交推荐***中,因此本发明具有普遍适用性。
附图说明:
图1是信任加强的矩阵分解推荐模型图
图2是不同类型用户的推荐性能比较图。

Claims (3)

1.一种基于信任计算和矩阵分解的协同推荐方法,其特征在于:包括信誉度敏感的信任计算模块和信任加强的矩阵分解模块,其中:
所述信誉度敏感的信任计算模块,用于隐式信任关系的发现,进而扩展信任网络,解决信任数据的稀疏性问题;
所述信任加强的矩阵分解模块,用于基于社会同质性原理,使用信任关系对传统的矩阵分解推荐方法进行扩展与约束,从而提高推荐性能。
2.根据权利要求1所述的信誉度敏感的信任计算方法,其特征是:全面考虑了用户间的局部信任关系以及用户的全局信誉度在信任传递过程中的作用,而且充分体现了多路信任的合成原理。
3.根据权利要求1所述的信任加强的矩阵分解方法,其特征是:充分利用社交信任关系对矩阵分解推荐模型进行全面改进,具体包括:对用户潜在因子向量进行扩展和对目标优化函数进行规格化约束,从而解决了传统协同推荐的数据稀疏性问题和新用户冷启动问题,而且增强了***的抗攻击能力。
CN201810614359.6A 2018-06-07 2018-06-07 一种基于信任计算和矩阵分解的推荐算法 Pending CN109213951A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810614359.6A CN109213951A (zh) 2018-06-07 2018-06-07 一种基于信任计算和矩阵分解的推荐算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810614359.6A CN109213951A (zh) 2018-06-07 2018-06-07 一种基于信任计算和矩阵分解的推荐算法

Publications (1)

Publication Number Publication Date
CN109213951A true CN109213951A (zh) 2019-01-15

Family

ID=64991843

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810614359.6A Pending CN109213951A (zh) 2018-06-07 2018-06-07 一种基于信任计算和矩阵分解的推荐算法

Country Status (1)

Country Link
CN (1) CN109213951A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110119465A (zh) * 2019-05-17 2019-08-13 哈尔滨工业大学 融合lfm潜在因子与svd的手机应用用户喜好检索方法
CN110134835A (zh) * 2019-05-15 2019-08-16 哈尔滨工业大学 一种面向在线教育平台的用户信任建模方法
CN110955829A (zh) * 2019-11-19 2020-04-03 江西财经大学 融合信任度和度量因子矩阵分解的兴趣点推荐方法及***
CN112395197A (zh) * 2020-11-19 2021-02-23 中国平安人寿保险股份有限公司 一种数据处理方法、数据处理装置及电子设备
CN112667885A (zh) * 2020-12-04 2021-04-16 四川长虹电器股份有限公司 一种耦合社会信任信息的矩阵分解协同过滤方法和***

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110134835A (zh) * 2019-05-15 2019-08-16 哈尔滨工业大学 一种面向在线教育平台的用户信任建模方法
CN110134835B (zh) * 2019-05-15 2022-10-28 哈尔滨工业大学 一种面向在线教育平台的用户信任建模方法
CN110119465A (zh) * 2019-05-17 2019-08-13 哈尔滨工业大学 融合lfm潜在因子与svd的手机应用用户喜好检索方法
CN110119465B (zh) * 2019-05-17 2023-06-13 哈尔滨工业大学 融合lfm潜在因子与svd的手机应用用户喜好检索方法
CN110955829A (zh) * 2019-11-19 2020-04-03 江西财经大学 融合信任度和度量因子矩阵分解的兴趣点推荐方法及***
CN110955829B (zh) * 2019-11-19 2023-05-23 江西财经大学 融合信任度和度量因子矩阵分解的兴趣点推荐方法及***
CN112395197A (zh) * 2020-11-19 2021-02-23 中国平安人寿保险股份有限公司 一种数据处理方法、数据处理装置及电子设备
CN112667885A (zh) * 2020-12-04 2021-04-16 四川长虹电器股份有限公司 一种耦合社会信任信息的矩阵分解协同过滤方法和***
CN112667885B (zh) * 2020-12-04 2022-08-16 四川长虹电器股份有限公司 一种耦合社会信任信息的矩阵分解协同过滤方法和***

Similar Documents

Publication Publication Date Title
CN111428147B (zh) 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
CN109213951A (zh) 一种基于信任计算和矩阵分解的推荐算法
Li et al. Digital Twin Driven Green Performance Evaluation Methodology of Intelligent Manufacturing: Hybrid Model Based on Fuzzy Rough‐Sets AHP, Multistage Weight Synthesis, and PROMETHEE II
Sun et al. Improved monarch butterfly optimization algorithm based on opposition‐based learning and random local perturbation
Zhao et al. Community extraction for social networks
CN108596774A (zh) 基于深层次网络嵌入特征的社会化信息推荐算法及***
CN105740430A (zh) 一种融合社会化信息的个性化推荐方法
Zou et al. Reinforcement learning to diversify top-n recommendation
Zhang et al. A novel power-driven fractional accumulated grey model and its application in forecasting wind energy consumption of China
CN110222838B (zh) 文档排序方法、装置、电子设备及存储介质
Sun et al. Boosting ant colony optimization via solution prediction and machine learning
CN104239496A (zh) 一种结合模糊权重相似性度量和聚类协同过滤的方法
Yao et al. Accurately detecting protein complexes by graph embedding and combining functions with interactions
CN105761154A (zh) 一种社会化推荐方法及装置
CN103699573A (zh) 社交平台的ugc标签聚类方法和装置
CN110491443B (zh) 一种基于投影邻域非负矩阵分解的lncRNA蛋白质关联预测方法
Król et al. Investigation of evolutionary optimization methods of TSK fuzzy model for real estate appraisal
CN107909498B (zh) 基于最大化接受者操作特征曲线下方面积的推荐方法
Zhong et al. An Improved Differential Evolution Algorithm Based on Dual‐Strategy
CN106971053A (zh) 一种基于混合协同过滤的推荐方法
Huang et al. A global network alignment method using discrete particle swarm optimization
CN109639469A (zh) 一种联合学习稀疏属性网络表征方法及***
Fan et al. An improved quantum clustering algorithm with weighted distance based on PSO and research on the prediction of electrical power demand
WO2020093817A1 (zh) 一种核身方法及装置
CN108021985A (zh) 一种模型参数训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190115