CN106326367A - 基于wnbi和rsvd混合协同推荐算法 - Google Patents

基于wnbi和rsvd混合协同推荐算法 Download PDF

Info

Publication number
CN106326367A
CN106326367A CN201610656489.7A CN201610656489A CN106326367A CN 106326367 A CN106326367 A CN 106326367A CN 201610656489 A CN201610656489 A CN 201610656489A CN 106326367 A CN106326367 A CN 106326367A
Authority
CN
China
Prior art keywords
user
project
rsvd
wnbi
algorithm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610656489.7A
Other languages
English (en)
Inventor
***
陈洁
汤庸
肖菁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China Normal University
Original Assignee
South China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China Normal University filed Critical South China Normal University
Priority to CN201610656489.7A priority Critical patent/CN106326367A/zh
Publication of CN106326367A publication Critical patent/CN106326367A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于WNBI和RSVD混合协同推荐算法,该方法首先利用WNBI算法将用户和项目抽象成网络中的节点,利用隐藏在网络中的信息,挖掘项目之间更深层的潜在信息,寻找与项目相似的近邻集合,其次,利用RSVD模型将用户‑项目评分矩阵分解成为用户特征矩阵和项目特征矩阵,通过降维提高了数据密度,最后利用项目的近邻信息来规则化RSVD模型,以改进传统方法的不足。基于RSVD和WNBI的混合协同推荐算法(RSVD_WNBI)能够利用WNBI算法所获得的隐藏在用户‑项目网络中的信息来规则化RSVD模型,从而提高推荐的准确率和有效地解决评分矩阵稀疏问题。

Description

基于WNBI和RSVD混合协同推荐算法
技术领域
本发明涉及个性化推荐***技术,尤其涉及一种基于WNBI和RSVD混合协同推荐算法。
背景技术
随着互联网的快速发展,互联网上的数据量急剧增长,人们在获取网络上的最新动态和海量信息的同时也面临着“信息迷航”的困境,即如何从大量无用信息中筛选出感兴趣的有用信息。因此,推荐***应运而生,它通过收集用户的各种信息数据,分析背后隐藏的用户兴趣和行为模式,并根据分析结果来为用户提供私人定制的个性化推荐服务。
协同过滤推荐算法(Collaborative filtering,CF)是最早被应用于推荐***中且运用最为广泛的一种算法,其算法核心是依赖用户与项目之间交互的历史数据来分析用户兴趣爱好,并广泛应用于各个领域上。它主要分为两类:基于最近邻的推荐算法和基于模型的推荐算法。前者可分为基于用户近邻和基于项目近邻两种,主要是通过在用户群(或项目群)中找到与目标用户(或项目)相似的用户(或项目)集合,综合这些相似用户(或项目)的信息,形成***对该目标用户(或项目)的喜好程度预测,然而随着用户和资源数量大规模增加,该类算法存在数据稀疏、冷启动等问题,仅仅利用最近邻相似性度量,必然会造成推荐质量大幅度地下降;后者通过降低维数来有效保存信息内容,同时大大降低了计算的复杂度和对内存的需求,但过度依赖用户-项目评分矩阵,当数据稀疏时,推荐质量也会大受影响。
当前常用降维技术包括奇异值分解(Singular Value Decomposition,SVD),贝叶斯聚类,概率潜在语义分析和隐含狄利克雷分布。其中奇异值分解以及其变种算法,因为简单高效的特点受到了学术界和工业界广泛的关注。Ma在An experimental study onimplicit social recommendation,in:Proceedings of the 36th international ACMSIGIR conference on Research and development in information retrieval,ACM,2013,pp.73-82.认为相似用户与不相似用户对目标用户都存在不同程度的影响,因此可将这两个影响作为社会正则化因子来约束矩阵分解的目标函数。Koren在Factorizationmeets the neighborhood:a multifaceted collaborativefiltering model[C]//Proceedings of the 14th ACM SIGKDDinternational conference on Knowledgediscovery and data mining.Las Vegas,Nevada,USA,2008.提出了将近邻信息与矩阵分解相结合的模型,此外他在矩阵分解模型的基础上对用户随时间变化而产生的行为变化进行建模,并利用随机梯度下降法,对模型进行优化。Yelong Shen等人在Learning personal+social latent factor model for social recommendation.KDD,page 1303-1311.ACM,(2012)提出联合个人和社会的潜在因素(Personal Social Latent Factor Model forSocial Recommendation,PSLF)模型来进行社会化推荐。Chu-Xu Zhang在Informationfiltering via collaborative userclustering modeling.Physica A 396(2014)195-203认为具有相似兴趣的近邻用户集合对目标用户的决定会产生一定的影响,并提出了基于用户聚类的矩阵分解方法(Matrix Factorization Based clusteringusers,UCMF)。Szwabe在Semantically enhanced collaborativefiltering based on RSVD,in:Proceedings of the International Conference onComputational CollectiveIntelligence,2011,pp.10-19.结合随机索引(RI)技术和SVD模型来描述项目的内容特征。
除了利用用户和项目的内容特征,还出现了基于复杂网络和图论的推荐算法,该类算法大多数是基于二部图或三部图来构建用户-项目之间的关系或用户-标签-项目关系,不仅仅有效改善推荐的精度,而且提高了推荐的多样性和新颖性,还具有创新性。Zhou等人在Bipartite network projection and personal recommendation[J].PhysicalReview E,2007 76(4):46115提出基于网络推断(network-based inference,NBI)的推荐算法,借鉴了物理中物质扩散过程,利用二部图进行资源分配,取得了比基于近邻的算法更好的推荐效果。Xin Pan等人在Weighted Bipartite network and PersonalizedRecommendation.Physics ProcediaVolume 3,Issue 5,August 2010,Pages 1867-1876在zhou的基础上提出加权网络推断算法,将用户对项目的评分作为二部图中边的权重。Zhang在Heat Conduction Process on Community Networks as aRecommendation Model[J].Phys.Rev.Lett.,2007,99(15):154301.提出一种类似于热量在用户—产品二部分图中扩散的算法,可提高精度和多样性。Da-Cheng在Information Filtering via BalancedDiffusion on Bipartite Networks.CoRR abs/1402.5774(2014)提出均衡扩散(BD)算法,该算法利用均衡权重来结合物质扩散(MD)和热传导(HC)。Lian等在Personalizedrecommendation via an improved NBIalgorithm and user influence model in aMicroblog network.Physica A 392(2013)4594-4605.提出了一种基于用户特征和改进NBI的微博推荐算法。
发明内容
针对个性化推荐中存在的高维数据稀疏问题,本发明提出一种基于WNBI和RSVD混合协同推荐算法,其中RSVD为规则化的奇异值分解(Regularized Singular ValueDecomposition,RSVD),可将高维的用户-项目矩阵投影到一个低维的空间,从而降低了数据的稀疏性。WNBI为z-score归一化加权的网络推断(Weighted Network-Based Inferencewith z-score normalization,WNBI),WNBI算法是基于复杂网络和图论的推荐算法,将用户和项目抽象成网络中的节点,可有效利用隐藏在网络中的信息来进行推荐,从而提高了***的多样性和推荐准确度。
该方法首先利用WNBI算法将用户和项目抽象成网络中的节点,利用隐藏在网络中的信息,挖掘项目之间更深层的潜在信息,寻找与项目相似的近邻集合,其次,利用RSVD模型将用户-项目评分矩阵分解成为用户特征矩阵和项目特征矩阵,通过降维提高了数据密度,最后利用项目的近邻信息来规则化RSVD模型,以改进传统方法的不足。
该方法包括如下步骤:
S1,获取训练集DT数据及由WNBI算法所获得的用户近邻集S,特征变量f;
S2,初始化用户特征向量pu和项目特征向量qi
S3,在RSVD模型中融合由WNBI算法所获得的近邻项目信息,通过随机梯度下降法使预测误差达到最小化,并预测误差是否小于阈值;
S4,当预测误差小于阈值时,输出用户特征向量pu和项目特征向量qi;当预测误差不小于阈值时,跳转到S3。
本申请的有益效果:基于RSVD和WNBI的混合协同推荐算法(RSVD_WNBI)能够利用WNBI算法所获得的隐藏在用户-项目网络中的信息来规则化RSVD模型,能提高推荐的准确率和有效地解决评分矩阵稀疏问题。
附图说明
图1基于WNBI和RSVD混合协同推荐算法的方法步骤;
图2基于WNBI和RSVD混合协同推荐算法的原理图;
图3基于二部图的资源分配过程;
图4不同用户组的评分预测。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。
本发明研究了一种基于WNBI和RMF混合协同推荐算法(RSVD_WNBI),WNBI算法是基于复杂网络和图论的推荐算法,将用户和项目抽象成网络中的节点,可有效利用隐藏在网络中的信息来进行推荐,从而提高了***的多样性和推荐准确度,而规则化的奇异值分解(Regularized Singular Value Decomposition,RSVD)可将高维的用户-项目矩阵投影到一个低维的空间,从而降低了数据的稀疏性。因此利用由WNBI算法获得的项目近邻信息来规则化RSVD模型,能有效挖掘项目之间更深层的潜在信息,从而提高了算法的准确度。实验结果证明,相对于传统的推荐算法,该算法除了有效地提高了评分预测的准确度,还缓解了数据稀疏性问题。
如图1所示,该方法包括如下步骤:
步骤101,获取训练集DT数据及由WNBI算法所获得的用户近邻集S,特征变量f;
步骤102,初始化用户特征向量pu和项目特征向量qi
步骤103,在RSVD模型中融合由WNBI算法所获得的近邻项目信息,通过随机梯度下降法使预测误差达到最小化,并预测误差是否小于阈值;
步骤104,当预测误差小于阈值时,输出用户特征向量pu和项目特征向量qi;当预测误差不小于阈值时,跳转到S3。
本发明利用WNBI算法来获取近邻项目的信息,并将其用来规则化和优化RSVD模型,由于WNBI算法通过将物质扩散原理引入到个性化推荐中,增加了对用户和项目度之间关系的考虑,利用物质流动过程来计算用户/项目之间的相似性,实现评分值高的项目得到优先推荐,同时能挖掘出隐性的项目关联信息,有效提高了算法准确度。
图2为基于WNBI和RSVD混合协同推荐算法的原理图,RSVD_WNBI模型首先利用WNBI算法来获取近邻项目的信息,然后将近邻信息设计成正则化因子的形式来约束矩阵分解的目标函数,并且认为目标项目与其对应的近邻项目之间具有一定的相似性,可以间接整合这种相似度的传递并减少目标项目与近邻项目在特征向量上的距离,从而提高推荐的准确度。
WNBI算法:
用户-项目评分矩阵采用图论中的二分图(Bipartite Graph)来表示,假设G=(V,E)表示一个无向图,其中V表示所有节点的集合,所有节点之间的边用集合E表示。节点集合V可以划分成互不相交的两个非空子集(U,I)分别表示用户和项目,并且图中的每条边(i,j)所关联的两个节点i和j分属于这两个互不相交的集合,可以通过邻接矩阵Am×n来表示,αij=1表示用户i对项目j进行了评分,否则为0。Zhou等人引入了物理学中物质扩散的原理,通过分析二分图的结构,利用物质扩散的方法来计算用户或项目之间的相似性,最后可得出推荐给用户的项目。
基于WNBI的推荐算法的四个大致步骤:
(a)建立二分图。如果推荐***包含m个用户和n个项目,那么二分图有m+n个节点,二分图边的权重为用户对项目的评分。
(b)如果用户x对项目a,c和d进行了评分,对项目b没有评分,则αxa=1,αxb=0,αxc=1及αxd=1。那么图3(a)对应的邻接矩阵如下:
A = 1 0 0 1 1 1 1 0 0 1 0 1 - - - ( 1 )
(c)资源-分配过程分两个阶段,首先由项目到用户(图3(b)),然后再回到项目(图3(c))。图3(a)是一个二分图,左边3个圆形节点构成一个用户集合,右边四个方形节点构成项目集合。节点的资源根据它的“出度”(即从该节点出发的边)而被稀释,如项目a被用户x和z评过分,那么每个用户从项目a中获取1/2的资源(节点初始资源值为1)。可根据公式(2)计算f(yl),它表示用户1通过步骤(c)计算得到的项目对用户资源分配关系,其中f(xi)初始值为1,αil邻接矩阵A中用户i与项目l之间存在边。
f ( y l ) = Σ i = 1 n α i l × f ( x i ) k ( x i ) - - - ( 2 )
(d)资源从用户集合再流回项目集合,遵循与(c)一致的原则。这样就得到了原集合最终的资源分配,整个分配过程是通过两个集合之间的共同连接关系所实现的资源再分配,包含了整个网络的拓扑结构信息。设资源分配矩阵为W,项目i到项目j的资源分配权重wij可以表示为公式(3):
w i j = 1 k ( item j ) Σ l = 1 m α l i α l j h ( r l i ) h ( r l j ) k ( user l ) - - - ( 3 )
h ( r u i ) = r u i - r ‾ i δ i
其中表示用户l的度;表示项目j的度。rli为用户l对项目i的评分,h(rui)对用户评分进行z-score归一化处理。
RSVD_WNBI模型将近邻项目的信息设计成正则化因子的形式来约束矩阵分解的目标函数,并且认为目标项目与其对应的近邻项目之间具有一定的相似性,而正则化因子可以间接整合这种相似度的传递并减少目标项目与近邻项目在特征向量上的距离。推荐算法中最重要的衡量标准就是要使预测误差达到最小化,我们通过对下面的目标函数最小化来得到模型的参数:
L = min q * , p * Σ ( u , i ) ∈ κ ( r u i - p u T q i ) 2 + α 2 Σ f ∈ S ( i ) | | q i - q f | | 2 + λ 2 | | q i | | F 2 + λ 2 | | p u | | F 2 - - - ( 4 )
其中pu为用户特征向量,qi为项目特征向量,λ是一个防止过拟合的参数,可以通过交叉验证选取并且采用随机梯度下降法来优化这个损失函数,参数α决定了在RSVD模型中融合近邻项目信息的程度,S(i)是项目i的近邻项目集。
然后为了最小化上式,采用基于梯度下降法对公式4的pu、qi求导,可以得到:
∂ L ∂ p u = - ( 2 e u i q i - λp u ) - - - ( 5 )
∂ L ∂ q i = - ( 2 e u i p u - α 2 Σ f ∈ S ( i ) ( v i - v f ) + α 2 Σ f ∈ S ( i ) ( v f - v i ) - λq i ) - - - ( 6 )
其中得到变化梯度后,为了获得最优的矩阵P和Q,需对其pu、qi进行迭代更新,更新规则分别为:
pu←pu+γ(euiqi-λpu) (7)
q i ← q i + γ ( e u i p u - α 2 Σ f ∈ S ( i ) ( v i - v f ) + α 2 Σ f ∈ S ( i ) ( v f - v i ) - λq i ) - - - ( 8 )
其中γ为学习率,与实际应用的数据集相关。
综上,RSVD_WNBI算法如下:
实验验证:
1、实验环境
运行环境:4核,Intel Core 3.2GHz处理器,4G内存,Windows***
2、数据集的选择
为验证本章提出算法的有效性,及考虑与其它算法的公平比较,选择了三个现实生活的数据集MovieLens1M,Yahoo!Music和EachMovie。
(1)MovieLens1M数据集:该数据集共有3952位用户对6040部电影的100万条评分数据(评分值为1-5的整数),该数据集的评分矩阵稀疏性为0.9538。
(2)Yahoo!Music数据集:该音乐数据集包含了2002年到2006年15,400位用户对1000首单曲的365,704条评分数据(评分值为1-5的整数),该数据集的评分矩阵稀疏性为0.9538,该数据集的评分矩阵稀疏性为0.9763。
(3)EachMovie数据集:该数据集共有74,424位用户对1648部电影的2,811,718条评分数据(评分值为0-5的整数),该数据集的评分矩阵稀疏性为0.977。
本文采用10折交叉验证方案,将MovieLens1M数据集随机划分为10个不相交子数据集。为了评估稀疏数据对算法的影响,我们使用不同比例的测试集(90%、80%和70%),70%/30%的训练/测试集是从10个子数据集中随机抽取7个作为训练集,其余3个数据集作为测试集。70%/30%的测试数据可分为10组,被测试算法在每组中重复执行10次,以10次测试结果的均值作为实验的整体结果。
3、方法选择
选择最先进的基于推断和基于检索的填补方法
(1)基于近邻的方法(k-NearestNeighborCollaborative filtering):
基于用户的近邻协同推荐User-based KNN(UCF):在评分矩阵上采用皮尔逊相关系数来计算用户之间的相似度,然后根据相似度来找目标用户的近邻用户集合,最后再根据k个最邻近用户对未知项目i的评分来预测用户u对i的评分值。(k等于150)
基于项目的近邻协同推荐Item-based KNN(ICF):该算法与基于用户的协同推荐类似,从项目角度出发,计算项目之间的相似性,寻找目标项目的近邻集合。(k等于150)
WNBI:在NBI算法基础上,将用户对项目的评分作为边权,根据计算资源分配权重来预测对目标项目的评分。
(2)基于模型的方法(Model-based):
规范化奇异值分解RSVD:规范化矩阵分解把用户-项目评分矩阵分解为两个矩阵P和Q乘积的形式。
概率矩阵分解PMF[18](Probabilistic Matrix Factorization):在RSVD基础上增加了概率分布,假设用户和项目的隐性特征向量服从高斯先验分布。
基于社会化规则的推荐SRi+(Social Regularization with similar iteminformation):在规则化的矩阵分解模型中融入通过UCF获得的相似项目信息。
4、准确性比较
为了衡量RSVD-WNBI模型在项目预测方面的有效性,需要统计项目评分预测的偏差。本文采用平均绝对误差(MAE)和均方根误差(RMSE)作为评价标准。
5、性能
为了验证本文算法的准确度,分别在3个数据集上,将RSVD_WNBI模型与6种常用推荐算法进行性能比较,主要是2个方面:(1)准确率,(2)不同用户组的评分预测效果。该6种算法分别为User-based KNN、Item-based KNN、WNBI、RSVD、PMF和SRi+。KNN和CDCF的近邻值取150,RSVD、PMF和SRi+的特征向量数f取10,独立地重复10次计算,这10次计算的平均值作为最后MAE和RMSE的实验结果,如表1所示:
表1 RSVD_WNBI与其它算法的结果对比
表2 T-test检验
*Significance at 95%.
表1和表2分别为RSVD_WNBI方法与已有的6种推荐方法在Movielens1M、Yahoo!Music和EachMovie的准确性比较。表1显示了在三个不同稀疏度的数据集及三种不同测试比例的实验测试中,无论是MAE还RMSE,RSVD_WNBI算法要比其它6种算法具有更高的预测准确度。
例如在80%训练集,RSVD_WNBI算法相对于UCF、ICF、WNBI、RSVD、PMF和SRi+算法在MAE值上分别提高了8.079%,6.744%,15.84%,1.56%,1.18%和1.48%,同时在RMSE值上分别提高了10.27%,9.43%,22.02%,1.38%,1.68%和1.05%。其次,随着训练集的增大,RSVD_WNBI算法的MAE和RMSE值也随之稳定下降。
为了验证实验结果的统计显著性,实验在显著性水平0.05上对交叉验证的10次结果进行了T检验(T-test),结果如表2所示。
从2个表显示的结果发现,与其它6种算法相比较,本专利提出的基于RSVD和WNBI的混合协同推荐算法(RSVD_WNBI)的预测准确性要高于其它6种算法,这说明通过引入从WNBI中获取的近邻项目信息来优化RSVD模型,有助于提高推荐算法的准确性及缓解数据稀疏性问题。
为了深入分析方法性能,将RSVD和RSVD_WNBI算法在不同评分数量的用户组上进行预测测试。根据用户在训练集中评分的数量进行划分,Movielens1M数据集可以分为7类:(0,20)、[20,40)、[40,80)、[80,160)、[160,320)、[320,800)和>=800,(0,20)代表评分数量在0到20次之间的用户组,例如评分数量为38次的用户被划分在[20,40)的用户组中。3个数据集的测试集用户组分布情况如表3、4、5所示。
表3 Movielens1M用户分组
表4 Yahoo!Music用户分组
表5 EachMovie用户分组
在Movielens1M、Yahoo!Music和EachMovie数据集上对不同用户组进行预测准确度的测试,为了让测试更为直观,采用不含额外信息的RSVD模型作为对比方法,结果如图4所示。从图可以看到,虽然使用不同数据集进行测试,但在所有用户组的测试中,RSVD_WNBI算法所得到的RMSE值都要比RSVD算法的值低。即使在用户评分较少的情况下(评分数量少于20的用户组),训练集为70%,特征量f为10时,RSVD_WNBI算法在3个数据集上的预测准确度比RSVD算法分别提高了6.36%,6.02%和1.86%。
通过实验分析,基于RSVD和WNBI的混合协同推荐算法RSVD_WNBI,在不同数据集的测试下,预测准确性均高于其余6种方法,这表明WNBI算法则以二分图的视角理解数据,利用物质扩散的方法寻找已有记录的用户或项目之间的关系,弥补了降维带来信息损失的影响。无论在用户评分量少或足够评分量的情况下,RSVD_WNBI算法均能有效地提高推荐的效果并且有效缓解了数据稀疏性问题。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (4)

1.一种基于WNBI和RSVD混合协同推荐算法,其特征在于,首先通过WNBI算法将用户和项目抽象成网络中的节点,利用隐藏在网络中的信息,挖掘项目之间更深层的潜在信息,寻找与项目相似的近邻集合,其次,利用RSVD模型将用户-项目评分矩阵分解成为用户特征矩阵和项目特征矩阵,通过降维提高了数据密度,最后利用项目的近邻信息来规则化RSVD模型,以改进传统方法的不足。
2.根据权利要求1所述的基于WNBI和RSVD混合协同推荐算法,其特征在于,所述的WNBI算法包括以下步骤:
S1,建立二分图,如果推荐***包含m个用户和n个项目,那么二分图有m+n个节点,二分图边的权重为用户对项目的评分;
S2,根据用户对项目是否进行评分构建对应的邻接矩阵A;
S3,资源-分配过程分两个阶段,首先由项目到用户,然后再回到项目,可根据公式计算f(y1),
f ( y l ) = Σ i = 1 n α i l × f ( x i ) k ( x i )
它表示用户1通过2个阶段计算最终得到的项目对用户资源分配关系,其中f(xi)初始值为1,αil邻接矩阵A中用户i与项目1之间存在边;S4,资源从用户集合再流回项目集合,这样就得到了原集合最终的资源分配,整个分配过程是通过两个集合之间的共同连接关系所实现的资源再分配,包含了整个网络的拓扑结构信息,设资源分配矩阵为W,项目i到项目j的资源分配权重wij可以表示为如下公式:
w i j = 1 k ( item j ) Σ l = 1 m α l i α l j h ( r l i ) h ( r l j ) k ( user l )
h ( r u i ) = r u i - r i ‾ δ i
其中表示用户1的度;表示项目j的度,rli为用户1对项目i的评分,h(rui)对用户评分进行z-score归一化处理。
3.根据权利要求1所述的基于WNBI和RSVD混合协同推荐算法,其特征在于,方法包括以下步骤:
S1,获取训练集DT数据及由WNBI算法所获得的用户近邻集S,特征变量f;
S2,初始化用户特征向量pu和项目特征向量qi
S3,在RSVD模型中融合由WNBI算法所获得的近邻项目信息,通过随机梯度下降法使预测误差达到最小化,并预测误差是否小于阈值;
S4,当预测误差小于阈值时,输出用户特征向量pu和项目特征向量qi;当预测误差不小于阈值时,跳转到S3。
4.根据权利要求3所述的基于WNBI和RSVD混合协同推荐算法,其特征在于,所述的S3中的预测误差达到最小化可通过最小化下面的函数求得:
L = min q * , p * Σ ( u , i ) ∈ κ ( r u i - p u T q i ) 2 + α 2 Σ f ∈ S ( i ) | | q i - q f | | 2 + λ 2 | | q i | | F 2 + λ 2 | | p u | | F 2
其中pu为用户特征向量,qi为项目特征向量,λ是一个防止过拟合的参数,可以通过交叉验证选取并且采用随机梯度下降法来优化这个损失函数,参数α决定了在RSVD模型中融合近邻项目信息的程度,S(i)是项目i的近邻项目集。
CN201610656489.7A 2016-08-11 2016-08-11 基于wnbi和rsvd混合协同推荐算法 Pending CN106326367A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610656489.7A CN106326367A (zh) 2016-08-11 2016-08-11 基于wnbi和rsvd混合协同推荐算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610656489.7A CN106326367A (zh) 2016-08-11 2016-08-11 基于wnbi和rsvd混合协同推荐算法

Publications (1)

Publication Number Publication Date
CN106326367A true CN106326367A (zh) 2017-01-11

Family

ID=57739906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610656489.7A Pending CN106326367A (zh) 2016-08-11 2016-08-11 基于wnbi和rsvd混合协同推荐算法

Country Status (1)

Country Link
CN (1) CN106326367A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107330115A (zh) * 2017-07-12 2017-11-07 广东工业大学 一种信息推荐方法及装置
CN108268900A (zh) * 2018-01-23 2018-07-10 北京工业大学 一种提升推荐***多样性的方法
CN108595533A (zh) * 2018-04-02 2018-09-28 深圳大学 一种基于协同过滤的物品推荐方法、存储介质及服务器
CN108805642A (zh) * 2017-05-02 2018-11-13 合信息技术(北京)有限公司 推荐方法及装置
CN108874998A (zh) * 2018-06-14 2018-11-23 华东师范大学 一种基于混合特征向量表示的对话式音乐推荐方法
CN109190045A (zh) * 2018-09-15 2019-01-11 新乡学院 一种基于二部图最近邻的个性化推荐方法
CN109784395A (zh) * 2019-01-07 2019-05-21 西安交通大学 一种针对不均衡数据的算法推荐方法
CN110033127A (zh) * 2019-03-14 2019-07-19 中国人民解放军国防科技大学 一种基于嵌入式特征选择的冷启动项目推荐方法
CN110032677A (zh) * 2019-03-05 2019-07-19 四川大学 一种基于深度神经网络和概率矩阵分解的混合推荐算法
CN110264364A (zh) * 2019-04-30 2019-09-20 电子科技大学 一种投资方的推荐方法
CN110908980A (zh) * 2018-08-28 2020-03-24 北京京东金融科技控股有限公司 用户标识映射关系建立方法、***、设备及存储介质
CN111274406A (zh) * 2020-03-02 2020-06-12 湘潭大学 一种基于深度学习混合模型的文本分类方法
CN112948238A (zh) * 2021-02-01 2021-06-11 成都信息工程大学 推荐***的多样性的量化方法
CN113906775A (zh) * 2019-05-01 2022-01-07 诺基亚技术有限公司 包括从数据库故障中恢复的优化用户设备能力信令
CN114095176A (zh) * 2021-10-29 2022-02-25 北京天融信网络安全技术有限公司 一种恶意域名检测方法及装置
CN114417138A (zh) * 2021-12-27 2022-04-29 海信集团控股股份有限公司 一种健康信息推荐方法和设备
US11869015B1 (en) 2022-12-09 2024-01-09 Northern Trust Corporation Computing technologies for benchmarking

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108805642A (zh) * 2017-05-02 2018-11-13 合信息技术(北京)有限公司 推荐方法及装置
CN107330115B (zh) * 2017-07-12 2020-04-28 广东工业大学 一种信息推荐方法及装置
CN107330115A (zh) * 2017-07-12 2017-11-07 广东工业大学 一种信息推荐方法及装置
CN108268900A (zh) * 2018-01-23 2018-07-10 北京工业大学 一种提升推荐***多样性的方法
CN108268900B (zh) * 2018-01-23 2022-05-10 北京工业大学 一种提升推荐***多样性的方法
CN108595533A (zh) * 2018-04-02 2018-09-28 深圳大学 一种基于协同过滤的物品推荐方法、存储介质及服务器
CN108595533B (zh) * 2018-04-02 2021-09-14 深圳大学 一种基于协同过滤的物品推荐方法、存储介质及服务器
CN108874998A (zh) * 2018-06-14 2018-11-23 华东师范大学 一种基于混合特征向量表示的对话式音乐推荐方法
CN108874998B (zh) * 2018-06-14 2021-10-19 华东师范大学 一种基于混合特征向量表示的对话式音乐推荐方法
CN110908980B (zh) * 2018-08-28 2024-04-12 京东科技控股股份有限公司 用户标识映射关系建立方法、***、设备及存储介质
CN110908980A (zh) * 2018-08-28 2020-03-24 北京京东金融科技控股有限公司 用户标识映射关系建立方法、***、设备及存储介质
CN109190045B (zh) * 2018-09-15 2021-08-31 新乡学院 一种基于二部图最近邻的个性化推荐方法
CN109190045A (zh) * 2018-09-15 2019-01-11 新乡学院 一种基于二部图最近邻的个性化推荐方法
CN109784395A (zh) * 2019-01-07 2019-05-21 西安交通大学 一种针对不均衡数据的算法推荐方法
CN110032677A (zh) * 2019-03-05 2019-07-19 四川大学 一种基于深度神经网络和概率矩阵分解的混合推荐算法
CN110033127A (zh) * 2019-03-14 2019-07-19 中国人民解放军国防科技大学 一种基于嵌入式特征选择的冷启动项目推荐方法
CN110033127B (zh) * 2019-03-14 2021-03-26 中国人民解放军国防科技大学 一种基于嵌入式特征选择的冷启动项目推荐方法
CN110264364B (zh) * 2019-04-30 2022-08-23 电子科技大学 一种投资方的推荐方法
CN110264364A (zh) * 2019-04-30 2019-09-20 电子科技大学 一种投资方的推荐方法
CN113906775A (zh) * 2019-05-01 2022-01-07 诺基亚技术有限公司 包括从数据库故障中恢复的优化用户设备能力信令
CN111274406A (zh) * 2020-03-02 2020-06-12 湘潭大学 一种基于深度学习混合模型的文本分类方法
CN112948238A (zh) * 2021-02-01 2021-06-11 成都信息工程大学 推荐***的多样性的量化方法
CN112948238B (zh) * 2021-02-01 2023-05-02 成都信息工程大学 推荐***的多样性的量化方法
CN114095176A (zh) * 2021-10-29 2022-02-25 北京天融信网络安全技术有限公司 一种恶意域名检测方法及装置
CN114095176B (zh) * 2021-10-29 2024-04-09 北京天融信网络安全技术有限公司 一种恶意域名检测方法及装置
CN114417138A (zh) * 2021-12-27 2022-04-29 海信集团控股股份有限公司 一种健康信息推荐方法和设备
CN114417138B (zh) * 2021-12-27 2024-04-02 海信集团控股股份有限公司 一种健康信息推荐方法和设备
US11869015B1 (en) 2022-12-09 2024-01-09 Northern Trust Corporation Computing technologies for benchmarking

Similar Documents

Publication Publication Date Title
CN106326367A (zh) 基于wnbi和rsvd混合协同推荐算法
CN112529168B (zh) 一种基于gcn的属性多层网络表示学习方法
Bothorel et al. Clustering attributed graphs: models, measures and methods
Yang et al. Diverse message passing for attribute with heterophily
Moosavi et al. Community detection in social networks using user frequent pattern mining
Li et al. An overlapping network community partition algorithm based on semi-supervised matrix factorization and random walk
Bortner et al. Progressive clustering of networks using structure-connected order of traversal
CN105868334A (zh) 一种基于特征递增型的电影个性化推荐方法及***
CN105512242A (zh) 一种基于社会网络结构的并行推荐方法
Avrachenkov et al. Network partitioning algorithms as cooperative games
König et al. From assortative to dissortative networks: the role of capacity constraints
Malhotra et al. A modified label propagation algorithm for community detection in attributed networks
Miyauchi et al. Threshold influence model for allocating advertising budgets
Lee et al. Multiscale analysis of time series of graphs
Xu et al. Latent interest and topic mining on user-item bipartite networks
CN108984551A (zh) 一种基于多类别联合软聚类的推荐方法及***
Wu et al. Similarity measure models and algorithms for hierarchical cases
Dridi et al. Exploiting context-awareness and multi-criteria decision making to improve items recommendation using a tripartite graph-based model
Anahideh et al. Local explanations of global rankings: insights for competitive rankings
Katsimpras et al. Class-aware tensor factorization for multi-relational classification
Bourhim et al. Towards a Novel Graph-based collaborative filtering approach for recommendation systems
Wang et al. Random partition factorization machines for context-aware recommendations
CN116226508A (zh) 一种基于Louvain算法的内容推荐方法
Jabbar et al. Analyzing restricted boltzmann machine neural network for building recommender systems
Argentini Ranking aggregation based on belief function theory

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Li Jianguo

Inventor after: Chen Jiemin

Inventor after: Tang Yong

Inventor after: Xiao Jing

Inventor before: Li Jianguo

Inventor before: Chen Jie

Inventor before: Tang Yong

Inventor before: Xiao Jing

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170111