CN104899763A - 基于二分网络双向扩散的个性化推荐方法 - Google Patents

基于二分网络双向扩散的个性化推荐方法 Download PDF

Info

Publication number
CN104899763A
CN104899763A CN201510230210.4A CN201510230210A CN104899763A CN 104899763 A CN104899763 A CN 104899763A CN 201510230210 A CN201510230210 A CN 201510230210A CN 104899763 A CN104899763 A CN 104899763A
Authority
CN
China
Prior art keywords
user
article
node
resource
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510230210.4A
Other languages
English (en)
Inventor
马文萍
焦李成
冯翔
马晶晶
侯彪
王爽
其他发明人请求不公开姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201510230210.4A priority Critical patent/CN104899763A/zh
Publication of CN104899763A publication Critical patent/CN104899763A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于二分网络双向扩散的个性化推荐方法,针对Top-N的个性化推荐,主要解决了推荐列表的准确性,多样性及新颖度几个主要算法性能指标的冲突。其实现步骤为:(1)构建用户-物品关联的二分图网络。假设每个目标用户节点都有某种可分的资源,可以按预定分配机制分配给其它节点对象;(2)建立物品-物品及用户-用户的二阶关联矩阵;(3)完成双向扩散过程,得到用户-物品的兴趣矩阵;(4)给出每个用户的长度为N的推荐列表,完成Top-N的推荐。本发明基于网络传播的思想,效果明显好于经典的协同过滤方法,更好的实现了个性化推荐***所关注的长尾挖掘,可用于解决个性化推荐的Top-N问题。

Description

基于二分网络双向扩散的个性化推荐方法
技术领域
本发明属于推荐***领域,将网络传播的方法和目前备受关注的个性化推荐***相结合,具体是一种基于二分网络初始资源双向扩散的个性化推荐方法,可用于解决个性化Top-N的推荐。
背景技术
随着信息技术的快速发展,互联网时代的到来,人们的生活也发生了深刻而巨大的变化。网络生活成为必不可少的部分,诸如网上商城,在线影院,网络书店等等,为人们的生活带来了极大的便利,但与此同时,信息过载让人有些应接不暇,疲于在庞杂的信息当中苦苦寻找对自己有用的信息,例如,Amazon的数百万本图书,Netflix的上十万部电影,豆瓣、淘宝的形形色色商品更是不计其数,在这样规模的数量中找自己感兴趣的,无疑是个灾难。在这个大数据到来的时代,有效而又高效的推荐***研究已经迫在眉睫。此外,除了电子商务领域,推荐***也被广泛应用在各行各业,像新闻推荐,旅游推荐,社交朋友推荐,甚至论文评审推荐,招标项目推荐等等。
传统的推荐方案只是给所有的用户提供近乎一模一样的推荐列表,且大多是司空见惯的流行度很大的商品,无法根据用户个人身份、年龄和兴趣的差异来进行有目的针对性的推荐,事实证明,在信息***的时代,这样的推荐是十分低效的,不仅不能为商家获得很好的销售业绩提供帮助,反而使得用户极其反感。由此,所谓个性化推荐应运而生,即充分利用商家所掌握的巨大的用户历史数据,在此基础上进行分析过滤,深度挖掘个人的需求和兴趣趋向,想用户所想,为不同的用户制定不同的推荐列表,用户通过自己的行为可以改变推荐结果。
优秀的个性化推荐***为用户快速找到自己需要的合适信息提供了极大的方便,同时让商家在众多的竞争者中脱颖而出,获得更大的点击量和销售额,据VentureBeat统计,Amazon的个性推荐为其提高35%的销售业绩。个性化推荐***在很多商业网站上已经获得成功的应用,其中具有代表性的有Amzaon的电子商务推荐,Netflix和Movielens电影推荐,Youtube和Hulu的视频推荐,Lastfm的音乐推荐,***的新闻推荐,Wanderfly的旅游推荐,Facebook和Twitter的社交好友推荐以及国内的豆瓣电台,天猫商城,当当网,优酷视频,人人网等等。Netflix还曾开出100万美元的巨奖来征集能够把他们网站上的推荐结果提高10%的方法。
自20世纪90年代以来,已经陆续有一些优秀的推荐***方法被提出来,可以分为以下几类:协同过滤***;基于内容的推荐***;混合的推荐***;基于社交网络的推荐***。其中主要的思想都是根据用户或者物品的相似性来进行的推荐,通过牺牲推荐列表的这样相同的物品有很大概率被推荐给众多不同的用户,以至于推荐列表很大的相似性,所推荐的大部分物品又是流行商品。
商品销售往往是具有“马太效应”的,即多的越多,少的越少,这就导致物品流行度的分布成长尾式,处于流行度大的物品种类逐渐递减,数量上占大多数的不流行物品就被称作长尾商品。理想的个性化推荐***应该关注的不仅仅是推荐结果的正确性,同样重要的还有其长尾挖掘的能力,即把不太惹人注目的商品恰到好处的推荐给需要的人群。如果一个推荐***通过推荐大量相似度很大的列表给用户,从而保证其正确率,显然是不符合个性化需求的,用户也会很反感商家为什么给自己推荐这么多相似的东西,而那些不怎么“招人喜欢”的商品则看起来很能保证销量。为了衡量这种冲突,用推荐结果的准确性,多样性和新颖度来综合评价一个算法的好坏才是合理的。
正是由于传统算法糟糕的多样性和新颖度指标,基于网络结构的推荐方法近些年兴起,基于网络的算法不考虑用户和产品的内容特征,仅仅把其用户和物品看作抽象节点,通过节点间信息的相互传递来确定用户节点对所有物品的联系,所有算法所利用的信息都藏在用户和物品的选择关系之中。一种基于二分网络的推荐的混合算法(HPH)在“Solving the apparent diversity-accuracy dilemma ofrecommender systems”(Proceedings of the National Academy of Sciences of theUSA-PNAS 107(10);4511-4515,2010)中被Zhou等提出,这种方法尝试将两种特色鲜明的二分图推荐算法混合,通过调节两者重要性的因子找到长尾挖掘和推荐准确性的折中方案。实验证明,恰到好处的为用户推荐一些不流行的长尾商品能够得到比一味推荐流行度较大的方案更高的准确率,与此同时,推荐结果的多样性和新颖度指标也会达到不错的效果。针对这种方法,有不少文献在其后给出一些改进的方案来进一步优化推荐的结果。
另一种基于二分网络的推荐方法由Liu等在“information filtering via biasedheat conduction”(Physical review E 84,037101,2011)中提出,这是一种在基于二分网络的热传导算法基础上改进的方法(BHC)。基于二分网络的热传导算法(Heats)是模拟初始资源分配的过程提出的推荐算法,该算法由于对流行的物品的影响进行了较大程度的抑制,导致推荐结果过多的呈现出长尾物品,从而有很好的新颖度和糟糕的准确性,这意味着推荐结果不能很好预测用户的需求,纵使良好的商品覆盖率,它并不能直接作为推荐结果给用户。Liu在这个方法基础上通过调节流行物品影响因子来使原来的算法以牺牲部分新颖度获得较好的准确性和多样性,设置合理的参数后,推荐结果有不错的效果。
本发明是在借鉴先前研究成果的基础上,对基于二分网络的热传导算法进行了完善改进,在调节推荐结果的流行性分布过程中,对推荐***三个重要指标都有了显著的提高。该发明能够为用户提供了体验更好的推荐结果。
发明内容
本发明的目的在于针对Heats方法推荐结果糟糕的准确率,提出一种基于二分网络双向扩散的方法,在准确性、多样性和新颖度之间找到折中方案,以获得更好的推荐结果,同时改善推荐***中的冷启动问题,实现Top-N的推荐,即为每个用户提供一份含有N个商品的推荐列表。为了方便叙述,这里假设本方法应用于电子购物网站,为用户推荐有可能感兴趣的商品。
本发明的技术方案是:将用户-物品之间的历史记录构造为简单二分网络,通过用户节点和物品节点间的连线来表示该用户是否对该物品发生过购买行为。因为推荐算法的根本目的是预测用户对未购买的物品的兴趣程度,在二分网络结构中,我们通过初始资源的重新配置来估计目标用户对未购买物品的兴趣程度,类似于三步的随机游走的过程,假设每个节点都有某种可分的资源,可以按一定比例分配给自己喜欢的其它节点对象,通过相连节点资源的不断扩散,达到重新分配,从而建立没有直接联系节点间的关系。
(1)构造用户-物品的二进制矩阵A,只考虑购买关系,诸如购买次数、购买时间、物品标签等等其它信息不纳入考虑范围。如果一个物品j曾经被用户i购买过,则aij=1;否则aij=0。并由此建立用户-物品的二分网络,假设物品数量为n,用户数量为m;
(2)计算物品间二阶关联性:
设初始状态下的二分网络的所有物品节点和用户节点所包含资源数量均为0:
2a)从物品节点集合O中选择某一物品节点为初始激活的物品节点,并拥有1个单位的资源,其它所有物品和用户节点未激活,资源数量为0;
2b)1个单位资源从初始激活的物品节点向与它相连的用户节点扩散,用户节点接受的资源数量等于与它相连物品节点所拥有资源总量的平均数;
2c)到达用户节点的资源再返回所有物品节点,物品节点接受的资源数量等于与它相连用户节点所拥有资源总量的平均数;
通过某一初始激活物品节点→用户节点→物品节点的扩散过程,这样原先资源数量为0的物品节点得到一定数量资源,得到资源数量越多的物品节点,视为与初始激活的物品节点越相似;依次选择不同的初始激活的物品节点,重复上面过程直到遍历完所有物品节点集合O,即可得到物品-物品的二阶关联矩阵;
(3)计算用户间二阶关联性:
设二分网络处于初始状态,初始状态下的二分网络的所有物品和用户节点所包含的资源数量均为0:
3a)从用户节点集合U中选择某一用户节点为初始激活的用户节点,并拥有1个单位的资源,其它节点未激活,资源数量为0;
3b)1个单位的资源从初始激活的用户节点向与它相连的物品节点扩散,物品节点接受的资源数量等于与它相连用户节点所拥有资源总量的平均数;
3c)到达物品节点的资源再返回所有用户节点,用户节点接受的资源数量等于与它相连物品节点所拥有资源总量的平均数;
通过某一初始激活用户节点→物品节点→用户节点的扩散过程,这样原先资源数量为0的用户节点得到一定数量资源,得到资源数量越多的用户节点,视为与初始激活的用户节点越相似;依次选择不同的初始激活的用户节点,重复上面过程直到遍历完所有用户节点集合U,即可得到用户-用户的二阶关联矩阵;
(4)完成资源双向扩散过程:
设二分网络处于初始状态,所有节点资源数量为0:
4a)正向资源扩散过程:
对于某一目标用户节点ut,设与其相连接的物品节点均为初始激活状态,并各自拥有一个单位数量资源,其它节点未激活,资源量为0;然后基于步骤(2)计算得到的物品之间的关联性,将这些初始激活物品节点的资源按比例配给所有物品节点;
4b)逆向资源扩散过程:
选择某一物品节点ot,经过正向扩散后,该物品节点得到数量为r的资源;设与ot相连接的所有用户节点被激活,并各自拥有数量为rλ的等量资源,λ是调优参数;然后基于步骤(3)计算得到的用户之间的关联性,将所有激活的用户节点所拥有的资源按比例分配给所有用户节点;用户节点ut得到的从物品节点ot反馈回的资源数量表征用户ut对物品ot的感兴趣的程度;
4c)依次选取集合O中其它物品节点,完成4b)的过程,直到遍历完所有物品节点,得到用户ut对所有物品的感兴趣的程度列表;
4d)依次选取集合U中其它用户节点,完成4a)~4c)的过程,直到遍历完所有用户节点,得到所有用户对所有物品的感兴趣程度,用m×n的矩阵M记录下来;
(5)给出对应于每个用户的长度为N的物品推荐列表:N的大小依据实际需要确定,表示为每个用户提供N个推荐物品,为每个用户推荐N个没有购买过的兴趣值排行靠前的物品;
本发明与现有技术相比具有如下优点:
第一,准确性提高。在仅利用用户-物品购买与否的历史纪录情况下,不考虑进一步的二阶冗杂信息剔除,本发明得到的推荐***具有更高的推荐准确率,在预测用户需求方面更加准确。
第二,多样性和新颖度提高,较好的长尾商品挖掘能力。本发明在不损失准确率,甚至有所提高的前提下,使得推荐结果有更好的多样性和新颖度,可以更高效将数量上占绝大多数的不流行物品恰到好处的推荐给有需求的人群,改善了用户对推荐商品列表的体验。
第三,改善了推荐***中的冷启动问题,在本算法过程中不仅用到物品-物品之间的关联,还囊括了用户-用户的关联信息,这样新物品一旦被某个用户购买,会迅速推广给其他用户,同时新用户一旦购买了某件物品,也可以迅速为其提供合适的推荐列表。
附图说明
图1为本发明的流程示意图;
图2为本发明用于MovieLens和Netflix的调节参数λ选择;
图3为本发明在10000×6000的Netflix数据集上得到推荐结果分布图;
图4为本发明与现有的基于二分网络推荐***方法的性能比较。
具体实施方式
将本发明的流程思想通过矩阵运算,避免复杂的迭代过程,得到比较清晰明了的具体实施方法。本发明的实现步骤如下:
步骤1,根据用户的历史行为记录来构建用户-物品的二分网络,用户的历史行为记录包括用户购买物品的记录或者用户对物品的评价记录:
设用户节点U={u1,u2,...,um},m为用户的数目,物品节点O={o1,o2,...,on},n为物品的数目,Re记录用户和物品之间的交互关系,只考虑用户是否购买或评价过物品的二元关系;
构建用户-物品的二分网络的图模型,其中用户节点与用户节点之间无连接,物品节点与物品节点之间也没有连接,只在发生过交互关系的用户节点与物品节点之间建立连接,即在Re中有记录的<U,O>。用二元矩阵Am×n=(aij)m×n来存储该二分网络中的连接信息,其中
a ij = 1 , < u i , o j > &Element; Re 0 , < u i , o j > &NotElement; Re
<ui,oj>表示第i个用户节点与第j个物品;aij是二元矩阵Am×n第i行第j列的元素;
步骤2,建立物品-物品及用户-用户的二阶关联矩阵:
2a)计算物品-物品间的二阶关联矩阵:
W &alpha;&beta; H = 1 k ( o &alpha; ) &Sigma; l = 1 m a l&alpha; a l&beta; k ( u l )
其中表示物品节点oα的出度,即流行度;表示用户节点ul的出度,即用户活跃度;a,a对应矩阵Am×n中的元素;m表示用户的数量,用来衡量物品oα和oβ的关联程度;通过计算n个物品任意两个之间的关联程度,可得到n×n维的物品关联矩阵WH
2b)计算用户-用户二阶关联矩阵:
W pq TH = 1 k ( u p ) &Sigma; &alpha; = 1 n &alpha; p&alpha; a q&alpha; k ( o &alpha; )
其中表示用户节点up的出度,即用户活跃度;表示物品节点oα的出度,即流行度;a,a对应矩阵Am×n中的元素;n表示物品的数量;用来衡量用户up和uq的关联程度;通过计m个用户任意两个之间的关联程度,可得到m×m维的物品关联矩阵WTH
步骤3,完成双向扩散过程:
3a)完成正向扩散过程:
R=Am×n×(WH)T
矩阵R为m×n维的矩阵,记录经过资源重新分配后物品节点从用户节点得到的资源数量;
3b)完成逆向扩散过程:
M=R·(WTH×Am×n)λ
矩阵M为m×n维的矩阵,记录逆向扩散后,用户节点从物品节点拿回的资源数量。某一物品节点ot反馈回给某一用户节点ut的资源数量越多,表明物品ot和用户ut关联性越强,即用户ut越有可能对物品ot感兴趣。
λ是为了调整正向过程和逆向过程的比重来优化推荐结果的性能指标而引进的参数,λ∈[0,1],λ的大小取决于矩阵Am×n的稀疏程度,可以通过在用户的历史行为记录的数据上测试来选择其最佳的值;
步骤4,给出每个用户的长度为N的推荐列表:
4a)将最终的用户-物品兴趣度矩阵M每行按从大到小排列,即按兴趣程度的大小,为每个用户都整理出他的兴趣表;
4b)为每个用户推荐N个没有购买过的兴趣值排行靠前的物品。
本发明的效果可以通过以下仿真进一步说明:
1.仿真条件
本实例在Intel(R)Core(TM)2Duo CPU 2.33GHz Windows 7(x64)***下,Matlab2012a运行平台上,完成本发明与现有Heats,HNBI,HPH,BHC推荐算法的仿真实验。
2.仿真实验内容
为了验证本发明的实际效果,实验中选择两个推荐***中著名的数据集做测试,并同几个现有经典的基于二分网络的推荐方法做了对比。实验数据集一是MovieLens数据(http://www.grouplens.org/),由1682个部电影和943个用户组成。数据集二是Netflix数据(http://www.netflixprize.com/),本实验数据随机抽取了其中10000个用户和6000部电影的记录。这两个数据集都是1到5的评分稀疏矩阵,本发明关注的是Top-N的推荐问题,所以本实验将数据集中评分不小于3的评分项视为用户喜欢,设为1;评分小于3的评分项视为用户不喜欢这部电影,设为0,我们为用户提供他可能喜欢的推荐电影列表。这样变为了二进制的数据集,原本很稀疏的数据将更加稀疏,Movielens的用户喜欢的历史记录有82520条,稀疏度为5.20·10-2;Netflix的用户喜欢的历史记录有642604条,稀疏度为1.07·10-2。实验中将数据集随机拆成90%的训练集和10%的测试集,采取五次随机交叉验证实验,实验结果推荐列表长度为50(N=50),也就是为每个用户推荐50个商品。
用来评价一个推荐***好坏的指标是其准确性,多样性和新颖度。准确性用准确率和召回率表示,多样性和新颖度有很多的衡量方法。本实验采取下面的方法。
准确率(Precision)衡量推荐列表预测出用户的下一步的购买行为的成功率,其中m是用户数量,N是推荐列表中包含物品数量;di(N)表示用户i的推荐列表中预测正确的商品个数(和测试集对照);m表示用户的数量。
Precision = &Sigma; i = 1 m d i ( N ) N
召回率(Recall)衡量推荐列表成功预测出的商品数量在用户下一步购买物品数量中的比例,其中T表示测试集中的记录为1的数量,即用户下一步购买的商品数量;m表示用户的数量。
Recall = &Sigma; i = 1 m d i ( N ) T
多样性(Diversity)衡量推荐列表中物品的多样性,高效的个性化推荐***会尽量提供广泛的选择。其中qij表示为用户i和用户j推荐的相同物品数量;Hij衡量用户i,j推荐表单的差异度;m表示用户的数量。
H ij = 1 - q ij N
Diversity = 1 m ( m - 1 ) &Sigma; i &NotEqual; j H ij
新颖度(Novelty)衡量推荐列表中物品的不流行度,高效的个性化推荐***会尽量推荐一些不常见的物品给用户,也称作用户的惊喜度。其中k表示为用户i所推荐物品α的流行度;m表示用户的数量。
Novelty = mean ( mean ( log 2 ( m k i&alpha; ) ) )
图2(a)是在MovieLens数据集上优化λ的过程,可已看出,当λ取0.2时,推荐***的准确性达到最好,但对应的多样性和新颖度却不是最高,说明推荐***的几个指标是存在一些冲突关系的。由于实验旨在测试本发明在准确性不降低的前提下,多样性和新颖度方面的表现,因此将λ=0.2作为***的最佳值。
图2(b)是在Netflix数据集上优化λ的过程,同理,将λ=0.2作为***的最佳值,λ的值和MovieLens数据集上测试集上相同,这是因为两个数据集稀疏度都是在10-2级,而λ的值是与数据的稀疏程度相关的。
图3(a)画出了商品长尾分布的特性,流行的商品数量占极少数,大部分商品属于不流行的,且随着流行度的增加,商品数量递减。流行的商品用户很容易从各种渠道了解,而不流行的则很难为大众所知,因此个性化推荐的一个重要目标就是把处于长尾的不流行的商品挖掘出来推荐给合适的用户。
图3(b)给出基于物品间关联性做推荐的结果分布图,也就是Heats方法的结果。从图中很容易看出,这样推荐策略更加侧重推荐不流行的商品,结果的新颖度会很好,但是准确率就很难保证了。糟糕准确率的一个推荐算法根本不能作为实际应用。由于正向过程是基于物品的关联程度扩散的,所以这个过程对新用户的推荐有优势。
图3(c)给出反向扩散结束后,根据矩阵TR做出的推荐物品分布图,与正向过程相反,它更多推荐了比较流行的物品,相对而言准确性会好一些,但新颖度和多样性比较差。由于反向过程是基于用户的关联程度扩散的,所以这个过程的对新物品的推荐有优势。
图3(d)给出基于用户间关联性做推荐的结果分布图,可以看出这个算法是找一个平衡点,但并不是性能的妥协。实验结果证明,融合后的推荐结果准确率比单个过程都要好,且多样性和新颖度也非常不错,这是因为融合的过程不仅仅是找到流行物品和不流行物品的平衡,同时将物品之间、用户之间的信息都囊括在内。然而,如果将传统KNN协同过滤也做这样的融合却达不到这样的效果,基于物品和基于用户的KNN推荐算法关注的都是准确率而非新颖度,融合后性能只会介于单个算法之间。这也是基于网络的推荐算法的根本优势,它能够将已有的信息通过网络扩散,使不流行的物品也散播给尽可能多的用户,而基于邻域思想的协同过滤方法将初始信息资源约束在小范围内传播。
图4给出了本方法和现有性能出色的基于二分网络的推荐算法之间的比较,本方法表示为HBT,与PNAS上提出的经典的HPH方法比较,在MovieLens上准确性提高了2.4%,多样性提升4.0%,新颖度也有6.1%的提高;在Netflix数据集上测试,准确性有6.0%的提高,多样性和新颖性指标分别提升了6.8%,3.1%。实验结果充分说明了本发明用于个性化推荐***的出色性能。
总之,本发明在基于二分网络搭建的推荐***方法,将用户和物品分别看做网络中的两列抽象节点,利用网络传播扩散的原理,通过正反向的信息扩散及融合过程,找到准确性、多样性和新颖性之间的契合点,同时将物品间和用户间的关联信息充分利用,最终得到一个性能较已有方法更好的推荐***。总之,本发明表现出很好的长尾商品挖掘能力,可以应用于Top-N的推荐。

Claims (5)

1.一种基于二分网络双向扩散的个性化推荐方法,所述方法包括下列步骤:
(1)根据用户的历史行为记录来构建用户-物品的二分网络,用户的历史行为记录包括用户购买物品的记录或者用户对物品的评价记录:
设用户节点集合U={u1,u2,...,um},m为用户的数目,物品节点集合O={o1,o2,...,on},n为物品的数目,Re记录用户和物品之间的交互关系,该交互关系与用户的历史行为记录对应,只考虑用户是否购买或评价过物品的二元关系。
构建用户-物品的二分网络的图模型,其中用户节点与用户节点之间无连接,物品节点与物品节点之间也没有连接,只在发生过交互关系的用户节点与物品节点之间建立连接;如果用户节点与物品节点发生过交互关系,则在Re中生成记录<U,O>;用二元矩阵Am×n=(aij)m×n来表示该二分网络中的连接信息,其中
a ij = 1 , < u i , o j > &Element; Re 0 , < u i , o j > &NotElement; Re
<ui,oj>表示第i个用户节点与第j个物品;aij是二元矩阵Am×n第i行第j列的元素;
(2)计算物品间二阶关联性:
假设二分网络的所有节点均可以储藏一定量的资源,初始状态下的所有网络节点所含资源数量均为0:
2a)从物品节点集合O中选择某一物品节点为初始激活的物品节点,并拥有1个单位的资源,其它节点未激活,资源数量为0;
2b)单位资源从初始激活的物品节点向与它相连的用户节点扩散,用户节点接受的资源数量等于它相连物品节点所拥有总量的平均数;
2c)到达用户节点的资源再返回所有物品节点,物品节点接受的资源数量等于它相连用户节点所拥有总量的平均数;
通过某一初始激活物品节点→用户节点→物品节点的扩散过程,这样原先资源数量为0的物品节点得到一定数量资源,得到资源数量越多的物品节点,视为与初始激活的物品节点越相似。依次选择不同的初始激活的物品节点,重复上面过程直到遍历完所有物品节点集合O,即可得到物品-物品的二阶关联矩阵;
(3)计算用户间二阶关联性:
设二分网络处于初始状态,所有节点资源数量均为0:
3a)从用户节点集合U中选择某一用户节点为初始激活的用户节点,并拥有1个单位的资源,其它节点未激活,资源数量为0;
3b)1个单位的资源从初始激活的用户节点向与它相连的物品节点扩散,物品节点接受的资源数量等于与它相连用户节点所拥有总量的平均数;
3c)到达物品节点的资源再返回所有用户节点,用户节点接受的资源数量等于它相连物品节点所拥有总量的平均数;
通过某一初始激活用户节点→物品节点→用户节点的扩散过程,这样原先资源数量为0的用户节点得到一定数量资源,得到资源数量越多的用户节点,视为与初始激活的用户节点越相似。依次选择不同的初始激活的用户节点,重复上面过程直到遍历完所有用户节点集合U,即可得到用户-用户的二阶关联矩阵;
(4)完成资源双向扩散过程:
设二分网络处于初始状态,所有节点资源数量为0:
4a)正向资源扩散过程:
对于某一目标用户节点ut,设与其相连接的物品节点均为初始激活状态,并拥有一个单位数量资源,其它节点未激活,资源量为0;然后基于步骤(2)计算得到的物品之间的关联性,将这些初始激活物品节点的资源按比例配给所有物品节点;
4b)逆向资源扩散过程:
选择某一物品节点ot,经过正向扩散后,该物品节点得到数量为r的资源;设与ot相连接的用户节点被激活,并各自拥有数量为rλ的资源,λ是调优参数;然后基于步骤(3)计算得到的用户之间的关联性,将所有激活的用户节点所拥有的资源按比例分配给所有用户节点;用户节点ut得到从物品节点ot反馈回的资源数量,用来表征用户ut对物品ot的感兴趣的程度;
4c)依次选取集合O中其它物品节点,完成4b)的过程,直到遍历完所有物品节点,得到用户ut对所有物品的感兴趣的程度列表;
4d)依次选取集合U中其它用户节点,完成4a)~4c)的过程,直到遍历完所有用户节点,得到所有用户对所有物品的感兴趣程度,用m×n的矩阵M记录下来;
(5)给出对应于每个用户的长度为N的物品推荐列表:N的大小依据实际需要确定,表示为每个用户提供N个推荐物品;
5a)将最终的用户-物品兴趣度矩阵M每行按从大到小排列,即按兴趣程度的大小,为每个用户都整理出他的兴趣表;
5b)为每个用户推荐N个没有购买过的兴趣值排行靠前的物品。
2.根据权利要求1所述的基于二分网络双向扩散的推荐方法,其中步骤(1)所述的二分网络是根据用户购买行为来确定的,二分网络只关心抽象节点间有无连接关系,是个没有权值的网络,很多现有用户历史数据集以1-5评分给出的,这时将大于2的评分项视为喜欢,即有连接;不大于2的评分项视为无连接。将现有处理过的用户历史行为数据随机分割为90%的训练集和用于测试***性能的10%的测试集。
3.根据权利要求1所述的基于二分网络双向扩散的推荐方法,其中,在步骤(2)、(3)中分别采用如下的方法建立物品-物品及用户-用户的二阶关联矩阵:
(1)计算物品-物品间的二阶关联矩阵:
w &alpha;&beta; H = 1 k ( o &alpha; ) &Sigma; l = 1 m a l&alpha; a l&beta; k ( u l )
其中表示物品节点oα的出度,即流行度;表示用户节点ul的出度,即用户活跃度;a,a对应矩阵Am×n中的元素;m表示用户的数量,用来衡量物品oα和oβ的关联程度;通过计算n个物品任意两个之间的关联程度,可得到n×n维的物品关联矩阵WH
(2)计算用户-用户二阶关联矩阵:
W pq TH = 1 k ( u p ) &Sigma; &alpha; = 1 n a p&alpha; a q&alpha; k ( o &alpha; )
其中表示用户节点up的出度,即用户活跃度;表示物品节点oα的出度,即流行度;a,a对应矩阵Am×n中的元素;n表示物品的数量;用来衡量用户up和uq的关联程度;通过计m个用户任意两个之间的关联程度,可得到m×m维的物品关联矩阵WTH
4.根据权利要求1所述的基于二分网络双向扩散的推荐方法,其中,步骤(4)采用如下的方法建立:
(1)完成正向扩散过程:
R=Am×n×(WH)T
矩阵R为m×n维的矩阵,记录经过资源重新分配后物品节点从用户节点得到的资源数量;
(2)完成逆向扩散过程:
M=R·(WTH×Am×n)λ
矩阵M为m×n维的矩阵,记录逆向扩散后,用户节点从物品节点拿回的资源数量。某一物品节点ot反馈回给某一用户节点ut的资源数量越多,表明物品ot和用户ut关联性越强,即用户ut越有可能对物品ot感兴趣。
λ是为了调整正向过程和逆向过程的比重来优化推荐结果的性能指标而引进的参数,λ∈[0,1],λ的大小取决于矩阵Am×n的稀疏程度,可以通过在用户的历史行为记录的数据上测试来选择其最佳的值。
5.根据权利要求1所述的基于二分网络双向扩散的推荐方法,其中所述的调优参数λ取值是根据推荐方法的各方面的性能折中选择的,衡量个性化推荐***的性能指标用以下方法确定:
准确率(Precision)衡量推荐列表预测出用户的下一步的购买行为的成功率,其中m是用户数量,N是推荐列表中包含物品数量;di(N)表示用户i的推荐列表中预测正确的商品个数(和测试集对照);m表示用户的数量。
Precision = &Sigma; i = 1 m d i ( N ) N
召回率(Recall)衡量推荐列表成功预测出的商品数量在用户下一步购买物品数量中的比例,其中T表示测试集中的记录为1的数量,即用户下一步购买的商品数量;m表示用户的数量。
Recall = &Sigma; i = 1 m d i ( N ) T
多样性(Diversity)衡量推荐列表中物品的多样性,高效的个性化推荐***会尽量提供广泛的选择。其中qij表示为用户i和用户j推荐的相同物品数量;Hij衡量用户i,j推荐表单的差异度;m表示用户的数量。
H ij = 1 - q ij N
Diversity = 1 m ( m - 1 ) &Sigma; i &NotEqual; j H ij
新颖度(Novelty)衡量推荐列表中物品的不流行度,高效的个性化推荐***会尽量推荐一些不常见的物品给用户,也称作用户的惊喜度。其中k表示为用户i所推荐物品α的流行度;m表示用户的数量。
Novelty = mean ( mean ( log 2 ( m k i&alpha; ) ) )
CN201510230210.4A 2015-05-07 2015-05-07 基于二分网络双向扩散的个性化推荐方法 Pending CN104899763A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510230210.4A CN104899763A (zh) 2015-05-07 2015-05-07 基于二分网络双向扩散的个性化推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510230210.4A CN104899763A (zh) 2015-05-07 2015-05-07 基于二分网络双向扩散的个性化推荐方法

Publications (1)

Publication Number Publication Date
CN104899763A true CN104899763A (zh) 2015-09-09

Family

ID=54032412

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510230210.4A Pending CN104899763A (zh) 2015-05-07 2015-05-07 基于二分网络双向扩散的个性化推荐方法

Country Status (1)

Country Link
CN (1) CN104899763A (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447087A (zh) * 2015-11-06 2016-03-30 腾讯科技(深圳)有限公司 一种视频推荐方法及装置
CN105894330A (zh) * 2016-04-01 2016-08-24 西安电子科技大学 基于物品相似度和二分网络的物品推荐方法
CN106021379A (zh) * 2016-05-12 2016-10-12 深圳大学 一种基于用户偏好的个性化推荐方法及其***
CN106709780A (zh) * 2016-11-14 2017-05-24 北京邮电大学 一种物品推荐方法及装置
CN106875258A (zh) * 2017-02-15 2017-06-20 北京邮电大学 一种物品推荐方法及装置
CN107123032A (zh) * 2017-05-02 2017-09-01 北京邮电大学 一种物品推荐方法及装置
WO2017193323A1 (zh) * 2016-05-12 2017-11-16 深圳大学 一种基于用户偏好的个性化推荐方法及其***
CN108182268A (zh) * 2018-01-16 2018-06-19 浙江工商大学 一种基于社会网络的协同过滤推荐方法及***
CN108205776A (zh) * 2016-12-16 2018-06-26 财团法人工业技术研究院 用户喜好的预测方法
CN108712663A (zh) * 2018-05-03 2018-10-26 武汉斗鱼网络科技有限公司 基于二分图的直播间推荐方法、相关存储介质和设备
CN109118379A (zh) * 2017-06-22 2019-01-01 腾讯科技(深圳)有限公司 基于社交网络的推荐方法和装置
CN109471978A (zh) * 2018-11-22 2019-03-15 腾讯科技(深圳)有限公司 一种电子资源推荐方法及装置
CN109711653A (zh) * 2017-10-26 2019-05-03 厦门一品威客网络科技股份有限公司 基于威客-任务-标签三方图的威客任务推荐方法
CN109726297A (zh) * 2018-12-28 2019-05-07 沈阳航空航天大学 一种基于互斥策略的二分网络节点预测算法
CN109783725A (zh) * 2018-12-15 2019-05-21 华南理工大学 一种融入用户好奇心机制的推荐方法
CN109886788A (zh) * 2019-02-26 2019-06-14 湖南大学 一种基于弱连接的惊喜度推荐方法
CN109919723A (zh) * 2019-03-01 2019-06-21 西安电子科技大学 一种基于用户和物品的个性化推荐方法
CN110264364A (zh) * 2019-04-30 2019-09-20 电子科技大学 一种投资方的推荐方法
CN110781398A (zh) * 2019-10-30 2020-02-11 四川华跃融智信息技术有限公司 一种增强冗余消除的基于网络推理的个性化推荐方法
CN110956511A (zh) * 2019-12-30 2020-04-03 深圳前海微众银行股份有限公司 商品推荐方法、装置、设备与计算机可读存储介质
CN111079005A (zh) * 2019-12-06 2020-04-28 成都理工大学 一种基于物品时间流行性的推荐方法
CN111127139A (zh) * 2019-12-06 2020-05-08 成都理工大学 一种基于ProbS与HeatS计算模式改进的混合推荐算法
CN112131480A (zh) * 2020-09-30 2020-12-25 中国海洋大学 基于多层异质属性网络表征学习的个性化商品推荐方法及***
CN112380453A (zh) * 2021-01-15 2021-02-19 腾讯科技(深圳)有限公司 物品推荐方法、装置、存储介质及设备
CN112380417A (zh) * 2020-12-01 2021-02-19 厦门市美亚柏科信息股份有限公司 一种基于标签与图的网页推荐方法、终端设备及存储介质
CN113127750A (zh) * 2021-05-19 2021-07-16 同盾科技有限公司 信息列表生成方法及装置、存储介质、电子设备
CN116150504A (zh) * 2023-04-17 2023-05-23 特斯联科技集团有限公司 处理长尾分布的推荐方法、装置及计算机存储介质、终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102750647A (zh) * 2012-06-29 2012-10-24 南京大学 一种基于交易网络的商家推荐方法
CN102789462A (zh) * 2011-05-18 2012-11-21 阿里巴巴集团控股有限公司 一种项目推荐方法及***
CN103309972A (zh) * 2013-06-08 2013-09-18 清华大学 基于链路预测的推荐方法和***
CN104346476A (zh) * 2014-11-20 2015-02-11 西安电子科技大学 基于物品相似度和网络结构的个性化物品推荐方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102789462A (zh) * 2011-05-18 2012-11-21 阿里巴巴集团控股有限公司 一种项目推荐方法及***
CN102750647A (zh) * 2012-06-29 2012-10-24 南京大学 一种基于交易网络的商家推荐方法
CN103309972A (zh) * 2013-06-08 2013-09-18 清华大学 基于链路预测的推荐方法和***
CN104346476A (zh) * 2014-11-20 2015-02-11 西安电子科技大学 基于物品相似度和网络结构的个性化物品推荐方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAO ZHOU 等: ""Bipartite network projection and personal recommendation"", 《PHYSICAL REVIEW E (STATISTICAL, NONLINEAR, AND SOFT MATTER PHYSICS) 》 *

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105447087A (zh) * 2015-11-06 2016-03-30 腾讯科技(深圳)有限公司 一种视频推荐方法及装置
CN105894330A (zh) * 2016-04-01 2016-08-24 西安电子科技大学 基于物品相似度和二分网络的物品推荐方法
WO2017193323A1 (zh) * 2016-05-12 2017-11-16 深圳大学 一种基于用户偏好的个性化推荐方法及其***
CN106021379A (zh) * 2016-05-12 2016-10-12 深圳大学 一种基于用户偏好的个性化推荐方法及其***
CN106021379B (zh) * 2016-05-12 2017-08-25 深圳大学 一种基于用户偏好的个性化推荐方法及其***
CN106709780A (zh) * 2016-11-14 2017-05-24 北京邮电大学 一种物品推荐方法及装置
CN108205776A (zh) * 2016-12-16 2018-06-26 财团法人工业技术研究院 用户喜好的预测方法
CN106875258A (zh) * 2017-02-15 2017-06-20 北京邮电大学 一种物品推荐方法及装置
CN106875258B (zh) * 2017-02-15 2021-01-08 北京邮电大学 一种物品推荐方法及装置
CN107123032A (zh) * 2017-05-02 2017-09-01 北京邮电大学 一种物品推荐方法及装置
CN107123032B (zh) * 2017-05-02 2020-11-13 北京邮电大学 一种物品推荐方法及装置
CN109118379B (zh) * 2017-06-22 2023-03-21 腾讯科技(深圳)有限公司 基于社交网络的推荐方法和装置
CN109118379A (zh) * 2017-06-22 2019-01-01 腾讯科技(深圳)有限公司 基于社交网络的推荐方法和装置
CN109711653B (zh) * 2017-10-26 2020-12-15 厦门一品威客网络科技股份有限公司 基于威客-任务-标签三方图的威客任务推荐方法
CN109711653A (zh) * 2017-10-26 2019-05-03 厦门一品威客网络科技股份有限公司 基于威客-任务-标签三方图的威客任务推荐方法
CN108182268B (zh) * 2018-01-16 2021-01-08 浙江工商大学 一种基于社会网络的协同过滤推荐方法及***
CN108182268A (zh) * 2018-01-16 2018-06-19 浙江工商大学 一种基于社会网络的协同过滤推荐方法及***
CN108712663A (zh) * 2018-05-03 2018-10-26 武汉斗鱼网络科技有限公司 基于二分图的直播间推荐方法、相关存储介质和设备
CN108712663B (zh) * 2018-05-03 2021-02-02 武汉斗鱼网络科技有限公司 基于二分图的直播间推荐方法、相关存储介质和设备
CN109471978B (zh) * 2018-11-22 2022-01-28 腾讯科技(深圳)有限公司 一种电子资源推荐方法及装置
CN109471978A (zh) * 2018-11-22 2019-03-15 腾讯科技(深圳)有限公司 一种电子资源推荐方法及装置
CN109783725B (zh) * 2018-12-15 2021-07-20 华南理工大学 一种融入用户好奇心机制的推荐方法
CN109783725A (zh) * 2018-12-15 2019-05-21 华南理工大学 一种融入用户好奇心机制的推荐方法
CN109726297A (zh) * 2018-12-28 2019-05-07 沈阳航空航天大学 一种基于互斥策略的二分网络节点预测算法
CN109726297B (zh) * 2018-12-28 2022-12-23 沈阳航空航天大学 一种基于互斥策略的二分网络节点预测算法
CN109886788A (zh) * 2019-02-26 2019-06-14 湖南大学 一种基于弱连接的惊喜度推荐方法
CN109919723A (zh) * 2019-03-01 2019-06-21 西安电子科技大学 一种基于用户和物品的个性化推荐方法
CN109919723B (zh) * 2019-03-01 2023-05-23 西安电子科技大学 一种基于用户和物品的个性化推荐方法
CN110264364A (zh) * 2019-04-30 2019-09-20 电子科技大学 一种投资方的推荐方法
CN110264364B (zh) * 2019-04-30 2022-08-23 电子科技大学 一种投资方的推荐方法
CN110781398A (zh) * 2019-10-30 2020-02-11 四川华跃融智信息技术有限公司 一种增强冗余消除的基于网络推理的个性化推荐方法
CN111127139B (zh) * 2019-12-06 2023-06-27 成都理工大学 一种基于ProbS与HeatS计算模式改进的混合推荐算法
CN111079005A (zh) * 2019-12-06 2020-04-28 成都理工大学 一种基于物品时间流行性的推荐方法
CN111079005B (zh) * 2019-12-06 2023-05-02 成都理工大学 一种基于物品时间流行性的推荐方法
CN111127139A (zh) * 2019-12-06 2020-05-08 成都理工大学 一种基于ProbS与HeatS计算模式改进的混合推荐算法
CN110956511A (zh) * 2019-12-30 2020-04-03 深圳前海微众银行股份有限公司 商品推荐方法、装置、设备与计算机可读存储介质
CN112131480B (zh) * 2020-09-30 2022-06-10 中国海洋大学 基于多层异质属性网络表征学习的个性化商品推荐方法及***
CN112131480A (zh) * 2020-09-30 2020-12-25 中国海洋大学 基于多层异质属性网络表征学习的个性化商品推荐方法及***
CN112380417A (zh) * 2020-12-01 2021-02-19 厦门市美亚柏科信息股份有限公司 一种基于标签与图的网页推荐方法、终端设备及存储介质
CN112380453A (zh) * 2021-01-15 2021-02-19 腾讯科技(深圳)有限公司 物品推荐方法、装置、存储介质及设备
CN112380453B (zh) * 2021-01-15 2021-06-11 腾讯科技(深圳)有限公司 物品推荐方法、装置、存储介质及设备
CN113127750A (zh) * 2021-05-19 2021-07-16 同盾科技有限公司 信息列表生成方法及装置、存储介质、电子设备
CN113127750B (zh) * 2021-05-19 2024-04-02 同盾科技有限公司 信息列表生成方法及装置、存储介质、电子设备
CN116150504A (zh) * 2023-04-17 2023-05-23 特斯联科技集团有限公司 处理长尾分布的推荐方法、装置及计算机存储介质、终端

Similar Documents

Publication Publication Date Title
CN104899763A (zh) 基于二分网络双向扩散的个性化推荐方法
CN102789462B (zh) 一种项目推荐方法及***
US8655949B2 (en) Correlated information recommendation
US10423999B1 (en) Performing personalized category-based product sorting
US9483580B2 (en) Estimation of closeness of topics based on graph analytics
CN102340514B (zh) 网络信息推送方法及***
Dickey et al. An overview of digital media and advertising
US20100268661A1 (en) Recommendation Systems
CN107358468A (zh) 广告管理方法和存储介质
CN103886487A (zh) 基于分布式的b2b平台的个性化推荐方法与***
CN105809475A (zh) “互联网+旅游”环境下支持o2o应用的商品推荐方法
CN102063433A (zh) 相关项推荐方法和装置
CN103345698A (zh) 电子商务环境下基于云计算处理模式的个性化推荐方法
CN103678518A (zh) 一种推荐列表调整方法和装置
Nie et al. Information filtering via balanced diffusion on bipartite networks
CN111026977B (zh) 信息推荐方法、装置及存储介质
CN107292648A (zh) 一种用户行为分析方法及装置
Liang et al. Collaborative filtering based on information-theoretic co-clustering
Sun et al. Leveraging friend and group information to improve social recommender system
US20240177194A1 (en) Real time bidding engine with radius insights
Shafik et al. Recommendation system comparative analysis: internet of things aided networks
CN106156113A (zh) 一种视频推荐的方法、***及电子设备
CN109075987A (zh) 优化数字组件分析***
Sziklai et al. Finding early adopters of innovation in social networks
Tian et al. Recommendation algorithm for mobile E-commerce based on cone depth learning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
AD01 Patent right deemed abandoned

Effective date of abandoning: 20190215