CN101753573B - 一种基于协同过滤的rss信息推荐方法 - Google Patents

一种基于协同过滤的rss信息推荐方法 Download PDF

Info

Publication number
CN101753573B
CN101753573B CN2009102564578A CN200910256457A CN101753573B CN 101753573 B CN101753573 B CN 101753573B CN 2009102564578 A CN2009102564578 A CN 2009102564578A CN 200910256457 A CN200910256457 A CN 200910256457A CN 101753573 B CN101753573 B CN 101753573B
Authority
CN
China
Prior art keywords
module
user
recommendation
rss
article
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009102564578A
Other languages
English (en)
Other versions
CN101753573A (zh
Inventor
袁东风
王恒
颜廷芝
徐超
林贺
陈飞
魏斌
石祚夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN2009102564578A priority Critical patent/CN101753573B/zh
Publication of CN101753573A publication Critical patent/CN101753573A/zh
Application granted granted Critical
Publication of CN101753573B publication Critical patent/CN101753573B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种基于协同过滤的RSS信息推荐方法,属信息推荐技术领域,***由阅读模块、订阅模块、订阅管理模块、行为记录模块、行为处理模块和推荐模块组成,其中阅读模块分别和订阅模块、订阅管理模块、行为记录模块及推荐模块相连接;行为处理模块分别和行为记录模块及推荐模块相连接;订阅模块和订阅管理模块相互连接,模块之间通过由编程实现的控制语句,共享一个或多个服务器数据库的数据。本发明使其推荐效果不仅限于整个RSS信息源的推荐,更加突出了单篇文章的推荐,有效避免了信息冗余和过载;推荐效果有一定的差异覆盖面,便于用户发现可能感兴趣的新内容;引入了同好用户群,并利用同好用户加权因子,使推荐内容更加精准可信。

Description

一种基于协同过滤的RSS信息推荐方法
所属技术领域
本发明涉及一种信息推荐方法,具体涉及一种基于协同过滤的RSS信息推荐方法。
背景技术
目前互联网中的RSS信息推荐方法,只能推荐整条信息源,不能针对单篇文章进行个性化推荐。例如:谷歌阅读器,抓虾网、鲜果网等的在线RSS阅读器均不能完成同好用户的单篇文章个性化推荐。如专利号为200510022721.3、发明名称为《一种基于XML文件的RSS信息交互处理方法》的专利即属于此列。
这样会导致使用者得到的推荐文章泛滥,不能得到精准的使用者喜好的单篇文章。
发明内容
本发明解决的技术问题是:提供一种既能荐整条信息源,又能针对同好用户的单篇文章进行个性化推荐。
本发明基于以下假设:有相同或类似订阅习惯的用户,其相互推荐的信息更具价值;最相似的同好用户推荐的信息比次相似同好用户的推荐更具价值。通过分析用户的习惯,找到每个用户的同好用户群,以及该用户群的订阅集。通过加权每个同好用户的收藏文章,以推荐该用户最有可能喜欢的文章,从而达到个性化的推荐效果。
为达到上述目标,本发明采用如下的技术方案:
一种基于协同过滤的RSS信息推荐方法,步骤如下:
1)用户从大量RSS源集中订阅某些RSS源时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该RSS信息源在***中的唯一标识r,形成用户对RSS源的订阅情况Wu,r,更新至行为处理模块的用户-RSS源订阅矩阵W(m,n)之中,m为***中的用户数目,n为RSS源的数目,订阅情况Wu,r的值当订阅时为1,未订阅时为0;
2)行为处理模块从用户-RSS源订阅矩阵W(m,n)中获取订阅情况Wu,r,利用余弦相关性算法计算两用户之间的相似度sim(ip,iq),其中ip,iq分别为p、q两名用户;并将相似度更新至用户相似度方阵sim(m,m)中,余弦相关算法的公式为:
sim ( i p , i q ) = cos ( i p , i q ) = Σ k = 1 n W p , k × W q , k Σ k = 1 n ( W p , k ) 2 × Σ k = 1 n ( W q , k ) 2
3)行为处理模块根据用户相似度方阵sim(m,m)推算出与每个用户有相似订阅习惯的“同好”用户,并将该用户所有“同好”用户订阅的所有RSS源形成同好用户订阅集,再按相似度由高到低排列,形成对该用户的推荐加权系数f;
4)用户从一个RSS源的文章列表中收藏某篇文章时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该篇文章在***中的唯一标识rt,形成用户对文章的收藏情况Cu,rt,更新至行为处理模块的同好收藏矩阵C(a,b)之中,a为某用户的同好用户数目,b为同好用户订阅集中所有文章的数目;
5)行为处理模块针对同好收藏矩阵C(a,b)中单篇文章的所有同好用户行为,做推荐加权处理,按推荐优先级形成推荐文章集,并将推荐文章集更新至推荐模块;
6)在用户获取文章推荐时,推荐模块实时地从推荐文章集筛选出目标用户可能会感兴趣的TopN条内容推荐给用户。
上述RSS是在线共享内容的一种简易方式(也称聚合内容,Really SimpleSyndication)。通常在时效性比较强的内容上使用RSS订阅能更快速获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新。
上述RSS源是一种描述和同步网站内容的格式,是目前使用最广泛的XML应用。发布一个RSS文件后,这个RSS Feed中包含的信息就能直接被其他站点调用,而且由于这些数据都是标准的XML格式,所以也能在其他的终端和服务中使用。
上述余弦相关性算法为信息推荐领域内公知的通用算法。
一种用于上述方法的RSS阅读***,由阅读模块、订阅模块、订阅管理模块、行为记录模块、行为处理模块和推荐模块组成,其特征在于阅读模块分别和订阅模块、订阅管理模块、行为记录模块及推荐模块相连接;行为处理模块分别和行为记录模块及推荐模块相连接;订阅模块和订阅管理模块相互连接,模块之间通过由编程实现的控制语句,共享一个或多个服务器数据库的数据。
本发明有以下有益效果:
1.相比起传统的RSS推荐方法,本发明使其推荐效果不仅仅局限于整个RSS信息源的推荐,更加突出了信息源中单篇文章的推荐,有效避免了信息冗余和过载;
2.相比起传统的基于用户的信息推荐技术,本发明结合了基于项的推荐方式,使其推荐效果有一定的差异覆盖面,便于用户发现可能感兴趣的新内容;
3.相比传统的基于项的信息推荐技术,本发明引入了同好用户群,并利用同好用户加权因子,使推荐内容更加精准可信。
附图说明
图1是本发明阅读***的结构示意图。
其中:1、阅读模块,2、订阅模块,3、订阅管理模块,4、行为记录模块,5、推荐模块,6、行为处理模块。
图2是本发明方法的流程图,其中7-12为其中的各个步骤。
具体实施方式
下面结合附图和实施例对本发明做进一步说明,但不限于此。
实施例1:
一种基于协同过滤的RSS信息推荐方法,如图2所示,步骤如下:
7、用户从大量RSS源集中订阅某些RSS源时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该RSS信息源在***中的唯一标识r,形成用户对RSS源的订阅情况Wu,r,更新至行为处理模块的用户-RSS源订阅矩阵W(m,n)之中,m为***中的用户数目,n为RSS源的数目,订阅情况Wu,r的值当订阅时为1,未订阅时为0;
8、行为处理模块从用户-RSS源订阅矩阵W(m,n)中获取订阅情况Wu,r,利用余弦相关性算法计算两用户之间的相似度sim(ip,iq),其中ip,iq分别为p、q两名用户;并将相似度更新至用户相似度方阵sim(m,m)中,余弦相关算法的公式为:
sim ( i p , i q ) = cos ( i p , i q ) = Σ k = 1 n W p , k × W q , k Σ k = 1 n ( W p , k ) 2 × Σ k = 1 n ( W q , k ) 2
9、行为处理模块根据用户相似度方阵sim(m,m)推算出与每个用户有相似订阅习惯的“同好”用户,并将该用户所有“同好”用户订阅的所有RSS源形成同好用户订阅集,再按相似度由高到低排列,形成对该用户的推荐加权系数f;
10、用户从一个RSS源的文章列表中收藏某篇文章时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该篇文章在***中的唯一标识rt,形成用户对文章的收藏情况Cu,rt,更新至行为处理模块的同好收藏矩阵C(a,b)之中,a为某用户的同好用户数目,b为同好用户订阅集中所有文章的数目;
11、行为处理模块针对同好收藏矩阵C(a,b)中单篇文章的所有同好用户行为,做推荐加权处理,按推荐优先级形成推荐文章集,并将推荐文章集更新至推荐模块;
12、在用户获取文章推荐时,推荐模块实时地从推荐文章集筛选出目标用户可能会感兴趣的TopN条内容推荐给用户。
实施例2:
一种用于上述方法的RSS阅读***,如图1所示,由阅读模块1、订阅模块2、订阅管理模块3、行为记录模块4、行为处理模块6和推荐模块5组成,其特征在于阅读模块1分别和订阅模块2、订阅管理模块3、行为记录模块4及推荐模块5相连接;行为处理模块6分别和行为记录模块4及推荐模块5相连接;订阅模块2和订阅管理模块3相互连接,模块之间通过由编程实现的控制语句,共享一个或多个服务器数据库的数据。

Claims (2)

1.一种基于协同过滤的RSS信息推荐方法,步骤如下:
1)用户从大量RSS源集中订阅某些RSS源时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该RSS信息源在***中的唯一标识r,形成用户对RSS源的订阅情况Wu,r,更新至行为处理模块的用户-RSS源订阅矩阵W(m,n)之中,m为***中的用户数目,n为RSS源的数目,订阅情况Wu,r的值当订阅时为1,未订阅时为0;
2)行为处理模块从用户-RSS源订阅矩阵W(m,n)中获取订阅情况Wu,r,利用余弦相关性算法计算两用户之间的相似度sim(ip,iq),其中ip,iq分别为p、q两名用户;并将相似度更新至用户相似度方阵sim(m,m)中,余弦相关算法的公式为:
sim ( i p , i q ) = cos ( i p , i q ) = Σ k = 1 n W p , k × W q , k Σ k = 1 n ( W p , k ) 2 × Σ k = 1 n ( W q , k ) 2 ;
3)行为处理模块根据用户相似度方阵sim(m,m)推算出与每个用户有相似订阅习惯的“同好”用户,并将该用户所有“同好”用户订阅的所有RSS源形成同好用户订阅集,再按相似度由高到低排列,形成对该用户的推荐加权系数f;
4)用户从一个RSS源的文章列表中收藏某篇文章时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该篇文章在***中的唯一标识rt,形成用户对文章的收藏情况Cu,rt,更新至行为处理模块的同好收藏矩阵C(a,b)之中,a为某用户的同好用户数目,b为同好用户订阅集中所有文章的数目;
5)行为处理模块针对同好收藏矩阵C(a,b)中单篇文章的所有同好用户行为,做推荐加权处理,按推荐优先级形成推荐文章集,并将推荐文章集更新至推荐模块;
6)在用户获取文章推荐时,推荐模块实时地从推荐文章集筛选出目标用户可能会感兴趣的TopN条内容推荐给用户。
2.一种用于权利要求1所述方法的RSS阅读***,由阅读模块、订阅模块、订阅管理模块、行为记录模块、行为处理模块和推荐模块组成,其特征在于阅读模块分别和订阅模块、订阅管理模块、行为记录模块及推荐模块相连接;行为处理模块分别和行为记录模块及推荐模块相连接;订阅模块和订阅管理模块相互连接,模块之间通过由编程实现的控制语句,共享一个或多个服务器数据库的数据。
CN2009102564578A 2009-12-25 2009-12-25 一种基于协同过滤的rss信息推荐方法 Expired - Fee Related CN101753573B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009102564578A CN101753573B (zh) 2009-12-25 2009-12-25 一种基于协同过滤的rss信息推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009102564578A CN101753573B (zh) 2009-12-25 2009-12-25 一种基于协同过滤的rss信息推荐方法

Publications (2)

Publication Number Publication Date
CN101753573A CN101753573A (zh) 2010-06-23
CN101753573B true CN101753573B (zh) 2012-05-23

Family

ID=42479973

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009102564578A Expired - Fee Related CN101753573B (zh) 2009-12-25 2009-12-25 一种基于协同过滤的rss信息推荐方法

Country Status (1)

Country Link
CN (1) CN101753573B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101916286A (zh) * 2010-08-23 2010-12-15 宇龙计算机通信科技(深圳)有限公司 一种信息推荐方法及***
CN102467542B (zh) * 2010-11-11 2016-06-15 腾讯科技(深圳)有限公司 获取用户相似度的方法、装置及用户推荐方法、***
US9087106B2 (en) 2010-12-31 2015-07-21 Yahoo! Inc. Behavior targeting social recommendations
CN103020198B (zh) * 2012-11-30 2016-10-26 台州市合正信息科技有限公司 一种在视频中搜索目标的方法
CN102999622B (zh) * 2012-11-30 2016-10-05 台州市合正信息科技有限公司 一种基于数据库的在视频中搜索目标的方法
CN104579912B (zh) * 2013-10-29 2020-04-07 深圳市腾讯计算机***有限公司 数据推送的方法及装置
CN103793476B (zh) * 2014-01-08 2017-02-15 西安电子科技大学 基于网络社区的协同过滤推荐方法
CN104834728B (zh) * 2015-05-14 2018-03-09 无锡天脉聚源传媒科技有限公司 一种订阅视频的推送方法及装置
CN106850750B (zh) * 2016-12-26 2020-11-10 北京五八信息技术有限公司 一种实时推送信息的方法和装置
CN107391687B (zh) * 2017-07-24 2020-04-03 华中师范大学 一种面向地方志网站的混合推荐***
CN110309401B (zh) * 2018-02-13 2023-12-22 中兴通讯股份有限公司 一种信息处理方法及装置
CN109165367B (zh) * 2018-07-02 2021-09-14 昆明理工大学 一种基于rss订阅的新闻推荐方法
CN115631660A (zh) * 2022-12-07 2023-01-20 南通翔昇人工智能科技有限公司 一种基于云计算的无人机安防监管***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008072045A2 (en) * 2006-12-11 2008-06-19 Hari Prasad Sampath A method and system for personalized content delivery for wireless devices
CN101395559A (zh) * 2006-03-01 2009-03-25 Tivo有限公司 推荐的记录和下载引导

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101395559A (zh) * 2006-03-01 2009-03-25 Tivo有限公司 推荐的记录和下载引导
WO2008072045A2 (en) * 2006-12-11 2008-06-19 Hari Prasad Sampath A method and system for personalized content delivery for wireless devices

Also Published As

Publication number Publication date
CN101753573A (zh) 2010-06-23

Similar Documents

Publication Publication Date Title
CN101753573B (zh) 一种基于协同过滤的rss信息推荐方法
CN105589905B (zh) 用户兴趣数据分析和收集***及其方法
CN101923544B (zh) 一种监测展示互联网热点的方法
JP5596152B2 (ja) 電子商取引ウェブサイトでの情報マッチングの方法及びシステム
CN103617289B (zh) 基于用户特征及网络关系的微博推荐方法
US20150205580A1 (en) Method and System for Sorting Online Videos of a Search
CN103577593B (zh) 一种基于微博热门话题的视频聚合方法及***
Yazdanfar et al. Link recommender: Collaborative-filtering for recommending urls to twitter users
US20130346496A1 (en) System and method of predicting community member responsiveness
CN104918066A (zh) 视频内容审核方法及***
CN104615627B (zh) 一种基于微博平台的事件舆情信息提取方法及***
Abdul Hussien et al. An e-commerce recommendation system based on dynamic analysis of customer behavior
CN102567477A (zh) 网站价值评估方法及装置
CN103699626A (zh) 一种微博用户个性化情感倾向分析方法及***
Kadilar et al. Estimators for the population mean in the case of missing data
CN104794207A (zh) 一种基于协作的推荐***及其工作方法
CN109165367A (zh) 一种基于rss订阅的新闻推荐方法
TW201207649A (en) Search engine optimization at scale
KR20180075234A (ko) 컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치
CN102831543A (zh) 一种电子商务推荐方法
Ding et al. Water footprint for pulse, cereal, and oilseed crops in Saskatchewan, Canada
CN103336831A (zh) 基于块对角矩阵的推荐方法和装置
Au Yeung et al. Capturing implicit user influence in online social sharing
Lodi et al. Patterns of zooplankton population synchrony in a tropical reservoir
Onyenekwe et al. The triple challenge: food security and vulnerabilities of fishing and farming households in situations characterized by increasing conflict, climate shock, and environmental degradation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120523

Termination date: 20181225