CN101753573B - 一种基于协同过滤的rss信息推荐方法 - Google Patents
一种基于协同过滤的rss信息推荐方法 Download PDFInfo
- Publication number
- CN101753573B CN101753573B CN2009102564578A CN200910256457A CN101753573B CN 101753573 B CN101753573 B CN 101753573B CN 2009102564578 A CN2009102564578 A CN 2009102564578A CN 200910256457 A CN200910256457 A CN 200910256457A CN 101753573 B CN101753573 B CN 101753573B
- Authority
- CN
- China
- Prior art keywords
- module
- user
- recommendation
- rss
- article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于协同过滤的RSS信息推荐方法,属信息推荐技术领域,***由阅读模块、订阅模块、订阅管理模块、行为记录模块、行为处理模块和推荐模块组成,其中阅读模块分别和订阅模块、订阅管理模块、行为记录模块及推荐模块相连接;行为处理模块分别和行为记录模块及推荐模块相连接;订阅模块和订阅管理模块相互连接,模块之间通过由编程实现的控制语句,共享一个或多个服务器数据库的数据。本发明使其推荐效果不仅限于整个RSS信息源的推荐,更加突出了单篇文章的推荐,有效避免了信息冗余和过载;推荐效果有一定的差异覆盖面,便于用户发现可能感兴趣的新内容;引入了同好用户群,并利用同好用户加权因子,使推荐内容更加精准可信。
Description
所属技术领域
本发明涉及一种信息推荐方法,具体涉及一种基于协同过滤的RSS信息推荐方法。
背景技术
目前互联网中的RSS信息推荐方法,只能推荐整条信息源,不能针对单篇文章进行个性化推荐。例如:谷歌阅读器,抓虾网、鲜果网等的在线RSS阅读器均不能完成同好用户的单篇文章个性化推荐。如专利号为200510022721.3、发明名称为《一种基于XML文件的RSS信息交互处理方法》的专利即属于此列。
这样会导致使用者得到的推荐文章泛滥,不能得到精准的使用者喜好的单篇文章。
发明内容
本发明解决的技术问题是:提供一种既能荐整条信息源,又能针对同好用户的单篇文章进行个性化推荐。
本发明基于以下假设:有相同或类似订阅习惯的用户,其相互推荐的信息更具价值;最相似的同好用户推荐的信息比次相似同好用户的推荐更具价值。通过分析用户的习惯,找到每个用户的同好用户群,以及该用户群的订阅集。通过加权每个同好用户的收藏文章,以推荐该用户最有可能喜欢的文章,从而达到个性化的推荐效果。
为达到上述目标,本发明采用如下的技术方案:
一种基于协同过滤的RSS信息推荐方法,步骤如下:
1)用户从大量RSS源集中订阅某些RSS源时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该RSS信息源在***中的唯一标识r,形成用户对RSS源的订阅情况Wu,r,更新至行为处理模块的用户-RSS源订阅矩阵W(m,n)之中,m为***中的用户数目,n为RSS源的数目,订阅情况Wu,r的值当订阅时为1,未订阅时为0;
2)行为处理模块从用户-RSS源订阅矩阵W(m,n)中获取订阅情况Wu,r,利用余弦相关性算法计算两用户之间的相似度sim(ip,iq),其中ip,iq分别为p、q两名用户;并将相似度更新至用户相似度方阵sim(m,m)中,余弦相关算法的公式为:
3)行为处理模块根据用户相似度方阵sim(m,m)推算出与每个用户有相似订阅习惯的“同好”用户,并将该用户所有“同好”用户订阅的所有RSS源形成同好用户订阅集,再按相似度由高到低排列,形成对该用户的推荐加权系数f;
4)用户从一个RSS源的文章列表中收藏某篇文章时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该篇文章在***中的唯一标识rt,形成用户对文章的收藏情况Cu,rt,更新至行为处理模块的同好收藏矩阵C(a,b)之中,a为某用户的同好用户数目,b为同好用户订阅集中所有文章的数目;
5)行为处理模块针对同好收藏矩阵C(a,b)中单篇文章的所有同好用户行为,做推荐加权处理,按推荐优先级形成推荐文章集,并将推荐文章集更新至推荐模块;
6)在用户获取文章推荐时,推荐模块实时地从推荐文章集筛选出目标用户可能会感兴趣的TopN条内容推荐给用户。
上述RSS是在线共享内容的一种简易方式(也称聚合内容,Really SimpleSyndication)。通常在时效性比较强的内容上使用RSS订阅能更快速获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新。
上述RSS源是一种描述和同步网站内容的格式,是目前使用最广泛的XML应用。发布一个RSS文件后,这个RSS Feed中包含的信息就能直接被其他站点调用,而且由于这些数据都是标准的XML格式,所以也能在其他的终端和服务中使用。
上述余弦相关性算法为信息推荐领域内公知的通用算法。
一种用于上述方法的RSS阅读***,由阅读模块、订阅模块、订阅管理模块、行为记录模块、行为处理模块和推荐模块组成,其特征在于阅读模块分别和订阅模块、订阅管理模块、行为记录模块及推荐模块相连接;行为处理模块分别和行为记录模块及推荐模块相连接;订阅模块和订阅管理模块相互连接,模块之间通过由编程实现的控制语句,共享一个或多个服务器数据库的数据。
本发明有以下有益效果:
1.相比起传统的RSS推荐方法,本发明使其推荐效果不仅仅局限于整个RSS信息源的推荐,更加突出了信息源中单篇文章的推荐,有效避免了信息冗余和过载;
2.相比起传统的基于用户的信息推荐技术,本发明结合了基于项的推荐方式,使其推荐效果有一定的差异覆盖面,便于用户发现可能感兴趣的新内容;
3.相比传统的基于项的信息推荐技术,本发明引入了同好用户群,并利用同好用户加权因子,使推荐内容更加精准可信。
附图说明
图1是本发明阅读***的结构示意图。
其中:1、阅读模块,2、订阅模块,3、订阅管理模块,4、行为记录模块,5、推荐模块,6、行为处理模块。
图2是本发明方法的流程图,其中7-12为其中的各个步骤。
具体实施方式
下面结合附图和实施例对本发明做进一步说明,但不限于此。
实施例1:
一种基于协同过滤的RSS信息推荐方法,如图2所示,步骤如下:
7、用户从大量RSS源集中订阅某些RSS源时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该RSS信息源在***中的唯一标识r,形成用户对RSS源的订阅情况Wu,r,更新至行为处理模块的用户-RSS源订阅矩阵W(m,n)之中,m为***中的用户数目,n为RSS源的数目,订阅情况Wu,r的值当订阅时为1,未订阅时为0;
8、行为处理模块从用户-RSS源订阅矩阵W(m,n)中获取订阅情况Wu,r,利用余弦相关性算法计算两用户之间的相似度sim(ip,iq),其中ip,iq分别为p、q两名用户;并将相似度更新至用户相似度方阵sim(m,m)中,余弦相关算法的公式为:
9、行为处理模块根据用户相似度方阵sim(m,m)推算出与每个用户有相似订阅习惯的“同好”用户,并将该用户所有“同好”用户订阅的所有RSS源形成同好用户订阅集,再按相似度由高到低排列,形成对该用户的推荐加权系数f;
10、用户从一个RSS源的文章列表中收藏某篇文章时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该篇文章在***中的唯一标识rt,形成用户对文章的收藏情况Cu,rt,更新至行为处理模块的同好收藏矩阵C(a,b)之中,a为某用户的同好用户数目,b为同好用户订阅集中所有文章的数目;
11、行为处理模块针对同好收藏矩阵C(a,b)中单篇文章的所有同好用户行为,做推荐加权处理,按推荐优先级形成推荐文章集,并将推荐文章集更新至推荐模块;
12、在用户获取文章推荐时,推荐模块实时地从推荐文章集筛选出目标用户可能会感兴趣的TopN条内容推荐给用户。
实施例2:
一种用于上述方法的RSS阅读***,如图1所示,由阅读模块1、订阅模块2、订阅管理模块3、行为记录模块4、行为处理模块6和推荐模块5组成,其特征在于阅读模块1分别和订阅模块2、订阅管理模块3、行为记录模块4及推荐模块5相连接;行为处理模块6分别和行为记录模块4及推荐模块5相连接;订阅模块2和订阅管理模块3相互连接,模块之间通过由编程实现的控制语句,共享一个或多个服务器数据库的数据。
Claims (2)
1.一种基于协同过滤的RSS信息推荐方法,步骤如下:
1)用户从大量RSS源集中订阅某些RSS源时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该RSS信息源在***中的唯一标识r,形成用户对RSS源的订阅情况Wu,r,更新至行为处理模块的用户-RSS源订阅矩阵W(m,n)之中,m为***中的用户数目,n为RSS源的数目,订阅情况Wu,r的值当订阅时为1,未订阅时为0;
2)行为处理模块从用户-RSS源订阅矩阵W(m,n)中获取订阅情况Wu,r,利用余弦相关性算法计算两用户之间的相似度sim(ip,iq),其中ip,iq分别为p、q两名用户;并将相似度更新至用户相似度方阵sim(m,m)中,余弦相关算法的公式为:
3)行为处理模块根据用户相似度方阵sim(m,m)推算出与每个用户有相似订阅习惯的“同好”用户,并将该用户所有“同好”用户订阅的所有RSS源形成同好用户订阅集,再按相似度由高到低排列,形成对该用户的推荐加权系数f;
4)用户从一个RSS源的文章列表中收藏某篇文章时,服务器行为记录模块获取登录的用户信息,查询会话表获得用户唯一身份标识u,连同该篇文章在***中的唯一标识rt,形成用户对文章的收藏情况Cu,rt,更新至行为处理模块的同好收藏矩阵C(a,b)之中,a为某用户的同好用户数目,b为同好用户订阅集中所有文章的数目;
5)行为处理模块针对同好收藏矩阵C(a,b)中单篇文章的所有同好用户行为,做推荐加权处理,按推荐优先级形成推荐文章集,并将推荐文章集更新至推荐模块;
6)在用户获取文章推荐时,推荐模块实时地从推荐文章集筛选出目标用户可能会感兴趣的TopN条内容推荐给用户。
2.一种用于权利要求1所述方法的RSS阅读***,由阅读模块、订阅模块、订阅管理模块、行为记录模块、行为处理模块和推荐模块组成,其特征在于阅读模块分别和订阅模块、订阅管理模块、行为记录模块及推荐模块相连接;行为处理模块分别和行为记录模块及推荐模块相连接;订阅模块和订阅管理模块相互连接,模块之间通过由编程实现的控制语句,共享一个或多个服务器数据库的数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102564578A CN101753573B (zh) | 2009-12-25 | 2009-12-25 | 一种基于协同过滤的rss信息推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2009102564578A CN101753573B (zh) | 2009-12-25 | 2009-12-25 | 一种基于协同过滤的rss信息推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101753573A CN101753573A (zh) | 2010-06-23 |
CN101753573B true CN101753573B (zh) | 2012-05-23 |
Family
ID=42479973
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009102564578A Expired - Fee Related CN101753573B (zh) | 2009-12-25 | 2009-12-25 | 一种基于协同过滤的rss信息推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101753573B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101916286A (zh) * | 2010-08-23 | 2010-12-15 | 宇龙计算机通信科技(深圳)有限公司 | 一种信息推荐方法及*** |
CN102467542B (zh) * | 2010-11-11 | 2016-06-15 | 腾讯科技(深圳)有限公司 | 获取用户相似度的方法、装置及用户推荐方法、*** |
US9087106B2 (en) | 2010-12-31 | 2015-07-21 | Yahoo! Inc. | Behavior targeting social recommendations |
CN103020198B (zh) * | 2012-11-30 | 2016-10-26 | 台州市合正信息科技有限公司 | 一种在视频中搜索目标的方法 |
CN102999622B (zh) * | 2012-11-30 | 2016-10-05 | 台州市合正信息科技有限公司 | 一种基于数据库的在视频中搜索目标的方法 |
CN104579912B (zh) * | 2013-10-29 | 2020-04-07 | 深圳市腾讯计算机***有限公司 | 数据推送的方法及装置 |
CN103793476B (zh) * | 2014-01-08 | 2017-02-15 | 西安电子科技大学 | 基于网络社区的协同过滤推荐方法 |
CN104834728B (zh) * | 2015-05-14 | 2018-03-09 | 无锡天脉聚源传媒科技有限公司 | 一种订阅视频的推送方法及装置 |
CN106850750B (zh) * | 2016-12-26 | 2020-11-10 | 北京五八信息技术有限公司 | 一种实时推送信息的方法和装置 |
CN107391687B (zh) * | 2017-07-24 | 2020-04-03 | 华中师范大学 | 一种面向地方志网站的混合推荐*** |
CN110309401B (zh) * | 2018-02-13 | 2023-12-22 | 中兴通讯股份有限公司 | 一种信息处理方法及装置 |
CN109165367B (zh) * | 2018-07-02 | 2021-09-14 | 昆明理工大学 | 一种基于rss订阅的新闻推荐方法 |
CN115631660A (zh) * | 2022-12-07 | 2023-01-20 | 南通翔昇人工智能科技有限公司 | 一种基于云计算的无人机安防监管*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008072045A2 (en) * | 2006-12-11 | 2008-06-19 | Hari Prasad Sampath | A method and system for personalized content delivery for wireless devices |
CN101395559A (zh) * | 2006-03-01 | 2009-03-25 | Tivo有限公司 | 推荐的记录和下载引导 |
-
2009
- 2009-12-25 CN CN2009102564578A patent/CN101753573B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101395559A (zh) * | 2006-03-01 | 2009-03-25 | Tivo有限公司 | 推荐的记录和下载引导 |
WO2008072045A2 (en) * | 2006-12-11 | 2008-06-19 | Hari Prasad Sampath | A method and system for personalized content delivery for wireless devices |
Also Published As
Publication number | Publication date |
---|---|
CN101753573A (zh) | 2010-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101753573B (zh) | 一种基于协同过滤的rss信息推荐方法 | |
CN105589905B (zh) | 用户兴趣数据分析和收集***及其方法 | |
CN101923544B (zh) | 一种监测展示互联网热点的方法 | |
JP5596152B2 (ja) | 電子商取引ウェブサイトでの情報マッチングの方法及びシステム | |
CN103617289B (zh) | 基于用户特征及网络关系的微博推荐方法 | |
US20150205580A1 (en) | Method and System for Sorting Online Videos of a Search | |
CN103577593B (zh) | 一种基于微博热门话题的视频聚合方法及*** | |
Yazdanfar et al. | Link recommender: Collaborative-filtering for recommending urls to twitter users | |
US20130346496A1 (en) | System and method of predicting community member responsiveness | |
CN104918066A (zh) | 视频内容审核方法及*** | |
CN104615627B (zh) | 一种基于微博平台的事件舆情信息提取方法及*** | |
Abdul Hussien et al. | An e-commerce recommendation system based on dynamic analysis of customer behavior | |
CN102567477A (zh) | 网站价值评估方法及装置 | |
CN103699626A (zh) | 一种微博用户个性化情感倾向分析方法及*** | |
Kadilar et al. | Estimators for the population mean in the case of missing data | |
CN104794207A (zh) | 一种基于协作的推荐***及其工作方法 | |
CN109165367A (zh) | 一种基于rss订阅的新闻推荐方法 | |
TW201207649A (en) | Search engine optimization at scale | |
KR20180075234A (ko) | 컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치 | |
CN102831543A (zh) | 一种电子商务推荐方法 | |
Ding et al. | Water footprint for pulse, cereal, and oilseed crops in Saskatchewan, Canada | |
CN103336831A (zh) | 基于块对角矩阵的推荐方法和装置 | |
Au Yeung et al. | Capturing implicit user influence in online social sharing | |
Lodi et al. | Patterns of zooplankton population synchrony in a tropical reservoir | |
Onyenekwe et al. | The triple challenge: food security and vulnerabilities of fishing and farming households in situations characterized by increasing conflict, climate shock, and environmental degradation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120523 Termination date: 20181225 |