CN108460145B - 一种基于混合兴趣相似度的协同过滤推荐方法 - Google Patents

一种基于混合兴趣相似度的协同过滤推荐方法 Download PDF

Info

Publication number
CN108460145B
CN108460145B CN201810212124.4A CN201810212124A CN108460145B CN 108460145 B CN108460145 B CN 108460145B CN 201810212124 A CN201810212124 A CN 201810212124A CN 108460145 B CN108460145 B CN 108460145B
Authority
CN
China
Prior art keywords
user
similarity
users
scores
scoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810212124.4A
Other languages
English (en)
Other versions
CN108460145A (zh
Inventor
姚文斌
胡芳燚
綦麟
樊悦芹
黄芬芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201810212124.4A priority Critical patent/CN108460145B/zh
Publication of CN108460145A publication Critical patent/CN108460145A/zh
Application granted granted Critical
Publication of CN108460145B publication Critical patent/CN108460145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本专利提出一种新的混合用户兴趣相似度计算方法。通过建立用户对所用项目的评分矩阵,当发现用户评分矩阵为空,计算用户特征属性相似性寻找相似用户进行预测评分。当目标用户与其他用户之间共同评分物品个数比较少时,通过计算物品相似度,间接计算出用户兴趣相似度。用户兴趣相似度计算主要分成三个部分:直接计算用户评分的距离值、求出一组评分的贡献值以及这组评分在整个评分***中是否为奇异值。最后,将三个计算用户兴趣相似度的方法通过sigmoid函数实现冷启动状态下根据用户属性计算相似度到根据用户评分信息的平滑过渡得到最终用户兴趣相似度。根据用户兴趣相似度计算目标用户未评分项目的预测评分,选取其中预测评分最高的N个项目推荐,本发明可以有效缓解冷启动问题、数据稀疏性问题并有效地提高预测推荐的准确度。

Description

一种基于混合兴趣相似度的协同过滤推荐方法
(一)技术领域
本发明涉及个性化推荐技术领域,具体涉及一种基于混合兴趣相似度的协同过滤推荐的方法。
(二)背景技术
推荐***是一种解决信息过载的智能***。协同过滤是现今推荐技术的方法之一,直接根据用户的历史行为预测其可能喜欢的物品,被广泛的应用于几乎所有的大型电子商务网站中。而当用户刚进入***时没有任何评分记录,并且用户之间共同评分的物品数量过少导致数据稀疏性问题,通过传统的相似度计算出用户相似度不够准确,此时通过基于用户兴趣的混合相似度则可以解决数据稀疏性和提取用户兴趣问题。
用户兴趣相似度的关键技术包括对用户兴趣相似性的计算方式,不准确的相似性计算将导致用户兴趣提出不够精确,进而产生大量的错误推荐。传统的相似度计算方式在遇到***日志中数据稀疏问题时会导致预测结果精度下降。最新研究针对这一问题提出从物品相似度上间接提取用户兴趣相似度,通过全面考虑用户评分信息计算用户相似性。但是忽略物品从稀疏到密集的过渡问题。据此进行用户兴趣相似性计算可能存在一定的偏差。因此本文提出一种基于混合兴趣相似度的协同过滤的方法,根据用户之间对物品评分绝对距离、贡献值和奇异值三个因素综合考虑用户评分信息计算用户之间的兴趣相似性。然后将用户兴趣相似性分为初始阶段、数据稀疏性阶段和最终阶段,根据用户对物品评分的个数进行对三个阶段进行混合。该方法有效提高获取用户兴趣准确率,保证推荐质量。
(三)发明内容
本发明的目的是提供一种基于混合兴趣相似度协同过滤的推荐方法。该方法通过将用户兴趣相似度分为三个阶段,首先用户刚进入***根据用户属性进行相似度计算,然后用户之间共同评分数目较少时根据物品相似度间接计算用户相似度,最后目标用户与相似用户共同评分数目不稀疏时根据用户之间共同评分的物品计算出用户兴趣相似度。此方法更准确提取用户兴趣,有效解决冷启动、数据稀疏性问题,实现推荐***的有效推荐。
为了达到上述目的,本发明采用如下方案实现:
首先提取用户特征属性以及物品特征属性。推荐***新加入的用户数据为空,根据用户特征属性计算出用户相似性进行推荐,随着用户对物品评分数量上升,此时用户与用户之间共同评分物品数量过少,则根据物品相似性间接求得用户兴趣相似性,当用户之间共同评分物品数量增加到一定数量时则可以直接根据用户之间共同评分的物品进行计算用户相似性。通过使用sigmoid函数融合三种用户兴趣相似性寻找目标用户的相似用户从而预测出用户对为评分物品的评分,选取TOP-N物品列表完成推荐。
本发明中涉及到如下参数:
用户特征属性向量Attruser=(au1,au2,...,aun),rui表示用户u给物品i的评分;物品特征属性向量表示为Attritem=(ai1,ai2,...,ain);ru,p表示用户v给物品p的评分;μp表示所有用户给物品P进行评分的平均值;rmed表示***中对评分值的中值;sim(i,j)表示物品i和j之间的相似度;Cuv表示用户u和v共同评分物品的集合;rup表示预测用户u对物品p的评分;rkp表示用户k对物品p的评分;
其具体方法步骤为:
(1)通过日志数据***,获取用户对各个物品的兴趣信息,根据设定的评分原则,建立各用户对所有物品的评分矩阵;
(2)根据评分矩阵计算每个用户对物品的平均评分,将用户特征属性和物品特征属性用向量表示;
(3)新用户进入***时没有历史数据,获取用户属性特征向量计算用户之间相似度simattr(u,v);
(4)根据两个用户对物品的评分求出两者在评分上的距离值,计算公示如下
Figure BDA0001597506500000021
(5)根据两个用户对物品评分与评级***中间值的差距得出一组评分的贡献值,计算公式如下:
Figure BDA0001597506500000022
(6)为判断一组评分是否为奇异值,根据这组评分与所有评分的平均值进行对比,计算公式如下:
Figure BDA0001597506500000023
(7)结合步骤(4)(5)(6)三个因素得到用户兴趣相似度,计算公式如下:
sim(u,v)1 PSS=∑p∈Iproximity(ru,p,rv,p)×significance(ru,p,rv,p)×singularity(ru,p,rv,p);
(8)新用户进入***中,由于没有任何数据,采取步骤(3)寻找相似用户;
(9)当目标用户与其他用户之间共同评分物品的数目较少时,通过计算物品之间的相似度结合步骤(7)得到稀疏时用户之间的兴趣相似度sim2
(10)随着用户之间共同评分数目增多,此时通过主要通过用户之间共同评分的物品进行用户相似性计算;
(11)步骤(7)(8)(9)通过用户对评分物品的数目和用户之间共同评分物品个数进行过度;
(12)将三种相似度进行融合得到最终混合相似度,计算公式如下:
simfinal(u,v)=αsimattr(u,v)+βsim1+λsim2
Figure BDA0001597506500000031
Figure BDA0001597506500000032
λ=1-α-β;
(13)由步骤13得到用户兴趣相似度最后预测出用户对未评分的物品的评分,如下:
Figure BDA0001597506500000033
(14)选取预测评分最高的前N个物品给推荐用户,算法结束。
本发明所阐述的基于混合用户兴趣相似度协同过滤的推荐方法,。
本方法的创新性在于:
1.当用户刚进进入***没有任何数据根据用户属性相似性解决用户冷启动问题。
2.根据用户评分相似度和用户倾向相似度获取用户兴趣相似度分别从用户行为相似性和用户对某一物品的倾向相似性求得用户兴趣相似性。
3.当用户之间共同评分物品个数较少时根据物品,通过物品特征属性相似性间接计算出用户相似性解决数据稀疏性问题。
4.从用户属性相似性到用户兴趣相似性计算分成三个阶段根据用户评级物品个数进行平滑,更准确获取到用户兴趣相似度。
(四)附图说明
图1、本文所述方法的示意图
图2、混合兴趣相似度协同过滤推荐方法流程图
(五)具体实施方式
下面结合附图举例对本发明做更详细地描述:
本发明所述方法的特征在于:
根据用户之间共同评价物品的个数是否超过置信度分别计算用户兴趣相似度,当用户之间共同评价物品的个数稀疏时,根据用户评价的物品的相似性进行相似性的间接计算,当个数不在稀疏时,则根据用户评分相似度和兴趣倾向度混合计算用户兴趣相似度。如果一个新用户进入***时没有对任何物品进行评分,通过计算用户属性相似性选择相似用户进行推荐。
(1)通过日志数据***,获取用户对各个物品的兴趣信息,根据设定的评分原则,建立各用户对所有物品的评分矩阵;
(2)根据评分矩阵计算每个用户对物品的平均评分,将用户特征属性和物品特征属性用向量表示;
(3)新用户进入***时没有历史数据,获取用户属性特征向量计算用户之间相似度simattr(u,v);
(4)根据两个用户对物品的评分求出两者在评分上的距离值,计算公示如下
Figure BDA0001597506500000041
(5)根据两个用户对物品评分与评级***中间值的差距得出一组评分的贡献值,计算公式如下:
Figure BDA0001597506500000042
(6)为判断一组评分是否为奇异值,根据这组评分与所有评分的平均值进行对比,计算公式如下:
Figure BDA0001597506500000043
(7)结合步骤(4)(5)(6)三个因素得到用户兴趣相似度,计算公式如下:
sim(u,v)1 PSS=∑p∈Iproximity(ru,p,rv,p)×significance(ru,p,rv,p)×singularity(ru,p,rv,p);
(8)新用户进入***中,由于没有任何数据,采取步骤(3)寻找相似用户;
(9)当目标用户与其他用户之间共同评分物品的数目较少时,通过计算物品之间的相似度结合步骤(7)得到稀疏时用户之间的兴趣相似度sim2
(10)随着用户之间共同评分数目增多,此时通过主要通过用户之间共同评分的物品进行用户相似性计算;
(11)步骤(7)(8)(9)通过用户对评分物品的数目和用户之间共同评分物品个数进行过度;
(12)将三种相似度进行融合得到最终混合相似度,计算公式如下:
simfinal(u,v)=αsimattr(u,v)+βsim1+λsim2
Figure BDA0001597506500000051
Figure BDA0001597506500000052
λ=1-α-β;
(13)由步骤13得到用户兴趣相似度最后预测出用户对未评分的物品的评分,如下:
Figure BDA0001597506500000053
(14)选取预测评分最高的前N个物品给推荐用户,算法结束。
在***中记录用户的历史评分记录,根据用户对物品评分的个数和用户之间共同评分物品个数选择计算用户兴趣相似度的方式。当新用户进入***时,没有任何对物品操作的记录,此时需要通过用户属性相似度进行计算,根据相似用户评价较高的物品进行推荐。当用户在***中有存在一定数量的评价记录,但是与其他用户之间的共同评分物品较少,这时需要根据用户之间评价的物品的相似度间接求出用户兴趣相识度,当用户之间共同评分物品不在稀疏时直接根据用户评分相似度和用户兴趣倾向度计算出用户兴趣相似度。根据最终混合的用户兴趣相似度计算目标用户对评分物品的预测,最终选取TOP-N物品列表向用户进行推荐。

Claims (1)

1.一种基于混合兴趣相似度的协同过滤推荐方法,其特征在于:
在***中记录用户的历史评分记录,首先提取用户特征属性以及物品特征属性;推荐***新加入的用户数据为空,根据用户特征属性计算出用户相似性进行推荐,随着用户对物品评分数量上升,此时用户与用户之间共同评分物品数量过少,则根据物品相似性间接求得用户兴趣相似性,当用户之间共同评分物品数量增加到预设值时则直接根据用户之间共同评分的物品进行计算用户相似性;用户兴趣相似性根据全面考虑用户对物品的评分从评分距离值、贡献值和奇异值三个因素进行计算;最后通过使用sigmoid函数融合三种用户兴趣相似性寻找目标用户的相似用户从而预测出用户对未评分物品的评分,选取TOP-N物品列表完成推荐,包括以下参数:
用户特征属性向量Attruser=(au1,au2,...,aun),物品特征属性向量表示为Attritem=(ai1,ai2,...,ain);ru,p表示用户u给物品p的评分;μp表示所有用户给物品p进行评分的平均值;rmed表示***中对评分值的中值;sim(i,j)表示物品i和j之间的相似度;rup表示预测用户u对物品p的评分;rk,p表示用户k对物品p的评分;其具体方法步骤为:
(1)通过日志数据***,获取用户对各个物品的兴趣信息,根据设定的评分原则,建立各用户对所有物品的评分矩阵;
(2)根据评分矩阵计算每个用户对物品的平均评分,将用户特征属性和物品特征属性用向量表示;
(3)新用户进入***时没有历史数据,获取用户属性特征向量计算用户之间相似度simattr(u,v);
(4)根据两个用户对物品的评分求出两者在评分上的距离值,计算公式如下
Figure FDA0002394506190000011
(5)根据两个用户对物品评分与评级***中间值的差距得出一组评分的贡献值,计算公式如下:
Figure FDA0002394506190000012
(6)为判断一组评分是否为奇异值,根据这组评分与所有评分的平均值进行对比,计算公式如下:
Figure FDA0002394506190000021
(7)结合步骤(4)(5)(6)三个因素得到用户兴趣相似度,计算公式如下:
simspa(u,v)=∑p∈Uproximity(ru,p,rv,p)×significance(ru,p,rv,p)×singularity(ru,p,rv,p);
(8)新用户进入***中,由于没有任何数据,采取步骤(3)寻找相似用户;
(9)当目标用户与其他用户之间共同评分物品的数目低于预设值时,通过计算物品之间的相似度结合步骤(7)得到稀疏时用户之间的兴趣相似度simspa
(10)随着用户之间共同评分数目高于预设值时,其相似度simden通过用户之间共同评分的物品进行计算;
(11)将三种相似度进行融合得到最终混合相似度,计算公式如下:
simfinal(u,v)=αsimattr(u,v)+βsimspa(u,v)+λsimden(u,v);
Figure FDA0002394506190000022
Figure FDA0002394506190000023
λ=1-α-β;
(12)由步骤(11)计算出用户之间的兴趣相似度,最后预测出用户对未评分的物品的评分,如下:
Figure FDA0002394506190000024
(13)选取预测评分最高的前N个物品给推荐用户,算法结束。
CN201810212124.4A 2018-03-15 2018-03-15 一种基于混合兴趣相似度的协同过滤推荐方法 Active CN108460145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810212124.4A CN108460145B (zh) 2018-03-15 2018-03-15 一种基于混合兴趣相似度的协同过滤推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810212124.4A CN108460145B (zh) 2018-03-15 2018-03-15 一种基于混合兴趣相似度的协同过滤推荐方法

Publications (2)

Publication Number Publication Date
CN108460145A CN108460145A (zh) 2018-08-28
CN108460145B true CN108460145B (zh) 2020-07-03

Family

ID=63216925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810212124.4A Active CN108460145B (zh) 2018-03-15 2018-03-15 一种基于混合兴趣相似度的协同过滤推荐方法

Country Status (1)

Country Link
CN (1) CN108460145B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364254A (zh) * 2020-10-09 2021-02-12 天津大学 用户相似度改进的协同过滤推荐***及方法

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697628B (zh) * 2018-11-12 2024-05-10 平安科技(深圳)有限公司 产品数据推送方法及装置、存储介质、计算机设备
CN110083764A (zh) * 2019-04-11 2019-08-02 东华大学 一种协同过滤算法冷启动问题的解决方法
CN111274493B (zh) * 2020-01-17 2020-09-08 电子科技大学 一种基于多源用户评论的评分预测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609533A (zh) * 2012-02-15 2012-07-25 中国科学技术大学 一种基于核方法的协同过滤推荐***及方法
CN103093376A (zh) * 2013-01-16 2013-05-08 北京邮电大学 基于奇异值分解算法的聚类协同过滤推荐***
CN104063481A (zh) * 2014-07-02 2014-09-24 山东大学 一种基于用户实时兴趣向量的电影个性化推荐方法
CN107391670A (zh) * 2017-07-21 2017-11-24 云南电网有限责任公司教育培训评价中心 一种融合协同过滤和用户属性过滤的混合推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100153292A1 (en) * 2008-12-11 2010-06-17 Microsoft Corporation Making Friend and Location Recommendations Based on Location Similarities

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609533A (zh) * 2012-02-15 2012-07-25 中国科学技术大学 一种基于核方法的协同过滤推荐***及方法
CN103093376A (zh) * 2013-01-16 2013-05-08 北京邮电大学 基于奇异值分解算法的聚类协同过滤推荐***
CN104063481A (zh) * 2014-07-02 2014-09-24 山东大学 一种基于用户实时兴趣向量的电影个性化推荐方法
CN107391670A (zh) * 2017-07-21 2017-11-24 云南电网有限责任公司教育培训评价中心 一种融合协同过滤和用户属性过滤的混合推荐方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364254A (zh) * 2020-10-09 2021-02-12 天津大学 用户相似度改进的协同过滤推荐***及方法

Also Published As

Publication number Publication date
CN108460145A (zh) 2018-08-28

Similar Documents

Publication Publication Date Title
CN108460145B (zh) 一种基于混合兴趣相似度的协同过滤推荐方法
CN107833117B (zh) 一种考虑标签信息的贝叶斯个性化排序推荐方法
WO2020253591A1 (zh) 运用标签知识网络的搜索方法及装置
CN107944035B (zh) 一种融合视觉特征和用户评分的图像推荐方法
CN112612973B (zh) 结合知识图谱的个性化智能服装搭配推荐方法
CN105426550B (zh) 一种基于用户质量模型的协同过滤标签推荐方法及***
CN104199898B (zh) 一种属性信息的获取方法及装置、推送方法及装置
CN104809243A (zh) 一种基于对用户行为复合因子进行挖掘的混合推荐方法
CN110427567A (zh) 一种基于用户偏好相似度加权的协同过滤推荐方法
CN104036002A (zh) 一种智能推荐数据的技术方法
CN104298787A (zh) 一种基于融合策略的个性化推荐方法及装置
CN107665217A (zh) 一种用于搜索业务的词汇处理方法及***
Cheung et al. Bag-of-features tagging approach for a better recommendation with social big data
CN110688565B (zh) 基于多维霍克斯过程和注意力机制的下一个物品推荐方法
CN111310046A (zh) 对象推荐方法及装置
CN104915860A (zh) 一种商品推荐方法及装置
CN104021230B (zh) 一种基于社区发现的协同过滤方法
CN103927339B (zh) 知识重组***和知识重组方法
CN115204967A (zh) 一种融入用户长短期兴趣表征隐式反馈的推荐方法
CN103064907A (zh) 基于无监督的实体关系抽取的主题元搜索***及方法
CN103020153A (zh) 一种基于视频的广告识别方法
CN108717436B (zh) 一种基于显著性检测的商品目标快速检索方法
Sang et al. A ranking based recommender system for cold start & data sparsity problem
CN113449200B (zh) 物品推荐方法、装置及计算机存储介质
KR101910424B1 (ko) 태그의 감성 분석을 이용한 영화 평점 예측 방법, 이를 수행하기 위한 기록 매체 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant