CN107833117B - 一种考虑标签信息的贝叶斯个性化排序推荐方法 - Google Patents

一种考虑标签信息的贝叶斯个性化排序推荐方法 Download PDF

Info

Publication number
CN107833117B
CN107833117B CN201711331175.0A CN201711331175A CN107833117B CN 107833117 B CN107833117 B CN 107833117B CN 201711331175 A CN201711331175 A CN 201711331175A CN 107833117 B CN107833117 B CN 107833117B
Authority
CN
China
Prior art keywords
user
product
interactive
preference
products
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711331175.0A
Other languages
English (en)
Other versions
CN107833117A (zh
Inventor
姜元春
吕曼丽
刘业政
王锦坤
孙见山
孙春华
姬翠翠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201711331175.0A priority Critical patent/CN107833117B/zh
Publication of CN107833117A publication Critical patent/CN107833117A/zh
Application granted granted Critical
Publication of CN107833117B publication Critical patent/CN107833117B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种考虑标签信息的贝叶斯个性化排序推荐方法,其特征按如下步骤进行:步骤一、定义一个表示用户与产品的交互关系;步骤二、定义用户与交互项产品的标签匹配度;步骤三、定义用户的偏好反馈集合的划分标准;步骤四、构建用户对产品的矩阵分解模型;步骤五、利用贝叶斯个性化推荐方法对模型进行求解;步骤六、获得某个用户的为交互项产品的降序排列,并将前top个产品推荐给用户。本发明具有较好的推荐性能,特别是在数据稀疏与冷启动用户推荐情况下。

Description

一种考虑标签信息的贝叶斯个性化排序推荐方法
技术领域
本发明属于个性化推荐领域,具体说是一种考虑标签信息的贝叶斯个性化排序(TBPR)推荐方法。
背景技术
推荐***作为解决“信息过载”的有效工具,已经成为电子商务网站的基本配置。根据使用数据类型不同,可将推荐***的推荐方法的分为基于显式评分数据的评分预测算法和基于隐式反馈数据的个性化排序算法。显式评分数据主要是通过用户对产品打分的方式产生,而隐式反馈数据则是来源于用户的购买、点击、收藏等,因此隐式反馈数据凭借广泛性、成本低、贴近现实等优点获得了越来越多的关注。
经典的贝叶斯个性化排序算法认为与用户交互过的产品属于正向反馈,用户未交互过的产品属于负项反馈,并且假设用户对交互过的产品的偏好大于未交互过的产品。但在用户的交互记录非常稀少或者没有交互记录时,经典的贝叶斯个性化排序算法不能很好的捕捉用户的产品偏好,导致个性化推荐率不高。然而推荐***中在实际应用中,用户与产品的交互记录大多比较稀疏,在数据稀疏情形下,如何利用辅助信息提高个性化推荐精度成为个性化推荐研究的热点。
发明内容
本发明为克服现有技术存在不足之处,提出一种考虑标签信息的贝叶斯个性化排序推荐方法,以期能在数据稀疏和冷启用用户的情况下利用标签作为辅助信息,从而提高个性化推荐的准确性。
为达到上述目的,本发明采用的技术方案为:
本发明一种考虑标签信息的贝叶斯个性化排序推荐方法的特点是按照如下步骤进行:
步骤一、定义交互关系集合D表示用户和产品的所有交互关系:
Figure GDA0002324392040000011
其中,D={d1,...,dd,...,d|D|},dd表示第d个交互关系,d=1,2,...,|D|,|D|表示用户和产品的所有交互关系的个数,表示U={1,...,u,...|U|}表示用户集合,u表示任意用户,u=1,2,…,|U|,|U|表示所有用户的个数,I={1,...,i,...,|I|}表示产品集合,i表示任意产品,且任意产品i带有标签,i=1,2,…,|I|,|I|表示所有产品的个数;
步骤二、基于用户与产品的标签匹配度,利用式(1)获得用户u与未交互产品j的标签匹配度match(u,j),从而获得用户u与所有未交互产品的标签匹配度集合:
Figure GDA0002324392040000021
式(1)中,
Figure GDA0002324392040000022
表示用户u标注的所有不同标签集合,
Figure GDA0002324392040000023
表示用户u标注的第p个标签,p表示用户u标注的不同标签个数;
Figure GDA0002324392040000024
表示用户u与未交互产品j的标签集合;
Figure GDA0002324392040000025
表示用户u所未交互产品j的第q个标签,q表示未交互产品j的不同标签个数,j=1,2,…,|J|,|J|表示用户u的所有未交互产品的个数;|Tu∩Tu,j|表示用户u标注的标签与用户u未交互产品j的标签的相同标签个数,|Tu|表示用户u标注的所有不同标签个数;
步骤三、定义一个基于标签的用户偏好反馈集合的划分标准;
步骤3.1、基于用户与产品的交互关系集合D,定义用户u的所有交互产品构成用户u的正反馈集合
Figure GDA0002324392040000026
步骤3.2、设置参数ε,0≤ε≤1;
基于用户u与所述产品集合I中所有未交互产品的标签匹配度{match(u,j)}j=1,2,…,|J|,获得用户u对应的强偏好反馈集合
Figure GDA0002324392040000027
弱偏好反馈集合
Figure GDA0002324392040000028
和负反馈集合
Figure GDA0002324392040000029
若满足match(u,j)≥ε,则表示未交互产品j属于用户u的强偏好反馈集合
Figure GDA00023243920400000210
若满足0<match(u,j)<ε,则表示未交互产品j属于用户u的弱偏好反馈集合
Figure GDA00023243920400000211
若满足match(u,j)=0,则表示未交互产品j属于用户u的负反馈集合
Figure GDA00023243920400000212
步骤四、利用式(2)构建用户集合U对产品集合I的矩阵分解模型:
Figure GDA00023243920400000213
式(2)中,
Figure GDA00023243920400000214
表示用户集合U对产品集合I的偏好集合,W表示用户集合U的特征矩阵,H表示产品集合I的特征矩阵;b表示产品集合I的偏差项;
步骤五、利用贝叶斯个性化排序方法对所述矩阵分解模型进行优化求解,得到所述矩阵分解模型中的各个参数值;
步骤5.1、利用式(3)得到所述矩阵分解模型的目标函数χ:
Figure GDA00023243920400000215
式(3)中,
Figure GDA0002324392040000031
表示用户u对正反馈集合
Figure GDA0002324392040000032
中产品i的偏好,
Figure GDA0002324392040000033
表示用户u对强偏好反馈集合
Figure GDA0002324392040000034
中产品k的偏好,
Figure GDA0002324392040000035
表示用户u对弱偏好反馈集合
Figure GDA0002324392040000036
中产品s的偏好,
Figure GDA0002324392040000037
表示用户u对负反馈集合
Figure GDA0002324392040000038
中产品j的偏好;σ(·)表示logistic函数,Θ表示所述矩阵分解模型中的参数集合,并有Θ={W,H,b},λΘ为正则化参数;
步骤5.2、定义外循环变量为α,并初始化α=1;
步骤5.3、利用正态分布随机初始化第α次循环的参数集合Θα={Wα,Hα,bα};利用(0,1)随机初始化第α次循环的正则化参数
Figure GDA0002324392040000039
步骤5.4、定义内循环变量为β,并初始化β=1;
步骤5.5、在第α次外循环下遍历用户和产品的的交互关系集合D:
步骤5.6、在访问第β个交互关系dβ的过程中第β次随机选取一个用户u,同时从所述用户u对应的正反馈集合
Figure GDA00023243920400000310
中随机选取一个交互产品i,从所述用户u对应的强偏好反馈集合
Figure GDA00023243920400000311
中随机选取一个未交互产品k,从所述用户u对应的弱偏好反馈集合
Figure GDA00023243920400000312
中随机选取一个未交互产品s、从所述用户u对应的负反馈集合中
Figure GDA00023243920400000313
随机选取一个未交互产品j;从而获得第α次外循环下第β次遍历的一组用户产品组合
Figure GDA00023243920400000314
步骤5.7、将用户产品组合
Figure GDA00023243920400000315
代入式(3),得到第α次外循环下访问第β个交互关系dβ的目标函数
Figure GDA00023243920400000316
步骤5.8、利用随机梯度下降方法更新目标函数
Figure GDA00023243920400000317
中参数
Figure GDA00023243920400000318
Figure GDA00023243920400000319
的梯度;
步骤5.9、令β+1赋值给β,并判断β>|D|是否成立,若成立,则执行步骤5.10;否则,返回步骤5.6;
步骤5.10、判断参数
Figure GDA00023243920400000320
是否均收敛,若均收敛,则表示获得最优参数集合
Figure GDA00023243920400000321
否则,将α+1赋值给α,并返回步骤5.4执行;
步骤六、随机选取所述产品集合U中一个用户v,根据式(3)得到所述用户v在所述产品集合I中所有未交互产品的偏好,并对所有未交互产品的偏好进行降序排序,选择前top个产品形成推荐列表推送给所述用户v。
相对于现有的技术相比,本发明的有益效果体现在:
本发明考虑了标签信息对用户偏好的影响,保留了用户与产品的交互信息,与传统协同过滤推荐算法相比在数据非常稀疏和冷启动用户情况下,能取得较好的推荐精度,具体的说:
1、推荐***中含有大量隐式反馈数据且数据较为稀疏,通过直接预测用户对产品的偏好得分不能准确反映用户个体偏好,从而不能产生较好的推荐效果,而本发明利用排序方法求解矩阵分解模型,排序方法对隐式反馈数据具有良好的适应性,能够有效提高个性化推荐的精度。
2、本发明融合标签信息,利用用户-标签,产品-标签细化用户对未交互的产品的偏好,拓展了传统贝叶斯个性化排序算法的偏好假设,更贴近真实推荐场景,明显提升了预测结果的准确性,提高了推荐效果。
3、本发明可用于图书和家电等实体产品、音乐和视频等数字产品、旅游路线和度假安排等服务产品的个性化推荐***,可以在电脑和手机的网页和APP等平台使用,应用范围广泛。
附图说明
图1为本发明方法的流程图;
图2为本发明在Last.fm数据集上与基准算法的各项推荐指标MAP、AUC、NDCG、pre@10对比图;
图3为本发明在Last.fm数据集上与贝叶斯个性化排序算法在对冷启动用户推荐上的效果对比图;
图4为本发明在Last.fm数据集上不同稀疏度训练集对个性化推荐的推荐效果的影响图。
具体实施方式
本发明在用户与产品交互的基础上,考虑用户-标签、产品-标签,构造用户与用户对未交互的产品的标签匹配度,从而将用户偏好缺失值部分进行了更细粒度的划分。根据用户的偏好差异,本发明将全部产品划分为正反馈集合、强偏好反馈集合、弱偏好反馈集合、负反馈集合。
如图1所示,本实施例中,一种考虑标签信息的个性化排序算法,按如下步骤进行:
步骤一、定义交互关系集合D表示用户和产品的所有交互关系:
Figure GDA0002324392040000041
其中,
Figure GDA0002324392040000042
dd表示第d个交互关系,d=1,2,...,|D|,|D|表示用户和产品的所有交互关系的个数,U={1,...,u,...|U|}表示用户集合,u表示任意用户,u=1,2,…,|U|,|U|表示所有用户的个数,I={1,...,i,...,|I|}表示产品集合,i表示任意产品,且任意产品i带有标签,i=1,2,…,|I|,|I|表示所有产品的个数;所述的交互关系的数据来源包括***中的点击、收藏、购买等多种隐式反馈数据;
步骤二、用户通过对产品打标签产生标签信息,标签不仅能体现用户兴趣,同时反映产品的特征;基于用户与产品的标签匹配度,利用式(1)获得用户u与未交互产品j的标签匹配度match(u,j),从而获得用户u与所有未交互产品的标签匹配度集合:
Figure GDA0002324392040000051
式(1)中,
Figure GDA0002324392040000052
表示用户u标注的所有不同标签集合,
Figure GDA0002324392040000053
表示用户u标注的第p个标签,p表示用户u标注的不同标签个数;
Figure GDA0002324392040000054
表示用户u与未交互产品j的标签集合;
Figure GDA0002324392040000055
表示用户u所未交互产品j的第q个标签,q表示未交互产品j的不同标签个数,j=1,2,…,|J|,|J|表示用户u的所有未交互产品的个数;|Tu∩Tu,j|表示用户u与用户u未交互产品j的相同标签个数,若用户u与用户u未交互产品j没有相同标签,则用户u与用户u未交互产品j的标签匹配度match(u,j)为0,|Tu|表示用户u标注的所有不同标签个数;
步骤三、定义一个基于标签的用户偏好反馈集合的划分标准;
步骤3.1、基于用户与产品的交互关系集合D,定义用户u的所有交互产品构成用户u的正反馈集合
Figure GDA0002324392040000056
步骤3.2、设置参数ε,0≤ε≤1;
基于用户u与所述产品集合I中所有未交互产品的标签匹配度{match(u,j)}j=1,2,…,|J|,获得用户u对应的强偏好反馈集合
Figure GDA0002324392040000057
弱偏好反馈集合
Figure GDA0002324392040000058
和负反馈集合
Figure GDA0002324392040000059
若满足match(u,j)≥ε,则表示未交互产品j属于用户u的强偏好反馈集合
Figure GDA00023243920400000510
若满足0<match(u,j)<ε,则表示未交互产品j属于用户u的弱偏好反馈集合
Figure GDA00023243920400000511
若满足match(u,j)=0,则表示未交互产品j属于用户u的负反馈集合
Figure GDA00023243920400000512
本发明基于所述用户偏好反馈集合的划分标准做出三组偏序关系假设:用户u对正反馈集合
Figure GDA00023243920400000513
中产品的偏好大于用户u对强偏好反馈集合
Figure GDA00023243920400000514
中产品的偏好,用户u对强偏好反馈集合
Figure GDA00023243920400000515
中产品的偏好大于用户u对弱偏好反馈集合
Figure GDA00023243920400000516
中产品的偏好,用户u对弱偏好反馈集合
Figure GDA00023243920400000517
中产品的偏好大于用户u对负反馈集合
Figure GDA00023243920400000518
中产品的偏好;经典的贝叶斯个性化排序算法并未细分用户对未交互产品集合内部产品偏好,而本发明利用标签信息对用户未交互的产品做了合理的偏好排序假设,更贴近真实推荐场景;
步骤四、利用式(2)构建用户集合U对产品集合I的矩阵分解模型:
Figure GDA0002324392040000061
式(2)中,
Figure GDA0002324392040000062
表示用户集合U对产品集合I的偏好集合,W表示用户集合U的特征矩阵,H表示产品集合I的特征矩阵;b表示产品集合I的偏差项;
步骤五、利用贝叶斯个性化排序方法对所述矩阵分解模型进行优化求解,得到所述矩阵分解模型中的各个参数值;
步骤5.1、利用式(6)得到所述矩阵分解模型的目标函数χ:根据贝叶斯个性化排序方法得出矩阵分解模型的学习目标就是最大化式(3)中的后验概率p(Θ|>u):
p(Θ|>u)∝p(>u|Θ)p(Θ) (3)
Θ表示所述矩阵分解模型中的参数集合,并有Θ={W,H,b},>u表示任意用户u对所有产品的偏好排序;假设不同用户之间的选择是相互独对的,用户对不同产品对之间排序也是相互独立的,则p(Θ|>u)可以表示为公式(4)中的似然函数:
Figure GDA0002324392040000063
式(4)中,
Figure GDA0002324392040000064
表示用户u对正反馈集合
Figure GDA0002324392040000065
中产品i的偏好,
Figure GDA0002324392040000066
表示用户u对强偏好反馈集合
Figure GDA0002324392040000067
中产品k的偏好,
Figure GDA0002324392040000068
表示用户u对弱偏好反馈集合
Figure GDA0002324392040000069
中产品s的偏好,
Figure GDA00023243920400000610
表示用户u对负反馈集合
Figure GDA00023243920400000611
中产品j的偏好;δ(u,i,j),ξ(u,k,s),ψ(u,s,j)为指示函数,当
Figure GDA00023243920400000612
Figure GDA00023243920400000613
时,指示函数δ(u,i,k)的值为1,否则δ(u,i,k)=0,当
Figure GDA00023243920400000614
时,指示函数ξ(u,k,s)=1,否则ξ(u,k,s)=0,当
Figure GDA00023243920400000615
时,指示函数ψ(u,s,j)=1,否则ψ(u,s,j)=0。公式(5)利用logistic函数将用户对产品之间的偏好差值转化为概率值:
Figure GDA0002324392040000071
综合式(4)、式(5),得到所有用户u∈U的全部参数对数形式后验分布,即矩阵分解模型的最终目标函数χ:
Figure GDA0002324392040000072
式(6)中,σ(·)表示logistic函数,λΘ为正则化参数;match(u,k)值越大,表示用户对产品i与产品k的偏好越接近;match(u,s)值越大,表示用户对产品s与产品j的偏好差异越大;本发明的训练准则是最大化公式(6)中的目标函数;
步骤5.2、定义外循环变量为α,并初始化α=1;
步骤5.3、利用正态分布随机初始化第α次循环的参数集合Θα={Wα,Hα,bα};利用(0,1)随机初始化第α次循环的正则化参数
Figure GDA0002324392040000073
步骤5.4、定义内循环变量为β,并初始化β=1;
步骤5.5、在第α次外循环下遍历用户和产品的的交互关系集合D:
步骤5.6、在访问第β个交互关系dβ的过程中第β次随机选取一个用户u,同时从所述用户u对应的正反馈集合
Figure GDA0002324392040000074
中随机选取一个交互产品i,从所述用户u对应的强偏好反馈集合
Figure GDA0002324392040000075
中随机选取一个未交互产品k,从所述用户u对应的弱偏好反馈集合
Figure GDA0002324392040000076
中随机选取一个未交互产品s、从所述用户u对应的负反馈集合中
Figure GDA0002324392040000077
随机选取一个未交互产品j;从而获得第α次外循环下第β次访问的一组用户产品组合
Figure GDA0002324392040000078
步骤5.7、将用户产品组合
Figure GDA0002324392040000079
代入式(3),得到第α次外循环下第β次访问的目标函数
Figure GDA00023243920400000710
步骤5.8、利用随机梯度下降方法更新目标函数
Figure GDA00023243920400000711
中参数
Figure GDA00023243920400000712
Figure GDA00023243920400000713
的梯度;
步骤5.9、令β+1赋值给β,并判断β>|D|是否成立,若成立,则执行步骤5.10;否则,返回步骤5.6;
步骤5.10、判断参数
Figure GDA0002324392040000081
是否均收敛,若均收敛,则表示获得最优参数集合
Figure GDA0002324392040000082
否则,将α+1赋值给α,并返回步骤5.4执行;
步骤六、随机选取所述产品集合U中一个用户v,根据式(3)得到所述用户v在所述产品集合I中所有未交互产品的偏好,并对所有未交互产品的偏好进行降序排序,选择前top个产品形成推荐列表推送给所述用户v。
针对本发明方法进行实验论证,具体包括:
1)准备标准数据集
本发明使用在推荐领域应用广泛的数据集Last.fm数据集作为标准数据集验证本发明提出的个性化推荐方法的性能。Last.fm数据集的数据来自Last.fm网站,Last.fm是一个面向音乐爱好者的在线音乐网站,音乐爱好者可以在Last.fm平台上为喜爱的歌手和相关歌曲添加标签。我们过滤掉原始数据集中用户对歌手没有标注历史的数据后,产生了92834个“用户-产品”二元组,28176个“用户-标签”二元组和84396个“产品-标签”二元组,来自1892个用户对17632为歌手标注的2109个标签。为了检验TBPR的推荐性能,我们从“用户-产品”二元组中随机选取20%的“用户-产品”交互数据作为测试集,剩余的数据作为训练集训练TBPR模型参数。最后得到了含有74362个“用户-产品”二元组的训练集,和18472个“用户-产品”二元组的测试集。
2)评价指标
采用平均准确率均值(MAP)和标准化折扣增益(NDCG),长度为N的准确率pre@N,感受性曲线下方的面积(AUC)作为本实验的评价指标。平均准确率均值和准确率衡量推荐推荐效果的指标,标准化折扣增益和感受性曲线下方的面积衡量排序效果的指标。长度为N的准确率pre@N的计算公式为:
Figure GDA0002324392040000083
式(7)中,S(K;u)表示出现在列表前K个产品中并被成功被用户u选择的产品集合。平均准确率均值的计算公式为:
Figure GDA0002324392040000084
Figure GDA0002324392040000085
式(8)中,S(u)表示测试集中用户u交互过的所有产品集合,C(u)表示测试集中用户u的待推荐产品集合。
感受性曲线下方的面积的计算公式为:
Figure GDA0002324392040000091
式(10)中
Figure GDA0002324392040000092
(xui-xuj)>0表明对于用户u,i产品比j产品排名靠前。
标准化折扣增益NDCG的计算公式如下:
Figure GDA0002324392040000093
其中,
Figure GDA0002324392040000094
Figure GDA0002324392040000095
式(12)和式(13)中,R(u)是测试集中用户u的待推荐产品集合C(u)的降序排序,
Figure GDA0002324392040000096
表示S(u)中任意产品i在R(u)中的位置。
3)在标准数据集上进行实验
为验证发明的有效性,我们将本发明提出的TBPR方法和4种基准方法进行比较,4种基准方法为:随机推荐算法(Random)、最热推荐算法(MostPopular)、基于用户的最近邻(UserKNN)算法,基于矩阵分解的贝叶斯个性化排序(BPRMF)方法。在Last.fm数据集上用5种方法进行建模和推荐,并将推荐结果进行比较。实验结果如图2。与4种基准方法相比,本发明提出的群推荐方法在Last.fm获得了更优的推荐精度。
为了验证本发明提出的TBPR方法对冷启动用户的推荐效果,我们本发明和基于矩阵分解的贝叶斯个性化排序(BPRMF)方法分别对训练集中选择产品个数少于5的用户进行推荐,图3反映的是TBPR与BPRMF对冷启动用户的推荐结果分析。实验结果表明本发明通过标签信息在用户与产品之间建立匹配联系,对于冷启用用户的推荐具有良好的效果。图4反映的是不同稀疏度训练集数据对本发明实验结果的影响,实验结果表明,在训练集稀疏度较低的情况下,本发明的推荐效果要好于其他对比算法。本发明对于稀疏度较高的数据和冷启动用户的推荐都具有良好的效果。

Claims (1)

1.一种考虑标签信息的贝叶斯个性化排序推荐方法,其特征是按照如下步骤进行:
步骤一、定义交互关系集合D表示用户和产品的所有交互关系:
Figure FDA0002324392030000011
其中,D={d1,...,dd,...,d|D|},dd表示第d个交互关系,d=1,2,...,|D|,|D|表示用户和产品的所有交互关系的个数,表示U={1,...,u,...|U|}表示用户集合,u表示任意用户,u=1,2,…,|U|,|U|表示所有用户的个数,I={1,...,i,...,|I|}表示产品集合,i表示任意产品,且任意产品i带有标签,i=1,2,…,|I|,|I|表示所有产品的个数;
步骤二、基于用户与产品的标签匹配度,利用式(1)获得用户u与未交互产品j的标签匹配度match(u,j),从而获得用户u与所有未交互产品的标签匹配度集合:
Figure FDA0002324392030000012
式(1)中,
Figure FDA0002324392030000013
表示用户u标注的所有不同标签集合,
Figure FDA0002324392030000014
表示用户u标注的第p个标签,p表示用户u标注的不同标签个数;
Figure FDA0002324392030000015
表示用户u与未交互产品j的标签集合;
Figure FDA0002324392030000016
表示用户u所未交互产品j的第q个标签,q表示未交互产品j的不同标签个数,j=1,2,…,|J|,|J|表示用户u的所有未交互产品的个数;|Tu∩Tu,j|表示用户u标注的标签与用户u未交互产品j的标签的相同标签个数,|Tu|表示用户u标注的所有不同标签个数;
步骤三、定义一个基于标签的用户偏好反馈集合的划分标准;
步骤3.1、基于用户与产品的交互关系集合D,定义用户u的所有交互产品构成用户u的正反馈集合
Figure FDA0002324392030000017
步骤3.2、设置参数ε,0≤ε≤1;
基于用户u与所述产品集合I中所有未交互产品的标签匹配度{match(u,j)}j=1,2,…,|J|,获得用户u对应的强偏好反馈集合
Figure FDA0002324392030000018
弱偏好反馈集合
Figure FDA0002324392030000019
和负反馈集合
Figure FDA00023243920300000110
若满足match(u,j)≥ε,则表示未交互产品j属于用户u的强偏好反馈集合
Figure FDA00023243920300000111
若满足0<match(u,j)<ε,则表示未交互产品j属于用户u的弱偏好反馈集合
Figure FDA00023243920300000112
若满足match(u,j)=0,则表示未交互产品j属于用户u的负反馈集合
Figure FDA00023243920300000113
步骤四、利用式(2)构建用户集合U对产品集合I的矩阵分解模型:
Figure FDA0002324392030000021
式(2)中,
Figure FDA0002324392030000022
表示用户集合U对产品集合I的偏好集合,W表示用户集合U的特征矩阵,H表示产品集合I的特征矩阵;b表示产品集合I的偏差项;
步骤五、利用贝叶斯个性化排序方法对所述矩阵分解模型进行优化求解,得到所述矩阵分解模型中的各个参数值;
步骤5.1、利用式(3)得到所述矩阵分解模型的目标函数χ:
Figure FDA0002324392030000023
式(3)中,
Figure FDA0002324392030000024
表示用户u对正反馈集合
Figure FDA0002324392030000025
中产品i的偏好,
Figure FDA0002324392030000026
表示用户u对强偏好反馈集合
Figure FDA0002324392030000027
中产品k的偏好,
Figure FDA0002324392030000028
表示用户u对弱偏好反馈集合
Figure FDA0002324392030000029
中产品s的偏好,
Figure FDA00023243920300000210
表示用户u对负反馈集合
Figure FDA00023243920300000211
中产品j的偏好;σ(·)表示logistic函数,Θ表示所述矩阵分解模型中的参数集合,并有Θ={W,H,b},λΘ为正则化参数;
步骤5.2、定义外循环变量为α,并初始化α=1;
步骤5.3、利用正态分布随机初始化第α次循环的参数集合Θα={Wα,Hα,bα};利用(0,1)随机初始化第α次循环的正则化参数
Figure FDA00023243920300000212
步骤5.4、定义内循环变量为β,并初始化β=1;
步骤5.5、在第α次外循环下遍历用户和产品的的交互关系集合D:
步骤5.6、在访问第β个交互关系dβ的过程中第β次随机选取一个用户u,同时从所述用户u对应的正反馈集合
Figure FDA00023243920300000213
中随机选取一个交互产品i,从所述用户u对应的强偏好反馈集合
Figure FDA00023243920300000214
中随机选取一个未交互产品k,从所述用户u对应的弱偏好反馈集合
Figure FDA00023243920300000215
中随机选取一个未交互产品s、从所述用户u对应的负反馈集合中
Figure FDA00023243920300000216
随机选取一个未交互产品j;从而获得第α次外循环下第β次遍历的一组用户产品组合
Figure FDA00023243920300000217
步骤5.7、将用户产品组合
Figure FDA00023243920300000218
代入式(3),得到第α次外循环下访问第β个交互关系dβ的目标函数
Figure FDA0002324392030000031
步骤5.8、利用随机梯度下降方法更新目标函数
Figure FDA0002324392030000032
中参数
Figure FDA0002324392030000033
Figure FDA0002324392030000034
的梯度;
步骤5.9、令β+1赋值给β,并判断β>|D|是否成立,若成立,则执行步骤5.10;否则,返回步骤5.6;
步骤5.10、判断参数
Figure FDA0002324392030000035
是否均收敛,若均收敛,则表示获得最优参数集合
Figure FDA0002324392030000036
否则,将α+1赋值给α,并返回步骤5.4执行;
步骤六、随机选取所述产品集合U中一个用户v,根据式(3)得到所述用户v在所述产品集合I中所有未交互产品的偏好,并对所有未交互产品的偏好进行降序排序,选择前top个产品形成推荐列表推送给所述用户v。
CN201711331175.0A 2017-12-13 2017-12-13 一种考虑标签信息的贝叶斯个性化排序推荐方法 Active CN107833117B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711331175.0A CN107833117B (zh) 2017-12-13 2017-12-13 一种考虑标签信息的贝叶斯个性化排序推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711331175.0A CN107833117B (zh) 2017-12-13 2017-12-13 一种考虑标签信息的贝叶斯个性化排序推荐方法

Publications (2)

Publication Number Publication Date
CN107833117A CN107833117A (zh) 2018-03-23
CN107833117B true CN107833117B (zh) 2020-03-17

Family

ID=61644239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711331175.0A Active CN107833117B (zh) 2017-12-13 2017-12-13 一种考虑标签信息的贝叶斯个性化排序推荐方法

Country Status (1)

Country Link
CN (1) CN107833117B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537638B (zh) * 2018-04-12 2020-12-15 合肥工业大学 基于贝叶斯回归的利基产品推荐方法及装置
CN109034389A (zh) * 2018-08-02 2018-12-18 黄晓鸣 信息推荐***的人机交互式修正方法、装置、设备和介质
CN109118330B (zh) * 2018-08-09 2020-09-22 珠海格力电器股份有限公司 一种家电推荐方法、装置、存储介质及服务器
CN109087178B (zh) * 2018-08-28 2021-05-18 清华大学 商品推荐方法和装置
CN109522426B (zh) * 2018-12-05 2021-06-22 北京达佳互联信息技术有限公司 多媒体数据推荐方法、装置、设备及计算机可读存储介质
CN109670909A (zh) * 2018-12-13 2019-04-23 南京财经大学 一种基于概率矩阵分解和特征融合的旅游产品推荐方法
CN110209946B (zh) * 2019-06-10 2021-03-09 合肥工业大学 基于社交和社群的产品推荐方法、***和存储介质
CN110197404B (zh) * 2019-06-12 2022-04-01 合肥工业大学 可降低流行度偏差的个性化长尾商品推荐方法和***
CN111080160B (zh) * 2019-12-27 2023-06-23 哈尔滨工业大学(威海) 包含偏好辅助决策因子优选的交互式多准则决策方法、装置及计算机设备
WO2021145823A1 (en) * 2020-01-17 2021-07-22 National University Of Singapore Advanced conversational recommender system
CN111598644B (zh) * 2020-04-01 2023-05-02 华瑞新智科技(北京)有限公司 一种物品推荐方法、装置以及介质
CN117436679B (zh) * 2023-12-21 2024-03-26 四川物通科技有限公司 一种元宇宙资源匹配方法及其***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102866997A (zh) * 2011-07-05 2013-01-09 腾讯科技(深圳)有限公司 用户数据的处理方法和装置
CN103246672A (zh) * 2012-02-09 2013-08-14 中国科学技术大学 对用户进行个性化推荐的方法和装置
CN104484431A (zh) * 2014-12-19 2015-04-01 合肥工业大学 一种基于领域本体的多源个性化新闻网页推荐方法
CN105260390A (zh) * 2015-09-11 2016-01-20 合肥工业大学 一种面向群组的基于联合概率矩阵分解的项目推荐方法
CN106651519A (zh) * 2016-12-23 2017-05-10 广州赛宝认证中心服务有限公司 基于标签信息的个性化推荐方法和***
CN106777123A (zh) * 2016-12-16 2017-05-31 合肥工业大学 一种基于双向张量分解模型的群推荐方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7389201B2 (en) * 2001-05-30 2008-06-17 Microsoft Corporation System and process for automatically providing fast recommendations using local probability distributions

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102866997A (zh) * 2011-07-05 2013-01-09 腾讯科技(深圳)有限公司 用户数据的处理方法和装置
CN103246672A (zh) * 2012-02-09 2013-08-14 中国科学技术大学 对用户进行个性化推荐的方法和装置
CN104484431A (zh) * 2014-12-19 2015-04-01 合肥工业大学 一种基于领域本体的多源个性化新闻网页推荐方法
CN105260390A (zh) * 2015-09-11 2016-01-20 合肥工业大学 一种面向群组的基于联合概率矩阵分解的项目推荐方法
CN106777123A (zh) * 2016-12-16 2017-05-31 合肥工业大学 一种基于双向张量分解模型的群推荐方法
CN106651519A (zh) * 2016-12-23 2017-05-10 广州赛宝认证中心服务有限公司 基于标签信息的个性化推荐方法和***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于用户信任和兴趣的概率矩阵分解推荐方法;彭鹏等;《计算机***应用》;20170915;全文 *
贝叶斯学习及其在个性化搜索和推荐应用研究;刘吉振;《中国优秀硕士学位论文全文数据库》;20140331;全文 *

Also Published As

Publication number Publication date
CN107833117A (zh) 2018-03-23

Similar Documents

Publication Publication Date Title
CN107833117B (zh) 一种考虑标签信息的贝叶斯个性化排序推荐方法
Luo et al. Personalized recommendation by matrix co-factorization with tags and time information
Li et al. Using multidimensional clustering based collaborative filtering approach improving recommendation diversity
CN109918563B (zh) 一种基于公开数据的图书推荐的方法
CN107545471B (zh) 一种基于高斯混合的大数据智能推荐方法
Hornick et al. Extending recommender systems for disjoint user/item sets: The conference recommendation problem
Xu A big-data oriented recommendation method based on multi-objective optimization
TW201520790A (zh) 個性化資料搜尋方法和裝置
CN103559622A (zh) 基于特征的协同过滤推荐方法
US20140288999A1 (en) Social character recognition (scr) system
Madadipouya et al. A literature review on recommender systems algorithms, techniques and evaluations
CN110083764A (zh) 一种协同过滤算法冷启动问题的解决方法
CN112989169B (zh) 目标对象识别方法、信息推荐方法、装置、设备及介质
CN110069713B (zh) 一种基于用户上下文感知的个性化推荐方法
CN112100512A (zh) 一种基于用户聚类和项目关联分析的协同过滤推荐方法
CN109977299A (zh) 一种融合项目热度和专家系数的推荐算法
CN111310046A (zh) 对象推荐方法及装置
Liu et al. Fast recommendation on latent collaborative relations
Mohamed et al. Sparsity and cold start recommendation system challenges solved by hybrid feedback
Ifada et al. Do-rank: DCG optimization for learning-to-rank in tag-based item recommendation systems
Tomeo et al. Addressing the cold start with positive-only feedback through semantic-based recommendations
Sun Music Individualization Recommendation System Based on Big Data Analysis
CN114861079A (zh) 一种融合商品特征的协同过滤推荐方法和***
CN115114517A (zh) 基于用户属性和项目评分的协同过滤推荐算法
Pandey et al. Unsupervised extraction of template structure in web search queries

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant