CN112569608A - 一种基于多源异构数据的桌游混合推荐方法 - Google Patents

一种基于多源异构数据的桌游混合推荐方法 Download PDF

Info

Publication number
CN112569608A
CN112569608A CN202011531148.XA CN202011531148A CN112569608A CN 112569608 A CN112569608 A CN 112569608A CN 202011531148 A CN202011531148 A CN 202011531148A CN 112569608 A CN112569608 A CN 112569608A
Authority
CN
China
Prior art keywords
game
user
matrix
variance
cnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011531148.XA
Other languages
English (en)
Other versions
CN112569608B (zh
Inventor
李绍利
杨传颖
石宝
雷小涵
李亚龙
王成龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inner Mongolia University of Technology
Original Assignee
Inner Mongolia University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inner Mongolia University of Technology filed Critical Inner Mongolia University of Technology
Priority to CN202011531148.XA priority Critical patent/CN112569608B/zh
Publication of CN112569608A publication Critical patent/CN112569608A/zh
Application granted granted Critical
Publication of CN112569608B publication Critical patent/CN112569608B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/70Game security or game management aspects
    • A63F13/79Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories
    • A63F13/798Game security or game management aspects involving player-related data, e.g. identities, accounts, preferences or play histories for assessing skills or for ranking players, e.g. for generating a hall of fame
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F2300/00Features of games using an electronically generated display having two or more dimensions, e.g. on a television screen, showing representations related to the game
    • A63F2300/60Methods for processing data by generating or executing the game program
    • A63F2300/61Score computation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Security & Cryptography (AREA)
  • Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

随着桌游和桌游用户数量越来越多,数据稀疏问题也越来越严重,传统矩阵分解方法仅使用评分数据,在评分矩阵稀疏时其性能受到限制,针对此,本发明提出了一种基于多源异构数据的桌游混合推荐算法,在评分数据基础上融合多源异构辅助数据,以解决由于评分矩阵稀疏导致游戏特征和用户特征表达不充分的问题。本发明在传统的概率矩阵分解算法(PMF)的基础上提出改进,改进点包括:1.使用游戏描述文本和游戏属性信息增强游戏特征向量的表示,2.使用用户已评分游戏的特征结合注意力机制增强用户特征的表示。实验表明,本发明模型相较基线模型,评分预测误差更小。

Description

一种基于多源异构数据的桌游混合推荐方法
技术领域
本发明属于大数据与人工智能技术领域,特别涉及一种基于多源异构数据的桌游混合推荐方法。
背景技术
21世纪初,人们对桌游的兴趣逐渐开始复兴,桌游在娱乐市场中的份额与日俱增,并且这种趋势是全球性的。相较于观看电影来说,桌上游戏这个兴趣是较新的,目前有较少学者研究桌游推荐这个应用。随着桌游玩家和桌游数目越来越多,产生的用户交互信息和桌游描述信息越来越多,需要有一个好的桌游推荐算法去更好的满足人们的需要。
目前,各种推荐的应用层出不清,然而桌游推荐研究却很少。Amazon和Barnes&Noble提供了桌游推荐方法,但是他们的推荐方法是基于用户购买模式和商品到商品的协同过滤,并不涉及游戏的特征以量身定做用户的偏好,没有实现个性化的推荐。Yiu-Kai Ng等人提出了PeGRec模型,PeGRec模型在给用户推荐新游戏时,考虑到游戏的特征。这些特征包括种类、复杂度、游戏时间等,并将这些特征进行整合,最终确定推荐列表,实现了用户的个性化推荐,并在一定程度上解决了冷启动问题,提高了用户满意度。但是需要用户自己创建用户档案并提供喜欢的指定游戏,并没有实现完全智能的推荐。Jan Zalewski等将桌游进行聚类,计算用户对每个类别的喜欢程度,并利用基于用户的协同过滤思想为用户推荐游戏。适用于用户较少的场合,但实际场景中用户很多,计算用户相似度矩阵代价很大。MichaelIon等人提出了一个桌游推荐***,其功能是用户输入一个他们喜欢的游戏集合,***进行推荐。该文提出了一种基于协同过滤和基于内容的混合推荐方法,提高了推荐准确性、多样性和新颖性。但是该方法需要用户输入一组他们喜欢的游戏,一方面,对于新手用户并不知道自己喜欢什么游戏,另一方没有利用机器学习方法从用户已评分游戏辅助信息中分析出用户偏好。
随着桌游和桌游用户数量越来越多,数据稀疏问题也越来越严重,传统的矩阵分解算法仅使用评分数据做推荐,当评分矩阵稀疏时,其性能受到限制,且传统的矩阵分解算法并没有考虑到:1.游戏多源异构辅助信息对游戏特征表达的增强。2.用户已评分游戏特征对用户特征表达的增强。
发明内容
为了克服上述现有技术的缺点,进一步提高桌游推荐的效果,本发明的目的在于提供一种基于多源异构数据的桌游混合推荐方法,结合多源异构辅助信息,以期解决由于评分数据稀疏引起的游戏特征和用户特征表示不准确的问题,从而能为用户推荐令其更加满意的游戏。
为了实现上述目的,本发明采用的技术方案是:
1.设定评分矩阵R的条件分布p为:
Figure BDA0002852150840000021
其中R表示评分矩阵,R={Rij},Rij为用户i对游戏j的评分,i为用户序号,i=1,2,3...L,L为用户总数,j为游戏序号,j=1,2,3...M,M为游戏总数,U为用户特征矩阵,U={Ui},Ui表示用户i的特征向量,V为游戏特征矩阵,V={Vj},Vj表示游戏j的特征向量,α2为Rij的方差,
Figure BDA0002852150840000022
表示Rij服从均值为Ui TVj,方差为α2的高斯分布,T为转置符号,Iij是一个矩阵,如果用户i给游戏j打分,则Iij为1,否则为0;
2.使用卷积神经网络从桌游描述文本中提取桌游特征向量,形式化表示为:CNN(Xj,Wcnn),其中,Xj是游戏j的描述文本,Wcnn是卷积神经网络内部的权重参数;
3.使用多层感知机从桌游属性信息中提取桌游特征向量,形式化表示为MLP(Yj,Wmlp),其中,Yj是游戏j的属性信息,Wmlp表示多层感知机网络内部的权重参数;
4.将CNN(Xj,Wcnn)和MLP(Yj,Wmlp)进行融合,用CM表示如下:CM(Xj,Yj,Wcnn,Wmlp,Wcm)=relu(Wcm*concatenate(CNN(Xj,Wcnn),MLP(Yj,Wmlp)))
其中concatenate为拼接函数,relu为激活函数,Wcm为融合层权重参数;
5.将游戏j的特征向量Vj定义为:Vj=CM(Xj,Yj,WV)+ξj,WV={Wcnn,Wmlp,Wcm},设定WV的条件分布为
Figure BDA0002852150840000031
即对于WV中的每一个参数wk,均值为0,方差为
Figure BDA0002852150840000032
k为WV中权重参数的序号,k=1,2,3...|wk|,|wk|为WV中权重参数的个数,ξj为从评分矩阵中学习到的游戏特征,ξj服从均值为0,方差
Figure BDA00028521508400000316
的高斯球形分布,即
Figure BDA0002852150840000033
I为单位矩阵;
6.游戏特征矩阵的条件分布为:
Figure BDA0002852150840000034
其中X为游戏描述文本集,Y为游戏属性信息集,
Figure BDA0002852150840000035
为Vj中每个分量的方差,
Figure BDA0002852150840000036
表示Vj服从均值为CM(Xj,Yj,WV),方差为
Figure BDA0002852150840000037
的高斯球形分布;
7.使用用户已评分游戏的特征结合注意力机制来增强用户特征表示,表示为UA,
Figure BDA0002852150840000038
其中
Figure BDA0002852150840000039
a表示采用自注意力机制对
Figure BDA00028521508400000310
进行信息汇总,得到的注意力向量,
Figure BDA00028521508400000311
为用户i已评分游戏的特征向量组成的矩阵,Wa1和Wa2为权重参数,softmax和tanh为激活函数;
8.用户i的特征向量定义为:
Figure BDA00028521508400000312
其中,WU为上一步提取用户特征时的权重参数,WU={Wa1,Wa2},设定WU的条件分布为
Figure BDA00028521508400000313
即对于WU中的每一个参数wt,均值为0,方差为
Figure BDA00028521508400000314
t为WU中权重参数的序号,t=1,2,3...|wt|,|wt|为WU中权重参数的个数,δi表示从评分矩阵中学习到的用户特征,δi服从均值为0,方差为
Figure BDA00028521508400000315
的高斯球形分布,即
Figure BDA0002852150840000041
9.用户特征矩阵的条件分布为:
Figure BDA0002852150840000042
其中VU为每个用户已评分游戏的特征向量组成的矩阵集合;
Figure BDA0002852150840000043
为Ui中的每个分量的方差,
Figure BDA0002852150840000044
表示Ui服从均值为
Figure BDA0002852150840000045
方差为
Figure BDA0002852150840000046
的高斯球形分布;
10.使用最大后验估计优化模型中的变量、参数,公式如下:
Figure BDA0002852150840000047
11.通过取负对数,上式表示为:
Figure BDA0002852150840000048
其中,
Figure BDA0002852150840000049
12.采用坐标下降法更新Vj:
Vj←(UIjUTUI)-1(URjVCM(Xj,Yj,WV))
其中,Ij是一个对角矩阵,其对角元素是Iij中第j列元素,Rj是一个向量,向量值为Rij中第j列元素值;
13.采用坐标下降法更新Ui
Figure BDA00028521508400000410
其中,Ii是一个对角矩阵,它的对角元素是Iij中第i行元素,Ri是一个向量,向量值为Rij中第i行元素值;
14.根据ε(WV)使用反向传播算法更新WV
Figure BDA00028521508400000411
15.根据ε(WU)使用反向传播算法更新WU
Figure BDA0002852150840000051
16.循环执行12-15步优化模型中的变量和参数,直至收敛;
17.使用优化后的U、V、WU、WV,预测用户对游戏的未知评分:
Figure BDA0002852150840000052
18.为了评估本文模型的性能,使用均方根误差(RMSE)作为评价标准,RMSE值越低,代表效果越好。RMSE的定义为:
Figure BDA0002852150840000053
S为测试集中的评分数。
所述桌游属性信息包括:游戏最少人数、游戏最多人数、游戏平均时间、游戏类别和游戏机制。将所述桌游属性信息分为类别信息和数值信息,类别信息有:游戏类别和游戏机制,数值信息有:游戏最少人数、游戏最多人数和游戏平均时间。对于类别信息,将其通过embedding降维,对于数值信息,进行Min-Max标准化,将处理后的属性信息进行拼接后使用多层感知机从中提取桌游特征向量。
与现有技术相比,本发明的有益效果是:
1.解决了由于评分矩阵稀疏,使得游戏特征表达不准确的问题。
2.解决了由于评分矩阵稀疏,使得用户特征表达不准确的问题。
附图说明
图1是本发明模型原理图。
具体实施方式
下面结合附图和实施例详细说明本发明的实施方式。
本发明将多源异构的辅助信息融入传统的PMF算法中。将从桌游描述文本和桌游属性信息中提取的特征向量融入游戏端的特征表示。由于评分矩阵稀疏,也造成了用户特征表达不准确,本发明使用用户已评分游戏的特征结合注意力机制增强用户特征的表达。整体框架如图1所示。
本发明一个实施例的具体步骤如下:
1、本实施例采用的数据集来自https://boardgamegeek.com网站,该网站是全球最大的桌游网站,使用爬虫技术共爬取了142308个用户对9021款游戏的评分,见表1。游戏辅助信息包括游戏描述文本和游戏属性信息,其中属性信息包括:游戏最少人数、游戏最多人数,游戏平均时间,游戏类别、游戏机制。
表1
用户数 桌游数 评分数 稀疏度
142308 9021 854848 99.93%
2、对文本数据进行如下预处理:
1)设置游戏描述文本的最大长度为200;
2)删除停止词;
3)选择频率大于5的单词构造词汇表;
4)将游戏描述表示为单词索引向量。
3、设定评分矩阵R的条件分布p为:
Figure BDA0002852150840000061
其中R表示评分矩阵,R={Rij},Rij为用户i对游戏j的评分,i为用户序号,i=1,2,3...L,L为用户总数,j为游戏序号,j=1,2,3...M,M为游戏总数,U为用户特征矩阵,U={Ui},Ui表示用户i的特征向量,V为游戏特征矩阵,V={Vj},Vj表示游戏j的特征向量,α2为Rij的方差,
Figure BDA0002852150840000062
表示Rij服从均值为Ui TVj,方差为α2的高斯分布,T为转置符号,Iij是一个矩阵,如果用户i给游戏j打分,则Iij为1,否则为0;
4、使用卷积神经网络(CNN)从桌游描述文本中提取桌游特征向量,形式化表示为:CNN(Xj,Wcnn),其中,Xj是游戏j的描述文本,Wcnn是CNN网络内部的权重参数。CNN网络由嵌入层、卷积层、池化层、全连接层4层组成,实验设置如下:
1)词向量的维数为300,通过优化过程训练词向量;
2)在卷积层中,使用64个过滤器,每个过滤器的窗口大小设置为3、4、5;
3)输出维度设为200。
5、游戏属性信息可分为两类,分别为类别信息和数值信息,类别信息有:游戏类别和游戏机制,数值信息有:游戏最少人数、游戏最多人数和游戏平均时间。对于类别信息,将其通过embedding降维,这是因为高维且稀疏的向量会影响模型的表现。对于数值信息,进行Min-Max标准化,将处理后的属性信息进行拼接后,使用多层感知机(MLP)从桌游属性信息中提取桌游特征向量,形式化表示为MLP(Yj,Wmlp),其中,Yj是游戏j的属性信息,Wmlp表示MLP网络内部的权重参数。本实施例设置MLP网络包含两个隐层,输出维度设为50。
6、将从游戏描述文本和属性信息中提取到的特征向量进行融合,用CM进行表示:CM(Xj,Yj,Wcnn,Wmlp,Wcm)=relu(Wcm*concatenate(CNN(Xj,Wcnn),MLP(Yj,Wmlp))),concatenate为拼接函数,relu为激活函数。Wcm为融合层权重参数。输出维度设为50。
7、将游戏j的特征向量Vj定义为:Vj=CM(Xj,Yj,WV)+ξj,为了表示方便,本实施例使用WV表示上述从多种辅助数据中提取游戏特征向量的权重参数,
WV={Wcnn,Wmlp,Wcm},设定WV的条件分布为
Figure BDA0002852150840000071
即对于WV中的每一个参数wk,均值为0,方差为
Figure BDA0002852150840000072
k为WV中权重参数的序号,k=1,2,3...|wk|,|wk|为WV中权重参数的个数,ξj为从评分矩阵中学习到的游戏特征,ξj服从均值为0,方差
Figure BDA0002852150840000073
的高斯球形分布,即
Figure BDA0002852150840000074
I为单位矩阵,ξj的维度为50。
8、因此,游戏特征矩阵的条件分布为:
Figure BDA0002852150840000075
其中X为游戏描述文本集,Y为游戏属性信息集,
Figure BDA0002852150840000081
为Vj中每个分量的方差,
Figure BDA0002852150840000082
表示Vj服从均值为CM(Xj,Yj,WV),方差为
Figure BDA0002852150840000083
的高斯球形分布。
9、由于评分数据稀疏,造成用户特征表达不准确,而用户玩过的游戏反映了用户的兴趣,然而,不同游戏对用户特征的贡献是不同的,因此本实施例使用用户已评分游戏的特征结合注意力机制来增强用户特征,表示为UA,
Figure BDA0002852150840000084
其中
Figure BDA0002852150840000085
a表示采用自注意力机制对
Figure BDA0002852150840000086
进行信息汇总,得到的注意力向量,
Figure BDA0002852150840000087
为用户i已评分游戏的特征向量组成的矩阵,Wa1和Wa2为权重参数,softmax和tanh为激活函数,UA的输出维度设为50。
10、用户i的特征向量定义为:
Figure BDA0002852150840000088
其中,WU为上一步提取用户特征时的权重参数,WU={Wa1,Wa2},设定WU的条件分布为
Figure BDA0002852150840000089
即对于WU中的每一个参数wt,均值为0,方差为
Figure BDA00028521508400000810
t为WU中权重参数的序号,t=1,2,3...|wt|,|wt|为WU中权重参数的个数,δi表示从评分矩阵中学习到的用户特征,δi服从均值为0,方差为
Figure BDA00028521508400000811
的高斯球形分布,即
Figure BDA00028521508400000812
δi的维度为50。
11、用户特征矩阵的条件分布为:
Figure BDA00028521508400000813
其中VU为每个用户已评分游戏的特征向量组成的矩阵集合;
Figure BDA00028521508400000814
为Ui中的每个分量的方差,
Figure BDA00028521508400000815
表示Ui服从均值为
Figure BDA00028521508400000816
方差为
Figure BDA00028521508400000817
的高斯球形分布;
12、为了优化模型中的变量、参数,使用最大后验估计(MAP)。公式如下:
Figure BDA00028521508400000818
13、通过取负对数,上式表示为:
Figure BDA0002852150840000091
其中,
Figure BDA0002852150840000092
14采用坐标下降法更新
Figure BDA0002852150840000093
其中,Ij是一个对角矩阵,它的对角元素是Iij中第j列元素,Rj是一个向量,向量值为Rij中第j列元素值。
15、采用坐标下降法更新
Figure BDA0002852150840000094
Ii是一个对角矩阵,它的对角元素是Iij中第i行元素,Ri是一个向量,向量值为Rij中第i行元素值。
16、根据ε(WV)使用反向传播算法更新WV
Figure BDA0002852150840000095
17、根据ε(WU)使用反向传播算法更新WU
Figure BDA0002852150840000096
18、循环执行14-17步优化模型中的变量和参数,直至收敛。
19、使用优化后的U、V、WU、WV,预测用户对游戏的未知评分:
Figure BDA0002852150840000097
20、为了衡量本实施例模型的评分预测效果,本实施例使用均方根误差(RMSE)验证本实施例模型与基线模型所得预测评分与实际评分之间的差距。RMSE的定义为:
Figure BDA0002852150840000098
S为测试集中的评分数。
实验结果如表2所示。
表2
算法 RMSE
PMF 1.617
CDL 1.605
ConvMF 1.590
本发明模型 1.381
从表2中可以看出本发明模型优于PMF模型、CDL模型和Convmf模型,PMF模型仅使用评分矩阵做评分预测,效果最差,CDL模型使用SDAE处理文本信息,并融于PMF中,评分预测效果优于PMF模型,Convmf模型使用CNN网络处理文本信息,融于PMF中,进一步降低了评分预测的误差。然而,以上基线方法均未在用户端加入辅助信息,进一步降低评分预测误差。本文借鉴Convmf的做法使用CNN处理文本信息,加入MLP网络处理属性信息,将两者信息整合后融入PMF模型增强游戏特征表示,并使用用户已评分游戏特征结合注意力机制增强用户特征表示,进一步降低了评分预测的误差。
21.为验证本文模型中参数λU和λV对评分预测结果的影响,通过设置不同的λU和λV进行实验,结果如表3所示
表3
λ<sub>U</sub> λ<sub>V</sub> RMSE
90 10 1.43616
50 50 1.40019
10 90 1.38192
10 100 1.38281
20 90 1.38094
实验表明,评分预测的结果受到λU和λV的影响,合适的λU和λV可以进一步降低评分预测的误差,从上表可以看出,当λU和λV的值分别为20和90时,评分预测误差最小。

Claims (4)

1.一种基于多源异构数据的桌游混合推荐方法,其特征在于,包括如下步骤:
步骤1,设定评分矩阵R的条件分布p为:
Figure FDA0002852150830000011
其中R表示评分矩阵,R={Rij},Rij为用户i对游戏j的评分,i为用户序号,i=1,2,3...L,L为用户总数,j为游戏序号,j=1,2,3...M,M为游戏总数,U为用户特征矩阵,U={Ui},Ui表示用户i的特征向量,V为游戏特征矩阵,V={Vj},Vj表示游戏j的特征向量,α2为Rij的方差,
Figure FDA0002852150830000012
表示Rij服从均值为Ui TVj,方差为α2的高斯分布,T为转置符号,Iij是一个矩阵,如果用户i给游戏j打分,则Iij为1,否则为0;
步骤2,使用卷积神经网络从桌游描述文本中提取桌游特征向量,形式化表示为:CNN(Xj,Wcnn),其中,Xj是游戏j的描述文本,Wcnn是卷积神经网络内部的权重参数;
步骤3,使用多层感知机从桌游属性信息中提取桌游特征向量,形式化表示为MLP(Yj,Wmlp),其中,Yj是游戏j的属性信息,Wmlp表示多层感知机网络内部的权重参数;
步骤4,将CNN(Xj,Wcnn)和MLP(Yj,Wmlp)进行融合,用CM表示如下:
CM(Xj,Yj,Wcnn,Wmlp,Wcm)=relu(Wcm*concatenate(CNN(Xj,Wcnn),MLP(Yj,Wmlp)))
其中concatenate为拼接函数,relu为激活函数,Wcm为融合层权重参数;
步骤5,将游戏j的特征向量Vj定义为:Vj=CM(Xj,Yj,WV)+ξj,WV={Wcnn,Wmlp,Wcm},设定WV的条件分布为
Figure FDA0002852150830000013
即对于WV中的每一个参数wk,均值为0,方差为
Figure FDA0002852150830000014
k为WV中权重参数的序号,k=1,2,3...|wk|,|wk|为WV中权重参数的个数,ξj为从评分矩阵中学习到的游戏特征,ξj服从均值为0,方差
Figure FDA00028521508300000221
的高斯球形分布,即
Figure FDA0002852150830000021
I为单位矩阵;
步骤6,游戏特征矩阵的条件分布为:
Figure FDA0002852150830000022
其中X为游戏描述文本集,Y为游戏属性信息集,
Figure FDA0002852150830000023
为Vj中每个分量的方差,
Figure FDA0002852150830000024
表示Vj服从均值为CM(Xj,Yj,WV),方差为
Figure FDA0002852150830000025
的高斯球形分布;
步骤7,使用用户已评分游戏的特征结合注意力机制来增强用户特征表示,表示为UA,
Figure FDA0002852150830000026
其中
Figure FDA0002852150830000027
a表示采用自注意力机制对
Figure FDA0002852150830000028
进行信息汇总,得到的注意力向量,
Figure FDA0002852150830000029
为用户i已评分游戏的特征向量组成的矩阵,Wa1和Wa2为权重参数,softmax和tanh为激活函数;
步骤8,用户i的特征向量定义为:
Figure FDA00028521508300000210
其中,WU为上一步提取用户特征时的权重参数,WU={Wa1,Wa2},设定WU的条件分布为
Figure FDA00028521508300000211
即对于WU中的每一个参数wt,均值为0,方差为
Figure FDA00028521508300000212
t为WU中权重参数的序号,t=1,2,3...|wt|,|wt|为WU中权重参数的个数,δi表示从评分矩阵中学习到的用户特征,δi服从均值为0,方差为
Figure FDA00028521508300000213
的高斯球形分布,即
Figure FDA00028521508300000214
步骤9,用户特征矩阵的条件分布为:
Figure FDA00028521508300000215
其中VU为每个用户已评分游戏的特征向量组成的矩阵集合;
Figure FDA00028521508300000216
为Ui中的每个分量的方差,
Figure FDA00028521508300000217
表示Ui服从均值为
Figure FDA00028521508300000218
方差为
Figure FDA00028521508300000219
的高斯球形分布;
步骤10,使用最大后验估计优化模型中的变量、参数,公式如下:
Figure FDA00028521508300000220
步骤11,通过取负对数,上式表示为:
Figure FDA0002852150830000031
其中,
Figure FDA0002852150830000032
步骤12,采用坐标下降法更新Vj:
Vj←(UIjUTUI)-1(URjVCM(Xj,Yj,WV))
其中,Ij是一个对角矩阵,其对角元素是Iij中第j列元素,Rj是一个向量,向量值为Rij中第j列元素值;
步骤13,采用坐标下降法更新Ui
Figure FDA0002852150830000033
其中,Ii是一个对角矩阵,它的对角元素是Iij中第i行元素,Ri是一个向量,向量值为Rij中第i行元素值;
步骤14,根据ε(WV)使用反向传播算法更新WV
Figure FDA0002852150830000034
步骤15,根据ε(WU)使用反向传播算法更新WU
Figure FDA0002852150830000035
步骤16,循环执行12-15步优化模型中的变量和参数,直至收敛;
步骤17,使用优化后的U、V、WU、WV,预测用户对游戏的未知评分:
Figure FDA0002852150830000036
步骤18,为了评估本文模型的性能,使用均方根误差(RMSE)作为评价标准,均方根误差值越低,代表效果越好。
2.根据权利要求1所述基于多源异构数据的桌游混合推荐方法,其特征在于,所述桌游属性信息包括:游戏最少人数、游戏最多人数、游戏平均时间、游戏类别和游戏机制。
3.根据权利要求1所述基于多源异构数据的桌游混合推荐方法,其特征在于,将所述桌游属性信息分为类别信息和数值信息,类别信息有:游戏类别和游戏机制,数值信息有:游戏最少人数、游戏最多人数和游戏平均时间;对于类别信息,将其通过embedding降维,对于数值信息,进行Min-Max标准化,将处理后的属性信息进行拼接后使用多层感知机从中提取桌游特征向量。
4.根据权利要求1所述基于多源异构数据的桌游混合推荐方法,其特征在于,所述均方根误差的定义为:
Figure FDA0002852150830000041
S为测试集中的评分数。
CN202011531148.XA 2020-12-22 2020-12-22 一种基于多源异构数据的桌游混合推荐方法 Active CN112569608B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011531148.XA CN112569608B (zh) 2020-12-22 2020-12-22 一种基于多源异构数据的桌游混合推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011531148.XA CN112569608B (zh) 2020-12-22 2020-12-22 一种基于多源异构数据的桌游混合推荐方法

Publications (2)

Publication Number Publication Date
CN112569608A true CN112569608A (zh) 2021-03-30
CN112569608B CN112569608B (zh) 2022-03-25

Family

ID=75138898

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011531148.XA Active CN112569608B (zh) 2020-12-22 2020-12-22 一种基于多源异构数据的桌游混合推荐方法

Country Status (1)

Country Link
CN (1) CN112569608B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909540A (zh) * 2015-12-23 2017-06-30 神州数码信息***有限公司 一种基于协同学习的智慧城市市民偏好发现技术
CN108959603A (zh) * 2018-07-13 2018-12-07 北京印刷学院 基于深度神经网络的个性化推荐***及方法
CN109255049A (zh) * 2018-09-05 2019-01-22 广州小楠科技有限公司 一种智慧音乐推荐***
CN109635989A (zh) * 2018-08-30 2019-04-16 电子科技大学 一种基于多源异构数据融合的社交网络链路预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909540A (zh) * 2015-12-23 2017-06-30 神州数码信息***有限公司 一种基于协同学习的智慧城市市民偏好发现技术
CN108959603A (zh) * 2018-07-13 2018-12-07 北京印刷学院 基于深度神经网络的个性化推荐***及方法
CN109635989A (zh) * 2018-08-30 2019-04-16 电子科技大学 一种基于多源异构数据融合的社交网络链路预测方法
CN109255049A (zh) * 2018-09-05 2019-01-22 广州小楠科技有限公司 一种智慧音乐推荐***

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
WEIHUA YUAN 等: "Wide and Deep Model of Multi-Source Information-Aware Recommender System", 《IEEE ACCESS》 *
冀振燕 等: "基于深度学习的融合多源异构数据的推荐模型", 《北京邮电大学学报》 *
邱丰羽: "融合多源异构数据的推荐模型与***", 《中国优秀博硕士学位论文全文数据库(硕士) 信息科技辑》 *

Also Published As

Publication number Publication date
CN112569608B (zh) 2022-03-25

Similar Documents

Publication Publication Date Title
CN107330049B (zh) 一种新闻热度预估方法及***
CN111949865A (zh) 基于图神经网络与用户长短期偏好的兴趣点推荐方法
CN108304359B (zh) 无监督学习统一特征提取器构建方法
CN110362738B (zh) 一种基于深度学习的结合信任和影响力的个性化推荐方法
CN107992531A (zh) 基于深度学习的新闻个性化智能推荐方法与***
CN111061962B (zh) 一种基于用户评分分析的推荐方法
CN107608956A (zh) 一种基于cnn‑grnn的读者情绪分布预测算法
CN110674850A (zh) 一种基于注意力机制的图像描述生成方法
CN108763362A (zh) 基于随机锚点对选择的局部模型加权融合Top-N电影推荐方法
CN111242729A (zh) 一种基于长短期兴趣的序列化推荐方法
CN112925977A (zh) 一种基于自监督图表征学习的推荐方法
CN113807422B (zh) 融合多特征信息的加权图卷积神经网络评分预测模型
CN107635151A (zh) 一种基于域分解机的机器学习电视节目推荐方法
CN112631560B (zh) 一种推荐模型的目标函数的构建方法及终端
CN112464100B (zh) 信息推荐模型训练方法、信息推荐方法、装置及设备
CN111241394A (zh) 数据处理方法、装置、计算机可读存储介质及电子设备
CN114332519A (zh) 一种基于外部三元组和抽象关系的图像描述生成方法
CN116401542A (zh) 一种多意图多行为解耦推荐方法及装置
CN116595975A (zh) 一种基于句信息进行词信息增强的方面级情感分析方法
CN112569608B (zh) 一种基于多源异构数据的桌游混合推荐方法
CN112085158A (zh) 一种基于堆栈降噪自编码器的图书推荐方法
CN110347825A (zh) 一种短英文影评分类方法及装置
CN113449200B (zh) 物品推荐方法、装置及计算机存储介质
CN115809374B (zh) 纠正推荐***主流偏差的方法、***、设备及存储介质
CN113033693A (zh) 一种融合用户主观属性的个性化图像美学评价方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant