CN105912729A - 基于三维时序动态模型的***推荐*** - Google Patents

基于三维时序动态模型的***推荐*** Download PDF

Info

Publication number
CN105912729A
CN105912729A CN201610333731.7A CN201610333731A CN105912729A CN 105912729 A CN105912729 A CN 105912729A CN 201610333731 A CN201610333731 A CN 201610333731A CN 105912729 A CN105912729 A CN 105912729A
Authority
CN
China
Prior art keywords
game
user
label
tensor
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610333731.7A
Other languages
English (en)
Other versions
CN105912729B (zh
Inventor
董守斌
王进
董守玲
胡金龙
张晶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201610333731.7A priority Critical patent/CN105912729B/zh
Publication of CN105912729A publication Critical patent/CN105912729A/zh
Application granted granted Critical
Publication of CN105912729B publication Critical patent/CN105912729B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于三维时序动态模型的***推荐***,包括用户行为数据获取模块、游戏信息获取模块、用户行为分析模块、游戏标签模块、时序动态模型模块、游戏推荐模块。本发明***根据获取的用户行为数据进行用户动态行为分析,并追踪新老用户的兴趣变化,在用户兴趣发生变化或可能流失时,综合考虑与用户兴趣游戏相似度较高的游戏以及游戏的热门度,给用户最优的推荐结果。本发明结合游戏和用户的时效性,制定了基于时间窗的用户活跃度评分计算方法。并引用游戏标签来对用户进行相应的映射,从而丰富了游戏推荐的多样性,让用户感受不断有新元素变化的游戏推荐,增强了游戏推荐的新颖性。

Description

基于三维时序动态模型的***推荐***
技术领域
本发明涉及产品推荐的技术领域,尤其是指一种基于三维时序动态模型的***推荐***。
背景技术
随着大数据时代的到来和***越来越盛行,***用户呈现***式增长。游戏运营平台一般直接把热门游戏推荐给用户,并未充分利用用户的信息,进行针对性的个性化推荐。盲目的推荐结果会给用户带来困扰,并增加企业的推广费用,这使得目前游戏运营平台的游戏用户流失率很高。***运营平台竞争激烈,如何吸引新用户并且继续留住平台的老用户是游戏运营平台的核心问题。因此结合大数据分析用户行为,捕捉用户的动态兴趣变化,利用用户的动态行为信息具有重大的意义。本发明利用张量模型的优势,提出三维时序动态推荐方法,深入挖掘用户的潜在时间行为信息,提高推荐效果,将有利于改善用户的体验感,减少用户的流失率。
传统的协同过滤的推荐算法,存在用户的冷启动问题和数据稀疏性问题,但基于张量分解的推荐算法能够很好的处理上述问题,于是张量分解模型开始被各个领域所应用,例如医学上的药品个性化推荐,基于用户信任的社会网络推荐等;张量模型中张量分解方法分为CP分解和Tucker分解两种方法。本发明引用张量Tucker分解方法,张量Tucker分解方法是将一个张量表示成一个核心张量,沿着不同维度乘上因子矩阵,简单来讲就是将复杂的矩阵,分解为多个简单矩阵的乘积,减少计算量。目前游戏运营平台也同样存在着数据稀疏性的问题,引用张量模型结合时间信息在游戏领域应用是一个新领域的尝试,与此同时还能够利用张量模型的另外一个优点,不破坏数据的结构特性,减少信息的丢失,并能够减缓数据稀疏问题,提高推荐性能,增加游戏收益。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于三维时序动态模型的***推荐***,能够实时捕捉用户的动态兴趣变化并结合用户的历史兴趣进行相应的游戏推荐。
为实现上述目的,本发明所提供的技术方案为:基于三维时序动态模型的***推荐***,包括:
用户行为数据获取模块,从相关游戏运营平台获取用户行为日志;
游戏信息获取模块,通过对相应***推荐平台的官网对游戏的简介信息进行爬取与数据预处理;
用户行为分析模块,在导入用户行为日志后,对日志进行数据分析、数据向量化,构成用户的特征向量;
游戏标签模块,通过相关的游戏内容简介进行相应游戏标签标注,并将标签转换为向量形式;
时序动态模型模块,根据游戏标签模块和用户行为分析模块,基于张量模型建立相应的三维时序动态模型,挖掘***,分析用户的动态兴趣与热门的游戏标签随时间的变化发生变化;
游戏推荐模块,根据时序动态模型进行相应的计算,得到用户的动态兴趣和当时游戏标签的热门度,与此同时结合用户的历史兴趣,给出相应的游戏标签推荐,并发布在游戏运营平台上。
所述用户行为数据获取模块,从游戏运营平台采集用户行为数据,并以日志的形式存储,而游戏运营平台通过游戏用户对游戏产生的行为,生成相应的游戏日志传输到相应游戏平台的服务器端;
所述用户行为数据,包括:
用户的手机硬件信息,包括imei、手机型号、手机卡的运营商、手机的屏幕大小;
用户对游戏的登陆信息:登陆时间,登陆的游戏;
用户玩游戏的信息:等级变化的时间,玩游戏的等级;
用户的充值信息:充值的时间、充值额。
所述游戏信息获取模块,通过对相应的游戏运营平台,对相应的游戏利用检索爬虫***,爬取相应的游戏内容简介,并整理数据。
所述用户行为分析模块,对每个日志进行相应的数据分析处理,初始化日志用于分析用户硬件信息的字段有:imei、time、bd、cn、sw、sh,其中imei是用户的手机唯一标识,进行了保护用户隐私处理,用该字段分析用户的依据是游戏平台推广的统一,time是记录相应时刻的时间戳字段,然后通过时间戳转化成年、月、日、时、周,bd是用户的机型品牌,cn是运营商名称字段,sw和sh分别是用户手机屏幕的宽和高,将文字信息量化,方便模型的分析,登陆日志用于分析用户活跃度评分的字段:imei、time、aid,其中aid是游戏的id,将游戏量化的一种编号,计算用户活跃度评分;
用户活跃度评分计算,根据当前时间窗,用户在时间窗内,最高分记为M,最低分记为1;计算公式:
WDUrating=UMax-UMin
其中,WDUrating表示为用户的周活跃度评分,UMax为用户在时间窗最后一次登陆的分数,UMin为用户在时间窗第一次登陆的分数,分数就是相应的天数,时间窗内以第一天登录的记为分数1;这样划分的依据是能够发现潜在信息,并不影响评分;同时也能够很好的将活跃用户和不活跃用户即只出现一次的登录用户区别开;另外一个目的是减少计算量,推进一天,大部分信息对第二个评分窗具有参考意义,时间衔接时,评分规则一样,另外考虑手游的特性,需要将用户活跃度评分最高的分值对应的游戏存取作为用户参考的历史兴趣;随着用户的活跃度的提升,不影响模型的稳定性;等级日志用于分析用户对游戏喜爱度评分的字段有:imei、time、aid、rgrade,其中rgrade是用户玩游戏的相应等级,用户对游戏的喜爱度评分,通过用户玩家对游戏的等级来说明用户对该游戏的一种喜爱度,设置多个用户等级阈值,评分范围在1-M;结合用户活跃度评分进行数据互相填补,用户同时出现在两个表的取最大分数作为用户对游戏的评分,将用户喜爱度评分表与用户活跃度表进行表融合并成为用户活跃度评分表,将对应的游戏存储作为用户的历史兴趣;消费日志用于分析用户的历史兴趣的字段有:imei、create_time、aid、pay_realmoney,其中pay_realmoney是用户充值真实额,对用户pay_realmoney大于0的作为用户对游戏喜爱的历史兴趣存储。
所述游戏标签模块,包含游戏标签、游戏相似列表、热门游戏标签列表;其中游戏标签是根据游戏内容简介中游戏的关键词,作为相应游戏的标签;然后根据游戏标签的频率,对游戏标签赋予不同的权值,根据相应的标签的最高频率值进行单位化使得所有标签权值范围在0-1;将游戏名称和标签名称相应的量化,游戏根据游戏日志中aid对应起来,并建立游戏标签的向量,(B1,W1,…,Bn,Wn),Bi为标签,Wi为对于标签的权值;某个游戏的相似列表根据某个游戏的aid对应的标签向量,根据余弦相似度计算,得到该游戏的相应游戏相似列表;相似度计算公式:
S i m = ( a , b ) | | a | | * | | b | |
其中,Sim为余弦相似度,(a,b)为a的向量与b的向量内积,||a||,||b||分别为a向量的模长,b向量的模长,a、b是游戏aid的特征向量,相似度计算都是以余弦相似度计算为准,热门游戏标签列表是时间窗内对游戏标签频率前n个最高,求出时间窗内热门游戏标签列表。
所述时序动态模型模块,包含时间窗、用户行为的特征、游戏标签,时间窗是指一个时间段的窗口,根据不同数据集特性改变;用户行为的特征是根据用户对游戏的活跃度评分结合用户对游戏的喜爱度评分融合的表,并结合游戏标签的向量表,然后引用张量模型根据用户、游戏、游戏标签建立时序动态模型,并通过张量Tucker分解方法,调节张量分解相关参数,利用用户-游戏,游戏-游戏标签信息,得到用户对某个游戏某些标签新的评分估值;利用张量模型中的用户对游戏某些标签权值,整合为用户对标签的相应的特征向量,然后结合游戏-标签两个维度,对用户-标签与游戏-标签求相似度就能够得到用户评分高的前N个游戏标签列表;张量的定义:设V1,…,VN为维数分别为I1,…,IN的N个有限维欧几里得空间,对于N个向量u1∈V1,…,un∈VN,定义V1×…×VN上的线性映射(u1…un)计算如下:
(u1…un)(x1…xN)=<u1,x1>V1…<un,xN>VN
其中,<ui,xi>Vi为Vi上的标量积,xi为Vi上的任意向量(i=1,i=2,…,N),则整个(u1…un)构成的空间称为V1,…,VN的张量空间,此张量空间上的元素称为V1×…×VN上的N阶张量;如果则此张量空间分别称为N阶I1,…,IN维实张量空间,记为而对于N阶张量其矩阵展开形式张量的元素(i1,i2,…,iN)映射到矩阵元素(in,j),映射关系为张量Tucker分解方法是一种高阶的主成分分析方法,它将原始张量分解为核心张量和一系列矩阵乘积的形式,张量分解在求解过程中能够进行降维处理;Tucker分解方法,一个张量按下面公式去理解:
X≈Y×U(1)×U(2)×…×U(N)
其中,Y为核心张量;U(1),U(2),…,U(N)为一系列正交矩阵,根据投影矩阵U的正交性UUT=E,其中UT为U的转置矩阵,E为单位矩阵;从而能够根据上面的张量X公式,两边乘以U(1)T,U(2)T,…,U(N)T,求得核心张量Y:
Y≈X×U(1)T×U(2)T…×U(N)T
时序动态模型的建立,数据是一个四维的数据元组(u,g,k,t),是一个用户u,g是一个游戏,k是一个标签,t是某个时间窗;模型根据用户-游戏-标签建立一个三阶张量n(u)是用户的集合,n(g)是游戏的集合,n(k)是某一游戏的标签集合;在某个时间窗内,得到一个用户-游戏-标签的三元权值Wu,g,k,根据三元权值建立张量模型,模型张量公式:
X t ≈ Y t × U t ( u ) × G t ( g ) × K t ( k )
其中,是核心张量,表示用户、游戏、标签之间的关系;表示用户的相关矩阵,表示游戏的相关矩阵,表示标签的相关矩阵;在某个时间窗内,Wu,g,k的计算根据用户对该游戏的活跃度评分乘以标签的权值得到,Wu,g,k=Au,g×Bu,g,k,其中u∈n(u),g∈n(g),k∈n(k),Au,g表示用户对某个游戏的活跃度评分,Bu,g,k表示对于给定用户u、游戏g、标签k在标签向量中的权重值,并且满足约束条件
所述游戏推荐模块,包含用户喜欢的游戏标签列表、游戏对应的标签、用户喜欢的游戏、游戏平台对用户进行相应游戏应用推荐,用户喜爱的游戏标签列表是由时序动态模型模块得到,游戏对应的标签是由游戏标签模块得到,用户喜欢的游戏列表是通过用户喜欢的游戏标签表和游戏对应的标签,映射得到的结果表,用户喜欢的游戏是通过筛选和权值得到,筛选和权值考虑是根据用户喜欢的游戏列表结合该用户的历史兴趣游戏列表和热门的游戏标签列表,对用户喜欢的游戏列表赋予权值α,对用户的历史兴趣游戏列表赋予权值β,且满足α+β=1,调节α,β的权值,得到一个新的用户喜欢的游戏列表,再结合热门的游戏标签进行优先筛选,游戏列表中有游戏的标签包含热门标签的优先推荐,达到推荐更具新颖性结果;从而得到用户喜欢的游戏,游戏平台对用户进行相应游戏应用推荐是根据用户喜欢的游戏转换为游戏应用推荐,从而达到最后根据用户兴趣变化与当前游戏热门度给出推荐。
本发明与现有技术相比,具有如下优点与有益效果:
1、本发明的基于三维时序动态模型的***推荐***,根据获取的用户行为数据进行用户动态行为分析,并追踪新老用户的兴趣变化,在用户兴趣发生变化或可能流失时,综合考虑与用户兴趣游戏相似度较高的游戏以及游戏的热门度,给用户最优的推荐结果。
2、本发明结合游戏和用户的时效性,制定了基于时间窗的用户活跃度评分计算方法。并引用游戏标签来对用户进行相应的映射,从而丰富了游戏推荐的多样性,让用户感受不断有新元素变化的游戏推荐,增强了游戏推荐的新颖性。
3、本发明引用张量模型建立三维时序动态模型,是一个创新亮点,而引用张量模型的优势是,不破坏数据的结构特性,减少信息的丢失。本发明的技术方案根据不同时间段用户对游戏标签不同的偏爱,了解用户的兴趣变化,能够在很好地留住老用户的同时减少新用户的流失,并改善用户的体验感。并通过针对性的游戏推荐使得游戏运营公司可根据用户的行为习惯做出相应的策略调整,并减少营销推广费用。
附图说明
图1为本发明的***推荐***的原理框图。
图2为本发明的用户行为分析模块的原理框图。
图3为本发明的游戏标签模块的原理框图。
图4为本发明的时序动态模型模块的原理框图。
图5为本发明的游戏推荐模块的原理框图。
图6为用户活跃度评分计算的原理框图。
图7为张量Tucker分解的原理框图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
如图1所示,本实施例所述的基于三维时序动态模型的***推荐***,包括用户行为数据获取模块、游戏信息获取模块、用户行为分析模块、游戏标签模块、时序动态模型模块、游戏推荐模块。所述的用户行为数据获取模块是从相关游戏运营平台获取用户行为日志;所述的游戏信息获取模块,通过对相应***推荐平台的官网对游戏的简介信息进行爬取与数据预处理;所述的用户行为分析模块在导入用户行为日志后,对日志进行数据分析、数据向量化,构成用户的特征向量;所述的游戏标签模块,通过相关的游戏内容简介进行相应游戏标签标注,并将标签转换为向量形式;所述的时序动态模型模块,根据游戏标签模块和用户行为分析模块,基于张量模型建立相应的三维时序动态模型,挖掘***,分析用户的动态兴趣与热门的游戏标签随时间的变化发生变化;所述的游戏推荐模块,根据时序动态模型进行相应的计算,得到用户的动态兴趣和当时游戏标签的热门度,与此同时结合用户的历史兴趣,给出相应的游戏标签推荐,并发布在游戏运营平台上。
下面对各个模块的具体实现原理进行阐述:
所述的用户行为数据获取模块,是从游戏运营平台采集用户行为数据,并以日志的形式存储,而游戏运营平台通过游戏用户对游戏产生的行为,生成相应的游戏日志传输到相应游戏平台的服务器端。用户行为数据包括:用户的手机硬件信息,包括imei(用户的手机唯一标示符)、手机型号、手机卡的运营商、手机的屏幕大小等;用户对游戏的登陆信息:登陆时间,登陆的游戏等;用户玩游戏的信息:等级变化的时间,玩游戏的等级等;用户的充值信息:充值的时间、充值额等。
所述的游戏信息获取模块,通过对相应的游戏运营平台,对相应的游戏利用一般的检索爬虫***,爬取相应的游戏内容简介,并整理数据。
如图2所示,所述的用户行为分析模块,对每个日志进行相应的数据分析处理,初始化日志用于分析用户硬件信息的字段有:imei、time、bd、cn、sw、sh,其中imei是用户的手机唯一标识,进行了保护用户隐私处理,用该字段分析用户的依据是游戏平台推广的统一,time是记录相应时刻的时间戳字段,然后通过时间戳转化成年、月、日、时、周,bd是用户的机型品牌,cn是运营商名称字段,sw和sh分别是用户手机屏幕的宽和高,我们需要将文字信息量化,方便模型的分析,登陆日志用于分析用户活跃度评分的字段:imei、time、aid,其中aid是游戏的id,将游戏量化的一种编号,计算用户活跃度评分。
如图6所示,为本发明用户活跃度评分计算,根据当前时间窗,用户在时间窗内,最高分记为M,最低分记为1;计算公式:
WDUrating=UMax-UMin
其中,WDUrating表示为用户的周活跃度评分,UMax为用户在时间窗最后一次登陆的分数,UMin为用户在时间窗第一次登陆的分数,分数就是相应的天数,时间窗内以第一天登录的记为分数1;这样划分的依据是能够发现潜在信息,并不影响评分(例如:用四个特征去存取这样的信息,第一个特征存取参考基准,第二个记录评分的当天是周几,第三个基于参考点的间隔天数,第四个基于评分规则评分,发掘用户的潜在信息,并有利于分析用户行为);同时也能够很好的将活跃用户和不活跃用户(只出现一次的登录用户)区别开;另外一个目的是减少计算量,推进一天,大部分信息对第二个评分窗具有参考意义,时间衔接时,评分规则一样,另外考虑手游的特性,需要将用户活跃度评分最高的分值对应的游戏存取作为用户参考的历史兴趣;随着用户的活跃度的提升,不影响模型的稳定性;等级日志用于分析用户对游戏喜爱度评分的字段有:imei、time、aid、rgrade,其中rgrade是用户玩游戏的相应等级,用户对游戏的喜爱度评分,例如,通过用户玩家对游戏的等级来说明用户对该游戏的一种喜爱度,设置多个用户等级阈值,评分范围在1-M;结合用户活跃度评分进行数据互相填补,用户同时出现在两个表的取最大分数作为用户对游戏的评分,将用户喜爱度评分表与用户活跃度表进行表融合并成为用户活跃度评分表,将他对应的游戏存储作为用户的历史兴趣;消费日志用于分析用户的历史兴趣的字段有:imei、create_time、aid、pay_realmoney,其中pay_realmoney是用户充值真实额,对用户pay_realmoney大于0的作为用户对游戏喜爱的历史兴趣存储。
如图3所示,所述的游戏标签模块,该模块包含游戏标签、游戏相似列表、热门游戏标签列表;其中游戏标签是根据游戏内容简介中游戏的关键词,作为相应游戏的标签;然后根据游戏标签的频率,对游戏标签赋予不同的权值,根据相应的标签的最高频率值进行单位化使得所有标签权值范围在0-1;将游戏名称和标签名称相应的量化,游戏根据游戏日志中aid对应起来,并建立游戏标签的向量,(B1,W1,…,Bn,Wn),Bi为标签,Wi为对于标签的权值;某个游戏的相似列表根据某个游戏的aid对应的标签向量,根据余弦相似度计算,得到该游戏的相应游戏相似列表;相似度计算公式:
S i m = ( a , b ) | | a | | * | | b | |
其中,Sim为余弦相似度,(a,b)为a的向量与b的向量内积,||a||,||b||分别为a向量的模长,b向量的模长,a、b是游戏aid的特征向量,本发明中的相似度计算都是以余弦相似度计算为准,热门游戏标签列表是时间窗内对游戏标签频率前n个最高,求出时间窗内热门游戏标签列表。
如图4所示,所述的时序动态模型模块,该模块包含时间窗、用户行为的特征、游戏标签,时间窗是指例如一个星期为一个时间段的窗口,根据不同数据集特性改变;用户行为的特征是根据用户对游戏的活跃度评分结合用户对游戏的喜爱度评分融合的表,并结合游戏标签的向量表,然后引用张量模型根据用户、游戏、游戏标签建立时序动态模型,并通过张量Tucker分解方法如图7,调节张量分解相关参数(例如:核心张量的维度)利用用户-游戏,游戏-游戏标签信息,得到用户对某个游戏某些标签新的评分估值。利用张量模型中的用户对游戏某些标签权值,整合为用户对标签的相应的特征向量,然后结合游戏-标签两个维度,对用户-标签与游戏-标签求相似度就可以得到用户评分高的前N个游戏标签列表;张量的定义:设V1,…,VN为维数分别为I1,…,IN的N个有限维欧几里得空间,对于N个向量u1∈V1,…,un∈VN,定义V1×…×VN上的线性映射(u1…un)计算如下:
(u1…un)(x1…xN)=<u1,x1>V1…<un,xN>VN
其中,<ui,xi>Vi为Vi上的标量积,xi为Vi上的任意向量(i=1,i=2,…,N),则整个(u1…un)构成的空间称为V1,…,VN的张量空间,此张量空间上的元素称为V1×…×VN上的N阶张量。如果n=1,…,N,则此张量空间分别称为N阶I1,…,IN维实张量空间,记为而对于N阶张量其矩阵展开形式张量的元素(i1,i2,…,iN)映射到矩阵元素(in,j),映射关系为张量Tucker分解方法是一种高阶的主成分分析方法,它将原始张量分解为核心张量和一系列矩阵乘积的形式,张量分解在求解过程中可以进行降维处理;Tucker分解方法,一个张量可以按下面公式和图7去理解:
X≈Y×U(1)×U(2)×…×U(N)
其中,Y为核心张量;U(1),U(2),…,U(N)为一系列正交矩阵,根据投影矩阵U的正交性UUT=E,其中UT为U的转置矩阵,E为单位矩阵;我们从而可以根据上面的张量X公式,两边乘以U(1)T,U(2)T,…,U(N)T,可以求得核心张量Y:
Y≈X×U(1)T×U(2)T…×U(N)T
时序动态模型的建立,数据是一个四维的数据元组(u,g,k,t),是一个用户u,g是一个游戏,k是一个标签,t是某个时间窗;模型根据用户-游戏-标签建立一个三阶张量n(u)是用户的集合,n(g)是游戏的集合,n(k)是某一游戏的标签集合;在某个时间窗内,可以得到一个用户-游戏-标签的三元权值Wu,g,k,根据三元权值建立张量模型,模型张量公式:
X t ≈ Y t × U t ( u ) × G t ( g ) × K t ( k )
其中,是核心张量,表示用户、游戏、标签之间的关系;表示用户的相关矩阵,表示游戏的相关矩阵,表示标签的相关矩阵;在某个时间窗内,Wu,g,k的计算根据用户对该游戏的活跃度评分乘以标签的权值得到,Wu,g,k=Au,g×Bu,g,k,其中u∈n(u),g∈n(g),k∈n(k),Au,g表示用户对某个游戏的活跃度评分,Bu,g,k表示对于给定用户u、游戏g、标签k在标签向量中的权重值,并且满足约束条件
如图5所示,所述的游戏推荐模块,该模块包含用户喜欢的游戏标签列表、游戏对应的标签、用户喜欢的游戏、游戏平台对用户进行相应游戏应用推荐,用户喜爱的游戏标签列表是由时序动态模型模块得到,游戏对应的标签是由游戏标签模块得到,用户喜欢的游戏列表是通过用户喜欢的游戏标签表和游戏对应的标签,映射得到的结果表,用户喜欢的游戏是通过筛选和权值得到,筛选和权值考虑是根据用户喜欢的游戏列表结合该用户的历史兴趣游戏列表和热门的游戏标签列表,对用户喜欢的游戏列表赋予权值α,对用户的历史兴趣游戏列表赋予权值β,且满足α+β=1,调节α,β的权值,得到一个新的用户喜欢的游戏列表,再结合热门的游戏标签进行优先筛选,游戏列表中有游戏的标签包含热门标签的优先推荐,达到推荐更具新颖性结果;从而得到用户喜欢的游戏,游戏平台对用户进行相应游戏应用推荐是根据用户喜欢的游戏转换为游戏应用推荐,从而达到最后根据用户兴趣变化与当前游戏热门度给出推荐。
以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。

Claims (7)

1.基于三维时序动态模型的***推荐***,其特征在于,包括:
用户行为数据获取模块,从相关游戏运营平台获取用户行为日志;
游戏信息获取模块,通过对相应***推荐平台的官网对游戏的简介信息进行爬取与数据预处理;
用户行为分析模块,在导入用户行为日志后,对日志进行数据分析、数据向量化,构成用户的特征向量;
游戏标签模块,通过相关的游戏内容简介进行相应游戏标签标注,并将标签转换为向量形式;
时序动态模型模块,根据游戏标签模块和用户行为分析模块,基于张量模型建立相应的三维时序动态模型,挖掘***,分析用户的动态兴趣与热门的游戏标签随时间的变化发生变化;
游戏推荐模块,根据时序动态模型进行相应的计算,得到用户的动态兴趣和当时游戏标签的热门度,与此同时结合用户的历史兴趣,给出相应的游戏标签推荐,并发布在游戏运营平台上。
2.根据权利要求1所述的基于三维时序动态模型的***推荐***,其特征在于:所述用户行为数据获取模块,从游戏运营平台采集用户行为数据,并以日志的形式存储,而游戏运营平台通过游戏用户对游戏产生的行为,生成相应的游戏日志传输到相应游戏平台的服务器端;
所述用户行为数据,包括:
用户的手机硬件信息,包括imei、手机型号、手机卡的运营商、手机的屏幕大小;
用户对游戏的登陆信息:登陆时间,登陆的游戏;
用户玩游戏的信息:等级变化的时间,玩游戏的等级;
用户的充值信息:充值的时间、充值额。
3.根据权利要求1所述的基于三维时序动态模型的***推荐***,其特征在于:所述游戏信息获取模块,通过对相应的游戏运营平台,对相应的游戏利用检索爬虫***,爬取相应的游戏内容简介,并整理数据。
4.根据权利要求1所述的基于三维时序动态模型的***推荐***,其特征在于:所述用户行为分析模块,对每个日志进行相应的数据分析处理,初始化日志用于分析用户硬件信息的字段有:imei、time、bd、cn、sw、sh,其中imei是用户的手机唯一标识,进行了保护用户隐私处理,用该字段分析用户的依据是游戏平台推广的统一,time是记录相应时刻的时间戳字段,然后通过时间戳转化成年、月、日、时、周,bd是用户的机型品牌,cn是运营商名称字段,sw和sh分别是用户手机屏幕的宽和高,将文字信息量化,方便模型的分析,登陆日志用于分析用户活跃度评分的字段:imei、time、aid,其中aid是游戏的id,将游戏量化的一种编号,计算用户活跃度评分;
用户活跃度评分计算,根据当前时间窗,用户在时间窗内,最高分记为M,最低分记为1;计算公式:
WDUrating=UMax-UMin
其中,WDUrating表示为用户的周活跃度评分,UMax为用户在时间窗最后一次登陆的分数,UMin为用户在时间窗第一次登陆的分数,分数就是相应的天数,时间窗内以第一天登录的记为分数1;这样划分的依据是能够发现潜在信息,并不影响评分;同时也能够很好的将活跃用户和不活跃用户即只出现一次的登录用户区别开;另外一个目的是减少计算量,推进一天,大部分信息对第二个评分窗具有参考意义,时间衔接时,评分规则一样,另外考虑手游的特性,需要将用户活跃度评分最高的分值对应的游戏存取作为用户参考的历史兴趣;随着用户的活跃度的提升,不影响模型的稳定性;等级日志用于分析用户对游戏喜爱度评分的字段有:imei、time、aid、rgrade,其中rgrade是用户玩游戏的相应等级,用户对游戏的喜爱度评分,通过用户玩家对游戏的等级来说明用户对该游戏的一种喜爱度,设置多个用户等级阈值,评分范围在1-M;结合用户活跃度评分进行数据互相填补,用户同时出现在两个表的取最大分数作为用户对游戏的评分,将用户喜爱度评分表与用户活跃度表进行表融合并成为用户活跃度评分表,将对应的游戏存储作为用户的历史兴趣;消费日志用于分析用户的历史兴趣的字段有:imei、create_time、aid、pay_realmoney,其中pay_realmoney是用户充值真实额,对用户pay_realmoney大于0的作为用户对游戏喜爱的历史兴趣存储。
5.根据权利要求1所述的基于三维时序动态模型的***推荐***,其特征在于:所述游戏标签模块,包含游戏标签、游戏相似列表、热门游戏标签列表;其中游戏标签是根据游戏内容简介中游戏的关键词,作为相应游戏的标签;然后根据游戏标签的频率,对游戏标签赋予不同的权值,根据相应的标签的最高频率值进行单位化使得所有标签权值范围在0-1;将游戏名称和标签名称相应的量化,游戏根据游戏日志中aid对应起来,并建立游戏标签的向量,(B1,W1,…,Bn,Wn),Bi为标签,Wi为对于标签的权值;某个游戏的相似列表根据某个游戏的aid对应的标签向量,根据余弦相似度计算,得到该游戏的相应游戏相似列表;相似度计算公式:
S i m = ( a , b ) | | a | | * | | b | |
其中,Sim为余弦相似度,(a,b)为a的向量与b的向量内积,||a||,||b||分别为a向量的模长,b向量的模长,a、b是游戏aid的特征向量,相似度计算都是以余弦相似度计算为准,热门游戏标签列表是时间窗内对游戏标签频率前n个最高,求出时间窗内热门游戏标签列表。
6.根据权利要求1所述的基于三维时序动态模型的***推荐***,其特征在于:所述时序动态模型模块,包含时间窗、用户行为的特征、游戏标签,时间窗是指一个时间段的窗口,根据不同数据集特性改变;用户行为的特征是根据用户对游戏的活跃度评分结合用户对游戏的喜爱度评分融合的表,并结合游戏标签的向量表,然后引用张量模型根据用户、游戏、游戏标签建立时序动态模型,并通过张量Tucker分解方法,调节张量分解相关参数,利用用户-游戏,游戏-游戏标签信息,得到用户对某个游戏某些标签新的评分估值;利用张量模型中的用户对游戏某些标签权值,整合为用户对标签的相应的特征向量,然后结合游戏-标签两个维度,对用户-标签与游戏-标签求相似度就能够得到用户评分高的前N个游戏标签列表;张量的定义:设V1,…,VN为维数分别为I1,…,IN的N个有限维欧几里得空间,对于N个向量u1∈V1,…,un∈VN,定义V1×…×VN上的线性映射(u1…un)计算如下:
( u 1 ... u n ) ( x 1 ... x N ) = < u 1 , x 1 > V 1 ... < u n , x N > V N
其中,为Vi上的标量积,xi为Vi上的任意向量(i=1,i=2,…,N),则整个(u1…un)构成的空间称为V1,…,VN的张量空间,此张量空间上的元素称为V1×…×VN上的N阶张量;如果n=1,…,N,则此张量空间分别称为N阶I1,…,IN维实张量空间,记为而对于N阶张量其矩阵展开形式张量的元素(i1,i2,…,iN)映射到矩阵元素(in,j),映射关系为张量Tucker分解方法是一种高阶的主成分分析方法,它将原始张量分解为核心张量和一系列矩阵乘积的形式,张量分解在求解过程中能够进行降维处理;Tucker分解方法,一个张量按下面公式去理解:
X≈Y×U(1)×U(2)×…×U(N)
其中,Y为核心张量;U(1),U(2),…,U(N)为一系列正交矩阵,根据投影矩阵U的正交性UUT=E,其中UT为U的转置矩阵,E为单位矩阵;从而能够根据上面的张量X公式,两边乘以U(1)T,U(2)T,…,U(N)T,求得核心张量Y:
Y≈X×U(1)T×U(2)T…×U(N)T
时序动态模型的建立,数据是一个四维的数据元组(u,g,k,t),是一个用户u,g是一个游戏,k是一个标签,t是某个时间窗;模型根据用户-游戏-标签建立一个三阶张量n(u)是用户的集合,n(g)是游戏的集合,n(k)是某一游戏的标签集合;在某个时间窗内,得到一个用户-游戏-标签的三元权值Wu,g,k,根据三元权值建立张量模型,模型张量公式:
X t &ap; Y t &times; U t ( u ) &times; G t ( g ) &times; K t ( k )
其中,是核心张量,表示用户、游戏、标签之间的关系;表示用户的相关矩阵,表示游戏的相关矩阵,表示标签的相关矩阵;在某个时间窗内,Wu,g,k的计算根据用户对该游戏的活跃度评分乘以标签的权值得到,Wu,g,k=Au,g×Bu,g,k,其中u∈n(u),g∈n(g),k∈n(k),Au,g表示用户对某个游戏的活跃度评分,Bu,g,k表示对于给定用户u、游戏g、标签k在标签向量中的权重值,并且满足约束条件
7.根据权利要求1所述的基于三维时序动态模型的***推荐***,其特征在于:所述游戏推荐模块,包含用户喜欢的游戏标签列表、游戏对应的标签、用户喜欢的游戏、游戏平台对用户进行相应游戏应用推荐,用户喜爱的游戏标签列表是由时序动态模型模块得到,游戏对应的标签是由游戏标签模块得到,用户喜欢的游戏列表是通过用户喜欢的游戏标签表和游戏对应的标签,映射得到的结果表,用户喜欢的游戏是通过筛选和权值得到,筛选和权值考虑是根据用户喜欢的游戏列表结合该用户的历史兴趣游戏列表和热门的游戏标签列表,对用户喜欢的游戏列表赋予权值α,对用户的历史兴趣游戏列表赋予权值β,且满足α+β=1,调节α,β的权值,得到一个新的用户喜欢的游戏列表,再结合热门的游戏标签进行优先筛选,游戏列表中有游戏的标签包含热门标签的优先推荐,达到推荐更具新颖性结果;从而得到用户喜欢的游戏,游戏平台对用户进行相应游戏应用推荐是根据用户喜欢的游戏转换为游戏应用推荐,从而达到最后根据用户兴趣变化与当前游戏热门度给出推荐。
CN201610333731.7A 2016-05-19 2016-05-19 基于三维时序动态模型的***推荐*** Expired - Fee Related CN105912729B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610333731.7A CN105912729B (zh) 2016-05-19 2016-05-19 基于三维时序动态模型的***推荐***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610333731.7A CN105912729B (zh) 2016-05-19 2016-05-19 基于三维时序动态模型的***推荐***

Publications (2)

Publication Number Publication Date
CN105912729A true CN105912729A (zh) 2016-08-31
CN105912729B CN105912729B (zh) 2019-05-14

Family

ID=56748170

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610333731.7A Expired - Fee Related CN105912729B (zh) 2016-05-19 2016-05-19 基于三维时序动态模型的***推荐***

Country Status (1)

Country Link
CN (1) CN105912729B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107239680A (zh) * 2017-05-22 2017-10-10 微梦创科网络科技(中国)有限公司 一种对用户登录进行风险评估的方法及装置
CN107291442A (zh) * 2017-04-28 2017-10-24 中国农业大学 一种旅游游戏设计模型的选取方法及旅游游戏设计方法
CN107609147A (zh) * 2017-09-20 2018-01-19 珠海金山网络游戏科技有限公司 一种从日志流中自动提取特征的方法和***
CN108014496A (zh) * 2016-11-01 2018-05-11 科尔赛特股份有限公司 游戏记录分析方法
CN108537636A (zh) * 2018-04-08 2018-09-14 林凡 基于用户动态行为相似性的在线协同过滤内容推荐算法
CN108829518A (zh) * 2018-05-31 2018-11-16 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN108876394A (zh) * 2017-05-16 2018-11-23 北京京东尚科信息技术有限公司 识别电子商务平台潜在流失用户的方法和装置
CN109101563A (zh) * 2018-07-13 2018-12-28 东软集团股份有限公司 一种对象推荐方法、装置、介质以及设备
CN109876454A (zh) * 2019-01-14 2019-06-14 珠海金山网络游戏科技有限公司 一种游戏动态修正方法及***
CN109902731A (zh) * 2019-02-21 2019-06-18 武汉大学 一种基于支持向量机的性能故障的检测方法及装置
CN110222267A (zh) * 2019-06-06 2019-09-10 中山大学 一种游戏平台信息推送方法、***、存储介质及设备
CN110245999A (zh) * 2018-03-09 2019-09-17 阿里巴巴集团控股有限公司 信息推荐方法、信息显示方法、装置及计算设备
CN110263053A (zh) * 2019-06-17 2019-09-20 浙江每日互动网络科技股份有限公司 一种基于移动终端数据获取移动终端画像标签的服务器
CN110363574A (zh) * 2019-06-26 2019-10-22 腾讯科技(深圳)有限公司 产品推荐方法、装置、电子设备和可读介质
CN111569412A (zh) * 2020-04-29 2020-08-25 炫彩互动网络科技有限公司 一种云游戏资源调度的方法和装置
CN113768750A (zh) * 2021-09-15 2021-12-10 安徽相王医疗健康股份有限公司 基于视觉生物反馈的康复训练机器人
CN114042319A (zh) * 2021-11-10 2022-02-15 华南理工大学 儿童创新思维游戏化启发方法、***、存储介质、设备
CN114549739A (zh) * 2022-01-12 2022-05-27 江阴小象互动游戏有限公司 一种基于三维数据模型的控制***及方法
CN117271904A (zh) * 2023-11-21 2023-12-22 厦门牛游果网络科技有限公司 一种基于大数据的游戏推荐方法和***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593214A (zh) * 2008-05-28 2009-12-02 美国日本电气实验室公司 用于处理高维数据的***和方法
CN103136694A (zh) * 2013-03-20 2013-06-05 焦点科技股份有限公司 基于搜索行为感知的协同过滤推荐方法
CN104331411A (zh) * 2014-09-19 2015-02-04 华为技术有限公司 推荐项目的方法和装置
CN104598518A (zh) * 2014-12-10 2015-05-06 深圳市腾讯计算机***有限公司 一种内容的推送方法和装置
CN105045916A (zh) * 2015-08-20 2015-11-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种***推荐***及其推荐方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101593214A (zh) * 2008-05-28 2009-12-02 美国日本电气实验室公司 用于处理高维数据的***和方法
CN103136694A (zh) * 2013-03-20 2013-06-05 焦点科技股份有限公司 基于搜索行为感知的协同过滤推荐方法
CN104331411A (zh) * 2014-09-19 2015-02-04 华为技术有限公司 推荐项目的方法和装置
CN104598518A (zh) * 2014-12-10 2015-05-06 深圳市腾讯计算机***有限公司 一种内容的推送方法和装置
CN105045916A (zh) * 2015-08-20 2015-11-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种***推荐***及其推荐方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
ALEXANDROS KARATZOGLOU ET AL: "Multiverse Recommendation: N-dimensional Tensor Factorization for Context-aware Collaborative Filtering", 《ACM CONFERENCE ON RECOMMENDER SYSTEM》 *
STEFFEN RENDLE ET AL: "Pairwise Interaction Tensor Factorization for Personalized Tag Recommendation", 《WSDM"10 PROCEEDINGS OF THE THIRD ACM INTERNATIONAL CONFERENCE ON WEB SEARCH AND DATA MINING》 *
张爽: "基于张量分解的上下文感知推荐及其应用", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
李贵 等: "基于张量分解的个性化标签推荐算法", 《计算机科学》 *

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108014496A (zh) * 2016-11-01 2018-05-11 科尔赛特股份有限公司 游戏记录分析方法
CN108014496B (zh) * 2016-11-01 2020-11-10 科尔赛特股份有限公司 游戏记录分析方法
CN107291442A (zh) * 2017-04-28 2017-10-24 中国农业大学 一种旅游游戏设计模型的选取方法及旅游游戏设计方法
CN107291442B (zh) * 2017-04-28 2020-01-10 中国农业大学 一种旅游游戏设计模型的选取方法及旅游游戏设计方法
CN108876394A (zh) * 2017-05-16 2018-11-23 北京京东尚科信息技术有限公司 识别电子商务平台潜在流失用户的方法和装置
CN107239680A (zh) * 2017-05-22 2017-10-10 微梦创科网络科技(中国)有限公司 一种对用户登录进行风险评估的方法及装置
CN107239680B (zh) * 2017-05-22 2019-09-06 微梦创科网络科技(中国)有限公司 一种对用户登录进行风险评估的方法及装置
CN107609147A (zh) * 2017-09-20 2018-01-19 珠海金山网络游戏科技有限公司 一种从日志流中自动提取特征的方法和***
CN107609147B (zh) * 2017-09-20 2021-03-30 珠海金山网络游戏科技有限公司 一种从日志流中自动提取特征的方法和***
CN110245999A (zh) * 2018-03-09 2019-09-17 阿里巴巴集团控股有限公司 信息推荐方法、信息显示方法、装置及计算设备
CN108537636A (zh) * 2018-04-08 2018-09-14 林凡 基于用户动态行为相似性的在线协同过滤内容推荐算法
CN108829518A (zh) * 2018-05-31 2018-11-16 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN108829518B (zh) * 2018-05-31 2020-01-03 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN109101563A (zh) * 2018-07-13 2018-12-28 东软集团股份有限公司 一种对象推荐方法、装置、介质以及设备
CN109876454A (zh) * 2019-01-14 2019-06-14 珠海金山网络游戏科技有限公司 一种游戏动态修正方法及***
CN109902731A (zh) * 2019-02-21 2019-06-18 武汉大学 一种基于支持向量机的性能故障的检测方法及装置
CN109902731B (zh) * 2019-02-21 2020-12-18 武汉大学 一种基于支持向量机的性能故障的检测方法及装置
CN110222267A (zh) * 2019-06-06 2019-09-10 中山大学 一种游戏平台信息推送方法、***、存储介质及设备
CN110222267B (zh) * 2019-06-06 2023-07-25 中山大学 一种游戏平台信息推送方法、***、存储介质及设备
CN110263053A (zh) * 2019-06-17 2019-09-20 浙江每日互动网络科技股份有限公司 一种基于移动终端数据获取移动终端画像标签的服务器
CN110363574A (zh) * 2019-06-26 2019-10-22 腾讯科技(深圳)有限公司 产品推荐方法、装置、电子设备和可读介质
CN111569412A (zh) * 2020-04-29 2020-08-25 炫彩互动网络科技有限公司 一种云游戏资源调度的方法和装置
CN111569412B (zh) * 2020-04-29 2023-08-15 炫彩互动网络科技有限公司 一种云游戏资源调度的方法和装置
CN113768750A (zh) * 2021-09-15 2021-12-10 安徽相王医疗健康股份有限公司 基于视觉生物反馈的康复训练机器人
CN114042319A (zh) * 2021-11-10 2022-02-15 华南理工大学 儿童创新思维游戏化启发方法、***、存储介质、设备
CN114549739A (zh) * 2022-01-12 2022-05-27 江阴小象互动游戏有限公司 一种基于三维数据模型的控制***及方法
CN117271904A (zh) * 2023-11-21 2023-12-22 厦门牛游果网络科技有限公司 一种基于大数据的游戏推荐方法和***
CN117271904B (zh) * 2023-11-21 2024-02-09 厦门牛游果网络科技有限公司 一种基于大数据的游戏推荐方法和***

Also Published As

Publication number Publication date
CN105912729B (zh) 2019-05-14

Similar Documents

Publication Publication Date Title
CN105912729A (zh) 基于三维时序动态模型的***推荐***
De Bosscher et al. Is prioritisation of funding in elite sport effective? An analysis of the investment strategies in 16 countries
Rioux et al. Capitalism and unfree labor: a review of Marxist perspectives on modern slavery
CN107515909A (zh) 一种视频推荐方法及***
CN103793537B (zh) 一种基于多维时间序列分析的个性化音乐推荐***及其实现方法
CN106803190A (zh) 一种广告个性化推送***及方法
CN108304556A (zh) 基于内容与协同过滤相结合的个性化推荐方法
CN104951518B (zh) 一种基于动态增量更新的上下文推荐方法
Singh et al. On calibration of design weights
Cheng et al. Batch prompting: Efficient inference with large language model apis
CN101346718A (zh) 用于向用户提供选定内容项的方法
CN107222787A (zh) 视频资源流行度预测方法
CN106372101B (zh) 一种视频推荐方法和装置
CN106168980A (zh) 多媒体资源推荐排序方法及装置
CN105183925A (zh) 内容关联推荐方法及装置
CN107657034A (zh) 一种社交信息增强的事件社交网络推荐算法
CN110275980A (zh) 一种基于群透视音乐推荐方法
Achen et al. Exploring off-season content and interaction on Facebook: A comparison of US professional sport leagues
CN107292648A (zh) 一种用户行为分析方法及装置
Van Dalen et al. Policy considerations on Facebook: Agendas, coherence, and communication patterns in the 2011 Danish parliamentary elections
CN110413896A (zh) 网络信息推送方法、装置、计算机设备及存储介质
Li Accurate digital marketing communication based on intelligent data analysis
Destefanis et al. The impact of COVID-19 on home advantage: a conditional order-m analysis of football clubs’ efficiency in the top-5 European leagues
CN106874368A (zh) 一种rtb竞价广告位价值分析方法及***
Li et al. Identification and evaluation of competitive products based on online user-generated content

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190514

CF01 Termination of patent right due to non-payment of annual fee