CN111563802B - 虚拟物品推荐方法、装置、电子设备及存储介质 - Google Patents

虚拟物品推荐方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111563802B
CN111563802B CN202010388740.2A CN202010388740A CN111563802B CN 111563802 B CN111563802 B CN 111563802B CN 202010388740 A CN202010388740 A CN 202010388740A CN 111563802 B CN111563802 B CN 111563802B
Authority
CN
China
Prior art keywords
sequence
virtual
user
target user
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010388740.2A
Other languages
English (en)
Other versions
CN111563802A (zh
Inventor
钱宇秋
陈思
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010388740.2A priority Critical patent/CN111563802B/zh
Publication of CN111563802A publication Critical patent/CN111563802A/zh
Application granted granted Critical
Publication of CN111563802B publication Critical patent/CN111563802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • AHUMAN NECESSITIES
    • A63SPORTS; GAMES; AMUSEMENTS
    • A63FCARD, BOARD, OR ROULETTE GAMES; INDOOR GAMES USING SMALL MOVING PLAYING BODIES; VIDEO GAMES; GAMES NOT OTHERWISE PROVIDED FOR
    • A63F13/00Video games, i.e. games using an electronically generated display having two or more dimensions
    • A63F13/85Providing additional services to players
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种虚拟物品推荐方法包括:基于目标用户的虚拟物品购买行为参数信息,确定与目标用户的虚拟物品购买行为相匹配的伪道具任务;确定目标用户的真实购买序列和伪道具序列对应的序列子图;确定相对应的序列片段特征向量;对序列片段特征向量进行共享处理,形成新的序列片段特征向量;确定目标用户所要购买的虚拟物品,以实现向所述目标用户推荐虚拟物品。本发明还提供了虚拟物品推荐装置、电子设备及存储介质。本发明能够实现利用虚拟物品推荐模型向用户准确地推荐虚拟物品,减少了用户查找虚拟物品的时间,提升了用户的使用体验。

Description

虚拟物品推荐方法、装置、电子设备及存储介质
技术领域
本发明涉及基于信息推荐技术,尤其涉及虚拟物品推荐方法、装置、电子设备及存储介质。
背景技术
现有技术中,游戏用户通常会在虚拟环境中购买感兴趣的虚拟物品(例如游戏道具),其中,道具PROPS)(PROPERTIES),泛指场景中任何装饰、布置用的可移动物件。游戏里也有道具,游戏道具是给游戏目标用户提供方便的物品,游戏道具通常由游戏目标用户做任务获得或者由游戏目标用户通过购买获得。这一过程中,不同的游戏目标用户在不同的时间往往具有不同的道具需求,准确地向游戏目标用户推荐其所需要的道具,不仅可以提高游戏目标用户对游戏道具的购买率,增加游戏应用商的游戏营收,还可以减少游戏目标用户因推荐道具不准确,所造成的目标用户对粘性地下降。
发明内容
有鉴于此,本发明实施例提供一种虚拟物品推荐方法、装置、电子设备及存储介质,,本发明实施例的技术方案是这样实现的:
本发明提供了一种虚拟物品推荐方法,包括:
响应于虚拟物品购买请求,取获取目标用户的虚拟物品购买行为参数信息;
基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户的虚拟物品购买行为相匹配的伪道具任务;
基于所述伪道具任务和所述目标用户的真实购买序列,确定相对应的序列片段特征向量;
对所述序列片段特征向量进行共享处理,形成新的序列片段特征向量;
基于所述目标用户的用户特征向量,确定所述目标用户所要购买的虚拟物品,以实现向所述目标用户推荐虚拟物品。
上述方案中,所述获取目标用户的虚拟物品购买行为参数信息,包括:
获取与所述目标用户相对应的不同维度的原始数据集合;
根据所述不同维度的原始数据集合,确定所述虚拟物品的购买序列与对应的购买时间;
基于所述拟物品的购买序列与对应的购买时间,确定不同单位时间内的所述目标用户虚拟物品购买行为参数。
本发明实施例还提供了一种虚拟物品推荐装置,包括:
信息传输模块,用于响应于虚拟物品购买请求,取获取目标用户的虚拟物品购买行为参数信息;
信息处理模块,用于基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户的虚拟物品购买行为相匹配的伪道具任务;
所述信息处理模块,用于基于所述伪道具任务和所述目标用户的真实购买序列,确定相对应的序列片段特征向量;
所述信息处理模块,用于对所述序列片段特征向量进行共享处理,形成新的序列片段特征向量;
所述信息处理模块,用于基于所述目标用户的用户特征向量,通过所述虚拟物品推荐模型确定所述目标用户所要购买的虚拟物品,以实现向所述目标用户推荐虚拟物品。
上述方案中,
所述信息处理模块,用于基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户相匹配的真实购买序列;
所述信息处理模块,用于基于所述伪道具任务和所述目标用户的真实购买序列,确定所述目标用户的真实购买序列和伪道具序列对应的序列子图;
所述信息处理模块,用于通过所述序列子图,确定与所述目标用户相对应的序列片段特征向量。
上述方案中,
所述信息处理模块,用于基于所述目标用户的虚拟物品购买行为参数信息,确定真实购买序列和伪道具序列;
所述信息处理模块,用于通过确定目标虚拟物品在所述真实购买序列中的节点和伪道具序列中的节点,确定所述序列子图的节点;
所述信息处理模块,用于基于所述目标虚拟物品在所述真实购买序列中的时间顺序,确定所述序列子图的第一类型边线;
所述信息处理模块,用于基于所述目标虚拟物品在所述伪道具序列中的时间顺序,确定所述序列子图的第二类型边线;
所述信息处理模块,用于基于所述真实购买序列和伪道具序列的关联关系,确定所述序列子图的第三类型边线;
所述信息处理模块,用于根据所述序列子图的节点、所述第一类型边线、所述第二类型边线和所述第三类型边线,确定与所述目标用户的虚拟物品购买行为相匹配的序列子图。
上述方案中,
所述信息处理模块,用于对序列子图的全部特征节点进行线性加权,确定第一序列片段特征向量,其中,所述第一序列片段特征向量用于表征所述目标用户的购买行为偏好;
所述信息处理模块,用于提取所述目标用户的最后一次拟物品的购买参数,确定第二序列片段特征向量;
所述信息处理模块,用于将所述第一序列片段特征向量和所述第二序列片段特征向量进行拼接处理,确定相应的序列片段特征向量。
上述方案中,
所述信息处理模块,用于对所述目标用户的虚拟物品购买行为相匹配的序列子图中的不同序列共享的目标用户向量进行初始化处理;
所述信息处理模块,用于通过所述虚拟物品推荐模型中的第一用户神经网络模型对所述目标用户向量进行处理,确定与真实购买序列相匹配的第一用户单序列特征;
所述信息处理模块,用于通过所述虚拟物品推荐模型中的第二用户神经网络模型对所述目标用户向量进行处理,确定与伪道具序列相匹配的第二用户单序列特征;
所述信息处理模块,用于对所述第一用户单序列特征和所述第二用户单序列特征进行拼接处理,形成所述目标用户的用户特征向量。
上述方案中,
所述信息处理模块,用于确定与所述虚拟物品推荐模型相匹配的多任务损失函数;
所述信息处理模块,用于基于所述序列片段特征向量、所述目标用户的用户特征向量以及所述多任务损失函数,调整所述虚拟物品推荐模型的网络参数;
所述信息处理模块,用于直至所述虚拟物品推荐模型对应的不同维度的损失函数达到相应的收敛条件;以实现所述虚拟物品推荐模型与所述目标用户相匹配。
上述方案中,
所述信息处理模块,用于基于所述目标用户购买的虚拟物品名称以及所述所要购买的虚拟物品的类别,对所述虚拟物品的召回顺序进行排序;
所述信息处理模块,用于根据所述虚拟物品的召回顺序的排序结果,对用户界面中所展示的虚拟物品的顺序进行调整。
上述方案中,
所述信息处理模块,用于当所述虚拟物品为游戏道具时,确定所述目标用户所持有的游戏角色,其中,不同游戏角色与相对应的游戏道具匹配;
所述信息处理模块,用于基于所述游戏角色,确定对应的游戏道具的购买序列与对应的购买时间;
所述信息处理模块,用于基于所述游戏道具的购买序列与对应的购买时间,确定不同单位时间内的所述目标用户虚拟物品购买行为参数。
本发明实施例还提供了一种电子设备,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于运行所述存储器存储的可执行指令时,实现权利前序的虚拟物品推荐模型训练方法,或者实现前序虚拟物品推荐方法。
本发明实施例还提供了一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时实现前序的虚拟物品推荐模型训练方法,或者实现前序虚拟物品推荐方法。
本发明实施例具有以下有益效果:
本发明实施例通过取获取目标用户的虚拟物品购买行为参数信息;基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户的虚拟物品购买行为相匹配的伪道具任务;基于所述伪道具任务和所述目标用户的真实购买序列,确定所述目标用户的真实购买序列和伪道具序列对应的序列子图;通过所述序列子图,基于所述虚拟物品推荐模型中的图神经网络模型,确定相对应的序列片段特征向量;通过所述虚拟物品推荐模型的自注意力学习机制对所述序列片段特征向量进行共享处理,形成新的序列片段特征向量;基于所述目标用户的用户特征向量,由此可以实现通过所述虚拟物品推荐模型确定所述目标用户所要购买的虚拟物品名称以及所述所要购买的虚拟物品的类别,进一步地可以利用虚拟物品推荐模型向用户准确地推荐虚拟物品,减少了用户查找虚拟物品的时间,提升了用户的使用体验。
附图说明
图1为本发明实施例提供的虚拟物品推荐模型训练方法的使用场景示意图;
图2为本发明实施例提供的虚拟物品推荐装置的组成结构示意图;
图3为本发明实施例提供的虚拟物品推荐模型的训练方法一个可选的流程示意图;
图4为本发明实施例提供的虚拟物品推荐方法一个可选的流程示意图;
图5为本发明实施例提供的虚拟物品推荐方法一个可选的流程示意图;
图6为本发明实施例提供的虚拟物品前端显示示意图;
图7为本发明实施例提供的虚拟物品前端显示示意图;
图8为本发明实施例提供的虚拟物品推荐模型的训练方法一个可选的流程示意图;
图9本发明实施例提供的虚拟物品推荐模型的训练过程中数据流转示意图;
图10为本发明实施例提供的虚拟物品推荐模型的训练过程中的序列片段子图的示意图;
图11为本发明实施例提供的虚拟物品推荐模型的训练过程中的序列片段自注意力学习过程的示意图;
图12为本发明实施例提供的虚拟物品推荐模型的训练过程中的通过序列片段和用户特征进行预测的示意图;
图13为本发明实施例提供的虚拟物品推荐模型进行游戏道具推荐过程中的序列片段处理示意图;
图14为本发明实施例提供的经过显示顺序调整的虚拟物品前端显示示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
对本发明实施例进行进一步详细说明之前,对本发明实施例中涉及的名词和术语进行说明,本发明实施例中涉及的名词和术语适用于如下的解释。
1)响应于,用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
2)基于,用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
3)卷积神经网络(CNN Convolutional Neural Networks)是一类包含卷积计算且具有深度结构的前馈神经网络(Feed forward Neural Networks),是深度学***移不变分类(shift-invariantclassification)。
4)模型训练,对图像数据集进行多分类学习。该模型可采用Tensor Flow、torch等深度学习框架进行构建,使用CNN等神经网络层的多层结合组成多分类模型。模型的输入为图像经过openCV等工具读取形成的三通道或原通道矩阵,模型输出为多分类概率,通过softmax等算法最终输出网页类别。在训练时,模型通过交叉熵等目标函数向正确趋势逼近。
5)神经网络(Neural Network,NN):人工神经网络(Artificial Neural Network,ANN),简称神经网络或类神经网络,在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经***,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。
6))图神经网络(Graph Neural Network,GNN):一种直接作用于图结构上的神经网络,主要针对非欧几里得空间结构(图结构)的数据进行处理。具有忽略节点的输入顺序;在计算过程中,节点的表示受其周围邻居节点的影响,而图本身连接不变;图结构的表示使得可以进行基于图的推理。通常,图神经网络由两个模块组成:传播模块(PropagationModule)和输出模块(Output Module),传播模块用于图中节点之间传递信息并更新状态,输出模块用于基于图的节点和边的向量表示,根据不同的任务定义目标函数。图神经网络有:图卷积神经网络(Graph Convolutional Networks,GCNs),门控图神经网络(GatedGraph Neural Networks,GGNNs)以及基于注意力机制的图注意力神经网络(GraphAttention Networks,GAT)。
7)有向图:表示物件与物件之间的关系,可以通过有序三元组(V(D),A(D),ψD)来表示有向图,其中ψD为关联函数,它是A(D)中的每一个元素对应于V(D)的有序元素对。
8)编码器-解码器结构:机器翻译技术常用的网络结构。由编码器和解码器两部分组成,编码器将输入的文本转换为一系列能够表达输入文本特征的上下文向量,解码器接收编码器输出的结果作为自己的输入,输出对应的另一种语言的文本序列。
9)Softmax:归一化指数函数,是逻辑函数的一种推广。它能将一个含任意实数的K维向量“压缩”到另一个K维实向量中,使得每一个元素的范围都在[0,1]之间,并且所有元素的和为1。
10)伪道具任务:非购买道具的预测任务,而是结合游戏策划专业知识,进行的已知结果的伪造预测任务,比如预测道具的类型(当然也包括基础资源、不同的***道具、道具的支付方式)
11)多任务推荐:联合多个预测任务(包括道具购买任务、道具类型预测任务),共享用户及道具信息,做出不同的推荐。
12)序列推荐:对数据时间顺序分析,推荐目标用户(游戏玩家)下一个时刻想要购买的游戏道具。
13)游戏道具:游戏中售卖的虚拟道具、礼包(包括角色技能和武器)、角色装饰(皮肤)、游戏角色(英雄)等各类型的可替换元素。
图1为本发明实施例提供的虚拟物品推荐方法的使用场景示意图,参见图1,终端(包括终端10-1和终端10-2)上设置有能够显示不同待售虚拟物品的软件的客户端,例如不同类型游戏或者游戏小程序的的客户端或插件,用户通过相应的客户端可以获得所有的待售的虚拟物品并进行展示;终端通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合,使用无线链路实现数据传输。
作为一个示例,服务器200用于布设所述虚拟物品推荐装置以实现本发明所提供的虚拟物品推荐方法,后者可以布设经过训练的虚拟物品推荐模型,以实现在不同的环境中(例如游戏环境中或者虚拟交易环境中)的虚拟物品的推荐,具体的,在使用虚拟物品推荐模型之前,需要对虚拟物品推荐模型进行训练,具体过程包括:获取目标用户的虚拟物品购买行为参数信息;基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户的虚拟物品购买行为相匹配的序列子图;通过所述序列子图,确定所述虚拟物品推荐模型中的图神经网络模型;基于所述虚拟物品推荐模型中的图神经网络模型,确定相应的序列片段特征向量;基于所述序列片段特征向量和所述目标用户的用户特征向量,对所述虚拟物品推荐模型的网络参数进行调整,以实现所述虚拟物品推荐模型与所述目标用户相匹配。当然,本发明所提供的虚拟物品推荐装置可以基于对同一目标用户在不同游戏环境中的虚拟物品的购买行为进行训练,在同一用户的所持有的不同游戏角色中通常会对不同数据来源的虚拟物品进行选择和购买,最终在用户界面(UI User Interface)上呈现出与通过虚拟物品推荐模型所确定所述目标用户购买的虚拟物品名称以及所述所要购买的虚拟物品的类别,所得到通过虚拟物品推荐模型所确定所述目标用户购买的虚拟物品名称以及所述所要购买的虚拟物品的类别还可以供其他应用程序调用,当然,与相应的目标用户相匹配的虚拟物品推荐模型也可以迁移至不同的虚拟推荐进程(例如网页游戏的推荐进程、小程序的游戏推荐进程或者短视频游戏的客户端推荐进程)。
当然对虚拟物品推荐模型训练完成之后,就可以通过虚拟物品推荐模型进行推荐,具体包括:响应于虚拟物品购买请求,取获取目标用户的虚拟物品购买行为参数信息;基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户的虚拟物品购买行为相匹配的伪道具任务;基于所述伪道具任务和所述目标用户的真实购买序列,确定所述目标用户的真实购买序列和伪道具序列对应的序列子图;通过所述序列子图,基于所述虚拟物品推荐模型中的图神经网络模型,确定相对应的序列片段特征向量;通过所述虚拟物品推荐模型的自注意力学习机制对所述序列片段特征向量进行共享处理,形成新的序列片段特征向量;基于所述目标用户的用户特征向量,通过所述虚拟物品推荐模型确定所述目标用户所要购买的虚拟物品名称以及所述所要购买的虚拟物品的类别,以实现向所述目标用户推荐虚拟物品。
下面对本发明实施例的虚拟物品推荐装置的结构做详细说明,虚拟物品推荐装置可以各种形式来实施,如带有虚拟物品推荐装置处理功能的专用终端,也可以为设置有虚拟物品推荐装置处理功能的服务器,例如前序图1中的服务器200。图2为本发明实施例提供的虚拟物品推荐装置的组成结构示意图,可以理解,图2仅仅示出了虚拟物品推荐装置的示例性结构而非全部结构,根据需要可以实施图2示出的部分结构或全部结构。
本发明实施例提供的虚拟物品推荐装置包括:至少一个处理器201、存储器202、用户接口203和至少一个网络接口204。虚拟物品推荐装置中的各个组件通过总线***205耦合在一起。可以理解,总线***205用于实现这些组件之间的连接通信。总线***205除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线***205。
其中,用户接口203可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。
可以理解,存储器202可以是易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。本发明实施例中的存储器202能够存储数据以支持终端(如10-1)的操作。这些数据的示例包括:用于在终端(如10-1)上操作的任何计算机程序,如操作***和应用程序。其中,操作***包含各种***程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序可以包含各种应用程序。
在一些实施例中,本发明实施例提供的虚拟物品推荐装置可以采用软硬件结合的方式实现,作为示例,本发明实施例提供的虚拟物品推荐装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本发明实施例提供的虚拟物品推荐方法。例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application SpecificIntegrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
作为本发明实施例提供的虚拟物品推荐装置采用软硬件结合实施的示例,本发明实施例所提供的虚拟物品推荐装置可以直接体现为由处理器201执行的软件模块组合,软件模块可以位于存储介质中,存储介质位于存储器202,处理器201读取存储器202中软件模块包括的可执行指令,结合必要的硬件(例如,包括处理器201以及连接到总线205的其他组件)完成本发明实施例提供的虚拟物品推荐方法。
作为示例,处理器201可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
作为本发明实施例提供的虚拟物品推荐装置采用硬件实施的示例,本发明实施例所提供的装置可以直接采用硬件译码处理器形式的处理器201来执行完成,例如,被一个或多个应用专用集成电路(ASIC,Application Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,ComplexProgrammable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable GateArray)或其他电子元件执行实现本发明实施例提供的虚拟物品推荐方法。
本发明实施例中的存储器202用于存储各种类型的数据以支持虚拟物品推荐装置的操作。这些数据的示例包括:用于在虚拟物品推荐装置上操作的任何可执行指令,如可执行指令,实现本发明实施例的从虚拟物品推荐方法的程序可以包含在可执行指令中。
在另一些实施例中,本发明实施例提供的虚拟物品推荐装置可以采用软件方式实现,图2示出了存储在存储器202中的虚拟物品推荐装置,其可以是程序和插件等形式的软件,并包括一系列的模块,作为存储器202中存储的程序的示例,可以包括虚拟物品推荐装置,虚拟物品推荐装置中包括以下的软件模块:
信息传输模块2081和信息处理模块2082。当虚拟物品推荐装置中的软件模块被处理器201读取到RAM中并执行时,将实现本发明实施例提供的虚拟物品推荐方法,其中,虚拟物品推荐装置中各个软件模块的功能,包括:
信息传输模块2081,用于信息传输模块,用于取获取目标用户的虚拟物品购买行为参数信息;
信息处理模块2082,用于基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户的虚拟物品购买行为相匹配的伪道具任务;
所述信息处理模块2082,用于基于所述伪道具任务和所述目标用户的真实购买序列,确定相对应的序列片段特征向量;
所述信息处理模块2082,用于对所述序列片段特征向量进行共享处理,形成新的序列片段特征向量;
所述信息处理模块2082,用于基于所述目标用户的用户特征向量,通过所述虚拟物品推荐模型确定所述目标用户所要购买的虚拟物品,以实现向所述目标用户推荐虚拟物品。
继续结合图2示出的虚拟物品推荐装置说明本发明实施例提供的虚拟物品推方法,首先介绍部署于服务器中的虚拟物品推荐模型的训练过程,其中,参见图3,图3为本发明实施例提供的虚拟物品推荐模型的训练方法一个可选的流程示意图,可以理解地,图3所示的步骤可以由运行虚拟物品推荐装置的各种电子设备执行,例如可以是如带有虚拟物品推荐装置的专用终端、游戏服务器或者虚拟物品提供商的服务器集群,其中,带有虚拟物品推荐装置的专用终端可以为前序图2所示的实施例中带有虚拟物品推荐装置的电子设备。为了克服传统推荐方式所造成的虚拟物品推荐不准确的缺陷,本发明所提供的技术方案使用了人工智能技术,人工智能AI(Artificial Intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
下面针对图3示出的步骤进行具体说明。
步骤301:虚拟物品推荐装置获取目标用户的虚拟物品购买行为参数信息。
其中,购买行为参数信息包括:购买序列,购买时间,道具类别,支付方式,回购次数等信息。
在本发明的一些实施例中,获取目标用户的虚拟物品购买行为参数信息,可以通过以下方式实现:
获取与所述目标用户相对应的不同维度的原始数据集合;根据所述不同维度的原始数据集合,确定所述虚拟物品的购买序列与对应的购买时间;基于所述拟物品的购买序列与对应的购买时间,确定不同单位时间内的所述目标用户虚拟物品购买行为参数。其中,可以通过不同的程序组件对相应的客户端所匹配的用户各类购买虚拟物品的行为进行收集,对用后购买记录日志进行有效提取,获取虚拟物品的购买序列与对应的购买时间,例如在一周的每一天按照依次购买了虚拟物品A、虚拟物品B、虚拟物品C。所以本申请中可以提取三元组信息(设备号(用户账号),购买时间,购买序列),以确定目标用户虚拟物品购买行为参数。这一过程中,还可以通过对所述购买序列进行除噪,可以清除没有成功购买虚拟物品的目标用户的行为,避免由于不准确的购买行为参数影响备虚拟物品推荐模型的准确性。
步骤302:虚拟物品推荐装置基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户的虚拟物品购买行为相匹配的序列子图。
其中,与所述目标用户的虚拟物品购买行为相匹配的序列子图可以由真实道具任务中的正式购买序列和伪道具任务中的伪道具序列构成,具体来说:构建伪道具任务的目的在于通过构造一个更简单的预测任务(例如在游戏道具推荐的使用场景中,对游戏玩家所要购买的道具类别预测任务),联合原任务(也就是玩家在游戏中真实购买道具的购买任务)一起通过神经网络模型的处理,通过共享道具特征、用户特征、序列片段特征等多任务学习的方式,来提升对原预测任务的准确性,增强虚拟物品推荐模型的泛化能力,使其适应不同的使用场景。
步骤303:虚拟物品推荐装置通过所述序列子图,确定所述虚拟物品推荐模型中的图神经网络模型。
步骤304:虚拟物品推荐装置基于所述虚拟物品推荐模型中的图神经网络模型,确定相应的序列片段特征向量。
在本发明的一些实施例中,基于所述虚拟物品推荐模型中的图神经网络模型,确定相应的序列片段特征向量,可以通过以下方式实现:
对所述图神经网络模型中的序列子图的全部特征节点进行线性加权,确定第一序列片段特征向量,其中,所述第一序列片段特征向量用于表征所述目标用户的购买行为偏好;对所述图神经网络模型中,提取所述目标用户的最后一次拟物品的购买参数,确定第二序列片段特征向量;将所述第一序列片段特征向量和所述第二序列片段特征向量进行拼接处理,确定相应的序列片段特征向量。其中,图神经网络模型中的序列子图的节点和每一类型边线的所表征的内容均不相同,序列片段特征向量由两部分组成,一部分代表了整个序列的用户偏好,为对整个序列的特征节点进行线性加权,称之为序列的第一部分特征;另一部分为用户的最近喜好,用最近一次购买的结果进行表示,称为序列的第二部分特征。将第一部分特征和最近一次购买的结果进行拼接处理,即可以构成完整的序列的整体片段特征向量。
步骤305:虚拟物品推荐装置基于所述序列片段特征向量和所述目标用户的用户特征向量,对所述虚拟物品推荐模型的网络参数进行调整。
由此,可以实现所述虚拟物品推荐模型与所述目标用户相匹配。
其中,获取用户特征向量可以通过以下方式实现:
对所述目标用户的虚拟物品购买行为相匹配的序列子图中的不同序列共享的目标用户向量进行初始化处理;通过所述虚拟物品推荐模型中的第一用户神经网络模型对所述目标用户向量进行处理,确定与真实购买序列相匹配的第一用户单序列特征;通过所述虚拟物品推荐模型中的第二用户神经网络模型对所述目标用户向量进行处理,确定与伪道具序列相匹配的第二用户单序列特征;对所述第一用户单序列特征和所述第二用户单序列特征进行拼接处理,形成所述目标用户的用户特征向量。
具体来说,目标用户的用户向量表征用户对两个任务(分别对应两个不同的购买序列)的共同喜好,将用户向量通过两个大小一样、参数不共享的独立的第一用户神经网络模型和第二用户神经网络模型的处理,所得到的的第一用户单序列特征和第二用户单序列特征表征该用户对于不同人物的喜好程度(即该目标用户偏好哪一个虚拟物品和哪一类型的虚拟物品),通过拼接处理,目标用户的用户特征向量能够均衡的表征该目标用户的喜好。
在本发明的一些实施例中,基于所述序列片段特征向量和所述目标用户的用户特征向量,对所述虚拟物品推荐模型的网络参数进行调整,以实现所述虚拟物品推荐模型与所述目标用户相匹配,可以通过以下方式实现:
确定与所述虚拟物品推荐模型相匹配的多任务损失函数;基于所述序列片段特征向量、所述目标用户的用户特征向量以及所述多任务损失函数,调整所述虚拟物品推荐模型的网络参数;直至所述虚拟物品推荐模型对应的不同维度的损失函数达到相应的收敛条件;以实现通过所述虚拟物品推荐模型确定所述目标用户再次购买的虚拟物品名称以及所要购买的虚拟物品的类别。
当虚拟物品推荐模型训练完成后可以部署在对应使用场景的服务器中,结合图2示出的虚拟物品推荐装置说明本发明实施例提供的虚拟物品推荐方法,参见图4,图4为本发明实施例提供的虚拟物品推荐方法一个可选的流程示意图,可以理解地,图4所示的步骤可以由运行虚拟物品推荐装置的各种电子设备执行,例如可以是如带有虚拟物品推荐装置的专用终端、服务器或者服务器集群,其中,带有虚拟物品推荐装置的专用终端可以为前序图2所示的实施例中带有虚拟物品推荐装置的电子设备。下面针对图4示出的步骤进行说明。
步骤401:响应于虚拟物品购买请求,取获取目标用户的虚拟物品购买行为参数信息。
在本发明的一些实施例中,获取目标用户的虚拟物品购买行为参数信息,可以通过以下方式实现:
当所述虚拟物品为游戏道具时,确定所述目标用户所持有的游戏角色,其中,不同游戏角色与相对应的游戏道具匹配;基于所述游戏角色,确定对应的游戏道具的购买序列与对应的购买时间;基于所述游戏道具的购买序列与对应的购买时间,确定不同单位时间内的所述目标用户虚拟物品购买行为参数。其中,以任一角色扮演游戏RPG(Role-playinggame)游戏为例,假设其预先设定了七种游戏角色:镖师、捕快、猎户、杀手、乐伶、游侠和文士,每个身份均对应着不同的游戏道具,作为玩家的目标对象可以选择加入其一。其中,作为虚拟物品的游戏道具是指在虚拟环境通过发射子弹进行攻击的游戏道具,或者发射箭簇的虚拟弓箭、虚拟弹弓,目标用户通过所持有的不同游戏角色可以在虚拟环境中可以购买不同的游戏道具,并通过所购买的游戏道具进行攻击。
其中,以射击类游戏为例,用户可以控制不同的游戏角色在该虚拟场景通过所购买的游戏道具实现在天空中自由下落、滑翔或者打开降落伞进行下落等,在陆地上中跑动、跳动、爬行、弯腰前行等,也可以控制不同的游戏角色在海洋中游泳、漂浮或者下潜等,当然,用户也可以控制不同的游戏角色乘坐游戏道具在该虚拟场景中进行移动,例如,该游戏道具可以是虚拟汽车、虚拟飞行器、虚拟游艇等,在此仅以上述场景进行举例说明,本发明实施例对此不作具体限定。用户也可以控制不同的游戏角色通过游戏道具与其他不同的游戏角色进行战斗等方式的互动,该游戏道具可以是冷兵器,也可以是热兵器,本发明对游戏道具的类型不作具体限定。
本发明中提供的方法可以应用于虚拟现实应用程序、三维地图程序、军事仿真程序、第一人称射击游戏(First-person shooting game,FPS)、多人在线战术竞技游戏(Multiplayer Online Battle Arena Games,MOBA)等不同游戏环境中的游戏道具的推荐进程中,下述实施例是以在游戏中的应用来举例说明。
基于虚拟环境的游戏往往由一个或多个游戏世界的地图构成,游戏中的虚拟环境模拟现实世界的场景,用户可以操控游戏中的不同的游戏角色在虚拟环境中进行行走、跑步、跳跃、射击、格斗、驾驶、切换使用游戏道具、使用游戏道具攻击其他不同的游戏角色等动作,交互性较强,并且多个用户可以在线组队进行竞技游戏。用户控制不同的游戏角色使用游戏道具对目标不同的游戏角色发起攻击时,用户根据目标不同的游戏角色所在的位置,或操作习惯选择合适的游戏道具对不同的游戏角色进行攻击。
步骤402:基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户的虚拟物品购买行为相匹配的伪道具任务。
步骤403:基于目标用户的虚拟物品购买行为参数信息,确定与目标用户相匹配的真实购买序列,并基于伪道具任务和目标用户的真实购买序列,确定目标用户的真实购买序列和伪道具序列对应的序列子图。
步骤404:通过序列子图,确定与目标用户相对应的序列片段特征向量。
在本发明的一些实施例中,基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户的虚拟物品购买行为相匹配的序列子图,可以通过以下方式实现:
基于所述目标用户的虚拟物品购买行为参数信息,确定真实购买序列和伪道具序列;通过确定目标虚拟物品在所述真实购买序列中的节点和伪道具序列中的节点,确定所述序列子图的节点;基于所述目标虚拟物品在所述真实购买序列中的时间顺序,确定所述序列子图的第一类型边线;基于所述目标虚拟物品在所述伪道具序列中的时间顺序,确定所述序列子图的第二类型边线;
基于所述真实购买序列和伪道具序列的关联关系,确定所述序列子图的第三类型边线;根据所述序列子图的节点、所述第一类型边线、所述第二类型边线和所述第三类型边线,确定与所述目标用户的虚拟物品购买行为相匹配的序列子图。
其中,在本发明的一些实施例中,图神经网络具体可以是图卷积神经网络(GCN),也可以是Graph-RNN、Graph-MPNN等图神经网络。具体的,以GCN模型框架为例,其输入是一张图,经过一层一层计算变换,最后输出一张图。GCN模型具备深度学习的以下三种性质:1、层级结构,特征一层一层抽取,一层比一层更抽象,更高级。2、非线性变换,增加模型的表达能力。3、端对端训练,不需要再去定义任何规则,只需要给图的节点一个标记,让模型自己学习,融合特征信息和结构信息。
步骤405:通过所述虚拟物品推荐模型的自注意力学习机制对所述目标用户对应的序列片段特征向量进行共享处理,形成新的序列片段特征向量。
在本发明的一些实施例中,通过所述虚拟物品推荐模型的自注意力学习机制对所述序列片段特征向量进行共享处理,形成新的序列片段特征向量,可以通过以下方式实现:
对所述目标用户的虚拟物品购买行为相匹配的序列子图中的不同序列共享的目标用户向量进行初始化处理;通过所述虚拟物品推荐模型中的第一用户神经网络模型对所述目标用户向量进行处理,确定与真实购买序列相匹配的第一用户单序列特征;通过所述虚拟物品推荐模型中的第二用户神经网络模型对所述目标用户向量进行处理,确定与伪道具序列相匹配的第二用户单序列特征;对所述第一用户单序列特征和所述第二用户单序列特征进行拼接处理,形成所述目标用户的用户特征向量。其中,以微信小程序游戏中的道具推荐场景为例,自注意力学习机制对目标用户的序列片段特征向量进行共享处理,形成新的序列片段特征向量,使得新的序列片段特征向量能够共享针对该目标用户的道具特征、用户特征、序列片段特征等由多任务学习机制所获得的特征,提升对所要向用户推荐的游戏道具的准确性,增强虚拟物品推荐模型的泛化能力,使其适应不同的微信小程序游戏使用场景。
步骤406:基于所述目标用户的用户特征向量,通过所述虚拟物品推荐模型确定所述目标用户所要购买的虚拟物品。
其中,所确定的目标用户所要购买的虚拟物品包括了所要购买的虚拟物品的名称以及所述所要购买的虚拟物品的类别。
其中,当虚拟物品数量较多时,可以基于所述目标用户购买的虚拟物品名称以及所述所要购买的虚拟物品的类别,对所述虚拟物品的召回顺序进行排序;根据所述虚拟物品的召回顺序的排序结果,对用户界面中所展示的虚拟物品的顺序进行调整。
在本发明的一些实施例中,还可以显示用户界面,所述用户界面中包括以不同的游戏角色的人称视角对所述虚拟环境进行观察的人称视角画面,所述不同的游戏角色持有所述游戏道具,所述用户界面中还包括伤害控制组件;通过所述伤害控制组件,控制所述游戏道具对所述显示用户界面中相应的伤害对象发起攻击,以实现所述显示用户界面中的不同的游戏角色攻击所述伤害对象。
在本发明的一些实施例中,当所述目标用户选择任一所展示的虚拟物品时,还可以基于所述目标用户的用户特征向量,确定与所述目标用户相匹配的支付方式,或者,基于所述目标用户的用户特征向量和所述虚拟物品的类型信息,确定与所述目标用户相匹配的支付方式;基于所述与所述目标用户相匹配的支付方式,触发对应的支付进程。
下面以游戏进程中作为游戏道具的虚拟物品为例对本发明所提供的虚拟物品推荐方法进行说明,其中,图5为本发明实施例提供的虚拟物品推荐方法的使用场景示意图,参见图5,终端(包括终端50-1和终端50-2)上设置有同一游戏的客户端由不同的用户通过各自所持有的游戏角色进行操作,用户通过相应的客户端可以购买并在游戏环境中使用不同的游戏道具;终端通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合,使用无线链路实现数据传输。
参考图6和图7,图6为本发明实施例提供的虚拟物品前端显示示意图,图7为本发明实施例提供的虚拟物品前端显示示意图,现有技术中,游戏用户通常会在虚拟环境中购买感兴趣的虚拟物品(例如游戏道具),其中,道具可以泛指场景中任何装饰、布置用的可移动物件(游戏武器或者运输工具)。游戏里也有道具,游戏道具是给游戏目标用户提供方便的物品,游戏道具通常由游戏目标用户做任务获得或者由游戏目标用户通过购买获得。
不同的游戏目标用户在不同的时间往往具有不同的道具需求,准确的向游戏目标用户推荐其所需要的道具,不仅可以提高游戏目标用户对游戏道具的购买率,增加游戏应用商的游戏营收,还可以减少游戏目标用户因推荐道具不准确,而对游戏应用产生负面情绪的情况发生,提高游戏目标用户对游戏应用的粘性。为了能够将游戏道具推荐给用户,通常进行推荐的服务器会将热门游戏道具或者是新上架的游戏道具推荐给用户。但是,每个用户的感兴趣的游戏道具并不相同,热门物品或者新上架物品的推荐并不适合每个用户,从而也无法满足针对不同用户的推荐的准确性的需求。
现有技术往往通过游戏道具推荐方法结合目标用户胜率、购买数据、行为数据等等进行分析,并构建单一的推荐模型。其缺陷在于,无法未考虑用户购买行为的时间序列关系,无法快速反应用户喜好;同时也没有挖掘道具本身的规则性描述特征,只是单一考虑从用户行为角度考虑,并不能够实现准确的推荐。
为解决上述缺陷,需要训练虚拟物品推荐模型以实现对目标用户所要购买的游戏道具的预判,及时并准确地向目标用户推荐作为虚拟物品的游戏道具,参考图8和图9,其中,图8为本发明实施例提供的虚拟物品推荐模型的训练方法一个可选的流程示意图;图9本发明实施例提供的虚拟物品推荐模型的训练过程中数据流转示意图,其中,本发明实施例提供的虚拟物品推荐方法包括以下步骤:
步骤801:获取目标用户的道具购买序列,以及每个道具的类别,构成伪道具任务。
其中,以第一类型游戏为例,假如真实的某一周道具购买序列A为(碎银,碎银,金色砭石兑换券,通用心法残页(紫)),下一个真实购买道具为通用心法残页(紫),那么伪造的道具序列B为:(碎银-基础资源,碎银-基础资源,金色砭石兑换券-砭石***,通用心法残页(紫)-心法***道具),下一个预测分类为心法***道具。
其中,构建伪道具任务的目的在于:通过构造一个更简单的预测任务(在这个例子里,也就是道具类别预测任务),联合原任务(也就是道具购买任务)一起学习,通过共享道具特征、用户特征、序列片段特征等多任务学习技术,来提升原预测任务的准确性
步骤802:将每个单周数据构健真实购买序列和伪道具序列的子图。
其中,参考图10,图10为本发明实施例提供的虚拟物品推荐模型的训练过程中的序列片段子图的示意图;其中,图中存在两类特征节点,包括维度为dr和df的特征向量er_i和ef_i,分别代表道具i在真实购买序列中的节点和伪道具序列的节点。在图10中一共存在三类边(通过不同的图例示出),第一类边按照道具购买序列的时间顺序进行连接,比如(er_i1,er_i2);第二类边为伪造的道具任务,比如(ef_i1,ef_i2);第三类边为两个任务之间的关联边,包(er_i1,ef_i2)和(ef_i1,er_i2),对应的边权重分别为WrrWff,Wrf和Wfr。这三类边代表不同类型序列节点之间的交互关系,因此设置不同的更新权重Wrr,Wff,Wrf和Wfr。于是以下图为例,
ef_j=Wff*ef_(j-1)+Wrf*er_(j-1)
er_j=Wrr*er_(j-1)+Wfr*ef_(j-1),j=i1,i2,…,i5
步骤803:构成子图后利用构建相匹配的图神经网络,确定两个长度为ds的序列片段特征向量sr和sf。
具体来说,图神经网络(Graph Neural Network,GNN):一种直接作用于图结构上的神经网络,主要针对非欧几里得空间结构(图结构)的数据进行处理。具有忽略节点的输入顺序;在计算过程中,节点的表示受其周围邻居节点的影响,而图本身连接不变;图结构的表示使得可以进行基于图的推理。通常,图神经网络由两个模块组成:传播模块(Propagation Module)和输出模块(Output Modul e),传播模块用于图中节点之间传递信息并更新状态,输出模块用于基于图的节点和边的向量表示,根据不同的任务定义目标函数。图神经网络有:图卷积神经网络(Graph Convolutional Networks,GCNs),门控图神经网络(Gated Graph Neural Networks,GGNNs)以及基于注意力机制的图注意力神经网络(Graph Att ention Networks,GAT)。
其中,序列片段特征向量由两部分组成,一部分代表了整个序列的用户偏好,为对整个序列的特征节点进行线性加权,称之为序列的第一部分特征sr1=∑j=i1......i5αrj*er_j,其中αrj为一个参数。另一部分为用户的最近喜好,用最近一次购买的结果sr2=er_i5表示,称为序列的第二部分特征。将第一部分特征sr1和最近一次购买的结果sr2拼接,构成序列的整体片段特征向量sr=[sr1,sr2]。同理可得sr=[sf1,sf2],其中sf1=∑j=i1......iαfj*er_j,sf2=ef_i5,αfj为参数。
步骤804:将sr和sf通过自注意力学习的方式进行共享。
其中,参考图11,图11为本发明实施例提供的虚拟物品推荐模型的训练过程中的序列片段自注意力学习过程的示意图;自注意力学习的方式如下步骤所示:
1)s11=sr*sr,s12=sr*sf;s21=sf*sr,s22=sf*sf;
2)s11’=e^s11/(e^s11+e^s12),s12’=e^s21/(e^s11+e^s12);
s21’=e^s21/(e^s21+e^s22),s22’=e^s22/(e^s21+e^s22),
3)sr’=s11’*sr+s12’*sf;sf’=s21’*sr+s22’*sf。
将sr和sf通过如下自注意力学习的方式进行共享,得到新的session state sr’和sf’。由此,可以使两个任务之间更好的共享特征。
步骤805:学习对应的用户特征ur’和uf’。
具体来说,参考图12,图12为本发明实施例提供的虚拟物品推荐模型的训练过程中的通过序列片段和用户特征进行预测的示意图,其中,用户的特征由两个部分组成,第一部分代表两个序列的共享用户特征us,另一个部分为用户单序列特征uf和ur。具体可以表达如下:
1)初始化序列共享用户特征向量us,这一部分代表用户对该两个任务的共同喜好
2)将us经过两个大小一样、参数不共享的独立的神经网络层,从而得到ur和uf,ur和uf代表用户对该两个任务的个性喜好
3)将us和ur、uf分别连接起来(直接拼接为一个更长的特征向量),构成新的用户特征ur’=[ur,us]和uf’=[uf,us],这样可以得到一个既考虑用户的共同喜好,又考虑用户的个性洗好的综合特征向量。
步骤806:利用连接得到的向量[sr’,ur’]和[sf,sr’]分别预测用户所要购买的游戏道具。
其中,所预测的用户所要购买的游戏道具可以包括:下一时刻的购买道具I D(真实购买预测任务)和用户下一时刻购买道具类别(伪道具任务),由此,可以完成进行游戏道具推荐的图神经网络的训练。
进一步地,还可以通过一定权值线性加权得到整体多任务的loss,对该loss梯度下降联合学习,并反向梯度传播,更新er_i,ef_i和us。
具体来说:首先进行线性加权处理,包括:对两个分类任务,其正样本分别是真实发生的下一次购买道具和对应的道具类别,其余均为负样本。可以利用真实样本和预测层得到的结果求出softmax交叉熵作为loss,分别为loss_r和loss_f,则整体损失函数loss可以表示为:
loss=αr1*loss_r+αf1*loss_f,
其中,αr1和αf1均为参数。之后进入然后联合学习阶段:直接对loss求梯度,当作一个简单的优化问题求解,最后反向梯度传播。当然还可以通过多周数据以及多次数据增强后的多次单周数据,可进一步增加数据数量,提高结果准确性当训练完成之后,通过本发明所提供的虚拟物品推荐模型进行游戏道具推荐,包括以下步骤:
1)获取目标玩家的道具购买序列,以及每个道具的类别,构成伪道具任务;假如真实的某一周道具已有购买序列A为(碎银,碎银,金色砭石兑换券,通用心法残页(紫)),运营商并不知道下一个真实购买道具为通用心法残页(紫)。伪造的道具序列B为:(碎银-基础资源,碎银-基础资源,金色砭石兑换券-砭石***,通用心法残页(紫)-心法***道具),同样不知道下一个预测分类真实结果为心法***道具。
2)将每个单周(作为单位时间,对于游戏小程序触发频繁的用户还可以
通过每天的用户日志获取购买数据)数据构健真实购买序列和伪道具序列的子图,并查表得到之前训练得到的ef_j和er_j,j=i1,i2,…,i5。
3)构成子图后得到序列片段特征向量(session state)sr和sf。序列片段特征向量由两部分组成,一部分代表了整个序列的用户偏好,为对整个序列的特征节点进行线性加权,称之为序列的第一部分特征其中,
Figure GDA0004105489080000241
其中αrj为一个参数。另一部分为用户的最近喜好,用最近一次购买的结果sr2=er_i5表示,称为序列的第二部分特征。将第一部分特征sr1和最近一次购买的结果sr2拼接,构成序列的整体片段特征向量sr=[sr1,sr2]。同理可得sr=[sf1,sf2],其中
Figure GDA0004105489080000242
sf2=ef_i5,αfj为参数。
4)将sr和sf通过如下自注意力学习的方式进行共享,得到新的session statesr’和sf’,具体包括:
a)s11=sr*sr,s12=sr*sf;s21=sf*sr,s22=sf*sf;
b)s11’=e^s11/(e^s11+e^s12);s12’=e^s21/(e^s11+e^s12);s21’=e^s21/(e^s21+e^s22),s22’=e^s22/(e^s21+e^s22);
c)sr’=s11’*sr+s12’*sf;sf’=s21’*sr+s22’*sf。
其中,由于不同目标用户的游戏道具使用习惯不同,在游戏环境中所使用的游戏角色以及技能、武器均不相同,因此通过自注意力学习机制对目标用户的序列片段特征向量进行共享处理,并通过注意力机制,在对于用户所要购买的游戏道具的类别与名称进行预测时,调整不同特征向量的权重,形成新的序列片段特征向量,使得新的序列片段特征向量能够共享针对该目标用户的道具特征、用户特征、序列片段特征等由多任务学习机制所获得的特征,提升对所要向用户推荐的游戏道具的准确性,增强虚拟物品推荐模型的泛化能力,使其适应不同的微信小程序游戏使用场景,同时,还能够在训练阶段调整与所述虚拟物品推荐模型中的基于注意力机制的图积神经网络的参数,实现虚拟物品模型的快速部署,节省用户的等待时间。
5)查表得到对应的用户特征ur’和uf’。
6)利用连接得到的向量[sr’,ur’]和[sf’,sr’]分别预测用户下一时刻的购买道具ID(真实购买预测任务)和用户下一时刻购买道具类别(伪道具任务)。由此,可以利用虚拟物品推荐模型向用户准确地推荐虚拟物品,减少了用户查找虚拟物品的时间,提升了用户的使用体验。
下面,继续以某用户(用户H)在第一类型游戏进程中的单周购买序列为例,对本发明所提供的游戏道具推荐过程进行说明,其中,确定用户H真实的某一周道具购买序列A为:碎银,碎银,金色砭石兑换券,通用心法残页(紫),通用心法残页(紫),下一个真实购买道具为通用心法残页(紫),作为分类真实结果。那么首先构造伪造的道具序列B为:(碎银-基础资源,碎银-基础资源,金色砭石兑换券-砭石***,通用心法残页(紫)-心法***道具),下一个预测分类结果为心法***道具。
参考图13,图13为本发明实施例提供的虚拟物品推荐模型进行游戏道具推荐过程中的序列片段处理示意图,其中,构建子图的过程,包括:其中,er1代表碎银的特征向量,er2代表金色砭石兑换券的特征向量,er3代表通用心法残页(紫)的特征向量;ef1代表碎银-基础资源的特征向量,ef2代表金色砭石兑换券-砭石***的特征向量,ef3代表通用心法残页(紫)-心法***道具的特征向量。同时,初始化er1,er2,er3,ef1,ef2,ef3,具体来说:
1)ef1’=Wff*ef1+Wrf*er1;
2)er1’=Wrr*er1+Wfr*ef1,
3)ef2’=Wff*ef1+Wrf*er1;
4)er2’=Wrr*er1+Wfr*ef1;
5)ef3’=Wff*ef2+Wrf*er2;和er3=Wrr*er2+Wfr*ef2,从而得到序列片段特征向量,即:
sr=αr1*er1+αr2*er1+αr3*er2+αr4*er3
sf=αf1*ef1+αf2*ef1+αf3*ef2+αf4*ef3
再通过自注意力方式机制调整不同特征向量的权重进行处理,得到新的特征向量sr’和sf’。
目标用户H的用户特征为ur’=[Wur*us,us]和uf’=[Wuf*us,us],将其带入序列片段特征向量,得到最终的预测层输入向量[sr’,ur’]和[sf’,uf’]。而两个预测任务的真实标签为通用心法残页(紫)和心法***道具,得到预测结果和真实结果的误差loss_r和loss_f,线性加权得到整体损失函数loss为:
loss=αr1*loss_r+αf1*loss_f
之后进行梯度下降反向传播处理,更新所有的变量。利用游戏***中的购买记录信息确定相应的训练样本对虚拟物品推荐模型进行训练,某一周运营商对目标用户H进行推荐。通过游戏服务器中的购买记录确定用户目标用户H上一周道具购买序列A:碎银,通用心法残页(紫),构建对应的伪造道具序列B:碎银-基础资源,通用心法残页(紫)-心法***道具。查表知道他们的特征向量分别为er_sui,er_xinzi,ef_sui和ef_xinzi,假设αr1均为0.5,那么对应的序列片段特征向量为[0.5*er_sui+0.5*er_xinzi,er_xinzi]和[0.5*ef_sui+0.5*ef_xinzi,ef_xinzi],并通过前序的自注意力方式进行转化,得到sr’和sf’。
同时,查表得到目标用户H的用户特征为ur_hong和uf_hong,那么便可以将[sr’,ur_hong]和[sf’,uf_hong]作为输入向量,输入预测层,得到全局的游戏道具的预测概率结果。由此,可以提升对所要向用户推荐的游戏道具的准确性,准确地向用户推荐心法***道具类型中的通用心法残页(紫)以适应用户所操控的游戏角色在之后的游戏操控,便面目标用户长时间地查找道具商店获取所需要的游戏道具。
图14为本发明实施例提供的经过显示顺序调整的虚拟物品前端显示示意图,通过全局的游戏道具的预测概率结果,对向用户推荐的游戏道具的召回顺序进行排序;根据游戏道具的召回顺序的排序结果,对用户界面中所展示的游戏道具的顺序进行调整。
并且还可以最终根据页面大小,选择概率最高的道具,展示在游戏页面上,或者对所要展示的游戏道具的排序进行调整,以更符合用户的购买意愿。
有益技术效果:
相比于传统技术中,通过本申请所提供的技术方案,过获取目标用户的虚拟物品购买行为参数信息;确定与所述目标用户的虚拟物品购买行为相匹配的序列子图;通过所述序列子图,确定所述虚拟物品推荐模型中的图神经网络模型;基于所述虚拟物品推荐模型中的图神经网络模型,确定相应的序列片段特征向量;基于所述序列片段特征向量和所述目标用户的用户特征向量,对所述虚拟物品推荐模型的网络参数进行调整,实现了虚拟物品推荐模型与目标用户相匹配,并可以利用虚拟物品推荐模型向用户准确地推荐虚拟物品,减少了用户查找虚拟物品的时间,提升了用户的使用体验。其中,参考表1-表3,在使用本发明多提供的虚拟物品推荐模型时,通过在不同维度与传统技术进行对比可以确定本发明所提供的虚拟物品推荐方法所推荐的游戏道具更加符合用户的购买意愿,提升用户黏性。其中,不同维度中包括各自对应的评价指标,即命中率(Hit ration)、匹配度MRR(MeanReciprocal Rank)和归一化折损累计增益NDCG(Normalized Discounted cumulativegain)。
Figure GDA0004105489080000271
Figure GDA0004105489080000281
表1
Figure GDA0004105489080000282
表2
Figure GDA0004105489080000283
表3
以上所述,仅为本发明的实施例而已,并非用于限定本发明的保护范围,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种虚拟物品推荐方法,其特征在于,所述方法包括:
取获取目标用户的虚拟物品购买行为参数信息;
基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户的虚拟物品购买行为相匹配的伪道具任务,其中,所述伪道具任务为根据游戏策划专业知识,进行的已知结果的伪造预测任务;
基于所述伪道具任务和所述目标用户的真实购买序列,确定相对应的序列片段特征向量;
对所述目标用户的虚拟物品购买行为相匹配的序列子图中的不同序列共享的目标用户向量进行初始化处理;
通过虚拟物品推荐模型中的第一用户神经网络模型对所述目标用户向量进行处理,确定与真实购买序列相匹配的第一用户单序列特征;
通过所述虚拟物品推荐模型中的第二用户神经网络模型对所述目标用户向量进行处理,确定与伪道具序列相匹配的第二用户单序列特征;
对所述第一用户单序列特征和所述第二用户单序列特征进行拼接处理,形成所述目标用户的用户特征向量;
基于所述目标用户的用户特征向量,确定所述目标用户所要购买的虚拟物品,以实现向所述目标用户推荐虚拟物品。
2.根据权利要求1所述的方法,其特征在于,所述基于所述伪道具任务和所述目标用户的真实购买序列,确定相对应的序列片段特征向量,包括:
基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户相匹配的真实购买序列;
基于所述伪道具任务和所述目标用户的真实购买序列,确定所述目标用户的真实购买序列和伪道具序列对应的序列子图;
通过所述序列子图,确定与所述目标用户相对应的序列片段特征向量。
3.根据权利要求2所述的方法,其特征在于,所述基于所述伪道具任务和所述目标用户的真实购买序列,确定所述目标用户的真实购买序列和伪道具序列对应的序列子图,包括:
基于所述目标用户的虚拟物品购买行为参数信息,确定真实购买序列和伪道具序列;
通过确定目标虚拟物品在所述真实购买序列中的节点和伪道具序列中的节点,确定所述序列子图的节点;
基于所述目标虚拟物品在所述真实购买序列中的时间顺序,确定所述序列子图的第一类型边线;
基于所述目标虚拟物品在所述伪道具序列中的时间顺序,确定所述序列子图的第二类型边线;
基于所述真实购买序列和伪道具序列的关联关系,确定所述序列子图的第三类型边线;
根据所述序列子图的节点、所述第一类型边线、所述第二类型边线和所述第三类型边线,确定与所述目标用户的虚拟物品购买行为相匹配的序列子图。
4.根据权利要求1所述的方法,其特征在于,所述基于所述伪道具任务和所述目标用户的真实购买序列,确定相对应的序列片段特征向量,包括:
对序列子图的全部特征节点进行线性加权,确定第一序列片段特征向量,其中,所述第一序列片段特征向量用于表征所述目标用户的购买行为偏好;
提取所述目标用户的最后一次拟物品的购买参数,确定第二序列片段特征向量;
将所述第一序列片段特征向量和所述第二序列片段特征向量进行拼接处理,确定相应的序列片段特征向量。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定与所述虚拟物品推荐模型相匹配的多任务损失函数;
基于所述序列片段特征向量、所述目标用户的用户特征向量以及所述多任务损失函数,调整所述虚拟物品推荐模型的网络参数;
直至所述虚拟物品推荐模型对应的不同维度的损失函数达到相应的收敛条件;以实现所述虚拟物品推荐模型与所述目标用户相匹配。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述目标用户所要购买的虚拟物品的名称以及所要购买的虚拟物品的类别;
基于所述目标用户购买的虚拟物品名称以及所述所要购买的虚拟物品的类别,对所述虚拟物品的召回顺序进行排序;
根据所述虚拟物品的召回顺序的排序结果,对用户界面中所展示的虚拟物品的顺序进行调整。
7.根据权利要求1所述的方法,其特征在于,所述获取目标用户的虚拟物品购买行为参数信息,包括:
当所述虚拟物品为游戏道具时,确定所述目标用户所持有的游戏角色,其中,不同游戏角色与相对应的游戏道具匹配;
基于所述游戏角色,确定对应的游戏道具的购买序列与对应的购买时间;
基于所述游戏道具的购买序列与对应的购买时间,确定不同单位时间内的所述目标用户虚拟物品购买行为参数。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
显示用户界面,所述用户界面中包括以不同的游戏角色的人称视角对虚拟环境进行观察的人称视角画面,所述不同的游戏角色持有所述游戏道具,所述用户界面中还包括伤害控制组件;
通过所述伤害控制组件,控制所述游戏道具对所述显示用户界面中相应的伤害对象发起攻击,以实现所述显示用户界面中的不同的游戏角色攻击所述伤害对象。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述目标用户选择任一所展示的虚拟物品时,
基于所述目标用户的用户特征向量,确定与所述目标用户相匹配的支付方式,或者,
基于所述目标用户的用户特征向量和所述虚拟物品的类型信息,确定与所述目标用户相匹配的支付方式;
基于所述与所述目标用户相匹配的支付方式,触发对应的支付进程。
10.一种虚拟物品推荐装置,其特征在于,所述装置包括:
信息传输模块,用于取获取目标用户的虚拟物品购买行为参数信息;
信息处理模块,用于基于所述目标用户的虚拟物品购买行为参数信息,确定与所述目标用户的虚拟物品购买行为相匹配的伪道具任务,其中,所述伪道具任务为根据游戏策划专业知识,进行的已知结果的伪造预测任务;
所述信息处理模块,用于基于所述伪道具任务和所述目标用户的真实购买序列,确定相对应的序列片段特征向量;
所述信息处理模块,用于对所述目标用户的虚拟物品购买行为相匹配的序列子图中的不同序列共享的目标用户向量进行初始化处理;
所述信息处理模块,用于通过虚拟物品推荐模型中的第一用户神经网络模型对所述目标用户向量进行处理,确定与真实购买序列相匹配的第一用户单序列特征;
所述信息处理模块,用于通过所述虚拟物品推荐模型中的第二用户神经网络模型对所述目标用户向量进行处理,确定与伪道具序列相匹配的第二用户单序列特征;
所述信息处理模块,用于对所述第一用户单序列特征和所述第二用户单序列特征进行拼接处理,形成所述目标用户的用户特征向量;
所述信息处理模块,用于基于所述目标用户的用户特征向量,确定所述目标用户所要购买的虚拟物品。
11.根据权利要求10所述的装置,其特征在于,
所述信息传输模块,用于当所述虚拟物品为游戏道具时,确定所述目标用户所持有的游戏角色,其中,不同游戏角色与相对应的游戏道具匹配;
所述信息传输模块,用于基于所述游戏角色,确定对应的游戏道具的购买序列与对应的购买时间;
所述信息传输模块,用于基于所述游戏道具的购买序列与对应的购买时间,确定不同单位时间内的所述目标用户虚拟物品购买行为参数。
12.根据权利要求10所述的装置,其特征在于,
所述信息处理模块,用于显示用户界面,所述用户界面中包括以不同的游戏角色的人称视角对虚拟环境进行观察的人称视角画面,所述不同的游戏角色持有游戏道具,所述用户界面中还包括伤害控制组件;
所述信息处理模块,用于通过所述伤害控制组件,控制所述游戏道具对所述显示用户界面中相应的伤害对象发起攻击,以实现所述显示用户界面中的不同的游戏角色攻击所述伤害对象。
13.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储可执行指令;
处理器,用于运行所述存储器存储的可执行指令时,实现权利要求1至9任一项所述虚拟物品推荐方法。
14.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1-9任一项所述虚拟物品推荐方法。
CN202010388740.2A 2020-05-09 2020-05-09 虚拟物品推荐方法、装置、电子设备及存储介质 Active CN111563802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010388740.2A CN111563802B (zh) 2020-05-09 2020-05-09 虚拟物品推荐方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010388740.2A CN111563802B (zh) 2020-05-09 2020-05-09 虚拟物品推荐方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111563802A CN111563802A (zh) 2020-08-21
CN111563802B true CN111563802B (zh) 2023-04-14

Family

ID=72070927

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010388740.2A Active CN111563802B (zh) 2020-05-09 2020-05-09 虚拟物品推荐方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111563802B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112270275B (zh) * 2020-11-02 2023-11-21 上海哔哩哔哩科技有限公司 基于图片识别的商品搜索方法、装置及计算机设备
CN112597392B (zh) * 2020-12-25 2022-09-30 厦门大学 一种基于动态注意力和分层强化学习的推荐***
CN112733018B (zh) * 2020-12-31 2022-12-06 哈尔滨工程大学 一种基于图神经网络gnn和多任务学习的会话推荐方法
CN113343097B (zh) * 2021-06-24 2023-01-13 中山大学 基于片段和自注意力机制的序列推荐方法及***
CN113633977B (zh) * 2021-08-09 2023-10-24 北京字跳网络技术有限公司 一种虚拟物品处理方法、装置、设备以及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201026A (zh) * 2010-03-23 2011-09-28 上海美你德软件有限公司 在虚拟环境中为玩家进行信息推荐的方法及***
CN104254851A (zh) * 2012-03-17 2014-12-31 海智网聚网络技术(北京)有限公司 用于向用户推荐内容的方法和***
CN106557938A (zh) * 2015-09-24 2017-04-05 网易(杭州)网络有限公司 一种游戏中虚拟物品的推送方法
CN109886769A (zh) * 2019-01-10 2019-06-14 珠海金山网络游戏科技有限公司 一种虚拟物品的展示优化方法和装置
CN110162703A (zh) * 2019-05-13 2019-08-23 腾讯科技(深圳)有限公司 内容推荐方法、训练方法、装置、设备及存储介质
WO2019192138A1 (zh) * 2018-04-04 2019-10-10 平安科技(深圳)有限公司 信息处理方法及***、电子设备、存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10614473B2 (en) * 2014-07-11 2020-04-07 Sensoriant, Inc. System and method for mediating representations with respect to user preferences

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102201026A (zh) * 2010-03-23 2011-09-28 上海美你德软件有限公司 在虚拟环境中为玩家进行信息推荐的方法及***
CN104254851A (zh) * 2012-03-17 2014-12-31 海智网聚网络技术(北京)有限公司 用于向用户推荐内容的方法和***
CN106557938A (zh) * 2015-09-24 2017-04-05 网易(杭州)网络有限公司 一种游戏中虚拟物品的推送方法
WO2019192138A1 (zh) * 2018-04-04 2019-10-10 平安科技(深圳)有限公司 信息处理方法及***、电子设备、存储介质
CN109886769A (zh) * 2019-01-10 2019-06-14 珠海金山网络游戏科技有限公司 一种虚拟物品的展示优化方法和装置
CN110162703A (zh) * 2019-05-13 2019-08-23 腾讯科技(深圳)有限公司 内容推荐方法、训练方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN111563802A (zh) 2020-08-21

Similar Documents

Publication Publication Date Title
CN111563802B (zh) 虚拟物品推荐方法、装置、电子设备及存储介质
Xu et al. Imagereward: Learning and evaluating human preferences for text-to-image generation
Yannakakis et al. Artificial intelligence and games
CN111632379B (zh) 游戏角色行为控制方法、装置、存储介质及电子设备
CN112791394B (zh) 游戏模型训练方法、装置、电子设备及存储介质
CN111282267B (zh) 信息处理方法、装置、介质及电子设备
CN110807150A (zh) 信息处理方法及装置、电子设备和计算机可读存储介质
CN115769234A (zh) 基于模板从2d图像生成3d对象网格
CN111111220A (zh) 多人对战游戏的自对弈模型训练方法、装置和计算机设备
CN113508378A (zh) 推荐模型的训练方法、推荐方法、装置及计算机可读介质
CN112380453B (zh) 物品推荐方法、装置、存储介质及设备
Weitkamp et al. Visual rationalizations in deep reinforcement learning for atari games
CN112791414B (zh) 外挂识别模型训练方法、装置、电子设备及存储介质
CN113343089A (zh) 用户召回方法及装置、设备
CN114333027A (zh) 基于联合和交替学习框架的跨域新类人脸表情识别方法
CN111589120B (zh) 目标物控制方法、计算机设备及计算机可读存储介质
CN115237732A (zh) 一种操作预测方法及相关装置
Han et al. A game strategy model in the digital curling system based on NFSP
Ketamo Sharing behaviors in games and social media
Saito et al. Python reinforcement learning projects: eight hands-on projects exploring reinforcement learning algorithms using TensorFlow
Sarkar et al. Using a disjoint skill model for game and task difficulty in human computation games
CN115487508A (zh) 游戏战队推荐模型的训练方法和相关装置
CN116943220A (zh) 一种游戏人工智能控制方法、装置、设备及存储介质
Bingham et al. Productive Tensions: How Every Leader Can Tackle Innovation’s Toughest Trade-offs
CN112836805B (zh) Krfpv算法、执行装置、电子设备、存储介质以及神经网络

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40027428

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant