CN113344184B - 用户画像预测方法、装置、终端和计算机可读存储介质 - Google Patents
用户画像预测方法、装置、终端和计算机可读存储介质 Download PDFInfo
- Publication number
- CN113344184B CN113344184B CN202110621172.0A CN202110621172A CN113344184B CN 113344184 B CN113344184 B CN 113344184B CN 202110621172 A CN202110621172 A CN 202110621172A CN 113344184 B CN113344184 B CN 113344184B
- Authority
- CN
- China
- Prior art keywords
- user
- feature
- target
- portrait
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24317—Piecewise classification, i.e. whereby each classification requires several discriminant rules
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请实施例公开了一种用户画像预测方法、装置、终端和计算机可读存储介质;其中用户画像预测方法包括:基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征;基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量,所述目标用户的编码后特征向量与用户画像中各画像维度的用户画像结果具有约束关系,所述约束关系基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习得到,所述画像标签中包括各画像维度的实际用户画像结果;基于所述目标用户的编码后特征向量,预测所述目标用户在所述各画像维度下的目标用户画像结果。本申请实施例可以提升用户画像结果的预测精度。
Description
技术领域
本申请涉及机器学习领域,具体涉及一种用户画像预测方法、装置、终端和计算机可读存储介质。
背景技术
用户画像数据对于数据分析,比如用户行为数据的分析具有重要的指导意义;然而,用户画像通常是多维的,有的维度容易收集、有的维度则难以直接收集。对于难以直接收集维度的用户画像可以通过模型进行预测,具体地将每个维度用户画像预测作为一个分类任务,每个分类任务单独训练一个模型,但多个维度的用户画像就需对应多个模型进行预测。
当要预测的用户画像维度较多时,则需训练的模型数量较大,模型训练操作繁琐。因此,对于多维用户画像通常会通过基于多标签学习的模型进行预测。
但是,本申请发明人在实际研究过程中发现,现有基于多标签学习的预测模型主要是以标签作为监督进行学习,对于标签与特征之间的关联没有深入学习,因此用户画像结果的预测精度相对较低。
发明内容
本申请实施例提供一种用户画像预测方法、装置、终端和存储介质,可以提升用户画像结果的预测精度。
第一方面,本申请实施例提供一种用户画像预测方法,包括:
基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征;
基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量,所述目标用户的编码后特征向量与用户画像中各画像维度的用户画像结果具有约束关系,所述约束关系基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习得到,所述画像标签中包括各画像维度的实际用户画像结果;
基于所述目标用户的编码后特征向量,预测所述目标用户在所述各画像维度下的目标用户画像结果。
第二方面,本申请实施例还提供一种用户画像预测装置,包括:
获取单元,用于基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征;
编码单元,用于基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量,所述目标用户的编码后特征向量与用户画像中各画像维度的用户画像结果具有约束关系,所述约束关系基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习得到,所述画像标签中包括各画像维度的实际用户画像结果;
预测单元,用于基于所述目标用户的编码后特征向量,预测所述目标用户在所述各画像维度下的目标用户画像结果。
在一些实施例中,所述用户信息包括群体关系信息和个体信息,所述获取单元具体用于:
基于所述目标用户在目标游戏中的社交关系,获取所述目标用户的群体关系信息;
基于所述群体关系信息,提取出所述目标用户的群体特征;
获取所述目标用户在目标游戏中的个体信息;
基于所述个体信息,提取出所述目标用户的个体特征;
根据所述群体特征和所述个体特征,得到所述目标用户的用户特征。
在一些实施例中,所述个体信息包括所述目标用户在所述目标游戏中的用户属性和行为属性,所述获取单元具体用于:
获取所述用户属性的嵌入式向量;
获取所述行为属性的嵌入式向量;
对所述用户属性的嵌入式向量和所述行为属性的嵌入式向量进行拼接,得到所述个体特征。
在一些实施例中,所述获取单元具体用于:
基于所述目标用户在目标游戏中的社交关系,获取所述目标用户在目标游戏中的交易信息、好友信息、交互信息和团队信息中的至少一项,作为所述目标用户的群体关系信息。
在一些实施例中,所述用户画像预测装置还包括训练单元,所述基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量步骤之前,所述训练单元具体用于:
获取用户特征样本;
通过预设的多任务分类模型中的特征编码器,对所述用户特征样本进行编码,得到所述用户特征样本的编码后特征向量;
通过所述多任务分类模型中的标签编码器,对所述用户特征样本的画像标签进行编码,得到所述用户特征样本的编码后标签向量,所述画像标签中包括各画像维度的实际用户画像结果;
通过所述多任务分类模型中的分类任务层,基于所述用户特征样本的编码后特征向量,预测所述用户特征样本在各画像维度下的预测用户画像结果;
基于所述预测用户画像结果、所述实际用户画像结果、所述用户特征样本的编码后特征向量和所述用户特征样本的编码后标签向量,确定所述多任务分类模型的训练损失;
基于所述训练损失对所述多任务分类模型中的参数进行调整,以得到训练完成的多任务分类模型。
在一些实施例中,所述训练单元具体用于:
基于所述预测用户画像结果和所述实际用户画像结果,确定所述多任务分类模型的目标分类损失;
基于所述用户特征样本的编码后特征向量和所述用户特征样本的编码后标签向量,确定所述多任务分类模型的特征标签间约束损失;
基于所述目标分类损失和所述特征标签间约束损失,确定所述多任务分类模型的训练损失。
在一些实施例中,所述通过所述多任务分类模型中的标签编码器,对所述用户特征样本的画像标签进行编码,得到所述用户特征样本的编码后标签向量步骤之后,所述训练单元具体用于:
通过所述多任务分类模型中的标签解码器,基于所述编码后标签向量进行解码,得到所述用户特征样本的标签估计值;
在一些实施例中,所述训练单元具体用于:
基于所述预测用户画像结果和所述实际用户画像结果,得到所述多任务分类模型的第一分类损失;
基于标签估计值和所述实际用户画像结果,得到所述多任务分类模型的第二分类损失;
对所述第一分类损失和所述第二分类损失求和,得到所述目标分类损失。
在一些实施例中,所述训练单元具体用于:
基于所述标签估计值和所述实际用户画像结果,确定所述多任务分类模型的分布相似度损失;
对所述目标分类损失、所述特征标签间约束损失和所述分布相似度损失求和,得到所述多任务分类模型的训练损失。
在一些实施例中,所述编码单元具体用于:
基于特征编码器,生成所述目标用户的用户特征的目标特征高斯分布;
基于所述特征编码器,对所述目标特征高斯分布进行采样,得到所述目标用户的编码后特征向量。
第三方面,本申请实施例还提供一种终端,包括存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行本申请实施例所提供的任一种用户画像预测方法中的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例所提供的任一种用户画像预测方法中的步骤。
本申请实施例通过基于特征编码器,对目标用户的用户特征进行编码得到目标用户的编码后特征向量,再预测目标用户在各画像维度下的目标用户画像结果;由于特征编码器基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习,得到了编码后特征向量与用户画像中各画像维度的用户画像结果的约束关系,即特征编码器学到了标签与特征之间的关联。因此,本申请实施例可以在一定程度上提升用户画像结果的预测精度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的用户画像预测方法的一种实施例流程示意图;
图2是本申请实施例中提供的目标用户画像结果的预测过程说明示意图;
图3是本申请实施例中提供的用户特征的获取说明示意图;
图4是本申请实施例中提供的群体关系信息的说明示意图;
图5是本实施例提供的多分类任务模型训练的一种实施例流程示意图;
图6是本申请实施例中提供的多分类任务模型的原理框架示意图;
图7是本申请实施例提供的用户画像预测装置的结构示意图;
图8是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种用户画像预测方法、装置、终端和存储介质。
其中,该用户画像预测装置具体可以集成在电子设备中,该电子设备可以为终端、服务器等设备。其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、或者个人电脑(Personal Computer,PC)等设备;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。
在一些实施例中,该用户画像预测装置还可以集成在多个电子设备中,比如,用户画像预测装置可以集成在多个服务器中,由多个服务器来实现本申请的用户画像预测方法。
在一些实施例中,服务器也可以以终端的形式来实现,比如,可以将个人电脑设置服务器来集成该用户画像预测装置。
例如,该电子设备可以是移动终端,该移动终端可以基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征;基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量,所述目标用户的编码后特征向量与用户画像中各画像维度的用户画像结果具有约束关系,所述约束关系基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习得到,所述画像标签中包括各画像维度的实际用户画像结果;基于所述目标用户的编码后特征向量,预测所述目标用户在所述各画像维度下的目标用户画像结果。
以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。
在本实施例中,提供了一种用户画像预测方法,如图1所示,图1是本申请实施例提供的用户画像预测方法的一种实施例流程示意图,该用户画像预测方法的具体流程可以包括如下步骤101~103:
101、基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征。
本实施例中,步骤101~步骤103可以由服务器实现,或者,也可以由终端实现,或者还可以由服务器和终端共同实现,本实施例对此没有限制。
本实施例中,用户为目标游戏的使用用户,该目标游戏可以是剧情类游戏、对战类游戏、跑酷类游戏、关卡类游戏等等。此处目标游戏仅为举例,具体可以实际场景需求而调整,不以此为限。
目标用户具体是待预测在各画像维度下的用户画像结果的用户。
目标用户在目标游戏中的用户信息可以包括例如目标用户账户信息、设备信息、社交信息、任务信息、项目信息、金钱信息等用户属性,目标用户在某个时间戳执行的行为ID等行为属性,目标用户的交易网络、好友网络、聊天网络和队伍网络等群体关系信息。
其中,用户特征是基于目标用户在目标游戏中的用户信息,进行向量化后表示后所得到的向量。例如,本申请实施例中,用户特征可以是基于目标用户在目标游戏中的用户信息进行向量化后表示后,所得到的one-hot形式的向量。
102、基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量。
所述目标用户的编码后特征向量与用户画像中各画像维度的用户画像结果具有约束关系,所述约束关系基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习得到,所述画像标签中包括各画像维度的实际用户画像结果。
其中,目标用户的编码后特征向量是指通过特征编码器,对目标用户的用户特征进行编码所得到的特征向量。
在一些实施例中,步骤102具体可以包括:基于特征编码器,生成所述目标用户的用户特征的目标特征高斯分布;基于所述特征编码器,对所述目标特征高斯分布进行采样,得到所述目标用户的编码后特征向量。其中,目标特征高斯分布是指通过特征编码器对目标用户的用户特征进行编码时所产生的特征高斯分布。例如,特征编码器可以是变分自编码器,则可以直接采用变分自编码器基于目标用户的用户特征产生目标特征高斯分布,并基于目标特征高斯分布进行采样,采样后的结果作为目标用户的编码后特征向量。
具体地,某一画像维度的用户画像结果可以是用户在目标游戏中的游戏行为,比如用户在未来3天是否在线、用户在未来2天是否参与某项游戏任务。用户画像结果还可以是用户与另一用户是否为好友关系。
本申请实施例中,特征编码器可以是本申请实施例训练完成的多任务分类模型中的特征编码器,也可以是模型参数与训练完成的多任务分类模型中的特征编码器模型参数相同的编码器。该特征编码器可以是变分自编码器。后文将详细介绍本申请实施例的多任务分类模型,未简化表述,此处不再赘述。
本申请实施例中的特征编码器与相关技术中的特征编码器不同,本申请实施例中的特征编码器,是基于自身对用户特征样本进行编码后得到的用户特征样本的编码后特征向量、以及标签编码器对用户特征样本的画像标签编码后得到的编码后标签向量,对特征编码器产生的特征与各画像维度的用户画像结果在同一维度上的预设损失函数,进行优化学习得到。因此,本申请实施例中的特征编码器可以学习到编码后的特征向量与用户画像中个画像维度的画像结果的约束关系,故而,特征编码器进行编码后的特征向量与用户画像中各画像维度的用户画像结果具有约束关系。
103、基于所述目标用户的编码后特征向量,预测所述目标用户在所述各画像维度下的目标用户画像结果。
其中,目标用户画像结果是指根据目标用户的用户特征预测得到的目标用户在各画像维度下的用户画像结果。
如图2所示,图2是本申请实施例中提供的目标用户画像结果的预测过程说明示意图。特征编码器进行特征编码后得到目标用户的编码后特征向量Zx,可以直接输入至本申请实施例中的分类层中,该分类层可以是全连接层结构,通过该分类层,可以分别预测目标用户在各画像维度下的目标用户画像结果。
例如,以预测跑酷类游戏中的用户A在未来3天是否在线、在未来2天是否参与某项游戏任务、与另一用户是否为好友关系三个画像维度下的用户画像结果为例。如图2所示,首先,基于用户A在跑酷类游戏中的用户信息,进行向量化得到用户A的用户特征;然后,通过本申请实施例的特征编码器对用户A的用户特征进行编码,得到用户A的编码后特征向量;最后通过分类层基于用户A的编码后特征向量,对用户A在未来3天是否在线、在未来2天是否参与某项游戏任务、与另一用户是否为好友关系进行二分类,得到用户A在未来3天是否在线、在未来2天是否参与某项游戏任务、与另一用户是否为好友关系三个画像维度下的用户画像结果。
由上可知,本申请实施例中,由于特征编码器基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习,得到了编码后特征向量与用户画像中各画像维度的用户画像结果的约束关系,即特征编码器学到了标签与特征之间的关联,第一方面,避免了单纯以标签作为监督进行多标签分类任务的学习而导致分类结果精度低的问题;第二方面,避免基于同一个特征向量进行多个维度进行分类而导致分类结果精度低的问题。因此基于本申请实施例中的特征编码器,对目标用户的用户特征进行编码得到目标用户的编码后特征向量,再预测目标用户在各画像维度下的目标用户画像结果,可以在一定程度上提升用户画像结果的预测精度。
第一方面,由于在游戏领域,数据环境复杂,单一数据源对用户的描述非常有限,很难从不同的角度完整地刻画用户;第二方面,不同的数据源的表现形式不同,难以同时使用不用的数据源完整地刻画用户;第三方面,不同的数据源会有部分重复特征的可能性,增加了数据处理的复杂度。如图3所示,图3是本申请实施例中提供的用户特征的获取说明示意图,为此,在本申请实施例,通过如图3所示的方式对多源数据进行整合,以实现从不同角度完整地刻画用户。
即在一些实施例中,即上述步骤“基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征”具体可以包括如下步骤1021~步骤1025:
1021、基于所述目标用户在目标游戏中的社交关系,获取所述目标用户的群体关系信息。
1022、基于所述群体关系信息,提取出所述目标用户的群体特征。
目标用户的群体特征是指基于目标用户在目标游戏中的群体关系信息进行嵌入表达后所得到的嵌入式向量。
具体地,将群体关系信息表示为多维邻接矩阵,作为目标用户的群体特征。
在一些实施例中,步骤“基于所述目标用户在目标游戏中的社交关系,获取所述目标用户的群体关系信息”具体可以包括:基于目标用户在目标游戏中的社交关系,获取目标用户在目标游戏中的交易网络,作为目标用户的群体信息。
交易网络基于目标用户在目标游戏中的交易关系构建得到,目标用户在目标游戏中的交易关系包括与其他用户之间的资产交换关系。
例如,如图4所示,图4是本申请实施例中提供的群体关系信息的说明示意图,其中,用户1为目标用户。若图4中表示目标用户在目标游戏中的交易网络,其中,交易网络中的每个节点代表一个用户,两个用户间的连边表示用户之间存在资产交换关系。
则可将该聊天网络表示为5*5的邻接矩阵,并将该5*5的邻接矩阵作为目标用户的群体特征,如下表1所示:
表1
邻接矩阵 | 用户1 | 用户2 | 用户3 | 用户4 | 用户5 |
用户1 | 0 | 1 | 1 | 1 | 1 |
用户2 | 1 | 0 | 0 | 0 | 0 |
用户3 | 1 | 0 | 0 | 0 | 1 |
用户4 | 1 | 0 | 0 | 0 | 0 |
用户5 | 1 | 0 | 1 | 0 | 0 |
在一些实施例中,步骤“基于所述目标用户在目标游戏中的社交关系,获取所述目标用户的群体关系信息”具体可以包括:基于目标用户在目标游戏中的社交关系,获取目标用户在目标游戏中的好友网络,作为目标用户的群体信息。
好友网络可以基于目标用户在目标游戏中的好友关系构建得到,目标用户在目标游戏中的好友关系包括与其他用户之间的单向关系,比如用户单向地添加和删除好友。
例如,若图4中表示目标用户在目标游戏中的好友网络,其中,好友网络中的每个节点代表一个用户,两个用户间的连边表示用户之间存在好友关系。同理,可将该好友网络表示为如表1所示的5*5的邻接矩阵,并将该5*5的邻接矩阵作为目标用户的群体特征。
在一些实施例中,步骤“基于所述目标用户在目标游戏中的社交关系,获取所述目标用户的群体关系信息”具体可以包括:基于目标用户在目标游戏中的社交关系,获取目标用户在目标游戏中的聊天网络,作为目标用户的群体信息。
聊天网络可以基于目标用户在目标游戏中与其他用户之间的沟通关系构建得到。
例如,若图4中表示目标用户在目标游戏中的聊天网络,其中,聊天网络中的每个节点代表一个用户,两个用户间的连边表示用户之间存在沟通关系。同理,可将该聊天网络表示为如表1所示的5*5的邻接矩阵,并将该5*5的邻接矩阵作为目标用户的群体特征。
在一些实施例中,步骤“基于所述目标用户在目标游戏中的社交关系,获取所述目标用户的群体关系信息”具体可以包括:基于目标用户在目标游戏中的社交关系,获取目标用户在目标游戏中的队伍网络,作为目标用户的群体信息。
队伍网络基于目标用户在目标游戏中与其他用户之间的协作关系构建得到。在游戏中,一般是以相同的目标暂时形成一个队伍,并在实现目标后解散。
例如,若图4中表示目标用户在目标游戏中的队伍网络,其中,队伍网络中的每个节点代表一个用户,两个用户间的连边表示用户之间存在协作关系。同理,可将该队伍网络表示为如表1所示的5*5的邻接矩阵,并将该5*5的邻接矩阵作为目标用户的群体特征。
在一些实施例中,步骤“基于所述目标用户在目标游戏中的社交关系,获取所述目标用户的群体关系信息”具体可以包括:基于所述目标用户在目标游戏中的社交关系,获取所述目标用户在目标游戏中的交易信息、好友信息、交互信息和团队信息中的至少一项,作为所述目标用户的群体关系信息。
其中,目标用户的群体关系信息包括目标用户在目标游戏中的交易信息、好友信息、交互信息和团队信息中的至少一项。
在一些实施例中,交易信息可以通过目标用户的交易网络来表示。好友信息可以通过目标用户的好友网络来表示。交互信息可以通过目标用户的交互网络来表示。团队信息可以通过目标用户的队伍网络来表示。
具体地,将群体关系信息表示为多维邻接矩阵,作为目标用户的群体特征。例如,群体关系信息包括目标用户在目标游戏中的交易信息、好友信息、交互信息和团队信息,具体体现为包括交易网络、好友网络、聊天网络和队伍网络,若群体关系信息中的用户数为N,则可将交易网络、好友网络、聊天网络和队伍网络分别表示成N*N*1的三维邻接矩阵。从而得到N*N*4的三维邻接矩阵,作为目标用户的群体特征。
通过筛选出交易信息、好友信息、交互信息和团队信息等与用户画像相关性较强的用户信息,体现在群体关系信息中,一方面,可以增加数据源的多样性,可以从更多不同的角度刻画用户;另一方面,可以在一定程度上降低用户信息重复的可能性,降低了数据处理的复杂度。
可见,通过从众多的用户信息中挖掘出群体关系信息,避免了部分重复特征导致的信息维度过高,建模复杂的问题。
1023、获取所述目标用户在目标游戏中的个体信息。
1024、基于所述个体信息,提取出所述目标用户的个体特征。
其中,个体信息可以是账户信息、设备信息、基础信息、社交信息、任务信息、项目信息、金钱信息等用户属性,也可以是行为属性。行为属性主要是由用户ID、行为ID、时间戳组成的用户行为交互形式。
目标用户的个体特征是指基于目标用户在目标游戏中的个体信息进行嵌入表达后所得到的嵌入式向量。
在一些实施例,个体信息为目标用户的用户属性,步骤“基于所述个体信息,提取出所述目标用户的个体特征”具体可以包括:获取用户属性的嵌入式向量;将用户属性的嵌入式向量作为目标用户的个体特征。
具体地,将目标用户的每个用户属性表征为向量,得到各用户属性的向量;将各用户属性的向量按照一定排序拼接再经过隐层特征表示网络,得到用户属性的嵌入式向量;将用户属性的嵌入式向量作为目标用户的个体特征。
其中,用户属性包括账户信息、设备属性、基础信息、社交信息、任务信息、玩法信息、金钱信息等。
例如,可将目标用户的账户信息、设备属性、基础信息、社交信息、任务信息、玩法信息、金钱信息分别为向量,得到各用户属性的向量a、b、c、d、e、f、g,例如a=(a1,a2,a3,…);然后,将向量a、b、c、d、e、f、g按照一定顺序拼接起来再经过隐层特征表示网络,得到用户属性的嵌入式向量A=(a,b,c,d,e,f,g)。目标用户的个体特征即为用户属性向量A=(a,b,c,d,e,f,g)。
在一些实施例,个体信息为目标用户的行为属性,步骤“基于所述个体信息,提取出所述目标用户的个体特征”具体可以包括:获取行为属性的嵌入式向量;将行为属性的嵌入式向量作为目标用户的个体特征。
目标用户的行为属性具体可以是包括用户ID、行为ID、时间戳的用户行为交互形式。其中时间戳表示用户特定行为发生的时间;用户ID和行为ID表示用户ID正在参与当前时间发生的行为ID,实验表明具有不同倾向性的用户,他们的行为是不同的。例如,喜欢冒险挑战的用户,在行为上会更愿意话花时间和金钱来提高他们的竞争力,如提升技能、装备等;倾向社交的用户,他们在行为上更愿意花时间在游戏中聊天,以扩大他们的社会关系等。目标用户的行为属性可以用来描述目标用户的短期和动态偏好。因此,本申请实施例中基于目标用户的行为属性获取用户特征,可以在一定程度上提升标用户在各画像维度下的目标用户画像结果的预测精度。
具体地,将目标用户的每个行为属性表示为一个ID;并将各行为属性的ID按照一定排序拼接再经过隐层特征表示网络,得到行为属性的嵌入式向量;将行为属性的嵌入式向量作为目标用户的个体特征。
例如,在目标游戏中,随时间变化目标用户发生一系列行为ID1、ID2、ID3、…,将行为ID表示成一个不定长的向量B=(ID1,ID2,ID3,…)再经过隐层特征表示网络,得到目标用户的行为属性的嵌入式向量;并将用户属性的嵌入式向量作为目标用户的个体特征。
在一些实施例中,个体信息包括目标用户在所述目标游戏中的用户属性和行为属性,步骤“基于所述个体信息,提取出所述目标用户的个体特征”具体可以包括:获取所述用户属性的嵌入式向量;获取所述行为属性的嵌入式向量;对所述用户属性的嵌入式向量和所述行为属性的嵌入式向量进行拼接,得到所述个体特征。
通过从众多的用户信息中挖掘用户属性和行为属性等有效的用户信息,避免了部分重复特征导致的信息维度过高,建模复杂的问题。
不同的用户属性、不同的行为属性对用户画像结果的影响程度不同,进一步地,为了增强对重要的用户属性或行为属性的注意力,本申请实施例中还引入了注意力机制,具体地,上述步骤“获取用户属性的嵌入式向量”具体可以包括:将目标用户的每个用户属性表征为向量,得到各用户属性的向量;将各用户属性的向量按照一定排序拼接,得到用户属性的向量序列;将用户属性的向量序列依次经过双向长短记忆网络(Bidirectional Longshort-term memory,BiLSTM)得到隐层状态序列,再将隐层状态序列经过多头注意力机制(Multi-Head Self-Attention),利用多头注意力机制来动态地生成不同连接权重后,得到用户属性的嵌入式向量。
同理,上述步骤“获取所述行为属性的嵌入式向量”具体可以包括:将目标用户的每个行为属性表征为向量,得到各行为属性的向量;将各行为属性的向量按照一定排序拼接,得到行为属性的向量序列;将行为属性的向量序列依次经过双向长短记忆网络(Bidirectional Long short-term memory,BiLSTM)得到隐层状态序列,再将隐层状态序列经过多头注意力机制(Multi-Head Self-Attention),利用多头注意力机制来动态地生成不同连接权重后,得到行为属性的嵌入式向量。
1024、根据所述群体特征和所述个体特征,得到所述目标用户的用户特征。
具体地,如图3所示,可以先群体特征和个体特征进行拼接后再经过图卷积网络(Modeling Relational Data with Graph Convolutional Networks,R-GCN)进行图卷积操作,将图卷积操作后得到的输出作为目标用户的用户特征。以增强用户信息之间的特征关联,提高用户特征的表示效果。
本申请实施例中,对于上述的特征编码器,可以是模型参数与训练完成的多任务分类模型中的特征编码器模型参数相同的编码器,也可以是训练完成的多任务分类模型中的特征编码器。本实施例中的特征编码器的模型参数可以是在步骤101之前确定的,也可以是在需要特征编码器时,实时确定的,本实施例对此没有限制。
下面介绍本申请实施例中多分类任务模型的训练过程,参考图5和图6,图5是本实施例提供的多分类任务模型训练的一种实施例流程示意图,图6是本申请实施例中提供的多分类任务模型的原理框架示意图,多分类任务模型的训练过程可以包括如下步骤501~步骤506:
501、获取用户特征样本。
其中,用户特征样本是指基于样本用户的在目标游戏中的用户信息,获取得到的样本用户的用户特征。用户特征样本的获取过程与目标用户的用户特征的获取过程类似,具体可以参考上述目标用户的用户特征的获取过程,为简化表述,此处不再赘述。
此外,在获取用户特征样本的同时,也可以获取用户特征样本的画像标签,该画像标签用于指示样本用户在各画像维度的实际画像结果。
502、通过预设的多任务分类模型中的特征编码器,对所述用户特征样本进行编码,得到所述用户特征样本的编码后特征向量。
如图6中所示,用户特征样本(记为X)进入多任务分类模型后,首先通过多任务分类模型中的特征编码器进行特征编码,得到用户特征样本的编码后特征向量(记为Zx)。其中,特征编码器将用户特征样本X编码得到用户特征样本的编码后特征向量ZX的具体过程为:特征编码器首先获取用户特征样本X的特征高斯分布G(μ(x),Σ(x)),再基于特征高斯分布G(μ(x),Σ(x))进行采样,得到采样结果ZX,即为用户特征样本的编码后特征向量。
503、通过所述多任务分类模型中的标签编码器,对所述用户特征样本的画像标签进行编码,得到所述用户特征样本的编码后标签向量。
其中,所述画像标签中包括各画像维度的实际用户画像结果。实际用户画像结果是样本用户在各画像维度下的实际用户画像结果。
如图6中所示,用户特征样本的画像标签(记为Y)进入多任务分类模型后,首先通过多任务分类模型中的标签编码器进行标签编码,得到画像标签的编码后标签向量(记为Zy)。其中,标签编码器将画像标签Y编码得到画像标签的编码后标签向量Zy的具体过程为:标签编码器首先获取画像标签Y的标签高斯分布G(μ(y),Σ(y)),再基于标签高斯分布G(μ(y),Σ(y))进行采样,得到采样结果Zy,即为画像标签的编码后标签向量。
504、通过所述多任务分类模型中的分类任务层,基于所述用户特征样本的编码后特征向量,预测所述用户特征样本在各画像维度下的预测用户画像结果。
其中,预测用户画像结果是根据用户特征样本预测得到的样本用户在各画像维度下的用户画像结果。
分类任务层可以采用全连接层结构,如图6中所示,分类任务层可以连接特征编码器输出的编码后特征向量,并基于分类任务层根据用户特征样本的编码后特征向量预测用户特征对应的样本用户在各画像维度下的预测画像结果。
505、基于所述预测用户画像结果、所述实际用户画像结果、所述用户特征样本的编码后特征向量和所述用户特征样本的编码后标签向量,确定所述多任务分类模型的训练损失。
其中,多任务分类模型的训练损失的设置方式有多种,示例性地,包括:
(1)多任务分类模型的训练损失包括目标分类损失和特征标签间约束损失。步骤505具体可以包括:基于所述预测用户画像结果和所述实际用户画像结果,确定所述多任务分类模型的目标分类损失;基于所述用户特征样本的编码后特征向量和所述用户特征样本的编码后标签向量,确定所述多任务分类模型的特征标签间约束损失;基于所述目标分类损失和所述特征标签间约束损失,确定所述多任务分类模型的训练损失。
其中,可以对目标分类损失和特征标签间约束损失直接求和,作为多任务分类模型的训练损失。或者也可以对目标分类损失与特征标签间约束损失求加权和,作为多任务分类模型的训练损失。
例如,如下公式(1)所示,多任务分类模型的训练损失为目标分类损失与特征标签间约束损失的加权和。
L=aLml+bLguide 公式(1)
公式(1)中,L表示多任务分类模型的训练损失,Lml表示多任务分类模型的目标分类损失,Lguide表示多任务分类模型的特征标签间约束损失,a、b分别表示目标分类损失Lml的权重、特征标签间约束损失Lguide的权重。
(2)多任务分类模型的训练损失包括目标分类损失、特征标签间约束损失和分布相似度损失。步骤505具体可以包括:基于所述预测用户画像结果和所述实际用户画像结果,确定所述多任务分类模型的目标分类损失;基于所述用户特征样本的编码后特征向量和所述用户特征样本的编码后标签向量,确定所述多任务分类模型的特征标签间约束损失;基于所述标签估计值和所述实际用户画像结果,确定所述多任务分类模型的分布相似度损失;对所述目标分类损失、所述特征标签间约束损失和所述分布相似度损失求和,得到所述多任务分类模型的训练损失。
其中,可以对目标分类损失、特征标签间约束损失和分布相似度损失直接求和,作为多任务分类模型的训练损失。或者也可以对目标分类损失、特征标签间约束损失与分布相似度损失求加权和,作为多任务分类模型的训练损失。
例如,如下公式(2)所示,多任务分类模型的训练损失为目标分类损失、特征标签间约束损失与分布相似度损失的加权和。
L=α(Lml+Lguide)+βLKL 公式(2)
公式(2)中,L表示多任务分类模型的训练损失,Lml表示多任务分类模型的目标分类损失,Lguide表示多任务分类模型的特征标签间约束损失,LKL表示多任务分类模型的分布相似度损失,α表示目标分类损失Lml和特征标签间约束损失Lguide的权重,β表示分布相似度损失的权重。
下面将详细介绍如何确定多任务分类模型的目标分类损失、特征标签间约束损失、分布相似度损失。
一、多任务分类模型的目标分类损失。
本申请实施例中,通过设置目标分类损失,以用户特征样本的画像标签作为监督,监督多任务分类模型的学习,保证能正常实现多任务分类功能。
在一些实施例中,目标分类损失包括多任务分类模型的第一分类损失。其中,第一分类损失用于指示分类任务层输出的预测用户画像结果与实际用户画像结果之间的偏差。步骤“基于所述预测用户画像结果和所述实际用户画像结果,确定所述多任务分类模型的目标分类损失”具体可以包括:基于预测用户画像结果和实际用户画像结果,确定多任务分类模型的第一分类损失;将第一分类损失作为多任务分类模型的目标分类损失。
进一步地,为提升对标签的学习能力,目标分类损失包括多任务分类模型的第一分类损失和第二分类损失。在一些实施例中,如图6所示,还可以通过多任务分类模型中的标签解码器,基于编码后标签向量进行解码,得到所述用户特征样本的标签估计值(记为);标签估计值是指通过用户特征样本的画像标签通过标签编码器得到编码后标签向量,再通过标签解码器对编码后标签向量解码还原后得到。其中,第二分类损失用于指示分类任务层输出的预测用户画像结果与标签估计值之间的偏差。
即在一些实施例中,目标分类损失包括多任务分类模型的第一分类损失和第二分类损失。步骤“基于所述预测用户画像结果和所述实际用户画像结果,确定所述多任务分类模型的目标分类损失”具体可以包括:基于所述预测用户画像结果和所述实际用户画像结果,得到所述多任务分类模型的第一分类损失;基于标签估计值和所述实际用户画像结果,得到所述多任务分类模型的第二分类损失;对所述第一分类损失和所述第二分类损失求和,得到所述目标分类损失。
例如,第一分类损失可以通过如下公式(3)所示的损失函数确定。
第二分类损失可以通过如下公式(4)所示的损失函数确定。
其中,可以将第一分类损失与第二分类损失直接加和作为目标分类损失。也可以对第一分类损失与第二分类损失求加权和,作为目标分类损失。如下公式(5)所示,可以将第一分类损失与第二分类损失直接加和作为目标分类损失。
二、多任务分类模型的特征标签间约束损失。
其中,特征标签间约束损失用于产生编码后的特征向量与用户画像中个画像维度的画像结果之间的约束。
本申请实施例中,通过设置特征标签间约束损失,用于引导特征编码器进行学习,使得特征编码器学习到编码后的特征向量与用户画像中个画像维度的画像结果的约束关系,进而使得特征编码器学习到隐空间中编码与标签的相关性,从而在一定程度上提升用户画像结果的预测精度。
在本申请的一些实施例中,特征标签间约束损失可以根据用户特征样本的编码后特征向量、用户特征样本的编码后标签向量、以及如下公式(6)所示的预设约束损失函数确定。
公式(6)中,Lguide表示多任务分类模型的特征标签间约束损失,n表示各画像维度的总维度数,Zxi表示各画像维度中的第i个维度画像维度的特征编码结果。
在本申请的一些实施例中,特征标签间约束损失可以根据用户特征样本的编码后特征向量、用户特征样本的编码后标签向量、特征解码隐变量、标签解码隐变量、以及如下公式(7)所示的预设约束损失函数确定。
公式(7)中,Lguide表示多任务分类模型的特征标签间约束损失,n表示各画像维度的总维度数,Zxi表示各画像维度中的第i个维度画像维度的特征编码结果,Hxj表示特征解码隐变量,Hyj表示标签解码隐变量。
如图6所示,其中,特征解码隐变量是通过特征解码器对用户特征样本的编码后特征向量(记为Zx)进行解码得出特征估计值(记为X^)时,产生的中间隐变量(记为Hxj)。标签解码隐变量是通过标签解码器对用户特征样本的编码后标签向量进行解码得出标签估计值(记为)时,产生的中间隐变量(记为Hyj)。
由于特征与标签之间不在同一维度,通过公式(6)或(7)中采用特征编码器对用户特征样本编码后得到用户特征样本的编码后特征向量、与标签编码器对画像标签编码后得到编码后标签向量,可以将特征与标签投影至同一维度上,从而便于建立特征与标签之间的关联,使得特征编码器可以学习到产生与用户画像中个画像维度的画像结果具有约束关系的编码后的特征向量。
三、多任务分类模型的分布相似度损失。
本申请实施例中,多任务分类模型采用的是特征编码器和标签编码器采用变分自编码器。为了提高特征编码器拟合的特征高斯分布G(μ(x),Σ(x))、与标签编码器拟合标签高斯分布G(μ(y),Σ(y))的相似度,以进一步提高特征编码器对编码后特征向量与用户画像中各画像维度的用户画像结果间约束关系的学习效果。
在本申请的一些实施例中,分布相似度损失可以根据标签估计值、实际用户画像结果、以及如下公式(8)所示的预设KL损失函数确定。
506、基于所述训练损失对所述多任务分类模型中的参数进行调整,以得到训练完成的多任务分类模型。
示例性地,可以最小化多任务分类模型的训练损失为目标,在训练过程中不断地进行反向传播,对多任务分类模型中的参数,比如特征标签器的参数等进行调整,直至符合预设的停止训练条件时,得到训练完成的多任务分类模型。
至此,多任务分类模型训练完成,此时,任务分类模型中的特征编码器学习到编码后的特征向量与用户画像中个画像维度的画像结果的约束关系。可以将多任务分类模型中特征编码器提取出来,用于对目标用户的用户特征进行编码,得到目标用户的编码后特征向量。或者可以直接将目标用户的用户特征直接输入至多任务分类模型,再调用多任务分类模型中的特征编码器对目标用户的用户特征进行编码,得到目标用户的编码后特征向量。
本申请实施例中,由于特征编码器基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习,得到了编码后特征向量与用户画像中各画像维度的用户画像结果的约束关系,即特征编码器学到了标签与特征之间的关联,第一方面,避免了单纯以标签作为监督进行多标签分类任务的学习而导致分类结果精度低的问题;第二方面,避免基于同一个特征向量进行多个维度进行分类而导致分类结果精度低的问题。
由此,本方案实施例可以提升用户画像结果的预测精度。
为了更好地实施以上方法,本申请实施例还提供一种用户画像预测装置,该用户画像预测装置具体可以集成在电子设备中,比如,计算机设备,该计算机设备可以为终端、服务器等设备。
其中,终端可以为手机、平板电脑、智能蓝牙设备、笔记本电脑、个人电脑等设备;服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群。
比如,在本实施例中,将以用户画像预测装置具体集成在智能手机为例,对本申请实施例的方法进行详细说明。
例如,如图7所示,该用户画像预测装置700可以包括获取单元701、第编码单元702以及预测单元703,如下:
(一)获取单元701。
获取单元701,可以用于基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征;
(二)编码单元702。
编码单元702,可以用于基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量,所述目标用户的编码后特征向量与用户画像中各画像维度的用户画像结果具有约束关系,所述约束关系基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习得到,所述画像标签中包括各画像维度的实际用户画像结果;
(三)预测单元703。
预测单元703,可以用于基于所述目标用户的编码后特征向量,预测所述目标用户在所述各画像维度下的目标用户画像结果。
在一些实施例中,所述用户信息包括群体关系信息和个体信息,所述获取单元701具体用于:
基于所述目标用户在目标游戏中的社交关系,获取所述目标用户的群体关系信息;
基于所述群体关系信息,提取出所述目标用户的群体特征;
获取所述目标用户在目标游戏中的个体信息;
基于所述个体信息,提取出所述目标用户的个体特征;
根据所述群体特征和所述个体特征,得到所述目标用户的用户特征。
在一些实施例中,所述个体信息包括所述目标用户在所述目标游戏中的用户属性和行为属性,所述获取单元701具体用于:
获取所述用户属性的嵌入式向量;
获取所述行为属性的嵌入式向量;
对所述用户属性的嵌入式向量和所述行为属性的嵌入式向量进行拼接,得到所述个体特征。
在一些实施例中,所述获取单元701具体用于:
基于所述目标用户在目标游戏中的社交关系,获取所述目标用户在目标游戏中的交易信息、好友信息、交互信息和团队信息中的至少一项,作为所述目标用户的群体关系信息。
在一些实施例中,所述用户画像预测装置700还包括训练单元(图中未示出),所述基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量步骤之前,所述训练单元具体用于:
获取用户特征样本;
通过预设的多任务分类模型中的特征编码器,对所述用户特征样本进行编码,得到所述用户特征样本的编码后特征向量;
通过所述多任务分类模型中的标签编码器,对所述用户特征样本的画像标签进行编码,得到所述用户特征样本的编码后标签向量,所述画像标签中包括各画像维度的实际用户画像结果;
通过所述多任务分类模型中的分类任务层,基于所述用户特征样本的编码后特征向量,预测所述用户特征样本在各画像维度下的预测用户画像结果;
基于所述预测用户画像结果、所述实际用户画像结果、所述用户特征样本的编码后特征向量和所述用户特征样本的编码后标签向量,确定所述多任务分类模型的训练损失;
基于所述训练损失对所述多任务分类模型中的参数进行调整,以得到训练完成的多任务分类模型。
在一些实施例中,所述训练单元具体用于:
基于所述预测用户画像结果和所述实际用户画像结果,确定所述多任务分类模型的目标分类损失;
基于所述用户特征样本的编码后特征向量和所述用户特征样本的编码后标签向量,确定所述多任务分类模型的特征标签间约束损失;
基于所述目标分类损失和所述特征标签间约束损失,确定所述多任务分类模型的训练损失。
在一些实施例中,所述通过所述多任务分类模型中的标签编码器,对所述用户特征样本的画像标签进行编码,得到所述用户特征样本的编码后标签向量步骤之后,所述训练单元具体用于:
通过所述多任务分类模型中的标签解码器,基于所述编码后标签向量进行解码,得到所述用户特征样本的标签估计值;
在一些实施例中,所述训练单元具体用于:
基于所述预测用户画像结果和所述实际用户画像结果,得到所述多任务分类模型的第一分类损失;
基于标签估计值和所述实际用户画像结果,得到所述多任务分类模型的第二分类损失;
对所述第一分类损失和所述第二分类损失求和,得到所述目标分类损失。
在一些实施例中,所述训练单元具体用于:
基于所述标签估计值和所述实际用户画像结果,确定所述多任务分类模型的分布相似度损失;
对所述目标分类损失、所述特征标签间约束损失和所述分布相似度损失求和,得到所述多任务分类模型的训练损失。
在一些实施例中,所述编码单元702具体用于:
基于特征编码器,生成所述目标用户的用户特征的目标特征高斯分布;
基于所述特征编码器,对所述目标特征高斯分布进行采样,得到所述目标用户的编码后特征向量。
由上可知,本实施例的用户画像预测装置可以由获取单元701基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征;由编码单元702基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量,所述目标用户的编码后特征向量与用户画像中各画像维度的用户画像结果具有约束关系,所述约束关系基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习得到,所述画像标签中包括各画像维度的实际用户画像结果;由预测单元703基于所述目标用户的编码后特征向量,预测所述目标用户在所述各画像维度下的目标用户画像结果。由此,本申请实施例可以提升用户画像结果的预测精度。
相应的,本申请实施例还提供一种计算机设备,该计算机设备可以为终端,该终端可以为智能手机、平板电脑、笔记本电脑、触控屏幕、游戏机、个人计算机(PC,PersonalComputer)、个人数字助理(Personal Digital Assistant,PDA)等终端设备。如图8所示,图8为本申请实施例提供的计算机设备的结构示意图。该计算机设备800包括有一个或者一个以上处理核心的处理器801、有一个或一个以上计算机可读存储介质的存储器802及存储在存储器802上并可在处理器上运行的计算机程序。其中,处理器801与存储器802电性连接。本领域技术人员可以理解,图中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
处理器801是计算机设备800的控制中心,利用各种接口和线路连接整个计算机设备800的各个部分,通过运行或加载存储在存储器802内的软件程序和/或模块,以及调用存储在存储器802内的数据,执行计算机设备800的各种功能和处理数据,从而对计算机设备800进行整体监控。
在本申请实施例中,计算机设备800中的处理器801会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器802中,并由处理器801来运行存储在存储器802中的应用程序,从而实现各种功能:
基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征;
基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量,所述目标用户的编码后特征向量与用户画像中各画像维度的用户画像结果具有约束关系,所述约束关系基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习得到,所述画像标签中包括各画像维度的实际用户画像结果;
基于所述目标用户的编码后特征向量,预测所述目标用户在所述各画像维度下的目标用户画像结果。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
可选的,如图8所示,计算机设备800还包括:触控显示屏803、射频电路804、音频电路805、输入单元806以及电源807。其中,处理器801分别与触控显示屏803、射频电路804、音频电路805、输入单元806以及电源807电性连接。本领域技术人员可以理解,图8中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
触控显示屏803可用于显示图形用户界面以及接收用户作用于图形用户界面产生的操作指令。触控显示屏803可以包括显示面板和触控面板。其中,显示面板可用于显示由用户输入的信息或提供给用户的信息以及计算机设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-EmittingDiode)等形式来配置显示面板。触控面板可用于收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并生成相应的操作指令,且操作指令执行对应程序。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器801,并能接收处理器801发来的命令并加以执行。触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器801以确定触摸事件的类型,随后处理器801根据触摸事件的类型在显示面板上提供相应的视觉输出。在本申请实施例中,可以将触控面板与显示面板集成到触控显示屏803而实现输入和输出功能。但是在某些实施例中,触控面板与触控面板可以作为两个独立的部件来实现输入和输出功能。即触控显示屏803也可以作为输入单元806的一部分实现输入功能。
射频电路804可用于收发射频信号,以通过无线通信与网络设备或其他计算机设备建立无线通讯,与网络设备或其他计算机设备之间收发信号。
音频电路805可以用于通过扬声器、传声器提供用户与计算机设备之间的音频接口。音频电路805可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路805接收后转换为音频数据,再将音频数据输出处理器801处理后,经射频电路804以发送给比如另一计算机设备,或者将音频数据输出至存储器802以便进一步处理。音频电路805还可能包括耳塞插孔,以提供外设耳机与计算机设备的通信。
输入单元806可用于接收输入的数字、字符信息或用户特征信息(例如指纹、虹膜、面部信息等),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
电源807用于给计算机设备800的各个部件供电。可选的,电源807可以通过电源管理***与处理器801逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源807还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管图8中未示出,计算机设备800还可以包括摄像头、传感器、无线保真模块、蓝牙模块等,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
由上可知,本实施例提供的计算机设备,可以基于特征编码器对目标用户的用户特征进行编码,得到目标用户的编码后特征向量;基于目标用户的编码后特征向量,预测目标用户在各画像维度下的目标用户画像结果;由于特征编码器基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习,得到了编码后特征向量与用户画像中各画像维度的用户画像结果的约束关系,即特征编码器学到了标签与特征之间的关联,因此本实施例提供的计算机设备:第一方面,避免了单纯以标签作为监督进行多标签分类任务的学习而导致分类结果精度低的问题;第二方面,避免基于同一个特征向量进行多个维度进行分类而导致分类结果精度低的问题。本实施例提供的计算机设备在一定程度上提升用户画像结果的预测精度。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条计算机程序,该计算机程序能够被处理器进行加载,以执行本申请实施例所提供的任一种用户画像预测方法中的步骤。例如,该计算机程序可以执行如下步骤:
基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征;
基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量,所述目标用户的编码后特征向量与用户画像中各画像维度的用户画像结果具有约束关系,所述约束关系基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习得到,所述画像标签中包括各画像维度的实际用户画像结果;
基于所述目标用户的编码后特征向量,预测所述目标用户在所述各画像维度下的目标用户画像结果。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的计算机程序,可以执行本申请实施例所提供的任一种用户画像预测方法中的步骤,因此,可以实现本申请实施例所提供的任一种用户画像预测方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种用户画像预测方法、装置、存储介质及计算机设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种用户画像预测方法,其特征在于,包括:
基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征;
基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量,所述目标用户的编码后特征向量与用户画像中各画像维度的用户画像结果具有约束关系,所述约束关系基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习得到,所述画像标签中包括各画像维度的实际用户画像结果;
基于所述目标用户的编码后特征向量,预测所述目标用户在所述各画像维度下的目标用户画像结果;
所述基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量之前,还包括:
获取用户特征样本;
通过预设的多任务分类模型中的特征编码器,对所述用户特征样本进行编码,得到所述用户特征样本的编码后特征向量;
通过所述多任务分类模型中的标签编码器,对所述用户特征样本的画像标签进行编码,得到所述用户特征样本的编码后标签向量,所述画像标签中包括各画像维度的实际用户画像结果;
通过所述多任务分类模型中的分类任务层,基于所述用户特征样本的编码后特征向量,预测所述用户特征样本在各画像维度下的预测用户画像结果;
基于所述预测用户画像结果、所述实际用户画像结果、所述用户特征样本的编码后特征向量和所述用户特征样本的编码后标签向量,确定所述多任务分类模型的训练损失;其中,所述训练损失包括目标分类损失和特征标签间约束损失,所述目标分类损失基于所述预测用户画像结果和所述实际用户画像结果确定,所述特征标签间约束损失基于所述用户特征样本的编码后特征向量和所述用户特征样本的编码后标签向量确定;
基于所述训练损失对所述多任务分类模型中的参数进行调整,以得到训练完成的多任务分类模型。
2.如权利要求1所述的用户画像预测方法,其特征在于,所述用户信息包括群体关系信息和个体信息,所述基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征,包括:
基于所述目标用户在目标游戏中的社交关系,获取所述目标用户的群体关系信息;
基于所述群体关系信息,提取出所述目标用户的群体特征;
获取所述目标用户在目标游戏中的个体信息;
基于所述个体信息,提取出所述目标用户的个体特征;
根据所述群体特征和所述个体特征,得到所述目标用户的用户特征。
3.如权利要求2所述的用户画像预测方法,其特征在于,所述个体信息包括所述目标用户在所述目标游戏中的用户属性和行为属性,所述基于所述个体信息,提取出所述目标用户的个体特征,包括:
获取所述用户属性的嵌入式向量;
获取所述行为属性的嵌入式向量;
对所述用户属性的嵌入式向量和所述行为属性的嵌入式向量进行拼接,得到所述个体特征。
4.如权利要求2所述的用户画像预测方法,其特征在于,所述基于所述目标用户在目标游戏中的社交关系,获取所述目标用户的群体关系信息,包括:
基于所述目标用户在目标游戏中的社交关系,获取所述目标用户在目标游戏中的交易信息、好友信息、交互信息和团队信息中的至少一项,作为所述目标用户的群体关系信息。
5.如权利要求1所述的用户画像预测方法,其特征在于,所述通过所述多任务分类模型中的标签编码器,对所述用户特征样本的画像标签进行编码,得到所述用户特征样本的编码后标签向量之后,还包括:
通过所述多任务分类模型中的标签解码器,基于所述编码后标签向量进行解码,得到所述用户特征样本的标签估计值;
所述目标分类损失基于所述预测用户画像结果和所述实际用户画像结果确定,包括:
基于所述预测用户画像结果和所述实际用户画像结果,得到所述多任务分类模型的第一分类损失;
基于标签估计值和所述实际用户画像结果,得到所述多任务分类模型的第二分类损失;
对所述第一分类损失和所述第二分类损失求和,得到所述目标分类损失。
6.如权利要求1所述的用户画像预测方法,其特征在于,所述通过所述多任务分类模型中的标签编码器,对所述用户特征样本的画像标签进行编码,得到所述用户特征样本的编码后标签向量之后,还包括:
通过所述多任务分类模型中的标签解码器,基于所述编码后标签向量进行解码,得到所述用户特征样本的标签估计值;
确定所述多任务分类模型的训练损失,包括:
基于所述标签估计值和所述实际用户画像结果,确定所述多任务分类模型的分布相似度损失;
对所述目标分类损失、所述特征标签间约束损失和所述分布相似度损失求和,得到所述多任务分类模型的训练损失。
7.如权利要求1-6任一项所述的用户画像预测方法,其特征在于,所述基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量,包括:
基于特征编码器,生成所述目标用户的用户特征的目标特征高斯分布;
基于所述特征编码器,对所述目标特征高斯分布进行采样,得到所述目标用户的编码后特征向量。
8.一种用户画像预测装置,其特征在于,包括:
获取单元,用于基于目标用户在目标游戏中的用户信息,获取所述目标用户的用户特征;
编码单元,用于基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量,所述目标用户的编码后特征向量与用户画像中各画像维度的用户画像结果具有约束关系,所述约束关系基于用户特征样本的编码后特征向量和用户特征样本的画像标签的编码后标签向量学习得到,所述画像标签中包括各画像维度的实际用户画像结果;
预测单元,用于基于所述目标用户的编码后特征向量,预测所述目标用户在所述各画像维度下的目标用户画像结果;
所述用户画像预测装置还包括训练单元,所述基于特征编码器,对所述目标用户的用户特征进行编码,得到所述目标用户的编码后特征向量步骤之前,所述训练单元具体用于:
获取用户特征样本;
通过预设的多任务分类模型中的特征编码器,对所述用户特征样本进行编码,得到所述用户特征样本的编码后特征向量;
通过所述多任务分类模型中的标签编码器,对所述用户特征样本的画像标签进行编码,得到所述用户特征样本的编码后标签向量,所述画像标签中包括各画像维度的实际用户画像结果;
通过所述多任务分类模型中的分类任务层,基于所述用户特征样本的编码后特征向量,预测所述用户特征样本在各画像维度下的预测用户画像结果;
基于所述预测用户画像结果、所述实际用户画像结果、所述用户特征样本的编码后特征向量和所述用户特征样本的编码后标签向量,确定所述多任务分类模型的训练损失;其中,所述训练损失包括目标分类损失和特征标签间约束损失,所述目标分类损失基于所述预测用户画像结果和所述实际用户画像结果确定,所述特征标签间约束损失基于所述用户特征样本的编码后特征向量和所述用户特征样本的编码后标签向量确定;
基于所述训练损失对所述多任务分类模型中的参数进行调整,以得到训练完成的多任务分类模型。
9.一种终端,其特征在于,包括处理器和存储器,所述存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行如权利要求1~7任一项所述的用户画像预测方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1~7任一项所述的用户画像预测方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110621172.0A CN113344184B (zh) | 2021-06-03 | 2021-06-03 | 用户画像预测方法、装置、终端和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110621172.0A CN113344184B (zh) | 2021-06-03 | 2021-06-03 | 用户画像预测方法、装置、终端和计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113344184A CN113344184A (zh) | 2021-09-03 |
CN113344184B true CN113344184B (zh) | 2023-05-30 |
Family
ID=77475162
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110621172.0A Active CN113344184B (zh) | 2021-06-03 | 2021-06-03 | 用户画像预测方法、装置、终端和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113344184B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115205011B (zh) * | 2022-06-15 | 2023-08-08 | 海南大学 | 基于lsf-fc算法的银行用户画像模型生成方法 |
CN114782764B (zh) * | 2022-06-22 | 2022-09-30 | 每日互动股份有限公司 | 一种用户画像的生成方法、装置、计算机设备及存储介质 |
CN115995814B (zh) * | 2023-03-23 | 2023-07-25 | 佛山市电子政务科技有限公司 | 一种基于大数据的公共电力资源调配方法 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106897590A (zh) * | 2015-12-17 | 2017-06-27 | 阿里巴巴集团控股有限公司 | 人像信息的校验方法及装置 |
CN109495920B (zh) * | 2017-09-13 | 2022-03-29 | ***通信集团设计院有限公司 | 一种无线通信网络特征画像方法、设备和计算机程序产品 |
CN108537586A (zh) * | 2018-03-30 | 2018-09-14 | 杭州米趣网络科技有限公司 | 基于用户画像的数据处理方法及装置 |
CN109753608B (zh) * | 2019-01-11 | 2023-08-04 | 腾讯科技(深圳)有限公司 | 确定用户标签的方法、自编码网络的训练方法及装置 |
US20200394553A1 (en) * | 2019-06-13 | 2020-12-17 | International Business Machines Corporation | Predicting functional tags of semantic role labeling |
CN110442794B (zh) * | 2019-08-12 | 2023-03-31 | 上海时廊人工智能科技有限公司 | 一种分析师画像***的构建方法 |
US11100145B2 (en) * | 2019-09-11 | 2021-08-24 | International Business Machines Corporation | Dialog-based image retrieval with contextual information |
CN111050193B (zh) * | 2019-11-12 | 2022-06-10 | 汉口北进出口服务有限公司 | 用户画像构建方法、装置、计算机设备和存储介质 |
CN111190939B (zh) * | 2019-12-27 | 2024-02-02 | 深圳市优必选科技股份有限公司 | 一种用户画像构建方法及装置 |
CN111090656B (zh) * | 2020-03-23 | 2020-07-17 | 北京大数元科技发展有限公司 | 一种动态构建对象画像的方法及*** |
CN111784301A (zh) * | 2020-07-02 | 2020-10-16 | 中国银行股份有限公司 | 用户画像的构建方法及装置、存储介质及电子设备 |
-
2021
- 2021-06-03 CN CN202110621172.0A patent/CN113344184B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113344184A (zh) | 2021-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113344184B (zh) | 用户画像预测方法、装置、终端和计算机可读存储介质 | |
US12045705B2 (en) | Dynamic and intuitive aggregation of a training dataset | |
CN112052948B (zh) | 一种网络模型压缩方法、装置、存储介质和电子设备 | |
CN112069309B (zh) | 信息获取方法、装置、计算机设备及存储介质 | |
CN111680123B (zh) | 对话模型的训练方法、装置、计算机设备及存储介质 | |
CN113284142B (zh) | 图像检测方法、装置、计算机可读存储介质及计算机设备 | |
CN112206541A (zh) | 游戏外挂识别方法、装置、存储介质及计算机设备 | |
CN112989134B (zh) | 节点关系图的处理方法、装置、设备及存储介质 | |
CN117540020A (zh) | 聊天数据的审核方法、装置、电子设备和可读存储介质 | |
CN115587616A (zh) | 网络模型训练方法、装置、存储介质及计算机设备 | |
CN113762585B (zh) | 数据的处理方法、账号类型的识别方法及装置 | |
CN116415624A (zh) | 模型训练方法及装置、内容推荐方法及装置 | |
CN112426726B (zh) | 游戏事件抽取方法、装置、存储介质及服务器 | |
CN113886674A (zh) | 资源推荐方法、装置、电子设备及存储介质 | |
CN113807403B (zh) | 模型训练的方法、装置、计算机设备及存储介质 | |
CN118212670A (zh) | 一种面部识别方法、装置、计算机设备及存储介质 | |
CN114416921A (zh) | 剧情文本生成的方法、装置、终端和存储介质 | |
Wen et al. | Personality-affected Emotion Generation in Dialog Systems | |
CN117560337A (zh) | 内容交互方法、装置和计算机可读存储介质 | |
CN117205568A (zh) | 文本生成模型的训练方法、文本生成方法、装置及设备 | |
CN116510306A (zh) | 一种游戏信息的处理方法、装置、计算机设备及存储介质 | |
CN116531760A (zh) | 一种游戏信息的处理方法、装置、计算机设备及存储介质 | |
CN116681075A (zh) | 文本识别方法以及相关设备 | |
CN116844530A (zh) | 语音信息的处理方法、装置、可读存储介质和电子装置 | |
CN117726700A (zh) | 图像生成方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |