CN113868523A - 推荐模型训练方法、电子设备及存储介质 - Google Patents

推荐模型训练方法、电子设备及存储介质 Download PDF

Info

Publication number
CN113868523A
CN113868523A CN202111132414.6A CN202111132414A CN113868523A CN 113868523 A CN113868523 A CN 113868523A CN 202111132414 A CN202111132414 A CN 202111132414A CN 113868523 A CN113868523 A CN 113868523A
Authority
CN
China
Prior art keywords
click
prediction
weight
conversion
loss function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111132414.6A
Other languages
English (en)
Inventor
王国瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Music Entertainment Technology Shenzhen Co Ltd
Original Assignee
Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Music Entertainment Technology Shenzhen Co Ltd filed Critical Tencent Music Entertainment Technology Shenzhen Co Ltd
Priority to CN202111132414.6A priority Critical patent/CN113868523A/zh
Publication of CN113868523A publication Critical patent/CN113868523A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种推荐模型训练方法、电子设备及存储介质,应用于机器学习技术领域。其中方法包括:获取样本特征集合并输入初始预测模型以获取样本用户针对样本推荐对象的预测点击率和预测转化率,基于点击标签和预测点击率生成点击损失函数,基于点击标签、转化标签、预测点击率和预测转化率生成点击转化损失函数,根据点击损失函数、点击转化损失函数和模型参数得到权重损失函数,基于权重损失函数生成点击权重和点击转化权重,基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数,基于目标损失函数修正模型参数得到目标预测模型。采用本申请实施例,可以提高目标预测模型针对点击率和转化率的预测准确率。

Description

推荐模型训练方法、电子设备及存储介质
技术领域
本申请涉及机器学习技术领域,尤其涉及一种推荐模型训练方法、电子设备及存储介质。
背景技术
目前,在推荐场景中需要预测用户对推荐对象的兴趣程度,以将用户感兴趣的推荐对象推送至用户终端,其预测的准确性直接体现在用户针对推荐对象的点击率和转化率上,相应的,则可以通过预测点击率和转化率来实现推荐场景下的精准推送。现有的预测方法通常是通过将点击率预测任务和转化率预测任务联合建模,并结合点击率预测任务的损失函数和转化率预测任务的损失函数训练得到用于预测点击率和转化率的目标预测模型。然而,由于两个损失函数在结合时,对应的权重参数难以调节,会对模型的训练效果有影响,从而导致预测的准确率不高。因此,如何提高点击率和转化率的预测准确率成为一个亟待解决的问题。
发明内容
本申请实施例提供了一种推荐模型训练方法、电子设备及存储介质,可以提高目标预测模型针对点击率和转化率的预测准确率。
一方面,本申请实施例提供了一种推荐模型训练方法,该方法包括:
获取样本特征集合;该样本特征集合包含样本用户的用户属性信息、样本推荐对象的对象属性信息、样本用户针对样本推荐对象的点击标签以及转化标签;
将样本特征集合输入初始预测模型,基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率;
基于点击标签和预测点击率生成点击损失函数,基于转化标签、预测点击率以及预测转化率生成点击转化损失函数;
根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到权重损失函数,基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重;
基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数,并基于目标损失函数修正初始预测模型的模型参数,得到目标预测模型。
一方面,本申请实施例提供了一种基于推荐模型的数据推荐方法,该方法包括:
获取预测用户的目标用户属性信息和待推荐对象的目标对象属性信息;
将目标用户属性信息和目标对象属性信息输入目标预测模型;
在目标预测模型中生成预测用户针对待推荐对象的目标预测点击率和目标预测转化率;
基于目标预测点击率和目标预测转化率,获取预测用户针对待推荐对象的兴趣分数;
若兴趣分数大于兴趣分数阈值,则将待推荐对象推送至预测用户对应的用户终端。
一方面,本申请实施例提供了一种推荐模型训练装置,该装置包括:
获取模块,用于获取样本特征集合;该样本特征集合包含样本用户的用户属性信息、样本推荐对象的对象属性信息、样本用户针对样本推荐对象的点击标签以及转化标签;
获取模块,还用于将样本特征集合输入初始预测模型,基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率;
生成模块,用于基于点击标签和预测点击率生成点击损失函数,基于转化标签、预测点击率以及预测转化率生成点击转化损失函数;
生成模块,还用于根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到权重损失函数,基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重;
修正模块,用于基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数,并基于目标损失函数修正初始预测模型的模型参数,得到目标预测模型。
一方面,本申请实施例提供了一种基于推荐模型的数据推荐装置,该装置包括:
获取模块,用于获取预测用户的目标用户属性信息和待推荐对象的目标对象属性信息;
输入模块,用于将目标用户属性信息和目标对象属性信息输入目标预测模型;
生成模块,用于在目标预测模型中生成预测用户针对待推荐对象的目标预测点击率和目标预测转化率;
获取模块,还用于基于目标预测点击率和目标预测转化率,获取预测用户针对待推荐对象的兴趣分数;
推送模块,用于若兴趣分数大于兴趣分数阈值,则将待推荐对象推送至预测用户对应的用户终端。
一方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,其中,存储器用于存储计算机程序,该计算机程序包括程序指令,处理器被配置用于调用该程序指令,执行上述方法中的部分或全部步骤。
一方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时,用于执行上述方法中的部分或全部步骤。
相应地,根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括程序指令,该程序指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该程序指令,处理器执行该程序指令,使得该计算机设备执行上述提供的推荐模型训练方法和/或基于推荐模型的数据推荐方法。
本申请实施例中可以获取样本特征集合,将样本特征集合输入初始预测模型,基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率,基于点击标签和预测点击率生成点击损失函数,基于转化标签、预测点击率以及预测转化率生成点击转化损失函数,根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到权重损失函数,基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重,基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数,并基于目标损失函数修正初始预测模型的模型参数,得到目标预测模型。通过实施上述所提出的方法,模型训练过程可以动态调节点击权重和点击转化权重,以保持目标损失函数中的两个损失函数的平衡,进而使得目标预测模型的训练效果更好,进而目标预测模型针对预测点击率和转化率的准确性更高。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种应用架构示意图;
图2为本申请实施例提供的一种推荐模型训练方法的流程示意图;
图3为本申请实施例提供的一种推荐模型训练方法的流程示意图;
图4为本申请实施例提供的一种获取属性特征的场景示意图;
图5为本申请实施例提供的一种获取融合属性特征的场景示意图;
图6为本申请实施例提供的一种模型训练的场景示意图;
图7为本申请实施例提供的一种基于推荐模型的数据推荐方法的流程示意图;
图8a为本申请实施例提供的一种针对预测用户的推送场景示意图;
图8b为本申请实施例提供的一种针对预测用户的推送场景示意图;
图9为本申请实施例提供的一种推荐模型训练装置的结构示意图;
图10为本申请实施例提供的一种基于推荐模型的数据推荐装置的结构示意图;
图11为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
本申请实施例提出的推荐模型训练方法可以实现于电子设备,该电子设备可以是服务器,也可以是终端设备。其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。
在一些实施例中,请参见图1,图1为本申请实施例提供的一种应用架构示意图,可以通过该应用架构执行本申请所提出的推荐模型训练方法。如图1所示,图1可包括电子设备,该电子设备中部署有初始预测模型。
其中,初始预测模型可以包括共享层、预测层和权重调节层;具体的,(1)该共享层可以包括特征处理层及预测特征生成层,该特征处理层可以用于对电子设备输入的样本特征集合进行处理得到融合属性特征,该预测特征生成层可以包括点击权重预测网络、转化权重预测网络以及N个预测特征生成网络,电子设备可以在该预测特征生成层中利用点击权重预测网络、转化权重预测网络以及N个预测特征生成网络并基于融合属性特征得到点击预测特征和转化预测特征;
(2)预测层可以包括点击预测网络和转化预测网络,电子设备可以在该预测层中利用点击预测网络并基于点击预测特征得到预测点击率,以及利用转化预测网络并基于转化预测特征得到预测转化率,进而可以基于得到的预测点击率和样本特征集合中的点击标签生成点击损失函数以及基于得到的预测转化率和样本特征集合中的转化标签生成点击转化损失函数;
(3)权重调节层可以用于在初始预测模型的训练过程中利用点击损失函数和点击转化损失函数以及初始预测模型的模型参数得到权重损失函数,并基于权重损失函数生成点击损失函数对应的点击权重和点击转化损失函数对应的点击转化权重,即可以是基于权重损失函数对点击损失函数对应的初始点击权重(此前模型训练时使用的点击权重)和点击转化损失函数对应的初始点击转化权重(此前模型训练时使用的点击转化权重(如第i次))进行动态调节,分别得到点击权重和点击转化权重,并利用点击权重对点击损失函数加权,得到加权后的点击损失函数,以及利用点击转化权重对点击转化损失函数加权得到加权后的点击转化损失函数,并将加权后的点击损失函数和加权后的点击转化损失函数进行求和得到此次(如第i+1次)模型训练的目标损失函数,后续可以基于该目标损失函数对初始预测模型进行模型参数的修正,以训练得到目标预测模型,电子设备可以通过该目标预测模型执行本申请所提出的基于推荐模型的数据推荐方法。后续,电子设备可以利用该目标预测模型进行推荐场景下的预测任务,并基于该预测任务得到的预测结果进行推荐场景下的推荐任务,可以理解的是,应用过程中使用的目标预测模型包括初始预测模型的共享层和预测层部分。此外,点击率又称为CTR(Click-through Rate)、转化率又称为CVR(Conversion Rates)。
可以理解的是,图1只是示例性地表征本申请技术方案的可能存在的应用架构,并不对本申请技术方案的具体架构进行限定,即本申请技术方案还可以提供其他形式的应用架构。
可选的,在一些实施例中,电子设备可根据实际的业务需求,执行该推荐模型训练方法以提高点击率和转化率的预测准确率。本申请技术方案可以应用于任意推荐场景下的预测任务中,即电子设备可以利用样本用户和样本推荐对象的相关信息(如样本用户的用户属性信息、样本推荐对象的对象属性信息、样本用户针对样本推荐对象的点击标签以及转化标签等),并基于本申请技术方案中包含的模型训练方式对初始预测模型进行训练,后续可以执行基于推荐模型的数据推荐方法以获取预测用户的目标用户属性信息和待推荐对象的目标对象属性信息,并利用训练得到的目标预测模型对预测用户的目标用户属性信息和待推荐对象的目标对象属性信息进行预测,得到该预测用户针对待推荐对象的目标预测点击率和目标预测转化率,进而可以结合该目标预测点击率和目标预测转化率确定出预测用户针对待推荐对象的兴趣分数,并可以基于兴趣分数实现精准推送。
例如,可以应用于直播产品的推荐场景中,则此时的样本推荐对象(待推荐对象)可以为在线主播,样本用户(预测用户)可以为在直播列表界面点击在线主播的用户,电子设备可以利用样本用户和样本推荐对象的相关信息对模型进行训练,后续利用目标预测模型的预测结果确定出预测用户针对在线主播的兴趣分数,并基于兴趣分数将在线主播推送至预测用户的用户终端。又如,还可以应用于新闻产品的推荐场景中,则此时的样本推荐对象(待推荐对象)可以为发布的资讯文章,样本用户(预测用户)可以为在资讯列表界面点击阅读文章的用户,电子设备可以利用样本用户和样本推荐对象的相关信息对模型进行训练,后续利用目标预测模型的预测结果确定出预测用户针对资讯文章的兴趣分数,并基于兴趣分数将资讯文章推送至预测用户的用户终端。又如,还可以应用于电商产品的推荐场景中,此时的样本推荐对象可以为购买的商品,样本用户(预测用户)可以为在商品列表界面点击商品的用户,后续利用目标预测模型的预测结果确定出预测用户针对商品的兴趣分数,并基于兴趣分数将商品推送至预测用户的用户终端。
可选的,本申请涉及的数据如预测点击率和预测转化率等,可以存储于数据库中,或者可以存储于区块链中,如通过区块链分布式***存储,本申请不做限定。
可以理解,上述场景仅是作为示例,并不构成对于本申请实施例提供的技术方案的应用场景的限定,本申请的技术方案还可应用于其他场景。例如,本领域普通技术人员可知,随着***架构的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
基于上述的描述,本申请实施例提出了一种推荐模型训练方法,该方法可以由上述提及的电子设备来执行。请参见图2,图2为本申请实施例提供的一种推荐模型训练方法的流程示意图。如图2所示,本申请实施例的推荐模型训练方法的流程可以包括如下:
S201、获取样本特征集合。
其中,样本特征集合包括样本用户的用户属性信息、样本推荐对象的对象属性信息、样本用户针对样本推荐对象的点击标签以及转化标签。
可选的,该样本用户的用户属性信息可以有一种或多种属性,可以用于表征用户特征,样本推荐对象的对象属性信息可以有一种或多种属性,可以用于表征推荐对象的对象特征,以及样本用户的用户属性信息和样本推荐对象的对象属性信息可以由相关业务人员根据实际应用场景设置,此处不作限制。例如,以直播产品的推荐场景为例,样本用户的用户属性信息可以为基础画像属性(包含年龄,性别和学历等)、统计属性(样本用户一天内或三天内直播观看的时长,样本用户三天内或一周内的主播送花数、样本用户三天内或一周内的主播打赏数等)等等;在线主播即样本推荐对象的对象属性信息可以为基础画像属性(包含年龄,性别和学历等)、实时属性(一天内或三天内直播间的总观看用户数或者最高观看用户数,直播间类型、直播间一天内播放时长等)等等。
可选的,样本用户针对样本推荐对象的点击标签和转化标签根据样本用户对样本推荐对象是否有点击行为和转化行为确定。即,若样本用户对样本推荐对象有点击行为,但没有转化行为,则对应的点击标签为1、转化标签为0;若样本用户对样本推荐对象有点击行为,以及有转化行为,则对应的点击标签为1、转化标签为1;若样本用户对样本推荐对象没有点击行为,则对应的点击标签为0、转化标签为0。例如,在直播产品的推荐场景中,点击行为指用户点进在线主播的直播间,转化行为指用户在在线直播的直播间观看一定时长(例如30s)。
S202、将样本特征集合输入初始预测模型,基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率。
在一个可能的实施方式中,电子设备可以将样本特征集合输入初始预测模型,在初始预测模型中利用样本特征集合中的样本用户的用户属性信息,生成用户属性信息对应的用户属性特征,以及利用样本特征集合中的样本推荐对象的对象属性信息,生成对象属性信息对应的对象属性特征。其中,可以是利用初始预测模型的共享层中的特征处理层生成用户属性特征和对象属性特征。
可选的,以生成用户属性特征为例,电子设备利用初始预测模型的共享层中的特征处理层生成用户属性特征具体可以是,利用特征处理层对用户属性信息进行热独编码(One-Hot编码),得到用户属性信息对应的用户属性特征。例如,用户属性信息中包含了年龄属性,并设将该年龄属性划分为了[<18,19-30,31-40,41-50,51-60,>60],若该样本用户的年龄为24,则进行热独编码所得到的年龄属性对应的属性特征可以表示为[0,1,0,0,0,0]。因此由用户属性信息包含的一种或多种属性可以生成对应的用户属性特征,该用户属性特征可以为由用户属性信息包含的属性所得到的一种或多种属性特征所组成的特征矩阵。可选的,生成对象属性特征的具体方式可以同生成用户属性特征的具体方式,此处不再赘述。
在一些实施例中,电子设备基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率具体可以是,利用初始预测模型的共享层中的特征处理层获取用户属性特征和对象属性特征的融合属性特征,并基于融合属性特征获取样本用户针对样本推荐对象的预测点击率和预测转化率。其中,电子设备利用初始预测模型的共享层中的特征处理层获取用户属性特征和对象属性特征的融合属性特征具体可以是,通过特征处理层将用户属性特征和对象属性特征进行拼接,得到融合属性特征,该融合属性特征可以为基于用户属性特征的特征矩阵和对象属性特征的特征矩阵所拼接得到的特征向量。例如,用户属性特征表示为[0,1,0,0,0,0]、[0,0,0,1,0,0],对象属性特征表示为[0,0,0,1,0,0]、[0,1,0,0,0,0],因此得到的融合属性特征可以表示为[0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,1,0,0,0,0]。
在一个可能的实施方式中,电子设备基于融合属性特征获取样本用户针对样本推荐对象的预测点击率和预测转化率具体可以是,利用初始预测模型的共享层中的预测特征生成层并基于融合属性特征得到点击预测特征和转化预测特征,并在初始预测模型的预测层中基于点击预测特征获取预测点击率以及基于转化预测特征获取预测转化率。
可选的,初始预测模型的共享层中的预测特征生成层可以包括点击权重预测网络、转化权重预测网络以及N个预测特征生成网络;电子设备利用初始预测模型的共享层中的预测特征生成层并基于融合属性特征得到点击预测特征和转化预测特征具体可以是,将融合属性特征输入预测特征生成层,并利用预测特征生成层中的点击权重预测网络和N个预测特征生成网络生成点击预测特征,以及利用转化权重预测网络和N个预测特征生成网络生成转化预测特征。其中,生成点击预测特征和生成转化预测特征的具体实施过程可以参见下述步骤S302中的相关描述。
以及,初始预测模型中的预测层可以包括针对预测点击率所构建的点击预测网络和针对预测转化率所构建的转化预测网络;电子设备在初始预测模型的预测层中基于点击预测特征获取预测点击率以及基于转化预测特征获取预测转化率具体可以是,将点击预测特征输入预测层中的点击预测网络得到预测点击率,并将转化预测特征输入预测层中的转化预测网络得到预测转化率。其中,得到预测点击率和得到预测转化率的具体实施过程可以参见下述步骤S302中的相关描述。
S203、基于点击标签和预测点击率生成点击损失函数,基于点击标签、转化标签、预测点击率以及预测转化率生成点击转化损失函数。
在一个可能的实施方式中,电子设备可以利用多个样本特征集合作为一个样本数据集合,并基于该样本数据集合中每个样本特征集合所得到的预测点击率确定点击损失函数,以及基于该样本数据集合中每个样本特征集合所得到的预测点击率和预测转化率确定点击转化损失函数;电子设备可以基于点击标签和预测点击率生成针对初始预测模型的点击损失函数,该点击损失函数Lctr(t)可以为:
Figure BDA0003280486400000101
其中,N为样本数据集合中样本特征集合的数量,xi(ctr)表示根据样本数据集合中第i个样本特征集合得到的点击预测特征,yi表示第i个样本特征集合的点击标签,θctr表示点击预测网络的网络参数,l表示交叉熵损失函数,f1(v1,u1)表示根据输入的u1和v1生成对应的预测点击率,t可以表示对初始预测模型的第t次训练过程,即t可以为第t次训练时的次数或者时刻(该时刻为相较于第0次模型(设此时指示的时刻为0)训练时的时刻),下述以t为训练次数为例进行说明。
以及,电子设备可以基于点击标签、转化标签、预测点击率以及预测转化率生成针对初始预测模型的点击转化损失函数,该点击转化损失函数Lctcvr(t)可以为:
Figure BDA0003280486400000102
其中,N为样本数据集合中样本特征集合的数量,xi(ctr)表示根据样本数据集合中第i个样本特征集合得到的点击预测特征,xi(cvr)表示根据样本数据集中第i个样本特征集合得到的转化预测特征,yi表示第i个样本特征集合的点击标签,zi表示第i个样本特征集合的转化标签,θctr表示点击预测网络的网络参数,θcvr表示转化预测网络的网络参数,l表示交叉熵损失函数,f1(v1,u1)表示根据输入的u1和v1生成对应的预测点击率,f2(v2,u2)表示根据输入的u2和v2生成对应的预测转化率,t可以表示对初始预测模型的第t次训练过程,即t可以为第t次训练时的次数或者时刻(该时刻为相较于第0次模型(设此时指示的时刻为0)训练时的时刻)。
此外,在训练过程中,训练目标为多任务目标,即训练点击率预测任务和转化率预测任务,由于样本用户针对样本推荐对象的点击标签为1的数量较多,转化标签为1的数量较少,因此会导致点击样本空间和转化样本空间之间存在差异,进而使得训练效果不佳,通过引入点击转化损失函数,即表示CTCVR=CTR*CVR,可以使得模型的训练目标理解为训练点击率预测任务和点击转化率预测任务,可以打通点击样本空间和转化样本空间,减小样本空间差异,即可以解决模型训练的样本选择偏差问题。
可选的,上述的点击预测网络的网络参数和转化预测网络的网络参数均可以为初始预测模型中的模型参数。
S204、根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到权重损失函数,基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重。
在一个可能的实施方式中,电子设备根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到权重损失函数具体可以是,获取点击损失函数对应的第一权重函数以及点击转化损失函数对应的第二权重函数,根据第一权重函数、点击损失函数以及初始预测模型的模型参数,确定点击梯度函数,并根据第二权重函数、点击转化损失函数以及初始预测模型的模型参数,确定点击转化梯度函数,以及根据点击梯度函数和点击转化梯度函数生成权重损失函数。
其中,第一权重函数可以用于确定点击权重,第二权重函数可以用于确定点击转化权重,电子设备可以根据第一权重函数、点击损失函数、第二权重函数和点击转化损失函数确定用于训练该初始预测模型的模型损失函数。该第一权重函数和第二权重函数可以相关业务人员根据经验值设置。
例如,设第一权重函数为Wctr(t),第二权重函数为Wcvr(t),因此确定的模型损失函数Ltask(t)可以表示为:
Ltask(t)=Wctr(t)Lctr(t)+Wcvr(t)Lctcvr(t)
其中,t可以表示对初始预测模型的第t次训练过程;Lctr(t)表示点击损失函数,Lctcvr(t)表示点击转化损失函数。
在一个可能的实施方式中,电子设备基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重具体可以是,基于初始预测模型的权重调节层并利用权重损失函数得到第一权重函数对应的第一权重调整函数和第二权重函数对应的第二权重调整函数,根据第一权重函数和第一权重调整函数得到点击权重,以及根据第二权重函数和第二权重调整函数得到点击转化权重。
S205、基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数,并基于目标损失函数修正初始预测模型的模型参数,得到目标预测模型。
在一个可能的实施方式中,在针对初始预测模型的其中一轮训练过程中,设点击权重为Wctr,点击转化权重为Wctcvr,点击损失函数为Lctr,点击转化损失函数为Lctcvr,因此得到的目标损失函数Ltask为:
Ltask=WctrLctr+WctcvrLctcvr
可以理解的是,当根据第一权重函数得到点击权重以及根据第二权重函数得到点击转化权重时,电子设备可以在模型损失函数中将第一权重函数替换为点击权重以及将第二权重函数替换为点击转化权重,此时的模型损失函数则为目标损失函数。
因此,电子设备可以基于此时的目标损失函数修正初始预测模型的模型参数,此轮修正模型参数所得到的模型会参与下一轮的模型训练,直至模型收敛,由此可以得到对应的目标预测模型。后续,该目标预测模型可以应用于对待推荐对象的推荐场景中,如具体可以用于根据预测用户的目标用户属性信息和待推荐对象(如在线主播,或资讯文章等)的目标对象属性信息进行目标点击率和目标转化率的预测,进而电子设备可以基于预测得到该预测用户针对该待推荐对象的目标点击率和目标转化率实现对于预测用户和待推荐对象的推荐任务,如该推荐任务可以是电子设备基于预测得到的目标点击率和目标转化率确定待推送的待推荐对象,并将该待推送的待推荐对象推送至预测用户的用户终端,预测用户可以点击查看所推送的待推荐对象的相关信息(如在线主播对应的直播间,或资讯文章对应的详细内容等)。
本申请实施例中可以获取样本特征集合,将样本特征集合输入初始预测模型,基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率,基于点击标签和预测点击率生成针对初始预测模型的点击损失函数,基于点击标签、转化标签、预测点击率以及预测转化率生成针对初始预测模型的点击转化损失函数,根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到权重损失函数,基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重,基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数,并基于目标损失函数修正初始预测模型的模型参数,得到目标预测模型。通过实施本申请实施例所提出的方法,模型训练过程可以动态调节点击权重和点击转化权重,以保持目标损失函数中的两个损失函数的平衡,进而使得目标预测模型的训练效果更好,进而目标预测模型针对预测点击率和转化率的准确性更高。
请参加图3,图3为本申请实施例提供的一种推荐模型训练方法的流程示意图,该方法可以由上述提及的电子设备执行。如图3所示,本申请实施例中推荐模型训练方法的流程可以包括如下:
S301、获取样本特征集合。其中,步骤S301的具体实施方式可以参见上述步骤S201的相关描述,此处不再赘述。
S302、将样本特征集合输入初始预测模型,基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率。
在一个可能的实施方式中,电子设备可以利用初始预测模型的共享层中的特征处理层生成用户属性信息对应的用户属性特征,以及生成对象属性信息对应的对象属性特征。其中,特征处理层可以包括属性特征生成层。
可选的,电子设备利用特征处理层生成用户属性信息对应的用户属性特征,以及生成对象属性信息对应的对象属性特征具体可以是,在属性特征生成层中利用用户属性信息生成用户属性特征,并利用对象属性信息生成对象属性特征。其中,以生成用户属性特征为例,电子设备在属性特征生成层中利用用户属性信息生成用户属性特征具体可以是,对用户属性信息进行热独编码,得到用户属性信息对应的用户属性编码,并构建针对用户属性的嵌入矩阵,并利用用户属性编码和对应的嵌入矩阵确定用户属性特征。
在一些实施例中,对用户属性信息进行热独编码,得到用户属性信息对应的用户属性编码的具体方式可以参见上述步骤S202相关描述;利用用户属性编码和对应的嵌入矩阵确定用户属性特征具体可以是,获取用户属性编码中为1的元素所在列数,并根据所在列数从嵌入矩阵中获取对应的行向量,该行向量在嵌入矩阵中的所在行数与该所在列数相同,并将该行向量作为用户属性特征。例如,用户属性信息中包含年龄属性,设将年龄属性划分为[<18,19-30,31-40,41-50,51-60,>60],若该样本用户的年龄为24,则进行热独编码所得到的年龄属性对应的属性特征可以表示为[0,1,0,0,0,0],因此其中为1的元素所在列数为2,从嵌入矩阵中获取行数为2的行向量,设嵌入矩阵为6*8,并将该行向量包含的8个元素作为年龄属性对应的属性特征。因此由用户属性信息包含的一种或多种属性可以得到一个或多个行向量,基于该一个或多个行向量可以组成特征矩阵,该特征矩阵即为用户属性特征。其中,多种属性分别对应的嵌入矩阵可以相同也可以不同,对多种属性分别对应的嵌入矩阵的大小和嵌入矩阵中每个元素的具体数值不作限定。
可选的,生成对象属性特征的具体方式可以同生成用户属性特征的具体方式,此处不再赘述。以及上述针对用户属性的嵌入矩阵和针对对象属性的嵌入矩阵可以由相关业务人员根据经验值设定,也可以作为初始预测模型的模型参数由模型训练获得。
例如,如图4所示,图4为本申请实施例提供的一种获取属性特征的场景示意图,其中,用户属性信息中包含了用户属性1,对用户属性1进行热独编码得到的属性编码为[0,1,0,0,0,0],因此,从对应的嵌入矩阵1获取第2行的行向量作为用户属性1对应的属性特征(V1),基于用户属性信息包含的多种用户属性(1、2、...、n)得到对应的属性特征(V1、V2、...、Vn),该用户属性特征为由属性特征(V1、V2、...、Vn)构成的特征矩阵1,以及,基于对象属性信息包含的多种对象属性(n+1、n+2、...、N)得到对应的属性特征(Vn+1、Vn+2、...、VN),该对象属性特征为由属性特征(Vn+1、Vn+2、...、VN)构成的特征矩阵2,可以由该特征矩阵1和特征矩阵2组成目标特征矩阵;可选的,该目标特征矩阵可以为两种形式,该两种形式的目标特征矩阵可以如图4中的目标特征矩阵1和目标特征矩阵2所表征的形式。其中,图4中的目标特征矩阵1表征的是以列表示同一属性特征,图4中的目标特征矩阵2表征的是以行表示同一属性特征。
在一个可能的实施方式中,电子设备基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率具体可以为,获取用户属性特征和对象属性特征,并基于用户属性特征和对象属性特征获取预测点击率和预测转化率。其中,电子设备基于用户属性特征和对象属性特征获取预测点击率和预测转化率具体可以是,对用户属性特征和对象属性特征进行特征融合,得到融合属性特征;基于融合属性特征获取预测点击率和预测转化率。
在一些实施例中,电子设备对用户属性特征和对象属性特征进行特征融合,得到融合属性特征具体可以是,将用户属性特征和对象属性特征进行拼接,得到融合属性特征,该融合属性特征可以为基于用户属性特征的特征矩阵和对象属性特征的特征矩阵所拼接得到的特征向量;或者,特征处理层还可以包括特征融合层,利用特征处理层中的特征融合层对用户属性特征和对象属性特征进行特征融合,得到融合属性特征。
可选的,电子设备利用特征处理层中的特征融合层对用户属性特征和对象属性特征进行特征融合,得到融合属性特征具体可以是,在特征融合层中,将用户属性特征和对象属性特征作为特征集合,并对特征集合中两两特征进行特征交叉(即两两向量进行内积),得到交叉特征,将用户属性特征和对象属性特征进行拼接,得到拼接特征,根据交叉特征和拼接特征得到融合属性特征。其中,根据交叉特征和拼接特征得到融合属性特征可以是将交叉特征和拼接特征的每个元素依序平铺组成目标向量,并将该目标向量作为融合属性特征;此外,将两两特征进行特征交叉引用了因子分解机的(Factorization Machine,FM)思想,即:
<Vi,Vj>1≤i≤N,1≤j≤N
其中,<>表示向量内积,Vi,Vj表示特征集合中任意两个特征,N表示特征集合中的特征数量。
可以理解的是,该融合属性特征包含了由用户属性特征内部之间、对象属性特征内部之间、用户属性特征和对象属性特征之间的特征的关联信息,体现了多种特征之间的进行显***互而得到特征之间的关系,进而使得融合属性特征中可以结合两两特征之间的关系,规避了当特征比较稀疏时对后续模型训练时会产生一定负面影响的问题。
进一步可选的,在将用户属性特征和对象属性特征进行拼接,得到拼接特征之后,获取用户属性特征的第一目标属性特征,和/或对象属性特征的第二目标属性特征,并在拼接特征中利用用户属性信息对第一目标属性特征和/或第二目标属性特征进行乘积处理,得到处理后的拼接特征,进而根据交叉特征和处理后的拼接特征得到融合属性特征。其中,第一目标属性特征和第二目标属性特征可以由相关业务人员根据实际情况和经验值设定。
例如,如图5所示,图5为本申请实施例提供的一种获取融合属性特征的场景示意图,其中,对包含用户属性特征(V1、V2、...、Vn)和对象属性特征的特征集合(Vn+1、Vn+2、...、VN)进行两两特征的特征交叉,得到交叉特征,并将用户属性特征和对象属性特征进行拼接得到拼接特征,根据交叉特征和拼接特征得到融合属性特征(如融合属性特征1),进一步的,得到拼接特征后,设第一目标属性特征为V1(设为[1,2,3,4,5,6]),该第一目标属性特征对应样本用户的平均点击率属性(设属性信息表示为0.3),因此在拼接特征中,利用该第一目标属性特征对应的属性信息对第一目标属性特征进行乘积处理,得到处理后的拼接特征(即V1:[1,2,3,4,5,6]*0.3→V′1:[0.3,0.6,0.9,1.2,1.5,1.8]),根据交叉特征和处理后的拼接特征得到融合属性特征(如融合属性特征2)。
在一个可能的实施方式中,电子设备基于融合属性特征获取预测点击率和预测转化率具体可以是,基于融合属性特征生成点击预测特征以及转化预测特征,并基于点击预测特征获取预测点击率,基于转化预测特征获取预测转化率。其中电子设备基于融合属性特征生成点击预测特征以及转化预测特征具体可以使,利用预测特征生成层并基于融合属性特征生成点击预测特征以及转化预测特征。
在一些实施例中,该预测特征生成层可以为多任务学习模型(如MMoE(多门混合专家,Multi-gate Mixture-of-Experts)模型)中的共享层结构,该预测特征生成层可以包括点击权重预测网络、转化权重预测网络以及N个预测特征生成网络;电子设备利用预测特征生成层并基于融合属性特征生成点击预测特征以及转化预测特征具体可以是,基于融合属性特征和N个预测特征生成网络,生成每个预测特征生成网络对应的初始预测特征,基于融合属性特征和点击权重预测网络预测针对每个预测特征生成网络的第一预测权重,基于融合属性特征和转化权重预测网络预测针对每个预测特征生成网络的第二预测权重,利用每个预测特征生成网络对应的第一预测权重分别对每个预测特征生成网络对应的初始预测特征进行加权求和,得到点击预测特征,利用每个预测特征生成网络对应的第二预测权重分别对每个预测特征生成网络对应的初始预测特征进行加权求和,得到转化预测特征。
其中,电子设备基于融合属性特征和N个预测特征生成网络,生成每个预测特征生成网络对应的初始预测特征具体可以是,将融合属性特征输入N个预测特征生成网络,并分别在每个预测特征生成网络中根据融合属性特征生成对应的初始预测特征;以及电子设备基于融合属性特征和点击权重预测网络预测针对每个预测特征生成网络的第一预测权重,并基于融合属性特征和转化权重预测网络预测针对每个预测特征生成网络的第二预测权重具体可以是,将融合属性特征输入点击权重预测网络,以及在点击权重预测网络中生成每个预测特征生成网络对应的第一预测权重,将融合属性特征输入转化权重预测网络,并在转化权重预测网络中生成每个预测特征生成网络对应的第二预测权重。
根据上述描述,即可表示为:
第一预测权重gctr(x)为:gctr(x)=softmax(Wctrx)
第二预测权重gcvr(x)为:gcvr(x)=softmax(Wcvrx)
点击预测特征fctr(x)为:
Figure BDA0003280486400000171
转化预测特征fcvr(x)为:
Figure BDA0003280486400000172
其中,Wctr表示点击权重预测网络的网络参数,Wcvr表示转化权重预测网络的网络参数,x表示融合属性特征,gctr(x)i表示N个预测特征生成网络中第i个预测特征生成网络对应的第一预测权重,gcvr(x)i表示N个预测特征生成网络中第i个预测特征生成网络对应的第二预测权重;fi(x)表示N个预测特征生成网络中第i个预测特征生成网络对应的初始预测特征。
可选的,上述点击权重预测网络、转化权重预测网络以及N个预测特征生成网络可以是均由一个或多个全连接层(Fully Connected Layers,FC)构成,点击权重预测网络和转化权重预测网络又可称为门限(gate)网络,N个预测特征生成网络又可称为专家(Expert)网络,以及初始预测模型的模型参数包含点击权重预测网络、转化权重预测网络以及N个预测特征生成网络的网络参数;N的数量可以由相关业务人员根据经验值设定。
在一个可能的实施方式中,电子设备基于点击预测特征获取预测点击率,基于转化预测特征获取预测转化率具体可以是是利用初始预测模型中的预测层并基于点击预测特征获取预测点击率以及基于转化预测特征获取预测转化率。其中,预测层可以是ESMM模型(Entire Space Multi-Task Model,全空间多任务模型),该预测层可以包括针对点击率预测任务(CTR Tower)构建的点击预测网络和针对转化率预测任务构建的转化预测网络(CVR Tower),因此可以利用点击预测网络并基于点击预测特征得到预测点击率,以及利用转化预测网络并基于转化预测特征得到转化点击率。其中,该点击预测网络和转化预测网络均可以包括一个或多个全连接层。
S303、基于点击标签和预测点击率生成点击损失函数,基于点击标签、转化标签、预测点击率以及预测转化率生成点击转化损失函数。
S304、获取点击损失函数对应的第一权重函数以及点击转化损失函数对应的第二权重函数。其中,步骤S303-S304的具体实施方式可以参见上述步骤S203-S204的相关描述,此处不再赘述。
S305、根据第一权重函数、点击损失函数以及初始预测模型的模型参数,确定点击梯度函数,以及根据第二权重函数、点击转化损失函数以及初始预测模型的模型参数确定点击转化梯度函数。
在一个可能的实施方式中,初始预测模型还包括权重调节层,电子设备可以利用权重调节层并根据第一权重函数、点击损失函数以及初始预测模型的模型参数确定点击梯度函数以及根据第二权重函数、点击转化损失函数以及初始预测模型的模型参数确定点击转化梯度函数,并在权重调节层中确定权重损失函数、点击权重以及点击转化权重。
在一些实施例中,电子设备可以利用权重调节层并根据第一权重函数、点击损失函数以及初始预测模型的模型参数确定点击梯度函数以及根据第二权重函数、点击转化损失函数以及初始预测模型的模型参数确定点击转化梯度函数具体可以是,利用第一权重函数、点击损失函数、模型参数中的共享层的网络参数确定点击梯度函数,并利用第二权重函数、点击转化损失函数以及模型参数中的共享层的网络参数确定点击转化梯度函数。即:
Figure BDA0003280486400000181
Figure BDA0003280486400000182
其中,Gctr W表示点击梯度函数,Gctcvr W表示点击转化梯度函数,θshare表示共享层的网络参数;t可以表示对初始预测模型的第t次训练过程;Lctr(t)表示点击损失函数,Lctcvr(t)表示点击转化损失函数;Wctr(t)表示第一权重函数;Wctcvr(t)表示第二权重函数;
Figure BDA0003280486400000183
表示计算得到A相对于B的梯度。
可选的,此处的共享层的网络参数可以是指N个预测特征生成网络中的网络参数,也可以是共享层中其他网络参数,此处不作限制。
可以理解的是,该权重调节层实现了梯度规范化以使模型训练的两个任务的梯度(或权重)达到平衡(Gradient Normalization,GradNorm),因此可以通过该权重调节层实现模型训练过程中动态调节点击损失函数的点击权重和点击转化损失函数的点击转化权重,以达到目标损失函数中两个损失函数的系数平衡,进而取得更好的模型训练效果,该点击权重即为目标损失函数中点击损失函数的系数,点击转化权重即为目标损失函数中点击转化损失函数的系数。
S306、根据点击梯度函数和点击转化梯度函数生成权重损失函数。
在一个可能的实施方式中,电子设备可以在权重调节层根据点击梯度函数和点击转化梯度函数生成权重损失函数,具体可以是,根据第一权重函数、第二权重函数、点击损失函数、点击转化损失函数以及模型参数,确定平均梯度函数,根据点击梯度函数和平均梯度函数确定目标点击梯度函数,根据点击转化梯度函数和平均梯度函数确定目标点击转化梯度函数,并根据目标点击梯度函数和目标点击转化梯度函数生成权重损失函数。其中,在平均梯度函数时用到的模型参数可以是点击预测网络的网络参数以及转化预测网络的网络参数。
即确定平均梯度
Figure BDA0003280486400000191
具体可以是:
Figure BDA0003280486400000192
Figure BDA0003280486400000193
Figure BDA0003280486400000194
其中,
Figure BDA0003280486400000195
表示平均梯度函数,θctr表示点击预测网络的网络参数,θcvr表示转化预测网络的网络参数;G1 W(t)表示根据第一权重函数、点击损失函数以及点击预测网络的网络参数确定的第一梯度函数;G2 W(t)表示根据第二权重函数、点击转化损失函数以及转化预测网络的网络参数确定的第二梯度函数,因此平均梯度函数由对第一梯度函数和第二梯度函数取平均得到;E[A+B]表示对输入的A和B进行均值处理得到A和B的均值结果(平均结果);t可以表示对初始预测模型的第t次训练过程;Lctr(t)表示点击损失函数,Lctcvr(t)表示点击转化损失函数;Wctr(t)表示第一权重函数;Wctcvr(t)表示第二权重函数;Wctr(t)表示第一权重函数;Wctcvr(t)表示第二权重函数;
Figure BDA0003280486400000196
表示计算得到A相对于B的梯度。
在一个可能的实施方式中,电子设备确定目标点击梯度函数和确定目标点击转化梯度函数的过程和原理相同,此处以确定目标点击梯度函数为例进行说明。电子设备根据点击梯度函数和平均梯度函数确定目标点击梯度函数具体可以是,根据点击损失函数和点击转化损失函数,确定模型训练的目标逆训练速率,并根据点击梯度函数、平均梯度函数和目标逆训练速率,确定目标点击梯度函数。
其中,电子设备根据点击损失函数和点击转化损失函数确定模型训练的目标逆训练速率具体可以是,获取初始点击损失函数和初始点击转化损失函数,根据初始点击损失函数和点击损失函数确定模型训练中针对点击率预测任务的逆训练速率,并根据初始点击转化损失函数和点击转化损失函数确定模型训练中针对转化率预测任务的逆训练速率,根据针对点击率预测任务的逆训练速率和针对转化率预测任务的逆训练速率确定平均逆训练速率,根据针对点击率预测任务的逆训练速率和平均逆训练速率确定针对点击率预测任务的相对逆训练速率,将针对点击率预测任务的相对逆训练速率作为目标逆训练速率。可选的,在确定目标点击转化梯度函数时,使用的平均逆训练速率与确定目标点击梯度函数时的相同。即:
Figure BDA0003280486400000201
Figure BDA0003280486400000202
Figure BDA0003280486400000203
Figure BDA0003280486400000204
Figure BDA0003280486400000205
Figure BDA0003280486400000206
Figure BDA0003280486400000207
其中,
Figure BDA0003280486400000208
表示针对点击率预测任务的逆训练速率,
Figure BDA0003280486400000209
表示针对转化率预测任务的逆训练速率,Lctr(0)表示初始点击损失函数,即为模型训练时最初的点击损失函数,Lctcvr(0)表示初始点击转化损失函数,即为模型训练时最初的点击转化损失函数,
Figure BDA00032804864000002010
表示平均逆训练数量,rctr(t)表示针对点击率预测任务的相对逆训练速率(即确定目标点击梯度函数时的目标逆训练速率),rcvr(t)表示针对转化率预测任务的相对逆训练速率(即确定目标点击转化梯度函数时的目标逆训练速率),Gradctr(t)表示目标点击梯度函数,Gradctcvr(t)表示目标点击转化梯度函数,t可以表示对初始预测模型的第t次训练过程,α为超参数,可以由相关业务人员根据经验值设定。
在一些实施例中,根据目标点击梯度函数Gradctr(t)和目标点击转化梯度函数Gradctcvr(t)生成的权重损失函数Grad(t),可以表示为:
Grad(t)=Gradctr(t)+Gradctcvr(t)
S307、基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重。
在一个可能的实施方式中,电子设备可以基于权重损失函数对第一权重函数进行调整,得到调整后的第一权重函数,并利用调整后的第一权重函数得到点击权重(即为调整后的点击权重),以及基于权重损失函数对第二权重函数进行调整,得到调整后的第二权重函数,并利用调整后的第二权重函数得到点击转化权重(即为调整后的点击转化权重)。
在一些实施例中,电子设备基于权重损失函数对第一权重函数进行调整,得到调整后的第一权重函数具体可以是,基于权重损失函数对第一权重函数进行求导,得到第一权重调整函数,根据第一权重调整函数和第一权重函数得到调整后的第一权重函数。电子设备可以根据调整后的第一权重函数,即第一权重调整函数和第一权重函数确定此轮模型训练的点击权重。以及基于权重损失函数对第二权重函数进行调整,得到调整后的第二权重函数具体可以是,基于权重损失函数对第二权重函数进行求导,得到第二权重调整函数,根据第二权重调整函数和第二权重函数得到调整后的第二权重函数。电子设备可以根据调整后的第二权重函数,即第二权重调整函数和第二权重函数确定此轮模型训练的点击转化权重。即调整后的第一权重函数W′ctr(t))可以为:
W′ctr(t)=Wctr(t)+λctrβctr(t)
其中,Wctr(t)表示第一权重函数,βctr(t)表示第一权重调整函数,t可以表示对初始预测模型的第t次训练过程,λctr表示超参数,可以由相关业务人员根据经验值设定。
以及,调整后的第二权重函数W′ctcvr(t)可以为:
W′ctcvr(t)=Wctcvr(t)+λctcvrβctcvr(t)
其中,Wctcvr(t)表示第二权重函数,βctcvr(t)表示第二权重调整函数,t可以表示对初始预测模型的第t次训练过程,λctcvr表示超参数,可以由相关业务人员根据经验值设定,λctr与λctcvr可以相同或者不同。
可以理解的是,此轮模型训练的调整后的第一权重函数和调整后的第二权重函数在下一轮模型训练作为下一轮的第一权重函数和第二权重函数,并在下一轮继续对下一轮的第一权重函数和第二权重函数进行调整得到下一轮的调整后的第一权重函数和调整后的第二权重函数,进而得到下一轮的点击权重(即下一轮调整后的点击权重)和点击转化权重(即下一轮调整后的点击转化权重),并在下一轮模型训练中基于所得到的下一轮的点击权重和点击转化权重确定下一轮的目标损失函数,并利用下一轮的目标损失函数修正下一轮的模型参数,直至多轮模型训练后模型收敛得到最终的目标预测模型。
S308、基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数,并基于目标损失函数修正初始预测模型的模型参数,得到目标预测模型。
在一个可能的实施方式中,电子设备基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数具体可以是,根据点击权重对点击损失函数进行加权,得到第一加权损失函数,根据点击转化权重对点击转化损失函数进行加权,得到第二加权损失函数,根据第一加权损失函数和第二加权损失函数,生成目标损失函数。电子设备可以基于目标损失函数修正初始预测模型的模型参数,得到目标预测模型。即此处仅以对模型训练的其中一轮为例进行了说明,每轮模型训练的过程和原理相同。直至模型收敛后得到该目标预测模型。可以理解的是,每轮模型训练过程,不仅会基于目标损失函数修正模型参数,每轮用于模型训练的目标损失函数可以相同也可以不相同,即在每轮获取目标损失函数时,还会结合确定的权重损失函数对上一次模型训练时使用的目标损失函数中的点击权重(初始点击权重)和点击转化权重(初始点击转化权重)进行动态调整,得到此次模型训练时使用的目标损失函数中的点击权重和点击转化权重。
例如,请参见图6,图6为本申请实施例提供的一种模型训练的场景示意图,其中,初始预测模型包括共享层、预测层及权重调节层,共享层包括特征处理层和预测特征生成层,特征处理层包括属性特征生成层和特征融合层;(1)电子设备将样本特征集合输入初始预测模型,在属性特征生成层中生成用户属性特征和对象属性特征;(2)在特征融合层中根据用户属性特征和对象属性特征生成融合属性特征;(3)在预测特征生成层根据融合属性特征生成点击预测特征和转化预测特征;(4)在预测层利用点击预测网络并根据点击预测特征生成预测点击率,以及利用转化预测网络并根据转化预测特征生成预测转化率,并根据预测点击率得到点击损失函数,以及根据预测点击率和预测转化率得到点击转化损失函数;(5)在权重调节层根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到点击权重和点击转化权重,由此得到目标损失函数,并利用目标损失函数修正初始预测模型,得到用于预测点击率和转化率的目标预测模型。
经过对目标预测模型进行的大量测试发现,针对点击率和转化率的预测准确率和效率相对于现有技术均有较大的提升,即,以应用为直播产品的推荐场景为例,基于目标预测模型进行的推荐任务,测试结果表示点击率和转化率(即有效观看时长)均有提升,如参见下述表1:
数据集 曝光 点击 转化(有效观看)
训练集 4248万 1451万 148万
测试集 435万 156万 16万
表1
其中,利用训练集作为样本特征集合对初始预测模型进行训练得到目标预测模型,并利用测试集对目标预测模型进行测试得知,在曝光量(针对在线主播的推送)约435万次时,点击量约156万次,转化量约16万次。
以及通过对比多种预测模型,发现本申请技术方案所提出的目标预测模型的模型评估指标AUC(area under the curve,曲线下面积)相较于现有的预测模型也有较大的提升。即参见下述表2:
模型 CTR AUC CVR AUC
ESMM 0.7096 0.7427
ESMM+GradNorm 0.7094 0.7429
FM+ESMM 0.7099 0.7432
FM+MMOE+ESMM 0.7248 0.7447
FM+ESMM+GradNorm 0.7102 0.7433
FM+MMOE+ESMM+GradNorm 0.7473 0.7487
表2
其中,CTR AUC表示预测点击率对应的AUC,CVR AUC表示预测转化率对应的AUC,CTR AUC和CVR AUC越大表示模型针对预测点击率和预测转化率的效果越好,即准确率越高。由上述描述可以得知,本申请技术方案是采用的最后一种模型结构(FM+MMOE+ESMM+GradNorm)训练得到目标预测模型的,采用该目标预测模型CTR AUC可以达到0.7473,与其他模型相较而言是最高的,采用该目标预测模型CVR AUC可以达到0.7487,与其他模型相较而言也是最高的。
本申请实施例中可以获取样本特征集合,将样本特征集合输入初始预测模型,基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率,基于点击标签和预测点击率生成点击损失函数,基于点击标签、转化标签、预测点击率以及预测转化率生成点击转化损失函数,获取点击损失函数对应的第一权重函数以及点击转化损失函数对应的第二权重函数,并根据第一权重函数、点击损失函数以及初始预测模型的模型参数,确定点击梯度函数,以及根据第二权重函数、点击转化损失函数以及初始预测模型的模型参数确定点击转化梯度函数,根据点击梯度函数和点击转化梯度函数生成权重损失函数,基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重,基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数,并基于目标损失函数修正初始预测模型的模型参数,得到目标预测模型。通过实施本申请实施例所提出的方法,模型训练过程可以利用梯度实现动态调节点击权重和点击转化权重,以保持目标损失函数中的两个损失函数的平衡,进而使得目标预测模型的训练效果更好,进而目标预测模型针对预测点击率和转化率的准确性更高。
请参加图7,图7为本申请实施例提供的一种基于推荐模型的数据推荐方法的流程示意图,该方法可以由上述提及的电子设备执行。如图7所示,本申请实施例中基于推荐模型的数据推荐方法的流程可以包括如下:
S701、获取预测用户的目标用户属性信息和待推荐对象的目标对象属性信息。
在一个可能的实施方式中,训练得到的目标预测模型可以对用户针对待推荐对象的点击率和转化率进行预测,进而实现针对预测用户的待推荐对象的精准推送。以直播产品的推荐场景为例进行说明,预测用户为登录直播产品的应用客户端的用户,待推荐对象为在线主播,当预测用户点击直播界面时,电子设备获取当前在线的一个或多个主播,并获取该预测用户的目标用户属性信息以及每个待推荐对象的目标对象属性信息;电子设备可以称为该应用客户端的后台设备。
S702、将目标用户属性信息和目标对象属性信息输入目标预测模型。
在一个可能的实施方式中,电子设备将预测用户的目标用户属性信息和待推荐对象的目标对象属性信息输入目标预测模型。当有多个待推荐对象时,将预测用户的目标用户属性信息分别和每个待推荐对象的目标对象属性信息一起输入目标预测模型。
其中,该目标预测模型可以是通过上述图2所示实施例和/或图3所示实施例中的相关描述训练得到的。
S703、在目标预测模型中生成预测用户针对待推荐对象的目标预测点击率和目标预测转化率。
在一些实施例中,电子设备可以在目标预测模型中分别生成预测用户针对每个待推荐对象的目标预测点击率和目标预测转化率。可以理解的是,目标预测模型中包括共享层和预测层,共享层包括特征处理层和预测特征生成层,特征处理层包括属性特征生成层和特征融合层。
S704、基于目标预测点击率和目标预测转化率,获取预测用户针对待推荐对象的兴趣分数。
在一些实施例中,基于目标预测点击率(Pctr)和目标预测转化率(Pcvr),获取预测用户针对待推荐对象的兴趣分数(P)可以通过以下公式实现:
P=Pctr*Pcvr a
其中,a为超参数,可以由相关业务人员根据经验值设定。
例如,a可以设置为[0.0,0.25,0.5,0.75,1],并采用当前组的流量占全流量的百分比,每组流量设为1%的流量,利用多种预测模型和本申请的目标预测模型进行测试得知,本申请的目标预测模型的测试效果最佳,即以应用为直播产品的推荐场景,参见下述表3:
Figure BDA0003280486400000251
Figure BDA0003280486400000261
表3
其中,每列表示当a为指定值时,得到的针对流量占比的模型测试结果,以a=0.5为例,流量占比表示指定时间内测试用户有效观看时长所占流量和给测试用户进行推送所耗费流量,流量占比越大表示模型针对预测点击率和转化率的效果越好,即准确率越高。由上述描述可以得知,本申请技术方案是采用的最后一种模型结构(FM+MMOE+ESMM+GradNorm)训练得到目标预测模型的,采用该目标预测模型在a为相同值的条件下流量占比与其他模型相较而言是最高的。
S705、若兴趣分数大于兴趣分数阈值,则将待推荐对象推送至预测用户对应的用户终端。
在一些实施例中,若预测用户针对待推荐对象的兴趣分数大于兴趣分数阈值,则可以将待推荐对象推送至预测用户对象的用户终端,即在应用客户端的直播界面中给预测用户推送该待推荐对象(在线主播)。兴趣分数阈值可以由相关业务人员根据经验值设定。
可选的,当有多个待推荐对象对应的兴趣分数大于兴趣分数阈值时,可以是随机将该多个待推荐对象进行推送或者根据兴趣分数的大小依次进行推送;或者,当有多个待推荐对象时,也可以是按照预测用户针对该多个待推荐对象的兴趣分数从大到小的顺序依次进行推送。
例如,如图8a-图8b所示,图8a-图8b为本申请实施例提供的一种针对预测用户的推送场景示意图,其中,如图8a,当预测用户点击直播产品的应用客户端的直播界面时,电子设备获取当前的在线主播,并将预测用户分别和每个在线主播组成待预测对((u,i1)、(u,i2)、(u,i3)......、(u,iN)),并基于多个待预测对从属性存储平台(如可以为数据库)提取预测用户的目标用户属性信息和在线主播的目标用户属性信息,并将预测用户的目标用户属性信息分别和每个在线主播的目标用户属性信息组成属性对((u,i1)、(u,i2)......),将每个属性对依次输入目标预测模型,得到每个属性对中预测用户针对在线主播的目标预测点击率和目标预测转化率,电子设备可以利用目标预测点击率和目标预测转化率获取预测用户针对每个在线主播的兴趣分数,利用预测用户针对每个在线主播的兴趣分数对每个在线主播进行排序,得到排序后的在线主播,将排序后的在线主播依次推送至预测用户的用户终端,即推送至应用客户端的直播界面,如图8b。
本申请实施例中可以获取预测用户的目标用户属性信息和待推荐对象的目标对象属性信息,将目标用户属性信息和目标对象属性信息输入目标预测模型,在目标预测模型中生成预测用户针对待推荐对象的目标预测点击率和目标预测转化率,基于目标预测点击率和目标预测转化率,获取预测用户针对待推荐对象的兴趣分数,若兴趣分数大于兴趣分数阈值,则将待推荐对象推送至预测用户对应的用户终端。通过实施本申请实施例所提出的方法,可以利用目标预测模型获取预测用户针对待推荐对象的兴趣分数,并基于兴趣分数对待推荐对象进行推送,以实现推荐场景下的精准推送。
请参见图9,图9为本申请提供的一种推荐模型训练装置的结构示意图。需要说明的是,图9所示的推荐模型训练装置,用于执行本申请图2和图3所示实施例的方法,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示,请参照本申请图2和图3所示的实施例。该推荐模型训练装置900可包括:获取模块901、生成模块902、修正模块903。其中:
获取模块901,用于获取样本特征集合;该样本特征集合包含样本用户的用户属性信息、样本推荐对象的对象属性信息、样本用户针对样本推荐对象的点击标签以及转化标签;
获取模块901,还用于将样本特征集合输入初始预测模型,基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率;
生成模块902,用于基于点击标签和预测点击率生成点击损失函数,基于转化标签、预测点击率以及预测转化率生成点击转化损失函数;
生成模块902,还用于根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到权重损失函数,基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重;
修正模块903,用于基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数,并基于目标损失函数修正初始预测模型的模型参数,得到目标预测模型。
在一个可能的实施方式中,生成模块902在用于根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到权重损失函数时,具体用于:
获取点击损失函数对应的第一权重函数以及点击转化损失函数对应的第二权重函数;
根据第一权重函数、点击损失函数以及初始预测模型的模型参数,确定点击梯度函数;
根据第二权重函数、点击转化损失函数以及初始预测模型的模型参数,确定点击转化梯度函数;
根据点击梯度函数和点击转化梯度函数生成权重损失函数。
在一个可能的实施方式中,生成模块902在用于根据点击梯度函数和点击转化梯度函数生成权重损失函数时,具体用于:
根据第一权重函数、第二权重函数、点击损失函数、点击转化损失函数以及模型参数,确定平均梯度函数;
根据点击梯度函数和平均梯度函数确定目标点击梯度函数;
根据点击转化梯度函数和平均梯度函数确定目标点击转化梯度函数;
根据目标点击梯度函数和目标点击转化梯度函数生成权重损失函数。
在一个可能的实施方式中,生成模块902在用于基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重时,具体用于:
基于权重损失函数对第一权重函数进行求导,得到第一权重调整函数,并根据第一权重调整函数和第一权重函数确定点击权重;
基于权重损失函数对第二权重函数进行求导,得到第二权重调整函数,并根据第二权重调整函数和第二权重函数确定点击转化权重。
在一个可能的实施方式中,修正模块903在用于基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数时,具体用于:
根据点击权重对点击损失函数进行加权,得到第一加权损失函数;
根据点击转化权重对点击转化损失函数进行加权,得到第二加权损失函数;
根据第一加权损失函数和第二加权损失函数,生成目标损失函数。
在一个可能的实施方式中,获取模块901在用于基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率时,具体用于:
在初始预测模型中,生成用户属性信息对应的用户属性特征,并生成对象属性信息对应的对象属性特征;
基于用户属性特征和对象属性特征获取预测点击率和预测转化率。
在一个可能的实施方式中,获取模块901在用于基于用户属性特征和对象属性特征获取预测点击率和预测转化率时,具体用于:
对用户属性特征和对象属性特征进行特征融合,得到融合属性特征;
基于融合属性特征获取预测点击率和预测转化率。
在一个可能的实施方式中,获取模块901在用于基于融合属性特征获取预测点击率和预测转化率时,具体用于:
基于融合属性特征生成点击预测特征以及转化预测特征;
基于点击预测特征获取预测点击率,基于转化预测特征获取预测转化率。
在一个可能的实施方式中,上述初始预测模型包含点击权重预测网络、转化权重预测网络以及N个预测特征生成网络,N为正整数;
获取模块901在用于基于融合属性特征生成点击预测特征以及转化预测特征时,具体用于:
将融合属性特征输入N个预测特征生成网络,并分别在每个预测特征生成网络中根据融合属性特征生成对应的初始预测特征;
将融合属性特征输入点击权重预测网络,在点击权重预测网络中生成每个预测特征生成网络对应的第一预测权重;
将融合属性特征输入转化权重预测网络,在转化权重预测网络中生成每个预测特征生成网络对应的第二预测权重;
利用每个预测特征生成网络对应的第一预测权重分别对每个预测特征生成网络对应的初始预测特征进行加权求和,得到点击预测特征;
利用每个预测特征生成网络对应的第二预测权重分别对每个预测特征生成网络对应的初始预测特征进行加权求和,得到转化预测特征。
本申请实施例中,获取模块将样本特征集合输入初始预测模型,基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率;生成模块基于点击标签和预测点击率生成点击损失函数,基于转化标签、预测点击率以及预测转化率生成针对点击转化损失函数;生成模块根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到权重损失函数,基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重;修正模块基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数,并基于目标损失函数修正初始预测模型的模型参数,得到目标预测模型。通过实施上述所提出的装置,模型训练过程可以动态调节点击权重和点击转化权重,以保持目标损失函数中的两个损失函数的平衡,进而使得目标预测模型的训练效果更好,以及预测点击率和转化率的准确性更高。
在本申请各个实施例中的各功能模块可以集成在一个模块中,也可以是各个模块单独物理存在,也可以是两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现,本申请不做限定。
请参见图10,图10为本申请提供的一种基于推荐模型的数据推荐装置的结构示意图。需要说明的是,图10所示的基于推荐模型的数据推荐装置,用于执行本申请图7所示实施例的方法,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示,请参照本申请图7所示的实施例。该基于推荐模型的数据推荐装置1000可包括:获取模块1001、输入模块1002、生成模块1003、推送模块1004。其中:
获取模块1001,用于获取预测用户的目标用户属性信息和待推荐对象的目标对象属性信息;
输入模块1002,用于将目标用户属性信息和目标对象属性信息输入目标预测模型;
生成模块1003,用于在目标预测模型中生成预测用户针对待推荐对象的目标预测点击率和目标预测转化率;
获取模块1003,还用于基于目标预测点击率和目标预测转化率,获取预测用户针对待推荐对象的兴趣分数;
推送模块1004,用于若兴趣分数大于兴趣分数阈值,则将待推荐对象推送至预测用户对应的用户终端。
在一个可能的实施方式中,该目标预测模型可以是采用上述图2所示实施例和/或图3所示实施例中的相关描述训练得到的。
本申请实施例中,获取模块获取预测用户的目标用户属性信息和待推荐对象的目标对象属性信息;输入模块将目标用户属性信息和目标对象属性信息输入目标预测模型;生成模块在目标预测模型中生成预测用户针对待推荐对象的目标预测点击率和目标预测转化率;获取模块基于目标预测点击率和目标预测转化率,获取预测用户针对待推荐对象的兴趣分数;若兴趣分数大于兴趣分数阈值,推送模块则将待推荐对象推送至预测用户对应的用户终端。通过实施上述所提出的装置,可以利用目标预测模型来获取预测用户针对待推荐对象的兴趣分数,并基于兴趣分数对待推荐对象进行推送,以实现推荐场景下的精准推送。
在本申请各个实施例中的各功能模块可以集成在一个模块中,也可以是各个模块单独物理存在,也可以是两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现,本申请不做限定。
请参见图11,图11为本申请实施例提供的一种电子设备的结构示意图。如图11所示,该电子设备1100包括:至少一个处理器1101、存储器1102。可选的,该电子设备还可包括网络接口。其中,处理器1101、存储器1102以及网络接口之间可以交互数据,网络接口受处理器1101的控制用于收发消息,存储器1102用于存储计算机程序,该计算机程序包括程序指令,处理器1101用于执行存储器1102存储的程序指令。其中,处理器1101被配置用于调用该程序指令执行上述方法。
其中,存储器1102可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器1102也可以包括非易失性存储器(non-volatilememory),例如快闪存储器(flash memory),固态硬盘(solid-state drive,SSD)等;存储器1102还可以包括上述种类的存储器的组合。
其中,处理器1101可以是中央处理器(central processing unit,CPU)。在一个实施例中,处理器1101还可以是图形处理器(Graphics Processing Unit,GPU)。处理器1101也可以是由CPU和GPU的组合。
在一个可能的实施方式中,存储器1102用于存储程序指令,处理器1101可以调用该程序指令,执行以下步骤:
获取样本特征集合;该样本特征集合包含样本用户的用户属性信息、样本推荐对象的对象属性信息、样本用户针对样本推荐对象的点击标签以及转化标签;
将样本特征集合输入初始预测模型,基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率;
基于点击标签和预测点击率生成点击损失函数,基于点击标签、转化标签、预测点击率以及预测转化率生成点击转化损失函数;
根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到权重损失函数,基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重;
基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数,并基于目标损失函数修正初始预测模型的模型参数,得到目标预测模型。
在一个可能的实施方式中,处理器1101在用于根据点击损失函数、点击转化损失函数和初始预测模型的模型参数得到权重损失函数时,具体用于:
获取点击损失函数对应的第一权重函数以及点击转化损失函数对应的第二权重函数;
根据第一权重函数、点击损失函数以及初始预测模型的模型参数,确定点击梯度函数;
根据第二权重函数、点击转化损失函数以及初始预测模型的模型参数,确定点击转化梯度函数;
根据点击梯度函数和点击转化梯度函数生成权重损失函数。
在一个可能的实施方式中,处理器1101在用于根据点击梯度函数和点击转化梯度函数生成权重损失函数时,具体用于:
根据第一权重函数、第二权重函数、点击损失函数、点击转化损失函数以及模型参数,确定平均梯度函数;
根据点击梯度函数和平均梯度函数确定目标点击梯度函数;
根据点击转化梯度函数和平均梯度函数确定目标点击转化梯度函数;
根据目标点击梯度函数和目标点击转化梯度函数生成权重损失函数。
在一个可能的实施方式中,处理器1101在用于基于权重损失函数生成点击损失函数对应的点击权重以及点击转化损失函数对应的点击转化权重时,具体用于:
基于权重损失函数对第一权重函数进行求导,得到第一权重调整函数,并根据第一权重调整函数和第一权重函数确定点击权重;
基于权重损失函数对第二权重函数进行求导,得到第二权重调整函数,并根据第二权重调整函数和第二权重函数确定点击转化权重。
在一个可能的实施方式中,处理器1101在用于基于点击权重、点击转化权重、点击损失函数和点击转化损失函数得到目标损失函数时,具体用于:
根据点击权重对点击损失函数进行加权,得到第一加权损失函数;
根据点击转化权重对点击转化损失函数进行加权,得到第二加权损失函数;
根据第一加权损失函数和第二加权损失函数,生成目标损失函数。
在一个可能的实施方式中,处理器1101在用于基于初始预测模型获取样本用户针对样本推荐对象的预测点击率以及预测转化率时,具体用于:
在初始预测模型中,生成用户属性信息对应的用户属性特征,并生成对象属性信息对应的对象属性特征;
基于用户属性特征和对象属性特征获取预测点击率和预测转化率。
在一个可能的实施方式中,处理器1101在用于基于用户属性特征和对象属性特征获取预测点击率和预测转化率时,具体用于:
对用户属性特征和对象属性特征进行特征融合,得到融合属性特征;
基于融合属性特征获取预测点击率和预测转化率。
在一个可能的实施方式中,处理器1101在用于基于融合属性特征获取预测点击率和预测转化率时,具体用于:
基于融合属性特征生成点击预测特征以及转化预测特征;
基于点击预测特征获取预测点击率,基于转化预测特征获取预测转化率。
在一个可能的实施方式中,上述初始预测模型包含点击权重预测网络、转化权重预测网络以及N个预测特征生成网络,N为正整数;
处理器1101在用于基于融合属性特征生成点击预测特征以及转化预测特征时,具体用于:
将融合属性特征输入N个预测特征生成网络,并分别在每个预测特征生成网络中根据融合属性特征生成对应的初始预测特征;
将融合属性特征输入点击权重预测网络,在点击权重预测网络中生成每个预测特征生成网络对应的第一预测权重;
将融合属性特征输入转化权重预测网络,在转化权重预测网络中生成每个预测特征生成网络对应的第二预测权重;
利用每个预测特征生成网络对应的第一预测权重分别对每个预测特征生成网络对应的初始预测特征进行加权求和,得到点击预测特征;
利用每个预测特征生成网络对应的第二预测权重分别对每个预测特征生成网络对应的初始预测特征进行加权求和,得到转化预测特征。
在一个可能的实施方式中,存储器1102用于存储程序指令,处理器1101可以调用该程序指令,执行以下步骤:
获取预测用户的目标用户属性信息和待推荐对象的目标对象属性信息;
将目标用户属性信息和目标对象属性信息输入目标预测模型;
在目标预测模型中生成预测用户针对待推荐对象的目标预测点击率和目标预测转化率;
基于目标预测点击率和目标预测转化率,获取预测用户针对待推荐对象的兴趣分数;
若兴趣分数大于兴趣分数阈值,则将待推荐对象推送至预测用户对应的用户终端。
其中,所述目标预测模型是采用上述图2所示实施例和/或图3所示实施例中的相关描述训练得到的。
具体实现中,上述所描述的装置、处理器1101、存储器1102等可执行上述方法实施例所描述的实现方式,也可执行本申请实施例所描述的实现方式,在此不再赘述。
本申请实施例中还提供一种计算机(可读)存储介质,该计算机存储介质存储有计算机程序,计算机程序包括程序指令,程序指令被处理器执行时,使处理器可执行上述方法实施例中所执行的部分或全部步骤。可选的,该计算机存储介质可以是易失性的,也可以是非易失性的。计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,前述的程序可存储于计算机存储介质中,该计算机存储介质可以为计算机可读存储介质,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)等。
以上所揭露的仅为本申请的部分实施例而已,当然不能以此来限定本申请之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本申请权利要求所作的等同变化,仍属于本申请所涵盖的范围。

Claims (12)

1.一种推荐模型训练方法,其特征在于,所述方法包括:
获取样本特征集合;所述样本特征集合包含样本用户的用户属性信息、样本推荐对象的对象属性信息、所述样本用户针对所述样本推荐对象的点击标签以及转化标签;
将所述样本特征集合输入初始预测模型,基于所述初始预测模型获取所述样本用户针对所述样本推荐对象的预测点击率以及预测转化率;
基于所述点击标签和所述预测点击率生成点击损失函数,基于所述点击标签、所述转化标签、所述预测点击率以及所述预测转化率生成点击转化损失函数;
根据所述点击损失函数、所述点击转化损失函数和所述初始预测模型的模型参数得到权重损失函数,基于所述权重损失函数生成所述点击损失函数对应的点击权重以及所述点击转化损失函数对应的点击转化权重;
基于所述点击权重、所述点击转化权重、所述点击损失函数和所述点击转化损失函数得到目标损失函数,并基于所述目标损失函数修正所述初始预测模型的模型参数,得到目标预测模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述点击损失函数、所述点击转化损失函数和所述初始预测模型的模型参数得到权重损失函数,包括:
获取所述点击损失函数对应的第一权重函数以及所述点击转化损失函数对应的第二权重函数;
根据所述第一权重函数、所述点击损失函数以及所述初始预测模型的模型参数,确定点击梯度函数;
根据所述第二权重函数、所述点击转化损失函数以及所述初始预测模型的模型参数,确定点击转化梯度函数;
根据所述点击梯度函数和所述点击转化梯度函数生成所述权重损失函数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述点击梯度函数和所述点击转化梯度函数生成所述权重损失函数,包括:
根据所述第一权重函数、所述第二权重函数、所述点击损失函数、所述点击转化损失函数以及所述模型参数,确定平均梯度函数;
根据所述点击梯度函数和所述平均梯度函数确定目标点击梯度函数;
根据所述点击转化梯度函数和所述平均梯度函数确定目标点击转化梯度函数;
根据所述目标点击梯度函数和所述目标点击转化梯度函数生成所述权重损失函数。
4.根据权利要求2所述的方法,其特征在于,所述基于所述权重损失函数生成所述点击损失函数对应的点击权重以及所述点击转化损失函数对应的点击转化权重,包括:
基于所述权重损失函数对所述第一权重函数进行求导,得到第一权重调整函数,并根据所述第一权重调整函数和所述第一权重函数确定所述点击权重;
基于所述权重损失函数对所述第二权重函数进行求导,得到第二权重调整函数,并根据所述第二权重调整函数和所述第二权重函数确定所述点击转化权重。
5.根据权利要求1所述的方法,其特征在于,所述基于所述点击权重、所述点击转化权重、所述点击损失函数和所述点击转化损失函数得到目标损失函数,包括:
根据所述点击权重对所述点击损失函数进行加权,得到第一加权损失函数;
根据所述点击转化权重对所述点击转化损失函数进行加权,得到第二加权损失函数;
根据所述第一加权损失函数和所述第二加权损失函数,生成所述目标损失函数。
6.根据权利要求1所述的方法,其特征在于,所述基于所述初始预测模型获取所述样本用户针对所述样本推荐对象的预测点击率以及预测转化率,包括:
在所述初始预测模型中,生成所述用户属性信息对应的用户属性特征,并生成所述对象属性信息对应的对象属性特征;
基于所述用户属性特征和所述对象属性特征获取所述预测点击率和所述预测转化率。
7.根据权利要求6所述的方法,其特征在于,所述基于所述用户属性特征和所述对象属性特征获取所述预测点击率和所述预测转化率,包括:
对所述用户属性特征和所述对象属性特征进行特征融合,得到融合属性特征;
基于所述融合属性特征获取所述预测点击率和所述预测转化率。
8.根据权利要求7所述的方法,其特征在于,所述基于所述融合属性特征获取所述预测点击率和所述预测转化率,包括:
基于所述融合属性特征生成点击预测特征以及转化预测特征;
基于所述点击预测特征获取所述预测点击率,基于所述转化预测特征获取所述预测转化率。
9.根据权利要求8所述的方法,其特征在于,所述初始预测模型包含点击权重预测网络、转化权重预测网络以及N个预测特征生成网络,N为正整数;
所述基于所述融合属性特征生成点击预测特征以及转化预测特征,包括:
将所述融合属性特征输入所述N个预测特征生成网络,并分别在每个预测特征生成网络中根据所述融合属性特征生成对应的初始预测特征;
将所述融合属性特征输入所述点击权重预测网络,在所述点击权重预测网络中生成所述每个预测特征生成网络对应的第一预测权重;
将所述融合属性特征输入所述转化权重预测网络,在所述转化权重预测网络中生成所述每个预测特征生成网络对应的第二预测权重;
利用所述每个预测特征生成网络对应的第一预测权重分别对所述每个预测特征生成网络对应的初始预测特征进行加权求和,得到所述点击预测特征;
利用所述每个预测特征生成网络对应的第二预测权重分别对所述每个预测特征生成网络对应的初始预测特征进行加权求和,得到所述转化预测特征。
10.一种基于推荐模型的数据推荐方法,其特征在于,所述方法包括:
获取预测用户的目标用户属性信息和待推荐对象的目标对象属性信息;
将所述目标用户属性信息和所述目标对象属性信息输入目标预测模型;所述目标预测模型是采用上述权利要求1-9任一项所述的方法进行训练得到;
在所述目标预测模型中生成所述预测用户针对所述待推荐对象的目标预测点击率和目标预测转化率;
基于所述目标预测点击率和所述目标预测转化率,获取所述预测用户针对所述待推荐对象的兴趣分数;
若所述兴趣分数大于兴趣分数阈值,则将所述待推荐对象推送至所述预测用户对应的用户终端。
11.一种电子设备,其特征在于,包括处理器和存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-10任一项所述的方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-10任一项所述的方法。
CN202111132414.6A 2021-09-26 2021-09-26 推荐模型训练方法、电子设备及存储介质 Pending CN113868523A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111132414.6A CN113868523A (zh) 2021-09-26 2021-09-26 推荐模型训练方法、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111132414.6A CN113868523A (zh) 2021-09-26 2021-09-26 推荐模型训练方法、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN113868523A true CN113868523A (zh) 2021-12-31

Family

ID=78991015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111132414.6A Pending CN113868523A (zh) 2021-09-26 2021-09-26 推荐模型训练方法、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113868523A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116578875A (zh) * 2023-07-12 2023-08-11 深圳须弥云图空间科技有限公司 基于多行为的点击预测模型训练方法及装置
CN116796012A (zh) * 2022-03-15 2023-09-22 腾讯科技(深圳)有限公司 一种数据处理方法及相关装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116796012A (zh) * 2022-03-15 2023-09-22 腾讯科技(深圳)有限公司 一种数据处理方法及相关装置
CN116578875A (zh) * 2023-07-12 2023-08-11 深圳须弥云图空间科技有限公司 基于多行为的点击预测模型训练方法及装置
CN116578875B (zh) * 2023-07-12 2023-11-10 深圳须弥云图空间科技有限公司 基于多行为的点击预测模型训练方法及装置

Similar Documents

Publication Publication Date Title
CN114265979B (zh) 确定融合参数的方法、信息推荐方法和模型训练方法
CN109690581B (zh) 用户指导***及方法
US10496651B2 (en) User recommendation generation
CN113868523A (zh) 推荐模型训练方法、电子设备及存储介质
CN109189922B (zh) 评论评估模型的训练方法和装置
CN113515690A (zh) 内容召回模型的训练方法、内容召回方法、装置及设备
CN113256335B (zh) 数据筛选方法、多媒体数据的投放效果预测方法及装置
CN115730125A (zh) 对象识别方法、装置、计算机设备和存储介质
CN115730217A (zh) 模型的训练方法、物料的召回方法及装置
CN113448876B (zh) 一种业务测试方法、装置、计算机设备及存储介质
CN114797113A (zh) 基于图卷积的资源预测方法及装置
CN115114462A (zh) 模型训练方法、装置、多媒体推荐方法、设备及存储介质
CN114329093A (zh) 数据的处理方法、装置及设备
CN111784377B (zh) 用于生成信息的方法和装置
CN114493674A (zh) 一种广告点击率预测模型及方法
CN112085040A (zh) 对象标签确定方法、装置和计算机设备
US20240214466A1 (en) Content push method and device, apparatus, and medium
CN116777529B (zh) 一种对象推荐的方法、装置、设备、存储介质及程序产品
CN116501993B (zh) 房源数据推荐方法及装置
CN116089722B (zh) 基于图产出标签的实现方法、装置、计算设备和存储介质
CN117725306A (zh) 推荐内容的处理方法、装置、设备及介质
CN115033777A (zh) 数据推荐方法、电子设备及存储介质
CN117725923A (zh) 文本匹配方法、装置、设备及介质
CN117540076A (zh) 一种基于特征增强的序列推荐粗排方法和装置
CN117743675A (zh) 资源召回方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination