CN113239230B - 业务推荐方法、行为数据增量预测模型生成方法和装置 - Google Patents

业务推荐方法、行为数据增量预测模型生成方法和装置 Download PDF

Info

Publication number
CN113239230B
CN113239230B CN202110296920.2A CN202110296920A CN113239230B CN 113239230 B CN113239230 B CN 113239230B CN 202110296920 A CN202110296920 A CN 202110296920A CN 113239230 B CN113239230 B CN 113239230B
Authority
CN
China
Prior art keywords
behavior data
user account
service
model
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110296920.2A
Other languages
English (en)
Other versions
CN113239230A (zh
Inventor
彭泽阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202110296920.2A priority Critical patent/CN113239230B/zh
Publication of CN113239230A publication Critical patent/CN113239230A/zh
Application granted granted Critical
Publication of CN113239230B publication Critical patent/CN113239230B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种业务推荐方法、行为数据增量预测模型生成方法和装置。其中,该业务推荐方法包括:获取多个待识别用户账户的用户特征;将每个待识别用户账户的用户特征输入至预先训练的、与第一业务对应的行为数据增量预测模型,获取每个待识别用户账户的行为数据增量预测值;根据每个待识别用户账户的行为数据增量预测值,从多个待识别用户账户中获取目标用户账户;以及将第一业务推荐给登录该目标用户账户的客户端。本公开实施例可以提高推荐效果。

Description

业务推荐方法、行为数据增量预测模型生成方法和装置
技术领域
本公开涉及短视频领域,尤其涉及一种业务推荐方法、行为数据增量预测模型生成方法、装置、服务器及存储介质。
背景技术
随着移动互联网的普及以及通信技术的成熟,越来越多的人参与到通过分享短视频来进行社交的潮流中来。短视频是指在各种新媒体平台上播放的、适合在移动状态和短时休闲状态下观看的、高频推送的视频内容,几秒到几分钟不等。
为了能够不断提升用户体验以及满足用户个性化需求,短视频平台可随着业务的发展给短视频用户下发对应的业务。相关技术中,短视频平台通常将待下发的业务推送给所有使用该短视频应用的用户。但是,这种推荐方式存在推荐效果差等问题。
发明内容
本公开提供一种业务推荐方法、行为数据增量预测模型生成方法、装置、服务器及存储介质,以至少解决相关技术中推荐方式存在推荐效果差等的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种业务推荐方法,包括:
获取多个待识别用户账户的用户特征;
将每个所述待识别用户账户的用户特征输入至预先训练的、与第一业务对应的行为数据增量预测模型,获取每个所述待识别用户账户的行为数据增量预测值;其中,所述行为数据增量预测模型是基于第一样本用户账户对应于第一业务的第一行为数据和第二样本用户账户对应于第二业务的第二行为数据而生成的,所述第一业务为所述第二业务的新版本业务;
根据每个所述待识别用户账户的行为数据增量预测值从所述多个待识别用户账户中获取目标用户账户;以及
将所述第一业务推荐给登录所述目标用户账户的客户端。
根据本公开的一些实施例,所述行为数据增量预测模型通过以下步骤训练得到:
获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;其中,所述第一业务为所述第二业务的新版本业务;
根据所述第二样本用户账户的用户特征和所述第二行为数据对第一机器学习模型进行训练,获得模型参数,基于所述模型参数生成纠偏模型;
根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量;
根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型。
根据本公开的一些实施例,所述根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量,包括:
将所述第一样本用户账户的用户特征输入至所述纠偏模型,预测所述第一样本用户账户对应于所述第二业务的行为数据预测值;
根据所述第一样本用户账户对应于第一业务的第一行为数据与所述行为数据预测值的差值,获取所述第一样本用户账户对应的行为数据增量。
根据本公开的一些实施例,所述根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型,包括:
将所述第一样本用户账户的用户特征作为训练数据,将所述行为数据增量作为所述训练数据对应的标签;
基于所述训练数据和所述标签对第二机器学习模型进行训练,获得模型参数,基于所述模型参数生成与所述第一业务对应的行为数据增量预测模型。
根据本公开的一些实施例,所述第一机器学习模型和所述第二机器学习模型为贝叶斯优化LightGBM模型。
根据本公开的一些实施例,所述根据每个所述待识别用户账户的行为数据增量预测值,从所述多个待识别用户账户中获取目标用户账户,包括:
将每个所述待识别用户账户的行为数据增量预测值与目标阈值进行大小比对;
从所述多个待识别用户账户中,识别出所述行为数据增量预测值大于所述目标阈值的待识别用户账户;
将所述行为数据增量预测值大于所述目标阈值的待识别用户账户确定为所述目标用户账户。
根据本公开的一些实施例,所述根据每个所述待识别用户账户的行为数据增量预测值,从所述多个待识别用户账户中获取目标用户账户,包括:
将每个所述待识别用户账户的行为数据增量预测值按照从大到小进行排序,将排在前N的行为数据增量预测值所对应的待识别用户账户确定为所述目标用户账户;或者,
按照每个所述待识别用户账户的行为数据增量预测值从大到小的顺序,对所述多个待识别用户账户进行排序,将排在前N的待识别用户账户确定为所述目标用户账户。
根据本公开实施例的第二方面,提供一种行为数据增量预测模型生成方法,包括:
获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;其中,所述第一业务为所述第二业务的新版本业务;
获取所述第一样本用户账户的用户特征和所述第二样本用户账户的用户特征;
根据所述第二样本用户账户的用户特征和所述第二行为数据对第一机器学习模型进行训练,获得模型参数,基于所述模型参数生成纠偏模型;
根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量;
根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型。
根据本公开的一些实施例,所述根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量,包括:
将所述第一样本用户账户的用户特征输入至所述纠偏模型,预测所述第一样本用户账户对应于所述第二业务的行为数据预测值;
根据所述第一样本用户账户对应于第一业务的第一行为数据与所述行为数据预测值的差值,获取所述第一样本用户账户对应的行为数据增量。
根据本公开的一些实施例,所述根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型,包括:
将所述第一样本用户账户的用户特征作为训练数据,将所述行为数据增量作为所述训练数据对应的标签;
基于所述训练数据和所述标签对第二机器学习模型进行训练,获得模型参数,基于所述模型参数生成与所述第一业务对应的行为数据增量预测模型。
根据本公开的一些实施例,所述第一机器学习模型和所述第二机器学习模型为贝叶斯优化LightGBM模型。
根据本公开实施例的第三方面,提供一种业务推荐装置,包括:
第一获取模块,被配置为获取多个待识别用户账户的用户特征;
第二获取模块,被配置为将每个所述待识别用户账户的用户特征输入至预先训练的、与第一业务对应的行为数据增量预测模型,获取每个所述待识别用户账户的行为数据增量预测值;其中,所述行为数据增量预测模型是基于第一样本用户账户对应于第一业务的第一行为数据和第二样本用户账户对应于第二业务的第二行为数据而生成的,所述第一业务为所述第二业务的新版本业务;
第三获取模块,被配置为根据每个所述待识别用户账户的行为数据增量预测值,从所述多个待识别用户账户中获取目标用户账户;以及
推荐模块,被配置为将所述第一业务推荐给登录所述目标用户账户的客户端。
根据本公开的一些实施例,所述装置还包括:
模型训练模块,被配置为预先训练所述行为数据增量预测模型;其中,所述模型训练模块具体被配置为:
获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;其中,所述第一业务为所述第二业务的新版本业务;
根据所述第二样本用户账户的用户特征和所述第二行为数据对第一机器学习模型进行训练,获得模型参数,基于所述模型参数生成纠偏模型;
根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量;
根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型。
根据本公开的一些实施例,所述模型训练模块具体被配置为:
将所述第一样本用户账户的用户特征输入至所述纠偏模型,预测所述第一样本用户账户对应于所述第二业务的行为数据预测值;
根据所述第一样本用户账户对应于第一业务的第一行为数据与所述行为数据预测值的差值,获取所述第一样本用户账户对应的行为数据增量。
根据本公开的一些实施例,所述模型训练模块具体被配置为:
将所述第一样本用户账户的用户特征作为训练数据,将所述行为数据增量作为所述训练数据对应的标签;
基于所述训练数据和所述标签对第二机器学习模型进行训练,获得模型参数,基于所述模型参数生成与所述第一业务对应的行为数据增量预测模型。
根据本公开的一些实施例,所述第一机器学习模型和所述第二机器学习模型为贝叶斯优化LightGBM模型。
根据本公开的一些实施例,所述第三获取模块具体被配置为:
将每个所述待识别用户账户的行为数据增量预测值与目标阈值进行大小比对;
从所述多个待识别用户账户中,识别出所述行为数据增量预测值大于所述目标阈值的待识别用户账户;
将所述行为数据增量预测值大于所述目标阈值的待识别用户账户确定为所述目标用户账户。
根据本公开的一些实施例,所述第三获取模块具体被配置为:
将每个所述待识别用户账户的行为数据增量预测值按照从大到小进行排序,将排在前N的行为数据增量预测值所对应的待识别用户账户确定为所述目标用户账户;或者,
按照每个所述待识别用户账户的行为数据增量预测值从大到小的顺序,对所述多个待识别用户账户进行排序,将排在前N的待识别用户账户确定为所述目标用户账户。
根据本公开实施例的第四方面,提供一种行为数据增量预测模型生成装置,包括:
第一获取模块,被配置为获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;其中,所述第一业务为所述第二业务的新版本业务;
第二获取模块,被配置为获取所述第一样本用户账户的用户特征和所述第二样本用户账户的用户特征;
第一生成模块,被配置为根据所述第二样本用户账户的用户特征和所述第二行为数据对第一机器学习模型进行训练,获得模型参数,基于所述模型参数生成纠偏模型;
第三获取模块,被配置为根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量;
第二生成模块,被配置为根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型。
根据本公开的一些实施例,所述第三获取模块具体被配置为:
将所述第一样本用户账户的用户特征输入至所述纠偏模型,预测所述第一样本用户账户对应于所述第二业务的行为数据预测值;
根据所述第一样本用户账户对应于第一业务的第一行为数据与所述行为数据预测值的差值,获取所述第一样本用户账户对应的行为数据增量。
根据本公开的一些实施例,所述第二生成模块具体被配置为:
将所述第一样本用户账户的用户特征作为训练数据,将所述行为数据增量作为所述训练数据对应的标签;
基于所述训练数据和所述标签对第二机器学习模型进行训练,获得模型参数,基于所述模型参数生成与所述第一业务对应的行为数据增量预测模型。
根据本公开的一些实施例,所述第一机器学习模型和所述第二机器学习模型为贝叶斯优化LightGBM模型。
根据本公开实施例的第五方面,提供一种服务器,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现本公开第一方面实施例所述的业务推荐方法,或者,实现本公开第二方面实施例所述的行为数据增量预测模型生成方法。
根据本公开实施例的第六方面,提供一种存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行本公开第一方面实施例所述的业务推荐方法,或者,实现本公开第二方面实施例所述的行为数据增量预测模型生成方法。
根据本公开实施例的第七方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开第一方面实施例所述的业务推荐方法,或者,实现本公开第二方面实施例所述的行为数据增量预测模型生成方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
可通过将每个待识别用户账户的用户行为特征输入至预先训练的、与第一业务对应的行为数据增量预测模型,获取每个待识别用户账户的行为数据增量预测值,并根据每个待识别用户账户的行为数据增量预测值从多个待识别用户账户中获取目标用户账户,使得这些目标用户是一群由于偏好第一业务的用户,即能够有效甄别出偏好第一业务的用户,这样,将该第一业务推荐给登录该目标用户账户的客户端,可以使得该业务对偏好这些业务的用户群体生效,从而可以提高推荐效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种业务推荐方法的流程图。
图2是根据一示例性实施例示出的一种行为数据增量预测模型的训练方法的流程图。
图3是根据一示例性实施例示出的一种行为数据增量预测模型生成方法的流程图。
图4是根据一示例性实施例示出的又一种行为数据增量预测模型生成方法的流程图。
图5是根据一示例性实施例示出的一种业务推荐方法的示例一流程图。
图6是根据一示例性实施例示出的一种业务推荐方法的示例二流程图。
图7是根据一示例性实施例示出的一种业务推荐装置框图。
图8是根据一示例性实施例示出的一种行为数据增量预测模型生成装置框图。
图9是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种业务推荐方法的流程图。本公开实施例的业务推荐方法的应用场景可为:短视频服务器向使用短视频应用的某些用户推送业务,以实现向对该业务感兴趣的人群推荐该业务。如图1所示,该业推荐方法用于本公开实施例所述的服务器中,包括以下步骤。
在步骤S11中,获取多个待识别用户账户的用户特征。
在本公开的实施例中,上述用户账户可包括但不限于用户ID(IdentityDocument,身份标识号)、用户名、用户昵称等任意一种或多种。多个待识别用户可理解为所有使用该短视频应用的用户。例如,该多个待识别用户可理解是短视频应用的全量用户,比如,可将所有下载并安装了该短视频应用的用户作为该待识别用户。
可选地,服务器中设有用以存储短视频应用用户账户的用户行为数据的存储模块。其中,每个待识别用户账户的用户行为数据可存储于该存储模块中。在本步骤中,可从该存储模块中获取多个待识别用户账户的用户行为数据,并从每个待识别用户账户的用户行为数据中提取出该待识别用户账户的用户特征。
在本公开一些实施例中,该用户行为数据可理解为用户在使用短视频应用时所产生的行为数据。例如,该用户行为数据可包括用户使用短视频应用观看短视频时所产生的行为数据,比如用户所观看的短视频的名称,观看时长或次数等;又如,该用户行为数据还可包括用户使用短视频应用制作短视频作品时所产生的行为数据,比如用户所制作的短视频作品的名称、时长等。
在本公开的一些实施例中,上述用户特征可包括但不限于用户画像、内容消费量和内容生产量等中的一种或多种。其中,该用户画像可包括但限于用户的职业、用户性别、用户年龄、用户兴趣爱好等中的一种或多种。该内容消费量是指观看短视频应用中的短视频内容的数量,和/或,使用短视频应用观看短视频的时长,和/或,使用短视频应用观看短视频的次数等。该内容生产量是指生产短视频产品的数量,和/或,使用短视频应用生产短视频作品的时长,和/或,使用短视频应用生产短视频的次数等。
在步骤S12中,将每个待识别用户账户的用户特征输入至预先训练的、与第一业务对应的行为数据增量预测模型,获取每个待识别用户账户的行为数据增量预测值;其中,行为数据增量预测模型是基于第一样本用户账户对应于第一业务的第一行为数据和第二样本用户账户对应于第二业务的第二行为数据而生成的,第一业务为第二业务的新版本业务。
在本公开实施例中,该行为数据增量预测模型已经学习到用户账户对应于第一业务的行为数据增量与用户特征之间的映射关系,该用户账户对应于第一业务的行为数据增量是指使用登录该用户账户的客户端的用户由于第一业务而产生的行为数据增量。由于行为数据增量预测模型已经学习得到了该映射关系,这样,在实际应用中,当短视频服务器需要向使用短视频应用的用户推荐业务时,通过将该短视频应用的全量用户账户的用户特征输入到该行为数据增量预测模型,通过该行为数据增量预测模型即可预测出这些全量用户账户中哪些目标用户账户将会由于该业务而使得对应的行为数据增多,则可认为该目标用户账户将会对该推荐的业务感兴趣,,故可以向登录该目标用户账户的客户端推荐该业务。
在本步骤中,该行为数据增量预测值可理解的是假设若向登录待识别用户账户的客户端推荐第一业务之后,预测该待识别用户账户将会由于该第一业务而使得对应的行为数据增多。其中,该行为数据增量预测模型可利用用户特征对每个待识别用户账户的行为数据增量进行预测,从而可以输出每个待识别用户账户的行为数据增量预测值。
需要说明的是,由于不同的业务,则对应的行为数据增量预测模型也会不同。因此,在确定要向登录目标用户账户的客户端推荐某一业务时,需要预先训练与该业务对应的行为数据增量预测模型,进而基于该对应的行为数据增量预测模型从众多用户账户中识别出该业务的受众用户账户,进而将该业务推荐给登录该受众用户账户的客户端。
在步骤S13中,根据每个待识别用户账户的行为数据增量预测值,从多个待识别用户账户中获取目标用户账户。
也就是说,在获得待识别用户账户的行为数据增量预测值之后,可判断待识别用户账户的行为数据增量预测值是否满足预设条件,若满足,则可从多个待识别用户账户中得到该满足预设条件的用户账户,将这些满足预设条件的用户账户作为目标用户账户。作为一种示例,该满足预设条件可包括但不限于:行为数据增量预测值大于目标阈值,或者,行为数据增量预测值排名在前N等。其中,N可为正整数,N的取值可根据实际情况决定。
在本公开一个实施例中,可将每个待识别用户账户的行为数据增量预测值与目标阈值进行大小比对,并从多个待识别用户账户中,识别出行为数据增量预测值大于目标阈值的待识别用户账户,将行为数据增量预测值大于目标阈值的待识别用户账户确定为目标用户账户。
在本公开另一个实施例中,可将每个待识别用户账户的行为数据增量预测值按照从大到小进行排序,将排在前N的行为数据增量预测值所对应的待识别用户账户确定为目标用户账户;或者,按照每个待识别用户账户的行为数据增量预测值从大到小的顺序,对多个待识别用户账户进行排序,将排在前N的待识别用户账户确定为目标用户账户。
在步骤S14中,将第一业务推荐给登录目标用户账户的客户端。
可选地,将该第一业务发送给登录目标用户账户的客户端,以使该客户端在接收到该第一业务之后可进行相应的业务更新,从而实现将第一业务推荐给登录目标用户账户的客户端的目的,以实现向对该业务感兴趣的人群推荐该业务。
根据本公开实施例的业务推荐方法,可通过将每个待识别用户账户的用户行为特征输入至预先训练的、与第一业务对应的行为数据增量预测模型,获取每个待识别用户账户的行为数据增量预测值,并根据每个待识别用户账户的行为数据增量预测值从多个待识别用户账户中获取目标用户账户,使得这些目标用户是一群偏好第一业务的用户,即能够有效甄别出偏好第一业务的用户,这样,将该第一业务推荐给登录该目标用户账户的客户端,可以提高推荐效果。
需要说明的是,本公开实施例的行为数据增量预测模型可以是预先训练的。由于不同的业务,则对应的行为数据增量预测模型也会不同,因此,在确定要向登录目标用户账户的客户端推荐第一业务时,需要预先训练与该第一业务对应的行为数据增量预测模型。在本公开的一些实施例中,如图2所示,该行为数据增量预测模型的训练方法可以包括如下步骤。
在步骤S21中,获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;其中,第一业务为第二业务的新版本业务。
其中,在本公开实施例中,该第一样本用户账户对应于第一业务的第一行为数据可理解为使用了登录第一样本用户账户的客户端的用户由于第一业务而产生的行为数据。第二样本用户账户对应于第二业务的第二行为数据可理解为使用了登录第二样本用户账户的客户端的用户由于第二业务而产生的行为数据。
在步骤S22中,根据第二样本用户账户的用户特征和第二行为数据对第一机器学习模型进行训练,获得模型参数,基于模型参数生成纠偏模型。
在本公开的一些实施例中,该用户特征可包括但不限于用户画像、内容消费量和内容生产量等中的一种或多种。其中,该用户画像可包括但限于用户的职业、用户性别、用户年龄、用户兴趣爱好等中的一种或多种。该内容消费量是指观看短视频应用中的短视频内容的数量,和/或,使用短视频应用观看短视频的时长,和/或,使用短视频应用观看短视频的次数等。该内容生产量是指生产短视频产品的数量,和/或,使用短视频应用生产短视频作品的时长,和/或,使用短视频应用生产短视频的次数等。
在本公开实施例中,第一机器学习模型可为贝叶斯优化LightGBM模型,或者,还可以是其他神经网络算法或机器学习算法,本公开实施例对此不做具体限定。作为一种示例,以第一机器学习模型为贝叶斯优化LightGBM模型为例,可获得第二样本用户账户的用户特征,并利用第二样本用户账户的用户特征和使用登录第二样本用户账户的客户端的用户由于第二业务而产生的行为数据,对该LightGBM模型进行训练,例如,以第二样本用户账户的用户特征作为模型的输入,以使用登录第二样本用户账户的客户端的用户由于第二业务而产生的行为数据作为模型的输出,进而将训练后的LightGBM模型作为所述纠偏模型,使得该纠偏模型已经学习得到用户特征与使用客户端的用户由于第二业务而产生的行为数据之间的映射关系。
在步骤S23中,根据第一样本用户账户的用户特征、第一行为数据、和纠偏模型,获取第一样本用户账户对应的行为数据增量。
可选地,将第一样本用户账户的用户特征输入至纠偏模型,预测第一样本用户账户对应于第二业务的行为数据预测值,并根据第一样本用户账户对应于第一业务的第一行为数据与行为数据预测值的差值,获取第一样本用户账户对应的行为数据增量。
也就是说,将第一样本用户账户的用户特征输入至纠偏模型中进行预测,以获得第一样本用户账户对应于第二业务的行为数据预测值,并将第一样本用户账户对应于第一业务的第一行为数据与该行为数据预测值进行减法操作,得到的差值即为该第一样本用户账户对应的行为数据增量。
在步骤S24中,根据第一样本用户账户的用户特征和行为数据增量,生成与第一业务对应的行为数据增量预测模型。
可选地,将第一样本用户账户的用户特征作为训练数据,将行为数据增量作为训练数据对应的标签,并基于训练数据和标签对第二机器学习模型进行训练,获得模型参数,基于模型参数生成与第一业务对应的行为数据增量预测模型。其中,在本公开实施例中,该第二机器学习模型可为贝叶斯优化LightGBM模型,或者,还可以是其他神经网络算法或机器学习算法,本公开实施例对此不做具体限定。
作为一种示例,以第二机器学习模型为贝叶斯优化LightGBM模型为例,该LightGBM模型可理解为用户特征与使用客户端的用户由于第一业务而产生的行为数据增量之间的对应关系模型,也就是说,以用户特征作为该模型的输入,行为数据增量作为模型的输出。此时可利用第一样本用户账户的用户特征作为训练数据,将该第一样本用户账户对应的行为数据增量作为训练数据对应的标签(其中,该标签可理解为第一样本用户账户对应的行为数据增量对应的真实值),将第一样本用户账户的用户特征输入至LightGBM模型进行行为数据增量的预测,获得预测值,将该预测值与该标签对应的真实值进行差异比较,基于差异程度调整LightGBM模型的参数,以实现对该LightGBM模型的训练。直至完成LightGBM模型的训练,获取完成训练后的LightGBM模型之中的模型参数,将该模型参数构成的模型作为所述行为数据增量预测模型,使得该行为数据增量预测模型已经学习得到用户特征与使用客户端的用户由于第一业务而产生的行为数据增量之间的映射关系。
可以理解,上述行为数据增量预测模型可以利用AB实验的实验数据而建立的,其中,该AB实验可理解为:向实验组用户所持的客户端发送第一业务,未向对照组用户所持的客户端发送第一业务的情况下进行的实验。可基于该AB实验的实验数据来建立该行为数据增量预测模型。下面将结合图3来对行为数据增量预测模型的生成方式进行详细描述。
举例而言,如图3所示,该行为数据增量预测模型生成方法可包括如下步骤。
在步骤S31中,获取实验前对照组用户账户的用户特征和实验组用户账户的用户特征。
在步骤S32中,获取实验后对照组用户账户对应的实际行为数据和实验组用户账户对应的实际行为数据。
在步骤S33中,根据对照组用户账户的用户特征、和实验后对照组用户账户对应的实际行为数据,对第一机器学习模型进行训练,获得模型参数,基于模型参数生成纠偏模型。
作为一种示例,以第一机器学习模型为贝叶斯优化LightGBM模型为例,以对照组用户账户的用户特征作为模型的输入,以实验后对照组用户账户对应的实际行为数据作为模型的输出,对该LightGBM模型进行训练,将完成训练的LightGBM模型作为纠偏模型。例如,获取完成训练后的LightGBM模型之中的模型参数,将由该模型参数所构成的LightGBM模型确定为该纠偏模型。
在步骤S34中,根据实验组用户账户的用户特征、实验后实验组用户账户对应的实际行为数据、和纠偏模型,获取实验组用户账户对应的行为数据增量。
在本公开一些实施例中,可将实验组用户账户的用户特征输入至纠偏模型,获得使用登录实验组用户账户的客户端的用户在未使用第一业务的情况下所产生的行为数据预测值;根据实验后实验组用户账户对应的实际行为数据与行为数据预测值的差值,获取实验组用户账户对应的行为数据增量。
在步骤S35中,根据实验组用户账户的用户特征和行为数据增量,生成与第一业务对应的行为数据增量预测模型。
在本公开一些实施例中,将实验组用户账户的用户特征作为训练数据,将行为数据增量作为训练数据对应的标签;基于训练数据和标签对第二机器学习模型进行训练,获得模型参数,基于模型参数生成与第一业务对应的行为数据增量预测模型。
作为一种示例,以第二机器学习模型为贝叶斯优化LightGBM模型为例,该LightGBM模型可理解为用户特征与使用客户端的用户由于第一业务而产生的行为数据增量之间的对应关系模型,也就是说,以用户特征作为该模型的输入,行为数据增量作为模型的输出。此时可利用实验组用户账户的用户特征作为训练数据,将该实验组用户账户对应的行为数据增量作为训练数据对应的标签(其中,该标签可理解为实验组用户账户对应的行为数据增量对应的真实值),将实验组用户账户的用户特征输入至LightGBM模型进行行为数据增量的预测,获得预测值,将该预测值与该标签对应的真实值进行差异比较,基于差异程度调整LightGBM模型的参数,以实现对该LightGBM模型的训练。直至完成LightGBM模型的训练,获取完成训练后的LightGBM模型之中的模型参数,将该模型参数构成的模型作为所述行为数据增量预测模型。
根据本公开实施例的技术方案,通过利用AB实验中对照组和实验组的实验前后数据来建立一个行为数据增量预测模型,进而可以利用该行为数据增量预测模型预测每个用户所对应的潜在偏好业务,进而根据该预测得到的潜在偏好业务能够有效甄别出不同人群对于有无推荐业务的推荐效果,从而可以有效识别出对业务偏好的人群,即有效识别出该业务的偏好用户。
为了实现上述实施例,本公开还提出了一种行为数据增量预测模型生成方法。
图4是根据一示例性实施例示出的一种行为数据增量预测模型生成方法的流程图。如图4所示,该行为数据增量预测模型生成方法可以包括如下步骤。
在步骤S41中,获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;其中,第一业务为第二业务的新版本业务。
在本公开的实施例中,步骤S41可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
在步骤S42中,获取第一样本用户账户的用户特征和第二样本用户账户的用户特征。
在本公开的实施例中,步骤S42可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
在步骤S43中,根据第二样本用户账户的用户特征和第二行为数据对第一机器学习模型进行训练,获得模型参数,基于模型参数生成纠偏模型。
在本公开的实施例中,步骤S43可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
在步骤S44中,根据第一样本用户账户的用户特征、第一行为数据、和纠偏模型,获取第一样本用户账户对应的行为数据增量。
在本公开实施例中,将第一样本用户账户的用户特征输入至纠偏模型,预测第一样本用户账户对应于第二业务的行为数据预测值;根据第一样本用户账户对应于第一业务的第一行为数据与行为数据预测值的差值,获取第一样本用户账户对应的行为数据增量。
在本公开的实施例中,步骤S44可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
在步骤S45中,根据第一样本用户账户的用户特征和行为数据增量,生成与第一业务对应的行为数据增量预测模型。
在本公开实施例中,将第一样本用户账户的用户特征作为训练数据,将行为数据增量作为训练数据对应的标签;基于训练数据和标签对第二机器学习模型进行训练,获得模型参数,基于模型参数生成与第一业务对应的行为数据增量预测模型。
在本公开的实施例中,步骤S45可以分别采用本公开的各实施例中的任一种方式实现,本公开实施例并不对此作出限定,也不再赘述。
在本公开一些实施例中,第一机器学习模型和第二机器学习模型均为贝叶斯优化LightGBM模型。
根据本公开实施例的技术方案,可通过第二样本用户账户的用户特征和第二样本用户账户对应于第二业务的的第二行为数据,生成纠偏模型,并利用第一样本用户账户的用户特征、第一样本用户账户对应于第一业务的的第一行为数据、以及该纠偏模型,获得第一样本用户账户对应的行为数据增量,进而根据第一样本用户账户的用户特征和该行为数据增量生成与第一业务对应的行为数据增量预测模型,使得该行为数据增量预测模型已经学习得到用户特征与使用客户端的用户由于使用第一业务的情况下所产生的行为数据增量之间的映射关系,从而可以利用该行为数据增量预测模型预测每个用户所对应的潜在偏好业务,进而根据该预测得到的潜在偏好业务能够有效甄别出不同人群对于有无推荐业务的推荐效果,从而可以有效识别出对业务偏好的人群,即有效识别出该业务的偏好用户。
为了能够使得本领域技术人员更加清楚地了解本公开的方案,下面将给出两种示例进行描述。
示例一,以第一业务“增加对作者发布作品进行额外点赞”为例,其中,实验组比对照组的作品多了点赞数,如图5所示,该业务推荐方法可以包括以下步骤:
在步骤S51中,对样本用户进行AB实验,并通过base组实验前用户行为特征预测base组实验后作品量,模型记为model1,即未向base组推荐上述第一业务情况下base组实验后的先验作品量,该模型为exp组的纠偏模型。
在步骤S52中,用model1计算在假如未向exp组推荐上述第一业务情况下,exp组实验后的预测作品量,并用exp组实验后实际作品量减去exp组预测作品量即可算出exp组由于实验带来的作品量增量delta。
在步骤S53中,用exp组样本用户的用户行为特征预测delta,记为model2。该模型为与示例一给出的第一业务对应的行为数据增量预测模型。其中,delta为步骤S52求得的由于实验带来的作品量增量,所以这一步建模可以直接预测哪些用户能够对该实验有产生业务量增量的可能。
在步骤S54中,通过model2对使用短视频应用的所有用户进行预测并排序,则预测值高(比如预测值排在前N)的用户作为满足预设条件的目标用户。
在步骤S55中,将第一业务推送给目标用户所持的客户端。
示例二,以第一业务“在短视频应用发现页用户名旁边加上’可能认识的人’”为例。也就是说,短视频服务商想在短视频应用发现页用户名旁边加上“可能认识的人”,想知道哪些用户的内容消费量最大,并针对这部分用户所持客户端发送该业务。首先假设一个用户在短视频应用上的内容消费总量为C(其中,C是一个关于使用短视频应用的时长、观看视频时长、观看直播时长、留存等消费指标的函数的输出值),如果实施“可能认识的人”业务后用户的内容消费总量为Cexp,则该业务带给个人的内容消费量为ΔC=Cexp-C。短视频服务商想找到ΔC>0的用户,对ΔC>0的用户实施该业务,使得实验对每一个人的增量都为正。具体而言,如图6所示,该业务推荐方法可以包括以下步骤:
在步骤S61中,对样本用户进行AB实验,并通过base组实验前后数据计算纠偏模型model1。其中,计算方法是首先用base组实验前的用户行为特征(用Xbase表示,比如包括画像、消费、生产等)建模lightgbm来预测base组实验后的收益Cbase_pred。由于base组没有上第一业务,因此可以认为Cbase_pred为用户的先验内容消费量。
在步骤S62中,用model1通过exp组实验前的用户行为特征Xexp来预测exp组样本用户实验后的增量为Cexp_pred,再用ΔC=Cexp_actual-Cexp_pred记为由于发现页用户名旁边加上“可能认识的人”带来的实验增量。其中,Cexp_actual为由于向实验组样本用户所持客户端推荐第一业务情况下实验组样本用户所产生的实际增量。
在步骤S63中,需要建立ΔC预测模型。即用exp组实验前的用户行为特征建立lightgbm模型预测ΔC,该模型记为model2,为与示例二给出的第一业务对应的行为数据增量预测模型。
在步骤S64中,通过model2对使用短视频应用的所有用户进行预测,预测出每一个用户的ΔC,并找出ΔC>0的用户,将ΔC>0的用户作为满足预设条件的目标用户。
在步骤S65中,将第一业务推荐给目标用户所处的客户端。即对步骤S64中得到的目标用户实施“可能认识的人”业务,这样的预期增量会比对全量用户都推荐第一业务得到的总体增量要大。
图7是根据一示例性实施例示出的一种业务推荐装置框图。参照图7,该业务推荐装置700包括:第一获取模块701、第二获取模块702、第三获取模块703和推荐模块704。
其中,第一获取模块701被配置为获取多个待识别用户账户的用户特征。
第二获取模块702被配置为将每个所述待识别用户账户的用户特征输入至预先训练的、与第一业务对应的行为数据增量预测模型,获取每个所述待识别用户账户的行为数据增量预测值;其中,所述行为数据增量预测模型是基于第一样本用户账户对应于第一业务的第一行为数据和第二样本用户账户对应于第二业务的第二行为数据而生成的,所述第一业务为所述第二业务的新版本业务。
第三获取模块703被配置为根据每个待识别用户账户的行为数据增量预测值,从多个待识别用户账户中获取目标用户账户。
在本公开一些实施例中,第三获取模块703将每个待识别用户账户的行为数据增量预测值与目标阈值进行大小比对;从多个待识别用户账户中,识别出行为数据增量预测值大于目标阈值的待识别用户账户;将行为数据增量预测值大于目标阈值的待识别用户账户确定为目标用户账户。
在本公开其他实施例中,第三获取模块703将每个待识别用户账户的行为数据增量预测值按照从大到小进行排序,将排在前N的行为数据增量预测值所对应的待识别用户账户确定为目标用户账户;或者,按照每个待识别用户账户的行为数据增量预测值从大到小的顺序,对多个待识别用户账户进行排序,将排在前N的待识别用户账户确定为目标用户账户。
推荐模块704被配置为将第一业务推荐给登录目标用户账户的客户端。
在本公开一些实施例中,该业务推荐装置还可包括:模型训练模块。该模型训练模块被配置为预先训练行为数据增量预测模型。其中,在本公开实施例中,模型训练模块具体被配置为:获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;其中,第一业务为第二业务的新版本业务;根据第二样本用户账户的用户特征和第二行为数据对第一机器学习模型进行训练,获得模型参数,基于模型参数生成纠偏模型;根据第一样本用户账户的用户特征、第一行为数据、和纠偏模型,获取第一样本用户账户对应的行为数据增量;根据第一样本用户账户的用户特征和行为数据增量,生成与第一业务对应的行为数据增量预测模型。
在本公开实施例中,模型训练模块根据第一样本用户账户的用户特征、第一行为数据、和纠偏模型,获取第一样本用户账户对应于第一业务的行为数据增量的具体实现过程可如下:将第一样本用户账户的用户特征输入至纠偏模型,预测第一样本用户账户对应于第二业务的行为数据预测值;根据第一样本用户账户对应于第一业务的第一行为数据与行为数据预测值的差值,获取第一样本用户账户对应的行为数据增量。
在本公开实施例中,模型训练模块根据第一样本用户账户的用户特征和行为数据增量,生成与第一业务对应的行为数据增量预测模型的具体实现过程可如下:将第一样本用户账户的用户特征作为训练数据,将行为数据增量作为训练数据对应的标签;基于训练数据和标签对第二机器学习模型进行训练,获得模型参数,基于模型参数生成与第一业务对应的行为数据增量预测模型。其中,作为一种示例,第一机器学习模型和第二机器学习模型均为贝叶斯优化LightGBM模型。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本公开实施例的业务推荐装置,可通过将每个待识别用户账户的用户行为特征输入至预先训练的、与第一业务对应的行为数据增量预测模型,获取每个待识别用户账户的行为数据增量预测值,并根据每个待识别用户账户的行为数据增量预测值从多个待识别用户账户中获取目标用户账户,使得这些目标用户是一群由于第一业务而能够提高一定业务量的用户,即能够有效甄别出由于第一业务而能够提高一定业务量的用户,这样,将该第一业务推荐给登录该目标用户账户的客户端,可以使得该业务对这些能够提高一定业务量的用户群体生效,从而可以提高该业务的总体业务量,从而可以提高推荐效果。
图8是根据一示例性实施例示出的一种行为数据增量预测模型生成装置框图。如图8所示,该行为数据增量预测模型生成装置800可以包括:第一获取模块801、第二获取模块802、第一生成模块803、第三获取模块804和第二生成模块805。
其中,第一获取模块801被配置为获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;其中,第一业务为第二业务的新版本业务。
第二获取模块802被配置为获取第一样本用户账户的用户特征和第二样本用户账户的用户特征。
第一生成模块803被配置为根据第二样本用户账户的用户特征和第二行为数据对第一机器学习模型进行训练,获得模型参数,基于模型参数生成纠偏模型。
第三获取模块804被配置为根据第一样本用户账户的用户特征、第一行为数据、和纠偏模型,获取第一样本用户账户对应的行为数据增量。
在本公开一些实施例中,第三获取模块804具体被配置为:将第一样本用户账户的用户特征输入至纠偏模型,预测第一样本用户账户对应于第二业务的行为数据预测值;根据第一样本用户账户对应于第一业务的第一行为数据与行为数据预测值的差值,获取第一样本用户账户对应的行为数据增量。
第二生成模块805被配置为根据第一样本用户账户的用户特征和行为数据增量,生成与第一业务对应的行为数据增量预测模型。
在本公开一些实施例中,第二生成模块805具体被配置为:将第一样本用户账户的用户特征作为训练数据,将行为数据增量作为训练数据对应的标签;基于训练数据和标签对第二机器学习模型进行训练,获得模型参数,基于模型参数生成与第一业务对应的行为数据增量预测模型。作为一种示例,第一机器学习模型和第二机器学习模型均为贝叶斯优化LightGBM模型。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本公开实施例的技术方案,可通过第二样本用户账户的用户特征和第二样本用户账户对应于第二业务的的第二行为数据,生成纠偏模型,并利用第一样本用户账户的用户特征、第一样本用户账户对应于第一业务的的第一行为数据、以及该纠偏模型,获得第一样本用户账户对应的行为数据增量,进而根据第一样本用户账户的用户特征和该行为数据增量生成与第一业务对应的行为数据增量预测模型,使得该行为数据增量预测模型已经学习得到用户特征与使用客户端的用户由于使用第一业务的情况下所产生的行为数据增量之间的映射关系,从而可以利用该行为数据增量预测模型预测每个用户所对应的潜在业务量,进而根据该预测得到的潜在业务量能够有效甄别出不同人群对于有无推荐业务的业务量预测情况,从而可以有效识别出对业务敏感的人群,即有效识别出该业务的受众用户。
图9是根据一示例性实施例示出的一种服务器200的框图。如图9所示,上述服务器200可以包括:
存储器210及处理器220,连接不同组件(包括存储器210和处理器220)的总线230,存储器210存储有处理器220可执行指令;其中,处理器220被配置为执行所述指令,以实现本公开实施例所述的业务推荐方法或行为数据增量预测模型生成方法。
总线230表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,***总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。
服务器200典型地包括多种电子设备可读介质。这些介质可以是任何能够被服务器200访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。存储器210还可以包括易失性存储器形式的计算机***可读介质,例如随机存取存储器(RAM)240和/或高速缓存存储器250。服务器200可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例,存储***260可以用于读写不可移动的、非易失性磁介质(图9未显示,通常称为“硬盘驱动器”)。尽管图9中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线230相连。存储器210可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本公开各实施例的功能。
具有一组(至少一个)程序模块270的程序/实用工具280,可以存储在例如存储器210中,这样的程序模块270包括——但不限于——操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块270通常执行本公开所描述的实施例中的功能和/或方法。
服务器200也可以与一个或多个外部设备290(例如键盘、指向设备、显示器291等)通信,还可与一个或者多个使得用户能与该服务器200交互的设备通信,和/或与使得该服务器200能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口292进行。并且,服务器200还可以通过网络适配器293与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器293通过总线230与服务器200的其它模块通信。应当明白,尽管图中未示出,可以结合服务器200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
处理器220通过运行存储在存储器210中的程序,从而执行各种功能应用以及数据处理。
需要说明的是,本实施例的服务器的实施过程和技术原理参见前述对本公开实施例的业务推荐方法或行为数据增量预测模型生成方法的解释说明,此处不再赘述。
为了实现上述实施例,本公开还提出一种存储介质。
其中,该存储介质中的指令由服务器的处理器执行时,使得服务器能够执行如前所述的业务推荐方法或行为数据增量预测模型生成方法。
为了实现上述实施例,本公开还提供一种计算机程序产品。该计算机程序产品包括计算机程序,该计算机程序在被服务器的处理器执行时实现如前所述的业务推荐方法或行为数据增量预测模型生成方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (22)

1.一种业务推荐方法,其特征在于,包括:
获取多个待识别用户账户的用户特征;
将每个所述待识别用户账户的用户特征输入至预先训练的、与第一业务对应的行为数据增量预测模型,获取每个所述待识别用户账户的行为数据增量预测值;其中,所述行为数据增量预测模型是基于第一样本用户账户对应于第一业务的第一行为数据和第二样本用户账户对应于第二业务的第二行为数据而生成的,所述第一业务为所述第二业务的新版本业务;
根据每个所述待识别用户账户的行为数据增量预测值,从所述多个待识别用户账户中获取目标用户账户;以及
将所述第一业务推荐给登录所述目标用户账户的客户端;
其中,所述行为数据增量预测模型通过以下步骤训练得到:
获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;
根据所述第二样本用户账户的用户特征和所述第二行为数据对第一机器学习模型进行训练,获得模型参数,基于所述模型参数生成纠偏模型;
根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量;
根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型。
2.根据权利要求1所述的业务推荐方法,其特征在于,所述根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量,包括:
将所述第一样本用户账户的用户特征输入至所述纠偏模型,预测所述第一样本用户账户对应于所述第二业务的行为数据预测值;
根据所述第一样本用户账户对应于第一业务的第一行为数据与所述行为数据预测值的差值,获取所述第一样本用户账户对应的行为数据增量。
3.根据权利要求1所述的业务推荐方法,其特征在于,所述根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型,包括:
将所述第一样本用户账户的用户特征作为训练数据,将所述行为数据增量作为所述训练数据对应的标签;
基于所述训练数据和所述标签对第二机器学习模型进行训练,获得模型参数,基于所述模型参数生成与所述第一业务对应的行为数据增量预测模型。
4.根据权利要求3所述的业务推荐方法,其特征在于,所述第一机器学习模型和所述第二机器学习模型为贝叶斯优化LightGBM模型。
5.根据权利要求1至4中任一项所述的业务推荐方法,其特征在于,所述根据每个所述待识别用户账户的行为数据增量预测值,从所述多个待识别用户账户中获取目标用户账户,包括:
将每个所述待识别用户账户的行为数据增量预测值与目标阈值进行大小比对;
从所述多个待识别用户账户中,识别出所述行为数据增量预测值大于所述目标阈值的待识别用户账户;
将所述行为数据增量预测值大于所述目标阈值的待识别用户账户确定为所述目标用户账户。
6.根据权利要求1至4中任一项所述的业务推荐方法,其特征在于,所述根据每个所述待识别用户账户的行为数据增量预测值,从所述多个待识别用户账户中获取目标用户账户,包括:
将每个所述待识别用户账户的行为数据增量预测值按照从大到小进行排序,将排在前N的行为数据增量预测值所对应的待识别用户账户确定为所述目标用户账户;或者,
按照每个所述待识别用户账户的行为数据增量预测值从大到小的顺序,对所述多个待识别用户账户进行排序,将排在前N的待识别用户账户确定为所述目标用户账户。
7.一种行为数据增量预测模型生成方法,其特征在于,包括:
获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;其中,所述第一业务为所述第二业务的新版本业务;
获取所述第一样本用户账户的用户特征和所述第二样本用户账户的用户特征;
根据所述第二样本用户账户的用户特征和所述第二行为数据对第一机器学习模型进行训练,获得模型参数,基于所述模型参数生成纠偏模型;
根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量;
根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型。
8.根据权利要求7所述的行为数据增量预测模型生成方法,其特征在于,所述根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量,包括:
将所述第一样本用户账户的用户特征输入至所述纠偏模型,预测所述第一样本用户账户对应于所述第二业务的行为数据预测值;
根据所述第一样本用户账户对应于第一业务的第一行为数据与所述行为数据预测值的差值,获取所述第一样本用户账户对应的行为数据增量。
9.根据权利要求7所述的行为数据增量预测模型生成方法,其特征在于,所述根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型,包括:
将所述第一样本用户账户的用户特征作为训练数据,将所述行为数据增量作为所述训练数据对应的标签;
基于所述训练数据和所述标签对第二机器学习模型进行训练,获得模型参数,基于所述模型参数生成与所述第一业务对应的行为数据增量预测模型。
10.根据权利要求9所述的行为数据增量预测模型生成方法,其特征在于,所述第一机器学习模型和所述第二机器学习模型为贝叶斯优化LightGBM模型。
11.一种业务推荐装置,其特征在于,包括:
第一获取模块,被配置为获取多个待识别用户账户的用户特征;
第二获取模块,被配置为将每个所述待识别用户账户的用户特征输入至预先训练的、与第一业务对应的行为数据增量预测模型,获取每个所述待识别用户账户的行为数据增量预测值;其中,所述行为数据增量预测模型是基于第一样本用户账户对应于第一业务的第一行为数据和第二样本用户账户对应于第二业务的第二行为数据而生成的,所述第一业务为所述第二业务的新版本业务;
第三获取模块,被配置为根据每个所述待识别用户账户的行为数据增量预测值,从所述多个待识别用户账户中获取目标用户账户;以及
推荐模块,被配置为将所述第一业务推荐给登录所述目标用户账户的客户端;
其中,所述装置还包括:
模型训练模块,被配置为预先训练所述行为数据增量预测模型;其中,
所述模型训练模块具体被配置为:
获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;
根据所述第二样本用户账户的用户特征和所述第二行为数据对第一机器学习模型进行训练,获得模型参数,基于所述模型参数生成纠偏模型;
根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量;
根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型。
12.根据权利要求11所述的业务推荐装置,其特征在于,所述模型训练模块具体被配置为:
将所述第一样本用户账户的用户特征输入至所述纠偏模型,预测所述第一样本用户账户对应于所述第二业务的行为数据预测值;
根据所述第一样本用户账户对应于第一业务的第一行为数据与所述行为数据预测值的差值,获取所述第一样本用户账户对应的行为数据增量。
13.根据权利要求11所述的业务推荐装置,其特征在于,所述模型训练模块具体被配置为:
将所述第一样本用户账户的用户特征作为训练数据,将所述行为数据增量作为所述训练数据对应的标签;
基于所述训练数据和所述标签对第二机器学习模型进行训练,获得模型参数,基于所述模型参数生成与所述第一业务对应的行为数据增量预测模型。
14.根据权利要求13所述的业务推荐装置,其特征在于,所述第一机器学习模型和所述第二机器学习模型为贝叶斯优化LightGBM模型。
15.根据权利要求11至14中任一项所述的业务推荐装置,其特征在于,所述第三获取模块具体被配置为:
将每个所述待识别用户账户的行为数据增量预测值与目标阈值进行大小比对;
从所述多个待识别用户账户中,识别出所述行为数据增量预测值大于所述目标阈值的待识别用户账户;
将所述行为数据增量预测值大于所述目标阈值的待识别用户账户确定为所述目标用户账户。
16.根据权利要求11至14中任一项所述的业务推荐装置,其特征在于,所述第三获取模块具体被配置为:
将每个所述待识别用户账户的行为数据增量预测值按照从大到小进行排序,将排在前N的行为数据增量预测值所对应的待识别用户账户确定为所述目标用户账户;或者,
按照每个所述待识别用户账户的行为数据增量预测值从大到小的顺序,对所述多个待识别用户账户进行排序,将排在前N的待识别用户账户确定为所述目标用户账户。
17.一种行为数据增量预测模型生成装置,其特征在于,包括:
第一获取模块,被配置为获取第一样本用户账户对应于第一业务的第一行为数据,并获取第二样本用户账户对应于第二业务的第二行为数据;其中,所述第一业务为所述第二业务的新版本业务;
第二获取模块,被配置为获取所述第一样本用户账户的用户特征和所述第二样本用户账户的用户特征;
第一生成模块,被配置为根据所述第二样本用户账户的用户特征和所述第二行为数据对第一机器学习模型进行训练,获得模型参数,基于所述模型参数生成纠偏模型;
第三获取模块,被配置为根据所述第一样本用户账户的用户特征、所述第一行为数据、和所述纠偏模型,获取所述第一样本用户账户对应的行为数据增量;
第二生成模块,被配置为根据所述第一样本用户账户的用户特征和所述行为数据增量,生成与所述第一业务对应的行为数据增量预测模型。
18.根据权利要求17所述的行为数据增量预测模型生成装置,其特征在于,所述第三获取模块具体被配置为:
将所述第一样本用户账户的用户特征输入至所述纠偏模型,预测所述第一样本用户账户对应于所述第二业务的行为数据预测值;
根据所述第一样本用户账户对应于第一业务的第一行为数据与所述行为数据预测值的差值,获取所述第一样本用户账户对应的行为数据增量。
19.根据权利要求17所述的行为数据增量预测模型生成装置,其特征在于,所述第二生成模块具体被配置为:
将所述第一样本用户账户的用户特征作为训练数据,将所述行为数据增量作为所述训练数据对应的标签;
基于所述训练数据和所述标签对第二机器学习模型进行训练,获得模型参数,基于所述模型参数生成与所述第一业务对应的行为数据增量预测模型。
20.根据权利要求19所述的行为数据增量预测模型生成装置,其特征在于,所述第一机器学习模型和所述第二机器学习模型为贝叶斯优化LightGBM模型。
21.一种服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的业务推荐方法,或者,实现如权利要求7至10中任一项所述的行为数据增量预测模型生成方法。
22.一种存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如权利要求1至6中任一项所述的业务推荐方法,或者,实现如权利要求7至10中任一项所述的行为数据增量预测模型生成方法。
CN202110296920.2A 2021-03-19 2021-03-19 业务推荐方法、行为数据增量预测模型生成方法和装置 Active CN113239230B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110296920.2A CN113239230B (zh) 2021-03-19 2021-03-19 业务推荐方法、行为数据增量预测模型生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110296920.2A CN113239230B (zh) 2021-03-19 2021-03-19 业务推荐方法、行为数据增量预测模型生成方法和装置

Publications (2)

Publication Number Publication Date
CN113239230A CN113239230A (zh) 2021-08-10
CN113239230B true CN113239230B (zh) 2024-05-17

Family

ID=77130361

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110296920.2A Active CN113239230B (zh) 2021-03-19 2021-03-19 业务推荐方法、行为数据增量预测模型生成方法和装置

Country Status (1)

Country Link
CN (1) CN113239230B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013126589A1 (en) * 2012-02-21 2013-08-29 Ooyala, Inc. Automatically recommending content
CN109299327A (zh) * 2018-11-16 2019-02-01 广州市百果园信息技术有限公司 视频推荐方法、装置、设备及存储介质
CN109711929A (zh) * 2018-12-13 2019-05-03 中国平安财产保险股份有限公司 基于预测模型的业务推荐的方法及装置
CN111260419A (zh) * 2020-02-20 2020-06-09 世纪龙信息网络有限责任公司 获取用户属性的方法、装置、计算机设备和存储介质
CN111382357A (zh) * 2020-03-06 2020-07-07 吉林农业科技学院 一种基于大数据的信息推荐***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013126589A1 (en) * 2012-02-21 2013-08-29 Ooyala, Inc. Automatically recommending content
CN109299327A (zh) * 2018-11-16 2019-02-01 广州市百果园信息技术有限公司 视频推荐方法、装置、设备及存储介质
CN109711929A (zh) * 2018-12-13 2019-05-03 中国平安财产保险股份有限公司 基于预测模型的业务推荐的方法及装置
CN111260419A (zh) * 2020-02-20 2020-06-09 世纪龙信息网络有限责任公司 获取用户属性的方法、装置、计算机设备和存储介质
CN111382357A (zh) * 2020-03-06 2020-07-07 吉林农业科技学院 一种基于大数据的信息推荐***

Also Published As

Publication number Publication date
CN113239230A (zh) 2021-08-10

Similar Documents

Publication Publication Date Title
US20210326674A1 (en) Content recommendation method and apparatus, device, and storage medium
CN109086439B (zh) 信息推荐方法及装置
US10943497B2 (en) Personalized e-learning using a deep-learning-based knowledge tracing and hint-taking propensity model
US20200374589A1 (en) User feature generation method and apparatus, device, and computer-readable storage medium
US10958704B2 (en) Feature generation for online/offline machine learning
CN106354856B (zh) 基于人工智能的深度神经网络强化搜索方法和装置
CN112100504B (zh) 内容推荐方法、装置、电子设备及存储介质
CN112905876B (zh) 基于深度学习的信息推送方法、装置和计算机设备
US20230222190A1 (en) Systems and methods for providing user validation
CN113641835B (zh) 多媒体资源推荐方法、装置、电子设备及介质
CN112291612A (zh) 视频与音频的匹配方法、装置、存储介质与电子设备
CN113704509B (zh) 多媒体推荐方法、装置、电子设备及存储介质
US20230316106A1 (en) Method and apparatus for training content recommendation model, device, and storage medium
CN113204699B (zh) 信息推荐方法、装置、电子设备及存储介质
CN111737579A (zh) 对象推荐方法、装置及电子设备、存储介质
CN113239230B (zh) 业务推荐方法、行为数据增量预测模型生成方法和装置
CN113836388A (zh) 信息推荐方法、装置、服务器及存储介质
CN114491093B (zh) 多媒体资源推荐、对象表征网络的生成方法及装置
CN112269942B (zh) 一种推荐对象的方法、装置、***及电子设备
CN115756821A (zh) 在线任务处理模型训练、任务处理方法及装置
KR102438104B1 (ko) 맞춤형 학습 문제풀이 컨텐츠 제공 시스템, 방법 및 컴퓨터 프로그램
CN111859141B (zh) 内容推送方法、装置、服务器及存储介质
CN114139059A (zh) 资源推荐模型的训练方法、资源推荐方法及装置
CN112785328A (zh) 一种内容推送方法、装置及计算机存储介质
CN110209881A (zh) 视频搜索方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant