CN109063900A - 用户转化率预测模型的训练及用户转化率预测方法和装置 - Google Patents
用户转化率预测模型的训练及用户转化率预测方法和装置 Download PDFInfo
- Publication number
- CN109063900A CN109063900A CN201810775857.9A CN201810775857A CN109063900A CN 109063900 A CN109063900 A CN 109063900A CN 201810775857 A CN201810775857 A CN 201810775857A CN 109063900 A CN109063900 A CN 109063900A
- Authority
- CN
- China
- Prior art keywords
- user
- sample
- sequence
- conversion ratio
- behavior sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种用户转化率预测模型的训练及用户转化率预测方法和装置,通过对用户的行为序列进行挖掘,从而能够体现出用户的潜在行为模式,并结合用户与其他用户行为的相似度选择目标行为序列来对用户转化率预测模型进行训练,获得的模型能够准确地预测出用户转化率,提高了用户转化率的预测准确率。
Description
技术领域
本发明涉及计算机软件技术领域,尤其涉及用户转化率预测模型的训练及用户转化率预测方法和装置。
背景技术
用户转化率是指用户由非特定用户转化为特定用户的概率。例如,用户由非付费用户转化为付费用户的概率,或者用户由非注册用户转化为注册用户的概率。如何准确预测用户转化率对于产品运营和UI更新等具有重要意义。然而,传统的用户转化率预测方式预测准确率较低。
发明内容
有鉴于此,本发明提供一种用户转化率预测模型的训练及用户转化率预测方法和装置。
具体地,本发明是通过如下技术方案实现的:
根据本发明实施例的第一方面,提供一种用户转化率预测模型的训练方法,所述方法包括:根据多个用户样本的目标行为序列对用户转化率预测模型进行训练;其中,任一用户样本的目标行为序列均根据如下方式获取:在获取所述用户样本对项目对象的行为序列之后,根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度;根据所述相似度从各个其他用户样本的行为序列中选择所述用户样本的目标行为序列。
可选地,所述用户转化率预测模型包括根据第一用户样本的目标行为序列训练出的第一用户转化率预测模型,所述第一用户是注册时长参数大于预设时长阈值,且注册活跃度小于或等于预设活跃度阈值的用户样本;根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度的步骤包括:分别将各个第一用户样本的行为序列转换为向量,并分别计算每个第一用户样本的向量与各个其他第一用户样本的向量之间的相似度。
可选地,所述用户转化率预测模型包括根据第二用户样本的目标行为序列训练出的第二用户转化率预测模型,所述第二用户样本是注册时长参数大于预设时长阈值,且注册活跃度大于预设活跃度阈值的用户样本;根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度的步骤包括:分别将各个第二用户样本的行为序列转换为向量,并分别计算每个第二用户样本的向量与各个其他第二用户样本的向量之间的相似度;以及分别将各个第二用户样本的行为序列划分为多个子序列,将各个子序列分别转换为子向量,根据所述子向量生成数组,分别计算每个第二用户样本的数组与各个其他第二用户样本的数组之间的相似度。
可选地,所述用户转化率预测模型包括根据第三用户样本的目标特征序列训练出的第三用户转化率预测模型,所述第三用户样本是注册时长参数小于或等于预设时长阈值的用户样本;其中,所述目标特征序列根据如下方式获取:计算所述第三用户样本的特征序列与各个其他第三用户样本的特征序列之间的相似度;根据所述相似度从各个其他第三用户样本的特征序列中选择所述第三用户样本的目标特征序列。
可选地,所述目标特征序列包括第一特征序列和第二特征序列;其中,所述第一特征序列是与所述用户样本的特征序列的相似度最高的特征序列;所述第二特征序列是与所述用户样本的特征序列的相似度最低的特征序列。
可选地,根据所述用户样本的登录活跃度、行为活跃度和社交活跃度计算所述用户样本的注册活跃度;其中,所述登录活跃度用于表征登录频率,所述行为活跃度用于表征产生所述历史行为事件的频率,所述社交活跃度用于表征产生历史社交行为的频率。
可选地,所述注册活跃度根据如下公式计算:式中,RA为所述注册活跃度,rd为注册时长,la为登录活跃度,ba为行为活跃度,sa为社交活跃度,N为项目上线时长。
可选地,所述用户样本的目标行为序列包括第一行为序列和第二行为序列;其中,所述第一行为序列是与所述用户样本的行为序列的相似度最高的行为序列;所述第二行为序列是与所述用户样本的行为序列的相似度最低的行为序列。
根据本发明实施例的第二方面,提供一种用户转化率预测方法,所述方法包括:根据预先训练的用户转化率预测模型对当前用户的用户转化率进行预测;所述用户转化率预测模型根据任一实施例的用户转化率预测模型的训练方法进行训练。
可选地,所述方法还包括:根据所述用户转化率向所述用户推送消息,所述消息中携带目标对象的对象信息,所述目标对象是使当前用户的用户转化率最大的对象。
根据本发明实施例的第三方面,提供一种用户转化率预测模型的训练装置,其特征在于,所述装置包括:训练模块,用于根据多个用户样本的目标行为序列对用户转化率预测模型进行训练;其中,任一用户样本的目标行为序列均根据如下方式获取:第一计算模块,用于在获取所述用户样本对项目对象的行为序列之后,根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度;第一选择模块,用于根据所述相似度从各个其他用户样本的行为序列中选择所述用户样本的目标行为序列。
根据本发明实施例的第四方面,提供一种用户转化率预测装置,其特征在于,所述装置包括:预测模块,用于根据预先训练的用户转化率预测模型对当前用户的用户转化率进行预测;所述用户转化率预测模型根据任一实施例的用户转化率预测模型的训练方法进行训练。
根据本发明实施例的第五方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现任一实施例中方法的步骤。
根据本发明实施例的第六方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现任一实施例中方法的步骤。
应用本发明实施例方案,通过对用户的行为序列进行挖掘,从而能够体现出用户的潜在行为模式,并结合用户与其他用户行为的相似度选择目标行为序列来对用户转化率预测模型进行训练,获得的模型能够准确地预测出用户转化率,提高了用户转化率的预测准确率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
图1是本发明一个实施例的用户转化率预测模型的训练方法流程图。
图2是本发明一个实施例的用户转化率预测模型的训练方法的总体流程图。
图3(a)和图3(b)是本发明一个实施例的用户划分方式的示意图。
图4是本发明一个实施例的行为序列相似度计算的示意图。
图5是本发明一个实施例的用户转化率预测方法流程图。
图6是本发明一个实施例的用户转化率预测模型的训练装置的框图。
图7是本发明一个实施例的用户转化率预测装置的框图。
图8是本发明一个实施例的用于执行本发明实施例方法的计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
如图1所示,图1是本发明一个实施例的用户转化率预测模型的训练方法流程图,所述方法可包括:
步骤101:根据多个用户样本的目标行为序列对用户转化率预测模型进行训练;其中,任一用户样本的目标行为序列均根据如下方式获取:
步骤102:在获取所述用户样本对项目对象的行为序列之后,根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度;
步骤103:根据所述相似度从各个其他用户样本的行为序列中选择所述用户样本的目标行为序列。
用户样本是已知用户标签的用户,用户标签用于表征该用户样本是否为转化用户,如果是,可将用户标签设为1;如果不是,可将用户标签设为0。用户转化是指用户由非特定用户转化为特定用户。例如,用户由非付费用户转化为付费用户,或者用户由非注册用户转化为注册用户。用户样本的行为序列是根据用户样本对项目对象所执行的一系列行为事件而产生的序列。其中,项目可以是应用程序,项目对象可以是应用程序中的对象,例如,可以是淘宝、京东等用于购物的应用程序中的商品;也可以是今日头条、网易新闻等用于阅读新闻的应用程序中的新闻。上述行为事件可以是在应用程序中的点击链接、购买/收藏商品、发表/查看评论、转发信息等行为。
用户样本的目标行为序列用于表征用户样本的行为行为模式(也称行为偏好或者行为习惯)。目标行为序列可以是与用户样本的行为序列相似度最高的行为序列,也可以同时包括与用户样本的行为序列相似度最高的行为序列以及与用户样本的行为序列相似度最低的行为序列。
在进行模型训练时,可以分别获取每个用户样本的目标行为序列,然后将各个目标行为序列均输入到用户转化率预测模型中对模型参数进行求解。假设用户样本中包括{u1,u2,…,un},其行为序列分别为s1,s2,…,sn,则可以分别计算s1与s2,…,sn的相似度,s2与s1,s3,…,sn的相似度,……,sn与s1,…,sn-1的相似度。然后,根据s2,…,sn与s1的相似度从s2,…,sn中选择s1的目标行为序列,根据s2与s1,s3,…,sn的相似度从s1,s3,…,sn中选择s2的目标行为序列,……,根据sn与s1,…,sn-1的相似度从s1,…,sn-1中选择sn的目标行为序列。最后,根据s1的目标行为序列,s2的目标行为序列,……,sn的目标行为序列对用户转化率预测模型进行训练。
应用本发明实施例方案,通过对用户的行为序列进行挖掘,从而能够体现出用户的潜在行为模式,并结合用户与其他用户行为的相似度选择目标行为序列来对用户转化率预测模型进行训练,获得的模型能够准确地预测出用户转化率,提高了用户转化率的预测准确率。
在一个实施例中,所述用户转化率预测模型包括根据第一用户样本的目标行为序列训练出的第一用户转化率预测模型,所述第一用户是注册时长参数大于预设时长阈值,且注册活跃度小于或等于预设活跃度阈值的用户样本;根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度的步骤包括:分别将各个第一用户样本的行为序列转换为向量,并分别计算每个第一用户样本的向量与各个其他第一用户样本的向量之间的相似度。
注册时长参数用于表征用户注册时间与当前时间之间的时间长度,可以通过注册时间(例如,注册天数、注册年数),或者其他与注册时间相关的参数来表示。注册活跃度可用于表征用户样本在注册之后存在行为事件的时间占注册时长的比例。活跃度阈值可以采用历史时间段内的用户平均注册时长,也可以根据实际应用采用其他参数作为活跃度阈值。
第一用户转化率预测模型可以用于对注册时长参数大于预设时长阈值,且注册活跃度小于或等于预设活跃度阈值的第一用户的用户转化率进行预测。
对于第一用户样本中的u1,可以获取其注册之后的全部行为序列,假设行为序列为{登录,点击广告1,点击广告2,阅读新闻1,阅读新闻2,点击商品1,查看评论,购买},行为序列中的每一种行为可以对应一个取值,因此,上述行为序列可以转换为向量(a,c1,c1,r,r,c2,v,b),a为登录行为对应的取值,c1为点击广告行为对应的取值,r为阅读新闻行为对应的取值,c2为点击商品行为对应的取值,v为查看评论行为对应的取值,b为购买行为对应的取值。对于其他第一用户样本,获取向量的方式与u1相同,此处不再赘述。
在一个实施例中,所述用户转化率预测模型包括根据第二用户样本的目标行为序列训练出的第二用户转化率预测模型,所述第二用户样本是注册时长参数大于预设时长阈值,且注册活跃度大于预设活跃度阈值的用户样本;根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度的步骤包括:分别将各个第二用户样本的行为序列转换为向量,并分别计算每个第二用户样本的向量与各个其他第二用户样本的向量之间的相似度;以及分别将各个第二用户样本的行为序列划分为多个子序列,将各个子序列分别转换为子向量,根据所述子向量生成数组,分别计算每个第二用户样本的数组与各个其他第二用户样本的数组之间的相似度。
第二用户转化率预测模型可以用于对注册时长参数大于预设时长阈值,且注册活跃度大于预设活跃度阈值的第二用户的用户转化率进行预测。
由于第二用户的注册时间和注册活跃度取值均较大,因此,第二用户对应的行为序列通常是一个非常长的序列。为了便于计算,可以将第二用户样本的行为序列划分为多个子序列。对于第二用户样本中的u2,假设其行为序列为{a1,a2,……,an},则将该行为序列划分为m个子序列:{a11,a12,……,a1n},{a21,a22,……,a2n},……,{am1,am2,……,amn},其中,1n+2n+……+mn=n。对于每个子序列,分别转换为子向量,转换方式与第一用户的转换方式相同,此处不再赘述。假设m个子序列对应的子向量分别是[x11,x12,……,x1n],[x21,x22,……,x2n],……,[xm1,xm2,……,xmn],则各个子向量构成的数组可以是如下形式:
除此之外,还可以将第二用户u2的行为序列{a1,a2,……,an}与其他各个第二用户的完整的行为序列分别计算相似度,计算方式与计算第一用户行为序列相似度的方式相同。
相似度可以采用余弦相似度的计算方式。对于第一用户,可以直接计算第一用户的向量两两之间的余弦相似度;对于第二用户的数组,可以将上述数组的每一列作为向量的一个元素,然后计算数组与数组之间的相似度。当然,子向量构成的数组也可以是上述数组的转置形式,则计算相似度时,可以将数组的每一行作为向量的一个元素,然后计算数组与数组之间的余弦相似度。对于第二用户的向量,也可以直接计算向量两两之间的余弦相似度。
在一个实施例中,可以根据所述用户样本的登录活跃度、行为活跃度和社交活跃度计算所述用户样本的注册活跃度;其中,所述登录活跃度用于表征登录频率,所述行为活跃度用于表征产生所述历史行为事件的频率,所述社交活跃度用于表征产生历史社交行为的频率。
注册时长是指用户注册时间距当前时间之间的时间间隔,可以以天为单位。登录活跃度可以通过登录次数与注册时长的比值计算,其中,用户每次登出后重新登录计算一次登录次数,即,只要用户不执行登出操作,登录次数不累计。行为活跃度可以通过行为事件发生的次数与注册时长的比值来计算,这里的行为次数包括用户发生的所有行为事件次数的总和,行为事件包括在应用程序中的点击链接、购买/收藏商品、发表/查看评论、转发信息等行为。对于用户间可以添加好友的应用程序,社交活跃度可以通过添加好友数量与登录时间的比值来计算。对于没有添加好友功能的应用程序,社交活跃度可以通过用户与其他用户的交互(例如,发私信)次数与登录时间的比值来计算,也可以通过用户发送的评论数与登录天数的比值来计算。其中,登录时间可以以天为单位。
具体地,所述注册活跃度根据如下公式计算:
式中,RA为所述注册活跃度,rd为注册时长,la为登录活跃度,ba为行为活跃度,sa为社交活跃度,N为项目上线时长。
上述公式中对活跃度取对数,可以将活跃度缩小到一个固定的范围,并且对数是在其定义域内是单调递增的,所以不会影响活跃度的关系。上述公式可以以用户的注册天数作为基准,以活跃度作为乘数因子(活跃因子),这个活跃因子考虑了用户的活跃度大小,利用对数缩小范围,再进一步加入产品本身的属性(例如,应用程序的上线时),每个用户对得到一个RA值。活跃度阈值可采用用户平均注册时长,所有RA值大于用户平均注册时长的为第二用户,小于或等于用户平均注册时长的为第一用户,这里“用户平均注册时长”的阈值,可以根据业务或运营部门要求灵活变动,一般取平均用户注册时长较好。
在一个实施例中,在计算出相似度之后,可以将与所述用户样本的行为序列的相似度最高的第一行为序列,以及与所述用户样本的行为序列的相似度最低的第二行为序列共同作为所述用户样本的目标行为序列。
对于第一用户,可以将与第一用户对应的向量相似度最高的向量对应的行为序列,以及与第一用户对应的向量相似度最低的向量对应的行为序列作为所述第一用户的目标行为序列。对于第二用户,可以将与第二用户对应的向量相似度最高的向量对应的行为序列,与第二用户对应的向量相似度最低的向量对应的行为序列,与第二用户对应的数组相似度最高的数组对应的行为序列,以及与第二用户对应的数组相似度最低的数组对应的行为序列作为所述第二用户的目标行为序列。
进一步地,所述用户转化率预测模型包括根据第三用户样本的目标特征序列训练出的第三用户转化率预测模型,所述第三用户样本是注册时长参数小于或等于预设时长阈值的用户样本;其中,所述目标特征序列根据如下方式获取:计算所述第三用户样本的特征序列与各个其他第三用户样本的特征序列之间的相似度;根据所述相似度从各个其他第三用户样本的特征序列中选择所述第三用户样本的目标特征序列。
特征序列可用于表征用户样本的用户特征,特征序列中可以包括从用户的个人信息中提取的特征,例如:年龄、性别、居住地、爱好、职业、邮箱等信息中的一者或多者。第三用户转化率预测模型可以用于对注册时长参数小于或等于预设时长阈值的第三用户的用户转化率进行预测。对于第三用户,由于其注册时间较短,可能不存在、或者只存在较短的行为序列,因此,可以通过第三用户的特征序列来训练第三用户转化率预测模型。
在一个实施例中,在计算出相似度之后,可以将与所述用户样本的特征序列的相似度最高的第一特征序列,以及与所述用户样本的特征序列的相似度最低的第二特征序列共同作为所述用户样本的目标特征序列。
在对用户转化率预测模型进行训练时,可以将行为序列或者特征序列作为用户转化率预测模型的输入,将用户标签作为用户转化率预测模型的输出,对用户转化率预测模型的参数进行求解。
一个实施例的用户转化率预测模型的训练方法的总体流程如图2所示,包括如下步骤:
步骤201:用户样本划分。根据用户样本的注册时间将用户样本划分为新注册用户样本和老用户样本,新用户样本即注册时长小于预设时长阈值的用户样本,老用户样本即注册时长大于或等于预设时长阈值的用户样本。再根据注册活跃度将老用户样本划分为短期用户样本和长期用户样本,短期用户样本即注册活跃度小于或等于预设活跃度阈值的老用户样本,长期用户样本即注册活跃度大于预设活跃度阈值的老用户样本。其中,注册活跃度可以根据登录活跃度、行为活跃度和社交活跃度来计算。具体的用户划分方式如图3(a)和图3(b)所示。
步骤202,计算相似度。对于新用户样本,计算该新用户样本与各个其他新用户样本的特征序列向量之间的相似度。对于短期用户样本,计算该短期用户样本的短行为序列向量与其他短期用户样本的短行为序列向量之间的相似度。对于长期用户样本,计算该长期用户样本的长行为序列向量与其他长期用户样本的长行为序列向量之间的相似度,以及该长期用户样本的行为序列数组与其他长期用户样本的行为序列数组之间的相似度。其中,特征序列向量是根据新用户样本的特征序列生成的向量,短行为序列向量是根据短期用户样本的行为序列生成的向量,长行为序列向量是根据长期用户样本的行为序列生成的向量,行为序列数组是根据长期用户样本在各个统计周期内的子行为序列生成的数组。计算相似度的方式如图4所示。
其中,一个统计周期可以是用户使用应用程序的周期。例如,以登录应用程序开始,退出应用程序结束,此期间作为一个统计周期。一个统计周期内产生的所有行为会作为同一个行为序列中的行为。通过这种划分统计周期的方式获得的行为序列较为宽松,内容涵盖较多。也可以以点击应用程序的首页开始,以付费结束,从点击首页到付费作为一个统计周期。通过这种划分统计周期的方式获得的行为序列较为严苛,可以剔除一些行为序列。在实际应用中,不同的运营场景下可以选择不同的方式来划分统计周期。划分出的各个统计周期的短行为序列还可以经过去重操作后再计算相似度。
步骤203:选择目标行为序列和目标特征序列。对于新用户样本,将与该新用户样本的特征序列向量相似度最大和最小的特征序列向量对应的特征序列作为该新用户样本的目标特征序列。对于短期用户样本,将与该短期用户样本的短行为序列向量相似度最大和最小的短行为序列向量对应的短行为序列作为该短期用户样本的目标行为序列。对于长期用户样本,将与该长期用户样本的长行为序列向量相似度最大和最小的长行为序列向量对应的长行为序列,以及与该长期用户样本的行为序列数组相似度最大和最小的行为序列数组对应的长行为序列,共同作为该长期用户样本的目标行为序列。
步骤204:根据目标行为序列或者目标特征序列对用户转化率预测模型进行训练。根据新用户样本的目标特征序列对第一用户转化率预测模型进行训练,根据短期用户样本的目标行为序列对第二用户转化率预测模型进行训练,根据长期用户样本的目标行为序列对第三用户转化率预测模型进行训练。其中,第一用户转化率预测模型用于预测新用户的用户转化率,第二用户转化率预测模型用于预测短期用户的用户转化率,第三用户转化率预测模型用于预测长期用户的用户转化率。
如图5所示,是本发明一个实施例的用户转化率预测方法流程图,所述方法包括:
根据预先训练的用户转化率预测模型对当前用户的用户转化率进行预测;其中,所述用户转化率预测模型根据任一实施例的用户转化率预测模型的训练方法进行训练。
在一个实施例中,对于新用户,可以将该新用户的用户特征输入第一用户转化率预测模型,得到该新用户的用户转化概率。对于短期用户,可以将该短期用户的短行为序列输入第二用户转化率预测模型,得到该短期用户的用户转化概率。对于长期用户,可以将该长期用户的长行为序列输入第三用户转化率预测模型,得到该长期用户的用户转化概率。用户转化概率可以表征当前用户对某一项目对象的转化概率。
因此,在一个实施例中,还可以根据所述用户转化率向所述当前用户推送消息,所述消息中携带目标对象的对象信息,所述目标对象是使当前用户的用户转化率最大的对象。通过这种方式,可以提高用户转化概率。
与上述用户转化率预测模型的训练方法的实施例相对应,本发明还提供了一种用户转化率预测模型的训练装置,如图6所示,所述装置可包括:
训练模块601,用于根据多个用户样本的目标行为序列对用户转化率预测模型进行训练;其中,任一用户样本的目标行为序列均根据如下方式获取:
第一计算模块602,用于在获取所述用户样本对项目对象的行为序列之后,根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度;
第一选择模块603,用于根据所述相似度从各个其他用户样本的行为序列中选择所述用户样本的目标行为序列。
与上述用户转化率预测方法的实施例相对应,本发明还提供了一种用户转化率预测装置,如图7所示,所述装置可包括:
预测模块701,用于根据预先训练的用户转化率预测模型对当前用户的用户转化率进行预测;所述当前用户转化率预测模型根据任一实施例的用户转化率预测模型的训练方法进行训练。
上述装置中各个单元的功能和作用的实现过程具体详见上述对应方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
在一个实施例中,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任意一实施例的方法。
在一个实施例中,本发明还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任意一实施例的方法。
如图8所示,图8是根据一示例性实施例示出的一种用于执行本发明实施例方法的计算机设备的结构示意图。参照图8,计算机设备800包括处理组件801,其进一步包括一个或多个处理器,以及由存储器802所代表的存储器资源,用于存储可由处理组件801的执行的指令,例如应用程序。存储器802中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件801被配置为执行指令,以执行上述方法。
计算机设备800还可以包括一个电源组件803被配置为执行计算机设备800的电源管理,一个有线或无线网络接口804被配置为将计算机设备800连接到网络,和一个输入输出(I/O)接口805。计算机设备800可以操作基于存储在存储器802的操作***。其中,当所述存储器802中的指令由所述处理组件801执行时,使得计算机设备800能够执行上述任一实施例的方法。
本说明书中描述的主题及功能操作的实施例可以在以下中实现:数字电子电路、有形体现的计算机软件或固件、包括本说明书中公开的结构及其结构性等同物的计算机硬件、或者它们中的一个或多个的组合。本说明书中描述的主题的实施例可以实现为一个或多个计算机程序,即编码在有形非暂时性程序载体上以被数据处理装置执行或控制数据处理装置的操作的计算机程序指令中的一个或多个模块。可替代地或附加地,程序指令可以被编码在人工生成的传播信号上,例如机器生成的电、光或电磁信号,该信号被生成以将信息编码并传输到合适的接收机装置以由数据处理装置执行。计算机存储介质可以是机器可读存储设备、机器可读存储基板、随机或串行存取存储器设备、或它们中的一个或多个的组合。
本说明书中描述的处理及逻辑流程可以由执行一个或多个计算机程序的一个或多个可编程计算机执行,以通过根据输入数据进行操作并生成输出来执行相应的功能。所述处理及逻辑流程还可以由专用逻辑电路—例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)来执行,并且装置也可以实现为专用逻辑电路。
适合用于执行计算机程序的计算机包括,例如通用和/或专用微处理器,或任何其他类型的中央处理单元。通常,中央处理单元将从只读存储器和/或随机存取存储器接收指令和数据。计算机的基本组件包括用于实施或执行指令的中央处理单元以及用于存储指令和数据的一个或多个存储器设备。通常,计算机还将包括用于存储数据的一个或多个大容量存储设备,例如磁盘、磁光盘或光盘等,或者计算机将可操作地与此大容量存储设备耦接以从其接收数据或向其传送数据,抑或两种情况兼而有之。然而,计算机不是必须具有这样的设备。此外,计算机可以嵌入在另一设备中,例如移动电话、个人数字助理(PDA)、移动音频或视频播放器、游戏操纵台、全球定位***(GPS)接收机、或例如通用串行总线(USB)闪存驱动器的便携式存储设备,仅举几例。
适合于存储计算机程序指令和数据的计算机可读介质包括所有形式的非易失性存储器、媒介和存储器设备,例如包括半导体存储器设备(例如EPROM、EEPROM和闪存设备)、磁盘(例如内部硬盘或可移动盘)、磁光盘以及CD ROM和DVD-ROM盘。处理器和存储器可由专用逻辑电路补充或并入专用逻辑电路中。
虽然本说明书包含许多具体实施细节,但是这些不应被解释为限制任何发明的范围或所要求保护的范围,而是主要用于描述特定发明的具体实施例的特征。本说明书内在多个实施例中描述的某些特征也可以在单个实施例中被组合实施。另一方面,在单个实施例中描述的各种特征也可以在多个实施例中分开实施或以任何合适的子组合来实施。此外,虽然特征可以如上所述在某些组合中起作用并且甚至最初如此要求保护,但是来自所要求保护的组合中的一个或多个特征在一些情况下可以从该组合中去除,并且所要求保护的组合可以指向子组合或子组合的变型。
类似地,虽然在附图中以特定顺序描绘了操作,但是这不应被理解为要求这些操作以所示的特定顺序执行或顺次执行、或者要求所有例示的操作被执行,以实现期望的结果。在某些情况下,多任务和并行处理可能是有利的。此外,上述实施例中的各种***模块和组件的分离不应被理解为在所有实施例中均需要这样的分离,并且应当理解,所描述的程序组件和***通常可以一起集成在单个软件产品中,或者封装成多个软件产品。
由此,主题的特定实施例已被描述。其他实施例在所附权利要求书的范围以内。在某些情况下,权利要求书中记载的动作可以以不同的顺序执行并且仍实现期望的结果。此外,附图中描绘的处理并非必需所示的特定顺序或顺次顺序,以实现期望的结果。在某些实现中,多任务和并行处理可能是有利的。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (14)
1.一种用户转化率预测模型的训练方法,其特征在于,所述方法包括:
根据多个用户样本的目标行为序列对用户转化率预测模型进行训练;其中,任一用户样本的目标行为序列均根据如下方式获取:
在获取所述用户样本对项目对象的行为序列之后,根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度;
根据所述相似度从各个其他用户样本的行为序列中选择所述用户样本的目标行为序列。
2.根据权利要求1所述的方法,其特征在于,所述用户转化率预测模型包括根据第一用户样本的目标行为序列训练出的第一用户转化率预测模型,所述第一用户是注册时长参数大于预设时长阈值,且注册活跃度小于或等于预设活跃度阈值的用户样本;
根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度的步骤包括:
分别将各个第一用户样本的行为序列转换为向量,并分别计算每个第一用户样本的向量与各个其他第一用户样本的向量之间的相似度。
3.根据权利要求1所述的方法,其特征在于,所述用户转化率预测模型包括根据第二用户样本的目标行为序列训练出的第二用户转化率预测模型,所述第二用户样本是注册时长参数大于预设时长阈值,且注册活跃度大于预设活跃度阈值的用户样本;
根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度的步骤包括:
分别将各个第二用户样本的行为序列转换为向量,并分别计算每个第二用户样本的向量与各个其他第二用户样本的向量之间的相似度;以及
分别将各个第二用户样本的行为序列划分为多个子序列,将各个子序列分别转换为子向量,根据所述子向量生成数组,分别计算每个第二用户样本的数组与各个其他第二用户样本的数组之间的相似度。
4.根据权利要求1所述的方法,其特征在于,所述用户转化率预测模型包括根据第三用户样本的目标特征序列训练出的第三用户转化率预测模型,所述第三用户样本是注册时长参数小于或等于预设时长阈值的用户样本;
其中,所述目标特征序列根据如下方式获取:
计算所述第三用户样本的特征序列与各个其他第三用户样本的特征序列之间的相似度;
根据所述相似度从各个其他第三用户样本的特征序列中选择所述第三用户样本的目标特征序列。
5.根据权利要求4所述的方法,其特征在于,所述目标特征序列包括第一特征序列和第二特征序列;
其中,所述第一特征序列是与所述用户样本的特征序列的相似度最高的特征序列;
所述第二特征序列是与所述用户样本的特征序列的相似度最低的特征序列。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述用户样本的登录活跃度、行为活跃度和社交活跃度计算所述用户样本的注册活跃度;
其中,所述登录活跃度用于表征登录频率,所述行为活跃度用于表征产生所述历史行为事件的频率,所述社交活跃度用于表征产生历史社交行为的频率。
7.根据权利要求6所述的方法,其特征在于,所述注册活跃度根据如下公式计算:
式中,RA为所述注册活跃度,rd为注册时长,la为登录活跃度,ba为行为活跃度,sa为社交活跃度,N为项目上线时长。
8.根据权利要求1所述的方法,其特征在于,所述用户样本的目标行为序列包括第一行为序列和第二行为序列;
其中,所述第一行为序列是与所述用户样本的行为序列的相似度最高的行为序列;
所述第二行为序列是与所述用户样本的行为序列的相似度最低的行为序列。
9.一种用户转化率预测方法,其特征在于,所述方法包括:
根据预先训练的用户转化率预测模型对当前用户的用户转化率进行预测;
所述用户转化率预测模型根据权利要求1至8任意一项所述的方法进行训练。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
根据所述用户转化率向所述当前用户推送消息,所述消息中携带目标对象的对象信息,所述目标对象是使当前用户的用户转化率最大的对象。
11.一种用户转化率预测模型的训练装置,其特征在于,所述装置包括:
训练模块,用于根据多个用户样本的目标行为序列对用户转化率预测模型进行训练;其中,任一用户样本的目标行为序列均根据如下方式获取:
第一计算模块,用于在获取所述用户样本对项目对象的行为序列之后,根据所述用户样本的注册活跃度分别计算所述用户样本的行为序列与各个其他用户样本的行为序列之间的相似度;
第一选择模块,用于根据所述相似度从各个其他用户样本的行为序列中选择所述用户样本的目标行为序列。
12.一种用户转化率预测装置,其特征在于,所述装置包括:
预测模块,用于根据预先训练的用户转化率预测模型对当前用户的用户转化率进行预测;
所述当前用户转化率预测模型根据权利要求1至8任意一项所述的方法进行训练。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至10任意一项所述方法的步骤。
14.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至10任意一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810775857.9A CN109063900A (zh) | 2018-07-16 | 2018-07-16 | 用户转化率预测模型的训练及用户转化率预测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810775857.9A CN109063900A (zh) | 2018-07-16 | 2018-07-16 | 用户转化率预测模型的训练及用户转化率预测方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109063900A true CN109063900A (zh) | 2018-12-21 |
Family
ID=64816774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810775857.9A Pending CN109063900A (zh) | 2018-07-16 | 2018-07-16 | 用户转化率预测模型的训练及用户转化率预测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109063900A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110740193A (zh) * | 2019-10-30 | 2020-01-31 | 江苏满运软件科技有限公司 | 一种平台活跃度的预测方法、装置、存储介质及电子设备 |
CN111724184A (zh) * | 2019-03-20 | 2020-09-29 | 北京嘀嘀无限科技发展有限公司 | 一种转化概率预测方法及装置 |
CN111767982A (zh) * | 2020-05-20 | 2020-10-13 | 北京大米科技有限公司 | 用户转换预测模型的训练方法、装置、存储介质以及电子设备 |
CN112116393A (zh) * | 2020-09-23 | 2020-12-22 | 贝壳技术有限公司 | 用于实现事件用户维护的方法、装置和设备 |
CN113395200A (zh) * | 2020-03-12 | 2021-09-14 | 阿里巴巴集团控股有限公司 | 消息推送方法和***、客户端、存储介质及处理器 |
CN114399355A (zh) * | 2021-12-22 | 2022-04-26 | 中国电信股份有限公司 | 基于用户转化率的信息推送方法、装置和电子设备 |
CN116883048A (zh) * | 2023-07-12 | 2023-10-13 | 广州朝辉智能科技有限公司 | 基于人工智能的客户数据处理方法、装置及计算机设备 |
CN117893256A (zh) * | 2024-03-14 | 2024-04-16 | 浙江卡赢信息科技有限公司 | 一种基于大数据的app用户智能管理*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100114663A1 (en) * | 2008-11-03 | 2010-05-06 | Oracle International Corporation | Hybrid prediction model for a sales prospector |
CN105446802A (zh) * | 2014-08-13 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 一种基于转化率的操作执行方法及装置 |
CN105631538A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 一种用户活跃度的预测方法、装置及其应用方法和*** |
CN107392645A (zh) * | 2017-06-20 | 2017-11-24 | 小草数语(北京)科技有限公司 | 用户挖掘方法、装置及其设备 |
CN107767152A (zh) * | 2016-08-16 | 2018-03-06 | 平安科技(深圳)有限公司 | 产品购买倾向分析方法及服务器 |
CN107944643A (zh) * | 2017-12-22 | 2018-04-20 | 上海斐讯数据通信技术有限公司 | 一种基于隐马尔科夫模型的购买转化率预测方法及*** |
-
2018
- 2018-07-16 CN CN201810775857.9A patent/CN109063900A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100114663A1 (en) * | 2008-11-03 | 2010-05-06 | Oracle International Corporation | Hybrid prediction model for a sales prospector |
CN105446802A (zh) * | 2014-08-13 | 2016-03-30 | 阿里巴巴集团控股有限公司 | 一种基于转化率的操作执行方法及装置 |
CN105631538A (zh) * | 2015-12-23 | 2016-06-01 | 北京奇虎科技有限公司 | 一种用户活跃度的预测方法、装置及其应用方法和*** |
CN107767152A (zh) * | 2016-08-16 | 2018-03-06 | 平安科技(深圳)有限公司 | 产品购买倾向分析方法及服务器 |
CN107392645A (zh) * | 2017-06-20 | 2017-11-24 | 小草数语(北京)科技有限公司 | 用户挖掘方法、装置及其设备 |
CN107944643A (zh) * | 2017-12-22 | 2018-04-20 | 上海斐讯数据通信技术有限公司 | 一种基于隐马尔科夫模型的购买转化率预测方法及*** |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111724184A (zh) * | 2019-03-20 | 2020-09-29 | 北京嘀嘀无限科技发展有限公司 | 一种转化概率预测方法及装置 |
CN110740193A (zh) * | 2019-10-30 | 2020-01-31 | 江苏满运软件科技有限公司 | 一种平台活跃度的预测方法、装置、存储介质及电子设备 |
CN113395200B (zh) * | 2020-03-12 | 2023-07-21 | 阿里巴巴集团控股有限公司 | 消息推送方法和***、客户端、存储介质及处理器 |
CN113395200A (zh) * | 2020-03-12 | 2021-09-14 | 阿里巴巴集团控股有限公司 | 消息推送方法和***、客户端、存储介质及处理器 |
CN111767982A (zh) * | 2020-05-20 | 2020-10-13 | 北京大米科技有限公司 | 用户转换预测模型的训练方法、装置、存储介质以及电子设备 |
CN112116393A (zh) * | 2020-09-23 | 2020-12-22 | 贝壳技术有限公司 | 用于实现事件用户维护的方法、装置和设备 |
CN112116393B (zh) * | 2020-09-23 | 2022-03-15 | 贝壳找房(北京)科技有限公司 | 用于实现事件用户维护的方法、装置和设备 |
CN114399355A (zh) * | 2021-12-22 | 2022-04-26 | 中国电信股份有限公司 | 基于用户转化率的信息推送方法、装置和电子设备 |
CN114399355B (zh) * | 2021-12-22 | 2023-10-10 | 中国电信股份有限公司 | 基于用户转化率的信息推送方法、装置和电子设备 |
CN116883048A (zh) * | 2023-07-12 | 2023-10-13 | 广州朝辉智能科技有限公司 | 基于人工智能的客户数据处理方法、装置及计算机设备 |
CN116883048B (zh) * | 2023-07-12 | 2024-03-15 | 卓盛科技(广州)有限公司 | 基于人工智能的客户数据处理方法、装置及计算机设备 |
CN117893256A (zh) * | 2024-03-14 | 2024-04-16 | 浙江卡赢信息科技有限公司 | 一种基于大数据的app用户智能管理*** |
CN117893256B (zh) * | 2024-03-14 | 2024-05-31 | 浙江卡赢信息科技有限公司 | 一种基于大数据的app用户智能管理*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109063900A (zh) | 用户转化率预测模型的训练及用户转化率预测方法和装置 | |
CN104090912B (zh) | 信息推送方法及装置 | |
CN108256907A (zh) | 一种客户分群模型的构建方法和计算设备 | |
Araújo et al. | Ensemble forecasting of species distributions | |
CN109657138A (zh) | 一种视频推荐方法、装置、电子设备及存储介质 | |
CN109067990A (zh) | 一种应用服务执行方法及装置 | |
CN108109011A (zh) | 一种广告反作弊方法及计算设备 | |
CN107729532A (zh) | 一种简历匹配方法及计算设备 | |
CN107704485A (zh) | 一种职位推荐方法及计算设备 | |
CN110351318A (zh) | 应用推荐的方法、终端和计算机存储介质 | |
CN109636479A (zh) | 一种广告推荐方法、装置、电子设备及存储介质 | |
CN112380449B (zh) | 信息推荐方法、模型训练方法及相关装置 | |
CN110910201B (zh) | 信息推荐的控制方法、装置、计算机设备及存储介质 | |
CN110246037A (zh) | 交易特征预测方法、装置、服务器及可读存储介质 | |
CN107093091A (zh) | 一种数据处理方法和装置 | |
CN106445954A (zh) | 一种业务对象的展示方法和装置 | |
Cheng et al. | Randomly weighted sums of dependent subexponential random variables with applications to risk theory | |
Jessen et al. | Prediction of outstanding payments in a Poisson cluster model | |
CN109117442A (zh) | 一种应用推荐方法及装置 | |
CN112288554A (zh) | 商品推荐方法和装置、存储介质及电子装置 | |
CN110166498A (zh) | 用户类别确定方法及装置、计算机设备及存储介质 | |
CN108667877B (zh) | 确定推荐信息的方法及装置、计算机设备及存储介质 | |
Nasrabadi et al. | A stepwise benchmarking approach to DEA with interval scale data | |
Stoklosa et al. | Heterogeneous capture–recapture models with covariates: A partial likelihood approach for closed populations | |
CN111340522A (zh) | 资源推荐方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181221 |