CN113743991A

CN113743991A - 生命周期价值预测方法及装置

Info

Publication number: CN113743991A
Application number: CN202111033382.4A
Authority: CN
Inventors: 曹煜
Original assignee: Shanghai Hode Information Technology Co Ltd
Current assignee: Shanghai Hode Information Technology Co Ltd
Priority date: 2021-09-03
Filing date: 2021-09-03
Publication date: 2021-12-03

Abstract

本申请提供生命周期价值预测方法及装置，其中所述生命周期价值预测方法包括：获取目标应用的标签信息、用户的历史生命周期价值和历史消费信息；将所述标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别；将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系；根据所述第一预测时间段的预测比例关系和所述历史生命周期价值，确定第一预测时间段的预测生命周期价值。极大地降低了预测模型的数据处理量，从而提高了预测生命周期价值的效率，进一步提高预测生命周期价值的精准度。

Description

生命周期价值预测方法及装置

技术领域

本申请涉及计算机技术领域，特别涉及一种生命周期价值预测方法。本申请同时涉及一种生命周期价值预测装置，一种计算设备，以及一种计算机可读存储介质。

背景技术

随着计算机技术的不断发展，各种各样的应用程序层出不穷。对于一款应用程序来说，为了最大化投入产出比，需要精准地预测用户生命周期价值。

现有技术中，通常基于曲线拟合来预测用户生命周期价值预测，其本质上是一种时间序列预测算法：通过拟合用户生命周期价值随时间的变化函数，进而预测用户生命周期价值。

然而上述方法利用历史用户生命周期价值的趋势，对未来用户生命周期价值的趋势进行预测，参考的因素单一，从而使拟合用户生命周期价值随时间的变化函数精准度低，导致对未来用户生命周期价值的预测偏差较大。因此，亟需一种有效的方案以解决上述问题。

发明内容

有鉴于此，本申请实施例提供了一种生命周期价值预测方法。本申请同时涉及一种生命周期价值预测装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的精准度低、偏差较大的技术缺陷。

根据本申请实施例的第一方面，提供了一种生命周期价值预测方法，包括：

获取目标应用的标签信息、用户的历史生命周期价值和历史消费信息；

将所述标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别；

将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系；

根据所述第一预测时间段的预测比例关系和所述历史生命周期价值，确定第一预测时间段的预测生命周期价值。

根据本申请实施例的第二方面，提供了一种生命周期价值预测装置，包括：

获取模块，被配置为获取目标应用的标签信息、用户的历史生命周期价值和历史消费信息；

分类模块，被配置为将所述标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别；

预测模块，被配置为将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系；

确定模块，被配置为根据所述第一预测时间段的预测比例关系和所述历史生命周期价值，确定第一预测时间段的预测生命周期价值。

根据本申请实施例的第三方面，提供了一种计算设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令，所述处理器执行所述计算机指令时实现所述生命周期价值预测方法的步骤。

根据本申请实施例的第四方面，提供了一种计算机可读存储介质，其存储有计算机指令，该计算机指令被处理器执行时实现所述生命周期价值预测方法的步骤。

本申请提供的生命周期价值预测方法，获取目标应用的标签信息、用户的历史生命周期价值和历史消费信息；将所述标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别；将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系；根据所述第一预测时间段的预测比例关系和所述历史生命周期价值，确定第一预测时间段的预测生命周期价值。通过对目标应用的标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别，极大地降低了预测模型的数据处理量，从而提高了预测生命周期价值的效率，进一步提高预测生命周期价值的精准度。通过将应用类别、标签信息、历史生命周期价值和历史消费信息作为预测因素，参考因素丰富，也可以提高预测生命周期价值的精准度。

附图说明

图1是本申请一实施例提供的一种生命周期价值预测方法的流程图；

图2A是本申请一实施例提供的一种生命周期价值预测方法的流程图；

图2B是本申请一实施例提供的另一种生命周期价值预测方法的流程图；

图3是本申请一实施例提供的一种应用于游戏的生命周期价值预测方法的处理流程图；

图4是本申请一实施例提供的一种生命周期价值预测装置的结构示意图；

图5是本申请一实施例提供的一种计算设备的结构框图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似推广，因此本申请不受下面公开的具体实施的限制。

在本申请一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请一个或多个实施例。在本申请一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本申请一个或多个实施例中使用的术语“和/或”是指包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请一个或多个实施例中可能采用术语第一、第二等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请一个或多个实施例范围的情况下，第一也可以被称为第二，类似地，第二也可以被称为第一。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

首先，对本申请一个或多个实施例涉及的名词术语进行解释。

自组织竞争型神经网络(SOM，Self-organizing Maps)，是一种无监督的人工神经网络。它运用竞争学习策略，依靠节点之间互相竞争逐步优化网络，且使用近邻关系函数来维持输入空间的拓扑结构。

梯度提升决策树(GBDT，Gradient Boosting Decision Tree)，是一种迭代的决策树算法，该算法由多棵决策树组成，所有树的结论累加起来做最终答案。

极度梯度提升(Xgboost，eXtreme Gradient Boosting)，是一种基于梯度提升决策树的算法，该算法使损失函数更精准，可以正则项避免树过拟合，具有高效、灵活和轻便的特点，在数据挖掘、推荐***等领域得到广泛的应用。

存留率，是用于反映网站、互联网应用或网络游戏的运营情况的统计指标，其具体含义为在统计周期(周/月)内，每日活跃用户数在第N日仍启动该应用程序的用户数占比的平均值。其中N通常取2、4、8、15、31，分别对应次日留存率、三日留存率、周留存率、半月留存率和月留存率。

生命周期(LT，Life Time)，指从获取某个用户到流失该用户的时间长度。

生命周期价值(LTV，Life Time Value)，意为用户终生价值，是指从用户所有的互动中所得到的全部经济收益的总和，也即在用户全生命周期内的所有经济收益。

每用户平均消费(ARPU，Average Revenue Per User)，指一段时间内，平均每个用户的消费值，如日均每用户平均消费。

每消费用户平均消费(ARPPU，Average Revenue Per Paying User)，指一段时间内，平均每个消费用户的消费值，如日均每消费用户平均消费。

在本申请中，提供了一种生命周期价值预测方法，本申请同时涉及一种生命周期价值预测装置，一种计算设备，以及一种计算机可读存储介质，在下面的实施例中逐一进行详细说明。

图1示出了根据本申请一实施例提供的一种生命周期价值预测方法的流程图，具体包括以下步骤：

步骤102：获取目标应用的标签信息、用户的历史生命周期价值和历史消费信息。

具体的，目标应用可以是一种应用程序，如游戏应用程序、视频应用程序、购物应用程序等，还可以是一种网页网站，如新闻资讯网站、文档浏览网站等；标签信息可以是人工标签，还可以是源于网络用户的评定；历史生命周期价值是指目标应用上线后，一段时间内的生命周期价值，如上线7天内的生命周期价值；历史消费信息是指用户在目标应用上进行消费的信息，包括每用户平均消费、每消费用户平均消费和存留率中至少一个。

实际应用中，通常采用基于曲线拟合的生命周期价值预测算法，获取目标应用的预测生命周期价值，但该方法仅使用了历史生命周期价值，没有考虑历史消费信息对预测生命周期价值的影响，导致预测生命周期价值不精准。为了在获取目标应用的预测生命周期价值，并提高预测生命周期价值的精准度，可以获取待预测应用，也即目标应用的标签信息、该目标应用的用户的历史生命周期价值和该目标应用的用户的历史消费信息，其中，历史消费信息包括每用户平均消费、每消费用户平均消费和存留率中的一个或多个。

例如，目标应用为购物应用，则可以获取该购物应用的标签信息、用户的历史生命周期价值、用户的存留率、每用户平均消费和每消费用户平均消费。

本申请中，通过获取目标应用的标签信息、用户的历史生命周期价值和历史消费信息，为后续获取预测生命周期价值奠定了基础，有利于提高预测生命周期价值精准度。

步骤104：将所述标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别。

在获取到标签信息、历史生命周期价值和历史消费信息的基础上，进一步地，通过预先训练的分类模型对标签信息进行处理，得到目标应用的应用类别。

具体的，分类模型是指将目标应用的标签信息作为输入，输出目标应用对应的应用类别，也即根据标签信息，将目标应用映射到预先定义好的应用类别中，如SOM模型、随机森林模型等；应用类别是指目标应用的类型，如对于某款游戏应用，应用类别可以是动漫游戏、回合制游戏、卡牌游戏等中的一种。

实际应用中，由于标签信息可以是人工标签，还可以是源于网络用户的评定，从而导致标签信息错综复杂，因而如果不对标签信息进行处理，会极大地增加预测模型的数据处理量，从而降低预测生命周期价值的效率，也会降低预测生命周期价值的精准度。因而，需要将标签信息输入至分类模型中进行处理，进而得到标签信息对应的应用类别，也即目标应用的应用类别。

沿用上例，购物应用的标签信息为“次日达”、“折扣大”、“一站式”，则将“次日达”、“折扣大”、“一站式”输入至分类模型中，得到该购物应用的应用类别“超市型购物”。

在本实施例的一个或多个实施方式中，分类模型可以包括输入层和输出层两大部分，此时，可以将标签信息输入至分类模型的输入层，有输出层输出目标应用的应用类别。也即在分类模型包括输入层和输出层的情况下，将所述标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别的具体实现过程可以为：

将所述标签信息输入至所述输入层中，通过所述输入层将所述标签信息发送至所述输出层，得到所述输出层中每个输出节点的输出值；

根据所述输出层中每个输出节点的输出值，确定所述输出层中的胜利节点，并输出所述胜利节点表征的应用类别。

实际应用中，可以将标签信息输入至分类模型的输入层中，输入层与输出层相连，由输入层在将标签信息传输至输出层。输出层中多个输出节点，每个输出节点都会根据标签信息进行处理，得到一个输出值。根据预设规则，将各输出节点的输出值进行比较，进而根据比较结果确定各输出节点中的胜利节点。最后输出胜利节点表征的应用类别。如此，可以提高标签信息的处理速度，并提高输出的应用类别与目标应用的关联系。

例如，标签信息为“语义”、“谈吐”、“优雅”和“倾听”，将“语义”、“谈吐”、“优雅”和“倾听”输入至输入层，并由输入层将“语义”、“谈吐”、“优雅”和“倾听”发送至输出层。输出层有5个输出节点，这5个输出节点均对“语义”、“谈吐”、“优雅”和“倾听”进行处理，得到这5个输出节点的输出值。然后根据得到的5个输出值，进而确定5个输出节点中的胜利节点，最后输出胜利节点表征的应用类别。

由于目标应用的标签信息可以是人工标签，还可以是网络用户的评定，说明标签信息是由多个标签，也即子标签信息组成的。因此在将标签信息输入分类模型的输入层时，需要将各子标签信息分别输入至输入层的输入节点中，然后输入节点将子标签信息发送给输出节点，得到输出值。也即在标签信息包括多个子标签信息的情况下，将所述标签信息输入至所述输入层中，通过所述输入层将所述标签信息发送至所述输出层，得到所述输出层中每个输出节点的输出值的具体实现过程可以如下：

将所述多个子标签信息分别输入至所述输入层中的各输入节点中，任意两个子标签信息输入的输入节点不同；

通过所述输入节点将各子标签信息发送至所述输出层的各输出节点中，每个输入节点分别与各输出节点相连；

针对各输出节点，根据该输出节点的各子标签信息权重和各子标签信息，确定该输出节点的输出值。

具体的，子标签信息是指标签信息中的子单元，如标签信息为“语义”、“谈吐”、“优雅”和“倾听”，则“语义”、“谈吐”、“优雅”、“倾听”分别为四个子标签信息；子标签信息权重是指某个子标签对应的权重值。

实际应用中，需要将标签信息中的每个子标签信息分别输入至不同的输入节点中，也即将N个子标签信息一一对应地输入至N个输入节点中，其中N为正整数。此外，每个输入节点都同所有的输出节点相连接，因此通过输入节点将各子标签信息发送至输出节点时，每个输出节点均接收到所有的子标签信息。每个输出节点都配置有权重网络，每个输出节点都配置有针对各个子标签信息的权重，即各子标签信息权重。进一步地，各输出节点根据接收的多个子标签信息和各子标签信息权重，确定第一输出节点的输出值。

例如，标签信息包括5个子标签信息：BQ1、BQ2、BQ3、BQ4和BQ5，则将5个子标签信息分别输入至输入层的5个输入节点中：将BQ1输入至输入节点SR1、将BQ2输入至输入节点SR2、将BQ3输入至输入节点SR3、将BQ4输入至输入节点SR4和将BQ5输入至输入节点SR5。假设输出层有3个输出节点：SC1、SC2和SC3，则输入节点SR1至SR5将各子标签信息发送输出节点SC1、输入节点SR1至SR5将各子标签信息发送输出节点SC2以及输入节点SR1至SR5将各子标签信息发送输出节点SC3。此外，输出节点SC1配置有分别针对BQ1至BQ5的子标签信息权重：Q11、Q12、Q13、Q14和Q15；，输出节点SC2配置有分别针对BQ1至BQ5的子标签信息权重：Q21、Q22、Q23、Q24和Q25；输出节点SC3配置有分别针对BQ1至BQ5的子标签信息权重：Q31、Q32、Q33、Q34和Q35。然后根据BQ1与Q11、BQ2与Q12、BQ3与Q13、BQ4与Q14以及BQ5与Q15，确定输出节点SC1的输出值；根据BQ1与Q21、BQ2与Q22、BQ3与Q23、BQ4与Q24以及BQ5与Q25，确定输出节点SC2的输出值；根据BQ1与Q31、BQ2与Q32、BQ3与Q33、BQ4与Q34以及BQ5与Q35，确定输出节点SC3的输出值。

需要说明的是，可以将每个子标签信息均转化为一个对应的子标签数值，如第一个子标签信息对应的子标签数值为1、第二子标签信息对应的子标签数值为8，然后根据各子标签信息权重，计算各子标签数值的权重和，得到输出节点的输出值。

沿用上例，子标签信息BQ1、BQ2、BQ3、BQ4和BQ5对应的子标签数值分别为1、2、3、4、5；输出节点SC1配置的针对BQ1、BQ2、BQ3、BQ4和BQ5的子标签权重分别为0.2、0.5、1、2.5、0.1，则输出节点SC1的输出值为1*0.2+2*0.5+3*1+4*2.5+5*0.1＝14.7。

在获得了各输出节点的输出值之后，进一步地，可以将各输出值，按照预设规则进行比较，进而确定获胜节点，确定目标应用对应的应用类别。也即输出层中每个输出节点的输出值，在所述输出层中确定胜利节点，并输出所述胜利节点表征的应用类别的具体实现过程可以为：

比较所述输出层中每个输出节点的输出值，将输出值最高的输出节点确定为胜利节点，并输出所述胜利节点表征的应用类别。

实际应用中，可以将输出值的大小进行比较，其中输出值越大，代表该输出节点表征的应用类别与目标应用越相似、越匹配。因此，将输出值最大的输出节点确定为胜利节点，并输出胜利节点表征的应用类别。

例如，有3个输出值：3、2、9，则将输出值9对应的输出节点确定为胜利节点，并输出胜利节点表征的应用类别。

以分类模型为SOM模型进行说明：SOM模型输出层中的每个输出节点均表征一个应用类型，例如当目标应用为游戏时，输出节点表征的应用类型可是只动漫游戏、回合制游戏、卡牌游戏等中的一个。胜利节点神经元的输出值即代表这个游戏的应用类型，例如：输出是5，可能表示该游戏是动漫游戏；输出是11，可能表示该游戏是卡牌游戏；输出是23，可能表示该款游戏是回合制。SOM模型会选择一个最能象征这款游戏的应用类型作为输出。

为了使分类模型有一个良好的分类效果，也即为了提高分类模型输出的应用类别的可靠性，需要预先训练分类模型。因此，在将所述标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别之前，还包括：

获取多个样本应用的样本标签信息；

将所述多个样本应用的样本标签信息输入至初始分类模型中进行迭代训练；

当达到第一预设停止条件时，停止训练，得到训练好的分类模型。

具体的，第一预设停止条件是指预先设置的表征分类模型已经训练合格的条件，可以是初始分类模型的损失值小于目标值，可以是初始分类模型的损失值停止下降，还可以是迭代次数达到目标迭代次数。

实际应用中，需要获取大量的训练样本对初始分类模型进行训练，也即获取多个样本应用的样本标签信息，然后将各个样本应用的样本标签信息输入至初始分类模型中进行迭代训练，根据每次训练的结果对初始分类模型的参数进行不断地调整。当达到第一预设停止条件时，训练完成，得到训练好的分类模型。

以初始分类模型为初始SOM模型为例进行说明，初始SOM模型的参数有权值和邻域两个，且初始SOM模型已经为权值参数赋予了一个较小的随机初始值、为领域参数赋予了一个较大的初始领域。SOM模型的第一预设停止条件为迭代次数达到目标迭代次数，设置目标迭代次数为T，T为正整数。然后将各样本应用的样本标签信息中的一个样本标签信息Xk输入到初始SOM模型中，SOM模型确定Xk和所有的输出节点的距离，并选择距离最小的输出节点为胜利节点。接着更新审理节点及其领域节点的权值；选取另样本标签信息输入至更新后的初始SOM模型，继续执行上述过程，直到所有的样本标签信息全部提供给初始SOM模型进行训练，至此完成一次迭代训练，即迭代次数为1。继续训练，直至迭代次数为T，得到训练好的SOM模型。

优选地，分类模型为SOM模型，由于SOM模型具有概率保持性特性，可以保证分类模型在给不同应用分类时是统一的，即目标应用是按照统一规则进行分类，得到应用类别。此外，使用SOM模型避免了应用类别的特征高度重叠时导致的预测欠拟合风险，其独有的竞争型网络可以保证分类是高度精准的、垂直化的、高度细分的。

步骤106：将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系。

在将标签信息输入至预先训练的分类模型中，得到目标应用的应用类别的基础上，进一步地，基于预先训练的预测模型，根据应用类别、标签信息、历史生命周期价值和历史消费信息，获取第一预测时间段的预测比例关系。

具体的，预测模型是指用于预测的、用数学语言或公式所描述的事物间的数量关系，例如Xgboost模型；第一预测时间段是指基于相对于历史生命周期价值的时间段，例如历史生命周期价值为7天的历史生命周期价值，根据本申请提供的方法，可以得到未来30天的生命周期价值，则未来30天则为第一预测时间段；预测比例关系是指表征预测生命周期价值与历史生命周期价值比例关系的公式或者数值等，例如预测生命周期价值与历史生命周期价值的比值。

实际应用中，在预测模型以训练完成的基础上，以目标应用的应用类别、标签信息、历史生命周期价值和历史消费信息作为预测模型的输入，进而得到第一预测时间段的预测比例关系。如此，获基于预测模型获取第一预测时间段的预测比例关系，而不是直接获取第一预测时间段的预测生命周期价值，可以减小不同目标应用的历史生命周期价值的绝对差值对预测效果的影响。

需要说明的是，预测模型可以包括决策层和抽样层两个部分，此时，可以将应用类别、标签信息、历史生命周期价值和历史消费信息输入至预测模型的决策层，由抽样层输出第一预测时间段的预测比例关系。也即在预测模型包括决策层和抽样层的情况下，将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系的具体实现过程可以如下：

将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至所述决策层，得到多个初始决策得分；

将所述多个初始决策得分输入至所述抽样层进行抽样处理，得到多个目标决策得分；

根据所述多个目标决策得分，计算所述第一预测时间段的预测比例关系。

具体的，决策层是指预测模型中的决策树，用于在已知各种情况发生概率的基础上，通过构成决策树来求取净现值的期望值大于等于零的概率，评价项目风险，判断其可行性的决策分析方法，例如梯度提升决策树；抽样层是指预测模型中对初始决策得分进行抽样处理的部分，如随机森林模型；初始决策得分是指经过决策层处理后得到的初步的决策得分；目标决策得分是指在多个初始决策得分进行抽样之后得到的决策得分。

实际应用中，可以将应用类别、标签信息、历史生命周期价值和历史消费信息输入至预测模型的决策层中。决策层由多个输出端，每一个输出端可以输出一个初始决策得分，因此，决策层对应用类别、标签信息、历史生命周期价值和历史消费信息输入进行处理后，将得到多个初始决策得分。然后抽样层对多个初始决策得分进行抽样处理，抽出来的至少两个初始决策得分，即为目标决策得分。进一步地，可以根据目标决策得分进行计算，得到第一预测时间段的预测比例关系。如此，可以提高确定第一预测时间段的预测比例关系的处理速度，并提高第一预测时间段的预测比例关系的准确度。

例如，决策层有五个输出端，将应用类别、标签信息、历史生命周期价值和历史消费信息输入至决策层，决策层的五个输出端分别输出一个初始决策得分，即得到5个初始决策得分。然后由抽样层对5个初始决策得分进行抽样处理，抽出2个初始决策得分，即得到2个目标决策得分。然后将2个目标决策得分按照预设计算规则进行计算，得到第一预测时间段的预测比例关系。

本申请中，通过将所述多个初始决策得分输入至所述抽样层进行抽样处理，得到多个目标决策得分，可降低过拟合风险，避免出现对于新上线的目标应用预测效果不佳的情况。

为了进一步提高第一预测时间段的预测比例关系的可靠性和精准度，可以在决策层设置多个并联的子决策层，每个子决策层之间的决策策略不同，也即个子决策层之间互不相同。此时，在决策层包括多个并联的子决策层的情况下，将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至所述决策层，得到多个初始决策得分的具体实现过可以如下：

将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至各子决策层，通过所述各子决策层的多个决策输出节点，得到多个初始决策得分，其中，所述多个初始决策得分由各子决策层输出的决策得分组成。

实际应用中，决策层包括至少两个子决策层，每一个子决策层都将接收到应用类别、标签信息、历史生命周期价值和历史消费信息。然后每个子决策层根据各自的决策策略对应用类别、标签信息、历史生命周期价值和历史消费信息进行处理，在由各自的决策输出节点输出决策得分。由于每个子决策层都有至少两个决策输出节点，因此经过每个子决策层都可以得到多个决策得分。各个子决策层输出的初始决策得分组成了多个初始决策得分。

例如，有两个决策层包括两个子决策层：JC1和JC2，其中子决策层JC1有两个决策输出节点、子决策层JC2有三个决策输出节点。将应用类别、标签信息、历史生命周期价值和历史消费信息输入至子决策层JC1后，将由子决策层JC1有两个决策输出节点分别输出一个决策得分，即得到两个决策得分；将应用类别、标签信息、历史生命周期价值和历史消费信息输入至子决策层JC2后，将由子决策层JC2有三个决策输出节点分别输出一个决策得分，即得到三个决策得分，如此一共得到5个初始决策得分。

在得到将多个初始决策得分进行抽样处理得到多个目标决策得分后，为了提高第一预测时间段的预测比例关系的精确度，需要对多个目标决策得分进行逻辑回归处理，也即根据所述多个目标决策得分，计算所述第一预测时间段的预测比例关系的具体实现过程可以如下：

分别确定所述多个目标决策得分中各个目标决策得分对应的决策输出节点；

分别计算所述各个目标决策得分与对应的决策输出节点携带的权重的乘积；

将各乘积相加，得到所述第一预测时间段的预测比例关系。

实际应用中，第一预测时间段的预测比例关系，即为所有目标决策得分的加权和，因此在确定了多个目标决策得分的基础上，进一步地，需要确定每个目标决策得分的权重：首先确定各个目标决策得分对应的决策输出节点，然后获取各决策输出节点携带有权重，该权重即为目标决策得分的权重。接着计算每个目标决策得分与其对应的权重的乘积，也即每个目标决策得分与其对应的决策输出节点携带的权重的乘积，然后将这些乘积相加，即得到第一预测时间段的预测比例关系。

例如，获取到3个目标决策得分：DF1、DF2和DF3，然后分别确定目标决策得分DF1、DF2和DF3对应的决策输出节点，其中标决策得分DF1对应决策输出节点1、标决策得分DF2对应决策输出节点2、标决策得分DF3对应决策输出节点3。接着确定决策输出节点1、决策输出节点2和决策输出节点3的权重，依次为0.3、0.4、0.2。假设DF1、DF2和DF3的值分别为2、4、6，则第一预测时间段的预测比例关系为2*0.3+4*0.4+6*0.2＝3.4。

为了使预测模型有一个良好的预测效果，也即为了提高第一预测时间段的预测比例关系可靠性，需要预先训练预测模型。因此，将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系之前，还包括：

获取训练样本，所述训练样本包括样本类别、样本标签信息、样本历史生命周期价值和样本历史消费信息；

将所述训练样本输入至初始预测模型中，得到初始预测比例关系；

基于预设损失函数，计算所述初始预测比例关系的损失值；

根据所述损失值调整所述初始预测模型的参数，继续执行所述将所述训练样本输入至初始预测模型中，得到初始预测比例关系的步骤；

当达到第二预设停止条件时，停止训练，得到训练好的预测模型。

具体的，预设损失函数是预先设置的用于计算初始预测模型的损失值的函数，如交叉熵损失函数、L1范数损失函数、最大损失函数、均方误差损失函数、对数损失函数等；损失值是用来评估初始预测模型的初始预测比例关系与理想值的差别；第二预设停止条件是指预先设置的表征预测模型已经训练合格的条件，可以是初始预测模型的损失值小于目标值，可以是初始预测模型的损失值停止下降，还可以是迭代次数达到目标迭代次数。

实际应用中，对初始预测模型进行训练时，先获取针对样本应用的样本类别、样本标签信息、样本历史生命周期价值和样本历史消费信息，也即获取训练样本。然后将样本类别、样本标签信息、样本历史生命周期价值和样本历史消费信息输入至初始预测模型中，得到初始预测比例关系。进一步地，根据预设损失函数计算初始预测比例关系的损失值，进而根据损失值对初始预测模型的参数进行不断地调整。当达到第二预设停止条件时，训练完成，得到训练好的预测模型。

以初始预测模型为初始Xgboost模型为例进行说明，初始Xgboost模型的第二预设停止条件为损失值小于目标值，设置目标值为1。先获取某样本应用的样本类别、样本标签信息、样本历史生命周期价值和样本历史消费信息，即训练样本，然后将训练样本输入到初始Xgboost模型中，初始Xgboost模型输出的初始预测比例关系为GX1，根据预设损失函数计算GX1的损失值为3，由于损失值3大于目标值1，则根据损失值3调整初始Xgboost模型的参数。接着将样本类别、样本标签信息、样本历史生命周期价值和样本历史消费信息输入调整参数后的初始Xgboost模型，得到初始预测比例关系GX2，根据预设损失函数计算GX2的损失值为0.5，由于损失值0.5大于目标值1，停止训练，此时的初始Xgboost模型即为训练好的Xgboost模型。

步骤108：根据所述第一预测时间段的预测比例关系和所述历史生命周期价值，确定第一预测时间段的预测生命周期价值。

在基于预先训练的预测模型，根据应用类别、标签信息、历史生命周期价值和历史消费信息，获取第一预测时间段的预测比例关系的基础上，进一步地，根据第一预测时间段的预测比例关系和历史生命周期价值，计算第一预测时间段的预测生命周期价值。

具体的，预测生命周期价值是指目标应用上线后，预测的未来一段时间内的生命周期价值，如从当前之后的30天内的生命周期价值；

实际应用中，由于第一预测时间段的预测比例关系表征第一预测时间段的预测生命周期价值与历史生命周期价值比例关系的公式或者数值，可以根据历史生命周期价值和第一预测时间段的预测比例关系，反向推导出一时间段的预测生命周期价值。

例如，第一预测时间段的预测比例关系为：第一预测时间段的预测生命周期价值与历史生命周期价值的比值加五等于八，则第一预测时间段的预测生命周期价值等于八与五的差值乘上历史生命周期价值，假设历史生命周期价值为10，则第一预测时间段的预测生命周期价值为(8-5)*10＝30。

优选地，预测比例关系为预测生命周期价值与历史生命周期价值的比值，则第一预测时间段的预测比例关系为第一预测时间段的预测生命周期价值与历史生命周期价值的比值。此时，计算所述第一预测时间段的预测比例关系与所述历史生命周期价值的乘积，得到第一预测时间段的预测生命周期价值。

此外，对于新上线的目标应用来说，其拥有的历史生命周期价值仅仅是短期的例如七天的，使用传统的曲线拟合的用户生命周期价值预测算法，基于其对历史时间序列长度的要求，限制了其应用场景只能上线中期的目标应用，不能符合实际市场业务应用的需求。本申请中为了避免上述问题，设置中短期预测生命周期价值的反馈级联，也即可以用短期的历史生命周期价值，得到中短期的预测生命周期价值，然后将中短期的预测生命周期价值作为历史生命周期价值，进而预测出长期的预测生命周期价值。也即确定第一预测时间段的预测生命周期价值之后，还包括：

将所述第一预测时间段的预测生命周期价值增至所述历史生命周期价值中，得到更新后的所述历史生命周期价值；

将所述应用类别、所述标签信息、更新后的所述历史生命周期价值和所述历史消费信息输入至所述预测模型中，得到第二预测时间段的预测比例关系；

根据所述第二预测时间段的预测比例关系和更新后的所述历史生命周期价值，确定第二预测时间段的预测生命周期价值。

具体的，第二预测时间段大于第一预测时间段，或者第二预测时间段长于第一预测时间段。

实际应用中，在得到较短的第一预测时间段的预测生命周期价值后，可以将第一预测时间段的预测生命周期价值作为反馈，更新历史生命周期价值，也即将第一预测时间段的预测生命周期价值作为新的历史生命周期价值；然后将应用类别、标签信息、第一预测时间段的预测生命周期价值和历史消费信息入至预测模型中，得到第二预测时间段的预测比例关系，进而根据第二预测时间段的预测比例关系和第一预测时间段的预测生命周期价值，计算出比第一预测时间段更长的第二预测时间段的预测生命周期价值。

例如，第一预测时间段为30天，第二预测时间段为180天。则第一预测时间段的预测生命周期价值为30天的预测生命周期价值，使用30天的预测生命周期价值替代历史生命周期价值，然后将应用类别、标签信息、30天的预测生命周期价值和历史消费信息入至预测模型中，得到180天的预测比例关系，然后根据180天的预测比例关系和30天的预测生命周期价值，得到180天的预测生命周期价值。

需要说明的是，还可以参照此方法，确定第三时间段的预测生命周期价值、第四时间段的预测生命周期价值等等，也即预测第M时间段的预测生命周期价值，其中第M时间段大于第M-1时间段，M为大于2的正整数。

图2A示出了本申请一实施例提供的一种生命周期价值预测方法的流程图。如图2A所示，在确定预测生命周期价值时，可以先将标签信息输入至分类模型中，进而得到应用类别；然后将标签信息、应用类别、历史消费信息和历史生命周期价值输入值预测模型中，从而得到对应的预测比例关系，进而根据预测比例关系计算出对应的预测生命周期价值。当得到预测生命周期价值在时间长度上不符合要求时，可以将预测生命周期价值作为新的历史消费信息，也即更新历史消费信息，继续执行上述过程，如此往复，以得到符合预期时间长度的预测生命周期价值。

图2B是本申请一实施例提供的另一种生命周期价值预测方法的流程图。如图2B所示，使用SOM模型作为分类模型、使用Xgboost模型作为预测模型。将标签信息输入至SOM模型的输入层，然后由输入层将标签信息转发至输出层。输出层对标签信息进行处理后，得到胜利节点，胜利节点输出应用类别。然后将应用类别、标签信息、历史消费信息、历史生命周期价值输入至Xgboost模型中，Xgboost模型的决策层为梯度提升决策树，且梯度提升决策树分为树1和树2，Xgboost模型的抽样层为随机森林。将应用类别、标签信息、历史消费信息、历史生命周期价值输入至Xgboost模型，即为将应用类别、标签信息、历史消费信息、历史生命周期价值输入至树1和树2，经树1和树2分别处理后，得到多个初始决策得分，然后由随机森林进行抽样处理和逻辑回归，得到对应的预测关系比例，进而根据预测比例关系计算出对应的预测生命周期价值。此外，当得到预测生命周期价值在时间长度上不符合要求时，可以将预测生命周期价值作为新的历史消费信息，也即更新历史消费信息，继续执行上述过程，如此往复，以得到符合预期时间长度的预测生命周期价值。

下述结合附图3，以本申请提供的生命周期价值预测方法在游戏中的应用为例，对所述生命周期价值预测方法进行进一步说明。其中，图3示出了本申请一实施例提供的一种应用于游戏的生命周期价值预测方法的处理流程图，具体包括以下步骤：

步骤302：获取多个样本游戏的样本标签信息。

步骤304：将多个样本游戏的样本标签信息输入至初始分类模型中进行迭代训练。

步骤306：当达到第一预设停止条件时，停止训练，得到训练好的分类模型。

步骤308：获取游戏训练样本。

游戏训练样本包括样本类别、样本标签信息、样本历史生命周期价值和样本历史消费信息。

步骤310：将训练样本输入至初始预测模型中，得到初始预测比例关系。

步骤312：基于预设损失函数，计算初始预测比例关系的损失值。

步骤314：根据损失值调整初始预测模型的参数，继续执行将训练样本输入至初始预测模型中，得到初始预测比例关系的步骤。

步骤316：当达到第二预设停止条件时停止训练，得到训练好的预测模型。

步骤318：获取目标游戏的标签信息、用户的历史生命周期价值和历史消费信息。

步骤320：将标签信息输入至训练好的分类模型中，得到目标游戏的应用类别。

其中，分类模型包括输入层和输出层。

可选地，将标签信息输入至预先训练的分类模型中，得到目标游戏的应用类别，包括：

将标签信息输入至输入层中，通过输入层将标签信息发送至输出层，得到输出层中每个输出节点的输出值；

根据输出层中每个输出节点的输出值，确定输出层中的胜利节点，并输出胜利节点表征的应用类别。

可选地，标签信息包括多个子标签信息；将标签信息输入至输入层中，通过输入层将标签信息发送至输出层，得到输出层中每个输出节点的输出值，包括：

将多个子标签信息分别输入至输入层中的各输入节点中，任意两个子标签信息输入的输入节点不同；

通过输入节点将各子标签信息发送至输出层的各输出节点中，每个输入节点分别与各输出节点相连；

可选地，根据输出层中每个输出节点的输出值，在输出层中确定胜利节点，并输出胜利节点表征的应用类别，包括：

比较输出层中每个输出节点的输出值，将输出值最高的输出节点确定为胜利节点，并输出胜利节点表征的应用类别。

步骤322：将应用类别、标签信息、历史生命周期价值和历史消费信息输入至训练好的预测模型中，得到第一预测时间段的预测比例关系。

可选地，预测模型包括决策层和抽样层；

将应用类别、标签信息、历史生命周期价值和历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系，包括：

将应用类别、标签信息、历史生命周期价值和历史消费信息输入至决策层，得到多个初始决策得分；

将多个初始决策得分输入至抽样层进行抽样处理，得到多个目标决策得分；

根据多个目标决策得分，计算第一预测时间段的预测比例关系。

可选地，决策层包括多个并联的子决策层；

将应用类别、标签信息、历史生命周期价值和历史消费信息输入至决策层，得到多个初始决策得分，包括：

将应用类别、标签信息、历史生命周期价值和历史消费信息输入至各子决策层，通过各子决策层的多个决策输出节点，得到多个初始决策得分，其中，多个初始决策得分由各子决策层输出的决策得分组成。

可选地，根据多个目标决策得分，计算第一预测时间段的预测比例关系，包括：

分别确定多个目标决策得分中各个目标决策得分对应的决策输出节点；

分别计算各个目标决策得分与对应的决策输出节点携带的权重的乘积；

将各乘积相加，得到所述第一预测时间段的预测比例关系。

步骤324：将第一预测时间段的预测生命周期价值增至历史生命周期价值中，得到更新后的历史生命周期价值。

步骤326：将应用类别、标签信息、更新后的历史生命周期价值和历史消费信息输入至预测模型中，得到第二预测时间段的预测比例关系。

步骤328：根据第二预测时间段的预测比例关系和更新后的历史生命周期价值，确定第二预测时间段的预测生命周期价值。

本申请提供的应用于游戏的生命周期价值预测方法，通过对目标游戏的标签信息输入至预先训练的分类模型中，得到所述目标游戏的应用类别，极大地降低了预测模型的数据处理量，从而提高了预测生命周期价值的效率，进一步提高预测生命周期价值的精准度。通过将应用类别、标签信息、历史生命周期价值和历史消费信息作为预测因素，参考因素丰富，也可以提高预测生命周期价值的精准度。

与上述方法实施例相对应，本申请还提供了生命周期价值预测装置实施例，图4示出了本申请一实施例提供的一种生命周期价值预测装置的结构示意图。

如图4所示，该装置包括：

获取模块402，被配置为获取目标应用的标签信息、用户的历史生命周期价值和历史消费信息；

分类模块404，被配置为将所述标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别；

预测模块406，被配置为将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系；

确定模块408，被配置为根据所述第一预测时间段的预测比例关系和所述历史生命周期价值，确定第一预测时间段的预测生命周期价值。

在本实施例的一个或多个实施方式中，所述装置还包括更新模块，被配置为：

在本实施例的一个或多个实施方式中，所述分类模型包括输入层和输出层；

所述分类模块404，还被配置为：

在本实施例的一个或多个实施方式中，所述标签信息包括多个子标签信息；

所述分类模块404，还被配置为：

在本实施例的一个或多个实施方式中，所述分类模块404，还被配置为：

在本实施例的一个或多个实施方式中，所述预测模型包括决策层和抽样层；

所述预测模块406，还被配置为：

在本实施例的一个或多个实施方式中，所述决策层包括多个并联的子决策层；

所述预测模块406，还被配置为：

在本实施例的一个或多个实施方式中，所述预测模块406，还被配置为：

将各乘积相加，得到所述第一预测时间段的预测比例关系。

在本实施例的一个或多个实施方式中，所述装置还包括第一训练模块，被配置为：

获取多个样本应用的样本标签信息；

在本实施例的一个或多个实施方式中，所述装置还包括第二训练模块，被配置为：

基于预设损失函数，计算所述初始预测比例关系的损失值；

本申请提供的生命周期价值预测装置，获取目标应用的标签信息、用户的历史生命周期价值和历史消费信息；将所述标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别；将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系；根据所述第一预测时间段的预测比例关系和所述历史生命周期价值，确定第一预测时间段的预测生命周期价值。通过对目标应用的标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别，极大地降低了预测模型的数据处理量，从而提高了预测生命周期价值的效率，进一步提高预测生命周期价值的精准度。通过将应用类别、标签信息、历史生命周期价值和历史消费信息作为预测因素，参考因素丰富，也可以提高预测生命周期价值的精准度。

上述为本实施例的一种生命周期价值预测装置的示意性方案。需要说明的是，该生命周期价值预测装置的技术方案与上述的生命周期价值预测方法的技术方案属于同一构思，生命周期价值预测装置的技术方案未详细描述的细节内容，均可以参见上述生命周期价值预测方法的技术方案的描述。

图5示出了根据本申请一实施例提供的一种计算设备500的结构框图。该计算设备500的部件包括但不限于存储器510和处理器520。处理器520与存储器510通过总线530相连接，数据库550用于保存数据。

计算设备500还包括接入设备540，接入设备540使得计算设备500能够经由一个或多个网络560通信。这些网络的示例包括公用交换电话网(PSTN，Public SwitchedTelephone Network)、局域网(LAN，Local Area Network)、广域网(WAN，Wide AreaNetwork)、个域网(PAN，Personal Area Network)或诸如因特网的通信网络的组合。接入设备540可以包括有线或无线的任何类型的网络接口(例如，网络接口卡(NIC，NetworkInterface Controller))中的一个或多个，诸如IEEE802.11无线局域网(WLAN，WirelessLocal Area Network)无线接口、全球微波互联接入(Wi-MAX，WorldwideInteroperability for Microwave Acess)接口、以太网接口、通用串行总线(USB，Universal Serial Bus)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC，Near FieldCommunication)接口，等等。

在本申请的一个实施例中，计算设备500的上述部件以及图5中未示出的其他部件也可以彼此相连接，例如通过总线。应当理解，图5所示的计算设备结构框图仅仅是出于示例的目的，而不是对本申请范围的限制。本领域技术人员可以根据需要，增添或替换其他部件。

计算设备500可以是任何类型的静止或移动计算设备，包括移动计算机或移动计算设备(例如，平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如，智能手机)、可佩戴的计算设备(例如，智能手表、智能眼镜等)或其他类型的移动设备，或者诸如台式计算机或PC的静止计算设备。计算设备500还可以是移动式或静止式的服务器。

其中，处理器520执行所述计算机指令时实现所述的生命周期价值预测方法的步骤。

上述为本实施例的一种计算设备的示意性方案。需要说明的是，该计算设备的技术方案与上述的生命周期价值预测方法的技术方案属于同一构思，计算设备的技术方案未详细描述的细节内容，均可以参见上述生命周期价值预测方法的技术方案的描述。

本申请一实施例还提供一种计算机可读存储介质，其存储有计算机指令，该计算机指令被处理器执行时实现如前所述生命周期价值预测方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是，该存储介质的技术方案与上述的生命周期价值预测方法的技术方案属于同一构思，存储介质的技术方案未详细描述的细节内容，均可以参见上述生命周期价值预测方法的技术方案的描述。

上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是，所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读介质不包括电载波信号和电信信号。

需要说明的是，对于前述的各方法实施例，为了简便描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其它顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定都是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其它实施例的相关描述。

以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节，也不限制该发明仅为所述的具体实施方式。显然，根据本申请的内容，可作很多的修改和变化。本申请选取并具体描述这些实施例，是为了更好地解释本申请的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种生命周期价值预测方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述确定第一预测时间段的预测生命周期价值之后，还包括：

3.根据权利要求1所述的方法，其特征在于，所述分类模型包括输入层和输出层；

所述将所述标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别，包括：

4.根据权利要求3所述的方法，其特征在于，所述标签信息包括多个子标签信息；

所述将所述标签信息输入至所述输入层中，通过所述输入层将所述标签信息发送至所述输出层，得到所述输出层中每个输出节点的输出值，包括：

5.根据权利要求4所述的方法，其特征在于，所述根据所述输出层中每个输出节点的输出值，在所述输出层中确定胜利节点，并输出所述胜利节点表征的应用类别，包括：

6.根据权利要求1所述的方法，其特征在于，所述预测模型包括决策层和抽样层；

所述将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系，包括：

7.根据权利要求6所述的方法，其特征在于，所述决策层包括多个并联的子决策层；

所述将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至所述决策层，得到多个初始决策得分，包括：

8.根据权利要求7所述的方法，其特征在于，所述根据所述多个目标决策得分，计算所述第一预测时间段的预测比例关系，包括：

将各乘积相加，得到所述第一预测时间段的预测比例关系。

9.根据权利要求1所述的方法，其特征在于，所述将所述标签信息输入至预先训练的分类模型中，得到所述目标应用的应用类别之前，还包括：

获取多个样本应用的样本标签信息；

10.根据权利要求1所述的方法，其特征在于，所述将所述应用类别、所述标签信息、所述历史生命周期价值和所述历史消费信息输入至预先训练的预测模型中，得到第一预测时间段的预测比例关系之前，还包括：

基于预设损失函数，计算所述初始预测比例关系的损失值；

11.一种生命周期价值预测装置，其特征在于，包括：

12.一种计算设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令，其特征在于，所述处理器执行所述计算机指令时实现权利要求1-10任意一项所述方法的步骤。

13.一种计算机可读存储介质，其存储有计算机指令，其特征在于，该计算机指令被处理器执行时实现权利要求1-10任意一项所述方法的步骤。