CN113822435B

CN113822435B - 一种用户转化率的预测方法及相关设备

Info

Publication number: CN113822435B
Application number: CN202010565072.6A
Authority: CN
Inventors: 叶佳木
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-06-19
Filing date: 2020-06-19
Publication date: 2023-11-03
Anticipated expiration: 2040-06-19
Also published as: CN113822435A

Abstract

本申请提供了一种用户转化率的预测方法及相关设备，通过机器学习的方式对业务中用户尚未转化的瞬间构建的随机延迟参数以及用户的特征进行训练，得到预测模型，在通过预测模型预测用户的转化率时，得到更加精准的转化率。该方法包括：确定目标用户的特征；确定目标业务的曝光时刻；根据目标业务的曝光时刻以及当前时刻确定目标用户的实际延迟参数；基于目标用户的实际延迟参数、目标用户的特征以及预测模型确定目标用户在目标业务的转化率，预测模型为通过对训练样本进行训练得到的，训练样本包括M个用户的特征以及M个用户对应的随机延迟参数，M个用户对应的随机延迟参数为根据M个用户的转化时长确定的，M为大于或等于1的正整数。

Description

一种用户转化率的预测方法及相关设备

技术领域

本申请涉及通信领域，尤其涉及一种用户转化率的预测方法及相关设备。

背景技术

延迟反馈建模指的是业务中经常遇到广告曝光后，用户的转化可能是有延迟的，而当动态建模时需要拉取已曝光用户的所有标签数据，那么由于用户可能在计算时尚未转化，而以后可能会有转化，所以不可以简单的当做一个负样本，故需要对有延迟的反馈标签进行建模。转化在不同业务中有不同的具体意思，指业务最终关注的指标，比如卡券广告中为用户最终去核销了卡券，游戏推荐业务中为用户最后去下载注册了游戏。

经典的延迟反馈建模方法需要采用双梯度更细的计算方法来优化模型，但是双梯度更新的计算方法对模型的实现有约束，这就导致由经典的延迟反馈建模方法得到的模型应用面不够广泛。而反向梯度法主要适用于模型持续更新的在线学习建模中，如果是每天都要拿当前历史数据重新建模计算的业务，它将无法使用。

由此，在通过上述模型对用户转化率进行预测时，得到的用户转化率不够准确。

发明内容

本申请提供了一种用户转化率的预测方法及相关设备，提高用户转化率预测的准确性。

本申请第一方面提供了一种用户转化率的预测方法，包括：

确定目标用户的特征，所述目标用户为待预测的对象，且所述目标用户与目标业务相关联；

确定所述目标业务的曝光时刻；

根据所述目标业务的曝光时刻以及当前时刻确定所述目标用户的实际延迟参数；

基于所述目标用户的实际延迟参数、所述目标用户的特征以及预测模型确定所述目标用户在所述目标业务中的转化率，所述预测模型与所述目标业务相对应，且所述预测模型为通过对训练样本进行训练得到的，所述训练样本包括M个用户的特征以及所述M个用户对应的随机延迟参数，其中，所述M个用户对应的随机延迟参数为根据所述M个用户的转化时长确定的，M为大于或等于1的正整数。

可选地，所述方法还包括：

获取所述M个用户的目标数据；

根据所述目标数据确定所述M个用户中每个用户的延迟参数的范围；

根据所述M个用户中每个用户的延迟参数的范围确定所述M个用户中每个用户的随机延迟参数；

获取所述M个用户中每个用户的特征；

对所述M个用户中每个用户的随机延迟参数以及所述M个用户中每个用户的特征进行模型训练，得到所述预测模型。

可选地，所述根据所述M个用户中每个用户的延迟参数的范围确定所述M个用户中每个用户的随机延迟参数包括：

基于预设规则，对所述M个用户中每个用户的延迟参数的范围进行计算，得到所述M个用户中每个用户的随机延迟参数，其中，所述预设规则至少包括如下规则中的一种：指数分布、幂率分布、正态分布以及伯努利分布。

可选地，所述基于所述目标用户的实际延迟参数、所述目标用户的特征以及预测模型确定所述目标用户在所述目标业务中的转化率包括：

确定所述目标业务的转化结束时刻；

基于所述目标业务的转化结束时刻、所述目标用户的实际延迟参数、所述目标用户的特征以及所述预测模型确定所述目标用户在所述目标业务中的转化率。

可选地，所述方法还包括：

展示所述目标业务在所述目标业务中的转化率；

当所述目标业务的转化周期结束时，获取所述目标业务对应的对象的标签数据，所述标签数据包括所述目标业务的曝光时刻、所述目标业务对应的对象的转化时刻、所述目标业务的转化结束时刻以及所述目标业务对应的对象的特征；

将所述标签数据作为训练样本，对所述预测模型进行优化。

本申请实施例第二方面提供了一种用户转化率的预测装置，包括：

第一确定单元，用于确定目标用户的特征，所述目标用户为待预测的对象，且所述目标用户与目标业务相关联；

第二确定单元，用于确定所述目标业务的曝光时刻；

第三确定单元，用于根据所述目标业务的曝光时刻以及当前时刻确定所述目标用户的实际延迟参数；

预测单元，用于基于所述目标用户的实际延迟参数、所述目标用户的特征以及预测模型确定所述目标用户在目标业务中的转化率，所述预测模型与所述目标业务相对应，且所述预测模型为通过对训练样本进行训练得到的，所述训练样本包括M个用户的特征以及所述M个用户对应的随机延迟参数，其中，所述M个用户对应的随机延迟参数为根据所述M个用户的转化时长确定的，M为大于或等于1的正整数。

可选地，所述用户转化率的预测装置还包括：

训练单元，所述训练单元用于：

获取所述M个用户的目标数据；

获取所述M个用户中每个用户的特征；

可选地，所述训练单元根据所述M个用户中每个用户的延迟参数的范围确定所述M个用户中每个用户的随机延迟参数包括：

可选地，所述预测单元具体用于：

确定所述目标业务的转化结束时刻；

可选地，所述装置还包括：

处理单元，所述处理单元用于：

展示所述目标用户在所述目标业务中的转化率；

将所述标签数据作为训练样本，对所述预测模型进行优化。

本申请第三方面提供了一种计算机装置，其包括至少一个连接的处理器、存储器和收发器，其中，所述存储器用于存储程序代码，所述程序代码由所述处理器加载并执行以实现上述所述的用户转化率的预测方法的步骤。

本申请第四方面提供了一种计算机可读存储介质，其包括指令，当其在计算机上运行时，使得计算机执行上述所述的用户转化率的预测方法的步骤。

根据本申请的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述第一方面的各种可选实现方式中提供的方法。

综上所述，可以看出，本申请提供的实施例中，将M个用户尚未转化的瞬间构建得到的随机延迟参数加入模型中进行训练，由于这部分样本量巨大，可以训练得到更加优秀的预测模型，这样在通过该模型预测用户的转化率时，可以提高预测用户转化率的准确度。

附图说明

图1为本申请实施例提供的用户转化率的预测方法的流程示意图；

图2为本申请实施例提供的预测模型的训练流程示意图；

图3为本申请实施例提供的用户转化率的预测装置的虚拟结构示意图；

图4为本申请实施例提供的终端设备的硬件结构示意图；

图5为本申请实施例提供的服务器的硬件结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块，本申请中所出现的模块的划分，仅仅是一种逻辑上的划分，实际应用中实现时可以有另外的划分方式，例如多个模块可以结合成或集成在另一个***中，或一些特征向量可以忽略，或不执行，另外，所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，模块之间的间接耦合或通信连接可以是电性或其他类似的形式，本申请中均不作限定。并且，作为分离部件说明的模块或子模块可以是也可以不是物理上的分离，可以是也可以不是物理模块，或者可以分布到多个电路模块中，可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。

本申请实施例涉及人工智能领域以及机器学习领域，下面对人工智能以及机器学习的相关内容进行说明：

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

语音技术(Speech Technology)的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉，是未来人机交互的发展方向，其中语音成为未来最被看好的人机交互方式之一。

自然语言处理(Nature Language processing，NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

目前的延迟反馈模型，一般是通过经典延迟反馈建模方法以及反向梯度法来构建的，对于经典延迟反馈建模方法构建的延迟反馈模型同时建立两个模型：

转化模型：P(C＝1)＝sigmod(-w_c·x)，用于预测用户最终是否会转化，w_c为转化模型参数，其中，X为用户特征，y为当前是否转化，C为最终是否转化，D为转化所需要时间，e为点击时刻至当前时刻已流逝的时间；

延迟模型：P(D＝d|C＝1)＝λ(x)exp(-λ(x)d)，通过一个指数分布来预测用户如果最终转化，那么延迟时间为d的概率。其中λ为随机延迟参数，为保证其大于0，可以通过λ(x)＝exp(w_d·x)来计算，其中w_d即为延迟模型的参数。

根据用户当前是否转化的式子，可以推导出最终需要优化的损失函数Loss为：

其中，x_i表示用户i的特征，y_i表示用户i最终是否转化，若转化则y_i＝1，若未转化则y_i＝0，e_i表示用户i的点击时刻至当前时刻已流逝的时间。

在训练时，每来一个样本，都会根据Loss更新转化模型和延迟模型的模型参数。在预测时，只需要把训练好的转化模型拿出来用即可。由于经典的延迟反馈建模方法采用双梯度更细的计算方法来优化模型，双梯度更新的计算方法对模型的实现有约束，这就导致由经典的延迟反馈建模方法得到的模型应用面不够广泛，在使用时容易造成预测精度不高。

而对于反向梯度法构建的延迟反馈模型，当曝光样本到来时，先将曝光样本作为负样本来更新已有模型的Loss，而后续确定有转化数据来时，再将更新Loss的梯度往反方向走一步，而反向梯度法主要适用于模型持续更新的在线学习建模中，如果是每天都要拿当前历史数据重新建模计算的业务，它将无法使用，如果不每天更新，则同样会出现在线上使用时预测精度不高的现象。

有鉴于此，本申请提供了一种用户转化率的预测方法，通过确定目标用户的特征以及目标业务的曝光时刻，目标用户为待预测的对象，且目标用户与目标业务相关联；并根据目标业务的曝光时刻以及当前时刻确定目标用户的实际延迟参数；基于目标用户的实际延迟参数、目标用户的特征以及预测模型确定目标用户在目标业务中的转化率，预测模型与目标业务相对应，且预测模型为通过对训练样本进行训练得到的，训练样本包括M个用户的特征以及M个用户对应的随机延迟参数，其中，M为大于或等于1的正整数。通过预先对训练样本进行训练得到的预测模型来预测时，在模型训练中将随机延迟参数与对象的特征一同作为训练样本进行模型训练，M个用户对应的随机延迟参数为根据M个用户的转化时长确定的。由此，本申请中，将M个用户尚未转化的瞬间构建得到的随机延迟参数加入模型中进行训练，由于这部分样本量巨大，可以训练得到更加优秀的预测模型，这样在通过该模型预测用户的转化率时，可以提高预测用户转化率的精准度。

下面从用户转化率的预测装置的角度对本申请提供的用户转化率的预测方法进行说明，该用户转化率的预测装置可以为终端设备，也可以为服务器，也可以为服务器中的服务单元，具体不做限定。

请参阅图1，图1为本申请实施例提供的用户转化率的预测方法的流程示意图，包括：

101、确定目标用户的特征。

本实施例中，用户转化率的预测装置可以首先确定目标用户的特征，该目标用户为待预测的对象，且该目标用户与目标业务相关联，该目标业务例如可以为微信面对面卡券支付Lookalike扩散项目，也还可以为某个游戏下载广告，则该目标用户即为领取该微信面对面卡卷支付Lookalike扩散项目中的卡卷，或者点击该某个游戏下载广告的用户。

需要说明的是，不同业务对应的目标用户的特征是不相同的，此处用户转化率的预测装置可以根据目标业务的实际内容获取目标用户相应的特征。

102、确定目标业务的曝光时刻。

本实施例中，用户转化率的预测装置可以确定目标业务的曝光时刻，也即确定出该目标业务上线面对用户的时刻，用户可以看到目标业务的时刻。

103、根据目标业务的曝光时刻以及当前时刻确定目标用户的实际延迟参数。

本实施例中，用户转化率的预测装置在得到目标业务的曝光时刻之后，可以根据目标业务的曝光时刻以及当前时刻确定目标用户的实际延迟参数，例如目标业务的曝光时刻为2020年5月1日，当前时刻为2020年5月10日，则可以确定目标用户的实际延迟参数为9天，也即从曝光时刻至当前时刻的时长，减去1即可得到实际延迟参数。可以理解的是，此处以天为单位对实际延迟参数进行举例说明，当然也可以是其他的时间单位，例如小时、周或者月等等，具体不做限定。

需要说明的是，通过步骤101可以确定目标用户的特征，通过步骤102至步骤103可以确定目标用户的实际延迟参数，然而步骤101与步骤102至步骤103之间并没有先后执行顺序的限制，可以先执行步骤101，也可以先执行步骤102至步骤103，或者同时执行，具体不做限定。

104、基于目标用户的实际延迟参数、目标用户的特征以及预测模型确定目标用户在目标业务中的转化率。

本实施例中，在得到目标用户的实际延迟参数以及目标用户的特征之后，可以将目标用户的实际延迟参数以及目标用户的特征输入预先训练好的预测模型确定目标用户在目标业务中的转化率，例如目标业务为“王者荣耀”游戏的点击下载，该转化率为目标用户下载该游戏的概率，也即通过预测模型对目标用户最终是否下载“王者荣耀”进行预测，最终得到用户下载“王者荣耀”的概率，也即转化率，当然该目标业务还可以是其他的业务，例如微信发放的优惠券，用户领取之后，可以通过上述方式来确定用户是否会使用的概率，也即用户对优惠券的转化率为多少，具体不做限定。其中，该预测模型与目标业务相对应，且该预测模型为通过对训练样本进行训练得到的，该训练样本包括M个用户的特征以及M个用户对应的随机延迟参数，M个用户对应的随机延迟参数为根据M个用户的转化时长确定的，M为大于或等于1的正整数，也就是说，可以利用历史上转化周期已结束的数据，抽取出可能会有未知标签的数据(如果只有曝光-转化两步，那么就是所有曝光用户，如果是曝光-点击-转化，那么就是所有点击用户，可以理解的是，此处的曝光指的是业务面向用户，例如卡劵类业务，微信的某项卡劵上线；点击指的是，例如卡劵类业务，用户领取了，但是未使用；转化指的是用户最终是否下载或者使用该业务，例如卡劵类业务，用户最终使用领取到的卡劵)作为训练样本进行模型训练。

一个实施例中，基于目标用户的实际延迟参数、目标用户的特征以及预测模型确定目标用户在目标业务中的转化率包括：

确定目标业务的转化结束时刻；

基于目标业务的转化结束时刻、目标用户的实际延迟参数、目标用户的特征以及预测模型确定目标用户在目标业务中的转化率。

本实施例中，用户转化率的预测装置还可以确定目标业务的转化结束时刻，也即确定该目标业务的结束时刻，例如卡劵活动的结束时间，之后基于目标业务的转化结束时刻、目标用户的实际延迟参数、目标用户的特征以及预测模型确定目标用户在目标业务中的转化率，也就是说，在对目标用户在目标业务中的转化率进行预测时，可以根据业务需要，把将目标业务距离转化结束时刻的特征也考虑进去，即在构造了随机延迟参数d之后，可以把当前距离转化结束时间信息T_l-T_e-d、曝光时距离转化结束时间信息T_l-T_e、目标用户的特征以及目标用户的实际延迟参数输入预测模型，得到目标用户在目标业务中的转化率，其中，T_l为目标业务的转化结束时刻，T_e为目标业务的曝光时刻。这样综合考虑各个时间节点，使得预测得到的用户的转化率更加精确。相应的，在对模型训练时，也需要综合考虑当前距离转化结束时间信息T_l-T_e-d、曝光时距离转化结束时间信息T_l-T_e、目标用户的特征以及目标用户的随机延迟参数。

一个实施例中，用户转化率的预测装置在确定目标用户在目标业务中的转化率之后，还执行如下操作：

展示目标用户在目标业务中的转化率；

当目标业务的转化周期结束时，获取目标业务对应的对象的标签数据，该标签数据包括目标业务的曝光时刻、目标业务对应的对象的转化时刻、目标业务的转化结束时刻以及目标业务对应的对象的特征；

将标签数据作为训练样本，对预测模型进行优化。

本实施例中，用户转化率的预测装置在得到目标用户在目标业务上的转化率之后，可以展示该转化率，且在当目标业务的转化周期结束时，将目标业务对应的用户的标签数据作为训练样本，对预测模型进行优化，丰富预测模型的训练样本，使得预测的结果更加精准。

综上所述，可以看出，本申请提供的实施例中，将M个用户尚未转化的瞬间构建得到的随机延迟参数加入模型中进行训练，由于这部分样本量巨大，可以训练得到更加优秀的预测模型，这样在使用该模型对用户的转化率进行预测时，可以得到更加精准的用户的转化率。

下面对预测模型的训练流程进行说明，该预测模型的训练方法即通过历史上转化周期已结束的数据，建立预测模型，专门针对标签未知的用户进行延迟反馈建模。建立的预测模型为f(x,d,θ)，其中x为用户特征，d为曝光时刻与当前时刻的延迟，θ为模型参数。预测模型在使用时，即判断f(x,d,θ)是否大于指定阈值，大于的话样本标签为1，否则样本标签为0。

可以理解的是，如果业务形态就是观察用户曝光后是否转化，标签数据有两种，已转化用户标签为1，未转化用户标签未知。如果业务形态除了曝光，转化外还有中间状态，比如曝光-点击-转化，必须要有上一步才可以有下一步的行为，那么曝光未点击的用户标签为0，曝光点击且转化的用户标签为1，曝光点击未转化的用户标签未知。

请参阅图2，图2为本申请实施例提供的预测模型的训练流程示意图，包括：

201、获取M个用户的目标数据。

本实施例中，用户转化率的预测装置可以获取M个用户的目标数据，该目标数据为M个用户对应的历史上转化周期已结束的数据，抽取出可能会有未知标签的数据(如果只有曝光-转化两步，那么就是所有曝光用户。如果是曝光-点击-转化，那么就是所有点击用户)作为训练样本；该目标数据至少包括曝光时刻、M个用户中每个用户的转化时刻以及结束时刻。

202、根据目标数据确定M个用户中每个用户的延迟参数的范围。

本实施例中，该目标数据因为转化周期已经结束的数据，所以可获得对象最终是否转化这一标签，而预测模型中需要根据已知数据最终是否转化，构建出尚未转化的瞬间，即需要构造出延迟参数d，使得对象在曝光d时间后尚未转化；这个范围应该是d∈[0,T_max)，而对于不同标签的样本，T_max取值不同，也即不同对象转化时间不同。

需要说明的是，假设最终可以转化，那么用户的标签为1，曝光时间为T_e，转化时间为T_c，那么构造出来的延迟参数d范围应该是[0,T_c-T_e)；如果最终没有转化，那么用户标签为0，假设允许转化最晚时间为T_l，那么构造出来的d的范围应该是[0,T_l-T_e)。

203、根据M个用户中每个用户的延迟参数的范围确定M个用户中每个用户的随机延迟参数。

本实施例中，用户转化率的预测装置在得到M个用户中每个用户的延迟参数的范围之后，可以根据M个用户中每个用户的延迟参数的范围确定M个用户中每个用户的随机延迟参数。具体的，可以基于预设规则对M个用户中每个用户的延迟参数的范围进行计算，得到M个用户中每个用户的随机延迟参数，其中，预设规则至少包括如下规则中的一种：指数分布、幂率分布、正态分布、伯努利分布以及数值模型。下面以预设规则为指数分布为例对生成随机延迟参数进行说明：

在得到延迟参数d的范围之后，在这个范围内随机生成的d也应该符合真实分布，这样才不会出现训练和预测样本分布不一致的问题。常见的延迟反馈的延迟参数都可以根据指数分布P(d＝k)＝λe^-λk来生成，e为常数，k为变量，例如用户的转化时刻为曝光后10天内转化，该用户的延迟参数的范围即为[0,9)，也即k的取值为[0,9)，其中，参数λ可以通过来计算，c_i表示样本转化时刻发生在曝光后i时刻的样本数，而由于d的范围都是[0,T_max)，所以在这个范围内生成的概率函数是归一化后的指数分布：从而保证/>的值为1。

需要说明的是，延迟参数的范围已知的情况下，根据一定的分布来生成随机延迟参数d，该分布不一定是指数分布，可以根据业务实际对应的分布来生成d，比如幂率分布、正态分布以及伯努利分布等，另外还可以不用数值模型来生成，而直接统计真实延迟的比例来生成：具体不做限定，只要能得到M个用户中每个用户的随机延迟参数即可。

204、获取M个用户中每个用户的特征。

本实施例中，用户转化率的预测装置可以获取M个用户中每个用户的特征，不同业务对应的用户的特征是不相同的，此处用户转化率的预测装置可以根据要训练的预测模型来获取对应的特征。

需要说明的是，通过步骤201至步骤203可以确定M个用户中每个用户的随机延迟参数，通过步骤204可以获取M个用户中每个用户的特征，然而，步骤201至步骤203与步骤204之间并没有先后执行顺序的限制，可以先执行步骤201至步骤203，也可以先执行步骤204，或者同时执行，具体不做限定。

205、对M个用户中每个用户的随机延迟参数以及M个用户中每个用户的特征进行模型训练，得到预测模型。

本实施例中，用户转化率的预测装置在得到M个用户中每个用户的随机延迟参数以及M个用户中每个用户的特征之后，可以对M个用户中每个用户的随机延迟参数以及M个用户中每个用户的特征进行模型训练，得到预测模型。

需要说明的是，在进行模型训练时，还可以根据业务需要，把距离转化结束的特征也考虑进去，即在构造了随机延迟参数d之后，可以把当前距离转化结束时间信息T_l-T_e-d，曝光时距离转化结束时间信息T_l-T_e与用户的特征以及用户的随机延迟参数加入模型中训练。

综上所述，可以看出，本申请提供的实施例中，在模型训练的过程中，通过M个用户中每个用户尚未转化的瞬间构建随机延迟模型参数，由于这部分样本量巨大，可以训练得到更加优秀的预测模型，使得预测模型在线上使用时，预测更加精准。

上面从用户转化率的预测方法的角度对本申请进行说明，下面从用户转化率的预测装置的角度对本申请进行说明。

请参阅图3，图3为本申请实施例提供的一种用户转化率的预测装置的虚拟结构示意图，包括：

第一确定单元301，用于确定目标用户的特征，所述目标用户为待预测的对象，且所述目标用户与目标业务相关联；

第二确定单元302，用于确定所述目标业务的曝光时刻；

第三确定单元303，用于根据所述目标业务的曝光时刻以及当前时刻确定所述目标用户的实际延迟参数；

预测单元304，用于基于所述目标用户的实际延迟参数、所述目标用户的特征以及预测模型确定所述目标用户在所述目标业务中的转化率，所述预测模型与所述目标业务相对应，且所述预测模型为通过对训练样本进行训练得到的，所述训练样本包括M个用户的特征以及所述M个用户对应的随机延迟参数，其中，所述M个用户对应的随机延迟参数为根据所述M个用户的转化时长确定的，M为大于或等于1的正整数。

可选地，所述用户转化率的预测装置还包括：

训练单元305，所述训练单元305用于：

获取所述M个用户的目标数据；

获取所述M个用户中每个用户的特征；

可选地，所述预测单元304具体用于：

确定所述目标业务的转化结束时刻；

基于所述目标业务的转化结束时刻、所述目标用户的实际延迟参数、所述目标用户的特征以及所述预测模型对所述目标用户进行预测，得到所述预测结果。

可选地，所述装置还包括：

处理单元306，所述处理单元306用于：

展示所述目标用户在所述目标业务中的转化率；

将所述标签数据作为训练样本，对所述预测模型进行优化。

综上所述，可以看出，本申请提供的实施例中，将M个用户尚未转化的瞬间构建得到的随机延迟参数加入模型中进行训练，由于这部分样本量巨大，可以训练得到更加优秀的预测模型，这样在线上应用时，可以提高预测的精度。

本申请实施例还提供了另一种用户转化率的预测装置，如图4所示，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该用户转化率的预测装置可以为终端，该终端可以为包括手机、平板电脑、PDA(Personal Digital Assistant，个人数字助理)、POS(Point of Sales，销售终端)、车载电脑等任意终端设备，以终端为手机为例：

图4示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图4，手机包括：射频(Radio Frequency，RF)电路410、存储器420、输入单元430、显示单元440、传感器450、音频电路460、无线保真(wireless fidelity，WiFi)模块470、处理器480、以及电源490等部件。本领域技术人员可以理解，图4中示出的手机结构并不构成对手机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

下面结合图4对手机的各个构成部件进行具体的介绍：

RF电路410可用于收发信息或通话过程中，信号的接收和发送，特别地，将基站的下行信息接收后，给处理器480处理；另外，将设计上行的数据发送给基站。通常，RF电路410包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier，LNA)、双工器等。此外，RF电路410还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议，包括但不限于全球移动通讯***(GlobalSystem of Mobile communication，GSM)、通用分组无线服务(General Packet RadioService，GPRS)、码分多址(Code Division Multiple Access，CDMA)、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)、长期演进(Long Term Evolution，LTE)、电子邮件、短消息服务(Short Messaging Service，SMS)等。

存储器420可用于存储软件程序以及模块，处理器480通过运行存储在存储器420的软件程序以及模块，从而执行手机的各种功能应用以及数据处理。存储器420可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器420可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元430可用于接收输入的数字或字符信息，以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地，输入单元430可包括触控面板431以及其他输入设备432。触控面板431，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板431上或在触控面板431附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触控面板431可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器480，并能接收处理器480发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板431。除了触控面板431，输入单元430还可以包括其他输入设备432。具体地，其他输入设备432可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元440可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元440可包括显示面板441，可选的，可以采用液晶显示器(Liquid CrystalDisplay，LCD)、有机发光二极管(Organic Light-Emitting Diode，OLED)等形式来配置显示面板441。进一步的，触控面板431可覆盖显示面板441，当触控面板431检测到在其上或附近的触摸操作后，传送给处理器480以确定触摸事件的类型，随后处理器480根据触摸事件的类型在显示面板441上提供相应的视觉输出。虽然在图4中，触控面板431与显示面板441是作为两个独立的部件来实现手机的输入和输入功能，但是在某些实施例中，可以将触控面板431与显示面板441集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器450，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板441的亮度，接近传感器可在手机移动到耳边时，关闭显示面板441和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路460、扬声器461，传声器462可提供用户与手机之间的音频接口。音频电路460可将接收到的音频数据转换后的电信号，传输到扬声器461，由扬声器461转换为声音信号输出；另一方面，传声器462将收集的声音信号转换为电信号，由音频电路460接收后转换为音频数据，再将音频数据输出处理器480处理后，经RF电路410以发送给比如另一手机，或者将音频数据输出至存储器420以便进一步处理。

WiFi属于短距离无线传输技术，手机通过WiFi模块470可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图4示出了WiFi模块470，但是可以理解的是，其并不属于手机的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器480是手机的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器420内的软件程序和/或模块，以及调用存储在存储器420内的数据，执行手机的各种功能和处理数据。可选的，处理器480可包括一个或多个处理单元；优选的，处理器480可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器480中。

手机还包括给各个部件供电的电源490(比如电池)，优选的，电源可以通过电源管理***与处理器480逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。

尽管未示出，手机还可以包括摄像头、蓝牙模块等，在此不再赘述。

在本申请实施例中，上述由用户转化率的预测装置所执行的步骤可以由该终端所包括的处理器480来执行。

图5是本申请实施例提供的一种服务器结构示意图，该服务器500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以***处理器(central processingunits，CPU)522(例如，一个或一个以上处理器)和存储器532，一个或一个以上存储应用程序542或数据544的存储介质530(例如一个或一个以上海量存储设备)。其中，存储器532和存储介质530可以是短暂存储或持久存储。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器522可以设置为与存储介质530通信，在服务器500上执行存储介质530中的一系列指令操作。

服务器500还可以包括一个或一个以上电源526，一个或一个以上有线或无线网络接口550，一个或一个以上输入输出接口558，和/或，一个或一个以上操作***541，例如Windows ServerTM，Mac OS XTM，UnixTM，LinuxTM，FreeBSDTM等等。

上述实施例中由用户转化率的预测装置所执行的步骤可以基于该图5所示的服务器结构。

本申请实施例还提供了一种计算机可读存储介质，其上存储有程序，该程序被处理器执行时实现上述所述用户转化率的预测方法的步骤。

本申请实施例还提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行上述所述用户转化率的预测方法的步骤。

本申请实施例还提供了一种终端设备，设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序，所述程序代码由所述处理器加载并执行以实现上述所述用户转化率的预测方法的步骤。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行上述所述用户转化率的预测方法的步骤。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***，装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域内的技术人员应明白，本申请的实施例可提供为方法、***、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、***或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种用户转化率的预测方法，其特征在于，包括：

确定所述目标业务的曝光时刻；

基于所述目标用户的实际延迟参数、所述目标用户的特征以及预测模型确定所述目标用户在所述目标业务中的转化率，所述预测模型与所述目标业务相对应；

所述预测模型的训练方式包括：

获取M个用户的目标数据；根据所述目标数据确定所述M个用户中每个用户的延迟参数的范围；其中，若所述目标数据表示最终可以转化，则确定的延迟参数d的范围是[0,T_c-T_e)，T_e为曝光时间，T_c为转化时间；若所述目标数据表示最终没有转化，则确定的延迟参数d的范围是[0,T_l-T_e)，T_l为允许转化最晚时间；

基于预设规则，对所述M个用户中每个用户的延迟参数的范围进行计算，得到所述M个用户中每个用户的随机延迟参数，所述预设规则至少包括如下规则中的一种：指数分布、幂率分布、正态分布以及伯努利分布；

获取所述M个用户中每个用户的特征；对所述M个用户中每个用户的随机延迟参数以及所述M个用户中每个用户的特征进行模型训练，得到所述预测模型，其中，M为大于或等于1的正整数。

2.根据权利要求1所述的方法，其特征在于，所述基于所述目标用户的实际延迟参数、所述目标用户的特征以及预测模型确定所述目标用户在所述目标业务中的转化率包括：

确定所述目标业务的转化结束时刻；

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

展示所述目标用户在所述目标业务中的转化率；

将所述标签数据作为训练样本，对所述预测模型进行优化。

4.一种用户转化率的预测装置，其特征在于，包括：

第二确定单元，用于确定所述目标业务的曝光时刻；

预测单元，用于基于所述目标用户的实际延迟参数、所述目标用户的特征以及预测模型确定所述目标用户在所述目标业务中的转化率，所述预测模型与所述目标业务相对应；

所述用户转化率的预测装置还包括：

训练单元，所述训练单元用于：

5.根据权利要求4所述的用户转化率的预测装置，其特征在于，所述预测单元具体用于：

确定所述目标业务的转化结束时刻；

6.根据权利要求4所述的用户转化率的预测装置，其特征在于，所述装置还包括：处理单元；

所述处理单元，用于展示所述目标用户在所述目标业务中的转化率；

将所述标签数据作为训练样本，对所述预测模型进行优化。

7.一种终端设备，其特征在于，所述终端设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序，所述程序代码由所述处理器加载并执行以上述权利要求1至3中任一项所述的用户转化率的预测方法的步骤。

8.一种计算机可读存储介质，其特征在于，包括指令，当所述指令在计算机上运行时，使得计算机执行上述权利要求1至3中任一项所述的用户转化率的预测方法的步骤。