CN117014500A

CN117014500A - 一种推送信息类型的确定方法、电子设备及存储介质

Info

Publication number: CN117014500A
Application number: CN202310924459.XA
Authority: CN
Inventors: 刘昊; 王殿胜; 薄满辉; 陈孟园; 张希; 刘彦君; 齐烁
Original assignee: China Travelsky Mobile Technology Co Ltd
Current assignee: China Travelsky Mobile Technology Co Ltd
Priority date: 2023-07-26
Filing date: 2023-07-26
Publication date: 2023-11-07

Abstract

本发明提供了一种推送信息类型的确定方法、电子设备及存储介质，包括：获取目标用户特征TZ；将TZ输入目标deepfm模型，得到目标deepfm模型输出的待展示选项卡对应的信息类型的第一点击概率P；根据P，获取SL；若SL＞Y1，则对TZ中预设目标用户特征进行删除，得到中间目标用户特征集TZ’；将TZ’输入目标多臂***模型，得到目标多臂***模型输出的待展示选项卡对应的信息类型的第二点击概率P’；根据P’，获取P’e＝max(P’)；若Pe≠N/A且Pe≠max(P)或Pe≠0且Pe≠max(P)，则获取Pg＝max(P)；获取中间概率GL；若GL＞0，则将第e个信息类型确定为目标推送信息类型。

Description

一种推送信息类型的确定方法、电子设备及存储介质

技术领域

本发明涉及数据处理领域，特别是涉及一种推送信息类型的确定方法、电子设备及存储介质。

背景技术

随着互联网技术的蓬勃发展，用户可以在线获取大量信息，在大数据时代，各种软件和网页可以通过向用户推送的相关信息，促使用户产生相关联的行为，影响用户的选择。现有技术中，会获取大量历史用户的人文属性、兴趣属性等特征数据形成训练样本，训练深度学习模型，根据训练好的深度学习模型，预测用户的需求，将预测结果对用户进行推送。虽然能够根据用户的需求进行信息推送，但是，由于只应用一种深度学习模型获取到的结果不够准确，使得推送的信息不能精准的反映用户的需求。

发明内容

针对上述技术问题，本发明采用的技术方案为：

在本发明的一方面，提供一种推送信息类型的确定方法，包括以下步骤：

S100，获取目标用户的目标用户特征集TZ＝(TZ¹，TZ²，TZ³ ₁，TZ³ ₂，…，TZ³ _a，…，TZ³ _n，

TZ⁴ ₁，TZ⁴ ₂，…，TZ⁴ _a，…，TZ⁴ _n，TZ⁵ ₁，TZ⁵ ₂，…，TZ⁵ _a，…，TZ⁵ _n，TZ⁶)；其中，a＝1，2，…，n；

TZ¹为目标用户的年龄；TZ²为目标用户的性别；TZ³ _a为目标用户在设定时间内对展示了第a个信息类型的信息的选项卡的点击次数；TZ⁴ _a为目标用户在设定时间内与第a个信息类型对应的任务建立关联关系的次数；TZ⁵ _a为目标用户在设定时间内对展示了第a个信息类型的信息的选项卡的浏览次数；TZ⁶为最近一次建立关联关系的任务对应的任意预设的信息类型；n为预设的信息类型的数量。

S200，将TZ输入目标deepfm模型，以得到目标deepfm模型输出的待展示选项卡对应的信息类型的第一点击概率集P＝(P1，P2，…，Pa，…，Pn)；其中，Pa为预测的目标用户点击第a个信息类型对应的待展示选项卡的第一点击概率。

S300，根据P，获取SL；其中，SL为P中N/A和0的数量；SL≤n。

S400，若SL＞Y1，则对TZ中预设目标用户特征进行删除，以得到中间目标用户特征集TZ’；Y1为第一预设阈值。

S500，将TZ’输入目标多臂***模型，以得到目标多臂***模型输出的待展示选项卡对应的信息类型的第二点击概率集P’＝(P’1，P’2，…，P’a，…，P’n)；P’a为预测的目标用户点击第a个信息类型对应的待展示选项卡的第二点击概率。

S600，根据P’，获取P’e＝max(P’)；e≤n；max()为预设的最大值确定函数。

S700，若Pe≠N/A且Pe≠max(P)或Pe≠0且Pe≠max(P)，则获取Pg＝max(P)；g≤n。

S800，获取中间概率GL＝Pe*w1+P’e*w2-Pg*w1-P’g*w2；其中，w1为预设的第一权重；w2为预设的第二权重。

S900，若GL＞0，则将第e个信息类型确定为目标推送信息类型。

在本发明的另一方面，提供一种非瞬时性计算机可读存储介质，存储介质中存储有至少一条指令或至少一段程序，至少一条指令或至少一段程序由处理器加载并执行以实现任意一项的推送信息类型的确定方法。

在本发明的另一方面，提供一种电子设备，包括处理器和上述非瞬时性计算机可读存储介质。

本发明至少具有以下有益效果：

本发明提供的推送信息类型的确定方法，将获取到的目标用户的目标用户特征TZ，输入目标deepfm模型，以得到目标deepfm模型输出的待展示选项卡对应的信息类型的第一点击概率集P。正常情况下，模型输出的第一点击概率会在阈值范围内，但在一些特殊情况下第一点击概率会上溢或者下溢，出现N/A或者0，表示第一点击概率超出了阈值范围，如果N/A和0的数量过多，说明模型输出结果的准确度不高。因此，若P中N/A和0的数量大于第一预设阈值，则对TZ中预设目标用户特征进行删除，以得到中间目标用户特征集TZ’，将TZ’输入目标多臂***模型，得到目标多臂***模型输出的待展示选项卡对应的信息类型的第二点击概率集P’。根据P’，获取P’e＝max(P’)，若Pe≠N/A且Pe≠max(P)或Pe≠0且Pe≠max(P)，则获取Pg＝max(P)。根据目标多臂***模型确定的第二点击概率最高的信息类型，获取其在目标deepfm模型中输出的第一点击概率，若该第一点击概率不为N/A或者0，并且不是最大值，此时由于目标deepfm模型比目标多臂***模型的置信度更高，目标多臂***模型输出的第二点击概率最高的信息类型不一定为目标推送信息类型，需要进一步判断。故而获取中间概率GL＝Pe*w1+P’e*w2-Pg*w1-P’g*w2，若GL＞0，则将第e个信息类型确定为目标推送信息类型。本发明提供的信息推送方法，结合目标deepfm模型和目标多臂***模型的输出结果确定目标推送信息类型，准确性更高。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的推送信息类型的确定方法流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或服务器不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

需要说明的是，下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见，本文中所描述的方面可体现于广泛多种形式中，且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开，所属领域的技术人员应了解，本文中所描述的一个方面可与任何其它方面独立地实施，且可以各种方式组合这些方面中的两者或两者以上。举例来说，可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外，可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。

请参考图1所示，本发明的实施例提供了一种推送信息类型的确定方法，包括以下步骤：

S100，获取目标用户的目标用户特征TZ＝(TZ¹，TZ²，TZ³ ₁，TZ³ ₂，…，TZ³ _a，…，TZ³ _n，TZ⁴ ₁，TZ⁴ ₂，…，TZ⁴ _a，…，TZ⁴ _n，TZ⁵ ₁，TZ⁵ ₂，…，TZ⁵ _a，…，TZ⁵ _n，TZ⁶)；其中，a＝1，2，…，n；TZ¹为目标用户的年龄；TZ²为目标用户的性别；TZ³ _a为目标用户在设定时间内对展示了第a个信息类型的信息的选项卡的点击次数；TZ⁴ _a为目标用户在设定时间内与第a个信息类型对应的任务建立关联关系的次数；TZ⁵ _a为目标用户在设定时间内对展示了第a个信息类型的信息的选项卡的浏览次数；TZ⁶为最近一次建立关联关系的任务对应的任意预设的信息类型；n为预设的信息类型的数量。

在本实施例中，所述推送信息类型的确定方法在实际应用场景中推送的信息可以为任意航旅购票APP或者网页中的待展示选项卡界面展示的保险，则信息类型为保险类型。

具体的，目标用户特征包括目标用户的年龄、性别、目标用户在设定时间内对展示的任一信息类型的信息的选项卡的点击次数、目标用户在设定时间内与任一信息类型对应的任务建立关联关系的次数、目标用户在设定时间内对展示了任一信息类型的信息的选项卡的浏览次数、最近一次建立关联关系的任务对应的任意预设的信息类型。所述对应的任务建立的关联关系的次数可以为购买次数。所述设定时间可以为近三个月至一年内，获取目标用户特征的时间不宜过长，设定时间过长获取到的用户特征不能精准反应用户目前的需求，设定时间过短获取到的用户特征反应的用户需求也不够准确，优选的，设定时间为六个月。

S300，根据P，获取SL；其中，SL为P中N/A和0的数量；SL≤n。

具体的，将获取到的目标用户的目标用户特征TZ，输入训练后的目标deepfm模型，可以得到目标deepfm模型输出的待展示选项卡对应的每一信息类型的置信概率，即第一点击概率集P。正常情况下，模型输出的第一点击概率会在阈值范围内，但在一些特殊情况下第一点击概率会上溢或者下溢，出现N/A或者0，表示第一点击概率超出了阈值范围，如果N/A和0的数量过多，说明模型输出结果的准确度不高。因此，若P中N/A和0的数量大于第一预设阈值，则要对TZ中预设目标用户特征进行删除，以得到中间目标用户特征集TZ’。

所述预设目标用户特征为：目标用户的性别、最近一次建立关联关系的任务对应的任意预设的信息类型。

进一步的，第一预设阈值Y1＝α*n；α为第一系数，取值范围为0.4-0.6，优选的，α＝0.5。

具体的，e和g均为下标，表示具体的常数。

值得说明的是，将第二点击概率集P’中的最大值确定为P’e，即预测的目标用户点击第e个信息类型对应的待展示选项卡的第二点击概率最大；将第一点击概率集P中的最大值确定为Pg，即预测的目标用户点击第g个信息类型对应的待展示选项卡的第一点击概率最大。

进一步的，本领域技术人员可以知悉，e和g不相等，此时表示，第一点击概率最大对应的信息类型与第二点击概率最大对应的信息类型不为同一个。

具体的，P’e为预测的目标用户点击第e个信息类型对应的待展示选项卡的第二点击概率，P’g为预测的目标用户点击第g个信息类型对应的待展示选项卡的第二点击概率，Pe为预测的目标用户点击第e个信息类型对应的待展示选项卡的第一点击概率，Pg为预测的目标用户点击第g个信息类型对应的待展示选项卡的第一点击概率。

将目标用户特征删除预设目标用户特征得到的中间目标用户特征集输入目标多臂***模型，可以得到目标多臂***模型输出的待展示选项卡对应的每一信息类型的置信概率，即第二点击概率集。获取第二点击概率最高的信息类型在目标deepfm模型中输出的第一点击概率，若该第一点击概率不为N/A或者0，并且不是最大值，此时由于目标deepfm模型比目标多臂***模型的置信度更高，目标多臂***模型输出的第二点击概率最高的信息类型不一定为目标推送信息类型，需要进一步判断。故而获取中间概率GL＝Pe*w1+P’e*w2-Pg*w1-P’g*w2，若GL＞0，说明目标多臂***模型的置信度更高，则将第e个信息类型确定为目标推送信息类型。

在本发明的一种示例性实施例中，w1+w2＝1。

具体的，w1≥w2。

在本发明的一种示例性实施例中，所述目标deepfm模型根据以下步骤获取：

S210，获取历史数据中m个用户在目标时间窗口对应的初始选项卡展示信息列表集ZS＝(ZS¹，ZS²，…，ZS^j，…，ZS^m)；其中，j＝1，2，…，m；ZS^j为第j个用户在目标时间窗口对应的初始选项卡展示信息列表，ZS^j＝(ZS^j ₁，ZS^j ₂，…，ZS^j _t，…，ZS^j _u)；目标时间窗口包括u个连续排布且依次连接的时间段；ZS^j _t为第j个用户在第t个时间段内对应的初始选项卡展示信息列表，ZS^j _t＝(ZS^j _t,1，ZS^j _t,2，…，ZS^j _t,k，…，ZS^j _t,h(t))；ZS^j _t,k＝(L_t,k，T_t,k)；t＝1，2，…，u；k＝1，2，…，h(t)；h(t)为第j个用户在第t个时间段内进入目标选项卡展示页面的次数；ZS^j _t,k为第j个用户在第t个时间段内第k次进入目标选项卡展示页面的选项卡展示信息；L_t,k为第j个用户在第t个时间段内第k次进入目标选项卡展示页面时，目标选项卡展示的信息对应的信息类型；T_t,k为第j个用户在第t个时间段内第k次进入目标选项卡展示页面时，目标选项卡的被展示时间；目标选项卡用于展示任意信息类型对应的信息。

S220，遍历ZS^j _t，若T_t,k＜Y2，则删除ZS^j _t,k，以得到中间选项卡展示信息集ZS’^j _t＝(ZS’

^j _t,1，ZS’^j _t,2，…，ZS’^j _t,c，…，ZS’^j _t,h’(t))；ZS’^j _t,c＝(L’^j _t,c，T’^j _t,c)；其中，c＝1，2，…，

h’(t)；ZS’^j _t,c为ZS’^j _t对应的第c个选项卡展示信息；L’^j _t,c为第j个用户在第t个时间段内第c次进入目标选项卡展示页面时，目标选项卡展示信息对应的信息类型；T’^j _t,c为第j个用户在第t个时间段内第c次进入目标选项卡展示页面时，目标选项卡的被展示时间；h’(t)为第j个用户在第t个时间段内进入目标选项卡展示页面的次数；h’(t)≤h(t)；Y2为第二预设阈值。

具体的，用户在目标时间窗口可能会多次进入目标选项卡展示页面，也可能会误点击进入，用户误点击时，可能不会认真浏览目标选项卡的展示信息，进入后短时间内直接退出，将误点击进入目标选项卡展示页面也算做有效次数会影响预测结果的准确性。故而，通过进入目标选项卡展示页面时，目标选项卡的被展示时间，判断用户是否为误点击，若T_t,k小于为第二预设阈值Y2，表明用户误点击，将其对应的目标选项卡展示信息作为无效数据进行删除，以得到中间选项卡展示信息集，

第二预设阈值Y2的取值范围为0.5-2，优选的，Y2＝1。

S230，根据L’^j _t,c，对ZS’^j _t进行聚类，得到若干集合，每个集合里包括至少一个选项卡展示信息；同一个集合内的选项卡展示信息对应的信息类型相同。

具体的，用户进入目标选项卡展示页面时，展示信息对应的信息类型随机，用户多次进入可能会展示相同类型的信息，通过聚类，将相同信息类型的展示信息作为同一组数据。

进一步的，本领域技术人员周知的，所述聚类方法为任意可以将相同信息类型的展示信息分为一类的方法。

S240，获取ZS’^j _t对应的点击行为列表DJ’^j _t＝(DJ’^j _t,1，DJ’^j _t,2，…，DJ’^j _t,c，…，DJ’^j _t,h’(t))；其中，DJ’^j _t,c为第j个用户在第t个时间段内第c次进入目标选项卡展示页面的过程中对应的第一点击行为标识，若DJ’^j _t,c＝1则表示第j个用户在第t个时间段内第c次进入目标选项卡展示页面的过程中对目标选项卡进行过点击，若DJ’^j _t,c＝0则表示第j个用户在第t个时间段内第c次进入目标选项卡展示页面的过程中未对目标选项卡进行过点击。

S250，生成每一聚类集合对应的样本标签，以得到样本标签列表BQ^j _t＝(BQ^j _t,1，BQ^j _t,2，…，BQ^j _t,d，…，BQ^j _t,r(t))；其中，d＝1，2，…，r(t)；r(t)为第j个用户在第t个时间段内样本标签列表的数量；r(t)≤n；BQ^j _t,d为第j个用户在第t个时间段内第d个聚类集合对应的选项卡展示信息，BQ^j _t,d＝(ML^j _t,d，MH^j _t,d)；ML^j _t,d为BQ^j _t,d对应的集合所包含的选项卡展示信息对应的信息类型；MH^j _t,d为BQ^j _t,d对应的第二点击行为标识，若BQ^j _t,d对应的集合对应的每一第一点击行为的标识相加后大于等于1，则MH^j _t,d＝1；否则，MH^j _t,d＝0。

具体的，在第t个时间段用户每一次进入目标选项卡展示页面后，可能会对目标选项卡进行过点击，也可能未点击。进行聚类后，用户多次进入目标选项卡展示页面，对展示的信息点击至少一次即说明用户在第t个时间段内对目标选项卡进行过点击。

S260，获取第j个用户在第t个时间段内的历史用户特征YHj^t。

S270，根据BQ^j _t和YHj^t，获取历史数据中m个用户的训练样本列表集X＝(X¹，X²，…，X^j，…，X^m)；其中，X^j为X中第j个用户的训练样本列表，X^j＝(X^j,1，X^j,2，…，X^j,t，…，X^j,u)；X^j,t为第j个用户在第t个时间段内的训练样本列表，X^j,t＝(X^j,t ₁，X^j,t ₂，…，X^j,t _d，…，X^j,t _r(t))；X^j ^,t _d为第j个用户在第t个时间段内的第d个训练样本，X^j,t _d＝(YHj^t，BQ^j _t,d)。

S280，根据X对初始deepfm模型进行训练，以得到目标deepfm模型。

具体的，本领域技术人员可知，将通过历史用户特征和对应的标签形成的训练样本对初始deepfm模型进行训练，可以得到训练后的目标deepfm模型。

在本发明的一种示例性实施例中，所述步骤S300后，还可以包括：

S310，若SL≤Y1，获取Pg＝max(P)。

S320，若Pg≠N/A或者Pg≠0，则将第g个信息类型确定为目标推送信息类型。

具体的，如果N/A和0的数量比较少，未超出第一预设阈值，说明模型输出结果的准确度比较高，则将第一点击概率最高的信息类型确定为目标推送信息类型。

在本发明的一种示例性实施例中，所述步骤S600后，还可以包括：

S610，若Pe≠N/A且Pe＝max(P)或Pe≠0且Pe＝max(P)，则将第e个信息类型确定为目标推送信息类型。

具体的，若第e个信息类型在目标多臂***模型输出结果中第二点击概率最高，并且在目标deepfm模型输出结果中不为N/A或0，并且第e个信息类型对应的第一点击概率也为最高，则可以确定第e个信息类型为目标推送信息类型。

在本发明的一种示例性实施例中，所述步骤S610后，还可以包括：

S620，若Pe＝N/A或者Pe＝0，则将第e个信息类型确定为目标推送信息类型。

具体的，若第e个信息类型在目标多臂***模型输出结果中第二点击概率最高，并且在目标deepfm模型输出结果的第一点击概率为N/A或者0，则可以将第e个信息类型确定为目标推送信息类型。

在本发明的一种示例性实施例中，所述步骤S900后，还可以包括：

S910，若GL≤0，则将第g个信息类型确定为目标推送信息类型。

具体的，若GL≤0，说明目标deepfm模型的置信度更高，则将第g个信息类型确定为目标推送信息类型。

在本发明的一种示例性实施例中，N/A表示目标deepfm模型或者目标多臂***模型输出的待展示选项卡对应的信息类型的点击概率上溢；0表示目标deepfm模型或者目标多臂***模型输出的待展示选项卡对应的信息类型的点击概率下溢。

本发明的实施例还提供了一种非瞬时性计算机可读存储介质，该存储介质可设置于电子设备之中以保存用于实现方法实施例中一种方法相关的至少一条指令或至少一段程序，该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述实施例提供的方法。

本发明的实施例还提供了一种电子设备，包括处理器和前述的非瞬时性计算机可读存储介质。

本发明的实施例还提供一种计算机程序产品，其包括程序代码，当所述程序产品在电子设备上运行时，所述程序代码用于使该电子设备执行本说明书上述描述的根据本发明各种示例性实施方式的方法中的步骤。

虽然已经通过示例对本发明的一些特定实施例进行了详细说明，但是本领域的技术人员应该理解，以上示例仅是为了进行说明，而不是为了限制本发明的范围。本领域的技术人员还应理解，可以对实施例进行多种修改而不脱离本发明的范围和精神。本发明开的范围由所附权利要求来限定。

Claims

1.一种推送信息类型的确定方法，其特征在于，包括：

S100，获取目标用户的目标用户特征集TZ＝(TZ¹，TZ²，TZ³ ₁，TZ³ ₂，…，TZ³ _a，…，TZ³ _n，TZ⁴ ₁，TZ⁴ ₂，…，TZ⁴ _a，…，TZ⁴ _n，TZ⁵ ₁，TZ⁵ ₂，…，TZ⁵ _a，…，TZ⁵ _n，TZ⁶)；其中，a＝1，2，…，n；TZ¹为目标用户的年龄；TZ²为目标用户的性别；TZ³ _a为目标用户在设定时间内对展示了第a个信息类型的信息的选项卡的点击次数；TZ⁴ _a为目标用户在设定时间内与第a个信息类型对应的任务建立关联关系的次数；TZ⁵ _a为目标用户在设定时间内对展示了第a个信息类型的信息的选项卡的浏览次数；TZ⁶为最近一次建立关联关系的任务对应的任意预设的信息类型；n为预设的信息类型的数量；

S200，将TZ输入目标deepfm模型，以得到所述目标deepfm模型输出的待展示选项卡对应的信息类型的第一点击概率集P＝(P1，P2，…，Pa，…，Pn)；其中，Pa为预测的目标用户点击第a个信息类型对应的待展示选项卡的第一点击概率；

S300，根据P，获取SL；其中，SL为P中N/A和0的数量；SL≤n；

S400，若SL＞Y1，则对TZ中预设目标用户特征进行删除，以得到中间目标用户特征集TZ’；Y1为第一预设阈值；

S500，将TZ’输入目标多臂***模型，以得到所述目标多臂***模型输出的待展示选项卡对应的信息类型的第二点击概率集P’＝(P’1，P’2，…，P’a，…，P’n)；P’a为预测的目标用户点击第a个信息类型对应的待展示选项卡的第二点击概率；

S600，根据P’，获取P’e＝max(P’)；e≤n；max()为预设的最大值确定函数；

S700，若Pe≠N/A且Pe≠max(P)或Pe≠0且Pe≠max(P)，则获取Pg＝max(P)；g≤n；

S800，获取中间概率GL＝Pe*w1+P’e*w2-Pg*w1-P’g*w2；其中，w1为预设的第一权重；w2为预设的第二权重；

2.根据权利要求1所述的推送信息类型的确定方法，其特征在于，所述目标deepfm模型根据以下步骤获取：

S210，获取历史数据中m个用户在目标时间窗口对应的初始选项卡展示信息列表集ZS＝(ZS¹，ZS²，…，ZS^j，…，ZS^m)；其中，j＝1，2，…，m；ZS^j为第j个用户在目标时间窗口对应的初始选项卡展示信息列表，ZS^j＝(ZS^j ₁，ZS^j ₂，…，ZS^j _t，…，ZS^j _u)；目标时间窗口包括u个连续排布且依次连接的时间段；ZS^j _t为第j个用户在第t个时间段内对应的初始选项卡展示信息列表，ZS^j _t＝(ZS^j _t,1，ZS^j _t,2，…，ZS^j _t,k，…，ZS^j _t,h(t))；ZS^j _t,k＝(L_t,k，T_t,k)；t＝1，2，…，u；k＝1，2，…，h(t)；h(t)为第j个用户在第t个时间段内进入目标选项卡展示页面的次数；ZS^j _t,k为第j个用户在第t个时间段内第k次进入目标选项卡展示页面的选项卡展示信息；L_t,k为第j个用户在第t个时间段内第k次进入目标选项卡展示页面时，目标选项卡展示的信息对应的信息类型；T_t,k为第j个用户在第t个时间段内第k次进入目标选项卡展示页面时，目标选项卡的被展示时间；目标选项卡用于展示任意信息类型对应的信息；

S220，遍历ZS^j _t，若T_t,k＜Y2，则删除ZS^j _t,k，以得到中间选项卡展示信息集ZS’^j _t＝(ZS’^j _t,1，ZS’^j _t,2，…，ZS’^j _t,c，…，ZS’^j _t,h’(t))；ZS’^j _t,c＝(L’^j _t,c，T’^j _t,c)；其中，c＝1，2，…，h’(t)；ZS’^j _t,c为ZS’^j _t对应的第c个选项卡展示信息；L’^j _t,c为第j个用户在第t个时间段内第c次进入目标选项卡展示页面时，目标选项卡展示信息对应的信息类型；T’^j _t,c为第j个用户在第t个时间段内第c次进入目标选项卡展示页面时，中间选项卡的被展示时间；h’(t)为第j个用户在第t个时间段内进入目标选项卡展示页面的次数；h’(t)≤h(t)；Y2为第二预设阈值；

S230，根据L’^j _t,c，对ZS’^j _t进行聚类，得到若干集合，每个集合里包括至少一个选项卡展示信息；同一个集合内的选项卡展示信息对应的信息类型相同；

S240，获取ZS’^j _t对应的点击行为列表DJ’^j _t＝(DJ’^j _t,1，DJ’^j _t,2，…，DJ’^j _t,c，…，DJ’^j _t,h’(t))；其中，DJ’^j _t,c为第j个用户在第t个时间段内第c次进入目标选项卡展示页面的过程中对应的第一点击行为标识，若DJ’^j _t,c＝1则表示第j个用户在第t个时间段内第c次进入目标选项卡展示页面的过程中对目标选项卡进行过点击，若DJ’^j _t,c＝0则表示第j个用户在第t个时间段内第c次进入目标选项卡展示页面的过程中未对目标选项卡进行过点击；

S250，生成每一聚类集合对应的样本标签，以得到样本标签列表BQ^j _t＝(BQ^j _t,1，BQ^j _t,2，…，BQ^j _t,d，…，BQ^j _t,r(t))；其中，d＝1，2，…，r(t)；r(t)为第j个用户在第t个时间段内样本标签列表的数量；r(t)≤n；BQ^j _t,d为第j个用户在第t个时间段内第d个聚类集合对应的选项卡展示信息，BQ^j _t,d＝(ML^j _t,d，MH^j _t,d)；ML^j _t,d为BQ^j _t,d对应的集合所包含的选项卡展示信息对应的信息类型；MH^j _t,d为BQ^j _t,d对应的第二点击行为标识，若BQ^j _t,d对应的集合对应的每一第一点击行为的标识相加后大于等于1，则MH^j _t,d＝1；否则，MH^j _t,d＝0；

S260，获取第j个用户在第t个时间段内的历史用户特征YHj^t；

S270，根据BQ^j _t和YHj^t，获取历史数据中m个用户的训练样本列表集X＝(X¹，X²，…，X^j，…，X^m)；其中，X^j为X中第j个用户的训练样本列表，X^j＝(X^j,1，X^j,2，…，X^j,t，…，X^j,u)；X^j,t为第j个用户在第t个时间段内的训练样本列表，X^j,t＝(X^j,t ₁，X^j,t ₂，…，X^j,t _d，…，X^j,t _r(t))；X^j ^,t _d为第j个用户在第t个时间段内的第d个训练样本，X^j,t _d＝(YHj^t，BQ^j _t,d)；

3.根据权利要求1所述的推送信息类型的确定方法，其特征在于，所述步骤S300后，还包括：

S310，若SL≤Y1，获取Pg＝max(P)；

4.根据权利要求1所述的推送信息类型的确定方法，其特征在于，所述步骤S600后，还包括：

5.根据权利要求4所述的推送信息类型的确定方法，其特征在于，所述步骤S610后，还包括：

6.根据权利要求1所述的信息推送方法，其特征在于，所述步骤S900后，还包括：

7.根据权利要求1所述的推送信息类型的确定方法，其特征在于，w1+w2＝1。

8.根据权利要求1所述的推送信息类型的确定方法，其特征在于，N/A表示目标deepfm模型或者目标多臂***模型输出的待展示选项卡对应的信息类型的点击概率上溢；0表示目标deepfm模型或者目标多臂***模型输出的待展示选项卡对应的信息类型的点击概率下溢。

9.一种非瞬时性计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条指令或至少一段程序，所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-8中任意一项的所述信息推送方法。

10.一种电子设备，其特征在于，包括处理器和权利要求9中所述的非瞬时性计算机可读存储介质。