CN112380449B

CN112380449B - 信息推荐方法、模型训练方法及相关装置

Info

Publication number: CN112380449B
Application number: CN202011398840.XA
Authority: CN
Inventors: 钟子宏
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-12-03
Filing date: 2020-12-03
Publication date: 2021-11-23
Anticipated expiration: 2040-12-03
Also published as: CN112380449A

Abstract

本申请实施例公开了一种人工智能领域的信息推荐方法、模型训练方法及相关装置，其中该信息推荐方法包括：获取预测数据集，该预测数据集包括多个目标用户各自对应的预测数据，预测数据包括第T周期内目标用户的用户特征数据、目标推荐信息的信息特征数据和预测标签；根据预测数据集中各预测数据包括的预测标签，确定预测数据集中的正负样本比例作为预测状态转移概率；通过感兴趣概率预测模型，根据用户特征数据、信息特征数据和预测状态转移概率，确定第T+1周期内目标用户对目标推荐信息的感兴趣概率；根据该感兴趣概率，确定在第T+1周期内是否向目标用户推荐目标推荐信息。该方法能够确保信息推荐的准确性。

Description

信息推荐方法、模型训练方法及相关装置

技术领域

本申请涉及人工智能(Artificial Intelligence，AI)技术领域，尤其涉及一种信息推荐方法、模型训练方法及相关装置。

背景技术

在互联网大数据时代，如何精准地向用户进行信息推荐，既满足用户个性化需求，又保证信息推荐的有效性，如今已成为很多网络平台关注的重点。

相关技术目前主要通过基于逻辑回归(Logistic Regression，LR)模型的二分类推荐方法，根据用户的行为特征(如点击通过率(Click Through Rate，CTR)等)相应地进行信息推荐。具体的，可以先利用第T周期的用户特征、推荐信息特征和用户对于推荐信息的查看情况，对逻辑回归模型进行训练；进而，利用训练得到的逻辑回归模型，根据第T+1周期的用户特征和推荐信息特征，预测用户对于推荐信息的感兴趣概率，并据此确定是否向用户推荐上述推荐信息。

然而，上述相关技术中的实现方式存在以下缺陷：受到特征数据稀疏、特征区分度低、模型效果不理想、分类阈值取值不合理等因素的影响，利用逻辑回归模型预测出的感兴趣概率往往分布较为集中，例如经常集中分布在分类阈值附近，如此，不利于准确地分辨用户对于推荐信息是否感兴趣，进而将影响信息推荐的效果。

发明内容

本申请实施例提供了一种信息推荐方法、模型训练方法及相关装置，能够降低感兴趣概率预测模型所预测的概率的集中度，便于准确地分辨用户对于推荐信息的感兴趣程度，进而确保信息推荐的准确性。

有鉴于此，本申请第一方面提供了一种信息推荐方法，所述方法包括：

获取预测数据集；所述预测数据集包括多个目标用户各自对应的预测数据，所述预测数据包括预测特征数据和预测标签，所述预测特征数据包括第T周期内所述目标用户的用户特征数据、以及所述第T周期内目标推荐信息的信息特征数据，所述预测标签是根据所述第T周期内所述目标用户对所述目标推荐信息的查看情况确定的；所述T为大于1的整数；

根据所述预测数据集中各所述预测数据包括的所述预测标签，确定所述预测数据集中的正负样本比例，作为预测状态转移概率；

通过感兴趣概率预测模型，根据所述目标用户对应的所述预测数据包括的所述预测特征数据、以及所述预测状态转移概率，确定第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率；

根据所述第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率，确定在所述第T+1周期内是否向所述目标用户推荐所述目标推荐信息。

本申请第二方面提供了一种模型训练方法，所述方法包括：

获取训练样本数据集；所述训练样本数据集包括多个用户各自对应的训练样本数据，所述训练样本数据包括训练特征数据、第一训练标签和第二训练标签，所述训练特征数据包括第T-1周期内所述用户的用户特征数据、以及所述第T-1周期内推荐信息的信息特征数据，所述第一训练标签是根据所述第T-1周期内所述用户对所述推荐信息的查看情况确定的，所述第二训练标签是根据所述第T周期内所述用户对所述推荐信息的查看情况确定的；所述T为大于1的整数；

根据所述训练样本数据集中各所述训练样本数据包括的所述第一训练标签，确定所述训练样本数据集中的正负样本比例，作为训练状态转移概率；

基于所述训练样本数据集中所述训练样本数据包括的所述训练特征数据和所述第二训练标签、以及所述训练状态转移概率，对所述感兴趣概率预测模型进行迭代训练。

本申请第三方面提供了一种信息推荐装置，所述装置包括：

预测数据获取模块，用于获取预测数据集；所述预测数据集包括多个目标用户各自对应的预测数据，所述预测数据包括预测特征数据和预测标签，所述预测特征数据包括第T周期内所述目标用户的用户特征数据、以及所述第T周期内目标推荐信息的信息特征数据，所述预测标签是根据所述第T周期内所述目标用户对所述目标推荐信息的查看情况确定的；所述T为大于1的整数；

状态转移概率确定模块，用于根据所述预测数据集中各所述预测数据包括的所述预测标签，确定所述预测数据集中的正负样本比例，作为预测状态转移概率；

感兴趣概率预测模块，用于通过感兴趣概率预测模型，根据所述目标用户对应的所述预测数据包括的所述预测特征数据、以及所述预测状态转移概率，确定第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率；

信息推荐模块，用于根据所述第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率，确定在所述第T+1周期内是否向所述目标用户推荐所述目标推荐信息。

本申请第四方面提供了一种模型训练装置，所述装置包括：

训练数据获取模块，用于获取训练样本数据集；所述训练样本数据集包括多个用户各自对应的训练样本数据，所述训练样本数据包括训练特征数据、第一训练标签和第二训练标签，所述训练特征数据包括第T-1周期内所述用户的用户特征数据、以及所述第T-1周期内推荐信息的信息特征数据，所述第一训练标签是根据所述第T-1周期内所述用户对所述推荐信息的查看情况确定的，所述第二训练标签是根据所述第T周期内所述用户对所述推荐信息的查看情况确定的；所述T为大于1的整数；

状态转移概率确定模块，用于根据所述训练样本数据集中各所述训练样本数据包括的所述第一训练标签，确定所述训练样本数据集中的正负样本比例，作为训练状态转移概率；

模型训练模块，用于基于所述训练样本数据集中所述训练样本数据包括的所述训练特征数据和所述第二训练标签、以及所述训练状态转移概率，对所述感兴趣概率预测模型进行迭代训练。

本申请第五方面提供了一种设备，所述设备包括处理器以及存储器：

所述存储器用于存储计算机程序；

所述处理器用于根据所述计算机程序，执行如上述第一方面所述的信息推荐方法的步骤或者第二方面所述的模型训练方法的步骤。

本申请第六方面提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行上述第一方面所述的信息推荐方法的步骤或者第二方面所述的模型训练方法的步骤。

本申请第七方面提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述第一方面所述的信息推荐方法的步骤或者第二方面所述的模型训练方法的步骤。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请实施例提供了一种信息推荐方法，该方法创新性地使感兴趣概率预测模型在预测感兴趣概率的过程中综合考虑状态转移概率，利用状态转移概率修正感兴趣概率预测模型的处理过程，以降低感兴趣概率预测模型预测出的感兴趣概率的集中度。具体的，在本申请实施例提供的信息推荐方法中，获取到由多个目标用户各自对应的预测数据组成的预测数据集后，根据该预测数据集中各预测数据包括的预测标签，确定该预测数据集中的正负样本比例作为预测状态转移概率，此处的预测标签是根据第T周期内目标用户对于目标推荐信息的查看情况确定的；进而，通过感兴趣概率预测模型，根据预测数据中包括的第T周期内目标用户的用户特征数据和目标推荐信息的信息特征数据、以及上述预测状态转移概率，预测第T+1周期内该目标用户对该目标推荐信息的感兴趣概率，并据此确定是否向该目标用户推荐该目标推荐信息。在上述信息推荐方法中，感兴趣概率预测模型在预测目标用户对目标推荐信息的感兴趣概率的过程中，引入了基于预测数据集中各预测数据包括的预测标签确定的预测状态转移概率，该预测状态转移概率能够有效地修正感兴趣概率预测模型预测出的感兴趣概率，降低感兴趣概率预测模型预测出的感兴趣概率的集中度；如此，便于根据该感兴趣概率预测模型预测出的感兴趣概率准确地分辨用户对于推荐信息的感兴趣程度，进而保证准确地进行信息推荐。

附图说明

图1为相关技术中基于逻辑回归模型的二分类推荐方法的原理示意图；

图2为本申请实施例提供的信息推荐方法的应用场景示意图；

图3为本申请实施例提供的信息推荐方法的流程示意图；

图4为本申请实施例提供的模型训练方法的流程示意图；

图5为本申请实施例提供的一种信息推荐方法的实现架构示意图；

图6为本申请实施例提供的另一种信息推荐方法的实现架构示意图；

图7为本申请实施例提供的第一种信息推荐装置的结构示意图；

图8为本申请实施例提供的第二种信息推荐装置的结构示意图；

图9为本申请实施例提供的第三种信息推荐装置的结构示意图；

图10为本申请实施例提供的第一种模型训练装置的结构示意图；

图11为本申请实施例提供的第二种模型训练装置的结构示意图；

图12为本申请实施例提供的第三种模型训练装置的结构示意图；

图13为本申请实施例提供的第四种模型训练装置的结构示意图；

图14为本申请实施例提供的终端设备的结构示意图；

图15为本申请实施例提供的服务器的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如，常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

本申请实施例提供的方案涉及人工智能的信息推荐技术，具体通过如下实施例进行说明：

图1为相关技术中基于逻辑回归模型的二分类推荐方法的原理示意图。如图1所示，采用该方法进行信息推荐时，需要先利用第T周期内的用户特征、推荐信息特征以及基于用户对于推荐信息的查看情况确定的标签，对逻辑回归模型进行训练；进而，利用训练得到的逻辑回归模型，根据第T+1周期的用户特征和推荐信息特征，预测用户在第T+1周期对于推荐信息的感兴趣概率，并据此确定是否向用户推荐该推荐信息。

然而，经本申请发明人研究发现，上述基于逻辑回归模型的二分类推荐方法存在以下缺陷：逻辑回归模型预测出的感兴趣概率往往集中度较高，经常集中分布在分类阈值附近，如此，不利于准确地分辨用户对于推荐信息是否感兴趣，进而可能会对信息推荐效果产生影响。

针对上述相关技术存在的问题，本申请实施例提供了一种信息推荐方法，该方法可以有效地降低模型预测出的感兴趣概率的集中度，进而，便于准确地分辨用户对于推荐信息是否感兴趣，并据此准确地进行信息推荐。

具体的，在本申请实施例提供的信息推荐方法中，先获取预测数据集；该预测数据集中包括多个目标用户各自对应的预测数据，预测数据中包括预测特征数据和预测标签，其中，预测特征数据包括第T周期内目标用户的用户特征数据、以及第T周期内目标推荐信息的信息特征数据，预测标签是根据第T周期内目标用户对目标推荐信息的查看情况确定的。然后，根据预测数据集中各预测数据包括的预测标签，确定该预测数据集中的正负样本比例作为预测状态转移概率。进而，通过感兴趣概率预测模型，根据某个目标用户对应的预测数据中包括的预测特征数据、以及上述预测状态转移概率，预测第T+1周期内该目标用户对目标推荐信息的感兴趣概率。最终，根据该第T+1周期内该目标用户对目标推荐信息的感兴趣概率，确定在第T+1周期内是否该目标用户推荐该目标推荐信息。

上述信息推荐方法创新性地使感兴趣概率预测模型在预测感兴趣概率的过程中综合考虑状态转移概率，即在感兴趣概率预测模型预测用户对于推荐信息的感兴趣概率的过程中，引入了基于预测数据集中各预测数据包括的预测标签确定的预测状态转移概率，由此利用该预测状态转移概率修正感兴趣概率预测模型预测出的感兴趣概率，以降低感兴趣概率预测模型预测出的感兴趣概率的集中度；如此，便于根据该感兴趣概率预测模型预测出的感兴趣概率，准确地分辨用户对于推荐信息的感兴趣程度，进而保证准确地进行信息推荐。

应理解，本申请实施例提供的信息推荐方法可以应用于具备数据处理能力的设备，如终端设备或服务器。其中，终端设备具体可以为计算机、智能手机、平板电脑、个人数字助理(Personal Digital Assitant，PDA)等；服务器具体可以为应用服务器或Web服务器，在实际部署时，可以为独立服务器，也可以为集群服务器或云服务器。

为了便于理解本申请实施例提供的信息推荐方法，下面以该信息推荐方法的执行主体为服务器为例，对该信息推荐方法适用的应用场景进行示例性介绍。

参见图2，图2为本申请实施例提供的信息推荐方法的应用场景示意图。如图2所示，该应用场景中包括服务器210、数据库220和数据库230，服务器210可以通过网络访问数据库220和数据库230，或者数据库220和数据库230也可以集成在服务器210中。其中，服务器210用于执行本申请实施例提供的信息推荐方法，以根据第T周期内目标用户的用户特征数据、目标推荐信息的信息特征数据和预测状态转移概率，确定在第T+1周期内是否向目标用户推荐目标推荐信息；数据库220用于存储目标网络平台上的用户的特征数据，数据库230用于存储目标网络平台上的推荐信息的信息特征数据。

需要说明的是，上文中周期的长度可以根据实际应用需求设定，例如，可以以秒、分钟、小时、天、周、月、年等为单位设置周期长度；假设一个周期的长度为一天，则服务器210需要根据第T天内目标用户的用户特征数据和目标推荐信息的信息特征数据、以及基于第T天内目标用户对于目标推荐信息的查看情况确定的预测状态转移概率，预测第T+1天内目标用户查看目标推荐信息的概率。本申请在此不对上述周期长度做任何限定。

在实际应用中，服务器210需要先获取预测数据集。具体的，服务器210可以针对多个目标用户构建其各自对应的预测数据，进而利用这多个目标用户各自对应的预测数据组成预测数据集；示例性的，服务器针对某目标用户构建对应的预测数据时，可以从数据库220中调取该目标用户在第T周期内的用户特征数据，从数据库230中调取在第T周期内向该目标用户推荐的目标推荐信息的信息特征数据，并且根据该目标用户在第T周期内对目标推荐信息的查看情况确定预测标签，进而，可以利用所调取的用户特征数据、信息特征数据以及所确定的预测标签，构成该目标用户对应的预测数据。

然后，服务器210可以根据该预测数据集中各预测数据包括的预测标签，确定该预测数据集中的正负样本比例作为预测状态转移概率。预测数据中包括的预测标签通常分为两种，一种用于反映目标用户在第T周期内查看了目标推荐信息(对应于正样本)，另一种用于反映目标用在第T周期内未查看目标推荐信息(对应于负样本)；服务器210可以根据预测数据集中各预测数据包括的预测标签的类型，确定预测数据集中两种不同的预测标签各自的占比，并将该占比作为预测状态转移概率。

进而，服务器210可以通过预先训练好的感兴趣概率预测模型，根据目标用户对应的预测数据中包括的用户特征数据、信息特征数据以及上述预测状态转移概率，预测该目标用户在第T+1周期内对目标推荐信息的感兴趣概率。需要说明的是，该感兴趣概率预测模型是预先基于训练样本数据集训练得到的，该训练样本数据集中包括多个用户各自对应的训练样本数据，训练样本数据具体包括第T-1周期内用户的用户特征数据、第T-1周期内推荐信息的信息特征数据、第一训练标签以及第二训练标签；此处的第一训练标签是根据第T-1周期内用户对推荐信息的查看情况确定的，对感兴趣概率预测模型进行训练时，需要利用到基于训练样本数据集中各第一训练标签确定的训练状态转移概率；此处的第二训练标签是根据第T周期内用户对推荐信息的查看情况确定的。

服务器210通过感兴趣概率预测模型预测出目标用户在第T+1周期内对目标推荐信息的感兴趣概率后，可以根据该感兴趣概率，确定是否在第T+1周期内向该目标用户推荐目标推荐信息。

应理解，图2所示的应用场景仅为示例，在实际应用中，本申请实施例提供的信息推荐方法还可以应用于其它应用场景，例如，可以由终端设备执行本申请实施例提供的信息推荐方法，本申请在此不对该信息推荐方法的应用场景做任何限定。

下面通过方法实施例对本申请提供的信息推荐方法进行详细介绍。

参见图3，图3为本申请实施例提供的信息推荐方法的流程示意图。为了便于描述，下述实施例仍以该信息推荐方法的执行主体为服务器为例进行介绍。如图3所示，该信息推荐方法包括以下步骤：

步骤301：获取预测数据集；所述预测数据集包括多个目标用户各自对应的预测数据，所述预测数据包括预测特征数据和预测标签，所述预测特征数据包括第T周期内所述目标用户的用户特征数据、以及所述第T周期内目标推荐信息的信息特征数据，所述预测标签是根据所述第T周期内所述目标用户对所述目标推荐信息的查看情况确定的；所述T为大于1的整数。

当服务器需要确定是否在第T+1周期内向目标用户推荐目标推荐信息时，服务器需要先获取预测目标用户对目标推荐信息的感兴趣概率时所需依据的基础数据—预测数据集。该预测数据集中包括多个目标用户各自对应的预测数据，每个目标用户对应的预测数据中包括预测特征数据和预测标签；其中，预测特征数据包括第T周期内目标用户的用户特征数据、以及第T周期内目标推荐信息的信息特征数据；预测标签是根据第T周期内目标用户对于目标推荐信息的查看情况确定的，其能够反映目标用户是否查看目标推荐信息。

在一种可能的实现方式中，服务器可以自主构建预测数据集。示例性的，服务器可以将第T周期内目标网络平台上的所有登录用户均视为目标用户，并且针对每个目标用户构建对应的预测数据，进而利用各目标用户各自对应的预测数据组成预测数据集。针对某目标用户构建其对应的预测数据时，服务器可以从用于存储用户特征数据的数据库中调取该目标用户在第T周期内的用户特征数据，从用于存储信息特征数据的数据库中调取第T周期内向该目标用户推荐的目标推荐信息的信息特征数据，并且根据该目标用户在第T周期内对于目标推荐信息的查看情况确定对应的预测标签，进而利用所调取的用户特征数据、信息特征数据和所确定的预测标签，构成该目标用户对应的预测数据。

在另一种可能的实现方式中，服务器也可以从其它相关设备处获取已构建的预测数据，组成预测数据集。示例性的，第T周期结束后，相关设备可以针对第T周期内目标网络平台上的每个登录用户，根据其在第T周期内的用户特征数据、在第T周期内向其推荐的目标推荐信息的信息特征数据、以及基于其对目标推荐信息的查看情况确定的预测标签，构建对应的预测数据；当服务器需要预测第T+1周期内目标网络平台上登录的各目标用户对于目标推荐信息的感兴趣概率时，服务器可以从相关设备处获取其构建的各目标用户各自对应的预测数据，组成预测数据集。

应理解，在实际应用中，服务器也可以通过其它方式获取预测数据集，本申请在此不对服务器获取该预测数据集的方式做任何限定。

需要说明的是，本申请实施例中的多个目标用户，可以是第T周期内目标网络平台上的所有登录用户或部分登录用户，也可以是第T+1周期内目标网络平台上的所有登录用户或部分登录用户，还可以是在第T周期和第T+1周期均在目标网络平台上登录的全部用户或部分用户，本申请在此不对多个目标用户做具体限定。

需要说明的是，上述目标网络平台可以是任意一种具有信息推荐业务的平台，如购物平台、音频播放平台、视频播放平台、新闻推荐平台等等，本申请在此不对该目标网络平台的类型做任何限定。不同的目标网络平台所推荐的目标推荐信息往往也有所差别，例如，对于购物网络平台，其推荐的目标推荐信息可以包括商品信息、商品优惠券等等，又例如，对于音视频播放平台，其推荐的目标推荐信息可以包括音频资源、视频资源等等，再例如，对于新闻推荐平台，其推荐的目标推荐信息可以包括新闻文章、新闻链接、新闻音视频等等，本申请在此也不对目标网络平台推荐的目标推荐信息做任何限定。

需要说明的是，对于不同的目标网络平台，预测数据中目标用户的用户特征数据也会有所差别。例如，对于购物平台来说，目标用户的用户特征数据可以包括以下任意一种或多种的组合：用于表征用户个人基本信息(如性别、年龄、所在地域等)的基础属性数据、用于表征用户操作活跃度(如持续活跃时长、活跃功能数量、第T周期距离用户注册时间的时间间隔等)的活跃属性数据、用于表征用户购买情况(如充值金额、消费金额、充值次数、充值天数、第T周期距离首次充值时间的时间间隔、所领取的优惠券的相关信息等)的消费属性数据；对于音视频播放平台来说，可以将适用于购物平台的消费属性数据替换为用于表征用户的历史资源播放情况的资源播放属性数据；对于新闻推荐平台来说，可以将适用于购物平台的消费属性数据替换为用于表征用户的历史新闻浏览情况的信息浏览属性数据。本申请在此不对用户特征数据做具体限定。

需要说明的是，对于不同的目标网络平台，预测数据中目标推荐信息的信息特征数据也会有所差别。例如，对于购物平台来说，目标推荐信息的信息特征数据可以包括以下任意一种或多种的组合：商品的点击率、费率、被收藏率、平均付费金额(商品的总付费金额/付费人数)、平均活跃时长(商品的总活跃时间/活跃人数)等；对于音视频播放平台来说，目标推荐信息的信息特征数据可以包括以下任意一种或多种的组合：音视频资源在预设时段内的播放次数、被收藏率、用户评分等等；对于新闻推荐平台来说，目标推荐信息的信息特征数据可以包括新闻信息的热度、产生时间、被浏览次数、被收藏率等等。本申请在此不对信息特征数据做具体限定。

需要说明的是，对于不同的目标推荐信息，预测数据中的预测标签的确定方式也有所差别。例如，对于购物平台来说，在目标推荐信息为商品信息的情况下，若目标用户在第T周期内查看了该商品信息，则可以确定该目标用户对应的预测数据中的预测标签为1，若目标用户在第T周期内未查看该商品信息，则可以确定该目标用户对应的预测数据中的预测标签为0；在目标推荐信息为商品优惠券的情况下，若目标用户在第T周期内下载了该商品优惠券，则可以确定该目标用户对应的预测数据中的预测标签为1，若目标用户在第T周期内未下载该商品优惠券，则可以确定该目标用户对应的预测数据中的预测标签为0。又例如，对于音视频播放平台来说，若目标用户在第T周期内播放了所推荐的音视频资源，则可以确定该目标用户对应的预测数据中的预测标签为1，若目标用户在第T周期内未播放所推荐的音视频资源，则可以确定该目标用户对应的预测数据中的预测标签为0。对于新闻推荐平台来说，若目标用户在第T周期内查看了所推荐的新闻信息或新闻链接，则可以确定该目标用户对应的预测数据中的预测标签为1，若目标用户在第T周期内未查看所推荐的新闻信息或新闻链接，则可以确定该目标用户对应的预测数据中的预测标签为0。本申请在此不对预测数据中预测标签的确定方式做任何限定。

步骤302：根据所述预测数据集中各所述预测数据包括的所述预测标签，确定所述预测数据集中的正负样本比例，作为预测状态转移概率。

服务器获取到预测数据集后，可以根据其中各预测数据包括的预测标签，计算该预测数据集中正样本和负样本各自在该预测数据集中所占的比例，并将计算得到的正负样本比例作为预测状态转移概率。

示例性的，服务器可以将所包括的预测标签为1的预测数据视为正样本，将所包括的预测标签为0的预测数据视为负样本；在此基础上，服务器可以计算预测数据集中所包括的预测标签为0的预测数据在预测数据集中的占比，作为预测数据集中的负样本占比

相应地，

即为预测数据集中的正样本占比。进而，将

作为预测状态转移概率(p_0,T，1-p_0,T)的无偏估计，无偏估计是指估计量的数学期望等于被估参数的真实值。

步骤303：通过感兴趣概率预测模型，根据所述目标用户对应的所述预测数据包括的所述预测特征数据、以及所述预测状态转移概率，确定第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率。

服务器调用预先训练好的感兴趣概率预测模型，将目标用户对应的预测数据中包括的预测特征数据(即用户特征数据和信息特征数据)、以及通过步骤302计算得到的预测状态转移概率输入该感兴趣概率预测模型，感兴趣概率预测模型对输入的预测特征数据和预测状态转移概率进行相应地处理，并输出对应的处理结果，该处理结果即为第T+1周期内目标用户对目标推荐信息的感兴趣概率。

在一种可能的实现方式中，服务器可以仅将某一目标用户对应的预测数据中包括的预测特征数据、以及通过步骤302计算得到的预测状态转移概率输入该感兴趣概率预测模型，以通过该感兴趣概率预测模型预测该目标用户在第T+1周期内对目标推荐信息的感兴趣概率。

在另一种可能的实现方式中，服务器也可以将预测数据集中各目标用户各自对应的预测数据中包括的预测特征数据、以及通过步骤302计算得到的预测状态转移概率均输入感兴趣概率预测模型，以通过该感兴趣概率预测模型预测在第T+1周期内各目标用户各自对目标推荐信息的感兴趣概率。

需要说明的是，上述感兴趣概率预测模型是基于训练样本数据集训练得到的；该训练样本数据集中包括多个用户各自对应的训练样本数据，每个用户对应的训练样本数据中包括训练特征数据、第一训练标签和第二训练标签；其中，训练特征数据包括第T-1周期内用户的用户特征数据、以及第T-1周期内向该用户推荐的推荐信息的信息特征数据；第一训练标签是根据第T-1周期内用户对推荐信息的查看情况确定的；第二训练标签是根据第T周期内用户对推荐信息的查看情况确定的。

训练感兴趣概率预测模型时，可以根据训练样本数据集中各训练样本数据包括的第一训练标签，确定训练样本数据集中的正负样本比例作为训练状态转移概率；进而，利用训练样本数据集中训练样本数据包括的训练特征数据、第二训练标签和该训练状态转移概率，通过梯度下降算法迭代调整所训练的感兴趣概率预测模型的模型参数，此处通过梯度下降算法求解的过程会受到状态转移概率的影响，可以在一定程度上提高模型的收敛速度。具体训练该感兴趣概率预测模型的实现方式将在下文通过实施例详细介绍。

示例性的，上述感兴趣概率预测模型可以为用于预测为正样本的模型、或者用于预测为负样本的模型，用于预测为正样本的模型具体可以如式(1)所示，用于预测为负样本的模型具体可以如式(2)所示。

其中，Y_t∈{0,1}取0或1这两个状态的概率分别为p₀和(1-p₀)；式(1)和式(2)中，

表示输入的预测特征数据，p₀和(1-p₀)为输入的预测状态转移概率，

和W_y为感兴趣概率预测模型的模型参数，需要基于训练样本数据集训练得到。

考虑到感兴趣概率预测模型处理的预测特征数据中通常包括大量的稀疏特征，这可能导致模型泛化能力不足、预测效果不佳。针对此问题，在本申请实施例提供的方法中，服务器可以在目标用户对应的预测数据包括的预测特征数据中，确定稀疏特征数据；进而，通过深度神经网络(Deep Neural Networks，DNN)模型处理该稀疏特征数据，得到第一目标特征数据。相应地，服务器可以通过感兴趣概率预测模型，根据上述第一目标特征数据、预测特征数据中除稀疏特征数据外的特征数据、以及预测状态转移概率，确定第T+1周期内目标用户对目标推荐信息的感兴趣概率。

示例性的，服务器可以将预测特征数据中的稀疏特征数据提取出来，例如，将用户性别、用户标识、用户年龄等稀疏型的特征数据提取出来；进而，可以利用DNN模型处理所提取出的稀疏特征数据，得到对应的embedding特征(即第一目标特征数据)。相应地，服务器通过感兴趣概率预测模型预测目标用户在第T+1周期内对目标推荐信息的感兴趣概率时，可以将通过DNN模型处理得到的embedding特征、预测特征数据中除所提取出的稀疏特征数据外的特征数据、以及通过步骤302计算得到的预测状态转移概率，输入该感兴趣概率预测模型。

需要说明的是，在实际应用中，通常可以使用包含5层网络架构的DNN模型处理稀疏特征数据，当然，也可以根据实际需求设置所采用的DNN模型的网络结构，本申请在此不对该DNN模型的网络结构做具体限定。

为了取得更好的预测效果，保证可以更准确地预测第T+1周期内目标用户对目标推荐信息的感兴趣概率，在本申请实施例提供的方法中，服务器可以在目标用户对应的预测数据包括的预测特征数据中，确定稠密特征数据；进而，对稠密特征数据进行预处理，得到第二目标特征数据，此处的预处理包括以下至少一种处理方式：去相关性处理、归一化处理、特征离散化处理。相应地，服务器可以通过感兴趣概率预测模型，根据上述第二目标特征数据、预测特征数据中除稠密特征数据外的特征数据、以及预测状态转移概率，确定第T+1周期内目标用户对目标推荐信息的感兴趣概率。

示例性的，服务器可以将预测特征数据中的稠密特征数据提取出来，例如，将用户的充值金额、消费金额、活跃时间长度以及商品的购买人数等稠密型的特征数据提取出来；进而，对所提取出的稠密特征数据进行主元分析(Principal component analysis，PCA)去相关性处理、归一化处理、特征离散化处理等等，得到第二目标特征数据。相应地，服务器通过感兴趣概率预测模型预测目标用户在第T+1周期内对目标推荐信息的感兴趣概率时，可以将经上述预处理得到的第二目标特征数据、预测特征数据中除所提取出的稠密特征数据外的特征数据、以及通过步骤302计算得到的预测状态转移概率，输入该感兴趣概率预测模型。

应理解，在实际应用中，除了可以采用上述处理方式对稠密特征数据进行预处理外，也可以根据实际需求采用其它处理方式对稠密特征数据进行预处理，本申请在此不对预处理时采用的处理方式做任何限定。

需要说明的是，在实际应用中，为了使感兴趣概率预测模型可以更准确地预测目标用户在第T+1周期内对目标推荐信息的感兴趣概率，服务器可以既通过DNN模型对预测特征数据中的稀疏特征数据进行处理，又对预测特征数据中的稠密特征数据进行处理。即，服务器可以在目标用户对应的预测特征数据中区分出稀疏特征数据和稠密特征数据，利用DNN模型处理稀疏特征数据得到对应的第一目标特征数据，对稠密特征数据进行PCA去相关性处理、归一化处理、特征离散化处理等预处理，得到对应的第二目标特征数据；进而，通过感兴趣概率预测模型，根据上述第一目标特征数据、第二目标特征数据和通过步骤302确定的预测状态转移概率，预测目标用户在第T+1周期内对目标推荐信息的感兴趣概率。

步骤304：根据所述第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率，确定在所述第T+1周期内是否向所述目标用户推荐所述目标推荐信息。

最终，服务器可以根据感兴趣概率预测模型所预测的第T+1周期内目标用户对目标推荐信息的感兴趣概率，确定是否在第T+1周期内向目标用户推荐该目标推荐信息。

在一种可能的实现方式中，服务器可以预先设置分类阈值，服务器获取到感兴趣概率模型根据某目标用户对应的预测特征数据和预测状态转移概率预测出的感兴趣概率后，可以判断该感兴趣概率是否大于该分类阈值；若该感兴趣概率大于该分类阈值，则说明该目标用户在第T+1周期内查看目标推荐信息的可能性较大，进而，服务器可以在第T+1周期内向该目标用户推荐该目标推荐信息；反之，若该感兴趣概率不大于该分类阈值，则说明该目标用户在第T+1周期内查看该目标推荐信息的可能性较小，相应地，服务器无需在第T+1周期内向该目标用户推荐该目标推荐信息。

在另一种可能的实现方式中，服务器可以根据感兴趣概率预测模型预测出的第T+1周期内各目标用户各自对目标推荐信息的感兴趣概率，确定一个用于划分正负样本的分类阈值；对于感兴趣概率大于该分类阈值的正预测数据，可以相应地向该预测数据对应的目标用户推荐目标推荐信息，对于感兴趣概率不大于该分类阈值的负预测数据，无需向该预测数据对应的目标用户推荐目标推荐信息。

应理解，在实际应用中，服务器还可以采用其它方式基于感兴趣概率预测模型预测出的感兴趣概率，相应地确定是否向目标用户推荐目标推荐信息，本申请在此不对基于感兴趣概率确定是否向目标用户推荐目标推荐信息的实现方式做任何限定。

本申请实施例提供的信息推荐方法，创新性地使感兴趣概率预测模型在预测感兴趣概率的过程中综合考虑状态转移概率，即在感兴趣概率预测模型预测用户对于推荐信息的感兴趣概率的过程中，引入了基于预测数据集中各预测数据包括的预测标签确定的预测状态转移概率，由此利用该预测状态转移概率修正感兴趣概率预测模型预测出的感兴趣概率，以降低感兴趣概率预测模型预测出的感兴趣概率的集中度；如此，便于根据该感兴趣概率预测模型预测出的感兴趣概率，准确地分辨用户对于推荐信息的感兴趣程度，进而保证准确地进行信息推荐。

本申请实施例提供的信息推荐方法能否准确地进行信息推荐，在极大程度上取决于上述感兴趣概率预测模型的模型性能，下面通过方法实施例对该感兴趣概率预测模型的训练方法进行详细介绍。

参见图4，图4为本申请实施例提供的模型训练方法的流程示意图。为了便于描述，下述实施例以该模型训练方法的执行主体为服务器为例进行介绍。如图3所示，该模型训练方法包括以下步骤：

步骤401：获取训练样本数据集；所述训练样本数据集包括多个用户各自对应的训练样本数据，所述训练样本数据包括训练特征数据、第一训练标签和第二训练标签，所述训练特征数据包括第T-1周期内所述用户的用户特征数据、以及所述第T-1周期内推荐信息的信息特征数据，所述第一训练标签是根据所述第T-1周期内所述用户对所述推荐信息的查看情况确定的，所述第二训练标签是根据所述第T周期内所述用户对所述推荐信息的查看情况确定的；所述T为大于1的整数。

服务器训练感兴趣概率预测模型时，需要获取训练样本数据集。该训练样本数据集中包括目标网络平台上的多个用户各自对应的训练样本数据，每个用户对应的训练样本数据中包括训练特征数据、第一训练标签和第二训练标签；其中，训练特征数据包括第T-1周期内用户的用户特征数据、以及第T-1周期内向该用户推荐的推荐信息的信息特征数据；第一训练标签是根据第T-1周期内该用户对推荐信息的查看情况确定的；第二训练标签是根据第T周期内该用户对推荐信息的查看情况确定的。

与获取预测数据集的实现过程相类似，服务器获取训练样本数据集时，既可以自主构建训练样本数据集，又可以从其它相关设备处获取已构建的训练样本数据，组成训练样本数据集。获取训练样本数据集的具体实现过程，可以参照上文中步骤301提及的获取预测数据集的具体实现过程，此处不再赘述；两个实现过程的差别在于所需获取的特征数据所属的工作周期不同，且在获取训练样本数据时需要额外获取第二训练标签。

需要说明的是，上述训练样本数据集中各训练样本数据各自对应的用户，可以是第T-1周期内目标网络平台上的所有登录用户或部分登录用户，也可以是第T周期内目标网络平台上的所有登录用户或部分登录用户，还可以是在第T-1周期和第T周期均在目标网络平台上登录的全部用户或部分用户，本申请在此不对训练样本数据集中各训练样本数据各自对应的用户做任何限定。

需要说明的是，本申请实施例中的目标网络平台与图3所示实施例中的目标网络平台相同，具体可以参见图3所示实施例中目标网络平台的相关介绍内容。本申请实施例中的训练样本数据包括的用户特征数据和信息特征数据，分别与图3所示实施例中的预测数据包括的用户特征数据和信息特征数据相同，差别仅在于特征数据所对应的工作周期不同，具体可以参见图3所示实施例中用户特征数据和信息特征数据的相关介绍内容。本申请实施例中的第一训练标签和第二训练标签的确定方式，均与图3所示实施例中的预测标签的确定方式相同，具体可以参见图3所示实施例中预测标签的确定方式的相关介绍内容。

考虑到在实际应用中，需要在训练感兴趣概率预测模型的过程中掺杂对于所训练的感兴趣概率预测模型的测试，以检测是否完成对于感兴趣概率预测模型的训练。因此，服务器获取到训练样本数据后，需要按照预设比例将该训练样本数据集中的各训练样本数据分别划分至训练子样本数据集和测试子样本数据集，其中，被划分至训练子样本数据集中的训练样本数据可以专用于对感兴趣概率预测模型进行训练，被划分至测试子样本数据集中的训练样本数据可以专用于对感兴趣概率预测模型进行测试。

示例性的，服务器可以按照预设比例，将训练样本数据集中的训练样本数据随机地划分至训练子样本数据集和测试子样本数据集；例如，可以按照训练子样本数据集包括的训练样本数据与测试子样本数据集包括的训练样本数据成8:2的比例，对训练样本数据集进行划分。当然，在实际应用中，可以根据实际需求设置上述预设比例，本申请在此不对该预设比例做任何限定。

步骤402：根据所述训练样本数据集中各所述训练样本数据包括的所述第一训练标签，确定所述训练样本数据集中的正负样本比例，作为训练状态转移概率。

服务器获取到训练样本数据集后，可以根据其中各训练样本数据包括的第一训练标签，计算该训练样本数据集中正样本和负样本各自在该训练样本数据集中所占的比例，并将计算得到的正负样本比例作为训练状态转移概率。

示例性的，服务器可以将所包括的第一训练标签为1的训练样本数据视为正样本，将所包括的第一训练标签为0的训练样本数据视为负样本；在此基础上，服务器可以计算训练样本数据集中所包括的第一训练标签为0的训练样本数据在训练样本数据集中的占比，作为训练样本数据集中的负样本占比

相应地，

即为训练样本数据集中的正样本占比。进而，将

作为训练状态转移概率(p_0,T-1，1-p_0,T-1)的无偏估计，无偏估计是指估计量的数学期望等于被估参数的真实值。

步骤403：基于所述训练样本数据集中所述训练样本数据包括的所述训练特征数据和所述第二训练标签、以及所述训练状态转移概率，对所述感兴趣概率预测模型进行迭代训练。

进而，服务器可以根据训练样本数据集中训练样本数据包括的训练特征数据(即用户特征数据和信息特征数据)和第二训练标签、以及通过步骤402计算得到的训练状态转移概率，对待训练的感兴趣概率预测模型进行迭代训练，直至得到满足训练结束条件的感兴趣概率预测模型。

具体的，服务器可以将训练样本数据中包括的训练特征数据和训练状态转移概率，输入待训练的感兴趣概率预测模型，并获取该感兴趣概率预测模型对该训练特征数据和训练状态转移概率进行处理后得到的输出结果；进而，基于该输出结果与该训练样本数据中包括的第二训练标签之间的差异，通过状态转移下的梯度下降算法(即在梯度下降求解的过程中均受到训练状态转移概率的影响)，对该感兴趣概率预测模型的模型参数进行调整。如此，利用训练样本数据集中的训练样本数据，通过上述过程对该感兴趣概率预测模型的模型参数进行不断的调整，实现对于该感兴趣概率预测模型的反复迭代训练。

示例性的，上述待训练的感兴趣概率预测模型可以为用于预测为正样本的模型、或者用于预测为负样本的模型，用于预测为正样本的模型具体可以如式(1)所示，用于预测为负样本的模型具体可以如式(2)所示。

表示输入的训练特征数据，p₀和(1-p₀)为输入的训练状态转移概率，

和W_y为所要训练的感兴趣概率预测模型的模型参数。

应理解，在训练样本数据集被划分为训练子样本数据集和测试子样本数据集的情况下，执行上述感兴趣概率预测模型的训练过程时，服务器需要使用训练子样本数据集中训练样本数据包括的训练特征数据和第二训练标签、以及训练状态转移概率，对该感兴趣概率预测模型进行迭代训练。

考虑到训练感兴趣概率预测模型时使用的训练特征数据中通常包括大量的稀疏特征，采用这种稀疏特征对感兴趣概率预测模型进行训练，可能导致模型泛化能力不足，预测效果不佳。针对此问题，在本申请实施例提供的方法中，服务器可以在训练样本数据包括的训练特征数据中，确定稀疏特征数据；进而，通过DNN模型处理该稀疏特征，得到第一训练特征数据。相应地，服务器可以基于该第一训练特征数据、训练特征数据中除稀疏特征数据外的特征数据、以及训练状态转移概率，对感兴趣概率预测模型进行迭代训练。

示例性的，服务器可以将训练特征数据中的稀疏特征数据提取出来，例如，将用户性别、用户标识、用户年龄等稀疏型的特征数据提取出来；进而，可以利用DNN模型处理所提取出的稀疏特征数据，得到对应的embedding特征(即第一训练特征数据)。相应地，服务器可以基于通过DNN模型处理得到的embedding特征、训练特征数据中除所提取出的稀疏特征数据外的特征数据、以及通过步骤402计算得到的训练状态转移概率，对感兴趣概率预测模型进行迭代训练。

为了使训练得到的感兴趣概率预测模型能够取得更好的预测效果，在本申请实施例提供的方法中，服务器可以在训练样本数据包括的训练特征数据中，确定稠密特征数据；进而，对稠密特征数据进行预处理，得到第二训练特征数据，此处的预处理包括以下至少一种处理方式：去相关性处理、归一化处理、特征离散化处理。相应地，服务器可以基于该第二训练特征数据、训练特征数据中除稠密特征数据外的特征数据、以及训练状态概率，对感兴趣概率预测模型进行迭代训练。

示例性的，服务器可以将训练特征数据中的稠密特征数据提取出来，例如，将用户的充值金额、消费金额、活跃时间长度以及商品的购买人数等稠密型的特征数据提取出来；进而，对所提取出的稠密特征数据进行PCA去相关性处理、归一化处理、特征离散化处理等等，得到第二训练特征数据。相应地，服务器可以基于经上述预处理得到的第二训练特征数据、训练特征数据中除所提取出的稠密特征数据外的特征数据，以及通过步骤402计算得到的训练状态转移概率，对感兴趣概率预测模型进行迭代训练。

需要说明的是，在实际应用中，为了使训练得到的感兴趣概率预测模型具有更好的模型性能，服务器可以既通过DNN模型对训练特征数据中的稀疏特征数据进行处理，又对训练特征数据中的稠密特征数据进行处理。即，服务器可以在训练特征数据中区分出稀疏特征数据和稠密特征数据，利用DNN模型处理稀疏特征数据得到对应的第一训练特征数据，对稠密特征数据进行PCA去相关性处理、归一化处理、特征离散化处理等预处理，得到对应的第二训练特征数据；进而，服务器可以基于上述第一训练特征数据、第二训练特征数据和通过步骤402确定的训练状态转移概率，对感兴趣概率预测模型进行迭代训练。

在训练样本数据集被划分为训练子样本数据集和测试子样本数据集的情况下，完成一轮对于感兴趣概率预测模型的迭代训练后，服务器可以利用测试子样本数据集中训练样本数据包括的训练特征数据和第二训练标签、以及通过步骤402计算得到的训练状态转移概率，测试经迭代训练得到的感兴趣概率预测模型的模型性能是否满足预设条件；此处的预设条件可以包括以下至少一种：查全率达到第一预设阈值、查准率达到第二预设阈值、感受性曲线的下方面积(Area Under Curve，AUC)达到第三预设阈值。在确定感兴趣概率预测模型的模型性能满足上述预设条件的情况下，相应地确定完成对于该感兴趣概率预测模型的训练。

具体的，服务器可以将测试子样本数据集中训练样本数据包括的训练特征数据(即用户特征数据和信息特征数据)以及训练状态转移概率，输入经迭代训练得到的感兴趣概率预测模型，该感兴趣概率预测模型对输入的训练特征数据和训练状态转移概率进行相应地处理，得到对应的输出结果。然后，服务器可以根据该感兴趣概率预测模型基于测试子样本数据集中多个训练样本数据处理得到的输出结果、以及这多个训练样本数据中包括的第二训练标签，确定该感兴趣概率预测模型的性能参数，如查全率、查准率和AUC中的至少一种。进而，服务器可以根据感兴趣概率预测模型的性能参数，判断当前是否完成对于该感兴趣概率预测模型的训练，例如，服务器可以执行以下至少一种判断操作：判断该感兴趣概率预测模型的查全率是否达到第一预设阈值、判断该感兴趣概率预测模型的查准率是否达到第二预设阈值、判断该感兴趣概率预测模型的AUC是否达到第三预设阈值。

需要说明的是，上述查全率是指预测正确的正训练样本数据占测试时采用的真正为正训练样本数据的比例；上述查准率是指预测正确的正训练样本数据占所有预测为正训练样本数据的比例；上述AUC是感受性曲线(receiver operating characteristic curve，ROC)与坐标值围成的面积，是用于判断感兴趣概率预测模型优劣的标准。在实际应用中，上述第一预设阈值、第二预设阈值和第三预设阈值均可以根据实际需求设定，本申请在此不对上述第一预设阈值、第二预设阈值和第三预设阈值做任何限定。

本申请实施例提供的感兴趣概率预测模型的训练方法，在迭代训练感兴趣概率预测模型的过程中融入了训练状态转移概率，使得梯度下降的过程可以受到训练状态转移概率的影响，如此，可以在一定程度上提高该感兴趣概率预测模型的收敛速度。

为了便于进一步理解本申请实施例提供的信息推荐方法，下面以本申请实施例提供的方法应用于出现服务中加油优惠券下载预估的场景为例，对该信息推荐方法进行整体示例性介绍。此处出现服务中加油优惠券下载预估的实现目的在于，根据用户在第T周期内对于出现服务中的加油优惠券的下载操作，预测用户在第T+1周期内是否会下载出现服务中的加油优惠券。

图5和图6为本申请实施例提供的信息推荐方法的实现架构示意图，图5和图6分别从不同的维度展现了本申请实施例提供的信息推荐方法的实现架构，下面结合图5和图6对本申请实施例提供的信息推荐方法的整体实现过程进行介绍。

本申请实施例提供的信息推荐方法主要可以分为以下七个阶段：样本数据集预处理阶段、状态转移概率计算阶段、DNN模型特征处理阶段、状态转移下的模型训练阶段、状态转移下的模型测试阶段、状态转移下的模型预测阶段和分类下载推荐阶段，下面分别对这七个阶段进行详细介绍。在加油优惠券下载预估的场景中，第T-1周期的用户标签和第T周期的用户标签分别表征用户在第T-1周期和第T周期对于加油优惠券的下载情况，用户标签为1表征用户下载了加油优惠券，用户标签为0表征用户没有下载加油优惠券；用户特征数据可以包括用户在出行服务功能界面上的点击行为特征数据，信息特征数据可以包括出行服务功能界面上各项功能的点击率、加油优惠券的下载率、曝光量、点击量等特征数据。

在样本数据集预处理阶段，服务器可以构建训练样本数据(其中包括训练样本和测试样本)和预测数据。

构建训练样本数据时，服务器可以使用第T-1周期的用户特征数据、信息特征数据、用户标签以及第T周期的用户标签构建训练样本数据，并在用户特征数据和信息特征数据区分出稀疏特征数据和稠密特征数据。其中，稀疏特征数据需要经过DNN模型处理，稠密特征数据需要经过PCA去相关性处理、归一化处理、特征离散化处理等。按照预设比例，随机地将所构建的训练样本数据划分至训练子样本数据集(比例为a)和测试子样本数据集(比例为1-a)，例如，按照通用经验使训练子样本数据集中的训练样本数据与测试子样本数据集中的训练样本数据的比例为8:2。

构建预测数据时，服务器可以使用第T周期的用户特征数据、信息特征数据、用户标签构建预测数据，并在用户特征数据和信息特征数据区分出稀疏特征数据和稠密特征数据。其中，稀疏特征数据需要经过DNN模型处理，稠密特征数据需要经过PCA去相关性处理、归一化处理、特征离散化处理等。

上述用户特征数据主要包括：用户性别、年龄、地域等基础属性数据，活跃天数、活跃时长、活跃功能数量、当前时间距离注册时间的天数间隔等活跃属性数据，充值金额、消费金额、充值次数、充值天数、当前时间距离首次充值时间的天数间隔等充值属性数据，点击优惠券次数、领取优惠券的信息(如数量、次数、价值)、使用优惠券的信息(如数量、价值)、过期优惠券的信息(如数量、价值)等优惠券属性数据。在加油优惠券下载预估的场景中，用户标签为1表示用户点击且下载优惠券，包括该用户标签的样本数据为正样本；用户标签为0表示用户点击而未下载优惠券，包括该用户标签的样本数据为负样本。

在状态转移概率计算阶段，服务器需要确定模型训练阶段的训练状态转移概率，即利用第T-1周期的用户标签计算正负样本比例(负样本占比为

正样本占比为

)，作为训练状态转移概率(p_0,T-1，1-p_0,T-1)的无偏估计。服务器还需要确定模型预测阶段的预测状态转移概率，即利用第T周期的用户标签计算正负样本比例(负样本占比为

正样本占比为

)，作为预测状态转移概率(p_0,T，1-p_0,T)的无偏估计。

在DNN模型特征处理阶段，服务器可以通过DNN模型，对训练样本数据和测试样本数据中的稀疏特征数据进行处理，得到对应的embedding特征。此处可以使用5层网络架构的DNN模型进行处理。

在状态转移下的模型训练阶段，服务器可以利用训练样本数据中的稀疏特征数据对应的embedding特征、训练样本数据中的稠密特征数据和第T周期的用户标签、以及训练状态转移概率(p_0,T-1，1-p_0,T-1)，基于状态转移下的梯度下降法对感兴趣概率预测模型进行训练，得到模型权重W。

在状态转移下的模型测试阶段，服务器可以采用测试子样本数据集中的训练样本数据，对基于模型权重W的感兴趣概率预测模型(LR模型)进行测试，并且在测试过程中代入训练状态转移概率(p_0,T-1，1-p_0,T-1)。具体可以测试该感兴趣概率预测模型的测评指标(如查全率、查准率、AUC等)是否达到预设的测评效果，若达到，则可以保存基于模型权重W的感兴趣概率预测模型，若未达到，则需要回到状态转移下的模型训练阶段，继续对该感兴趣概率预测模型进行训练。

在状态转移下的模型预测阶段，服务器可以通过基于模型权重W的感兴趣概率预测模型，根据预测数据中的稀疏特征数据对应的embedding特征、预测数据中的稠密特征数据、以及预测状态转移概率(p_0,T，1-p_0,T)，计算用户在第T+1周期对加油优惠券的感兴趣概率，即对于加油优惠券的下载概率。

在分类下载推荐阶段，服务器可以对预测得到的下载概率按照一定阈值(如0.5)进行正负样本的划分，其中，正样本对应的用户有意愿下载加油优惠券，可以将其标记为1，负样本对应的用户没有意愿下载加油优惠券，可以将其标记为0；进而，对被标记为1的用户进行加油优惠券的推荐。

此外，本申请实施例提供的方法还可以应用于加油服务推荐等场景，当本申请实施例提供的方法应用于加油服务推荐场景时，服务器可以根据用户在第T周期内体验的加油服务，预测用户在第T+1周期内是否会体验使用所推荐的加油服务。本申请实施例提供的方法在加油服务推荐场景中的具体实现过程，与上述加油优惠券下载预估场景中的具体实现过程相类似，区别通常仅在于两种场景下训练样本数据和预测数据中的用户特征数据和信息特征数据有所不同，在加油服务推荐场景中，用户特征数据除了可以包括上述基础属性数据、活跃属性数据和充值数据数据外，还可以包括加油服务体验次数、加油服务详情信息、加油服务价值等加油服务属性数据，信息特征数据是与加油服务相关的特征数据；相应地，在加油服务推荐场景中，用户标签为1表示用户使用了加油服务，用户标签为0表示用户没有使用加油服务。

应理解，本申请实施例提供的方法还可以应用于商品推荐、音视频推荐、文章推荐、链接推荐等场景，在不同的场景下，基于相应场景中的用户特征数据和信息特征数据构建训练样本数据和预测数据，在此不对本申请实施例提供的信息推荐方法所适用的场景，以及对应场景下应当使用的用户特征数据和信息特征数据做任何限定。

本申请发明人对相关技术中的逻辑回归模型和本申请实施例中的感兴趣概率预测模型进行了对比测试，测试结果如表1所示。

表1

	相关技术中的逻辑回归模型	本申请中的感兴趣概率预测模型
			查全率	71.61％	88.37％
查准率	63.22％	88.52％
			AUC	0.6518	0.9003

通过对比可以发现，本申请实施例中的感兴趣概率预测模型的各方面性能均优于相关技术中的逻辑回归模型。

针对上文描述的信息推荐方法，本申请还提供了对应的信息推荐装置，以使上述信息推荐方法在实际中的应用以及实现。

参见图7，图7是上文图3所示的信息推荐方法对应的一种信息推荐装置700的结构示意图。如图7所示，该信息推荐装置700包括：

预测数据获取模块701，用于获取预测数据集；所述预测数据集包括多个目标用户各自对应的预测数据，所述预测数据包括预测特征数据和预测标签，所述预测特征数据包括第T周期内所述目标用户的用户特征数据、以及所述第T周期内目标推荐信息的信息特征数据，所述预测标签是根据所述第T周期内所述目标用户对所述目标推荐信息的查看情况确定的；所述T为大于1的整数；

状态转移概率确定模块702，用于根据所述预测数据集中各所述预测数据包括的所述预测标签，确定所述预测数据集中的正负样本比例，作为预测状态转移概率；

感兴趣概率预测模块703，用于通过感兴趣概率预测模型，根据所述目标用户对应的所述预测数据包括的所述预测特征数据、以及所述预测状态转移概率，确定第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率；

信息推荐模块704，用于根据所述第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率，确定在所述第T+1周期内是否向所述目标用户推荐所述目标推荐信息。

可选的，在图7所示的信息推荐装置的基础上，参见图8，图8为本申请实施例提供的另一种信息推荐装置800的结构示意图。如图8所示，该信息推荐装置还包括：

稀疏特征处理模块801，用于在所述目标用户对应的所述预测数据包括的所述预测特征数据中，确定稀疏特征数据；通过深度神经网络模型处理所述稀疏特征数据，得到第一目标特征数据；

则所述感兴趣概率预测模块703具体用于：

通过所述感兴趣概率预测模型，根据所述第一目标特征数据、所述预测特征数据中除所述稀疏特征数据外的特征数据、以及所述预测状态转移概率，确定所述第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率。

可选的，在图7所示的信息推荐装置的基础上，参见图9，图9为本申请实施例提供的另一种信息推荐装置900的结构示意图。如图9所示，该信息推荐装置还包括：

稠密特征处理模块901，用于在所述目标用户对应的所述预测数据包括的所述预测特征数据中，确定稠密特征数据；对所述稠密特征数据进行预处理，得到第二目标特征数据；所述预处理包括以下至少一种处理方式：去相关性处理、归一化处理、特征离散化处理；

则所述感兴趣概率预测模块703具体用于：

通过所述感兴趣概率预测模型，根据所述第二目标特征数据、所述预测特征数据中除所述稠密特征数据外的特征数据、以及所述预测状态转移概率，确定所述第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率。

可选的，在图7所示的信息推荐装置的基础上，所述感兴趣概率预测模型是基于训练样本数据集训练得到的；所述训练样本数据集包括多个用户各自对应的训练样本数据，所述训练样本数据包括训练特征数据、第一训练标签和第二训练标签，所述训练特征数据包括第T-1周期内所述用户的用户特征数据、以及所述第T-1周期内推荐信息的信息特征数据，所述第一训练标签是根据所述第T-1周期内所述用户对所述推荐信息的查看情况确定的，所述第二训练标签是根据所述第T周期内所述用户对所述推荐信息的查看情况确定的。

可选的，在图7所示的信息推荐装置的基础上，所述用户特征数据包括以下至少一种：用于表征个人基本信息的基础属性数据、用于表征用户操作活跃度的活跃属性数据、用于表征用户购买情况的消费属性数据；

所述推荐信息包括以下至少一种：商品信息、商品优惠券。

本申请实施例提供的信息推荐装置，创新性地使感兴趣概率预测模型在预测感兴趣概率的过程中综合考虑状态转移概率，即在感兴趣概率预测模型预测用户对于推荐信息的感兴趣概率的过程中，引入了基于预测数据集中各预测数据包括的预测标签确定的预测状态转移概率，由此利用该预测状态转移概率修正感兴趣概率预测模型预测出的感兴趣概率，以降低感兴趣概率预测模型预测出的感兴趣概率的集中度；如此，便于根据该感兴趣概率预测模型预测出的感兴趣概率，准确地分辨用户对于推荐信息的感兴趣程度，进而保证准确地进行信息推荐。

针对上文描述的模型训练方法，本申请还提供了对应的模型训练装置，以使上述模型训练方法在实际中的应用以及实现。

参见图10，图10是上文图4所示的模型训练方法对应的一种模型训练装置1000的结构示意图。如图10所示，该模型训练装置1000包括：

训练数据获取模块1001，用于获取所述训练样本数据集；所述训练样本数据集包括多个用户各自对应的训练样本数据，所述训练样本数据包括训练特征数据、第一训练标签和第二训练标签，所述训练特征数据包括第T-1周期内所述用户的用户特征数据、以及所述第T-1周期内推荐信息的信息特征数据，所述第一训练标签是根据所述第T-1周期内所述用户对所述推荐信息的查看情况确定的，所述第二训练标签是根据所述第T周期内所述用户对所述推荐信息的查看情况确定的；所述T为大于1的整数；

状态转移概率确定模块1002，用于根据所述训练样本数据集中各所述训练样本数据包括的所述第一训练标签，确定所述训练样本数据集中的正负样本比例，作为训练状态转移概率；

模型训练模块1003，用于基于所述训练样本数据集中所述训练样本数据包括的所述训练特征数据和所述第二训练标签、以及所述训练状态转移概率，对所述感兴趣概率预测模型进行迭代训练。

可选的，在图10所示的模型推荐装置的基础上，参见图11，图11为本申请实施例提供的另一种模型推荐装置1100的结构示意图。如图11所示，所述装置还包括：

样本划分模块1101，用于按照预设比例，将所述训练样本数据集中各所述训练样本数据分别划分至训练子样本数据集和测试子样本数据集；

则所述模型训练模块1003，具体用于基于所述训练子样本数据集中所述训练样本数据包括的所述训练特征数据和所述第二训练标签、以及所述训练状态转移概率，对所述感兴趣概率预测模型进行迭代训练；

模型测试模块1102，用于在对所述感兴趣概率预测模型进行迭代训练之后，利用所述测试子样本数据集中所述训练样本数据包括的所述训练特征数据和所述第二训练标签、以及所述训练状态转移概率，测试经迭代训练得到的所述感兴趣概率预测模型的模型性能是否满足预设条件；所述预测条件包括以下至少一种：查全率达到预设第一预设阈值、查准率达到第二预设阈值、感受性曲线的下方面积达到第三预设阈值；若所述感兴趣概率预测模型的模型性能满足所述预设条件，则确定完成对于所述感兴趣概率预测模型的训练。

可选的，在图10所示的模型训练装置的基础上，参见图12，图12为本申请实施例提供的另一种模型训练装置1200的结构示意图。如图12所示，所述装置还包括：

稀疏特征处理模块1201，用于在所述训练样本数据包括的所述训练特征数据中，确定稀疏特征数据；通过深度神经网络模型处理所述稀疏特征数据，得到第一训练特征数据；

则所述模型训练模块1003具体用于：

基于所述第一训练特征数据、所述训练特征数据中除所述稀疏特征数据外的特征数据、以及所述训练状态转移概率，对所述感兴趣概率预测模型进行迭代训练。

可选的，在图10所示的模型训练装置的基础上，参见图13，图13为本申请实施例提供的另一种模型训练装置1300的结构示意图。如图13所示，所述装置还包括：

稠密特征处理模块1301，用于在所述训练样本数据包括的所述训练特征数据中，确定稠密特征数据；对所述稠密特征数据进行预处理，得到第二训练特征数据；所述预处理包括以下至少一种处理方式：去相关性处理、归一化处理、特征离散化处理；

则所述模型训练模块1003具体用于：

基于所述第二训练特征数据、所述训练特征数据中除所述稠密特征数据外的特征数据、以及所述训练状态转移概率，对所述感兴趣概率预测模型进行迭代训练。

本申请实施例提供的感兴趣概率预测模型的训练装置，在迭代训练感兴趣概率预测模型的过程中融入了训练状态转移概率，使得梯度下降的过程可以受到训练状态转移概率的影响，如此，可以在一定程度上提高该感兴趣概率预测模型的收敛速度。

本申请实施例还提供了一种用于推荐信息或者训练模型的设备，该设备具体可以是终端设备或者服务器，下面将从硬件实体化的角度对本申请实施例提供的终端设备和服务器进行介绍。

参见图14，图14是本申请实施例提供的终端设备的结构示意图。如图14所示，为了便于说明，仅示出了与本申请实施例相关的部分，具体技术细节未揭示的，请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(英文全称：PersonalDigital Assistant，英文缩写：PDA)、销售终端(英文全称：Point of Sales，英文缩写：POS)、车载电脑等任意终端设备，以终端为计算机为例：

图14示出的是与本申请实施例提供的终端相关的计算机的部分结构的框图。参考图14，计算机包括：射频(英文全称：Radio Frequency，英文缩写：RF)电路1410、存储器1420、输入单元1430、显示单元1440、传感器1450、音频电路1460、无线保真(英文全称：wireless fidelity，英文缩写：WiFi)模块1470、处理器1480、以及电源1490等部件。本领域技术人员可以理解，图14中示出的计算机结构并不构成对计算机的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

存储器1420可用于存储软件程序以及模块，处理器1480通过运行存储在存储器1420的软件程序以及模块，从而执行计算机的各种功能应用以及数据处理。存储器1420可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据计算机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器1420可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器1480是计算机的控制中心，利用各种接口和线路连接整个计算机的各个部分，通过运行或执行存储在存储器1420内的软件程序和/或模块，以及调用存储在存储器1420内的数据，执行计算机的各种功能和处理数据，从而对计算机进行整体监控。可选的，处理器1480可包括一个或多个处理单元；优选的，处理器1480可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器1480中。

在本申请实施例中，该终端所包括的处理器1480还具有以下功能：

或者，

可选的，所述处理器1480还用于执行本申请实施例提供的信息推荐方法或模型训练方法的任意一种实现方式的步骤。

参见图15，图15为本申请实施例提供的一种服务器1500的结构示意图。该服务器1500可因配置或性能不同而产生比较大的差异，可以包括一个或一个以***处理器(central processing units，CPU)1522(例如，一个或一个以上处理器)和存储器1532，一个或一个以上存储应用程序1542或数据1544的存储介质1530(例如一个或一个以上海量存储设备)。其中，存储器1532和存储介质1530可以是短暂存储或持久存储。存储在存储介质1530的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1522可以设置为与存储介质1530通信，在服务器1500上执行存储介质1530中的一系列指令操作。

服务器1500还可以包括一个或一个以上电源1526，一个或一个以上有线或无线网络接口1550，一个或一个以上输入输出接口1558，和/或，一个或一个以上操作***，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

上述实施例中由服务器所执行的步骤可以基于该图15所示的服务器结构。

其中，CPU 1522用于执行如下步骤：

或者，

可选的，CPU 1522还可以用于执行本申请实施例提供的信息推荐方法或者模型训练方法的任意一种实现方式的步骤。

本申请实施例还提供一种计算机可读存储介质，用于存储计算机程序，该计算机程序用于执行前述各个实施例所述的一种信息推荐方法或者模型训练方法中的任意一种实施方式。

本申请实施例还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行前述各个实施例所述的一种信息推荐方法或者模型训练方法中的任意一种实施方式。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的***，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(英文全称：Read-OnlyMemory，英文缩写：ROM)、随机存取存储器(英文全称：Random Access Memory，英文缩写：RAM)、磁碟或者光盘等各种可以存储计算机程序的介质。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

以上所述，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种信息推荐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述目标用户对应的所述预测数据包括的所述预测特征数据中，确定稀疏特征数据；

通过深度神经网络模型处理所述稀疏特征数据，得到第一目标特征数据；

以及，所述通过感兴趣概率预测模型，根据所述目标用户对应的所述预测数据包括的所述预测特征数据、以及所述预测状态转移概率，确定第T+1周期内所述目标用户对所述目标推荐信息的感兴趣概率，包括：

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

在所述目标用户对应的所述预测数据包括的所述预测特征数据中，确定稠密特征数据；

对所述稠密特征数据进行预处理，得到第二目标特征数据；所述预处理包括以下至少一种处理方式：去相关性处理、归一化处理、特征离散化处理；

4.根据权利要求1所述的方法，其特征在于，所述感兴趣概率预测模型是基于训练样本数据集训练得到的；所述训练样本数据集包括多个用户各自对应的训练样本数据，所述训练样本数据包括训练特征数据、第一训练标签和第二训练标签，所述训练特征数据包括第T-1周期内所述用户的用户特征数据、以及所述第T-1周期内推荐信息的信息特征数据，所述第一训练标签是根据所述第T-1周期内所述用户对所述推荐信息的查看情况确定的，所述第二训练标签是根据所述第T周期内所述用户对所述推荐信息的查看情况确定的。

5.根据权利要求1或4所述的方法，其特征在于，所述用户特征数据包括以下至少一种：用于表征个人基本信息的基础属性数据、用于表征用户操作活跃度的活跃属性数据、用于表征用户购买情况的消费属性数据；

所述推荐信息包括以下至少一种：商品信息、商品优惠券。

6.一种模型训练方法，其特征在于，所述方法包括：

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

按照预设比例，将所述训练样本数据集中各所述训练样本数据分别划分至训练子样本数据集和测试子样本数据集；

以及，所述基于所述训练样本数据集中所述训练样本数据包括的所述训练特征数据和所述第二训练标签、以及所述训练状态转移概率，对所述感兴趣概率预测模型进行迭代训练，包括：

基于所述训练子样本数据集中所述训练样本数据包括的所述训练特征数据和所述第二训练标签、以及所述训练状态转移概率，对所述感兴趣概率预测模型进行迭代训练；

在所述对所述感兴趣概率预测模型进行迭代训练之后，所述方法还包括：

利用所述测试子样本数据集中所述训练样本数据包括的所述训练特征数据和所述第二训练标签、以及所述训练状态转移概率，测试经迭代训练得到的所述感兴趣概率预测模型的模型性能是否满足预设条件；所述预测条件包括以下至少一种：查全率达到预设第一预设阈值、查准率达到第二预设阈值、感受性曲线的下方面积达到第三预设阈值；

若所述感兴趣概率预测模型的模型性能满足所述预设条件，则确定完成对于所述感兴趣概率预测模型的训练。

8.根据权利要求6所述的方法，其特征在于，所述方法还包括：

在所述训练样本数据包括的所述训练特征数据中，确定稀疏特征数据；

通过深度神经网络模型处理所述稀疏特征数据，得到第一训练特征数据；

9.根据权利要求6所述的方法，其特征在于，所述方法还包括：

在所述训练样本数据包括的所述训练特征数据中，确定稠密特征数据；

对所述稠密特征数据进行预处理，得到第二训练特征数据；所述预处理包括以下至少一种处理方式：去相关性处理、归一化处理、特征离散化处理；

10.一种信息推荐装置，其特征在于，所述装置包括：

11.根据权利要求10所述的装置，其特征在于，所述装置还包括：

稀疏特征处理模块，用于在所述目标用户对应的所述预测数据包括的所述预测特征数据中，确定稀疏特征数据；通过深度神经网络模型处理所述稀疏特征数据，得到第一目标特征数据；

则所述感兴趣概率预测模块具体用于：

12.根据权利要求10所述的装置，其特征在于，所述装置还包括：

稠密特征处理模块，用于在所述目标用户对应的所述预测数据包括的所述预测特征数据中，确定稠密特征数据；对所述稠密特征数据进行预处理，得到第二目标特征数据；所述预处理包括以下至少一种处理方式：去相关性处理、归一化处理、特征离散化处理；

则所述感兴趣概率预测模块具体用于：

13.一种模型训练装置，其特征在于，所述装置包括：

14.一种设备，其特征在于，所述设备包括处理器及存储器；

所述存储器用于存储计算机程序；

所述处理器用于根据所述计算机程序执行权利要求1至5中任一项所述的信息推荐方法或者权利要求6至9中任一项所述的模型训练方法。

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机程序，所述计算机程序用于执行权利要求1至5中任一项所述的信息推荐方法或者权利要求6至9中任一项所述的模型训练方法。