CN111126495A

CN111126495A - 模型训练方法、信息预测方法、装置、存储介质及设备

Info

Publication number: CN111126495A
Application number: CN201911360658.2A
Authority: CN
Inventors: 杨晚鹏; 谭怒涛
Original assignee: Guangzhou Baiguoyuan Information Technology Co Ltd
Current assignee: Bigo Technology Pte Ltd
Priority date: 2019-12-25
Filing date: 2019-12-25
Publication date: 2020-05-08
Anticipated expiration: 2039-12-25
Also published as: WO2021129055A1; CN111126495B; EP4083857A1; US20230066853A1; EP4083857A4

Abstract

本发明实施例公开了模型训练方法、信息预测方法、装置、存储介质及设备。其中，模型训练方法包括：获取当前训练周期对应的训练样本集合，其中，训练样本集合中的训练样本包含特征项目、对应的特征属性值以及用户针对信息条目的行为数据，对训练样本集合中的行为数据进行统计，并利用当前行为统计数据更新第一信息预测模型中的第一行为统计数据，得到第二信息预测模型，其中，第一信息预测模型对应于上一个训练周期，利用训练样本集合对第二信息预测模型进行训练。通过采用上述技术方案，可以更准确地训练模型中的参数，提升模型准确性，在需要进行信息预测时，可以及时获取到最新的模型用于信息预测，可提升信息预测的准确度以及时效性。

Description

模型训练方法、信息预测方法、装置、存储介质及设备

技术领域

本发明实施例涉及计算机技术领域，尤其涉及模型训练方法、信息预测方法、装置、存储介质及设备。

背景技术

随着互联网领域的飞速发展，***式增长的信息导致用户想要获取感兴趣的有效内容越来越困难。个性化推荐技术已经成为互联网领域不可或缺的基础技术，在涉及新闻、短视频和音乐等信息的产品中扮演着越来越重要的角色。

目前，一般的信息推荐***往往采用流式统计任务(如sparkstreaming或者flink等)进行用户行为的连续特征(如点击、点赞以及分享等行为特征)统计和更新，行为特征数据存储于分布式存储***(如redis等)，当线上需要进行推荐时，需要通过流式统计任务从存储***读取行为特征并进行行为特征抽取及行为特征统计，然后与当前样本一起输入至预先训练好的信息预测模型中进行预测，再根据预测结果进行信息推荐。然而，上述方案中信息预测模型准确性不高，需要改进。

发明内容

本发明实施例提供了模型训练方法、装置、设备和存储介质，可以优化现有的信息预测模型的训练方案。

第一方面，本发明实施例提供了一种信息预测模型训练方法，该方法包括：

获取当前训练周期对应的训练样本集合，其中，所述训练样本集合中的训练样本包含特征项目、所述特征项目对应的特征属性值以及用户针对信息条目的行为数据，特征项目中包含用户特征和/或信息条目特征；

对所述训练样本集合中的所述行为数据进行统计，得到当前行为统计数据，并利用所述当前行为统计数据更新第一信息预测模型中的第一行为统计数据，得到第二信息预测模型，其中，所述第一信息预测模型对应于上一个训练周期；

利用所述训练样本集合对所述第二信息预测模型进行训练，得到训练后的第三信息预测模型。

第二方面，本发明实施例提供了一种信息预测方法，该方法包括：

获取候选信息条目对应的当前样本；

获取信息预测模型，其中，所述信息预测模型采用本发明实施例提供的信息预测模型训练方法训练得到；

将所述当前样本输入至所述信息预测模型，并根据所述信息预测模型的输出结果确定所述候选信息条目对应的预测结果。

第三方面，本发明实施例提供了一种信息预测模型训练装置，该装置包括：

训练样本获取模块，用于获取当前训练周期对应的训练样本集合，其中，所述训练样本集合中的训练样本包含特征项目、所述特征项目对应的特征属性值以及用户针对信息条目的行为数据，特征项目中包含用户特征和/或信息条目特征；

行为统计数据更新模块，用于对所述训练样本集合中的所述行为数据进行统计，得到当前行为统计数据，并利用所述当前行为统计数据更新第一信息预测模型中的第一行为统计数据，得到第二信息预测模型，其中，所述第一信息预测模型对应于上一个训练周期；

模型训练模块，用于利用所述训练样本集合对所述第二信息预测模型进行训练，得到训练后的第三信息预测模型。

第四方面，本发明实施例提供了一种信息预测装置，该装置包括：

样本获取模块，用于获取候选信息条目对应的当前样本；

模型获取模块，用于获取信息预测模型，其中，所述信息预测模型采用本发明实施例提供的信息预测模型训练方法训练得到；

预测模块，用于将所述当前样本输入至所述信息预测模型，并根据所述信息预测模型的输出结果确定所述候选信息条目对应的预测结果。

第三方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例提供的方法。

第四方面，本发明实施例提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如本发明实施例提供的方法。

本发明实施例中提供的信息预测模型训练方案，获取当前训练周期对应的训练样本集合，其中，训练样本集合中的训练样本包含特征项目、特征项目对应的特征属性值以及用户针对信息条目的行为数据，特征项目中包含用户特征和/或信息条目特征，对训练样本集合中的行为数据进行统计，得到当前行为统计数据，并利用当前行为统计数据更新第一信息预测模型中的第一行为统计数据，得到第二信息预测模型，其中，第一信息预测模型对应于上一个训练周期，利用训练样本集合对第二信息预测模型进行训练，得到训练后的第三信息预测模型。通过采用上述技术方案，可以周期性的根据训练样本集合统计行为数据，并将行为统计数据加入到上一个训练周期的信息预测模型中，然后再利用训练样本集合对上一个训练周期的信息预测模型进行训练更新，也即让行为统计数据参与到模型训练过程中，从而可以更准确地训练模型中的参数，提升模型准确性，在需要进行信息预测时，可以及时获取到最新的模型用于信息预测，可提升信息预测的准确度以及时效性。

附图说明

图1为本发明实施例提供的一种信息预测模型训练方法的流程示意图；

图2为本发明实施例提供的又一种信息预测模型训练方法的流程示意图；

图3为本发明实施例提供的一种信息预测模型的结构示意图；

图4为本发明实施例提供的一种信息预测方法的流程示意图；

图5为本发明实施例提供的一种信息预测模型训练装置的结构框图；

图6为本发明实施例提供的一种信息预测装置的结构框图；

图7为本发明实施例提供的一种计算机设备的结构框图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。此外，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

图1为本发明实施例提供的一种信息预测模型训练方法的流程示意图，该方法可以由信息预测模型训练装置执行，其中该装置可由软件和/或硬件实现，一般可集成在计算机设备中。如图1所示，该方法包括：

步骤101、获取当前训练周期对应的训练样本集合，其中，所述训练样本集合中的训练样本包含特征项目、所述特征项目对应的特征属性值以及用户针对信息条目的行为数据，所述特征项目中包含用户特征和/或信息条目特征。

本发明实施例中的信息预测模型可应用于新闻、资讯、文章、音乐以及短视频等各种推荐场景，信息条目可以是对新闻、资讯、文章、音乐以及短视频等信息进行展示或曝光时的表现形式，如标题、名称、图标、动图或显示界面等等。一般的，信息条目由所属的应用程序(以下简称预设应用程序)进行曝光，如短视频由对应的短视频应用程序进行曝光，曝光形式可以是短视频对应的截图或短视频的播放界面等。

本发明实施例中可以周期性地训练信息预测模型，具体的训练周期可以根据实际需求进行设置，训练周期可以以时间为基准进行衡量，例如每小时为一个训练周期，也可以以样本数量为基准进行衡量，例如一个batch(批)为一个训练周期，一个batch例如可以有1024个样本。可选的，可以采集预设用户群体针对预设信息条目集合中的信息条目的行为数据，并整理成训练样本集合中的训练样本，待需要进行模型训练时进行获取，此过程可以由预设应用程序完成，预设应用程序可以实时或定时将样本传送至对应的服务器，当然预设应用程序也可以将采集的原始数据传送至对应的服务器，由服务器来完成训练样本整理的相关步骤。本发明实施例对训练样本集合中的训练样本的具体数量不做限定。

示例性的，训练样本中的特征项目可以包含用户特征，也可以包含信息条目特征。其中，用户特征例如可以是用户属性相关的一些特征，例如，性别、年龄(或所属年龄段)、职业、所在地区以及使用预设应用程序的累计年限等等。特征项目对应的特征属性值可以是特征项目可能存在的不同具体情况对应的取值，例如，性别包含男和女，职业包含教师、警察及工人等等。信息条目特征例如可以是信息条目属性相关的一些特征，以短视频为例，可以包括短视频对应的拍客、短视频类型、短视频风格、短视频拍摄地以及短视频总时长等等。用户针对信息条目的行为数据可以包括用户针对信息条目进行相关操作的行为，以短视频为例，可包括是否点击、是否播完、是否点赞、是否分享、是否评论以及播放时长等等。

步骤102、对所述训练样本集合中的所述行为数据进行统计，得到当前行为统计数据，并利用所述当前行为统计数据更新第一信息预测模型中的第一行为统计数据，得到第二信息预测模型，其中，所述第一信息预测模型对应于上一个训练周期。

可选的，第一信息预测模型可以是机器学习模型，例如可以是基于深度神经网络(Deep Neural Networks，DNN)的信息预测模型。可选的，第一信息预测模型可包括基于点击通过率(Click-Through-Rate，CTR)的信息预测模型。点击通过率指下发条目的点击到达率,即该条目的实际点击次数除以条目展现量。根据CTR可以衡量用户选择某个信息条目的可能性高低，进而实现向用户推荐用户感兴趣的信息条目。

示例性的，可以针对训练样本集合中出现的每个特征属性值分别进行统计，也可以对特征属性值进行组合，得到多个特征属性值组(例如，性别为男，职业为警察为一个特征属性值组)，并针对每个特征属性值组分别进行统计。

本发明实施例中，第一信息预测模型对应于上一个训练周期，也即第一信息预测模型是上一个训练周期采用本发明实施例提供的训练方法得到的信息预测模型。需要说明的是，若当前训练周期为第一个训练周期，那么可以将预设初始信息预测模型设定为第一个训练周期中的第一信息预测模型。相关技术中，在采用信息预测模型进行预测时，行为统计数据作为输入数据与当前样本一同输入至信息预测模型中，而本发明实施例中，在信息预测模型中增加了行为统计数据部分，也即行为统计数据作为信息预测模型中的一部分，按照训练周期进行周期性的更新，并参与模型训练。本步骤中，将上一个训练周期的第一行为统计数据替换为当前训练周期对应的当前行为统计数据，从而实现信息预测模型中的行为统计数据的更新。

步骤103、利用所述训练样本集合对所述第二信息预测模型进行训练，得到训练后的第三信息预测模型。

示例性的，在更新了行为统计数据后，得到第二信息预测模型，并在第二信息预测模型基础上利用训练样本集合进行训练，进而可以更准确地训练模型中的参数。示例性的，可以采用梯度回传的方式更新第二信息预测模型中的模型参数，得到当前训练周期对应的训练后的第三信息预测模型。

示例性的，随后，可以将第三信息预测模型发布到对应的服务端，以便服务端能够根据最新的信息预测模型进行信息预测。

可选的，也可将当前行为统计数据和训练后得到的新的模型参数发布到对应的服务端，由服务端根据当前行为统计数据和训练后得到的新的模型参数对第一信息预测模型进行更新。这样设置的好处在于，可以减少数据传输量。

可选的，在训练完成后，可以通知存储训练样本集合的存储设备删除当前训练周期对应的训练样本集合，以节省存储空间。

本发明实施例中提供的信息预测模型训练方法，获取当前训练周期对应的训练样本集合，其中，训练样本集合中的训练样本包含特征项目、特征项目分别对应的特征属性值以及用户针对信息条目的行为数据，特征项目中包含用户特征和/或信息条目特征，对训练样本集合中的行为数据进行统计，得到当前行为统计数据，并利用当前行为统计数据更新第一信息预测模型中的第一行为统计数据，得到第二信息预测模型，其中，第一信息预测模型对应于上一个训练周期，利用训练样本集合对第二信息预测模型进行训练，得到训练后的第三信息预测模型。通过采用上述技术方案，可以周期性的根据训练样本集合统计行为数据，并将行为统计数据加入到上一个训练周期的信息预测模型中，然后再利用训练样本集合对上一个训练周期的信息预测模型进行训练更新，也即让行为统计数据参与到模型训练过程中，从而可以更准确地训练模型中的参数，提升模型准确性，在需要进行信息预测时，可以及时获取到最新的模型用于信息预测，可提升信息预测的准确度以及时效性。

在一些实施例中，所述对所述训练样本集合中的所述行为数据进行统计，得到当前行为统计数据，包括：针对所述训练样本集合中出现的每个特征属性值，对当前特征属性值对应的行为数据进行统计，得到所述当前特征属性值对应的当前行为统计量；汇总各特征属性值对应的当前行为统计量，得到当前行为统计数据。这样设置的好处在于，可以更加全面地对行为数据进行统计。

在一些实施例中，所述针对所述训练样本集合中出现的每个特征属性值，对当前特征属性值对应的行为数据进行统计，包括：针对所述训练样本集合中出现的每个特征属性值，获取当前特征属性值在所述第一行为统计数据中对应的第一行为统计量，在所述第一行为统计量基础上叠加所述训练样本集合中出现的所述当前特征属性值对应的行为数据。这样设置的好处在于，可以在历史行为统计数据基础上叠加当前训练周期中出现的行为数据，相当于扩大了统计时长，能够更加全面地体现用户行为特征。

在一些实施例中，所述在所述第一行为统计量基础上叠加所述训练样本集合中出现的所述当前特征属性值对应的行为数据，包括：计算所述第一行为统计量与预设时间衰减因子的乘积；在所述乘积基础上叠加所述训练样本集合中出现的所述当前特征属性值对应的行为数据。其中，预设时间衰减因子的取值范围可以在0到1之间，可以根据实际情况进行设置，例如可以是0.9。这样设置的好处在于，可以利用预设时间衰减因子来控制历史行为统计量在当前行为统计量中所占的比重，更加合理地计算当前行为统计量。

图2为本发明实施例提供的又一种信息预测模型训练方法的流程示意图，本发明实施例在上述各可选实施例基础上进行优化。

示例性的，所述第一信息预测模型中包含嵌入层和全连接层，所述全连接层承接所述嵌入层和所述第一行为统计数据。利用所述训练样本集合对所述第二信息预测模型进行训练，得到训练后的第三信息预测模型，包括：利用所述训练样本集合对所述第二信息预测模型进行训练，以对所述第二信息预测模型中的嵌入层参数和全连接层参数进行更新，得到训练后的第三信息预测模型。

可选的，该方法可包括：

步骤201、获取当前训练周期对应的训练样本集合，其中，训练样本集合中的训练样本包含特征项目、特征项目对应的特征属性值以及用户针对信息条目的行为数据，特征项目中包含用户特征和信息条目特征。

本发明实施例中，特征项目同时包含用户特征和信息条目特征，这样设置的好处在于，可以实现交叉对象的统计，例如可以统计出不同属性的用户对某个拍客的统计量，如点击量(或点击率)、播放量(或播放率)、播完量(或播完率)、点赞量(点赞率)、分享量(分享率)、收藏量(收藏率)以及评论量(评论率)等。交叉对象的统计量在个性化推荐***中扮演着重要的角色，可更加准确地确定用户的兴趣偏好，达到千人千面的推荐效果。而相关技术中，行为特征数据存储于分布式存储***中，统计流程涉及到打点日志解析、从存储***读取特征、特征计算和新特征写入存储***，大量的计算和IO(输入输出)开销导致流式***稳定性较差，消耗资源巨大，另外所有中间和最终结果必须长久存储于内存或者分布式内存存储***，受限于存储***容量，无法实现对交叉对象的统计。而本发明实施例中，可以周期性的获取训练样本集合，并及时对行为数据进行统计，将统计结果直接更新到模型中，不需要继续存储原始数据和中间结果，有效降低对存储空间的需求。

可选的，特征属性值可以以哈希(hash)值表示。

示例性的，可以按照如下格式整理训练样本：

slot1@hashval_1_1,hashval_1_2；slot2@hashval_2_1,hashval_2_2；...；slotn@hashval_n_1,hashval_n_2action_tpl@1,0,1,0,1,8lable:1weight:1

其中slot1，slot2...slotn表示n个特征域，也即特征项目。后面的hash值分别表示各特征域属性值hash化后的hash值，每个特征域对应的hash值的数量不做限定，上述举例以两个为例，当然也可以是一个或三个以上。action_tpl表示信息条目曝光时，用户对曝光的信息条目的反馈行为对应的数组(tuple)，例如可包括是否点击、是否播完、是否点赞、是否分享、是否评论以及播放时长等，其目的是用于后面步骤做特征统计。其中，以是否点击为例，若用户点击了该信息条目，则可记为“1”，若未点击，则可记为“0”；以播放时长为例，上述举例中的“8”可表示播放时长为8分钟。label可表示训练样本标号。weight可表示当前训练样本对应的权重。

步骤202、针对训练样本集合中出现的每个特征属性值，获取当前特征属性值在第一信息预测模型中的第一行为统计数据中对应的第一行为统计量，计算第一行为统计量与预设时间衰减因子的乘积，在乘积基础上叠加训练样本集合中出现的当前特征属性值对应的行为数据，得到当前特征属性值对应的当前行为统计量。

其中，所述第一信息预测模型对应于上一个训练周期。

图3为本发明实施例提供的一种信息预测模型的结构示意图。以信息预测模型为基于CTR的DNN信息预测模型为例。图3中，field表示特征域，也即特征项目，embedding表示嵌入层，stats feature表示行为统计数据，模型经过三个全连接层最后输出CTR。

示例性的，对训练样本集合里出现的每个hash值，首先从历史版本模型(即上一个训练周期对应的第一信息预测模型，如果是首次训练则不需要加载历史模型)里读取其历史累计的行为统计量(stats_feature)，如果该hash值第一次出现，则将stats_feature用0做初始化，然后用当前样本集合中的action_tpl对其进行如下更新：

stats_feature＝stats_feature*decay_rate+action_tpl

其中，decay_rate表示时间衰减因子。需要说明的是，上述公式以一个训练样本为例，当前hash值出现在多个训练样本中，那么上述公式中的action_tpl为多个训练样本中的action_tpl的和。

为了便于说明，下面进行简单的举例说明。假设训练样本中包含3个特征项目，分别为性别、年龄段和视频类型，性别对应的特征属性值包含男和女，年龄段包含青少年、青年、中年和老年，视频类型包含A、B、C和D。行为数据包含是否点击、是否播完和是否点赞。假设训练样本集合中包含以下3个样本：

slot1@男，slot2@青少年，slot3@A，action_tpl@1,1,0lable:1weight:1

slot1@女，slot2@中年，slot3@A，action_tpl@1,1,1lable:1weight:1

slot1@男，slot2@老年，slot3@A，action_tpl@1,0,0lable:1weight:1

以男对应的hash值为例，读取上一个训练周期中对应的行为统计量，假设为[100,30,20],decay_rate为0.9，那么在[100,30,20]基础上乘以0.9，得到[90,27,18]，在样本1和样本2中出现了“男”，因此加上对应的action_tpl的取值，更新后的当前行为统计量为[90,27,18]+[1,1,0]+[1,0,0]＝[91,28,18]。

步骤203、汇总各特征属性值对应的当前行为统计量，得到当前行为统计数据。

步骤204、利用所述训练样本集合对所述第二信息预测模型进行训练，以对所述第二信息预测模型中的嵌入层参数和全连接层参数进行更新，得到训练后的第三信息预测模型。

示例性的，如图3所示，将每个特征域对应的hash值经过Embbedding layer得到隐向量，同时从统计特征更新后的模型(即第二信息预测模型)里读取该hash值对应的行为统计数据(stats feature)，将隐向量和行为统计数据拼接后经过多层全连接，得到最终模型CTR得分。在模型训练过程中，可以通过梯度回传的方式更新嵌入层参数和全连接层参数，得到训练后的第三信息预测模型。

步骤205、将第三信息预测模型发布到对应的服务端。

示例性的，将训练好的最新的第三信息预测模型及时发布到对应的服务端，以便服务端能够根据最新的信息预测模型进行信息预测。

本发明实施例提供的信息推荐模型训练方法，将行为统计数据添加到信息推荐模型中，并与嵌入层输出的隐向量一起作为全连接的输入，先对模型中的行为统计数据进行更新，再通过训练来更新嵌入层和全连接的参数，可以更准确地训练模型中的参数，提升模型准确性，并提升推荐***特征工程和模型训练流程的鲁棒性和实效性，简化模型离在线流程，提升模型迭代效率，此外，由于能够及时对行为数据进行统计，因此不需要对原始行为数据和中间数据进行存储，可有效解决存储空间局限性问题，能够轻松实现针对交叉特征的统计，并保证***稳定性。在提升模型迭代效率的基础上，在需要进行信息预测时，可以及时获取到最新的模型用于信息预测，可提升信息预测的准确度以及时效性。

图4为本发明实施例提供的一种信息预测方法的流程示意图，该方法可以由信息预测装置执行，其中该装置可由软件和/或硬件实现，一般可集成在计算机设备中。如图4所示，该方法包括：

步骤401、获取候选信息条目对应的当前样本。

示例性的，候选信息条目可根据设定策略进行选取，设定策略可根据实际需求进行设置。当前样本中包含的元素可以与上述训练样本中包含的内容相对应，例如包含相应的特征项目和特征项目对应的特征属性值。

步骤402、获取信息预测模型。

其中，所述信息预测模型采用本发明实施例提供的方法训练得到。示例性的，可从对应的线上服务端进行获取。

步骤403、将所述当前样本输入至所述信息预测模型，并根据所述信息预测模型的输出结果确定所述候选信息条目对应的预测结果。

本发明实施例提供的信息预测方法，由于采用了本发明实施例提供的信息预测模型训练方法得到信息预测模型，再基于该最新的模型进行信息预测，能够得到更加及时准确的识别结果。

在一些实施例中，所述信息预测模型包括基于点击通过率CTR的信息预测模型。所述根据所述信息预测模型的输出结果确定所述候选信息条目对应的预测结果，包括：根据所述信息预测模型的输出结果确定所述候选信息条目对应的CTR预测结果。在所述根据所述信息预测模型的输出结果确定所述候选信息条目对应的预测结果之后，还包括：根据所述CTR预测结果确定所述候选信息条目的排序；根据所述排序确定所述候选信息条目中的待推荐信息条目。这样设置的好处在于，能够基于本发明实施例提供的信息预测模型准确地预测各候选信息条目对应的CTR，并基于CTR进行排序，合理地确定待推荐信息条目，也即能够更好地解决推荐***中top k排序问题。

图5为本发明实施例提供的一种信息预测模型训练装置的结构框图，该装置可由软件和/或硬件实现，一般可集成在计算机设备中，可通过执行信息预测模型训练方法来进行模型训练。如图5所示，该装置包括：

训练样本获取模块501，用于获取当前训练周期对应的训练样本集合，其中，所述训练样本集合中的训练样本包含特征项目、所述特征项目对应的特征属性值以及用户针对信息条目的行为数据，特征项目中包含用户特征和/或信息条目特征；

行为统计数据更新模块502，用于对所述训练样本集合中的所述行为数据进行统计，得到当前行为统计数据，并利用所述当前行为统计数据更新第一信息预测模型中的第一行为统计数据，得到第二信息预测模型，其中，所述第一信息预测模型对应于上一个训练周期；

模型训练模块503，用于利用所述训练样本集合对所述第二信息预测模型进行训练，得到训练后的第三信息预测模型。

本发明实施例中提供的信息预测模型训练装置，可以周期性的根据训练样本集合统计行为数据，并将行为统计数据加入到上一个训练周期的信息预测模型中，然后再利用训练样本集合对上一个训练周期的信息预测模型进行训练更新，也即让行为统计数据参与到模型训练过程中，从而可以更准确地训练模型中的参数，提升模型准确性，在需要进行信息预测时，可以及时获取到最新的模型用于信息预测，可提升信息预测的准确度以及时效性。

在一些实施例中，所述对所述训练样本集合中的所述行为数据进行统计，得到当前行为统计数据，包括：

针对所述训练样本集合中出现的每个特征属性值，对当前特征属性值对应的行为数据进行统计，得到所述当前特征属性值对应的当前行为统计量；

汇总各特征属性值对应的当前行为统计量，得到当前行为统计数据。

在一些实施例中，所述针对所述训练样本集合中出现的每个特征属性值，对当前特征属性值对应的行为数据进行统计，包括：

针对所述训练样本集合中出现的每个特征属性值，获取当前特征属性值在所述第一行为统计数据中对应的第一行为统计量，在所述第一行为统计量基础上叠加所述训练样本集合中出现的所述当前特征属性值对应的行为数据。

在一些实施例中，所述在所述第一行为统计量基础上叠加所述训练样本集合中出现的所述当前特征属性值对应的行为数据，包括：

计算所述第一行为统计量与预设时间衰减因子的乘积；

在所述乘积基础上叠加所述训练样本集合中出现的所述当前特征属性值对应的行为数据。

在一些实施例中，所述第一信息预测模型中包含嵌入层和全连接层，所述全连接层承接所述嵌入层和所述第一行为统计数据；

利用所述训练样本集合对所述第二信息预测模型进行训练，得到训练后的第三信息预测模型，包括：

利用所述训练样本集合对所述第二信息预测模型进行训练，以对所述第二信息预测模型中的嵌入层参数和全连接层参数进行更新，得到训练后的第三信息预测模型。

在一些实施例中，该装置还包括：

发布模块，用于在所述得到训练后的第三信息预测模型之后，将所述第三信息预测模型发布到对应的服务端。

在一些实施例中，所述特征属性值以哈希值表示。

在一些实施例中，所述第一信息预测模型包括基于深度神经网络DNN的信息预测模型。

在一些实施例中，所述第一信息预测模型包括基于点击通过率CTR的信息预测模型。

图6为本发明实施例提供的一种信息预测装置的结构框图，该装置可由软件和/或硬件实现，一般可集成在计算机设备中，可通过执行信息预测方法来进行信息预测。如图6所示，该装置包括：

样本获取模块601，用于获取候选信息条目对应的当前样本；

模型获取模块602，用于获取信息预测模型，其中，所述信息预测模型采用本发明实施例提供的信息预测模型训练方法训练得到；

预测模块603，用于将所述当前样本输入至所述信息预测模型，并根据所述信息预测模型的输出结果确定所述候选信息条目对应的预测结果。

本发明实施例提供的信息预测装置，由于采用了本发明实施例提供的信息预测模型训练方法得到信息预测模型，再基于该最新的模型进行信息预测，能够得到更加及时准确的识别结果。

在一些实施例中，所述信息预测模型包括基于点击通过率CTR的信息预测模型；

所述根据所述信息预测模型的输出结果确定所述候选信息条目对应的预测结果，包括：

根据所述信息预测模型的输出结果确定所述候选信息条目对应的CTR预测结果；

该模块还包括：

排序确定模块，用于在所述根据所述信息预测模型的输出结果确定所述候选信息条目对应的预测结果之后，根据所述CTR预测结果确定所述候选信息条目的排序；

待推荐条目确定模块，用于根据所述排序确定所述候选信息条目中的待推荐信息条目。

本发明实施例还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行本发明实施例提供的信息预测模型训练方法和/或信息预测方法。

存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括：安装介质，例如CD-ROM、软盘或磁带装置；计算机***存储器或随机存取存储器，诸如DRAM、DDRRAM、SRAM、EDORAM，兰巴斯(Rambus)RAM等；非易失性存储器，诸如闪存、磁介质(例如硬盘或光存储)；寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外，存储介质可以位于程序在其中被执行的第一计算机***中，或者可以位于不同的第二计算机***中，第二计算机***通过网络(诸如因特网)连接到第一计算机***。第二计算机***可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机***中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

本发明实施例提供了一种计算机设备，该计算机设备中可集成本发明实施例提供的模型训练装置。图7为本发明实施例提供的一种计算机设备的结构框图。计算机设备700包括存储器701、处理器702及存储在存储器701上并可在处理器702上运行的计算机程序，所述处理器702执行所述计算机程序时实现本发明实施例提供的信息预测模型训练方法和/或信息预测方法。

上述实施例中提供的信息预测模型训练装置、信息预测装置、存储介质以及计算机设备可执行本发明相应实施例所提供的方法，具备执行方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本发明任意实施例所提供的方法。

注意，上述仅为本发明的较佳实施例。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由权利要求范围决定。

Claims

1.一种信息预测模型训练方法，其特征在于，包括：

获取当前训练周期对应的训练样本集合，其中，所述训练样本集合中的训练样本包含特征项目、所述特征项目对应的特征属性值以及用户针对信息条目的行为数据，所述特征项目中包含用户特征和/或信息条目特征；

2.根据权利要求1所述的方法，其特征在于，所述对所述训练样本集合中的所述行为数据进行统计，得到当前行为统计数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述针对所述训练样本集合中出现的每个特征属性值，对当前特征属性值对应的行为数据进行统计，包括：

4.根据权利要求3所述的方法，其特征在于，所述在所述第一行为统计量基础上叠加所述训练样本集合中出现的所述当前特征属性值对应的行为数据，包括：

计算所述第一行为统计量与预设时间衰减因子的乘积；

5.根据权利要求1所述的方法，其特征在于，所述第一信息预测模型中包含嵌入层和全连接层，所述全连接层承接所述嵌入层和所述第一行为统计数据；

6.根据权利要求1所述的方法，其特征在于，在所述得到训练后的第三信息预测模型之后，还包括：

将所述第三信息预测模型发布到对应的服务端。

7.根据权利要求1-6任一所述的方法，其特征在于，所述特征属性值以哈希值表示。

8.根据权利要求1-6任一所述的方法，其特征在于，所述第一信息预测模型包括基于深度神经网络DNN的信息预测模型。

9.根据权利要求1-6任一所述的方法，其特征在于，所述第一信息预测模型包括基于点击通过率CTR的信息预测模型。

10.一种信息预测方法，其特征在于，包括：

获取候选信息条目对应的当前样本；

获取信息预测模型，其中，所述信息预测模型采用如权利要求1-9任一所述的方法训练得到；

11.根据权利要求10所述的方法，其特征在于，所述信息预测模型包括基于点击通过率CTR的信息预测模型；

在所述根据所述信息预测模型的输出结果确定所述候选信息条目对应的预测结果之后，还包括：

根据所述CTR预测结果确定所述候选信息条目的排序；

根据所述排序确定所述候选信息条目中的待推荐信息条目。

12.一种信息预测模型训练装置，其特征在于，包括：

13.一种信息预测装置，其特征在于，包括：

样本获取模块，用于获取候选信息条目对应的当前样本；

模型获取模块，用于获取信息预测模型，其中，所述信息预测模型采用如权利要求1-9任一所述的方法训练得到；

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-11中任一所述的方法。

15.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-11任一项所述的方法。