CN112883265A

CN112883265A - 信息推荐方法、装置、服务器及计算机可读存储介质

Info

Publication number: CN112883265A
Application number: CN202110185529.5A
Authority: CN
Inventors: 朱静雅; ***; 尚铮; 程佳
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-02-10
Filing date: 2021-02-10
Publication date: 2021-06-01

Abstract

本公开提供了一种信息推荐方法、装置、服务器及存储介质，属于互联网技术领域。所述方法包括：将目标用户特征、每条候选信息的信息特征及交叉特征输入到粗排模型中，输出每条候选信息的粗排分数，粗排模型基于精排模型的训练结果训练得到；基于每条候选信息的粗排分数，从多条候选信息中，筛选出多条第一信息；基于精排模型，从多条第一信息中，筛选出多条第二信息；将多条第二信息推荐给目标用户。本公开中的粗排模型基于精排模型的训练结果训练得到，因而能够学习到精排模型的排序机制，在线应用时，基于同一排序机制对候选信息进行排序，从而能够筛选出满足用户需求的信息，提高了所推荐信息的准确性。

Description

信息推荐方法、装置、服务器及计算机可读存储介质

技术领域

本公开涉及互联网技术领域，特别涉及一种信息推荐方法、装置、服务器及计算机可读存储介质。

背景技术

在互联网技术领域，信息推荐包括三个阶段，分别为召回、粗排及精排。召回是指从海量信息中筛选出用户可能感兴趣的信息；粗排是指采用较少特征训练的粗排模型，对召回的信息进行排序，从而将召回的信息缩小到合理范围；精排是指采用较多特征训练的精排模型，对筛选的信息进行排序，从而将筛选的信息缩小到预期数量。面对互联网上的海量信息，通过对召回的信息进行粗排及精排，保证所推荐信息的覆盖性和准确性。

相关技术中，基于粗排模型对召回的信息进行排序，从中筛选出第一数量条信息，该粗排模型基于多个训练样本信息和第一优化目标训练得到；基于精排模型对第一数量条信息进行排序，从中筛选出第二数量条信息，该精排模型基于多个训练样本信息和第二优化目标训练得到；将第二数量条信息推荐给用户。

然而，由于粗排模型和精排模型基于不同的优化目标训练得到，导致精排模型和粗排模型的排序机制不同，采用粗排模型和精排模型无法按照统一的标准进行排序，因而推荐的信息并不准确。

发明内容

本公开实施例提供了一种信息推荐方法、装置、服务器及计算机可读存储介质，能够提高所推荐信息的准确性。所述技术方案如下：

第一方面，提供了一种信息推荐方法，所述方法包括：

获取多条候选信息；

提取目标用户的目标用户特征，并提取每条候选信息的信息特征及每条候选信息与所述目标用户的交叉特征；

将所述目标用户特征、每条候选信息的信息特征及交叉特征输入到粗排模型中，输出每条候选信息的粗排分数，所述粗排模型基于精排模型的训练结果训练得到；

基于每条候选信息的粗排分数，从所述多条候选信息中，筛选出多条第一信息；

基于所述精排模型，从所述多条第一信息中，筛选出多条第二信息；

将所述多条第二信息推荐给所述目标用户。

在本公开的另一个实施例中，所述粗排模型的训练过程为：

基于所述精排模型，从用于训练所述精排模型的多条训练样本信息中，获取多条粗排样本信息；

提取每条粗排样本信息的训练信息特征、点击每条粗排样本信息的用户的用户特征以及每个用户与每条粗排样本信息之间的训练交叉特征；

基于每条粗排样本信息的训练信息特征、点击每条粗排样本信息的用户的用户特征以及每个用户与每条粗排样本信息之间的训练交叉特征，对初始粗排模型进行训练，得到所述粗排模型。

在本公开的另一个实施例中，所述基于所述精排模型，从用于训练所述精排模型的多条训练样本信息中，获取多条粗排样本信息，包括：

基于所述精排模型对所述多条训练样本信息的精排分数，获取排位在前预设位数的训练样本信息；

将所述排位在前预设位数的训练样本信息确定为正样本，将其余的训练样本信息确定为负样本；

将所述正样本和所述负样本组成为所述多条粗排样本信息。

将所述排位在前预设位数的训练样本信息及与每条训练样本信息来源于同一查询请求且排位在预设位数之后的至少一条训练样本信息，确定为所述多条粗排训练样本信息。

基于所述粗排模型预估每条训练样本信息的点击率和转化率；

根据每条训练样本信息的点击率和转化率，确定每条训练样本信息的排序分数；

基于每条训练样本信息的排序分数，从所述多条训练样本信息中，获取多条粗排训练样本信息。

第二方面，提供了一种信息推荐装置，所述装置包括：

第一获取模块，用于获取多条候选信息；

第一提取模块，用于提取目标用户的目标用户特征；

第二提取模块，还用于提取每条候选信息的信息特征及每条候选信息与所述目标用户的交叉特征；

输入输出模块，用于将所述目标用户特征、每条候选信息的信息特征及交叉特征输入到粗排模型中，输出每条候选信息的粗排分数，所述粗排模型基于精排模型的训练结果训练得到；

第一筛选模块，用于基于每条候选信息的粗排分数，从所述多条候选信息中，筛选出多条第一信息；

第二筛选模块，还用于基于所述精排模型，从所述多条第一信息中，筛选出多条第二信息；

推荐模块，用于将所述多条第二信息推荐给所述目标用户。

在本公开的另一个实施例中，用于所述粗排模型的装置包括：

第二获取模块，用于基于所述精排模型，从用于训练所述精排模型的多条训练样本信息中，获取多条粗排样本信息；

第三提取模块，用于提取每条粗排样本信息的训练信息特征、点击每条粗排样本信息的用户的用户特征以及每个用户与每条粗排样本信息之间的训练交叉特征；

训练模块，用于基于每条粗排样本信息的训练信息特征、点击每条粗排样本信息的用户的用户特征以及每个用户与每条粗排样本信息之间的训练交叉特征，对初始粗排模型进行训练，得到所述粗排模型。

在本公开的另一个实施例中，所述第二获取模块，还用于基于所述精排模型对所述多条训练样本信息的精排分数，获取排位在前预设位数的训练样本信息；将所述排位在前预设位数的训练样本信息确定为正样本，将其余的训练样本信息确定为负样本；将所述正样本和所述负样本组成为所述多条粗排样本信息。

在本公开的另一个实施例中，所述第二获取模块，还用于基于所述精排模型对所述多条训练样本信息的精排分数，获取排位在前预设位数的训练样本信息；将所述排位在前预设位数的训练样本信息及与每条训练样本信息来源于同一查询请求且排位在预设位数之后的至少一条训练样本信息，确定为所述多条粗排训练样本信息。

在本公开的另一个实施例中，所述第二获取模块，还用于基于所述粗排模型预估每条训练样本信息的点击率和转化率；根据每条训练样本信息的点击率和转化率，确定每条训练样本信息的排序分数；基于每条训练样本信息的排序分数，从所述多条训练样本信息中，获取多条粗排训练样本信息。

第三方面，提供了一种服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如第一方面所述的信息推荐方法。

第四方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现第一方面所述的信息推荐方法。

本公开实施例提供的技术方案带来的有益效果是：

由于粗排模型基于精排模型的训练结果训练得到，因而能够学习到精排模型的排序机制，在线应用时，基于同一排序机制对候选信息进行排序，从而能够筛选出满足用户需求的信息。同时在基于粗排模型和精排模型进行信息筛选时，不仅考虑了候选信息本身的信息特征和目标用户的用户特征，而且还考虑了候选信息和目标用户之间的交叉特征，对目标用户和候选信息进行全面刻画，从而在进行信息推荐时，大大提高了所推荐信息的准确性。

附图说明

为了更清楚地说明本公开实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本公开实施例提供的一种信息推荐方法所涉及的实施环境的示意图；

图2是本公开实施例提供的一种信息推荐方法的整体架构图；

图3是本公开实施例提供的一种粗排模型的架构图；

图4是本公开实施例提供的一种信息推荐方法的流程图；

图5是本公开实施例提供的一种信息推荐方法的流程图；

图6是本公开实施例提供的一种粗排模型的训练方法的流程图；

图7是本公开实施例提供的一种信息推荐装置的结构示意图；

图8示出了本公开一个示例性实施例提供的一种服务器的结构框图。

具体实施方式

为使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开实施方式作进一步地详细描述。

可以理解，本公开实施例所使用的术语“每个”、“多个”及“任一”等，多个包括两个或两个以上，每个是指对应的多个中的每一个，任一是指对应的多个中的任意一个。举例来说，多个词语包括10个词语，而每个词语是指这10个词语中的每一个词语，任一词语是指10个词语中的任意一个词语。

请参考图1，其示出了本公开实施例提供的信息推荐方法所涉及的实施环境，该实施环境包括：终端101和服务器102。

其中，终端101中安装有购物类应用、新闻类应用、搜索类应用等至少一种应用，基于所安装的应用，终端101能够向服务器发起信息查询请求，也能够接收服务器推送的信息。终端101可以为智能手机、平板电脑、笔记本电脑、台式电脑等设备，本公开实施例不对终端101的产品类型作具体的限定。

服务器102为终端101内所安装的应用程序的后台服务器，该服务器102可以为独立的物理服务器，也可以为多个物理服务器构成的服务器集群或者分布式***，本公开实施例不对服务器102的类型作具体的限定。该服务器具有较强的计算能力，能够基于多条训练样本信息，训练精排模型，并基于精排模型的训练结果，从多条训练样本信息中，确定出用于训练粗排模型的多条粗排样本信息，进而根据多条粗排样本信息，训练粗排模型；服务器还能够基于所训练的粗排模型和精排模型，从召回的候选信息中，获取待推荐给用户的信息，并将该信息推荐给用户。

上述终端101以及服务器102可以通过有线或无线通信方式进行直接或间接地连接，本公开实施例对此不做限制。

图2为本公开实施例提供的信息推荐过程的架构图，参见图2，信息推荐过程包括离线服务过程和在线服务过程。

其中，离线服务过程主要用于训练精排模型和粗排模型。具体地，获取训练样本信息，并基于所获取的训练样本信息训练精排模型，基于所训练的精排模型对训练样本信息进行排序，进而基于排序结果，从用于训练粗排模型的训练样本信息中，获取粗排样本信息，进而基于粗排样本信息训练粗排模型。

在线服务过程主要基于所训练的粗排模型和精排模型，从召回的候选信息中，获取需要待推荐给用户的信息。

在信息推荐领域，粗排模型常用的模型包括LR(Logistic Regression，逻辑回归模型)、DSSM(Deep Structured Semantic Model，深层语义模型)或FFM(Field-awareFactorization Machine，场感知因子分解机模型)等。对于粗排模型的架构图，下面以图3为例进行说明，参见图3，粗排模型采用Wide&Deep框架，Deep部分采用双塔架构，分别为用户侧和信息侧，Wide部分包括用户和信息的交叉特征。对于该粗排模型下面分别从效果和性能的两个方面进行说明。

效果方面：粗排模型的用户侧考虑了用户的基本特征、请求的上下文特征(实时场景信息)、以及用户历史的行为序列信息。这些信息包含了用户各个维度上的信息，结合行为序列信息和注意力模型能够非常好的刻画出用户的兴趣；信息侧主要是对信息的各种信息进行刻画。通过计算用户侧的向量和信息侧的向量的余弦相似度，得出双塔部分的分数。同时，考虑到双塔模型并未考虑用户和信息之间的交叉，主要从单侧进行刻画，为了弥补这一缺陷，本公开实施例加入了Wide部分，该部分采用双侧的交叉特征，进一步对用户和信息进行描述，以辅助模型提升效果。

性能方面：深度学习模型参数量巨大，计算过程耗时较长，为了缩短计算时间，双塔部分中信息侧的向量可离线计算，并以天为单位更新加载到资源中，线上使用时只需查询离线计算结果即可。双塔部分中用户侧的向量需要在线实时计算，Wide部分需要在线实时计算。例如，当接收到用户的查询请求时，对于发送请求的用户侧计算一次即可，对于信息侧虽然会包含大量候选的信息，但是这些信息无需在线实时计算，只需从资源中加载，且Wide部分采用的是LR模型，该模型的计算速度也是较快的，因而大大缩短了粗排模型的计算时间。

综上可以看出，采用本公开实施例提供提供的粗排模型，能够在模型性能和效果方面获得较大的提升。

基于图1所示的实施环境，本公开实施例提供了一种信息推荐方法，参见图4，本公开实施例提供的方法流程包括：

401、获取多条候选信息。

402、提取目标用户的目标用户特征，并提取每条候选信息的信息特征及每条候选信息与目标用户的交叉特征。

403、将目标用户特征、每条候选信息的信息特征及交叉特征输入到粗排模型中，输出每条候选信息的粗排分数。

其中，粗排模型基于精排模型的训练结果训练得到。

404、基于每条候选信息的粗排分数，从多条候选信息中，筛选出多条第一信息。

405、基于精排模型，从多条第一信息中，筛选出多条第二信息。

406、将多条第二信息推荐给目标用户。

本公开实施例提供的方法，由于粗排模型基于精排模型的训练结果训练得到，因而能够学习到精排模型的排序机制，在线应用时，基于同一排序机制对候选信息进行排序，从而能够筛选出满足用户需求的信息。同时在基于粗排模型和精排模型进行信息筛选时，不仅考虑了候选信息本身的信息特征和目标用户的用户特征，而且还考虑了候选信息和目标用户之间的交叉特征，对目标用户和候选信息进行全面刻画，从而在进行信息推荐时，大大提高了所推荐信息的准确性。

在本公开的另一个实施例中，粗排模型的训练过程为：

基于精排模型，从用于训练精排模型的多条训练样本信息中，获取多条粗排样本信息；

基于每条粗排样本信息的训练信息特征、点击每条粗排样本信息的用户的用户特征以及每个用户与每条粗排样本信息之间的训练交叉特征，对初始粗排模型进行训练，得到粗排模型。

在本公开的另一个实施例中，基于精排模型，从用于训练精排模型的多条训练样本信息中，获取多条粗排样本信息，包括：

基于精排模型对多条训练样本信息的精排分数，获取排位在前预设位数的训练样本信息；

将排位在前预设位数的训练样本信息确定为正样本，将其余的训练样本信息确定为负样本；

将正样本和负样本组成为多条粗排样本信息。

将排位在前预设位数的训练样本信息及与每条训练样本信息来源于同一查询请求且排位在预设位数之后的至少一条训练样本信息，确定为多条粗排训练样本信息。

基于粗排模型预估每条训练样本信息的点击率和转化率；

基于每条训练样本信息的排序分数，从多条训练样本信息中，获取多条粗排训练样本信息。

上述所有可选技术方案，可以采用任意结合形成本公开的可选实施例，在此不再一一赘述。

基于图1所示的实施环境，本公开实施例提供了一种信息推荐方法，以服务器执行本公开实施例为例，参见图5，本公开实施例提供的方法流程包括：

501、服务器获取多条候选信息。

当接收到目标用户发送信息查询请求时，服务器基于该信息查询请求，采用信息召回算法从互联网上的海量信息中召回多条目标用户可能感兴趣的信息，该召回的多条信息即为多条候选信息。其中，信息召回算法包括base算法、modified算法、ranki2i算法等，本公开实施例不对信息召回算法作具体的限定。

502、服务器提取目标用户的目标用户特征，并提取每条候选信息的信息特征及每条候选信息与目标用户的交叉特征。

其中，目标用户特征包括目标用户的行为特征和目标用户的属性特征。该行为特征包括点击行为特征、收藏行为特征、查看行为特征等至少一种。属性特征包括年龄、性别、籍贯、归属地等至少一种。

信息特征根据候选信息的内容确定，例如，美食类候选信息的信息特征包括商户地址、价格、销量、评价等。

交叉特征不属于目标用户特征和信息特征，为候选信息与目标用户之间相关联的特征。例如，在外卖应用中美食推荐场景下，交叉特征可以为商户与目标用户之间的距离等。

503、服务器将目标用户特征、每条候选信息的信息特征及交叉特征输入到粗排模型中，输出每条候选信息的粗排分数。

基于所获取到的目标用户特征、每条候选信息的信息特征、每条候选信息与目标用户的交叉特征，服务器将目标用户特征、每条候选信息的信息特征、每条候选信息与目标用户的交叉特征输入到粗排模型中，输出每条候选信息的粗排分数。其中，粗排模型基于精排模型的训练结果训练得到，因而该粗排模型学习到精排模型的排序机制，从而能够基于相同的排序机制为目标用户筛选出符合要求的信息，大大提高了所推荐信息的准确性。对于粗排模型的训练过程可参见下述步骤601～603，此处暂不进行详细说明。

504、基于每条候选信息的粗排分数，服务器从多条候选信息中，筛选出多条第一信息。

服务器根据每条候选信息的粗排分数，按照粗排分数由高到低的顺序，对多条候选信息进行排序，进而基于排序结果，从多条候选信息中，筛选出多条第一信息。

505、服务器将多条第一信息输入到精排模型中，输出多条第一信息的精排分数。

基于所获取到的多条第一信息，服务器将多条第一信息输入到精排模型中，输出多条第一信息的精排分数。

506、基于多条第一信息的精排分数，服务器从多条第一信息中，筛选出多条第二信息。

服务器根据多条第一信息的精排分数，按照精排分数由高到低的顺序，对多条第一信息进行排序，进而基于排序结果，从多条第一信息中，筛选出多条第二信息。

507、服务器将多条第二信息推荐给目标用户。

本公开实施例提供了一种粗排模型的训练方法，参见图6，本公开实施例提供的方法流程包括：

601、基于精排模型，服务器从用于训练精排模型的多条训练样本信息中，获取多条粗排样本信息。

由于本公开实施例中的粗排模型是基于精排模型训练得到的，因而在执行本步骤之前，还需要对精排模型进行训练。具体地，精排模型的训练过程为：

第一步，服务器获取多条训练样本信息。

本步骤中，服务器根据互联网上真实的曝光数据、点击数据及转化数据，从互联网上获取多条训练样本信息，每条训练样本信息标注有相应的点击率、转化率等。

第二步，服务器基于多条训练样本信息，对初始精排模型进行训练，得到训练好的精排模型。

其中，初始精排模型可以为DNN(Deep Neural Networks，深度神经网络)模型等。初始精排模型包括点击率预估模块、转化率预估模块及多目标机制模块等，在对精排模型进行训练时，可根据每条训练样本信息对精排模型中的各模块进行分别训练，其中，多目标机制模块可根据待训练的精排模型的性能进行设置，例如，该精排模型需要从200条信息中筛选出10条信息，则该多目标机制模块中的目标机制为如何从200条信息中筛选出10条信息。具体地，服务器可根据每条训练样本信息中标注的点击率，对精排模型中的点击率预估模块进行训练；服务器可根据每条训练样本信息中标注的转化率，对精排模型中的转化率模块进行训练。

基于所训练的精排模型，服务器可从多条训练样本信息中，获取多条粗排样本信息。服务器在获取粗排样本信息时通常有两种方式，一种方式是采用精排模型的排序结果，获取粗排样本信息，该种方式能够学习精排模型中所包含的多目标机制的最终排序；另一种方式是根据精排模型预估的每条训练样本信息的点击率和转化率，该种方式能够学习如何对每条训练样本信息进行打分。基于上述两种方式，服务器在获取粗排样本信息时，包括但不限于如下几种：

在一种可能的实现方式中，基于第一种方式的排序理念，服务器将多条训练样本信息输入到精排模型中，输出每条训练样本信息的精排分数，进而按照精排分数由高到低的顺序，对多条训练样本信息进行排序，然后，服务器获取排位在前预设位数的训练样本信息，将排位在前预设位数的训练样本信息确定为正样本，将其余的训练样本信息确定为负样本，进而将正样本和负样本组成为多条粗排样本信息。该种样本获取方式根据正样本和负样本对粗排模型进行训练，使得粗排模型学习到如何从多条粗排样本信息中，获取到预设条数的正样本信息，由于所有的候选信息都参与到对粗排模型的训练过程中，因而该种方式的损失函数为全局损失函数。在互联网技术领域，该种方式称为pointwise。其中，预设位数可根据粗排模型的学习机制确定，如果粗排模型的学习机制是如何从100条信息中获取20条信息，则该预设位数可以为20位。

在另一种可能的实现方式中，基于第一种方式的排序理念，服务器将多条训练样本信息输入到精排模型中，输出每条训练样本信息的精排分数，进而按照精排分数由高到低的顺序，对多条训练样本信息进行排序，然后，服务器获取排位在前预设位数的训练样本信息，将排位在前预设位数的训练样本信息及与每条训练样本信息来源于同一查询请求且排位在预设位数之后的至少一个训练样本信息，确定为多条粗排训练样本信息。该种样本获取方式基于同一请求下的正例和负例同时对粗排模型进行训练，使得粗排模型能够学习到同一请求下如何合理地对进行信息排序。该种方式的损失函数一般为正例和负例之间的间隔，正例和负例之间的差距越大，粗排模型越能区分出同一请求下哪些信息是好的，哪些信息是不好的。该种方式称为pairwise。

在另一种可能的实现方式中，基于第二种方式的排序理念，服务器基于粗排模型预估每条训练样本信息的点击率和转化率，进而根据每条训练样本信息的点击率和转化率，确定每条训练样本信息的排序分数，然后基于每条训练样本信息的排序分数，从多条训练样本信息中，获取多条粗排训练样本信息。

602、服务器提取每条粗排样本信息的训练信息特征、点击每条粗排样本信息的用户的用户特征以及每个用户与每条粗排样本信息之间的训练交叉特征。

对于每条粗排样本信息，服务器提取每条训练样本信息的训练信息特征，并提取点击每条粗排样本信息的用户的行为特征和属性特征，得到点击每条粗排样本信息的用户的用户特征，然后，服务器提取每条粗排样本信息和点击每条粗排样本信息的用户之间的训练交叉特征。

603、基于每条粗排样本信息的训练信息特征、点击每条粗排样本信息的用户的用户特征以及每个用户与每条粗排样本信息之间的训练交叉特征，服务器对初始粗排模型进行训练，得到粗排模型。

其中，初始粗排模型可以为LR、DSSM、FFM等，服务器不对初始粗排模型作具体的限定。服务器预先为初始粗排模型设置模型参数，并将每条粗排样本信息的训练信息特征、点击每条粗排样本信息的用户的用户特征以及每个用户与每条粗排样本信息之间的训练交叉特征输入到初始粗排模型中，输出每条粗排样本信息的预测粗排分数。然后，服务器将每条训练样本信息的预测粗排分数和标注粗排分数输入到预先构建的损失函数中，得到损失函数的函数值，如果损失函数的函数值大于预设数值，则对初始粗排模型的模型参数进行调整，直至损失函数的函数值小于预设数值。服务器将使得损失函数的函数值小于预设数值的模型参数对应的粗排模型，确定为训练好的粗排模型。其中，预设数值可根据对粗排模型的训练精度得到。

本公开实施例提供的方法，由于粗排模型基于精排模型的训练结果训练得到，因而能够学习到精排模型的排序机制，在线应用时，基于同一排序机制对候选信息进行排序，从而能够筛选出满足用户需求的信息。同时在基于粗排模型和精排模型进行信息筛选时，不仅考虑了候选信息本身的信息特征和目标用户的用户特征，而且还考虑了候选信息和目标用户之间的交叉特征，对目标用户和候选信息进行全面刻画，从而提高了所训练模型的准确性。

参见图7，本公开实施例提供了一种信息推荐装置，该装置包括：

第一获取模块701，用于获取多条候选信息；

第一提取模块702，用于提取目标用户的目标用户特征；

第二提取模块703，还用于提取每条候选信息的信息特征及每条候选信息与目标用户的交叉特征；

输入输出模块704，用于将目标用户特征、每条候选信息的信息特征及交叉特征输入到粗排模型中，输出每条候选信息的粗排分数，粗排模型基于精排模型的训练结果训练得到；

第一筛选模块705，用于基于每条候选信息的粗排分数，从多条候选信息中，筛选出多条第一信息；

第二筛选模块706，还用于基于精排模型，从多条第一信息中，筛选出多条第二信息；

推荐模块707，用于将多条第二信息推荐给目标用户。

在本公开的另一个实施例中，用于粗排模型的训练装置包括：

第二获取模块，用于基于精排模型，从用于训练精排模型的多条训练样本信息中，获取多条粗排样本信息；

训练模块，用于基于每条粗排样本信息的训练信息特征、点击每条粗排样本信息的用户的用户特征以及每个用户与每条粗排样本信息之间的训练交叉特征，对初始粗排模型进行训练，得到粗排模型。

在本公开的另一个实施例中，第二获取模块，还用于基于精排模型对多条训练样本信息的精排分数，获取排位在前预设位数的训练样本信息；将排位在前预设位数的训练样本信息确定为正样本，将其余的训练样本信息确定为负样本；将正样本和负样本组成为多条粗排样本信息。

在本公开的另一个实施例中，第二获取模块，还用于基于精排模型对多条训练样本信息的精排分数，获取排位在前预设位数的训练样本信息；将排位在前预设位数的训练样本信息及与每条训练样本信息来源于同一查询请求且排位在预设位数之后的至少一条训练样本信息，确定为多条粗排训练样本信息。

在本公开的另一个实施例中，第二获取模块，还用于基于粗排模型预估每条训练样本信息的点击率和转化率；根据每条训练样本信息的点击率和转化率，确定每条训练样本信息的排序分数；基于每条训练样本信息的排序分数，从多条训练样本信息中，获取多条粗排训练样本信息。

综上，本公开实施例提供的装置，由于粗排模型基于精排模型的训练结果训练得到，因而能够学习到精排模型的排序机制，在线应用时，基于同一排序机制对候选信息进行排序，从而能够筛选出满足用户需求的信息。同时在基于粗排模型和精排模型进行信息筛选时，不仅考虑了候选信息本身的信息特征和目标用户的用户特征，而且还考虑了候选信息和目标用户之间的交叉特征，对目标用户和候选信息进行全面刻画，从而在进行信息推荐时，大大提高了所推荐信息的准确性。

图8是根据一示例性实施例示出的一种用于信息推荐的服务器。参照图8，服务器800包括处理组件822，其进一步包括一个或多个处理器，以及由存储器832所代表的存储器资源，用于存储可由处理组件822的执行的指令，例如应用程序。存储器832中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件822被配置为执行指令，以执行上述信息推荐方法中服务器所执行的功能。

服务器800还可以包括一个电源组件826被配置为执行服务器800的电源管理，一个有线或无线网络接口850被配置为将服务器800连接到网络，和一个输入输出(I/O)接口858。服务器800可以操作基于存储在存储器832的操作***，例如Windows Server^TM，Mac OSX^TM，Unix^TM,Linux^TM，FreeBSD^TM或类似。

本公开实施例提供了一种计算机可读存储介质，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以图4或图5所示的信息推荐方法。该计算机可读存储介质可以是非暂态的。例如，该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本公开的可选实施例，并不用以限制本公开，凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

1.一种信息推荐方法，其特征在于，所述方法包括：

获取多条候选信息；

将所述多条第二信息推荐给所述目标用户。

2.根据权利要求1所述的方法，其特征在于，所述粗排模型的训练过程为：

3.根据权利要求2所述的方法，其特征在于，所述基于所述精排模型，从用于训练所述精排模型的多条训练样本信息中，获取多条粗排样本信息，包括：

将所述正样本和所述负样本组成为所述多条粗排样本信息。

4.根据权利要求2所述的方法，其特征在于，所述基于所述精排模型，从用于训练所述精排模型的多条训练样本信息中，获取多条粗排样本信息，包括：

5.根据权利要求2所述的方法，其特征在于，所述基于所述精排模型，从用于训练所述精排模型的多条训练样本信息中，获取多条粗排样本信息，包括：

6.一种信息推荐装置，其特征在于，所述装置包括：

第一获取模块，用于获取多条候选信息；

第一提取模块，用于提取目标用户的目标用户特征；

推荐模块，用于将所述多条第二信息推荐给所述目标用户。

7.根据权利要求6所述的装置，其特征在于，用于所述粗排模型的训练装置包括：

8.根据权利要求7所述的装置，其特征在于，所述第二获取模块，还用于基于所述精排模型对所述多条训练样本信息的精排分数，获取排位在前预设位数的训练样本信息；将所述排位在前预设位数的训练样本信息确定为正样本，将其余的训练样本信息确定为负样本；将所述正样本和所述负样本组成为所述多条粗排样本信息。

9.根据权利要求7所述的装置，其特征在于，所述第二获取模块，还用于基于所述精排模型对所述多条训练样本信息的精排分数，获取排位在前预设位数的训练样本信息；将所述排位在前预设位数的训练样本信息及与每条训练样本信息来源于同一查询请求且排位在预设位数之后的至少一条训练样本信息，确定为所述多条粗排训练样本信息。

10.根据权利要求7所述的装置，其特征在于，所述第二获取模块，还用于基于所述粗排模型预估每条训练样本信息的点击率和转化率；根据每条训练样本信息的点击率和转化率，确定每条训练样本信息的排序分数；基于每条训练样本信息的排序分数，从所述多条训练样本信息中，获取多条粗排训练样本信息。

11.一种服务器，其特征在于，所述服务器包括处理器和存储器，所述存储器中存储有至少一条程序代码，所述至少一条程序代码由所述处理器加载并执行，以实现如权利要求1至5中任一项所述的信息推荐方法。

12.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行，以实现如权利要求1至5中任一项所述的信息推荐方法。