CN113343131B

CN113343131B - 一种模型训练的方法、信息展示的方法及装置

Info

Publication number: CN113343131B
Application number: CN202110733456.9A
Authority: CN
Inventors: 钟啸林; 刘影; 侯培旭; 华镇; 余婷婷
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-06-30
Filing date: 2021-06-30
Publication date: 2022-08-26
Anticipated expiration: 2041-06-30
Also published as: CN113343131A

Abstract

本说明书公开了一种模型训练的方法、信息展示的方法及装置，获取训练样本。其次，针对每个搜索结果，将该搜索结果输入到待训练的排序模型中，以得到根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型所确定出的该搜索结果对应的展示优先级。而后，根据排序模型确定出的各搜索结果对应的展示优先级，确定搜索请求对应的排序结果。最后，以最小化搜索请求对应的排序结果，与基于标签信息确定出的搜索请求对应的最优排序结果之间的偏差为优化目标，对排序模型进行训练。本方法可以提高未出现的内容类型的搜索结果对应的展示优先级，避免相同内容类型的搜索结果集中出现在同一区域，排序结果更为合理，以提高用户的信息浏览体验。

Description

一种模型训练的方法、信息展示的方法及装置

技术领域

本说明书涉及计算机技术领域，尤其涉及一种模型训练的方法、信息展示的方法及装置。

背景技术

随着电子技术和网络技术的不断发展，互联网中存在大量的信息，可以根据用户的搜索请求，确定向用户展示的搜索结果，由于页面展示的搜索结果有限，因此，需要将这些搜索结果进行排序，将用户感兴趣的搜索结果进行优先展示。

在实际应用中，通常是通过预先训练的排序模型，得到各搜索结果的预测点击率，再将预测点击率较高的搜索结果优先进行展示。但是这种方式可能会在同一区域内集中出现同一内容类型的搜索结果，例如，用户在浏览页面(浏览页面可以展示六个搜索结果)中的搜索结果时，可能出现前四个搜索结果都为同一内容类型的搜索结果，得到搜索请求对应的排序结果并不合理，给予用户较差的感观，使得用户的信息浏览体验不佳。

因此，如何能够提高排序模型对不同内容类型的搜索结果排序的合理性，则是一个亟待解决的问题。

发明内容

本说明书提供一种模型训练的方法、信息展示的方法及装置，以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案：

本说明书提供了一种模型训练的方法，包括：

获取训练样本，所述训练样本中包含有搜索请求对应的各搜索结果以及所述各搜索结果对应的标签信息；

针对每个搜索结果，将该搜索结果输入到待训练的排序模型中，以得到根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型所确定出的该搜索结果对应的展示优先级，其中，若是该搜索结果对应的内容类型与该搜索结果所在页面位置之前的其他搜索结果对应的内容类型匹配度越低，该搜索结果对应的展示优先级越高；

根据所述排序模型确定出的各搜索结果对应的展示优先级，确定所述搜索请求对应的排序结果；

以最小化所述搜索请求对应的排序结果，与基于所述标签信息确定出的所述搜索请求对应的最优排序结果之间的偏差为优化目标，对所述排序模型进行训练。

可选地，根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型，确定该搜索结果对应的展示优先级，具体包括：

根据所述搜索请求与该搜索结果之间的相关度，确定该搜索结果对应的预测点击率；

根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型以及所述预测点击率，确定该搜索结果对应的展示优先级。

可选地，根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型以及所述预测点击率，确定该搜索结果对应的展示优先级，具体包括：

根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型，确定该搜索结果与所在页面位置之前的其他搜索结果所对应的每个内容类型的类型占比；

根据所述类型占比，确定该搜索结果的多样性得分，其中，若该搜索结果与所在页面位置之前的其他搜索结果所对应的内容类型越多，所述多样性得分越高；

根据该搜索结果的多样性得分以及所述预测点击率，确定该搜索结果对应的展示优先级。

根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型、该搜索结果所在页面位置上对应的位置折扣因子以及所述预测点击率，确定该搜索结果对应的展示优先级，其中，若是该搜索结果对应的页面位置越靠后，所述位置折扣因子越小。

可选地，根据所述类型占比，确定该搜索结果的多样性得分，具体包括：

确定在该搜索结果所在页面位置之前，且与该搜索结果相邻的其他搜索结果，作为相邻搜索结果，并确定所述相邻搜索结果对应的内容类型；

根据所述类型占比以及所述相邻搜索结果对应的内容类型，确定该搜索结果的多样性得分，其中，在所述类型占比不变的情况下，所述相邻搜索结果对应的内容类型与该搜索结果对应的内容类型相同时该搜索结果的多样性得分，低于所述相邻搜索结果对应的内容类型与该搜索结果对应的内容类型不同时该搜索结果的多样性得分。

可选地，根据所述排序模型确定出的各搜索结果对应的展示优先级，确定所述搜索请求对应的排序结果，具体包括：

根据所述排序模型确定出的各搜索结果对应的展示优先级，确定所述搜索请求对应的排序结果的排序评分；

将所述搜索请求对应的排序结果中的至少两个搜索结果的页面位置进行互换，并确定互换页面位置后的排序结果的排序评分；

以最小化所述搜索请求对应的排序结果，与基于所述标签信息确定出的所述搜索请求对应的最优排序结果之间的偏差为优化目标，对所述排序模型进行训练，具体包括：

根据所述搜索请求对应的排序结果的排序评分与所述互换页面位置后的排序结果的排序评分之间的差值，确定排序损失值，并以最小化所述排序损失值为优化目标，对所述排序模型进行训练。

本说明书提供了一种信息展示的方法，包括：

响应于搜索请求，确定所述搜索请求对应的各搜索结果；

将所述各搜索结果输入到预先训练的排序模型中，得到所述搜索请求对应的排序结果，所述排序模型是通过上述模型训练的方法训练得到的；

根据所述排序结果，向用户进行信息展示。

本说明书提供了一种模型训练的装置，包括：

获取模块，用于获取训练样本，所述训练样本中包含有搜索请求对应的各搜索结果以及所述各搜索结果对应的标签信息；

确定模块，用于针对每个搜索结果，将该搜索结果输入到待训练的排序模型中，以得到根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型所确定出的该搜索结果对应的展示优先级，其中，若是该搜索结果对应的内容类型与该搜索结果所在页面位置之前的其他搜索结果对应的内容类型匹配度越低，该搜索结果对应的展示优先级越高；

排序模块，用于根据所述排序模型确定出的各搜索结果对应的展示优先级，确定所述搜索请求对应的排序结果；

训练模块，用于以最小化所述搜索请求对应的排序结果，与基于所述标签信息确定出的所述搜索请求对应的最优排序结果之间的偏差为优化目标，对所述排序模型进行训练。

本说明书提供了一种信息展示的装置，包括：

确定模块，用于响应于搜索请求，确定所述搜索请求对应的各搜索结果；

排序模块，用于将所述各搜索结果输入到预先训练的排序模型中，得到所述搜索请求对应的排序结果，所述排序模型是通过上述模型训练的方法训练得到的；

展示模块，用于根据所述排序结果，向用户进行信息展示。

本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述模型训练的方法以及信息展示的方法。

本说明书提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述模型训练的方法以及信息展示的方法。

本说明书采用的上述至少一个技术方案能够达到以下有益效果：

在本说明书提供的模型训练的方法以及信息展示的方法中，获取训练样本，训练样本中包含有搜索请求对应的各搜索结果以及各搜索结果对应的标签信息。其次，针对每个搜索结果，将该搜索结果输入到待训练的排序模型中，以得到根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型所确定出的该搜索结果对应的展示优先级，其中，若是该搜索结果对应的内容类型与该搜索结果所在页面位置之前的其他搜索结果对应的内容类型匹配度越低，该搜索结果对应的展示优先级越高。而后，根据排序模型确定出的各搜索结果对应的展示优先级，确定搜索请求对应的排序结果。最后，以最小化搜索请求对应的排序结果，与基于标签信息确定出的搜索请求对应的最优排序结果之间的偏差为优化目标，对排序模型进行训练。

从上述方法中可以看出，本方法可以根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型，确定该搜索结果对应的展示优先级。也就是说，确定出该搜索结果所在页面位置之前的其他搜索结果对应的内容类型，为了提高未出现的内容类型的搜索结果对应的展示优先级，以尽可能避免相同内容类型的搜索结果集中出现在同一区域，使得搜索请求对应的排序结果更为合理，从而将不同内容类型的搜索结果在页面中展示给用户，以提高用户的信息浏览体验。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，本说明书的示意性实施例及其说明用于解释本说明书，并不构成对本说明书的不当限定。在附图中：

图1为本说明书中一种模型训练的方法的流程示意图；

图2为本说明书实施例提供的展示搜索结果的页面的示意图；

图3为本说明书实施例提供的多样性得分的公式曲线的示意图；

图4为本说明书中一种信息展示的方法的流程示意图；

图5为本说明书提供的一种模型训练的装置的示意图；

图6为本说明书提供的一种信息展示的装置的示意图；

图7为本说明书提供的一种对应于图1的电子设备的示意图。

具体实施方式

为使本说明书的目的、技术方案和优点更加清楚，下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本说明书保护的范围。

以下结合附图，详细说明本说明书各实施例提供的技术方案。

图1为本说明书中一种模型训练的方法的流程示意图，包括以下步骤：

S100：获取训练样本，所述训练样本中包含有搜索请求对应的各搜索结果以及所述各搜索结果对应的标签信息。

在本说明书实施例中，对排序模型进行训练的执行主体可以是服务器，也可以是诸如台式电脑等电子设备，为了便于描述，下面仅以服务器为执行主体，对本说明书提供的排序模型的训练方法进行说明。

在本说明书实施例中，服务器可以获取训练样本，训练样本中包含有搜索请求对应的各搜索结果以及所述各搜索结果对应的标签信息，这里提到的标签信息可以用于表征用户在历史上对各搜索结果对应的实际浏览情况，如用户对搜索请求对应的搜索结果是否进行点击，也可以是人为通过实际经验确定出的。这里提到的搜索请求可以是指用户根据实际需求输入的搜索语句或搜索词等。

S102：针对每个搜索结果，将该搜索结果输入到待训练的排序模型中，以得到根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型，确定该搜索结果对应的展示优先级，其中，若是该搜索结果对应的内容类型与该搜索结果所在页面位置之前的其他搜索结果对应的内容类型匹配度越低，该搜索结果对应的展示优先级越高。

在本说明书实施例中，服务器可以针对每个搜索结果，将该搜索结果输入到待训练的排序模型中，根据该搜索结果所在页面位置以及所在页面位置之前的其他搜索结果对应的内容类型，确定该搜索结果对应的展示优先级，其中，若是该搜索结果对应的内容类型与该搜索结果所在页面位置之前的其他搜索结果对应的内容类型匹配度越低，该搜索结果对应的展示优先级越高。这里提到的页面位置可以是指在用于展示搜索结果的页面中，每一个页面位置对应有一个需要进行展示的搜索结果，具体的页面位置如图2所示。

图2为本说明书实施例提供的展示搜索结果的页面的示意图。

在图2中，在终端页面中展示的是搜索结果的排序结果，在当前页面中有六个页面位置进行展示，每个页面位置对应一个搜索结果，通常来说，越靠前的页面位置，展示的搜索结果的展示优先级越高。

在本说明书实施例中，服务器可以根据搜索请求与该搜索结果之间的相关度，确定该搜索结果对应的预测点击率。这里提到的相关度的确定方式可以有多种，服务器可以根据搜索结果的内容与搜索请求本身之间的相关性，来确定搜索请求与搜索结果之间相关度。例如，若搜索请求为宫保鸡丁，搜索结果为旅游景点，宫保鸡丁与旅游景点之间的内容的相关性较低，则相关度也相对较低，若搜索请求为宫保鸡丁，搜索结果为有宫保鸡丁菜品的饭店，宫保鸡丁与有宫保鸡丁菜品的饭店之间的内容的相关性较高，相关度也相对较高。

当然，在排序模型训练阶段，搜索请求与搜索结果之间相关度也可以根据训练样本中用户对搜索请求对应的搜索结果的实际点击情况进行确定，若进行点击，则相关度为第一预设值，如1，若未进行点击，则相关度为第二预设值，如0。

服务器可以将该搜索结果输入到待训练的排序模型中，得到该搜索结果对应的特征向量，再根据该搜索结果对应的特征向量，确定该搜索结果对应的预测点击率。服务器确定搜索结果对应的特征向量的方式可以有多种，例如，服务器可以通过排序模型中包含的卷积神经网络(Convolutional Neural Networks,CNN)，将该搜索结果转换成该搜索结果对应的特征向量，根据该搜索结果对应的特征向量，确定该搜索结果对应的预测点击率。以最小化确定出的搜索结果对应的预测点击率与标签信息之间的偏差为优化目标，对排序模型进行训练，以此通过排序模型得到准确的预测点击率。

在实际应用中，不同内容类型的搜索结果对应的预测点击率可能出现较大的差距，从而使得相同内容类型的搜索结果集中出现在同一区域，导致得到的搜索请求对应的排序结果的多样性较低。为了提高搜索请求对应的排序结果的内容类型的多样性，服务器可以确定出该搜索结果所在页面位置之前的其他搜索结果对应的内容类型，通过提高未出现的内容类型的搜索结果对应的展示优先级，来提高搜索请求对应的排序结果的内容类型的多样性。

其中，不同内容类型的搜索结果在信息展示方式、内容侧重等方面上有所不同，例如，若搜索请求为宫保鸡丁，内容类型可以是有宫保鸡丁菜品的饭店(商家)、宫保鸡丁的做法(美食攻略)、用户对宫保鸡丁菜品的点评(用户点评)、不同饭店的宫保鸡丁菜品的排行榜(美食排行榜)等搜索结果，可以看出，这些搜索结果虽然都与宫保鸡丁有关，但是在内容本身上却属于不同的内容类型。

在本说明书实施例中，服务器可以根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型以及预测点击率，确定该搜索结果对应的展示优先级。

具体的，服务器可以参考如下公式，确定出该搜索结果对应的展示优先级：

在上述公式中，p_k可以用于表示搜索结果在页面位置k对应的展示优先级。k可以用于表示搜索结果所在的页面位置。y_k可以用于表示搜索请求与搜索请求对应的搜索结果之间的相关度。α为可调超参数。E(k)可以用于表示搜索结果对应的多样性得分。

从上述公式中可以看出，搜索请求与搜索请求对应的搜索结果之间的相关度越高，搜索结果在页面位置k对应的展示优先级越高。多样性得分越高，搜索结果在页面位置k对应的展示优先级越高。

在本说明书实施例中，服务器可以根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型，确定该搜索结果与所在页面位置之前的其他搜索结果所对应的每个内容类型的类型占比。其次，根据类型占比，确定该搜索结果的多样性得分，其中，若该搜索结果与所在页面位置之前的其他搜索结果所对应的内容类型越多，多样性得分越高。最后，根据该搜索结果的多样性得分以及预测点击率，确定该搜索结果对应的展示优先级。

具体的，服务器可以参考如下公式，确定出该搜索结果对应的多样性得分：

在上述公式中，type可以用于表示搜索结果对应的内容类型，P(type)可以用于表示该搜索结果与所在页面位置之前的其他搜索结果所对应的每个内容类型的类型占比。

从上述公式中可以看出，-p(type)log₂(P(type))可以用于表示在搜索结果所在页面位置k之前，每个内容类型对应的搜索结果的多样性得分，具体的公式曲线如图3所示。

图3为本说明书实施例提供的多样性得分的公式曲线的示意图。

从图3中可以看出，-P(type)log₂(P(type))的公式曲线在一定范围内处于较高的数值，结合上述公式可以看出，该搜索结果与所在页面位置之前的其他搜索结果所对应的内容类型越多，多样性得分越高(E(k)越大)，从而使得搜索结果在页面位置k对应的展示优先级越高。若确定该搜索结果所在页面位置之前的其他搜索结果中包含有该搜索结果对应的内容类型，则该搜索结果对应的多样性得分较低(E(k)较小)，该搜索结果在页面位置k对应的展示优先级越低。以此，尽可能的将不同内容类型的搜索结果展示给用户。

为了进一步地保证页面内容在内容类型上的多样性，在本说明书实施例中，服务器可以确定在该搜索结果所在页面位置之前，且与该搜索结果相邻的其他搜索结果，作为相邻搜索结果，并确定相邻搜索结果对应的内容类型，根据类型占比以及相邻搜索结果对应的内容类型，确定该搜索结果的多样性得分，其中，在类型占比不变的情况下，相邻搜索结果对应的内容类型与该搜索结果对应的内容类型相同时该搜索结果的多样性得分，低于相邻搜索结果对应的内容类型与该搜索结果对应的内容类型不同时该搜索结果的多样性得分。

在图2中，服务器可以通过上述公式，尽可能的将不同内容类型的搜索结果展示给用户，若搜索结果的内容类型为四种，小于用于展示搜索结果的页面位置数量，为了避免同一内容类型的搜索结果相邻，服务器可以先确定出相邻搜索结果的内容类型，若相邻搜索结果对应的内容类型与该搜索结果对应的内容类型相同，得到的该搜索结果的多样性得分较低，这样一来可以在一定程度上保证同一内容类型的搜索结果不会相邻，从而提高用户的信息浏览体验。

在本说明书实施例中，服务器可以根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型、该搜索结果所在页面位置上对应的位置折扣因子以及预测点击率，确定该搜索结果对应的展示优先级，其中，若是该搜索结果对应的页面位置越靠后，所述位置折扣因子越小。例如，在图2中，页面位置1对应的位置折扣因子大于页面位置2对应的位置折扣因子。

具体的，在实际应用中，服务器在向用户展示搜索请求对应的搜索结果时，用户往往先关注页面中排序靠前的搜索结果，因此，页面中排序靠前的搜索结果的点击概率相较于排序靠后的搜索结果来说较大，因此，服务器可以根据每个搜索结果所在页面位置上对应的位置折扣因子，调整每个搜索结果对应的展示优先级。

从上述公式中可以看出，

可以用于表示搜索结果所在页面位置上对应的位置折扣因子，所在页面位置越靠后(k越大)，所在页面位置上对应的位置折扣因子越小，相应的，该搜索结果对应的展示优先级越小。

S104：根据所述排序模型确定出的各搜索结果对应的展示优先级，确定所述搜索请求对应的排序结果。

在本说明书实施例中，服务器可以根据排序模型确定出的各搜索结果对应的展示优先级，确定搜索请求对应的排序结果。

在实际应用中，服务器在确定搜索请求对应的排序结果时，需要根据搜索请求与搜索结果之间的相关度，先确定出第一个页面位置对应的搜索结果，再根据第一个页面位置对应的搜索结果的内容类型，确定出接下来的其他页面位置的搜索结果。例如，在图2中，服务器可以先确定出页面位置1对应的搜索结果，再根据页面位置1对应的搜索结果的内容类型，确定出接下来的页面位置2的搜索结果，接着，根据页面位置1、2对应的搜索结果的内容类型，确定出接下来的页面位置3的搜索结果，以此类推，确定出搜索请求对应的排序结果。

进一步的，服务器可以根据搜索请求对应的排序结果，确定搜索请求对应的排序结果的排序评分。

在实际应用中，为了确定出得到的各搜索请求对应的排序结果的优劣，服务器可以先确定出搜索请求对应的最优排序结果的排序评分，再根据搜索请求对应的排序结果的排序评分以及搜索请求对应的最优排序结果的排序评分，得到各搜索请求对应的排序结果的统一标准的排序评分，以此，确定各搜索请求对应的排序评分的优劣。

具体的，服务器可以参考如下公式，确定出搜索请求对应的排序结果的排序评分：

在上述公式中，IDCG可以用于表示搜索请求对应的最优排序结果的排序评分。ENDCG可以用于表示搜索请求对应的排序结果的统一标准的排序评分，服务器可以通过ENDCG来确定各搜索请求对应的排序评分的优劣。

从上述公式中可以看出，若该搜索结果与所在页面位置之前的其他搜索结果所对应的内容类型越多，ENDCG越高。该搜索结果与搜索请求之间的相关度越高，ENDCG越高，以此，提高搜索请求对应的排序结果的多样性。

S106：以最小化所述搜索请求对应的排序结果，与所述搜索请求对应的最优排序结果之间的偏差为优化目标，对所述排序模型进行训练。

在本说明书实施例中，服务器可以以最小化搜索请求对应的排序结果，与基于标签信息确定出的搜索请求对应的最优排序结果之间的偏差为优化目标，对排序模型进行训练。

这里提到的最优排序结果可以是根据包含有各搜索结果的点击情况的标签信息，相应的，服务器可以先确定搜索请求对应的各搜索结果的实际点击率，再根据搜索请求对应的各搜索结果的实际点击率、各搜索结果所在页面位置的位置折扣因子以及该搜索结果的多样性得分，对该搜索请求对应的排序结果进行遍历，计算该搜索请求对应的各排序结果的排序评分，从该搜索请求对应的各排序结果的排序评分中，选取出排序评分最高的搜索请求对应的排序结果，作为最优排序结果。当然，服务器也可以根据人为预先确定的排序结果，作为最优排序结果。

在本说明书实施例中，服务器可以根据排序模型确定出的各搜索结果对应的展示优先级，确定搜索请求对应的排序结果的排序评分。其次，将搜索请求对应的排序结果中的至少两个搜索结果的页面位置进行互换，并确定互换页面位置后的排序结果的排序评分。最后，根据搜索请求对应的排序结果的排序评分与互换页面位置后的排序结果的排序评分之间的差值，确定排序损失值，并以最小化排序损失值为优化目标，对排序模型进行训练。经过多轮的迭代训练，可以使偏差不断减小，并收敛在一个数值范围内，进而完成排序模型的训练。

具体的，服务器可以参考如下公式，确定出搜索请求对应的排序结果的损失函数：

在上述公式中，L(y，s)可以用于表示搜索请求对应的排序结果的排序损失值。y_i可以用于表示页面位置i的搜索结果对应的实际点击率。y_j可以用于表示页面位置j的搜索结果对应的实际点击率。s_i可以用于表示页面位置i的搜索结果对应的预测点击率。s_j可以用于表示页面位置j的搜索结果对应的预测点击率。e为常数，σ为可调超参数。ΔENDCG(i，j)可以用于表示搜索请求对应的排序结果的排序评分与搜索请求对应的互换后排序结果的排序评分之间的差值。

其中，

可以用于表示两个搜索结果之间的排序顺序是否合理，若两个搜索结果进行互换后，将两个搜索结果中相关性低的搜索结果换到靠前的页面位置，显然两个搜索结果互换后的排序顺序是不合理，则确定出s_i大于s_j，

的数值小于1，若两个搜索结果进行互换后，将两个搜索结果中相关性低的搜索结果换到靠后的页面位置，显然两个搜索结果互换后的排序顺序是合理，则确定出s_i小于s_j，

的数值大于1。也就是说，若搜索请求对应的排序结果的排序顺序越合理，搜索请求对应的排序损失值越小，若搜索请求对应的排序结果的排序顺序越不合理，搜索请求对应的排序损失值越大。服务器可以以最小化搜索请求对应的损失函数为优化目标，对排序模型进行训练。

在图2中，若搜索结果的内容类型有五种，分别为商家、美食攻略、用户评论、商家排行榜、美食排行榜。若页面位置1对应的搜索结果的内容类型为商家，页面位置2对应的搜索结果的内容类型为美食攻略，页面位置3对应的搜索结果的内容类型为美食攻略，页面位置4对应的搜索结果的内容类型为用户评论，页面位置5对应的搜索结果的内容类型为商家排行榜，页面位置6对应的搜索结果的内容类型为美食排行榜，根据上述公式，由于页面位置3对应的搜索结果的内容类型与页面位置2对应的搜索结果的内容类型相同，因此，页面位置3对应的搜索结果的多样性得分较低，服务器可以得出将页面位置3对应的搜索结果与页面位置6对应的搜索结果进行互换后，各页面位置对应的多样性评分最高，以此得到的搜索请求的排序评分最高。

从上述过程中可以看出，本方法可以根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型，确定该搜索结果对应的展示优先级。也就是说，确定出该搜索结果所在页面位置之前的其他搜索结果对应的内容类型，为了提高未出现的内容类型的搜索结果对应的展示优先级，以尽可能避免相同内容类型的搜索结果集中出现在同一区域，使得搜索请求对应的排序结果更为合理，从而将不同内容类型的搜索结果在页面中展示给用户，以提高用户的信息浏览体验。

本说明书实施例在排序模型的训练完成后，可以通过排序模型向用户进行信息展示，具体过程如图4所示。

图4为本说明书中一种信息展示的方法的流程示意图。

S400：响应于搜索请求，确定所述搜索请求对应的各搜索结果。

S402：将所述各搜索结果输入到预先训练的排序模型中，得到所述搜索请求对应的排序结果，所述排序模型是通过上述模型训练的方法训练得到的。

S404：根据所述排序结果，向用户进行信息展示。

在本说明书实施例中，服务器可以响应于搜索请求，确定所述搜索请求对应的各搜索结果，这里提到的搜索请求可以是指用户用于搜索的文本信息，也可以是用户打开应用后，服务器将用户的位置、偏好等信息作为搜索请求，对用户进行搜索结果的推送。其次，服务器可以将各搜索结果输入到预先训练的排序模型中，得到搜索请求对应的排序结果，排序模型是通过上述模型训练的方法训练得到的。最后，服务器可以根据排序结果，向用户进行信息展示。

在本说明书实施例中，服务器可以将各搜索结果输入到排序模型中，确定搜索结果对应的特征向量，再根据搜索结果对应的特征向量，确定搜索结果对应的预测点击率。其中，确定搜索结果对应的特征向量的方式，与上述模型训练过程中提到的方式基本相同，在此就不进行详细赘述了。

从上述内容可以看出，首先，服务器先通过排序模型，来确定各搜索结果对应的展示优先级，而后，服务器再根据各搜索结果对应的展示优先级，确定搜索请求对应的排序结果。这样不仅能够保证排序结果中搜索请求与搜索结果的相关度，还能保证排序结果中的搜索结果的多样性，从而进一步地提高了用户的信息浏览体验。

以上为本说明书的一个或多个实施例提供的模型训练的方法以及信息展示的方法，基于同样的思路，本说明书还提供了相应的模型训练的装置以及信息展示的装置，如图5所示。

图5为本说明书提供的一种模型训练的装置示意图，包括：

获取模块500，用于获取训练样本，所述训练样本中包含有搜索请求对应的各搜索结果以及所述各搜索结果对应的标签信息；

确定模块502，用于针对每个搜索结果，将该搜索结果输入到待训练的排序模型中，以得到根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型所确定出的该搜索结果对应的展示优先级，其中，若是该搜索结果对应的内容类型与该搜索结果所在页面位置之前的其他搜索结果对应的内容类型匹配度越低，该搜索结果对应的展示优先级越高；

排序模块504，用于根据所述排序模型确定出的各搜索结果对应的展示优先级，确定所述搜索请求对应的排序结果；

训练模块506，用于以最小化所述搜索请求对应的排序结果，与基于所述标签信息确定出的所述搜索请求对应的最优排序结果之间的偏差为优化目标，对所述排序模型进行训练。

可选地，所述确定模块502具体用于，根据所述搜索请求与该搜索结果之间的相关度，确定该搜索结果对应的预测点击率，根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型以及所述预测点击率，确定该搜索结果对应的展示优先级。

可选地，所述确定模块502具体用于，根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型，确定该搜索结果与所在页面位置之前的其他搜索结果所对应的每个内容类型的类型占比，根据所述类型占比，确定该搜索结果的多样性得分，其中，若该搜索结果与所在页面位置之前的其他搜索结果所对应的内容类型越多，所述多样性得分越高，根据该搜索结果的多样性得分以及所述预测点击率，确定该搜索结果对应的展示优先级。

可选地，所述确定模块502具体用于，根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型、该搜索结果所在页面位置上对应的位置折扣因子以及所述预测点击率，确定该搜索结果对应的展示优先级，其中，若是该搜索结果对应的页面位置越靠后，所述位置折扣因子越小。

可选地，所述确定模块502具体用于，确定在该搜索结果所在页面位置之前，且与该搜索结果相邻的其他搜索结果，作为相邻搜索结果，并确定所述相邻搜索结果对应的内容类型，根据所述类型占比以及所述相邻搜索结果对应的内容类型，确定该搜索结果的多样性得分，其中，在所述类型占比不变的情况下，所述相邻搜索结果对应的内容类型与该搜索结果对应的内容类型相同时该搜索结果的多样性得分，低于所述相邻搜索结果对应的内容类型与该搜索结果对应的内容类型不同时该搜索结果的多样性得分。

可选地，所述训练模块506具体用于，根据所述排序模型确定出的各搜索结果对应的展示优先级，确定所述搜索请求对应的排序结果的排序评分，将所述搜索请求对应的排序结果中的至少两个搜索结果的页面位置进行互换，并确定互换页面位置后的排序结果的排序评分，根据所述搜索请求对应的排序结果的排序评分与所述互换页面位置后的排序结果的排序评分之间的差值，确定排序损失值，并以最小化所述排序损失值为优化目标，对所述排序模型进行训练。

图6为本说明书提供的一种信息展示的装置示意图，包括：

确定模块600，用于响应于搜索请求，确定所述搜索请求对应的各搜索结果；

排序模块602，用于将所述各搜索结果输入到预先训练的排序模型中，得到所述搜索请求对应的排序结果，所述排序模型是通过上述模型训练的方法训练得到的；

展示模块604，用于根据所述排序结果，向用户进行信息展示。

本说明书还提供了一种计算机可读存储介质，该存储介质存储有计算机程序，计算机程序可用于执行上述图1提供的一种模型训练的方法以及信息展示的方法。

本说明书还提供了图7所示的一种对应于图1的电子设备的示意结构图。如图7所述，在硬件层面，该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器，当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，以实现上述图1所述的模型训练的方法以及信息展示的方法。当然，除了软件实现方式之外，本说明书并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的***、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本说明书的实施例可提供为方法、***、或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本说明书的实施例可提供为方法、***或计算机程序产品。因此，本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于***实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本说明书的实施例而已，并不用于限制本说明书。对于本领域技术人员来说，本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书的权利要求范围之内。

Claims

1.一种模型训练的方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型，确定该搜索结果对应的展示优先级，具体包括：

3.如权利要求2所述的方法，其特征在于，根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型以及所述预测点击率，确定该搜索结果对应的展示优先级，具体包括：

4.如权利要求3所述的方法，其特征在于，根据该搜索结果所在页面位置之前的其他搜索结果对应的内容类型以及所述预测点击率，确定该搜索结果对应的展示优先级，具体包括：

5.如权利要求4所述的方法，其特征在于，根据所述类型占比，确定该搜索结果的多样性得分，具体包括：

6.如权利要求1所述的方法，其特征在于，根据所述排序模型确定出的各搜索结果对应的展示优先级，确定所述搜索请求对应的排序结果，具体包括：

7.一种信息展示的方法，其特征在于，包括：

响应于搜索请求，确定所述搜索请求对应的各搜索结果；

将所述各搜索结果输入到预先训练的排序模型中，得到所述搜索请求对应的排序结果，所述排序模型是通过上述权利要求1～6任一项方法训练得到的；

根据所述排序结果，向用户进行信息展示。

8.一种模型训练的装置，其特征在于，包括：

9.一种信息展示的装置，其特征在于，包括：

排序模块，用于将所述各搜索结果输入到预先训练的排序模型中，得到所述搜索请求对应的排序结果，所述排序模型是通过上述权利要求1～6任一项方法训练得到的；

展示模块，用于根据所述排序结果，向用户进行信息展示。

10.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1～6或7任一项所述的方法。

11.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1～6或7任一项所述的方法。