CN113761348A

CN113761348A - 一种信息推荐方法、装置、电子设备和存储介质

Info

Publication number: CN113761348A
Application number: CN202110221124.2A
Authority: CN
Inventors: 宋金波; 姚亚飞; 李勇; 彭长平; 包勇军; 颜伟鹏
Original assignee: Beijing Wodong Tianjun Information Technology Co Ltd
Current assignee: Beijing Wodong Tianjun Information Technology Co Ltd
Priority date: 2021-02-26
Filing date: 2021-02-26
Publication date: 2021-12-07

Abstract

本申请实施例提供了一种信息推荐方法、信息推荐装置、电子设备及存储介质，该信息推荐方法包括：获取用户特征和待推荐给用户的至少两个推荐对象的对象特征；将用户特征和所有对象特征输入点击率预估模型，得到所有推荐对象的预估点击率；将用户特征和所有对象特征输入指标数据预估模型，得到所有推荐对象的预估展现指标数据；基于所有推荐对象的预估点击率和预估展现指标数据对所有推荐对象进行排序；根据排序结果从至少两个推荐对象中选择至少一个推荐对象，并输出至少一个推荐对象。

Description

一种信息推荐方法、装置、电子设备和存储介质

技术领域

本申请涉及数据处理领域，尤其是涉及一种信息推荐方法、信息推荐装置、电子设备和存储介质。

背景技术

随着互联网技术的飞速发展，推荐***既是信息提供商为宣传自身商品而采用的商业手段，也是广告企业因用户点击广告商品产生收益而采取的方式。

相关技术中，参考图1所示，推荐***包括召回模块、模型预估模块和排序模块，且模型预估模块中仅得到点击率(click-through rate，ctr)预估模型，进而基于点击率预估模型和广告企业对商品设置的广告基础价格，在排序阶段确定推荐给用户的商品。然而，该方法至少存在推荐给用户的商品信息不准确，用户体验差，且无法保证推荐***收益最大化的问题。

发明内容

本申请实施例期望提供一种信息推荐方法、信息推荐装置、电子设备和存储介质，以解决相关技术中存在推荐给用户的商品信息不准确，用户体验差，且无法保证推荐***收益最大化的问题。

本申请实施例的技术方案是这样实现的：

第一方面，本申请实施例提供一种信息推荐方法，所述方法包括：

获取用户特征和待推荐给用户的至少两个推荐对象的对象特征；

将所述用户特征和所有对象特征输入点击率预估模型，得到所述所有推荐对象的预估点击率；

将所述用户特征和所述所有对象特征输入指标数据预估模型，得到所述所有推荐对象的预估展现指标数据；

基于所述所有推荐对象的所述预估点击率和所述预估展现指标数据对所述所有推荐对象进行排序；

根据排序结果从所述至少两个推荐对象中选择至少一个推荐对象，并输出所述至少一个推荐对象。

第二方面，本申请实施例提供一种信息推荐装置，所述装置包括：

获取模块，用于获取用户特征和待推荐给用户的至少两个推荐对象的对象特征；

处理模块，用于将所述用户特征和所有对象特征输入点击率预估模型，得到所述所有推荐对象的预估点击率；

所述处理模块，还用于将所述用户特征和所述所有对象特征输入指标数据预估模型，得到所述所有推荐对象的预估展现指标数据；

排序模块，用于基于所述所有推荐对象的所述预估点击率和所述预估展现指标数据对所述所有推荐对象进行排序；

选择模块，用于根据排序结果从所述至少两个推荐对象中选择至少一个推荐对象；

输出模块，用于输出所述至少一个推荐对象。

第三方面，本申请实施例提供一种电子设备，所述电子设备包括：处理器、存储器和通信总线；

所述通信总线用于实现处理器和存储器之间的通信连接；

所述处理器用于执行存储器中存储的信息处理程序，以实现如上述的信息推荐方法。

第四方面，本申请实施例提供一种存储介质，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现上述的信息推荐方法的步骤。

应用本申请实施例实现以下有益效果：提高了预估展现指标数据的准确度，同时提升了推荐信息的精确度，提升用户使用体验，增加了广告***的收益。

因为获取用户特征和待推荐给用户的至少两个推荐对象的对象特征；将用户特征和所有对象特征输入点击率预估模型，得到所有推荐对象的预估点击率；将用户特征和所有对象特征输入指标数据预估模型，得到所有推荐对象的预估展现指标数据；基于所有推荐对象的预估点击率和预估展现指标数据对所有推荐对象进行排序；根据排序结果从至少两个推荐对象中选择至少一个推荐对象，并输出至少一个推荐对象；如此，解决了相关技术中推荐给用户的商品信息不准确，无法保证推荐***收益最大化的问题，实现了既可以提高预估展现指标数据的准确度，提升推荐信息的精确度，提升用户使用体验，又可以增加广告***的收益。

附图说明

图1为相关技术提供的一种推荐***的架构示意图；

图2为本申请实施例提供的信息推荐方法的一个可选的流程示意图

图3为本申请实施例提供的信息推荐方法的一个可选的流程示意图；

图4为本申请实施例提供的信息推荐方法的一个可选的流程示意图；

图5为本申请实施例提供的深度学习模型一个可选的结构示意图；

图6为本申请实施例提供的信息推荐方法的一个可选的建模过程示意图；

图7为本申请实施例提供的信息推荐方法的一个可选的建模过程示意图；

图8为本申请实施例提供的一种推荐***的架构示意图；

图9为本申请实施例提供的信息推荐装置的一个可选的结构示意图；

图10为本申请实施例提供的电子设备的一个可选的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

应理解，说明书通篇中提到的“本申请实施例”或“前述实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此，在整个说明书各处出现的“本申请实施例中”或“在前述实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中应用。在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

本申请实施例提供了一种信息推荐方法，应用于电子设备，参照图2所示，该方法包括以下步骤：

步骤201、获取用户特征和待推荐给用户的至少两个推荐对象的对象特征。

其中，用户特征包括用户本身特征和用户行为特征。这里，用户本身特征为用户自身所具有的特征，用户本身特征包括用户年龄、用户性别和用户地址；用户行为特征为根据用户的历史搜索对象、用户对网页展示页面的浏览对象或用户先前所点击或展示过的历史推荐对象，分别得到用户的查询词特征、网站访问特征以及网页相关特征、推荐对象相关特征。

其中，推荐对象可以是广告，广告包括但不限于商品广告和/或企业广告，它是生产者或商品经营者向消费者介绍商品和推销商品的传播广告。

在一种可实现的应用场景中，电子设备获取用户信息和待推荐给用户的至少两个推荐对象的对象信息，并提取用户信息中的用户特征以及对象信息中的对象特征后，还可以根据用户特征，从具有百万级推荐对象的推荐对象池中粗略筛选出与用户特征关联的具有千级数量的推荐对象，并填充与推荐对象关联的信息，如广告信息。具体地，筛查出与用户特征关联的具有千级数量的推荐对象的目标公式如下，

其中，O为与用户特征关联的推荐对象，N为筛选的与用户特征关联的推荐对象的数量，user为用户特征，item为推荐对象，item_i为第i个推荐对象，Relevance(user，item_i)为用户特征user与第i个推荐对象item_i之间的相关性。该公式的意义为获取与用户特征相关程度高的前N个推荐对象。

步骤202、将用户特征和所有对象特征输入点击率预估模型，得到所有推荐对象的预估点击率。

其中，输入点击率预估模型基于能够处理非线性特征的深度学习模型构建而成的。

本申请实施例中，电子设备获取到用户特征和待推荐给用户的至少两个推荐对象的对象特征后，将用户特征和所有推荐对象的对象特征输入点击率预估模型中，得到所有推荐对象的预估点击率。

步骤203、将用户特征和所有对象特征输入指标数据预估模型，得到所有推荐对象的预估展现指标数据。

其中，指标数据预估模型基于能够处理非线性特征的深度学习模型构建而成的。预估展现指标数据用于指示推荐对象所能转化出的收益和投入的比例。

本申请实施例中，电子设备获取到用户特征和待推荐给用户的至少两个推荐对象的对象特征后，将用户特征和所有对象特征输入指标数据预估模型，得到所有推荐对象的预估展现指标数据。

步骤204、基于所有推荐对象的预估点击率和预估千次展现收益对所有推荐对象进行排序。

本申请实施例中，电子设备得到所有推荐对象的预估点击率和预估千次展现收益后，基于预估点击率和预估千次展现收益对所有推荐对象进行排序。

在一种可实现的应用场景中，电子设备根据用户特征，从具有百万级推荐对象的推荐对象池中粗略筛选出与用户特征关联的具有千级数量的推荐对象后，根据所有推荐对象的预估点击率和预估千次展现收益对筛选出的与用户特征关联的具有千级数量的推荐对象进行精细排序，得到推荐对象的排序结果。

步骤205、根据排序结果从至少两个推荐对象中选择至少一个推荐对象，并输出至少一个推荐对象。

本申请实施例中，电子设备根据排序结果从至少两个推荐对象中选择至少一个推荐对象，并输出至少一个推荐对象。

本申请实施例所提供的一种信息推荐方法，获取用户特征和待推荐给用户的至少两个推荐对象的对象特征；将用户特征和所有对象特征输入点击率预估模型，得到所有推荐对象的预估点击率；将用户特征和所有对象特征输入指标数据预估模型，得到所有推荐对象的预估展现指标数据；基于所有推荐对象的预估点击率和预估展现指标数据对所有推荐对象进行排序；根据排序结果从至少两个推荐对象中选择至少一个推荐对象，并输出至少一个推荐对象；如此，解决了相关技术中推荐给用户的商品信息不准确，无法保证推荐***收益最大化的问题，实现既可以提高预估展现指标数据的准确度，提升推荐信息的精确度，提升用户使用体验，又可以增加广告***的收益。

本申请实施例提供了一种信息推荐方法，应用于电子设备，参照图3所示，该方法包括以下步骤：

步骤301、获取用户特征和待推荐给用户的至少两个推荐对象的对象特征。

步骤302、获取在预设历史时间段内的点击日志和曝光日志。

其中，曝光日志包括点击日志中的点击对象，以及与点击对象不同的候选对象。

在一种可实现的应用场景中，电子设备可以获取日志服务器中在预设历史时间段内的点击日志和曝光日志。这里，曝光日志包括电子设备预先展示给用户浏览、滑动或点击所包含的对象的信息。点击日志为预先展示给用户浏览、滑动或点击所包含的对象的信息中，用户浏览时点击、加购和/或购买某一对象的行为被记录所形成的信息。电子设备通过一定的计算关系对点击日志和曝光日志统计出所需的特征数据。

步骤303、基于点击日志中的点击特征数据，和曝光日志中的曝光特征数据，确定目标训练数据。

其中，点击特征数据用于表征点击日志中记录的目标用户点击上述点击对象所生成的数据，曝光特征数据用于表征展示点击对象和候选对象所生成的数据。

本申请实施例中，电子设备从点击日志中提取点击特征数据，从曝光日志中抽取曝光特征数据。示例性的，点击特征数据包括目标用户的用户标识、点击对象的对象标识、点击对象的点击时间、点击对象是否为广告和点击对象的单次点击价格。曝光特征数据包括曝光对象曝光给目标用户的目标标识，曝光对象的对象标识、曝光对象的曝光时间和曝光对象是否为广告；需要说明的是，点击对象和候选对象组成曝光对象。

本申请实施例中，参考图4所示，步骤303基于点击日志中的点击特征数据，和曝光日志中的曝光特征数据，确定目标训练数据，还可通过如下步骤实现，

步骤3031、从点击特征数据中，获取所有目标用户中每一目标用户对应的原始点击数据。

本申请实施例中，在点击特征数据中，每一目标用户对应的至少一个原始点击数据，电子设备获取所有目标用户中每一目标用户对应的至少一个原始点击数据。

步骤3032、从曝光特征数据中，获取所有目标用户中每一目标用户对应的原始曝光数据。

本申请实施例中，在曝光特征数据中，每一目标用户对应的至少一个原始曝光数据，电子设备获取所有目标用户中每一目标用户对应的至少一个原始曝光数据。

步骤3033、对同一目标用户对应的原始点击数据与原始曝光数据进行笛卡尔积运算，得到原始训练数据。

本申请实施例中，电子设备将同一目标用户对应的原始点击数据和原始曝光数据进行笛卡尔积运算，得到原始训练数据。示例性的，原始训练数据包括点击对象的对象标识、曝光对象的对象标识、点击对象的点击时间、点击对象是否为广告和点击对象的单次点击价格、曝光对象的曝光时间和曝光对象是否为广告。

步骤3034、针对原始训练数据中的所有对象，按照对象标识和对象标识对应的点击信息进行聚类处理，得到聚类后的原始训练数据。

其中，点击信息包括点击对象的对象标识、点击次数和点击对象的单次点击价格总和。

本申请实施例中，电子设备针对原始训练数据中的所有对象，按照对象标识和对象标识对应的点击信息进行聚类处理，得到聚类后的原始训练数据。示例性的，电子设备按照点击对象的对象标识和曝光对象的对象标识这两特征，对原始训练数据中的所有对象进行聚类，得到聚类后的原始训练数据。这里，聚合后的原始训练数据包括点击对象的对象标识、曝光对象的对象标识、曝光次数、点击次数和点击对象的单次点击价格总和；需要说明的是，曝光次数为按照对象标识和对象标识对应的点击信息进行聚类处理后得到的数据条数；点击次数为聚类处理后得到的数据条数中，对象标识对应的点击信息中确定点击曝光对象的数据条数。

步骤3035、从聚类后的原始训练数据中，筛选出点击信息满足点击条件的目标训练数据。

一些实施例中，点击条件包括被点击的条件。进一步地，点击条件还包括点击次数的条件；也就是说，曝光对象不仅要被目标用户点击，曝光对象还要满足被目标用户点击的次数。

在一种可实现的应用场景中，电子设备从聚类后的原始训练数据中，筛选出点击信息满足被点击条件的目标训练数据；或电子设备从聚类后的原始训练数据中，筛选出点击信息满足被点击且点击次数条件的目标训练数据。

步骤304、基于第一深度学习算法对目标用户的目标用户特征，以及目标训练数据中与目标用户特征关联的第一样本数据进行训练，得到点击率预估模型。

其中，第一样本数据包括点击对象的对象标识、曝光对象的对象标识、曝光次数、点击次数。

在一种可实现的应用场景中，参照图5所示，图5示出了深度学习算法模型的结构示意图，首先，电子设备将目标用户特征、目标训练数据中与目标用户特征关联的第一样本数据包含的特征输入第一深度学习算法；其次，将目标用户特征、目标训练数据中与目标用户特征关联的第一样本数据包含的特征发送到嵌入层进行处理，得到特征向量；然后通过带有参数的线性整流函数(Parametric Rectified Linear Unit，PRELU)对特征向量进行表示学习，将学习后的特征发送到深度学习模型的回归层，进而得到点击率预估模型。

步骤305、基于第二深度学习算法对目标用户特征，以及目标训练数据中与目标用户特征关联的第二样本数据进行训练，得到指标数据预估模型。

其中，第一样本数据与第二样本数据不同，第一样本数据与第二样本数据组成目标训练数据。

本申请实施例中，第一深度学习算法与第二深度学习算法可以相同，也可以不同。

其中，第二样本数据包括点击对象的对象标识、曝光对象的对象标识、曝光次数、点击次数和点击对象的单次点击价格总和。

本申请实施例中，参考图6所示，指标数据预估模型401可以通过对目标用户特征，以及目标训练数据中与目标用户特征关联的第二样本数据(目标用户特征和对象特征的交叉特征)进行深度学习模型训练得到。

本申请其他实施例中，参考图7所示，指标数据预估模型501还可以通过广告价格和点击率预估模块503得到。具体地，在推荐***的排序模块设置智能出价，通过单次点击价格(cost per click，cpc)获取模块502获取广告企业设置的单次点击价格cpc；其次根据流量质量和竞价环境，在排序模块对单次点击价格cpc进行调整，将调整后的cpc与点击率预估模型相乘，得到指标数据预估模型。

在一种可实现的应用场景中，参照图5所示，图5示出了深度学习算法模型的结构示意图，首先，电子设备将目标用户特征、目标训练数据中与目标用户特征关联的第二样本数据包含的特征输入第二深度学习算法；其次，将目标用户特征、目标训练数据中与目标用户特征关联的第二样本数据包含的特征发送到嵌入层进行处理，得到特征向量；然后通过带有参数的线性整流函数(Parametric Rectified Linear Unit，PRELU)和线性整流函数(Rectified Linear Unit，RELU)对特征向量进行表示学习，将学习后的特征发送到深度学习模型的回归层，进而得到指标数据预估模型。

需要说明的是，深度学习是通过多层网络学习抽象特征，在最后输出层(即回归层)使用得到的抽象特征完成最终的学习任务。这种学习到的特征可以较好的降低问题的非线性程度。深度学习的强大在于利用反向传播可以将目标函数的误差回传，逐层向输出层的方向传播从而矫正网络参数，经过多次迭代，网络参数会被训练的很好。同时，深度学习能够得到人工特征提取难以得到的隐含特征，所以通过深度学习得到的预估模型的预估能力会有明显提升，预估效果会更好。

步骤306、将用户特征和所有对象特征输入点击率预估模型，得到所有推荐对象的预估点击率。

步骤307、将用户特征和所有对象特征输入指标数据预估模型，得到所有推荐对象的预估展现指标数据。

步骤308、确定所有推荐对象的预估点击率的T次方和预估展现指标数据的乘积，为所有推荐对象的推荐置信度。

其中，T为正整数。

本申请实施例中，当T为1时，确定的推荐对象的推荐置信度更加准确，为用户推荐的推荐对象更加准确，且***收益更好。

在一种可实现的应用场景中，参考图8所示，图8示出了本申请提供的一种可选的推荐***的架构示意图。电子设备从日志服务器中获取预设历史时间段内的点击日志601和曝光日志602；通过特征抽取模块603抽取点击日志601中的点击特征数据和曝光日志602中的曝光特征数据；电子设备对点击特征数据和曝光特征数据按照目标用户进行聚合，并对同一目标用户对应的原始点击数据与原始曝光数据进行笛卡尔积运算，得到原始训练数据604。通过相关性控制模块605对原始训练数据604中的所有对象，按照对象标识和对象标识对应的点击信息进行聚类处理，得到聚类后的原始训练数据，聚类后的原始训练数据中，筛选出点击信息满足点击条件的目标训练数据606。基于第一深度学习算法对目标用户的目标用户特征，以及目标训练数据606中与目标用户特征关联的第一样本数据进行训练，得到点击率预估模型607；基于第二深度学习算法对目标用户特征，以及目标训练数据606中与目标用户特征关联的第二样本数据进行训练，得到指标数据预估模型608。将用户特征和待推荐给用户的推荐对象的对象特征输入609分别输入点击率预估模型607和指标数据预估模型608，分别得到预估点击率610和预估展现指标数据611。多目标融合模块612将预估点击率610和预估展现指标数据611进行处理，得到所有推荐对象的推荐置信度613。

步骤309、基于所有推荐对象的推荐置信度，对所有推荐对象进行排序。

步骤310、根据排序结果从至少两个推荐对象中，选择推荐置信度满足置信度阈值的至少一个推荐对象，并输出至少一个推荐对象。

在一种可实现的应用场景中，预估展现指标数据可以为千次展现收益(effectivecost per mile，ecpm)，电子设备得到所有推荐对象的预估点击率(predicted clickthrough rate，pctr)和预估展现指标数据ecpm后，计算所有推荐对象的pctr的T次方和预估展现指标数据ecpm的乘积，得到每一推荐对象的推荐置信度，并基于所有推荐对象的推荐置信度，对所有推荐对象进行排序，并取推荐置信度最大的N个推荐对象。具体地，通过如下公式计算推荐置信度，

score＝pctr^T*ecpm

其中，score为推荐对象的推荐置信度，pctr为推荐对象的预估点击率，ecpm为推荐对象的预估展现指标数据，T为权衡预估点击率即代表长期收益和预估展现指标数据即代表短期收益的超参数。示例性的，当T为1时，确定的推荐对象的推荐置信度更加准确，为用户推荐的推荐对象更加准确，且***收益更高。

由此可知，本申请实施例中，电子设备通过历史数据直接创建点击率ctr预估模型和指标数据ecpm预估模型后，将用户所具有的用户特征和待推荐给用户的推荐对象的对象特征直接输入上述两个预估模型中，分别得到预估点击率和预估展现指标数据，进而参考预估的结果对推荐对象进行最佳推荐；如此，提高了预估展现指标数据的预估准确度；同时，提升了推荐信息的精确度，保证了用户体验，且提升推荐***的总体收益的同时，兼顾了推荐***的长期收益和短期收益。

需要说明的是，本实施例中与其它实施例中相同步骤和相同内容的说明，可以参照其它实施例中的描述，此处不再赘述。

本申请实施例提供一种信息推荐装置，该信息推荐装置可以应用于图2～4对应的实施例提供的一种信息推荐方法中，参照图9所示，该信息推荐装置8包括：

获取模块801，用于获取用户特征和待推荐给用户的至少两个推荐对象的对象特征；

处理模块802，用于将用户特征和所有对象特征输入点击率预估模型，得到所有推荐对象的预估点击率；

处理模块802，还用于将用户特征和所有对象特征输入指标数据预估模型，得到所有推荐对象的预估展现指标数据；

排序模块803，用于基于所有推荐对象的预估点击率和预估展现指标数据对所有推荐对象进行排序；

选择模块804，用于根据排序结果从至少两个推荐对象中选择至少一个推荐对象；

输出模块805，用于输出至少一个推荐对象。

本申请其他实施例中，获取模块801，还用于获取在预设历史时间段内的点击日志和曝光日志；其中，曝光日志包括点击日志中的点击对象，以及与点击对象不同的候选对象；处理模块802，还用于基于点击日志中的点击特征数据，和曝光日志中的曝光特征数据，确定目标训练数据；其中，点击特征数据用于表征点击日志中记录的目标用户点击上述点击对象所生成的数据，曝光特征数据用于表征展示点击对象和候选对象所生成的数据；基于第一深度学习算法对目标用户的目标用户特征，以及目标训练数据中与目标用户特征关联的第一样本数据进行训练，得到点击率预估模型；基于第二深度学习算法对目标用户特征，以及目标训练数据中与目标用户特征关联的第二样本数据进行训练，得到指标数据预估模型；其中，第一样本数据与第二样本数据不同，第一样本数据与第二样本数据组成目标训练数据。

本申请其他实施例中，获取模块801，还用于从点击特征数据中，获取所有目标用户中每一目标用户对应的原始点击数据；从曝光特征数据中，获取所有目标用户中每一目标用户对应的原始曝光数据；处理模块802，还用于对同一目标用户对应的原始点击数据与原始曝光数据进行笛卡尔积运算，得到原始训练数据；从原始训练数据中筛选出部分数据，得到目标训练数据。

本申请其他实施例中，处理模块802，还用于针对原始训练数据中的所有对象，按照对象标识和对象标识对应的点击信息进行聚类处理，得到聚类后的原始训练数据；对聚类后的原始训练数据进行筛选，得到目标训练数据。

本申请其他实施例中，处理模块802，还用于从聚类后的原始训练数据中，筛选出点击信息满足点击条件的目标训练数据。

本申请其他实施例中，处理模块802，还用于确定所有推荐对象的预估点击率的T次方和预估展现指标数据的乘积，为所有推荐对象的推荐置信度；其中，T为正整数；排序模块803，还用于基于所有推荐对象的推荐置信度，对所有推荐对象进行排序。

本申请其他实施例中，选择模块804，还用于根据排序结果从至少两个推荐对象中，选择推荐置信度满足置信度阈值的至少一个推荐对象。

本申请实施例提供一种电子设备，该电子设备可以应用于图2～4对应的实施例提供的一种信息推荐方法中，参照图10所示，该电子设备(图10中的电子设备9对应图9中的信息推荐装置8)包括：处理器901、存储器902和通信总线903，其中：

通信总线903用于实现处理器901和存储器902之间的通信连接；

处理器901用于执行存储器902中存储的信息处理程序，以实现以下步骤：

将用户特征和所有对象特征输入点击率预估模型，得到所有推荐对象的预估点击率；

将用户特征和所有对象特征输入指标数据预估模型，得到所有推荐对象的预估展现指标数据；

基于所有推荐对象的预估点击率和预估展现指标数据对所有推荐对象进行排序；

根据排序结果从至少两个推荐对象中选择至少一个推荐对象，并输出至少一个推荐对象。

在本申请其他实施例中，处理器902用于执行存储器901中存储的信息推荐处理程序，以实现以下步骤：

获取在预设历史时间段内的点击日志和曝光日志；其中，曝光日志包括点击日志中的点击对象，以及与点击对象不同的候选对象；基于点击日志中的点击特征数据，和曝光日志中的曝光特征数据，确定目标训练数据；其中，点击特征数据用于表征点击日志中记录的目标用户点击上述点击对象所生成的数据，曝光特征数据用于表征展示点击对象和候选对象所生成的数据；基于第一深度学习算法对目标用户的目标用户特征，以及目标训练数据中与目标用户特征关联的第一样本数据进行训练，得到点击率预估模型；基于第二深度学习算法对目标用户特征，以及目标训练数据中与目标用户特征关联的第二样本数据进行训练，得到指标数据预估模型；其中，第一样本数据与第二样本数据不同，第一样本数据与第二样本数据组成目标训练数据。

从点击特征数据中，获取所有目标用户中每一目标用户对应的原始点击数据；从曝光特征数据中，获取所有目标用户中每一目标用户对应的原始曝光数据；对同一目标用户对应的原始点击数据与原始曝光数据进行笛卡尔积运算，得到原始训练数据；从原始训练数据中筛选出部分数据，得到目标训练数据。

针对原始训练数据中的所有对象，按照对象标识和对象标识对应的点击信息进行聚类处理，得到聚类后的原始训练数据；对聚类后的原始训练数据进行筛选，得到目标训练数据。

从聚类后的原始训练数据中，筛选出点击信息满足点击条件的目标训练数据。

确定所有推荐对象的预估点击率的T次方和预估展现指标数据的乘积，为所有推荐对象的推荐置信度；其中，T为正整数；

基于所有推荐对象的推荐置信度，对所有推荐对象进行排序。

根据排序结果从至少两个推荐对象中，选择推荐置信度满足置信度阈值的至少一个推荐对象。

基于前述实施例，本申请的实施例提供一种计算机存储介质，该计算机存储介质存储有一个或者多个程序，该一个或者多个程序可被一个或者多个处理器执行，以实现如下步骤：

在本申请的其他实施例中，该一个或者多个程序可被一个或者多个处理器执行，还可以实现以下步骤：

确定所有推荐对象的预估点击率的T次方和预估展现指标数据的乘积，为所有推荐对象的推荐置信度；其中，T为正整数；基于所有推荐对象的推荐置信度，对所有推荐对象进行排序。

需要说明的是，上述计算机存储介质/存储器可以是只读存储器(Read OnlyMemory，ROM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、磁性随机存取存储器(Ferromagnetic Random Access Memory，FRAM)、快闪存储器(Flash Memory)、磁表面存储器、光盘、或只读光盘(Compact Disc Read-Only Memory，CD-ROM)等存储器；也可以是包括上述存储器之一或任意组合的各种终端，如移动电话、计算机、平板设备、个人数字助理等。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个***，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能单元可以全部集成在一个处理模块中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请所提供的几个方法实施例中所揭露的方法，在不冲突的情况下可以任意组合，得到新的方法实施例。

本申请所提供的几个产品实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的产品实施例。

本申请所提供的几个方法或设备实施例中所揭露的特征，在不冲突的情况下可以任意组合，得到新的方法实施例或设备实施例。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种信息推荐方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述用户特征和所有对象特征输入点击率预估模型，得到所述所有推荐对象的预估点击率之前，所述方法还包括：

获取在预设历史时间段内的点击日志和曝光日志；其中，所述曝光日志包括点击日志中的点击对象，以及与所述点击对象不同的候选对象；

基于所述点击日志中的点击特征数据，和所述曝光日志中的曝光特征数据，确定目标训练数据；其中，点击特征数据用于表征所述点击日志中记录的目标用户点击所述点击对象所生成的数据，曝光特征数据用于表征展示所述点击对象和所述候选对象所生成的数据；

基于第一深度学习算法对所述目标用户的目标用户特征，以及所述目标训练数据中与所述目标用户特征关联的第一样本数据进行训练，得到所述点击率预估模型；

基于第二深度学习算法对所述目标用户特征，以及所述目标训练数据中与所述目标用户特征关联的第二样本数据进行训练，得到所述指标数据预估模型；其中，所述第一样本数据与所述第二样本数据不同，所述第一样本数据与所述第二样本数据组成所述目标训练数据。

3.根据权利要求2所述的方法，其特征在于，所述基于所述点击日志中的点击特征数据，和所述曝光日志中的曝光特征数据，确定目标训练数据，包括：

从所述点击特征数据中，获取所有目标用户中每一目标用户对应的原始点击数据；

从所述曝光特征数据中，获取所述所有目标用户中每一目标用户对应的原始曝光数据；

对同一目标用户对应的所述原始点击数据与所述原始曝光数据进行笛卡尔积运算，得到原始训练数据；

从所述原始训练数据中筛选出部分数据，得到所述目标训练数据。

4.根据权利要求3所述的方法，其特征在于，所述从所述原始训练数据中筛选出部分数据，得到所述目标训练数据，包括：

针对原始训练数据中的所有对象，按照对象标识和所述对象标识对应的点击信息进行聚类处理，得到聚类后的原始训练数据；

对所述聚类后的原始训练数据进行筛选，得到所述目标训练数据。

5.根据权利要求4所述的方法，其特征在于，所述对所述聚类后的原始训练数据进行筛选，得到所述目标训练数据，包括：

从所述聚类后的原始训练数据中，筛选出所述点击信息满足点击条件的所述目标训练数据。

6.根据权利要求1所述的方法，其特征在于，所述基于所述所有推荐对象的所述预估点击率和所述预估展现指标数据对所述所有推荐对象进行排序，包括：

确定所述所有推荐对象的所述预估点击率的T次方和所述预估展现指标数据的乘积，为所述所有推荐对象的推荐置信度；其中，T为正整数；

基于所述所有推荐对象的推荐置信度，对所述所有推荐对象进行排序。

7.根据权利要求6所述的方法，其特征在于，所述根据排序结果从所述至少两个推荐对象中选择至少一个推荐对象，包括：

根据排序结果从所述至少两个推荐对象中，选择所述推荐置信度满足置信度阈值的至少一个推荐对象。

8.一种信息推荐装置，其特征在于，所述装置包括：

输出模块，用于输出所述至少一个推荐对象。

9.一种电子设备，其特征在于，所述电子设备包括：处理器、存储器和通信总线；

所述通信总线用于实现处理器和存储器之间的通信连接；

所述处理器用于执行存储器中存储的信息处理程序，以实现如权利要求1至7中任一项所述的信息推荐方法。

10.一种存储介质，其特征在于，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如权利要求1至7中任一项所述的信息推荐方法。