CN110825966A

CN110825966A - 一种信息推荐的方法、装置、推荐服务器和存储介质

Info

Publication number: CN110825966A
Application number: CN201911053819.3A
Authority: CN
Inventors: 张永池
Original assignee: Guangzhou Baiguoyuan Information Technology Co Ltd
Current assignee: Bigo Technology Pte Ltd
Priority date: 2019-10-31
Filing date: 2019-10-31
Publication date: 2020-02-21
Anticipated expiration: 2039-10-31
Also published as: US20220405641A1; EP4053716A4; WO2021082500A1; CN110825966B; EP4053716A1

Abstract

本发明实施例公开了一种信息推荐的方法、装置、推荐服务器和存储介质。其中，该方法包括：通过推荐模型对推荐信息的特征向量进行预测，得到所述推荐信息的点击通过率，所述推荐模型中去掉与所述特征向量的特征相同且频次小于等于第一阈值的特征对应的模型参数；根据所述点击通过率，下发所述推荐信息。本发明实施例提供的技术方案，在推荐模型的训练过程中，仅保留频次大于第一阈值的特征对应的模型参数，减小了推荐模型的大小，降低了推荐模型中的参数占用空间，无需查询特征向量中的每一特征对应的模型参数，降低了查询过程中的耗费时长，仅对与推荐模型中保留的模型参数对应的特征进行分析，在保证推荐准确性的同时，提高了信息推荐效率。

Description

一种信息推荐的方法、装置、推荐服务器和存储介质

技术领域

本发明实施例涉及机器学习技术领域，尤其涉及一种信息推荐的方法、装置、推荐服务器和存储介质。

背景技术

随着人工智能交互技术的快速发展，预先训练的机器学习模型越来越广泛的应用在推荐、搜索、广告等各类业务的大数据场景下，针对用户的搜索需求后台会获取大量相关的推荐信息，此时需要预测多条推荐信息的点击通过率(Click Through Rate，CTR)，以便根据各推荐信息的点击通过率为用户推送最优的信息。

目前通常采用逻辑回归算法训练出的尽量拟合用户对推荐信息的点击行为的业务预测模型中包含推荐信息中每一特征维度下的模型权重系数，在预测每一推荐信息的点击通过率时，需要去查询推荐信息中每一特征维度下的特征值以及对应的模型权重系数，此时由于推荐信息中存在大量高维稀疏特征，如推荐信息中身份维度下的用户身份标识(identity，ID)、主播ID或者设备ID等，最高能够达到上亿维，使得业务预测模型在存储推荐信息中的大量高维稀疏特征时会占用大量的内存空间，面临内存不足的问题；而且对于包含大量特征的推荐信息，需要耗费较长时间去查询推荐信息中每一特征维度下的模型参数模型权重系数，使得业务预测模型过大，导致推荐信息的预测效率较低。

发明内容

本发明实施例提供了一种信息推荐的方法、装置、推荐服务器和存储介质，减小推荐模型的大小，在保证推荐准确性的同时，提高信息推荐效率。

第一方面，本发明实施例提供了一种信息推荐的方法，该方法包括：

通过推荐模型对推荐信息的特征向量进行预测，得到所述推荐信息的点击通过率，所述推荐模型中去掉与所述特征向量的特征相同且频次小于等于第一阈值的特征对应的模型参数；

根据所述点击通过率，下发所述推荐信息。

第二方面，本发明实施例提供了一种信息推荐的装置，该装置包括：

点击预测模块，用于通过推荐模型对推荐信息的特征向量进行预测，得到所述推荐信息的点击通过率，所述推荐模型中去掉与所述特征向量的特征相同且频次小于等于第一阈值的特征对应的模型参数；

信息推荐模块，用于根据所述点击通过率，下发所述推荐信息。

第三方面，本发明实施例提供了一种推荐服务器，该推荐服务器包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明任意实施例所述的信息推荐的方法。

第四方面，本发明实施例提供了一种模型训练***，该***包括：训练服务器集群和参数服务器集群，所述参数服务器集群中存储预设的机器学习模型中不同特征对应的模型参数；

所述训练服务器集群依次从所述参数服务器集群获取所述机器学习模型中不同特征对应的最新模型参数，根据该模型参数对历史推荐信息的历史特征向量进行处理，得到对应的点击通过率，并计算所述机器学习模型中频次大于第一阈值的特征对应的模型参数的损失系数，将该损失系数返回给所述参数服务器集群；

所述参数服务器集群根据该损失系数更新对应的模型参数并反馈给所述训练服务器集群，直至所述机器学习模型完成训练后，去掉频次小于等于第一阈值的特征对应的模型参数，并利用最新的剩余模型参数生成对应的推荐模型。

第五方面，本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明任意实施例所述的信息推荐的方法。

本发明实施例提供了一种信息推荐的方法、装置、推荐服务器和存储介质，在推荐模型的训练过程中，去掉与推荐信息的特征向量中的特征相同且频次小于等于第一阈值的特征对应的模型参数，仅保留频次大于第一阈值的特征对应的模型参数，从而减小了推荐模型的大小，降低了推荐模型中的参数占用空间，同时在通过该推荐模型中的模型参数对推荐信息的特征向量进行预测时，无需查询特征向量中的每一特征对应的模型参数，降低了查询过程中的耗费时长，仅对推荐信息的特征向量中与推荐模型中保留的模型参数对应的特征进行分析，在保证推荐准确性的同时，提高了信息推荐效率。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1A为本发明实施例一提供的一种信息推荐的方法的流程图；

图1B为本发明实施例一提供的信息推荐过程的原理示意图；

图2A为本发明实施例二提供的方法中训练推荐模型的流程图；

图2B为本发明实施例二提供的推荐模型训练过程的原理示意图；

图3A为本发明实施例三提供的方法中训练推荐模型的流程图；

图3B为本发明实施例三提供的方法中推荐模型的训练过程的原理示意图；

图4为本发明实施例四提供的一种信息推荐的方法的流程图；

图5为本发明实施例五提供的一种信息推荐的装置的结构示意图；

图6为本发明实施例六提供的一种模型训练***的原理架构图；

图7为本发明实施例七提供的一种推荐服务器的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1A为本发明实施例一提供的一种信息推荐的方法的流程图，本实施例可应用于任一种可以为用户提供针对相关推荐信息的下发请求服务的后台推荐服务器中。本发明实施例的技术方案适用于为用户推荐相关信息的情况中。本实施例提供的一种信息推荐的方法可以由本发明实施例提供的信息推荐的装置来执行，该装置可以通过软件和/或硬件的方式来实现，并集成在执行本方法的推荐服务器中。

具体的，参考图1A，该方法可以包括如下步骤：

S110，通过推荐模型对推荐信息的特征向量进行预测，得到推荐信息的点击通过率。

其中，推送信息是推送服务器根据接收到的用户在客户端作用的下发请求，根据用户的历史行为数据通过现有的物品推荐itemCF算法、用户推荐userCF算法、内容推荐content-based算法或服务推荐vector-based算法等查找出的大量与本次下发请求对应的推荐信息。

具体的，该下发请求为用户需要推荐服务端在当前推荐对应的相关信息时，通过在客户端执行对应的内容刷新操作或者对具体某一信息的搜索查找操作，而对应生成本次请求中的指令信息。在下发请求中不包含具体的请求内容时，可以通过对该用户的历史行为数据进行分析，判断该用户较为感兴趣的新闻、资讯、音乐或短视频等内容，从而查找出对应的数据内容，作为本次请求对应的推荐信息，该种请求方法一般针对的是用户在客户端安装的对应软件产品中执行内容刷新操作，不确定所需要的具体信息，此时根据历史行为数据分析对应的推荐信息，从而为用户推荐优质的信息；同时，在下发请求中包含具体的请求内容时，可以直接对该具体的请求内容进行分析，从而查找与本次请求的具体内容相关联的新闻、资讯、音乐或短视频等内容，将查找到的关联信息作为本次请求对应的推荐信息，该种请求方法一般针对的是用户在客户端安装的对应软件产品中执行相关内容信息的搜索查找操作，此时可以根据本次请求中的具体搜索内容确定对应的推送信息，从而为用户推荐匹配的信息。

同时，推荐信息的特征向量是指对推荐信息的各类特征分析出的在不同维度上的特征数据，例如，如果从点赞、转发和评论三方面对某一视频进行特征分析，则从这三方面分别对应分析出的点赞结果、转发结果和评论结果可以组成该视频的一个三维特征向量。

此外，推荐模型为预先训练好的一种用于快速为用户筛选出最匹配的推荐信息的网络模型，该离线训练为针对各个历史推荐信息对应的特征向量，对用户对每一历史推荐信息的点击行为进行的训练，现有的训练会不断更新网络模型中预设的与特征向量中每一特征相同的特征所对应的模型参数，因此所训练出的网络模型中存在与特征向量中每一特征对应的模型参数，以便对特征向量中的各个特征进行分析，此时由于在搜索、个性化推送或者广告通知等推荐场景下，每一推荐信息中包含大量不同类型下的特征，使得训练后的网络模型中也存在大量不同类型特征对应的模型参数，导致内存占用过大，而且在预测用户对各个推荐信息的点击行为时，需要耗费较长时间在大量模型参数中查询每一特征对应的模型参数，降低模型运算的效率。

针对上述原因，本实施例中考虑到推荐信息的特征向量中可能包含大量高维稀疏特征，如用户ID、主播ID或者设备ID等，此时如果该类高维稀疏特征极少参与到用户对推荐信息的点击行为的训练过程中，从而对用户对不同推荐信息的点击行为不造成影响，因此在模型训练过程中，如图1B所示，本实施例可以排除对历史推荐信息的特征向量中包含的该类特征的训练，仅保留对用户的点击行为存在较大影响的特征的训练，使得训练后的推荐模型中仅保留对用户的点击行为存在较大影响的特征对应的模型参数。本实施例中可以在模型训练过程中根据历史推荐信息的特征向量判断网络模型中预设的每一特征出现的次数(本实施例中特征的频次)表示该特征对用户的点击行为的影响程度，因此本实施例训练好的推荐模型中去掉与特征向量的特征相同且频次小于等于第一阈值的特征对应的模型参数，仅保留频次大于第一阈值的特征对应的模型参数，从而减少了推荐模型的大小，降低了推荐模型中的参数占用空间。示例性的，本实施例中推荐模型中的模型参数可以为该推荐模型中不同特征对应的权重系数，用于表示各个特征对于用户的点击行为的影响程度。

同时，推荐信息的点击通过率是指将该推荐信息从全部的推荐信息中筛选出来并推荐给用户所在客户端，并被用户点击查看的点击达到率，也就是该推荐信息的实际点击次数除以全部推荐信息的信息总量，以此确定下发给用户的各个推荐信息的优劣性。

可选的，用户通过在客户端执行对应的内容刷新操作或者对具体某一信息的搜索查找操作，生成对应的下发请求，并发送给推荐服务器，该推荐服务器根据用户的历史行为数据通过现有的相似度算法查找出的大量与本次下发请求对应的推荐信息，并根据各个推荐信息的标识信息从存储有各个上传信息的不同类型特征的特征服务端中获取对应的特征向量，进而将各推荐信息的特征向量输入到本实施例预先训练好的推荐模型中，通过该推荐模型中保留的频次大于第一阈值的特征对应的模型参数对各推荐信息的特征向量中对应的特征进行分析，从而预测得到各个推荐信息的点击通过率。

S120，根据点击通过率，下发推荐信息。

具体的，在得到各个推荐信息的点击通过率后，可以明确用户对各个推荐信息的喜好程度，进而根据用户的下发需求和点击通过率在全部的推荐信息中筛选出对应的推荐信息，并下发给用户。示例性的，如果用户当前需要获取最优的一条信息，则将点击通过率最高的推荐信息下发给用户，如果用户需要一次性获取多条相关信息，则将点击通过率靠前的多条推荐信息下发给用户。

本实施例提供的技术方案，在推荐模型的训练过程中，去掉与推荐信息的特征向量中的特征相同且频次小于等于第一阈值的特征对应的模型参数，仅保留频次大于第一阈值的特征对应的模型参数，从而减小了推荐模型的大小，降低了推荐模型中的参数占用空间，同时在通过该推荐模型中的模型参数对推荐信息的特征向量进行预测时，无需查询特征向量中的每一特征对应的模型参数，降低了查询过程中的耗费时长，仅对推荐信息的特征向量中与推荐模型中保留的模型参数对应的特征进行分析，在保证推荐准确性的同时，提高了信息推荐效率。

实施例二

图2A为本发明实施例二提供的方法中训练推荐模型的流程图，图2B为本发明实施例二提供的推荐模型训练过程的原理示意图。本实施例是在上述实施例的基础上进行优化。可选的，本实施例中推荐模型的训练可以在线下执行，与线上采用该训练好的推荐模型预测各个推荐信息的点击通过率的步骤可以在不同的设备上实现，因此本实施例中可以通过预先架构的模型训练***来训练该推荐模型，在训练完成后，将该推荐模型发布到推荐服务器中，用于线上执行本发明任意实施例提及的信息推荐的方法。具体的，本实施例中主要对于推荐模型的线下训练过程进行详细的解释说明。

可选的，如图2A所示，本实施例中可以包括如下步骤：

S210，根据历史推荐信息的历史特征向量在预设的机器学习模型中的点击通过率，依次更新机器学习模型中频次大于第一阈值的特征对应的模型参数。

其中，在训练推荐模型前，会预先构建一个机器学习模型，该机器学习模型中针对不同类型下的每一特征均预先设置对应的模型参数的初始值，后续通过大量不同类型下的历史推荐信息的点击通过率的预测误差，不断对该机器学习模型中各特征对应的模型参数进行修正，直至能够准确预测任一类型下的历史推荐信息的点击通过率。

具体的，获取大量不同类型下的历史推荐信息，用于准确分析用户对不同类型信息的点击行为，进而判断用户的喜好；将各历史推荐信息的历史特征向量输入到预设的机器学习模型中，由该机器学习模型中预设的当前模型参数对历史特征向量中对应的特征进行分析，进而得到各历史推荐信息的点击通过率，通过对该历史推荐信息的历史标签和点击通过率进行比对，判断机器学习模型中当前模型参数下的预测误差，同时根据历史推荐信息的特征向量中包含的特征，判断该机器学习模型中各个特征出现的次数，也就是本实施例中特征的频次，并将该预测误差在机器学习模型中反向传播，用于对选取出的机器学习模型中频次大于第一阈值的特征对应的模型参数进行修正，以便后续提高预测结果的准确性。

示例性的，如图2B所示，本实施例中根据历史推荐信息的历史特征向量在预设的机器学习模型中的点击通过率，依次更新机器学习模型中频次大于第一阈值的特征对应的模型参数，具体可以包括：通过机器学习模型对当前历史推荐信息的历史特征向量进行预测，得到对应的当前点击通过率；采用预设损失函数计算当前点击通过率在频次大于第一阈值的特征对应的模型参数下的损失系数，并根据该损失系数修正机器学习模型中对应的模型参数，继续通过机器学习模型对下一历史推荐信息的历史特征向量进行预测，并修正机器学习模型中频次大于第一阈值的特征对应的模型参数，直至机器学习模型完成训练。

具体的，将当前历史推荐信息的历史特征向量输入预设的机器学习模型中，通过当前的模型参数对当前历史推荐信息的历史特征向量中的对应特征进行分析，预测得到该当前历史推荐信息的当前点击通过率，并根据历史推荐信息的历史特征向量中包含的特征分析机器学习模型中各个特征的频次，进而标记出频次大于第一阈值的特征对应的模型参数；同时采用预设损失函数确定当前点击通过率在该机器学习模型中频次大于第一阈值的特征对应的模型参数下的损失系数，也就是该模型参数距离达到能够准确分析出历史推荐信息的点击通过率的差距，进而根据该损失系数分别修正机器学习模型中对应的模型参数；在本次修正后继续获取下一历史推荐信息的历史特征向量，并输入到修正后的机器学习模型中，由该机器学习模型中修正后的模型参数(频次大于第一阈值的特征对应的模型参数)继续分析下一历史推荐信息的历史特征向量中与该模型参数对应的特征，排除频次小于等于第一阈值的特征，得到下一历史推荐信息的下一点击通过率，并继续修正该机器学习模型中频次大于第一阈值的特征对应的模型参数，依次循环，直至历史推荐信息的点击通过率的预测误差低于预设误差阈值，表示此时该机器学习模型完成训练。

S220，在机器学习模型完成训练后，去掉频次小于等于第一阈值的特征对应的模型参数，并利用最新的剩余模型参数生成推荐模型。

其中，剩余模型参数为机器学习模型中频次大于第一阈值的特征对应的模型参数。

可选的，由于机器学习模型中频次小于等于第一阈值的特征对于预测用户的点击行为几乎未作出贡献，因此为了推荐模型的效率，本实施例中在机器学习模型完成训练后，可以直接根据模型训练过程中对频次大于第一阈值的特征对应的模型参数的标记情况，去掉该机器学习模型中频次小于等于第一阈值的特征对应的模型参数，而不对推荐信息的点击通过率的预测结果造成影响，后续利用去掉频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数(机器学习模型中频次大于第一阈值的特征对应的模型参数)生成对应的推荐模型，使得该推荐模型中仅保留频次大于第一阈值的特征对应的模型参数，在保证推荐准确性的基础上，见笑了推荐模型的大小，提高了推荐模型的效率。

此外，为了准确判断出机器学习模型中频次小于等于第一阈值的特征对应的模型参数，本实施例在依次更新机器学习模型中频次大于第一阈值的特征对应的模型参数之后，还可以包括：将机器学习模型中频次小于等于第一阈值的特征对应的模型参数设置为预设稀疏值，以便在机器学习模型完成训练后，去掉预设稀疏值下的模型参数。

具体的，在模型训练过程中，在将每一历史推荐信息的历史特征向量输入到机器学习模型中进行训练的过程中，可以根据历史特征向量中包含的特征确定该机器学习模型中预设的各个特征的频次，此时对于频次大于第一阈值的特征对应的模型参数进行修正，对于频次小于等于第一阈值的特征对应的模型参数，由于后续该特征对应的模型参数不再参与学习训练，因此直接将频次小于等于第一阈值的特征对应的模型参数设置为预设稀疏值(本实施例中该预设稀疏值为0)，后续在机器学习模型完成训练后，直接去掉预设稀疏值下的模型参数，进而保留频次大于第一阈值的特征对应的模型参数。

示例性的，本实施例中在机器学习模型中配置改进的跟随正则化逻辑(Followedthe Regularized Leader，FTRL)算法，通过该改进的FTRL算法对在模型训练过程中依次对频次大于第一阈值的特征对应的模型参数进行修正。现有的FTRL算法如下：

其中，g为某一特征对应的模型参数的损失系数，z和n为机器学习模型在训练过程中的中间变量，w为特征对应的模型参数，α、β、λ₁和λ₂为稀疏性训练的限定参数。

本实施例中在上述FTRL算法的基础上，对机器学习模型中特征的频次进行限定，改进的FTRL算法如下：

其中，f为机器学习模型中某一特征的频次，λ₃为特征的频次限定的第一阈值；改进后的FTRL算法对机器学习模型中频次大于第一阈值的特征对应的模型参数依然进行常规的训练，而直接将频次小于等于第一阈值的特征对应的模型参数设置为0，不参与后续的机器学习过程，也就是在机器学习模型的训练过程中，根据历史推荐信息的历史特征向量，确定机器学习模型中预设的各个特征的频次，只有特征频次大于第一阈值后才会对该特征对应的模型参数进行机器学习，否则该特征对应的模型参数一直设置为0；后续在机器学习模型完成训练后，利用不为0的模型参数生成对应的推荐模型，在保证推荐准确性的基础上，减少了推荐模型的大小，提高了推荐模型的效率。

S230，线上发布推荐模型。

可选的，在生成对应的推荐模型后，可以直接将该推荐模型在线上发布，也就是应用到执行本发明任意实施例提供的信息推荐的方法的推荐服务器中，以便在线上直接采用该推荐模型预测各个推荐信息的点击通过率，为用户推荐更感兴趣的内容，提高信息推荐的准确性和效率。

本实施例提供的技术方案，通过机器学习模型对历史推荐信息预测的点击通过率不断更新机器学习模型中频次大于第一阈值的特征对应的模型参数，并在机器学习模型完成训练后，去掉频次小于等于第一阈值的特征对应的模型参数，并利用最新的剩余模型参数生成对应的推荐模型，无需每次对频次小于等于第一阈值的特征对应的模型参数进行修正，提高了模型训练的高效性，减少了推荐模型的大小，同时降低了模型参数和高维稀疏特征的内存占用。

实施例三

图3A为本发明实施例三提供的方法中训练推荐模型的流程图，图3B为本发明实施例三提供的方法中推荐模型的训练过程的原理示意图。本实施例是在上述实施例的基础上进行优化。可选的，由于在机器学习模型完成训练后，如果模型规模达到内存上限则会造成模型预测的拥塞，因此需要对频次较低的特征对应的模型参数再次进行过滤，以保证推荐模型的高效性。具体的，本实施例主要对于推荐模型的二次优化过程进行详细的解释说明。

具体的，如图3A所示，该方法可以包括如下步骤：

S310，根据历史推荐信息的历史特征向量在预设的机器学习模型中的点击通过率，依次更新机器学习模型中频次大于第一阈值的特征对应的模型参数。

S320，在机器学习模型完成训练后，去掉频次小于等于第一阈值的特征对应的模型参数，如果机器学习模型规模达到内存上限，则在剩余模型参数中过滤频次小于等于第二阈值的特征对应的模型参数，并利用过滤后的剩余模型参数生成推荐模型。

可选的，在机器学习模型完成训练后，可以去掉该机器学习模型中频次小于等于第一阈值的特征对应的模型参数，此时如果该机器学习模型的规模还是达到内存上限，则在去掉频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数中继续过滤出频次小于等于第二阈值的特征对应的模型参数，此时该第二阈值大于第一阈值，释放相应的内存空间，并利用过滤后的剩余模型参数生成对应的推荐模型，进而进一步减少推荐模型的大小。

S330，在机器学习模型完成当前时段下的训练后，根据预设的频次衰减系数更新机器学习模型中不同特征的频次，并在去掉频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数中过滤频次小于等于第二阈值的特征对应的模型参数，利用过滤后的剩余模型参数生成当前时段下的推荐模型。

可选的，由于在信息推荐过程中不断存在新的推荐业务，从而存在新的特征，而如果某一时段更新的推荐业务特征仅热门一段时间，后期不再对该业务特征进行参考，但机器学习模型中在热门时段已经记录该业务特征的频次大于第一阈值，在后期训练时还是会一直参考该业务特征，但该业务特征已经不再对模型训练有任何贡献，因此为了保证推荐模型的准确性，本实施例可以对机器学习模型进行分时段训练，获取当前时段下的历史推荐信息，不断对机器学习模型中频次大于第一阈值的特征对应的模型参数进行修正，在机器学习模型完成当前时段下的训练后，由于前一时段的某一特征在当前时段可能不在出现，因此根据预设的频次衰减系数更新机器学习模型中不同特征的频次，此时如果某一特征一直不出现，则该特征的频次会不断衰减，直至小于等于第一阈值而被去掉，如图3B所示，本实施例中根据预设的频次衰减系数更新机器学习模型中不同特征的频次后，首先去掉频次小于等于第一阈值的特征对应的模型参数，并在剩余模型参数中再次过滤频次小于等于第二阈值的特征对应的模型参数，进而利用过滤后的剩余模型参数生成当前时段下的推荐模型，进一步提高推荐模型的准确性和高效性。

需要说明的是，本实施例中过滤频次小于等于第二阈值的特征对应的模型参数可以根据训练后的机器学习模型的规模来判断是否执行，如果在机器学习模型完成当前时段下的训练后规模未达到内存上限，则可以不用再次过滤频次小于等于第二阈值的特征对应的模型参数，而直接利用去掉频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数生成对应的推荐模型，因此本实施例中S320和S330可以选择执行其中的一个。

S340，线上发布推荐模型。

本实施例提供的技术方案，在机器学习模型完成训练后，如果机器学习模型的规模达到内存上限，则在去掉频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数中再次过滤频次小于等于第二阈值的特征对应的模型参数，利用过滤后的剩余模型参数生成对应的推荐模型，进一步减少了推荐模型的大小，降低了模型参数和高维稀疏特征的内存占用；同时通过分时段训练机器学习模型，并根据频次衰减系数不断更新不同特征的频次，保证不同时段下推荐模型的准确性和高效性。

实施例四

图4为本发明实施例四提供的一种信息推荐的方法的流程图。本实施例是在上述实施例的基础上进行优化。具体的，本实施例中对于具体的信息推荐过程进行说明，如图4所示，本实施例中可以包括如下步骤：

S410，获取推荐模型中去掉与特征向量的特征相同且频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数。

具体的，在根据用户请求获取到大量推荐信息后，需要通过线上发布的推荐模型对各个推荐信息的特征向量进行预测，因此首先确定线上发布的推荐模型，并查找出该推荐模型中去掉与特征向量的特征相同且频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数，也就是频次大于第一阈值的特征对应的模型参数，以便对各个推荐信息的特征向量中对应的特征进行分析。

S420，根据剩余模型参数以及特征向量中与剩余模型参数对应的特征，计算推荐信息的点击通过率。

可选的，根据推荐模型中保留的剩余模型参数，在各个推荐信息的特征向量中筛选出该剩余模型参数对应的特征，此时模型参数可以是特征的权重系数，采用加权求和的方式将每一剩余模型参数和推荐信息的特征向量中与该剩余模型参数对应的特征相乘并求和，将推荐信息的特征向量中各个剩余模型参数对应的特征加权求和的结果作为本实施例中推荐信息的点击通过率，减少推荐模型中的计算量，提高信息推荐的效率。

S430，根据点击通过率对推荐信息排序，并构建对应的下发列表下发给用户。

可选的，在得到各个推荐信息的点击通过率后，根据该点击通过率的高低为各个推荐信息进行排序，并根据用户的需求选择排序靠前的推荐信息构建对应的下发列表，并将该下发列表显示给用户，保证信息推荐的准确性。

本实施例提供的技术方案，在推荐模型的训练过程中，去掉与推荐信息的特征向量中的特征相同且频次小于等于第一阈值的特征对应的模型参数，仅保留频次大于第一阈值的特征对应的模型参数，从而减小了推荐模型的大小，降低了推荐模型中的参数占用空间，同时在通过该推荐模型中的模型参数对推荐信息的特征向量进行预测时，无需查询特征向量中的每一特征对应的模型参数，降低了查询过程中的耗费时长，仅对推荐信息的特征向量中与推荐模型中保留的模型参数对应的特征进行分析，在保证推荐准确性的同时，提高了信息推荐效率，进而为用户推送更加优质的内容，优化了信息推送效果。

实施例五

图5为本发明实施例五提供的一种信息推荐的装置的结构示意图，具体的，如图5所示，该装置可以包括：

点击预测模块510，用于通过推荐模型对推荐信息的特征向量进行预测，得到推荐信息的点击通过率，该推荐模型中去掉与特征向量的特征相同且频次小于等于第一阈值的特征对应的模型参数；

信息推荐模块520，用于根据点击通过率，下发推荐信息。

进一步的，上述点击预测模块510，可以具体用于：

获取推荐模型中去掉与特征向量的特征相同且频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数；

根据剩余模型参数以及特征向量中与剩余模型参数对应的特征，计算推荐信息的点击通过率。

进一步的，上述推荐模型可以通过模型训练***包括的模型参数更新模块和推荐模型生成模块执行下述操作生成：

模型参数更新模块，用于根据历史推荐信息的历史特征向量在预设的机器学习模型中的点击通过率，依次更新机器学习模型中频次大于第一阈值的特征对应的模型参数；

推荐模型生成模块，用于在机器学习模型完成训练后，去掉频次小于等于第一阈值的特征对应的模型参数，并利用最新的剩余模型参数生成推荐模型，该剩余模型参数为机器学习模型中频次大于第一阈值的特征对应的模型参数。

进一步的，上述模型参数更新模块，可以具体用于：

通过机器学习模型对当前历史推荐信息的历史特征向量进行预测，得到对应的当前点击通过率；

采用预设损失函数计算当前点击通过率在频次大于第一阈值的特征对应的模型参数下的损失系数，并根据该损失系数修正机器学习模型中对应的模型参数，继续通过机器学习模型对下一历史推荐信息的历史特征向量进行预测，并修正机器学习模型中频次大于第一阈值的特征对应的模型参数，直至机器学习模型完成训练。

进一步的，上述模型训练***，还可以包括：

稀疏参数设置模块，用于将机器学习模型中频次小于等于第一阈值的特征对应的模型参数设置为预设稀疏值，以便在机器学习模型完成训练后，去掉预设稀疏值下的模型参数。

进一步的，上述推荐模型生成模块，可以具体用于：

如果机器学习模型规模达到内存上限，则在剩余模型参数中过滤频次小于等于第二阈值的特征对应的模型参数，并利用过滤后的剩余模型参数生成推荐模型，该第二阈值大于第一阈值。

进一步的，上述推荐模型生成模块，还可以具体用于：

在机器学习模型完成当前时段下的训练后，根据预设的频次衰减系数更新机器学习模型中不同特征的频次，并在去掉频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数中过滤频次小于等于第二阈值的特征对应的模型参数，利用过滤后的剩余模型参数生成当前时段下的推荐模型。

进一步的，上述模型训练***，还可以包括：

模型发布模块，用于线上发布推荐模型。

进一步的，上述模型参数为推荐模型中不同特征的权重系数。

进一步的，上述信息推荐模块520，可以具体用于：

根据点击通过率对推荐信息排序，并构建对应的下发列表下发给用户。

本实施例提供的信息推荐的装置可适用于上述任意实施例提供的信息推荐的方法，具备相应的功能和有益效果。

实施例六

图6为本发明实施例六提供的一种模型训练***的原理架构图。本实施例是在上述实施例的基础上进行优化。参照图6，该模型训练***可以包括：训练服务器集群610和参数服务器集群620，参数服务器集群620中存储预设的机器学习模型中不同特征对应的模型参数。

具体的，训练服务器集群610依次从参数服务器集群620获取机器学习模型中不同特征对应的最新模型参数，根据该模型参数对历史推荐信息的历史特征向量进行处理，得到对应的点击通过率，并计算机器学习模型中频次大于第一阈值的特征对应的模型参数的损失系数，将该损失系数返回给参数服务器集群620；参数服务器集群620根据该损失系数更新对应的模型参数并反馈给训练服务器集群610，直至机器学习模型完成训练后，去掉频次小于等于第一阈值的特征对应的模型参数，并利用最新的剩余模型参数生成对应的推荐模型。

同时，训练服务器集群610将机器学习模型中频次小于等于第一阈值的特征对应的模型参数设置为预设稀疏值，并返回给参数服务器集群620；参数服务器集群620将频次小于等于第一阈值的特征对应的模型参数修正为预设稀疏值，并在机器学习模型完成训练后，去掉预设稀疏值下的模型参数。

可选的，为了保证模型的高效性，参数服务器集群620在机器学习模型完成训练后，在剩余模型参数中过滤频次小于第二阈值的特征对应的模型参数，并利用过滤后的剩余模型参数生成推荐模型。

进一步的，为了保证各个时段下的推荐模型的准确性，参数服务器集群620在机器学习模型完成当前时段下的训练后，根据预设的频次衰减系数更新机器学习模型中不同特征的频次，并在去掉频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数中过滤频次小于等于第二阈值的特征对应的模型参数，利用过滤后的剩余模型参数生成当前时段下的推荐模型。

此外，模型训练***中还可以包括推荐服务器630，参数服务器集群620将生成的推荐模型发布到推荐服务器630中，推荐服务器630用于执行本发明任意实施例提供的信息推荐的方法。

需要说明的是，训练服务器集群610中分布式部署多个训练服务器，该训练服务器可以并行执行机器学习模型的训练，提高模型的训练速率；同时，参数服务器集群620中分布式部署多个参数服务器，该参数服务器中分片存储机器学习模型中不同特征对应的模型参数，减少数据的存储压力；而且将模型训练过程中的训练步骤和参数修正步骤分离开来，降低了模型训练的计算压力。

本实施例提供的技术方案，通过训练服务器集群和参数服务器集群共同训练推荐模型，从而将具体的训练步骤和参数更新步骤分离开来，将训练和模型参数分散到不同的计算节点上，减小单台服务器的计算压力，提高了推荐模型的训练速率。

实施例七

图7为本发明实施例七提供的一种推荐服务器的结构示意图，如图7所示，该推荐服务器包括处理器70、存储装置71和通信装置72；推荐服务器中处理器70的数量可以是一个或多个，图7中以一个处理器70为例；推荐服务器中的处理器70、存储装置71和通信装置72可以通过总线或其他方式连接，图7中以通过总线连接为例。

存储装置71作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块，如本发明任意实施例所述的信息推荐的方法对应的程序指令/模块。处理器70通过运行存储在存储装置71中的软件程序、指令以及模块，从而执行推荐服务器的各种功能应用以及数据处理，即实现上述信息推荐的方法。

存储装置71可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储装置71可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储装置71可进一步包括相对于处理器70远程设置的存储器，这些远程存储器可以通过网络连接至推荐服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

通信装置72可用于实现推荐服务器与客户端之间的网络连接或者移动数据连接。

本实施例提供的一种推荐服务器可用于执行上述任意实施例提供的信息推荐的方法，具备相应的功能和有益效果。

实施例八

本发明实施例八还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时可实现上述任意实施例中的信息推荐的方法。该方法具体可以包括：

通过推荐模型对推荐信息的特征向量进行预测，得到推荐信息的点击通过率，该推荐模型中去掉与特征向量的特征相同且频次小于等于第一阈值的特征对应的模型参数；

根据点击通过率，下发推荐信息。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的信息推荐的方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

值得注意的是，上述信息推荐的装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

以上所述仅为本发明的优选实施例，并不用于限制本发明，对于本领域技术人员而言，本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种信息推荐的方法，其特征在于，包括：

根据所述点击通过率，下发所述推荐信息。

2.根据权利要求1所述的方法，其特征在于，通过推荐模型对推荐信息的特征向量进行预测，得到所述推荐信息的点击通过率，包括：

获取所述推荐模型中去掉与所述特征向量的特征相同且频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数；

根据所述剩余模型参数以及所述特征向量中与所述剩余模型参数对应的特征，计算所述推荐信息的点击通过率。

3.根据权利要求1所述的方法，其特征在于，所述推荐模型通过模型训练***执行下述操作生成：

根据历史推荐信息的历史特征向量在预设的机器学习模型中的点击通过率，依次更新所述机器学习模型中频次大于第一阈值的特征对应的模型参数；

在所述机器学习模型完成训练后，去掉频次小于等于第一阈值的特征对应的模型参数，并利用最新的剩余模型参数生成所述推荐模型，所述剩余模型参数为所述机器学习模型中频次大于第一阈值的特征对应的模型参数。

4.根据权利要求3所述的方法，其特征在于，根据历史推荐信息的历史特征向量在预设的机器学习模型中的点击通过率，依次更新所述机器学习模型中频次大于第一阈值的特征对应的模型参数，包括：

通过所述机器学习模型对当前历史推荐信息的历史特征向量进行预测，得到对应的当前点击通过率；

采用预设损失函数计算所述当前点击通过率在频次大于第一阈值的特征对应的模型参数下的损失系数，并根据该损失系数修正所述机器学习模型中对应的模型参数，继续通过所述机器学习模型对下一历史推荐信息的历史特征向量进行预测，并修正所述机器学习模型中频次大于第一阈值的特征对应的模型参数，直至所述机器学习模型完成训练。

5.根据权利要求3所述的方法，其特征在于，在依次更新所述机器学习模型中频次大于第一阈值的特征对应的模型参数之后，还包括：

将所述机器学习模型中频次小于等于所述第一阈值的特征对应的模型参数设置为预设稀疏值，以便在所述机器学习模型完成训练后，去掉预设稀疏值下的模型参数。

6.根据权利要求3所述的方法，其特征在于，利用最新的剩余模型参数生成所述推荐模型，包括：

如果所述机器学习模型规模达到内存上限，则在剩余模型参数中过滤频次小于等于第二阈值的特征对应的模型参数，并利用过滤后的剩余模型参数生成所述推荐模型，所述第二阈值大于所述第一阈值。

7.根据权利要求3所述的方法，其特征在于，在所述机器学习模型完成训练后，去掉频次小于等于第一阈值的特征对应的模型参数，并利用最新的剩余模型参数生成所述推荐模型，包括：

在所述机器学习模型完成当前时段下的训练后，根据预设的频次衰减系数更新所述机器学习模型中不同特征的频次，并在去掉频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数中过滤频次小于等于第二阈值的特征对应的模型参数，利用过滤后的剩余模型参数生成当前时段下的推荐模型。

8.根据权利要求3-7任一项所述的方法，其特征在于，在利用最新的剩余模型参数生成所述推荐模型之后，还包括：

线上发布所述推荐模型。

9.根据权利要求1-7任一项所述的方法，其特征在于，所述模型参数为所述推荐模型中不同特征的权重系数。

10.根据权利要求1所述的方法，其特征在于，根据所述点击通过率，下发所述推荐信息，包括：

根据所述点击通过率对所述推荐信息排序，并构建对应的下发列表下发给用户。

11.一种信息推荐的装置，其特征在于，包括：

12.一种推荐服务器，其特征在于，所述推荐服务器包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-10中任一所述的信息推荐的方法。

13.一种模型训练***，其特征在于，包括：训练服务器集群和参数服务器集群，所述参数服务器集群中存储预设的机器学习模型中不同特征对应的模型参数；

14.根据权利要求13所述的***，其特征在于，所述训练服务器集群将所述机器学习模型中频次小于等于所述第一阈值的特征对应的模型参数设置为预设稀疏值，并返回给所述参数服务器集群；

所述参数服务器集群将频次小于等于所述第一阈值的特征对应的模型参数修正为所述预设稀疏值，并在所述机器学习模型完成训练后，去掉预设稀疏值下的模型参数。

15.根据权利要求13所述的***，其特征在于，所述参数服务器集群在所述机器学习模型完成训练后，在剩余模型参数中过滤频次小于第二阈值的特征对应的模型参数，并利用过滤后的剩余模型参数生成所述推荐模型，所述第二阈值大于所述第一阈值。

16.根据权利要求13所述的***，其特征在于，所述参数服务器集群在所述机器学习模型完成当前时段下的训练后，根据预设的频次衰减系数更新所述机器学习模型中不同特征的频次，并在去掉频次小于等于第一阈值的特征对应的模型参数后的剩余模型参数中过滤频次小于等于第二阈值的特征对应的模型参数，利用过滤后的剩余模型参数生成当前时段下的推荐模型。

17.根据权利要求13-16任一项所述的***，其特征在于，还包括权利要求12所述的推荐服务器，所述参数服务器集群将生成的推荐模型发布到所述推荐服务器中。

18.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-10中任一所述的信息推荐的方法。