CN110119477B

CN110119477B - 一种信息推送方法、装置和存储介质

Info

Publication number: CN110119477B
Application number: CN201910398975.7A
Authority: CN
Inventors: 孙振龙; 胡澜涛; 陈磊; 张博; 刘祺; 梁铭霏; 丘志杰; 饶君; 刘毅; 王良栋; 刘书凯; 商甜甜; 苏舟
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-05-14
Filing date: 2019-05-14
Publication date: 2024-02-27
Anticipated expiration: 2039-05-14
Also published as: CN110119477A

Abstract

本发明实施例公开了一种信息推送方法、装置和存储介质；本发明实施例可以先获取目标用户的用户数据，接着，对所述用户数据进行特征抽取，得到用户特征，然后，将所述用户特征和待推送信息进行低维稠密向量化，得到用户向量和信息向量，再计算所述信息向量和所述用户向量的相似度，再然后，将相似度满足预设条件的待推送信息推送给目标用户。该方案可以提高信息推送的准确性。

Description

一种信息推送方法、装置和存储介质

技术领域

本发明涉及通信技术领域，具体涉及一种信息推送方法、装置和存储介质。

背景技术

随着信息的发展和普及，人们被包围在信息的汪洋大海之中。互联网上的信息资源呈指数膨胀，海量的信息资源具有异构的、多元的、分布的等多种特性。因而，能够根据用户的信息，有针对性地向用户推荐感兴趣的内容，为用户提供个性化的服务非常重要。

然而，现有的推荐方法中，主要通过定向推荐方式，将内容定向地推荐给目标人群，比如，根据定向条件(如用户的性别、年龄、地域、精英等级或兴趣类目等)向用户推荐感兴趣的内容。或者通过再营销方式，根据用户的历史浏览内容，继续给用户推荐此类内容。但是，定向推荐方式获取到的定向条件偏少，人为划定的目标人群不一定是喜欢推荐内容的真实人群。而再营销方式中将浏览过的用户作为目标用户，目标人群较为局限。

发明内容

本发明实施例提供一种信息推送方法、装置和存储介质，可以提高信息推送的准确性。

本发明实施例提供一种信息推送方法，包括：

获取目标用户的用户数据；

对所述用户数据进行特征抽取，得到用户特征；

将所述用户特征和待推送信息进行低维稠密向量化，得到用户向量和信息向量；

计算所述信息向量和所述用户向量的相似度；

将相似度满足预设条件的待推送信息推送给目标用户。

相应的，本发明实施例还提供一种信息推送装置，包括：

获取单元，用于获取目标用户的用户数据；

特征抽取单元，用于对所述用户数据进行特征抽取，得到用户特征；

向量化单元，用于将所述用户特征和待推送信息进行低维稠密向量化，分别得到用户向量和信息向量；

计算单元，用于计算所述信息向量和所述用户向量的相似度；

推送单元，用于将相似度满足预设条件的待推送信息推送给目标用户。

可选的，在一些实施例中，特征抽取单元，具体可以用于将所述用户数据的特征统一成预设格式，统计预设格式中各个特征参数的值，所述特征参数包括特征权重，然后，根据统计出的值将所述特征权重进行归一化，得到用户特征。

可选的，在一些实施例中，所述用户特征包括用户的多个特征，所述待推送信息包括信息标识，所述向量化单元可以包括用户向量化子单元和信息子向量化单元，如下：

所述用户向量化子单元，用于将用户特征中的每个特征根据向量化模型进行低维稠密向量化，得到多个特征向量，再根据用户每个特征的权重对所述特征向量进行加权求和，得到用户向量。

所述信息向量化子单元，用于在所述向量化模型中查找所述信息标识对应的低维稠密向量，得到信息向量。

可选的，在一些实施例中，所述信息推送装置还可以包括获取单元和训练单元，如下：

所述获取单元，用于获取用户数据样本和用户行为数据样本。

所述训练单元，用于利用所述用户数据样本和用户行为数据样本对预设模型进行训练，得到向量化模型。

可选的，在一些实施例中，训练单元可以包括特征抽取子单元、样本格式化子单元和训练子单元，如下：

所述特征抽取子单元，用于对所述用户数据样本进行特征抽取，得到用户特征样本。

所述样本格式化子单元，用于对所述用户行为数据样本进行格式化，得到格式化样本。

所述训练子单元，用于利用所述用户特征样本和所述格式化样本对预设模型进行训练，得到向量化模型。

可选的，在一些实施例中，训练子单元，具体可以用于采用预设模型对所述用户特征样本和所述格式化样本进行随机低维稠密向量化，分别得到用户向量样本和信息向量样本；利用所述用户向量样本和所述信息向量样本对用户行为进行预测，得到样本预测值；根据所述样本预测值和所述样本真实值对预设模型进行收敛，得到向量化模型。

可选的，在一些实施例中，训练子单元，具体可以利用嵌入层随机产生用户每个特征样本对应的低维稠密向量，得到特征向量样本，根据用户每个特征样本的权重对所述特征向量样本进行加权求和，得到用户向量样本，利用嵌入层随机产生所述信息样本标识对应的低维稠密向量，得到信息向量样本，然后，利用所述用户向量样本和所述信息向量样本进行向量点积，得到样本向量值，将所述样本向量值映射到预设的函数区间，得到样本预测值，根据所述样本预测值和所述样本真实值对预设模型进行收敛，得到向量化模型。

可选的，在一些实施例中，训练单元，具体可以用于将所述用户行为数据样本划分为正行为数据样本和负行为数据样本，得到用户行为数据样本集，所述正行为数据样本为执行用户行为数据样本中行为的样本，所述负行为数据样本为除执行所述用户行为数据样本中行为之外的样本；利用所述用户数据样本以及多个正行为数据样本对应同一个负行为数据样本对预设模型进行训练，得到向量化模型。

此外，本发明实施例还提供一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行本发明实施例提供的任一种信息推送方法中的步骤。

本发明实施例可以先获取目标用户的用户数据，接着，对所述用户数据进行特征抽取，得到用户特征，然后，将所述用户特征和待推送信息进行低维稠密向量化，得到用户向量和信息向量，再计算所述信息向量和所述用户向量的相似度，再然后，将相似度满足预设条件的待推送信息推送给目标用户；该方案可以提高信息推送的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1a是本发明实施例提供的信息推送方法的场景示意图；

图1b是本发明实施例提供的信息推送方法的流程图；

图1c是本发明实施例提供的向量化模型的结构图；

图1d是本发明实施例提供的预设模型的结构图；

图1e是本发明实施例提供的向量化模型的又一结构图；

图2a是本发明实施例提供的信息推送的框架图；

图2b是本发明实施例提供的预设模型的又一结构图；

图2c是本发明实施例提供的信息推送方法的另一流程图；

图3是本发明实施例提供的信息推送装置的结构示意图；

图4是本发明实施例提供的网络设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供一种信息推送方法、装置和存储介质。其中，该信息推送可以集成在网络设备中，该网络设备可以是服务器，也可以是终端等设备。

例如，参见图1a，首先，该集成了信息推送装置的网络设备可以先获取目标用户的用户数据，接着，对该用户数据进行特征抽取，得到用户特征，然后，将该用户特征和待推送信息(比如时下流行的内容产权，例如“甄X传”、“流浪X球”等等热点信息)进行低维稠密向量化(比如，利用向量化模型生成低维稠密向量)，得到用户向量和信息向量，再计算该信息向量和该用户向量的相似度，再然后将相似度满足预设条件的待推送信息推送给目标用户。

由于该方案是利用用户数据进行特征抽取，然后通过分析抽取后的用户特征与待推送信息的相似度，以得到用户对信息的感兴趣度，根据用户的感兴趣度对用户进行信息推送，有效地提高信息推送的准确性。

以下分别进行详细说明。需说明的是，以下实施例的描述顺序不作为对实施例优选顺序的限定。

本实施例将从信息推送装置的角度进行描述，该信息推送装置具体可以集成在网络设备中，该网络设备可以是服务器，也可以是终端等设备；其中，该终端可以包括手机、平板电脑、笔记本电脑、以及个人计算(Personal Computer，PC)等设备。

一种信息推送方法，包括：获取目标用户的用户数据，接着，对该用户数据进行特征抽取，得到用户特征，然后，将该用户特征和待推送信息进行低维稠密向量化，得到用户向量和信息向量，再计算该信息向量和该用户向量的相似度，再然后，将相似度满足预设条件的待推送信息推送给目标用户。

如图1b所示，该信息推送方法的具体流程可以如下：

101、获取目标用户的用户数据。

例如，具体可以由信息推送装置获取目标用户的用户数据，也可以由其他设备，比如终端，采集到目标用户的用户数据后，进而提供给信息推送装置，即，信息推送装置具体获取目标用户的用户数据，也可以接收其他设备发送的目标用户的用户数据。

其中，目标用户指的是需要进行信息推送的对象，比如，需要向张三推送张三感兴趣的信息，则目标用户为张三。用户数据指的是可以反映用户个人信息的数据，比如，用户的年龄、性别、兴趣、标签、以及地域等等。

102、对该用户数据进行特征抽取，得到用户特征。

例如，具体可以将该用户数据的特征统一成预设格式，统计预设格式中各个特征参数的值，该特征参数包括特征权重，然后，根据统计出的值将该特征权重进行归一化，得到用户特征。

其中，预设格式的设定方式可以有很多种，比如，可以根据实际应用的需求灵活设置，也可以预先设置好存储在网络设备中。此外，预设格式可以内置于网络设备中，或者，也可以保存在存储器中并发送给网络设备，等等。

比如，为了方便后续处理，可以从获取到的用户数据中将特征统一成“用户标识|特征组名称\t特征ID：权重空格特征ID：权重……|特征组名称\t特征ID：权重空格特征ID：权重……”的格式。再对统一后的特征进行全局统计，比如统计特征的出现次数、权重最大值、权重最小值、权重平均值、以及权重标准差等。再然后，根据统计出的值将特征权重进行归一化，得到用户特征。其中，特征归一化可以利用L1范数(L1 norm，即绝对值相加，又称曼哈顿距离)、L2范数(L2 norm，即欧几里德距离之和)、以及z分数(z-score)等方式。

103、将该用户特征和待推送信息进行低维稠密向量化，得到用户向量和信息向量。

例如，用户特征可以包括用户的多个特征，待推送信息可以包括信息标识，具体可以将用户特征中的每个特征根据向量化模型进行低维稠密向量化，得到多个特征向量，再根据用户每个特征的权重对该特征向量进行加权求和，得到用户向量，然后，在该向量化模型中查找该信息标识对应的低维稠密向量，得到信息向量。

为了加速模型训练与预测过程，以及降低内存消耗，把原始的高维特征向量压缩成较低维特征向量，且尽量不损失原始特征的表达能力，可以利用特征哈希法，将用户特征的高维特征向量压缩成低维的特征向量，即“将用户特征中的每个特征根据向量化模型进行低维稠密向量化，得到多个特征向量”可以包括：

利用向量化模型对该用户特征中每个特征进行哈希变换，得到多个哈希特征，在该向量化模型中查找该多个哈希特征对应的特征向量，得到多个特征向量。

可选的，该向量化模型可以由用户数据样本和用户行为数据样本训练而成。具体可以由其他设备进行训练后，提供给该信息推送装置，或者，也可以由该信息推送装置自行进行训练。即在步骤“将用户特征中的每个特征根据向量化模型进行低维稠密向量化”之前，该信息推送方法还可以包括：

获取用户数据样本和用户行为数据样本，利用该用户数据样本和用户行为数据样本对预设模型进行训练，得到向量化模型，该向量化模型框架可以如图1c所示。例如，具体可以如下：

A、获取用户数据样本和用户行为数据样本。

比如，具体可以采集多组用户数据样本和用户行为数据样本作为训练数据，比如可以从数据库或网络等获取训练数据，如可以从Hadoop分布式文件***(HadoopDistributed File System，HDFS)中获取训练数据，然后对该训练数据进行预处理，比如，可以对该用户数据样本进行特征抽取，对该用户行为数据样本进行格式化，等等，以得到满足预设模型的输入标准的数据。

其中，行为数据是关于机体的行为和行为发生时环境的观察报告，而用户行为数据主要指的是关于用户的行为和发生该行为时的各项数据。比如，用户在网站和移动手机软件(App)中的浏览、点击、发帖等行为。其中，行为数据通常有时间、频次、结果这3个数据维度。行为数据时间维度主要关注行为发生的时间段和持续时间。持续时间关注行为发生的过程，记录了行为起始和结束时间。行为数据的频次主要关注某些特定行为发生的次数和趋势，其中次数同用户的兴趣具有较大的正相关度。行为数据的结果主要关注是否完成交易、转发、点赞等等，用于判断用户点击浏览的结果。

B、对该用户数据样本进行特征抽取，得到用户特征样本。

例如，具体可以将该用户数据样本的特征统一成预设格式，统计预设格式中各个特征参数的值，该特征参数包括特征权重，然后，根据统计出的值将该特征权重进行归一化，得到用户特征样本。

比如，可以从获取到的用户数据样本中将特征统一成“用户标识|特征组名称\t特征ID：权重空格特征ID：权重……|特征组名称\t特征ID：权重空格特征ID：权重……”的格式。再对统一后的特征进行全局统计，比如统计特征的出现次数、权重最大值、权重最小值、权重平均值、以及权重标准差等。再然后，根据统计出的值将特征权重进行归一化，得到用户特征。其中，特征归一化可以利用L1范数、L2范数、以及z分数(z-score)等方式。

C、对该用户行为数据样本进行格式化，得到格式化样本。

例如，具体可以基于行为日志构建格式化样本，其中，格式化样本的格式可以为(用户标识，信息标识，标签)。其中，信息标识指的是用户执行行为的对象的标识。其中，可以将用户行为数据样本划分为正行为数据样本和负行为数据样本，则格式化样本中的标签可以用1或0表示，1表示正例样本，即正行为数据样本，0表示负例样本，即负行为数据样本。比如，可以选取对该信息进行操作的用户作为正行为数据样本，然后对正行为数据样本进行上采样，得到格式化样本，可以选取未对该信息进行操作的用户作为负行为数据样本，即选取除对该信息进行操作的用户之外的用户作为负行为数据样本。该负行为数据样本可以根据预设条件进行随机采样，比如，该预设条件可以是能获取到近期行为且用户数据的特征数大于预设阈值的用户，得到格式化样本。

D、利用该用户特征样本和该格式化样本对预设模型进行训练，得到向量化模型。

例如，具体可以采用预设模型对该用户特征样本和该格式化样本进行随机低维稠密向量化，分别得到用户向量样本和信息向量样本；利用该用户向量样本和该信息向量样本对用户行为进行预测，得到样本预测值；根据该样本预测值和该样本真实值对预设模型进行收敛，得到向量化模型。

例如，为了提高模型的训练效率，以及降低内存消耗，可以将用户特征样本和格式化样本的高维特征向量压缩成低维特征向量，比如，预设模型可以包括输入层、嵌入层、中间层和输出层，预设模型结构可以如图1d所示，可以采用预设模型的嵌入层随机产生预设维度的用户向量样本和信息向量样本，即“采用预设模型对该用户特征样本和该格式化样本进行随机低维稠密向量化，得到用户向量样本和信息向量样本”，可以包括：

利用嵌入层随机产生用户每个特征样本对应的低维稠密向量，得到特征向量样本；根据用户每个特征样本的权重对该特征向量样本进行加权求和，得到用户向量样本；利用嵌入层随机产生该信息样本标识对应的低维稠密向量，得到信息向量样本。

例如，为了得到准确的预测值，可以将用户向量样本和信息向量样本先做向量点积，再经过S型(Sigmoid)函数将点积得到的值映射到0，1之间，即“利用该用户向量样本和该信息向量样本对用户行为进行预测，得到样本预测值”，可以包括：

利用该用户向量样本和该信息向量样本进行向量点积，得到样本向量值；将该样本向量值映射到预设的函数区间，得到样本预测值。

将样本预测值和样本真实值计算交叉熵，比如，logistic loss，然后，反向传播梯度来调节嵌入(embedding)层，以达到收敛的目的，并将调整后的参数保存在嵌入层，最终得到向量化模型。

为了进一步地提高模型的训练效率和节省磁盘空间，可以采用共享负例的方式对模型进行训练，比如，多个正行为数据样本共享一份负行为数据样本，如图1e所示。因为负例是随机生成的，所以不必为每个属性单独生成负例，多模型共享一份负例即可，共享负例读取后***，***个数＝属性个数，***后的负例依次用于训练各个属性，以此来减少输入/输出(Input/Output，IO)操作和存储。即“利用该用户数据样本和用户行为数据样本对预设模型进行训练，得到向量化模型”，可以包括：

将所述用户行为数据样本划分为正行为数据样本和负行为数据样本，得到用户行为数据样本集，所述正行为数据样本为执行用户行为数据样本中行为的样本，所述负行为数据样本为除执行所述用户行为数据样本中行为之外的样本；利用所述用户数据样本以及多个正行为数据样本对应同一个负行为数据样本对预设模型进行训练，得到向量化模型。

为了验证模型的准确性，可以将用户数据样本划分为验证集和测试集，利用验证集和用户行为数据样本进行训练后，再利用测试集对训练后的模型进行分数预估，得到模型评估指标曲线下的面积(Area Under Curve，AUC)。

为了验证模型正确性，还需要进行信息热门特征(top feature)的计算。比如，利用向量化模型计算信息的热门特征，根据计算结果判断模型的正确性。

104、计算该信息向量和该用户向量的相似度。

其中，计算信息向量和用户向量之间的相似度的方式可以有多种，例如，可以通过计算信息向量和用户向量之间的余弦值，来得到信息向量和用户向量之间的相似度，等等。例如，具体可以计算该信息向量和该用户向量的余弦值，得到该信息向量和该用户向量的相似度。

105、将相似度满足预设条件的待推送信息推送给目标用户。

例如，具体可以将相似度满足预设条件的待推送信息存储到键值(key-value，KV)存储***中，等待用户进行刷新时，将该待推送信息推送给用户。

其中，预设条件的设定方式可以有很多种，比如，可以根据实际应用的需求灵活设置，也可以预先设置好存储在网络设备中。此外，预设条件可以内置于网络设备中，或者，也可以保存在存储器中并发送给网络设备，等等。其中，该预设条件可以是相似度大于预设阈值，比如，相似度大于80％，等等。该预设阈值也可以根据实际应用的需求灵活设置，还可以预先设置好存储在网络设备中。

由上可知，本实施例可以先获取目标用户的用户数据，接着，对该用户数据进行特征抽取，得到用户特征，然后，将该用户特征和待推送信息进行低维稠密向量化，得到用户向量和信息向量，再计算该信息向量和该用户向量的相似度，再然后，将相似度满足预设条件的待推送信息推送给目标用户；由于该方案是利用用户数据进行特征抽取，然后通过分析抽取后的用户特征与待推送信息的相似度，以得到用户对信息的感兴趣度，根据用户的感兴趣度对用户进行信息推送，所以，相对于仅仅依靠用户的点击行为对信息进行推送的方案而言，可以有效地提高信息推送的准确性。

根据上一个实施例所描述的方法，以下将举例作进一步详细说明。

在本实施例中，将以该信息推送装置具体集成在网络设备，其以待推送信息具体为时下流行的内容产权(intellectual property，IP)，向量化模型具体为内容产权向量化模型(Intellectual property to Vector，IP2Vec)模型为例进行说明，该信息推送的具体框架可以如图2a所示。

(一)首先，需要对IP2Vec模型进行训练，具体可以如下：

(1)网络设备获取用户数据样本和用户行为数据样本。

比如，具体可以采集多组用户数据样本和用户行为数据样本作为训练数据，比如可以从Hadoop分布式文件***中获取训练数据，然后对该训练数据进行特征抽取和样本构建，等等，以得到满足预设模型的输入标准的数据。

(2)网络设备利用该用户数据样本和用户行为数据样本对预设模型进行训练，得到IP2Vec模型；例如，具体可以如下：

A、对该用户数据样本进行特征抽取，得到用户特征样本。

比如，可以从获取到的用户数据样本中将特征统一成“用户标识|特征组名称\t特征ID：权重空格特征ID：权重……|特征组名称\t特征ID：权重空格特征ID：权重……”的格式，比如，用户特征可以为年龄(age)、性别(gender)、兴趣(interest)、及标签(tag)等等，例如，“uin\t sex_1age_2country_中国province_河南省city_郑州市bizcategory_1009:80bizcategory_2004:20usercategory_1009:90usercategory_2004:10fobbiz_11111111:100fobbiz_222222222:30”，再对统一后的特征进行全局统计，比如统计特征的出现次数、权重最大值、权重最小值、权重平均值、以及权重标准差等。再然后，将特征权重进行归一化，得到用户特征。其中，特征归一化可以利用L1范数、L2范数、以及z分数(z-score)等方式。比如，归一化后得到的用户特征为“uin\t sex_1age_2country_中国province_河南省city_郑州市bizcategory_1009:0.8bizcategory_2004:0.2usercategory_1009:0.9usercategory_2004:0.1fobbiz_11111111:1.0fobbiz_222222222:0.3”。

B、网络设备对该用户行为数据样本进行格式化，得到格式化样本。

例如，具体可以基于行为日志构建格式化样本，其中，格式化样本的格式可以为(uin,ip_id,label)，其中uin为用户标识，ip_id为IP标识，label为标签，1表示正例，0表示负例。比如，可以获取点击IP的用户作为正例，负例可以从未点击IP、活跃(最近两周有曝光)且特征数大于20的用户中随机采样。比如，格式化样本可以为“10001\t 1\t sex_1age_2country_中国province_河南省city_郑州市bizcategory_1009:1.0bizcategory_2004:0.17508813161usercategory_1009:1.0usercategory_2004:0.17508813161fobbiz_11111111:1.0fobbiz_222222222:0.586206896552”。

C、网络设备利用该用户特征样本和该格式化样本对预设模型进行训练，得到IP2Vec模型。

例如，具体可以采用预设模型对该用户特征样本和该格式化样本进行随机低维稠密向量化，得到用户向量样本和信息向量样本；利用该用户向量样本和该信息向量样本对用户行为进行预测，得到样本预测值；根据该样本预测值和该样本真实值对预设模型进行收敛，得到IP2Vec模型。

例如，为了提高模型的训练效率，以及降低内存消耗，可以将用户特征样本和格式化样本的高维特征向量压缩成低维特征向量，比如，预设模型可以包括输入层、嵌入层、中间层和输出层，预设模型结构可以如图2b所示，可以采用预设模型的嵌入层随机产生预设维度的用户向量样本和信息向量样本，比如，输入层：用户特征维数为1000万维，ip_id维数为1000维。嵌入层：向量(embedding)维数为32维浮整(float)类型。中间层：用户向量样本(user embedding)维数为32维float类型，信息向量样本(IP embedding)维数为32维float类型。输出层：样本预测值为1维float类型，可以利用嵌入层随机产生用户每个特征样本对应的低维稠密向量(比如32维float类型向量)，比如，对该用户特征样本中每个特征随机进行哈希变换，得到多个哈希特征(feature_hashid)，比如，feature_hashid:weight空格feature_hashid:weight空格feature_hashid:weight……，得到特征向量样本(feature_embedding)，比如，feature_embedding:weight空格feature_embedding:weight空格feature_embedding:weight……。根据用户每个特征样本的权重(weight)对该特征向量样本进行加权求和，得到用户向量样本(user embedding)；利用嵌入层随机产生该信息样本标识(ip_id)对应的低维稠密向量，得到信息向量样本(IP embedding)。将用户向量样本(user embedding)和信息向量样本(IP embedding)做向量点积，再经过S型(Sigmoid)函数将点积得到的值映射到0，1之间，得到输出(output)，即样本预测值。之后，将输出和Label(即样本真实值)计算交叉熵，比如，logistic loss，然后，反向传播梯度来调节嵌入(embedding)层，以达到收敛的目的，并将调整后的参数保存在嵌入层，最终得到IP2Vec模型。

为了进一步地提高模型的训练效率和节省磁盘空间，可以采用共享负例的方式对模型进行训练，比如，多个正行为数据样本共享一份负行为数据样本。因为负例是随机生成的，所以不必为每个属性单独生成负例，多模型共享一份负例即可，共享负例读取后***，***个数＝属性个数，***后的负例依次用于训练各个属性，以此来减少输入/输出(Input/Output，IO)操作和存储。即“利用该用户数据样本和用户行为数据样本对预设模型进行训练，得到向量化模型”，可以包括：

为了验证模型的准确性，可以将用户数据样本划分为验证集和测试集，利用验证集和用户行为数据样本进行训练后，再利用测试集对训练后的模型进行分数预估，得到模型评估指标曲线下的面积(Area Under Curve，AUC)。需要说明的是，训练算法的复杂度是属性个数*每个属性样本量*平均特征个数，即5000*41万*171，单台16核机器上，需要20小时训练时间。本方案采用共享负例的方式将训练时间提高4倍，存储减少为原来的1/count(属性)，AUC无明显变化。

为了验证模型正确性，还需要进行IP热门特征(IP top feature)的计算。比如，计算IP为航母的top feature，得到国产航母、歼-20、辽宁舰、电磁弹射、歼-11d、轰-6k、苏-30、核动力、洲际弹道导弹、飞行器等等，由此可以看到，训练后对于查找IP的top feature较准确，且内容较丰富。

(二)通过训练好的IP2Vec模型，便可以向目标用户推送感兴趣的IP，具体流程图可以参见图2c。

如图2c所示，一种信息推送方法，具体流程可以如下：

201、网络设备获取目标用户的用户数据。

例如，具体可以由网络设备获取目标用户的用户数据。比如，获取用户的年龄、性别、兴趣、标签、以及地域等等。

202、网络设备对该用户数据进行特征抽取，得到用户特征。

例如，网络设备具体可以将该用户数据的特征统一成预设格式，统计预设格式中各个特征参数的值，该特征参数包括特征权重，然后，根据统计出的值将该特征权重进行归一化，得到用户特征。

比如，为了方便后续处理，可以从获取到的用户数据中将特征统一成“用户标识|特征组名称\t特征ID：权重空格特征ID：权重……|特征组名称\t特征ID：权重空格特征ID：权重……”的格式，例如，“uin\t sex_1age_22country_中国province_广东省city_广州市bizcategory_1018:90bizcategory_2014:30usercategory_1018:80usercategory_2014:10fobbiz_11111111:100fobbiz_222222222:40”。再对统一后的特征进行全局统计，比如统计特征的出现次数、权重最大值、权重最小值、权重平均值、以及权重标准差等。再然后，将特征权重进行归一化，得到用户特征。其中，特征归一化可以利用L1范数(L1 norm，即绝对值相加，又称曼哈顿距离)、L2范数(L2 norm，即欧几里德距离之和)、以及z分数(z-score)等方式。比如，归一化后得到的用户特征为“uin\t sex_1age_22country_中国province_广东省city_广州市bizcategory_1018:0.9bizcategory_2014:0.3usercategory_1018:0.8usercategory_2004:0.1fobbiz_11111111:1.0fobbiz_222222222:0.4”。

203、网络设备将用户特征中的每个特征根据向量化模型进行低维稠密向量化，得到多个特征向量。

例如，用户特征包括用户的多个特征，网络设备具体可以利用向量化模型对该用户特征中每个特征进行哈希变换，得到多个哈希特征，比如，feature_hashid:weight空格feature_hashid:weight空格feature_hashid:weight……，在该向量化模型中查找该多个哈希特征(feature_hashid)对应的特征向量(embedding)，得到多个特征向量，比如，feature_embedding:weight空格feature_embedding:weight空格feature_embedding:weight……。

204、网络设备根据用户每个特征的权重对该特征向量进行加权求和，得到用户向量。

例如，网络设备具体可以获取用户每个特征的权重，根据每个特征的权重对该特征向量进行加权求和，得到用户向量(user embedding)。

205、网络设备在该IP2Vec模型中查找该IP标识对应的低维稠密向量，得到信息向量。

例如，该IP可以包括IP标识，网络设备可以从网络中获取IP的ID，即将ip_id输入到IP2Vec模型中，直接从IP2Vec模型的嵌入(embedding)层查找ip_id对应的信息向量(IPembedding)。

206、网络设备计算该信息向量和该用户向量的相似度。

例如，具体可以计算该信息向量(IP embedding)和该用户向量(user embedding)的余弦值，得到该信息向量和该用户向量的相似度。

207、网络设备将相似度满足预设条件的待推送信息推送给目标用户。

例如，具体可以将最热门的以及和目标用户相似度大于预设阈值，比如，相似度大于80％，的IP存储到键值(key-value，KV)存储***中，即截取最热门的和相似度最高的IP，比如，截取top前20个数据，等待用户进行刷新时，将该IP的内容推送给用户。

此外，需说明的是，利用该方案对用户进行感兴趣IP推荐，在XX应用中用户点击率均得到提高，如，在XX应用视频推荐业务上：主时间轴(timeline，TL)视频曝光点击率：+0.58％；XX应用top5点击率：+0.29％；视频兴趣试探主TL文章点击率：+0.44％；XX应用新用户top5点击率：+3.15％；XX应用新用户top15点击率：+1.79％。在XX应用图文推荐业务上：人均数字绘景(Matte Painting，mp)文章阅读时长(分钟)+0.54；mp有点用户人均有效阅读时长+0.53；mp文章人均主题(topic)数+0.37％；mp文章人均推荐标签(tag)数+0.48％；mp文章人均推荐类目数+0.15％，等等。

由上可知，本实施例可以先获取目标用户的用户数据，接着，对该用户数据进行特征抽取，得到用户特征，然后，将该用户特征和待推送信息进行低维稠密向量化，得到用户向量和信息向量，再计算该信息向量和该用户向量的相似度，再然后，将相似度满足预设条件的待推送信息推送给目标用户；由于该方案是利用用户数据进行特征抽取，然后通过分析抽取后的用户特征与待推送信息的相似度，以得到用户对信息的感兴趣度，根据用户的感兴趣度对用户进行信息推送，所以，相对于仅仅依靠用户的点击行为对信息进行推送的方案而言，可以有效地提高信息推送的准确性，同时，由于负例为随机采样，所以本方案采取多个正例共享一份负例的方式，可以节省磁盘空间和提升训练效率。

为了更好地实施以上方法，相应的，本发明实施例还提供一种信息推送装置，该信息推送装置具体可以集成在网络设备中，该网络设备可以是服务器，也可以是终端等设备。

例如，如图3所示，该信息推送装置可以包括获取单元301、特征抽取单元302、向量化单元303、计算单元304和推送单元305，如下：

(1)获取单元301；

获取单元301，用于获取目标用户的用户数据。

例如，具体可以由信息推送装置获取目标用户的用户数据，也可以由其他设备，比如终端，采集到目标用户的用户数据后，进而提供给获取单元301，即，获取单元301具体获取目标用户的用户数据，也可以接收其他设备发送的目标用户的用户数据。

(2)特征抽取单元302；

特征抽取单元302，用于对该用户数据进行特征抽取，得到用户特征。

例如，特征抽取单元302，具体可以用于将该用户数据的特征统一成预设格式，统计预设格式中各个特征参数的值，该特征参数包括特征权重，然后，根据统计出的值将该特征权重进行归一化，得到用户特征。该特征抽取过程具体可以参见前面实施例，在此不再赘述。

(3)向量化单元303；

向量化单元303，用于将该用户特征和待推送信息进行低维稠密向量化，分别得到用户向量和信息向量。

可选的，在一些实施例中，该用户特征可以包括用户的多个特征，该待推送信息可以包括信息标识，该向量化单元可以包括用户向量化子单元和信息子向量化单元，如下：

用户向量化子单元，用于将用户特征中的每个特征根据向量化模型进行低维稠密向量化，得到多个特征向量，再根据用户每个特征的权重对该特征向量进行加权求和，得到用户向量。

例如，为了加速模型训练与预测过程，以及降低内存消耗，把原始的高维特征向量压缩成较低维特征向量，且尽量不损失原始特征的表达能力，用户向量化单元具体可以用于利用向量化模型对该用户特征中每个特征进行哈希变换，得到多个哈希特征，在该向量化模型中查找该多个哈希特征对应的特征向量，得到多个特征向量。

信息向量化子单元，用于在该向量化模型中查找该信息标识对应的低维稠密向量，得到信息向量。

可选的，该向量化模型可以由多组用户数据样本和用户行为数据样本训练而成。具体可以由其他设备进行训练后，提供给该信息推送装置，或者，也可以由该信息推送装置自行进行训练；即该信息推送装置还可以包括获取单元和训练单元，如下：

获取单元306，用于获取用户数据样本和用户行为数据样本。

比如，获取单元306，具体可以采集多组用户数据样本和用户行为数据样本作为训练数据，比如可以从数据库或网络等获取训练数据，如可以从Hadoop分布式文件***(Hadoop Distributed File System，HDFS)中获取训练数据，然后对该训练数据进行预处理，比如，可以对该用户数据样本进行特征抽取，对该用户行为数据样本进行格式化，等等，以得到满足预设模型的输入标准的数据。

训练单元，用于利用该用户数据样本和用户行为数据样本对预设模型进行训练，得到向量化模型。

特征抽取子单元，用于对该用户数据样本进行特征抽取，得到用户特征样本。

例如，特征抽取子单元，具体可以用于将该用户数据样本的特征统一成预设格式，统计预设格式中各个特征参数的值，该特征参数包括特征权重，然后，根据统计出的值将该特征权重进行归一化，得到用户特征样本。

样本格式化子单元，用于对该用户行为数据样本进行格式化，得到格式化样本。

例如，样本格式化子单元，具体可以基于行为日志构建格式化样本，格式化样本的格式可以为(用户标识，信息标识，标签)。其中，可以将用户行为数据样本划分为正行为数据样本和负行为数据样本，则格式化样本中的标签可以用1或0表示，1表示正例，即正行为数据样本，0表示负例，即负行为数据样本。比如，可以选取对该信息进行操作的用户作为正行为数据样本，然后对正行为数据样本进行上采样，得到格式化样本，可以选取未对该信息进行操作的用户作为负行为数据样本，即选取除对该信息进行操作的用户之外的用户作为负行为数据样本。该负行为数据样本可以根据预设条件进行随机采样，比如，该预设条件可以是能获取到近期行为且用户数据的特征数大于预设阈值的用户，得到格式化样本。

训练子单元，用于利用该用户特征样本和该格式化样本对预设模型进行训练，得到向量化模型。

例如，训练子单元，具体可以用于采用预设模型对该用户特征样本和该格式化样本进行随机低维稠密向量化，得到用户向量样本和信息向量样本；利用该用户向量样本和该信息向量样本对用户行为进行预测，得到样本预测值；根据该样本预测值和该样本真实值对预设模型进行收敛，得到向量化模型。

可选的，为了提高模型的训练效率，以及降低内存消耗，可以将用户特征样本和格式化样本的高维特征向量压缩成低维特征向量，训练子单元具体可以利用嵌入层随机产生用户每个特征样本对应的低维稠密向量，得到特征向量样本，根据用户每个特征样本的权重对该特征向量样本进行加权求和，得到用户向量样本，利用嵌入层随机产生该信息样本标识对应的低维稠密向量，得到信息向量样本，然后，利用该用户向量样本和该信息向量样本进行向量点积，得到样本向量值，将该样本向量值映射到预设的函数区间，得到样本预测值，根据该样本预测值和该样本真实值对预设模型进行收敛，得到向量化模型。

为了进一步地提高模型的训练效率和节省磁盘空间，可以采用共享负例的方式对模型进行训练，比如，多个正行为数据样本共享一份负行为数据样本。因为负例是随机生成的，所以不必为每个属性单独生成负例，多模型共享一份负例即可，共享负例读取后***，***个数＝属性个数，***后的负例依次用于训练各个属性，以此来减少输入/输出(Input/Output，IO)操作和存储。即训练单元，具体可以用于将所述用户行为数据样本划分为正行为数据样本和负行为数据样本，得到用户行为数据样本集，所述正行为数据样本为执行用户行为数据样本中行为的样本，所述负行为数据样本为除执行所述用户行为数据样本中行为之外的样本；利用所述用户数据样本以及多个正行为数据样本对应同一个负行为数据样本对预设模型进行训练，得到向量化模型。

(4)计算单元304；

计算单元304，用于计算该信息向量和该用户向量的相似度。

例如，计算单元，具体可以用于计算该信息向量和该用户向量的余弦值，得到该信息向量和该用户向量的相似度。

(5)推送单元305；

例如，推送单元，具体可以用于将相似度满足预设条件的待推送信息存储到键值(key-value，KV)存储***中，等待用户进行刷新时，将该待推送信息推送给用户。

具体实施时，以上各个单元可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现，以上各个单元的具体实施可参见前面的方法实施例，在此不再赘述。

由上可知，本实施例可以由获取单元301先获取目标用户的用户数据，接着，由特征抽取单元302对该用户数据进行特征抽取，得到用户特征，然后，由向量化单元303将该用户特征和待推送信息进行低维稠密向量化，得到用户向量和信息向量，再由计算单元304计算该信息向量和该用户向量的相似度，再然后，由推送单元305将相似度满足预设条件的待推送信息推送给目标用户；由于该方案是利用用户数据进行特征抽取，然后通过分析抽取后的用户特征与待推送信息的相似度，以得到用户对信息的感兴趣度，根据用户的感兴趣度对用户进行信息推送，所以，相对于仅仅依靠用户的点击行为对信息进行推送的方案而言，可以有效地提高信息推送的准确性。

此外，本发明实施例还提供一种网络设备，如图4所示，其示出了本发明实施例所涉及的网络设备的结构示意图，具体来讲：

该网络设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解，图4中示出的网络设备结构并不构成对网络设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

处理器401是该网络设备的控制中心，利用各种接口和线路连接整个网络设备的各个部分，通过运行或执行存储在存储器402内的软件程序和/或模块，以及调用存储在存储器402内的数据，执行网络设备的各种功能和处理数据。可选的，处理器401可包括一个或多个处理核心；优选的，处理器401可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作***、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器401中。

存储器402可用于存储软件程序以及模块，处理器401通过运行存储在存储器402的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据网络设备的使用所创建的数据等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器402还可以包括存储器控制器，以提供处理器401对存储器402的访问。

网络设备还包括给各个部件供电的电源403，优选的，电源403可以通过电源管理***与处理器401逻辑相连，从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

该网络设备还可包括输入单元404，该输入单元404可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。

尽管未示出，网络设备还可以包括显示单元等，在此不再赘述。具体在本实施例中，网络设备中的处理器401会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中，并由处理器401来运行存储在存储器402中的应用程序，从而实现各种功能，如下：

获取目标用户的用户数据，接着，对该用户数据进行特征抽取，得到用户特征，然后，将该用户特征和待推送信息进行低维稠密向量化，得到用户向量和信息向量，再计算该信息向量和该用户向量的相似度，再然后，将相似度满足预设条件的待推送信息推送给目标用户。

以上各个操作的具体实施可参见前面的实施例，在此不再赘述。

本领域普通技术人员可以理解，上述实施例的各种方法中的全部或部分步骤可以通过指令来完成，或通过指令控制相关的硬件来完成，该指令可以存储于一计算机可读存储介质中，并由处理器进行加载和执行。

为此，本发明实施例还提供一种存储介质，其中存储有多条指令，该指令能够被处理器进行加载，以执行本发明实施例所提供的任一种信息推送方法中的步骤。例如，该指令可以执行如下步骤：

其中，该存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)、磁盘或光盘等。

由于该存储介质中所存储的指令，可以执行本发明实施例所提供的任一种信息推送方法中的步骤，因此，可以实现本发明实施例所提供的任一种信息推送方法所能实现的有益效果，详见前面的实施例，在此不再赘述。

以上对本发明实施例所提供的一种信息推送方法、装置和存储介质进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种信息推送方法，其特征在于，包括：

获取目标用户的用户数据；

对所述用户数据进行特征抽取，得到用户特征；

采用向量化模型将所述用户特征和待推送信息进行低维稠密向量化，得到用户向量和信息向量，所述向量化模型为采用正行为样本和负行为样本对预设模型进行训练所得到的模型，多个所述正行为样本共享同一负行为样本，所述负行为样本被***为至少一个，所述负行为样本的***个数和所述预设模型的属性个数相同，***后的负行为样本依次用于在各个属性上对预设模型进行训练；

计算所述信息向量和所述用户向量的相似度；

将相似度满足预设条件的待推送信息推送给目标用户。

2.根据权利要求1所述的方法，其特征在于，所述用户特征包括用户的多个特征，所述待推送信息包括信息标识，所述将所述用户特征和待推送信息进行低维稠密向量化，得到用户向量和信息向量，包括：

将用户特征中的每个特征根据向量化模型进行低维稠密向量化，得到多个特征向量；

根据用户每个特征的权重对所述特征向量进行加权求和，得到用户向量；

在所述向量化模型中查找所述信息标识对应的低维稠密向量，得到信息向量。

3.根据权利要求2所述的方法，其特征在于，所述将用户特征中的每个特征根据向量化模型进行低维稠密向量化，得到多个特征向量，包括：

利用向量化模型对所述用户特征中每个特征进行哈希变换，得到多个哈希特征；

在所述向量化模型中查找所述多个哈希特征对应的特征向量，得到多个特征向量。

4.根据权利要求2所述的方法，其特征在于，所述将用户特征中的每个特征根据向量化模型进行低维稠密向量化之前，还包括：

获取用户数据样本和用户行为数据样本；

利用所述用户数据样本和用户行为数据样本对预设模型进行训练，得到向量化模型。

5.根据权利要求4所述的方法，其特征在于，所述利用所述用户数据样本和用户行为数据样本对预设模型进行训练，得到向量化模型，包括：

对所述用户数据样本进行特征抽取，得到用户特征样本；

对所述用户行为数据样本进行格式化，得到格式化样本；

利用所述用户特征样本和所述格式化样本对预设模型进行训练，得到向量化模型。

6.根据权利要求5所述的方法，其特征在于，所述格式化样本包括样本真实值，所述利用所述用户特征样本和所述格式化样本对预设模型进行训练，得到向量化模型，包括：

采用预设模型对所述用户特征样本和所述格式化样本进行随机低维稠密向量化，分别得到用户向量样本和信息向量样本；

利用所述用户向量样本和所述信息向量样本对用户行为进行预测，得到样本预测值；

根据所述样本预测值和所述样本真实值对预设模型进行收敛，得到向量化模型。

7.根据权利要求6所述的方法，其特征在于，所述格式化样本包括信息样本标识，所述预设模型包括嵌入层，所述采用预设模型对所述用户特征样本和所述格式化样本进行随机低维稠密向量化，分别得到用户向量样本和信息向量样本，包括：

利用嵌入层随机产生用户每个特征样本对应的低维稠密向量，得到特征向量样本；

根据用户每个特征样本的权重对所述特征向量样本进行加权求和，得到用户向量样本；

利用嵌入层随机产生所述信息样本标识对应的低维稠密向量，得到信息向量样本。

8.根据权利要求6所述的方法，其特征在于，所述利用所述用户向量样本和所述信息向量样本对用户行为进行预测，得到样本预测值，包括：

利用所述用户向量样本和所述信息向量样本进行向量点积，得到样本向量值；

将所述样本向量值映射到预设的函数区间，得到样本预测值。

9.根据权利要求4所述的方法，其特征在于，所述利用所述用户数据样本和用户行为数据样本对预设模型进行训练，得到向量化模型，包括：

将所述用户行为数据样本划分为正行为数据样本和负行为数据样本，得到用户行为数据样本集，所述正行为数据样本为执行用户行为数据样本中行为的样本，所述负行为数据样本为除执行所述用户行为数据样本中行为之外的样本；

利用所述用户数据样本以及多个正行为数据样本对应同一个负行为数据样本对预设模型进行训练，得到向量化模型。

10.根据权利要求1至9任一项所述的方法，其特征在于，所述对所述用户数据进行特征抽取，得到用户特征，包括：

将所述用户数据的特征统一成预设格式；

统计预设格式中各个特征参数的值，所述特征参数包括特征权重；

根据统计出的值将所述特征权重进行归一化，得到用户特征。

11.根据权利要求1至9任一项所述的方法，其特征在于，所述计算所述信息向量和所述用户向量的相似度，包括：

计算所述信息向量和所述用户向量的余弦值，得到所述信息向量和所述用户向量的相似度。

12.一种信息推送装置，其特征在于，包括：

获取单元，用于获取目标用户的用户数据；

向量化单元，用于采用向量化模型将所述用户特征和待推送信息进行低维稠密向量化，分别得到用户向量和信息向量，所述向量化模型为采用正行为样本和负行为样本对预设模型进行训练所得到的模型，多个所述正行为样本共享同一负行为样本，所述负行为样本被***为至少一个，所述负行为样本的***个数和所述预设模型的属性个数相同，***后的负行为样本依次用于在各个属性上对预设模型进行训练；

13.一种存储介质，其特征在于，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至11任一项所述的信息推送方法中的步骤。

14.一种网络设备，其特征在于，包括处理器和存储器，所述存储器存储有应用程序，所述处理器用于运行所述存储器内的应用程序，以执行权利要求1至11任一项所述的信息推送方法中的步骤。