CN109871487B - 一种新闻召回方法和*** - Google Patents
一种新闻召回方法和*** Download PDFInfo
- Publication number
- CN109871487B CN109871487B CN201910132210.9A CN201910132210A CN109871487B CN 109871487 B CN109871487 B CN 109871487B CN 201910132210 A CN201910132210 A CN 201910132210A CN 109871487 B CN109871487 B CN 109871487B
- Authority
- CN
- China
- Prior art keywords
- news
- user
- multidimensional
- clicked
- cosine similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种新闻召回方法和***,通过获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,基于预先设置的预测模型对用户特征和标签进行训练,生成对应用户特征的多维向量,根据多维向量和下一时刻用户点击的新闻id、未点击的新闻id进行余弦相似度计算,得到对应多维向量的余弦相似度,基于多维向量对应的余弦相似度由大至小选取N个多维向量,确定N个多维向量对应的新闻id。通过上述方法,生成用户特征的多维向量,基于多维向量对应的余弦相似度的大小,确定多维向量对应的新闻id,得到用户感兴趣的新闻,通过召回用户感兴趣的新闻实现用户获取其兴趣度较高的新闻。
Description
技术领域
本发明涉及深度学习技术领域,更具体地说,涉及一种新闻召回方法和***。
背景技术
随着信息技术和互联网的飞速发展,网络新闻越来越受到人们的欢迎,成为人们日常生活中获取信息的一种主要途径。目前新闻召回是人们获取信息的方式之一。
新闻召回工作是新闻推荐领域中的一项重要工作,传统的新闻召回是利用用户过去点击过的标题和内容的关键词进行召回,并获取此关键词的相关新闻。
现有技术中,由于新闻篇数多,新闻的特征总量大,通过传统的新闻召回的新闻资讯,所得到的新闻资讯有些不符合用户兴趣。
发明内容
有鉴于此,本申请提供了一种新闻召回方法和***,实现召回的新闻符合用户兴趣的目的。
为了实现上述目的,现提出的方案如下:
本发明第一方面公开了一种新闻召回方法,包括:
获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,下一时刻为所述用户点击新闻id序列中对应点击新闻id的最新时刻确定;
基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量;
根据所述多维向量和所述下一时刻用户点击新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度;
基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数。
优选的,所述预先设置的预测模型的设置过程,包括:
构建原始神经网络模型;
获取预设数目的训练用户分别对应的用户点击的新闻id和未点击的新闻id;
将各个所述训练用户对应的用户点击的新闻id和未点击的新闻id依次输入至所述原始神经网络模型,得到各个所述训练用户对应的初始训练结果;
依据所述初始训练结果更新所述原始神经网络参数得到预测模型。
优选的,所述基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量,包括:
在预先设置的预测模型的嵌入层中,基于lstm长短期记忆模型将所述用户特征转换成多维向量;
在预先设置的预测模型的输出层中,基于mlp多层感知机将所述多维向量进行投影,生成所述用户特征对应的多维向量。
优选的,所述根据所述多维向量和所述下一时刻用户点击的新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度,包括:
所述多维向量与所述下一时刻用户点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第一余弦相似度;
所述多维向量与所述下一时刻未点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第二余弦相似度。
优选的,所述基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,包括:
基于所述多维向量的余弦相似度的大小进行排序,选取由大到小的N个多维向量,确定所述N个多维向量对应的新闻id;
或
对所述多维向量对应的余弦相似度的大小进行判断,当所述多维向量对应的余弦相似度值大于预设阈值时,确定大于预设阈值的N个多维向量,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id。
本发明第二方面公开了一种新闻召回***,包括:
获取单元,用于获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,下一时刻为所述用户点击新闻id序列中对应点击新闻id的最新时刻确定;
训练转换单元,用于基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量;
计算单元,用于根据所述多维向量和所述下一时刻用户点击的新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度;
确定单元,用于基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数。
优选的,所述基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量的训练转换单元,包括:
转换模块,用于在预先设置的预测模型的嵌入层中,基于lstm长短期记忆模型将所述用户特征转换成多维向量;
投影模块,用于在预先设置的预测模型的输出层中,基于mlp多层感知机将所述多维向量进行投影,生成所述用户特征对应的多维向量。
优选的,所述根据所述多维向量和所述下一时刻用户点击的新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度的计算单元,包括:
第一计算模块,用于所述多维向量与所述下一时刻用户点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第一余弦相似度;
第二计算模块,用于所述多维向量与所述下一时刻未点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第二余弦相似度。
优选的,所述基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id的确定单元,包括:排序模块或判断模块;
所述排序模块,用于基于所述多维向量的余弦相似度的大小进行排序,选取由大到小的N个多维向量,确定所述N个多维向量对应的新闻id;
所述判断模块,用于对所述多维向量对应的余弦相似度的大小进行判断,当所述多维向量对应的余弦相似度值大于预设阈值时,确定大于预设阈值的N个多维向量,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id。
经由上述技术方案可知,本发明公开了一种新闻召回方法和***,通过获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,基于预先设置的预测模型对用户特征和标签进行训练,并对用户特征进行转换,生成对应用户特征的多维向量,根据多维向量和下一时刻用户点击的新闻id、未点击的新闻id进行余弦相似度计算,得到对应多维向量的余弦相似度,基于多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定N个多维向量对应的新闻id。通过上述方法,生成用户特征的多维向量,基于多维向量对应的余弦相似度的大小,确定多维向量对应的新闻id,得到用户感兴趣的新闻,通过召回用户感兴趣的新闻以实现用户获取其兴趣度较高的新闻。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种新闻召回方法的流程示意图;
图2为本发明实施例公开的预测模型设置过程的流程示意图;
图3为本发明实施例公开的更新原始神经网络参数的流程示意图;
图4为本发明实施例公开的另一种新闻召回方法的流程示意图;
图5为本发明实施例公开的另一种新闻召回方法的流程示意图;
图6为本发明实施例公开的另一种新闻召回方法的流程示意图;
图7为本发明实施例公开的一种新闻召回***的结构示意图;
图8为本发明实施例公开的新闻召回***的训练转换单元的结构示意图;
图9为本发明实施例公开的新闻召回***的计算单元的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,现有技术中,新闻召回是利用用户过去点击过的标题和内容的关键词进行召回,并获取此关键词的相关新闻,通过新闻召回方法召回新闻资讯,所得到的新闻资讯有些不符合用户兴趣。因此,本发明公开了一种新闻召回方法,通过生成用户特征的多维向量,基于多维向量对应的余弦相似度的大小,确定多维向量对应的新闻id,得到用户感兴趣的新闻,通过召回用户感兴趣的新闻以实现用户获取其兴趣度较高的新闻。
如图1所示,为本发明实施例公开的一种新闻召回方法的流程示意图,具体包括如下步骤:
步骤S101:获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签。
在执行步骤S101的过程中,由于用户行为受时效性影响较大,从而选取的用户点击序列是用户最近点击过的新闻id作为用户特征,以及点击序列下一时刻用户点击的新闻id和未点击的新闻id作为标签。
需要说明的是,所述用户点击新闻id序列是用户点击的新闻内容标题后确定的,所述用户点击新闻id数量可以为多个,具体由技术人员根据实际情况进行设置。
需要说明的是,所述用户点击的新闻id在用户点击的新闻id集合中,所述用户点击的新闻id数量可以为多个,具体由技术人员根据实际情况进行选取。
需要说明的是,下一时刻为所述用户点击新闻id序列中对应点击新闻id的最新时刻确定。
基于上述获取下一时刻用户点击的新闻id和未点击的新闻id的实现过程,这里举例进行说明:
例如,在15时02分时,用户点击的新闻id15作为用户特征,15时03分时,将用户点击的新闻id16和未点击的新闻id17作为标签。
需要说明的是,所述用户未点击的新闻id在用户未点击的新闻id集合中,所述用户未点击的新闻的id为用户未点击的新闻id集合中的任意一个,具体由技术人员根据实际情况进行选取。
步骤S102:基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量。
在执行步骤S102的过程中,将所述用户特征和所述标签通过预先设置的预测模型进行训练,并将所述用户特征转换成对应所述用户特征的多维向量。所述预测模型是基于样本数据训练原始神经网络模型得到的。
上述图1公开的步骤S102中涉及到的预先设置的预测模型的设置过程,如图2,示出了预测模型设置过程的流程示意图,具体包括如下步骤:
步骤S201:构建原始神经网络模型。
步骤S202:获取预设数目的训练用户分别对应的用户点击的新闻id和未点击的新闻id。
需要说明的是,所述训练用户可以是不同年龄段的用户,可以是不同性别的用户,也可以是不同兴趣爱好的用户等,具体训练用户的确定由技术人员根据实际情况进行选择。
步骤S203:将各个所述训练用户对应的用户点击的新闻id和用户未点击的新闻id依次输入至所述原始神经网络模型,得到各个所述训练用户对应的初始训练结果。
在具体实现步骤S203的过程中,将各个所述训练用户对应的用户点击的新闻id和未点击的新闻id依次输入至原始神经网络模型,选择长短期记忆模型lstm作为训练使用的原始神经网络模型。
需要说明的是,长短期记忆模型(long short-trem memory,lstm)是一种基于时间序列的深度神经网络,用于处理和预测时间序列中间隔和延迟相对较长的重要时间。
步骤S204:依据所述初始训练结果更新所述原始神经网络参数得到预测模型。
通过执行上述步骤S201-步骤S204依据所述初始训练结果通过反向传播算法更新所述原始神经网络参数得到预测模型。
需要说明的是,反向传播算法(back propagation algorithm,bpa)常被用来训练多层感知机,所述反向传播算法bpa主要由激励传播和权重更新反复循环迭代,直至输入的数据响应达到预定的目标范围为止。
在具体实现中,构建的预测模型中包括多个处理层,至少包括:embedding层、双向lstm层和predict层。
需要说明的是,所述embedding层根据矩阵分解的方法,通过lstm长短期记忆模型将所述用户特征转换成具有表征意义的多维向量。所述双向lstm层采用lstm长短期记忆模型连接mlp多层感知机的方式训练模型,并将mlp多层感知机的输出结果与用户点击的新闻id和未点击的新闻id进行余弦相似度计算。所述predict层中输入用户特征及用户点击新闻id、未点击新闻id,根据预测模型计算用户点击的新闻id和未点击的新闻id的余弦相似度。
需要说明的是,embedding层和双向lstm层为本预测模型的训练阶段,predict层为本预测模型的预测阶段。
进一步需要说明的是,后续采用该预测模型得到的结果,也可以作为调整该预测模型预测精度的参数进行使用。
上述图2公开的步骤S204中涉及到的依据初始训练结果更新所述原始神经网络参数得到预测模型的过程,如图3,示出了更新原始神经网络参数的流程示意图,具体包括如下步骤:
步骤S301:获取训练用户点击新闻id序列。
需要说明的是,所述训练用户点击新闻id序列中包含多个用户点击新闻id,具体训练用户点击新闻id序列的确定由技术人员根据实际情况进行设置。
步骤S302:将所述训练用户点击新闻id序列经过embedding层进行向量化。
步骤S303:将向量化后的所述训练用户点击新闻id序列通过lstm长短期记忆模型转换成多维向量。
步骤S304:将所述多维向量通过mlp多层感知机进行投影,得到用户特征对应的多维向量。
步骤S305:根据所述用户特征对应的多维向量分别与用户点击的新闻id和未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度,并通过反向传播算法更新预测模型参数。
通过执行上述步骤S301-步骤S305获取训练用户点击新闻id序列,将所述用户点击新闻id序列进行投影得到用户特征对应的多维向量,根据所述用户特征对应的多维向量分别与用户点击的新闻id和未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度,并通过反向传播算法更新预测模型参数。
基于上述更新预测模型参数的过程,这里举例进行说明:
当前用户点击新闻id序列是id0-id19,下一时刻用户点击的新闻id20和未点击的新闻id21作为标签,将所述当前用户点击新闻id序列id0-id19经过embedding层向量化后,通过lstm长短期记忆模型转换成300维向量,将所述300维向量通过mlp多层感知机进行投影,得到用户特征对应的300维向量,将所述300维向量分别与id20、id21进行余弦相似度计算,得到用户点击的第一余弦相似度值和未点击的第二余弦相似度值,通过反向传播算法更新预测模型参数。
步骤S103:根据所述多维向量和所述下一时刻用户点击新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度。
在执行步骤S103的过程中,根据所述多维向量分别和所述下一时刻用户点击新闻id、未点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第一余弦相似度和第二余弦相似度。
需要说明的是,根据所述多维向量对应的第一余弦相似度和第二余弦相似度的大小,确定多维向量对应的新闻id,从而得到用户感兴趣的新闻,通过召回用户感兴趣的新闻使得用户获取其兴趣度较高的新闻。
步骤S104:基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数。
在执行步骤S104的过程中,基于所述多维向量对应的余弦相似度的大小,由大至小进行排序后选取N个多维向量,确定所述N个多维向量对应的新闻id。
需要说明的是,多维向量可以是300维向量,也可以是600维向量等,具体由技术人员根据实际情况进行设置。
需要说明的是,多维向量的余弦相似度越大,说明用户越对当前的新闻感兴趣。
需要说明的是,具体N的取值由技术人员根据实际情况进行选取。
本发明实施例通过上述公开的新闻召回方法,通过获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,基于预先设置的预测模型对用户特征和标签进行训练,并对用户特征进行转换,生成对应用户特征的多维向量,根据多维向量和下一时刻用户点击新闻id、未点击的新闻id进行余弦相似度计算,得到对应多维向量的余弦相似度,基于多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定N个多维向量对应的新闻id。通过上述方法,生成用户特征的多维向量,基于多维向量对应的余弦相似度的大小,确定多维向量对应的新闻id,得到用户感兴趣的新闻,通过召回用户感兴趣的新闻以实现用户获取其兴趣度较高的新闻。
可选的,通过线上真实的用户点击数据进行评测,采用lstm长短期记忆模型召回的新闻的点击通过率(click through rate,ctr)高于传统的新闻召回的点击通过率。
需要说明的是,ctr点击通过率为点击数/曝光数。
本发明实施例通过线上真实的用户点击数据,采用lstm长短期记忆模型召回的新闻的点击通过率高于传统的新闻召回的点击通过率,使得通过lstm长短期记忆模型召回的新闻的留存率和人均阅读时长得到提高。
基于图1所述的方法,本发明实施例公开的另一种新闻召回方法,如图4所示,具体包括如下步骤:
步骤S401:获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签。
上述步骤S401的执行过程与图1示出的步骤S101的执行过程相同,且执行原理也相同,可参见,这里不再进行赘述。
步骤S402:在预先设置的预测模型的嵌入层中,基于lstm长短期记忆模型将所述用户特征转换成多维向量。
在执行步骤S402的过程中,在预先设置的预测模型的嵌入层中,根据矩阵分解的方法,通过lstm长短期记忆模型将所述用户特征转换成多维向量。
需要说明的是,将lstm长短期记忆模型应用在用户点击新闻id序列上,过滤与用户兴趣不相关的新闻id,在算法上优胜劣汰,择优选择用户感兴趣的新闻id。
步骤S403:在预先设置的预测模型的输出层中,基于mlp多层感知机将所述多维向量进行投影,生成所述用户特征对应的多维向量。
需要说明的是,多层感知机(multi layer perception,mlp)中包括:嵌入层,隐藏层和输出层。mlp多层感知机中层与层之间连接是,上一层的任何一个神经元与下一层的所有神经元都有连接。
需要说明的是,将用户特征输入至预测模型的嵌入层后转换成多维向量,通过隐藏层将所述多维向量从输入层传递至输出层中,在输出层中,将所述多维向量进行投影后,生成用户特征对应的多维向量。
需要说明的是,基于预先设置的预测模型对所述用户特征和所述标签进行训练,采用lstm长短期记忆模型连接mlp多层感知机的方式进行训练。
步骤S404:根据所述多维向量和所述下一时刻用户点击新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度。
步骤S405:基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数。
上述步骤S404-步骤S405的执行过程与图1示出的步骤S103-步骤S104的执行过程相同,且执行原理也相同,可参见,这里不再进行赘述。
本发明实施例通过上述公开的新闻召回方法,通过获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,在预先设置的预测模型的嵌入层中,基于lstm长短期记忆模型将所述用户特征转换成多维向量,在预先设置的预测模型的输出层中,基于mlp多层感知机将所述多维向量进行投影,生成所述用户特征对应的多维向量,根据所述多维向量和所述下一时刻用户点击新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度,基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id。通过上述方法,生成用户特征的多维向量,基于多维向量对应的余弦相似度的大小,确定多维向量对应的新闻id,得到用户感兴趣的新闻,通过召回用户感兴趣的新闻以实现用户获取其兴趣度较高的新闻。
本发明实施例公开的另一种新闻召回方法的流程示意图,如图5所示,具体包括如下步骤:
步骤S501:获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签。
步骤S502:基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量。
上述步骤S501-步骤S502的执行过程与图1示出的步骤S101-步骤S102的执行过程相同,且执行原理也相同,可参见,这里不再进行赘述。
可选的,步骤S502中具体生成对应所述用户特征的多维向量的方式,也可以采用图4中公开的步骤S402-步骤S403的执行方式实现。
步骤S503:所述多维向量与所述下一时刻用户点击新闻id进行余弦相似度计算,得到所述多维向量各自对应的第一余弦相似度。
需要说明的是,所述第一余弦相似度为用户点击新闻id的余弦相似度。根据得到所述多维向量对应的第一余弦相似度通过反向传播算法进行更新模型的参数。
步骤S504:所述多维向量与所述下一时刻未点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第二余弦相似度。
需要说明的是,所述第二余弦相似度为用户未点击新闻id的余弦相似度。根据得到所述多维向量对应的第二余弦相似度通过反向传播算法进行更新模型的参数。
步骤S505:基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数。
上述步骤S505的执行过程与图1示出的步骤S104的执行过程相同,且执行原理也相同,可参见,这里不再进行赘述。
本发明实施例通过上述公开的新闻召回方法,通过获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,所述多维向量与所述下一时刻用户点击新闻id进行余弦相似度计算,得到所述多维向量各自对应的第一余弦相似度,所述多维向量与所述下一时刻未点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第二余弦相似度,基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量。通过上述方法,生成用户特征的多维向量,基于多维向量对应的余弦相似度的大小,确定多维向量对应的新闻id,得到用户感兴趣的新闻,通过召回用户感兴趣的新闻以实现用户获取其兴趣度较高的新闻。
本发明实施例公开的另一种新闻召回方法的流程示意图,如图6所示,具体包括如下步骤:
步骤S601:获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签。
上述步骤S601的执行过程与图1示出的步骤S101的执行过程相同,且执行原理也相同,可参见,这里不再进行赘述。
步骤S602:基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量。
上述步骤S602的执行过程与图1示出的步骤S102的执行过程相同,且执行原理也相同,可参见,这里不再进行赘述。
可选的,步骤S602中具体生成对应所述用户特征的多维向量的方式,也可以采用图4中公开的步骤S402-步骤S403的执行方式实现。
步骤S603:根据所述多维向量和所述下一时刻用户点击新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度。
可选的,步骤S603中具体得到对应所述多维向量的余弦相似度的方式,也可以采用图5中公开的步骤S503-步骤S504的执行方式实现。
步骤S604:多所述多维向量对应的余弦相似度的大小进行判断,当所述多维向量对应的余弦相似度的大小进行判断,当所述多维向量对应的余弦相似度值大于预设阈值时,确定大于预设阈值的N个多维向量,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数。
需要说明的是,在对所述多维向量对应的余弦相似度的大小进行判断,可能会出现的余弦相似度值相等且最大的或者余弦相似度值大于预设阈值的多个多维向量,所述预设阈值由技术人员根据实际情况,确定最优的多维向量的选取数值。
需要说明的是,N的取值可以为多个,具体可以根据实际情况进行选取。
本发明实施例公开的一种新闻召回方法,通过获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量,根据所述多维向量和所述下一时刻用户点击新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度,多所述多维向量对应的余弦相似度的大小进行判断,当所述多维向量对应的余弦相似度的大小进行判断,当所述多维向量对应的余弦相似度值大于预设阈值时,确定大于预设阈值的N个多维向量,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id。通过上述方法,生成用户特征的多维向量,基于多维向量对应的余弦相似度的大小,确定多维向量对应的新闻id,得到用户感兴趣的新闻,通过召回用户感兴趣的新闻以实现用户获取其兴趣度较高的新闻。
基于上述新闻召回方法具体实现过程,这里举例进行说明:
例如,当前用户点击新闻序列是id0-id30,后续用户点击的新闻id与未点击的新闻id的标签分别是id31和id32,在预先设置的预测模型的嵌入层中,基于lstm长短期记忆模型将用户点击新闻序列id0-id30与标签id31和标签id31进行训练,并对用户点击新闻序列id0-id19进行转换,生成500维向量,在预先设置的预测模型的输出层中,基于mlp多层感知机将所述多维向量进行投影,生成所述用户特征对应的多维向量,将所述500维向量和所述id31、id31进行余弦相似度计算,得到所述500维向量的余弦相似度,根据所述500维向量的余弦相似度由大到小依次进行选取,确定选取后的500维向量对应的新闻id,得到用户感兴趣的新闻。通过本发明实施例提供的新闻召回方法召回的新闻的ctr(点击数/曝光数)值高于传统传统内容画像召回新闻的ctr值,使得留存率和人均阅读时长均有明显提升。
基于上述本发明实施例公开的一种新闻召回方法,本发明实施例还对应公开了一种新闻召回***,如图7所示,该新闻召回***700主要包括:
获取单元701,用于获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,下一时刻为所述用户点击新闻id序列中对应点击新闻id的最新时刻确定。
训练转换单元702,用于基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量。
计算单元703,用于根据所述多维向量和所述下一时刻用户点击的新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度。
确定单元704,用于基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数。
进一步的,所述训练转换单元702,如图8所示,包括:
构建模块801,用于构建原始神经网络模型。
获取模块802,用于获取预设数目的训练用户分别对应的用户点击的新闻序列id和未点击的新闻序列id。
输入模块803,用于将各个所述训练用户对应的用户点击的新闻序列id和未点击的新闻序列id依次输入至所述原始神经网络模型,得到各个所述训练用户对应的初始训练结果。
更新模块804,用于依据所述初始训练结果更新所述原始神经网络参数得到预测模型。
转换模块805,用于在预先设置的预测模型的嵌入层中,基于lstm长短期记忆模型将所述用户特征转换成多维向量。
投影模块806,用于在预先设置的预测模型的输出层中,基于mlp多层感知机将所述多维向量进行投影,生成所述用户特征对应的多维向量。
进一步的,所述计算单元703,如图9所示,包括:
第一计算模块901,用于所述多维向量与所述下一时刻用户点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第一余弦相似度。
第二计算模块902,用于所述多维向量与所述下一时刻未点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第二余弦相似度。
进一步的,所述确定单元704,包括:排序模块1001或判断模块1002;
所述排序模块1001,用于基于所述多维向量的余弦相似度的大小进行排序,选取由大到小的N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数。
所述判断模块1002,用于对所述多维向量对应的余弦相似度的大小进行判断,当所述多维向量对应的余弦相似度值大于预设阈值时,确定大于预设阈值的N个多维向量,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数。
上述本发明实施例公开的新闻召回***中的各个单元和模块具体的原理和执行过程,与上述本发明实施例公开的新闻召回方法相同,可参见上述本发明实施例公开的新闻召回方法中相应的部分,这里不再进行赘述。
基于上述本发明实施例公开的新闻召回***,上述各个单元和模块可以通过一种由处理器和存储器构成的硬件设备实现。具体为:上述各个单元和模块作为程序单元存储于存储器中,由处理器执行存储在存储器中的上述程序单元来实现新闻召回。
其中,处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现新闻召回。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
进一步的,本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述新闻召回。
本发明实施例中公开的设备可以是服务器、PC、PAD、手机等。
进一步的,本发明实施例还提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现新闻召回方法。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、装置或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (8)
1.一种新闻召回方法,其特征在于,包括:
获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,下一时刻为所述用户点击新闻id序列中对应点击新闻id的最新时刻确定;
基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量;
根据所述多维向量和所述下一时刻用户点击新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度;
基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数;
其中,所述预先设置的预测模型的设置过程,包括:
构建原始神经网络模型;
获取预设数目的训练用户分别对应的用户点击的新闻id和未点击的新闻id;
将各个所述训练用户对应的用户点击的新闻id和未点击的新闻id依次输入至所述原始神经网络模型,得到各个所述训练用户对应的初始训练结果;
依据所述初始训练结果更新所述原始神经网络模型的参数得到预测模型。
2.根据权利要求1所述的方法,其特征在于,所述基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量,包括:
在预先设置的预测模型的嵌入层中,基于lstm长短期记忆模型将所述用户特征转换成多维向量;
在预先设置的预测模型的输出层中,基于mlp多层感知机将所述多维向量进行投影,生成所述用户特征对应的多维向量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述多维向量和所述下一时刻用户点击的新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度,包括:
所述多维向量与所述下一时刻用户点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第一余弦相似度;
所述多维向量与所述下一时刻未点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第二余弦相似度。
4.根据权利要求1所述的方法,其特征在于,所述基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,包括:
基于所述多维向量的余弦相似度的大小进行排序,选取由大到小的N个多维向量,确定所述N个多维向量对应的新闻id;
或
对所述多维向量对应的余弦相似度的大小进行判断,当所述多维向量对应的余弦相似度值大于预设阈值时,确定大于预设阈值的N个多维向量,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id。
5.一种新闻召回***,其特征在于,包括:
获取单元,用于获取用户点击新闻id序列作为用户特征,以及获取下一时刻用户点击的新闻id和未点击的新闻id作为标签,下一时刻为所述用户点击新闻id序列中对应点击新闻id的最新时刻确定;
训练转换单元,用于基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量;
计算单元,用于根据所述多维向量和所述下一时刻用户点击的新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度;
确定单元,用于基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id,其中,N的取值为大于等于2的正整数;
其中,所述训练转换单元包括:
构建模块,用于构建原始神经网络模型;
获取模块,用于获取预设数目的训练用户分别对应的用户点击的新闻序列id和未点击的新闻序列id;
输入模块,用于将各个所述训练用户对应的用户点击的新闻序列id和未点击的新闻序列id依次输入至所述原始神经网络模型,得到各个所述训练用户对应的初始训练结果;
更新模块,用于依据所述初始训练结果更新所述原始神经网络模型的参数得到预测模型。
6.根据权利要求5所述的***,其特征在于,所述基于预先设置的预测模型对所述用户特征和所述标签进行训练,并对所述用户特征进行转换,生成对应所述用户特征的多维向量的训练转换单元,包括:
转换模块,用于在预先设置的预测模型的嵌入层中,基于lstm长短期记忆模型将所述用户特征转换成多维向量;
投影模块,用于在预先设置的预测模型的输出层中,基于mlp多层感知机将所述多维向量进行投影,生成所述用户特征对应的多维向量。
7.根据权利要求5所述的***,其特征在于,所述根据所述多维向量和所述下一时刻用户点击的新闻id、未点击的新闻id进行余弦相似度计算,得到对应所述多维向量的余弦相似度的计算单元,包括:
第一计算模块,用于所述多维向量与所述下一时刻用户点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第一余弦相似度;
第二计算模块,用于所述多维向量与所述下一时刻未点击的新闻id进行余弦相似度计算,得到所述多维向量各自对应的第二余弦相似度。
8.根据权利要求5所述的***,其特征在于,所述基于所述多维向量对应的余弦相似度的大小,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id的确定单元,包括:排序模块或判断模块;
所述排序模块,用于基于所述多维向量的余弦相似度的大小进行排序,选取由大到小的N个多维向量,确定所述N个多维向量对应的新闻id;
所述判断模块,用于对所述多维向量对应的余弦相似度的大小进行判断,当所述多维向量对应的余弦相似度值大于预设阈值时,确定大于预设阈值的N个多维向量,由大至小选取N个多维向量,确定所述N个多维向量对应的新闻id。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910132210.9A CN109871487B (zh) | 2019-02-22 | 2019-02-22 | 一种新闻召回方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910132210.9A CN109871487B (zh) | 2019-02-22 | 2019-02-22 | 一种新闻召回方法和*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109871487A CN109871487A (zh) | 2019-06-11 |
CN109871487B true CN109871487B (zh) | 2021-03-23 |
Family
ID=66919134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910132210.9A Active CN109871487B (zh) | 2019-02-22 | 2019-02-22 | 一种新闻召回方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109871487B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102346899A (zh) * | 2011-10-08 | 2012-02-08 | 亿赞普(北京)科技有限公司 | 一种基于用户行为的广告点击率预测方法和装置 |
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
WO2014143024A1 (en) * | 2013-03-15 | 2014-09-18 | Yahoo! Inc. | Almost online large scale collaborative filtering based recommendation system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599226B (zh) * | 2016-12-19 | 2020-08-28 | 深圳大学 | 一种内容推荐方法及内容推荐*** |
US20180357321A1 (en) * | 2017-06-08 | 2018-12-13 | Ebay Inc. | Sequentialized behavior based user guidance |
CN109104620B (zh) * | 2018-07-26 | 2020-05-19 | 腾讯科技(深圳)有限公司 | 一种短视频推荐方法、装置和可读介质 |
-
2019
- 2019-02-22 CN CN201910132210.9A patent/CN109871487B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102346899A (zh) * | 2011-10-08 | 2012-02-08 | 亿赞普(北京)科技有限公司 | 一种基于用户行为的广告点击率预测方法和装置 |
CN102831234A (zh) * | 2012-08-31 | 2012-12-19 | 北京邮电大学 | 基于新闻内容和主题特征的个性化新闻推荐装置和方法 |
WO2014143024A1 (en) * | 2013-03-15 | 2014-09-18 | Yahoo! Inc. | Almost online large scale collaborative filtering based recommendation system |
Also Published As
Publication number | Publication date |
---|---|
CN109871487A (zh) | 2019-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108536679B (zh) | 命名实体识别方法、装置、设备及计算机可读存储介质 | |
CN109408731B (zh) | 一种多目标推荐方法、多目标推荐模型生成方法以及装置 | |
CN110580500B (zh) | 一种面向人物交互的网络权重生成少样本图像分类方法 | |
WO2022161202A1 (zh) | 多媒体资源分类模型训练方法和多媒体资源推荐方法 | |
CN111680147A (zh) | 一种数据处理方法、装置、设备以及可读存储介质 | |
US10621137B2 (en) | Architecture for predicting network access probability of data files accessible over a computer network | |
CN111625715B (zh) | 信息提取方法、装置、电子设备及存储介质 | |
CN112995690B (zh) | 直播内容品类识别方法、装置、电子设备和可读存储介质 | |
CN113128526B (zh) | 图像识别方法、装置、电子设备和计算机可读存储介质 | |
CN113836390B (zh) | 资源推荐方法、装置、计算机设备及存储介质 | |
CN115131052A (zh) | 一种数据处理方法、计算机设备和存储介质 | |
CN115204436A (zh) | 检测业务指标异常原因的方法、装置、设备及介质 | |
CN116401522A (zh) | 一种金融服务动态化推荐方法和装置 | |
CN114707633B (zh) | 特征提取方法、装置、电子设备和存储介质 | |
CN109871487B (zh) | 一种新闻召回方法和*** | |
CN115858911A (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
WO2020151318A1 (zh) | 基于爬虫模型的语料构建方法、装置及计算机设备 | |
CN112529637A (zh) | 基于情景感知的服务需求动态预测方法及*** | |
CN112765479B (zh) | 一种信息推荐的方法、装置、电子设备和可读存储介质 | |
CN116561540B (zh) | 业务数据校正方法、装置及ai数字人的训练方法、装置 | |
CN116778264B (zh) | 基于类增学习的对象分类方法、图像分类方法及相关设备 | |
CN113792163B (zh) | 多媒体推荐方法、装置、电子设备及存储介质 | |
CN115905584B (zh) | 一种视频拆分方法及装置 | |
CN114417944B (zh) | 识别模型训练方法及装置、用户异常行为识别方法及装置 | |
CN117556149B (zh) | 资源推送方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |