CN111143684A

CN111143684A - 基于人工智能的泛化模型的训练方法及装置

Info

Publication number: CN111143684A
Application number: CN201911392134.1A
Authority: CN
Inventors: 陈蓉; 黄银锋
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-12-30
Filing date: 2019-12-30
Publication date: 2020-05-12
Anticipated expiration: 2039-12-30
Also published as: CN111143684B

Abstract

本发明提供了一种基于人工智能的泛化模型的训练方法及装置；泛化模型包括输入层、隐藏层及输出层，方法包括：获取推荐对象样本的文本内容对应的内容向量，推荐对象样本标注有用于表征推荐对象样本的目标向量序列；将获取的内容向量输入至所述输入层，以通过输入层传递至隐藏层；通过隐藏层，调用激活函数得到对应内容向量的隐层特征；通过输出层，对得到的隐层特征进行预测，得到对应推荐对象样本的向量序列；其中，向量序列包括多个具有点击数据的第二推荐对象所对应的第二推荐对象向量，用于供基于第二推荐对象向量，对推荐对象样本进行推荐；获取向量序列与目标向量序列的差异，并基于差异更新泛化模型的模型参数。

Description

基于人工智能的泛化模型的训练方法及装置

技术领域

本发明涉及人工智能的自然语言处理技术，尤其涉及一种基于人工智能的泛化模型的训练方法、推荐对象泛化方法、装置及存储介质。

背景技术

自然语言处理(Nature Language Processing，NLP)是计算机科学领域与人工智能领域中的一个重要方向，能够实现人与计算机之间用自然语言进行有效通信，通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。推荐***是自然语言处理领域的重要应用之一，可以自动联系用户和推荐对象，能够在信息过载的环境中帮助用户发现可能令他们感兴趣的信息，也能将信息推送给对它们感兴趣的用户。

相关技术中，为了保证推荐***进行内容推荐的有效性，往往结合推荐对象的内容数据及用户行为数据进行内容推荐，然而在实际应用中，对于新发布的推荐对象，往往没有或存在少量的用户行为数据，致使仅基于推荐对象的内容数据，或者结合推荐对象的内容数据及少量的用户行为数据，所进行的内容推荐的准确度低。

发明内容

本发明实施例提供一种基于人工智能的泛化模型的训练方法及装置，能够基于推荐对象的内容向量对该推荐对象进行泛化，得到能够表征该推荐对象的多个推荐对象向量。

本发明实施例提供一种基于人工智能的泛化模型的训练方法，所述泛化模型包括输入层、隐藏层及输出层，所述方法包括：

获取推荐对象样本的文本内容对应的内容向量，所述推荐对象样本标注有用于表征所述推荐对象样本的目标向量序列，所述目标向量序列包括多个具有点击数据的第一推荐对象所对应的第一推荐对象向量；

将获取的所述内容向量输入至所述输入层，以通过所述输入层传递至所述隐藏层；

通过所述隐藏层，调用激活函数得到对应所述内容向量的隐层特征；

通过所述输出层，对得到的所述隐层特征进行预测，得到对应所述推荐对象样本的向量序列；

其中，所述向量序列包括多个具有点击数据的第二推荐对象所对应的第二推荐对象向量，用于供基于所述第二推荐对象向量，对所述推荐对象样本进行推荐；

获取所述向量序列与所述目标向量序列的差异，并基于所述差异，更新所述泛化模型的模型参数。

本发明实施例提供一种基于人工智能的泛化模型的训练装置，所述泛化模型包括输入层、隐藏层及输出层，所述装置包括：

第一获取模块，用于获取推荐对象样本的文本内容对应的内容向量，所述推荐对象样本标注有用于表征所述推荐对象样本的目标向量序列，所述目标向量序列包括多个具有点击数据的第一推荐对象所对应的第一推荐对象向量；

第一传递模块，用于将获取的所述内容向量输入至所述输入层，以通过所述输入层传递至所述隐藏层；

第一调用模块，用于通过所述隐藏层，调用激活函数得到对应所述内容向量的隐层特征；

第一预测模块，用于通过所述输出层，对得到的所述隐层特征进行预测，得到对应所述推荐对象样本的向量序列；

更新模块，用于获取所述向量序列与所述目标向量序列的差异，并基于所述差异更新所述泛化模型的模型参数。

上述方案中，所述获取模块，还用于对所述推荐对象样本的文本内容进行分词处理，得到所述文本内容的多个词语；

分别对得到的各个所述词语进行词向量转换处理，得到对应各个所述词语的词语向量；

对得到的各个所述词语的词语向量加权求平均，得到对应所述文本内容的内容向量。

上述方案中，所述获取模块，还用于对所述推荐对象样本的文本内容进行关键词提取处理，得到对应所述文本内容的多个关键词；

分别对各所述关键词进行词向量转换处理，得到对应的关键字向量；

对各所述关键词向量进行加权求平均，得到对应所述文本内容的内容向量。

上述方案中，所述装置还包括构建模块，所述构建模块，用于获取预设时间段内推荐对象样本集合中各推荐对象样本的用户行为数据；

基于获取的用户行为数据，以推荐对象样本为节点，构建包括各推荐对象样本对应的节点的网络图；

基于所述网络图，得到对应所述推荐对象样本的目标向量序列。

上述方案中，所述构建模块，还用于基于获取的用户行为数据，分别确定所述推荐对象样本集合中各所述推荐对象样本对应的用户向量，所述用户向量，用于表征针对相应的推荐对象样本存在用户行为的用户；

基于各所述推荐对象样本对应的用户向量，进行推荐对象样本之间的相似度匹配，得到所述推荐对象样本集合中推荐对象样本之间的第一相似度值；

基于得到的所述第一相似度值，构建包括各推荐对象样本对应的节点的网络图。

上述方案中，所述构建模块，还用于基于获取的用户行为数据，分别获取所述推荐对象样本集合中各推荐对象样本对应的点击量；

基于各所述推荐对象样本对应的点击量，进行推荐对象样本之间的相似度匹配，得到所述推荐对象样本集合中推荐对象样本之间的第二相似度值；

基于得到的所述第二相似度值，构建包括各推荐对象样本对应的节点的网络图。

上述方案中，所述构建模块，还用于分别以所述网络图中包括的各个节点作为起始节点，对所述网络图执行随机游走操作，得到多条随机游走路径；

基于多条所述随机游走路径，得到对应所述推荐对象样本的目标向量序列。

上述方案中，基于所述网络图，得到对应所述推荐对象样本的目标向量序列，包括：

分别以所述网络图中包括的各个节点作为起始节点，对所述网络图执行偏差随机游走操作，得到多条偏差随机游走路径；

基于多条所述偏差随机游走路径，得到对应所述推荐对象样本的目标向量序列。

上述方案中，所述更新模块，还用于当所述差异超过差异阈值时，基于所述差异确定所述泛化模型的误差信号；

将所述误差信号在所述泛化模型中反向传播，并在传播的过程中更新各个层的模型参数。

本发明实施例还提供一种推荐对象泛化方法，所述方法包括：

获取待泛化推荐对象的文本内容对应的内容向量；

通过泛化模型的输入层，将所述内容向量传递至所述泛化模型的隐藏层；

通过所述泛化模型的隐藏层，调用激活函数得到对应所述内容向量的隐层特征；

通过所述泛化模型的输出层，对得到的所述隐层特征进行预测，得到对应所述待泛化推荐对象的包括多个推荐对象向量的向量序列；

所述向量序列，用于表征所述待泛化推荐对象，以及，用于供基于所述向量序列，进行对应所述待泛化推荐对象的内容推荐；

其中，所述泛化模型由上述方案中所提供的训练方法训练得到。

本发明实施例还提供一种推荐对象泛化装置，所述装置包括：

第二获取模块，用于获取待泛化推荐对象的文本内容对应的内容向量；

第二传递模块，用于通过泛化模型的输入层，将所述内容向量传递至所述泛化模型的隐藏层；

第二调用模块，用于通过所述泛化模型的隐藏层，调用激活函数得到对应所述内容向量的隐层特征；

第二预测模块，用于通过所述泛化模型的输出层，对得到的所述隐层特征进行预测，得到对应所述待泛化推荐对象的包括多个推荐对象向量的向量序列；

本发明实施例提供一种电子设备，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本发明实施例提供的基于人工智能的泛化模型的训练方法。

本发明实施例提供一种存储介质，存储有可执行指令，用于引起处理器执行时，实现本发明实施例提供的基于人工智能的泛化模型的训练方法。

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本发明实施例提供的推荐对象泛化方法。

本发明实施例还提供一种存储介质，所述存储介质存储有可执行指令，用于引起处理器执行时，实现本发明实施例提供的推荐对象泛化方法。

本发明实施例具有以下有益效果：

通过将获取的标注有基于用户行为数据得到的目标向量序列的推荐对象样本的文本内容的内容向量输入至输入层，以通过输入层传递至隐藏层；通过隐藏层，调用激活函数得到对应内容向量的隐层特征；通过输出层，对得到的隐层特征进行预测，得到对应推荐对象样本的向量序列；获取向量序列与目标向量序列的差异，并基于获取的差异更新泛化模型的模型参数；如此，结合推荐对象样本的文本内容信息以及针对推荐对象样本的用户行为信息，构建出的泛化模型的泛化能力较强，通过该泛化模型能够基于推荐对象的内容向量对该推荐对象进行泛化，得到能够表征该推荐对象的多个推荐对象向量，进而可基于表征该推荐对象的多个推荐对象向量进行推荐对象推荐，提高推荐对象推荐的准确度。

附图说明

图1为本发明实施例提供的推荐***的架构示意图；

图2为本发明实施例提供的排序模块的组成示意图；

图3为本发明实施例提供的泛化模型的实施场景示意图；

图4为本发明实施例提供的电子设备的一个可选的结构示意图；

图5为本发明实施例提供的泛化模型的训练方法的一个可选的流程示意图；

图6为本发明实施例提供的泛化模型的结构示意图；

图7为本发明实施例提供的目标向量序列获取示意图；

图8为本发明实施例提供的目标向量序列获取示意图；

图9为本发明实施例提供的推荐对象样本的内容向量的获取示意图；

图10为本发明实施例提供的泛化模型的使用流程示意图；

图11为本发明实施例提供的排序模块的组成示意图；

图12为本发明实施例提供的泛化模型的使用流程示意图；

图13为本发明实施例提供的泛化模型的训练方法的一个可选的流程示意图；

图14为本发明实施例提供的泛化模型的训练方法的一个可选的流程示意图。

图15为本发明实施例提供的泛化模型的训练装置的一个可选的结构示意图；

图16为本发明实施例提供的推荐对象泛化方法的流程示意图；

图17为本发明实施例提供的推荐对象泛化装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，所描述的实施例不应视为对本发明的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

在以下的描述中，所涉及的术语“第一\第二”仅仅是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的，不是旨在限制本发明。

对本发明实施例进行进一步详细说明之前，对本发明实施例中涉及的名词和术语进行说明，本发明实施例中涉及的名词和术语适用于如下的解释。

1)推荐对象(Item)：待推荐的内容，比如新闻、比赛、帖子或feeds流中的短视频等。

2)推荐对象向量(Item embedding)：一种映射，将原始高维数据空间中的多值离散特征映射成低维定长向量。

3)泛化：可由具体的、个别的扩大为一般的，当某一反应与某种刺激形成条件联系后，这一反应也会与其它类似的刺激形成某种程度的条件联系，这一过程称为泛化。

4)点击率(click-through-rate)：被点击次数和被显示次数的比，用来衡量体育feeds流推荐对象的吸引程度。

5)用户兴趣：用户在使用文本推荐***时，所表现的行为倾向性。文本推荐***会根据用户的一系列行为表现来确实用户的兴趣。

6)用户画像：又称用户角色，作为一种勾画目标用户、联系用户诉求与设计方向的有效工具。用户画像在各领域得到了广泛的应用，在实际操作的过程中，往往会以最为浅显和贴近生活的话语将用户的属性、行为与期待联结起来，作为实际用户的虚拟代表。

7)分词：将连续的字序列按照一定的规范重新组合成词序列的过程。通过让计算机模拟人对句子的理解，达到识别词的效果。

8)召回(Recall)：从文档库中检索出相关文档，例如为用户粗选一批待推荐的商品。

9)word2vec：用来产生词向量的相关模型。将所有的词向量化，使得词与词之间可以定量地度量它们之间的关系，从而挖掘词之间的联系。

发明人在实施本发明实施例的过程中，基于用户的历史浏览和观看行为构建推荐***，通过构建的推荐***将待推荐对象推荐给感兴趣的用户，如在腾讯体育APP、微博等应用客户端进行个性化的新闻推荐。参见图1，图1为本发明实施例提供的推荐***的架构示意图，如图1所示，本发明实施例提供的推荐***由召回模块、排序模块、重新排序模块等几部分组成，接下来逐一进行说明。

召回模块预先根据用户的浏览、点赞、评论等行为，基于用户兴趣召回算法计算出用户兴趣、记录用户的历史行为，并基于推荐对象的协同过滤算法(Item CF，ItemCollaboration Filter)计算出两两推荐对象之间的相似度，根据推荐对象的相似度和用户的历史行为(如用户的点击行为)，计算出推荐对象热度，从而基于推荐对象热度对推荐对象进行粗排序，以从百万级的推荐对象库中挑选几千个待推荐的推荐对象组成的推荐对象列表。

排序模块基于离线训练的方式，预先根据用户的行为构造训练特征，其中，训练特征包括：用户画像，用户兴趣，推荐对象属性，上下文场景等，可采用多个决策树来表征训练特征。参见图2，图2为本发明实施例提供的排序模块的组成示意图，在实施实施时，可基于梯度提升迭代决策树(GBDT，Gradient Boosting Decision Tree)模型，每个小时计算一次，采集到用户行为数据后，进行数据拼接，构造出训练数据，即推荐对象样本，然后通过GBDT模型进行训练，对召回模块得到的待推荐对象列表进行重新精排序，如此，根据用户的历史行为和用户画像检索出用户可能感兴趣的推荐对象列表。

重新排序模块对上述排序模块得到的推荐对象列表进行打散、曝光去重、多样性控制等操作，对推荐对象列表中的待推荐对象进行重新排序，从中选出最优的少量推荐对象展现给用户。

发明人在实施本发明实施例的过程中发现，排序模块是基于GBDT模型训练的，而GBDT模型以推荐对象标识(itemid)作为特征，此种情况比较适合部分推荐对象的推荐，比对，对于体育的feeds流中打上球队的推荐对象，每天大约不到1万的推荐对象量，因此以itemid作为特征来进行GBDT模型训练能够保证计算的速度；而针对全量推荐对象推荐的情况，itemid的量将比较庞大，如果仍以itemid作为特征并将所有推荐对象全放进GBDT模型中，势必会带来巨大的计算消耗，使得计算性能遇到瓶颈；并且，itemid之间是相互独立的，并不没有考虑不同推荐对象之间的关联关系，使得泛化能力较弱，导致推荐的精准度有待进一步提高。

基于此，本发明实施例提供了一种基于用户行为的泛化模型的训练方法，训练得到的泛化模型结合了目标推荐对象的文本内容及对应的用户行为数据，泛化能力更强，通过该泛化模型能够基于推荐对象的内容向量对该推荐对象进行泛化，得到能够表征该推荐对象的多个推荐对象向量。

首先对本发明实施例提供的基于人工智能的泛化模型的实施场景进行说明，图3为本发明实施例提供的基于人工智能的泛化模型的实施场景示意图，参见图3，为实现支撑一个示例性应用，终端400(示例性示出了终端400-1、终端400-2)上设置有应用客户端，如新闻应用客户端，其中，终端400-1位于发布新闻侧，终端400-2位于接收推荐新闻侧，终端400通过网络300连接服务器200，网络300可以是广域网或者局域网，又或者是二者的组合，使用无线链路实现数据传输。

服务器200，用于获取推荐对象样本的文本内容对应的内容向量，推荐对象样本标注有用于表征推荐对象样本的目标向量序列，目标向量序列包括多个具有点击数据的第一推荐对象所对应的第一推荐对象向量；将获取的内容向量输入至输入层，以通过输入层传递至隐藏层；通过隐藏层，调用激活函数得到对应内容向量的隐层特征；通过输出层，对得到的隐层特征进行预测，得到对应推荐对象样本的向量序列，其中，向量序列包括多个具有点击数据的第二推荐对象所对应的第二推荐对象向量，用于供基于第二推荐对象向量，对推荐对象样本进行推荐；获取向量序列与目标向量序列的差异，并基于获取的差异更新泛化模型的模型参数。如此，实现对泛化模型的训练。

用户打开用户终端400-1的客户端，发布一条新的新闻(待泛化推荐对象)，终端400-1的显示界面410-1上可呈现待泛化推荐对象，终端400-1用于发送携带待泛化推荐对象的泛化请求给服务器200。

服务器200，还用于接收到终端发送的泛化请求，采用训练得到的泛化模型对待泛化推荐对象进行泛化，得到基于用户行为的目标向量序列，并结合待泛化推荐对象的内容向量及对应的用户行为的目标向量序列进行推荐对象的推荐，并将确定的推荐对象返回给终端400-2，以在终端的显示界面410-2呈现推荐对象。

参见图4，图4为本发明实施例提供的电子设备200的一个可选的结构示意图，以电子设备实施通过服务器来实施为例，图4所示的电子设备200包括：至少一个处理器210、存储器250、至少一个网络接口220和用户接口230。终端200中的各个组件通过总线***240耦合在一起。可理解，总线***240用于实现这些组件之间的连接通信。总线***240除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图2中将各种总线都标为总线***240。

处理器210可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

用户接口230包括使得能够呈现媒体内容的一个或多个输出装置231，包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口230还包括一个或多个输入装置232，包括有助于用户输入的用户接口部件，比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。

存储器250可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。存储器250可选地包括在物理位置上远离处理器210的一个或多个存储设备。

存储器250包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM，Read Only Me mory)，易失性存储器可以是随机存取存储器(RAM，Random Access Memor y)。本发明实施例描述的存储器250旨在包括任意适合类型的存储器。

在一些实施例中，存储器250能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作***251，包括用于处理各种基本***服务和执行硬件相关任务的***程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块252，用于经由一个或多个(有线或无线)网络接口220到达其他计算设备，示例性的网络接口420包括：蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB，Universal Serial Bus)等；

呈现模块253，用于经由一个或多个与用户接口230相关联的输出装置231(例如，显示屏、扬声器等)使得能够呈现信息(例如，用于操作***设备和显示内容和信息的用户接口)；

输入处理模块254，用于对一个或多个来自一个或多个输入装置232之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。

在一些实施例中，本发明实施例提供的基于人工智能的泛化模型的训练装置可以采用软件方式实现，图4示出了存储在存储器250中的基于人工智能的泛化模型的训练装置255，其可以是程序和插件等形式的软件，包括以下软件模块：第一获取模块2551、第一传递模块2552、第一调用模块2553、第一预测模块2554和更新模块2555，这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。

在另一些实施例中，本发明实施例提供的基于人工智能的泛化模型的训练装置可以采用硬件方式实现，作为示例，本发明实施例提供的基于人工智能的泛化模型的训练装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本发明实施例提供的基于人工智能的泛化模型的训练方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，Applicati on Specific Integrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable Logic Device)、复杂可编程逻辑器件(CPLD，ComplexProgrammable Logic Device)、现场可编程门阵列(FPGA，Field-Programmable GateArray)或其他电子元件。

下面将结合本发明实施例提供的基于用户行为的泛化模型的训练方法实施为服务器时的示例性应用，说明本发明实施例提供的基于用户行为的泛化模型的训练方法。

参见图5-6，图5为本发明实施例提供的基于用户行为的泛化模型的训练方法的一个可选的流程示意图，图6为本发明实施例提供的泛化模型的结构示意图，如图6所示，本发明实施例提供的泛化模型包括输入层、隐藏层及输出层，将结合图5示出的步骤和图6进行说明。

步骤501：服务器获取推荐对象样本的文本内容对应的内容向量。

在实际实施时，在进行泛化模型的训练之前，建立训练推荐对象样本集，推荐对象样本集包括多个推荐对象样本，其中，推荐对象样本标注有用于表征推荐对象样本的目标向量序列，目标向量序列包括多个具有点击数据的第一推荐对象所对应的第一推荐对象向量，目标向量序列基于用户行为数据所得到。

在一些实施例中，服务器可通过如下方式得到对应推荐对象样本的目标向量序列：

获取预设时间段内推荐对象样本集合中各推荐对象样本的用户行为数据；基于获取的用户行为数据，以推荐对象样本为节点，构建包括各推荐对象样本对应的节点的网络图；基于构建的网络图，得到对应推荐对象样本的目标向量序列。

这里，用户行为数据可以是用户对推荐对象样本的点击数据，如点击量或点击率。在实际应用中，可采集用户一段时间(比如一天)内对推荐对象样本库中的各个推荐对象样本的点击流水。

在一些实施例中，服务器可通过如下方式基于获取的用户行为数据，以推荐对象样本为节点，构建包括各推荐对象样本对应的节点的网络图：

基于获取的用户行为数据，分别确定推荐对象样本集合中各推荐对象样本对应的用户向量；基于各推荐对象样本对应的用户向量，进行推荐对象样本之间的相似度匹配，得到推荐对象样本集合中推荐对象样本之间的第一相似度值；基于得到的第一相似度值，构建包括各推荐对象样本对应的节点的网络图。

其中，用户向量用于表征针对相应的推荐对象样本存在用户行为的用户，比如，对于推荐对象样本item1:user1、user2、user3，item2:user2、user3、user4，表征用户user1、用户user2和用户user3点击或观看了推荐对象样本item1，用户user2、用户user3和用户user4点击或观看了推荐对象样本item2。

在实际实施时，利用余弦定理，采用公式(1)计算推荐对象样本集合中的推荐对象样本两两之间的相似度，由此得到的第一相似度值具备对称性，相应地，构建出的网络图是无向图。

其中，a和b分别为item a和item b的用户向量，表征用户点击或观看了相应的推荐对象样本item a和item b。

在一些实施例中，服务器还可通过如下方式基于获取的用户行为数据，以推荐对象样本为节点，构建包括各推荐对象样本对应的节点的网络图：

基于获取的用户行为数据，分别获取推荐对象样本集合中各推荐对象样本对应的点击量；基于各推荐对象样本对应的点击量，进行推荐对象样本之间的相似度匹配，得到推荐对象样本集合中推荐对象样本之间的第二相似度值；基于得到的第二相似度值，构建包括各推荐对象样本对应的节点的网络图。

这里，利用关联规则的计算方法，采用公式(2)计算推荐对象样本集合中的推荐对象样本两两之间的相似度：

其中，a和b分别为针对样本推荐对象item a和item b的点击量，后面乘以log(b)，由此得到的第二相似度值是不一致的，相应地，构建出的网络图是有向图。

在一些实施例中，服务器可通过如下方式基于网络图，得到对应推荐对象样本的目标向量序列：

分别以网络图中包括的各个节点作为起始节点，对网络图执行随机游走操作，得到多条随机游走路径；基于多条随机游走路径，得到对应推荐对象样本的目标向量序列。

这里，对于构建好的网络图，为了将网络图中的每个节点映射成一个低维的向量，利用图模型比如Deep Walk对网络图进行训练，以网络图中包括的各个节点作为起始节点，对网络图执行随机游走操作，得到对应的多条随机游走路径，对于每条随机游走路径中的节点进行向量化训练，得到对应推荐对象样本的目标向量序列。

在一些实施例中，服务器还可通过如下方式基于网络图，得到对应推荐对象样本的目标向量序列：

分别以网络图中包括的各个节点作为起始节点，对网络图执行偏差随机游走操作，得到多条偏差随机游走路径；基于多条偏差随机游走路径，得到对应推荐对象样本的目标向量序列。

参见图7，图7为本发明实施例提供的目标向量序列获取示意图，如图8所示，对于构建好的网络图利用note2vector模型进行训练，得到对应的推荐对象样本的目标向量序列。由于Deep Walk选取随机游走序列中下一个节点的方式是均匀随机分布的，而note2vector采用有偏差的随机游走，引入两个超参数p和q，其中，p控制重复访问各个访问过的节点的概率，q控制着游走是内向还是外向，将宽度优先搜索和深度优先搜索引入随机游走序列的生成过程，宽度优先搜索注重临近的节点，并刻画了相对局部的一种网络表示，宽度优先中的节点一般会出现很多次，从而降低刻画中心节点的邻居节点的方差，深度优先搜索反应了更高层面上的节点间的同质性。

在一些实施例中，服务器获取预设时间段内推荐对象集合中各推荐对象样本的用户行为数据，其中，用户行为数据为获取的预设时间内用户的点击序列(比如，以30分钟作为一个分段，并且按照时间先后顺序排序)，如此，构建出多个这样的用户点击序列，参见图8，图8为本发明实施例提供的目标向量序列获取示意图，如图8所示，可将每个用户看成doc，每个用户的点击序列看成是每个item，利用word2vector，就会得到每个推荐对象的目标向量序列(即item的embedding向量)。

在一些实施例中，服务器可通过如下方式获取推荐对象样本的文本内容对应的内容向量：

对推荐对象样本的文本内容进行分词处理，得到文本内容的多个词语；分别对得到的各个词语进行词向量转换处理，得到对应各个词语的词语向量；对得到的各个词语的词语向量加权求平均，得到对应文本内容的内容向量。

这里，推荐对象样本集也即搜集到的历史全量item(即推荐对象)内容数据，在实际应用中，item包括新闻、视频、比赛和帖子等多种形态。鉴于除了新闻外其他几类推荐对象内容的文本信息都比较少，因此，可以新闻库的历史存量新闻来做训练推荐对象样本，参见图9，图9为本发明实施例提供的推荐对象样本的内容向量的获取示意图，如图9所示，先对推荐对象样本库(新闻库)中的每条推荐对象(即新闻)的文本内容进行分词处理，得到对应该条推荐对象内容文本的多个词语，比如，对于推荐对象item1对应的分词为词语tag1、词语tag2…，推荐对象item2对应的分词为词语tag3、词语tag4…等；然后基于word2vector分别对各个词语进行词向量转换，得到对应各个词语的词语向量tag；最后对各个词语的词语向量tag进行加权求平均，得到对应文本内容的内容向量item。

在一些实施例中，服务器还可通过如下方式获取推荐对象样本的文本内容对应的内容向量：

对推荐对象样本的文本内容进行关键词提取处理，得到对应文本内容的多个关键词；分别对各关键词进行词向量转换处理，得到对应的关键字向量；对各关键词向量进行加权求平均，得到对应文本内容的内容向量。

在实际应用中，为了提高效率，可对文本内容进行关键词处理，通过关键词来理解推荐对象的意图，常用的关键词提取方法有词频逆文本频率(TF-IDF，Term Frequency-Inverse Document Frequency)、Rake(Rapid Automatic Keyw ord Extraction)、Topic-Model等。

步骤502：将获取的内容向量输入至输入层，以通过输入层传递至隐藏层。

步骤503：通过隐藏层，调用激活函数得到对应内容向量的隐层特征。

这里，隐藏层的层数和每层的神经元数目可根据实际情况设定。

步骤504：通过输出层，对得到的隐层特征进行预测，得到对应推荐对象样本的向量序列。

这里，对应推荐对象样本的向量序列是通过输出层得到的预测结果。

步骤505：获取向量序列与目标向量序列的差异，并基于差异更新泛化模型的模型参数。

这里，将预测得到的向量序列与推荐对象样本标注的目标向量序列进行比较，计算预测得到的向量序列与目标向量序列的差异，基于两者之间的差异，构建损失函数，以均方误差表示损失函数，如公式(3)：

其中，O_i为获取的向量序列，T_i为目标向量序列，n表示序列数目。

在一些实施例，服务器可通过如下方式基于获取的差异更新泛化模型的模型参数：

当损失函数的值表征差异超过差异阈值时，基于差异确定泛化模型的误差信号；将误差信号在泛化模型中反向传播，并在传播的过程中更新各个层的模型参数。

通过上述步骤，实现了泛化模型的训练。将上述训练好的泛化模型加载到排序模块中，结合推荐对象样本的内容向量和目标向量序列，得到对应的推荐对象向量(即itemembedding)。

接下来，继续对泛化模型的使用进行说明。

在一些实施例中，当产生了新的推荐对象(item)，即服务器获取到待泛化推荐对象时，参见图10，图10为本发明实施例提供的泛化模型的使用流程示意图，如图11所示，首先对待泛化推荐对象的文本内容进行分词，得到对应的多个词语；然后分别对得到的各个词语进行词向量转换处理，得到对应各个词语的词语向量；最后对得到的各个词语的词语向量加权求平均，得到对应文本内容的内容向量。接下来将得到的内容向量输入训练得到的泛化模型进行预测，得到对应的基于用户行为的行为向量。

通过上述步骤，预测得到了新产生的item的基于用户行为的行为向量，在排序模块的离线训练和在线预测中，参见图11，图11为本发明实施例提供的排序模块的组成示意图，将新item的内容向量和行为向量作为新item的item embedding(推荐对象向量)，以item embedding替代图2所示的itemid，大大缩小了训练数据的维度(比如，可从2万以上的维度缩小到200个维度)，计算速度更快。

在实际应用中，将训练得到的泛化模型加载到推荐***的引擎中，参见图3，用户打开用户终端上的客户端，终端发送携带待泛化推荐对象的泛化请求给服务器。服务器接收到终端发送的泛化请求，采用训练得到的泛化模型对待泛化推荐对象进行泛化，得到基于用户行为的目标向量，并结合待泛化推荐对象的文本内容及对应的用户行为数据进行推荐对象的推荐，并将确定的推荐对象返回给终端，参见图12，图12为本发明实施例提供的推荐对象的呈现界面示意图，以在如图12所示的终端的显示界面呈现推荐对象。由于本发明实施例训练得到的泛化模型的泛化能力更强，可大大提升推荐对象的推荐效果。

通过上述方式，将获取的标注有基于用户行为数据得到的目标向量序列的推荐对象样本的文本内容的内容向量输入至输入层，以通过输入层传递至隐藏层；通过隐藏层，调用激活函数得到对应内容向量的隐层特征；通过输出层，对得到的隐层特征进行预测，得到对应推荐对象样本的向量序列；获取向量序列与目标向量序列的差异；基于获取的差异，采用反向传播的方式更新泛化模型的模型参数；如此，结合推荐对象样本的文本内容信息以及针对推荐对象样本的用户行为信息，构建出的泛化模型的泛化能力较强，通过该泛化模型能够对基于待泛化推荐对象的文本内容进行泛化，得到基于用户行为的目标向量，进而结合待泛化推荐对象的文本内容及对应的用户行为数据进行推荐对象的推荐，推荐精度更高。

接下来继续对本发明实施例提供的基于人工智能的泛化模型的训练方法进行介绍，图13为本发明实施例提供的基于人工智能的泛化模型的训练方法的一个可选的流程示意图，参见图13，本发明实施例提供的基于人工智能的泛化模型的训练方法由应用客户端、服务器协同实施。

步骤601：服务器获取预设时间段内各推荐对象的用户行为数据。

这里，在进行泛化模型的训练之前，建立训练推荐对象样本集，获取的用户行为数据可以是用户对推荐对象样本的点击数，如点击量或点击率。在实际应用中，可采集用户一段时间(比如一天)内对推荐对象样本库中的各个推荐对象样本的点击流水。

步骤602：服务器基于获取的用户行为数据，以推荐对象为节点，构建包括各推荐对象对应的节点的网络图。

在实际实施时，服务器基于获取的用户行为数据，分别确定推荐对象样本集合中各推荐对象样本对应的用户向量；基于各推荐对象样本对应的用户向量，进行推荐对象样本之间的相似度匹配，得到推荐对象样本集合中推荐对象样本之间的相似度值；基于得到的相似度值，构建包括各推荐对象样本对应的节点的网络图。

步骤603：服务器基于构建的网络图，得到对应推荐对象的目标向量序列。

在实际实施时，服务器分别以网络图中包括的各个节点作为起始节点，对网络图执行随机游走操作，得到多条随机游走路径；基于多条随机游走路径，得到对应推荐对象样本的目标向量序列。

步骤604：服务器分别将得到目标向量序列标注在对应的推荐对象上，得到推荐对象样本。

通过上述方式，训练得到了推荐对象样本，由多个推荐对象样本构成训练推荐对象样本集。

步骤605：服务器对推荐对象样本的文本内容进行分词处理，得到文本内容的多个词语。

步骤606：服务器分别对得到的各个词语进行词向量转换处理，得到对应各个词语的词语向量。

步骤607：服务器对得到的各个词语的词语向量加权求平均，得到对应文本内容的内容向量。

通过上述步骤，得到了对应目标文本的文本内容的内容向量。

步骤608：服务器将获取的内容向量输入至所述输入层，以通过输入层传递至隐藏层。

步骤609：服务器通过隐藏层，调用激活函数得到对应内容向量的隐层特征。

步骤610：服务器通过输出层，对得到的隐层特征进行预测，得到对应推荐对象样本的向量序列。

步骤611：服务器获取向量序列与目标向量序列的差异。

步骤612：服务器基于获取的差异，采用反向传播的方式更新泛化模型的模型参数。

上述步骤611-612，将输出层预测的向量序列与推荐对象样本标注的目标向量序列进行比较，计算预测得到的向量序列与目标向量序列的差异，基于两者之间的差异，构建损失函数。当损失函数的值差异超过差异阈值时，基于差异确定泛化模型的误差信号；将误差信号在泛化模型中反向传播，并在传播的过程中更新各个层的模型参数。如此，通过上述步骤实现对泛化模型的训练。

步骤613：应用客户端响应于针对待泛化推荐对象的发布操作，生成携带待泛化推荐对象的泛化请求。

这里，用户打开第一终端上的应用客户端，发布待泛化推荐对象(即一条新的新闻)时，生成相应用于请求对待泛化推荐对象进行泛化的泛化请求。

步骤614：应用客户端发送泛化请求至服务器。

步骤615：服务器基于泛化请求，通过泛化模型对待泛化推荐对象进行泛化，得到基于用户行为的目标向量序列。

步骤616：服务器发送目标向量序列至应用客户端。

步骤617：应用客户端呈现目标向量序列。

下面，将说明本发明实施例在一个实际的应用场景中的示例性应用。在实际实施时，参见图14，图14为本发明实施例提供的基于人工智能的泛化模型的训练方法的一个可选的流程示意图，本发明实施例提供的基于人工智能的泛化模型的训练方法可包括如下操作：

步骤701：对推荐对象样本的文本内容进行分词处理，得到文本内容的多个词语。

在实际实施时，在进行泛化模型的训练之前，建立训练推荐对象样本集，推荐对象样本集包括多个推荐对象样本，其中推荐对象样本标注有用于表征推荐对象样本的包括多个推荐对象向量的目标向量序列，目标向量序列基于用户行为数据所得到。

这里，推荐对象样本集也即搜集到的历史全量item(即推荐对象)内容数据，在实际应用中，item包括新闻、视频、比赛和帖子等多种形态。鉴于除了新闻外其他几类推荐对象内容的文本信息都比较少，因此，可以新闻库的历史存量新闻来做训练推荐对象样本，先对训练推荐对象样本中的每条新闻进行分词处理，得到对应该新闻的标签列表(taglist)，该标签列表由多个分词得到的词语构成。

步骤702：分别对得到的各个词语进行词向量转换处理，得到对应各个词语的词语向量。

这里，对步骤701分词得到的多个词语进行word2vector模型的训练，得到对应词语的embedding向量(即词语向量)。

步骤703：对得到的各个词语的词语向量加权求平均，得到对应文本内容的内容向量。

步骤704：获取预设时间段内推荐对象样本集合中各推荐对象样本的用户行为数据。

这里，用户行为数据可以是点击数，如点击量或点击率，可采集用户一段时间(比如一天)内的点击流水。

步骤705：基于获取的用户行为数据，确定推荐对象样本之间的相似度。

在一些实施例中，可基于获取的用户行为数据，分别确定推荐对象样本集合中各推荐对象样本对应的用户向量，其中，用户向量用于表征针对相应的推荐对象样本存在用户行为的用户，比如用户点击或观看了相应的推荐对象样本；基于各推荐对象样本对应的用户向量，进行推荐对象样本之间的相似度匹配，得到推荐对象样本集合中推荐对象样本之间的相似度值。如此，利用余弦定理，采用公式(1)计算得到的相似度值具备对称性，相应地，构建出的网络图是无向图。

在一些实施例中，还可基于获取的用户行为数据，分别获取推荐对象样本集合中各推荐对象样本对应的点击量；基于各推荐对象样本对应的点击量，进行推荐对象样本之间的相似度匹配，得到推荐对象样本集合中推荐对象样本之间的相似度值；基于得到的相似度值，构建包括各推荐对象样本对应的节点的网络图。如此，利用关联规则的计算方法，采用公式(2)计算得到的相似度时不一致的，相应地，构建出的网络图是有向图。

步骤706：基于确定的相似度，构建包括各推荐对象样本对应的节点的网络图。

步骤707：基于构建得到的网络图，得到对应推荐对象样本的目标向量序列。

在实际实施时，对于构建好的网络图，可利用图模型，比如deepwalk或node2vector等进行训练，得到基于用户行为的向量序列，具体地：可分别以网络图中包括的各个节点作为起始节点，对网络图执行随机游走操作，得到多条随机游走路径；基于多条随机游走路径，得到对应推荐对象样本的目标向量序列。

步骤708：利用对应推荐对象样本的内容向量和目标向量序列构建泛化模型。

这里，泛化模型为一个全连接神经网络，包括输入层、隐藏层及输出层，以步骤703得到的对应推荐对象样本的内容向量作为输入、以步骤707得到的对应推荐对象文本的目标向量序列作为输出，训练泛化模型。

在实际实施时，首先将获取的对应推荐对象样本的内容向量输入至输入层，以通过输入层传递至隐藏层；然后通过隐藏层，调用激活函数得到对应内容向量的隐层特征；然后通过输出层，对得到的隐层特征进行预测，得到对应推荐对象样本的向量序列；最后计算得到的对应推荐对象样本的向量序列与推荐对象样本标注的目标向量序列之间的差异，并基于两者之间的差异，采用反向传播的方式更新泛化模型的模型参数，具体地，当两者之间的差异超过差异阈值时，基于得到的差异确定泛化模型的误差信号，将误差信号在泛化模型中反向传播，并在传播的过程中更新各个层的模型参数。

通过上述步骤，实现了泛化模型的训练。接下来，对泛化模型的使用进行说明。

步骤709：获取待泛化推荐对象的文本内容对应的内容向量。

这里，待泛化推荐对象为新产生的item，item产生后，执行类似步骤701-703的步骤得到相应的内容向量，即，首先对待泛化推荐对象的文本内容进行分词，得到对应的多个词语；然后分别对得到的各个词语进行词向量转换处理，得到对应各个词语的词语向量；最后对得到的各个词语的词语向量加权求平均，得到对应文本内容的内容向量。

步骤710：将得到的内容向量输入训练得到的泛化模型进行预测，得到对应的基于用户行为的行为向量。

通过上述步骤，预测得到了新产生的item的基于用户行为的行为向量，在排序模块的离线训练和在线预测中，将新item的内容向量和行为向量作为新it em的itemembedding(推荐对象向量)，以item embedding替代原来的itemid，大大缩小了训练数据的维度(比如，可从2万以上的维度缩小到200个维度)，计算速度更快，将训练得到的泛化模型加载到推荐***的引擎中，确定推荐的推荐对象，并将推荐的推荐对象推送给终端进行呈现，由于本发明实施例训练得到的泛化模型的泛化能力更强，可大大提升推荐效果。

下面继续说明本发明实施例提供的基于人工智能的泛化模型的训练装置255实施为软件模块的示例性结构，在一些实施例中，如图4和图15所示，存储在存储器250中的基于人工智能的泛化模型的训练装置255，其中，泛化模型包括输入层、隐藏层及输出层，其可以是程序和插件等形式的软件，包括以下软件模块：第一获取模块2551、第一传递模块2552、第一调用模块2553、第一预测模块2554和更新模块2555。

第一获取模块2551，用于获取推荐对象样本的文本内容对应的内容向量，所述推荐对象样本标注有用于表征所述推荐对象样本的目标向量序列，所述目标向量序列包括多个具有点击数据的第一推荐对象所对应的第一推荐对象向量；

第一传递模块2552，用于将获取的所述内容向量输入至所述输入层，以通过所述输入层传递至所述隐藏层；

第一调用模块2553，用于通过所述隐藏层，调用激活函数得到对应所述内容向量的隐层特征；

第一预测模块2554，用于通过所述输出层，对得到的所述隐层特征进行预测，得到对应所述推荐对象样本的向量序列；

更新模块2555，用于获取所述向量序列与所述目标向量序列的差异，并基于所述差异更新所述泛化模型的模型参数。

在一些实施例中，所述第一获取模块，还用于对所述推荐对象样本的文本内容进行分词处理，得到所述文本内容的多个词语；分别对得到的各个所述词语进行词向量转换处理，得到对应各个所述词语的词语向量；对得到的各个所述词语的词语向量加权求平均，得到对应所述文本内容的内容向量。

在一些实施例中，所述第一获取模块，还用于对所述推荐对象样本的文本内容进行关键词提取处理，得到对应所述文本内容的多个关键词；

在一些实施例中，所述装置还包括构建模块，所述构建模块，用于获取预设时间段内推荐对象样本集合中各推荐对象样本的用户行为数据；

在一些实施例中，所述构建模块，还用于基于获取的用户行为数据，分别确定所述推荐对象样本集合中各所述推荐对象样本对应的用户向量，所述用户向量，用于表征针对相应的推荐对象样本存在用户行为的用户；

在一些实施例中，所述构建模块，还用于基于获取的用户行为数据，分别获取所述推荐对象样本集合中各推荐对象样本对应的点击量；

在一些实施例中，所述构建模块，还用于分别以所述网络图中包括的各个节点作为起始节点，对所述网络图执行随机游走操作，得到多条随机游走路径；

在一些实施例中，基于所述网络图，得到对应所述推荐对象样本的目标向量序列，包括：

在一些实施例中，所述更新模块，还用于当所述差异超过差异阈值时，基于所述差异确定所述泛化模型的误差信号；

需要说明的是，本发明实施例装置的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果，因此不做赘述。

接下来对本发明实施例提供的推荐对象泛化方法进行说明，参见图16，图16为本发明实施例提供的推荐对象泛化方法的流程示意图，如图16所示，本发明实施例提供的推荐对象泛化方法，包括：

步骤801：服务器获取待泛化推荐对象的文本内容对应的内容向量。

这里，在实际应用中，用户打开用户终端的客户端，发布一条新的新闻(待泛化推荐对象)，终端生成并发送携带待泛化推荐对象的泛化请求给服务器；服务器解析接收到的泛化请求，得到待泛化推荐对象的文本内容，首先对待泛化推荐对象的文本内容进行分词，得到对应的多个词语，然后分别对得到的各个词语进行词向量转换处理，得到对应各个词语的词语向量，最后对得到的各个词语的词语向量加权求平均，得到对应文本内容的内容向量。

步骤802：通过泛化模型的输入层，将所内容向量传递至泛化模型的隐藏层。

步骤803：通过泛化模型的隐藏层，调用激活函数得到对应内容向量的隐层特征。

步骤804：通过泛化模型的输出层，对得到的隐层特征进行预测，得到对应待泛化推荐对象的包含多个推荐对象向量的向量序列。

其中，向量序列，用于表征待泛化推荐对象，以及，用于供基于所述向量序列,进行对应所述待泛化推荐对象的内容推荐；泛化模型通过上述实施例中所提供的训练方法训练得到。

下面继续说明本发明实施例提供的推荐对象泛化装置实施为软件模块的示例性结构，参见图17，图17为本发明实施例提供的推荐对象泛化装置的结构示意图，如图17所示，本发明实施例提供的推荐对象泛化装置17包括：

第二获取模块171，用于获取待泛化推荐对象的文本内容对应的内容向量；

第二传递模块172，用于通过泛化模型的输入层，将所述内容向量传递至所述泛化模型的隐藏层；

第二调用模块173，用于通过所述泛化模型的隐藏层，调用激活函数得到对应所述内容向量的隐层特征；

第二预测模块174，用于通过所述泛化模型的输出层，对得到的所述隐层特征进行预测，得到对应所述待泛化推荐对象的包含多个推荐对象向量的向量序列，所述向量序列，用于表征所述待泛化推荐对象，以及，用于供基于所述向量序列,进行对应所述待泛化推荐对象的内容推荐；

本发明实施例提供一种电子设备，包括：

存储器，用于存储可执行指令；

在一些实施例中，存储介质可以是FRAM、ROM、PROM、EPROM、EE PROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件***中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(H TML，Hyper TextMarkup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。

作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

以上所述，仅为本发明的实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本发明的保护范围之内。

Claims

1.一种基于人工智能的泛化模型的训练方法，其特征在于，所述泛化模型包括输入层、隐藏层及输出层，所述方法包括：

获取所述向量序列与所述目标向量序列的差异，并基于所述差异更新所述泛化模型的模型参数。

2.如权利要求1所述的方法，其特征在于，所述获取推荐对象样本的文本内容对应的内容向量，包括：

对所述推荐对象样本的文本内容进行分词处理，得到所述文本内容的多个词语；

3.如权利要求1所述的方法，其特征在于，所述获取推荐对象样本的文本内容对应的内容向量，包括：

对所述推荐对象样本的文本内容进行关键词提取处理，得到对应所述文本内容的多个关键词；

4.如权利要求1所述的方法，其特征在于，所述方法还包括：

获取预设时间段内推荐对象样本集合中各推荐对象样本的用户行为数据；

5.如权利要求4所述的方法，其特征在于，所述基于获取的用户行为数据，以推荐对象样本为节点，构建包括各推荐对象样本对应的节点的网络图，包括：

基于获取的用户行为数据，分别确定所述推荐对象样本集合中各所述推荐对象样本对应的用户向量，所述用户向量，用于表征针对相应的推荐对象样本存在用户行为的用户；

6.如权利要求4所述的方法，其特征在于，所述基于获取的用户行为数据，以推荐对象样本为节点，构建包括各推荐对象样本对应的节点的网络图，包括：

基于获取的用户行为数据，分别获取所述推荐对象样本集合中各推荐对象样本对应的点击量；

7.如权利要求4所述的方法，其特征在于，所述基于所述网络图，得到对应所述推荐对象样本的目标向量序列，包括：

分别以所述网络图中包括的各个节点作为起始节点，对所述网络图执行随机游走操作，得到多条随机游走路径；

8.如权利要求1所述的方法，其特征在于，基于所述差异更新所述泛化模型的模型参数，包括：

当所述差异超过差异阈值时，基于所述差异确定所述泛化模型的误差信号；

9.一种基于人工智能的泛化模型的训练装置，其特征在于，所述泛化模型包括输入层、隐藏层及输出层，所述装置包括：

更新模块，用于获取所述向量序列与所述目标向量序列的差异，并基于所述差异，更新所述泛化模型的模型参数。

10.一种推荐对象泛化方法，其特征在于，所述方法包括：

获取待泛化推荐对象的文本内容对应的内容向量；

通过所述泛化模型的输出层，对得到的所述隐层特征进行预测，得到对应所述待泛化推荐对象的包括多个项目向量的向量序列；

其中，所述泛化模型基于权利要求1至8任一项所述的训练方法训练得到。