CN113672820B

CN113672820B - 特征提取网络的训练方法、信息推荐方法、装置及设备

Info

Publication number: CN113672820B
Application number: CN202110902980.4A
Authority: CN
Inventors: 彭冲; 程兵
Original assignee: Beijing Sankuai Online Technology Co Ltd
Current assignee: Beijing Sankuai Online Technology Co Ltd
Priority date: 2021-08-06
Filing date: 2021-08-06
Publication date: 2022-09-16
Anticipated expiration: 2041-08-06
Also published as: CN113672820A

Abstract

本申请公开了一种特征提取网络的训练方法、信息推荐方法、装置及设备，属于计算机技术领域。所述方法包括：获取曝光推荐信息以及第一历史行为信息；获取历史推荐信息序列；根据历史推荐信息序列获取第二历史行为信息序列；通过曝光推荐信息、第一历史行为信息、历史推荐信息序列以及第二历史行为信息序列训练特征提取网络，特征提取网络用于提取曝光推荐信息以及历史推荐信息的语义向量。通过特征提取网络能够实现提取信息的语义向量，从而能够实现基于语义向量的匹配结果向用户推荐感兴趣的信息。在训练过程中，使用的训练数据是在实际应用场景中的数据，因此能够提升提取的语义向量的准确度，从而提升向用户推荐图文组合时的准确度。

Description

特征提取网络的训练方法、信息推荐方法、装置及设备

技术领域

本申请涉及计算机技术领域，特别涉及一种特征提取网络的训练方法、信息推荐方法、装置及设备。

背景技术

具有推荐功能的客户端能够向用户推荐其感兴趣的图文组合，图文组合是由图片和标题构成的文档(item)，其中，标题用于描述图片。

在进行图文组合推荐的过程中，服务器需要通过机器学习模型提取待推荐图文组合的第一语义向量，之后根据用户过去感兴趣的图文组合的第二语义向量与第一语义向量的相似度，确定出与用户过去感兴趣的图文组合匹配的待推荐图文组合，并推荐给用户，从而实现向用户推荐用户感兴趣的图文组合。

在通过上述方式向用户推荐图文组合时，需要使用样本数据对机器学习模型进行预训练。但是样本数据来源广泛，与实际应用场景中的数据可能存在较大的差异，导致提取的图文组合的语义向量不准确，从而导致推荐图文组合的准确度较低。

发明内容

本申请提供了一种特征提取网络的训练方法、信息推荐方法、装置及设备，可以提升推荐图文组合时的准确度。所述技术方案如下：

根据本申请的一方面，提供了一种特征提取网络的训练方法，所述方法包括：

获取曝光推荐信息以及第一历史行为信息，所述曝光推荐信息是推荐给样本用户帐号集合中的样本用户帐号的推荐信息，所述第一历史行为信息用于反映所述样本用户帐号与所述曝光推荐信息产生过第一交互行为；

获取历史推荐信息序列，所述历史推荐信息序列包括在所述曝光推荐信息之前，推荐给所述样本用户帐号的历史推荐信息；

根据所述历史推荐信息序列获取第二历史行为信息序列，所述第二历史行为信息序列包括第二历史行为信息，所述第二历史行为信息用于反映所述样本用户帐号与所述历史推荐信息产生过第二交互行为；

通过所述曝光推荐信息、所述第一历史行为信息、所述历史推荐信息序列以及所述第二历史行为信息序列训练特征提取网络，所述特征提取网络用于提取所述曝光推荐信息以及所述历史推荐信息的语义向量。

根据本申请的另一方面，提供了一种信息推荐方法，应用于运行有特征提取网络的计算机设备中，所述特征提取网络是采用如上方面所述的特征提取网络的训练方法所训练得到的，所述方法包括：

确定待推荐用户帐号对应的参考待推荐信息，所述参考待推荐信息包括与所述待推荐用户帐号产生过交互行为的待推荐信息，以及与所述待推荐用户帐号的特征匹配的用户帐号产生过交互行为的待推荐信息中的至少一种；

通过所述特征提取网络提取所述参考待推荐信息的第三语义向量；

获取多个候选待推荐信息的第四语义向量，所述第四语义向量是通过所述特征提取网络对所述候选待推荐信息提取得到的；

在所述多个候选待推荐信息的第四语义向量中，确定与所述第三语义向量匹配的目标第四语义向量，并将所述目标第四语义向量对应的候选待推荐信息确定为推荐信息，所述推荐信息用于推荐给所述待推荐用户帐号。

根据本申请的另一方面，提供了一种特征提取网络的训练装置，所述装置包括：

获取模块，用于获取曝光推荐信息以及第一历史行为信息，所述曝光推荐信息是推荐给样本用户帐号集合中的样本用户帐号的推荐信息，所述第一历史行为信息用于反映所述样本用户帐号与所述曝光推荐信息产生过第一交互行为；

所述获取模块，还用于获取历史推荐信息序列，所述历史推荐信息序列包括在所述曝光推荐信息之前，推荐给所述样本用户帐号的历史推荐信息；

所述获取模块，还用于根据所述历史推荐信息序列获取第二历史行为信息序列，所述第二历史行为信息序列包括第二历史行为信息，所述第二历史行为信息用于反映所述样本用户帐号与所述历史推荐信息产生过第二交互行为；

训练模块，用于通过所述曝光推荐信息、所述第一历史行为信息、所述历史推荐信息序列以及所述第二历史行为信息序列训练特征提取网络，所述特征提取网络用于提取所述曝光推荐信息以及所述历史推荐信息的语义向量。

在一个可选的设计中，所述特征提取网络是机器学习模型中的子网络，所述机器学习模型还包括与所述特征提取网络级联的行为预测网络；所述训练模块，用于：

通过所述特征提取网络提取所述曝光推荐信息的第一语义向量，以及所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量；

将所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量，与所述历史推荐信息对应的第二历史行为信息的特征进行融合，得到所述历史推荐信息对应的融合特征；

基于所述第一语义向量以及所述历史推荐信息序列中每个所述历史推荐信息对应的融合特征，通过所述行为预测网络预测所述曝光推荐信息的预测行为信息；

根据所述第一历史行为信息与所述预测行为信息之间的差异，训练所述机器学习模型。

在一个可选的设计中，所述机器学习模型还包括行为编码网络，所述行为编码网络与所述特征提取网络和所述行为预测网络级联；所述训练模块，用于：

通过所述行为编码网络处理所述第二历史行为信息序列中每个所述第二历史行为信息，得到所述第二历史行为信息对应的历史行为编码向量；

将所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量，与所述历史推荐信息对应的第二历史行为信息的历史行为编码向量进行融合，得到所述融合特征。

在一个可选的设计中，所述机器学习模型还包括行为融合网络，所述行为融合网络与所述行为预测网络、所述行为编码网络以及所述特征提取网络级联；所述训练模块，用于

通过所述行为融合网络，将所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量，与所述历史推荐信息对应的第二历史行为信息的历史行为编码向量进行融合，得到所述融合特征。

在一个可选的设计中，所述曝光推荐信息以及所述历史推荐信息的内容为图文组合，所述图文组合是由图片和标题构成的文档，所述标题用于描述所述图片。

在一个可选的设计中，所述获取模块，用于：

获取浏览信息序列和交互信息序列中的至少一种；

其中，所述浏览信息序列是由在所述曝光推荐信息的推荐时刻之前，向所述样本用户帐号推荐的浏览推荐信息组成的，所述交互信息序列是由在所述曝光推荐信息的推荐时刻之前，与所述样本用户帐号产生过第三交互行为的交互推荐信息组成的。

在一个可选的设计中，所述交互推荐信息，包括被点击推荐信息、被点赞推荐信息、被分享推荐信息、被收藏推荐信息以及被评论推荐信息中的至少一种。

根据本申请的另一方面，提供了一种信息推荐装置，所述装置运行有特征提取网络，所述特征提取网络是如上方面所述的特征提取网络的训练装置训练得到的网络，所述装置包括：

确定模块，用于确定待推荐用户帐号对应的参考待推荐信息，所述参考待推荐信息包括与所述待推荐用户帐号产生过交互行为的待推荐信息，以及与所述待推荐用户帐号的特征匹配的用户帐号产生过交互行为的待推荐信息中的至少一种；

提取模块，用于通过所述特征提取网络提取所述参考待推荐信息的第三语义向量；

获取模块，用于获取多个候选待推荐信息的第四语义向量，所述第四语义向量是通过所述特征提取网络对所述候选待推荐信息提取得到的；

所述确定模块，还用于在所述多个候选待推荐信息的第四语义向量中，确定与所述第三语义向量匹配的目标第四语义向量，并将所述目标第四语义向量对应的候选待推荐信息确定为推荐信息，所述推荐信息用于推荐给所述待推荐用户帐号。

在一个可选的设计中，所述参考待推荐信息以及所述候选待推荐信息的内容为图文组合，所述图文组合是由图片和标题构成的文档，所述标题用于描述所述图片。

根据本申请的另一方面，提供了一种计算机设备，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上方面所述的特征提取网络的训练方法或信息推荐方法。

根据本申请的另一方面，提供了一种计算机可读存储介质，所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上方面所述的特征提取网络的训练方法或信息推荐方法。

根据本申请的另一方面，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方面的各种可选实现方式中提供的特征提取网络的训练方法或信息推荐方法。

本申请提供的技术方案带来的有益效果至少包括：

通过训练得到的特征提取网络能够实现提取信息的语义向量，从而能够实现基于语义向量的匹配结果向用户推荐感兴趣的信息。在训练特征提取网络的过程中，使用的训练数据是在实际应用场景中的数据，因此能够提升提取的语义向量的准确度，从而提升向用户推荐信息时的准确度，也即是能够提升向用户推荐图文组合时的准确度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一个示例性实施例提供的训练机器学习模型的过程的示意图；

图2是本申请一个示例性实施例提供的特征提取网络的训练方法的流程示意图；

图3是本申请另一个示例性实施例提供的特征提取网络的训练方法的流程示意图；

图4是本申请一个示例性实施例提供的信息推荐方法的流程示意图；

图5是本申请一个示例性实施例提供的推荐的图文组合的示意图；

图6是本申请一个示例性实施例提供的特征提取网络的训练装置的结构示意图；

图7是本申请一个示例性实施例提供的信息推荐装置的结构示意图；

图8是本申请一个示例性实施例提供的计算机设备的结构示意图。

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

首先，对本申请实施例中涉及的名词进行介绍：

图文组合：图文组合是由图片和标题构成的文档，其中标题用于描述图片。例如，图文组合是由一张动物的图片和用于描述这张动物的图片的标题构成。

曝光图文组合：曝光图文组合是已经推荐给用户帐号的图文组合。例如是在用户帐号登录的客户端中显示过的图文组合。

浏览图文组合：浏览图文组合是指在曝光图文组合推荐给用户帐号的推荐时刻之前，该用户帐号浏览过的图文组合。例如是在推荐时刻之前，该用户帐号登录的客户端中显示过的图文组合。

交互图文组合：交互图文组合是指在曝光图文组合推荐给用户帐号的推荐时刻之前，与该用户帐号存在交互行为的图文组合。交互行为包括点击、点赞、分享、收藏和评论中的至少一种。例如是在推荐时刻之前，该用户帐号在其登录的客户端中点赞过的图文组合。

曝光历史行为信息：曝光历史行为信息用于反映用户帐号与曝光图文组合产生过交互行为。曝光历史行为信息是在接收到曝光图文组合的用户帐号与曝光图文组合产生交互行为的情况下产生的。例如曝光历史行为信息能够反映用户帐号与曝光图文组合之间存在哪些交互行为以及产生交互行为的时间。

浏览历史行为信息：浏览历史行为信息用于反映用户帐号与浏览图文组合产生过交互行为。浏览历史行为信息是在浏览过浏览图文组合的用户帐号与浏览图文组合产生交互行为的情况下产生的。例如浏览历史行为信息能够反映用户帐号与浏览图文组合之间存在哪些交互行为以及产生交互行为的时间。

交互历史行为信息：交互历史行为信息用于反映用户帐号交互图文组合产生过交互行为。例如交互历史行为信息能够反映用户帐号与交互图文组合之间存在哪些交互行为以及产生交互行为的时间。

候选图文组合：候选图文组合是用于推荐给用户帐号的图文组合。

图1是本申请一个示例性实施例提供的训练机器学习模型的过程的示意图。如图1所示，机器学习模型包括特征提取网络101、行为编码网络102、行为融合网络103以及行为预测网络104。

在训练机器学习模型时，计算机设备会获取曝光图文组合105、浏览图文组合序列106、交互图文组合序列107、曝光图文组合105对应的曝光历史行为信息、浏览图文组合序列106对应的浏览历史行为信息108以及交互图文组合序列107对应的交互历史行为信息109。其中，曝光图文组合105是被推荐给样本用户帐号集合中的样本用户帐号的图文组合。浏览图文组合序列106是由曝光图文组合105的推荐时刻之前，样本用户帐号浏览过的图文组合构成的。交互图文组合序列107是由曝光图文组合105的推荐时刻之前，与样本用户帐号存在交互行为的图文组合构成的。浏览历史行为信息用于反映样本用户帐号与曝光图文组合105产生过交互行为。浏览历史行为信息108用于反映样本用户帐号与浏览图文组合序列106中的图文组合产生过交互行为。交互历史行为信息109用于反映样本用户帐号与交互图文组合序列107中的图文组合产生过交互行为。

在获取到上述训练数据后，计算机设备通过特征提取网络101提取曝光图文组合105的曝光图文语义向量110，以及通过特征提取网络101提取浏览图文组合序列106中的图文组合的浏览图文语义向量111，以及通过特征提取网络101提取交互图文组合序列107中的图文组合的交互图文语义向量112。并且，计算机设备还会通过行为编码网络102处理浏览历史行为信息108，得到浏览图文行为编码向量113，以及通过行为编码网络102处理交互历史行为信息109，得到交互图文行为编码向量114。之后计算机设备通过行为融合网络103将浏览图文语义向量111和对应的浏览图文行为编码向量113进行特征融合，得到浏览图文融合向量115，以及通过行为融合网络103将交互图文语义向量112和对应的交互图文行为编码向量114进行特征融合，得到交互图文融合向量116。从而使得每个图文组合的语义向量叠加上与该图文组合对应的交互行为的行为信息。之后计算机设备基于曝光图文语义向量110、浏览图文融合向量115以及交互图文融合向量116，通过行为预测网络预测曝光图文组合105的预测行为信息117，并根据预测行为信息117与曝光图文组合105的曝光历史行为信息之间的差异训练机器学习模型。该机器学习模型能够根据用户帐号在浏览某一个图文组合之前浏览或交互过的图文组合，以及与该浏览或交互过的图文组合的交互行为产生的历史行为信息，来预测该用户帐号与该某一个图文组合可能产生的交互行为。

通过上述完成训练的机器学习模型的特征提取网络101，计算机设备能够提取候选图文组合的语义向量，并将候选图文组合的语义向量与待推荐用户帐号感兴趣的图文组合的语义向量进行匹配，从而在候选图文组合中确定出用于向待推荐用户帐号进行推荐的推荐图文组合。其中，待推荐用户帐号感兴趣的图文组合，包括与待推荐用户帐号产生过交互行为的图文组合，以及与待推荐用户帐号的特征匹配(相似)的用户帐号产生过交互行为的图文组合。

通过特征提取网络提取候选图文组合的语义向量以及用户过去感兴趣的图文组合的语义向量，能够实现基于语义向量的匹配结果在候选图文组合中确定出推荐图文组合，从而实现向用户推荐感兴趣的图文组合。在训练特征提取网络的过程中，使用的训练数据是在实际应用场景中的数据，因此能够提升提取的图文组合的语义向量的准确度，从而提升推荐图文组合的准确度。

另外，在训练机器学习模型的过程中，无需人工进行样本标注(若直接使用实际应用场景中的数据通常需要人工进行样本标注)，而是基于对已有的数据的处理结果训练机器学习模型，因此能够提升推荐图文组合的效率。

另外，用于提取图文组合的语义向量的机器学习模型，能够学习到用户在浏览的某一个图文组合的特征，以及用户在该某一个图文组合之前浏览或交互过的图文组合的特征，以及该浏览或交互过的图文组合的的历史行为信息的特征，与该某一个图文组合与用户产生的交互行为之间的关系，因此该机器学习模型能够提取出图文组合中与用户的行为(兴趣)相关的特征，有助于提升后续推荐图文组合时的准确度。

图2是本申请一个示例性实施例提供的特征提取网络的训练方法的流程示意图。该方法可以用于计算机设备。如图2所示，该方法包括：

步骤202：获取曝光推荐信息以及第一历史行为信息。

该曝光推荐信息是推荐给样本用户帐号集合中的样本用户帐号的推荐信息。该样本用户帐号集合是由接收到该曝光推荐信息的样本用户帐号组成的。该曝光推荐信息以及第一历史行为信息是在实际应用场景下产生的信息。示例地，曝光推荐信息是计算机设备对应的，样本用户帐号登录的客户端中显示过的信息。

该客户端与计算机设备对应，该客户端具有向用户推荐信息的功能，例如该客户端能够为本地生活服务客户端。计算机设备能够为服务器，该服务器为一台服务器，或者由若干台服务器组成的服务器集群，或者是一个云计算服务中心中的虚拟服务器等。

可选地，该曝光推荐信息的内容为图文组合，图文组合是由图片和标题构成的文档，其中标题用于描述图片。例如图文组合是由一张猫的图片和标题“这只猫真可爱”构成。

第一历史行为信息用于反映样本用户帐号与曝光推荐信息产生过第一交互行为。该第一交互行为包括点击、点赞、分享、收藏和评论中的至少一种。即该第一历史行为信息能够反映曝光推荐信息是否被点击、是否被点赞、是否被分享、是否被收藏和是否被评论中的至少一种。

步骤204：获取历史推荐信息序列。

该历史推荐信息序列包括在曝光推荐信息之前，推荐给样本用户帐号的历史推荐信息。在历史推荐信息序列中，历史推荐信息按照向样本用户帐号进行推荐的推荐时刻排序。该历史推荐信息是在实际应用场景下产生的信息。可选地，该历史推荐信息的内容为图文组合，图文组合是由图片和标题构成的文档，其中标题用于描述图片。

可选地，历史推荐信息序列包括浏览信息序列和交互信息序列中的至少一种。其中，浏览信息序列是由在曝光推荐信息的推荐时刻之前，向样本用户帐号推荐的浏览推荐信息组成的，交互信息序列是由在曝光推荐信息的推荐时刻之前，与样本用户帐号产生过第三交互行为的交互推荐信息组成的。该第三交互行为包括点击、点赞、分享、收藏和评论中的至少一种。

根据不同的第三交互行为，计算机设备还能够对交互信息序列进行进一步的划分。例如将存在点击行为的交互推荐信息，划分为点击信息序列。将存在点赞、分享和评论行为的交互推荐信息，划分为其他交互信息序列。需要说明的是，浏览信息序列中的信息与交互信息序列中的信息存在重合。并且，对于交互信息序列中的划分出的各序列来说，各序列中的中的信息之间也会存在重合。

可选地，计算机设备在获取历史推荐信息序列的过程中，会使用时段限制或数量限制中的至少一种来确定历史推荐信息。其中，时段限制指计算机设备基于曝光推荐信息的推荐时刻之前的历史时段内的历史推荐信息，确定历史推荐信息序列。数量限制指计算机设备基于曝光推荐信息的推荐时刻之前的数量小于数量阈值的历史推荐信息，确定历史推荐信息序列。例如，计算机设备在11：00向样本用户帐号推荐曝光推荐信息，在获取历史推荐序列时，计算机设备只获取9:00-11:00之间推荐给样本用户帐号的历史推荐信息，得到历史推荐信息序列。

步骤206：根据历史推荐信息序列获取第二历史行为信息序列。

该第二历史行为信息序列包括第二历史行为信息，第二历史行为信息用于反映样本用户帐号与历史推荐信息产生过第二交互行为。即该第二历史行为信息是基于样本用户帐号与历史推荐信息之间的交互行为产生的。该第二历史行为信息是在实际应用场景下产生的信息。可选地，该第二交互行为包括点击、点赞、分享、收藏和评论中的至少一种。

步骤208：通过曝光推荐信息、第一历史行为信息、历史推荐信息序列以及第二历史行为信息序列训练特征提取网络。

该特征提取网络用于提取曝光推荐信息以及历史推荐信息的语义向量。通过该特征提取网络，能够实现提取用户帐号过去感兴趣的参考推荐信息的语义向量，以及候选推荐信息的语义向量。通过将用户帐号过去感兴趣的参考推荐信息的语义向量与候选推荐信息的语义向量进行匹配，能够在候选推荐信息中确定出推荐信息，并推荐给用户帐号。

可选地，该特征提取网络能够为基于变形的双向编码器图像表征模型(ImageBidirectional Encoder Representations from Transformers，ImageBERT)。该特征提取网络属于机器学习模型。计算机设备基于曝光推荐信息、历史推荐信息序列以及第二历史行为信息，通过该机器学习模型能够预测曝光推荐信息的预测行为信息。该预测行为信息用于反映样本用户帐号与曝光推荐信息可能产生哪些交互行为。之后根据预测行为信息与第一历史行为信息之间的差异，能够实现训练机器学习模型。其中，特征提取网络在机器学习模型中的作用为提取曝光推荐信息以及历史推荐信息的语义向量，作为后续预测预测行为信息时的输入。

综上所述，本实施例提供的方法，通过训练得到的特征提取网络能够实现提取信息的语义向量，从而能够实现基于语义向量的匹配结果向用户推荐感兴趣的信息。在训练特征提取网络的过程中，使用的训练数据是在实际应用场景中的数据，因此能够提升提取的语义向量的准确度，从而提升向用户推荐信息时的准确度，也即是能够提升向用户推荐图文组合时的准确度。

图3是本申请另一个示例性实施例提供的特征提取网络的训练方法的流程示意图。该方法可以用于计算机设备。如图3所示，该方法包括：

步骤302：获取曝光推荐信息以及第一历史行为信息。

该曝光推荐信息是推荐给样本用户帐号集合中的样本用户帐号的推荐信息。第一历史行为信息用于反映样本用户帐号与曝光推荐信息产生过第一交互行为。可选地，该第一交互行为包括点击、点赞、分享、收藏和评论中的至少一种。该曝光推荐信息以及第一历史行为信息是在实际应用场景下产生的信息。

步骤304：获取历史推荐信息序列。

历史推荐信息序列包括在曝光推荐信息之前，推荐给样本用户帐号的历史推荐信息。在历史推荐信息序列中，历史推荐信息按照向样本用户帐号进行推荐的推荐时刻排序。该历史推荐信息是在实际应用场景下产生的信息。

可选地，计算机设备获取历史推荐信息序列，包括获取浏览信息序列和交互信息序列中的至少一种。其中，浏览信息序列是由在曝光推荐信息的推荐时刻之前，向样本用户帐号推荐的浏览推荐信息组成的。交互信息序列是由在曝光推荐信息的推荐时刻之前，与样本用户帐号产生过第三交互行为的交互推荐信息组成的。

该第三交互行为包括点击、点赞、分享、收藏和评论中的至少一种。即交互推荐信息，包括被点击推荐信息、被点赞推荐信息、被分享推荐信息、被收藏推荐信息以及被评论推荐信息中的至少一种。

根据不同的第三交互行为，计算机设备还能够对交互信息序列进行进一步的划分。例如将存在点击行为的交互推荐信息，划分为点击信息序列。将存在点赞、分享和评论行为的交互推荐信息，划分为其他交互信息序列。

需要说明的是，上述曝光推荐信息以及历史推荐信息的内容能够为图文组合。图文组合是由图片和标题构成的文档，标题用于描述图片。

步骤306：根据历史推荐信息序列获取第二历史行为信息序列。

步骤308：通过特征提取网络提取曝光推荐信息的第一语义向量，以及历史推荐信息序列中每个历史推荐信息的第二语义向量。

该第一语义向量用于反映曝光推荐信息的特征。当曝光推荐信息的内容为图文组合时，该第一语义向量能够同时反映曝光推荐信息中的标题与图片的特征。该第二语义向量用于反映历史推荐信息的特征。当历史推荐信息的内容为图文组合时，该第二语义向量能够同时反映历史推荐信息中的标题与图片的特征。

需要说明的是，相同的图片和不同的标题组合会产生不同的特征，不同的图片和相同的标题组合也会产生不同的特征。

该特征提取网络基于神经网络(Neural Networks，NN)，能够实现多模态的计算曝光推荐信息的第一语义向量以及历史推荐信息序列中的每个历史推荐信息的第二语义向量。在曝光推荐信息和历史推荐信息的内容为图文组合的情况下，特征提取网络会分别提取图文组合中图片的特征，以及标题的特征之后再进行融合。可选地，该特征提取网络能够为ImageBERT。

步骤310：将历史推荐信息序列中每个历史推荐信息的第二语义向量，与历史推荐信息对应的第二历史行为信息的特征进行融合，得到历史推荐信息对应的融合特征。

在进行第二语义向量与第二历史行为信息的特征融合的过程中，计算机设备会将对应同一个历史推荐信息的第二语义向量与第二历史行为信息的特征进行融合。通过将第二语义向量与第二历史行为信息的特征进行融合，计算机设备能够使历史推荐信息序列中的每个历史推荐信息对应一个附加了第二历史行为信息的特征的第二语义向量。

可选地，计算机设备通过行为编码网络处理第二历史行为信息序列中每个第二历史行为信息，能够得到第二历史行为信息对应的历史行为编码向量。在进行融合的过程中，计算机设备会将历史推荐信息序列中每个历史推荐信息的第二语义向量，与历史推荐信息对应的第二历史行为信息的历史行为编码向量进行融合，从而得到融合特征。其中，历史行为编码向量能够反映样本用户帐号是否点击、点赞、分享、收藏和评论过历史推荐信息，还能够反映具体的交互时间。

可选地，计算机设备通过行为融合网络，能够实现将历史推荐信息序列中每个历史推荐信息的第二语义向量，与历史推荐信息对应的第二历史行为信息的历史行为编码向量进行融合，从而得到融合特征。

在通过行为融合网络进行融合的过程中，计算机设备会将第二语义向量与第二历史行为信息的特征进行融合计算，该融合计算的方式包括相加、相乘、使用神经网络融合等。使用神经网络融合即神经网络的输入为第二语义向量与第二历史行为信息的特征，输出为融合特征。

步骤312：基于第一语义向量以及历史推荐信息序列中每个历史推荐信息对应的融合特征，通过行为预测网络预测曝光推荐信息的预测行为信息。

该预测行为信息用于反映样本用户帐号与曝光推荐信息可能产生哪些交互行为。该行为预测网络，能够根据向用户帐号推荐的某一曝光推荐信息的特征，以及推荐该某一曝光推荐信息之前，向用户帐号推荐的历史推荐信息的特征，以及历史推荐信息对应的交互行为，来预测用户帐号与该某一曝光推荐信息可能产生哪些交互行为。

通过该行为预测网络，计算机设备能够基于行为融合网络的输出和曝光推荐信息的第一语义向量，预测样本用户帐号与曝光推荐信息之间可能出现哪些交互行为。例如样本用户帐号是否会点击、点赞、分享和评论曝光推荐信息等。

可选地，计算机设备通过行为预测网络，能够基于注意力机制根据融合特征以及第一语义向量通过神经网络预测该预测行为信息。或者，计算机设备能够将融合特征进行池化(pooling)，之后与第一语义向量进行点乘，再基于输出的结果通过神经网络预测该预测行为信息。或者，计算机设备能够直接将融合特征以及第一语义向量连接并输入神经网络，从而预测该预测行为信息。

步骤314：根据第一历史行为信息与预测行为信息之间的差异，训练机器学习模型。

上述特征提取网络、行为预测网络、行为编码网络以及行为融合网络均为机器学习模型的子网络。其中，特征提取网络、行为预测网络、行为编码网络以及行为融合网络之间级联。训练机器学习模型，即训练上述特征提取网络、行为预测网络、行为编码网络以及行为融合网络。

在训练机器学习模型的过程中，计算机设备根据第一历史行为信息与预测行为信息之间的差异，能够确定误差损失。之后通过该误差损失基于反向传播能够实现训练该机器学习模型。示例地，该机器学习模型中的特征提取网络、行为预测网络、行为编码网络以及行为融合网络的结构可参照图1中的示例。

通过机器学习模型中的特征提取网络，能够实现提取用户帐号过去感兴趣的参考推荐信息的语义向量，以及候选推荐信息的语义向量。通过将用户帐号过去感兴趣的参考推荐信息的语义向量与候选推荐信息的语义向量进行匹配，能够在候选推荐信息中确定出推荐信息，并推荐给用户帐号。

另外，在训练机器学习模型的过程中，无需人工进行样本标注，而是基于对已有的数据的处理结果训练机器学习模型，因此能够提升训练特征提取网络的以及推荐信息的效率。用于提取信息的语义向量的机器学习模型，能够学习到用户在浏览的某一个信息的特征，以及用户在该某一个信息之前浏览或交互过的信息的特征，以及该浏览或交互过的信息的历史行为信息的特征，与该某一个信息与用户产生的交互行为之间的关系，因此该机器学习模型能够提取出信息中与用户的行为相关的特征，有助于提升后续推荐信息时的准确度。通过提取历史行为编码向量，并将历史行为编码向量与第二语义向量进行融合，能够使第二语义向量附加对应的第二历史行为信息的特征，从而提升预测预测行为信息时的准确度。

图4是本申请一个示例性实施例提供的信息推荐方法的流程示意图。该方法可以用于计算机设备。如图4所示，该方法包括：

步骤402：确定待推荐用户帐号对应的参考待推荐信息。

该参考待推荐信息是待推荐用户帐号感兴趣的信息，包括与待推荐用户帐号产生过交互行为的任一待推荐信息，以及与待推荐用户帐号的特征匹配的用户帐号产生过交互行为的待推荐信息中的至少一种。

上述交互行为包括点击、点赞、分享、收藏和评论中的至少一种。与待推荐用户帐号的特征匹配的用户帐号，包括行为特征与待推荐用户帐号相似的用户帐号，以及属性特征与待推荐用户帐号相似的用户帐号。例如待推荐用户帐号近一周点赞的信息中，有80％的信息也被另一用户帐号点赞，则计算机设备会确定该两个用户帐号特征匹配。

步骤404：通过特征提取网络提取参考待推荐信息的第三语义向量。

该第三语义向量能够反映参考推荐信息的特征。该特征提取提取网络是通过上述步骤302至步骤314提供的特征提取网络的训练方法训练得到的。

步骤406：获取多个候选待推荐信息的第四语义向量。

该第四语义向量是通过特征提取网络对候选待推荐信息提取得到的。可选地，参考待推荐信息以及候选待推荐信息的内容为图文组合，图文组合是由图片和标题构成的文档，标题用于描述图片。

该候选待推荐信息是计算机设备中存储的用于向待推荐用户帐号进行推荐的信息，该候选待推荐信息会随时间产生变化。因此，计算机设备会定期通过特征提取网络对候选待推荐信息进行特征提取，从而得到第四语义向量。计算机设备能够在提取第三语义向量之前，提取该第四语义向量，并在需要进行信息推荐时，获取该第四语义向量。

步骤408：在多个候选待推荐信息的第四语义向量中，确定与第三语义向量匹配的目标第四语义向量，并将目标第四语义向量对应的候选待推荐信息确定为推荐信息。

该推荐信息用于推荐给待推荐用户帐号。计算机设备会向待推荐用户帐号发送该推荐信息。可选地，计算机设备通过计算第三语义向量与第四语义向量之间的相似度(或距离)，能够确定出该目标第四语义向量。

参考待推荐信息的第三语义向量与候选待推荐信息的第四语义向量匹配，该参考待推荐信息是待推荐用户帐号过去感兴趣的信息，因此该候选待推荐信息也为用户感兴趣的信息。根据特征提取网络提取的语义向量能够实现向用户推荐感兴趣的信息。

在一个具体的例子中，图5是本申请一个示例性实施例提供的推荐的图文组合的示意图。如图5所示，在待推荐用户帐号登录的客户端需要显示信息推荐界面501时，客户端会向服务器发送信息推荐请求。服务器根据信息推荐请求，会获取待推荐用户帐号过去交互过的参考图文组合502。该参考图文组合502的内容由猫的图片以及对图片的描述构成。之后服务器会提取参考图文组合502的语义向量，并与候选图文组合的语义向量进行匹配。从而确定出推荐图文组合503，并发送至客户端。推荐图文组合的内容由宠物的图片与对图片的描述构成，具有相似的语义。客户端会在信息推荐界面501中显示推荐图文组合503。

综上所述，本实施例提供的方法，通过特征提取网络提取参考待推荐信息的第三语义向量以及候选待推荐信息的第四语义向量，能够实现基于第三语义向量和第四语义向量的匹配结果在候选待推荐信息中确定出推荐信息，从而实现向用户推荐感兴趣的信息。在训练特征提取网络的过程中，使用的训练数据是在实际应用场景中的数据，因此能够提升提取的信息的语义向量的准确度，从而提升推荐信息的准确度，也即是能够提升向用户推荐图文组合时的准确度。

需要说明的是，本申请实施例提供的方法步骤的先后顺序可以进行适当调整，步骤也可以根据情况进行相应增减，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化的方法，都应涵盖在本申请的保护范围之内，因此不再赘述。

在一个具体的例子中，上述客户端为本地生活客户端，能够实现向用户推荐感兴趣的美食、休闲、旅游和美容等方面的图文组合。

在模型训练阶段，服务器会确定已经向用户推荐过的美食、休闲、旅游和美容等方面图文组合，以及推荐这些图文组合之前用户浏览或交互过的图文组合，以及用户与上述图文组合之间产生的历史交互行为信息，来训练特征提取网络。并且，服务器还会定期更新上述信息，并使用更新的信息继续训练特征提取网络。

在推荐阶段，当本地生活客户端需要显示具有向用户进行图文组合推荐功能的用户界面，或本地生活客户端开始运行时，本地生活客户端会向服务器发送推荐请求。服务器根据推荐请求中的用户标识，确定用户过去在美食、休闲、旅游和美容等方面感兴趣(用户交互过的或与用户匹配的用户交互过的)的图文组合，并使用训练得到的特征提取网络提取用户过去感兴趣的图文组合的语义向量。之后将提取得到的语义向量与预先提取的待推荐图文组合的语义向量进行匹配，从而得到美食、休闲、旅游和美容等方面的匹配图文组合，之后发送至客户端进行显示，实现向用户推荐感兴趣的图文组合。上述提取用户过去感兴趣的图文组合的语义向量的过程，也可以是在处理推荐请求之前预先进行的。

图6是本申请一个示例性实施例提供的特征提取网络的训练装置的结构示意图。该装置可以用于计算机设备。如图6所示，该装置60包括：

获取模块601，用于获取曝光推荐信息以及第一历史行为信息，曝光推荐信息是推荐给样本用户帐号集合中的样本用户帐号的推荐信息，第一历史行为信息用于反映样本用户帐号与曝光推荐信息产生过第一交互行为。

获取模块601，还用于获取历史推荐信息序列，历史推荐信息序列包括在曝光推荐信息之前，推荐给样本用户帐号的历史推荐信息。

获取模块601，还用于根据历史推荐信息序列获取第二历史行为信息序列，第二历史行为信息序列包括第二历史行为信息，第二历史行为信息用于反映样本用户帐号与历史推荐信息产生过第二交互行为。

训练模块602，用于通过曝光推荐信息、第一历史行为信息、历史推荐信息序列以及第二历史行为信息序列训练特征提取网络，特征提取网络用于提取曝光推荐信息以及历史推荐信息的语义向量。

在一个可选的设计中，特征提取网络是机器学习模型中的子网络，机器学习模型还包括与特征提取网络级联的行为预测网络。训练模块602，用于：

通过特征提取网络提取曝光推荐信息的第一语义向量，以及历史推荐信息序列中每个历史推荐信息的第二语义向量。

将历史推荐信息序列中每个历史推荐信息的第二语义向量，与历史推荐信息对应的第二历史行为信息的特征进行融合，得到历史推荐信息对应的融合特征。

基于第一语义向量以及历史推荐信息序列中每个历史推荐信息对应的融合特征，通过行为预测网络预测曝光推荐信息的预测行为信息。

根据第一历史行为信息与预测行为信息之间的差异，训练机器学习模型。

在一个可选的设计中，机器学习模型还包括行为编码网络，行为编码网络与特征提取网络和行为预测网络级联。训练模块602，用于：

通过行为编码网络处理第二历史行为信息序列中每个第二历史行为信息，得到第二历史行为信息对应的历史行为编码向量。

将历史推荐信息序列中每个历史推荐信息的第二语义向量，与历史推荐信息对应的第二历史行为信息的历史行为编码向量进行融合，得到融合特征。

在一个可选的设计中，机器学习模型还包括行为融合网络，行为融合网络与行为预测网络、行为编码网络以及特征提取网络级联。训练模块602，用于

通过行为融合网络，将历史推荐信息序列中每个历史推荐信息的第二语义向量，与历史推荐信息对应的第二历史行为信息的历史行为编码向量进行融合，得到融合特征。

在一个可选的设计中，曝光推荐信息以及历史推荐信息的内容为图文组合，图文组合是由图片和标题构成的文档，标题用于描述图片。

在一个可选的设计中，获取模块601，用于：

获取浏览信息序列和交互信息序列中的至少一种。其中，浏览信息序列是由在曝光推荐信息的推荐时刻之前，向样本用户帐号推荐的浏览推荐信息组成的，交互信息序列是由在曝光推荐信息的推荐时刻之前，与样本用户帐号产生过第三交互行为的交互推荐信息组成的。

在一个可选的设计中，交互推荐信息，包括被点击推荐信息、被点赞推荐信息、被分享推荐信息、被收藏推荐信息以及被评论推荐信息中的至少一种。

图7是本申请一个示例性实施例提供的信息推荐装置的结构示意图。该装置可以用于计算机设备。如图7所示，该装置70包括：

确定模块701，用于确定待推荐用户帐号对应的参考待推荐信息，参考待推荐信息包括与待推荐用户帐号产生过交互行为的待推荐信息，以及与待推荐用户帐号的特征匹配的用户帐号产生过交互行为的待推荐信息中的至少一种。

提取模块702，用于通过特征提取网络提取参考待推荐信息的第三语义向量。

获取模块703，用于获取多个候选待推荐信息的第四语义向量，第四语义向量是通过特征提取网络对候选待推荐信息提取得到的。

确定模块701，还用于在多个候选待推荐信息的第四语义向量中，确定与第三语义向量匹配的目标第四语义向量，并将目标第四语义向量对应的候选待推荐信息确定为推荐信息，推荐信息用于推荐给待推荐用户帐号。

在一个可选的设计中，参考待推荐信息以及候选待推荐信息的内容为图文组合，图文组合是由图片和标题构成的文档，标题用于描述图片。

需要说明的是：上述实施例提供的特征提取网络的训练装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的特征提取网络的训练装置与特征提取网络的训练方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

同理，上述实施例提供的信息推荐装置，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的信息推荐装置与信息推荐方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

本申请的实施例还提供了一种计算机设备，该计算机设备包括：处理器和存储器，存储器中存储有至少一条指令、至少一段程序、代码集或指令集，至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的特征提取网络的训练方法或信息推荐方法。

可选地，该计算机设备为服务器。示例地，图8是本申请一个示例性实施例提供的计算机设备的结构示意图。

所述计算机设备800包括中央处理单元(Central Processing Unit，CPU)801、包括随机存取存储器(Random Access Memory，RAM)802和只读存储器(Read-Only Memory，ROM)803的***存储器804，以及连接***存储器804和中央处理单元801的***总线805。所述计算机设备800还包括帮助计算机设备内的各个器件之间传输信息的基本输入/输出***(Input/Output***，I/O***)806，和用于存储操作***813、应用程序814和其他程序模块815的大容量存储设备807。

所述基本输入/输出***806包括有用于显示信息的显示器808和用于用户输入信息的诸如鼠标、键盘之类的输入设备809。其中所述显示器808和输入设备809都通过连接到***总线805的输入输出控制器810连接到中央处理单元801。所述基本输入/输出***806还可以包括输入输出控制器810以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地，输入输出控制器810还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备807通过连接到***总线805的大容量存储控制器(未示出)连接到中央处理单元801。所述大容量存储设备807及其相关联的计算机可读存储介质为计算机设备800提供非易失性存储。也就是说，所述大容量存储设备807可以包括诸如硬盘或者只读光盘(Compact Disc Read-Only Memory，CD-ROM)驱动器之类的计算机可读存储介质(未示出)。

不失一般性，所述计算机可读存储介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读存储指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、可擦除可编程只读寄存器(Erasable Programmable Read OnlyMemory，EPROM)、电子抹除式可复写只读存储器(Electrically-Erasable ProgrammableRead-Only Memory，EEPROM)、闪存或其他固态存储设备，CD-ROM、数字多功能光盘(DigitalVersatile Disc，DVD)或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然，本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的***存储器804和大容量存储设备807可以统称为存储器。

存储器存储有一个或多个程序，一个或多个程序被配置成由一个或多个中央处理单元801执行，一个或多个程序包含用于实现上述方法实施例的指令，中央处理单元801执行该一个或多个程序实现上述各个方法实施例提供的方法。

根据本申请的各种实施例，所述计算机设备800还可以通过诸如因特网等网络连接到网络上的远程计算机设备运行。也即计算机设备800可以通过连接在所述***总线805上的网络接口单元811连接到网络812，或者说，也可以使用网络接口单元811来连接到其他类型的网络或远程计算机设备***(未示出)。

所述存储器还包括一个或者一个以上的程序，所述一个或者一个以上程序存储于存储器中，所述一个或者一个以上程序包含用于进行本申请实施例提供的方法中由计算机设备所执行的步骤。

本申请实施例中还提供了一种计算机可读存储介质，该可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，当该至少一条指令、至少一段程序、代码集或指令集由计算机设备的处理器加载并执行时，实现上述各方法实施例提供的特征提取网络的训练方法或信息推荐方法。

本申请还提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各方法实施例提供的特征提取网络的训练方法或信息推荐方法。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，上述提到的可读存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同切换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种特征提取网络的训练方法，其特征在于，所述方法包括：

根据时段限制和数量限制中的至少一种，获取历史推荐信息序列，所述历史推荐信息序列包括在所述曝光推荐信息之前，推荐给所述样本用户帐号的历史推荐信息；

基于所述第一语义向量以及所述历史推荐信息序列中每个所述历史推荐信息对应的融合特征，通过行为预测网络预测所述曝光推荐信息的预测行为信息；

根据所述第一历史行为信息与所述预测行为信息之间的差异，训练机器学习模型，所述特征提取网络是所述机器学习模型中的子网络，所述机器学习模型还包括与所述特征提取网络级联的所述行为预测网络。

2.根据权利要求1所述的方法，其特征在于，所述机器学习模型还包括行为编码网络，所述行为编码网络与所述特征提取网络和所述行为预测网络级联；

所述将所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量，与所述历史推荐信息对应的第二历史行为信息的特征进行融合，得到所述历史推荐信息对应的融合特征，包括：

3.根据权利要求2所述的方法，其特征在于，所述机器学习模型还包括行为融合网络，所述行为融合网络与所述行为预测网络、所述行为编码网络以及所述特征提取网络级联；

所述将所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量，与所述历史推荐信息对应的第二历史行为信息的历史行为编码向量进行融合，得到所述融合特征，包括：

4.根据权利要求1至3任一所述的方法，其特征在于，

所述曝光推荐信息以及所述历史推荐信息的内容为图文组合，所述图文组合是由图片和标题构成的文档，所述标题用于描述所述图片。

5.根据权利要求1至3任一所述的方法，其特征在于，所述获取历史推荐信息序列，包括：

获取浏览信息序列和交互信息序列中的至少一种；

6.根据权利要求5所述的方法，其特征在于，所述交互推荐信息，包括被点击推荐信息、被点赞推荐信息、被分享推荐信息、被收藏推荐信息以及被评论推荐信息中的至少一种。

7.一种信息推荐方法，其特征在于，应用于运行有特征提取网络的计算机设备中，所述特征提取网络是采用权利要求1至6任一所述的方法所训练得到的，所述方法包括：

8.根据权利要求7所述的方法，其特征在于，

所述参考待推荐信息以及所述候选待推荐信息的内容为图文组合，所述图文组合是由图片和标题构成的文档，所述标题用于描述所述图片。

9.一种特征提取网络的训练装置，其特征在于，所述装置包括：

所述获取模块，还用于根据时段限制和数量限制中的至少一种，获取历史推荐信息序列，所述历史推荐信息序列包括在所述曝光推荐信息之前，推荐给所述样本用户帐号的历史推荐信息；

训练模块，用于通过所述特征提取网络提取所述曝光推荐信息的第一语义向量，以及所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量；将所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量，与所述历史推荐信息对应的第二历史行为信息的特征进行融合，得到所述历史推荐信息对应的融合特征；基于所述第一语义向量以及所述历史推荐信息序列中每个所述历史推荐信息对应的融合特征，通过行为预测网络预测所述曝光推荐信息的预测行为信息；根据所述第一历史行为信息与所述预测行为信息之间的差异，训练机器学习模型，所述特征提取网络是所述机器学习模型中的子网络，所述机器学习模型还包括与所述特征提取网络级联的所述行为预测网络。

10.一种信息推荐装置，其特征在于，所述装置运行有特征提取网络，所述特征提取网络是权利要求9所示装置训练得到的网络，所述装置包括：

11.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或所述指令集由所述处理器加载并执行以实现如权利要求1至6任一所述的特征提取网络的训练方法，或权利要求7或8所述的信息推荐方法。

12.一种计算机可读存储介质，其特征在于，所述可读存储介质中存储有至少一条指令、至少一段程序、代码集或指令集，所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至6任一所述的特征提取网络的训练方法，或权利要求7或8所述的信息推荐方法。