CN115630219A

CN115630219A - 推荐模型的训练方法、装置和计算机设备

Info

Publication number: CN115630219A
Application number: CN202211100428.4A
Authority: CN
Inventors: 唐俪月
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2022-09-09
Filing date: 2022-09-09
Publication date: 2023-01-20

Abstract

本申请涉及一种推荐模型的训练方法、装置、计算机设备、存储介质和计算机程序产品，涉及大数据技术领域。方法包括：将目标对象标识信息输入嵌入层得到目标对象标识向量；将目标对象标识向量输入关联网络函数，得到与目标对象关联历史对象标识向量；将历史对象标识向量输入深度学习模型，得到预测信息；根据目标对象真实推荐信息和预测信息，确定第一评价损失函数，根据历史对象真实推荐信息和预测信息，确定第二评价损失函数；利用正则化损失函数和最小方法处理第一评价损失函数、第二评价损失函数，更新嵌入层和关联网络函数，得训练后的推荐模型。本方法在正则项准确率不降低的基础上提高推荐模型参数解的稀疏性，提高推荐模型准确度。

Description

推荐模型的训练方法、装置和计算机设备

技术领域

本申请涉及大数据技术领域，特别是涉及一种推荐模型的训练方法、装置和计算机设备。

背景技术

近年来，个性化推荐***被广泛应用于各种在线服务，包括电子商务、新闻媒体、相亲网站等。推荐***是信息过滤***的一个子集，目的在于根据用户与项目的特征属性来预测用户在项目中可能会发生的行为，帮助用户快速做出决策，提高用户满意度。在正式的上线场景中，总会有源源不断的新用户、新项目的加入，而对这些新加入的新用户、新项目做推荐的冷启动问题也成了近两年的研究热点。

然而，现有技术中推荐模型对新加入的新用户、新项目做推荐的冷启动时，通常会面临推荐模型预测准确性较低的问题。

发明内容

基于此，有必要针对上述技术问题，提供一种推荐模型的训练方法、装置和计算机设备。

第一方面，本申请提供了一种推荐模型的训练方法。所述方法包括：

将目标对象的标识信息输入推荐模型的嵌入层，得到所述目标对象的标识向量；

将所述目标对象的标识向量输入所述推荐模型的关联网络函数，得到与所述目标对象关联的历史对象的标识向量；

将所述历史对象的标识向量输入所述推荐模型的深度学习模型，得到所述目标对象对应的推荐对象的预测信息；

根据所述目标对象的真实推荐信息和所述预测信息，确定第一评价损失函数，并根据所述历史对象的真实推荐信息和所述预测信息，确定第二评价损失函数；

基于所述第一评价损失函数、正则化损失函数和最小方法，更新所述嵌入层的参数，并基于所述第二评价损失函数、正则化损失函数和最小方法，更新所述关联网络函数的参数，以得到训练后的推荐模型。

在其中一个实施例中，所述基于所述第一评价损失函数、正则化损失函数和最小方法，更新所述嵌入层的参数，并基于所述第二评价损失函数、正则化损失函数和最小方法，更新所述关联网络函数的参数，以得到训练后的推荐模型，包括：

利用所述正则化损失函数和最小方法，确定所述第一评价损失函数在达到最小值情况下的目标嵌入层参数，将所述嵌入层的参数更新为所述目标嵌入层参数；

利用所述正则化损失函数和最小方法，确定所述第二评价损失函数在达到最小值情况下的目标关联网络函数参数，将所述关联网络函数的参数更新为所述目标关联网络函数参数，以得到所述训练后的推荐模型。

在其中一个实施例中，所述关联网络函数包括元缩放网络函数和元偏移网络函数；

所述将所述目标对象的标识向量输入所述推荐模型的关联网络函数，得到与所述目标对象关联的历史对象的标识向量，包括：

将所述目标对象的标识向量输入所述元缩放网络函数后，将所述元缩放网络函数的输出结果输入至所述元偏移网络函数，以得到与所述目标对象关联的历史对象的标识向量。

在其中一个实施例中，所述将所述目标对象的标识向量输入所述元缩放网络函数后，将元缩放网络函数的输出结果输入至所述元偏移网络函数，以得到与所述目标对象关联的历史对象的标识向量之前，所述方法还包括：

将所述目标对象的特征信息和所述历史对象的特征信息输入所述推荐模型的嵌入层，获得所述目标对象的特征向量和所述历史对象的特征向量；

将所述目标对象的特征向量和所述历史对象的特征向量输入元缩放网络，以获得所述元缩放网络函数；

将所述目标对象的真实推荐对象的标识信息和所述历史对象的真实推荐对象的标识信息输入所述推荐模型的嵌入层，获得目标真实推荐对象的标识向量和历史真实推荐对象的标识向量；

将所述目标真实推荐对象的标识向量和所述历史真实推荐对象的标识向量输入所述元偏移网络，以获得所述元偏移网络函数。

在其中一个实施例中，所述目标对象的真实推荐对象的标识信息的数目为多个，所述历史对象的真实推荐对象的标识信息的数目为多个，所述将所述目标真实推荐对象的标识向量和所述历史真实推荐对象的标识向量输入所述元偏移网络，以获得所述元偏移网络函数，包括：

将多个所述目标真实推荐对象的标识向量输入平均值函数，得到第一平均值向量，将多个所述历史真实推荐对象的标识向量输入所述平均值函数，得到第二平均值向量；

将所述第一平均值向量和所述第二平均值向量输入所述元偏移网络，以获得所述元偏移网络函数。

在其中一个实施例中，

在所述目标对象为新用户的情况下，所述预测信息用于表示新用户与历史项目之间是否存在交互行为；

在所述目标对象为新项目的情况下，所述预测信息用于表示新项目与历史用户之间是否存在交互行为。

第二方面，本申请还提供了一种推荐方法。所述方法包括：

获取目标对象的标识信息；

将所述目标对象的标识信息输入至推荐模型，得到所述目标对象对应的推荐对象的预测信息；

其中，所述推荐模型通过上述第一方面所述的推荐模型的训练方法训练得到。

第三方面，本申请还提供了一种推荐模型的训练装置。所述装置包括：

标识向量获取模块，用于将目标对象的标识信息输入推荐模型的嵌入层，得到所述目标对象的标识向量；

关联转换模块，用于将所述目标对象的标识向量输入所述推荐模型的关联网络函数，得到与所述目标对象关联的历史对象的标识向量；

深度学习模块，用于将所述历史对象的标识向量输入所述推荐模型的深度学习模型，得到所述目标对象对应的推荐对象的预测信息；

评价损失模块，用于根据所述目标对象的真实推荐信息和所述预测信息，确定第一评价损失函数，并根据所述历史对象的真实推荐信息和所述预测信息，确定第二评价损失函数；

更新模块，用于基于所述第一评价损失函数、正则化损失函数和最小方法，更新所述嵌入层的参数，并基于所述第二评价损失函数、正则化损失函数和最小方法，更新所述关联网络函数的参数，以得到训练后的推荐模型。

在其中一个实施例中，所述更新模块，具体用于：

在其中一个实施例中，所述关联网络函数包括元缩放网络函数和元偏移网络函数；所述关联转换模块，具体用于：

将所述目标对象的标识向量输入所述元缩放网络函数后，将元缩放网络函数的输出结果输入至所述元偏移网络函数，以得到与所述目标对象关联的历史对象的标识向量。

在其中一个实施例中，所述装置，还包括：

特征向量获取模块，用于将所述目标对象的特征信息和所述历史对象的特征信息输入所述推荐模型的嵌入层，获得所述目标对象的特征向量和所述历史对象的特征向量；

元缩放网络函数获取模块，用于将所述目标对象的特征向量和所述历史对象的特征向量输入元缩放网络，以获得所述元缩放网络函数；

真实推荐对象向量获取模块，用于将所述目标对象的真实推荐对象的标识信息输入所述推荐模型的嵌入层，获得所述真实推荐对象的标识向量；

元偏移网络函数获取模块，用于将所述真实推荐对象的标识向量输入元偏移网络，以获得所述元偏移网络函数。

第四方面，本申请还提供了一种推荐装置。所述装置包括：

获取模块，用于获取目标对象的标识信息；

推荐模块，用于将所述目标对象的标识信息输入至推荐模型，得到所述目标对象对应的推荐对象的预测信息；

第五方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述第一方面或上述第二方面所述的步骤。

第六方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面或上述第二方面所述的步骤。

第七方面，本申请还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述第一方面或上述第二方面所述的步骤。

上述推荐模型的训练方法、装置、计算机设备、存储介质和计算机程序产品，将目标对象的标识信息输入推荐模型的嵌入层，得到所述目标对象的标识向量；将所述目标对象的标识向量输入所述推荐模型的关联网络函数，得到与所述目标对象关联的历史对象的标识向量；将所述历史对象的标识向量输入所述推荐模型的深度学习模型，得到所述目标对象对应的推荐对象的预测信息；根据所述目标对象的真实推荐信息和所述预测信息，确定第一评价损失函数，并根据所述历史对象的真实推荐信息和所述预测信息，确定第二评价损失函数；基于所述第一评价损失函数、正则化损失函数和最小方法，更新所述嵌入层的参数，并基于所述第二评价损失函数、正则化损失函数和最小方法，更新所述关联网络函数的参数，以得到训练后的推荐模型。这样可以利用推荐模型训练方法对推荐模型进行训练并通过利用正则化损失函数和最小方法处理第一评价损失函数、第二评价损失函数，更新嵌入层和关联网络函数，能够利用正则项在准确率不降低的基础上提高推荐模型参数的解的稀疏性，从而可以提高推荐模型的准确度。

附图说明

图1为一个实施例中推荐模型的训练方法的流程图；

图2为另一个实施例中推荐模型的训练方法的流程框图；

图3为一个实施例中推荐方法的流程图；

图4为一个实施例中推荐模型的训练装置图；

图5为一个实施例中推荐装置图；

图6为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在一个实施例中，如图1所示，本申请提供了一种推荐模型的训练方法，本实施例以该方法应用于终端进行举例说明，可以理解的是，该方法也可以应用于服务器，还可以应用于包括终端和服务器的***，并通过终端和服务器的交互实现。其中，终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备，物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中，该方法包括以下步骤：

步骤101，将目标对象的标识信息输入推荐模型的嵌入层，得到目标对象的标识向量。

其中，目标对象可以是冷用户，目标对象也可以是冷项目。目标对象的标识信息可以是目标对象ID(IDentity)。

在本申请的一个实施例中，推荐模型可以根据冷用户的标识信息，确定出冷用户对应的项目预测信息，从而为冷用户推荐项目；也可以根据冷项目的标识信息，预测出冷项目对应的用户预测信息，从而为冷项目推荐用户。因此，在推荐模型训练的过程中，目标对象可以是冷用户，也可以是冷项目。在目标对象是冷用户的情况下，标识信息可以为冷用户的ID，在目标用户为冷项目的情况下，标识信息可以为冷项目的ID。

在本申请的一个实施例中，推荐模型的嵌入层可以将输入信息转化为向量，终端将目标对象的标识信息输入嵌入层后，可以得到目标对象的标识向量。例如，终端可以将冷用户ID输入嵌入层，得到冷用户ID标识向量u，终端还可以将冷项目ID输入嵌入层，得到冷项目ID标识向量v。

步骤102，将目标对象的标识向量输入推荐模型的关联网络函数，得到与目标对象关联的历史对象的标识向量。

其中，在目标对象是冷用户的情况下，与冷用户关联的历史对象为热用户；在目标对象是冷项目的情况下，与冷项目关联的历史对象为热项目。

目标对象和与目标对象关联的历史对象之间存在相似的特征，因此，目标对象的标识信息通过嵌入层获得的标识向量和与目标对象关联的历史对象的标识信息通过嵌入层获得的标识向量存在一定联系。

在本申请的一个实施例中，终端利用关联网络函数将目标对象的标识向量转化为与目标对象关联的历史对象的标识向量，实现冷用户与热用户的转换或冷项目和热项目的转换，便于深度学习模型基于与目标对象关联的历史对象的标识向量对目标对象进行预测。

具体的，在目标对象是冷用户的情况下，终端将用户的嵌入层输出的冷用户ID标识向量u输入至关联网络函数，可以得到热用户ID标识向量u^warm。在目标对象是冷项目的情况下，终端将项目的嵌入层输出的冷项目ID标识向量v输入至关联网络函数，得到热项目ID标识向量v^warm。

步骤103，将历史对象的标识向量输入推荐模型的深度学习模型，得到目标对象对应的推荐对象的预测信息。

在本申请的一个实施例中，深度学习模型可以为数据通信网络(Datacommunication network；DCN)，深度学习模型可以基于与目标对象关联的历史对象的信息对目标对象进行预测。

具体的，终端可以将历史对象的标识向量输入深度学习模型，深度学习模型输出的预测信息，其中预测信息中包括预测数据。在目标对象是冷用户的情况下，深度学习模型可以基于与冷用户拥有相似特征的热用户与项目的关系，来预测该冷用户与项目的关系，深度学习模型输出的预测数据可以用来表示冷用户和项目之间是否可能存在点击浏览的行为；在目标对象是冷项目的情况下，深度学习模型也可以基于与冷项目拥有相似特征的热项目与用户的关系，来预测该冷项目与用户的关系，深度学习模型输出的预测数据还用来表示可以冷项目与用户是否可能存在点击浏览的行为。

在本申请的一个实施例中，经步骤101和步骤102后，终端将冷用户A标识向量转化为了热用户B、C标识向量，深度学习模型基于转化结果可以进一步计算用户A对于项目的点击浏览行为是否可能存在，若预测存在点击浏览行为则预测信息中的预测数据为1，若预测不存在点击浏览行为则预测信息中的预测数据为0。

步骤104，根据目标对象的真实推荐信息和预测信息，确定第一评价损失函数，并根据历史对象的真实推荐信息和预测信息，确定第二评价损失函数。

具体的，第一评价损失函数包括冷用户评价损失函数和冷项目评价损失函数。第二评价损失函数包括热用户评价损失函数和热项目评价损失函数。在目标对象是冷用户的情况下，终端可以根据冷用户的真实推荐信息和深度学习模型输出的预测信息，确定冷用户评价损失函数，终端还可以根据冷用户关联的热用户的真实推荐信息和深度学习模型输出的预测信息，确定热用户评价损失函数。

在目标对象是冷项目的情况下，终端可以根据冷项目的真实推荐信息和深度学习模型输出的预测信息，确定冷项目评价损失函数，终端还可以根据冷项目关联的热项目的真实推荐信息和深度学习模型输出的预测信息，确定热项目评价损失函数。

在本申请的一个实施例中，目标对象具有真实推荐信息y。当目标用户为冷用户时，目标对象的真实推荐信息表明实际上冷用户与项目之间是否存在点击浏览行为。当目标用户为冷项目时，目标对象的真实推荐信息表明实际上冷项目与用户之间是否存在点击浏览行为。

对数损失函数的表达式如(1)所示：

其中，φ表示嵌入层的参数，y为真实推荐信息，

为预测信息。

步骤105，基于第一评价损失函数、正则化损失函数和最小方法，更新嵌入层的参数，并基于第二评价损失函数、正则化损失函数和最小方法，更新关联网络函数的参数，以得到训练后的推荐模型。

其中，推荐模型应用于推荐***，用于对目标对象进行推荐。

具体的，在目标对象是冷用户的情况下，终端可以基于冷用户评价损失函数、正则化损失函数和最小方法，更新用户的嵌入层的参数，终端还可以基于热用户评价损失函数、正则化损失函数和最小方法，更新用户的关联网络函数的参数。在目标对象是冷项目的情况下，终端还可以基于冷项目评价损失函数、正则化损失函数和最小方法，更新项目的嵌入层的参数，终端还可以基于热项目评价损失函数、正则化损失函数和最小方法，更新项目的关联网络函数的参数。其中，正则化损失函数和最小方法为FTRL(Follow The RegularizedLeader)算法。

在本申请的一个实施例中，在将目标对象的标识信息输入推荐模型的嵌入层，得到目标对象的标识向量前，方法还包括：

采集样本数据集，对推荐模型进行模型训练，以得到训练后的推荐模型；样本数据集包括目标对象信息和历史对象信息，目标对象信息包括目标对象的标识信息、目标对象的特征信息、目标对象的真实推荐对象的标识信息和目标对象的真实推荐信息，历史对象信息包括历史对象的标识信息、历史对象的特征信息、历史对象的真实推荐对象的标识信息和历史目标对象的真实推荐信息。

具体的，在将目标对象的标识信息输入推荐模型的嵌入层，得到目标对象的标识向量前，终端需要进行采集样本数据集，样本数据集包括目标对象信息和历史对象信息，目标对象信息包括目标对象的标识信息、目标对象的特征信息、目标对象的真实推荐对象的标识信息和目标对象的真实推荐信息，历史对象信息包括历史对象的标识信息、历史对象的特征信息、历史对象的真实推荐对象的标识信息和历史目标对象的真实推荐信息。

在目标对象是冷用户的情况下，终端采集的样本数据集可以包括冷用户ID、冷用户特征信息、冷用户真实推荐项目的的项目信息、冷用户真实推荐信息、热用户ID、热用户特征信息、热用户真实推荐用户的标识信息和热用户真实推荐信息，终端可以将冷用户的样本数据集输入至推荐模型，并对推荐模型进行微调，实现对推荐模型进行模型训练。在目标对象是冷项目的情况下，终端采集的样本数据集可以包括冷项目ID、冷项目特征信息、冷项目真实推荐的项目的标识信息、冷项目真实推荐用户的标识信息、热项目ID、热项目特征信息、热项目真实推荐用户的标识信息和热项目真实推荐信息，终端可以将冷项目的样本数据集输入至推荐模型，并对推荐模型进行微调，实现对推荐模型进行模型训练。

上述推荐模型的训练方法中，将目标对象的标识信息输入推荐模型的嵌入层，得到目标对象的标识向量；将目标对象的标识向量输入推荐模型的关联网络函数，得到与目标对象关联的历史对象的标识向量；将历史对象的标识向量输入推荐模型的深度学习模型，得到目标对象对应的推荐对象的预测信息；根据目标对象的真实推荐信息和预测信息，确定第一评价损失函数，并根据历史对象的真实推荐信息和预测信息，确定第二评价损失函数；基于第一评价损失函数、正则化损失函数和最小方法，更新嵌入层的参数，并基于第二评价损失函数、正则化损失函数和最小方法，更新关联网络函数的参数，以得到训练后的推荐模型。这样可以利用推荐模型训练方法对推荐模型进行训练并通过利用正则化损失函数和最小方法处理第一评价损失函数、第二评价损失函数，更新嵌入层和关联网络函数，能够利用正则项在准确率不降低的基础上提高推荐模型参数的解的稀疏性，从而可以提高推荐模型的准确度。除此之外，上述推荐模型训练方法能够有效提升推荐模型在预测时的效率，并且使得训练后的推荐模型能够更好地抵抗在线学习时的复杂波动。

在本申请的一个实施例中，步骤105基于第一评价损失函数、正则化损失函数和最小方法，更新嵌入层的参数，并基于第二评价损失函数、正则化损失函数和最小方法，更新关联网络函数的参数，以得到训练后的推荐模型，具体包括：利用正则化损失函数和最小方法，确定第一评价损失函数在达到最小值情况下的目标嵌入层参数，将嵌入层的参数更新为目标嵌入层参数；利用正则化损失函数和最小方法，确定第二评价损失函数在达到最小值情况下的目标关联网络函数参数，将关联网络函数的参数更新为目标关联网络函数参数，以得到训练后的推荐模型。

具体的，第一评价损失函数包括冷用户评价损失函数和冷项目评价损失函数。第二评价损失函数包括热用户评价损失函数和热项目评价损失函数。

在目标对象是冷用户的情况下，终端可以利用正则化损失函数和最小方法，确定冷用户评价损失函数最小值时，用户的目标嵌入层参数，并将用户的嵌入层参数更新为目标嵌入层参数。终端还可以利用正则化损失函数和最小方法，确定冷用户对应的热用户评价损失函数最小值时，用户的目标关联网络函数参数，并将用户的关联网络函数参数更新为目标关联网络函数参数，完成对冷用户的推荐模型的训练。在目标对象是冷项目的情况下，终端可以利用正则化损失函数和最小方法，确定冷项目评价损失函数最小值时，项目的目标嵌入层参数，并将项目的嵌入层参数更新为目标嵌入层参数。终端还可以利用正则化损失函数和最小方法，确定冷项目对应的热项目评价损失函数最小值时，项目的目标关联网络函数参数，并将项目的关联网络函数的参数更新为目标关联网络函数参数，完成对冷项目的推荐模型的训练。冷***中包括冷用户和冷项目，终端在完成对冷用户推荐模型的训练和冷项目推荐模型的训练时，即完成对冷***推荐模型的训练。

在本申请的一个实施例中，关联网络函数包括元缩放网络函数和元偏移网络函数；相应的，步骤102将目标对象的标识向量输入推荐模型的关联网络函数，得到与目标对象关联的历史对象的标识向量，具体包括：将目标对象的标识向量输入元缩放网络函数后，将元缩放网络函数的输出结果输入至元偏移网络函数，以得到与目标对象关联的历史对象的标识向量。

具体的，终端使用元缩放网络函数实现目标对象和与目标对象关联的历史对象的转换。在推荐模型进行推荐过程中，经常产生错误的交互，比如误触、信号不稳定等情况。这些情况产生的噪声会对目标对象的标识信息在嵌入层的嵌入过程造成严重的影响，也会对将目标对象转换为与目标对象关联的历史对象的过程产生干扰。终端可以利用元偏移网络函数，降低噪声的影响，并且终端可以利用元偏移网络函数使得推荐模型能更好地抵抗在线学习时存在的复杂波动。

在目标对象是冷用户的情况下，终端可以将冷用户的标识向量输入用户的元缩放网络函数后，将用户的元缩放网络函数的输出结果输入至用户的元偏移网络，得到与冷用户关联的热用户的标识向量。在目标对象是冷项目的情况下，终端可以将冷项目的标识向量输入项目的元缩放网络函数后，将项目的元缩放网络函数的输出结果输入至项目的元偏移网络，得到与冷项目关联的热项目的标识向量。

在本申请的一个实施例中，将目标对象的标识向量输入元缩放网络函数后，将元缩放网络函数的输出结果输入至元偏移网络函数，以得到与目标对象关联的历史对象的标识向量之前，方法还包括：

将目标对象的特征信息和历史对象的特征信息输入推荐模型的嵌入层，获得目标对象的特征向量和历史对象的特征向量；

将目标对象的特征向量和历史对象的特征向量输入元缩放网络，以获得元缩放网络函数；

将目标对象的真实推荐对象的标识信息和历史对象的真实推荐对象的标识信息输入推荐模型的嵌入层，获得目标真实推荐对象的标识向量和历史真实推荐对象的标识向量；

将目标真实推荐对象的标识向量和历史真实推荐对象的标识向量输入元偏移网络，以获得元偏移网络函数。

具体的，在目标对象是冷用户的情况下，目标对象的真实推荐对象为与冷用户存在交互历史的项目，历史对象的真实推荐对象，为与热用户存在交互历史的项目。在目标对象是冷项目的情况下，目标对象的真实推荐对象为与冷项目存在交互历史的用户，历史对象的真实推荐对象，为与热项目存在交互历史的用户。

终端可以将目标对象的特征向量、历史对象的特征向量输入到元缩放网络中，获得元缩放网络函数，将目标对象的信息转换为与目标对象关联的历史对象的信息。除此之外，终端可以将目标对象的真实推荐对象的标识信息、历史对象的真实推荐对象的标识信息输入到元偏移网络中，获得元偏移网络函数。终端利用存在交互历史的真实推荐对象信息作为输入信息，可以有效降低噪声干扰，提高推荐模型的稳定性，提高推荐模型推荐的准确性。

在本申请的一个实施例中，目标对象的真实推荐对象的标识信息的数目为多个，历史对象的真实推荐对象的标识信息的数目为多个，将目标真实推荐对象的标识向量和历史真实推荐对象的标识向量输入元偏移网络，以获得元偏移网络函数，包括：

将多个目标真实推荐对象的标识向量输入平均值函数，得到第一平均值向量，将多个历史真实推荐对象的标识向量输入平均值函数，得到第二平均值向量；

将第一平均值向量和第二平均值向量输入元偏移网络，以获得元偏移网络函数。

具体的，目标对象可能存在多个真实推荐对象，历史对象也可能存在多个真实推荐对象，因此，终端将多个目标对象的真实推荐对象的标识信息输入嵌入层，可以获得多个目标真实推荐对象的标识向量的标识向量。终端可以利用平均值函数对多个目标真实推荐对象的标识向量处理获得第一平均值向量，终端还可以将多个历史对象的真实推荐对象的标识信息输入嵌入层，获得多个历史真实推荐对象的标识向量的标识向量，之后，终端利用平均值函数对多个历史真实推荐对象的标识向量处理获得第二平均值向量。终端可以将第一平均值向量和第二平均值向量输入至元偏移网络获得元偏移网络函数。基于多个目标对象的真实推荐对象的标识信息和多个历史对象的真实推荐对象的标识信息获得的元偏移网络函数，可以增强推荐模型对噪声的抗干扰性，也提高推荐模型的稳定性和推荐模型的准确性。

在本申请的一个实施例中，在目标对象为新用户的情况下，预测信息用于表示新用户与历史项目之间是否存在交互行为；

在目标对象为新项目的情况下，预测信息用于表示新项目与历史用户之间是否存在交互行为。

具体的，在目标对象是冷用户(新用户)的情况下，深度学习模型可以基于与冷用户拥有相似特征的热用户(历史用户)与项目(历史项目)的关系，来预测该冷用户与项目(历史项目)的关系，深度学习模型输出的预测数据可以用来表示冷用户和项目之间是否可能存在点击浏览的行为；在目标对象是冷项目(新项目)的情况下，深度学习模型也可以基于与冷项目拥有相似特征的热项目(历史项目)与用户(历史用户)的关系，来预测该冷项目(新项目)与用户(历史用户)的关系，深度学习模型输出的预测数据还用来表示可以冷项目与用户是否可能存在点击浏览的行为。

在本申请的一个实施例中，终端可以为二分类推荐***，用以预测用户与项目之间的购买行为或点击浏览行为。终端可以获取样本集合，每个样本包含一个用户、一个项目以及一个标签y∈{0,1}，其中标签y用来表示用户与项目之间的购买行为或点击浏览行为，y为真实推荐信息。用户与项目还包含了一些相关特征。例如，有如下用户：冷用户A、热用户B、热用户C，有如下项目：X品牌商品(冷)、Y品牌商品(热)、Z品牌商品(热)。每个用户均具有年龄、性别、职业、收入等用户特征，每个商品均具有价值、所属类别、是否进口商品等项目特征。若某一用户如A对X品牌商品之间存在点击浏览记录，二者之间的关系y值为1，否则为y值为0。

请一并参见图2，在本申请的一个实施例中，终端通过嵌入层可以将目标对象较少的特征转化为稠密的标识向量即嵌入向量。在目标对象是冷用户的情况下，终端将可以冷用户ID输入用户的嵌入层

得到冷用户ID嵌入向量(即标识向量)u_j。终端还可以将用户属性(即用户特征信息)输入嵌入层后，可以得到用户特征向量，用户特征向量的表达式为

m表示用户的特征个数，用户属性包括冷用户特征属性和热用户特征属性，用户特征向量包括冷用户特征向量和热用户特征向量。终端还可以将与用户交互过的项目ID(即目标对象的真实推荐对象的标识信息)输入用户嵌入层得到真实推荐项目的嵌入向量U(u_j)。在目标对象是冷项目的情况下，终端可以将冷项目ID输入项目的嵌入层

得到冷项目ID嵌入向量v_i。终端将可以将项目属性(即项目特征信息)输入嵌入层后，可以得到项目特征向量，项目特征向量的表达式为

n表示项目的特征个数，该项目属性包括冷项目特征属性和热项目特征属性，项目特征向量包括冷项目特征向量和热项目特征向量。终端还可以将与项目交互过的用户ID(即目标对象的真实推荐对象的标识信息)输入项目嵌入层得到真实推荐用户的嵌入向量U(v_i)。

对于相近的用户或者相近的项目，往往有着相似的特征，因此，冷ID嵌入向量与热ID嵌入向量之间有着一定的联系。终端可以利用元缩放网络将冷ID嵌入向量转换到一个更好的特征空间，以更好地拟合深度学习模型。其中，特征转换具体包括以下过程：

过程1：

终端将目标对象的特征向量和历史对象的特征向量输入元缩放网络，可以得到的元缩放网络函数。

在目标对象是冷项目的情况下，项目元缩放网络函数

表达式为：

其中，ω_scale是h(·)的参数。

在目标对象是冷用户的情况下，用户元缩放网络函数

表达式为

其中，ω_scale是h(·)的参数。

过程2：

元缩放网络函数可以看成是一种特征变换，可以将冷用户ID转换成热用户ID，还可以将冷项目ID转换为热项目ID。

在目标对象是冷项目的情况下，元缩放网络函数的输出结果输出热项目ID。此时热项目ID表达式为：

在目标对象是冷用户的情况下，元缩放网络函数的输出结果输出热用户ID。此时热用户ID表达式为：

在推荐模型进行推荐的过程中，经常产生错误的交互，比如误触、信号不稳定等，因此，噪声会对冷ID嵌入过程造成严重的影响。为了缓解噪声的影响，终端使用与项目交互过的用户ID嵌入向量U(v_i)的均值和与用户交互过的项目ID嵌入向量U(u_j)的均值作为输入，输入至元偏移网络，得到元偏移网络函数。终端利用元偏移网络函数降低噪声干扰具体包括以下过程：

过程1：

终端将真实推荐对象的标识向量输入元偏移网络，得到的元偏移网络函数。在目标对象是冷项目的情况下，项目元偏移网络函数表达式如下所示：

其中，w_shift是g(·)函数的参数。终端利用简单未加权均值函数

对与项目交互过的用户ID嵌入向量U(v_i)进行处理。

在目标对象是冷用户的情况下，用户元偏移网络函数表达式如下所示：

对与用户交互过的项目ID嵌入向量U(u_j)进行处理。

过程2：

在目标对象是冷项目的情况下，项目元偏移网络函数的输出结果输出热项目ID。此时热项目ID表达式为：

在目标对象是冷用户的情况下，用户元偏移网络函数的输出结果输出热用户ID。此时热用户ID表达式为：

终端经过上述过程后将目标对象的标识向量转化为与目标对象关联的历史对象标识向量，之后终端将获得的历史对象标识向量输入深度学习模型，以获得预测信息，预测信息中包括预测数据。终端可根据预测信息及预测数据判断用户与项目之间是否可能存在点击浏览行为，并根据该预测信息完成对冷用户或者冷项目的推荐。终端完成对冷用户和冷项目推荐即完成对冷***的推荐。

终端可以根据冷用户嵌入向量、冷项目嵌入向量和深度学习模型的预测数据构建冷用户评价损失函数、冷项目评价损失函数

终端还可以利用FTRL方法通过最小化

的值来分别更新用户嵌入层、项目嵌入层

同理，终端可以根据冷用户对应的热用户嵌入向量、冷项目对应的热项目嵌入向量和深度学习模型的预测数据构建冷用户对应的热用户评价损失函数、冷项目对应的热项目评价损失函数

终端还可以利用FTRL方法通过最小化

的值来分别更新用户元缩放网络函数

项目元缩放网络函数

用户元偏移网络函数和项目元偏移网络函数

以利用FTRL方法更新

参数的推导过程为例，其他参数的更新同理可得。

参数简化记作μ，其损失函数

简化记为l。t表示第t轮迭代，那么第t+1轮迭代时μ的值为：

FTL即采用了累计梯度的计算方法，FTRL是在FTL的基础上增加了正则化项。FTRL方法中用

代替

为第一轮到t轮损失函数的累计梯度，即

并加入了L1正则和L2正则，λ₁、λ₂分别L1正则和L2正则项的系数，第t+1轮迭代时μ的值可以表示为：

其中，

则

将

展开得：

相对于需要优化的μ是一个可以消去的常数，令

公式(13)可以简化为：

将特征的各个维度拆开成独立的标量最小化问题，i为第i个特征：

对其用次导数方法求得μ_t+1,i的更新公式为：

对于推荐模型中冷用户或冷项目某一特征的数据较少的情况，那么该特征维度对应的训练速率可以独自保持比较大的值，而不需要与其他特征的训练速率强行一致。FTRL算法对于每一维度的特征有着单独的学习率，更能反映样本在不同特征上的分布，能够利用正则项在准确率不降低的基础上提高稀疏性，进而提高推荐模型推荐的准确性和高效性。

FTRL中第t轮第i个特征的学习率为：

其中，α、β为超参数，一般β设为1，α则根据情况选择。g_s,i为第s轮第i个特征的偏导数。

于是，上式(16)变为：

在本申请的一个实施例中，还提供了一种推荐方法，如图3所示，具体过程包括以下步骤：

步骤301，获取目标对象的标识信息；

步骤302，将目标对象的标识信息输入至推荐模型，得到目标对象对应的推荐对象的预测信息；

上述推荐方法中，通过推荐模型的训练方法训练得到推荐模型，并基于获得的目标对象的标识信息，自动且准确对目标对象进行推荐并获得目标对象对应的推荐对象的预测信息，从而实现对用户或项目的快速高效准确推荐。

应该理解的是，虽然如上述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的推荐模型的训练方法的推荐模型的训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个推荐模型的训练装置实施例中的具体限定可以参见上文中对于推荐模型的训练方法的限定，在此不再赘述。

在本申请的一个实施例中，如图4所示，提供了一种推荐模型的训练装置400，包括：标识向量获取模块410、关联转换模块420、深度学习模块430、评价损失模块440和更新模块450，其中：

标识向量获取模块410，用于将目标对象的标识信息输入推荐模型的嵌入层，得到目标对象的标识向量；

关联转换模块420，用于将目标对象的标识向量输入推荐模型的关联网络函数，得到与目标对象关联的历史对象的标识向量；

深度学习模块430，用于将历史对象的标识向量输入推荐模型的深度学习模型，得到目标对象对应的推荐对象的预测信息；

评价损失模块440，用于根据目标对象的真实推荐信息和预测信息，确定第一评价损失函数，并根据历史对象的真实推荐信息和预测信息，确定第二评价损失函数；

更新模块450，用于基于第一评价损失函数、正则化损失函数和最小方法，更新嵌入层的参数，并基于第二评价损失函数、正则化损失函数和最小方法，更新关联网络函数的参数，以得到训练后的推荐模型。

在本申请的一个实施例中，更新模块具体用于：

利用正则化损失函数和最小方法，确定第一评价损失函数在达到最小值情况下的目标嵌入层参数，将嵌入层的参数更新为目标嵌入层参数；

利用正则化损失函数和最小方法，确定第二评价损失函数在达到最小值情况下的目标关联网络函数参数，将关联网络函数的参数更新为目标关联网络函数参数，以得到训练后的推荐模型。

在本申请的一个实施例中，关联网络函数包括元缩放网络函数和元偏移网络函数；关联转换模块，具体用于：

将目标对象的标识向量输入元缩放网络函数后，将元缩放网络函数的输出结果输入至元偏移网络函数，以得到与目标对象关联的历史对象的标识向量。

在本申请的一个实施例中，该装置还包括：

特征向量获取模块，用于将目标对象的特征信息和历史对象的特征信息输入推荐模型的嵌入层，获得目标对象的特征向量和历史对象的特征向量；

元缩放网络函数获取模块，用于将目标对象的特征向量和历史对象的特征向量输入元缩放网络，以获得元缩放网络函数；

真实推荐对象向量获取模块，用于将目标对象的真实推荐对象的标识信息和历史对象的真实推荐对象的标识信息输入推荐模型的嵌入层，获得目标真实推荐对象的标识向量和历史真实推荐对象的标识向量；

元偏移网络函数获取模块，用于将目标真实推荐对象的标识向量和历史真实推荐对象的标识向量输入元偏移网络，以获得元偏移网络函数。

在本申请的一个实施例中，目标对象的真实推荐对象的标识信息的数目为多个，历史对象的真实推荐对象的标识信息的数目为多个，元偏移网络函数获取模块还用于：

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的推荐装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个推荐装置实施例中的具体限定可以参见上文中对于推荐方法的限定，在此不再赘述。

在本申请的一个实施例中，如图5所示，提供了一种推荐装置500，包括：获取模块510和推荐模块520，其中：

获取模块510，用于获取目标对象的标识信息；

推荐模块520，用于将目标对象的标识信息输入至推荐模型，得到目标对象对应的推荐对象的预测信息；

其中，推荐模型通过上述推荐模型的训练方法训练得到。

上述推荐模型的训练装置和推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在本申请的一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图6所示。该计算机设备包括通过***总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种量表问题生成模型的训练方法或量表问题生成方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图6中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在本申请的一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在本申请的一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在本申请的一个实施例中，提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

需要说明的是，本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)，均为经用户授权或者经过各方充分授权的信息和数据。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory，MRAM)、铁电存储器(Ferroelectric Random Access Memory，FRAM)、相变存储器(Phase Change Memory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory，DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种推荐模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的推荐模型的训练方法，其特征在于，所述基于所述第一评价损失函数、正则化损失函数和最小方法，更新所述嵌入层的参数，并基于所述第二评价损失函数、正则化损失函数和最小方法，更新所述关联网络函数的参数，以得到训练后的推荐模型，包括：

3.根据权利要求1所述的推荐模型的训练方法，其特征在于，所述关联网络函数包括元缩放网络函数和元偏移网络函数；

4.根据权利要求3所述的推荐模型的训练方法，其特征在于，所述将所述目标对象的标识向量输入所述元缩放网络函数后，将元缩放网络函数的输出结果输入至所述元偏移网络函数，以得到与所述目标对象关联的历史对象的标识向量之前，所述方法还包括：

5.根据权利要求4所述的推荐模型的训练方法，其特征在于，所述目标对象的真实推荐对象的标识信息的数目为多个，所述历史对象的真实推荐对象的标识信息的数目为多个，所述将所述目标真实推荐对象的标识向量和所述历史真实推荐对象的标识向量输入所述元偏移网络，以获得所述元偏移网络函数，包括：

6.根据权利要求1至5所述的推荐模型的训练方法，其特征在于，

7.一种推荐方法，其特征在于，所述方法包括：

获取目标对象的标识信息；

其中，所述推荐模型通过权利要求1至6中任一项所述的推荐模型的训练方法训练得到。

8.一种推荐模型的训练装置，其特征在于，所述装置包括：

9.一种推荐装置，其特征在于，所述装置包括：

获取模块，用于获取目标对象的标识信息；

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项或权利要求7所述的方法的步骤。

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至6中任一项或权利要求7所述的方法的步骤。

12.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至6中任一项或权利要求7所述的方法的步骤。