CN113705683B

CN113705683B - 推荐模型的训练方法、装置、电子设备及存储介质

Info

Publication number: CN113705683B
Application number: CN202111002586.1A
Authority: CN
Inventors: 骆明楠; 廖一桥; ***
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2021-08-30
Filing date: 2021-08-30
Publication date: 2024-06-04
Anticipated expiration: 2041-08-30
Also published as: CN113705683A

Abstract

本公开公开了一种推荐模型的训练方法、装置、电子设备及存储介质。该方法在获取训练样本集后确定待处理训练样本集；遍历待处理训练样本集，并执行：根据当前训练样本中第一对象类型对应的样本信息，在第一训练样本中确定当前训练样本的相似样本；将相似样本中的第二对象类型对应的样本信息，对当前训练样本中的第二对象类型对应的样本信息进行替换，将替换后的当前训练样本作为新训练样本，以及得到新训练样本的样本标签；基于训练样本集中的训练样本和相应样本标签，以及待处理训练样本集中每个训练样本对应的新训练样本和相应样本标签，对神经网络模型进行迭代训练，得到推荐模型。该方法提高了推荐模型的推荐准确率。

Description

推荐模型的训练方法、装置、电子设备及存储介质

技术领域

本公开涉及数据处理技术领域，尤其涉及一种推荐模型的训练方法、装置、电子设备及存储介质。

背景技术

对于多媒体的推荐***，输入推荐***的样本信息可以包括用户账户信息和多媒体资源信息，还可以包括用户账户与相应多媒体资源的上下文信息，获取到该样本信息中每种属性的特征向量，如词向量后，推荐***通过这些词向量，可以判断出该样本信息属于正样本的概率值(即基于这样的上下文信息的情况下，该用户选择该对象的概率值)。

在训练推荐模型时，常常存在因训练样本少，导致训练出的推荐模型的推荐准确性不高的问题。

发明内容

本公开实施例提供一种推荐模型的训练方法、装置、电子设备及存储介质，以至少解决相关技术中因训练样本少，导致训练出的推荐模型的推荐准确率不高的问题。本公开的技术方案如下：

根据本公开实施例的第一方面，提供一种推荐模型的训练方法，该方法可以包括：

获取训练样本集，所述训练样本集包括训练样本和所述训练样本对应的样本标签；所述训练样本包括两种对象类型对应的样本信息，所述两种对象类型包括账户类型和多媒体类型，所述两种对象类型对应的样本信息包括用户账户信息和多媒体资源信息；所述样本标签表征所述用户账户信息对应的账户对所述多媒体资源信息对应的多媒体资源间的操作行为；

确定所述训练样本集中的待处理训练样本集；遍历所述待处理训练样本集，针对遍历到的当前训练样本，执行如下步骤：

根据所述当前训练样本中第一对象类型对应的样本信息，在第一训练样本中确定所述当前训练样本的相似样本；其中，所述第一对象类型是所述训练样本中的一种对象类型；所述第一训练样本为所述训练样本集中除所述当前训练样本外的其他训练样本；

将所述相似样本中的第二对象类型对应的样本信息，对所述当前训练样本中的第二对象类型对应的样本信息进行替换，将替换后的所述当前训练样本作为新训练样本，并将相应相似样本的样本标签确定为所述新训练样本的样本标签；所述第二对象类型是所述训练样本中除所述第一对象类型外的类型；

基于所述训练样本集中的训练样本和相应样本标签，以及所述待处理训练样本集中每个训练样本对应的新训练样本和相应样本标签，对神经网络模型进行迭代训练，得到推荐模型。

该实施方式通过对用户账户对应的训练样本或多媒体资源对应的训练样本进行样本扩展，得到针对相应用户账户或多媒体资源的新训练样本，从而避免某些用户账户或某些多媒体资源对应样本因有效样本少，而导致训练出的推荐模型不准确的问题，提高了推荐模型的推荐准确率。

一种可能的实施方式中，所述用户账户信息包括账户标识；

在所述第一对象类型对应的样本信息为所述用户账户信息时，确定所述训练样本集中的待处理训练样本集，包括：

获取历史累计样本中各账户标识的数量；

若目标账户标识的数量小于预设数量阈值，则将所述训练样本集中所述目标账户标识对应的训练样本确定为待处理训练样本，基于确定的待处理训练样本构建待处理训练样本集；所述目标账户标识为所述训练样本集中的一个账户标识。

该实施方式通过查询历史累计样本中各账户标识的数量可准确的确定出目标账户标识对应的用户账户存在有效样本量少的问题，且将训练样本集中目标账户标识对应的训练样本作为待处理训练样本，以实现后期对该待处理训练样本进行样本扩展。

一种可能的实施方式中，所述多媒体资源信息包括多媒体标识；

在所述第一对象类型对应的样本信息为所述多媒体资源信息时，确定所述训练样本集中的待处理训练样本集，包括：

获取存储的历史累计样本中各多媒体标识的数量；

若目标多媒体标识的数量小于预设数量阈值，则将所述训练样本集中所述目标多媒体标识对应的训练样本确定为待处理训练样本，基于确定的待处理训练样本构建待处理训练样本集；所述目标多媒体标识为所述训练样本集中的一个多媒体标识。

该实施方式通过查询历史累计样本中各多媒体标识的数量可准确的确定出目标多媒体标识对应的多媒体资源存在有效样本量少的问题，且将训练样本集中目标多媒体标识对应的训练样本作为待处理训练样本，以实现后期对该待处理训练样本进行样本扩展。

一种可能的实施方式中，根据所述当前训练样本中第一对象类型对应的样本信息，在第一训练样本中确定所述当前训练样本的相似样本，包括：

获取所述当前训练样本的第一对象类型对应的样本信息分别与所述第一训练样本中各训练样本的第一对象类型对应的样本信息的相似度；

将满足预设筛选条件的相似度对应的第一训练样本确定为所述当前训练样本的相似样本。

该实施方式为了扩展出与当前训练样本中第一对象类型对应的有效样本，在第一训练样本中，根据当前训练样本中第一对象类型对应的样本信息来寻找其相似样本，以得到与当前训练样本存在较强关联程度的相似样本。

一种可能的实施方式中，所述用户账户信息还包括账户特征；

获取所述当前训练样本的第一对象类型对应的样本信息分别与所述第一训练样本中各训练样本的第一对象类型对应的样本信息的相似度，包括：

获取所述当前训练样本的所述账户标识和所述账户特征分别与所述第一训练样本中各训练样本的所述账户标识和所述账户特征的相似度；或者，

获取所述当前训练样本的所述账户标识或所述账户特征分别与所述第一训练样本中各训练样本的所述账户标识或所述账户特征的相似度。

该实施方式通过用户账户信息中的账户标识和/或账户特征来获取与当前训练样本中账户标识和/或账户特征对应的相似样本。

一种可能的实施方式中，所述多媒体资源信息包括多媒体特征；

获取所述当前训练样本的所述多媒体标识和所述多媒体特征分别与所述第一训练样本中各训练样本的所述多媒体标识和所述多媒体特征的相似度；或者，

获取所述当前训练样本的所述多媒体标识或所述多媒体特征分别与所述第一训练样本中各训练样本的所述多媒体标识或所述多媒体特征的相似度。

该实施方式通过多媒体资源信息中的多媒体标识和多媒体特征来获取与当前训练样本中多媒体资源信息对应的相似样本。

一种可能的实施方式中，将所述相似样本中的第二对象类型对应的样本信息，对所述当前训练样本中的第二对象类型对应的样本信息进行替换，将替换后的所述当前训练样本作为新训练样本，包括：

根据所述当前训练样本对应的相似样本的数量和样本选取权重，确定样本选取数量；

从所述当前训练样本的相似样本中，选取所述样本选取数量的相似样本作为待处理的相似样本；

根据所述待处理的相似样本中所述第二对象类型对应的样本信息，对所述当前训练样本中所述第二对象类型对应的样本信息进行替换，将替换后的所述当前训练样本作为新训练样本。

该实施方式仅通过相似样本中第二对象类型对应的样本信息与当前训练样本中第二对象类型对应的样本信息进行替换，即可得到新的训练样本，提高新训练样本的获取速度。

一种可能的实施方式中，所述样本选取权重是对所述满足预设筛选条件的相似度进行归一化处理后得到的。

一种可能的实施方式中，在所述第一对象类型对应的样本信息为所述用户账户信息时，所述第二对象类型对应的样本信息为所述多媒体资源信息；

根据所述待处理的相似样本中所述第二对象类型对应的样本信息，对所述当前训练样本中所述第二对象类型对应的样本信息进行替换，将替换后的所述当前训练样本作为新训练样本，包括：

将所述待处理的相似样本中的所述多媒体资源信息，替换所述当前训练样本中的所述多媒体资源信息，并将替换后的所述当前训练样本作为新训练样本。

该实施方式在第二对象类型对应的样本信息为用户账户信息时，通过相似样本中用户账户信息与当前训练样本中用户账户信息进行替换，得到用户账户信息对应的新训练样本。

一种可能的实施方式中，在所述第一对象类型对应的样本信息为所述多媒体资源信息时，所述第二对象类型对应的样本信息为所述用户账户信息。

将所述待处理的相似样本中的所述用户账户信息，替换所述当前训练样本中的所述用户账户信息，并将替换后的所述当前训练样本作为新训练样本。

该实施方式在第二对象类型对应的样本信息为多媒体资源信息时，通过相似样本中多媒体资源信息与当前训练样本中多媒体资源信息进行替换，得到多媒体资源信息对应的新训练样本。

一种可能的实施方式中，根据所述待处理的相似样本中所述第二对象类型对应的样本信息，对所述当前训练样本中所述第二对象类型对应的样本信息进行替换，将替换后的所述当前训练样本作为新训练样本，包括：

获取所述待处理的相似样本中所述第二对象类型对应的样本信息的特征向量，以及所述当前训练样本中所述第二对象类型对应的样本信息的特征向量；

根据所述待处理的相似样本中所述第二对象类型对应的样本信息的特征向量与预设权重系数，得到所述待处理的相似样本中所述第二对象类型对应的新的样本信息的特征向量；

基于所述第二对象类型对应的新的样本信息的特征向量，对所述当前训练样本中所述第二对象类型对应的样本信息的特征向量进行替换，将替换后的所述当前训练样本作为新训练样本。

该实施方式在当前训练样本第一对象类型对应的样本信息不变的情况下，通过对相似样本中第二对象类型对应的样本信息的特征向量与预设权重系数相乘，获取到训练样本集中不存在的第二对象类型对应的样本信息，从而通过将新的样本信息的特征向量，替换当前训练样本中第二对象类型对应的样本信息的特征向量，得到当前训练样本对应的新训练样本，确保了该新训练样本是与训练样本集中的各训练样本不同的训练样本。

一种可能的实施方式中，根据所述待处理的相似样本中所述第二对象类型对应的样本信息的特征向量与预设权重系数，得到所述待处理的相似样本中所述第二对象类型对应的新的样本信息的特征向量，包括：

当所述待处理的相似样本的样本选取数量为至少一个时，将每个待处理的相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数相乘，得到所述每个待处理的相似样本中所述第二对象类型对应的新的样本信息的特征向量；或者，

当所述待处理的相似样本的样本选取数量为至少两个时，将所述至少两个待处理的相似样本中每个待处理的相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数进行加权求和，得到所述至少两个待处理的相似样本中所述第二对象类型对应的一个新的样本信息的特征向量。

该实施方式在当前训练样本第一对象类型对应的样本信息不变的情况下，通过对各相似样本中第二对象类型对应的样本信息的特征向量与预设权重系数的加权求和，获取到训练样本集中不存在的第二对象类型对应的样本信息，从而通过将新的样本信息的特征向量，替换当前训练样本中第二对象类型对应的样本信息的特征向量，得到当前训练样本对应的新训练样本，确保了该新训练样本是与训练样本集中的各训练样本不同的训练样本。

根据本公开实施例的第二方面，提供一种数据处理装置，该装置可以包括：

获取单元，被配置为执行获取训练样本集，所述训练样本集包括训练样本和所述训练样本对应的样本标签；所述训练样本包括两种对象类型对应的样本信息，所述两种对象类型包括账户类型和多媒体类型，所述两种对象类型对应的样本信息包括用户账户信息和多媒体资源信息；所述样本标签表征所述用户账户信息对应的账户对所述多媒体资源信息对应的多媒体资源间的操作行为；

确定单元，被配置为执行确定所述训练样本集中的待处理训练样本集；遍历所述待处理训练样本集，针对遍历到的当前训练样本，执行如下步骤：

训练单元，被配置为执行基于所述训练样本集中的训练样本和相应样本标签，以及所述待处理训练样本集中每个训练样本对应的新训练样本和相应样本标签，对神经网络模型进行迭代训练，得到推荐模型。

一种可能的实施方式中，所述用户账户信息包括账户标识；

在所述第一对象类型对应的样本信息为所述用户账户信息时，所述确定单元，具体被配置为执行：

获取历史累计样本中各账户标识的数量；

在所述第一对象类型对应的样本信息为所述多媒体资源信息时，所述确定单元，具体被配置为执行：

获取存储的历史累计样本中各多媒体标识的数量；

一种可能的实施方式中，所述确定单元，还具体被配置为执行：

以及，将满足预设筛选条件的相似度对应的第一训练样本确定为所述当前训练样本的相似样本。

所述确定单元，还具体被配置为执行：

获取所述当前训练样本的所述账户标识和所述账户特征分别与所述第一训练样本中各训练样本的所述账户标识和所述账户特征的相似度；或者，获取所述当前训练样本的所述账户标识或所述账户特征分别与所述第一训练样本中各训练样本的所述账户标识或所述账户特征的相似度。

所述确定单元，还具体被配置为执行：

获取所述当前训练样本的所述多媒体标识和所述多媒体特征分别与所述第一训练样本中各训练样本的所述多媒体标识和所述多媒体特征的相似度；或者，获取所述当前训练样本的所述多媒体标识或所述多媒体特征分别与所述第一训练样本中各训练样本的所述多媒体标识或所述多媒体特征的相似度。

以及，从所述当前训练样本的相似样本中，选取所述样本选取数量的相似样本作为待处理的相似样本；

所述确定单元，还具体被配置为执行：

以及，根据所述待处理的相似样本中所述第二对象类型对应的样本信息的特征向量与预设权重系数，得到所述待处理的相似样本中所述第二对象类型对应的新的样本信息的特征向量；

当所述待处理的相似样本的样本选取数量为至少一个时，将每个待处理的相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数相乘，得到所述每个待处理的相似样本中所述第二对象类型对应的新的样本信息的特征向量；或者，当所述待处理的相似样本的样本选取数量为至少两个时，将所述至少两个待处理的相似样本中每个待处理的相似样本的所述第二对象类型对应的样本信息的特征向量与预设权重系数进行加权求和，得到所述至少两个待处理的相似样本中所述第二对象类型对应的一个新的样本信息的特征向量。

根据本公开实施例的第三方面，提供一种电子设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现上述第一方面中所述的任一方法步骤。

根据本公开实施例的第四方面，提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行上述第一方面中所述的任一方法步骤。

根据本公开实施例的第五方面，提供一种计算机程序产品，包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现上述第一方面中所述的任一方法步骤。

本公开的实施例提供的技术方案至少带来以下有益效果：

本公开实施例提供的推荐模型的训练方法在获取训练样本集后，训练样本集包括训练样本和训练样本对应的样本标签；训练样本包括两种对象类型对应的样本信息，两种对象类型包括账户类型和多媒体类型，两种对象类型对应的样本信息包括用户账户信息和多媒体资源信息；样本标签表征用户账户信息对应的账户对多媒体资源信息对应的多媒体资源间的操作行为，确定训练样本集中的待处理训练样本集；遍历待处理训练样本集，针对遍历到的当前训练样本，执行如下步骤：根据当前训练样本中第一对象类型对应的样本信息，在第一训练样本中确定当前训练样本的相似样本；第一对象类型是训练样本中的一种对象类型；第一训练样本为训练样本集中除当前训练样本外的其他训练样本；将相似样本中的第二对象类型对应的样本信息，对当前训练样本中的第二对象类型对应的样本信息进行替换，将替换后的当前训练样本作为新训练样本，并将相应相似样本的样本标签确定为新训练样本的样本标签；第二对象类型是训练样本中除第一对象类型外的类型；最后，基于训练样本集中的训练样本和相应样本标签，以及待处理训练样本集中每个训练样本对应的新训练样本和相应样本标签，对神经网络模型进行迭代训练，得到推荐模型。该方法通过在样本信息层面进行对相应用户账户或多媒体资源对应的样本进行扩展，得到扩展出的针对相应用户账户或多媒体资源的新样本，使推荐模型在训练样本集中存在某些用户账户或某些多媒体资源对应的有限样本时，导致训练出的推荐模型不准确的问题，增强训练出的推荐模型的鲁棒性，提高了推荐模型的推荐准确率。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

图1是根据一示例性实施例示出的一种推荐***的训练方法的流程示意图。

图2是根据一示例性实施例示出的一种推荐模型的训练方法的流程示意图。

图3是根据一示例性实施例示出的一种推荐模型的训练装置的结构框图。

图4是根据一示例性实施例示出的一种电子设备的结构框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案，下面将结合附图，对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、 “第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开实施例提供的推荐模型的训练方法可以由终端设备执行，也可以由为该终端设备提供服务的服务器执行。

该终端设备可以是移动终端、固定终端或便携式终端，例如移动手机、站点、单元、设备、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信 ***设备、个人导航设备、个人数字助理、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合，包括这些设备的配件和外设或者其任意组合。还可预见到的是，终端设备能够支持任意类型的针对用户的接口(例如可穿戴设备)等。

该服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式***，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务以及大数据和人工智能平台等基础云计算服务的云服务器。

互联网多媒体的快速发展产生了大量的信息，一方面满足了用户对信息的需求，但另一方面，用户难以从大量信息中获取到有用的内容，即存在信息过载问题，降低了用户对信息的使用效率，推荐***是解决信息过载问题的一个很有用的方法。目前推荐***已经广泛应用于商品、短视频、音乐、新闻等领域的推荐应用中。

目前，在这些推荐应用中的推荐***均是由相应推荐应用中产生的数据对神经网络进行训练得到的，如图1所示，以一个训练样本为例，通常推荐*** 的训练方法可以包括：

步骤S110、获取1个训练样本和该训练样本的样本标签。

该训练样本可以包括两种对象类型对应的样本信息。

两种对象类型包括账户类型和多媒体类型，两种对象类型对应的样本信息包括用户账户信息和多媒体资源信息。样本标签用于表征用户账户信息对应的账户对多媒体资源信息对应的多媒体资源间的操作行为。

其中，用户账户信息可以包括账户标识(User Identification，UID)和账户特征；账户标识UID可以是用户标识。账户特征可以包括姓名、性别、年龄、身高、体重、消费力等。

多媒体资源信息可以包括多媒体标识(Product Identification，PID)和多媒体特征。多媒体特征可以包括多媒体资源的标题、类目、价格、尺寸、颜色等。

步骤S120、获取训练样本中各信息对应的特征向量。

该训练样本中的多媒体特征和账户特征可以包括稠密dense特征和稀疏 sparse特征。其中，dense特征是指不能用数字标识距离关系的特征，如职业、学历等。sparse特征是指能用数字标识距离关系的特征，如身高、体重等。

将多媒体标识PID、账户标识UID以及sparse特征分别转为相应的特征向量，如词向量，以及，将dense特征转为相应的dense特征的特征向量，如词向量。

需要说明的是，多媒体标识PID对应的词向量、账户标识UID对应的词向量以及sparse特征对应的词向量均是预先配置的，本公开实施例在此不做赘述。

步骤S130、采用预设链接concat方式，将得到的各特征向量与相应的dense 特征的特征向量进行合并，得到该训练样本对应的输入向量。

其中，预设链接concat方式是对向量进行融合处理。例如，假设第一向量为：[1，2，3]，第二向量为：[4，5，6]，第三向量为：[7，8，9]，那么，对这3个向量进行融合处理，可得到向量：{[1，2，3]，[4，5，6]，[7，8，9]}。

步骤S140、基于该输入向量和相应样本标签，对神经网络进行训练，得到推荐模型。

由于推荐***中常常存在长尾问题：用户账户对应的历史操作行为较少的长尾用户账户问题，或多媒体资源对应的历史***作行为较少的长尾多媒体资源问题，将影响训练出的推荐模型的推荐准确率。

其中，长尾用户账户问题是指用户账户的有效样本量(或称“用户账户的历史操作行为的样本量”)较少的问题；长尾多媒体资源问题是指多媒体资源的有效样本量(或称“多媒体资源的历史***作的样本量”)较少的问题。有效样本量是指作为训练样本的数量。对此本公开提供了一种推荐模型的训练方法，通过增加相应账户标识或多媒体标识对应的有效样本量，来提高训练出的推荐模型的预测准确率。

以下结合说明书附图对本公开的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本公开，并不用于限定本公开，并且在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。

图2是根据一示例性实施例示出的一种推荐模型的训练方法的流程示意图，如图1所示，该方法可以包括以下步骤：

步骤S210、获取训练样本集。

用户账户通过智能终端使用业务应用，如多媒体应用的过程中会产生业务数据，可以将近期产生的业务数据确定为训练样本，也可以从历史业务数据中选出部分业务数据作为训练样本，以获取到训练样本集X。

训练样本集包括训练样本和训练样本对应的样本标签；训练样本包括两种对象类型对应的样本信息，两种对象类型包括账户类型和多媒体类型，两种对象类型对应的样本信息包括用户账户信息和多媒体资源信息；样本标签表征用户账户信息对应的账户对多媒体资源信息对应的多媒体资源间的操作行为。

其中，用户账户信息可以包括账户标识UID和账户特征；多媒体资源信息可以包括多媒体标识PID和多媒体特征。例如，训练样本为“一名学生账户关注了一个美食视频”，该训练样本包括该账户的账户标识UID、账户特征为学生、美食视频的视频标识PID、多媒体特征为美食领域，其中，“关注”行为为该训练样本的样本标签。

为了提高推荐的准确性，该训练样本还可以包括多媒体标识和账户标识对应的上下文信息。

例如，训练样本为“一名学生账户在每天12点都关注一个美食视频”，该训练样本包括该账户的账户标识UID、账户特征为学生、美食视频的视频标识 PID、多媒体特征为美食领域，上下文信息为每天12点。

步骤S220、确定训练样本集中的待处理训练样本集。

在一些实施例中，确定训练样本集中的待处理训练样本集可以包括以下方式：

方式一，可以直接将训练样本集中预设样本数量的训练样本组成的集合，确定为待处理训练样本集。其中，预设样本数量可以为训练样本集中训练样本的总数量或部分数量。例如，训练样本集中训练样本的总数量为N个，则预设样本数量为M，其中，M大于0，且不大于N。该预设样本数量可以根据实际业务需求进行确定，本公开在此不做限定。

方式二，由于训练样本中的两种对象类型，且一种对象类型为用户账户，另一种对象类型为多媒体资源，故可以先确定训练样本集中用户账户或多媒体资源是否存在长尾问题，若不存在长尾问题，则可以直接利用该训练样本集训练推荐***，如图1所示；

若存在长尾问题，则需要确定训练样本集中的待处理训练样本集。

(1)在第一对象类型为账户类型，第一对象类型对应的样本信息为用户账户信息时，可以获取存储的历史累计样本中各账户标识的数量；第一对象类型是训练样本中的一种对象类型，即用户账户或多媒体资源。

若目标账户标识的数量小于预设数量阈值，则将训练样本集中目标账户标识对应的训练样本确定为待处理训练样本，并基于确定的待处理训练样本，构建待处理训练样本集。其中，该目标账户标识为训练样本集中的一个账户标识。

例如，以存储的历史累计样本中包括账户标识UID1、UID2、UID3和UID4 对应的样本，预设数量阈值为10为例。在历史累计样本中查找到账户标识UID1、 UID2、UID3和UID4出现的次数依次为5次、14次、2次和9次，由于预设数量阈值为10，故此时得到账户标识UID1、UID3和UID4对应的有效样本量较少，即账户标识UID1、UID3和UID4对应的用户账户存在长尾问题，且训练样本集中存在账户标识UID1和UID4，故将账户标识UID1和UID4对应的训练样本确定为待处理训练样本，由账户标识UID1对应的待处理训练样本和 UID4对应的待处理训练样本组成待处理训练样本集。

该实施方式通过查询历史累计样本中各账户标识的数量可准确的确定出目标账户标识对应的用户账户是否存在有效样本量少的问题，若存在，则将训练样本集中目标账户标识对应的训练样本作为待处理训练样本，以实现后期针对该待处理训练样本进行样本扩展。

(2)在第一对象类型为多媒体类型，第一对象类型对应的样本信息为多媒体资源信息时，可以获取存储的历史累计样本中各多媒体标识的数量。

若目标多媒体标识的数量小于预设数量阈值，则将训练样本集中目标多媒体标识对应的训练样本确定为待处理训练样本，并基于确定的待处理训练样本，构建待处理训练样本集。其中，该目标多媒体标识为训练样本集中的一个多媒体标识。

例如，以存储的历史累计样本中包括多媒体标识PID1、PID2和PID3对应的样本，预设数量阈值为10为例。在历史累计样本中查找到多媒体标识PID1、 PID2和PID3出现的次数依次为20次、3次和13次。由于预设数量阈值为10，故此时得到多媒体标识PID2对应的样本有效样本量较少，即多媒体标识PID2 对应的多媒体资源存在长尾问题，且训练样本集中存在多媒体标识PID2，故将多媒体标识PID2对应的训练样本确定为待处理训练样本，由多媒体标识 PID2对应的待处理训练样本组成待处理训练样本，即该待处理训练样本中仅包括一个待处理训练样本。

步骤S230、遍历待处理训练样本集，获取待处理训练样本集中各训练样本对应的新训练样本。

具体实施中，在遍历待处理训练样本集过程中，针对遍历到的当前训练样本，需要执行如下步骤：

步骤一，根据当前训练样本中第一对象类型对应的样本信息，在第一训练样本中确定当前训练样本的相似样本。第一训练样本为训练样本集中除当前训练样本外的其他训练样本，也就是说，第一训练样本可以是待处理训练样本集中除当前训练样本外的其他待处理训练样本，也可以是除待处理训练样本集外的其他待处理训练样本。

具体的，可通过余弦相似度算法、欧式距离算法等现有算法，获取当前训练样本的第一对象类型对应的样本信息与第一训练样本的第一对象类型对应的样本信息的相似度；并将满足预设筛选条件的相似度对应的第一训练样本确定为当前训练样本的相似样本。当前训练样本的相似样本的数量可以为多个。

其中，预设筛选条件可以是大于预设相似度阈值的条件、最大相似度的选取条件、按照相似度从大到小顺序选取前预设数量的选取条件等能够实现对相似度筛选的条件，本公开在此不做限定。

例如，若预设筛选条件为大于预设相似度阈值的条件，则此时当前训练样本的相似样本的数量可以为至少一个。

若预设筛选条件为最大相似度的选取条件，则此时当前训练样本的相似样本的数量仅为一个。

若预设筛选条件为按照相似度从大到小顺序选取前预设数量的选取条件，则此时当前训练样本的相似样本的数量为预设数量个。

步骤二，将相似样本中的第二对象类型对应的样本信息，对当前训练样本中的第二对象类型对应的样本信息进行替换，将替换后的当前训练样本作为新训练样本，并将相应相似样本的样本标签确定为新训练样本的样本标签。其中，第二对象类型是训练样本中除第一对象类型外的类型，也就是说，第一对象类型为账户类型时，第二对象类型为多媒体类型；第一对象类型为多媒体类型时，第二对象类型为账户类型。

在一些实施例中，针对每个相似样本，可以将该相似样本中的第二对象类型对应的样本信息，替换当前训练样本中的第二对象类型对应的样本信息，并将替换后的当前训练样本作为新训练样本，以及将相应相似样本的样本标签确定为该新训练样本的样本标签。这样就可以得到每个相似样本对应的新训练样本和相应新训练样本的样本标签。

在一些实施例中，在当前训练样本存在大量满足预设筛选条件的相似度对应的相似样本时，按照上述实施方式会得到大量的新训练样本，由于新训练样本并不是真实存在的，而是基于当前训练样本的真实相似样本虚构的，故大量的新训练样本可能会导致后期训练的推荐模型的推荐准确率，因此需要控制新训练样本的获取数量。

具体实施中，根据当前训练样本对应的相似样本的数量和样本选取权重，确定样本选取数量。样本选取权重可以是对满足预设筛选条件的相似度进行归一化处理后得到的，即将该相似度归一化到[0,1]之间。

其中，该满足预设筛选条件的相似度为满足预设筛选条件的至少一个相似度中的一个，具体可以根据实际业务需求，从满足预设筛选条件的至少一个相似度中选取最小相似度，或该至少一个相似度的平均相似度。该归一化处理方式可以是现有的任一归一化算法，本公开在此不做限定。

可以理解的是，样本选取权重也可以是根据不同业务需求设定的随机权重，还可以是预先设置的固定权重，本公开在此不做限定。

之后，从当前训练样本的相似样本中，选取样本选取数量的相似样本作为待处理的相似样本；并根据待处理的相似样本中第二对象类型对应的样本信息，对当前训练样本中第二对象类型对应的样本信息进行替换，将替换后的当前训练样本作为新训练样本，以及将相应相似样本的样本标签确定为该新训练样本的样本标签。

上述实施例为了扩展出与当前训练样本中第一对象类型对应的有效数量的有效样本，通过先获取当前训练样本的相似样本，再按照当前训练样本中的第一对象类型查找样本选取数量的相似样本，以避免相似样本过多影响推荐模型的准确率，再基于样本选取数量的相似样本中的第二对象类型对应的样本信息对当前训练样本中第二对象类型对应的样本信息进行替换，可快速得到较真实的新训练样本，提高了新训练样本的获取效率。

进一步的，由于待处理训练样本集可以由小于预设数量阈值的账户标识对应的待处理训练样本组成，也可以由小于预设数量阈值的多媒体标识对应的待处理训练样本组成，故遍历待处理训练样本集包括遍历小于预设数量阈值的账户标识对应的待处理训练样本集，以及遍历小于预设数量阈值的多媒体标识对应的待处理训练样本集。

(1)在遍历小于预设数量阈值的账户标识对应的待处理训练样本集过程中，第一对象类型对应的样本信息为用户账户信息，针对遍历到的当前训练样本，需要执行如下步骤：

首先，获取当前训练样本的用户账户信息与第一训练样本的用户账户信息的相似度。其中，用户账户信息包括账户标识和账户特征，故可以获取账户标识和账户特征的组合信息对应的相似度，也可以获取账户标识或账户特征对应的相似度。

具体实施中，对于获取账户标识和账户特征的组合信息对应的相似度的情况：

获取当前训练样本的账户标识和账户特征与第一训练样本中各训练样本的账户标识和账户特征的相似度；具体的，获取账户标识的特征向量和账户特征的特征向量对应的第一特征融合向量，以及第一训练样本中各训练样本的账户标识的特征向量和账户特征的特征向量对应的第二特征融合向量；其中，可按照concat方式进行向量的融合。

采用相似度算法，计算第一特征融合向量与第二特征融合向量间的相似度，从而获取到账户标识和账户特征的组合信息对应的相似度。

对于获取账户标识或账户特征对应的相似度对应的相似度的情况：

获取当前训练样本的账户标识或账户特征与第一训练样本中各训练样本的账户标识或账户特征的相似度。具体的，获取当前训练样本中账户标识的特征向量，以及第一训练样本中各训练样本的账户标识的特征向量；采用相似度算法，分别计算当前训练样本的账户标识的特征向量与第一训练样本中各训练样本的账户标识的特征向量的相似度；

或者，获取当前训练样本中账户特征的特征向量，以及第一训练样本的账户特征的特征向量；采用相似度算法，计算当前训练样本的账户特征的特征向量与第一训练样本的账户特征的特征向量的相似度。

可见，该实施方式通过用户账户信息中的账户标识和账户特征来获取与当前训练样本中用户账户信息对应的相似样本，以得到在相同账户标识和/或账户特征的情况下，与当前训练样本存在较强关联程度的相似样本。

其次，将满足预设筛选条件的相似度对应的第一训练样本确定为当前训练样本的相似样本。

然后，根据当前训练样本对应的相似样本的数量和样本选取权重，确定样本选取数量，并从当前训练样本的相似样本中，选取该样本选取数量的相似样本作为待处理的相似样本。

最后，由于第一对象类型对应的样本信息为用户账户信息，故第二对象类型对应的样本信息为多媒体资源信息。此时将待处理的相似样本中的多媒体资源信息，替换当前训练样本中的多媒体资源信息，并将替换后的当前训练样本作为新训练样本，以及将相应相似样本的样本标签确定为该新训练样本的样本标签。

(2)在遍历小于预设数量阈值的多媒体标识对应的待处理训练样本集过程中，第一对象类型对应的样本信息为多媒体资源信息，针对遍历到的当前训练样本，需要执行如下步骤：

首先，获取当前训练样本的多媒体标识和多媒体特征与第一训练样本中各训练样本的多媒体标识和多媒体特征的相似度；

具体的，获取当前训练样本的多媒体资源信息与第一训练样本的多媒体资源信息的相似度。其中，多媒体资源信息包括多媒体标识和多媒体特征，故可以获取多媒体标识和多媒体特征的组合信息对应的相似度，也可以获取多媒体标识或多媒体特征对应的相似度。

具体实施中，对于获取多媒体标识和多媒体特征的组合信息对应的相似度的情况：

获取当前训练样本的多媒体标识和多媒体特征与第一训练样本中各训练样本的多媒体标识和多媒体特征的相似度；具体的，获取多媒体标识的特征向量和多媒体特征的特征向量对应的第三特征融合向量，以及第一训练样本中各训练样本的多媒体标识的特征向量和多媒体特征的特征向量对应的第四特征融合向量；其中，可按照concat方式进行向量的融合。

采用相似度算法，计算第三特征融合向量与第四特征融合向量间的相似度，从而获取到多媒体标识和多媒体特征的组合信息对应的相似度。

该实施方式通过多媒体资源信息中的多媒体标识和/或多媒体特征来获取与当前训练样本中多媒体标识和/或多媒体特征对应的相似样本，以得到在相同多媒体标识和/或多媒体特征的情况下，与当前训练样本存在较强关联程度的相似样本。

对于获取多媒体标识或多媒体特征对应的相似度对应的相似度的情况：

获取当前训练样本的多媒体标识或多媒体特征与第一训练样本的多媒体标识或多媒体特征的相似度。具体的，获取当前训练样本中多媒体标识的特征向量，以及第一训练样本中各训练样本的多媒体标识的特征向量；采用相似度算法，计算当前训练样本的多媒体标识的特征向量与第一训练样本中各训练样本的多媒体标识的特征向量的相似度；

或者，获取当前训练样本中多媒体特征的特征向量，以及第一训练样本的多媒体特征的特征向量；采用相似度算法，计算当前训练样本的多媒体特征的特征向量与第一训练样本中各训练样本的多媒体特征的特征向量的相似度。

该实施方式通过多媒体资源信息中的多媒体标识和多媒体特征来获取与当前训练样本中多媒体资源信息对应的相似样本，以得到在相同多媒体标识和 /或多媒体特征的情况下，与当前训练样本存在较强关联程度的相似样本。

最后，由于第一对象类型对应的样本信息为多媒体资源信息，故第二对象类型对应的样本信息为用户账户信息。此时将待处理的相似样本中的多媒体资源信息，替换当前训练样本中的多媒体资源信息，并将替换后的当前训练样本作为新训练样本，以及将相应相似样本的样本标签确定为该新训练样本的样本标签。

在一些可能的实施例中，为了进一步扩展出新训练样本，在将待处理的相似样本中的第二对象类型对应的样本信息，对当前训练样本中的第二对象类型对应的样本信息进行替换还可以包括以下两种方式：

方式一，获取待处理的相似样本中第二对象类型对应的样本信息的特征向量，以及当前训练样本中第二对象类型对应的样本信息的特征向量；

根据待处理的相似样本中第二对象类型对应的样本信息的特征向量与预设权重系数，得到待处理的相似样本中第二对象类型对应的新的样本信息的特征向量；

基于第二对象类型对应的新的样本信息的特征向量，对当前训练样本中第二对象类型对应的样本信息的特征向量进行替换，将替换后的所述当前训练样本作为新训练样本。

方式二，当待处理的相似样本的样本选取数量为至少一个时，将每个待处理的相似样本的第二对象类型对应的样本信息的特征向量与预设权重系数相乘，得到每个待处理的相似样本中第二对象类型对应的新的样本信息的特征向量；或者，当待处理的相似样本的样本选取数量为至少两个时，将至少两个待处理的相似样本中每个待处理的相似样本的第二对象类型对应的样本信息的特征向量与预设权重系数进行加权求和，得到至少两个待处理的相似样本中第二对象类型对应的一个新的样本信息的特征向量。

综合上述实施例可知本公开实施例可以针对小于预设数量阈值的账户标识对应的待处理训练样本集，以及小于预设数量阈值的多媒体标识对应的待处理训练样本集进行训练样本进行多训练样本的扩展，且仅通过相似样本中用户账户信息或多媒体资源信息与当前训练样本中用户账户信息或多媒体资源信息进行替换，即可得到新的训练样本，提高了新训练样本的获取速度。

步骤S240、基于训练样本集中的训练样本和相应样本标签，以及新训练样本和相应样本标签，对神经网络模型进行迭代训练，得到推荐模型。

在得到各相似样本对应的新训练样本之后，将新训练样本和相应样本标签添加入步骤S210获取的训练样本集中，得到当前训练样本集，由此扩充了训练样本的数量，提高了模型训练的准确率。

针对当前训练样本集中的各训练样本和相应的样本标签，对神经网络模型进行训练，得到推荐模型，具体可参考图1所示的推荐***的训练方法，本公开实施例在此不再赘述。

为了进一步提高推荐***的推荐准确率，在当前训练样本集对神经网络模型进行训练得到推荐模型后，可以再次获取新的训练样本集，即返回执行步骤 210进行新一轮的训练样本扩展和推荐模型的训练。其中，在不同轮次的训练样本扩展方案中每次对训练样本进行扩展时涉及的样本选取权重需要根据业务需求进行重新设置，且执行的次数可按照模型训练速度或最终训练出的推荐模型的推荐准确率来调整。

本公开实施例提供的推荐模型的训练方法在获取训练样本集后，训练样本集包括训练样本和训练样本对应的样本标签；训练样本包括两种对象类型对应的样本信息，两种对象类型包括账户类型和多媒体类型，两种对象类型对应的样本信息包括用户账户信息和多媒体资源信息；样本标签表征用户账户信息对应的账户对多媒体资源信息对应的多媒体资源间的操作行为，确定训练样本集中的待处理训练样本集；遍历待处理训练样本集，针对遍历到的当前训练样本，执行如下步骤：根据当前训练样本中第一对象类型对应的样本信息，在第一训练样本中确定当前训练样本的相似样本；第一对象类型是训练样本中的一种对象类型；第一训练样本为训练样本集中除当前训练样本外的其他训练样本；将相似样本中的第二对象类型对应的样本信息，对当前训练样本中的第二对象类型对应的样本信息进行替换，将替换后的当前训练样本作为新训练样本，并将相应相似样本的样本标签确定为新训练样本的样本标签；第二对象类型是训练样本中除第一对象类型外的类型；最后，基于训练样本集中的训练样本和相应样本标签，以及待处理训练样本集中每个训练样本对应的新训练样本和相应样本标签，对神经网络模型进行迭代训练，得到推荐模型。

可见，该方法通过在样本信息层面进行对相应用户账户或多媒体资源对应的样本进行扩展，得到扩展出的针对相应用户账户或多媒体资源的新样本，使推荐模型在训练样本集中存在某些用户账户或某些多媒体资源对应的有限样本时，导致训练出的推荐模型不准确的问题，增强训练出的推荐模型的鲁棒性，提高了推荐模型的推荐准确率。

且，本公开实施例是在在样本信息层面进行对相应用户账户或多媒体资源对应的样本进行扩展，不需要修改待训练的推荐模型的模型结构以及相应损失函数，故本公开实施例提供的推荐模型的训练方法可以适用任何领域中推荐系统的训练过程。

图3是根据一示例性实施例示出的一种数据处理装置的结构框图。参照图 3，该装置可以包括获取单元310、确定单元320和训练单元330。

该获取单元310，被配置为执行获取训练样本集，所述训练样本集包括训练样本和所述训练样本对应的样本标签；所述训练样本包括两种对象类型对应的样本信息，所述两种对象类型包括账户类型和多媒体类型，所述两种对象类型对应的样本信息包括用户账户信息和多媒体资源信息；所述样本标签表征所述用户账户信息对应的账户对所述多媒体资源信息对应的多媒体资源间的操作行为；

确定单元320，被配置为执行确定所述训练样本集中的待处理训练样本集；遍历所述待处理训练样本集，针对遍历到的当前训练样本，执行如下步骤：

训练单元330，被配置为执行基于所述训练样本集中的训练样本和相应样本标签，以及所述待处理训练样本集中每个训练样本对应的新训练样本和相应样本标签，对神经网络模型进行迭代训练，得到推荐模型。

一种可能的实施方式中，所述用户账户信息包括账户标识；

在所述第一对象类型对应的样本信息为所述用户账户信息时，确定单元 320，具体被配置为执行：

获取历史累计样本中各账户标识的数量；

在所述第一对象类型对应的样本信息为所述多媒体资源信息时，确定单元 320，具体被配置为执行：

获取存储的历史累计样本中各多媒体标识的数量；

一种可能的实施方式中，确定单元320，还具体被配置为执行：

确定单元320，还具体被配置为执行获取所述当前训练样本的所述账户标识和所述账户特征分别与所述第一训练样本中各训练样本的所述账户标识和所述账户特征的相似度；或者，获取所述当前训练样本的所述账户标识或所述账户特征分别与所述第一训练样本中各训练样本的所述账户标识或所述账户特征的相似度。

确定单元320，还具体被配置为执行获取所述当前训练样本的所述多媒体标识和所述多媒体特征分别与所述第一训练样本中各训练样本的所述多媒体标识和所述多媒体特征的相似度；或者，获取所述当前训练样本的所述多媒体标识或所述多媒体特征分别与所述第一训练样本中各训练样本的所述多媒体标识或所述多媒体特征的相似度。

确定单元320，还具体被配置为执行将所述待处理的相似样本中的所述多媒体资源信息，替换所述当前训练样本中的所述多媒体资源信息，并将替换后的所述当前训练样本作为新训练样本。

确定单元320，还具体被配置为执行将所述待处理的相似样本中的所述用户账户信息，替换所述当前训练样本中的所述用户账户信息，并将替换后的所述当前训练样本作为新训练样本。

本公开上述实施例提供的数据处理装置的各功能单元的功能，可以通过上述各方法步骤来实现，因此，本公开实施例提供的数据处理装置中的各个单元的具体工作过程和有益效果，在此不复赘述。

下面参照图4来描述根据本公开的这种实施方式的电子设备130。如图4 所示，电子设备130以通用计算装置的形式表现。电子设备130的组件可以包括但不限于：上述至少一个处理器131、上述至少一个存储器132、连接不同 ***组件(包括存储器132和处理器131)的总线133。

总线133表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、***总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储器132可以包括易失性存储器形式的可读介质，例如随机存取存储器 (RAM)1321和/或高速缓存存储器1322，还可以进一步包括只读存储器(ROM) 1323。

存储器132还可以包括具有一组(至少一个)程序模块1324的程序/实用工具1325，这样的程序模块1324包括但不限于：操作***、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。

电子设备130也可以与一个或多个外部设备134(例如键盘、指向设备等) 通信，和/或与使得该电子设备130能与一个或多个其它计算装置进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O) 接口135进行。并且，电子设备130还可以通过网络适配器136与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网) 通信。如图所示，网络适配器136通过总线133与用于电子设备130的其它模块通信。应当理解，尽管图中未示出，可以结合电子设备130使用其它硬件和 /或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。

在一些可能的实施方式中，本公开提供的推荐模型的训练方法的各个方面还可以实现为一种程序产品的形式，其包括计算机程序，当程序产品在计算机设备上行驶时，计算机程序用于使计算机设备执行本说明书上述描述的根据本公开各种示例性实施方式的推荐模型的训练方法的步骤，例如，电子设备可以执行图2中的方法步骤。

程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器 (CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

本公开的实施方式的用于数据处理的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括计算机程序，并可以在计算装置上行驶。然而，本公开的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式，包括—— 但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的计算机程序可以用任何适当的介质传输，包括——但不限于——无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的计算机程序，程序设计语言包括面向对象的程序设计语言—诸如Java、C++ 等，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。计算机程序可以完全地在目标对象计算装置上执行、部分地在目标对象设备上执行、作为一个独立的软件包执行、部分在目标对象计算装置上部分在远程计算装置上执行、或者完全在远程计算装置或服务器上执行。在涉及远程计算装置的情形中，远程计算装置可以通过任意种类的网络——包括局域网(LAN) 或广域网(WAN)—连接到目标对象计算装置，或者，可以连接到外部计算装置(例如利用因特网服务提供商来通过因特网连接)。

应当注意，尽管在上文详细描述中提及了装置的若干单元或子单元，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之，上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。

此外，尽管在附图中以特定顺序描述了本公开方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

本领域内的技术人员应明白，本公开的实施例可提供为方法、***、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用计算机程序的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和 /或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/ 或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本公开的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本公开范围的所有变更和修改。

显然，本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种推荐模型的训练方法，其特征在于，所述方法包括：

从所述训练样本集中选择存在长尾问题的用户账户或多媒体资源对应的训练样本，构建待处理训练样本集；

遍历所述待处理训练样本集，针对遍历到的当前训练样本，执行如下步骤：

2.如权利要求1所述的方法，其特征在于，所述用户账户信息包括账户标识；

在所述第一对象类型对应的样本信息为所述用户账户信息时，从所述训练样本集中选择存在长尾问题的用户账户或多媒体资源对应的训练样本，构建待处理训练样本集，包括：

获取历史累计样本中各账户标识的数量；

3.如权利要求1所述的方法，其特征在于，所述多媒体资源信息包括多媒体标识；

在所述第一对象类型对应的样本信息为所述多媒体资源信息时，从所述训练样本集中选择存在长尾问题的用户账户或多媒体资源对应的训练样本，构建待处理训练样本集，包括：

获取存储的历史累计样本中各多媒体标识的数量；

4.如权利要求2或3所述的方法，其特征在于，根据所述当前训练样本中第一对象类型对应的样本信息，在第一训练样本中确定所述当前训练样本的相似样本，包括：

5.如权利要求4所述的方法，其特征在于，所述用户账户信息还包括账户特征；

获取所述当前训练样本的账户标识和所述账户特征分别与所述第一训练样本中各训练样本的账户标识和所述账户特征的相似度；或者，

获取所述当前训练样本的账户标识或所述账户特征分别与所述第一训练样本中各训练样本的账户标识或所述账户特征的相似度。

6.如权利要求4所述的方法，其特征在于，所述多媒体资源信息包括多媒体特征；

获取所述当前训练样本的多媒体标识和所述多媒体特征分别与所述第一训练样本中各训练样本的多媒体标识和所述多媒体特征的相似度；或者，

获取所述当前训练样本的多媒体标识或所述多媒体特征分别与所述第一训练样本中各训练样本的多媒体标识或所述多媒体特征的相似度。

7.如权利要求4所述的方法，其特征在于，将所述相似样本中的第二对象类型对应的样本信息，对所述当前训练样本中的第二对象类型对应的样本信息进行替换，将替换后的所述当前训练样本作为新训练样本，包括：

8.如权利要求7所述的方法，其特征在于，所述样本选取权重是对所述满足预设筛选条件的相似度进行归一化处理后得到的。

9.如权利要求7所述的方法，其特征在于，在所述第一对象类型对应的样本信息为所述用户账户信息时，所述第二对象类型对应的样本信息为所述多媒体资源信息；

10.如权利要求7所述的方法，其特征在于，在所述第一对象类型对应的样本信息为所述多媒体资源信息时，所述第二对象类型对应的样本信息为所述用户账户信息；

11.如权利要求7所述的方法，其特征在于，根据所述待处理的相似样本中所述第二对象类型对应的样本信息，对所述当前训练样本中所述第二对象类型对应的样本信息进行替换，将替换后的所述当前训练样本作为新训练样本，包括：

12.如权利要求11所述的方法，其特征在于，根据所述待处理的相似样本中所述第二对象类型对应的样本信息的特征向量与预设权重系数，得到所述待处理的相似样本中所述第二对象类型对应的新的样本信息的特征向量，包括：

13.一种推荐模型的训练装置，其特征在于，所述装置包括：

确定单元，被配置为执行从所述训练样本集中选择存在长尾问题的用户账户或多媒体资源对应的训练样本，构建待处理训练样本集；遍历所述待处理训练样本集，针对遍历到的当前训练样本，执行如下步骤：

14.如权利要求13所述的装置，其特征在于，所述用户账户信息包括账户标识；

获取历史累计样本中各账户标识的数量；

15.如权利要求13所述的装置，其特征在于，所述多媒体资源信息包括多媒体标识；

获取存储的历史累计样本中各多媒体标识的数量；

16.如权利要求14或15所述的装置，其特征在于，所述确定单元，还具体被配置为执行：

17.如权利要求16所述的装置，其特征在于，所述用户账户信息还包括账户特征；

所述确定单元，还具体被配置为执行获取所述当前训练样本的账户标识和所述账户特征分别与所述第一训练样本中各训练样本的账户标识和所述账户特征的相似度；或者，获取所述当前训练样本的账户标识或所述账户特征分别与所述第一训练样本中各训练样本的账户标识或所述账户特征的相似度。

18.如权利要求16所述的装置，其特征在于，所述多媒体资源信息包括多媒体特征；

所述确定单元，还具体被配置为执行获取所述当前训练样本的多媒体标识和所述多媒体特征分别与所述第一训练样本中各训练样本的多媒体标识和所述多媒体特征的相似度；或者，获取所述当前训练样本的多媒体标识或所述多媒体特征分别与所述第一训练样本中各训练样本的多媒体标识或所述多媒体特征的相似度。

19.如权利要求16所述的装置，其特征在于，所述确定单元，还具体被配置为执行：

20.如权利要求19所述的装置，其特征在于，所述样本选取权重是对所述满足预设筛选条件的相似度进行归一化处理后得到的。

21.如权利要求19所述的装置，其特征在于，在所述第一对象类型对应的样本信息为所述用户账户信息时，所述第二对象类型对应的样本信息为所述多媒体资源信息；

所述确定单元，还具体被配置为执行将所述待处理的相似样本中的所述多媒体资源信息，替换所述当前训练样本中的所述多媒体资源信息，并将替换后的所述当前训练样本作为新训练样本。

22.如权利要求19所述的装置，其特征在于，在所述第一对象类型对应的样本信息为所述多媒体资源信息时，所述第二对象类型对应的样本信息为所述用户账户信息；

所述确定单元，还具体被配置为执行将所述待处理的相似样本中的所述用户账户信息，替换所述当前训练样本中的所述用户账户信息，并将替换后的所述当前训练样本作为新训练样本。

23.如权利要求19所述的装置，其特征在于，所述确定单元，还具体被配置为执行：

24.如权利要求23所述的装置，其特征在于，所述确定单元，还具体被配置为执行：

25.一种电子设备，其特征在于，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为执行所述指令，以实现如权利要求1至12中任一项所述的方法。

26.一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由电子设备的处理器执行时，使得电子设备能够执行如权利要求1至12中任一项所述的方法。

27.一种计算机程序产品，包括计算机程序/指令，其特征在于，所述计算机程序/指令被处理器执行时实现权利要求1至12任一项所述的推荐模型的训练方法。