CN111428783A

CN111428783A - 对推荐模型的训练样本进行样本域转换的方法及装置

Info

Publication number: CN111428783A
Application number: CN202010205866.1A
Authority: CN
Inventors: 王冠楠
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Alipay Hangzhou Information Technology Co Ltd
Priority date: 2020-03-23
Filing date: 2020-03-23
Publication date: 2020-07-17
Anticipated expiration: 2040-03-23
Also published as: CN111428783B

Abstract

本说明书实施例提供了一种用于对训练样本进行样本域转换的方法及装置，在该方法中，获取第一样本域下的第一训练样本和第二样本域下的第二训练样本，使用第一样本迁移转换过程将第二训练样本迁移转换成第三训练样本，其中，第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的。在满足第一约束条件时将第三训练样本确定为第一样本域下的训练样本。

Description

对推荐模型的训练样本进行样本域转换的方法及装置

技术领域

本说明书实施例涉及机器学习技术领域，具体地，涉及对推荐模型的训练样本进行样本域转换的方法及装置。

背景技术

每个场景下的样本可以反映出该场景的业务特点，基于此，不同的场景下的样本会存在差异。例如，新零售时代推出的以适应大众的购物需求的“双十一”、“手机节”等各种业务模式，每种业务模式即是一种场景，不同的业务模式有不同的业务特点，比如，针对的消费群体、商品类型等不同，因此，不同的业务模式冷启动所需的样本会不同，比如，“手机节”场景下的样本主要是手机，而“双十一”场景下的样本主要是服装等。

对于较成熟的场景，样本的数量较丰富。而对于新场景来说，相应的样本数量会较少，甚至样本的数量达不到冷启动的要求。此时，需要增加新场景中的样本，一种增加方式是利用成熟场景中的样本来增加新场景中的样本。

发明内容

鉴于上述，本说明书实施例提供了一种对推荐模型的训练样本进行样本域转换的方法及装置。在该方法中，在获取第一样本域下的第一训练样本和第二样本域下的第二训练样本后，使用第一样本迁移转换过程将第二训练样本迁移转换成第一样本域下的第三训练样本，其中，第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的。通过上述方法，第一约束条件使得第三训练样本可以适用于第一样本域的场景，由此扩充了第一样本域下的训练样本，再利用扩充后的第一样本域下的训练样本可以训练出相应的推荐模型。

根据本说明书实施例的一个方面，提供了一种对推荐模型的训练样本进行样本域转换的方法，包括：获取第一样本域下的第一训练样本和第二样本域下的第二训练样本；其中，所述第一样本域下的训练样本被用来训练用于推荐第一类商品的第一推荐模型，所述第二样本域下的训练样本被用来训练用于推荐第二类商品的第二推荐模型，所述第一训练样本包括针对所述第一类商品的样本，所述第二训练样本包括针对所述第二类商品的样本；使用第一样本迁移转换过程来将所述第二训练样本迁移转换为第三训练样本；以及将所述第三训练样本确定为所述第一样本域下的训练样本，以使得基于所确定的训练样本来训练所述第一推荐模型，其中，所述第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的，所述第一约束条件包括：当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第一阈值，其中，每次迁移转换的分布式距离为该次迁移转换得到的第三训练样本与所述第一训练样本之间的分布式距离。

可选地，在上述方面的一个示例中，所述第一训练样本和所述第二训练样本是有监督训练样本，以及所述第一约束条件还包括：所述第三训练样本的训练误差小于第二阈值，以及所述第一训练样本的预测误差小于第三阈值，其中，所述第一训练样本的预测值是使用第一预测模型预测的，所述第一预测模型是利用所述第三训练样本训练出的。

可选地，在上述方面的一个示例中，还包括：使用第二样本迁移转换过程来将所述第三训练样本迁移转换为第四训练样本，其中，所述第二样本迁移转换过程是使用机器学习方法来在第二约束条件下实现的；以及将所述第三训练样本确定为所述第一样本域下的训练样本包括：当所述第四训练样本满足第三约束条件时，将所述第三训练样本确定为所述第一样本域下的训练样本，其中，所述第三约束条件包括：所述第四训练样本与所述第二训练样本之间的分布式距离小于第四阈值。

可选地，在上述方面的一个示例中，所述第二训练样本和所述第四训练样本是有监督训练样本，以及所述第三约束条件还包括：所述第四训练样本的训练误差小于第五阈值，以及所述第二训练样本的预测误差小于第六阈值，其中，所述第二训练样本的预测值是使用第二预测模型预测的，所述第二预测模型是利用所述第四训练样本训练出的。

可选地，在上述方面的一个示例中，还包括：当所述第四训练样本不满足第三约束条件时，将所述第四训练样本确定为第二样本域下的第二训练样本，并返回执行使用第一样本迁移转换过程来将第二训练样本迁移转换为第三训练样本的操作。

可选地，在上述方面的一个示例中，所述第二约束条件包括：循环次数，或者当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第七阈值，其中，每次迁移转换的分布式距离为该次迁移转换得到的第四训练样本与所述第二训练样本之间的分布式距离。

可选地，在上述方面的一个示例中，所述第一样本域是与少样本场景对应的样本域，以及所述第二样本域是与多样本场景对应的样本域。

可选地，在上述方面的一个示例中，分布式距离包括以下中的至少一种：欧式距离；KL散度；JS散度；和EM距离。

根据本说明书实施例的另一方面，还提供一种对推荐模型的训练样本进行样本域转换的装置，包括：训练样本获取单元获取第一样本域下的第一训练样本和第二样本域下的第二训练样本；其中，所述第一样本域下的训练样本被用来训练用于推荐第一类商品的第一推荐模型，所述第二样本域下的训练样本被用来训练用于推荐第二类商品的第二推荐模型，所述第一训练样本包括针对所述第一类商品的样本，所述第二训练样本包括针对所述第二类商品的样本；第一样本迁移转换单元使用第一样本迁移转换过程来将所述第二训练样本迁移转换为第三训练样本；以及第一训练样本确定单元将所述第三训练样本确定为所述第一样本域下的训练样本，以使得基于所确定的训练样本来训练所述第一推荐模型，其中，所述第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的，所述第一约束条件包括：当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第一阈值，其中，每次迁移转换的分布式距离为该次迁移转换得到的第三训练样本与所述第一训练样本之间的分布式距离。

可选地，在上述方面的一个示例中，还包括：第二样本迁移转换单元使用第二样本迁移转换过程来将所述第三训练样本迁移转换为第四训练样本，其中，所述第二样本迁移转换过程是使用机器学习方法来在第二约束条件下实现的；以及所述第一训练样本确定单元：当所述第四训练样本满足第三约束条件时，将所述第三训练样本确定为所述第一样本域下的训练样本，其中，所述第三约束条件包括：所述第四训练样本与所述第二训练样本之间的分布式距离小于第四阈值。

可选地，在上述方面的一个示例中，还包括：第二训练样本确定单元，当所述第四训练样本不满足第三约束条件时，将所述第四训练样本确定为第二样本域下的第二训练样本，并触发所述第一样本迁移转换单元执行使用第一样本迁移转换过程来将第二训练样本迁移转换为第三训练样本的操作。

根据本说明书实施例的另一方面，还提供一种电子设备，包括：至少一个处理器；以及存储器，所述存储器存储指令，当所述指令被所述至少一个处理器执行时，使得所述至少一个处理器执行如上所述的用于对训练样本进行样本域转换的方法。

根据本说明书实施例的另一方面，还提供一种机器可读存储介质，其存储有可执行指令，所述指令当被执行时使得所述机器执行如上所述的用于对训练样本进行样本域转换的方法。

附图说明

通过参照下面的附图，可以实现对于本说明书内容的本质和优点的进一步理解。在附图中，类似组件或特征可以具有相同的附图标记。附图是用来提供对本发明实施例的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本说明书的实施例，但并不构成对本说明书的实施例的限制。在附图中：

图1示出了本说明书的实施例的用于对训练样本进行样本域转换的方法的流程图；

图2示出了本说明书的实施例的第一样本迁移转换过程的一个示例的流程图；

图3示出了本说明书的另一实施例的用于对训练样本进行样本域转换的方法的流程图；

图4示出了本说明书的另一实施例的第二样本迁移转换过程的一个示例的流程图；

图5示出了本说明书的实施例的用于对训练样本进行样本域转换的装置的方框图；

图6示出了本说明书的另一实施例的用于对训练样本进行样本域转换的装置的方框图；和

图7示出了本说明书的实施例的用于对训练样本进行样本域转换的电子设备的方框图。

具体实施方式

以下将参考示例实施方式讨论本文描述的主题。应该理解，讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题，并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本说明书内容的保护范围的情况下，对所讨论的元素的功能和排列进行改变。各个示例可以根据需要，省略、替代或者添加各种过程或组件。另外，相对一些示例所描述的特征在其它例子中也可以进行组合。

如本文中使用的，术语“包括”及其变型表示开放的术语，含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义，无论是明确的还是隐含的。除非上下文中明确地指明，否则一个术语的定义在整个说明书中是一致的。

对于较成熟的场景，样本的数量较丰富。而对于新场景来说，相应的样本数量会较少，甚至样本的数量达不到冷启动的要求。此时，需要增加新场景中的样本。目前，一种增加方式是依赖于人工经验，即依靠具有丰富产品经验的专家选取适于新场景的样本。另一种增加方式是直接将成熟场景下的样本作为新场景中的样本。

然而，第一种方式依赖人工经验，导致人力资源的浪费，并且人工经验无法进行量化评估而导致所选取的样本不适用于新场景。第二种方式中会因为新场景和成熟场景的业务特点不同而导致成熟场景下的样本不适用于新场景。

为了解决上述问题，本说明书实施例提供了一种对推荐模型的训练样本进行样本域转换的方法及装置。在该方法中，在获取第一样本域下的第一训练样本和第二样本域下的第二训练样本后，使用第一样本迁移转换过程将第二训练样本迁移转换成第一样本域下的第三训练样本，其中，第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的。通过上述方法，将第二样本域下的训练样本迁移转换成第一样本域下的第三训练样本，第一约束条件使得第三训练样本可以适用于第一样本域的场景，由此扩充了第一样本域下的训练样本，再利用扩充后的第一样本域下的训练样本可以训练出相应的推荐模型。

下面将结合附图来详细描述根据本说明书实施例的对推荐模型的训练样本进行样本域转换的方法及装置。

图1示出了本说明书的实施例的对推荐模型的训练样本进行样本域转换的方法的流程图。

如图1所示，在块110，获取第一样本域下的第一训练样本和第二样本域下的第二训练样本。

在本说明书实施例中，第一样本域和第二样本域包括有多个训练样本，属于同一个样本域的训练样本是针对同一类商品的。第一训练样本包括针对第一类商品的样本，第二训练样本包括针对第二类商品的样本。其中，第一类商品和第二类商品所包括的商品不同。在一个示例中，第一类商品和第二类商品可以包括相同的商品。例如，双十一的应用场景对应第一类商品，3C数码节的应用场景对应第二类商品，因为双十一是针对全类商品，3C数码节仅针对3C数码产品，因此第二类商品和第一类商品都包括有3C数码产品。

在本说明书实施例中，第一样本域下的训练样本被用来训练用于推荐第一类商品的第一推荐模型，第二样本域下的训练样本被用来训练用于推荐第二类商品的第二推荐模型。

第一样本域对应至少一个应用场景(比如第一应用场景)，第二样本域对应至少一个应用场景(比如第二应用场景)。第一推荐模型应用于第一应用场景中，第二推荐模型应用于第二应用场景。

例如，第一样本域对应的第一应用场景是“男装节”场景，该场景下的第一类商品是男装，第一样本域下的训练样本(比如第一训练样本)都是针对男装的，比如，各种类型、各种款式以及各种品牌的男装等。第二样本域对应的第二应用场景是“手机节”场景，该场景下的第二类商品是手机，第二样本域下的第二训练样本都是针对手机的，比如各种品牌、各种功能以及各种类型的手机等。

在本说明书实施例中，训练样本可以用不同维度的变量来表示，因此，每个训练样本可以是由多个维度的变量组成的，比如，商品销量、退货率、价位以及未退转换率等。第一训练样本的变量与第二训练样本的变量存在相同的变量。在一个示例中，第一训练样本的变量与第二训练样本的变量相同，比如，第一训练样本和第二训练样本的变量都由商品销量、退货率、价位以及未退转换率组成。每个训练样本可以表示为：(X₁，X₂，……，X_n)，其中，X₁，X₂，……，X_n表示n个特征变量，n可以是指定的。

在本说明书实施例的一个示例中，第一样本域是与少样本场景对应的样本域，第二样本域是与多样本场景对应的样本域。少样本场景对应的样本域下的样本数量较少，甚至不足以作为训练样本用来训练少样本场景的预测模型；多样本场景对应的样本域下的样本数量较多。

在一个示例中，少样本场景可以是新场景，多样本场景可以是已经多次应用了的成熟场景。例如，成熟场景是已经成熟应用了的“双十一”促销活动，而新场景是还未推广应用的另一个促销活动。

通过上述示例，多样本场景对应有较多数量的训练样本，利用多样本场景下的训练样本来增加少样本场景对应的样本域下的训练样本，这样，在需要训练针对少样本场景下的预测模型时该少样本场景对应的样本域可以提供足够数量的训练样本。

在块120，使用第一样本迁移转换过程来将第二训练样本迁移转换为第三训练样本。

在本说明书实施例中，第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的，该机器学习方法中第二训练样本是输入，第三训练样本是输出。

图2示出了本说明书的实施例的第一样本迁移转换过程的一个示例的流程图。如图2所示，在块121，将第二训练样本迁移转换为第三训练样本，在每次转换得到第三训练样本后，在块123，判断当前是否满足第一约束条件，若满足，则流程进行到块125，结束第一样本迁移转换过程。若不满足，则流程进行到块127，调整机器学习模型的参数，并流程返回至块121，即利用调整后的机器学习模型将第二训练样本迁移转换为第三训练样本。

在块127，参数调整是在机器学习模型的当前参数的基础上进行的，并且使得调整后的机器学习模型所转换得到的第三训练样本能够满足于第一约束条件，或者更接近于满足于第一约束条件。在一个示例中，机器学习模型可以是第一转换函数，该第一转换函数可以用于将第二训练样本迁移转换为第三训练样本。

在本说明书实施例中，第一样本迁移转换过程是一个循环过程，循环的控制条件是第一约束条件。在每一次循环过程中，可以转换得到该次对应的第三训练样本，基于该第三训练样本可以得到该次第一样本迁移转换的分布式距离，即该第三训练样本与第一训练样本之间的分布式距离，分布式距离可以用以下公式表示：

|S′(X′₁，X′₂，…，X′_n)，T(X₁，X₂，…，X_n)|

其中，S′表示第三训练样本，X′₁，X′₂，…，X′_n表示第三训练样本的特征变量，T表示第一训练样本，X₁，X₂，…，X_n表示第一训练样本的特征变量，符号“||”表示分布间距离。

第三训练样本和第一训练样本之间的分布式距离可以表示该第三训练样本与第一训练样本的数据间分布差异，分布式距离越大，表示数据间分布差异越大，迁移转换效果越不好；分布式距离越小，表示数据间分布差异越小，迁移转换效果越好。当分布式距离为0时，表示第三训练样本和第一训练样本相同。

在本说明书实施例的一个示例中，分布式距离可以包括以下中的至少一种：欧式距离，KL散度(Kullback-Leibler divergence)，JS散度(Jensen-Shannon divergence)以及EM(Earth-Mover)距离。分布式距离除了上述四种以外还可以用其他类型信息来表征。下面以欧式距离为例进行说明。

第一样本域下有M个第一训练样本，每个训练样本的特征变量维度是n，则M个第一训练样本用矩阵形式可以表示为：

其中，P₁表示包括有M个第一训练样本的矩阵，a_ji表示第j个第一训练样本中的第i个特征变量。

迁移转换得到的第三训练样本有N个，每个训练样本的特征变量维度是n，则N个第三训练样本用矩阵形式可以表示为：

其中，P₂表示包括有N个第三训练样本的矩阵，b_ji表示第j个第三训练样本中的第i个特征变量。

N个第三训练样本与M个第一训练样本之间的欧式距离为：

其中，||A_j||²＝a_j1 ²+…+a_ji ²+…+a_jn ²，||B_j||²＝b_j1 ²+…+b_ji ²+…+b_jn ²。P₂ ^T表示P₂的转置矩阵。

在本说明书实施例中，第一约束条件包括：当前第一样本迁移转换的分布式距离与上一次第一样本迁移转换的分布式距离之间的差值小于第一阈值。其中，第一阈值可以是指定的。

例如，当前迁移转换是第一样本迁移转换过程中循环的第三次迁移转换过程，则可以计算出该第三次迁移转换的分布式距离，再计算该第三次迁移转换的分布式距离与第二次迁移转换的分布式距离的差值，并判断该差值是否小于第一阈值。

基于第一约束条件，每一次迁移转换过程得到的分布式距离会比上一次得到的分布式距离小，相邻两次的分布式距离之间的差值也会逐渐减小，这样，第二训练样本迁移转换成第三训练样本的效果越好，迁移转换得到的第三训练样本越接近于第一样本域下的第一训练样本。

在块130，将第三训练样本确定为第一样本域下的训练样本。

在本说明书实施例中，被确定的第三训练样本是在满足第一约束条件时迁移转换所得到的。例如，在第二次迁移转换得到的第三训练样本，且该第三训练样本满足第一约束条件，则该第三训练样本被确定为第一样本域下的训练样本。

在本说明书实施例的一个示例中，第三训练样本和第一训练样本是针对第一类商品的训练样本，可以用来训练用于推荐第一类商品的第一推荐模型。在另一个示例中，还可以只用第三训练样本来训练用于推荐第一类商品的第一推荐模型。例如，第一推荐模型应用于“手机节”的场景时，通过训练好的第一推荐模型可以向消费者推荐手机。

在本说明书实施例的一个示例中，第一训练样本和第二训练样本是有监督训练样本。每个训练样本中的变量包括特征变量和标签变量，标签变量即作为有监督训练中的标签。

有监督训练样本用于训练的模型可以是预测模型，预测模型的输入为特征变量，输出为标签变量对应的预测值，该预测值与训练样本中的标签变量进行比较。每个训练样本可以表示为：(X₁，X₂，…，X_n；Y)，其中，X₁，X₂，…，X_n表示n个特征变量，Y表示标签变量。标签变量是可以指定的。

例如，每个训练样本由商品销量、退货率、价位和未退转换率组成，其中，商品销量、退货率和价位是特征变量，未退转换率是标签变量，这样，由训练样本训练得到的预测模型可以根据商品的商品销量、退货率和价位三个特征变量来预测该商品的未退转换率。

第一约束条件还可以包括：第三训练样本的训练误差小于第二阈值，以及第一训练样本的预测误差小于第三阈值。其中，第二阈值和第三阈值都可以是指定的。

第三训练样本是由第二训练样本迁移转换得到的，第三训练样本也是有监督训练样本。利用第三训练样本可以训练得到第一预测模型，该第一预测模型可以根据特征变量来预测标签变量的预测值。例如，第一预测模型可以用y＝g₁(x)来表示，x表示第一预测模型的输入，y表示第一预测模型的输出(即标签变量对应的预测值)，进一步地，第一预测模型还可以表示为：标签变量＝g₁(特征变量)。

第三训练样本的训练误差是针对第一预测模型的训练误差，可以表示为：|Y₃-g₁(S′(X′₁，X′₂，…，X′_n))|，其中，Y₃表示第三训练样本中标签变量对应的值，X′₁，X′₂，…，X′_n表示第三训练样本中的特征变量，S′(X′₁，X′₂，…，X′_n)表示第三训练样本。

在利用第三训练样本训练出第一预测模型后，可以使用第一预测模型来预测第一训练样本的预测值。第一训练样本的预测值可以表示为：g₁(T(X₁，X₂，…，X_n))，其中，T(X₁，X₂，…，X_n)表示第一训练样本，X₁，X₂，…，X_n表示第一训练样本的特征变量。

第一训练样本的预测误差是第一预测模型对第一训练样本进行预测的误差，可以表示为：|Y₁-g(T(X₁，X₂，…，X_n))|，其中，Y₁表示第一训练样本中的特征变量对应的值。

在该示例中，满足第一约束条件需要同时满足以下三个条件：当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第一阈值，第三训练样本的训练误差小于第二阈值，以及第一训练样本的预测误差小于第三阈值。

通过上述示例，第一训练样本的预测误差可以反映出第一样本迁移转换过程的迁移转换效果，若迁移转换效果越好，即第三训练样本越接近第一训练样本，则利用第三训练样本训练出的第一预测模型对第一训练样本进行预测的预测误差会越小。因此，将第一训练样本的预测误差作为第一约束条件中的其中一个约束条件，可以提高第一样本迁移转换的迁移转换效果，第三训练样本更接近于第一训练样本。

图3示出了本说明书的另一实施例的用于对训练样本进行样本域转换的方法的流程图。图3中所示的实施例是上述图1示出的实施例的修改实施例。

在图3中示出的实施例中，块310、块320以及块350的操作分别与图1中的块110、块120以及块130相同，在此不再描述。下面仅仅对不同之处进行详细描述。

在块320之后，接着，在块330，使用第二样本迁移转换过程来将第三训练样本迁移转换为第四训练样本。

在本说明书的实施例中，第二样本迁移转换过程是使用机器学习方法来在第二约束条件下实现的。该机器学习方法中第三训练样本是输入，第四训练样本是输出。

图4示出了本说明书的实施例的第二样本迁移转换过程的一个示例的流程图。如图4所示，在块331，将第三训练样本迁移转换为第四训练样本，在每次转换得到第四训练样本后，在块333，判断当前是否满足第二约束条件，若满足，则流程进行到块335，结束第二样本迁移转换过程。若不满足，则流程进行到块337，调整机器学习模型的参数，并流程返回至块331，即利用调整后的机器学习模型将第三训练样本迁移转换为第四训练样本。

在块337，参数调整是在机器学习模型的当前参数的基础上进行的，并且使得调整后的机器学习模型所转换得到的第四训练样本能够满足于第二约束条件，或者更接近于满足于第二约束条件。在一个示例中，机器学习模型可以是第二转换函数，该第二转换函数可以用于将第三训练样本迁移转换为第四训练样本。

在本说明书实施例的一个示例中，可以用CYCLE-GAN模型来实现第一样本迁移转换过程和第二样本迁移转换过程。

在本说明书实施例的一个示例中，第二约束条件可以包括：循环次数，或者当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第七阈值。

在该示例中，循环次数是针对第二样本迁移转换过程中第三训练样本迁移转换成第四训练样本的次数，该循环次数可以是指定的。

在该示例中，第七阈值可以是指定的。第二样本迁移转换过程是一个循环过程，循环的控制条件是第二约束条件。在每一次循环过程中，每次迁移转换的分布式距离为该次迁移转换得到的第四训练样本与第二训练样本之间的分布式距离，可以表示为：

|S″(X″₁，X″₂，…，X″_n)，S(X₁，X₂，…，X_n)|

其中，S″表示第四训练样本，X″₁，X″₂，…，X″_n表示第四训练样本的特征变量，S表示第二训练样本。

第四训练样本和第二训练样本之间的分布式距离可以表示该第四训练样本与第二训练样本的数据间分布差异，分布式距离越大，表示第一样本迁移转换过程和第二样本迁移转换过程的迁移转换效果越不好；分布式距离越小，表示第一样本迁移转换过程和第二样本迁移转换过程的迁移转换效果越好。当第四训练样本与第二训练样本相同时，第四训练样本和第二训练样本之间的分布式距离为0，这种情况下，第一样本迁移转换过程将第二训练样本迁移转换成第三训练样本，第二样本迁移转换过程将第三训练样本迁移转换回第二训练样本，第一样本迁移转换过程和第二样本迁移转换过程迁移转换效果都很好，没有造成信息丢失。

在块340，判断第四训练样本是否满足第三约束条件，如果是，则流程进行到块350，将第三训练样本确定为第一样本域下的训练样本。如果否，则流程进行到块360。

在本说明书的实施例中，第三约束条件包括：第四训练样本与第二训练样本之间的分布式距离小于第四阈值。其中，第四阈值可以是指定的。

在块360，将第四训练样本确定为第二样本域下的第二训练样本。并且流程返回至块320，即使用第一样本迁移转换过程将新的第二训练样本迁移转换为第三训练样本。

在本说明书实施例的一个示例中，第二训练样本和第四训练样本是有监督训练样本。每个训练样本中的变量包括特征变量和标签变量。

第三约束条件还可以包括：第四训练样本的训练误差小于第五阈值，以及第二训练样本的预测误差小于第六阈值。其中，第五阈值和第六阈值都可以是指定的。

利用第四训练样本可以训练出第二预测模型，该第二预测模型可以根据特征变量来预测对应的标签变量。第二预测模型可以用y＝g₂(x)来表示，x表示第二预测模型的输入，y表示第二预测模型的输出。

第四训练样本的训练误差是针对第二预测模型的训练误差，可以表示为：|Y₄-g₂(S″(X″₁，X″₂，…，X″_n))|，其中，Y₄表示第四训练样本中标签变量对应的值，S″(X″₁，X″₂，…，X″_n)表示第四训练样本。

在利用第四训练样本训练出第二预测模型后，可以使用第二预测模型来预测第二训练样本的预测值。第二训练样本的预测值可以表示为：g₂(S(X₁，X₂，…，X_n))，其中，S(X₁，X₂，…，X_n)表示第二训练样本。

第二训练样本的预测误差是第二预测模型对第二训练样本进行预测的误差，可以表示为：|Y₂-g₂(S(X₁，X₂，…，X_n))|，其中，Y₂表示第二训练样本中标签变量的值。

在该示例中，满足第三约束条件需要同时满足以下三个条件：第四训练样本与第二训练样本之间的分布式距离小于第四阈值，第四训练样本的训练误差小于第五阈值，以及第二训练样本的预测误差小于第六阈值。

通过上述示例，第四训练样本的预测误差可以反映出第二样本迁移转换过程的迁移转换效果，进一步地，可以反映出第一样本迁移转换过程的迁移转换效果。若第一样本迁移转换过程的迁移转换效果较好，第二训练样本迁移转换成第三训练样本的过程中没有信息丢失，且第二样本迁移转换过程中第三训练样本迁移转换成第四训练样本的过程中没有信息丢失，则第四训练样本与第二训练样本是相同的。若第四训练样本与第二训练样本之间的分布式距离越大，第四训练样本的训练误差以及第二训练样本的预测误差越大，则表示迁移转换过程中信息丢失严重，迁移转换效果越差。

图5示出了本说明书的实施例的用于对训练样本进行样本域转换的装置(以下简称为样本域转换装置500)的方框图。如图5所示，样本域转换装置500包括训练样本获取单元510、第一样本迁移转换单元520和第一训练样本确定单元530。

训练样本获取单元510获取第一样本域下的第一训练样本和第二样本域下的第二训练样本。

第一样本迁移转换单元520使用第一样本迁移转换过程来将第二训练样本迁移转换为第三训练样本。其中，第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的，第一约束条件包括：当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第一阈值，每次迁移转换的分布式距离为该次迁移转换得到的第三训练样本与第一训练样本之间的分布式距离。

第一训练样本确定单元530将第三训练样本确定为第一样本域下的训练样本。

在本说明书实施例的一个示例中，第一训练样本和第二训练样本是有监督训练样本，以及第一约束条件还可以包括：第三训练样本的训练误差小于第二阈值，以及第一训练样本的预测误差小于第三阈值，其中，第一训练样本的预测值是使用第一预测模型预测的，第一预测模型是利用第三训练样本训练出的。

图6示出了本说明书的另一实施例的用于对训练样本进行样本域转换的装置的方框图。图6中所示的实施例是上述图5示出的实施例的修改实施例。

如图6所示，样本域转换装置500还可以包括第二样本迁移转换单元540，第二样本迁移转换单元540使用第二样本迁移转换过程来将第三训练样本迁移转换为第四训练样本，其中，第二样本迁移转换过程是使用机器学习方法来在第二约束条件下实现的；以及第一训练样本确定单元530当第四训练样本满足第三约束条件时，将第三训练样本确定为第一样本域下的训练样本，其中，第三约束条件包括：第四训练样本与第二训练样本之间的分布式距离小于第四阈值。

在一个示例中，第二训练样本和第四训练样本是有监督训练样本，以及第三约束条件还包括：第四训练样本的训练误差小于第五阈值，以及第二训练样本的预测误差小于第六阈值，其中，第二训练样本的预测值是使用第二预测模型预测的，第二预测模型是利用第四训练样本训练出的。

在一个示例中，样本域转换装置500还可以包括第二训练样本确定单元550。第二训练样本确定单元550当第四训练样本不满足第三约束条件时，将第四训练样本确定为第二样本域下的第二训练样本，并触发第一样本迁移转换单元执行使用第一样本迁移转换过程来将第二训练样本迁移转换为第三训练样本的操作。

在一个示例中，第二约束条件包括：循环次数，或者当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第七阈值，其中，每次迁移转换的分布式距离为该次迁移转换得到的第四训练样本与第二训练样本之间的分布式距离。

以上参照图1到图6，对根据本说明书实施例的用于对训练样本进行样本域转换的方法及装置的实施例进行了描述。

本说明书实施例的用于对训练样本进行样本域转换的装置可以采用硬件实现，也可以采用软件或者硬件和软件的组合来实现。以软件实现为例，作为一个逻辑意义上的装置，是通过其所在设备的处理器将存储器中对应的计算机程序指令读取到内存中运行形成的。在本说明书实施例中，用于对训练样本进行样本域转换的装置例如可以利用电子设备实现。

图7示出了本说明书的实施例的用于对训练样本进行样本域转换的电子设备700的方框图。

如图7所示，电子设备700可以包括至少一个处理器710、存储器(例如，非易失性存储器)720、内存730和通信接口740，并且至少一个处理器710、存储器720、内存730和通信接口740经由总线750连接在一起。至少一个处理器710执行在存储器中存储或编码的至少一个计算机可读指令(即，上述以软件形式实现的元素)。

在一个实施例中，在存储器中存储计算机可执行指令，其当执行时使得至少一个处理器710：获取第一样本域下的第一训练样本和第二样本域下的第二训练样本，使用第一样本迁移转换过程来将第二训练样本迁移转换为第三训练样本，将第三训练样本确定为第一样本域下的训练样本，其中，第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的，第一约束条件包括：当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第一阈值，每次迁移转换的分布式距离为该次迁移转换得到的第三训练样本与第一训练样本之间的分布式距离。

应该理解，在存储器中存储的计算机可执行指令当执行时使得至少一个处理器710进行本说明书的各个实施例中以上结合图1-6描述的各种操作和功能。

根据一个实施例，提供了一种例如机器可读介质的程序产品。机器可读介质可以具有指令(即，上述以软件形式实现的元素)，该指令当被机器执行时，使得机器执行本说明书的各个实施例中以上结合图1-6描述的各种操作和功能。

具体地，可以提供配有可读存储介质的***或者装置，在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码，且使该***或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。

在这种情况下，从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能，因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。

可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地，可以由通信网络从服务器计算机上或云上下载程序代码。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

上述各流程和各***结构图中不是所有的步骤和单元都是必须的，可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的，可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构，也可以是逻辑结构，即，有些单元可能由同一物理实体实现，或者，有些单元可能分由多个物理实体实现，或者，可以由多个独立设备中的某些部件共同实现。

在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”，并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的，具体实施方式包括具体细节。然而，可以在没有这些具体细节的情况下实施这些技术。在一些实例中，为了避免对所描述的实施例的概念造成难以理解，公知的结构和装置以框图形式示出。

以上结合附图详细描述了本说明书的实施例的可选实施方式，但是，本说明书的实施例并不限于上述实施方式中的具体细节，在本说明书的实施例的技术构思范围内，可以对本说明书的实施例的技术方案进行多种简单变型，这些简单变型均属于本说明书的实施例的保护范围。

本说明书内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本说明书内容。对于本领域普通技术人员来说，对本说明书内容进行的各种修改是显而易见的，并且，也可以在不脱离本说明书内容的保护范围的情况下，将本文所定义的一般性原理应用于其它变型。因此，本说明书内容并不限于本文所描述的示例和设计，而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims

1.一种对推荐模型的训练样本进行样本域转换的方法，包括：

获取第一样本域下的第一训练样本和第二样本域下的第二训练样本；其中，所述第一样本域下的训练样本被用来训练用于推荐第一类商品的第一推荐模型，所述第二样本域下的训练样本被用来训练用于推荐第二类商品的第二推荐模型，所述第一训练样本包括针对所述第一类商品的样本，所述第二训练样本包括针对所述第二类商品的样本；

使用第一样本迁移转换过程来将所述第二训练样本迁移转换为第三训练样本；以及

将所述第三训练样本确定为所述第一样本域下的训练样本，以使得基于所确定的训练样本来训练所述第一推荐模型，

其中，所述第一样本迁移转换过程是使用机器学习方法来在第一约束条件下实现的，所述第一约束条件包括：当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第一阈值，其中，每次迁移转换的分布式距离为该次迁移转换得到的第三训练样本与所述第一训练样本之间的分布式距离。

2.如权利要求1所述的方法，其中，所述第一训练样本和所述第二训练样本是有监督训练样本，以及

所述第一约束条件还包括：所述第三训练样本的训练误差小于第二阈值，以及所述第一训练样本的预测误差小于第三阈值，

其中，所述第一训练样本的预测值是使用第一预测模型预测的，所述第一预测模型是利用所述第三训练样本训练出的。

3.如权利要求1或2所述的方法，还包括：

使用第二样本迁移转换过程来将所述第三训练样本迁移转换为第四训练样本，其中，所述第二样本迁移转换过程是使用机器学习方法来在第二约束条件下实现的；以及

将所述第三训练样本确定为所述第一样本域下的训练样本包括：

当所述第四训练样本满足第三约束条件时，将所述第三训练样本确定为所述第一样本域下的训练样本，

其中，所述第三约束条件包括：所述第四训练样本与所述第二训练样本之间的分布式距离小于第四阈值。

4.如权利要求3所述的方法，其中，所述第二训练样本和所述第四训练样本是有监督训练样本，以及

所述第三约束条件还包括：所述第四训练样本的训练误差小于第五阈值，以及所述第二训练样本的预测误差小于第六阈值，

其中，所述第二训练样本的预测值是使用第二预测模型预测的，所述第二预测模型是利用所述第四训练样本训练出的。

5.如权利要求3所述的方法，还包括：

当所述第四训练样本不满足第三约束条件时，将所述第四训练样本确定为第二样本域下的第二训练样本，并返回执行使用第一样本迁移转换过程来将第二训练样本迁移转换为第三训练样本的操作。

6.如权利要求3所述的方法，其中，所述第二约束条件包括：

循环次数，或者

当前迁移转换的分布式距离与上一次迁移转换的分布式距离之间的差值小于第七阈值，其中，每次迁移转换的分布式距离为该次迁移转换得到的第四训练样本与所述第二训练样本之间的分布式距离。

7.如权利要求1所述的方法，其中，所述第一样本域是与少样本场景对应的样本域，以及所述第二样本域是与多样本场景对应的样本域。

8.如权利要求6任一项所述的方法，其中，分布式距离包括以下中的至少一种：

欧式距离；

KL散度；

JS散度；和

EM距离。

9.一种对推荐模型的训练样本进行样本域转换的装置，包括：

训练样本获取单元，获取第一样本域下的第一训练样本和第二样本域下的第二训练样本；其中，所述第一样本域下的训练样本被用来训练用于推荐第一类商品的第一推荐模型，所述第二样本域下的训练样本被用来训练用于推荐第二类商品的第二推荐模型，所述第一训练样本包括针对所述第一类商品的样本，所述第二训练样本包括针对所述第二类商品的样本；

第一样本迁移转换单元，使用第一样本迁移转换过程来将所述第二训练样本迁移转换为第三训练样本；以及

第一训练样本确定单元，将所述第三训练样本确定为所述第一样本域下的训练样本，以使得基于所确定的训练样本来训练所述第一推荐模型，

10.如权利要求9所述的装置，其中，所述第一训练样本和所述第二训练样本是有监督训练样本，以及

11.如权利要求9或10所述的装置，还包括：

第二样本迁移转换单元，使用第二样本迁移转换过程来将所述第三训练样本迁移转换为第四训练样本，其中，所述第二样本迁移转换过程是使用机器学习方法来在第二约束条件下实现的；以及

所述第一训练样本确定单元：

12.如权利要求11所述的装置，其中，所述第二训练样本和所述第四训练样本是有监督训练样本，以及

13.如权利要求11所述的装置，还包括：

第二训练样本确定单元，当所述第四训练样本不满足第三约束条件时，将所述第四训练样本确定为第二样本域下的第二训练样本，并触发所述第一样本迁移转换单元执行使用第一样本迁移转换过程来将第二训练样本迁移转换为第三训练样本的操作。

14.如权利要求11所述的装置，其中，所述第二约束条件包括：

循环次数，或者

15.一种电子设备，包括：

至少一个处理器，以及

与所述至少一个处理器耦合的存储器，所述存储器存储指令，当所述指令被所述至少一个处理器执行时，使得所述至少一个处理器执行如权利要求1到8中任一所述的方法。

16.一种机器可读存储介质，其存储有可执行指令，所述指令当被执行时使得所述机器执行如权利要求1到8中任一所述的方法。