WO2019210695A1

WO2019210695A1 - 模型训练和业务推荐

Info

Publication number: WO2019210695A1
Application number: PCT/CN2018/121950
Authority: WO
Inventors: 王子伟
Original assignee: 北京三快在线科技有限公司
Priority date: 2018-05-02
Filing date: 2018-12-19
Publication date: 2019-11-07
Also published as: CN108875776B; CN108875776A; US20210042664A1

Abstract

一种模型训练方法和装置、业务推荐的方法和装置、电子设备，该模型训练方法，包括：获取样本数据集；其中，所述样本数据集包括第一类样本数据，以及第二类样本数据(101)；获取所述第一类样本数据对应的第一权重，以及所述第二类样本数据对应的第二权重(102)；根据所述第一权重、所述第二权重、所述第一类样本数据对应的损失函数、和所述第二类样本数据对应的损失函数，进行加权运算，得到总体损失函数(103)；基于所述总体损失函数，使用所述样本数据集进行机器学习模型的训练(104)。

Description

模型训练和业务推荐

相关申请的交叉引用

本专利申请要求于2018年05月02日提交的、申请号为201810411497.4、发明名称为“模型训练方法和装置、业务推荐的方法和装置、电子设备”的中国专利申请的优先权，该申请的全文以引用的方式并入本文中。

技术领域

本公开的实施例涉及人工智能技术领域，特别是涉及一种模型训练方法和装置、业务推荐的方法和装置、电子设备。

背景技术

机器学习(Machine Learning，ML)是人工智能的核心，其应用遍及人工智能的各个领域，是使计算机具有智能的根本途径。通常，在训练机器学习的模型时，训练集样本需要与预测集在物理意义上一致，如训练集样本与预测集针对的是同一类型用户，以保证训练的机器学习的模型在针对预测集进行预测时，有一个比较好的精度。而在某些业务场景中，与预测集在物理意义上一致的训练集样本的数量较少，由于训练样本数较少，会导致机器学习的模型的参数优化不充分，从而导致后续的预测准确率下降。

发明内容

本公开的实施例提供了一种新的模型训练方法，所述方法包括：获取样本数据集，其中，所述样本数据集包括第一类样本数据以及第二类样本数据；获取所述第一类样本数据对应的第一权重，以及所述第二类样本数据对应的第二权重；根据所述第一权重、所述第二权重、所述第一类样本数据对应的损失函数、和所述第二类样本数据对应的损失函数进行加权运算，得到总体损失函数；基于所述总体损失函数，使用所述样本数据集进行机器学习模型的训练。

可选地，获取所述第一类样本数据对应的所述第一权重，以及所述第二类样本数据对应的所述第二权重包括：确定第一比例和第二比例，其中，所述第一比例为所述第一类样本数据的行为为指定行为的概率，所述第二比例为所述第二类样本数据的行为为指定行为的概率；将所述第一比例作为所述第一权重，将所述第二比例作为所述第二权重。

可选地，获取所述第一类样本数据对应的所述第一权重，以及所述第二类样本数据对应的所述第二权重包括：确定所述第一类样本数据和所述第二类样本数据的分类信息；在预置的分类信息与权重映射关系中，匹配所述分类信息，得到所述第一类样本数据对应的所述第一权重和所述第二类样本数据对应的所述第二权重。

可选地，所述样本数据集为针对酒旅类业务的用户数据集，所述第一类样本数据包括第一等级用户的用户数据以及所述用户数据的特征标签，所述第二类样本数据包括第二等级用户的用户数据以及所述用户数据的特征标签，所述用户数据包括属性数据和行为数据，所述第一等级用户的级别高于所述第二等级用户的级别，所述特征标签用于指示所述用户数据与购买行为的对应关系。

本公开实施例还提供了一种业务推荐的方法，所述方法包括：利用上述任一项所述的模型训练方法训练目标机器学习模型；获取候选用户列表，其中，所述候选用户列表包括多个候选用户的用户数据；分别将每个候选用户的所述用户数据输入训练好的所述目标机器学习模型，获得每个候选用户的所述用户数据对应的预测值；在检测到所述用户数据对应的所述预测值大于第一预设阈值时，将所述用户数据对应的所述候选用户作为目标用户，并向所述目标用户推荐目标业务。

本公开实施例还提供了一种模型训练的装置，所述装置包括：样本数据集获取模块，用于获取样本数据集，其中，所述样本数据集包括第一类样本数据以及第二类样本数据；权重获取模块，用于获取所述第一类样本数据对应的第一权重，以及所述第二类样本数据对应的第二权重；总体损失函数确定模块，用于根据所述第一权重、所述第二权重、所述第一类样本数据对应的损失函数、和所述第二类样本数据对应的损失函数进行加权运算，得到总体损失函数；模型训练模块，用于基于所述总体损失函数，使用所述样本数据集进行机器学习模型的训练。

可选地，所述权重获取模块包括：比例确定子模块，用于确定第一比例和第二比例，其中，所述第一比例为所述第一类样本数据的行为为指定行为的概率，所述第二比例为所述第二类样本数据的行为为指定行为的概率；权重作为子模块，用于将所述第一比例作为所述第一权重，将所述第二比例作为所述第二权重。

可选地，所述权重获取模块包括：分类信息确定子模块，用于确定所述第一类样本数据和所述第二类样本数据的分类信息；权重匹配子模块，用于在预置的分类信息与权重映射关系中，匹配所述分类信息，得到所述第一类样本数据对应的所述第一权重和所述第二类样本数据对应的所述第二权重。

本公开实施例还提供了一种业务推荐的装置，所述装置包括：模型训练模块，用于利用上述任一项所述的模型训练方法训练目标机器学习模型；候选用户列表获取模块，用于获取候选用户列表，其中，所述候选用户列表包括多个候选用户的用户数据；预测值计算模块，用于分别将每个候选用户的所述用户数据输入训练好的所述目标机器学习模型，获得每个候选用户的所述用户数据对应的预测值；业务推荐模块，用于在检测到所述用户数据对应的所述预测值大于第一预设阈值时，将所述用户数据对应的所述候选用户作为目标用户，并向所述目标用户推荐目标业务。

本公开实施例还提供了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如上所述方法。

本公开实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述方法的步骤。

本公开实施例包括以下优点：在本公开实施例中，通过获取样本数据集，样本数据集包括第一类样本数据，以及第二类样本数据，并可以获取第一类样本数据对应的第一权重，以及第二类样本数据对应的第二权重，然后可以根据第一权重、第二权重、第一类样本数据对应的损失函数、和第二类样本数据对应的损失函数进行加权运算，得到总体损失函数，基于总体损失函数，使用样本数据集进行机器学习模型的训练。实现了采用多种类型的样本数据进行模型训练，以在第一类样本数据的数量较少时，将第二类样本数据作为第一类样本数据的补充，有助于提升模型训练的效果。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对本公开实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本公开一个实施例的一种模型训练的方法的步骤流程图；

图2是本公开另一个实施例的一种模型训练的方法的步骤流程图；

图3是本公开实施例的一种成本函数的函数示意图；

图4是本公开实施例的一种业务推荐的方法的步骤流程图；

图5是本公开实施例的一种模型训练的装置的结构框图；

图6是本公开实施例的一种业务推荐的装置的结构框图。

具体实施方式

为使本公开的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本公开作进一步详细的说明。显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

参照图1，示出了本公开一个实施例的一种模型训练的方法的步骤流程图，具体可以包括如下步骤：

步骤101，获取样本数据集，其中，所述样本数据集包括第一类样本数据，以及第二类样本数据。

例如，样本数据集可以为针对酒旅类业务的用户数据集，第一类样本数据可以包括第一等级用户的用户数据以及用户数据的特征标签，第二类样本数据可以包括第二等级用户的用户数据以及用户数据的特征标签，第一等级用户的级别高于第二等级用户的级别。所述特征标签可以用于指示对应的用户数据与购买行为的对应关系。比如一些用户数据对应的特征标签为产生了购买行为，一些用户数据对应的特征标签为没有产生购买行为。

作为一种示例，用户数据可以包括属性数据和行为数据，如属性数据可以包括样本用户的用户标签、消费水平等，行为数据可以为样本用户的购买行为数据、浏览行为数据等。

针对每个机器学习的模型，具有对应的预测目标，即预测集，本公开实施例不仅获取与预测目标关联性较强的第一类样本数据，还获取与预测目标关联性较弱的第二类样本数据。由于引入了更多与预测目标具有关联性的样本数据，提升了模型的泛化能力。

实际上，预测目标可以为针对待预测用户的用户数据，则第一类样本数据可以为与预测目标在物理意义上一致的样本数据，如第一类样本数据与预测目标均为第一等级用户的用户数据。而第二类样本数据与预测目标在物理意义上不一致，但与预测目标的一部分数据具有关联性。如预测目标为第一等级用户的用户数据，而第二类样本数据为第二等级用户的用户数据，但该第二等级用户为具有指定行为的第二等级用户。比如在酒旅类业务的环境下，指定行为可以是指购买的行为。

例如，在酒店业务中，当某个用户针对高星级酒店业务的购买行为次数超过预设次数，则该用户为高星用户，否则为低星用户，则当预测目标中待预测的用户为高星用户时，则第一等级用户可以为高星用户，第二等级用户可以为具有针对高星级酒店业务的购买行为的低星用户。

在一种示例中，还可以将样本数据集中的样本数据区分为正样本数据和负样本数据，以使得在模型训练的过程中，能够对正样本数据、负样本数据进行区别训练，如正样本数据集可以为具有针对高星酒店业务的购买行为的用户数据集，负样本数据集可以为具有针对高星酒店业务的浏览行为但不进行购买的用户数据集。

步骤102，获取所述第一类样本数据对应的第一权重，以及所述第二类样本数据对应的第二权重。

在获取样本数据集后，可以获取第一类样本数据对应的第一权重，以及第二类样本数据对应的第二权重。

在一种实施方式中，可以直接设置第一权重大于第二权重，以使得在模型训练过程中区别对待不同的样本数据，并关注于权重较大的第一类样本数据。

在另一种实施方式中，可以通过分析样本数据，确定样本数据对应的用户进行指定行为的概率，进而可以根据概率确定各类样本数据对应的权重。则步骤102可以包括：

确定第一比例和第二比例。

其中，第一比例可以为第一类样本数据的行为为指定行为的概率，第二比例可以为第二类样本数据的行为为指定行为的概率。针对每个第一类样本数据，可以确定该第一类样本数据的行为，然后可以统计指定行为占第一类样本数据的行为的概率，作为第一比例。针对每个第二类样本数据，可以确定该第二类样本数据的行为，可以统计指定行为占第二类样本数据的行为的概率，作为第二比例。

例如，在第二样本用户数据中，包含10条针对酒店业务的购买行为数据，针对高星级酒店业务的购买行为数据占1条，针对低星级酒店的购买行为数据占9条，则可以确定针对高星级酒店业务的购买行为数据占所有针对酒店业务的购买行为数据的比值为10％，即第二比例为10％。

将所述第一比例作为第一权重，将所述第二比例作为第二权重。

在确定比例后，将第一比例作为第一类样本数据对应的第一权重，将第二比例作为第二类样本数据对应的第二权重。

还可以从预置的比例和权重映射关系中，获取第一比例对应的权重，作为第一类样本数据对应的第一权重，获取第二比例对应的权重，作为第二类样本数据对应的第二权重。

在另一种实施方式中，还可以通过分析样本数据，确定样本数据所属的类别，进而可以根据该类别确定样本数据对应的权重。则步骤102可以包括：

确定所述第一类样本数据和所述第二类样本数据的分类信息。

其中，分类信息可以包括样本数据对应的用户类型，如第一类样本数据对应的用户类型为第一等级用户，第二类样本数据对应的用户类型为第二等级用户。

在具体实现中，样本数据可以具有分类信息，则针对每个样本数据，可以从指定字段获取分类信息。

在预置的分类信息与权重映射关系中，匹配所述分类信息，得到所述第一类样本数据对应的第一权重和所述第二类样本数据的第二权重。

在获得分类信息后，可以在预置的分类信息和权重映射关系中，对分类信息进行匹配，然后可以确定第一类样本数据对应分类信息对应的权重，作为第一类样本数据对应的第一权重，并可以确定第二类样本数据对应分类信息对应的权重，作为第二类样本数据对应的第二权重。

步骤103，根据所述第一权重、所述第二权重、所述第一类样本数据对应的损失函数、和所述第二类样本数据对应的损失函数进行加权运算，得到总体损失函数。

在本公开实施例中，可以分别为第一类样本数据、第二类样本数据设置损失函数，以分别计算第一类样本数据、第二类样本数据的预测损失。

其中，预测损失为针对某类样本数据进行预测时，预测值与预先采集的真实值之间的差值。

在获得权重后，可以使用第一权重对第一类样本数据对应的损失函数进行加权运算，并可以使用第二权重对第二类样本数据对应的损失函数进行加权运算，然后可以将加权后的损失函数组织为总体损失函数，以计算样本数据集对应的总体预测损失。

损失函数可以如下公式所示：

其中，L为第一类样本数据或第二类样本数据对应的预测损失，

为第i个第一类样本数据或第i个第二类样本数据对应的预测值，y ⁱ为预先采集的第i个第一类样本数据或第i个第二类样本数据对应的真实值，w _i为第i个第一类样本数据对应的第一权重或第i个第二类样本数据对应的第二权重，对于一类样本数据来讲，每个数据的w _i的值都一样，都等于该类数据对应的权重，abs为求绝对值运算。

总体损失函数可以如下公式(2)所示：

其中，J为总体预测损失，n为第一类样本数据的数据个数，m为第二类样本数据的数据个数，W ₁为第一权重，W ₂为第二权重，Σ为求和运算。

在一种示例中，总体损失函数也可以如下公式(3)所示：

J＝W ₁J ₁+W ₂J ₂ (3),

其中，J ₁为第一类样本数据对应的预测损失，W ₁为第一权重，J ₂为第二类样本数据对应的预测损失，W ₂为第二权重。

其中，J ₁和J ₂可以采用如下公式(4)计算：

步骤104，基于所述总体损失函数，使用所述样本数据集进行机器学习模型的训练。

在获得总体损失函数后，总体损失函数可以计算样本数据的总体预测损失。然后根据总体预测损失对样本数据进行模型训练，如可以采用梯度提升决策树(Gradient Boosting Decision Tree，GBDT)算法迭代进行模型训练。迭代的目标可以是使样本数据的总体损失函数尽可能变小。从而最终找到模型的最优参数。

在以上任一本公开实施例中，通过获取样本数据集，样本数据集包括第一类样本数据，以及第二类样本数据，并可以获取第一类样本数据对应的第一权重，以及第二类样本数据对应的第二权重，然后可以依次使用第一权重、第二权重对第一类样本数据对应的损失函数、第二类样本数据对应的损失函数进行加权运算，得到总体损失函数，基于总体损失函数，使用样本数据集进行模型训练。实现了采用多种类型的样本数据进行模型训练，以在第一类样本数据的数量较少时，将第二类样本数据作为第一类样本数据的补充，提升了模型训练的效果。

参照图2，示出了本公开实施例的另一种模型训练的方法的步骤流程图，具体可以包括如下步骤：

步骤201，获取样本数据集，其中，所述样本数据集包括第一类样本数据，以及第二类样本数据。

针对每个机器学习模型，具有对应的的预测目标，即预测集，本公开实施例不仅可以获取与预测目标关联性强的第一类样本数据，还可以获取与预测目标关联性弱的第二类样本数据。由于引入更多与预测目标具有关联性的样本数据，提升模型的泛化能力。

步骤202，获取所述第一类样本数据对应的第一权重，以及所述第二类样本数据对应的第二权重。

步骤203，根据所述第一权重、所述第二权重、所述第一类样本数据对应的第一损失函数、所述第二类样本数据对应的第二损失函数，得到总体损失函数。

在获得权重后，可以确定总体损失函数。可以使用第一权重对第一类样本数据对应的损失函数进行加权运算，并可以使用第二权重对第二类样本数据对应的损失函数进行加权运算，然后可以将加权后的损失函数组织为总体损失函数。

步骤204，初始化机器学习模型。

在实际应用中，机器学习模型可以具有多个模型参数，在模型训练开始前，可以初始化机器学习模型的模型参数。

步骤205，在所述机器学习模型中，根据所述第一类样本数据、所述第二类样本数据，采用总体损失函数计算所述样本数据集对应的总体预测损失。

在初始化后，可以将样本数据集输入机器学习模型，机器学习模型可以对样本数据集进行预测，得到每个样本数据对应预测值。根据预先采集的每个样本数据的真实值，可以采用总体损失函数，分别对样本数据集中每个样本数据的预测值和真实值进行计算，得到样本数据集对应的总体预测损失。

在本公开一种实施例中，所述总体损失函数可以采用如下方式计算样本数据集对应的总体预测损失：

计算所述第一类样本数据对应的预测值的第一预测损失，并采用所述第一权重对所述第一预测损失进行加权，得到第一加权预测损失。

针对每个第一类样本数据，可以预先采集每个第一类样本数据对应的真实值，然后计算预测值和真实值的差值的绝对值，得到第一预测损失，然后可以采用第一权重对第一预测损失进行加权，得到第一加权预测损失。

计算所述第二类样本数据对应的预测值的第二预测损失，并采用所述第二权重对所述第二预测损失进行加权，得到第二加权预测损失。

针对每个第二类样本数据，可以预先采集每个第二类样本数据对应的真实值，然后计算预测值和真实值的差值的绝对值，得到第二预测损失，然后可以采用第二权重对第二预测损失进行加权，得到第二加权预测损失。

对所述第一加权预测损失和所述第二加权预测损失进行均值计算，得到所述样本数据对应的预测值的总体预测损失。

在获得加权预测损失后，可以将每个样本数据的加权预测损失进行均值计算，得到样本数据集对应的总体预测损失。

步骤206，迭代调整所述机器学习模型的参数，重新计算所述样本数据集对应的总体预测损失。

在获得总体预测损失后，可以对模型参数进行迭代，得到迭代后机器学习模型，然后采用迭代后的模型重新计算总体预测损失。

更进一步的，在实际应用中，每个样本数据可以具有一个或多个样本特征，机器学习模型中的模型参数可以为针对每个样本特征设置的样本权重，通过对样本权重进行迭代，得到不同的总体预测损失。

随着机器学习模型的迭代，总体损失函数可以计算得到多个总体预测损失，如图3 所示，p为第p组模型参数，J(p)为总体预测损失，沿着总体损失函数的函数值下降最快的方向，对总体损失函数进行收敛，可以得到使总体损失函数最小的模型参数，进而建立目标机器学习模型。

步骤207，将最小的总体预测损失对应的机器学习模型，确定为目标机器学习模型。

在以上任一本公开的实施例中，首先获取样本数据集，样本数据集包括第一类样本数据，以及第二类样本数据，并可以获取第一类样本数据对应的第一权重，以及第二类样本数据对应的第二权重。然后可以根据第一权重、第二权重、第一类样本数据对应的损失函数、第二类样本数据对应的损失函数进行加权运算，得到总体损失函数，基于总体损失函数，使用样本数据集进行模型训练。实现了采用多种类型的样本数据进行模型训练，以在第一类样本数据的数量较少时，将第二类样本数据作为第一类样本数据的补充，提升了模型训练的效果。

而且，通过在模型迭代的过程中，采用总体损失函数计算样本数据集对应的总体预测损失，进而确定最小的总体预测损失对应的目标机器学习模型，保证了模型预测的准确性，减小了模型的预测损失。

参照图4，示出了本公开实施例的一种业务推荐的方法步骤流程图，具体可以包括如下步骤：

步骤401，获取候选用户列表，其中，所述候选用户列表包括多个候选用户的用户数据。

其中，候选用户可以为在酒旅类业务中用户级别高于第二预设阈值的用户，如候选用户为第一等级用户，即高星用户。

当需要推荐目标业务时，可以确定该目标业务对应的用户类型，然后从后台数据中，筛选出符合该用户类型的多个候选用户，并获取多个候选用户的用户数据，得到候选用户列表。

例如，当需要推荐的目标业务为针对高星用户的酒旅类业务，可以将所有的高星用户作为候选用户，并获取高星用户的用户数据。

步骤402，分别将每个候选用户的用户数据输入训练好的目标机器学习模型，获得每个候选用户的用户数据对应的预测值。

在获得候选用户列表后，可以将每个候选用户的用户数据输入目标机器学习模型，目标机器模型对每个候选用户的用户数据进行预测，获得每个候选用户的用户数据对应的预测值。

其中，利用以上任意实施例所述的模型训练方法训练目标机器学习模型，主要步骤包括：获取样本数据集；其中，所述样本数据集包括第一类样本数据，以及第二类样本数据；获取所述第一类样本数据对应的第一权重，以及所述第二类样本数据对应的第二权重；根据所述第一权重、所述第二权重、所述第一类样本数据对应的损失函数、所述第二类样本数据对应的损失函数进行加权运算，得到总体损失函数；基于所述总体损失函数，使用所述样本数据集进行机器学习模型的训练，以得到目标机器学习模型。

对于建立目标机器学习模型的过程，可以参考上述各个实施例关于模型训练的方法的描述，这里不再赘述。

步骤403，在检测到所述用户数据对应的预测值大于第一预设阈值时，将所述用户数据对应的候选用户作为目标用户，并向所述目标用户推荐关联的目标业务。

其中，目标业务可以为与候选用户关联的酒旅类业务，如针对第一等级用户(高星用户)的酒旅类业务。

在获得预测值后，可以判断用户数据对应的预测值是否大于第一预设阈值，若是，则将该用户数据对应的候选用户作为目标用户，在确定目标用户后，可以向目标用户推荐关联的目标业务，如向目标用户发放补贴优惠券等。

在本公开实施例中，通过获取候选用户列表，候选用户列表可以包括多个候选用户的用户数据，分别将每个候选用户的用户数据输入训练好的目标机器学习模型，获得每个候选用户的用户数据对应的预测值，在检测到用户数据对应的预测值大于第一预设阈值时，将用户数据对应的候选用户作为目标用户，然后向目标用户推荐关联的目标业务。采用目标机器学习模型进行预测，并基于预测结果进行业务推荐，提升了业务推荐的成功率。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本公开实施例并不受所描述的动作顺序的限制，因为依据本公开实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本公开实施例所必须的。

参照图5，示出了本公开实施例的一种模型训练的装置的结构框图，具体可以包括如下模块：

样本数据集获取模块501，用于获取样本数据集，其中，所述样本数据集包括第一类样本数据，以及第二类样本数据。

权重获取模块502，用于获取所述第一类样本数据对应的第一权重，以及所述第二类样本数据对应的第二权重。

总体损失函数确定模块503，用于根据所述第一权重、所述第二权重、所述第一类样本数据对应的损失函数、和所述第二类样本数据对应的损失函数进行加权运算，得到总体损失函数。

模型训练模块504，用于基于所述总体损失函数，使用所述样本数据集进行机器学习模型的训练。

在本公开一种实施例中，所述权重获取模块502包括：比例确定子模块，用于确定第一比例和第二比例；其中，所述第一比例为所述第一类样本数据的行为为指定行为的概率，所述第二比例为所述第二类样本数据的行为为指定行为的概率；权重作为子模块，用于将所述第一比例作为第一权重，将所述第二比例作为第二权重。

在本公开一种实施例中，所述权重获取模块502包括：分类信息确定子模块，用于确定所述第一类样本数据和所述第二类样本数据的分类信息；权重匹配子模块，用于在预置的分类信息与权重映射关系中，匹配所述分类信息，得到所述第一类样本数据对应的第一权重和所述第二类样本数据对应的第二权重。

在本公开一种实施例中，所述样本数据集为针对酒旅类业务的用户数据集，所述第一类样本数据包括第一等级用户的用户数据，所述第二类样本数据包括第二等级用户的用户数据，所述第一等级用户的级别高于所述第二等级用户的级别，所述特征标签用于指示所述用户数据与购买行为的对应关系。

在本公开一种实施例中，所述用户数据包括属性数据和行为数据。

在以上任一本公开实施例中，通过获取样本数据集，样本数据集包括第一类样本数据，以及第二类样本数据，并可以获取第一类样本数据对应的第一权重，以及第二类样本数据对应的第二权重，然后可以根据第一权重、第二权重、第一类样本数据对应的损失函数、和第二类样本数据对应的损失函数进行加权运算，得到总体损失函数，基于总体损失函数，使用样本数据集进行机器学习模型的训练。实现了采用多种类型的样本数据进行模型训练，以在第一类样本数据的数量较少时，将第二类样本数据作为第一类样本数据的补充，提升了模型训练的效果。

参照图6，示出了本公开实施例的一种业务推荐的装置的结构框图，具体可以包括如下模块：

模型训练模块601，用于利用以上任意的方法实施例所述的模型训练方法训练目标机器学习模型；

候选用户列表获取模块602，用于获取候选用户列表，其中，所述候选用户列表包括多个候选用户的用户数据；

预测值计算模块603，用于分别将每个候选用户的所述用户数据输入训练好的所述目标机器学习模型，获得每个候选用户的所述用户数据对应的预测值；

业务推荐模块604，用于在检测到所述用户数据对应的预测值大于第一预设阈值时，将所述用户数据对应的候选用户作为目标用户，并向所述目标用户推荐目标业务。

在本公开的一个实施例中，所述目标业务为与所述候选用户关联的酒旅类业务，所述候选用户为在所述酒旅类业务中用户级别高于第二预设阈值的用户。

在本公开实施例中，通过获取候选用户列表，分别将每个候选用户的所述用户数据输入训练好的所述目标机器学习模型，获得每个候选用户的所述用户数据对应的预测值，在检测到用户数据对应的预测值大于第一预设阈值时，将用户数据对应的候选用户作为目标用户，然后向目标用户推荐关联的目标业务。采用目标机器学习模型进行预测，并基于预测结果进行业务推荐，提升了业务推荐的成功率。

本公开各实施例的装置可用于对应的执行上述各个实施例提供的方法，相关术语和描述可以参考关于方法的描述，这里不再赘述。

本公开实施例还公开了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如上所述方法。

本公开实施例还公开了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如上所述方法的步骤。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本公开实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本公开实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开实施例是参照根据本公开实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本公开实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本公开实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本公开所提供的一种模型训练及业务推荐的方法和装置，进行了详细介绍，本文中应用了具体个例对本公开的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本公开的方法及其核心思想；同时，对于本领域的一般技术人员，依据本公开的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本公开的限制。

Claims

一种模型训练的方法，包括：

获取样本数据集，其中，所述样本数据集包括第一类样本数据以及第二类样本数据；

获取所述第一类样本数据对应的第一权重，以及所述第二类样本数据对应的第二权重；

根据所述第一权重、所述第二权重、所述第一类样本数据对应的损失函数、和所述第二类样本数据对应的损失函数进行加权运算，得到总体损失函数；

基于所述总体损失函数，使用所述样本数据集进行机器学习模型的训练。
根据权利要求1的方法，其特征在于，获取所述第一类样本数据对应的所述第一权重，以及所述第二类样本数据对应的所述第二权重包括：

确定第一比例和第二比例，其中，所述第一比例为所述第一类样本数据的行为为指定行为的概率，所述第二比例为所述第二类样本数据的行为为指定行为的概率；

将所述第一比例作为所述第一权重，将所述第二比例作为所述第二权重。
根据权利要求1所述的方法，其特征在于，获取所述第一类样本数据对应的所述第一权重，以及所述第二类样本数据对应的所述第二权重包括：

确定所述第一类样本数据和所述第二类样本数据的分类信息；

在预置的分类信息与权重映射关系中，匹配所述分类信息，得到所述第一类样本数据对应的所述第一权重和所述第二类样本数据对应的所述第二权重。
根据权利要求3所述的方法，其特征在于，

所述样本数据集为针对酒旅类业务的用户数据集，

所述第一类样本数据包括第一等级用户的用户数据以及所述用户数据的特征标签，

所述第二类样本数据包括第二等级用户的用户数据以及所述用户数据的特征标签，所述第一等级用户的级别高于所述第二等级用户的级别，

所述特征标签用于指示所述用户数据与购买行为的对应关系。
根据权利要求4所述的方法，其特征在于，所述用户数据包括属性数据和行为数据。
一种业务推荐的方法，包括：

利用如权利要求1-5任一项所述的方法训练目标机器学习模型；

获取候选用户列表，其中，所述候选用户列表包括多个候选用户的用户数据；

分别将每个候选用户的所述用户数据输入训练好的所述目标机器学习模型，获得每个候选用户的所述用户数据对应的预测值；

在检测到所述用户数据对应的所述预测值大于第一预设阈值时，将所述用户数据对应的所述候选用户作为目标用户，并向所述目标用户推荐目标业务。
一种模型训练的装置，包括：

样本数据集获取模块，用于获取样本数据集，其中，所述样本数据集包括第一类样本数据以及第二类样本数据；

权重获取模块，用于获取所述第一类样本数据对应的第一权重，以及所述第二类样本数据对应的第二权重；

总体损失函数确定模块，用于根据所述第一权重、所述第二权重、所述第一类样本数据对应的损失函数、和所述第二类样本数据对应的损失函数进行加权运算，得到总体损失函数；

模型训练模块，用于基于所述总体损失函数，使用所述样本数据集进行机器学习模型的训练。
根据权利要求7的装置，其特征在于，所述权重获取模块包括：

比例确定子模块，用于确定第一比例和第二比例，其中，所述第一比例为所述第一类样本数据的行为为指定行为的概率，所述第二比例为所述第二类样本数据的行为为指定行为的概率；

权重作为子模块，用于将所述第一比例作为所述第一权重，将所述第二比例作为所述第二权重。
根据权利要求7所述的装置，其特征在于，所述权重获取模块包括：

分类信息确定子模块，用于确定所述第一类样本数据和所述第二类样本数据的分类信息；

权重匹配子模块，用于在预置的分类信息与权重映射关系中，匹配所述分类信息，得到所述第一类样本数据对应的所述第一权重和所述第二类样本数据对应的所述第二权重。
根据权利要求9所述的装置，其特征在于，

所述样本数据集为针对酒旅类业务的用户数据集，

所述第一类样本数据包括第一等级用户的用户数据以及所述用户数据的特征标签，

所述第二类样本数据包括第二等级用户的用户数据以及所述用户数据的特征标签，

所述第一等级用户的级别高于所述第二等级用户的级别，

所述特征标签用于指示所述用户数据与购买行为的对应关系。
根据权利要求10所述的装置，其特征在于，所述用户数据包括属性数据和行为数据。
一种业务推荐的装置，包括：

模型训练模块，用于利用如权利要求1-5任一项所述的方法训练目标机器学习模型；

候选用户列表获取模块，用于获取候选用户列表，其中，所述候选用户列表包括多个候选用户的用户数据；

预测值计算模块，用于分别将每个候选用户的所述用户数据输入训练好的所述目标机器学习模型，获得每个候选用户的所述用户数据对应的预测值；

业务推荐模块，用于在检测到所述用户数据对应的所述预测值大于第一预设阈值时，将所述用户数据对应的所述候选用户作为目标用户，并向所述目标用户推荐目标业务。
一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至6任一项所述方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。