CN113313582A

CN113313582A - 拒客回捞模型训练方法、装置及电子设备

Info

Publication number: CN113313582A
Application number: CN202110713287.2A
Authority: CN
Inventors: 顾凌云; 谢旻旗; 段湾; 乔韵如; 王震宇
Original assignee: Shanghai IceKredit Inc
Current assignee: Shanghai IceKredit Inc
Priority date: 2021-06-25
Filing date: 2021-06-25
Publication date: 2021-08-27

Abstract

本申请提供一种拒客回捞模型训练方法、装置及电子设备，所述方法包括：根据用户数据训练样本确定入模变量并输入待训练模型进行处理，获得输出结果；根据样本标签、输出结果及预设的目标函数对待训练模型的模型参数进行调整；待训练模型的损失函数包括表征正样本的损失函数值的第一函数项和表征负样本的损失函数值的第二函数项，第一函数项包括表示正样本被预测为负样本时的第一惩罚系数，第二函数项包括表示负样本被预测为正样本时的第二惩罚系数，第一惩罚系数大于第二惩罚系数。如此，可以使得对将正样本预测为负样本的关注度高于将负样本预测为正样本，从而提高模型对正样本预测的准确度，确保模型在实际使用中回捞客户的风险在可控范围内。

Description

拒客回捞模型训练方法、装置及电子设备

技术领域

本申请涉及大数据技术领域，具体而言，涉及一种拒客回捞模型训练方法、装置及电子设备。

背景技术

拒客回捞是近年发展起来的一种风控模式，指的是金融放贷机构在一道风控业务已经拒绝过的客群中，构建新的风控模型进行二道筛选，并在确保风险可控的基础上尽可能回捞部分客户进行放贷。拒客回捞模式能够降低金融放贷机构的获客成本，在稳定风险的基础上进一步提高通过率。

在建模思路上，拒客回捞模型与信用评估模型有明显的差异。因为拒客回捞模型需首先确保风险可控，对逾期率的关注高于通过率，所以使用实际业务场景中，对“将正样本预测为负样本”的关注度高于将“将负样本预测为正样本”，因此传统的信用评估模型不适用于拒客回捞场景。

发明内容

为了克服现有技术中的上述不足，本申请的目的在于提供一种拒客回捞模型训练方法，其特征在于，所述方法包括：

获取包括多个用户数据训练样本，所述用户数据训练样本包括正样本及负样本，所述正样本的样本标签表征不需要回捞的用户，所述负样本的样本标签表征需要回捞的用户；

对所述用户数据训练样本进行特征提取和特征筛选，确定入模变量；

将所述用户数据训练样本和所述入模变量输入待训练模型进行处理，获得所述用户数据训练样本的输出结果；

根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整；

其中，所述待训练模型的损失函数包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数项，所述第一函数项包括表示正样本被预测为负样本时的第一惩罚系数，所述第二函数项包括表示负样本被预测为正样本时的第二惩罚系数，所述第一惩罚系数大于所述第二惩罚系数。

在一种可能的实现方式中，所述目标函数的公式如下：

其中，y_i表示用户数据训练样本i的真实标签，

表示用户数据训练样本i的预测标签为正样本的概率；

数据项

为所述第一函数项，w₀表示所述第一惩罚系数；

表示不同正样本计算损失函数值的调制系数，r表示权重调整比例，r≥0；

数据项

为所述第二函数项，w₁表示所述第二惩罚系数；

表示不同负样本计算损失函数值的调制系数，r表示权重调整比例，r≥0。

在一种可能的实现方式中，所述方法还包括：

根据用户数据训练样本中正负样本比例进行设置所述第一惩罚系数、第二惩罚系数及权重调整比例；或

使用所述用户数据训练样本进行网格搜索以确定所述第一惩罚系数、第二惩罚系数及权重调整比例。

在一种可能的实现方式中，所述方法还包括：

使用所述用户数据训练样本和所述入模变量，对待训练模型进行多次训练获得不同的已训练模型；其中，每次训练使用的不同的系数进行网格搜索；

通过预设的评价函数计算各所述已训练模型的评价指标值；

将所述评价指标值最高的已训练模型作为训练完成的拒客回捞模型。

在一种可能的实现方式中，所述评价函数的评价指标包括曲线下面积AUC指标或Kolmogorov-Smirnov指标。

在一种可能的实现方式中，所述通过预设的评价函数计算各所述已训练模型的评价指标值的步骤，包括：

针对各所述已训练模型，按照各所述用户数据训练样本的输出结果从小到大的顺序对用户数据训练样本排序，选择排名靠前的预设数量个样本通过所述评价函数计算获得评价指标值。

本申请还提供一种拒客回捞模型训练装置，所述装置包括：

数据获取模块，用于获取包括多个用户数据训练样本，所述用户数据训练样本包括正样本及负样本，所述正样本的样本标签表征不需要回捞的用户，所述负样本的样本标签表征需要回捞的用户；

特征处理模块，用于对所述用户数据训练样本进行特征提取和特征筛选，确定入模变量；

模型处理模块，用于将所述用户数据训练样本和所述入模变量输入待训练模型进行处理，获得所述用户数据训练样本的输出结果；

参数调整模块，用于根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整；

在一种可能的实现方式中，所述目标函数的公式如下：

其中，y_i表示用户数据训练样本i的真实标签，

表示用户数据训练样本i的预测标签为正样本的概率；

数据项

为所述第一函数项，w₀表示所述第一惩罚系数；

数据项

为所述第二函数项，w₁表示所述第二惩罚系数；

在一种可能的实现方式中，所述装置还包括：

系数调整模块，用于根据用户数据训练样本中正负样本比例进行设置所述第一惩罚系数、第二惩罚系数及权重调整比例；或使用所述用户数据训练样本进行网格搜索以确定所述第一惩罚系数、第二惩罚系数及权重调整比例。

本申请还提供一种电子设备，包括处理器及机器可读存储介质，所述机器可读存储介质存储有机器可执行指令，所述机器可执行指令在被所述处理器执行时，实现本申请提供的拒客回捞模型训练方法。

相对于现有技术而言，本申请具有以下有益效果：

本申请提供的拒客回捞模型训练方法、装置及电子设备，通过将模型时使用的损失函数设置为包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数项，所述第一函数项包括表示正样本被预测为负样本时的第一惩罚系数，所述第二函数项包括表示负样本被预测为正样本时的第二惩罚系数，所述第一惩罚系数大于所述第二惩罚系数。提高模型对正样本预测的准确度，提升模型使用效果，确保模型在实际使用中回捞客户的风险在可控范围内。如此，可以使得对“将正样本预测为负样本”的关注度高于“将负样本预测为正样本”，从而提高模型对正样本预测的准确度，提升模型使用效果，确保模型在实际使用中回捞客户的风险在可控范围内。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的拒客回捞模型训练方法的步骤流程示意图；

图2为本申请实施例提供的电子设备的示意图；

图3为本申请实施例提供的拒客回捞模型训练装置的功能模块示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

在本申请的描述中，需要说明的是，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请的描述中，还需要说明的是，除非另有明确的规定和限定，术语“设置”、“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本申请中的具体含义。

仅发明人研究发现，在建模思路上，拒客回捞模型与信用评估模型有明显的差异。因为拒客回捞模型需首先确保风险可控，对逾期率的关注高于通过率，所以使用实际业务场景中，对“将正样本预测为负样本”的关注度高于将“将负样本预测为正样本”。

传统信用评估场景下，通常使用下述的交叉熵函数和评价指标计算方法分别作为目标函数和评价函数：

1、损失函数用来评价模型的预测值与真实标签的差异程度，实际模型的训练过程中，损失函数越小，说明模型的性能越好。

交叉熵函数是分类问题中最常见的损失函数设置。而信用评估模型通常为二分类问题，因此其损失函数通常的计算公式如下所示：

其中：y_i表示样本i的真实标签，信用评估场景下通常设置逾期样本为正样本，真实标签取值为1；正常还款样本为负样本，真实标签取值为0；

表示样本i由模型预测为正样本的概率。

由上述公式可以看到，交叉熵函数在计算时是对各个训练样本的交叉熵直接求和，不同样本的权重是一致的。

2、评价函数用来评价模型的区分效果，通常二分类问题可以使用准确率、精确率、召回率、F1-Score、AUC、KS等作为评价指标。而在一般信用评估场景下，往往更多关注模型分数在整体建模样本上的AUC与KS取值。AUC和KS的值越大，模型在整体样本上的区分效果越好。

基于上述特点传统的使用下述的交叉熵函数和评价指标计算方法分别作为目标函数和评价函数在拒客回捞场景中会存在以下缺陷：

1、由传统的交叉熵函数的计算可知，交叉熵函数计算过程中，不同样本的权重是一致的。因此在计算“将正样本预测为负样本”和“将负样本预测为正样本”这两种情况的损失时并没有差异化的设置。

而在拒客回捞场景中，业务要求对“将正样本预测为负样本”的关注度高于“将负样本预测为正样本”，因为在拒客回捞的通过率相对较低的情况下，前者会带来更高的逾期率和损失。因此使用传统交叉熵函数训练的信用评估模型，无法更关注对正样本的分类效果，会影响最终回捞模型的使用效果。

2、传统评价指标计算时，通常是对全体样本计算确定的评价指标。而在拒客回捞场景中，通常更关注按模型结果排序后，在排位靠前的区间上模型的区分效果，例如模型分数在前20％客群上的区分效果，或模型分数在前30％客群上的区分效果。因此传统评价指标计算方法并不适用拒客回捞模型，以此训练出来的模型在实际使用中效果可能无法达到最佳。

有基于此，本实施例提供了一种拒客回捞模型训练方法、装置及电子设备已解决上述问题，下面对本实施例提供的方案进行详细阐述。

请参照图1，图1为本实施例提供的一种拒客回捞模型训练方法的步骤流程示意图，该方法可以包括以下步骤。

步骤S110，获取包括多个用户数据训练样本，所述用户数据训练样本包括正样本及负样本，所述正样本的样本标签表征不需要回捞的用户，所述负样本的样本标签表征需要回捞的用户。

在本实施例中，每个所述用户数据训练样本可以包括用户的个人信息数据、信贷记录、征信报告数据等等。在训练样本中，将不需要回捞的用户作为正样本，将需要回捞的用户作为负样本。

步骤S120，对所述用户数据训练样本进行特征提取和特征筛选，确定入模变量。

在本实施例中，可以使用常规的信用评估方案中的特征提取和特征筛选方式对训练样本进行特征提取和特征筛选，获得入模变量。同时还可以根据拒客回捞的实际业务需求，确定预估通过率上限记为m。

步骤S130，将所述用户数据训练样本和所述入模变量输入待训练模型进行处理，获得所述用户数据训练样本的输出结果。

在本实施例中，可以将所述用户数据训练样本和所述入模变量输入待训练模型进行，获得模型得出的预测概率值作为输出结果。

步骤S140，根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整。

具体地，在本实施例中，所述目标函数的公式如下：

其中，y_i表示用户数据训练样本i的真实标签，

表示用户数据训练样本i的预测标签为正样本的概率；

数据项

为所述第一函数项，w₀表示所述第一惩罚系数；

数据项

为所述第二函数项，w₁表示所述第二惩罚系数；

在一些可能的实现方式中，在实际构建模型的过程中，需要将损失系数w₀、w₁以及权重调整比例r设置为目标函数项的超参数，可以根据用户数据训练样本中正负样本比例进行设置所述第一惩罚系数、第二惩罚系数及权重调整比例；或使用所述用户数据训练样本进行网格搜索以自动地确定所述第一惩罚系数、第二惩罚系数及权重调整比例。

在一些可能的实现方式中，还可以使用所述用户数据训练样本和所述入模变量对，待训练模型进行多次训练获得不同的已训练模型；其中，每次训练使用的不同的系数进行网格搜索。然后通过预设的评价函数计算各所述已训练模型的评价指标值，将所述评价指标值最高的已训练模型作为训练完成的拒客回捞模型。其中，所述评价函数的评价指标包括曲线下面积AUC指标或Kolmogorov-Smirnov指标。

可选地，在本实施例中，还可以通过测试样本集合对各已训练的模型进行测试，在确定最终模型时，可以将训练样本的评价函数值尽可能好，且训练样本评价函数值和测试样本评价函数值的差值在设定的范围内的模型作为最终的拒客回捞模型。

具体地，在通过预设的评价函数计算各所述已训练模型的评价指标值时，可以针对各所述已训练模型，按照各所述用户数据训练样本的输出结果从小到大的顺序对用户数据训练样本排序，选择排名靠前的预设数量个样本通过所述评价函数计算获得评价指标值。实例性的，可以选取按照模型输出结果从小到大排序后，前m排位区间的训练样本进行评价指标值的计算，m为实际业务中预估通过率上限。

请参照图2，图2是本申请实施例提供的电子设备100的示意图，所述电子设备100可以是，但不限于，服务器、个人电脑等具有数据处理能力的设备。所述电子设备100包括拒客回捞模型训练装置110、机器可读存储介质120、处理器130。

所述机器可读存储介质120、处理器130相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述拒客回捞模型训练装置110包括至少一个可以软件或固件(firmware)的形式存储于所述机器可读存储介质120中或固化在所述电子设备100的操作***(operatingsystem，OS)中的软件功能模块。所述处理器130用于执行所述机器可读存储介质120中存储的可执行模块，例如所述拒客回捞模型训练装置110所包括的软件功能模块及计算机程序等。

其中，所述机器可读存储介质120可以是，但不限于，随机存取存储器(RandomAccess Memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read-Only Memory，PROM)，可擦除只读存储器(Erasable ProgrammableRead-Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable ProgrammableRead-Only Memory，EEPROM)等。其中，机器可读存储介质120用于存储程序，所述处理器130在接收到执行指令后，执行所述程序。

所述处理器130可能是一种集成电路芯片，具有信号的处理能力。上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

请参照图3，本实施例还提供一种拒客回捞模型训练装置，拒客回捞模型训练装置包括至少一个可以软件形式存储于机器可读存储介质中的功能模块。从功能上划分，拒客回捞模型训练装置可以包括数据获取模块111、特征处理模块112、模型处理模块113及参数调整模块114。

所述数据获取模块111用于获取包括多个用户数据训练样本，所述用户数据训练样本包括正样本及负样本，所述正样本的样本标签表征不需要回捞的用户，所述负样本的样本标签表征需要回捞的用户。

本实施例中，所述数据获取模块111可用于执行图1所示的步骤S110，关于所述数据获取模块111的具体描述可参对所述步骤S110的描述。

所述特征处理模块112用于对所述用户数据训练样本进行特征提取和特征筛选，确定入模变量。

本实施例中，所述特征处理模块112可用于执行图1所示的步骤S120，关于所述特征处理模块112的具体描述可参对所述步骤S120的描述。

所述模型处理模块113用于将所述用户数据训练样本和所述入模变量输入待训练模型进行处理，获得所述用户数据训练样本的输出结果。

本实施例中，所述模型处理模块113可用于执行图1所示的步骤S130，关于所述模型处理模块113的具体描述可参对所述步骤S130的描述。

所述参数调整模块114用于根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整。

本实施例中，所述参数调整模块114可用于执行图1所示的步骤S140，关于所述参数调整模块114的具体描述可参对所述步骤S140的描述。

在一些可能的实现方式中，所述目标函数的公式如下：

其中，y_i表示用户数据训练样本i的真实标签，

表示用户数据训练样本i的预测标签为正样本的概率；

数据项

为所述第一函数项，w₀表示所述第一惩罚系数；

数据项

为所述第二函数项，w₁表示所述第二惩罚系数；

在一些可能的实现方式中，所述装置还包括系数调整模块。

所述系数调整模块用于根据用户数据训练样本中正负样本比例进行设置所述第一惩罚系数、第二惩罚系数及权重调整比例；或使用所述用户数据训练样本进行网格搜索以确定所述第一惩罚系数、第二惩罚系数及权重调整比例。

综上所述，本申请提供的拒客回捞模型训练方法、装置及电子设备，通过将模型时使用的损失函数设置为包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数项，所述第一函数项包括表示正样本被预测为负样本时的第一惩罚系数，所述第二函数项包括表示负样本被预测为正样本时的第二惩罚系数，所述第一惩罚系数大于所述第二惩罚系数。提高模型对正样本预测的准确度，提升模型使用效果，确保模型在实际使用中回捞客户的风险在可控范围内。如此，可以使得对“将正样本预测为负样本”的关注度高于“将负样本预测为正样本”，从而提高模型对正样本预测的准确度，提升模型使用效果，确保模型在实际使用中回捞客户的风险在可控范围内。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个......”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述，仅为本申请的各种实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。