CN113724061A - 基于客户分群的消费金融产品信用评分方法及装置 - Google Patents
基于客户分群的消费金融产品信用评分方法及装置 Download PDFInfo
- Publication number
- CN113724061A CN113724061A CN202110946950.3A CN202110946950A CN113724061A CN 113724061 A CN113724061 A CN 113724061A CN 202110946950 A CN202110946950 A CN 202110946950A CN 113724061 A CN113724061 A CN 113724061A
- Authority
- CN
- China
- Prior art keywords
- model
- client
- grouping
- credit
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013077 scoring method Methods 0.000 title claims abstract description 12
- 238000007477 logistic regression Methods 0.000 claims abstract description 37
- 238000011156 evaluation Methods 0.000 claims abstract description 35
- 238000000034 method Methods 0.000 claims abstract description 29
- 238000011835 investigation Methods 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims description 68
- 238000012795 verification Methods 0.000 claims description 54
- 230000000694 effects Effects 0.000 claims description 32
- 238000012216 screening Methods 0.000 claims description 23
- 238000003066 decision tree Methods 0.000 claims description 17
- 238000000926 separation method Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 7
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 230000007547 defect Effects 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Technology Law (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于客户分群的消费金融产品信用评分方法及装置,能够克服传统单渠道信用评分模型的技术缺陷,解决客户分群信用评价方法的关键问题。所述方法包括以下步骤:获取单一客户的人行征信数据,根据预定义的客户分群规则,判定单一客户所属的一个或多个客户分群;将客户的征信数据导入其对应客户分群的分群逻辑回归评分卡模型中,计算获取对应每一个客户分群的分群信用评分。基于客户分群信用评价的思想,将其应用于消费金融产品的风控工作当中,从而弥补这类金融产品的现有信用评分方式未能够充分体现出不同客户群体违约行为特征。
Description
技术领域
本发明涉及金融产品风控技术领域,尤其涉及消费金融产品的客户信用评分技术领域。
背景技术
随着我国经济发展和公众消费水平的提高,各类消费金融产品越发普及。在消费金融产品的风险控制方面,对客户进行信用评分是主要采用的方式。信用评分是指根据客户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数。根据客户的信用分数,授信者可以分析消费者的信用等级以此来给予消费者不同程度的折扣和优惠。在信用评分的过程中,最关键的就是信用评分模型的构建。用来产生信用评分的模型不胜枚举,每一种模型均有其独特的规则。
目前的消费金融贷款产品的业务开展,都是由银行对接各类金融流量平台(如携程、360金融等)完成。目前大部分银行采用的是传统单渠道信用评分模型,即按流量渠道搭建各个渠道的准入策略、信用评分模型、额度策略。上述的单渠道信用评分模型,侧重于体现不同流量渠道的信用评分影响,未能体现客户群中存在不同的客户群类型对于信用评分的显著影响,存在以下弊端:(1)渠道内客户分群种类多,导致模型区分度低。(2)不同客户分群种类入模变量差异较大,导致渠道模型的变量为客户分群间的通用入模变量。(3)未深入画像区分,模型效果较低,导致额度利率策略效果差。
总之,现有评分模型,并未真正体现出客户个人属性(例如职业、年龄、固定资产情况、目前信贷情况)对于信用评分的影响,导致大量不同类型的客户采用统一模型影响了模型的最终评估效果。
发明内容
本发明是为了克服现有技术中的上述问题,提供一种基于客户分群的消费金融产品信用评分方法,能够克服传统单渠道信用评分模型的技术缺陷,解决客户分群信用评价方法的关键问题,同时提供一种实现该方法的基于客户分群的消费金融产品信用评分装置。
为实现上述目的,本发明采用以下技术方案:
本发明实施例提供一种基于客户分群的消费金融产品信用评分方法,所述方法包括以下步骤:
获取单一客户的人行征信数据,根据预定义的客户分群规则,判定单一客户所属的一个或多个客户分群;
将客户的征信数据导入其对应客户分群的分群逻辑回归评分卡模型中,计算获取对应每一个客户分群的分群信用评分。
作为优选,所述的客户分群规则的预定义步骤进一步包括:
根据经验定义人行征信变量若干变量为分群变量,根据所述分群变量构建分群决策树算法;
针对总训练集,利用人行征信变量,通过预设的分群决策树算法,获得多个训练集客户分群;
将好坏客户比例相近的客户分群合并,获得最终的客户分群,并将对应的分群变量的数值范围规则作为客户分群规则。
作为优选,所述的分群逻辑回归评分卡模型的制定方法,进一步包括如下步骤:
针对一个客户分群,根据其对应分群变量,对人行征信数据中的变量进行初步筛选,去掉缺失值大于0.6,iv值小于0.02,相关性大于0.7的变量;
对剩余变量进行卡方分箱,再调整每个变量分箱编号及对应坏样本率之间的单调性,留下单调且iv值大于0.02的变量,再对剩下的变量进行WOE编码;
卡方分箱后,再次去掉相关性大于0.7的变量;
根据逐步回归筛选出最终入模变量变量,将这些变量带入逻辑回归模型中,得到此客群的分群逻辑回归评分卡模型。
作为优选,当单一客户属于至少两个不同的客户分群时,将其征信数据导入对应的多个分群评分模型中;并根据预设权重结合多个评分,计算最终分群信用评分。
本发明同时提供一种基于客户分群的消费金融产品信用评分装置,所述装置包括:
客户分群模块,用于获取单一客户的人行征信数据,根据预定义的客户分群规则,判定单一客户所属的一个或多个客户分群;
信用评分模块,用于将客户的征信数据导入其对应客户分群的分群逻辑回归评分卡模型中,计算获取对应每一个客户分群的分群信用评分。
作为优选,所述的客户分群模块,进一步包括:
决策树构建单元,用于根据经验定义人行征信变量若干变量为分群变量,根据所述分群变量构建分群决策树算法;
初始分群单元,用于针对总训练集,利用人行征信变量,通过预设的分群决策树算法,获得多个训练集客户分群;
分群合并单元,用于将好坏客户比例相近的客户分群合并,获得最终的客户分群,并将对应的分群变量的数值范围规则作为客户分群规则。
作为优选,所述信用评分模块,进一步包括:
第一变量筛选单元,用于针对一个客户分群,根据其对应分群变量,对人行征信数据中的变量进行初步筛选,去掉缺失值大于0.6,iv值小于0.02,相关性大于0.7的变量;
第二变量筛选单元,用于对剩余变量进行卡方分箱,再调整每个变量分箱编号及对应坏样本率之间的单调性,留下单调且iv值大于0.02的变量,再对剩下的变量进行WOE编码;
第三变量筛选单元,用于卡方分箱后,再次去掉相关性大于0.7的变量;
评分卡构建单元,用于评分卡根据逐步回归筛选出最终入模变量变量,将这些变量带入逻辑回归模型中,得到此客群的分群逻辑回归评分卡模型。
作为优选,还包括加权评分模块,用于当单一客户属于至少两个不同的客户分群时,将其征信数据导入对应的多个分群评分模型中;并根据预设权重结合多个评分,计算最终分群信用评分。
本发明还提供一种基于客户分群的消费金融产品信用评分效果验证方法,所述方法包括以下步骤:
全体客户样本数据集按时间划分为总训练集和跨时间的总验证集,同时定义好坏客户标准,所述的客户样本数据包含人行征信数据风控变量;
根据预设的客户分群规则,判定总训练集和总验证集中的客户样本归属的客户分群,从而建立对应每个客户分群的分群训练集和分群验证集;
利用所述的分群训练集和分群验证集,分别建立各客户分群的分群逻辑回归评分卡模型;
利用总训练集和总验证集,建立对应各流量渠道的渠道评分卡模型;
根据客户对应客户分群的分群逻辑回归评分卡模型,计算总训练集和总验证集中所有客户对应分群的分群信用评分,若某客户不属于某一客户分群,则该客户对应该客户分群的分群信用评分赋值为空;根据客户对应渠道的渠道评分卡模型,计算总训练集和总验证集中所有客户对应渠道的渠道信用评分;
以所述的分群信用评分和渠道信用评分作为入模变量,利用总训练集和总跨时间验证集,建立主模型;
通过对比分群模型、渠道模型、主模型的模型评价指标,得出主模型效果明显优于渠道模型的结论,从而验证采用分群方法建立消费金融模型,模型效果可以得到很大提升。
作为优选,所述的利用所述的分群训练集和分群验证集,分别建立各客户分群的分群逻辑回归评分卡模型的步骤,进一步包括:
每个分群训练集构建分群逻辑回归评分卡模型,并得到对应每个分群的分群训练集模型效果KS、AUC评价指标,以及分群验证集模型效果KS、AUC评价指标,并确认每个分群训练集、分群验证集的模型评价指标未有较大差异,确认模型未过拟合,并通过入模变量和模型的稳定性PSI验证,从而建立每个客户分群的逻辑回归评分卡模型;
所述的利用总训练集和总验证集,建立对应各流量渠道的渠道评分卡模型的步骤,进一步包括:
针对总训练集构建渠道评分模型,并得到训练集模型效果KS、AUC评价指标,以及跨时间验证集模型效果KS、AUC评价指标,训练集、验证集的模型评价指标未有较大差异,确认渠道评分模型未过拟合,并通过入模变量和模型的稳定性PSI验证,从而建立渠道评分卡模型;
所述的以所述的分群信用评分和渠道信用评分作为入模变量,利用总训练集和总跨时间验证集,建立主模型的步骤,进一步包括:
利用总训练集对应的所有分群信用评分、渠道信用评分构作为入模变量构建主模型,并得到总训练集主模型效果KS、AUC评价指标,以及总验证集主模型效果KS、AUC评价指标,训练集、验证集的主模型评价指标未有较大差异,确认主模型未过拟合,并通过入模评分变量和主模型的稳定性PSI验证,从而建立主模型。
本发明的技术方案,基于客户分群信用评价的思想,将其应用于消费金融产品的风控工作当中,从而弥补这类金融产品的现有信用评分方式未能够充分体现出不同客户群体违约行为特征。同时提供了相应的客户分群规则制定方法及客户分群模型制定。同时确保各分群模型的入模变量有显著差异,即多个分群模型之间的入模变量不存在较大共线性,分群模型之间有相同的入模变量,变量分箱有显著差异。
附图说明
图1为本实施例的基于客户分群的消费金融产品信用评分方法的流程图。
图2为本实施例的方法中客户分群规则的预定义方法的流程图。
图3为本实施例的方法中的客户分群评分模型的制定方法的流程图。
图4为本实施例的基于客户分群的消费金融产品信用评分装置的第一结构原理图
图5为本实施例的基于客户分群的消费金融产品信用评分装置的第二结构原理图
图6为本实施例的基于客户分群的消费金融产品信用评分效果验证方法的流程图
具体实施方式
下面结合附图和具体实施方式对本发明做进一步描述。
如图1所示,本申请实施例提供一种基于客户分群的消费金融产品信用评分方法,所述方法包括以下步骤:
步骤S101,获取单一客户的人行征信数据,根据预定义的客户分群规则,判定单一客户所属的一个或多个客户分群。
步骤S102,将客户的征信数据导入其对应客户分群的分群逻辑回归评分卡模型中,计算获取对应每一个客户分群的分群信用评分。
步骤S103,当单一客户属于至少两个不同的客户分群时,将其征信数据导入对应的多个分群评分模型中;并根据预设权重结合多个评分,计算最终分群信用评分。
如图2所示,步骤S101中所述的客户分群规则的预定义步骤进一步包括:
步骤S201,根据经验定义人行征信变量若干变量为分群变量,根据所述分群变量构建分群决策树算法。
步骤S202,针对总训练集,利用人行征信变量,通过预设的分群决策树算法,获得多个训练集客户分群。
步骤S203,将好坏客户比例相近的客户分群合并,获得最终的客户分群,并将对应的分群变量的数值范围规则作为客户分群规则。
如图3所示,所述步骤S102中,所述的分群逻辑回归评分卡模型的制定方法,进一步包括如下步骤:
步骤S301,全体客户样本中按时间切分训练集、测试集和验证集。
步骤S302,针对一个客户分群,根据其对应分群变量,对人行征信数据中的变量进行初步筛选,去掉缺失值大于0.6,iv值小于0.02,相关性大于0.7的变量。在机器学习的二分类问题中,iv值(Information Value)主要用来对输入变量进行编码和预测能力评估
步骤S303,对剩余变量进行卡方分箱,再调整每个变量分箱编号及对应坏样本率之间的单调性,留下单调且iv值大于0.02的变量,再对剩下的变量进行WOE编码。
步骤S304,卡方分箱后,再次去掉相关性大于0.7的变量。
步骤S305,根据逐步回归筛选出最终入模变量变量,将这些变量带入逻辑回归模型中,得到此客户分群的分群模型。
如图4所示,本申请实施例同时一种基于客户分群的消费金融产品信用评分装置,通过该装置可实现上述的基于客户分群的消费金融产品信用评分方法。
所述装置包括:
客户分群模块1,用于获取单一客户的人行征信数据,根据预定义的客户分群规则,判定单一客户所属的一个或多个客户分群;
信用评分模块2,用于将客户的征信数据导入其对应客户分群的分群逻辑回归评分卡模型中,计算获取对应每一个客户分群的分群信用评分。
加权评分模块3,用于当单一客户属于至少两个不同的客户分群时,将其征信数据导入对应的多个分群评分模型中;并根据预设权重结合多个评分,计算最终分群信用评分。
图5为本实施例的基于客户分群的消费金融产品信用评分装置的第二结构原理图,在一个优选的示例中,所述的客户分群模块1,进一步包括:
决策树构建单元101,用于根据经验定义人行征信变量若干变量为分群变量,根据所述分群变量构建分群决策树算法;
初始分群单元102,用于针对总训练集,利用人行征信变量,通过预设的分群决策树算法,获得多个训练集客户分群;
分群合并单元103,用于将好坏客户比例相近的客户分群合并,获得最终的客户分群,并将对应的分群变量的数值范围规则作为客户分群规则。
优选的,所述信用评分模块2,进一步包括:
第一变量筛选单元201,用于针对一个客户分群,根据其对应分群变量,对人行征信数据中的变量进行初步筛选,去掉缺失值大于0.6,iv值小于0.02,相关性大于0.7的变量;
第二变量筛选单元202,用于对剩余变量进行卡方分箱,再调整每个变量分箱编号及对应坏样本率之间的单调性,留下单调且iv值大于0.02的变量,再对剩下的变量进行WOE编码;
第三变量筛选单元203,用于卡方分箱后,再次去掉相关性大于0.7的变量;
评分卡构建单元204,用于评分卡根据逐步回归筛选出最终入模变量变量,将这些变量带入逻辑回归模型中,得到此客群的分群逻辑回归评分卡模型。
本实施例中所指的装置、模块和单元均是由集成电路和电子元件构成,用于存储程序,通过数据采集、计算和程序运行,实现基于客户分群的消费金融产品信用评分方法。
本申请实施例的技术方案,基于客户分群信用评价的思想,将其应用于消费金融产品的风控工作当中,从而弥补这类金融产品的现有信用评分方式未能够充分体现出不同客户群体违约行为特征。同时提供了相应的客户分群规则制定方法及客户分群模型制定。同时确保各分群模型的入模变量有显著差异,即多个分群模型之间的入模变量不存在较大共线性,分群模型之间有相同的入模变量,变量分箱有显著差异。
如图6所示,本申请实施例的一种基于客户分群的消费金融产品信用评分效果验证方法,所述方法包括以下步骤:
步骤S001,全体客户样本数据集按时间划分为总训练集和跨时间的总验证集,同时定义好坏客户标准,所述的客户样本数据包含人行征信数据风控变量。
所述好坏客户标准为模型观察期内逾期20天以上为坏客户。所述的全体客户样本数据集是包含了每一个客户的人行征信数据,已有8000多个人行征信风控变量。
步骤S002,根据预设的客户分群规则,判定总训练集和总验证集中的客户样本归属的客户分群,从而建立对应每个客户分群的分群训练集和分群验证集。
步骤S003,利用所述的分群训练集和分群验证集,分别建立各客户分群的分群逻辑回归评分卡模型。
具体的方式是:每个分群训练集构建分群逻辑回归评分卡模型,并得到对应每个分群的分群训练集模型效果KS、AUC评价指标,以及分群验证集模型效果KS、AUC评价指标,并确认每个分群训练集、分群验证集的模型评价指标未有较大差异,确认模型未过拟合,并通过入模变量和模型的稳定性PSI验证,从而建立每个客户分群的逻辑回归评分卡模型。
步骤S004,利用总训练集和总验证集,建立对应各流量渠道的渠道评分卡模型。
具体的方式是:针对总训练集构建渠道评分模型,并得到训练集模型效果KS、AUC评价指标,以及跨时间验证集模型效果KS、AUC评价指标,训练集、验证集的模型评价指标未有较大差异,确认渠道评分模型未过拟合,并通过入模变量和模型的稳定性PSI验证,从而建立渠道评分卡模型。
所述的渠道评分模型和目前大部分银行采用的是传统单渠道信用评分模型类似,即按流量渠道搭建各个渠道的准入策略、信用评分模型、额度策略。单渠道信用评分模型,侧重于体现不同流量渠道的信用评分影响,属于现有技术在此不再赘述。
步骤S005,根据客户对应客户分群的分群逻辑回归评分卡模型,计算总训练集和总验证集中所有客户对应分群的分群信用评分,若某客户不属于某一客户分群,则该客户对应该客户分群的分群信用评分赋值为空;根据客户对应渠道的渠道评分卡模型,计算总训练集和总验证集中所有客户对应渠道的渠道信用评分。
步骤S006,以所述的分群信用评分和渠道信用评分作为入模变量,利用总训练集和总跨时间验证集,建立主模型。
具体的方式是:利用总训练集对应的所有分群信用评分、渠道信用评分构作为入模变量构建主模型,并得到总训练集主模型效果KS、AUC评价指标,以及总验证集主模型效果KS、AUC评价指标,训练集、验证集的主模型评价指标未有较大差异,确认主模型未过拟合,并通过入模评分变量和主模型的稳定性PSI验证,从而建立主模型。
步骤S007,通过对比分群模型、渠道模型、主模型的模型评价指标,得出主模型效果明显优于渠道模型的结论,从而验证采用分群方法建立消费金融模型,模型效果可以得到很大提升。
以一个具体示例具体说明,其中所述好坏客户标准为模型观察期内逾期20天以上为坏客户,还可以根据经验选取其他的单一指标定义好坏客户。
根据步骤S201~S203所述的客户分群规则的预定义方法:
将训练数据集样本带入分群决策树模型中得到4个客户分群,决策树结果如图4所示。其中四个客户分群采用贷款笔数和最大一笔贷款本金两项变量作为分群变量,四个客户分群分别为:(1)贷款笔数小于23笔且最大一笔贷款本金小于63680元的客户分群;(2)贷款笔数小于23笔且最大一笔贷款本金大于等于63680元的客户分群;(3)贷款笔数大于等于23笔且最大一笔贷款本金小于63680元的客户分群;(4)贷款笔数大于等于23笔且最大一笔贷款本金大于等于63680元的客户分群。
其中第二、三个客户分群的坏样本率非常接近,分别为0.059和0.054,因此合并这两个客户分群,最终得到通过两个变量划分的三个客户分群。最终分群规则的分群表如下:
以客户分群1为例,根据步骤S301~S305所述的客户分群评分模型的制定方法:
首先对变量进行初步筛选,去掉缺失值大于0.6,iv值小于0.02,相关性大于0.7的变量;然后对剩余变量进行卡方分箱,再调整每个变量分箱编号及对应坏样本率之间的单调性,留下单调且iv值大于0.02的变量,再对剩下的变量进行WOE编码;由于分箱后,变量间的相关性会增加,再次去掉相关性大于0.7的变量;接着根据逐步回归筛选出最终入模变量变量,将这些变量带入逻辑回归模型中,得到此客户分群的分群模型。
客户分群1的分群逻辑回归评分卡模型的评分卡如下表:
选取渠道模型评分评分模型的评分卡如下表:
以KS值、AUC值为模型评价标准,对分群模型和渠道模型的测试结果进行比较。其中KS值越大代表真实性越高;AUC值越接近1.0,真实性越高;等于0.5时,则真实性最低,无应用价值。
建立客户分群1、客户分群2、客户分群3的分群模型,三个分群模型在跨时间样本上的KS值分别为0.3131,0.3022,0.3093;AUC值分别为0.7097,0.6919,0.6963。渠道评分模型在跨时间样本上的KS值为0.2575,AUC值为0.6773。
再根据步骤S006~S007,构建主模型,主模型在跨时间样本中的KS值为0.3334,AUC值为0.7122。
上述模型的测试结果对比如下:
KS值 | AUC值 | |
分群模型1 | 0.3131 | 0.7097 |
分群模型2 | 0.3022 | 0.6919 |
分群模型3 | 0.3093 | 0.6963 |
渠道模型 | 0.2575 | 0.6773 |
评分主模型 | 0.3334 | 0.7122 |
通过对比分群模型、渠道模型、主模型的模型评价指标,得出主模型效果明显优于渠道模型的结论,从而验证采用分群方法建立消费金融模型,模型效果可以得到很大提升。
Claims (10)
1.一种基于客户分群的消费金融产品信用评分方法,其特征是,所述方法包括以下步骤:
获取单一客户的人行征信数据,根据预定义的客户分群规则,判定单一客户所属的一个或多个客户分群;
将客户的征信数据导入其对应客户分群的分群逻辑回归评分卡模型中,计算获取对应每一个客户分群的分群信用评分。
2.根据权利要求1所述的基于客户分群的消费金融产品信用评分方法,其特征是,所述的客户分群规则的预定义步骤进一步包括:
根据经验定义人行征信变量若干变量为分群变量,根据所述分群变量构建分群决策树算法;
针对总训练集,利用人行征信变量,通过预设的分群决策树算法,获得多个训练集客户分群;
将好坏客户比例相近的客户分群合并,获得最终的客户分群,并将对应的分群变量的数值范围规则作为客户分群规则。
3.根据权利要求1所述的基于客户分群的消费金融产品信用评分方法,其特征是,所述的分群逻辑回归评分卡模型的制定方法,进一步包括如下步骤:
针对一个客户分群,根据其对应分群变量,对人行征信数据中的变量进行初步筛选,去掉缺失值大于0.6,iv值小于0.02,相关性大于0.7的变量;
对剩余变量进行卡方分箱,再调整每个变量分箱编号及对应坏样本率之间的单调性,留下单调且iv值大于0.02的变量,再对剩下的变量进行WOE编码;
卡方分箱后,再次去掉相关性大于0.7的变量;
根据逐步回归筛选出最终入模变量变量,将这些变量带入逻辑回归模型中,得到此客群的分群逻辑回归评分卡模型。
4.根据权利要求1所述的基于客户分群的消费金融产品信用评分方法,其特征是,当单一客户属于至少两个不同的客户分群时,将其征信数据导入对应的多个分群评分模型中;并根据预设权重结合多个评分,计算最终分群信用评分。
5.一种基于客户分群的消费金融产品信用评分装置,其特征是,所述装置包括:
客户分群模块,用于获取单一客户的人行征信数据,根据预定义的客户分群规则,判定单一客户所属的一个或多个客户分群;
信用评分模块,用于将客户的征信数据导入其对应客户分群的分群逻辑回归评分卡模型中,计算获取对应每一个客户分群的分群信用评分。
6.根据权利要求5所述的基于客户分群的消费金融产品信用评分装置,其特征是,所述的客户分群模块,进一步包括:
决策树构建单元,用于根据经验定义人行征信变量若干变量为分群变量,根据所述分群变量构建分群决策树算法;
初始分群单元,用于针对总训练集,利用人行征信变量,通过预设的分群决策树算法,获得多个训练集客户分群;
分群合并单元,用于将好坏客户比例相近的客户分群合并,获得最终的客户分群,并将对应的分群变量的数值范围规则作为客户分群规则。
7.根据权利要求5所述的基于客户分群的消费金融产品信用评分装置,其特征是,所述信用评分模块,进一步包括:
第一变量筛选单元,用于针对一个客户分群,根据其对应分群变量,对人行征信数据中的变量进行初步筛选,去掉缺失值大于0.6,iv值小于0.02,相关性大于0.7的变量;
第二变量筛选单元,用于对剩余变量进行卡方分箱,再调整每个变量分箱编号及对应坏样本率之间的单调性,留下单调且iv值大于0.02的变量,再对剩下的变量进行WOE编码;
第三变量筛选单元,用于卡方分箱后,再次去掉相关性大于0.7的变量;
评分卡构建单元,用于评分卡根据逐步回归筛选出最终入模变量变量,将这些变量带入逻辑回归模型中,得到此客群的分群逻辑回归评分卡模型。
8.根据权利要求5所述的基于客户分群的消费金融产品信用评分装置,其特征是,还包括加权评分模块,用于当单一客户属于至少两个不同的客户分群时,将其征信数据导入对应的多个分群评分模型中;并根据预设权重结合多个评分,计算最终分群信用评分。
9.一种基于客户分群的消费金融产品信用评分效果验证方法,其特征是,所述方法包括以下步骤:
全体客户样本数据集按时间划分为总训练集和跨时间的总验证集,同时定义好坏客户标准,所述的客户样本数据包含人行征信数据风控变量;
根据预设的客户分群规则,判定总训练集和总验证集中的客户样本归属的客户分群,从而建立对应每个客户分群的分群训练集和分群验证集;
利用所述的分群训练集和分群验证集,分别建立各客户分群的分群逻辑回归评分卡模型;
利用总训练集和总验证集,建立对应各流量渠道的渠道评分卡模型;
根据客户对应客户分群的分群逻辑回归评分卡模型,计算总训练集和总验证集中所有客户对应分群的分群信用评分,若某客户不属于某一客户分群,则该客户对应该客户分群的分群信用评分赋值为空;根据客户对应渠道的渠道评分卡模型,计算总训练集和总验证集中所有客户对应渠道的渠道信用评分;
以所述的分群信用评分和渠道信用评分作为入模变量,利用总训练集和总跨时间验证集,建立主模型;
通过对比分群模型、渠道模型、主模型的模型评价指标,得出主模型效果明显优于渠道模型的结论,从而验证采用分群方法建立消费金融模型,模型效果可以得到很大提升。
10.根据权利要求9所述的基于客户分群的消费金融产品信用评分效果验证方法,其特征是,所述的利用所述的分群训练集和分群验证集,分别建立各客户分群的分群逻辑回归评分卡模型的步骤,进一步包括:
每个分群训练集构建分群逻辑回归评分卡模型,并得到对应每个分群的分群训练集模型效果KS、AUC评价指标,以及分群验证集模型效果KS、AUC评价指标,并确认每个分群训练集、分群验证集的模型评价指标未有较大差异,确认模型未过拟合,并通过入模变量和模型的稳定性PSI验证,从而建立每个客户分群的逻辑回归评分卡模型;
所述的利用总训练集和总验证集,建立对应各流量渠道的渠道评分卡模型的步骤,进一步包括:
针对总训练集构建渠道评分模型,并得到训练集模型效果KS、AUC评价指标,以及跨时间验证集模型效果KS、AUC评价指标,训练集、验证集的模型评价指标未有较大差异,确认渠道评分模型未过拟合,并通过入模变量和模型的稳定性PSI验证,从而建立渠道评分卡模型;
所述的以所述的分群信用评分和渠道信用评分作为入模变量,利用总训练集和总跨时间验证集,建立主模型的步骤,进一步包括:
利用总训练集对应的所有分群信用评分、渠道信用评分构作为入模变量构建主模型,并得到总训练集主模型效果KS、AUC评价指标,以及总验证集主模型效果KS、AUC评价指标,训练集、验证集的主模型评价指标未有较大差异,确认主模型未过拟合,并通过入模评分变量和主模型的稳定性PSI验证,从而建立主模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110946950.3A CN113724061A (zh) | 2021-08-18 | 2021-08-18 | 基于客户分群的消费金融产品信用评分方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110946950.3A CN113724061A (zh) | 2021-08-18 | 2021-08-18 | 基于客户分群的消费金融产品信用评分方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113724061A true CN113724061A (zh) | 2021-11-30 |
Family
ID=78676208
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110946950.3A Pending CN113724061A (zh) | 2021-08-18 | 2021-08-18 | 基于客户分群的消费金融产品信用评分方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113724061A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112017062A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 基于客群细分的资源额度分配方法、装置及电子设备 |
CN114996371A (zh) * | 2022-08-03 | 2022-09-02 | 广东中盈盛达数字科技有限公司 | 基于图论算法的关联企业反欺诈模型构建方法及*** |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109886349A (zh) * | 2019-02-28 | 2019-06-14 | 成都新希望金融信息有限公司 | 一种基于多模型融合的用户分类方法 |
CN110349007A (zh) * | 2019-07-02 | 2019-10-18 | 上海淇毓信息科技有限公司 | 基于变量区分度指标进行用户分群提额的方法、装置和电子设备 |
CN110349000A (zh) * | 2019-06-29 | 2019-10-18 | 上海淇毓信息科技有限公司 | 基于用户分群的提额策略确定方法、装置和电子设备 |
CN110415103A (zh) * | 2019-07-02 | 2019-11-05 | 上海淇毓信息科技有限公司 | 基于变量影响度指标进行用户分群提额的方法、装置和电子设备 |
CN110689311A (zh) * | 2018-07-06 | 2020-01-14 | 马上消费金融股份有限公司 | 一种用户分群方法、***、设备及计算机可读存储介质 |
CN110807527A (zh) * | 2019-09-30 | 2020-02-18 | 北京淇瑀信息科技有限公司 | 一种基于客群筛选的额度调整方法、装置和电子设备 |
CN110807653A (zh) * | 2019-11-28 | 2020-02-18 | 北京淇瑀信息科技有限公司 | 一种筛选用户的方法、装置和电子设备 |
CN110956273A (zh) * | 2019-11-07 | 2020-04-03 | 中信银行股份有限公司 | 融合多种机器学习模型的征信评分方法及*** |
CN111275338A (zh) * | 2020-01-20 | 2020-06-12 | 深圳微众税银信息服务有限公司 | 一种企业欺诈行为的判定方法、装置、设备及存储介质 |
CN111696661A (zh) * | 2020-05-13 | 2020-09-22 | 平安科技(深圳)有限公司 | 患者分群模型构建方法、患者分群方法及相关设备 |
CN112395478A (zh) * | 2021-01-18 | 2021-02-23 | 索信达(北京)数据技术有限公司 | 一种双模型共用的数据筛选方法及*** |
CN112434886A (zh) * | 2020-12-17 | 2021-03-02 | 北京环信简益科技有限公司 | 一种预测客户抵押贷款违约概率的方法 |
CN112686479A (zh) * | 2021-03-15 | 2021-04-20 | 上海冰鉴信息科技有限公司 | 基于联合模型的数据处理方法及装置 |
CN112966991A (zh) * | 2021-05-19 | 2021-06-15 | 南京蜂泰互联网科技有限公司 | 基于逻辑回归模型的评分卡模型的建立方法 |
-
2021
- 2021-08-18 CN CN202110946950.3A patent/CN113724061A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110689311A (zh) * | 2018-07-06 | 2020-01-14 | 马上消费金融股份有限公司 | 一种用户分群方法、***、设备及计算机可读存储介质 |
CN109886349A (zh) * | 2019-02-28 | 2019-06-14 | 成都新希望金融信息有限公司 | 一种基于多模型融合的用户分类方法 |
CN110349000A (zh) * | 2019-06-29 | 2019-10-18 | 上海淇毓信息科技有限公司 | 基于用户分群的提额策略确定方法、装置和电子设备 |
CN110349007A (zh) * | 2019-07-02 | 2019-10-18 | 上海淇毓信息科技有限公司 | 基于变量区分度指标进行用户分群提额的方法、装置和电子设备 |
CN110415103A (zh) * | 2019-07-02 | 2019-11-05 | 上海淇毓信息科技有限公司 | 基于变量影响度指标进行用户分群提额的方法、装置和电子设备 |
CN110807527A (zh) * | 2019-09-30 | 2020-02-18 | 北京淇瑀信息科技有限公司 | 一种基于客群筛选的额度调整方法、装置和电子设备 |
CN110956273A (zh) * | 2019-11-07 | 2020-04-03 | 中信银行股份有限公司 | 融合多种机器学习模型的征信评分方法及*** |
CN110807653A (zh) * | 2019-11-28 | 2020-02-18 | 北京淇瑀信息科技有限公司 | 一种筛选用户的方法、装置和电子设备 |
CN111275338A (zh) * | 2020-01-20 | 2020-06-12 | 深圳微众税银信息服务有限公司 | 一种企业欺诈行为的判定方法、装置、设备及存储介质 |
CN111696661A (zh) * | 2020-05-13 | 2020-09-22 | 平安科技(深圳)有限公司 | 患者分群模型构建方法、患者分群方法及相关设备 |
CN112434886A (zh) * | 2020-12-17 | 2021-03-02 | 北京环信简益科技有限公司 | 一种预测客户抵押贷款违约概率的方法 |
CN112395478A (zh) * | 2021-01-18 | 2021-02-23 | 索信达(北京)数据技术有限公司 | 一种双模型共用的数据筛选方法及*** |
CN112686479A (zh) * | 2021-03-15 | 2021-04-20 | 上海冰鉴信息科技有限公司 | 基于联合模型的数据处理方法及装置 |
CN112966991A (zh) * | 2021-05-19 | 2021-06-15 | 南京蜂泰互联网科技有限公司 | 基于逻辑回归模型的评分卡模型的建立方法 |
Non-Patent Citations (10)
Title |
---|
吴运奇;: "***客户流失的新模型", 中国***, no. 24 * |
张丹君著: "智能风控-python金融风险管理与评分卡建模", 知识产权出版社, pages: 163 * |
张彦彬;苏杨;许亚春;彭速标;徐国江;刘阳丽;钟志光;萧达辉;: "基于LSTM神经网络模型对大宗矿产资源放行风险预测研究", 中国口岸科学技术, no. 06 * |
杨志燕;黄天宝;王树山;林华日;周君艺;: "基于支持向量机的急性百草枯中毒预后模型的建立与评价", 南京医科大学学报(自然科学版), no. 10 * |
王方春;: "LightGBM算法在早期催收管理工作中的应用", 电脑知识与技术, no. 07 * |
陈煜;周继恩;杜金泉;: "基于交易数据的信用评估方法", 计算机应用与软件, no. 05 * |
***;杨慧荣;崔恒建;: "变量筛选后的个人信贷评分模型与统计学习", 数理统计与管理, no. 02 * |
韩修龙: "基于XGBOOST的用户信用评分建模", 电脑知识与技术, vol. 14, no. 5, pages 8 * |
魏秉全;袁卫东;秦思佳;: "基于数据挖掘的普惠信贷客户智能营销模型", 金融科技时代, no. 04 * |
魏秋萍;张景肖;张波;: "基于核函数法进行拒绝推断的信用评分模型", 统计与决策, no. 12 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112017062A (zh) * | 2020-07-15 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 基于客群细分的资源额度分配方法、装置及电子设备 |
CN112017062B (zh) * | 2020-07-15 | 2024-06-07 | 北京淇瑀信息科技有限公司 | 基于客群细分的资源额度分配方法、装置及电子设备 |
CN114996371A (zh) * | 2022-08-03 | 2022-09-02 | 广东中盈盛达数字科技有限公司 | 基于图论算法的关联企业反欺诈模型构建方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109978680A (zh) | 一种细分客群信贷业务风控差异化定价的风控方法和*** | |
CN108053310A (zh) | 信用风险评分方法、装置、计算机设备及存储介质 | |
CN107066616A (zh) | 用于账号处理的方法、装置及电子设备 | |
CN107665333A (zh) | 一种基于卷积神经网络的不雅图片识别方法、终端、设备及计算机可读存储介质 | |
CN105931116A (zh) | 基于深度学习机制的自动化信用评分***及方法 | |
CN106384282A (zh) | 构建决策模型的方法和装置 | |
CN108596630A (zh) | 基于深度学习的欺诈交易识别方法、***及存储介质 | |
CN113724061A (zh) | 基于客户分群的消费金融产品信用评分方法及装置 | |
CN111815432B (zh) | 金融服务风险预测方法及装置 | |
CN109034194A (zh) | 基于特征分化的交易欺诈行为深度检测方法 | |
CN111695597A (zh) | 基于改进式孤立森林算法的信贷欺诈团伙识别方法和*** | |
CN107766823A (zh) | 基于关键区域特征学习的视频中异常行为检测方法 | |
CN110222733A (zh) | 一种高精度的多阶神经网络分类方法及*** | |
CN110020868A (zh) | 基于线上交易特征的反欺诈模块决策融合方法 | |
CN111310918B (zh) | 一种数据处理方法、装置、计算机设备及存储介质 | |
CN112308148A (zh) | 缺陷类别识别、孪生神经网络训练方法、装置及存储介质 | |
CN116012131A (zh) | 一种用于评估用户信贷风险的方法、***、装置以及介质 | |
CN114169439A (zh) | 异常通信号码的识别方法、装置、电子设备和可读介质 | |
CN114139931A (zh) | 企业数据评估方法、装置、计算机设备及存储介质 | |
CN115423600B (zh) | 数据筛选方法、装置、介质及电子设备 | |
CN116821688A (zh) | 基于聚类下采样技术处理***欺诈交易中数据集的方法 | |
CN110533341A (zh) | 一种基于bp神经网络的城市宜居性评价方法 | |
CN110414586A (zh) | 基于深度学习的防伪标签验伪方法、装置、设备及介质 | |
CN115762530A (zh) | 声纹模型训练方法、装置、计算机设备和存储介质 | |
CN115587828A (zh) | 一种基于Shap值的电信欺诈场景的可解释方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |