CN118035750A - 一种基于panel data的信贷模型样本构建方法 - Google Patents
一种基于panel data的信贷模型样本构建方法 Download PDFInfo
- Publication number
- CN118035750A CN118035750A CN202410434238.9A CN202410434238A CN118035750A CN 118035750 A CN118035750 A CN 118035750A CN 202410434238 A CN202410434238 A CN 202410434238A CN 118035750 A CN118035750 A CN 118035750A
- Authority
- CN
- China
- Prior art keywords
- credit
- users
- features
- variation
- change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 28
- 238000012216 screening Methods 0.000 claims abstract description 20
- 230000008859 change Effects 0.000 claims description 157
- 238000000605 extraction Methods 0.000 claims description 35
- 238000011156 evaluation Methods 0.000 claims description 17
- 239000002131 composite material Substances 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 5
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供一种基于panel data的信贷模型样本构建方法,属于数据处理技术领域,具体包括:基于不同的信贷用户的信贷特征的变动情况进行存在信贷特征的变动的信贷用户的确定,并结合不同的信贷用户的逾期状态的变动情况与信贷特征的变动情况的关联数据进行信贷特征中的有效变动信贷特征的确定,根据不同的时间维度的面板数据以及信贷用户的逾期状态的变动情况的关联数据确定不同的有效变动信贷特征的综合关联系数,以综合关联系数为基础对所述有效变动信贷特征进行筛选得到输入样本中的变动输入样本,并结合输入样本中的稳定输入样本进行信贷模型的输入样本的确定,实现了存量用户的信贷风险的准确评估。
Description
技术领域
本发明属于数据处理技术领域,尤其涉及一种基于panel data的信贷模型样本构建方法。
背景技术
面板数据,即panel data,也叫“平行数据”,是指在时间序列上取多个截面,在这些截面上同时选取样本观测值所构成的样本数据。或者说它是一个mxn的数据矩阵,记载的是n个时间节点上,m个对象的某一数据指标,因此通过对面板数据的分析,实现对信贷模型的样本的筛选,对于提升信贷模型的收敛稳定性和收敛可靠性具有较高的现实意义。
针对上述技术问题,本发明提供了一种基于panel data的信贷模型样本构建方法。
发明内容
为实现本发明目的,本发明采用如下技术方案:
根据本发明的一个方面,提供了一种基于panel data的信贷模型样本构建方法。
一种基于panel data的信贷模型样本构建方法,其特征在于,具体包括:
S1基于不同的信贷用户的信贷特征的变动情况进行存在所述信贷特征的变动的信贷用户的确定,并结合不同的信贷用户的逾期状态的变动情况与信贷特征的变动情况的关联数据进行所述信贷特征中的有效变动信贷特征的确定;
S2将存在所述有效变动信贷特征的变动的信贷用户作为变动信贷用户,并根据不同的变动信贷用户的有效变动信贷特征的变动情况进行不同的有效变动信贷特征的抽取时间间隔的确定;
S3基于所述抽取时间间隔进行不同的有效变动信贷特征的不同的时间维度的面板数据的抽取,根据不同的时间维度的面板数据以及信贷用户的逾期状态的变动情况的关联数据确定不同的有效变动信贷特征的综合关联系数;
S4以所述综合关联系数为基础对所述有效变动信贷特征进行筛选得到所述输入样本中的变动输入样本,并结合所述输入样本中的稳定输入样本进行信贷模型的输入样本的确定。
本发明的有益效果在于:
1、根据信贷特征的变动的信贷用户以及不同的信贷用户的逾期状态的变动情况与信贷特征的变动情况的关联数据进行信贷特征中的有效变动信贷特征的确定,实现了从信贷特征的变动情况以及与逾期状态的关联情况两个角度进行了有效变动信贷特征的筛选,为进一步实现从不同的时间维度的面板数据的差异化抽取和变动输入样本的确定奠定了基础。
2、根据不同的时间维度的面板数据以及信贷用户的逾期状态的变动情况的关联数据确定不同的有效变动信贷特征的综合关联系数,避免了原有的单一的采用某一个时间维度的关联情况导致的关联系数的评估准确率不高的技术问题,实现了从多个时间尺度的角度进行有效变动信贷特征的筛选,也为进一步提升存量用户的信贷风险的高效准确评估奠定了基础。
3、以综合关联系数为基础对有效变动信贷特征进行筛选得到输入样本中的变动输入样本,提升了变动输入样本的筛选的准确性,在保证信贷风险的评估准确率的基础上,也进一步减少了风控模型的收敛难度,提升了处理效率。
进一步的技术方案在于,所述信贷特征包括但不限于信用账户支用特征、还款特征、多头借贷特征、工作信息特征以及身份特征。
进一步的技术方案在于,所述信贷用户的逾期状态的变动情况与信贷特征的变动情况的关联数据根据所述信贷用户的逾期状态的变动情况与所述信贷用户的不同类型的信贷特征的变动数量进行确定。
进一步的技术方案在于,所述变动输入样本的筛选的方法为:
当所述有效变动特征的综合关联系数大于预设关联系数值时,则确定所述有效变动特征为变动输入样本。
进一步的技术方案在于,所述稳定输入样本根据所述信贷特征的类型进行确定,具体的根据所述信贷特征的类型的匹配结果进行确定。
其他特征和优点将在随后的说明书中阐述,本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显;
图1是一种基于panel data的信贷模型样本构建方法的流程图;
图2是信贷特征中的有效变动信贷特征的确定的方法的流程图;
图3是有效变动信贷特征的抽取时间间隔的确定的方法的流程图;
图4是有效变动信贷特征的综合关联系数的确定的方法的流程图;
图5是一种计算机存储介质的框架图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
在基于信贷模型进行信贷用户的逾期风险的分析时,简单的采用某一时间维度的数据并不能准确的实现对信贷用户的逾期风险的准确评估,因此本申请中通过对不同的时间维度的信贷特征的提取,并结合信贷用户的稳定信贷特征实现对信贷用户的逾期风险的准确评估。
具体的,采用以下技术方案:
首先根据不同的信贷用户的信贷特征的变动情况与逾期状态的变动情况的关联情况进行信贷特征中的有效变动信贷特征的确定,具体的将存在信贷特征的变动的信贷用户中的逾期占比较大的作为有效变动信贷特征。
根据不同的信贷用户的有效变动信贷特征的变动数据进行抽取时间间隔的确定,具体的根据信贷用户的有效变动信贷特征的变动的平均时长确定抽取时间间隔。
根据不同的时间维度的面板数据以及信贷用户的逾期状态的变动情况的关联数据确定不同的有效变动信贷特征的综合关联系数,具体的根据不同的时间维度的有效变动特征的信贷用户的逾期状态的变动数量占比的权重和确定综合关联系数。
当有效变动特征的综合关联系数大于预设关联系数值时,则确定有效变动特征为变动输入样本,稳定输入样本根据信贷特征的类型进行确定,具体的根据所述信贷特征的类型的匹配结果进行确定,基于变动输入样本和输入样本中的稳定输入样本进行信贷模型的输入样本的确定。
以下将从方法类实施例和***类实施例两个角度进行进一步阐述。
为解决上述问题,根据本发明的一个方面,如图1所示,提供了一种基于paneldata的信贷模型样本构建方法,其特征在于,具体包括:
S1基于不同的信贷用户的信贷特征的变动情况进行存在所述信贷特征的变动的信贷用户的确定,并结合不同的信贷用户的逾期状态的变动情况与信贷特征的变动情况的关联数据进行所述信贷特征中的有效变动信贷特征的确定;
进一步的,所述信贷特征包括但不限于信用账户支用特征、还款特征、多头借贷特征、工作信息特征以及身份特征。
具体的,所述信贷用户的逾期状态的变动情况与信贷特征的变动情况的关联数据根据所述信贷用户的逾期状态的变动情况与所述信贷用户的不同类型的信贷特征的变动数量进行确定。
在其中的一个可能的实施例中,如图2所示,上述步骤中的所述信贷特征中的有效变动信贷特征的确定的方法为:
基于所述信贷用户的逾期状态将所述信贷用户划分为逾期用户和未逾期用户,通过所述逾期用户中的存在信贷特征的变动的用户的数量以及比例、未逾期用户中的存在信贷特征的变动的用户的数量以及比例确定所述信贷特征的综合变动量;
利用所述信贷用户中是否存在所述信贷特征的变动将所述信贷用户划分为特征变动用户和特征固定用户,通过所述逾期用户中的特征变动用户中的不同类型的信贷特征的变动数量以及仅有所述信贷特征的特征变动用户的数量、未逾期用户中仅有所述信贷特征的特征变动用户的数量确定所述信贷特征的逾期关联系数;
根据所述信贷特征的逾期关联系数以及综合变动量进行所述信贷特征的综合评估量的确定,并根据所述综合评估量确定所述信贷特征中的有效变动信贷特征。
进一步的,根据所述综合评估量确定所述信贷特征中的有效变动信贷特征,具体包括:
当所述信贷特征的综合评估量满足要求时,则确定所述信贷特征为有效变动信贷特征。
需要说明的是,根据所述信贷特征的逾期关联系数以及综合变动量进行所述信贷特征的综合评估量的确定,具体包括:
通过所述逾期用户的数量以及信贷用户的数量进行所述信贷特征的逾期关联系数的权重值以及综合变动量的权重值的确定,并结合所述信贷特征的逾期关联系数以及综合变动量进行所述信贷特征的综合评估量的确定。
在另外的一个可能的实施例中,上述步骤中的所述信贷特征中的有效变动信贷特征的确定的方法为:
利用所述信贷用户中是否存在所述信贷特征的变动将所述信贷用户划分为特征变动用户和特征固定用户,判断所述特征变动用户的用户数量是否满足要求,若是,则进入下一步骤,若否,则确定所述信贷特征不属于有效变动信贷特征;
基于所述信贷用户的逾期状态将所述信贷用户划分为逾期用户和未逾期用户,通过所述逾期用户中的存在信贷特征的变动的用户的数量以及比例进行所述逾期用户的特征变动量的确定,判断所述逾期用户的特征变动量是否满足要求,若是,则进入下一步骤,若否,则确定所述信贷特征不属于有效变动信贷特征;
通过所述逾期用户中的特征变动用户中的不同类型的信贷特征的变动数量以及仅有所述信贷特征的特征变动用户的数量确定所述逾期用户的信贷特征的逾期关联系数,判断所述逾期用户的信贷特征的逾期关联系数是否满足要求,若是,则进入下一步骤,若否,则确定所述信贷特征不属于有效变动信贷特征;
利用所述逾期用户的特征变动量、未逾期用户中的存在信贷特征的变动的用户的数量以及比例确定所述信贷特征的综合变动量,通过所述逾期用户中的特征变动用户中的不同类型的信贷特征的变动数量以及仅有所述信贷特征的特征变动用户的数量、未逾期用户中仅有所述信贷特征的特征变动用户的数量确定所述信贷特征的逾期关联系数;
根据所述信贷特征的逾期关联系数以及综合变动量进行所述信贷特征的综合评估量的确定,并根据所述综合评估量确定所述信贷特征中的有效变动信贷特征。
在另外的一个可能的实施例中,上述步骤中的所述信贷特征中的有效变动信贷特征的确定的方法为:
基于所述信贷用户的逾期状态将所述信贷用户划分为逾期用户和未逾期用户,利用所述信贷用户中是否存在所述信贷特征的变动将所述信贷用户划分为特征变动用户和特征固定用户;
当所述逾期用户的数量以及所述逾期用户中的特征变动用户的数量任意一项不满足要求时,则确定所述信贷特征不属于有效变动信贷特征;
当所述逾期用户的数量以及所述逾期用户中的特征变动用户的数量均不满足要求时,通过所述逾期用户中的特征变动用户中的不同类型的信贷特征的变动数量以及仅有所述信贷特征的特征变动用户的数量、未逾期用户中仅有所述信贷特征的特征变动用户的数量确定所述信贷特征的逾期关联系数,判断所述信贷特征的逾期关联系数是否满足要求,若是,则确定所述信贷特征属于有效变动信贷特征,若否,则进入下一步骤;
通过所述逾期用户中的存在信贷特征的变动的用户的数量以及比例、未逾期用户中的存在信贷特征的变动的用户的数量以及比例确定所述信贷特征的综合变动量,根据所述信贷特征的逾期关联系数以及综合变动量进行所述信贷特征的综合评估量的确定,并根据所述综合评估量确定所述信贷特征中的有效变动信贷特征。
S2将存在所述有效变动信贷特征的变动的信贷用户作为变动信贷用户,并根据不同的变动信贷用户的有效变动信贷特征的变动情况进行不同的有效变动信贷特征的抽取时间间隔的确定;
在其中的一个可能的实施例中,如图3所示,上述步骤中的所述有效变动信贷特征的抽取时间间隔的确定的方法为:
根据不同的变动信贷用户的有效变动信贷特征的变动情况进行不同的变动信贷用户的有效变动信贷特征的变动次数的确定,并结合不同的变动次数的时间间隔以及有效变动信贷特征的变动幅度确定不同的变动信贷用户的有效变动信贷特征的特征变动因子;
通过所述特征变动因子将所述变动信贷用户划分为剧烈变动用户和其它变动用户,并根据所述剧烈变动用户的数量以及特征变动因子、其它变动用户的数量以及特征变动因子、信贷变动用户在所述信贷用户中的占比确定所述有效变动信贷特征的抽取时间间隔。
具体的,所述特征变动因子的取值范围在0到1之间,其中所述特征变动因子越大,则所述变动信贷用户的有效变动信贷特征的变动幅度越大。
进一步的,通过所述特征变动因子将所述变动信贷用户划分为剧烈变动用户和其它变动用户,具体包括:
当所述变动信贷用户的特征变动因子大于预设变动限定值时,则确定所述变动信贷用户为剧烈变动用户;
当所述变动信贷用户的特征变动因子不大于预设变动限定值时,则确定所述变动信贷用户为其它变动用户。
在另外的一个可能的实施例中,上述步骤中的所述有效变动信贷特征的抽取时间间隔的确定的方法为:
判断所述变动信贷用户的数量是否大于预设用户数量,若是,则基于预设时间间隔进行所述有效变动信贷特征的抽取时间间隔的确定,若否,则进入下一步骤;
根据不同的变动信贷用户的有效变动信贷特征的变动情况进行不同的变动信贷用户的有效变动信贷特征的变动次数的确定,并结合不同的变动次数的时间间隔以及有效变动信贷特征的变动幅度确定不同的变动信贷用户的有效变动信贷特征的特征变动因子;
通过所述特征变动因子将所述变动信贷用户划分为剧烈变动用户和其它变动用户,判断所述剧烈变动用户的数量是否大于预设变动用户数量,若是,则基于预设时间间隔进行所述有效变动信贷特征的抽取时间间隔的确定,若否,则进入下一步骤;
利用不同的变动信贷用户的有效变动信贷特征的特征变动因子、变动信贷用户的数量以及在所述信贷用户中的占比进行特征综合变动因子的确定,判断所述特征综合变动因子是否在预设变动因子区间内,若是,则进入下一步骤,若否,则基于预设时间间隔进行所述有效变动信贷特征的抽取时间间隔的确定;
根据所述剧烈变动用户的数量以及特征变动因子、其它变动用户的数量以及特征变动因子、特征综合变动因子确定所述有效变动信贷特征的抽取时间间隔。
在另外的一个可能的实施例中,上述步骤中的所述有效变动信贷特征的抽取时间间隔的确定的方法为:
根据所述变动信贷用户的数量以及所述变动信贷用户中的逾期用户的数量进行基础抽取时间间隔的确定;
根据不同的变动信贷用户的有效变动信贷特征的变动情况进行不同的变动信贷用户的有效变动信贷特征的变动次数的确定,并结合不同的变动次数的时间间隔以及有效变动信贷特征的变动幅度确定不同的变动信贷用户的有效变动信贷特征的特征变动因子,判断是否存在特征变动因子大于预设变动限定值的变动信贷用户,若是,则进入下一步骤,若否,则基于所述基础抽取时间间隔进行所述有效变动信贷特征的抽取时间间隔的确定;
通过所述特征变动因子将所述变动信贷用户划分为剧烈变动用户和其它变动用户,判断所述剧烈变动用户的数量是否大于预设变动用户数量,若否,则基于所述基础抽取时间间隔进行所述有效变动信贷特征的抽取时间间隔的确定,若否,则进入下一步骤;
利用不同的剧烈变动用户的有效变动信贷特征的特征变动因子、剧烈变动用户的数量以及在所述信贷用户中的占比进行剧烈变动用户的特征综合变动因子的确定,判断所述特征综合变动因子是否在预设变动因子区间内,若是,则基于所述基础抽取时间间隔进行所述有效变动信贷特征的抽取时间间隔的确定,若否,则进入下一步骤;
根据所述剧烈变动用户的特征综合变动因子、其它变动用户的数量以及特征变动因子、信贷变动用户在所述信贷用户中的占比对所述基础抽取时间间隔进行修正得到所述有效变动信贷特征的抽取时间间隔。
在另外的一个可能的实施例中,上述步骤中的所述有效变动信贷特征的抽取时间间隔的确定的方法为:
根据所述变动信贷用户的数量以及所述变动信贷用户中的逾期用户的数量进行基础抽取时间间隔的确定,根据不同的变动信贷用户的有效变动信贷特征的变动情况进行不同的变动信贷用户的有效变动信贷特征的变动次数的确定,并结合不同的变动次数的时间间隔以及有效变动信贷特征的变动幅度确定不同的变动信贷用户的有效变动信贷特征的特征变动因子;
通过所述特征变动因子将所述变动信贷用户划分为剧烈变动用户和其它变动用户, 利用不同的剧烈变动用户的有效变动信贷特征的特征变动因子、剧烈变动用户的数量以及在所述信贷用户中的占比进行剧烈变动用户的特征综合变动因子的确定,利用不同的其它变动用户的有效变动信贷特征的特征变动因子、其它变动用户的数量以及在所述信贷用户中的占比进行其它变动用户的特征综合变动因子的确定;
根据所述剧烈变动用户以及其它变动用户的特征综合变动因子、信贷变动用户在所述信贷用户中的占比对所述基础抽取时间间隔进行修正得到所述有效变动信贷特征的抽取时间间隔。
S3基于所述抽取时间间隔进行不同的有效变动信贷特征的不同的时间维度的面板数据的抽取,根据不同的时间维度的面板数据以及信贷用户的逾期状态的变动情况的关联数据确定不同的有效变动信贷特征的综合关联系数;
在其中的一个可能的实施例中,如图4所示,上述步骤中的所述有效变动信贷特征的综合关联系数的确定的方法为:
利用所述信贷用户中是否存在所述信贷特征的变动将所述信贷用户划分为特征变动用户和特征固定用户,基于所述信贷用户的逾期状态将所述信贷用户划分为逾期用户和未逾期用户;
通过不同的特征变动用户中的不同的变动信贷特征的变动次数、不同的变动次数的时间间隔以及有效变动信贷特征的变动幅度确定不同的变动信贷用户的不同的变动信贷特征的特征变动因子,并根据所述特征信贷用户的不同的变动信贷特征的特征变动因子以及有效变动信贷特征的特征变动因子确定所述特征信贷用户的有效变动信贷特征的影响因子;
通过不同的时间维度的面板数据进行不同的时间维度的信贷用户中的新增逾期用户的确定,通过所述新增逾期用户的数量以及不同的新增逾期用户的有效变动信贷特征的影响因子、未逾期用户的有效变动信贷特征的影响因子确定不同的时间维度的特征关联系数;
基于不同的时间维度的特征关联系数以及不同的时间维度的新增逾期用户的数量确定所述有效变动信贷特征的综合关联系数。
在另外的一个可能的实施例中,上述步骤中的所述有效变动信贷特征的综合关联系数的确定的方法为:
利用所述信贷用户中是否存在所述信贷特征的变动将所述信贷用户划分为特征变动用户和特征固定用户,基于所述信贷用户的逾期状态将所述信贷用户划分为逾期用户和未逾期用户;
通过不同的特征变动用户中的不同的变动信贷特征的变动次数、不同的变动次数的时间间隔以及有效变动信贷特征的变动幅度确定不同的变动信贷用户的不同的变动信贷特征的特征变动因子,并根据所述特征信贷用户的不同的变动信贷特征的特征变动因子以及有效变动信贷特征的特征变动因子确定所述特征信贷用户的有效变动信贷特征的影响因子;
通过不同的时间维度的面板数据进行不同的时间维度的信贷用户中的新增逾期用户的确定,通过所述新增逾期用户的数量以及不同的新增逾期用户的有效变动信贷特征的影响因子、未逾期用户的有效变动信贷特征的影响因子确定不同的时间维度的特征关联系数,判断是否存在特征关联系数大于预设关联系数的时间维度,若是,则进入下一步骤,若否,则通过不同的时间维度的特征关联系数的平均值确定所述有效变动信贷特征的综合关联系数;
将特征关联系数大于预设关联系数的时间维度作为筛选时间维度,判断所述筛选时间维度的数量是否大于预设维度数量,若是,则通过预设关联系数确定所述有效变动信贷特征的综合关联系数,若否,则进入下一步骤;
根据所述筛选时间维度的数量、不同的筛选时间维度的特征关联系数以及新增逾期用户的数量确定所述筛选时间维度的有效变动信贷特征的综合关联系数是否在预设关联系数区间内,若是,则通过预设关联系数确定所述有效变动信贷特征的综合关联系数,若否,则进入下一步骤;
基于不同的时间维度的特征关联系数以及不同的时间维度的新增逾期用户的数量确定所述有效变动信贷特征的综合关联系数。
S4以所述综合关联系数为基础对所述有效变动信贷特征进行筛选得到所述输入样本中的变动输入样本,并结合所述输入样本中的稳定输入样本进行信贷模型的输入样本的确定。
进一步的,所述变动输入样本的筛选的方法为:
当所述有效变动特征的综合关联系数大于预设关联系数值时,则确定所述有效变动特征为变动输入样本。
具体的,所述稳定输入样本根据所述信贷特征的类型进行确定,具体的根据所述信贷特征的类型的匹配结果进行确定。
另一方面,如图5所示,本发明提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种基于panel data的信贷模型样本构建方法。
其中上述的一种基于panel data的信贷模型样本构建方法,具体包括:
基于不同的信贷用户的信贷特征的变动情况进行存在所述信贷特征的变动的信贷用户的确定,并结合不同的信贷用户的逾期状态的变动情况与信贷特征的变动情况的关联数据进行所述信贷特征中的有效变动信贷特征的确定;
将存在所述有效变动信贷特征的变动的信贷用户作为变动信贷用户,并根据不同的变动信贷用户的有效变动信贷特征的变动情况进行不同的变动信贷用户的有效变动信贷特征的变动次数的确定,并结合不同的变动次数的时间间隔以及有效变动信贷特征的变动幅度确定不同的变动信贷用户的有效变动信贷特征的特征变动因子;
通过所述特征变动因子将所述变动信贷用户划分为剧烈变动用户和其它变动用户,并根据所述剧烈变动用户的数量以及特征变动因子、其它变动用户的数量以及特征变动因子、信贷变动用户在所述信贷用户中的占比确定所述有效变动信贷特征的抽取时间间隔;
基于所述抽取时间间隔进行不同的有效变动信贷特征的不同的时间维度的面板数据的抽取,利用所述信贷用户中是否存在所述信贷特征的变动将所述信贷用户划分为特征变动用户和特征固定用户,基于所述信贷用户的逾期状态将所述信贷用户划分为逾期用户和未逾期用户;
通过不同的特征变动用户中的不同的变动信贷特征的变动次数、不同的变动次数的时间间隔以及有效变动信贷特征的变动幅度确定不同的变动信贷用户的不同的变动信贷特征的特征变动因子,并根据所述特征信贷用户的不同的变动信贷特征的特征变动因子以及有效变动信贷特征的特征变动因子确定所述特征信贷用户的有效变动信贷特征的影响因子;
通过不同的时间维度的面板数据进行不同的时间维度的信贷用户中的新增逾期用户的确定,通过所述新增逾期用户的数量以及不同的新增逾期用户的有效变动信贷特征的影响因子、未逾期用户的有效变动信贷特征的影响因子确定不同的时间维度的特征关联系数;
基于不同的时间维度的特征关联系数以及不同的时间维度的新增逾期用户的数量确定所述有效变动信贷特征的综合关联系数;
以所述综合关联系数为基础对所述有效变动信贷特征进行筛选得到所述输入样本中的变动输入样本,并结合所述输入样本中的稳定输入样本进行信贷模型的输入样本的确定。
通过以上实施例,本发明取得以下有益效果:
1、根据信贷特征的变动的信贷用户以及不同的信贷用户的逾期状态的变动情况与信贷特征的变动情况的关联数据进行信贷特征中的有效变动信贷特征的确定,实现了从信贷特征的变动情况以及与逾期状态的关联情况两个角度进行了有效变动信贷特征的筛选,为进一步实现从不同的时间维度的面板数据的差异化抽取和变动输入样本的确定奠定了基础。
2、根据不同的时间维度的面板数据以及信贷用户的逾期状态的变动情况的关联数据确定不同的有效变动信贷特征的综合关联系数,避免了原有的单一的采用某一个时间维度的关联情况导致的关联系数的评估准确率不高的技术问题,实现了从多个时间尺度的角度进行有效变动信贷特征的筛选,也为进一步提升存量用户的信贷风险的高效准确评估奠定了基础。
3、以综合关联系数为基础对有效变动信贷特征进行筛选得到输入样本中的变动输入样本,提升了变动输入样本的筛选的准确性,在保证信贷风险的评估准确率的基础上,也进一步减少了风控模型的收敛难度,提升了处理效率。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、设备、非易失性计算机存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本说明书的一个或多个实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书的一个或多个实施例可以有各种更改和变化。凡在本说明书的一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (10)
1.一种基于panel data的信贷模型样本构建方法,其特征在于,具体包括:
基于不同的信贷用户的信贷特征的变动情况进行存在所述信贷特征的变动的信贷用户的确定,并结合不同的信贷用户的逾期状态的变动情况与信贷特征的变动情况的关联数据进行所述信贷特征中的有效变动信贷特征的确定;
将存在所述有效变动信贷特征的变动的信贷用户作为变动信贷用户,并根据不同的变动信贷用户的有效变动信贷特征的变动情况进行不同的有效变动信贷特征的抽取时间间隔的确定;
基于所述抽取时间间隔进行不同的有效变动信贷特征的不同的时间维度的面板数据的抽取,根据不同的时间维度的面板数据以及信贷用户的逾期状态的变动情况的关联数据确定不同的有效变动信贷特征的综合关联系数;
以所述综合关联系数为基础对所述有效变动信贷特征进行筛选得到所述输入样本中的变动输入样本,并结合输入样本中的稳定输入样本进行信贷模型的输入样本的确定。
2.如权利要求1所述的基于panel data的信贷模型样本构建方法,其特征在于,所述信贷特征包括但不限于信用账户支用特征、还款特征、多头借贷特征、工作信息特征以及身份特征。
3.如权利要求1所述的基于panel data的信贷模型样本构建方法,其特征在于,所述信贷用户的逾期状态的变动情况与信贷特征的变动情况的关联数据根据所述信贷用户的逾期状态的变动情况与所述信贷用户的不同类型的信贷特征的变动数量进行确定。
4.如权利要求1所述的基于panel data的信贷模型样本构建方法,其特征在于,所述信贷特征中的有效变动信贷特征的确定的方法为:
基于所述信贷用户的逾期状态将所述信贷用户划分为逾期用户和未逾期用户,通过所述逾期用户中的存在信贷特征的变动的用户的数量以及比例、未逾期用户中的存在信贷特征的变动的用户的数量以及比例确定所述信贷特征的综合变动量;
利用所述信贷用户中是否存在所述信贷特征的变动将所述信贷用户划分为特征变动用户和特征固定用户,通过所述逾期用户中的特征变动用户中的不同类型的信贷特征的变动数量以及仅有所述信贷特征的特征变动用户的数量、未逾期用户中仅有所述信贷特征的特征变动用户的数量确定所述信贷特征的逾期关联系数;
根据所述信贷特征的逾期关联系数以及综合变动量进行所述信贷特征的综合评估量的确定,并根据所述综合评估量确定所述信贷特征中的有效变动信贷特征。
5.如权利要求4所述的基于panel data的信贷模型样本构建方法,其特征在于,根据所述综合评估量确定所述信贷特征中的有效变动信贷特征,具体包括:
当所述信贷特征的综合评估量满足要求时,则确定所述信贷特征为有效变动信贷特征。
6.如权利要求1所述的基于panel data的信贷模型样本构建方法,其特征在于,所述有效变动信贷特征的抽取时间间隔的确定的方法为:
根据不同的变动信贷用户的有效变动信贷特征的变动情况进行不同的变动信贷用户的有效变动信贷特征的变动次数的确定,并结合不同的变动次数的时间间隔以及有效变动信贷特征的变动幅度确定不同的变动信贷用户的有效变动信贷特征的特征变动因子;
通过所述特征变动因子将所述变动信贷用户划分为剧烈变动用户和其它变动用户,并根据所述剧烈变动用户的数量以及特征变动因子、其它变动用户的数量以及特征变动因子、信贷变动用户在所述信贷用户中的占比确定所述有效变动信贷特征的抽取时间间隔。
7.如权利要求6所述的基于panel data的信贷模型样本构建方法,其特征在于,所述特征变动因子的取值范围在0到1之间,其中所述特征变动因子越大,则所述变动信贷用户的有效变动信贷特征的变动幅度越大。
8.如权利要求7所述的基于panel data的信贷模型样本构建方法,其特征在于,通过所述特征变动因子将所述变动信贷用户划分为剧烈变动用户和其它变动用户,具体包括:
当所述变动信贷用户的特征变动因子大于预设变动限定值时,则确定所述变动信贷用户为剧烈变动用户;
当所述变动信贷用户的特征变动因子不大于预设变动限定值时,则确定所述变动信贷用户为其它变动用户。
9.如权利要求1所述的基于panel data的信贷模型样本构建方法,其特征在于,所述变动输入样本的筛选的方法为:
当所述有效变动特征的综合关联系数大于预设关联系数值时,则确定所述有效变动特征为变动输入样本。
10.如权利要求1所述的基于panel data的信贷模型样本构建方法,其特征在于,所述稳定输入样本根据所述信贷特征的类型进行确定,具体的根据所述信贷特征的类型的匹配结果进行确定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410434238.9A CN118035750A (zh) | 2024-04-11 | 2024-04-11 | 一种基于panel data的信贷模型样本构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410434238.9A CN118035750A (zh) | 2024-04-11 | 2024-04-11 | 一种基于panel data的信贷模型样本构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118035750A true CN118035750A (zh) | 2024-05-14 |
Family
ID=90988123
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410434238.9A Pending CN118035750A (zh) | 2024-04-11 | 2024-04-11 | 一种基于panel data的信贷模型样本构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118035750A (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090248571A1 (en) * | 2008-03-28 | 2009-10-01 | American Express Travel Related Services Company, Inc. | Consumer behaviors at lender level |
US7933796B1 (en) * | 2004-11-03 | 2011-04-26 | Fannie Mae | Method of and system for evaluating credit risk associated with a financial asset |
WO2019080407A1 (zh) * | 2017-10-25 | 2019-05-02 | 深圳壹账通智能科技有限公司 | 信贷评估方法、装置、设备及计算机可读存储介质 |
CN111986808A (zh) * | 2020-07-30 | 2020-11-24 | 珠海中科先进技术研究院有限公司 | 健康保险风险评估及控制的方法、装置及介质 |
CN113962800A (zh) * | 2021-10-26 | 2022-01-21 | 度小满科技(北京)有限公司 | 模型训练及逾期风险预测方法、装置、设备和介质 |
CN114722941A (zh) * | 2022-04-11 | 2022-07-08 | 中国农业银行股份有限公司 | 信贷违约识别方法、装置、设备和介质 |
CN115187066A (zh) * | 2022-07-11 | 2022-10-14 | 平安科技(深圳)有限公司 | 风险识别方法、装置、电子设备及存储介质 |
CN116739742A (zh) * | 2023-06-02 | 2023-09-12 | 北京百度网讯科技有限公司 | 信贷风控模型的监控方法、装置、设备及存储介质 |
CN117437036A (zh) * | 2023-12-18 | 2024-01-23 | 杭银消费金融股份有限公司 | 一种基于多任务提升树的信贷风控管理方法与*** |
CN117541397A (zh) * | 2023-10-20 | 2024-02-09 | 广州估值狗网络科技有限公司 | 一种基于ai投研策略的智能投资辅助方法、装置及*** |
-
2024
- 2024-04-11 CN CN202410434238.9A patent/CN118035750A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7933796B1 (en) * | 2004-11-03 | 2011-04-26 | Fannie Mae | Method of and system for evaluating credit risk associated with a financial asset |
US20090248571A1 (en) * | 2008-03-28 | 2009-10-01 | American Express Travel Related Services Company, Inc. | Consumer behaviors at lender level |
WO2019080407A1 (zh) * | 2017-10-25 | 2019-05-02 | 深圳壹账通智能科技有限公司 | 信贷评估方法、装置、设备及计算机可读存储介质 |
CN111986808A (zh) * | 2020-07-30 | 2020-11-24 | 珠海中科先进技术研究院有限公司 | 健康保险风险评估及控制的方法、装置及介质 |
CN113962800A (zh) * | 2021-10-26 | 2022-01-21 | 度小满科技(北京)有限公司 | 模型训练及逾期风险预测方法、装置、设备和介质 |
CN114722941A (zh) * | 2022-04-11 | 2022-07-08 | 中国农业银行股份有限公司 | 信贷违约识别方法、装置、设备和介质 |
CN115187066A (zh) * | 2022-07-11 | 2022-10-14 | 平安科技(深圳)有限公司 | 风险识别方法、装置、电子设备及存储介质 |
CN116739742A (zh) * | 2023-06-02 | 2023-09-12 | 北京百度网讯科技有限公司 | 信贷风控模型的监控方法、装置、设备及存储介质 |
CN117541397A (zh) * | 2023-10-20 | 2024-02-09 | 广州估值狗网络科技有限公司 | 一种基于ai投研策略的智能投资辅助方法、装置及*** |
CN117437036A (zh) * | 2023-12-18 | 2024-01-23 | 杭银消费金融股份有限公司 | 一种基于多任务提升树的信贷风控管理方法与*** |
Non-Patent Citations (5)
Title |
---|
BRAJENDRA C. SUTRADHAR: "An Overview on Econometric Models for Linear Spatial Panel Data", SANKHYA A, vol. 83, no. 1, 31 December 2021 (2021-12-31), pages 206 - 244 * |
张华;钱胡萍;: "基于结构方程模型的商业银行信贷质量评价", 农村金融研究, no. 10, 15 October 2018 (2018-10-15) * |
李庆海;吕小锋;孙光林;: "农户信贷配给:需求型还是供给型?――基于双重样本选择模型的分析", 中国农村经济, no. 01, 30 January 2016 (2016-01-30) * |
褚保金;张龙耀;郝彬;: "农村信用社扶贫小额贷款的实证分析――以江苏省为例", 中国农村经济, no. 05, 30 May 2008 (2008-05-30) * |
迟国泰;王化增;杨德;: "基于信用迁移全部贷款组合优化下的新增单笔贷款决策模型", ***管理学报, no. 01, 15 February 2008 (2008-02-15) * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11272059B2 (en) | Exclusive agent pool allocation method, electronic device, and computer readable storage medium | |
CN103827826B (zh) | 自适应地确定事务型工作负荷的响应时间分布 | |
CN117149797B (zh) | 一种基于多维度数据监控的对账方法及*** | |
CN104125584A (zh) | 一种针对网络业务的业务指标实现预测的方法及装置 | |
CN110618867A (zh) | 一种预测资源使用量的方法和装置 | |
CN109428760B (zh) | 一种基于运营商数据的用户信用评估方法 | |
CN116596659A (zh) | 基于大数据风控的企业智能化信贷审批方法、***及介质 | |
CN109272340B (zh) | 参数阈值确定方法、装置及计算机存储介质 | |
CN114781717A (zh) | 网点设备推荐方法、装置、设备和存储介质 | |
CN117078403B (zh) | 一种基于规则组合优化的风控决策方法与*** | |
CN116761207B (zh) | 一种基于通信行为的用户画像构建方法与*** | |
CN118035750A (zh) | 一种基于panel data的信贷模型样本构建方法 | |
CN109167806A (zh) | 一种基于前景理论的不确定QoS感知Web服务选择方法 | |
CN116993351A (zh) | 基于银行账户风险等级的交易控制方法、装置及设备 | |
CN115660822A (zh) | 用于金融业务的风控策略处理方法以及装置、电子设备、存储介质 | |
CN111209105A (zh) | 扩容处理方法、装置、设备及可读存储介质 | |
CN111190800A (zh) | 预测主机的批量运行时长的方法、***、装置及存储介质 | |
CN114338429B (zh) | 网络带宽的确定方法、装置及电子设备 | |
CN110825781B (zh) | 一种全国城市一卡通互联互通平台 | |
CN117648387B (zh) | 一种基于数据实体的逻辑数据截面的构建方法 | |
Addabbo et al. | Children capabilities and family characteristics in Italy | |
CN117892112B (zh) | 基于区块链的数据分析方法 | |
CN117331560B (zh) | 一种前端表单页面生成方法及*** | |
CN106021082A (zh) | 一种基于大数据的主机性能容量预估方法 | |
CN116823430A (zh) | 风险量化的授信***、方法、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |