CN114219611A - 贷款额度计算方法、装置、计算机设备和存储介质 - Google Patents

贷款额度计算方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN114219611A
CN114219611A CN202111375611.0A CN202111375611A CN114219611A CN 114219611 A CN114219611 A CN 114219611A CN 202111375611 A CN202111375611 A CN 202111375611A CN 114219611 A CN114219611 A CN 114219611A
Authority
CN
China
Prior art keywords
risk
data
coefficient
module
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111375611.0A
Other languages
English (en)
Inventor
刘垚
范戈
曾桂平
许晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Construction Bank Corp
Original Assignee
China Construction Bank Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Construction Bank Corp filed Critical China Construction Bank Corp
Priority to CN202111375611.0A priority Critical patent/CN114219611A/zh
Publication of CN114219611A publication Critical patent/CN114219611A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Technology Law (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本公开涉及贷款额度计算方法、装置、计算机设备和存储介质。所述方法包括:计算收入额度数据和负债额度数据的差值,得到对象的基础额度数据;通过预先训练好的违约概率模型、预先设置的分数跨度、根据基础额度数据计算得到的基础总额度、根据贷款逾期的对象确定的不良额度数据、预设的风险约束条件并采用线性规划计算得到风险系数;根据预设的维度确定每个维度的对象的层级,基于每个维度的对象的层级确定对象的分层系数;利用基础额度数据、风险系数和分层系数计算得到对象的贷款额度。采用本方法能够一种能够精准的确定个人贷款的额度,从而降低个人贷款违约风险,增加个人贷款整体收益。

Description

贷款额度计算方法、装置、计算机设备和存储介质
技术领域
本公开涉及大数据技术领域,特别是涉及一种贷款额度计算方法、装置、计算机设备和存储介质。
背景技术
随着互联网金融技术的发展,人们的消费观念和消费水平不断地在转变和提升,个人信用贷款业务的比重不断上升,且个人信用贷款业务具有笔数多、金额小、数据丰富的特点,所以对应的出现了自动实时审批个人贷款的产品,但自动实时审批个人贷款的产品大多数都是主要依靠其较高的利率来弥补用户未能还款所带来的损失,并未实现贷款风险的有效管控,使用的都是传统评分卡方法,只考虑通过基本的数据进行评估客户个人贷款的风险,从而大致确定个人贷款的额度,无法实现对客户风险的精准评估,精准的确定个人贷款的额度,会导致个人贷款违约风险大大提高,降低个人贷款的整体收益。
发明内容
基于此,有必要针对上述技术问题,提供一种能够精准的确定个人贷款的额度,从而降低个人贷款违约风险,增加个人贷款整体收益的贷款额度计算方法、装置、计算机设备和存储介质。
一种贷款额度计算方法,方法包括:
计算收入额度数据和负债额度数据的差值,得到对象的基础额度数据,收入额度数据是根据对象的金融信息确定的,负债额度数据是根据对象的征信信息确定的;
通过预先训练好的违约概率模型、预先设置的分数跨度、根据基础额度数据计算得到的基础总额度、根据贷款逾期的对象确定的不良额度数据、预设的风险约束条件并采用线性规划计算得到风险系数;
根据预设的维度确定每个维度的对象的层级,基于每个维度的对象的层级确定对象的分层系数;
利用基础额度数据、风险系数和分层系数计算得到对象的贷款额度。
在其中一个实施例中,违约概率模型的训练方法包括:
对通过账龄分析确定的目标变量进行分析处理,得到特征变量,目标变量包括贷款逾期超过第一时间的对象、贷款未逾期的对象;
利用逻辑回归算法对特征变量进行模型拟合,并对模型拟合得到的逻辑回归模型进行模型评估;
在模型评估中评价指标不低于第一预设数值且稳定性指标不高于第二预设数值的情况下,进行模型评估的逻辑回归模型为违约概率模型。
在其中一个实施例中,对通过账龄分析确定的目标变量进行分析处理,得到特征变量,包括:
获取建立模型的对象的信息数据,对信息数据通过账龄分析确定的目标变量,获取目标变量中的建模数据,建模数据包括自有数据和对象授权后获取的第三方数据;
对建模数据进行描述性统计;
对进行描述性统计后的建模数据进行数据处理,得到特征变量,数据处理包括:删除重复值、异常值处理、缺失值处理、数据标准化、特征衍生、变量分箱、证据权重转换、根据信息值和通过特征衍生出的变量的相关系数进行特征筛选。
在其中一个实施例中,根据信息值和通过特征衍生出的变量的相关系数进行特征筛选,包括:
计算建模数据的信息值;
删除信息值小于第一信息阈值,或信息值大于第二信息阈值对应的建模数据;
计算通过特征衍生出的变量和建模数据的相关系数;
获取相关系数大于相关系数阈值的建模数据中信息值最大的建模数据。
在其中一个实施例中,通过预先训练好的违约概率模型、预先设置的分数跨度、根据基础额度数据计算得到的基础总额度、根据贷款逾期的对象确定的不良额度数据、预设的风险约束条件并采用线性规划计算得到风险系数,包括:
利用预先训练好的违约概率模型计算对象违约的概率;
基于概率和通过分数跨度计算得到的转换系数确定对象的得分;
根据得分确定对象的风险等级;
计算风险等级中基础总额度和不良额度数据并根据预设的风险约束条件进行线性规划计算得到等级对应的风险系数。
在其中一个实施例中,计算风险等级中基础总额度和不良额度数据并根据预设的风险约束条件进行线性规划计算得到等级对应的风险系数,包括:
计算每个风险等级中对象的基础额度数据之和,得到每个等级的基础总额度数据;
计算每个风险等级中贷款逾期的对象的基础额度数据之和,得到每个等级的不良额度数据;
根据每个风险等级的基础总额度数据以及不良额度数据、预设的风险约束条件计算得到每个风险等级的风险调整系数;
通过每个风险等级的基础总额度数据、不良额度数据、风险调整系数计算得到总额度不良率;
在总额度不良率最小,且满足风险约束条件的情况下,对应的风险调整系数为风险等级对应的风险系数。
在其中一个实施例中,预设的风险约束条件包括:
按照风险等级排列风险系数,且风险系数逐级递减;
相邻的风险系数之间差值大于等于第一预设差值;
排名第一与第二的风险系数大于第一阈值,排名第一与第二之外的风险系数小于第一阈值;
通过每个风险等级的风险调整系数、基础总额度数据计算得到每个风险等级的额度占比,且每个风险等级的额度占比之和为第一预设百分比。
在其中一个实施例中,通过每个风险等级的风险调整系数、基础总额度数据通过采用如下公式计算得到每个风险等级的额度占比:
Figure BDA0003363879650000041
每个风险等级的基础总额度数据、不良额度数据、风险调整系数通过采用如下公式计算得到总额度不良率:
Figure BDA0003363879650000042
其中,bi为第i风险等级的不良额度数据,Xi为第i风险等级的风险系数,ai为第i风险等级的基础总额度数据。
在其中一个实施例中,预设的维度包括:单位维度、工资水平维度、单位区域维度、代发月份维度、信贷历史长度维度、历史还款表现维度。
第二方面,本公开还提供一种贷款额度计算装置,装置包括:
收入额度确定模块,用于根据对象的金融信息确定收入额度数据;
负债额度确定模块,用于根据对象的征信信息确定负债额度数据;
基础额度计算模块,用于计算收入额度数据和负债额度数据的差值,得到对象的基础额度数据;
风险系数计算模块,用于通过预先训练好的违约概率模型、预先设置的转换系数、根据基础额度数据计算得到的基础总额度、根据贷款逾期的对象确定的不良额度数据、预设的风险约束条件并采用线性规划计算得到风险系数;
分层系数确定模块,用于根据预设的维度确定每个维度的对象的层级,基于每个维度的对象的层级确定对象的分层系数;
贷款额度计算模块,用于利用基础额度数据、风险系数和分层系数计算得到对象的贷款额度。
在所述装置的其中一个实施例中,所述装置还包括:分析处理模块、模型评估模块和模型确定模块;
分析处理模块,用于对通过账龄分析确定的目标变量进行分析处理,得到特征变量,目标变量包括贷款逾期超过第一时间的对象、贷款未逾期的对象。
模型评估模块,用于利用逻辑回归算法对特征变量进行模型拟合,并对模型拟合得到的逻辑回归模型进行模型评估。
模型确定模块,用于在模型评估模块进行模型评估中评价指标不低于第一预设数值且稳定性指标不高于第二预设数值的情况下,进行模型评估的逻辑回归模型确定为违约概率模型。
在所述装置的其中一个实施例中,所述分析处理模块,包括:目标变量确定模块、描述性统计模块、数据处理模块;
目标变量确定模块,用于获取建立模型的对象的信息数据,对信息数据通过账龄分析确定的目标变量,获取目标变量中的建模数据,建模数据包括自有数据和对象授权后获取的第三方数据。
描述性统计模块,用于对建模数据进行描述性统计。
数据处理模块,用于对进行描述性统计后的建模数据进行数据处理,得到特征变量,数据处理包括:删除重复值、异常值处理、缺失值处理、数据标准化、特征衍生、变量分箱、证据权重转换、根据信息值和通过特征衍生出的变量的相关系数进行特征筛选。
在所述装置的其中一个实施例中,所述数据处理模块包括:信息值计算模块,信息值删除模块、相关系数计算模块、获取模块;
信息值计算模块,用于计算建模数据的信息值。
信息值删除模块,用于删除信息值小于第一信息阈值,或信息值大于第二信息阈值对应的建模数据。
相关系数计算模块,用于计算通过特征衍生出的变量和建模数据的相关系数。
获取模块,用于获取相关系数大于相关系数阈值的建模数据中信息值最大的建模数据。
在所述装置的其中一个实施例中,风险系数计算模块包括:违约概率计算模块、得分确定模块、风险等级匹配模块、风险系数计算模块;
违约概率计算模块,用于利用预先训练好的违约概率模型计算对象违约的概率。
得分确定模块,用于基于概率和通过分数跨度计算得到的转换系数确定对象的得分。
风险等级匹配模块,用于根据得分确定对象的风险等级。
风险系数计算模块,用于计算风险等级中基础总额度和不良额度数据并根据预设的风险约束条件进行线性规划计算得到等级对应的风险系数。
在所述装置的其中一个实施例中,风险系数计算模块包括:基础总额度数据计算模块、不良额度数据计算模块、风险调整系数计算模块、总额度不良率计算模块、风险系数确定模块;
基础总额度数据计算模块,用于计算每个风险等级中对象的基础额度数据之和,得到每个等级的基础总额度数据。
不良额度数据计算模块,用于计算每个风险等级中贷款逾期的对象的基础额度数据之和,得到每个等级的不良额度数据。
风险调整系数计算模块,用于根据每个风险等级的基础总额度数据以及不良额度数据、预设的风险约束条件计算得到每个风险等级的风险调整系数。
总额度不良率计算模块,用于通过每个风险等级的基础总额度数据、不良额度数据、风险调整系数计算得到总额度不良率。
风险系数确定模块,用于在总额度不良率最小,且满足风险约束条件的情况下,对应的风险调整系数确定为风险等级对应的风险系数。
在所述装置的其中一个实施例中,风险系数计算模块,还包括:风险约束条件设置模块,用于设置风险约束条件,风险约束条件包括:按照风险等级排列风险系数,且风险系数逐级递减;相邻的风险系数之间差值大于等于第一预设差值;排名第一与第二的风险系数大于第一阈值,排名第一与第二之外的风险系数小于第一阈值;通过每个风险等级的风险调整系数、基础总额度数据计算得到每个风险等级的额度占比,且每个风险等级的额度占比之和为第一预设百分比。
在所述装置的其中一个实施例中,所述风险约束条件设置模块包括:额度占比计算模块,用于通过每个风险等级的风险调整系数、基础总额度数据通过采用如下公式计算得到每个风险等级的额度占比:
Figure BDA0003363879650000061
其中,Xi为第i风险等级的风险系数,ai为第i风险等级的基础总额度数据。
在所述装置的其中一个实施例中,总额度不良率计算模块,还用于采用如下公式计算得到总额度不良率:
Figure BDA0003363879650000071
其中,bi为第i风险等级的不良额度数据,Xi为第i风险等级的风险系数,ai为第i风险等级的基础总额度数据。
在所述装置的其中一个实施例中,所述分层系数确定模块中预设的维度包括:单位维度、工资水平维度、单位区域维度、代发月份维度、信贷历史长度维度、历史还款表现维度。
第三方面,本公开还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法所述的步骤。
第四方面,本公开还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法所述的步骤。
第五方面,本公开还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述方法所述的步骤。
上述贷款额度计算方法、装置、计算机设备和存储介质,结合金融数据和征信数据确定收入额度和负债额度,进而确定了基础额度数据,采用了违约概率模型计算得到的风险系数并基于预先设置的分数跨度、根据所述基础额度数据计算得到的基础总额度、根据贷款逾期的所述对象确定的不良额度数据、预设的风险约束条件并通过线性规划方法计算出对象的风险系数,有效的降低了总体额度不良率,通过预设的维度确定分层系数,进而采用了分层系数来调整授信额度,有效的提高了优质对象的授信额度,最后通过分层系数、风险系数和基础额度数据确定了对象的授信额度,能够实现对客户风险的精准评估,精准的确定个人贷款的额度,降低个人贷款违约风险,提高个人贷款的整体收益。
另一方面,通过对训练模型用到的目标变量进行数据分析和数据处理,能够得到特征变量,其中特征变量中包括了多个维度的特征,并且都是对模型训练有意义的特征,在模型训练时使用该特征变量进行训练违约概率模型,使得训练后得到的违约概率模型能够较为准确的得到违约概率。
附图说明
图1为一个实施例中贷款额度计算方法的流程示意图;
图2为一个实施例中违约概率模型的训练方法的步骤的流程示意图;
图3为一个实施例中S202步骤的流程示意图;
图4为一个实施例中S306步骤的特征筛选步骤的流程示意图;
图5为一个实施例中S104步骤的流程示意图;
图6为一个实施例中S508步骤的流程示意图;
图7为一个实施例中S106步骤的流程示意图;
图8为一个实施例中贷款额度计算装置的结构示意框图;
图9为一个实施例中计算机设备的内部结构示意图。
具体实施方式
为了使本公开的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本公开进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本公开,并不用于限定本公开。
在本文实施例中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系。例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
需要说明的是,本文的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本文的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、装置、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
近年来,随着消费水平和消费观念的不断转变和不断增加,个人信用贷款的比例也在不断上升,但是在目前在确定个人信用贷款的授信额度时存在以下问题:
(1)数据和信息不全面,现有的额度测算方法大多数只考虑了单方面的最基本的数据,比如现有资产,收入,负债等。若只考虑单方面的最基础的数据,会过度授信,导致个人贷款违约风险大大提高。
(2)现有的额度测算方法,使用的都是传统评分卡方法,只考虑了客户的风险系数,未根据客户的具体情况进行细分,缺少客户细分的限额测算模型,会导致限额测算不精确,进而导致个人贷款违约风险大大提高。
因此,针对上述问题,本公开提供了一种贷款额度计算方法,本实施例以该方法应用于终端进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括终端和服务器的***,并通过终端和服务器的交互实现,其中,终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中,如图1所示,该方法包括以下步骤:
S102,计算收入额度数据和负债额度数据的差值,得到对象的基础额度数据,所述收入额度数据是根据所述对象的金融信息确定的,所述负债额度数据是根据所述对象的征信信息确定的。
其中,收入额度数据可以是根据金融信息中多维度的数据确定的对象的收入额度。负债额度数据可以是根据征信信息中贷款额度和***额度确定的对象的负债数据。基础额度数据可以是代表该对象最基本的可使用的额度。金融信息可以是通过金融机构获取到的对象各种支出和收入的信息。征信信息可以是指由特定机关建立的个人信用数据库所采集、整理、保存的,为商业银行和个人提供信用报告查询服务,为货币政策制定、金融监管和法律、法规规定的其他用途提供有关信息服务所使用的个人信用信息。对象通常可以指的是能够进行贷款的个人或者个人企业。
具体地,通过获取人行、银监或者银联中的对象的金融信息,金融信息可以包括年收入,年代发工资总额,公积金,流水金额等等多维度数据;多维度数据是为了贴合不同对象所对应个性化场景,能够考虑了不同产品,不同场景特点,较单一维度数据更具优势。根据金融信息和本领域技术人员预先设置的对应的系数,计算得到收入额度数据。通过获取到的对象的征信信息中的现有消费类贷款月供总额和***额度月均使用量等信息,来确定负债额度数据。负债额度数据有助于进一步考察对象目前负债信息,并纳入其他金融机构信息,避免过度授信,进一步降低风险。在一些实施方式中,负债额度数据的计算方式可以为:负债额度数据=现有消费类贷款月供总额+***额度月均使用量。计算收入额度数据和负债额度数据的差值,通过此差值得到对象的基础额度数据。
S104,通过预先训练好的违约概率模型、预先设置的分数跨度、根据所述基础额度数据计算得到的基础总额度、根据贷款逾期的所述对象确定的不良额度数据、预设的风险约束条件并采用线性规划计算得到风险系数。
其中,预先训练好的违约概率模型可以是基于特征工程、机器学习等方法进行训练得到的模型。特征工程可以是对原始数据进行一系列工程处理,将其提炼为特征的方法,特征可以作为输入供算法和/或模型使用,特征工程是一个表示和展现数据的过程。在实际工作中,特征工程旨在去除原始数据中的杂质和冗余。机器学习是一门人工智能的多领域交叉学科,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。目前较受欢迎的机器学习算法包含了梯度提升树(GBDT、LGBM等)、线性回归、朴素贝叶斯、随机森林、集成模型等。本领域技术人员可根据实际情况进行选择对应的机器学习算法。
分数跨度可以是能够计算出转换系数,从而通过转换系数计算得到对象的分层等级的数据。不良额度数据通常可以是贷款逾期的对象的基础额度数据。风险约束条件通常指的是线性规划问题的构造条件。风险系数通常可以是调整对象的授信额度的系数,能够使得额度不良率达到最低的系数。
具体地,通过预先训练好的违约概率模型计算违约概率,通过分数跨度计算转换系数,通过转换系数将违约概率转换为对应的评分,根据对应的评分确定对象的风险等级,根据所述基础额度数据计算得到的基础总额度、根据贷款逾期的所述对象确定的不良额度数据、预设的风险约束条件计算得到每个风险等级下的风险系数。
S106,根据预设的维度确定每个维度的所述对象的层级,基于每个维度的所述对象的层级确定所述对象的分层系数。
其中,预设的维度通常可以是根据地区,工资水平、贷款信息等确定的维度。分层系数通常可以是能够使得授信风险的额度降低的系数。
具体的,根据单位维度、工资水平维度、单位区域维度、代发月份维度、信贷历史长度维度、历史还款表现维度确定每个维度的对象所处的层级,根据每个维度的对象所处的层级进行确定对象的分层系数。其中,本领域技术人员可以通过预先设置的确定规则进行确定对象的分层系数。本领域技术人员也可以根据自身经验通过预设的维度确定对象的分层系数。
S108,利用所述基础额度数据、所述风险系数和所述分层系数计算得到所述对象的贷款额度。
具体地,对象的贷款额度=基础额度数据×风险系数×分层系数。
上述贷款额度计算方法中,结合金融数据和征信数据确定收入额度和负债额度,进而确定了基础额度数据,采用了违约概率模型计算得到的风险系数并基于预先设置的分数跨度、根据所述基础额度数据计算得到的基础总额度、根据贷款逾期的所述对象确定的不良额度数据、预设的风险约束条件使用线性规划计算出客户的风险系数,有效的降低了总体额度不良率,采用了分层系数来调整授信额度,有效的提高了优质对象的授信额度,最后通过分层系数、风险系数和基础额度数据确定了对象的授信额度,能够实现对客户风险的精准评估,精准的确定个人贷款的额度,降低个人贷款违约风险,提高个人贷款的整体收益。
在其中一个实施例中,如图2所示,所述违约概率模型的训练方法,包括:
S202,对通过账龄分析确定的目标变量进行分析处理,得到特征变量,所述目标变量包括贷款逾期超过第一时间的对象、贷款未逾期的对象。
其中,账龄分析通常可以是vintage分析,vintage分析被广泛应用于金融信贷产业,分析的方法是针对不同时期产生的信贷账户分别进行跟踪,按照账龄的长短进行同步对比,从而了解不同时期批准账户的资产质量情况。分析处理通常可以是对目标变量进行处理的方式,其可以包括数据分析和数据处理两部分。特征变量通常是原始数据属性通过处理转化为特征的数据,能够用来训练模型。
具体地,通过对vintage分析后确定的目标变量进行数据分析和数据处理,得到特征变量。目标变量中可以包括了贷款逾期超过第一时间的对象(该对象通常情况下可以定义为坏客户),以及贷款未逾期的对象(该对象通常情况下可以定义为好客户)。需要说明的是,在本实施例中第一时间为预设的时间,本领域技术人员可根据具体场景选择设置,可以为30天、60天等,在本实施例中不进行限制。通常情况下本实施例的第一时间为30天。
S204,利用逻辑回归算法对所述特征变量进行模型拟合,并对模型拟合得到的逻辑回归模型进行模型评估。
其中,逻辑回归又称logistic回归分析,是一种广义的线性回归分析模型。模型拟合可以是监督学习的过程,监督学习可以是根据已有的数据集(可以为训练集),知道输入和输出结果之间的关系。根据这种已知的关系,训练得到一个最优的模型。通过找到特征和标签之间的联系,而在只有特征没有标签的数据时,较为准确地判断出数据的标签。
具体地,通过对上述得到的特征变量进行数据划分,划分为训练集和验证集,划分的方式可以为随机划分或者设置时间点,在时间点以前的特征变量为测试集,在时间点以后的特征变量为验证集。也可以在时间点以前的特征变量为验证集、在时间点以后的特征变量为测试集。随机划分可以是根据预设比例或者其他方式划分训练集和验证集。划分为训练集和验证集后,通过训练集对并利用逻辑回归算法进行模型拟合,即模型训练的过程,拟合后得到逻辑回归模型。对得到的逻辑回归模型进行模型评估。
S206,在模型评估中评价指标不低于第一预设数值且稳定性指标不高于第二预设数值的情况下,进行模型评估的所述逻辑回归模型为违约概率模型。
其中,模型评估通常可以包括:模型的精确性评估和模型的稳定性评估。评价指标通常可以是KS值,其能够对模型进行精确性评估,KS值是在模型中用于区分预测正负样本分隔程度的评价指标。稳定性指标通常可以是PSI(Population Stability Index)值,其能够对模型的稳定性进行评估。
具体地,计算逻辑回归模型的KS值和PSI值。在模型评估时,当KS值不低于第一预设数据(此处第一预设数值可以为0.35),且PSI值不高于第二预设数值(第二预设数值可以为0.1)的情况下,进行模型评估的逻辑回归模型为违约概率模型。
违约概率模型可以为:
Figure BDA0003363879650000131
其中p为违约的概率,x为特征变量,w为特征变量的相关系数。
若进行评估的模型的KS值高于第一预设数据,和/或稳定性指标低于第二预设数值的情况下,重新通过测试集对模型进行拟合,直至评价指标不低于第一预设数值且稳定性指标不高于第二预设数值。
在另一种实施方式中,违约概率模型也可以使用信用评分卡来进行预测违约概率。信用评分卡可以是通过信用评分来衡量风险的一种手段,能够对未来一段时间内的逾期情况进行预测。模型原理是将变量WOE(Weight Of Evidence)编码方式离散化后运用逻辑回归进行的一种二分类变量的广义线性模型。
在本实施例中,通过对目标变量进行数据分析和数据处理,能够得到特征变量,其中特征变量中包括了多个维度的特征,并且都为对模型训练有意义的特征,在模型训练时使用该特征变量进行训练违约概率模型,通过违约概率模型能够较为准确的得到违约概率。
在第一实施例的其中一个实施例中,如图3所示,所述对通过账龄分析确定的目标变量进行分析处理,得到特征变量,包括:
S302,获取建立模型的对象的信息数据,对所述信息数据通过账龄分析确定的目标变量,获取目标变量中的建模数据,所述建模数据包括自有数据和所述对象授权后获取的第三方数据;
具体地,从金融机构的数据库中找到历史贷款对象,在历史贷款对象中根据预设的条件筛选符合条件的对象作为建立模型的对象。在建立模型的对象中通过vintage分析确定建立模型的对象的客户标准,即目标变量,具体步骤为:在贷款到期后逾期超过30天的客户为坏客户,贷款到期后未发生逾期的客户定义为好客户,贷款到期后逾期天数在0至30天之间的客户需要暂时将它从建立模型的对象中删除,并将其定义为不确定的客户。获取目标变量中的建模数据,建模数据可以包括自有数据和所述对象授权后获取的第三方数据。自有数据可以包括该对象的贷款信息,如贷款日,还款日等信息。对象授权后获取的第三方数据可以包括征信信息金融信息等。
S304,对所述建模数据进行描述性统计。
其中,描述性统计通常是指运用制表和分类,图形以及计算概括性数据来描述数据特征的各项活动。描述性统计分析要对调查总体所有变量的有关数据进行统计性描述,主要包括数据的频数分析、集中趋势分析、离散程度分析、分布以及一些基本的统计图形等。
具体地,对建模数据进行描述性统计评估建模数据中每个变量值的分布、极端值的识别等。
S306,对进行描述性统计后的所述建模数据进行数据处理,得到特征变量,所述数据处理包括:删除重复值、异常值处理、缺失值处理、数据标准化、特征衍生、变量分箱、证据权重转换、根据信息值和通过特征衍生出的变量的相关系数进行特征筛选。
其中,证据权重转换通常可以是WOE(Weight Of Evidence)转换,就是自变量取某个值时对目标变量的影响。信息值的大小决定了自变量对目标变量的影响程度。WOE和信息值均是用来衡量变量的预测能力,其值越大,表示此变量的预测能力越强。
具体地,对进行描述性统计后的建模数据进行删除重复值、异常值处理、缺失值处理、数据标准化、特征衍生、变量分箱、证据权重转换、根据信息值和通过特征衍生出的变量的相关系数进行特征筛选。
其中,特征衍生可以包括交叉比对(根据对象的提供的地址信息衍生出与其相关的信息),即根据目标变量中的信息衍生出与其相关联的信息的操作。
变量分箱可以使用基于树模型的最优分箱方法,也可以使用卡方等其他最优分箱方法,在本实施例中不进行限制分箱方法。
在其中一个实施例中,如图4所示,所述根据信息值和通过特征衍生出的变量的相关系数进行特征筛选,包括:
S402,计算所述建模数据的信息值;
S404,删除信息值小于第一信息阈值,或信息值大于第二信息阈值对应的所述建模数据;
S406,计算通过特征衍生出的变量和所述建模数据的相关系数;
S408,获取所述相关系数大于相关系数阈值的建模数据中信息值最大的建模数据。
具体地,通过
Figure BDA0003363879650000151
计算WOE值,进而通过公式:
Figure BDA0003363879650000152
计算得到建模数据的信息值。
删除建模数据的信息值小于第一信息阈值或建模数据的信息值大于第二信息阈值的建模数据,得到第一建模数据,在一些实施方式中,第一信息阈值可以为0.02,第二信息阈值可以为0.5。通过相关系数计算公式计算建模变量和特征衍生得到的变量的相关系数。获取相关系数大于相关系数阈值的建模数据,记为第二建模数据,获取第二建模数据中信息值最大的建模数据。将第二建模数据中信息值最大的建模数据和第一建模数据进行组合,得到最终的建模数据,即为特征变量。
在本实施例中,通过信息值和相关系数对建模变量进行筛选能够得到预测能力较好的建模变量,提升违约概率模型计算违约概率时的准确性。
在其中一个实施例中,如图5所示,所述通过预先训练好的违约概率模型、预先设置的分数跨度、根据所述基础额度数据计算得到的基础总额度、根据贷款逾期的所述对象确定的不良额度数据、预设的风险约束条件并采用线性规划计算得到风险系数,包括:
S502,利用所述预先训练好的违约概率模型计算所述对象违约的概率。
S504,基于所述概率和通过分数跨度计算得到的转换系数确定所述对象的得分。
S506,根据所述得分确定所述对象的风险等级。
S508,计算所述风险等级中所述基础总额度和所述不良额度数据并根据预设的风险约束条件进行线性规划计算得到所述等级对应的风险系数。
具体地,使用预先训练好的违约概率模型计算违约的概率后,基于预先设置的分数跨度,并通过如下公式计算得到转换系数:
Figure BDA0003363879650000161
其中,A和B为计算得到的转换系数,PDO和p0为预先设置的特定点分值,均为常数,在一些实施方式中,PDO可以为20,p0可以为600。
计算出转换系数后,通过如下公式确定对应的对象的得分:
Figure BDA0003363879650000162
计算对象得分后,通过预先设置的分档标准和对象得分对所述对象进行分档,从而确定对象的风险等级。预先设置的分档标准可以包括:
(1)每个风险等级中,得分区间的上下界均为正数。
(2)可以分为5个风险等级,风险等级由高到低分别占比20%、25%、30%、20%和5%。
(3)风险等级由高到低的逾期率依次递增。
(4)风险等级由高到低的提升率依次递增,其中提升率的计算公式可以为:
Figure BDA0003363879650000163
在一些实施方式中,具体的风险等级表如表1所示:
表1风险等级表
Figure BDA0003363879650000171
需要说明的是,表1中的数据仅仅为举例进行示例,E风险等级的累计逾期客户数通常可以是E风险等级的逾期客户数量,D风险等级的累计逾期客户数通常E风险等级的逾期客户数量加上D风险等级的逾期客户数量,依次类推得到每个等级的累计逾期客户数。累计所有客户数计算方式可参照上述累计逾期客户,在此不再重复赘述。
在其中一个实施例中,如图6所示,计算所述风险等级中所述基础总额度和所述不良额度数据并根据预设的风险约束条件进行线性规划计算得到所述等级对应的风险系数,包括:
S602,计算每个风险等级中所述对象的基础额度数据之和,得到每个等级的基础总额度数据。
S604,计算每个风险等级中贷款逾期的对象的基础额度数据之和,得到每个等级的不良额度数据。
S606,根据每个风险等级的所述基础总额度数据以及不良额度数据、预设的风险约束条件计算得到每个风险等级的风险调整系数。
S608,通过每个风险等级的所述基础总额度数据、不良额度数据、所述风险调整系数计算得到总额度不良率。
S610,在所述总额度不良率最小,且满足所述风险约束条件的情况下,对应的所述风险调整系数为所述风险等级对应的风险系数。
其中,线性规划是运筹学的一个重要分支,广泛应用于军事作战、经济分析、经营管理和工程技术等方面。为合理地利用有限的人力、物力、财力等资源作出的最优决策,提供科学的依据。
具体地,获取每个等级的对象的基础额度数据,将每个对象的基础额度数据相加,得到该等级中对应的基础总额度数据,获取每个等级中贷款逾期的对象,将该等级中所有贷款逾期的对象的基础额度数据进行相加,得到该等级对应的不良额度数据。根据每个等级计算的得到的基础总额度数据、不良额度数据以及预设的线性规划的风险约束条件进行计算得到每个风险等级对应的风险调整系数。此时的仅仅是大致计算出了风险调整系数,但是还未满足特定的条件。需要通过每个风险等级的所述基础总额度数据、不良额度数据、所述风险调整系数计算得到总额度不良率,通过调整风险调整系数,使得总额度不良率最小,在所述总额度不良率最小,且满足所述风险约束条件的情况下,对应的所述风险调整系数为所述风险等级对应的风险系数。
也可以计算得到风险系数前的不良率,风险系数前的额度不良率=每个等级的不良额度数据之和/每个等级的基础总额度数据之和。将风险系数调整前的额度不良率和总额度不良率进行对比,可以得到,风险系数调整前的额度不良率相较于总额度不良率更高,因此通过该风险系数能够使得整体的额度不良率得到降低。
在本实施例中,通过计算每个风险等级的风险调整系数,进而调整该风险调整系数,当总额度不良率最小时对应的风险调整系数为风险等级,通过求解风险系数的目的是为了提升违约概率更低的客户的额度,降低违约概率高的坏客户的额度,使得整体的额度不良率得到降低,从而控制了逾期风险。
在其中一个实施例中,所述预设的风险约束条件包括:
按照所述风险等级排列所述风险系数,且所述风险系数逐级递减;
相邻的所述风险系数之间差值大于等于第一预设差值;
排名第一与第二的所述风险系数大于第一阈值,排名第一与第二之外的所述风险系数小于第一阈值;
通过每个风险等级的风险系数、所述基础总额度数据计算得到每个风险等级的额度占比,且每个风险等级的额度占比的和为第一预设百分比。
具体地,在一些实施方式中,例如按照风险等级A、B、C、D、E排列后的风险系数,依次为X1、X2、X3、X4、X5,则预设的风险约束条件可以为:
(1)风险系数X1至X5逐渐递减。
(2)风险系数X1到X5,每两个之间的差值大于等于0.1,如X1和X2之间的差值大于等于0.1,X2和X3之间的差值大于等于0.1。
(3)风险系数X1和X2大于1,风险等级系数X3、X4、X5小于等于1。
(4)通过每个等级的风险系数和基础总额度数据计算得到每个风险等级的额度占比,每个等级的额度占比相加的和为百分之百。
在本实施例中,通过将风险约束条件风险等级为A、B具有较低违约概率的风险系数调整为大于1,达到经过系数调整后风险限额提高的目的,将风险等级为C、D、E具有较高违约概率的风险系数调整为小于1,能够降低风险限额。
在其中一个实施例中,通过每个风险等级的风险调整系数、所述基础总额度数据通过采用如下公式计算得到每个风险等级的额度占比:
Figure BDA0003363879650000191
每个风险等级的所述基础总额度数据、不良额度数据、所述风险调整系数通过采用如下公式计算得到总额度不良率:
Figure BDA0003363879650000192
其中,bi为第i风险等级的不良额度数据,Xi为第i风险等级的风险系数,ai为第i风险等级的基础总额度数据。
具体的,总额度不良率可以为每个等级的不良额度乘以对应的风险系数相加的值除以每个等级的基础总额度数据乘以对应的风险系数相加的值。
在其中一个实施例中,如图7所示,根据预设的维度确定每个维度的所述对象的层级,基于每个维度的所述对象的层级确定所述对象的分层系数,包括:
S701,根据单位维度确定对象的单位维度层级。
具体地,根据对象的单位性质设置单位维度,单位维度包括:国企单位、政府机关单位、事业单位、部队、私企单位、外企单位等。根据对象的单位,确定该对象所处的单位层级。其中,国企单位、政府机关单位、事业单位、部队证明该对象的工作较为稳定,其单位层级可以对应的设为较高的单位层级。
S702,根据对象的工资水平维度确定对象的工资水平层级。
具体地,确定了对象的单位后,根据对象在该单位的工资水平进行分类,将该单位的所有员工的代发工资进行排序,分为几个等级,进而确定该对象在该单位中的等级,等级越靠前,说明该对象的工资水平层级越高。
在一些实施方式中,可以将代发工资水平分为a、b、c、d、e、f、g、h、i,几个等级每个等级都匹配一个分位值,见表2,分位值越高则说明工资水平层级越高。
表2工资水平层级表
90分位以上 a
80-90分位 b
70-80分位 c
60-70分位 d
50-60分位 e
40-50分位 f
30-40分位 g
20-30分位 h
20分位以下 i
S703,根据单位区域维度确定该对象的单位区域层级。
具体地,根据该对象的单位所处的城市确定单位区域维度,单位区域维度包括:一线城市维度、新一线城市维度、二线城市维度、三线城市维度、四线城市维度、五线城市维度共六类。根据单位所处的城市确定单位区域维度,其中一线城市维度、新一线城市维度对应的单位区域层级较高。
S704,根据对象的代发月份维度确定代发月度层级。
具体地,统计该对象近12个月以来有收到工资的月份数量,如,该对象近12个月以来有3个月收到工资,则代发月份数为3。代发月份维度包括:代发月份数极短(代发月份数为0-3),代发月份数较短(代发月份数为4-6),代发月份数一般(代发月份数为6-9),代发月份数较长(代发月份数为9-11),代发月份数长(代发月份数为12)。根据对象12个月以来有收到工资的月份数量匹配对应的代发月份维度,从而确定代发月度层级。代发月份数越多,则对应的代发月度层级越高。
S705,根据对象的信贷历史长度维度确定信贷层级。
具体地,根据对象在最后一笔贷款的申请日期减去对象第一笔贷款的申请日期得到对象的信贷历史长度维度。信贷历史长度维度按照时间长度从低到高分为5档,分别可以为:信贷历史长度极短(A档),信贷历史长度较短(B档),信贷历史长度中等(C档),信贷历史长度较长(D档),信贷历史长度极长(E档)。其中本领域人员可以根据自身经验对信贷历史长度维度进行分档,在本实施例不进行限制分档的时间长度。根据信贷历史长度维度确定信贷层级。信贷历史长度越短,则对应的信贷层级越高。
S706,根据对象的历史还款表现维度确定还款维度层级。
具体地,根据对象消费贷款的还款情况确定历史还款表现维度,历史还款表现维度可以包括:历史逾期,正常结清(3笔以下),正常结清(3笔及以上),正常结清(6笔及以上)。正常结清(6笔及以上)和正常结清(3笔及以上),正常结清(6笔及以上)对应的还款维度层级较高。
S707,根据单位维度层级、工资水平层级、单位区域层级、代发月度层级、信贷层级、还款维度层级确定对象的分层等级,根据分层等级确定分层系数。分层等级可以包括:优质客户1,优质客户2,优质客户3,普通客户4,普通客户5,普通客户6,其中优质客户经过分层系数调整后可以获得更高风险限额,普通客户经过分层系数调整后风险限额降低。根据本领域人员预设的规则或自身经验,设置分层等级对应的分层系数。如表3所示。
表3分层等级和分层系数对应关系
Figure BDA0003363879650000211
Figure BDA0003363879650000221
应该理解的是,虽然附图中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,附图中的流程图至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种贷款额度计算装置800,包括:收入额度确定模块801、负债额度确定模块802、基础额度计算模块803、风险系数计算模块804、分层系数确定模块805、贷款额度计算模块806,其中:
收入额度确定模块801,用于根据对象的金融信息确定收入额度数据。
负债额度确定模块802,用于根据对象的征信信息确定负债额度数据。
基础额度计算模块803,用于计算收入额度数据和负债额度数据的差值,得到对象的基础额度数据。
风险系数计算模块804,用于通过预先训练好的违约概率模型、预先设置的转换系数、根据基础额度数据计算得到的基础总额度、根据贷款逾期的对象确定的不良额度数据、预设的风险约束条件并采用线性规划计算得到风险系数。
分层系数确定模块805,用于根据预设的维度确定每个维度的对象的层级,基于每个维度的对象的层级确定对象的分层系数。
贷款额度计算模块806,用于利用基础额度数据、风险系数和分层系数计算得到对象的贷款额度。
在所述装置的其中一个实施例中,所述装置还包括:分析处理模块、模型评估模块和模型确定模块;
分析处理模块,用于对通过账龄分析确定的目标变量进行分析处理,得到特征变量,目标变量包括贷款逾期超过第一时间的对象、贷款未逾期的对象。
模型评估模块,用于利用逻辑回归算法对特征变量进行模型拟合,并对模型拟合得到的逻辑回归模型进行模型评估。
模型确定模块,用于在模型评估模块进行模型评估中评价指标不低于第一预设数值且稳定性指标不高于第二预设数值的情况下,进行模型评估的逻辑回归模型确定为违约概率模型。
在所述装置的其中一个实施例中,所述分析处理模块,包括:目标变量确定模块、描述性统计模块、数据处理模块;
目标变量确定模块,用于获取建立模型的对象的信息数据,对信息数据通过账龄分析确定的目标变量,获取目标变量中的建模数据,建模数据包括自有数据和对象授权后获取的第三方数据。
描述性统计模块,用于对建模数据进行描述性统计。
数据处理模块,用于对进行描述性统计后的建模数据进行数据处理,得到特征变量,数据处理包括:删除重复值、异常值处理、缺失值处理、数据标准化、特征衍生、变量分箱、证据权重转换、根据信息值和通过特征衍生出的变量的相关系数进行特征筛选。
在所述装置的其中一个实施例中,所述数据处理模块包括:信息值计算模块,信息值删除模块、相关系数计算模块、获取模块;
信息值计算模块,用于计算建模数据的信息值。
信息值删除模块,用于删除信息值小于第一信息阈值,或信息值大于第二信息阈值对应的建模数据。
相关系数计算模块,用于计算通过特征衍生出的变量和建模数据的相关系数。
获取模块,用于获取相关系数大于相关系数阈值的建模数据中信息值最大的建模数据。
在所述装置的其中一个实施例中,风险系数计算模块804包括:违约概率计算模块、得分确定模块、风险等级匹配模块、风险系数计算模块;
违约概率计算模块,用于利用预先训练好的违约概率模型计算对象违约的概率。
得分确定模块,用于基于概率和通过分数跨度计算得到的转换系数确定对象的得分。
风险等级匹配模块,用于根据得分确定对象的风险等级。
风险系数计算模块,用于计算风险等级中基础总额度和不良额度数据并根据预设的风险约束条件进行线性规划计算得到等级对应的风险系数。
在所述装置的其中一个实施例中,风险系数计算模块包括:基础总额度数据计算模块、不良额度数据计算模块、风险调整系数计算模块、总额度不良率计算模块、风险系数确定模块;
基础总额度数据计算模块,用于计算每个风险等级中对象的基础额度数据之和,得到每个等级的基础总额度数据。
不良额度数据计算模块,用于计算每个风险等级中贷款逾期的对象的基础额度数据之和,得到每个等级的不良额度数据。
风险调整系数计算模块,用于根据每个风险等级的基础总额度数据以及不良额度数据、预设的风险约束条件计算得到每个风险等级的风险调整系数。
总额度不良率计算模块,用于通过每个风险等级的基础总额度数据、不良额度数据、风险调整系数计算得到总额度不良率。
风险系数确定模块,用于在总额度不良率最小,且满足风险约束条件的情况下,对应的风险调整系数确定为风险等级对应的风险系数。
在所述装置的其中一个实施例中,风险系数计算模块,还包括:风险约束条件设置模块,用于设置风险约束条件,风险约束条件包括:按照风险等级排列风险系数,且风险系数逐级递减;相邻的风险系数之间差值大于等于第一预设差值;排名第一与第二的风险系数大于第一阈值,排名第一与第二之外的风险系数小于第一阈值;通过每个风险等级的风险调整系数、基础总额度数据计算得到每个风险等级的额度占比,且每个风险等级的额度占比之和为第一预设百分比。
在所述装置的其中一个实施例中,所述风险约束条件设置模块包括:额度占比计算模块,用于通过每个风险等级的风险调整系数、基础总额度数据通过采用如下公式计算得到每个风险等级的额度占比:
Figure BDA0003363879650000251
其中,Xi为第i风险等级的风险系数,ai为第i风险等级的基础总额度数据。
在所述装置的其中一个实施例中,总额度不良率计算模块,还用于采用如下公式计算得到总额度不良率:
Figure BDA0003363879650000252
其中,bi为第i风险等级的不良额度数据,Xi为第i风险等级的风险系数,ai为第i风险等级的基础总额度数据。
在所述装置的其中一个实施例中,预设的维度包括:单位维度、工资水平维度、单位区域维度、代发月份维度、信贷历史长度维度、历史还款表现维度。
关于贷款额度计算装置的具体实施方式可以参见上文中对于贷款额度计算方法的实施例,在此不再赘述。上述贷款额度计算装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储收入额度数据、负债额度数据、风险系数、分层系数等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种贷款额度计算方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本公开所涉及的对象的信息(包括但不限于金融信息、征信信息等)和数据(包括但不限于用于基础总额度数据、不良额度数据等)均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本公开的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本公开构思的前提下,还可以做出若干变形和改进,这些都属于本公开的保护范围。因此,本公开专利的保护范围应以所附权利要求为准。

Claims (22)

1.一种贷款额度计算方法,其特征在于,所述方法包括:
计算收入额度数据和负债额度数据的差值,得到对象的基础额度数据,所述收入额度数据是根据所述对象的金融信息确定的,所述负债额度数据是根据所述对象的征信信息确定的;
通过预先训练好的违约概率模型、预先设置的分数跨度、根据所述基础额度数据计算得到的基础总额度、根据贷款逾期的所述对象确定的不良额度数据、预设的风险约束条件并采用线性规划计算得到风险系数;
根据预设的维度确定每个维度的所述对象的层级,基于每个维度的所述对象的层级确定所述对象的分层系数;
利用所述基础额度数据、所述风险系数和所述分层系数计算得到所述对象的贷款额度。
2.根据权利要求1所述的贷款额度计算方法,其特征在于,所述违约概率模型的训练方法包括:
对通过账龄分析确定的目标变量进行分析处理,得到特征变量,所述目标变量包括贷款逾期超过第一时间的对象、贷款未逾期的对象;
利用逻辑回归算法对所述特征变量进行模型拟合,并对模型拟合得到的逻辑回归模型进行模型评估;
在模型评估中评价指标不低于第一预设数值且稳定性指标不高于第二预设数值的情况下,进行模型评估的所述逻辑回归模型为违约概率模型。
3.根据权利要求2所述的贷款额度计算方法,其特征在于,所述对通过账龄分析确定的目标变量进行分析处理,得到特征变量,包括:
获取建立模型的对象的信息数据,对所述信息数据通过账龄分析确定的目标变量,获取目标变量中的建模数据,所述建模数据包括自有数据和所述对象授权后获取的第三方数据;
对所述建模数据进行描述性统计;
对进行描述性统计后的所述建模数据进行数据处理,得到特征变量,所述数据处理包括:删除重复值、异常值处理、缺失值处理、数据标准化、特征衍生、变量分箱、证据权重转换、根据信息值和通过特征衍生出的变量的相关系数进行特征筛选。
4.根据权利要求3所述的贷款额度计算方法,其特征在于,所述根据信息值和通过特征衍生出的变量的相关系数进行特征筛选,包括:
计算所述建模数据的信息值;
删除信息值小于第一信息阈值,或信息值大于第二信息阈值对应的所述建模数据;
计算通过特征衍生出的变量和所述建模数据的相关系数;
获取所述相关系数大于相关系数阈值的建模数据中信息值最大的建模数据。
5.根据权利要求1所述的贷款额度计算方法,其特征在于,所述通过预先训练好的违约概率模型、预先设置的分数跨度、根据所述基础额度数据计算得到的基础总额度、根据贷款逾期的所述对象确定的不良额度数据、预设的风险约束条件并采用线性规划计算得到风险系数,包括:
利用所述预先训练好的违约概率模型计算所述对象违约的概率;
基于所述概率和通过分数跨度计算得到的转换系数确定所述对象的得分;
根据所述得分确定所述对象的风险等级;
计算所述风险等级中所述基础总额度和所述不良额度数据并根据预设的风险约束条件进行线性规划计算得到所述等级对应的风险系数。
6.根据权利要求2所述的贷款额度计算方法,其特征在于,所述计算所述风险等级中所述基础总额度和所述不良额度数据并根据预设的风险约束条件进行线性规划计算得到所述等级对应的风险系数,包括:
计算每个风险等级中所述对象的基础额度数据之和,得到每个等级的基础总额度数据;
计算每个风险等级中贷款逾期的对象的基础额度数据之和,得到每个等级的不良额度数据;
根据每个风险等级的所述基础总额度数据以及不良额度数据、预设的风险约束条件计算得到每个风险等级的风险调整系数;
通过每个风险等级的所述基础总额度数据、不良额度数据、所述风险调整系数计算得到总额度不良率;
在所述总额度不良率最小,且满足所述风险约束条件的情况下,对应的所述风险调整系数为所述风险等级对应的风险系数。
7.根据权利要求6所述的贷款额度计算方法,其特征在于,所述预设的风险约束条件包括:
按照所述风险等级排列所述风险系数,且所述风险系数逐级递减;
相邻的所述风险系数之间差值大于等于第一预设差值;
排名第一与第二的风险系数大于第一阈值,排名第一与第二之外的所述风险系数小于第一阈值;
通过每个风险等级的风险调整系数、所述基础总额度数据计算得到每个风险等级的额度占比,且每个风险等级的额度占比之和为第一预设百分比。
8.根据权利要求7所述的贷款额度计算方法,其特征在于,通过每个风险等级的风险调整系数、所述基础总额度数据通过采用如下公式计算得到每个风险等级的额度占比:
Figure FDA0003363879640000031
每个风险等级的所述基础总额度数据、不良额度数据、所述风险调整系数通过采用如下公式计算得到总额度不良率:
Figure FDA0003363879640000032
其中,bi为第i风险等级的不良额度数据,Xi为第i风险等级的风险系数,ai为第i风险等级的基础总额度数据。
9.根据权利要求1所述的贷款额度计算方法,其特征在于,所述预设的维度包括:单位维度、工资水平维度、单位区域维度、代发月份维度、信贷历史长度维度、历史还款表现维度。
10.一种贷款额度计算装置,其特征在于,所述装置包括:
收入额度确定模块,用于根据对象的金融信息确定收入额度数据;
负债额度确定模块,用于根据所述对象的征信信息确定负债额度数据;
基础额度计算模块,用于计算所述收入额度数据和所述负债额度数据的差值,得到对象的基础额度数据;
风险系数计算模块,用于通过预先训练好的违约概率模型、预先设置的转换系数、根据所述基础额度数据计算得到的基础总额度、根据贷款逾期的所述对象确定的不良额度数据、预设的风险约束条件并采用线性规划计算得到风险系数;
分层系数确定模块,用于根据预设的维度确定每个维度的所述对象的层级,基于每个维度的所述对象的层级确定所述对象的分层系数;
贷款额度计算模块,用于利用所述基础额度数据、所述风险系数和所述分层系数计算得到所述对象的贷款额度。
11.根据权利要求10所述的贷款额度计算装置,其特征在于,所述装置还包括:分析处理模块、模型评估模块和模型确定模块;
所述分析处理模块,用于对通过账龄分析确定的目标变量进行分析处理,得到特征变量,所述目标变量包括贷款逾期超过第一时间的对象、贷款未逾期的对象;
所述模型评估模块,用于利用逻辑回归算法对所述特征变量进行模型拟合,并对模型拟合得到的逻辑回归模型进行模型评估;
所述模型确定模块,用于所述模型评估模块在模型评估中评价指标不低于第一预设数值且稳定性指标不高于第二预设数值的情况下,进行模型评估的所述逻辑回归模型为违约概率模型。
12.根据权利要求11所述的贷款额度计算装置,其特征在于,所述分析处理模块,包括:目标变量确定模块、描述性统计模块、数据处理模块;
所述目标变量确定模块,用于获取建立模型的对象的信息数据,对所述信息数据通过账龄分析确定的目标变量,获取目标变量中的建模数据,所述建模数据包括自有数据和所述对象授权后获取的第三方数据;
所述描述性统计模块,用于对所述建模数据进行描述性统计;
所述数据处理模块,用于对进行描述性统计后的所述建模数据进行数据处理,得到特征变量,所述数据处理包括:删除重复值、异常值处理、缺失值处理、数据标准化、特征衍生、变量分箱、证据权重转换、根据信息值和通过特征衍生出的变量的相关系数进行特征筛选。
13.根据权利要求12所述的贷款额度计算装置,其特征在于,所述数据处理模块包括:信息值计算模块,信息值删除模块、相关系数计算模块、获取模块;
所述信息值计算模块,用于计算所述建模数据的信息值;
所述信息值删除模块,用于删除信息值小于第一信息阈值,或信息值大于第二信息阈值对应的所述建模数据;
所述相关系数计算模块,用于计算通过特征衍生出的变量和所述建模数据的相关系数;
所述获取模块,用于获取所述相关系数大于相关系数阈值的建模数据中信息值最大的建模数据。
14.根据权利要求11所述的贷款额度计算装置,其特征在于,所述风险系数计算模块包括:违约概率计算模块、得分确定模块、风险等级匹配模块、风险系数计算模块;
所述违约概率计算模块,用于利用所述预先训练好的违约概率模型计算所述对象违约的概率;
所述得分确定模块,用于基于所述概率和通过分数跨度计算得到的转换系数确定所述对象的得分;
所述风险等级匹配模块,用于根据所述得分确定所述对象的风险等级;
所述风险系数计算模块,用于计算所述风险等级中所述基础总额度和所述不良额度数据并根据预设的风险约束条件进行线性规划计算得到所述等级对应的风险系数。
15.根据权利要求14所述的贷款额度计算装置,其特征在于,所述风险系数计算模块包括:基础总额度数据计算模块、不良额度数据计算模块、风险调整系数计算模块、总额度不良率计算模块、风险系数确定模块;
所述基础总额度数据计算模块,用于计算每个风险等级中所述对象的基础额度数据之和,得到每个等级的基础总额度数据;
所述不良额度数据计算模块,用于计算每个风险等级中贷款逾期的对象的基础额度数据之和,得到每个等级的不良额度数据;
所述风险调整系数计算模块,用于根据每个风险等级的所述基础总额度数据以及不良额度数据、预设的风险约束条件计算得到每个风险等级的风险调整系数;
所述总额度不良率计算模块,用于通过每个风险等级的所述基础总额度数据、不良额度数据、所述风险调整系数计算得到总额度不良率;
所述风险系数确定模块,用于在所述总额度不良率最小,且满足所述风险约束条件的情况下,对应的所述风险调整系数为所述风险等级对应的风险系数。
16.根据权利要求14或15所述的贷款额度计算装置,其特征在于,所述风险系数计算模块,还包括:风险约束条件设置模块,用于设置风险约束条件,所述风险约束条件包括:按照所述风险等级排列所述风险系数,且所述风险系数逐级递减;相邻的所述风险系数之间差值大于等于第一预设差值;排名第一与第二的风险系数大于第一阈值,排名第一与第二之外的所述风险系数小于第一阈值;通过每个风险等级的风险调整系数、所述基础总额度数据计算得到每个风险等级的额度占比,且每个风险等级的额度占比之和为第一预设百分比。
17.根据权利要求16所述的贷款额度计算装置,其特征在于,所述风险约束条件设置模块包括:额度占比计算模块,用于通过每个风险等级的风险调整系数、基础总额度数据通过采用如下公式计算得到每个风险等级的额度占比:
Figure FDA0003363879640000061
其中,Xi为第i风险等级的风险系数,ai为第i风险等级的基础总额度数据。
18.根据权利要求16所述的贷款额度计算装置,其特征在于,所述总额度不良率计算模块还用于采用如下公式计算得到总额度不良率:
Figure FDA0003363879640000062
其中,bi为第i风险等级的不良额度数据,Xi为第i风险等级的风险系数,ai为第i风险等级的基础总额度数据。
19.根据权利要求16所述的贷款额度计算装置,其特征在于,所述分层系数确定模块中预设的维度包括:单位维度、工资水平维度、单位区域维度、代发月份维度、信贷历史长度维度、历史还款表现维度。
20.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
21.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
22.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
CN202111375611.0A 2021-11-19 2021-11-19 贷款额度计算方法、装置、计算机设备和存储介质 Pending CN114219611A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111375611.0A CN114219611A (zh) 2021-11-19 2021-11-19 贷款额度计算方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111375611.0A CN114219611A (zh) 2021-11-19 2021-11-19 贷款额度计算方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN114219611A true CN114219611A (zh) 2022-03-22

Family

ID=80697613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111375611.0A Pending CN114219611A (zh) 2021-11-19 2021-11-19 贷款额度计算方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN114219611A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116954591A (zh) * 2023-06-15 2023-10-27 天云融创数据科技(北京)有限公司 银行领域的广义线性模型训练方法、装置、设备和介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116954591A (zh) * 2023-06-15 2023-10-27 天云融创数据科技(北京)有限公司 银行领域的广义线性模型训练方法、装置、设备和介质
CN116954591B (zh) * 2023-06-15 2024-02-23 天云融创数据科技(北京)有限公司 银行领域的广义线性模型训练方法、装置、设备和介质

Similar Documents

Publication Publication Date Title
CN110837931B (zh) 客户流失预测方法、装置及存储介质
De Fontnouvelle et al. Using loss data to quantify operational risk
KR102009309B1 (ko) 금융상품 관리자동화 시스템 및 관리자동화 방법
CN110909984B (zh) 业务数据处理模型训练方法、业务数据处理方法及装置
CN111105266B (zh) 基于改进决策树的客户分群方法及装置
US20210287119A1 (en) Systems and methods for mitigation bias in machine learning model output
CN112633962B (zh) 业务推荐方法、装置、计算机设备和存储介质
Van Thiel et al. Artificial intelligence credit risk prediction: An empirical study of analytical artificial intelligence tools for credit risk prediction in a digital era
CN111709826A (zh) 目标信息确定方法和装置
Petrides et al. Cost-sensitive learning for profit-driven credit scoring
CN111738819A (zh) 表征数据筛选方法、装置和设备
US10325235B2 (en) Method and system for analyzing and optimizing distribution of work from a plurality of queues
CN112200659A (zh) 建立风控模型的方法、装置及存储介质
CN110728301A (zh) 一种个人用户的信用评分方法、装置、终端及存储介质
CN114219611A (zh) 贷款额度计算方法、装置、计算机设备和存储介质
CN115689713A (zh) 异常风险数据处理方法、装置、计算机设备和存储介质
CN115099933A (zh) 一种业务预算方法、装置及设备
CN114626940A (zh) 数据分析方法、装置及电子设备
CN114170000A (zh) ***用户风险类别识别方法、装置、计算机设备和介质
CN113822751A (zh) 一种线上贷款的风险预测方法
Nazari et al. Using the Hybrid Model for Credit Scoring (Case Study: Credit Clients of microloans, Bank Refah-Kargeran of Zanjan, Iran)
CN114662824A (zh) 风控策略切换方法、装置、计算机设备和存储介质
CN117994017A (zh) 构建零***风险预测模型的方法和线上信贷业务Scoredelta模型
CN118229402A (zh) 构建零***风险预测模型的方法和零售信贷Scoresigmam2a模型
CN116128635A (zh) 一种基于最优变量分箱算法的信用评分卡开发方法及终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination