CN115953234A - 风险评估方法、装置、电子设备及存储介质 - Google Patents
风险评估方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115953234A CN115953234A CN202211651731.3A CN202211651731A CN115953234A CN 115953234 A CN115953234 A CN 115953234A CN 202211651731 A CN202211651731 A CN 202211651731A CN 115953234 A CN115953234 A CN 115953234A
- Authority
- CN
- China
- Prior art keywords
- sample
- risk
- model
- score
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请公开了一种风险评估方法、装置、电子设备及存储介质,所述的风险评估方法包括以下步骤:获取待评估样本;通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果;若基于所述初始风险评估结果确定所述待评估样本属于高分客群,则通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果,其中,所述第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到。本申请解决了现有技术风险评估效果较差的技术问题。
Description
技术领域
本申请涉及金融科技(Fintech)的人工智能技术领域,尤其涉及一种风险评估方法、装置、电子设备及存储介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
在金融行业中,常常对客户进行风险评估,进而将风险评估结果用于额度授信,一般而言,对于评估确定的风险越高的客户,给予的授信额度会越低,而评估确定的风险越低的客户,给予的授信额度会越高。风险模型对大部分的高风险客户识别得很准,对于识别得准确的这部分高风险客户,可以通过审批拒绝或给予一个低额度,降低逾期损失,然而,对客户风险水平进行评估时会存在误判的情况,对于被误判为低风险客户的这部分高风险客户,由于被判定为高风险客户,会给予其一个较高的授信额度,造成较高的逾期损失,风险评估效果较差。
发明内容
本申请的主要目的在于提供一种风险评估方法、装置、电子设备及存储介质,旨在解决现有技术风险评估效果较差的技术问题。
为实现上述目的,本申请提供一种风险评估方法,包括以下步骤:
获取待评估样本;
通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果;
若基于所述初始风险评估结果确定所述待评估样本属于高分客群,则通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果,其中,所述第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到。
本申请还提供一种风险评估装置,所述风险评估装置包括:
获取模块,用于获取待评估样本;
第一风险评估模块,用于通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果;
第二风险评估模块,用于若基于所述初始风险评估结果确定所述待评估样本属于高分客群,则通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果,其中,所述第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到。
本申请还提供一种电子设备,所述电子设备为实体设备,所述电子设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述的风险评估方法的程序,所述的风险评估方法的程序被处理器执行时可实现如上述的风险评估方法的步骤。
本申请还提供一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有实现风险评估方法的程序,所述的风险评估方法的程序被处理器执行时实现如上述的风险评估方法的步骤。
本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的风险评估方法的步骤。
本申请提供了一种风险评估方法、装置、电子设备及存储介质,通过获取待评估样本,通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果,实现了基于第一风险模型对待评估样本进行初步风险评估的目的,进而,通过若基于所述初始风险评估结果确定所述待评估样本属于高分客群,则通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果,其中,所述第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到,实现了在所述待评估样本属于高分客群的情况下,基于第二风险模型对所述待评估样本进一步进行风险评估的目的。高分客群中被误判为属于高分客群的低分客户,其特征与低分客群存在一定差异,否则也不会被误判为属于高分客群,但这些存在差异的特征占比较小或在低分客群中的权重较低,故而在第一风险模型时,无法准确识别出这部分被误判为属于高分客群的低分客户,而第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到,这样,仅基于高分客群进行训练得到的第二风险模型,不会受到低分客群的影响,故而可以从高分客群中识别出原本由于存在差异的特征占比较小或权重较低而被误判为属于高分客群的低分客户,进而有效减小给予被误判为属于高分客群的低分客户较高的授信额度可能导致的较高的逾期损失,克服了对客户风险水平进行评估时会存在误判的情况,对于被误判为低风险客户的这部分高风险客户,由于被判定为高风险客户,会给予其一个较高的授信额度,造成较高的逾期损失,风险评估效果较差的技术缺陷,提高了风险评估的效果。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图得到其他的附图。
图1为本申请中风险评估方法的一实施例的流程示意图;
图2为本申请中风险评估方法中的一种示例的第一评分分布和第二评分分布的示意图;
图3为本申请中风险评估方法的另一实施例的流程示意图;
图4为本申请中风险评估装置的一实施例的结构示意图;
图5为本申请实施例中风险评估方法涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所得到的所有其它实施例,均属于本发明保护的范围。
实施例一
本申请实施例提供一种风险评估方法,在本申请风险评估方法的第一实施例中,参照图1,包括以下步骤:
步骤S10,获取待评估样本;
本实施例方法的执行主体可以是一种风险评估装置,也可以是一种风险评估终端设备或服务器,本实施例以风险评估装置进行举例,该风险评估装置可以集成在具有数据处理功能的智能手机、平板电脑等终端设备上。
在本实施例中,需要说明的是,风险模型是指以识别客户是否会违约为目标基于数理统计方法开发的计量模型,常用于信贷风险管理,如贷款审批、额度授信、风险定价等方面。所述风险模型是以自然人也即客户的角度开发,例如,某个人正常按时还款,则可以标记为0,表示其为好客户,如果某个人发生长时间的逾期行为,则可以标记为1,表示其为坏客户,进而,基于这些自然人或客户的特征数据作为样本,通过逻辑回归、GBDT(GradientBoosting Decision Tree,梯度提升决策树)、XGBoost(eXtreme Gradient Boosting,极度梯度提升树)等分类算法建立的分类模型。
具体地,获取待评估样本,其中,所述待评估样本中包含有待进行风险评估的客户与信贷相关的信贷特征数据,所述信贷特征数据包括借贷类型、借贷金额、逾期时间、逾期金额、多头借贷等中的一个或多个。
步骤S20,通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果;
在本实施例中,具体地,将所述待评估样本中包含的信贷特征数据拼接成信贷特征向量,例如,假设所述信贷特征向量为(a,b,c),则特征值a表示借贷类型为房贷,特征值b表示逾期时间30天,特征值c表示在3家金融机构提出借贷需求,通过将所述信贷特征向量输入第一风险模型,获得所述待评估样本的初始风险评估结果,其中,所述第一风险模型可以为通过逻辑回归、GBDT、XGBoost等分类算法建立的分类模型,所述初始风险评估结果至少包括初始分类标签、初始分类概率、初始质量评分等中的至少一个,所述初始质量评分是所述第一风险模型根据信贷特征向量进行数据处理后得到的所述待评估样本的质量评分,所述初始分类标签可以包括高分客群、低分客群等,所述高分客群由初始质量评分高于初始质量评分阈值的客户组成,所述低分客群由初始质量评分不高于初始质量评分阈值的客户组成,所述初始风险评估结果也可以为初始风险评估向量,例如,通过第一风险模型可以确定所述待评估样本的初始分类标签为1,表示待评估样本属于高分客群,可以确定待评估样本有80%的概率属于高分客群,以及所述待评估样本的初始质量评分为900,则可以将所述初始分类标签1或者初始质量评分为900作为初始风险评估结果,也可以将向量(1,0.8,900)、向量(1,0.8)或向量(1,900)作为初始风险评估结果。
步骤S30,若基于所述初始风险评估结果确定所述待评估样本属于高分客群,则通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果,其中,所述第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到。
在本实施例中,需要说明的是,所述第二风险模型可以为通过逻辑回归、GBDT、XGBoost等分类算法建立的分类模型,所述第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到。
具体地,在获得所述待评估样本的初始风险评估结果之后,根据所述初始风险评估结果中的分类标签或质量评分确定所述待评估样本是否属于高分客群,若基于所述初始风险评估结果确定所述待评估样本属于高分客群,则通过将所述待评估样本对应的信贷特征向量输入第二风险模型,获得所述待评估样本的目标风险评估结果,以供用户根据所述目标风险评估结果确定所述待评估样本的授信额度,其中,所述目标风险评估结果至少包括目标分类标签、目标分类概率、目标质量评分等中的至少一个,所述目标质量评分是所述第二风险模型根据信贷特征向量进行数据处理后得到的所述待评估样本的质量评分,所述目标分类标签可以包括高风险高分客群、低风险高分客群等,所述高风险高分客群由初始质量评分高于初始质量评分阈值而目标质量评分低于目标质量评分阈值的客户组成,所述低风险高分客群由初始质量评分高于初始质量评分阈值且目标质量评分不低于目标质量评分阈值的客户组成,所述目标风险评估结果也可以为目标风险评估向量,例如,通过第二风险模型可以确定所述待评估样本的目标分类标签为1,表示待评估样本属于高风险高分客群,可以确定待评估样本有75%的概率属于高风险高分客群,以及所述待评估样本的目标质量评分为350,则可以将所述目标分类标签1或者目标质量评分为350作为目标风险评估结果,也可以将向量(1,0.75,350)、向量(1,0.75)或向量(1,350)作为目标风险评估结果。所述目标风险评估结果中包含质量评分的信息,可以使得用户不仅可以确定是否授信,还可以确定具体的授信金额,质量评分越高,则可以给予更高的授信金额,反之则给予较低的授信金额。
可选地,所述通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果的步骤包括:
步骤S31,通过将所述待评估样本输入第二风险模型,获得所述待评估样本的第一质量评分;
在本实施例中,具体地,通过将所述待评估样本对应的信贷特征向量输入第二风险模型,获得所述待评估样本的第一质量评分。
步骤S32,根据预设的第一风险模型与第二风险模型之间的评分映射关系,确定所述第一质量评分对应的第二质量评分;
在本实施例中,具体地,预先根据所述第一风险模型中高分客群的质量评分信息和第二风险模型中客群的质量评分信息,确定第一风险模型与第二风险模型之间的评分映射关系,所述第一风险模型与第二风险模型之间的评分映射关系用于将所述第二风险模型中客群的质量评分映射至所述第一风险模型中高分客群的质量评分范围中,进而根据所述预设的第一风险模型与第二风险模型之间的评分映射关系,可以确定所述第一质量评分对应的第二质量评分,其中,所述第二质量评分处于所述第一风险模型中高分客群的质量评分范围中,所述评分映射关系可以为评分映射关系表,也可以为评分映射关系函数等。
示例性地,若所述第一风险模型的评分范围是0-100分,所述高分客群由第三质量评分高于70分的客户组成,则所述第一风险模型中高分客群的质量评分范围为70分至100分,若所述第二风险模型的质量评分范围是0-100分,则所述第一质量评分处于0-100分之间,若直接将所述第一质量评分作为目标风险评估结果输出,则可能出现低于70分的高分客户,导致用户在授信时,容易混淆第一质量评分较低的这部分高分客户与其他低分客户,而用户是基于质量评分确定授信金额,故而可能导致授信金额出错,故而,可以将所述第一质量评分映射至70分至100分之间,以使得所述第一质量评分与其他低分客群的第三质量评分之间可比且清楚,用户看到质量评分之后可以简单明了地知晓具体情况,不容易混淆,也不需要结合其他更多信息进行确认。
在一种可实施的方式中,所述评分映射关系可以根据第二风险模型中客群的质量评分范围与第一风险模型中高分客群的质量评分范围之间的比例关系进行确定,例如,第二风险模型中客群的质量评分范围为0-100分,第一风险模型中高分客群的质量评分范围为80-100分,则可以将所述第一质量评分缩小五倍后加上80,得到第二质量评分;所述评分映射关系也可以根据第二风险模型中客群的质量评分分布与第一风险模型中高分客群的质量评分分布之间的关系进行确定。
可选地,所述根据预设的第一风险模型与第二风险模型之间的评分映射关系,确定所述第一质量评分对应的第二质量评分的步骤之前,还包括:
步骤S321,获取所述第一风险模型中高分客群的第一评分分布,以及所述第二风险模型中客群的第二评分分布;
在本实施例中,具体地,在所述第一风险模型训练好之后,获取所述第一风险模型中客群的评分分布,从所述第一风险模型中客群的评分分布中提取高分客群的第一评分分布,在所述第二风险模型训练好之后,获取所述第二风险模型中客群的第二评分分布,其中,所述第一风险模型中客群的评分分布服从正态分布,所述第一评分分布可以为正态分布中数量下降区域中的一部分,所述第二评分分布也服从正态分布。
步骤S322,将所述第一评分分布与所述第二评分分布之间的分布映射关系确定为所述第一风险模型与所述第二风险模型之间的评分映射关系。
在本实施例中,具体地,根据所述第一评分分布与所述第二评分分布确定分布映射关系,将所述分布映射关系确定为所述第一风险模型与所述第二风险模型之间的评分映射关系,其中,所述分布映射关系用于表征在保持客群中客户总数不变、将客群的评分分布从第二评分分布调整为第一评分分布的情况下,每个客户的评分的变化情况。
示例性地,参照图2,图2中,两个评分分布的横坐标均为评分,纵坐标为客户数量,根据高分客群通过第二风险模型重新评分后的第一质量评分,可对高分客群重新进行排序,也即原本第三质量评分较高的客户,第一质量评分可能会较低,进而可以形成第二评分分布,将按照第一质量评分重新排序后的客户,按顺序排列成第一风险模型中高分客群的第一评分分布,得到评分相同但重新排序后的第一评分分布,在形成第一评分分布之后,可以重新根据每个客户在第一评分分布中的位置确定其对应的第二质量评分,这样,实现了在保证第一风险模型的分布不发生变化的情况下,对高分客群重新进行风险评估后重新进行排序,进而可以降低对高分客户的误判幅度,进而可以帮助用户及时减少给予误判为很高分的实际质量较低的高风险高分客户的授信金额,降低逾期损失。
步骤S33,将所述第二质量评分确定为所述待评估样本的目标风险评估结果。
在本实施例中,具体地,将所述第二质量评分确定为所述待评估样本的目标风险评估结果,以供用户根据所述第二质量评分确定所述待评估样本的授信额度。
可选地,所述通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果的步骤之后,还包括:
若基于所述初始风险评估结果确定所述待评估样本不属于高分客群,则将所述初始风险评估结果中的第三质量评分确定为所述待评估样本的目标风险评估结果。
在本实施例中,具体地,在获得所述待评估样本的初始风险评估结果之后,根据所述初始风险评估结果中的分类标签或质量评分确定所述待评估样本是否属于高分客群,若基于所述初始风险评估结果确定所述待评估样本不属于高分客群,则将所述初始风险评估结果中的第三质量评分确定为所述待评估样本的目标风险评估结果,其中,不属于高分客群的情况,可以属于低分客群,也可以属于及格分客群等,具体可以根据实际需要以及所述第一风险模型的分类类别的数量进行确定,本实施例对此不加以限制。将质量评分确定为最终的目标风险评估结果,可以使得用户不仅可以确定是否授信,还可以确定具体的授信金额,质量评分越高,则可以给予更高的授信金额,反之则给予较低的授信金额。
可选地,所述初始风险评估结果包括第三质量评分,所述通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果的步骤之后,还包括:
步骤A10,比较所述第三质量评分和预设质量评分阈值;
步骤A20,若确定所述第三质量评分大于所述预设质量评分阈值,则判定所述待评估样本属于高分客群;
步骤A30,若确定所述第三质量评分小于或等于所述预设质量评分阈值,则判定所述待评估样本属于低分客群。
在本实施例中,具体地,在获得所述待评估样本的初始风险评估结果之后,从所述初始风险评估结果中提取所述待评估样本的第三质量评分,比较所述第三质量评分和预设质量评分阈值的大小关系,其中,所述预设质量评分阈值可以根据实际情况进行设定,可以根据高分客群的实际占比进行确定,也可以根据业务经验进行确定,本实施例对此不加以限制。进而,若确定所述第三质量评分大于所述预设质量评分阈值,则判定所述待评估样本属于高分客群,若确定所述第三质量评分小于或等于所述预设质量评分阈值,则判定所述待评估样本属于低分客群。
在本实施例中,通过获取待评估样本,通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果,实现了基于第一风险模型对待评估样本进行初步风险评估的目的,进而,通过若基于所述初始风险评估结果确定所述待评估样本属于高分客群,则通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果,其中,所述第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到,实现了在所述待评估样本属于高分客群的情况下,基于第二风险模型对所述待评估样本进一步进行风险评估的目的。高分客群中被误判为属于高分客群的低分客户,其特征与低分客群存在一定差异,否则也不会被误判为属于高分客群,但这些存在差异的特征占比较小或在低分客群中的权重较低,故而在第一风险模型时,无法准确识别出这部分被误判为属于高分客群的低分客户,而第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到,这样,仅基于高分客群进行训练得到的第二风险模型,不会受到低分客群的影响,故而可以从高分客群中识别出原本由于存在差异的特征占比较小或权重较低而被误判为属于高分客群的低分客户,进而有效减小给予被误判为属于高分客群的低分客户较高的授信额度可能导致的较高的逾期损失,克服了对客户风险水平进行评估时会存在误判的情况,对于被误判为低风险客户的这部分高风险客户,由于被判定为高风险客户,会给予其一个较高的授信额度,造成较高的逾期损失,风险评估效果较差的技术缺陷,提高了风险评估的效果。
实施例二
进一步地,参照图3,基于本申请上述实施例,在本申请的第二实施例中,与上述实施例相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,所述通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果的步骤之前,还包括:
步骤B10,获取训练样本和所述训练样本对应的训练样本标签;
在本实施例中,具体地,获取训练样本,并对所述训练样本进行人工标注,得到所述训练样本对应的训练样本标签,所述训练样本标签至少包括训练样本分类标签、训练样本分类概率、训练样本质量评分等中的至少一个。
步骤B20,通过将所述训练样本输入待训练的第一风险模型,确定所述训练样本的第一训练模型预测结果;
在本实施例中,具体地,将所述训练样本中包含的信贷特征训练数据拼接成信贷特征训练向量,将所述信贷特征训练向量输入待训练的第一风险模型,确定所述训练样本的第一训练模型预测结果,其中,所述第一训练模型预测结果至少包括初始训练分类标签、初始训练分类概率、初始训练质量评分等中的至少一个,所述初始训练质量评分是所述第一风险模型根据信贷特征训练向量进行数据处理后得到的所述训练样本的质量评分,所述初始分类标签可以包括高分客群、低分客群等,所述高分客群由训练质量评分高于训练质量评分阈值的客户组成,所述低分客群由训练质量评分不高于训练质量评分阈值的客户组成,所述训练风险评估结果也可以为训练风险评估向量。
步骤B30,基于所述训练样本标签和所述第一训练模型预测结果,通过计算所述待训练的第一风险模型对应的第一模型预测损失,迭代优化所述待训练的第一风险模型,获得第一风险模型;
在本实施例中,具体地,根据所述训练样本标签与所述第一训练模型预测结果之间的差异,计算所述待训练的第一风险模型对应的第一模型预测损失;判断所述第一模型预测损失是否收敛,若所述第一模型预测损失收敛,则将所述待训练的第一风险模型作为第一风险模型;若所述第一模型预测损失未收敛,则依据第一模型预测损失计算的模型梯度,对待训练的第一风险模型进行更新,并返回执行所述获取训练样本和所述训练样本对应的训练样本标签的步骤,直至计算得到的第一模型预测损失收敛。
可选地,所述通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果的步骤之前,还包括:
步骤C10,从所述训练样本中确定属于高分客群的目标训练样本;
在本实施例中,具体地,在所述第一风险模型训练完成之后,根据所述第一风险模型的评估结果,从所述训练样本中提取属于高分客群的目标训练样本。
步骤C20,将所述目标训练样本输入待训练的第二风险模型,确定所述目标训练样本的第二训练模型预测结果;
在本实施例中,具体地,可以直接获取第一风险模型训练时已拼接好的所述目标训练样本对应的目标信贷特征训练向量,也可以将所述目标训练样本中包含的信贷特征训练数据拼接成目标信贷特征训练向量,进而,将所述目标信贷特征训练向量输入待训练的第二风险模型,确定所述目标训练样本的第二训练模型预测结果,其中,所述待训练的第二风险模型可以与所述待训练的第一风险模型一样,也即,用同样的模型通过不同的训练样本进行训练,所述第二训练模型预测结果至少包括目标训练分类标签、目标训练分类概率、目标训练质量评分等中的至少一个,所述目标训练质量评分是所述第二风险模型根据目标信贷特征训练向量进行数据处理后得到的所述目标训练样本的目标训练质量评分,所述目标初始分类标签可以包括高风险高分客群、低风险高分客群等,所述高风险高分客群由训练质量评分高于训练质量评分阈值而目标训练质量评分低于目标训练质量评分阈值的客户组成,所述低风险高分客群由训练质量评分高于训练质量评分阈值且目标训练质量评分不低于目标训练质量评分阈值的客户组成,所述目标训练风险评估结果也可以为目标训练风险评估向量。
步骤C30,基于所述目标训练样本对应的训练样本标签和所述第二训练模型预测结果,通过计算所述待训练的第二风险模型对应的第二模型预测损失,迭代优化所述待训练的第二风险模型,获得第二风险模型。
在本实施例中,具体地,根据所述目标训练样本对应的训练样本标签与所述第二训练模型预测结果之间的差异,计算所述待训练的第二风险模型对应的第二模型预测损失;判断所述第二模型预测损失是否收敛,若所述第二模型预测损失收敛,则将所述待训练的第二风险模型作为第二风险模型;若所述第二模型预测损失未收敛,则依据第二模型预测损失计算的模型梯度,对待训练的第二风险模型进行更新,并返回执行所述从所述训练样本中确定属于高分客群的目标训练样本的步骤,直至计算得到的第二模型预测损失收敛。
在本实施例中,通过将第一风险模型中的高分客群作为第二风险模型的训练样本,训练后的第二风险模型不会受到低分客群的影响,故而可以从高分客群中识别出原本由于存在差异的特征占比较小或权重较低而被误判为属于高分客群的低分客户,进而有效减小给予被误判为属于高分客群的低分客户较高的授信额度可能导致的较高的逾期损失,克服了对客户风险水平进行评估时会存在误判的情况,对于被误判为低风险客户的这部分高风险客户,由于被判定为高风险客户,会给予其一个较高的授信额度,造成较高的逾期损失,风险评估效果较差的技术缺陷,提高了风险评估的效果。
实施例三
进一步地,本申请实施例还提供一种风险评估装置,参照图4,所述风险评估装置应用于风险评估方,包括:
第一获取模块10,用于获取待评估样本;
第一风险评估模块20,用于通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果;
第二风险评估模块30,用于若基于所述初始风险评估结果确定所述待评估样本属于高分客群,则通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果,其中,所述第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到。
可选地,所述第一风险评估模块20,还用于:
通过将所述待评估样本输入第二风险模型,获得所述待评估样本的第一质量评分;
根据预设的第一风险模型与第二风险模型之间的评分映射关系,确定所述第一质量评分对应的第二质量评分;
将所述第二质量评分确定为所述待评估样本的目标风险评估结果。
可选地,在所述根据预设的第一风险模型与第二风险模型之间的评分映射关系,确定所述第一质量评分对应的第二质量评分的步骤之前,所述第一风险评估模块20,还用于:
获取所述第一风险模型中高分客群的第一评分分布,以及所述第二风险模型中客群的第二评分分布;
将所述第一评分分布与所述第二评分分布之间的分布映射关系确定为所述第一风险模型与所述第二风险模型之间的评分映射关系。
可选地,所述风险评估装置还包括第三风险评估模块,在所述通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果的步骤之后,所述第三风险评估模块用于:
若基于所述初始风险评估结果确定所述待评估样本不属于高分客群,则将所述初始风险评估结果中的第三质量评分确定为所述待评估样本的目标风险评估结果。
可选地,所述风险评估装置还包括训练模块,在所述通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果的步骤之前,所述训练模块用于:
获取训练样本和所述训练样本对应的训练样本标签;
通过将所述训练样本输入待训练的第一风险模型,确定所述训练样本的第一训练模型预测结果;
基于所述训练样本标签和所述第一训练模型预测结果,通过计算所述待训练的第一风险模型对应的第一模型预测损失,迭代优化所述待训练的第一风险模型,获得第一风险模型。
可选地,所述通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果的步骤之前,所述训练模块还用于:
从所述训练样本中确定属于高分客群的目标训练样本;
将所述目标训练样本输入待训练的第二风险模型,确定所述目标训练样本的第二训练模型预测结果;
基于所述目标训练样本对应的训练样本标签和所述第二训练模型预测结果,通过计算所述待训练的第二风险模型对应的第二模型预测损失,迭代优化所述待训练的第二风险模型,获得第二风险模型。
可选地,所述风险评估装置还包括判定模块,在所述初始风险评估结果包括第三质量评分,所述通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果的步骤之后,所述判定模块用于:
比较所述第三质量评分和预设质量评分阈值;
若确定所述第三质量评分大于所述预设质量评分阈值,则判定所述待评估样本属于高分客群;
若确定所述第三质量评分小于或等于所述预设质量评分阈值,则判定所述待评估样本属于低分客群。
本发明提供的风险评估装置,采用上述实施例中的风险评估方法,解决了现有技术风险评估效果较差的技术问题。与现有技术相比,本发明实施例提供的风险评估装置的有益效果与上述实施例提供的风险评估方法的有益效果相同,且该风险评估装置中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
实施例四
进一步地,本发明实施例提供一种电子设备,电子设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例中的风险评估方法或转化资质截断参数确定方法。
下面参考图5,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如蓝牙耳机、移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等),其可以根据存储在只读存储器(ROM)中的程序或者从存储装置加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有电子设备操作所需的各种程序和数组。处理装置、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。
通常,以下***可以连接至I/O接口:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置;包括例如磁带、硬盘等的存储装置;以及通信装置。通信装置可以允许电子设备与其他设备进行无线或有线通信以交换数组。虽然图中示出了具有各种***的电子设备,但是应理解的是,并不要求实施或具备所有示出的***。可以替代地实施或具备更多或更少的***。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置被安装,或者从ROM被安装。在该计算机程序被处理装置执行时,执行本公开实施例的方法中限定的上述功能。
本发明提供的电子设备,采用上述实施例中的风险评估方法或转化资质截断参数确定方法,解决了现有技术风险评估效果较差的技术问题。与现有技术相比,本发明实施例提供的电子设备的有益效果与上述实施例提供的风险评估方法或转化资质截断参数确定方法的有益效果相同,且该电子设备中的其他技术特征与上述实施例方法公开的特征相同,在此不做赘述。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
实施例六
进一步地,本实施例提供一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行上述实施例中的风险评估方法或转化资质截断参数确定方法。
本发明实施例提供的计算机可读存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的***、***或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、***或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是电子设备中所包含的;也可以是单独存在,而未装配入电子设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被电子设备执行时,使得电子设备:获取待评估样本;通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果;若基于所述初始风险评估结果确定所述待评估样本属于高分客群,则通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果,其中,所述第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该单元本身的限定。
本发明提供的计算机可读存储介质,存储有用于执行上述风险评估方法或转化资质截断参数确定方法的计算机可读程序指令,解决了现有技术风险评估效果较差的技术问题。与现有技术相比,本发明实施例提供的计算机可读存储介质的有益效果与上述实施例提供的风险评估方法或转化资质截断参数确定方法的有益效果相同,在此不做赘述。
实施例七
进一步地,本申请还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的风险评估方法或转化资质截断参数确定方法的步骤。
本申请提供的计算机程序产品解决了现有技术风险评估效果较差的技术问题。与现有技术相比,本发明实施例提供的计算机程序产品的有益效果与上述实施例提供的风险评估方法或转化资质截断参数确定方法的有益效果相同,在此不做赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。
Claims (10)
1.一种风险评估方法,其特征在于,所述风险评估方法包括以下步骤:
获取待评估样本;
通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果;
若基于所述初始风险评估结果确定所述待评估样本属于高分客群,则通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果,其中,所述第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到。
2.如权利要求1所述的风险评估方法,其特征在于,所述通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果的步骤包括:
通过将所述待评估样本输入第二风险模型,获得所述待评估样本的第一质量评分;
根据预设的第一风险模型与第二风险模型之间的评分映射关系,确定所述第一质量评分对应的第二质量评分;
将所述第二质量评分确定为所述待评估样本的目标风险评估结果。
3.如权利要求2所述的风险评估方法,其特征在于,所述根据预设的第一风险模型与第二风险模型之间的评分映射关系,确定所述第一质量评分对应的第二质量评分的步骤之前,还包括:
获取所述第一风险模型中高分客群的第一评分分布,以及所述第二风险模型中客群的第二评分分布;
将所述第一评分分布与所述第二评分分布之间的分布映射关系确定为所述第一风险模型与所述第二风险模型之间的评分映射关系。
4.如权利要求1所述的风险评估方法,其特征在于,所述通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果的步骤之后,还包括:
若基于所述初始风险评估结果确定所述待评估样本不属于高分客群,则将所述初始风险评估结果中的第三质量评分确定为所述待评估样本的目标风险评估结果。
5.如权利要求1所述的风险评估方法,其特征在于,所述通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果的步骤之前,还包括:
获取训练样本和所述训练样本对应的训练样本标签;
通过将所述训练样本输入待训练的第一风险模型,确定所述训练样本的第一训练模型预测结果;
基于所述训练样本标签和所述第一训练模型预测结果,通过计算所述待训练的第一风险模型对应的第一模型预测损失,迭代优化所述待训练的第一风险模型,获得第一风险模型。
6.如权利要求5所述的风险评估方法,其特征在于,所述通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果的步骤之前,还包括:
从所述训练样本中确定属于高分客群的目标训练样本;
将所述目标训练样本输入待训练的第二风险模型,确定所述目标训练样本的第二训练模型预测结果;
基于所述目标训练样本对应的训练样本标签和所述第二训练模型预测结果,通过计算所述待训练的第二风险模型对应的第二模型预测损失,迭代优化所述待训练的第二风险模型,获得第二风险模型。
7.如权利要求1所述的风险评估方法,其特征在于,所述初始风险评估结果包括第三质量评分,所述通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果的步骤之后,还包括:
比较所述第三质量评分和预设质量评分阈值;
若确定所述第三质量评分大于所述预设质量评分阈值,则判定所述待评估样本属于高分客群;
若确定所述第三质量评分小于或等于所述预设质量评分阈值,则判定所述待评估样本属于低分客群。
8.一种风险评估装置,所述风险评估装置包括:
获取模块,用于获取待评估样本;
第一风险评估模块,用于通过将所述待评估样本输入第一风险模型,获得所述待评估样本的初始风险评估结果;
第二风险评估模块,用于若基于所述初始风险评估结果确定所述待评估样本属于高分客群,则通过将所述待评估样本输入第二风险模型,获得所述待评估样本的目标风险评估结果,其中,所述第二风险模型是基于所述第一风险模型的训练样本中属于高分客群的目标训练样本训练得到。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至7中任一项所述的风险评估方法的步骤。
10.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有实现风险评估方法的程序,所述实现风险评估方法的程序被处理器执行以实现如权利要求1至7中任一项所述的风险评估方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211651731.3A CN115953234A (zh) | 2022-12-21 | 2022-12-21 | 风险评估方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211651731.3A CN115953234A (zh) | 2022-12-21 | 2022-12-21 | 风险评估方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115953234A true CN115953234A (zh) | 2023-04-11 |
Family
ID=87287062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211651731.3A Pending CN115953234A (zh) | 2022-12-21 | 2022-12-21 | 风险评估方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115953234A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116957052A (zh) * | 2023-06-09 | 2023-10-27 | 清华大学 | 基于构造样本相似度的风险评估模型的训练方法 |
-
2022
- 2022-12-21 CN CN202211651731.3A patent/CN115953234A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116957052A (zh) * | 2023-06-09 | 2023-10-27 | 清华大学 | 基于构造样本相似度的风险评估模型的训练方法 |
CN116957052B (zh) * | 2023-06-09 | 2024-06-04 | 清华大学 | 基于构造样本相似度的风险评估模型的训练方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111340616B (zh) | 线上贷款的审批方法、装置、设备及介质 | |
CN110929799B (zh) | 用于检测异常用户的方法、电子设备和计算机可读介质 | |
CN113592535B (zh) | 一种广告推荐方法、装置、电子设备和存储介质 | |
CN112037007A (zh) | 针对小微企业信贷审批的方法及电子设备 | |
CN111738316B (zh) | 零样本学习的图像分类方法、装置及电子设备 | |
CN115953234A (zh) | 风险评估方法、装置、电子设备及存储介质 | |
US20230237787A1 (en) | Techniques for dynamic time-based custom model generation | |
CN114972113A (zh) | 图像处理方法、装置、电子设备及可读存储介质 | |
CN111582908A (zh) | 一种基于利率敏感度曲线的定价方法、装置及电子设备 | |
CN113919432A (zh) | 一种分类模型构建方法、数据分类方法及装置 | |
CN113554504A (zh) | 一种车贷风控模型生成方法、装置及评分卡生成方法 | |
CN116563007A (zh) | 授信信用风险预测方法、电子设备及可读存储介质 | |
CN111815435A (zh) | 一种群体风险特征的可视化方法、装置、设备及存储介质 | |
CN115187393A (zh) | 贷款风险检测方法、装置、电子设备及可读存储介质 | |
CN116468479A (zh) | 确定页面质量评估维度方法、页面质量的评估方法和装置 | |
CN113516398A (zh) | 基于分层抽样的风险设备识别方法、装置及电子设备 | |
CN112419025A (zh) | 用户数据处理方法和装置、存储介质、电子设备 | |
CN110619537A (zh) | 用于生成信息的方法和装置 | |
CN115470292B (zh) | 区块链共识方法、装置、电子设备及可读存储介质 | |
CN116823407B (zh) | 产品信息推送方法、装置、电子设备和计算机可读介质 | |
CN117745336A (zh) | 客户流失预测方法、装置、设备、存储介质及程序产品 | |
CN116503073A (zh) | 信用支付交易管理方法、装置、电子设备及可读存储介质 | |
CN117314433A (zh) | 银行网点的交易风险控制方法、装置、设备及存储介质 | |
CN117093933A (zh) | 模型构建方法、装置、存储介质及电子设备 | |
CN111833026A (zh) | 智能的数字化面试登记与面试风险预警方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |