CN109670940A - 基于机器学习的信用风险评估模型生成方法及相关设备 - Google Patents

基于机器学习的信用风险评估模型生成方法及相关设备 Download PDF

Info

Publication number
CN109670940A
CN109670940A CN201811342552.5A CN201811342552A CN109670940A CN 109670940 A CN109670940 A CN 109670940A CN 201811342552 A CN201811342552 A CN 201811342552A CN 109670940 A CN109670940 A CN 109670940A
Authority
CN
China
Prior art keywords
sample data
credit risk
default
loan
risk assessment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811342552.5A
Other languages
English (en)
Inventor
苏晓翠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OneConnect Smart Technology Co Ltd
Original Assignee
OneConnect Smart Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OneConnect Smart Technology Co Ltd filed Critical OneConnect Smart Technology Co Ltd
Priority to CN201811342552.5A priority Critical patent/CN109670940A/zh
Publication of CN109670940A publication Critical patent/CN109670940A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及机器学习领域,其公开了一种基于机器学习的信用风险评估模型生成方法及相关设备,所述方法包括:获取用户的贷款样本数据;统计所述贷款样本数据中存有的预设样本数据;在所述贷款样本数据中存有的预设样本数据数量达到预设阈值时,将所述贷款样本数据作为目标训练数据;将所述目标训练数据转换为损失函数,并将所述损失函数添加进预设信用风险评估模型进行训练,从而生成目标信用风险评估模型。本发明通过预设样本数据对贷款样本数据进行预先判断,将判断后的有效的贷款样本数据对预先建立的信用风险评估模型进行训练,从而生成目标信用风险评估模型,通过有效的样本数据对机器模型进行训练,从而缩短机器模型的迭代周期。

Description

基于机器学习的信用风险评估模型生成方法及相关设备
技术领域
本发明涉及机器模型技术领域,尤其涉及一种基于机器学习的信用风险评估模型生成方法及相关设备。
背景技术
机器学习是一种终端设备利用数据进行各种工作的方法,通过机器学习可对输入的数据进行分析,总结出数据中的规律并生成机器模型,从而实现对数据的分析和判断,但是,判断生成的机器模型是否精确需要通过较长时间的表现才能得到,从而加大机器学习模型的迭代周期。
发明内容
本发明的主要目的在于提出一种基于机器学习的信用风险评估模型生成方法及相关设备,旨在缩短机器模型的迭代周期。
为实现上述目的,本发明提供一种基于机器学习的信用风险评估模型生成方法,所述基于机器学习的信用风险评估模型生成方法包括以下步骤:
获取用户的贷款样本数据;
统计所述贷款样本数据中存有的预设样本数据;
在所述贷款样本数据中存有的预设样本数据数量达到预设阈值时,将所述贷款样本数据作为目标训练数据;
将所述目标训练数据转换为损失函数,并将所述损失函数添加进预设信用风险评估模型进行训练,从而生成目标信用风险评估模型。
优选地,所述预设样本数据包括逾期时间信息或迁移率信息。
优选地,所述统计所述贷款样本数据中存有的预设样本数据之前,所述方法还包括:
将所述贷款样本数据与预设样本数据进行比较,在所述贷款样本数据中存有所述预设样本数据时,通过第一预设公式计算所述预设样本数据占所述贷款样本数据的集中度信息,所述第一预设公式为:
其中,CR表示集中度信息,Xi表示所述预设样本数据,X表示所述贷款样本数据,S表示所述预设样本数据占所述贷款样本数据中的比例,i表示第i个贷款样本数据,n表示所述贷款样本数据的数量;
根据所述集中度信息统计所述贷款样本数据中存有的预设样本数据。
优选地,所述根据所述集中度信息统计所述贷款样本数据中存有的预设样本数据,包括:
获取预设样本数据占所述贷款样本数据的集中度信息,根据所述集中度信息将所述贷款样本数据由高到底的顺序进行排序,判断所述贷款样本数据中存有的预设样本数据的数量。
优选地,所述将所述目标训练数据转换为损失函数,并将所述损失函数添加进预设信用风险评估模型进行训练,从而生成目标信用风险评估模型,包括:
获取所述目标训练数据的信用风险实际值,并根据所述目标训练数据进行预测,获取所述目标训练数据的信用风险预测值,根据所述信用风险实际值和所述信用风险预测值将所述目标训练数据通过第二预设公式转换为损失函数,将所述损失函数添加进预设信用风险评估模型进行训练,从而生成所述目标信用风险评估模型。
优选地,所述第二预设公式为:
其中,J表示损失函数,w、b表示所述目标训练数据的线性关系,y表示所述目标训练数据的信用风险实际值,表示对所述目标训练数据的信用风险预测值,i表示第i个所述目标训练数据,m表示所述目标训练数据的数量。
优选地,所述将所述目标训练数据转换为损失函数,并将所述损失函数添加进预设信用风险评估模型进行训练,从而生成目标信用风险评估模型之前,所述方法还包括:
获取历史贷款样本数据,将所述历史贷款样本数据与预设信用风险数据进行比较,根据比较结果提取所述历史贷款样本数据中的预设信用风险数据,获取所述预设信用风险数据中的目标信用风险特征变量,将所述目标信用风险特征变量输入到预先建立的卷积神经网络中,获得所述预设信用风险评估模型。
此外,为实现上述目的,本发明还提出一种基于机器学习的信用风险评估模型生成装置,所述基于机器学习的信用风险评估模型生成装置包括:
获取模块,用于获取用户的贷款样本数据;
统计模块,用于统计所述贷款样本数据中存有的预设样本数据;
定义模块,用于在所述贷款样本数据中存有的预设样本数据数量达到预设阈值时,将所述贷款样本数据作为目标训练数据;
生成模块,用于将所述目标训练数据转换为损失函数,并将所述损失函数添加进预设信用风险评估模型进行训练,从而生成目标信用风险评估模型。
此外,为实现上述目的,本发明还提出一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于机器学习的信用风险评估模型生成程序,所述基于机器学习的信用风险评估模型生成程序配置为实现如上所述的基于机器学习的信用风险评估模型生成方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有基于机器学习的信用风险评估模型生成程序,所述基于机器学习的信用风险评估模型生成程序被处理器执行时实现如上文所述的基于机器学习的信用风险评估模型生成方法的步骤。
本发明提出的基于机器学习的信用风险评估模型生成方法,通过预设样本数据对贷款样本数据进行预先判断,将判断后的有效的贷款样本数据对预先建立的预设信用风险评估模型进行训练,从而生成目标信用风险评估模型,通过有效的样本数据对机器模型进行训练,从而缩短机器模型的迭代周期。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的终端设备结构示意图;
图2为本发明基于机器学习的信用风险评估模型生成方法第一实施例的流程示意图;
图3为本发明基于机器学习的信用风险评估模型生成方法第二实施例的流程示意图;
图4为本发明基于机器学习的信用风险评估模型生成方法第三实施例的流程示意图;
图5为本发明基于机器学习的信用风险评估模型生成装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的终端设备结构示意图。
如图1所示,该终端设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如按键,可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端设备结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作***、网络通信模块、用户接口模块以及基于机器学习的信用风险评估模型生成程序。
在图1所示的终端设备中,网络接口1004主要用于连接外网,与其他网络终端设备进行数据通信;用户接口1003主要用于连接用户终端设备,与终端设备进行数据通信;本发明终端设备通过处理器1001调用存储器1005中存储的基于机器学习的信用风险评估模型生成程序,并执行本发明实施例提供的基于机器学习的信用风险评估模型生成的实施方法。
基于上述硬件结构,提出本发明基于机器学习的信用风险评估模型生成方法实施例。
参照图2,图2为本发明基于机器学习的信用风险评估模型生成方法第一实施例的流程示意图。
在第一实施例中,所述基于机器学习的信用风险评估模型生成方法包括以下步骤:
步骤S10,获取用户的贷款样本数据。
需要说明的是,所述贷款样本数据可为通过金融数据平台导入用户的贷款样本数据,还可为通过其他方式获取用户的贷款样本数据,本实施例对此不作限制,在本实施例中,以导入的贷款样本数据为例进行说明。
在本实施例中,所述贷款样本数据包括用户个人信息,贷款额度信息,贷款时间信息,已还贷款时间信息,还可包括其他贷款信息,本实施例对此不作限制。
可以理解的是,在本实施例中,执行主体为终端设备,例如服务器等。
步骤S20,统计所述贷款样本数据中存有的预设样本数据。
需要说明的是,所述预设样本数据包括逾期时间信息或迁移率信息,通过逾期时间信息可对用户的欺诈行为进行判断,通过迁移率信息可作为进行催收的判断标准,从而可扩展在反欺诈领域以及催收领域进行分析判断,提高机器模型的灵活性。
可以理解的是,逾期时间为到了还款期限而没有还款,则表示该用户进入了逾期,根据逾期天数,又分为M0-M7+等八个阶段,没有逾期的是M0,逾期1~29天的是为M1,逾期30~59的定义为M2,以此类推,逾期超过180天的定义为M7+,将处于某一逾期阶段的客户转到其他逾期阶段的变化情况为迁移率,通过迁移率通常可以用来预测不同逾期阶段的未来坏账损失。比如,M2-M3,表示从逾期阶段M2转到逾期阶段M3的比例,从而针对催收应用上实现对样本数据的预判。
在本实施例中,将所述贷款样本数据与有效的的参考数据,即逾期时间信息或迁移率信息,判断所述贷款样本数据是否包含所述参考数据,在所述贷款数据中未存有所述参考数据,则说明所述贷款样本数据中未存有有效的训练数据,在这种情况下,无需将所述贷款样本数据对预设信用风险评估模型进行训练,避免增大迭代时间,并且对预设信用风险评估模型也并没有提高,反而增大预设信用风险评估模型的噪声。
需要说明的是,由于所述预设样本数据包括逾期时间信息或迁移率信息,因此,对于在线学习的应用场景,不局限于传统意义上的信用风险模型和预测模型,可拓展到反欺诈、催收领域。
在具体实现中,对实时的申请反欺诈行为,由于传统模型需要一段时间贷后表现才能精确确定是否为欺诈,线上在线学习模型通过对短时间内相似可疑行为模式的集中度判断,从而可根据集中度判断出所述贷款样本数据是否含有异常数据信息,实现提前对贷款样本数据的预判,从而提高对样本数据判断的准确性。
步骤S30,在所述贷款样本数据中存有的预设样本数据数量达到预设阈值时,将所述贷款样本数据作为目标训练数据。
需要说明的是,所述预设阈值可为预设样本数据占所述贷款样本数据中的比例阈值,例如可设为70%,还可设为其他阈值参数,本实施例对此不作限制,在本实施例中,以70%为了进行说明。
在本实施例中,可通过判断预设样本数据在所述贷款样本***的集中度,例如所述集中度超过70%,表明所述贷款样本数据中含有有效的异常数据,可将所述贷款样本数据对所述预设信用风险评估模型进行训练,在所述集中度为50%,未超过所述预设阈值,则表明所述贷款样本数据中基本为无效的异常数据,则不将所述贷款样本数据对所述预设信用风险评估模型进行训练,从而缩短所述预设信用风险评估模型的迭代时间。
步骤S40,将所述目标训练数据转换为损失函数,并将所述损失函数添加进预设信用风险评估模型进行训练,从而生成目标信用风险评估模型。
需要说明的是,所述信用风险评估模型可为预先建立的机器学习模型,在对所述预设信用风险评估模型进行训练时,可通过预先选取的有效训练数据对所述预先建立的机器学习模型进行自动化优化,从而缩短所述信用风险评估模型的迭代时间。
本实施例通过上述方案,通过预设样本数据对贷款样本数据进行预先判断,将判断后的有效的贷款样本数据对预先建立的信用风险评估模型进行训练,从而生成目标信用风险评估模型,通过有效的样本数据对机器模型进行训练,从而缩短机器模型的迭代周期。
进一步地,如图3所示,基于第一实施例提出本发明基于机器学习的信用风险评估模型生成方法第二实施例,在本实施例中,所述步骤S20之前,所述方法还包括:
步骤S201,将所述贷款样本数据与预设样本数据进行比较,在所述贷款样本数据中存有所述预设样本数据时,通过第一预设公式计算所述预设样本数据占所述贷款样本数据的集中度信息。
需要说明的是,在本实施例中,对所述预设样本数据进行统计可进行数量的统计,还可进行集中度判断,在进行数量统计时,可统计所述贷款样本数据中的预设样本数据的数量,将所述数量与预设数量进行比较,从而判断出贷款样本数据中是否含有更多有效的预设样本数据。
步骤S202,根据所述集中度信息统计所述贷款样本数据中存有的预设样本数据。
在本实施例中,还可在短时间内进行集中度判断,具体为,获取预设样本数据,提取预设样本数据中权重较大的参考信息,判断所述参考信息在贷款样本数据信息中的比例,比例越大,说明贷款样本数据中是否含有更多有效的预设样本数据,例如所述预设样本数据中的逾期时间是反映欺诈行为一个重要指标,提取贷款样本数据中的逾期时间,当逾期时间占贷款时间的50%以上时,表明当前的贷款样本数据为具有欺诈行为的样本数据。
在具体实现中,通过所述第一预设公式计算出所述预设样本数据占所述贷款样本数据的集中度,所述第一预设公式为:
其中,CR表示集中度信息,Xi表示所述预设样本数据,X表示所述贷款样本数据,S表示所述预设样本数据占所述贷款样本数据中的比例,i表示第i个贷款样本数据,n表示所述贷款样本数据的数量。
进一步地,所述步骤S202,包括:
步骤S203,获取预设样本数据占所述贷款样本数据的集中度信息,根据所述集中度信息将所述贷款样本数据由高到底的顺序进行排序,判断所述贷款样本数据中存有的预设样本数据的数量。
在本实施例中,根据所述集中度信息将所述贷款样本数据由高到底的顺序进行排序,从而可根据集中度信息将所述贷款样本数据进行统计,从所述贷款样本数据中选取更符合业务需求的样本数据,从而提高对建立模型的准确性。
本实施例提供的方案,通过计算所述预设样本数据占所述贷款样本数据的集中度信息,通过所述集中度信息判断所述贷款样本数据中是否含有有效的预设样本数据,从而提高对贷款样本数据判断的正确性。
进一步地,如图4所示,基于第一实施例或第二实施例提出本发明基于机器学习的信用风险评估模型生成方法第三实施例,在本实施例中,基于第一实施例进行说明,所述步骤S40,包括:
步骤S401,获取所述目标训练数据的信用风险实际值,并根据所述目标训练数据进行预测,获取所述目标训练数据的信用风险预测值,根据所述信用风险实际值和所述信用风险预测值将所述目标训练数据通过第二预设公式转换为损失函数,将所述损失函数添加进预设信用风险评估模型进行训练,从而生成所述目标信用风险评估模型。
在本实施例中,通过所述损失函数将有效的的信用风险数据放入所述预设信用风险评估模型进行训练,从而提高所述预设信用风险评估模型对数据预测的正确性,并通过更多有效的信用风险数据对所述预设信用风险评估模型进行训练,从而缩短所述预设信用风险评估模型的迭代周期。
需要说明的是,通过所述第二预设公式将有效的信用风险数据转换为损失函数,所述第二预设公式为:
其中,J表示损失函数,w、b表示所述目标训练数据的线性关系,y表示所述目标训练数据的信用风险实际值,表示对所述目标训练数据的信用风险预测值,i表示第i个所述目标训练数据,m表示所述目标训练数据的数量。
需要说明的是,在本实施例中,还可在损失函数中加入对客户放款额度指标,使得所述预设信用风险评估模型给出相应的建议审批额度,从而提高所述预设信用风险评估模型的灵活性,还可实现不同信用风险评分段对应的坏客户比例保持不变,风控政策不需要频繁调整规则切分点。
进一步地,所述步骤S40之前,所述方法还包括:
步骤S402,获取历史贷款样本数据,将所述历史贷款样本数据与预设信用风险数据进行比较,根据比较结果提取所述历史贷款样本数据中的预设信用风险数据,获取所述预设信用风险数据中的目标信用风险特征变量,将所述目标信用风险特征变量输入到预先建立的卷积神经网络中,获得所述预设信用风险评估模型。
需要说明的是,在本实施例中,所述预设信用风险评估模型为基于卷积神经网络建立的,通过历史贷款样本数据,例如包括用户的逾期时间等,提取所述历史贷款样本数据中的预设信用风险数据,将所述预设信用风险数据,根据逾期时间或者迁移率信息生成预设维度的信用风险评估模型,其中,所述预设维度为多维度,例如从时间维度,或者迁移率维度,并将生成的预设信用风险数据放入卷积神经网络进行训练,根据训练结果生成所述预设信用风险评估模型,从而实现信用风险评估模型的建立。
本实施例提供的方案,将用户的历史贷款样本数据生成预设维度的预设信用风险数据放入卷积神经网络进行训练,从而实现预设信用风险评估模型的建立。
本发明进一步提供一种基于机器学习的信用风险评估模型生成装置。
参照图5,图5为本发明基于机器学习的信用风险评估模型生成装置第一实施例的功能模块示意图。
本发明基于机器学习的信用风险评估模型生成装置第一实施例中,该基于机器学习的信用风险评估模型生成装置包括:
获取模块10,用于获取用户的贷款样本数据。
需要说明的是,所述贷款样本数据可为通过金融数据平台导入用户的贷款样本数据,还可为通过其他方式获取用户的贷款样本数据,本实施例对此不作限制,在本实施例中,以导入的贷款样本数据为例进行说明。
在本实施例中,所述贷款样本数据包括用户个人信息,贷款额度信息,贷款时间信息,已还贷款时间信息,还可包括其他贷款信息,本实施例对此不作限制。
可以理解的是,在本实施例中,执行主体为终端设备,例如服务器等。
统计模块20,用于统计所述贷款样本数据中存有的预设样本数据。
需要说明的是,所述预设样本数据包括逾期时间信息或迁移率信息,通过逾期时间信息可对用户的欺诈行为进行判断,通过迁移率信息可作为进行催收的判断标准,从而可扩展在反欺诈领域以及催收领域进行分析判断,提高机器模型的灵活性。
可以理解的是,逾期时间为到了还款期限而没有还款,则表示该用户进入了逾期,根据逾期天数,又分为M0-M7+等八个阶段,没有逾期的是M0,逾期1~29天的是为M1,逾期30~59的定义为M2,以此类推,逾期超过180天的定义为M7+,将处于某一逾期阶段的客户转到其他逾期阶段的变化情况为迁移率,通过迁移率通常可以用来预测不同逾期阶段的未来坏账损失。比如,M2-M3,表示从逾期阶段M2转到逾期阶段M3的比例,从而针对催收应用上实现对样本数据的预判。
在本实施例中,将所述贷款样本数据与有效的的参考数据,即逾期时间信息或迁移率信息,判断所述贷款样本数据是否包含所述参考数据,在所述贷款数据中未存有所述参考数据,则说明所述贷款样本数据中未存有有效的训练数据,在这种情况下,无需将所述贷款样本数据对预设预设信用风险评估模型进行训练,避免增大迭代时间,并且对预设信用风险评估模型也并没有提高,反而增大预设信用风险评估模型的噪声。
需要说明的是,由于所述预设样本数据包括逾期时间信息或迁移率信息,因此,对于在线学习的应用场景,不局限于传统意义上的信用风险模型和预测模型,可拓展到反欺诈、催收领域。
在具体实现中,对实时的申请反欺诈行为,由于传统模型需要一段时间贷后表现才能精确确定是否为欺诈,线上在线学习模型通过对短时间内相似可疑行为模式的集中度判断,从而可根据集中度判断出所述贷款样本数据是否含有异常数据信息,实现提前对贷款样本数据的预判,从而提高对样本数据判断的准确性。
定义模块30,用于在所述贷款样本数据中存有的预设样本数据数量达到预设阈值时,将所述贷款样本数据作为目标训练数据。
需要说明的是,所述预设阈值可为预设样本数据占所述贷款样本数据中的比例阈值,例如可设为70%,还可设为其他阈值参数,本实施例对此不作限制,在本实施例中,以70%为了进行说明。
在本实施例中,可通过判断预设样本数据在所述贷款样本***的集中度,例如所述集中度超过70%,表明所述贷款样本数据中含有有效的异常数据,可将所述贷款样本数据对所述预设信用风险评估模型进行训练,在所述集中度为50%,未超过所述预设阈值,则表明所述贷款样本数据中基本为无效的异常数据,则不将所述贷款样本数据对所述预设信用风险评估模型进行训练,从而缩短所述预设信用风险评估模型的迭代时间。
生成模块40,用于将所述目标训练数据转换为损失函数,并将所述损失函数添加进预设信用风险评估模型进行训练,从而生成目标信用风险评估模型。
需要说明的是,所述信用风险评估模型可为预先建立的机器学习模型,在对所述预设信用风险评估模型进行训练时,可通过预先选取的有效训练数据对所述预先建立的机器学习模型进行自动化优化,从而缩短所述信用风险评估模型的迭代时间。
本实施例通过上述方案,通过预设样本数据对贷款样本数据进行预先判断,将判断后的有效的贷款样本数据对预先建立的信用风险评估模型进行训练,从而生成目标信用风险评估模型,通过有效的样本数据对机器模型进行训练,从而缩短机器模型的迭代周期。
此外,为实现上述目的,本发明还提出一种终端设备,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于机器学习的信用风险评估模型生成程序,所述基于机器学习的信用风险评估模型生成程序配置为实现如上文所述的基于机器学习的信用风险评估模型生成方法的步骤。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于机器学习的信用风险评估模型生成程序,所述基于机器学习的信用风险评估模型生成程序被处理器执行如上文所述的基于机器学习的信用风险评估模型生成方法的步骤。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个计算机可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台智能终端设备(可以是手机,计算机,终端设备,空调器,或者网络终端设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于机器学习的信用风险评估模型生成方法,其特征在于,所述基于机器学习的信用风险评估模型生成方法包括:
获取用户的贷款样本数据;
统计所述贷款样本数据中存有的预设样本数据;
在所述贷款样本数据中存有的预设样本数据数量达到预设阈值时,将所述贷款样本数据作为目标训练数据;
将所述目标训练数据转换为损失函数,并将所述损失函数添加进预设信用风险评估模型进行训练,从而生成目标信用风险评估模型。
2.如权利要求1所述的基于机器学习的信用风险评估模型生成方法,其特征在于,所述预设样本数据包括逾期时间信息或迁移率信息。
3.如权利要求1所述的基于机器学习的信用风险评估模型生成方法,其特征在于,所述统计所述贷款样本数据中存有的预设样本数据之前,所述方法还包括:
将所述贷款样本数据与预设样本数据进行比较,在所述贷款样本数据中存有所述预设样本数据时,通过第一预设公式计算所述预设样本数据占所述贷款样本数据的集中度信息,所述第一预设公式为:
其中,CR表示集中度信息,Xi表示所述预设样本数据,X表示所述贷款样本数据,S表示所述预设样本数据占所述贷款样本数据中的比例,i表示第i个贷款样本数据,n表示所述贷款样本数据的数量;
根据所述集中度信息统计所述贷款样本数据中存有的预设样本数据。
4.如权利要求3所述的基于机器学习的信用风险评估模型生成方法,其特征在于,所述根据所述集中度信息统计所述贷款样本数据中存有的预设样本数据,包括:
获取预设样本数据占所述贷款样本数据的集中度信息,根据所述集中度信息将所述贷款样本数据由高到底的顺序进行排序,判断所述贷款样本数据中存有的预设样本数据的数量。
5.如权利要求1至4中任一项所述的基于机器学习的信用风险评估模型生成方法,其特征在于,所述将所述目标训练数据转换为损失函数,并将所述损失函数添加进预设信用风险评估模型进行训练,从而生成目标信用风险评估模型,包括:
获取所述目标训练数据的信用风险实际值,并根据所述目标训练数据进行预测,获取所述目标训练数据的信用风险预测值,根据所述信用风险实际值和所述信用风险预测值将所述目标训练数据通过第二预设公式转换为损失函数,将所述损失函数添加进预设信用风险评估模型进行训练,从而生成所述目标信用风险评估模型。
6.如权利要求5所述的基于机器学习的信用风险评估模型生成方法,其特征在于,所述第二预设公式为:
其中,J表示损失函数,w、b表示所述目标训练数据的线性关系,y表示所述目标训练数据的信用风险实际值,表示对所述目标训练数据的信用风险预测值,i表示第i个所述目标训练数据,m表示所述目标训练数据的数量。
7.如权利要求1至4中任一项所述的基于机器学习的信用风险评估模型生成方法,其特征在于,所述将所述目标训练数据转换为损失函数,并将所述损失函数添加进预设信用风险评估模型进行训练,从而生成目标信用风险评估模型之前,所述方法还包括:
获取历史贷款样本数据,将所述历史贷款样本数据与预设信用风险数据进行比较,根据比较结果提取所述历史贷款样本数据中的预设信用风险数据,获取所述预设信用风险数据中的目标信用风险特征变量,将所述目标信用风险特征变量输入到预先建立的卷积神经网络中,获得所述预设信用风险评估模型。
8.一种基于机器学习的信用风险评估模型生成装置,其特征在于,所述基于机器学习的信用风险评估模型生成装置包括:
获取模块,用于获取用户的贷款样本数据;
统计模块,用于统计所述贷款样本数据中存有的预设样本数据;
定义模块,用于在所述贷款样本数据中存有的预设样本数据数量达到预设阈值时,将所述贷款样本数据作为目标训练数据;
生成模块,用于将所述目标训练数据转换为损失函数,并将所述损失函数添加进预设信用风险评估模型进行训练,从而生成目标信用风险评估模型。
9.一种终端设备,其特征在于,所述终端设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于机器学习的信用风险评估模型生成程序,所述基于机器学习的信用风险评估模型生成程序配置为实现如权利要求1至7中任一项所述的基于机器学习的信用风险评估模型生成方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有基于机器学习的信用风险评估模型生成程序,所述基于机器学习的信用风险评估模型生成程序被处理器执行时实现如权利要求1至7中任一项所述的基于机器学习的信用风险评估模型生成方法的步骤。
CN201811342552.5A 2018-11-12 2018-11-12 基于机器学习的信用风险评估模型生成方法及相关设备 Pending CN109670940A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811342552.5A CN109670940A (zh) 2018-11-12 2018-11-12 基于机器学习的信用风险评估模型生成方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811342552.5A CN109670940A (zh) 2018-11-12 2018-11-12 基于机器学习的信用风险评估模型生成方法及相关设备

Publications (1)

Publication Number Publication Date
CN109670940A true CN109670940A (zh) 2019-04-23

Family

ID=66141748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811342552.5A Pending CN109670940A (zh) 2018-11-12 2018-11-12 基于机器学习的信用风险评估模型生成方法及相关设备

Country Status (1)

Country Link
CN (1) CN109670940A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110264093A (zh) * 2019-06-21 2019-09-20 深圳前海微众银行股份有限公司 信用模型的建立方法、装置、设备及可读存储介质
CN110322342A (zh) * 2019-06-27 2019-10-11 上海上湖信息技术有限公司 借贷风险预测模型的构建方法、***及借贷风险预测方法
CN110348991A (zh) * 2019-06-21 2019-10-18 上海淇馥信息技术有限公司 评估用户授信额度上限的方法、装置和电子设备
CN110782338A (zh) * 2019-10-15 2020-02-11 卓尔智联(武汉)研究院有限公司 借贷业务风险预测方法、装置、计算机设备和存储介质
CN111062444A (zh) * 2019-12-21 2020-04-24 湖南大学 信用风险预测方法、***、终端及存储介质
CN111160638A (zh) * 2019-12-20 2020-05-15 深圳前海微众银行股份有限公司 一种转化预估方法及装置
CN111260186A (zh) * 2020-01-08 2020-06-09 缤刻普达(北京)科技有限责任公司 一种运动能力评估方法、***和体脂秤、移动终端
CN111369006A (zh) * 2020-02-28 2020-07-03 上海蓝书信息科技有限公司 召回模型的生成方法及装置
CN111695989A (zh) * 2020-06-18 2020-09-22 新分享科技服务(深圳)有限公司 一种风控信贷模型的建模方法和平台
CN111695084A (zh) * 2020-04-26 2020-09-22 北京奇艺世纪科技有限公司 模型生成方法、信用评分生成方法、装置、设备及存储介质
CN112017060A (zh) * 2020-07-15 2020-12-01 北京淇瑀信息科技有限公司 为目标用户进行资源分配的方法、装置及电子设备
CN112396310A (zh) * 2020-11-12 2021-02-23 上海京滴信用管理有限公司 一种基于机器学习的社会信用风险评估***
CN112435035A (zh) * 2019-08-09 2021-03-02 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备
CN112734568A (zh) * 2021-01-29 2021-04-30 深圳前海微众银行股份有限公司 信用评分卡模型构建方法、装置、设备及可读存储介质
CN112862472A (zh) * 2021-03-15 2021-05-28 深圳市心版图科技有限公司 基于商显产业链的贷款支付***及贷款支付判断方法
CN113240509A (zh) * 2021-05-18 2021-08-10 重庆邮电大学 一种基于多源数据联邦学习的贷款风险评估方法
CN113610625A (zh) * 2021-07-23 2021-11-05 上海淇玥信息技术有限公司 逾期风险警示方法、装置及电子设备
CN116452320A (zh) * 2023-04-12 2023-07-18 西南财经大学 一种基于持续学习的信用风险预测方法

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447385A (zh) * 2016-08-31 2017-02-22 无锡雅座在线科技发展有限公司 数据处理方法和装置
CN106651574A (zh) * 2016-12-30 2017-05-10 苏州大学 一种个人信用评估方法及装置
CN106779755A (zh) * 2016-12-31 2017-05-31 湖南文沥征信数据服务有限公司 一种网络电商借贷风险评估方法及模型
CN107153977A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 网上交易平台中交易实体信用评估方法、装置及***
CN107517251A (zh) * 2017-08-16 2017-12-26 北京小度信息科技有限公司 信息推送方法和装置
CN107798390A (zh) * 2017-11-22 2018-03-13 阿里巴巴集团控股有限公司 一种机器学习模型的训练方法、装置以及电子设备
CN107886425A (zh) * 2017-10-25 2018-04-06 上海壹账通金融科技有限公司 信贷评估方法、装置、设备及计算机可读存储介质
CN107909178A (zh) * 2017-08-31 2018-04-13 上海壹账通金融科技有限公司 电子装置、失联修复率预测方法和计算机可读存储介质
CN108154430A (zh) * 2017-12-28 2018-06-12 上海氪信信息技术有限公司 一种基于机器学习和大数据技术的信用评分构建方法
CN108510194A (zh) * 2018-03-30 2018-09-07 平安科技(深圳)有限公司 风控模型训练方法、风险识别方法、装置、设备及介质
CN108564286A (zh) * 2018-04-19 2018-09-21 天合泽泰(厦门)征信服务有限公司 一种基于大数据征信的人工智能金融风控授信评定方法和***
CN108648072A (zh) * 2018-05-18 2018-10-12 深圳灰猫科技有限公司 基于用户信用动态评分的互联网金融放贷风险评估***

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107153977A (zh) * 2016-03-02 2017-09-12 阿里巴巴集团控股有限公司 网上交易平台中交易实体信用评估方法、装置及***
CN106447385A (zh) * 2016-08-31 2017-02-22 无锡雅座在线科技发展有限公司 数据处理方法和装置
CN106651574A (zh) * 2016-12-30 2017-05-10 苏州大学 一种个人信用评估方法及装置
CN106779755A (zh) * 2016-12-31 2017-05-31 湖南文沥征信数据服务有限公司 一种网络电商借贷风险评估方法及模型
CN107517251A (zh) * 2017-08-16 2017-12-26 北京小度信息科技有限公司 信息推送方法和装置
CN107909178A (zh) * 2017-08-31 2018-04-13 上海壹账通金融科技有限公司 电子装置、失联修复率预测方法和计算机可读存储介质
CN107886425A (zh) * 2017-10-25 2018-04-06 上海壹账通金融科技有限公司 信贷评估方法、装置、设备及计算机可读存储介质
CN107798390A (zh) * 2017-11-22 2018-03-13 阿里巴巴集团控股有限公司 一种机器学习模型的训练方法、装置以及电子设备
CN108154430A (zh) * 2017-12-28 2018-06-12 上海氪信信息技术有限公司 一种基于机器学习和大数据技术的信用评分构建方法
CN108510194A (zh) * 2018-03-30 2018-09-07 平安科技(深圳)有限公司 风控模型训练方法、风险识别方法、装置、设备及介质
CN108564286A (zh) * 2018-04-19 2018-09-21 天合泽泰(厦门)征信服务有限公司 一种基于大数据征信的人工智能金融风控授信评定方法和***
CN108648072A (zh) * 2018-05-18 2018-10-12 深圳灰猫科技有限公司 基于用户信用动态评分的互联网金融放贷风险评估***

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110264093A (zh) * 2019-06-21 2019-09-20 深圳前海微众银行股份有限公司 信用模型的建立方法、装置、设备及可读存储介质
CN110348991A (zh) * 2019-06-21 2019-10-18 上海淇馥信息技术有限公司 评估用户授信额度上限的方法、装置和电子设备
CN110322342A (zh) * 2019-06-27 2019-10-11 上海上湖信息技术有限公司 借贷风险预测模型的构建方法、***及借贷风险预测方法
CN110322342B (zh) * 2019-06-27 2022-05-06 上海上湖信息技术有限公司 借贷风险预测模型的构建方法、***及借贷风险预测方法
CN112435035A (zh) * 2019-08-09 2021-03-02 阿里巴巴集团控股有限公司 数据的审核方法、装置及设备
CN110782338A (zh) * 2019-10-15 2020-02-11 卓尔智联(武汉)研究院有限公司 借贷业务风险预测方法、装置、计算机设备和存储介质
CN110782338B (zh) * 2019-10-15 2023-03-31 卓尔智联(武汉)研究院有限公司 借贷业务风险预测方法、装置、计算机设备和存储介质
CN111160638A (zh) * 2019-12-20 2020-05-15 深圳前海微众银行股份有限公司 一种转化预估方法及装置
CN111160638B (zh) * 2019-12-20 2022-09-02 深圳前海微众银行股份有限公司 一种转化预估方法及装置
CN111062444B (zh) * 2019-12-21 2023-12-08 湖南大学 信用风险预测方法、***、终端及存储介质
CN111062444A (zh) * 2019-12-21 2020-04-24 湖南大学 信用风险预测方法、***、终端及存储介质
CN111260186A (zh) * 2020-01-08 2020-06-09 缤刻普达(北京)科技有限责任公司 一种运动能力评估方法、***和体脂秤、移动终端
CN111260186B (zh) * 2020-01-08 2023-09-26 有品国际科技(深圳)有限责任公司 一种运动能力评估方法、***和体脂秤、移动终端
CN111369006B (zh) * 2020-02-28 2023-07-04 上海蓝书信息科技有限公司 召回模型的生成方法及装置
CN111369006A (zh) * 2020-02-28 2020-07-03 上海蓝书信息科技有限公司 召回模型的生成方法及装置
CN111695084A (zh) * 2020-04-26 2020-09-22 北京奇艺世纪科技有限公司 模型生成方法、信用评分生成方法、装置、设备及存储介质
CN111695989A (zh) * 2020-06-18 2020-09-22 新分享科技服务(深圳)有限公司 一种风控信贷模型的建模方法和平台
CN112017060A (zh) * 2020-07-15 2020-12-01 北京淇瑀信息科技有限公司 为目标用户进行资源分配的方法、装置及电子设备
CN112017060B (zh) * 2020-07-15 2024-04-26 北京淇瑀信息科技有限公司 为目标用户进行资源分配的方法、装置及电子设备
CN112396310A (zh) * 2020-11-12 2021-02-23 上海京滴信用管理有限公司 一种基于机器学习的社会信用风险评估***
CN112396310B (zh) * 2020-11-12 2024-05-28 上海京滴信用管理有限公司 一种基于机器学习的社会信用风险评估***
CN112734568A (zh) * 2021-01-29 2021-04-30 深圳前海微众银行股份有限公司 信用评分卡模型构建方法、装置、设备及可读存储介质
CN112734568B (zh) * 2021-01-29 2024-01-12 深圳前海微众银行股份有限公司 信用评分卡模型构建方法、装置、设备及可读存储介质
CN112862472A (zh) * 2021-03-15 2021-05-28 深圳市心版图科技有限公司 基于商显产业链的贷款支付***及贷款支付判断方法
CN113240509B (zh) * 2021-05-18 2022-04-22 重庆邮电大学 一种基于多源数据联邦学习的贷款风险评估方法
CN113240509A (zh) * 2021-05-18 2021-08-10 重庆邮电大学 一种基于多源数据联邦学习的贷款风险评估方法
CN113610625A (zh) * 2021-07-23 2021-11-05 上海淇玥信息技术有限公司 逾期风险警示方法、装置及电子设备
CN116452320A (zh) * 2023-04-12 2023-07-18 西南财经大学 一种基于持续学习的信用风险预测方法
CN116452320B (zh) * 2023-04-12 2024-04-30 西南财经大学 一种基于持续学习的信用风险预测方法

Similar Documents

Publication Publication Date Title
CN109670940A (zh) 基于机器学习的信用风险评估模型生成方法及相关设备
CN110246029A (zh) 贷后风险管理方法、终端、装置及可读存储介质
CN110246031A (zh) 企业信用的评估方法、***、设备及存储介质
CN109242135B (zh) 一种模型运营方法、装置、及业务服务器
CN110992169A (zh) 一种风险评估方法、装置、服务器及存储介质
CN108520460A (zh) 业务数据测算处理方法、装置、计算机设备和存储介质
CN108960505A (zh) 个人金融信用的量化评估方法、装置、***及存储介质
CN103607309B (zh) 一种业务kqi与qoe的映射方法
CN107426759A (zh) 新增基站数据业务量的预测方法和***
CN111078880B (zh) 子应用的风险识别方法以及装置
CN110009417A (zh) 目标客户筛选方法、装置、设备及计算机可读存储介质
CN107798615A (zh) 保单续期收费难度预测方法和装置
CN108648091A (zh) 保单风险评估方法、装置、设备和计算机存储介质
CN103617146B (zh) 一种基于硬件资源消耗的机器学习方法及装置
CN107992978A (zh) 一种网贷平台的风险预警方法及相关装置
CN109345371A (zh) 个人征信报告回溯方法及***
CN109409502A (zh) 反欺诈模型的生成方法、装置、设备及存储介质
CN115203496A (zh) 基于大数据的项目智能预测及评估方法、***及可读存储介质
CN106776757A (zh) 用户完成网银操作的指示方法及装置
CN110516713A (zh) 一种目标群体识别方法、装置及设备
CN109308660B (zh) 一种征信评分模型评估方法、装置、设备及存储介质
CN110610415B (zh) 一种模型更新的方法和装置
CN116539006B (zh) 径流预测方法、装置、计算机设备和存储介质
CN109727116A (zh) 信贷分析方法、装置、设备及计算机可读存储介质
CN117388951A (zh) 梅雨预测方法、装置和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40002545

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination