CN108648074B - 基于支持向量机的贷款评估方法、装置及设备 - Google Patents
基于支持向量机的贷款评估方法、装置及设备 Download PDFInfo
- Publication number
- CN108648074B CN108648074B CN201810485676.2A CN201810485676A CN108648074B CN 108648074 B CN108648074 B CN 108648074B CN 201810485676 A CN201810485676 A CN 201810485676A CN 108648074 B CN108648074 B CN 108648074B
- Authority
- CN
- China
- Prior art keywords
- loan
- data
- user
- training
- credit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本申请公开了一种基于支持向量机的贷款评估方法、装置及设备,涉及数据处理技术领域,可以提高贷款评估效率和精确性,并且贷款审核通过率较高。其中方法包括:预先收集不同用户的用户数据,其中所述用户数据包含不同用户的用户属性数据、历史信用数据、用户投资数据;对所述用户数据进行处理,得到符合信用评分模型训练标准的训练数据;基于所述训练数据,利用支持向量机算法进行训练得到信用评分模型;当接收到贷款用户的贷款请求时,利用所述信用评分模型,分析得到所述贷款用户的信用评分和可贷款额度。本申请适用于贷款评估。
Description
技术领域
本申请涉及数据处理技术领域,尤其是涉及到一种基于支持向量机的贷款评估方法、装置及设备。
背景技术
信用记录指信用评级机构依托来自某一渠道或社会各方、能够判断经济主体信用状况的信息,按一定标准和指标进行评价之后,用一定符号或文字表示的关于经济主体信用的说明。
目前,在各金融机构评估个人信用记录进行贷款评估时,主要是依靠信贷员的个人经验进行判断。然而,这样不仅效率低下,而且由于人的不可控因素较多,会影响贷款评估的精确性,进而制约了金融机构的发展。同时由于信贷员贷款审核往往比较谨慎,会导致贷款审核通过率过低,无法满足广大用户的贷款需求,从而不能给贷款用户带来较好的体验。
发明内容
有鉴于此,本申请提供了一种基于支持向量机的贷款评估方法、装置及设备,主要目的在于解决目前现有主要依靠信贷员的个人经验评估个人信用记录进行贷款评估,不仅效率低下,而且由于人的不可控因素较多,会影响贷款评估的精确性,并且会导致贷款审核通过率过低的问题。
根据本申请的一个方面,提供了一种基于支持向量机的贷款评估方法,该方法包括:
预先收集不同用户的用户数据,其中所述用户数据包含不同用户的用户属性数据、历史信用数据、用户投资数据;
对所述用户数据进行处理,得到符合信用评分模型训练标准的训练数据;
基于所述训练数据,利用支持向量机算法进行训练得到信用评分模型;
当接收到贷款用户的贷款请求时,利用所述信用评分模型,分析得到所述贷款用户的信用评分和可贷款额度。
根据本申请的另一方面,提供了一种基于支持向量机的贷款评估装置,该装置包括:
收集单元,用于预先收集不同用户的用户数据,其中所述用户数据包含不同用户的用户属性数据、历史信用数据、用户投资数据;
处理单元,用于对所述收集单元收集到的用户数据进行处理,得到符合信用评分模型训练标准的训练数据;
训练单元,用于基于所述处理单元得到的训练数据,利用支持向量机算法进行训练得到信用评分模型;
分析单元,用于当接收到贷款用户的贷款请求时,利用所述训练单元得到的信用评分模型,分析得到所述贷款用户的信用评分和可贷款额度。
依据本申请又一个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述基于支持向量机的贷款评估方法。
依据本申请再一个方面,提供了一种基于支持向量机的贷款评估的实体设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于支持向量机的贷款评估方法。
借由上述技术方案,本申请提供的一种基于支持向量机的贷款评估方法、装置及设备,与目前主要依靠信贷员的个人经验评估个人信用记录进行贷款评估的方式相比,本申请根据预先收集的不同用户数据进行处理得到训练数据,然后基于该训练数据利用支持向量机算法进行训练得到信用评分模型,在接收到贷款用户的贷款请求时,可以利用该信用评分模型自动分析得到贷款用户的信用评分和可贷款额度,无需人工靠经验进行贷款评估,可以提高贷款评估效率和精确性,并且贷款审核通过率较高,可以满足广大用户的贷款需求,能够给贷款用户带来较好的使用体验,有利于金融机构的发展。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1示出了本申请实施例提供的一种基于支持向量机的贷款评估方法的流程示意图;
图2示出了本申请实施例提供的一种基于支持向量机的贷款评估方法实施的整体架构示意图;
图3示出了本申请实施例提供的一种基于支持向量机的贷款评估装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
针对现有主要依靠信贷员的个人经验评估个人信用记录进行贷款评估,不仅效率低下,而且由于人的不可控因素较多,会影响贷款评估的精确性,并且会导致贷款审核通过率过低的问题,本申请实施例提供了一种基于支持向量机的贷款评估方法,可以提高贷款评估效率和精确性,并且贷款审核通过率较高,如图1所示,该方法包括:
101、预先收集不同用户的用户数据。
其中,用户数据包含不同用户的用户属性数据、历史信用数据、用户投资数据。用户属性数据可以包括用户的姓名、性别、年龄、职业、月平均收入和消费水平、名下财产、居住地、户口所在地、籍贯等;历史信用数据可以包括用户的历史信用评分、***历史消费和还款记录、历史信贷还款情况、骗保记录等;用户投资数据可以包括用户理财记录、投资项目、投资额及其回报情况等。
在本实施例中,可以通过查询金融机构、保险公司、银行、购物网站等存在的用户记录、或通过第三方平台、用户网上调查问卷等方式收集不同用户的用户数据。对于本实施例的执行主体可以为贷款评估的装置或设备,可以配置在贷款评估方侧,用于基于收集到的用户数据,对贷款请求方进行贷款评估。
102、对预先收集到的用户数据进行处理,得到符合信用评分模型训练标准的训练数据。
其中,信用评分模型可以为基于支持向量机算法训练得到的模型。
对于本实施例,为了训练得到精确的信用评分模型需要对收集到的用户数据进行预处理,例如删掉或修复无效的数据、调整用户数据格式以便模型训练读取等方式,使得得到的数据符合信用评分模型训练内容、格式等标准。
103、基于处理得到的训练数据,利用支持向量机算法进行训练得到信用评分模型。
其中,支持向量机(Support Vector Machine,SVM)算法与神经网络类似,都是学习型的机制,但与神经网络不同的是SVM使用的是数学方法和优化技术。在机器学习中,支持向量机(还支持矢量网络)是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析。
支持向量机算法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。因此在本实施例中,参照预先收集到的用户数据的小样本、非线性、高维等特点,利用支持向量机算法可以更好的训练得到用于贷款评估的信用评分模型。
104、当接收到贷款用户的贷款请求时,利用信用评分模型,分析得到贷款用户的信用评分和可贷款额度。
其中,贷款请求携带有贷款用户的用户属性数据、历史信用数据、用户投资数据等,将这些数据代入到信用评分模型中进行贷款评估预测,对该贷款用户进行分类,得到该贷款用户的信用评分和可贷款额度。对于本实施例方法实施的整体架构可以参见图2所示。
进一步的,贷款请求中还可携带有贷款用户的贷款资金用途信息,结合信用评分模型得到的分析结果,可以更好的评估贷款用户的信用等级,实时主动的进行授信额度调整。例如,如果贷款用户的贷款资金用途为购买商品,结合信用评分模型得到的分析结果,可以按照分析得到的可贷款额度满额为该贷款用户提供贷款;如果贷款用户的贷款资金用途为偿还***,说明贷款用户资金不足,可能会存在坏账的情况,可以按照分析得到的可贷款额度的80%为该贷款用户提供贷款。
本实施例提供的一种基于支持向量机的贷款评估方法,与目前主要依靠信贷员的个人经验评估个人信用记录进行贷款评估的方式相比,可以利用信用评分模型自动分析得到贷款用户的信用评分和可贷款额度,无需人工靠经验进行贷款评估,可以提高贷款评估效率和精确性,并且贷款审核通过率较高,可以应用到用户日常的产品购买支付场景、网上贷款场景等,通过实时的数据分析和灵活的运营活动,为用户提供更好的资金支付能力。能够给贷款用户带来较好的使用体验,有利于金融机构、电商的发展。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了说明步骤102中的数据处理过程,在一种可选方式中,步骤102具体可以包括:利用多重填补法对用户数据中存在缺失值的数据进行插补缺失值处理;将插补缺失值处理后的用户数据利用箱线图进行分析,识别箱线图中的异常数据并进行删除;将删除异常数据后的用户数据进行对数变换和归一化处理,得到符合信用评分模型训练标准的训练数据。
其中,多重填补法是指由包含m个插补值的向量代替每一个缺失值的过程,要求m大于等于一定数值。m个完整数据集合能从插补向量中创建。m个完整数据集合能从插补向量中创建;由该向量的第一个元素代替每一个缺失值从而创建了第一个完整的数据集合,由它的向量中的第二个元素代替每一个缺失值从而创建了第二个完整数据的集合,以此类推,标准完整数据方法被用于分析每一个数据集合。
箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图,其绘制须使用常用的统计量,能提供有关数据位置和分散情况的关键信息,尤其在比较不同的母体数据时更可表现其差异。图中主要包含六种数据节点,将一组数据从大到小排列,分别计算出它的上边缘,上四分位数Q3,中位数,下四分位数Q1,下边缘,异常值。对于本实施例,通过箱形图分析可以很好剔除用户数据中的异常数据,减少对用户数据结果带来的不良影响。
在删除异常数据后,可以进行对数变换和归一化处理,归纳用户数据的统计分布性,得到符合信用评分模型训练标准的训练数据。其中归一化处理就是要把需要处理的数据经过处理后限制在需要的一定范围内,对数变换和归一化处理是为了后面数据训练的方便,其次是保证程序运行时收敛加快。
基于上述步骤102中得到的训练数据,为了说明信用评分模型具体生成过程,在一种可选方式中,步骤103具体可以包括:基于该训练数据,利用Bagging算法构建多个训练集合,其中训练集合是由从训练数据中随机抽取的多个样本进行训练得到的,每轮训练得到一个训练集合;分别在每个训练集合中随机选择预定数量的特征样本进行核函数建模,特征样本包括正样本和负样本;在训练集合建模后,通过模式搜索算法求解核函数得到最优超平面,最优超平面能够分割训练集合中随机选择的正样本和负样本,且使得分割后的正负样本向量与最优超平面之间间隔最大;基于每个训练集合对应的最优超平面的函数,生成得到每个训练集合对应的分类器;最后从训练数据中随机抽样得到验证数据,并利用该验证数据,计算每一个分类器与其它多个分类器之间的相关性系数;选择相关性系数最小的一组分类器进行集成,得到信用评分模型。
Bagging算法是一种用来提高学***面。对于本实施例,该正样本的定义可以结合与用户信用强相关的数据进行设定,而负样本可以结合与用户信用弱相关的数据进行设定。
通过模式搜索算法求解核函数得到最优超平面,模式搜索算法简单说就是寻找一系列的点X0,X1,X2,…,这些点都越来越靠近最优值点,当搜索进行到终止条件时则将最后一个点作为本次搜索的解。本实施例中,通过模式搜索算法得到最优超平面,其保证信用评分模型预测精度的同时,也缩短了基于支持向量机的信用评分模型的构建时间。
泛化能力用来表征信用评分模型的预测能力,为了提高本信用评分模型的泛化能力,本实施例中以支持向量机作为基学***面。通过应用模式搜索法确保在每一个训练集合上,寻找最优的参数,提高了单个分类器的泛化能力;不同训练集合训练出来的分类器不完全相同,个体分类器之间的差异性得到了增强。相关性最小化算法从众多个体分类器中进一步选择差异大的分类器进行集成,进一步提高了信用评分模型的泛化能力。
为了方便快速进行贷款评估,进一步的,贷款请求中可携带有贷款用户的身份标识信息,该身份标识信息可以为表征贷款用户身份的姓名、ID号等;相应的,步骤104中利用信用评分模型得到贷款用户评分结果的过程具体可以包括:利用贷款用户的身份标识信息,查询为训练信用评分模型而预先收集的不同用户数据中是否存在该贷款用户的用户数据;若存在,则将存在的该贷款用户的用户数据代入到信用评分模型中进行分类,确定该贷款用户的类型结果;最后将与类型结果对应的信用评分、和与信用评分所属信用评分分数段对应的可贷款额度,分别确定为该贷款用户的信用评分和可贷款额度,其中不同类型结果分别对应不同信用评分,且不同信用评分分数段分别对应不同可贷款额度。
通过上述这种方式,贷款用户无需手动输入过多的贷款请求信息,就可实现利用信用评分模型进行贷款评估,方便贷款用户的操作。
对于本实施例,为了应用信用评分模型精确评估贷款用户的信用评分和可贷款额度,需要保证贷款用户的用户数据也参与训练了信用评分模型,这样可以基于贷款用户数据进行精确分类,将该贷款用户的用户数据代入到信用评分模型进行分析,可以精确分类得到该贷款用户的信用评分和可贷款额度。需要说明的是,除了采用信用评分分数段对应可贷款额度的方式以外,还可采用信用评分直接对应可贷款额度,不同的信用评分可以分别对应不同的可贷款额度(也可以对应相同的可贷款额度),具体可以根据实际业务需求进行选择。
若为训练信用评分模型而预先收集的不同用户数据中不存在该贷款用户的用户数据,说明该贷款用户的用户数据没有参与训练信用评分模型,信用评分模型只能实现简单预测,为了这种场景下提高贷款评估精确性,一种可选方式是,根据贷款用户的身份标识信息,向第三方信用平台发送查询贷款用户第三方信用评分的查询请求,使得第三方信用平台按照该身份标识信息查询与该贷款用户对应的第三方信用评分;然后接收第三方信用平台返回的与贷款用户对应的第三方信用评分;将第三方信用评分进行转换得到符合信用评分模型评分格式的信用评分;将转换得到的信用评分、和信用评分所属信用评分分数段对应的可贷款额度,分别确定为贷款用户的信用评分和可贷款额度。
对于本实施例,如果贷款用户的用户数据没有参与训练信用评分模型,可以通过第三方信用评分代替信用评分模型进行预测,可以提高贷款评估的精确性。
若贷款用户存在未还款记录,说明此次信用评分模型得到的可贷款额度非实际的可贷款额度,为了更贴切具体的使用场景,满足具体的业务需求,一种可选方式是,将与信用评分所属信用评分分数段对应的可贷款额度,确定为贷款用户理论上的最大可贷款额度,且将最大可贷款额度与贷款用户未还款额度之间的差值,确定为贷款用户实际的可贷款额度。这样得到的分析结果更加符合业务需求,使得贷款用户了解实际的可贷款额度是多少。
进一步的,为了满足信用评分模型的更新需求,本实施例中的方法还可以包括:当收集到新用户的用户数据,和/或旧用户数据出现更新时,对新用户的用户数据和/或更新后的旧用户数据进行处理,得到符合信用评分模型训练标准的新训练数据;基于新训练数据和旧训练数据,利用支持向量机算法进行训练得到更新后的信用评分模型;相应的步骤104具体可以包括:当接收到贷款用户的贷款请求时,利用更新后的信用评分模型,分析得到贷款用户的信用评分和可贷款额度,这样得到的分析结果精确度更高,满足了信用评分模型的更新需要。
进一步的,作为图1和图2方法的具体实现,本申请实施例提供了一种基于支持向量机的贷款评估装置,如图3所示,该装置包括:收集单元21、处理单元22、训练单元23、分析单元24。
收集单元21,可以用于预先收集不同用户的用户数据,其中用户数据包含不同用户的用户属性数据、历史信用数据、用户投资数据;收集单元21为本装置中收集用户数据的主要功能模块,可以通过查询金融机构、保险公司、银行、购物网站等存在的用户记录、或通过第三方平台、用户网上调查问卷等方式收集不同用户的用户数据。
处理单元22,可以用于对收集单元21收集到的用户数据进行处理,得到符合信用评分模型训练标准的训练数据;处理单元22为本装置中数据预处理的功能模块。
训练单元23,可以用于基于处理单元22得到的训练数据,利用支持向量机算法进行训练得到信用评分模型;训练单元23为基于支持向量机算法训练信用评分模型的主要功能模块,也是本装置的核心模块。
分析单元24,可以用于当接收到贷款用户的贷款请求时,利用训练单元23得到的信用评分模型,分析得到贷款用户的信用评分和可贷款额度。分析单元24为本装置中贷款评估的主要功能模块。
在具体的应用场景中,处理单元22,具体可以用于利用多重填补法对用户数据中存在缺失值的数据进行插补缺失值处理;将插补缺失值处理后的用户数据利用箱线图进行分析,识别箱线图中的异常数据并进行删除;将删除异常数据后的用户数据进行对数变换和归一化处理,得到符合信用评分模型训练标准的训练数据。对于本实施例,通过箱形图分析可以很好剔除用户数据中的异常数据,减少对用户数据结果带来的不良影响。对数变换和归一化处理是为了后面数据训练的方便,其次是保证程序运行时收敛加快。
在具体的应用场景中,训练单元23,具体可以用于基于训练数据,利用Bagging算法构建多个训练集合,其中训练集合是由从训练数据中随机抽取的多个样本进行训练得到的,每轮训练得到一个训练集合;分别在每个训练集合中随机选择预定数量的特征样本进行核函数建模,特征样本包括正样本和负样本;在训练集合建模后,通过模式搜索算法求解核函数得到最优超平面,最优超平面能够分割训练集合中随机选择的正样本和负样本,且使得分割后的正负样本与最优超平面之间间隔最大;基于每个训练集合对应的最优超平面的函数,生成得到每个训练集合对应的分类器;从训练数据中随机抽样得到验证数据,并利用验证数据,计算每一个分类器与其它多个分类器之间的相关性系数;选择相关性系数最小的一组分类器进行集成,得到信用评分模型。
本实施例中以支持向量机作为基学***面。通过应用模式搜索法确保在每一个训练集合上,寻找最优的参数,提高了单个分类器的泛化能力;不同训练集合训练出来的分类器不完全相同,个体分类器之间的差异性得到了增强。相关性最小化算法从众多个体分类器中进一步选择差异大的分类器进行集成,进一步提高了信用评分模型的泛化能力。
在具体的应用场景中,可选的,贷款请求中携带有贷款用户的身份标识信息,分析单元24,具体可以用于利用身份标识信息,查询为训练信用评分模型而预先收集的不同用户数据中是否存在贷款用户的用户数据;若存在,则将存在的贷款用户的用户数据代入到信用评分模型中进行分类,确定贷款用户的类型结果;将与类型结果对应的信用评分、和与信用评分所属信用评分分数段对应的可贷款额度,分别确定为贷款用户的信用评分和可贷款额度,其中不同类型结果分别对应不同信用评分,且不同信用评分分数段分别对应不同可贷款额度。通过这种方式,贷款用户无需手动输入过多的贷款请求信息,就可实现利用信用评分模型进行贷款评估,方便贷款用户的操作。
在具体的应用场景中,分析单元24,具体还可以用于若为训练信用评分模型而预先收集的不同用户数据中不存在贷款用户的用户数据,则根据身份标识信息,向第三方信用平台发送查询贷款用户第三方信用评分的查询请求;接收第三方信用平台返回的与贷款用户对应的第三方信用评分;将第三方信用评分进行转换得到符合信用评分模型评分格式的信用评分;将转换得到的信用评分、和信用评分所属信用评分分数段对应的可贷款额度,分别确定为贷款用户的信用评分和可贷款额度。
对于本实施例,如果贷款用户的用户数据没有参与训练信用评分模型,可以通过第三方信用评分代替信用评分模型进行预测,可以提高贷款评估的精确性。
在具体的应用场景中,分析单元24,具体还可以用于若贷款用户存在未还款记录,则将与信用评分所属信用评分分数段对应的可贷款额度,确定为贷款用户理论上的最大可贷款额度,且将最大可贷款额度与贷款用户未还款额度之间的差值,确定为贷款用户实际的可贷款额度。这样得到的分析结果更加符合业务需求,使得贷款用户了解实际的可贷款额度是多少。
在具体的应用场景中,为了满足信用评分模型的更新需求,处理单元22,还可以用于当收集到新用户的用户数据,和/或旧用户数据出现更新时,对新用户的用户数据和/或更新后的旧用户数据进行处理,得到符合信用评分模型训练标准的新训练数据;
训练单元23,还可以用于基于新训练数据和旧训练数据,利用支持向量机算法进行训练得到更新后的信用评分模型;
相应的,分析单元24,还可以用于当接收到贷款用户的贷款请求时,利用更新后的信用评分模型,分析得到贷款用户的信用评分和可贷款额度。
需要说明的是,本申请实施例提供的一种基于支持向量机的贷款评估装置所涉及各功能单元的其他相应描述,可以参考图1至图2中的对应描述,在此不再赘述。
基于上述如图1所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1所示的基于支持向量机的贷款评估方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1所示的方法,以及图3所示的虚拟装置实施例,为了实现上述目的,本申请实施例还提供了一种基于支持向量机的贷款评估的实体设备,具体可以为个人电脑、服务器、网络设备等终端,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1所示的基于支持向量机的贷款评估方法。
可选的,该实体设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种基于支持向量机的贷款评估的实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作***、网络通信模块。操作***是管理上述基于支持向量机的贷款评估实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,与目前主要依靠信贷员的个人经验评估个人信用记录进行贷款评估的方式相比,可以利用信用评分模型自动分析得到贷款用户的信用评分和可贷款额度,无需人工靠经验进行贷款评估,可以提高贷款评估效率和精确性,并且贷款审核通过率较高,可以应用到用户日常的产品购买支付场景、网上贷款场景等,通过实时的数据分析和灵活的运营活动,为用户提供更好的资金支付能力。能够给贷款用户带来较好的使用体验,有利于金融机构、电商的发展。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。
Claims (9)
1.一种基于支持向量机的贷款评估方法,其特征在于,包括:
预先收集不同用户的用户数据,其中所述用户数据包含不同用户的用户属性数据、历史信用数据、用户投资数据;
对所述用户数据进行处理,得到符合信用评分模型训练标准的训练数据;
基于所述训练数据,利用支持向量机算法进行训练得到信用评分模型;
当接收到贷款用户的贷款请求时,利用所述信用评分模型,分析得到所述贷款用户的信用评分和可贷款额度;
基于所述训练数据,利用支持向量机算法进行训练得到信用评分模型,具体包括:
基于所述训练数据,利用Bagging算法构建多个训练集合,其中所述训练集合是由从所述训练数据中随机抽取的多个样本进行训练得到的,每轮训练得到一个训练集合;
分别在每个训练集合中随机选择预定数量的特征样本进行核函数建模,所述特征样本包括正样本和负样本;
在训练集合建模后,通过模式搜索算法求解核函数得到最优超平面,所述最优超平面能够分割训练集合中随机选择的正样本和负样本,且使得分割后的正负样本与所述最优超平面之间间隔最大;
基于每个训练集合对应的最优超平面的函数,生成得到每个训练集合对应的分类器;
从所述训练数据中随机抽样得到验证数据,并利用所述验证数据,计算每一个分类器与其它多个分类器之间的相关性系数;
选择相关性系数最小的一组分类器进行集成,得到信用评分模型。
2.根据权利要求1所述的方法,其特征在于,对所述用户数据进行处理,得到符合信用评分模型训练标准的训练数据,具体包括:
利用多重填补法对所述用户数据中存在缺失值的数据进行插补缺失值处理;
将所述插补缺失值处理后的所述用户数据利用箱线图进行分析,识别所述箱线图中的异常数据并进行删除;
将删除异常数据后的所述用户数据进行对数变换和归一化处理,得到符合信用评分模型训练标准的训练数据。
3.根据权利要求1所述的方法,其特征在于,所述贷款请求中携带有所述贷款用户的身份标识信息,利用所述信用评分模型,分析得到所述贷款用户的信用评分和可贷款额度,具体包括:
利用所述身份标识信息,查询为训练所述信用评分模型而预先收集的不同用户数据中是否存在所述贷款用户的用户数据;
若存在,则将存在的所述贷款用户的用户数据代入到所述信用评分模型中进行分类,确定所述贷款用户的类型结果;
将与所述类型结果对应的信用评分、和与信用评分所属信用评分分数段对应的可贷款额度,分别确定为所述贷款用户的信用评分和可贷款额度,其中不同类型结果分别对应不同信用评分,且不同信用评分分数段分别对应不同可贷款额度。
4.根据权利要求3所述的方法,其特征在于,在利用所述身份标识信息,查询为训练所述信用评分模型而预先收集的不同用户数据中是否存在所述贷款用户的用户数据之后,所述方法还包括:
若不存在,则根据所述身份标识信息,向第三方信用平台发送查询所述贷款用户第三方信用评分的查询请求;
接收所述第三方信用平台返回的与所述贷款用户对应的第三方信用评分;
将所述第三方信用评分进行转换得到符合所述信用评分模型评分格式的信用评分;
将转换得到的信用评分、和信用评分所属信用评分分数段对应的可贷款额度,分别确定为所述贷款用户的信用评分和可贷款额度。
5.根据权利要求1所述的方法,其特征在于,若所述贷款用户存在未还款记录,则将与信用评分所属信用评分分数段对应的可贷款额度,确定为所述贷款用户的可贷款额度,具体包括:
将与信用评分所属信用评分分数段对应的可贷款额度,确定为所述贷款用户理论上的最大可贷款额度,且将所述最大可贷款额度与所述贷款用户未还款额度之间的差值,确定为所述贷款用户实际的可贷款额度。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
当收集到新用户的用户数据,和/或旧用户数据出现更新时,对所述新用户的用户数据和/或更新后的旧用户数据进行处理,得到符合信用评分模型训练标准的新训练数据;
基于所述新训练数据和旧训练数据,利用支持向量机算法进行训练得到更新后的信用评分模型;
所述当接收到贷款用户的贷款请求时,利用所述信用评分模型,分析得到所述贷款用户的信用评分和可贷款额度,具体包括:
当接收到贷款用户的贷款请求时,利用所述更新后的信用评分模型,分析得到所述贷款用户的信用评分和可贷款额度。
7.一种基于支持向量机的贷款评估装置,其特征在于,包括:收集单元,用于预先收集不同用户的用户数据,其中所述用户数据包含不同用户的用户属性数据、历史信用数据、用户投资数据;
处理单元,用于对所述收集单元收集到的用户数据进行处理,得到符合信用评分模型训练标准的训练数据;
训练单元,用于基于所述处理单元得到的训练数据,利用支持向量机算法进行训练得到信用评分模型;
分析单元,用于当接收到贷款用户的贷款请求时,利用所述训练单元得到的信用评分模型,分析得到所述贷款用户的信用评分和可贷款额度;
所述训练单元,还用于基于所述训练数据,利用Bagging算法构建多个训练集合,其中所述训练集合是由从所述训练数据中随机抽取的多个样本进行训练得到的,每轮训练得到一个训练集合;分别在每个训练集合中随机选择预定数量的特征样本进行核函数建模,所述特征样本包括正样本和负样本;在训练集合建模后,通过模式搜索算法求解核函数得到最优超平面,所述最优超平面能够分割训练集合中随机选择的正样本和负样本,且使得分割后的正负样本与所述最优超平面之间间隔最大;基于每个训练集合对应的最优超平面的函数,生成得到每个训练集合对应的分类器;从所述训练数据中随机抽样得到验证数据,并利用所述验证数据,计算每一个分类器与其它多个分类器之间的相关性系数;选择相关性系数最小的一组分类器进行集成,得到信用评分模型。
8.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至6中任一项所述的基于支持向量机的贷款评估方法。
9.一种基于支持向量机的贷款评估设备,包括存储介质、处理器及存储在存储介质上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6中任一项所述的基于支持向量机的贷款评估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810485676.2A CN108648074B (zh) | 2018-05-18 | 2018-05-18 | 基于支持向量机的贷款评估方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810485676.2A CN108648074B (zh) | 2018-05-18 | 2018-05-18 | 基于支持向量机的贷款评估方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108648074A CN108648074A (zh) | 2018-10-12 |
CN108648074B true CN108648074B (zh) | 2023-06-09 |
Family
ID=63757180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810485676.2A Active CN108648074B (zh) | 2018-05-18 | 2018-05-18 | 基于支持向量机的贷款评估方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108648074B (zh) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109584037A (zh) * | 2018-10-16 | 2019-04-05 | 深圳壹账通智能科技有限公司 | 贷款用户信用评分的计算方法、装置和计算机设备 |
CN109636576A (zh) * | 2018-10-25 | 2019-04-16 | 深圳壹账通智能科技有限公司 | 信贷数据的处理方法、装置、设备和存储介质 |
CN109816509A (zh) * | 2018-12-14 | 2019-05-28 | 平安科技(深圳)有限公司 | 评分卡模型的生成方法、终端设备及介质 |
CN109685649A (zh) * | 2018-12-28 | 2019-04-26 | 上海点融信息科技有限责任公司 | 基于人工智能确定授信额度的方法、装置及存储介质 |
CN109886799A (zh) * | 2019-01-22 | 2019-06-14 | 上海上湖信息技术有限公司 | 一种实时预测并显示借款成功率的方法及*** |
CN111583010A (zh) * | 2019-02-18 | 2020-08-25 | 北京奇虎科技有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN112930545A (zh) * | 2019-02-19 | 2021-06-08 | 算话智能科技有限公司 | 信用评估的***和方法 |
CN110060144B (zh) * | 2019-03-18 | 2024-01-30 | 平安科技(深圳)有限公司 | 额度模型训练方法、额度评估方法、装置、设备及介质 |
CN110135970A (zh) * | 2019-04-15 | 2019-08-16 | 深圳壹账通智能科技有限公司 | 贷款评估方法、装置、计算机设备和存储介质 |
CN112115258B (zh) * | 2019-06-20 | 2023-09-26 | 腾讯科技(深圳)有限公司 | 一种用户的信用评价方法、装置、服务器及存储介质 |
CN110443694A (zh) * | 2019-07-31 | 2019-11-12 | 中国工商银行股份有限公司 | 小微企业线上融资方法及装置 |
CN111210337A (zh) * | 2019-12-27 | 2020-05-29 | 安徽科讯金服科技有限公司 | 一种用于贷款的用户信用评估*** |
CN111222979A (zh) * | 2019-12-27 | 2020-06-02 | 安徽科讯金服科技有限公司 | 一种基于政务大数据的贷款信用评价*** |
CN111275545A (zh) * | 2020-02-14 | 2020-06-12 | 中国建设银行股份有限公司 | 线上抵押贷款方法、装置、设备及介质 |
CN111340616B (zh) * | 2020-03-10 | 2024-03-19 | 中国建设银行股份有限公司 | 线上贷款的审批方法、装置、设备及介质 |
CN111583015A (zh) * | 2020-04-09 | 2020-08-25 | 上海淇毓信息科技有限公司 | 一种信贷申请分类方法、装置及电子设备 |
TWI759759B (zh) * | 2020-06-09 | 2022-04-01 | 台北富邦商業銀行股份有限公司 | 企業申貸評估系統 |
CN112163943A (zh) * | 2020-09-17 | 2021-01-01 | 中国建设银行股份有限公司 | 违约概率的确定方法、装置、设备和介质 |
CN112347343B (zh) * | 2020-09-25 | 2024-05-28 | 北京淇瑀信息科技有限公司 | 一种定制信息推送方法、装置和电子设备 |
CN112700319A (zh) * | 2020-12-16 | 2021-04-23 | 中国建设银行股份有限公司 | 基于政务数据的企业授信额度确定方法及装置 |
CN112950354A (zh) * | 2021-02-26 | 2021-06-11 | 中国光大银行股份有限公司 | 账户的信用评分方法、装置和存储介质及电子装置 |
CN112907358A (zh) * | 2021-03-17 | 2021-06-04 | 平安消费金融有限公司 | 贷款用户信用评分方法、装置、计算机设备和存储介质 |
CN112862602B (zh) * | 2021-03-29 | 2024-05-24 | 中信银行股份有限公司 | 一种用户请求的确定方法及存储介质、电子装置 |
CN113129126B (zh) * | 2021-04-15 | 2023-04-25 | 算话智能科技有限公司 | 一种业务数据处理方法及装置 |
CN113177837A (zh) * | 2021-05-12 | 2021-07-27 | 广州市全民钱包科技有限公司 | 贷款申请人的贷款额度评估方法、装置、设备及存储介质 |
CN113283979A (zh) * | 2021-05-12 | 2021-08-20 | 广州市全民钱包科技有限公司 | 一种贷款申请人的贷款信用评估方法、装置及存储介质 |
CN113887981A (zh) * | 2021-10-14 | 2022-01-04 | 黑龙江省范式智能技术有限公司 | 一种企业信用额度标准分析方法 |
CN114387077A (zh) * | 2021-11-29 | 2022-04-22 | 阿尔法时刻科技(深圳)有限公司 | 一种信贷资质审查方法及*** |
CN116468265A (zh) * | 2023-03-23 | 2023-07-21 | 杭州瓴羊智能服务有限公司 | 批量用户数据处理方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107248114A (zh) * | 2017-06-01 | 2017-10-13 | 世纪禾光科技发展(北京)有限公司 | 电商贷款管理方法和*** |
CN107798600A (zh) * | 2017-12-05 | 2018-03-13 | 深圳信用宝金融服务有限公司 | 互联网金融小微贷款的信用风险识别方法及装置 |
CN107967461A (zh) * | 2017-12-08 | 2018-04-27 | 深圳云天励飞技术有限公司 | Svm 差分模型训练及人脸验证方法、装置、终端及存储介质 |
-
2018
- 2018-05-18 CN CN201810485676.2A patent/CN108648074B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107248114A (zh) * | 2017-06-01 | 2017-10-13 | 世纪禾光科技发展(北京)有限公司 | 电商贷款管理方法和*** |
CN107798600A (zh) * | 2017-12-05 | 2018-03-13 | 深圳信用宝金融服务有限公司 | 互联网金融小微贷款的信用风险识别方法及装置 |
CN107967461A (zh) * | 2017-12-08 | 2018-04-27 | 深圳云天励飞技术有限公司 | Svm 差分模型训练及人脸验证方法、装置、终端及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN108648074A (zh) | 2018-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108648074B (zh) | 基于支持向量机的贷款评估方法、装置及设备 | |
CN108564286B (zh) | 一种基于大数据征信的人工智能金融风控授信评定方法和*** | |
WO2020119272A1 (zh) | 风险识别模型训练方法、装置及服务器 | |
CN108711107A (zh) | 智能融资服务推荐方法及其*** | |
Kostic et al. | What image features boost housing market predictions? | |
CN104321794A (zh) | 一种使用多维评级来确定一实体的未来商业可行性的***和方法 | |
CN113469730A (zh) | 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置 | |
WO2020135642A1 (zh) | 一种基于生成对抗网络的模型训练方法及设备 | |
Guliyev et al. | Customer churn analysis in banking sector: Evidence from explainable machine learning model | |
CN111611496A (zh) | 产品推荐方法及其装置 | |
CN111047193A (zh) | 一种基于信用大数据标签的企业信用评分模型生成算法 | |
CN110634060A (zh) | 一种用户信用风险的评估方法、***、装置及存储介质 | |
CN109978300B (zh) | 客户风险承受力量化方法及***、资产配置方法及*** | |
CN112449002B (zh) | 一种待推送对象的推送方法、装置、设备及存储介质 | |
CN117132383A (zh) | 一种信贷数据处理方法、装置、设备及可读存储介质 | |
CN113011966A (zh) | 基于深度学习的信用评分方法及装置 | |
CN116385151A (zh) | 基于大数据进行风险评级预测的方法及计算设备 | |
CN115689708A (zh) | 训练数据的筛选方法、风险评估方法、装置、设备和介质 | |
Koç et al. | Consumer loans' first payment default detection: a predictive model | |
CN114626940A (zh) | 数据分析方法、装置及电子设备 | |
Zimal et al. | Customer churn prediction using machine learning | |
Dixon et al. | A Bayesian approach to ranking private companies based on predictive indicators | |
KR101656024B1 (ko) | 배우자 후보에 대한 매칭 장치 및 방법 | |
Kumar et al. | Data Mining in Credit Scoring and Future Application | |
CN116384749A (zh) | 训练风险评级预测模型的方法及计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |