CN113435987A - 一种金融领域的高风险用户动态识别方法及装置 - Google Patents

一种金融领域的高风险用户动态识别方法及装置 Download PDF

Info

Publication number
CN113435987A
CN113435987A CN202110704410.4A CN202110704410A CN113435987A CN 113435987 A CN113435987 A CN 113435987A CN 202110704410 A CN202110704410 A CN 202110704410A CN 113435987 A CN113435987 A CN 113435987A
Authority
CN
China
Prior art keywords
user
risk
users
current
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110704410.4A
Other languages
English (en)
Inventor
罗世谦
王丹菊
何文清
何斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110704410.4A priority Critical patent/CN113435987A/zh
Publication of CN113435987A publication Critical patent/CN113435987A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明可用于金融领域或其他领域,本发明提供了一种金融领域的高风险用户动态识别方法及装置,金融领域的高风险用户动态识别方法包括:根据用户债项分级生成用户的特征集合;利用聚类算法,根据所述特征集合对所述用户进行分类,以生成分类结果;根据所述分类结果对高风险用户进行动态识别。实现了不同时点不同整体风险程度下,高风险大户的动态识别,可改变当前线下手工评估高风险大户低效且精准度低的现状。

Description

一种金融领域的高风险用户动态识别方法及装置
技术领域
本发明属于大数据技术领域,特别是涉及分布式***服务调用,具体涉及一种金融领域的高风险用户动态识别方法及装置。
背景技术
在当前金融领域中,监管机构和行内制度都要求对高风险大户进行特定事项管理,可以理解的是,高风险大户是相对的概念,指在行内所有大户中,某时点风险相对较高的大户。即不同时点整体风险程度不一,需要在不同整体风险程度下,查找出对应的风险相对较高的大户。
按何种标准来对动态变化的多维度大户信息进行大户风险评价(即难点1:如何量化评价大户风险),以及如何根据当前时点整体风险程度,动态从全行近万大户中精确甄别高风险大户(即难点2:如何动态甄别高风险大户),无疑是一件非常困难的事情。筛选出的高风险大户过多,将增加管理难度和成本,筛选少了又会增加管理风险。由于当前缺少有效的技术方案,当前仍采用线下手工评估(即基于客户评级、担保、经营状态等因素,按经验判断)的方式进行筛选。该方式无论效率还是精准度,都很难令人满意。
因此,提出一种能动态自动识别高风险大户的方法,就显得尤为重要。
发明内容
需要说明的是,本发明公开的一种金融领域的高风险用户动态识别方法及装置可用于金融领域,也可用于除金融领域之外的任意领域,本发明公开的金融领域的高风险用户动态识别方法及装置的应用领域不做限定
本发明属所提供的金融领域的高风险用户动态识别方法及装置,可实现同时点不同整体风险程度下,高风险大户的动态识别,将改变当前线下手工评估高风险大户低效且精准度低的现状。
为解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供一种金融领域的高风险用户动态识别方法,包括:
根据用户债项分级生成用户的特征集合;
利用聚类算法,根据所述特征集合对所述用户进行分类,以生成分类结果;
根据所述分类结果对高风险用户进行动态识别。
一实施例中,金融领域的高风险用户动态识别方法还包括:根据用户的客户评级、担保方式参数、抵质押价值、经济性质参数以及经营状态参数确定所述用户债项分级。
一实施例中,所述根据用户债项分级生成用户的特征集合包括:
对所述用户债项分级进行数据清洗;
根据清洗后的用户债项分级计算用户当前风险值;
根据所述用户当前风险值生成所述特征集合。
一实施例中,所述聚类算法,根据所述特征集合对所述用户进行分类,以生成分类结果,包括:
根据所述特征集合计算所有用户的用户当前风险值的平均值;
根据所述平均值对所述用户进行分类,以生成第一用户合集以及第二用户合集;
进行迭代操作:
从所述第一用户合集中随机选取一当前用户;
分别计算所述当前用户与第一用户合集的用户当前风险值的平均值的第一差值,以及当前用户与第二用户合集的用户当前风险值的平均值的第二差值;
当所述第一差值小于所述第二差值时,将所述当前用户移入至所述第二用户合集;
直至所述第一差值不小于所述第二差值。
第二方面,本发明提供一种金融领域的高风险用户动态识别装置,包括:
特征集合生成模块,用于根据用户债项分级生成用户的特征集合;
分类结果生成模块,用于利用聚类算法,根据所述特征集合对所述用户进行分类,以生成分类结果;
用户识别模块,用于根据所述分类结果对高风险用户进行动态识别。
一实施例中,金融领域的高风险用户动态识别装置还包括:债项分级确定模块,用于根据用户的客户评级、担保方式参数、抵质押价值、经济性质参数以及经营状态参数确定所述用户债项分级。
一实施例中,所述特征集合生成模块包括:
数据清洗单元,用于对所述用户债项分级进行数据清洗;
风险值计算单元,用于根据清洗后的用户债项分级计算用户当前风险值;
特征集合生成单元,用于根据所述用户当前风险值生成所述特征集合。
一实施例中,所述分类结果生成模块包括:
平均值计算单元,用于根据所述特征集合计算所有用户的用户当前风险值的平均值;
用户分类单元,用于根据所述平均值对所述用户进行分类,以生成第一用户合集以及第二用户合集;
迭代操作单元,用于进行迭代操作:
从所述第一用户合集中随机选取一当前用户;
分别计算所述当前用户与第一用户合集的用户当前风险值的平均值的第一差值,以及当前用户与第二用户合集的用户当前风险值的平均值的第二差值;
当所述第一差值小于所述第二差值时,将所述当前用户移入至所述第二用户合集;
直至所述第一差值不小于所述第二差值。
第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现金融领域的高风险用户动态识别方法的步骤。
第四方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现金融领域的高风险用户动态识别方法的步骤。
从上述描述可知,本发明实施例提供的金融领域的高风险用户动态识别方法及装置,首先根据用户债项分级生成用户的特征集合;接着,利用聚类算法,根据特征集合对用户进行分类,以生成分类结果;最后根据分类结果对高风险用户进行动态识别。本发明通过建立一套能量化评价大户风险的风险评价模型,以及一种动态聚类算法,实现了不同时点不同整体风险程度下,高风险大户的动态识别,可改变当前线下手工评估高风险大户低效且精准度低的现状。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的实施例中金融领域的高风险用户动态识别方法流程示意图一;
图2为本发明的实施例中金融领域的高风险用户动态识别方法流程示意图二;
图3为本发明的实施例中金融领域的高风险用户动态识别方法中步骤100的流程示意图;
图4为本发明的实施例中金融领域的高风险用户动态识别方法中步骤200的流程示意图;
图5为本发明具体应用实例中金融领域的高风险用户动态识别方法的流程示意图;
图6为本发明具体应用实例中金融领域的高风险用户动态识别方法的思维导图;
图7为本发明具体应用实例中嵌套动态聚类分析方法的流程示意图;
图8为本发明实施例中金融领域的高风险用户动态识别装置的结构示意图一;
图9为本发明实施例中金融领域的高风险用户动态识别装置的结构示意图二;
图10为本发明实施例中特征集合生成模块10的结构示意图;
图11为本发明实施例中分类结果生成模块20的结构示意图;
图12为本发明的实施例中的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明的实施例提供一种金融领域的高风险用户动态识别方法的具体实施方式,参见图1,该方法具体包括如下内容:
步骤100:根据用户债项分级生成用户的特征集合。
具体地,提取当前时点全量风险大户融资余额和12级分类(风险评级),形成风险大户对象的初始特征集合。接着,基于风险大户对象的初始特征集合,利用风险评价模型对全量风险大户对象逐一进行风险值量化评价,对全量风险大户对象逐一新建风险值量化特征,从而构建出风险大户风险特征集合。
步骤200:利用聚类算法,根据所述特征集合对所述用户进行分类,以生成分类结果。
可以理解的是,聚类分析又称群分析,是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。
步骤300:根据所述分类结果对高风险用户进行动态识别。
完成步骤300中的聚类分析之后,‘高风险大户集合’中所有用户即本场景所需甄别出的当前时点对应的较高风险大户。
从上述描述可知,本发明实施例提供的金融领域的高风险用户动态识别方法,首先根据用户债项分级生成用户的特征集合;接着,利用聚类算法,根据特征集合对用户进行分类,以生成分类结果;最后根据分类结果对高风险用户进行动态识别。本发明通过建立一套能量化评价大户风险的风险评价模型,以及一种动态聚类算法,实现了不同时点不同整体风险程度下,高风险大户的动态识别,将改变当前线下手工评估高风险大户低效且精准度低的现状。
一实施例中,参见图2,金融领域的高风险用户动态识别方法还包括:
步骤400:根据用户的客户评级、担保方式参数、抵质押价值、经济性质参数以及经营状态参数确定所述用户债项分级。
一实施例中,参见图3,步骤100包括:
步骤101:对所述用户债项分级进行数据清洗;
数据清洗(Data cleaning)是指对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。具体包括:
一致性检查,一致性检查(consistency check)是根据每个变量的合理取值范围和相互关系,检查数据是否合乎要求,发现超出正常范围、逻辑上不合理或者相互矛盾的数据。例如,用1-7级量表测量的变量出现了0值,体重出现了负数,都应视为超出正常值域范围。SPSS、SAS、和Excel等计算机软件都能够根据定义的取值范围,自动识别每个超出范围的变量值。具有逻辑上不一致性的答案可能以多种形式出现:例如,许多调查对象说自己开车上班,又报告没有汽车;或者调查对象报告自己是某品牌的重度购买者和使用者,但同时又在熟悉程度量表上给了很低的分值。发现不一致时,要列出问卷序号、记录序号、变量名称、错误类别等,便于进一步核对和纠正。
无效值和缺失值的处理:由于调查、编码和录入误差,数据中可能存在一些无效值和缺失值,需要给予适当的处理。常用的处理方法有:估算,整例删除,变量删除和成对删除。估算(estimation)。最简单的办法就是用某个变量的样本均值、中位数或众数代替无效值和缺失值。这种办法简单,但没有充分考虑数据中已有的信息,误差可能较大。另一种办法就是根据调查对象对其他问题的答案,通过变量之间的相关分析或逻辑推论进行估计。例如,某一产品的拥有情况可能与家庭收入有关,可以根据调查对象的家庭收入推算拥有这一产品的可能性。
整例删除(casewise deletion)是剔除含有缺失值的样本。由于很多问卷都可能存在缺失值,这种做法的结果可能导致有效样本量大大减少,无法充分利用已经收集到的数据。因此,只适合关键变量缺失,或者含有无效值或缺失值的样本比重很小的情况。
变量删除(variable deletion)。如果某一变量的无效值和缺失值很多,而且该变量对于所研究的问题不是特别重要,则可以考虑将该变量删除。这种做法减少了供分析用的变量数目,但没有改变样本量。
成对删除(pairwise deletion)是用一个特殊码(通常是9、99、999等)代表无效值和缺失值,同时保留数据集中的全部变量和样本。但是,在具体计算时只采用有完整答案的样本,因而不同的分析因涉及的变量不同,其有效样本量也会有所不同。这是一种保守的处理方法,最大限度地保留了数据集中的可用信息。
采用不同的处理方法可能对分析结果产生影响,尤其是当缺失值的出现并非随机且变量之间明显相关时。因此,在调查中应当尽量避免出现无效值和缺失值,保证数据的完整性。
步骤102:根据清洗后的用户债项分级计算用户当前风险值;
具体地,利用公式(1)计算用户当前风险值:
Figure BDA0003130584520000071
其中Xi为客户在某12级分类下对应的融资余额,且若大户融资余额为0,则大户风险值为0,因此大户风险值范围为[0,12]。
例如:大户A有3笔融资,融资余额均为1000,12级分类分别为1~3级,因此该大户风险值为‘(1×1000+2×1000+3×1000)/(1000+1000+1000)=2’。
步骤103:根据所述用户当前风险值生成所述特征集合。
一实施例中,参见图4,步骤200包括:
步骤201:根据所述特征集合计算所有用户的用户当前风险值的平均值;
步骤202:根据所述平均值对所述用户进行分类,以生成第一用户合集以及第二用户合集;
在步骤201以及步骤202中,首先利用当前时点全行大户的平均风险值进行初始分类,分为高于该平均值和低于该平均值的两类。
接着,得到每一类的平均风险值(该类的重心,作为下一步的判别标准)。
步骤203:进行迭代操作:
从所述第一用户合集中随机选取一当前用户;
分别计算所述当前用户与第一用户合集的用户当前风险值的平均值的第一差值,以及当前用户与第二用户合集的用户当前风险值的平均值的第二差值;
当所述第一差值小于所述第二差值时,将所述当前用户移入至所述第二用户合集;
直至所述第一差值不小于所述第二差值。
步骤203实质上是一个聚类分析过程:聚类分析过程:以平均风险值(相当于类的重心)作为类的判别标准,依次对相应的类中的所有风险值进行判断。若类中的这个风险值与所在类的平均风险值的差值小于此风险值与另一个类的平均风险值的差值(即,此类中的这个风险值离另一类的重心更近),则将此风险值从原来的类中移出,并放入另一个类中。相反,则此风险值仍保留在原来的类中。对两个类的所有风险值分别进行完此判断之后,则完成了一次聚类分析过程。反复进行此聚类分析过程,直到不会再有风险值需要从一个类移到另一个类(即每个类中的风险值都紧绕在所在类的重心周围,离所在类的平均风险值更近)。完成上述聚类之后,重心更高的类中对应的大户即高风险大户。
为进一步地说明本方案,本发明还提供金融领域的高风险用户动态识别方法的具体应用实例,具体内容参见图5以及图6。
步骤S101:建立风险评价模型。
风险评价模型用以对大户风险程度进行精确衡量。(即,先量化评价每个大户有多少风险)。
确定大户的风险程度,无疑应该考虑‘客户评级、担保方式、抵质押价值、经济性质、经营状态’等多方面因素,但基于诸多因素进行建模判断无疑非常困难且低效。考虑到我行特有的针对债项的12级分类已利用了上述各风险因素来确定债项风险程度,因此提出一种基于12级分类的加权平均算法来衡量各大户的风险:
Figure BDA0003130584520000081
其中Xi为客户在某12级分类下对应的融资余额,且若大户融资余额为0,则大户风险值为0,因此大户风险值范围为[0,12]。
例如:大户A有3笔融资,融资余额均为1000,12级分类分别为1~3级,因此该大户风险值为“(1×1000+2×1000+3×1000)/(1000+1000+1000)=2”。
步骤S102:利用聚类算法识别风险用户。
受宏观因素等影响,全行大户的整体风险水平在不同时点必定不尽相同,可能某些时点整体偏高,某些时点整体偏低,某些时点高风险的大户多,某些时点高风险的大户少。因此采用机器学***下,动态筛选高风险大户。(即,根据某时点大户群体风险水平,动态聚类,筛选出高风险大户),来动态适应不同场景的高风险大户筛选需要。参见图7,步骤如下:
S1:风险大户特征数据初始化。
提取当前时点全量风险大户融资余额和12级分类,形成风险大户对象的初始特征集合。基于风险大户对象的初始特征集合,利用风险评价模型对全量风险大户对象逐一进行风险值量化评价,对全量风险大户对象逐一新建风险值量化特征。构建出风险大户风险特征数据初始化集合。
S2:聚类初分。
针对全量风险大户,计算大户风险量化特征平均值。基于大户风险量化特征平均值,对全量风险大户进行聚类初分:若大户风险特征值大于等于该平均值,则将其纳入‘高风险大户集合’;若大户风险特征值小于该平均值,则将其纳入‘低风险大户集合’。
S3:嵌套动态聚类分析。
聚类重心重置:针对‘高风险大户集合、低风险大户集合’,分别计算集合内大户风险量化特征平均值,作为‘高风险大户集合、低风险大户集合’各自新的聚类重心。
重聚类:以新聚类重心作为‘高风险大户集合、低风险大户集合’的新判别标准,依次对原‘高风险大户集合、低风险大户集合’中所有大户进行重聚类:
a、若原‘高风险大户集合’中的某大户风险值与该集合新聚类重心差值大于此风险值与‘低风险大户集合’新聚类重心差值(即,此类中的这个风险值离另一集合的重心更近),则将该大户迁移到‘低风险大户集合’。
b、若原‘高风险大户集合’中的某大户风险值与该集合新聚类重心差值小于等于此风险值与‘低风险大户集合’新聚类重心差值(即,此类中的这个风险值离原集合的重心更近),则将该大户保留在‘高风险大户集合’。
c、若原‘低风险大户集合’中的某大户风险值与该集合新聚类重心差值大于此风险值与‘高风险大户集合’新聚类重心差值(即,此类中的这个风险值离另一集合的重心更近),则将该大户迁移到‘高风险大户集合’。
d、若原‘低风险大户集合’中的某大户风险值与该集合新聚类重心差值小于等于此风险值与‘高风险大户集合’新聚类重心差值(即,此类中的这个风险值离原集合的重心更近),则将该大户保留在‘低风险大户集合’。
S4:聚类终结判定。
若聚类重心重置后新重心和原本重心重合,则无需进行重聚类。应该退出嵌套动态聚类分析。此时,‘高风险大户集合、低风险大户集合’中每个大户的风险值都紧绕在所在集合的大户风险值重心周围,离所在集合的平均大户风险值更近。
S5:聚类结果输出。
完成上述聚类分析之后,‘高风险大户集合’中所有大户即本场景所需甄别出的,当前时点对应的较高风险大户。
为了可以实现自动的动态识别高风险大户,改变当前线下手工评估高风险大户低效且精准度低的现状,针对上述背景中两个亟待解决的难点,本发明提供了一种基于加权平均和动态聚类的高风险大户动态识别方法,能在不同时点不同整体风险程度下,动态自动识别出对应的风险相对较高的大户。具体地,首先根据用户债项分级生成用户的特征集合;接着,利用聚类算法,根据特征集合对用户进行分类,以生成分类结果;最后根据分类结果对高风险用户进行动态识别。本发明通过建立一套能量化评价大户风险的风险评价模型,以及一种动态聚类算法,实现了不同时点不同整体风险程度下,高风险大户的动态识别,将改变当前线下手工评估高风险大户低效且精准度低的现状。
基于同一发明构思,本申请实施例还提供了一种金融领域的高风险用户动态识别装置,可以用于实现上述实施例所描述的方法,如下面的实施例。由于金融领域的高风险用户动态识别装置解决问题的原理与金融领域的高风险用户动态识别方法相似,因此金融领域的高风险用户动态识别装置的实施可以参见金融领域的高风险用户动态识别方法实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的***较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
本发明的实施例提供一种能够实现金融领域的高风险用户动态识别方法的金融领域的高风险用户动态识别装置的具体实施方式,参见图8,金融领域的高风险用户动态识别装置具体包括如下内容:
特征集合生成模块10,用于根据用户债项分级生成用户的特征集合;
分类结果生成模块20,用于利用聚类算法,根据所述特征集合对所述用户进行分类,以生成分类结果;
用户识别模块30,用于根据所述分类结果对高风险用户进行动态识别。
一实施例中,参见图9,金融领域的高风险用户动态识别装置还包括:债项分级确定模块40,用于根据用户的客户评级、担保方式参数、抵质押价值、经济性质参数以及经营状态参数确定所述用户债项分级。
一实施例中,参见图10,所述特征集合生成模块10包括:
数据清洗单元101,用于对所述用户债项分级进行数据清洗;
风险值计算单元102,用于根据清洗后的用户债项分级计算用户当前风险值;
特征集合生成单元103,用于根据所述用户当前风险值生成所述特征集合。
一实施例中,参见图11,所述分类结果生成模块20包括:
平均值计算单元201,用于根据所述特征集合计算所有用户的用户当前风险值的平均值;
用户分类单元202,用于根据所述平均值对所述用户进行分类,以生成第一用户合集以及第二用户合集;
迭代操作单元203,用于进行迭代操作:
从所述第一用户合集中随机选取一当前用户;
分别计算所述当前用户与第一用户合集的用户当前风险值的平均值的第一差值,以及当前用户与第二用户合集的用户当前风险值的平均值的第二差值;
当所述第一差值小于所述第二差值时,将所述当前用户移入至所述第二用户合集;
直至所述第一差值不小于所述第二差值。
从上述描述可知,本发明实施例提供的金融领域的高风险用户动态识别装置,首先根据用户债项分级生成用户的特征集合;接着,利用聚类算法,根据特征集合对用户进行分类,以生成分类结果;最后根据分类结果对高风险用户进行动态识别。本发明通过建立一套能量化评价大户风险的风险评价模型,以及一种动态聚类算法,实现了不同时点不同整体风险程度下,高风险大户的动态识别,将改变当前线下手工评估高风险大户低效且精准度低的现状。
下面参考图12,其示出了适于用来实现本申请实施例的电子设备600的结构示意图。
如图12所示,电子设备600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM))603中的程序而执行各种适当的工作和处理。在RAM603中,还存储有***600操作所需的各种程序和数据。CPU601、ROM602、以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡,调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装如存储部分608。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述基于数据机房场景下的人员距离确定方法的步骤,该步骤包括:
步骤100:根据用户债项分级生成用户的特征集合;
步骤200:利用聚类算法,根据所述特征集合对所述用户进行分类,以生成分类结果;
步骤300:根据所述分类结果对高风险用户进行动态识别。
在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上该仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种金融领域的高风险用户动态识别方法,其特征在于,包括:
根据用户债项分级生成用户的特征集合;
利用聚类算法,根据所述特征集合对所述用户进行分类,以生成分类结果;
根据所述分类结果对高风险用户进行动态识别。
2.根据权利要求1所述的金融领域的高风险用户动态识别方法,其特征在于,还包括:根据用户的客户评级、担保方式参数、抵质押价值、经济性质参数以及经营状态参数确定所述用户债项分级。
3.根据权利要求2所述的金融领域的高风险用户动态识别方法,其特征在于,所述根据用户债项分级生成用户的特征集合包括:
对所述用户债项分级进行数据清洗;
根据清洗后的用户债项分级计算用户当前风险值;
根据所述用户当前风险值生成所述特征集合。
4.根据权利要求3所述的金融领域的高风险用户动态识别方法,其特征在于,所述聚类算法,根据所述特征集合对所述用户进行分类,以生成分类结果,包括:
根据所述特征集合计算所有用户的用户当前风险值的平均值;
根据所述平均值对所述用户进行分类,以生成第一用户合集以及第二用户合集;
进行迭代操作:
从所述第一用户合集中随机选取一当前用户;
分别计算所述当前用户与第一用户合集的用户当前风险值的平均值的第一差值,以及当前用户与第二用户合集的用户当前风险值的平均值的第二差值;
当所述第一差值小于所述第二差值时,将所述当前用户移入至所述第二用户合集;
直至所述第一差值不小于所述第二差值。
5.一种金融领域的高风险用户动态识别装置,其特征在于,包括:
特征集合生成模块,用于根据用户债项分级生成用户的特征集合;
分类结果生成模块,用于利用聚类算法,根据所述特征集合对所述用户进行分类,以生成分类结果;
用户识别模块,用于根据所述分类结果对高风险用户进行动态识别。
6.根据权利要求5所述的金融领域的高风险用户动态识别装置,其特征在于,还包括:债项分级确定模块,用于根据用户的客户评级、担保方式参数、抵质押价值、经济性质参数以及经营状态参数确定所述用户债项分级。
7.根据权利要求6所述的金融领域的高风险用户动态识别装置,其特征在于,所述特征集合生成模块包括:
数据清洗单元,用于对所述用户债项分级进行数据清洗;
风险值计算单元,用于根据清洗后的用户债项分级计算用户当前风险值;
特征集合生成单元,用于根据所述用户当前风险值生成所述特征集合。
8.根据权利要求7所述的金融领域的高风险用户动态识别装置,其特征在于,所述分类结果生成模块包括:
平均值计算单元,用于根据所述特征集合计算所有用户的用户当前风险值的平均值;
用户分类单元,用于根据所述平均值对所述用户进行分类,以生成第一用户合集以及第二用户合集;
迭代操作单元,用于进行迭代操作:
从所述第一用户合集中随机选取一当前用户;
分别计算所述当前用户与第一用户合集的用户当前风险值的平均值的第一差值,以及当前用户与第二用户合集的用户当前风险值的平均值的第二差值;
当所述第一差值小于所述第二差值时,将所述当前用户移入至所述第二用户合集;
直至所述第一差值不小于所述第二差值。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至4任一项所述金融领域的高风险用户动态识别方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至4任一项所述金融领域的高风险用户动态识别方法的步骤。
CN202110704410.4A 2021-06-24 2021-06-24 一种金融领域的高风险用户动态识别方法及装置 Pending CN113435987A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110704410.4A CN113435987A (zh) 2021-06-24 2021-06-24 一种金融领域的高风险用户动态识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110704410.4A CN113435987A (zh) 2021-06-24 2021-06-24 一种金融领域的高风险用户动态识别方法及装置

Publications (1)

Publication Number Publication Date
CN113435987A true CN113435987A (zh) 2021-09-24

Family

ID=77753956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110704410.4A Pending CN113435987A (zh) 2021-06-24 2021-06-24 一种金融领域的高风险用户动态识别方法及装置

Country Status (1)

Country Link
CN (1) CN113435987A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104331849A (zh) * 2014-11-13 2015-02-04 重庆大学 一种电力***风险分级方法及应用
CN108629680A (zh) * 2018-04-03 2018-10-09 中国农业银行股份有限公司 一种风险识别方法及***
CN111192131A (zh) * 2019-12-12 2020-05-22 上海淇玥信息技术有限公司 金融风险预测方法、装置和电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104331849A (zh) * 2014-11-13 2015-02-04 重庆大学 一种电力***风险分级方法及应用
CN108629680A (zh) * 2018-04-03 2018-10-09 中国农业银行股份有限公司 一种风险识别方法及***
CN111192131A (zh) * 2019-12-12 2020-05-22 上海淇玥信息技术有限公司 金融风险预测方法、装置和电子设备

Similar Documents

Publication Publication Date Title
Ferrer et al. Bias and discrimination in AI: a cross-disciplinary perspective
US20240078475A1 (en) Attributing reasons to predictive model scores with local mutual information
WO2017140222A1 (zh) 机器学习模型的建模方法及装置
CN107633265A (zh) 用于优化信用评估模型的数据处理方法及装置
CN111861698B (zh) 一种基于贷款多头数据的贷前审批预警方法及***
US11804302B2 (en) Supervised machine learning-based modeling of sensitivities to potential disruptions
CN112700324A (zh) 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法
CN112950347B (zh) 资源数据处理的优化方法及装置、存储介质、终端
CN111882420A (zh) 响应率的生成方法、营销方法、模型训练方法及装置
CN107392217B (zh) 计算机实现的信息处理方法及装置
Eddy et al. Credit scoring models: Techniques and issues
CN113313538A (zh) 用户消费能力预测方法、装置、电子设备和存储介质
CN108647714A (zh) 负面标签权重的获取方法、终端设备及介质
CN112328869A (zh) 一种用户贷款意愿的预测方法、装置及计算机***
CN112581291B (zh) 风险测评异动检测方法、装置、设备及存储介质
CN112200684A (zh) 一种检测医保欺诈的方法、***及存储介质
CN111382909A (zh) 基于生存分析模型扩展坏样本的拒绝推断方法及相关设备
CN113435987A (zh) 一种金融领域的高风险用户动态识别方法及装置
CN115713248A (zh) 对用于交易所的数据打分和评价的方法
CN114626940A (zh) 数据分析方法、装置及电子设备
CN114170000A (zh) ***用户风险类别识别方法、装置、计算机设备和介质
US11004156B2 (en) Method and system for predicting and indexing probability of financial stress
Kuznietsova et al. Business intelligence techniques for missing data imputation
CN112950350A (zh) 一种基于机器学习的贷款产品推荐方法及***
CN115099860A (zh) 房产评估方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination