CN115330522A - 基于聚类的***审批方法、装置、电子设备和介质 - Google Patents

基于聚类的***审批方法、装置、电子设备和介质 Download PDF

Info

Publication number
CN115330522A
CN115330522A CN202210991776.9A CN202210991776A CN115330522A CN 115330522 A CN115330522 A CN 115330522A CN 202210991776 A CN202210991776 A CN 202210991776A CN 115330522 A CN115330522 A CN 115330522A
Authority
CN
China
Prior art keywords
user
credit card
characteristic data
data
potential risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210991776.9A
Other languages
English (en)
Inventor
汪辰
胡永峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202210991776.9A priority Critical patent/CN115330522A/zh
Publication of CN115330522A publication Critical patent/CN115330522A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种基于聚类的***审批方法、装置、电子设备和介质,其方法包括:获取优良用户和坏账用户分别对应的特征数据;对所述特征数据进行聚类得到若干个类簇,其中,所述优良用户的特征数据用第一颜色点表征,所述坏账用户的特征数据用第二颜色点表征;根据所述类簇中的特征数据分析得到对应的可信发放范围;判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***。本发明减少风险借贷事件的概率,降低***发放后坏账的概率,大大提升银行的资金的安全性。

Description

基于聚类的***审批方法、装置、电子设备和介质
技术领域
本发明涉及数据处理技术领域,进一步地涉及基于聚类的***审批方法、装置、电子设备和介质。
背景技术
随着人们生活水平的不断提高,对于消费的需求日益提高。在此前景下,***的出现,解决了大部分人员的消费需求。
当然,随着***的普及,越来越多的消费者使用***进行消费,而***推荐为用户办理***带来了很多便利。目前,***推荐方法通常是,直接将可以办理的***推荐给用户,这种方式无法根据用户的个性化需求进行精准的推荐,导致推荐准确性差、推荐失败率高。
发明内容
本发明实施例的目的是提供一种基于聚类的***审批方法、装置、电子设备及计算机可读存储介质,降低***的审批风险和提升***的自动审批效率的效果。
在第一方面,为实现上述目的,本发明实施例提供了一种基于聚类的***审批方法,包括:
获取优良用户和坏账用户分别对应的特征数据;
对所述特征数据进行聚类得到若干个类簇,其中,所述优良用户的特征数据用第一颜色点表征,所述坏账用户的特征数据用第二颜色点表征;
根据所述类簇中的特征数据分析得到对应的可信发放范围;
判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***;
其中,所述潜在风险用户包括征信报告良好、不存在违法行为中的任意一种或多种行为类型的用户。
在第二方面,为了解决相同的技术问题,本发明实施例提供了一种基于聚类的***审批装置,包括:
数据获取模块,用于获取优良用户和坏账用户分别对应的特征数据;
聚类处理模块,用于对所述特征数据进行聚类得到若干个类簇,其中,所述优良用户的特征数据用第一颜色点表征,所述坏账用户的特征数据用第二颜色点表征;
分析模块,用于根据所述类簇中的特征数据分析得到对应的可信发放范围;
处理模块,用于判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***;
其中,所述潜在风险用户包括征信报告良好、不存在违法行为中的任意一种或多种行为类型的用户。
在第三方面,为了解决相同的技术问题,本发明实施例提供了一种电子设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述存储器与所述处理器耦接,且所述处理器执行所述计算机程序时,实现上述任一项所述的基于聚类的***审批方法中的步骤。
在第四方面,为了解决相同的技术问题,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在的设备执行上述任一项所述的基于聚类的***审批方法中的步骤。
本发明实施例提供了一种基于聚类的***审批方法、装置、电子设备及计算机可读存储介质,根据优良用户和坏账用户分别对应的特征数据进行聚类处理,并根据聚类结果分析得到对应的可信发放范围,判断潜在风险用户的特征数据是否在可信发放范围内,进而依据判断结果决定是否来决定是否向该潜在风险用户发放***,这样银行能够降低***发放后坏账的概率,大大提升银行的资金的安全性。此外,提升银行用户对***申请的可信度的同时,还能降低了银行信贷的管理成本和风险,更保障了银行的权益。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对本发明的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1为本申请实施例提供的基于聚类的***审批方法的一种流程示意图;
图2为本申请实施例提供的基于聚类的***审批方法的另一种流程示意图;
图3为本申请实施例提供的基于聚类的***审批方法的另一种流程示意图;
图4为本申请实施例提供的基于聚类的***审批方法的另一种流程示意图;
图5为本申请实施例提供的基于聚类的***审批方法的另一种流程示意图;
图6为本申请实施例提供的基于聚类的***审批方法的另一种流程示意图;
图7为本申请实施例提供的基于聚类的***审批方法的另一种流程示意图;
图8为本申请实施例提供的电子设备的一种结构示意图;
图9为本申请实施例提供的电子设备的另一种结构示意图;
图10为本申请实施例提供的基于聚类的***审批方法中优良用户的特征数据、坏账用户的特征数据聚类后,通过白点、黑点进行颜色标记的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定***结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中,省略对众所周知的***、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
不存在违法行为的用户是指没有违反国家现行法律规定,危害法律所保护的社会关系的行为的用户。征信报告良好包括两种类型,分别为无信贷申请记录的用户或者无征信问题的用户。
无信贷申请记录的用户是指没有任何一家银行机构发放的信贷记录的用户,而因为信贷都会纳入征信报告,因此,可以从个人征信报告首页上查询用户是否有信贷申请记录(例如***申请记录、房贷申请记录等),当然,也可以通过云闪付的后台服务器查询用户在所有银行机构是否有信贷申请记录,如果没有则确定该用户为无信贷申请记录的用户。
无征信问题的用户是指虽然用户存在信贷(例如***、花呗等)的记录,但是不存在逾期还款记录的用户。可以从个人征信报告首页上查询用户的征信报告,进而根据征信报告中的还款记录判断该用户是否为无征信问题的用户。从某一种角度来说,无信贷申请记录的用户因为无需按时还款,因此无信贷申请记录也属于征信报告良好的一种。
请参见图1,图1为本发明实施例提供的基于聚类的***审批方法的一种流程示意图,包括步骤S101至步骤S104。
S101获取优良用户和坏账用户分别对应的特征数据;
具体的,商业信用的高度发展是市场经济的重要特征之一,商业信用的发展在为企业带来销售收入的增加的同时,不可避免地导致坏账的发生。坏账是指无法收回或收回的可能性极小的应收款项,死账也可称为坏账。坏账用户指得就是未向银行等金融机构交还应还款项的用户,而优良用户则是指征信报告良好,按时向银行等金融机构交还应还款项的用户。其中,优良用户(即非坏账用户)可以包括按时还款且逾期还款记录为零的用户,以提升的***风险识别的全面性。当然,良用户最优的是已完成信贷还款的用户,以提升***风险识别的准确率。
请参见图2,图2为本发明实施例提供的基于聚类的***审批方法中获取优良用户和坏账用户分别对应的特征数据的流程示意图,包括步骤S201至步骤S203。
S201获取***的历史申请记录,所述历史申请记录包括所述优良用户和所述坏账用户的用户属性数据;
具体的,可以从银行***服务器的***数据库中调取大量的***的历史申请记录,而历史申请记录包括优良用户的用户属性数据以及坏账用户的用户属性数据。
其中,用户属性数据包括个人信息和行为信息,其中,个人信息包括但是不限于身份信息、生理信息、征信报告和喜好信息中的一种或多种。行为信息包括但是不限于社交信息、消费记录、交易记录中的一种或者多种。
其中,身份信息包括身份ID(例如身份证号码)、职业、婚姻状况、年龄,籍贯等。候选用户和目标用户的身份信息均可以从银行的***数据库中调取,当然,也可以根据身份ID从第三方数据库(例如人力资源管理部门的数据服务器)调取候选用户和目标用户的身份信息。
其中,生理信息包括身高、体重、疾病史等。候选用户和目标用户的生理信息均可以从医疗机构(例如医院或者体检机构)的患者数据库中调取,其他获取生理信息的方式亦在本发明保护范围之内。
其中,征信报告包括用户的违约记录或者逾期记录、还款记录、还款时间等。候选用户和目标用户的征信报告均可以从中国人民银行征信中心的数据服务器中调取,其他获取征信报告的方式亦在本发明保护范围之内。
其中,喜好信息包括运动喜好、购物喜好、娱乐喜好等。候选用户和目标用户的喜好信息均可以从用户通过应用程序(例如浏览器、购物APP、视频APP等)的程序开发商的服务器中爬取分析得到,其他获取喜好信息的方式亦在本发明保护范围之内。
其中,社交信息可以是社交平台,例如论坛上的帖子内容,用户评论等,也可以是即时通讯平台(例如QQ群、微信群等)的聊天室内容,也可以是视频软件(例如腾讯视频等)的弹幕内容。候选用户和目标用户的社交信息均可以从用户预定的社交服务器例如为微博服务器、微信服务器或者QQ服务器等处获取,社交账号与社交服务器对应,例如为微博账号、微信账号或者QQ账号等。
其中,消费记录包括日常消费记录(即非信用消费的记录,例如日常购物的消费信息)和信用消费记录等。候选用户和目标用户的日常消费记录均可以从第三方支付工具(例如支付宝余额、微信零钱等)的第三方服务器中获取,当然,候选用户和目标用户的日常消费记录还可以直接从银行卡(即借记卡)服务器中获取。而候选用户和目标用户的信用消费记录均可以从第三方支付工具(例如支付宝花呗等)的第三方服务器中获取,当然,候选用户和目标用户的信用消费记录还可以直接从***服务器中获取。当然,其他获取消费记录的方式亦在本发明保护范围之内。
其中,交易记录包括交易金额、交易时间等,候选用户和目标用户的交易记录均可以从第三方支付工具(例如支付宝、微信等)的第三方服务器中获取,当然,候选用户和目标用户的交易记录还可以直接从银行服务器中获取。当然,其他获取交易记录的方式亦在本发明保护范围之内。
S202将所述优良用户和所述坏账用户的用户属性数据进行清洗处理;
具体的,对优良用户的用户属性数据和坏账用户的用户属性数据进行数据清洗,即对原始的用户属性数据中的重复数据、异常数据和无效数据进行清除,具体实现方法可以是对原始的用户属性数据通过孤立森林方法进行异常值检测,并清除重复数据、异常数据(包括不完整数据和错误数据等)和无效数据。
S203根据清洗处理后的优良用户和坏账用户的用户属性数据,提取得到对应的特征数据。
具体的,特征数据包括但是不限于身份特征(例如职业特征)、生理特征、信用度、偏好特征、社交类型特征(例如主动社交类型和被动社交类型)、消费特征、收入特征、交易特征和***意向特征中的任意一种或多种。本实施例中使用清洗处理后的用户属性数据进行特征提取,能够大大减少聚类的数据量,以便提高对用户属性数据的聚类效率,进而间接提升对于***的自动审批效率。
S102对所述特征数据进行聚类得到若干个类簇,其中,所述优良用户的特征数据用第一颜色点表征,所述坏账用户的特征数据用第二颜色点表征;
具体的,第一颜色点和第二颜色点是RGB色值相差很大的特征数据对应的点数据。例如,如图10所示,包括多个类簇3,当第一颜色点2是白点时第二颜色点1可以是黑点。当然,如果第一颜色点是红点时第二颜色点也可以是蓝点或者绿色。
采用聚类方法将优良用户的特征数据以及坏账用户的特征数据中,同一属性的特征词聚类在一起得到若干个类簇。其中,聚类(Cluster)算法又称群分析,它是样品或指标分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法,聚类算法包括但不限于:K均值(K-Means)聚类算法、均值漂移聚类算法、基于密度的聚类(Density-BasedSpatial Clustering ofApplications with Noise,DBSCAN)方法、基于高斯混合模型的最大期望聚类、凝聚层次聚类和图团体检测(Graph Community Detection)算法等。本发明所采用的聚类方法包括k-mean聚类算法、ST-DBSCAN算法(属于基于密度的空间聚类算法的一种)等。
根据本发明实施例提供的技术方案,通过不同的可视化颜色展现优良用户、坏账用户的特征数据,不仅实现了对特征数据的有效区分,丰富了展现形式,并且能够通过展现的颜色能够直观地了解优良用户和坏账用户之间特征数据的区别。
请参见图3,图3为本发明实施例提供的基于聚类的***审批方法中对所述特征数据进行聚类得到若干个类簇的流程示意图,包括步骤S301至步骤S204。
S301对所述特征数据设置用户类型标签;所述用户类型标签包括优良用户标签和坏账用户标签;
S302根据预设聚类算法将打标后的特征数据,按照所述特征数据的特征类型进行聚类得到对应的类簇;
S303将所述类簇中设有所述优良用户标签的特征数据对应的点数据,根据所述第一颜色进行标记得到所述第一颜色点;
S304将所述类簇中设有所述坏账用户标签的特征数据对应的点数据,根据所述第二颜色进行标记得到所述第二颜色点。
具体的,将全部的标记有优良用户标签的打标后的特征数据标记为预定的第一颜色,进而获得显示为第一颜色的特征数据对应的第一类点数据。将全部的标记有坏账用户标签的打标后的特征数据标记为预定的第二颜色,进而获得显示为第二颜色的特征数据对应的第二类点数据。这样,可以将优良用户的特征数据对应的点数据与坏账用户的特征数据对应的点数据显著地区分出来,并在视觉显示形成对比。
本实施例通过为提取的优良用户、坏账用户的特征数据进行颜色标注处理,这种以颜色区分优良用户对应的特征数据和坏账用户对应的特征数据的方式,可以将颜色与特征数据相关联,使得颜色不仅具有传统的客观定义,还可以在后期使得工作人员便于通过这种颜色标注可视化地观察、展示和分析优良用户和坏账用户之间特征数据的区别。
S103根据所述类簇中的特征数据分析得到对应的可信发放范围;
请参见图4,图4为本发明实施例提供的基于聚类的***审批方法中根据所述类簇中的特征数据分析得到对应的可信发放范围的流程示意图,包括步骤S401至步骤S403。
S401从所述类簇中查找出全部为第一颜色点的目标类簇,按照预设赋值映射表对所述目标类簇中各个特征数据进行赋值处理;
具体的,特征数据包括但是不限于身份特征(例如职业特征)、生理特征、收入特征、信用度、偏好特征、社交类型特征(例如主动社交类型和被动社交类型)、消费特征、交易特征中的任意一种或多种。甚至,由于某些黑产团伙会非法购买姓名、身份证号和大头照,并使用软件非法破解***的审批流程伪造盗用他人身份申请***使用,因此,本申请的***的审批流程还可以获取申请场景图片,根据申请场景图片获取申请环境特征。
预设赋值映射表设置有各种特征数据与不同设定数值的对应关系。其中,如果特征数据就是数值时,那么对特征数据的赋值处理就是赋值结果等于特征数据的数值。示例性的,特征数据为收入特征时,对某一优良用户的月收入为1.2万进行赋值就是月收入1.2万不变。示例性的,特征数据为信用度(例如支付宝的芝麻分也可算为信用度)时,对某一优良用户的芝麻分为745分进行赋值就是745分不变。
当然,如果特征数据不是数值而是一种属性时,那么根据属性等级大小按照正相关方式进行赋值。示例性的,特征数据为职业特征时,某一优良用户的职业特征为公司高层总管时,由于公司高层总管属于高收入群体,因此对该优良用户的职业特征即公司高层总管进行赋值得到A1。例如,某一优良用户的职业特征为医生时,由于医生属于中收入群体,因此对该优良用户的职业特征即中进行赋值得到A2,且A1大于A2。
S402根据所述目标类簇中各个特征数据的赋值数值,统计得到当前特征数据分别对应的第一最大值和第一最小值;
S403根据所述当前特征数据分别对应的第一最大值和第一最小值,得到所述当前特征数据对应的可信发放范围;
S403根据所述当前特征数据分别对应的第一最大值和第一最小值,得到所述当前特征数据对应的可信发放范围。
具体的,通过上述方式进行赋值处理得到目标类簇中不同特征参数分别对应的赋值数值后,将当前特征数据对应的所有赋值数值进行大小排序,这样就可以查找出目标类簇中当前特征数据分别对应的第一最大值和第一最小值,也就是说,查找出属于优良用户的当前特征数据中的最大值就是第一最大值,找出属于优良用户的当前特征数据中的最小值就是第一最小值。最后,由于目标类簇中全部为第一颜色点,也就是说,目标类簇中的点数据全部都是优良用户的特征数据,因此,查找出来的第一最大值和第一最小值就是当前特征数据的可信发放范围(或区间)的边界值。
示例性的,延续上述实施例,假设特征数据为收入特征时,目标类簇中的月收入最大值为3万,月收入最小值为1.2万,那么收入特征对应的可信发放范围为月收入1.2万至2万。
请参见图5,图5为本发明实施例提供的基于聚类的***审批方法中根据所述类簇中的特征数据分析得到对应的可信发放范围的流程示意图,包括步骤S501至步骤S505。
S501从所述类簇中查找出全部为第二颜色点的目标类簇,按照预设赋值映射表对所述参考类簇中各个特征数据进行赋值处理;
S502根据所述参考类簇中各个特征数据的赋值数值,获得当前特征数据分别对应的第二最大值和第二最小值以得到风险发放范围;
具体的,参照图4所示的实施例,通过上述方式进行赋值处理得到参照类簇中不同特征参数分别对应的赋值数值后,将当前特征数据对应的所有赋值数值进行大小排序,这样就可以查找出参照类簇中当前特征数据分别对应的第二最大值和第二最小值,也就是说,查找出属于坏账用户的当前特征数据中的最大值就是第二最大值,找出属于坏账用户的当前特征数据中的最小值就是第二最小值。最后,由于坏账类簇中全部为第二颜色点,也就是说,坏账类簇中的点数据全部都是坏账用户的特征数据,因此,查找出来的第二最大值和第二最小值就是当前特征数据的不可信发放范围(或区间)的边界值。
S503将所述可信发放范围和风险发放范围进行交集计算得到最终的可信发放范围。
具体的,将可信发放范围和风险发放范围进行交集计算,也就是说比较当前特征数据对应的第一最大值和第二最大值之间的大小得到第一比较结果,并且,比较当前特征数据对应的第一最小值和第二最小值之间的大小得到第二比较结果。然后,根据当前特征数据对应的第一比较结果和第二比较结果,得到当前特征数据所对应的最终的可信发放范围。
示例性的,延续上述实施例,假设特征数据为收入特征时,目标类簇中的月收入最大值为3万,月收入最小值为1.2万,也就是说初始可信发放范围为月收入[1.2万,3万],然而,参考类簇中的月收入最大值为1万,月收入最小值为0.5万,也就是说风险发放范围为月收入[0.5万,1万],那么进行交集计算可以得到收入特征对应的可信发放范围为月收入[1.2万,3万]。当然,如果参考类簇中的月收入最大值为1.5万,月收入最小值为0.3万,也就是说风险发放范围为月收入[0.3万,1.5万],那么进行交集计算可以得到收入特征对应的可信发放范围为月收入[1.5万,3万]。
S404切换获取下一特征数据的可信发放范围,直至分析得到所有特征数据分别对应的可信发放范围为止。
S104判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***;
其中,所述潜在风险用户包括征信报告良好、不存在违法行为中的任意一种或多种行为类型的用户。
具体的,***申请请求包括用户的身份证号码,后台服务器可以根据身份证号码查询发起申请请求的用户是否是潜在风险用户,如果发起申请请求的用户属于潜在风险用户,那么后台服务器就可以从第三方网站、征信中心服务器、银行***等爬取潜在风险用户的用户属性数据,进而对潜在风险用户的用户属性数据进行分析提取得到潜在风险用户的特征数据。一旦获取到潜在风险用户的特征数据后,判断潜在风险用户的特征数据是否在可信发放范围内,进而根据判断结果决定是否为潜在风险用户发放其所申请的***。
请参见图6,图6为本发明实施例提供的基于聚类的***审批方法中判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***的流程示意图,包括步骤S601至步骤S605。
S601获取所述潜在风险用户的用户属性数据;
S602根据所述用户属性数据提取得到所述潜在风险用户的特征数据;
S603按照预设赋值映射表对所述潜在风险用户的特征数据进行赋值处理;
S604判断所述潜在风险用户的特征数据对应的待定赋值数值是否在对应的可信发放范围之内;
S605根据所述特征数据对应的权重系数和所述判断结果决定是否向所述潜在风险用户发放***。
具体的,参照上述实施例获取潜在风险用户的用户属性数据和特征数据,并参照上述实施例按照预设赋值映射表对潜在风险用户的特征数据进行赋值处理。然后,判断潜在风险用户的特征数据对应的待定赋值数值是否在对应的可信发放范围之内,最后,根据特征数据对应的权重系数和判断结果决定是否向潜在风险用户发放***。
请参见图7,图7为本发明实施例提供的基于聚类的***审批方法中根据所述特征数据对应的权重系数和所述判断结果决定是否向所述潜在风险用户发放***的流程示意图,包括步骤S701至步骤S706。
S701若所述潜在风险用户的特征数据为一种,且所述待定赋值数值在对应的可信发放范围之外,拒绝向所述潜在风险用户发放***;
S702若所述潜在风险用户的特征数据为一种,且所述待定赋值数值在对应的可信发放范围之内,允许向所述潜在风险用户发放***;
S703若所述潜在风险用户的特征数据为至少两种,将所述潜在风险用户的特征数据对应的权重系数和所述判断结果进行加权计算得到评估分数;
S704比较所述评估分数与预设分数阈值的大小;
S705若所述评估分数低于所述预设分数阈值,拒绝向所述潜在风险用户发放***;
S706若所述评估分数高于所述预设分数阈值,允许向所述潜在风险用户发放***。
具体的,特征数据对应的权重系数与特征数据在整体数据集(包括优良用户的所有特征数据,以及坏账用户的所有特征数据)中的出现频次呈正相关,即特征数据的出现频次越大那么其对应的权重系数越大。分别统计各个特征数据在整体数据集中的出现频次,判断当前特征数据的出现统计是否超过预设频次阈值,如果超过预设频次阈值说明去除当前特征数据有利于聚类,如果不超过预设频次阈值说明当前特征数据是不利于聚类的无关或噪声的特征数据,表示当前特征数据对聚类的负作用越大。由此可知,可以通过统计特征数据的出现频次对特征集中的所有特征数据进行大小排序,根据排序的大小设置的特征数据对应的权重系数的大小。然后,将所述潜在风险用户的特征数据对应的权重系数和所述判断结果进行加权计算得到评估分数,比较评估分数与预设分数阈值的大小,如果所述评估分数低于所述预设分数阈值,拒绝向所述潜在风险用户发放***,当然,如果若所述评估分数高于所述预设分数阈值,允许向所述潜在风险用户发放***。
众所周知,由于用户在不同阶段的行为观念可能会产生变化,即用户此前从无逾期或者违法行为,但是可能因为外界或者个人原因需要申请***进行超前消费且无还款意愿,这样的用户会给银行造成极大的损失。因此,本发明根据优良用户和坏账用户分别对应的特征数据进行聚类处理,并根据聚类结果分析得到对应的可信发放范围,判断潜在风险用户的特征数据是否在可信发放范围内,进而依据判断结果决定是否来决定是否向该潜在风险用户发放***,这样银行能够降低***发放后坏账的概率,大大提升银行的资金的安全性。此外,提升银行用户对***申请的可信度的同时,还能降低了银行信贷的管理成本和风险,更保障了银行的权益。
本发明避免了当前业内所采用的人工核查方式对用户的***申请请求进行审批的情况,不仅极大的节省了人力物力,同时还提高了审批效率,避免了因人工评估时间过长,导致放贷效率降低的情况出现。同时根据优良用户和坏账用户分别对应的特征数据进行聚类处理,并根据聚类结果分析得到对应的可信发放范围,判断潜在风险用户的特征数据是否在可信发放范围内,进而依据判断结果决定是否来决定是否向该潜在风险用户发放***,极大的提高了风险评估效率和评估准确度。
根据上述实施例所描述的方法,本实施例将从基于聚类的***审批装置的角度进一步进行描述,该基于聚类的***审批装置具体可以作为独立的实体来实现,也可以集成在电子设备,比如终端中来实现,该终端可以包括手机、平板电脑等。
另外,本申请还提供一种基于聚类的***审批装置,包括:
数据获取模块,用于获取优良用户和坏账用户分别对应的特征数据;
聚类处理模块,用于对所述特征数据进行聚类得到若干个类簇,其中,所述优良用户的特征数据用第一颜色点表征,所述坏账用户的特征数据用第二颜色点表征;
分析模块,用于根据所述类簇中的特征数据分析得到对应的可信发放范围;
处理模块,用于判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***;
其中,所述潜在风险用户包括征信报告良好、不存在违法行为中的任意一种或多种行为类型的用户。
具体实施时,以上各个模块和/或单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块和/或单元的具体实施可参见前面的方法实施例,具体可以达到的有益效果也请参看前面的方法实施例中的有益效果,在此不再赘述。
另外,请参见图8,图8为本发明实施例提供的电子设备的一种结构示意图,该电子设备可以是移动终端如智能手机、平板电脑等设备。如图8所示,电子设备800包括处理器801、存储器802。其中,处理器801与存储器802电性连接。
处理器801是电子设备800的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器802内的应用程序,以及调用存储在存储器802内的数据,执行电子设备800的各种功能和处理数据,从而对电子设备800进行整体监控。
在本实施例中,电子设备800中的处理器801会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器802中,并由处理器801来运行存储在存储器802中的应用程序,从而实现各种功能:
获取优良用户和坏账用户分别对应的特征数据;
对所述特征数据进行聚类得到若干个类簇,其中,所述优良用户的特征数据用第一颜色点表征,所述坏账用户的特征数据用第二颜色点表征;
根据所述类簇中的特征数据分析得到对应的可信发放范围;
判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***;
其中,所述潜在风险用户包括征信报告良好、不存在违法行为中的任意一种或多种行为类型的用户。
该电子设备800可以实现本发明实施例所提供的基于聚类的***审批方法任一实施例中的步骤,因此,可以实现本发明实施例所提供的任一基于聚类的***审批方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
请参见图9,图9示出了本申请实施例提供的电子设备的具体结构框图,该电子设备可以用于实施上述实施例中提供的基于聚类的***审批方法。该电子设备900可以为移动终端如智能手机或笔记本电脑等设备。
RF电路910用于接收以及发送电磁波,实现电磁波与电信号的相互转换,从而与通讯网络或者其他设备进行通讯。RF电路910可包括各种现有的用于执行这些功能的电路元件,例如,天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。RF电路910可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。上述的无线网络可包括蜂窝式电话网、无线局域网或者城域网。上述的无线网络可以使用各种通信标准、协议及技术,包括但并不限于全球移动通信***(Global System for Mobile Communication,GSM)、增强型移动通信技术(Enhanced DataGSM Environment,EDGE),宽带码分多址技术(Wideband Code Division MultipleAccess,WCDMA),码分多址技术(Code Division Access,CDMA)、时分多址技术(TimeDivision Multiple Access,TDMA),无线保真技术(Wireless Fidelity,Wi-Fi)(如美国电气和电子工程师协会标准IEEE802.11a,IEEE 802.11b,IEEE802.11g和/或IEEE 802.11n)、网络电话(Voice over Internet Protocol,VoIP)、全球微波互联接入(WorldwideInteroperability for Microwave Access,Wi-Max)、其他用于邮件、即时通讯及短消息的协议,以及任何其他合适的通讯协议,甚至可包括那些当前仍未被开发出来的协议。
存储器920可用于存储软件程序以及模块,如上述实施例中基于聚类的***审批方法对应的程序指令/模块,处理器980通过运行存储在存储器920内的软件程序以及模块,从而执行基于聚类的***审批流程如下:
获取优良用户和坏账用户分别对应的特征数据;
对所述特征数据进行聚类得到若干个类簇,其中,所述优良用户的特征数据用第一颜色点表征,所述坏账用户的特征数据用第二颜色点表征;
根据所述类簇中的特征数据分析得到对应的可信发放范围;
判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***;
其中,所述潜在风险用户包括征信报告良好、不存在违法行为中的任意一种或多种行为类型的用户。
存储器920可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器920可进一步包括相对于处理器980远程设置的存储器,这些远程存储器可以通过网络连接至电子设备900。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入单元930可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,输入单元930可包括触敏表面931以及其他输入设备932。触敏表面931,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面931上或在触敏表面931附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面931可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器980,并能接收处理器980发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面931。除了触敏表面931,输入单元930还可以包括其他输入设备932。具体地,其他输入设备932可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元940可用于显示由用户输入的信息或提供给用户的信息以及电子设备900的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元940可包括显示面板941,可选的,可以采用LCD(Liquid Crystal Display,液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板941。进一步的,触敏表面931可覆盖显示面板941,当触敏表面931检测到在其上或附近的触摸操作后,传送给处理器980以确定触摸事件的类型,随后处理器980根据触摸事件的类型在显示面板941上提供相应的视觉输出。虽然在图中,触敏表面931与显示面板941是作为两个独立的部件来实现输入和输出功能,但是在某些实施例中,可以将触敏表面931与显示面板941集成而实现输入和输出功能。
电子设备900还可包括至少一种传感器950,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板941的亮度,接近传感器可在翻盖合上或者关闭时产生中断。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备900还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路960、扬声器961,传声器962可提供用户与电子设备900之间的音频接口。音频电路960可将接收到的音频数据转换后的电信号,传输到扬声器961,由扬声器961转换为声音信号输出;另一方面,传声器962将收集的声音信号转换为电信号,由音频电路960接收后转换为音频数据,再将音频数据输出处理器980处理后,经RF电路910以发送给比如另一终端,或者将音频数据输出至存储器920以便进一步处理。音频电路960还可能包括耳塞插孔,以提供外设耳机与电子设备900的通信。
电子设备900通过传输模块970(例如Wi-Fi模块)可以帮助用户接收请求、发送信息等,它为用户提供了无线的宽带互联网访问。虽然图中示出了传输模块970,但是可以理解的是,其并不属于电子设备900的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器980是电子设备900的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器920内的软件程序和/或模块,以及调用存储在存储器920内的数据,执行电子设备900的各种功能和处理数据,从而对电子设备进行整体监控。可选的,处理器980可包括一个或多个处理核心;在一些实施例中,处理器980可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解地,上述调制解调处理器也可以不集成到处理器980中。
电子设备900还包括给各个部件供电的电源990(比如电池),在一些实施例中,电源可以通过电源管理***与处理器980逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源990还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,电子设备900还包括摄像头(如前置摄像头、后置摄像头)、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备的显示单元是触摸屏显示器,移动终端还包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行一个或者一个以上程序包含用于进行以下操作的指令:
获取优良用户和坏账用户分别对应的特征数据;
对所述特征数据进行聚类得到若干个类簇,其中,所述优良用户的特征数据用第一颜色点表征,所述坏账用户的特征数据用第二颜色点表征;
根据所述类簇中的特征数据分析得到对应的可信发放范围;
判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***;
其中,所述潜在风险用户包括征信报告良好、不存在违法行为中的任意一种或多种行为类型的用户。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个模块的具体实施可参见前面的方法实施例,在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。为此,本申请实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的基于聚类的***审批方法中任一实施例的步骤。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的基于聚类的***审批方法任一实施例中的步骤,因此,可以实现本申请实施例所提供的任一基于聚类的***审批方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种基于聚类的***审批、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。并且,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本申请的保护范围。

Claims (10)

1.一种基于聚类的***审批方法,其特征在于,包括:
获取优良用户和坏账用户分别对应的特征数据;
对所述特征数据进行聚类得到若干个类簇,其中,所述优良用户的特征数据用第一颜色点表征,所述坏账用户的特征数据用第二颜色点表征;
根据所述类簇中的特征数据分析得到对应的可信发放范围;
判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***;
其中,所述潜在风险用户包括征信报告良好、不存在违法行为中的任意一种或多种行为类型的用户。
2.根据权利要求1所述的基于聚类的***审批方法,其特征在于,所述获取优良用户和坏账用户分别对应的特征数据包括步骤:
获取***的历史申请记录,所述历史申请记录包括所述优良用户和所述坏账用户的用户属性数据;
将所述优良用户和所述坏账用户的用户属性数据进行清洗处理;
根据清洗处理后的优良用户和坏账用户的用户属性数据,提取得到对应的特征数据。
3.根据权利要求1所述的基于聚类的***审批方法,其特征在于,所述对所述特征数据进行聚类得到若干个类簇包括步骤:
对所述特征数据设置用户类型标签;所述用户类型标签包括优良用户标签和坏账用户标签;
根据预设聚类算法将打标后的特征数据,按照所述特征数据的特征类型进行聚类得到对应的类簇;
将所述类簇中设有所述优良用户标签的特征数据对应的点数据,根据所述第一颜色进行标记得到所述第一颜色点;
将所述类簇中设有所述坏账用户标签的特征数据对应的点数据,根据所述第二颜色进行标记得到所述第二颜色点。
4.根据权利要求3所述的基于聚类的***审批方法,其特征在于,所述根据所述类簇中的特征数据分析得到对应的可信发放范围包括步骤:
从所述类簇中查找出全部为第一颜色点的目标类簇,按照预设赋值映射表对所述目标类簇中各个特征数据进行赋值处理;
根据所述目标类簇中各个特征数据的赋值数值,统计得到当前特征数据分别对应的第一最大值和第一最小值;
根据所述当前特征数据分别对应的第一最大值和第一最小值,得到所述当前特征数据对应的可信发放范围;
切换获取下一特征数据的可信发放范围,直至分析得到所有特征数据分别对应的可信发放范围为止。
5.根据权利要求4所述的基于聚类的***审批方法,其特征在于,所述根据所述不同的特征数据分别对应的第一最大值和第一最小值,得到各个特征数据对应的可信发放范围包括步骤:
从所述类簇中查找出全部为第二颜色点的目标类簇,按照预设赋值映射表对所述参考类簇中各个特征数据进行赋值处理;
根据所述参考类簇中各个特征数据的赋值数值,获得当前特征数据分别对应的第二最大值和第二最小值以得到风险发放范围;
将所述可信发放范围和风险发放范围进行交集计算得到最终的可信发放范围。
6.根据权利要求1-5任一项所述的基于聚类的***审批方法,其特征在于,所述判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***包括步骤:
获取所述潜在风险用户的用户属性数据;
根据所述用户属性数据提取得到所述潜在风险用户的特征数据;
按照预设赋值映射表对所述潜在风险用户的特征数据进行赋值处理;
判断所述潜在风险用户的特征数据对应的待定赋值数值是否在对应的可信发放范围之内;
根据所述特征数据对应的权重系数和所述判断结果决定是否向所述潜在风险用户发放***。
7.根据权利要求6所述的基于聚类的***审批方法,其特征在于,所述根据所述特征数据对应的权重系数和所述判断结果决定是否向所述潜在风险用户发放***包括步骤:
若所述潜在风险用户的特征数据为一种,且所述待定赋值数值在对应的可信发放范围之外,拒绝向所述潜在风险用户发放***;
若所述潜在风险用户的特征数据为一种,且所述待定赋值数值在对应的可信发放范围之内,允许向所述潜在风险用户发放***;
若所述潜在风险用户的特征数据为至少两种,将所述潜在风险用户的特征数据对应的权重系数和所述判断结果进行加权计算得到评估分数;
比较所述评估分数与预设分数阈值的大小;
若所述评估分数低于所述预设分数阈值,拒绝向所述潜在风险用户发放***;
若所述评估分数高于所述预设分数阈值,允许向所述潜在风险用户发放***。
8.一种基于聚类的***审批装置,其特征在于,包括:
数据获取模块,用于获取优良用户和坏账用户分别对应的特征数据;
聚类处理模块,用于对所述特征数据进行聚类得到若干个类簇,其中,所述优良用户的特征数据用第一颜色点表征,所述坏账用户的特征数据用第二颜色点表征;
分析模块,用于根据所述类簇中的特征数据分析得到对应的可信发放范围;
处理模块,用于判断潜在风险用户的特征数据是否在所述可信发放范围内,根据判断结果决定是否向所述潜在风险用户发放***;
其中,所述潜在风险用户包括征信报告良好、不存在违法行为中的任意一种或多种行为类型的用户。
9.一种电子设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述存储器与所述处理器耦接,且所述处理器执行所述计算机程序时,实现如权利要求1至7任一项所述的基于聚类的***审批方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在的设备执行如权利要求1至7任一项所述的基于聚类的***审批方法中的步骤。
CN202210991776.9A 2022-08-17 2022-08-17 基于聚类的***审批方法、装置、电子设备和介质 Pending CN115330522A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210991776.9A CN115330522A (zh) 2022-08-17 2022-08-17 基于聚类的***审批方法、装置、电子设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210991776.9A CN115330522A (zh) 2022-08-17 2022-08-17 基于聚类的***审批方法、装置、电子设备和介质

Publications (1)

Publication Number Publication Date
CN115330522A true CN115330522A (zh) 2022-11-11

Family

ID=83926139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210991776.9A Pending CN115330522A (zh) 2022-08-17 2022-08-17 基于聚类的***审批方法、装置、电子设备和介质

Country Status (1)

Country Link
CN (1) CN115330522A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116882936A (zh) * 2023-07-26 2023-10-13 新南(北京)科技有限公司 基于经费卡的经费管理方法及***

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116882936A (zh) * 2023-07-26 2023-10-13 新南(北京)科技有限公司 基于经费卡的经费管理方法及***

Similar Documents

Publication Publication Date Title
CN109961296A (zh) 商户类型识别方法及装置
CN107230133B (zh) 一种数据处理方法、设备和计算机存储介质
WO2021120875A1 (zh) 搜索方法、装置、终端设备及存储介质
CN110225104A (zh) 数据获取方法、装置及终端设备
CN110516967A (zh) 一种信息评估的方法以及相关装置
CN110503409B (zh) 信息处理的方法以及相关装置
CN115271931A (zh) 一种***产品的推荐方法、装置、电子设备和介质
CN108833661A (zh) 一种信息的显示方法及移动终端
CN113190646A (zh) 一种用户名样本的标注方法、装置、电子设备及存储介质
CN114726947A (zh) 消息展示方法、装置、用户终端及可读存储介质
CN111951021B (zh) 一种可疑社团的发现方法和装置、存储介质及计算机设备
CN115330522A (zh) 基于聚类的***审批方法、装置、电子设备和介质
CN110796552A (zh) 一种风险提示方法及装置
CN114626036B (zh) 基于人脸识别的信息处理方法、装置、存储介质及终端
CN112966756A (zh) 一种可视化的准入规则的生成方法、装置、机器可读介质及设备
CN116307394A (zh) 产品用户体验评分方法、装置、介质及设备
CN116959059A (zh) 一种活体检测的方法、装置以及存储介质
CN115496609A (zh) 基于理财产品的数据处理方法、装置、设备及存储介质
CN114840570A (zh) 数据处理方法、装置、电子设备及存储介质
CN115497252A (zh) 自助设备的预警方法、装置、计算机设备、存储介质
CN109993337A (zh) 一种金融产品实时管理方法、装置和服务器
CN109739998B (zh) 一种信息分类方法及装置
CN111930826A (zh) 软件界面的订单生成方法及***
CN115482099A (zh) 一种交易事件的生成方法、相关装置、设备以及存储介质
CN112329462A (zh) 一种数据排序方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination