CN115860904A - 信贷异常群体挖掘方法及装置 - Google Patents
信贷异常群体挖掘方法及装置 Download PDFInfo
- Publication number
- CN115860904A CN115860904A CN202211418296.XA CN202211418296A CN115860904A CN 115860904 A CN115860904 A CN 115860904A CN 202211418296 A CN202211418296 A CN 202211418296A CN 115860904 A CN115860904 A CN 115860904A
- Authority
- CN
- China
- Prior art keywords
- credit
- node
- abnormal
- representing
- community
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了信贷异常群体挖掘方法,包括:获取预定时间段的信贷用户及其信贷数据;根据信贷用户及其信贷数据构建以信贷用户为节点的同构图;利用Louvain算法对所述同构图进行社区划分,得到多个社区;计算多个所述社区的信贷异常群体风险性评估指标,根据所述信贷异常群体风险性评估指标判断多个所述社区是否为信贷异常群体。本发明还提供了信贷异常群体挖掘装置。本发明能够对信贷异常群体进行精准识别。
Description
技术领域
本发明涉及计算机技术领域。更具体地说,本发明涉及一种信贷异常群体挖掘方法及装置。
背景技术
信贷异常群体是指在客户贷款过程中通过收取客户贷款佣金而提供相应服务的人员,在客户申请过程中,通过各种非法手段,将客户本身信用度进行所谓的包装和提升,以此向银行等金融机构贷款,后从中赚取差价,客户最终拿到手只是部分款项,却欠了银行巨额贷款,对银行和客户均造成资产损失。该行为识别因其自身特性有较大难度,客户自身真实信息以及中介包装后的虚假信息,具有较高的隐蔽性。对于金融机构而言,无法判定当前申请操作是否是客户行为,因数据资源有限,对于包装的虚假信息无法进行有效的判定。
因此,有必要设计一种能够一定程度克服上述缺陷的技术方案。
发明内容
本发明的一个目的是提供一种信贷异常群体挖掘方法及装置,能够对信贷异常群体进行精准识别。
为了实现本发明的这些目的和其它优点,根据本发明的一个方面,本发明提供了信贷异常群体挖掘方法,包括:获取预定时间段的信贷用户及其信贷数据;根据信贷用户及其信贷数据构建以信贷用户为节点的同构图;利用Louvain算法对所述同构图进行社区划分,得到多个社区;计算多个所述社区的信贷异常群体风险性评估指标,根据所述信贷异常群体风险性评估指标判断多个所述社区是否为信贷异常群体。
进一步地,至少根据信贷用户、地址、位置、联系电话、设备和IP及其关联构建原始图;剔除所述原始图中的无效节点;提取信贷用户节点之间的关联关系,构建以信贷用户为节点的同构图。
进一步地,若在所述原始图中,两个信贷用户关联到同一非信贷用户节点,则在所述同构图中,该两个信贷用户节点存在关联边。
进一步地,还包括:评估所述同构图中关联边的权重值,剔除所述权重值低于第一预定值的关联边,所述权重值根据信贷用户节点的SDK特征信息和关联边的属性信息评估得到,所述SDK特征信息包括注册操作信息、异常登录操作信息、开户操作信息。
进一步地,计算权重值W;
W=Weight(a,b)*Weight(edge)
p(a,i)为信贷用户节点的第i个SDK特征信息,p(b,i)为邻居节点的第i个SDK特征信息,n为信贷用户节点所具有的SDK特征信息总数,r(a,b)为信贷用户节点与邻居节点的关系总数,rmax为信贷用户节点与邻居节点中关系总数中的最大值;
wi表示关联边第i类关系的权重,mi表示关联边第i类关系的数量,mnum表示关联边第i类关系的风险数量,当邻居节点为异常信贷节点,则信贷用户节点与邻居节点的关系存在风险,异常信贷节点根据预设规则确定;edgei表示i类边,f(edgei)表示边的属性计算函数;
其中,(x1,...,xm)和(y1,...,ym)分别表示关联的信贷用户节点的属性特征值。
进一步地,还包括:计算信贷用户节点的风险值f(node),剔除风险值低于第二预定值的信贷用户节点;
其中,λ1和λ2分别为稳定性权重值;s表示共同节点数,s1表示t-1时刻社团p的节点数;
进一步地,按照以下公式计算信贷异常群体风险性评估指标Score,将所述信贷异常群体风险性评估指标大于社团异常阈值的所述社区认定为信贷异常群体。
Score=(1+log10 M)*(1+blackper)
其中,M为社团中节点数,blackper为社团中异常比例。
根据本发明的另一个方面,还提供了信贷异常群体挖掘装置,包括:处理器;存储器,其存储有可执行指令;其中,所述处理器被配置为执行所述可执行指令,以执行所述的信贷异常群体挖掘方法。
本发明至少包括以下有益效果:
本发明根据信贷用户及其信贷数据构建以信贷用户为节点的同构图,然后利用Louvain算法对同构图进行社区划分,计算得到的社区的信贷异常群体风险性评估指标,根据信贷异常群体风险性评估指标识别社区是否为信贷异常群体,识别效率高、准确率高。
本发明的其它优点、目标和特征将部分通过下面的说明体现,部分还将通过对本发明的研究和实践而为本领域的技术人员所理解。
附图说明
图1为本发明的流程图。
具体实施方式
下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
应当理解,本文所使用的诸如“具有”、“包含”以及“包括”术语并不排除一个或多个其它元件或其组合的存在或添加。
如图1所示,本申请的实施例提供了信贷异常群体挖掘方法,包括:
S1:获取预定时间段的信贷用户及其信贷数据;可选地,选取近3~5年历史申请通过用户和历史申请拒绝用户,选取以上用户在行内数据信息,包含金融资产数据、SDK端操作行为数据、信贷申请数据等;
S2:根据信贷用户及其信贷数据构建以信贷用户为节点的同构图;信贷用户节点存在关联关系,关联关系用关联边表示,从而建立同构图;
S3:利用Louvain算法对所述同构图进行社区划分,得到多个社区;Louvain算法是一种基于模块度的社区发现算法,其基本思想是网络中节点尝试遍历所有邻居的社区标签,并选择最大化模块度增量的社区标签,在最大化模块度之后,每个社区看成一个新的节点,重复直到模块度不再增大;
S4:计算多个所述社区的信贷异常群体风险性评估指标,根据所述信贷异常群体风险性评估指标判断多个所述社区是否为信贷异常群体,可选地,信贷异常群体风险性评估指标可根据社团中的异常信贷用户节点数量确定。
在另一些实施例中,至少根据信贷用户(用证件号表示)、地址、位置、联系电话、设备和IP及其关联构建原始图,还可以包括信贷用户的自定义用户标签,参见表1;剔除所述原始图中的无效节点;提取信贷用户节点之间的关联关系,构建以信贷用户为节点的同构图;
表1同构图中节点类别及属性
在另一些实施例中,若在所述原始图中,两个信贷用户关联到同一非信贷用户节点,则在所述同构图中,该两个信贷用户节点存在关联边,关联关系可以是客户——操作设备、客户——联系电话、客户——地址、客户——IP等、客户——GPS,参见表2。
表2关联边属性特征
在另一些实施例中,还包括:无效节点剔除,剔除原始图中异常和无效的非客户节点;步骤1,无效节点范围界定:入度数量大于阈值(100,或占网络信贷节点数量40%)的关联节点;步骤2,无效节点评估:a、节点为IP类型,且关联客户节点最近登录时间中位数差值平均值大于阈值(如2周);b、节点为地址类型,且关联客户节点最近输入时间中位数差值平均值大于阈值(如2周);c、节点为设备类型,且关联客户节点最近登录时间中位数差值平均值大于阈值(如2周);d、节点为地址类型,且为非标准地址(如缺少街道/社区维度信息)。
在另一些实施例中,还包括:评估所述同构图中关联边的权重值,剔除所述权重值低于第一预定值的关联边,所述权重值根据信贷用户节点的SDK特征信息和关联边的属性信息评估得到,所述SDK特征信息包括注册操作信息、异常登录操作信息、开户操作信息;例如,基于同构图对关联边权重的评估值,剔除权重值低于0.2的低效关联边。
在另一些实施例中,计算权重值W;
W=Weight(a,b)*Weight(edge)
p(a,i)为信贷用户节点的第i个SDK特征信息,p(b,i)为邻居节点的第i个SDK特征信息,n为信贷用户节点所具有的SDK特征信息总数,r(a,b)为信贷用户节点与邻居节点的关系总数,rmax为信贷用户节点与邻居节点中关系总数中的最大值;
wi表示关联边第i类关系的权重,第i类关系即两个信贷用户节点的关联关系,见表2中的边类别,mi表示关联边第i类关系的数量,mnum表示关联边第i类关系的风险数量,当邻居节点为异常信贷用户节点,则信贷用户节点与邻居节点的关系存在风险,异常信贷节点根据预设规则确定,预设规则可以是进行标签定义,一是根据历史授信客户在行内逾期表现,将用户定义为2类异常,异常1,“首贷首逾30+,且当前逾期期数等于当前还款期数”,异常2,“首期未逾期,第二期逾期,且逾期60+,且当前逾期期数等于当前还款期数-1”;二是建立拒绝客户标签,“历史申请被拒绝,且无申请通过记录”,异常信贷用户节点包括异常1和异常2;
edgei表示i类边,f(edgei)表示边的属性计算函数;
其中,(x1,...,xm)和(y1,...,ym)分别表示关联的信贷用户节点的属性特征值,即表1中节点属性的值,例如当前逾期天数,时间等。
例如,根据客户在银行APP端贷款申请中的流程操作,通过SDK特征信息包括基础设备类特征信息、位置类特征信息、贷款申请流程类特征信息和敏感操作类特征信息,代入上述公式;
(1)基础设备类信息特征
通过APP端SDK所获取的设备信息,构建基础设备类信息特征;
表3基础设备类特征信息
设备操作频次 | 设备更换行为 | 设备基本信息 |
开机时间 | 设备登录用户数 | 是否刷机 |
近一周设备申请/登录/转账频次 | 设备更换后登录失败次数 | 设备型号 |
近一周设备凌晨登录频次 | 设备IMEI关联用户数 | 型号等级 |
(2)位置类特征信息
通过APP端SDK所获取的设备信息,提取IP和GPS位置数据,并构建位置类信息特征;
表4位置类特征信息
IP维度 | GPS维度 |
IP漂移 | 是否缺失 |
近一周设备登录IP数 | 近一周设备登录GPS数 |
同IP关联客户数 | 同6PS地址关联客户数 |
同IP关联设备数 | 同GPS地址关联设备数 |
(3)贷款申请流程类特征信息
按照时序梳理操作环节,包括借款点击、借款信息填写确认、授信授权、证件照片上传、人脸识别、提交完成等。通过计算最近一次申请成功流程种各操作环节成功前失败次数、相邻操作环节操作时长构建特征体系;
表5贷款申请流程类特征信息
失败次数类特征 | 操作时长类特征 |
借款信息填写确认失败次数 | 借款点击——借款信息填写确认操作时长 |
授信授权失败次数 | 借款信息填写确认——授信授权操作时长 |
证件照片上传失败次数 | 授信授权——证件照片上传操作时长 |
人脸识别失败次数 | 证件照片上传——人脸识别操作时长 |
人脸识别——提交完成操作时长 |
(4)敏感操作类特征信息
通过APP端SDK所获取的客户操作行为信息,包括注册操作、异常登录操作、开户操作等,提取相关联的信息特征;
表6敏感操作类特征信息
注册操作 | 异常登录操作 | 开户操作 |
注册设备关联数 | 连续登录趋势 | 开户后关联操作统计 |
注册设备关联IP数 | 设备切换聚合分布 | 同趋势同时段开户趋势 |
注册操作时长 | 密码修改频率 | |
同时段密码设置相似度 |
在另一些实施例中,还包括:计算信贷用户节点的风险值f(node),剔除风险值低于第二预定值的信贷用户节点;
其中,zi取值根据关联度数确定,vi表示关联边第i类关系的权重,qi表示关联边第i类关系的数量,qnum表示关联边第i类关系的风险数量;li表示连接的异常信贷节点数;可选地,zi取值根据关联度数分类,例如,一度,取0.1,二度,取0.05,三度,取0.02,例如信贷用户节点a、b、c、d的关系为a-b-c-d,则a的一度邻居是b,a的二度邻居是c,a的三度邻居是d。/>
其中,λ1和λ2分别为稳定性权重值,优选均取0.5;s表示共同节点数,s1表示t-1时刻社团p的节点数;表示节点重要性;e表示共同边数,e1表示t-1时刻社团p的边数,/>d表示社团p中第i个节点的度数,/>表示社团p中节点的总度数;t-1时刻与t时刻的间隔可以是一个月或多个月,即通过一个月的新增信贷数据判断分团是否稳定,提升信贷异常群体挖掘的准确性。
在另一些实施例中,按照以下公式计算信贷异常群体风险性评估指标Score,将所述信贷异常群体风险性评估指标大于社团异常阈值的所述社区认定为信贷异常群体。
Score=(1+log10 M)*(1+blackper)
其中,M为社团中节点数,blackper为社团中异常比例,指的是社团中异常信贷用户节点个数除以社团总节点个数;社团异常阈值根据经验或统计数据确定。
本申请的实施例还提供了信贷异常群体挖掘装置,包括:处理器;存储器,其存储有可执行指令;其中,所述处理器被配置为执行所述可执行指令,以执行所述的信贷异常群体挖掘方法;处理器、存储器可以选自PC、服务器、云服务器,建立程序执行以上的信贷异常群体挖掘方法。
这里说明的设备数量和处理规模是用来简化本发明的说明的。对本发明信贷异常群体挖掘方法及装置的应用、修改和变化对本领域的技术人员来说是显而易见的。
尽管本发明的实施方案已公开如上,但其并不仅仅限于说明书和实施方式中所列运用,它完全可以被适用于各种适合本发明的领域,对于熟悉本领域的人员而言,可容易地实现另外的修改,因此在不背离权利要求及等同范围所限定的一般概念下,本发明并不限于特定的细节和这里示出与描述的图例。
Claims (9)
1.信贷异常群体挖掘方法,其特征在于,包括:
获取预定时间段的信贷用户及其信贷数据;
根据信贷用户及其信贷数据构建以信贷用户为节点的同构图;
利用Louvain算法对所述同构图进行社区划分,得到多个社区;
计算多个所述社区的信贷异常群体风险性评估指标,根据所述信贷异常群体风险性评估指标判断多个所述社区是否为信贷异常群体。
2.如权利要求1所述的信贷异常群体挖掘方法,其特征在于,至少根据信贷用户、地址、位置、联系电话、设备和IP及其关联构建原始图;剔除所述原始图中的无效节点;提取信贷用户节点之间的关联关系,构建以信贷用户为节点的同构图。
3.如权利要求2所述的信贷异常群体挖掘方法,其特征在于,若在所述原始图中,两个信贷用户关联到同一非信贷用户节点,则在所述同构图中,该两个信贷用户节点存在关联边。
4.如权利要求3所述的信贷异常群体挖掘方法,其特征在于,还包括:
评估所述同构图中关联边的权重值,剔除所述权重值低于第一预定值的关联边,所述权重值根据信贷用户节点的SDK特征信息和关联边的属性信息评估得到,所述SDK特征信息包括注册操作信息、异常登录操作信息、开户操作信息。
5.如权利要求4所述的信贷异常群体挖掘方法,其特征在于,计算权重值W;
W=Weight(a,b)*Weight(edge)
p(a,i)为信贷用户节点的第i个SDK特征信息,p(b,i)为邻居节点的第i个SDK特征信息,n为信贷用户节点所具有的SDK特征信息总数,r(a,b)为信贷用户节点与邻居节点的关系总数,rmax为信贷用户节点与邻居节点中关系总数中的最大值;
wi表示关联边第i类关系的权重,mi表示关联边第i类关系的数量,mnum表示关联边第i类关系的风险数量,当邻居节点为异常信贷节点,则信贷用户节点与邻居节点的关系存在风险,异常信贷节点根据预设规则确定;edgei表示i类边,f(edgei)表示边的属性计算函数;
其中,(x1,...,xm)和(y1,...,ym)分别表示关联的信贷用户节点的属性特征值。
8.如权利要求4所述的信贷异常群体挖掘方法,其特征在于,按照以下公式计算信贷异常群体风险性评估指标Score,将所述信贷异常群体风险性评估指标大于社团异常阈值的所述社区认定为信贷异常群体。
Score=(1+log10M)*(1+blackper)
其中,M为社团中节点数,blackper为社团中异常比例。
9.信贷异常群体挖掘装置,其特征在于,包括:
处理器;
存储器,其存储有可执行指令;
其中,所述处理器被配置为执行所述可执行指令,以执行权利要求1~8任一所述的信贷异常群体挖掘方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211418296.XA CN115860904A (zh) | 2022-11-14 | 2022-11-14 | 信贷异常群体挖掘方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211418296.XA CN115860904A (zh) | 2022-11-14 | 2022-11-14 | 信贷异常群体挖掘方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115860904A true CN115860904A (zh) | 2023-03-28 |
Family
ID=85663322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211418296.XA Pending CN115860904A (zh) | 2022-11-14 | 2022-11-14 | 信贷异常群体挖掘方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115860904A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107194623A (zh) * | 2017-07-20 | 2017-09-22 | 深圳市分期乐网络科技有限公司 | 一种团伙欺诈的发现方法及装置 |
CN109214617A (zh) * | 2017-06-29 | 2019-01-15 | 格局商学教育科技(深圳)有限公司 | 一种互联网金融风险定量评估审核*** |
CN111831923A (zh) * | 2020-07-14 | 2020-10-27 | 北京芯盾时代科技有限公司 | 识别关联的特定账户的方法、装置及存储介质 |
CN112037038A (zh) * | 2020-09-02 | 2020-12-04 | 中国银行股份有限公司 | 银行信贷风险预测方法及装置 |
CN112348659A (zh) * | 2020-10-21 | 2021-02-09 | 上海淇玥信息技术有限公司 | 用户风险识别策略的分配方法、装置及电子设备 |
CN114331665A (zh) * | 2021-11-11 | 2022-04-12 | 中科聚信信息技术(北京)有限公司 | 用于预定申请人的信用判定模型的训练方法、装置和电子设备 |
-
2022
- 2022-11-14 CN CN202211418296.XA patent/CN115860904A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109214617A (zh) * | 2017-06-29 | 2019-01-15 | 格局商学教育科技(深圳)有限公司 | 一种互联网金融风险定量评估审核*** |
CN107194623A (zh) * | 2017-07-20 | 2017-09-22 | 深圳市分期乐网络科技有限公司 | 一种团伙欺诈的发现方法及装置 |
CN111831923A (zh) * | 2020-07-14 | 2020-10-27 | 北京芯盾时代科技有限公司 | 识别关联的特定账户的方法、装置及存储介质 |
CN112037038A (zh) * | 2020-09-02 | 2020-12-04 | 中国银行股份有限公司 | 银行信贷风险预测方法及装置 |
CN112348659A (zh) * | 2020-10-21 | 2021-02-09 | 上海淇玥信息技术有限公司 | 用户风险识别策略的分配方法、装置及电子设备 |
CN114331665A (zh) * | 2021-11-11 | 2022-04-12 | 中科聚信信息技术(北京)有限公司 | 用于预定申请人的信用判定模型的训练方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108009915B (zh) | 一种欺诈用户社区的标记方法及相关装置 | |
US11830004B2 (en) | Blockchain transaction safety | |
Cortes et al. | Communities of interest | |
Cahill et al. | Detecting fraud in the real world | |
CN108780479A (zh) | 用于对异常进行检测和评分的***和方法 | |
WO2017133456A1 (zh) | 一种确定风险评估参数的方法及装置 | |
US20130124448A1 (en) | Method and system for selecting a target with respect to a behavior in a population of communicating entities | |
CN109063966A (zh) | 风险账户的识别方法和装置 | |
CN110009365B (zh) | 非正常转移电子资产的用户群体检测方法、装置和设备 | |
CN102081774A (zh) | 养卡识别方法及*** | |
CN114187112A (zh) | 账户风险模型的训练方法和风险用户群体的确定方法 | |
CN110852870A (zh) | 一种虚拟资源转移方法、装置、设备及可读存储介质 | |
CN111309788A (zh) | 一种银行客户交易网络的社区结构发现方法及*** | |
Cortes et al. | Communities of interest | |
CN109670933A (zh) | 识别用户角色的方法、用户设备、存储介质及装置 | |
CN110728301A (zh) | 一种个人用户的信用评分方法、装置、终端及存储介质 | |
CN110991789A (zh) | 置信区间的确定方法和装置、存储介质及电子装置 | |
CN111797942A (zh) | 用户信息的分类方法及装置、计算机设备、存储介质 | |
CN115375480A (zh) | 基于图神经网络的异常虚拟币钱包地址检测方法 | |
CN111681044A (zh) | 积分兑换作弊行为处理方法及装置 | |
CN112749974A (zh) | 一种交易数据处理方法、装置、设备及存储介质 | |
CN114820219B (zh) | 一种基于复杂网络的欺诈社团识别方法及*** | |
CN116645134A (zh) | 一种***分期的推荐方法、装置、设备及介质 | |
CN115860904A (zh) | 信贷异常群体挖掘方法及装置 | |
CN113870021B (zh) | 一种数据的分析方法、装置、存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |