CN113763167B - 一种基于复杂网络的黑名单挖掘方法 - Google Patents

一种基于复杂网络的黑名单挖掘方法 Download PDF

Info

Publication number
CN113763167B
CN113763167B CN202110918735.2A CN202110918735A CN113763167B CN 113763167 B CN113763167 B CN 113763167B CN 202110918735 A CN202110918735 A CN 202110918735A CN 113763167 B CN113763167 B CN 113763167B
Authority
CN
China
Prior art keywords
nodes
blacklist
network
node
original network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110918735.2A
Other languages
English (en)
Other versions
CN113763167A (zh
Inventor
韦虎
周朝阁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Yinghuo Network Technology Co ltd
Original Assignee
Hangzhou Yinghuo Network Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Yinghuo Network Technology Co ltd filed Critical Hangzhou Yinghuo Network Technology Co ltd
Priority to CN202110918735.2A priority Critical patent/CN113763167B/zh
Publication of CN113763167A publication Critical patent/CN113763167A/zh
Application granted granted Critical
Publication of CN113763167B publication Critical patent/CN113763167B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于复杂网络的黑名单挖掘方法。本发明步骤如下:1、根据借贷和消费场景下的有效信息维度构建原始网络;2、根据原始网络的邻接矩阵,求得原始网络的转移概率矩阵;3、初始向量R,如果原始网络G中节点i对应的是种子节点,则向量R的第i行的值是1/|S|,否则0;4、根据迭代公式Rn=DRn‑1,求得第n次迭代的排序值;5、迭代最终收敛或者达到预先指定的迭代次数后,根据排序值,输出头部M个非种子节点,输出的非种子节点是最有可能的潜在黑名单节点。本发明通过数据关联关系网络,将已知的风险通过PageRank算法传播到整个网络节点,量化每个节点的风险程度。具有记录内容详细,运算简便等优点。

Description

一种基于复杂网络的黑名单挖掘方法
技术领域
本发明涉及复杂网络黑名单挖掘技术领域,具体涉及一种基于复杂网络的黑名单挖掘方法,应用于借贷和消费贷场景下的复杂网络。
背景技术
随着社会经济的快速发展和时代的进步,人们的生活水平也在不断的提高,对借贷和消费贷等超前消费观念有了更多的需求。在资金方,风险控制直接影响盈利能力,是最为重要的技术之一,因此随之而来的风险控制的需求也越来越多。黑名单是最为常用的风控技术,因此,黑名单发掘成为广大资金方追捧的技术之一。
现有的黑名单主要来源于政府机构的失信人,或者机构内部积累的失信人信息,然而,在很多案例中,“白名单”用户仍然存在很大的概率成为失信人,并且,内部积累失信人的过程本身对机构造成了严重的经济损失。因此,仅仅依赖于已知失信人信息无法涵盖所有的黑名单用户。传统的机器学习模型广泛应用于违约预测任务,这个过程采用了用户年龄、性别、学历、工作状况等维度的信息,通过机器学习模型对未知个体逾期可能性进行预测,但是这类方法仅仅考虑单一个体的信息,而忽略了个体之间的关联关系。因此,效果往往不够理想。
PageRank算法是由拉里·佩奇(Larry Page)和谢尔盖·布林 (Sergey Brin)提出的网页排序算法。算法核心在于给网页一个全局分值,利用分值排序网页的重要性,为搜索用户甄选出优质相关的网页,以提高使用搜索引擎寻找网页的体验舒适度。PageRank算法基于随机游走模型,它以其优良的数学理论基础和计算速度,成为计算机网络研究人员一直追捧至今的优秀算法之一。
PageRank算法及其扩展算法被广泛的应用于各种网络模型中,例如社交网络、疾病传播网络、论文引用网络、信任网络、影响力分析、推荐***、偏好与声望排名、信息传播检测等。
发明内容
本发明的目的是针对现有技术的不足,提供一种基于复杂网络的黑名单挖掘方法。本发明应用于借贷和消费贷场景下的复杂网络。基于已知黑名单用户(种子),在网络中进行风险传播,从而对潜在的黑名单用户进行挖掘。
为解决上述技术问题,本发明采用以下技术方案予以实现:
一种基于复杂网络的黑名单挖掘方法,包括如下步骤:
步骤S1:根据借贷和消费场景下的有效信息维度构建原始网络 G;
步骤S2:根据原始网络G的邻接矩阵D,求得原始网络G的转移概率矩阵P;
步骤S3:初始向量R,如果原始网络G中节点i对应的是种子节点,则向量R的第i行的值是1/|S|,否则0;其中,S是种子节点集合;
步骤S4:根据迭代公式Rn=DRn-1,求得第n次迭代的排序值;其中Rn是第n次迭代的排序值,Rn-1是第n-1次迭代的排序值,D是邻接矩阵;
步骤S5:迭代最终收敛或者达到预先指定的迭代次数后,根据排序值,输出头部M个非种子节点,输出的非种子节点是最有可能的潜在黑名单节点。
进一步的,步骤S1所述的有效信息维度包括借贷人的唯一ID、设备ID、手机号码和银行卡,将有效信息维度作为节点;在节点之间建立无向边,并根据同一条边出现的次数计算边的权重;如果节点i和j之间存在边,则Dij=w,否则Dij=0;Dij是原始网络G的邻接矩阵D中的元素。
进一步的,步骤S2所述的转移概率矩阵P,计算公式如下:
其中,Pij表示转移概率矩阵P的元素。
与现有技术相比,本申请提供的技术方案,具有的技术效果或优点是:本发明通过数据关联关系网络,将已知的风险通过 PageRank算法传播到整个网络节点,量化每个节点的风险程度。具有记录内容详细,运算简便等优点,在风险控制、反洗钱等方面有着广泛的应用前景。
具体实施方式
下面结合实施例对本发明作进一步说明。
一种基于复杂网络的黑名单挖掘方法,包括步骤如下:
步骤S1:根据借贷和消费场景下的有效信息维度构建原始网络 G,其中有效信息维度包括借贷人的唯一ID、设备ID、手机号码和银行卡等,并将有效信息维度作为节点;在节点之间建立无向边,并根据同一条边出现的次数计算边的权重w;如果节点i和j之间存在边,则Dij=w,否则Dij=0;Dij是原始网络G的邻接矩阵D中的元素。
步骤S2:根据邻接矩阵D,求得原始网络G的转移概率矩阵P,计算公式如下:
其中,Pij表示转移概率矩阵P的元素;
步骤S3:初始向量R,如果i对应的是种子节点,所述向量R的第i行的值是1/|S|,否则0。这里,S是种子节点集合;
步骤S4:根据迭代公式Rn=DRn-1,求得第n次迭代的排序值;其中Rn是第n次迭代的排序值,Rn-1是第n-1次迭代的排序值,D是邻接矩阵。
步骤S5:迭代最终收敛或者达到预先指定的迭代次数后,根据排序值,输出头部M个非种子节点,这些节点是最有可能的潜在黑名单节点。

Claims (3)

1.一种基于复杂网络的黑名单挖掘方法,其特征在于包括如下步骤:
步骤S1:根据借贷和消费场景下的有效信息维度构建原始网络G;
步骤S2:根据原始网络G的邻接矩阵D,求得原始网络G的转移概率矩阵P;
步骤S3:初始向量R,如果原始网络G中节点i对应的是种子节点,则向量R的第i行的值是1/|S|,否则0;其中,S是种子节点集合;
步骤S4:根据迭代公式Rn=DRn-1,求得第n次迭代的排序值;其中Rn是第n次迭代的排序值,Rn-1是第n-1次迭代的排序值,D是邻接矩阵;
步骤S5:迭代最终收敛或者达到预先指定的迭代次数后,根据排序值,输出头部M个非种子节点,输出的非种子节点是最有可能的潜在黑名单节点。
2.根据权利要求1所述的一种基于复杂网络的黑名单挖掘方法,其特征在于步骤S1所述的有效信息维度包括借贷人的唯一ID、设备ID、手机号码和银行卡,将有效信息维度作为节点;在节点之间建立无向边,并根据同一条边出现的次数计算边的权重;如果节点i和j之间存在边,则Dij=w,否则Dij=0;Dij是原始网络G的邻接矩阵D中的元素。
3.根据权利要求2所述的一种基于复杂网络的黑名单挖掘方法,其特征在于步骤S2所述的转移概率矩阵P,计算公式如下:
其中,Pij表示转移概率矩阵P的元素。
CN202110918735.2A 2021-08-11 2021-08-11 一种基于复杂网络的黑名单挖掘方法 Active CN113763167B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110918735.2A CN113763167B (zh) 2021-08-11 2021-08-11 一种基于复杂网络的黑名单挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110918735.2A CN113763167B (zh) 2021-08-11 2021-08-11 一种基于复杂网络的黑名单挖掘方法

Publications (2)

Publication Number Publication Date
CN113763167A CN113763167A (zh) 2021-12-07
CN113763167B true CN113763167B (zh) 2023-11-17

Family

ID=78788959

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110918735.2A Active CN113763167B (zh) 2021-08-11 2021-08-11 一种基于复杂网络的黑名单挖掘方法

Country Status (1)

Country Link
CN (1) CN113763167B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101499098A (zh) * 2009-03-04 2009-08-05 阿里巴巴集团控股有限公司 一种网页评估值的确定及运用的方法、***
CN104504251A (zh) * 2014-12-10 2015-04-08 沈阳航空航天大学 一种基于PageRank算法的社区划分方法
CN108053256A (zh) * 2017-12-27 2018-05-18 上海银橙文化传媒股份有限公司 一种基于PageRank的反作弊方法
CN109299811A (zh) * 2018-08-20 2019-02-01 众安在线财产保险股份有限公司 一种基于复杂网络的欺诈团伙识别和风险传播预测的方法
CN109325814A (zh) * 2017-07-31 2019-02-12 上海诺悦智能科技有限公司 一种用于发现可疑交易网络的方法
CN110136016A (zh) * 2019-04-04 2019-08-16 中国科学院信息工程研究所 一种基于隐式关联的多标签传播方法及***
CN113094558A (zh) * 2021-04-08 2021-07-09 电子科技大学 一种基于局部结构的网络节点影响力排序方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090234711A1 (en) * 2005-09-14 2009-09-17 Jorey Ramer Aggregation of behavioral profile data using a monetization platform
US8955129B2 (en) * 2013-04-23 2015-02-10 Duke University Method and system for detecting fake accounts in online social networks

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101499098A (zh) * 2009-03-04 2009-08-05 阿里巴巴集团控股有限公司 一种网页评估值的确定及运用的方法、***
CN104504251A (zh) * 2014-12-10 2015-04-08 沈阳航空航天大学 一种基于PageRank算法的社区划分方法
CN109325814A (zh) * 2017-07-31 2019-02-12 上海诺悦智能科技有限公司 一种用于发现可疑交易网络的方法
CN108053256A (zh) * 2017-12-27 2018-05-18 上海银橙文化传媒股份有限公司 一种基于PageRank的反作弊方法
CN109299811A (zh) * 2018-08-20 2019-02-01 众安在线财产保险股份有限公司 一种基于复杂网络的欺诈团伙识别和风险传播预测的方法
CN110136016A (zh) * 2019-04-04 2019-08-16 中国科学院信息工程研究所 一种基于隐式关联的多标签传播方法及***
CN113094558A (zh) * 2021-04-08 2021-07-09 电子科技大学 一种基于局部结构的网络节点影响力排序方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Comparison of Adaboost with MultiBoosting for Phishing Website Detection;Abdulhamit SubasiEmir Kremic;《Procedia Computer Science》;全文 *
基于链接分析的网络搜索排名的反作弊研究;王洪伟等;《***管理学报》;全文 *

Also Published As

Publication number Publication date
CN113763167A (zh) 2021-12-07

Similar Documents

Publication Publication Date Title
CN110263280B (zh) 一种基于多视图的动态链路预测深度模型及应用
CN111737551B (zh) 一种基于异构图注意力神经网络的暗网线索检测方法
WO2021143267A1 (zh) 基于图像检测的细粒度分类模型处理方法、及其相关设备
CN109189988B (zh) 一种视频推荐方法
CN103136267B (zh) 一种基于社区的专家挖掘方法与装置
CN111414461A (zh) 一种融合知识库与用户建模的智能问答方法及***
CN110619081A (zh) 一种基于交互图神经网络的新闻推送方法
US10942939B2 (en) Systems and methods for unsupervised streaming feature selection in social media
CN111475838B (zh) 基于深度神经网络的图数据匿名方法、装置、存储介质
CN109960755B (zh) 一种基于动态迭代快速梯度的用户隐私保护方法
CN113918834B (zh) 融合社交关系的图卷积协同过滤推荐方法
CN107368499B (zh) 一种客户标签建模及推荐方法及装置
CN109344246B (zh) 一种电子问卷生成方法、计算机可读存储介质及终端设备
CN113590976A (zh) 一种空间自适应图卷积网络的推荐方法
CN111400615A (zh) 一种资源推荐方法、装置、设备及存储介质
CN115718826A (zh) 图结构数据中的目标节点分类方法、***、设备及介质
CN110932962A (zh) 一种基于矩阵分解的网络结构去匿名化***及方法
CN113763167B (zh) 一种基于复杂网络的黑名单挖掘方法
CN112559877A (zh) 基于跨平台异构数据及行为上下文的ctr预估方法及***
CN105447013A (zh) 一种新闻推荐***
CN112435034A (zh) 一种基于多网络图聚合的营销套利黑产的识别方法
CN112231579A (zh) 基于隐式社群发现的社会化视频推荐***与方法
CN116541592A (zh) 向量生成方法、信息推荐方法、装置、设备及介质
CN114676228A (zh) 基于动态路由的跨模态注意力筛选网络的跨模态匹配方法
CN113256024A (zh) 一种融合群体行为的用户行为预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant