CN110070364A - 基于图模型检测团伙欺诈的方法和装置、存储介质 - Google Patents

基于图模型检测团伙欺诈的方法和装置、存储介质 Download PDF

Info

Publication number
CN110070364A
CN110070364A CN201910239821.3A CN201910239821A CN110070364A CN 110070364 A CN110070364 A CN 110070364A CN 201910239821 A CN201910239821 A CN 201910239821A CN 110070364 A CN110070364 A CN 110070364A
Authority
CN
China
Prior art keywords
clique
user
determined
association
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910239821.3A
Other languages
English (en)
Inventor
黄剑飞
陈振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201910239821.3A priority Critical patent/CN110070364A/zh
Publication of CN110070364A publication Critical patent/CN110070364A/zh
Priority to PCT/CN2019/124807 priority patent/WO2020192184A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Computer Security & Cryptography (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及一种基于图模型检测团伙欺诈的方法和装置、存储介质,用于解决相关技术中难以识别团伙欺诈的技术问题。所述基于图模型检测团伙欺诈的方法包括:获取用户基础数据和历史嫌疑用户数据;根据获取的数据,生成用户关联图;其中,所述用户关联图的节点为根据数据特征生成的用户关联子图,所述用户关联图的边权重包括节点的相似度;基于所述用户关联图,利用社区划分算法生成待判定团伙集合;计算所述待判定团伙集合的嫌疑度;根据计算结果,输出所述待判定团伙的判定结果。

Description

基于图模型检测团伙欺诈的方法和装置、存储介质
技术领域
本公开涉及网络技术领域,具体地,涉及一种基于图模型检测团伙欺诈的方法和装置、存储介质。
背景技术
金融领域对交易风险控制的要求较高,需要保证资金交易的安全性。在实际应用中,可能会存在一些欺诈行为。比如,欺诈者诱骗很多的普通消费者向其转账,但是却不向这些消费者返还相应的回报,以此进行牟利。为了识别上述的欺诈行为,将高风险的欺诈者识别出来,以采取措施尽量避免消费者的资金损失,可以利用交易模型来识别欺诈者,比如,将某个支付账户定性为欺诈者账户,将欺诈者账户进行的资金交易定性为风险交易。
发明内容
本公开提供一种基于图模型检测团伙欺诈的方法和装置、存储介质,以解决相关技术中难以识别团伙欺诈的技术问题。
为实现上述目的,本公开实施例的第一方面,提供一种基于图模型检测团伙欺诈的方法,所述方法包括:
获取用户基础数据和历史嫌疑用户数据;
根据获取的数据,生成用户关联图;其中,所述用户关联图的节点为根据数据特征生成的用户关联子图,所述用户关联图的边权重包括节点的相似度;
基于所述用户关联图,利用社区划分算法生成待判定团伙集合;
计算所述待判定团伙集合的嫌疑度;
根据计算结果,输出所述待判定团伙的判定结果。
可选地,所述生成用户关联图,包括:
选取所述用户基础数据和所述历史嫌疑用户数据中的特征组合和组数;
利用特征一致性相等或模糊性相等方式对应生成用户关联子图并以所述用户关联子图为节点拼接生成用户无权重关联图;
以所述用户无权重关联图中节点的相似度作为边权重生成用户相似权重关联图。
可选地,所述利用社区划分算法生成待判定团伙集合,包括:
基于所述用户相似权重关联图,利用社区划分算法生成n个团伙集合,n为正整数;
确认所述团伙集合中用户数量小于或等于极大阈值;
确认用户数量小于极小阈值的所述团伙集合的数量小于或等于预设阈值;
将所述团伙集合确定为待判定团伙集合。
可选地,还包括:
对用户数量大于所述极大阈值的团伙集合调用社区划分算法进行划分以使所述团伙集合中用户数量小于或等于所述极大阈值;
若用户数量小于极小阈值的所述团伙集合的数量大于所述预设阈值,调用层次聚类算法对用户数量小于极小阈值的所述团伙集合进行凝聚。
可选地,所述社区划分算法包括图标签传播算法或GN算法;所述层次聚类算法包括凝聚算法或***算法。
可选地,所述计算所述待判定团伙集合的嫌疑度得分,包括:
从所述数据特征中选取目标数据特征,所述目标数据特征在所述待判定团伙集合中的分布与所述目标数据特征在整体数据中的分布差异超过目标阈值;
根据所述目标数据特征在所述待判定团伙集合中的占比,计算所述待判定团伙集合的嫌疑度得分。
可选地,所述计算所述待判定团伙集合的嫌疑度得分,包括:
抽取每个所述待判定团伙集合的团伙特征;
将所述团伙特征输入训练好的回归模型中以使所述回归模型输出所述待判定团伙集合的嫌疑度得分。
可选地,所述计算所述待判定团伙集合的嫌疑度得分,包括:
从所述数据特征中选取目标数据特征,所述目标数据特征在所述待判定团伙集合中的分布与所述目标数据特征在整体数据中的分布差异超过目标阈值;
根据所述目标数据特征在所述待判定团伙集合中的占比,计算所述待判定团伙集合的第一嫌疑度得分;
抽取每个所述待判定团伙集合的团伙特征;
将所述团伙特征输入训练好的回归模型中以使所述回归模型输出所述待判定团伙集合的第二嫌疑度得分;
根据所述第一嫌疑度得分以及所述第二嫌疑度得分,计算所述待判定团伙集合的综合嫌疑度得分。
本公开实施例的第二方面,提供一种基于图模型检测团伙欺诈的装置,所述装置包括:
获取模块,用于用户基础数据和历史嫌疑用户数据;
第一生成模块,用于根据获取的数据,生成用户关联图;其中,所述用户关联图的节点为根据数据特征生成的用户关联子图,所述用户关联图的边权重包括节点的相似度;
第二生成模块,用于基于所述用户关联图,利用社区划分算法生成待判定团伙集合;
计算模块,用于计算所述待判定团伙集合的嫌疑度;
输出模块,用于根据计算结果,输出所述待判定团伙的判定结果。
可选地,所述第一生成模块包括:
第一选取子模块,用于选取所述用户基础数据和所述历史嫌疑用户数据中的特征组合和组数;
第一生成子模块,用于利用特征一致性相等或模糊性相等方式对应生成用户关联子图并以所述用户关联子图为节点拼接生成用户无权重关联图;
第二生成子模块,用于以所述用户无权重关联图中节点的相似度作为边权重生成用户相似权重关联图。
可选地,所述第二生成模块包括:
第三生成子模块,用于基于所述用户相似权重关联图,利用社区划分算法生成n个团伙集合,n为正整数;
第一确认子模块,用于确认所述团伙集合中用户数量小于或等于极大阈值;
第二确认子模块,用于确认用户数量小于极小阈值的所述团伙集合的数量小于或等于预设阈值;
第三确认子模块,用于将所述团伙集合确定为待判定团伙集合。
可选地,还包括:
划分模块,用于对用户数量大于所述极大阈值的团伙集合调用社区划分算法进行划分以使所述团伙集合中用户数量小于或等于所述极大阈值;
凝聚模块,用于若用户数量小于极小阈值的所述团伙集合的数量大于所述预设阈值,调用层次聚类算法对用户数量小于极小阈值的所述团伙集合进行凝聚。
可选地,所述社区划分算法包括图标签传播算法或GN算法;所述层次聚类算法包括凝聚算法或***算法。
可选地,所述计算模块包括:
第二选取子模块,用于从所述数据特征中选取目标数据特征,所述目标数据特征在所述待判定团伙集合中的分布与所述目标数据特征在整体数据中的分布差异超过目标阈值;
第一计算子模块,用于根据所述目标数据特征在所述待判定团伙集合中的占比,计算所述待判定团伙集合的嫌疑度得分。
可选地,所述计算模块包括:
第一抽取子模块,用于抽取每个所述待判定团伙集合的团伙特征;
第一输入子模块,用于将所述团伙特征输入训练好的回归模型中以使所述回归模型输出所述待判定团伙集合的嫌疑度得分。
可选地,所述计算模块包括:
第三选取子模块,用于从所述数据特征中选取目标数据特征,所述目标数据特征在所述待判定团伙集合中的分布与所述目标数据特征在整体数据中的分布差异超过目标阈值;
第二计算子模块,用于根据所述目标数据特征在所述待判定团伙集合中的占比,计算所述待判定团伙集合的第一嫌疑度得分;
第二抽取子模块,用于抽取每个所述待判定团伙集合的团伙特征;
第二输入子模块,用于将所述团伙特征输入训练好的回归模型中以使所述回归模型输出所述待判定团伙集合的第二嫌疑度得分;
第三计算子模块,用于根据所述第一嫌疑度得分以及所述第二嫌疑度得分,计算所述待判定团伙集合的综合嫌疑度得分。
本公开实施例的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述第一方面中任一项所述方法的步骤。
本公开实施例的第四方面,提供一种基于图模型检测团伙欺诈的装置,包括:
存储器,其上存储有计算机程序;以及
处理器,用于执行所述存储器中的所述计算机程序,以实现上述第一方面中任一项所述方法的步骤。
采用上述技术方案,至少能够达到如下技术效果:
本公开根据获取的用户数据,生成用户关联图,并利用社区划分算法生成待判定团伙集合,通过计算待判定团伙集合的嫌疑度,即可以分辨出该待判定团伙集合是否属于欺诈团伙,解决了相关技术中难以识别团伙欺诈的技术问题。另外,本公开还使用社区划分算法和层次聚类算法,解决了团伙划分结果中团伙规模过大、较小的团伙规模数量很多的问题。并且,本公开通过相似索引的手段来提升图模型数据处理能力,同时利用子图组装、相似边权重可配置地方式生成用户相似权重关联图,这种方法更加灵活可并行,可以进一步提升欺诈场景下的大规模数据处理能力。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是本公开一示例性实施例示出的一种基于图模型检测团伙欺诈的方法流程图。
图2是根据一示例性实施例示出的一种基于图模型检测团伙欺诈的方法包括的步骤中生成用户关联图的流程图。
图3是根据一示例性实施例示出的一种基于图模型检测团伙欺诈的方法包括的步骤中生成待判定团伙集合的流程图。
图4是根据一示例性实施例示出的一种基于图模型检测团伙欺诈的方法包括的步骤中计算嫌疑度得分的流程图。
图5是根据一示例性实施例示出的另一种基于图模型检测团伙欺诈的方法包括的步骤中计算嫌疑度得分的流程图。
图6是根据一示例性实施例示出的另一种基于图模型检测团伙欺诈的方法包括的步骤中计算嫌疑度得分的流程图。
图7是本公开一示例性实施例示出的一种基于图模型检测团伙欺诈的装置框图。
图8是本公开一示例性实施例示出的一种基于图模型检测团伙欺诈的装置的第一生成模块框图。
图9是本公开一示例性实施例示出的一种基于图模型检测团伙欺诈的装置的第二生成模块框图。
图10是本公开一示例性实施例示出的另一种基于图模型检测团伙欺诈的装置框图。
图11是本公开一示例性实施例示出的一种基于图模型检测团伙欺诈的装置的计算模块框图。
图12是本公开一示例性实施例示出的另一种基于图模型检测团伙欺诈的装置的计算模块框图。
图13是本公开一示例性实施例示出的另一种基于图模型检测团伙欺诈的装置的计算模块框图。
图14是本公开一示例性实施例示出的一种基于图模型检测团伙欺诈的装置框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
为了应对无处不在的攻击,欺诈检测在当下显得至关重要。经过调研,相关技术中,针对金融欺诈检测主要采用如下几种,且存在各种缺陷,总结如下:
基于黑白名单、信誉库查找的方法,需要不定期维护添加新的黑白名单或信誉库内容,这种维护方法成本比较高如第三方有偿数据购买,且方法响应和覆盖性有限。
基于规则引擎的方法,线上金融欺诈手段多变,当欺诈者改变欺诈手段后,基于规则引擎的方法往往就会失效,需要投入大量运营和财力资源去更新规则引擎。
基于有监督机器学习的方法,有监督机器学习是欺诈检测中应用最广泛的学习方法。机器学习模型通过会运用如决策树、随机森林、支持向量机SVM(Support VectorMachine)和朴素贝叶斯算法等,进行数百个变量(高维空间)的复杂计算,准确锁定欺诈行为,但有监督机器学习方法依赖于标注数据,标注数据在金融欺诈场景获取难度比较大、正负样本失衡(正样本只有当欺诈发生后打标才有,在金融欺诈场景欺诈手段多变且样本较少导致打标较难)。若缺少足够欺诈标注数据,有监督机器学习的能力有限。
基于无监督学习的方法,无监督学习是目前欺诈检测应用探索的一个分支,主要是基于聚类和图方法进行研究,当前无监督技术比较不成熟,难度比较大,没有现成的解决方案可以有效的将无监督机器学习用于欺诈检测。主要难度如如何解决大规模数据能力、嫌疑判定量化等。
图1是本公开一示例性实施例示出的一种基于图模型检测团伙欺诈的方法流程图,以解决相关技术中难以识别团伙欺诈的技术问题。如图1所示,该基于图模型检测团伙欺诈包括:
S11,获取用户基础数据和历史嫌疑用户数据。
S12,根据获取的数据,生成用户关联图;其中,所述用户关联图的节点为根据数据特征生成的用户关联子图,所述用户关联图的边权重包括节点的相似度。
S13,基于所述用户关联图,利用社区划分算法生成待判定团伙集合。
S14,计算所述待判定团伙集合的嫌疑度。
S15,根据计算结果,输出所述待判定团伙的判定结果。
在步骤S11中,所述用户数据可以是用户申请的各种客户端账号的数据,比如申请美团账号时的用户数据、申请支付宝账号时的用户数据、申请微信账号时的用户数据等,所述账号可以是用户申请的银行***,比如储蓄卡或者***。所述用户数据也可以是利用支付平台进行支付的用户对应的数据,比如利用美团进行支付的用户数据、利用支付宝进行支付的用户数据、利用微信进行支付的用户数据等等。用户基础数据包括申请人填写申请书资料、人行报告查询信息、申请人授权的移动端行为数据、电商数据、以及社交数据。所述历史嫌疑用户数据可以包括黑白名单信息,黑白名单可以是网络中的任何实体类型,账户、地址、电话号码等。黑名单包括行内积累的欺诈、严重逾期、或者交换黑名单,白名单包括vip客户或者人工标记无风险的电话、地址等。
在获取用户基础数据和历史嫌疑用户数据后,执行步骤S12,根据获取的数据,生成用户关联图;其中,所述用户关联图的节点为根据数据特征生成的用户关联子图,所述用户关联图的边权重包括节点的相似度。
请参考图2,所述根据获取的数据,生成用户关联图,可以包括以下步骤:
S121,选取所述用户基础数据和所述历史嫌疑用户数据中的特征组合和组数。
S122,利用特征一致性相等或模糊性相等方式对应生成用户关联子图并以所述用户关联子图为节点拼接生成用户无权重关联图。
S123,以所述用户无权重关联图中节点的相似度作为边权重生成用户相似权重关联图。
在步骤S121中,所述数据中的特征可以是设备ID、IP地址、imsi(国际移动用户识别码)、imei(国际移动设备识别码)、地理信息、登录时间等特征。所述特征组合是从所述数据中的特征中选出至少一个特征作为一组,所述组数至少也是一组。
选取特征组合和组数后,利用特征一致性相等或模糊性相等方式,将不同的特征组合关联起来形成用户关联子图。比如,不同账号登录的设备ID相同,则可以利用特征一致性相等方式,将该两个账号关联起来;不同账号登录的IP地址部分相同,即同一个局域网下登录过不同账号,则可以利用特征模糊性相等方式将该两个账号关联起来。生成用户关联子图后,以所述用户关联子图为节点拼接生成用户无权重关联图。接着,以所述用户无权重关联图中节点的相似度作为边权重生成用户相似权重关联图,相识度可以使用相似度衡量函数来计算,基于权重大小可选择性剪枝优化生成用户相似权重关联图。
生成用户关联图后,执行步骤S13,基于用户关联图,利用社区划分算法生成待判定团伙集合。请参照图3,所述利用社区划分算法生成待判定团伙集合,包括:
S131,基于所述用户相似权重关联图,利用社区划分算法生成n个团伙集合,n为正整数。其中,所述社区划分算法包括图标签传播算法或GN算法。
S132,确认所述团伙集合中用户数量小于或等于极大阈值。
S133,确认用户数量小于极小阈值的所述团伙集合的数量小于或等于预设阈值。所述极大阈值大于所述极小阈值。
S134,将所述团伙集合确定为待判定团伙集合。
当所述团伙集合中用户数量(比如不同的账号数量)大于极大阈值时,比如,一个团伙集合中不同的账号数量超过20个,则继续调用社区划分算法进行划分以使所述团伙集合中用户数量小于或等于所述极大阈值。若用户数量小于极小阈值的所述团伙集合的数量大于所述预设阈值,比如,不同的账号数量小于3个团伙集合数超过15个,则调用层次聚类算法对用户数量小于极小阈值的所述团伙集合进行凝聚,这里层次聚类可选层次凝聚法或***法。
生成待判定团伙集合后,执行步骤S14,计算所述待判定团伙集合的嫌疑度。嫌疑度的计算方式包括但不限于以下三种:
第一种计算方式:请参考图4,所述计算所述待判定团伙集合的嫌疑度得分,包括以下步骤:
S141a,从所述数据特征中选取目标数据特征,所述目标数据特征在所述待判定团伙集合中的分布与所述目标数据特征在整体数据中的分布差异超过目标阈值。其中,整体数据是指所有的用户基础数据。
S142a,根据所述目标数据特征在所述待判定团伙集合中的占比,计算所述待判定团伙集合的嫌疑度得分。
举例来讲,以某客户端当天新注册的账号数量100个为例,其中使用虚拟手机号注册账号的数量为8个,则使用虚拟手机号注册的账号在当天新注册的账号中的分布比例为8%。生成的某个待判定团伙集合中,账号数量是10个,其中有7个账号是使用虚拟手机号注册的,分布比例为70%,70%对比8%,差异性很大。则以虚拟手机号注册的账号为目标数据特征,所述目标数据特征在所述待判定团伙集合中的占比为0.7,可以将该占比作为所述待判定团伙集合的嫌疑度得分。
或者,以某客户端当天新注册的账号数量100个为例,其中历史嫌疑用户注册账号的数量为8个,则历史嫌疑用户注册的账号在当天新注册的账号中的分布比例为8%。生成的某个待判定团伙集合中,账号数量是10个,其中有8个账号是历史嫌疑用户注册的,分布比例为80%,80%对比8%,差异性很大。则以历史嫌疑用户注册的账号为目标数据特征,所述目标数据特征在所述待判定团伙集合中的占比为0.8,可以将该占比作为所述待判定团伙集合的嫌疑度得分。
第二种计算方式:请参考图5,所述计算所述待判定团伙集合的嫌疑度得分,可以包括以下步骤:
S141b,抽取每个所述待判定团伙集合的团伙特征。其中,所述团伙特征至少包括历史嫌疑用户占比特征,也可以包括团伙规模、共享设备账号数量占比等特征。
S142b,将所述团伙特征输入训练好的回归模型中以使所述回归模型输出所述待判定团伙集合的嫌疑度得分。其中,所述回归模型可以是GBDT(Gradient BoostingDecision Tree;梯度提升决策树)模型。
第三种计算方式:请参考图6,所述计算所述待判定团伙集合的嫌疑度得分,可以包括以下步骤:
S141c,从所述数据特征中选取目标数据特征,所述目标数据特征在所述待判定团伙集合中的分布与所述目标数据特征在整体数据中的分布差异超过目标阈值。
S142c,根据所述目标数据特征在所述待判定团伙集合中的占比,计算所述待判定团伙集合的第一嫌疑度得分。
S143c,抽取每个所述待判定团伙集合的团伙特征。
S14c,将所述团伙特征输入训练好的回归模型中以使所述回归模型输出所述待判定团伙集合的第二嫌疑度得分。
S144c,根据所述第一嫌疑度得分以及所述第二嫌疑度得分,计算所述待判定团伙集合的综合嫌疑度得分。
接着根据计算结果,输出所述待判定团伙的判定结果。比如,当综合嫌疑度得分超过预设值时,则可以判定所述待判定团伙为欺诈团伙。
举例来讲,某个待判定团伙的第一嫌疑度得分为0.7,第二嫌疑度得分0.8,则所述待判定团伙集合的综合嫌疑度得分可以取两个得分的平均值0.75,超过预设值0.6,则该待判定团伙为欺诈团伙。
本公开根据获取的用户数据,生成用户关联图,并利用社区划分算法生成待判定团伙集合,通过计算待判定团伙集合的嫌疑度,即可以分辨出该待判定团伙集合是否属于欺诈团伙,解决了相关技术中难以识别团伙欺诈的技术问题。另外,本公开还使用社区划分算法和层次聚类算法,解决了团伙划分结果中团伙规模过大、较小的团伙规模数量很多的问题。并且,本公开通过相似索引的手段来提升图模型数据处理能力,同时利用子图组装、相似边权重可配置地方式生成用户相似权重关联图,这种方法更加灵活可并行,可以进一步提升欺诈场景下的大规模数据处理能力。
值得说明的是,对于图1所示的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本公开并不受所描述的动作顺序的限制。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本公开所必须的。
图7是本公开一示例性实施例示出的一种基于图模型检测团伙欺诈的装置。如图7所示,所述基于图模型检测团伙欺诈的装置300包括:
获取模块310,用于获取用户基础数据和历史嫌疑用户数据;
第一生成模块320,用于根据获取的数据,生成用户关联图;其中,所述用户关联图的节点为根据数据特征生成的用户关联子图,所述用户关联图的边权重包括节点的相似度;
第二生成模块330,用于基于所述用户关联图,利用社区划分算法生成待判定团伙集合;
计算模块340,用于计算所述待判定团伙集合的嫌疑度;
输出模块350,用于根据计算结果,输出所述待判定团伙的判定结果。
可选地,如图8所示,所述第一生成模块320包括:
第一选取子模块321,用于选取所述用户基础数据和所述历史嫌疑用户数据中的特征组合和组数;
第一生成子模块322,用于利用特征一致性相等或模糊性相等方式对应生成用户关联子图并以所述用户关联子图为节点拼接生成用户无权重关联图;
第二生成子模块323,用于以所述用户无权重关联图中节点的相似度作为边权重生成用户相似权重关联图。
可选地,如图9所示,所述第二生成模块330包括:
第三生成子模块331,用于基于所述用户相似权重关联图,利用社区划分算法生成n个团伙集合,n为正整数;
第一确认子模块332,用于确认所述团伙集合中用户数量小于或等于极大阈值;
第二确认子模块333,用于确认用户数量小于极小阈值的所述团伙集合的数量小于或等于预设阈值;
第三确认子模块334,用于将所述团伙集合确定为待判定团伙集合。
可选地,如图10所示,所述基于图模型检测团伙欺诈的装置300还包括:
划分模块360,用于对用户数量大于所述极大阈值的团伙集合调用社区划分算法进行划分以使所述团伙集合中用户数量小于或等于所述极大阈值;
凝聚模块370,用于若用户数量小于极小阈值的所述团伙集合的数量大于所述预设阈值,调用层次聚类算法对用户数量小于极小阈值的所述团伙集合进行凝聚。
可选地,所述社区划分算法包括图标签传播算法或GN算法;所述层次聚类算法包括凝聚算法或***算法。
可选地,如图11所示,所述计算模块340包括:
第二选取子模块341a,用于从所述数据特征中选取目标数据特征,所述目标数据特征在所述待判定团伙集合中的分布与所述目标数据特征在整体数据中的分布差异超过目标阈值;
第一计算子模块342a,用于根据所述目标数据特征在所述待判定团伙集合中的占比,计算所述待判定团伙集合的嫌疑度得分。
可选地,如图12所示,所述计算模块340包括:
第一抽取子模块341b,用于抽取每个所述待判定团伙集合的团伙特征;
第一输入子模块342b,用于将所述团伙特征输入训练好的回归模型中以使所述回归模型输出所述待判定团伙集合的嫌疑度得分。
可选地,如图13所示,所述计算模块340包括:
第三选取子模块341c,用于从所述数据特征中选取目标数据特征,所述目标数据特征在所述待判定团伙集合中的分布与所述目标数据特征在整体数据中的分布差异超过目标阈值;
第二计算子模块342c,用于根据所述目标数据特征在所述待判定团伙集合中的占比,计算所述待判定团伙集合的第一嫌疑度得分;
第二抽取子模块343c,用于抽取每个所述待判定团伙集合的团伙特征;
第二输入子模块344c,用于将所述团伙特征输入训练好的回归模型中以使所述回归模型输出所述待判定团伙集合的第二嫌疑度得分;
第三计算子模块345c,用于根据所述第一嫌疑度得分以及所述第二嫌疑度得分,计算所述待判定团伙集合的综合嫌疑度得分。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项可选实施例所述基于图模型检测团伙欺诈的方法步骤。
本公开还提供一种基于图模型检测团伙欺诈的装置,包括:
存储器,其上存储有计算机程序;以及
处理器,用于执行所述存储器中的所述计算机程序,以实现上述任一项可选实施例所述基于图模型检测团伙欺诈的方法步骤。
图14是根据一示例性实施例示出的一种基于图模型检测团伙欺诈的装置400的框图。如图14所示,该装置400可以包括:处理器401,存储器402,多媒体组件403,输入/输出(I/O)接口404,以及通信组件405。
其中,处理器401用于控制该装置400的整体操作,以完成上述的基于图模型检测团伙欺诈的方法中的全部或部分步骤。存储器402用于存储各种类型的数据以支持在该装置400的操作,这些数据例如可以包括用于在该装置400上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器402可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-OnlyMemory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-OnlyMemory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件403可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器402或通过通信组件405发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口404为处理器401和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件405用于该装置400与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near Field Communication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件405可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,装置400可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的基于图模型检测团伙欺诈的方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,例如包括程序指令的存储器402,上述程序指令可由装置400的处理器401执行以完成上述的基于图模型检测团伙欺诈的方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

Claims (10)

1.一种基于图模型检测团伙欺诈的方法,其特征在于,所述方法包括:
获取用户基础数据和历史嫌疑用户数据;
根据获取的数据,生成用户关联图;其中,所述用户关联图的节点为根据数据特征生成的用户关联子图,所述用户关联图的边权重包括节点的相似度;
基于所述用户关联图,利用社区划分算法生成待判定团伙集合;
计算所述待判定团伙集合的嫌疑度;
根据计算结果,输出所述待判定团伙的判定结果。
2.根据权利要求1所述的方法,其特征在于,所述生成用户关联图,包括:
选取所述用户基础数据和所述历史嫌疑用户数据中的特征组合和组数;
利用特征一致性相等或模糊性相等方式对应生成用户关联子图并以所述用户关联子图为节点拼接生成用户无权重关联图;
以所述用户无权重关联图中节点的相似度作为边权重生成用户相似权重关联图。
3.根据权利要求2所述的方法,其特征在于,所述利用社区划分算法生成待判定团伙集合,包括:
基于所述用户相似权重关联图,利用社区划分算法生成n个团伙集合,n为正整数;
确认所述团伙集合中用户数量小于或等于极大阈值;
确认用户数量小于极小阈值的所述团伙集合的数量小于或等于预设阈值;
将所述团伙集合确定为待判定团伙集合。
4.根据权利要求3所述的方法,其特征在于,还包括:
对用户数量大于所述极大阈值的团伙集合调用社区划分算法进行划分以使所述团伙集合中用户数量小于或等于所述极大阈值;
若用户数量小于极小阈值的所述团伙集合的数量大于所述预设阈值,调用层次聚类算法对用户数量小于极小阈值的所述团伙集合进行凝聚。
5.根据权利要求4所述的方法,其特征在于,所述社区划分算法包括图标签传播算法或GN算法;所述层次聚类算法包括凝聚算法或***算法。
6.根据权利要求1所述的方法,其特征在于,所述计算所述待判定团伙集合的嫌疑度得分,包括:
从所述数据特征中选取目标数据特征,所述目标数据特征在所述待判定团伙集合中的分布与所述目标数据特征在整体数据中的分布差异超过目标阈值;
根据所述目标数据特征在所述待判定团伙集合中的占比,计算所述待判定团伙集合的嫌疑度得分。
7.根据权利要求1所述的方法,其特征在于,所述计算所述待判定团伙集合的嫌疑度得分,包括:
抽取每个所述待判定团伙集合的团伙特征;
将所述团伙特征输入训练好的回归模型中以使所述回归模型输出所述待判定团伙集合的嫌疑度得分。
8.一种基于图模型检测团伙欺诈的装置,其特征在于,所述装置包括:
获取模块,用于获取用户基础数据和历史嫌疑用户数据;
第一生成模块,用于根据获取的数据,生成用户关联图;其中,所述用户关联图的节点为根据数据特征生成的用户关联子图,所述用户关联图的边权重包括节点的相似度;
第二生成模块,用于基于所述用户关联图,利用社区划分算法生成待判定团伙集合;
计算模块,用于计算所述待判定团伙集合的嫌疑度;
输出模块,用于根据计算结果,输出所述待判定团伙的判定结果。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7中任一项所述方法的步骤。
10.一种基于图模型检测团伙欺诈的装置,其特征在于,包括:
存储器,其上存储有计算机程序;以及
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1至7中任一项所述方法的步骤。
CN201910239821.3A 2019-03-27 2019-03-27 基于图模型检测团伙欺诈的方法和装置、存储介质 Pending CN110070364A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910239821.3A CN110070364A (zh) 2019-03-27 2019-03-27 基于图模型检测团伙欺诈的方法和装置、存储介质
PCT/CN2019/124807 WO2020192184A1 (zh) 2019-03-27 2019-12-12 基于图模型检测团伙欺诈

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910239821.3A CN110070364A (zh) 2019-03-27 2019-03-27 基于图模型检测团伙欺诈的方法和装置、存储介质

Publications (1)

Publication Number Publication Date
CN110070364A true CN110070364A (zh) 2019-07-30

Family

ID=67366679

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910239821.3A Pending CN110070364A (zh) 2019-03-27 2019-03-27 基于图模型检测团伙欺诈的方法和装置、存储介质

Country Status (2)

Country Link
CN (1) CN110070364A (zh)
WO (1) WO2020192184A1 (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110827159A (zh) * 2019-11-11 2020-02-21 上海交通大学 基于关系图的金融医疗保险诈骗预警方法、装置及终端
CN111090729A (zh) * 2019-12-16 2020-05-01 深圳市卡牛科技有限公司 欺诈团伙的识别方法、装置、服务器和存储介质
CN111325350A (zh) * 2020-02-19 2020-06-23 第四范式(北京)技术有限公司 可疑组织发现***和方法
CN111339436A (zh) * 2020-02-11 2020-06-26 腾讯科技(深圳)有限公司 一种数据识别方法、装置、设备以及可读存储介质
CN111401959A (zh) * 2020-03-18 2020-07-10 多点(深圳)数字科技有限公司 风险群体的预测方法、装置、计算机设备及存储介质
CN111428217A (zh) * 2020-04-12 2020-07-17 中信银行股份有限公司 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质
CN111476662A (zh) * 2020-04-13 2020-07-31 中国工商银行股份有限公司 反洗钱识别方法及装置
CN111709756A (zh) * 2020-06-16 2020-09-25 银联商务股份有限公司 一种可疑社团的识别方法、装置、存储介质和计算机设备
WO2020192184A1 (zh) * 2019-03-27 2020-10-01 北京三快在线科技有限公司 基于图模型检测团伙欺诈
CN111931047A (zh) * 2020-07-31 2020-11-13 中国平安人寿保险股份有限公司 基于人工智能的黑产账号检测方法及相关装置
CN112184334A (zh) * 2020-10-27 2021-01-05 北京嘀嘀无限科技发展有限公司 用于确定问题用户的方法、装置、设备和介质
CN112308694A (zh) * 2020-11-24 2021-02-02 拉卡拉支付股份有限公司 一种欺诈团伙的发现方法及装置
CN112508456A (zh) * 2020-12-25 2021-03-16 平安国际智慧城市科技股份有限公司 食品安全风险评估方法、***、计算机设备及存储介质
CN112651764A (zh) * 2019-10-12 2021-04-13 武汉斗鱼网络科技有限公司 一种目标用户识别方法、装置、设备和存储介质
CN112907308A (zh) * 2019-11-19 2021-06-04 京东数字科技控股有限公司 数据检测方法和装置、计算机可读存储介质
CN113326178A (zh) * 2021-06-22 2021-08-31 北京奇艺世纪科技有限公司 一种异常账号传播方法、装置、电子设备和存储介质
WO2021169631A1 (zh) * 2020-02-29 2021-09-02 深圳壹账通智能科技有限公司 欺诈人员识别方法、装置、设备和存储介质
CN113592517A (zh) * 2021-08-09 2021-11-02 深圳前海微众银行股份有限公司 欺诈客群识别方法、装置、终端设备及计算机存储介质
CN114820219A (zh) * 2022-05-23 2022-07-29 杭银消费金融股份有限公司 一种基于复杂网络的欺诈社团识别方法及***
CN115150052A (zh) * 2022-06-08 2022-10-04 北京天融信网络安全技术有限公司 攻击团伙的跟踪识别方法、装置、设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662964A (zh) * 2012-03-05 2012-09-12 北京千橡网景科技发展有限公司 对用户的好友进行分组的方法和装置
CN107194623A (zh) * 2017-07-20 2017-09-22 深圳市分期乐网络科技有限公司 一种团伙欺诈的发现方法及装置
CN107527295A (zh) * 2017-08-24 2017-12-29 中南大学 基于时态合著网络的学术团队动态社区发现方法及其质量评估方法
CN107644098A (zh) * 2017-09-29 2018-01-30 马上消费金融股份有限公司 一种欺诈行为识别方法、装置、设备及存储介质
CN107784327A (zh) * 2017-10-27 2018-03-09 天津理工大学 一种基于gn的个性化社区发现方法
CN108681936A (zh) * 2018-04-26 2018-10-19 浙江邦盛科技有限公司 一种基于模块度和平衡标签传播的欺诈团伙识别方法
CN108764917A (zh) * 2018-05-04 2018-11-06 阿里巴巴集团控股有限公司 一种欺诈团伙的识别方法和装置
CN108898505A (zh) * 2018-05-28 2018-11-27 武汉斗鱼网络科技有限公司 作弊团伙的识别方法、相关存储介质和电子设备
CN109299811A (zh) * 2018-08-20 2019-02-01 众安在线财产保险股份有限公司 一种基于复杂网络的欺诈团伙识别和风险传播预测的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8694979B2 (en) * 2012-06-26 2014-04-08 International Business Machines Corporation Efficient egonet computation in a weighted directed graph
CN105812195B (zh) * 2014-12-30 2019-05-07 阿里巴巴集团控股有限公司 计算机识别批量账户的方法和装置
CN110070364A (zh) * 2019-03-27 2019-07-30 北京三快在线科技有限公司 基于图模型检测团伙欺诈的方法和装置、存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102662964A (zh) * 2012-03-05 2012-09-12 北京千橡网景科技发展有限公司 对用户的好友进行分组的方法和装置
CN107194623A (zh) * 2017-07-20 2017-09-22 深圳市分期乐网络科技有限公司 一种团伙欺诈的发现方法及装置
CN107527295A (zh) * 2017-08-24 2017-12-29 中南大学 基于时态合著网络的学术团队动态社区发现方法及其质量评估方法
CN107644098A (zh) * 2017-09-29 2018-01-30 马上消费金融股份有限公司 一种欺诈行为识别方法、装置、设备及存储介质
CN107784327A (zh) * 2017-10-27 2018-03-09 天津理工大学 一种基于gn的个性化社区发现方法
CN108681936A (zh) * 2018-04-26 2018-10-19 浙江邦盛科技有限公司 一种基于模块度和平衡标签传播的欺诈团伙识别方法
CN108764917A (zh) * 2018-05-04 2018-11-06 阿里巴巴集团控股有限公司 一种欺诈团伙的识别方法和装置
CN108898505A (zh) * 2018-05-28 2018-11-27 武汉斗鱼网络科技有限公司 作弊团伙的识别方法、相关存储介质和电子设备
CN109299811A (zh) * 2018-08-20 2019-02-01 众安在线财产保险股份有限公司 一种基于复杂网络的欺诈团伙识别和风险传播预测的方法

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020192184A1 (zh) * 2019-03-27 2020-10-01 北京三快在线科技有限公司 基于图模型检测团伙欺诈
CN112651764B (zh) * 2019-10-12 2023-03-31 武汉斗鱼网络科技有限公司 一种目标用户识别方法、装置、设备和存储介质
CN112651764A (zh) * 2019-10-12 2021-04-13 武汉斗鱼网络科技有限公司 一种目标用户识别方法、装置、设备和存储介质
CN110827159B (zh) * 2019-11-11 2023-11-03 上海交通大学 基于关系图的金融医疗保险诈骗预警方法、装置及终端
CN110827159A (zh) * 2019-11-11 2020-02-21 上海交通大学 基于关系图的金融医疗保险诈骗预警方法、装置及终端
CN112907308B (zh) * 2019-11-19 2024-05-24 京东科技控股股份有限公司 数据检测方法和装置、计算机可读存储介质
CN112907308A (zh) * 2019-11-19 2021-06-04 京东数字科技控股有限公司 数据检测方法和装置、计算机可读存储介质
CN111090729B (zh) * 2019-12-16 2024-04-09 深圳市卡牛科技有限公司 欺诈团伙的识别方法、装置、服务器和存储介质
CN111090729A (zh) * 2019-12-16 2020-05-01 深圳市卡牛科技有限公司 欺诈团伙的识别方法、装置、服务器和存储介质
CN111339436A (zh) * 2020-02-11 2020-06-26 腾讯科技(深圳)有限公司 一种数据识别方法、装置、设备以及可读存储介质
CN111325350B (zh) * 2020-02-19 2023-09-29 第四范式(北京)技术有限公司 可疑组织发现***和方法
CN111325350A (zh) * 2020-02-19 2020-06-23 第四范式(北京)技术有限公司 可疑组织发现***和方法
WO2021169631A1 (zh) * 2020-02-29 2021-09-02 深圳壹账通智能科技有限公司 欺诈人员识别方法、装置、设备和存储介质
CN111401959A (zh) * 2020-03-18 2020-07-10 多点(深圳)数字科技有限公司 风险群体的预测方法、装置、计算机设备及存储介质
CN111401959B (zh) * 2020-03-18 2023-09-29 多点(深圳)数字科技有限公司 风险群体的预测方法、装置、计算机设备及存储介质
CN111428217A (zh) * 2020-04-12 2020-07-17 中信银行股份有限公司 欺诈团伙识别方法、装置、电子设备及计算机可读存储介质
CN111476662A (zh) * 2020-04-13 2020-07-31 中国工商银行股份有限公司 反洗钱识别方法及装置
CN111709756A (zh) * 2020-06-16 2020-09-25 银联商务股份有限公司 一种可疑社团的识别方法、装置、存储介质和计算机设备
CN111931047A (zh) * 2020-07-31 2020-11-13 中国平安人寿保险股份有限公司 基于人工智能的黑产账号检测方法及相关装置
CN112184334A (zh) * 2020-10-27 2021-01-05 北京嘀嘀无限科技发展有限公司 用于确定问题用户的方法、装置、设备和介质
CN112308694A (zh) * 2020-11-24 2021-02-02 拉卡拉支付股份有限公司 一种欺诈团伙的发现方法及装置
CN112508456A (zh) * 2020-12-25 2021-03-16 平安国际智慧城市科技股份有限公司 食品安全风险评估方法、***、计算机设备及存储介质
CN113326178A (zh) * 2021-06-22 2021-08-31 北京奇艺世纪科技有限公司 一种异常账号传播方法、装置、电子设备和存储介质
CN113592517A (zh) * 2021-08-09 2021-11-02 深圳前海微众银行股份有限公司 欺诈客群识别方法、装置、终端设备及计算机存储介质
CN114820219A (zh) * 2022-05-23 2022-07-29 杭银消费金融股份有限公司 一种基于复杂网络的欺诈社团识别方法及***
CN115150052A (zh) * 2022-06-08 2022-10-04 北京天融信网络安全技术有限公司 攻击团伙的跟踪识别方法、装置、设备及存储介质

Also Published As

Publication number Publication date
WO2020192184A1 (zh) 2020-10-01

Similar Documents

Publication Publication Date Title
CN110070364A (zh) 基于图模型检测团伙欺诈的方法和装置、存储介质
CN106803168B (zh) 一种异常转账侦测方法和装置
US11074350B2 (en) Method and device for controlling data risk
CN112396189B (zh) 一种多方构建联邦学习模型的方法及装置
CN107730262A (zh) 一种欺诈识别方法和装置
KR101364763B1 (ko) 금융거래패턴분석을 이용한 금융사기 경보 시스템 및 방법
CN109063966A (zh) 风险账户的识别方法和装置
CN108921686A (zh) 一种个人用户的信用评分方法和装置
CN112600810A (zh) 一种基于图分类的以太坊网络钓鱼诈骗检测方法及装置
CN109325845A (zh) 一种金融产品智能推荐方法及***
CN111325619A (zh) 一种基于联合学习的***欺诈检测模型更新方法及装置
Kulkarni et al. Advanced credit score calculation using social media and machine learning
CN110619574A (zh) 汇款数据处理方法、装置、电子设备及存储介质
CN109711801A (zh) 一种网银对账方法及装置
CN111428092B (zh) 基于图模型的银行精准营销方法
CN109003088B (zh) 一种业务风险分析方法、装置及设备
CN108022096A (zh) 一种移动支付方法、装置、终端及可读存储介质
CN110347566A (zh) 用于对注册风控模型进行效能评估的方法及装置
US10049306B2 (en) System and method for learning from the images of raw data
Adedoyin Predicting fraud in mobile money transfer
TWI717839B (zh) 風險頂點識別方法和裝置
CN114444120A (zh) 一种基于区块链的融资方法、装置、电子设备和存储介质
CN107423982A (zh) 基于账户的业务实现方法和装置
CN113052579B (zh) 一种移动支付平台的支付方法及***
CN115345726B (zh) ***的自动审批方法、装置、电子设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination