CN113689218A - 风险账户的识别方法、装置、计算机设备和存储介质 - Google Patents

风险账户的识别方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN113689218A
CN113689218A CN202110901445.7A CN202110901445A CN113689218A CN 113689218 A CN113689218 A CN 113689218A CN 202110901445 A CN202110901445 A CN 202110901445A CN 113689218 A CN113689218 A CN 113689218A
Authority
CN
China
Prior art keywords
transaction
risk
account
accounts
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110901445.7A
Other languages
English (en)
Inventor
朱超
杨洋
李锋
张琛
万化
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Pudong Development Bank Co Ltd
Original Assignee
Shanghai Pudong Development Bank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Pudong Development Bank Co Ltd filed Critical Shanghai Pudong Development Bank Co Ltd
Priority to CN202110901445.7A priority Critical patent/CN113689218A/zh
Publication of CN113689218A publication Critical patent/CN113689218A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/03Credit; Loans; Processing thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Development Economics (AREA)
  • Computer Security & Cryptography (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请涉及一种风险账户的识别方法、装置、计算机设备和存储介质。所述方法包括:获取多个交易账户,构建多个交易账户对应的交易网络拓扑图,可以从转账交易关系的角度重新识别了整个洗钱交易链路,更加全面地检测海量交易中的涉及洗钱风险的账户;根据交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户;根据预设局部社区发现算法以及交易异常账户,对交易网络拓扑图进行划分,得到多个风险社区;通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户,可以结合图神经网络算法,利用图的网络结构特征构造模型,从关系的角度识别风险账户,提高风险账户的识别准确率。

Description

风险账户的识别方法、装置、计算机设备和存储介质
技术领域
本申请涉及数据处理技术领域,特别是涉及一种风险账户的识别方法、装置、计算机设备和存储介质。
背景技术
洗钱是一种将非法收入通过金融机构以各种手段掩饰、隐瞒资金的来源和性质,使其在形式上合法化的行为。洗钱行为会对正常、稳定的经济秩序带来一定的负面影响。目前在反洗钱领域,传统的反洗钱风险检测方法一般是:由银行内多名专家设置的模型和指标,组成银行内部反洗钱***。根据规则在海量交易中进行人工筛选,继而通过银行内部反洗钱***,对筛选出的交易进行监测,最后再对触发模型异常的交易进行人工甄别,确定交易账户是否异常。
但是,随着金融业务模式的发展,线上交易以及交易数据越来越多,传统的反洗钱风险检测方法难以适应,又由于传统方法多依赖于专家总结的规则模型进行涉及洗钱风险账户的识别,导致传统方法的识别准确率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高识别准确率的风险账户的识别方法、装置、计算机设备和存储介质。
一种风险账户的识别方法,所述方法包括:
获取多个交易账户,构建所述多个交易账户对应的交易网络拓扑图;
根据所述交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户;
根据预设局部社区发现算法以及所述交易异常账户,对所述交易网络拓扑图进行划分,得到多个风险社区;
通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户。
在其中一个实施例中,在所述根据所述交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户的步骤之前,所述方法还包括:
通过预设过滤方式,对所述交易网络拓扑图进行过滤,得到过滤后的交易网络拓扑图。
在其中一个实施例中,所述预设过滤方式包括转账孤岛过滤方式、出入度过滤方式、中心折损率过滤方式中的一种或多种;
所述通过预设过滤方式,对所述交易网络拓扑图进行过滤,得到过滤后的交易网络拓扑图,包括:
识别所述交易网络拓扑图中的转账孤岛节点,并对所述转账孤岛节点进行过滤,得到过滤后的交易网络拓扑图;
识别所述交易网络拓扑图中入度以及出度均满足第一目标条件的第一节点,并将所述第一节点过滤,得到过滤后的交易网络拓扑图;
识别所述交易网络拓扑图中的中心折损率满足第二目标条件的第二节点,并将所述第二节点过滤,得到过滤后的交易网络拓扑图。
在其中一个实施例中,所述根据所述交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户,包括:
将所述交易网络拓扑图输入至所述预先训练完成的异常账户识别模型,得到多个初始异常账户以及多个初始异常账户对应的异常度;
将所述异常度满足预设异常条件的初始异常账户作为交易异常账户。
在其中一个实施例中,所述根据预设局部社区发现算法以及所述交易异常账户,对所述交易网络拓扑图进行划分,得到多个风险社区,包括:
通过所述预设局部社区发现算法,确定与所述交易异常账户相关联的多个关联节点,并计算多个关联节点的网页排名值;
将所述网页排名值大于或等于预设切割阈值的目标关联节点、以及与所述目标关联节点对应的交易异常账户划分为同一风险社区。
在其中一个实施例中,所述通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户,包括:
分别将各所述风险社区的图结构特征信息输入至所述预设图神经网络算法,得到所述风险社区中各账户的风险值;
将所述风险值大于或等于预设风险阈值的账户作为涉及洗钱风险的交易账户。
在其中一个实施例中,所述异常账户识别模型的训练过程包括:
获取样本账户的数据;
根据所述样本账户数据,通过有监督的机器学习算法对待训练的异常账户识别模型进行训练,得到训练完成的异常账户识别模型,所述样本账户包括风险样本账户和非风险样本账户,所述样本账户数据包括风险样本账户的交易特征以及非风险账户的交易特征。
在其中一个实施例中,所述预设图神经网络算法包括图卷积神经网络算法和GraphSage算法。
一种风险账户的识别装置,所述装置包括:
获取模块,用于获取多个交易账户,构建所述多个交易账户对应的交易网络拓扑图;
第一识别模块,用于根据所述交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户;
划分模块,用于根据预设局部社区发现算法以及所述交易异常账户,对所述交易网络拓扑图进行划分,得到多个风险社区;
第二识别模块,用于通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户。
在其中一个实施例中,所述装置还包括:
过滤模块,用于通过预设过滤方式,对所述交易网络拓扑图进行过滤,得到过滤后的交易网络拓扑图。
在其中一个实施例中,所述预设过滤方式包括转账孤岛过滤方式、出入度过滤方式、中心折损率过滤方式中的一种或多种;
所述过滤模块,包括:
第一识别单元,用于识别所述交易网络拓扑图中的转账孤岛节点,并对所述转账孤岛节点进行过滤,得到过滤后的交易网络拓扑图;
第二识别单元,用于识别所述交易网络拓扑图中入度以及出度均满足第一目标条件的第一节点,并将所述第一节点过滤,得到过滤后的交易网络拓扑图;
第三识别单元,用于识别所述交易网络拓扑图中的中心折损率满足第二目标条件的第二节点,并将所述第二节点过滤,得到过滤后的交易网络拓扑图。
在其中一个实施例中,所述第一识别模块,包括:
异常度确定单元,用于将所述交易网络拓扑图输入至所述预先训练完成的异常账户识别模型,得到多个初始异常账户以及多个初始异常账户对应的异常度;
交易异常账户确定单元,用于将所述异常度满足预设异常条件的初始异常账户作为交易异常账户。
在其中一个实施例中,所述划分模块,包括:
计算单元,用于通过所述预设局部社区发现算法,确定与所述交易异常账户相关联的多个关联节点,并计算多个关联节点的网页排名值;
排名单元,用于将所述网页排名值大于或等于预设切割阈值的目标关联节点、以及与所述目标关联节点对应的交易异常账户划分为同一风险社区。
在其中一个实施例中,所述第二识别模块,包括:
风险值计算单元,用于分别将各所述风险社区的图结构特征信息输入至所述预设图神经网络算法,得到所述风险社区中各账户的风险值;
账户识别单元,用于将所述风险值大于或等于预设风险阈值的账户作为涉及洗钱风险的交易账户。
在其中一个实施例中,所述装置还包括:
训练模块,用于获取样本账户的数据;根据所述样本账户数据,通过有监督的机器学习算法对待训练的异常账户识别模型进行训练,得到训练完成的异常账户识别模型,所述样本账户包括风险样本账户和非风险样本账户,所述样本账户数据包括风险样本账户的交易特征以及非风险账户的交易特征。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取多个交易账户,构建所述多个交易账户对应的交易网络拓扑图;
根据所述交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户;
根据预设局部社区发现算法以及所述交易异常账户,对所述交易网络拓扑图进行划分,得到多个风险社区;
通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取多个交易账户,构建所述多个交易账户对应的交易网络拓扑图;
根据所述交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户;
根据预设局部社区发现算法以及所述交易异常账户,对所述交易网络拓扑图进行划分,得到多个风险社区;
通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户。
上述风险账户的识别方法、装置、计算机设备和存储介质,通过获取多个交易账户,构建多个交易账户对应的交易网络拓扑图,可以从转账交易关系的角度重新识别了整个洗钱交易链路,更加全面地检测海量交易中的涉及洗钱风险的账户;根据交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户;根据预设局部社区发现算法以及交易异常账户,对交易网络拓扑图进行划分,得到多个风险社区;通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户,可以结合图神经网络算法,利用图的网络结构特征构造模型,从关系的角度识别风险账户,提高风险账户的识别准确率。
附图说明
图1为一个实施例中风险账户的识别方法的流程示意图;
图2为一个实施例中过滤步骤的流程示意图;
图3为一个实施例中提取交易异常账户步骤的流程示意图;
图4为一个实施例中划分风险社区步骤的流程示意图;
图5为一个实施例中筛选风险账户步骤的流程示意图;
图6为一个实施例中模型训练步骤的流程示意图;
图7为一个实施例中风险账户的识别装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种风险账户的识别方法,本实施例以该方法应用于识别设备进行举例说明,可以理解的是,该方法也可以应用于服务器,还可以应用于包括识别设备和服务器的***,并通过识别设备和服务器的交互实现,上述识别设备可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。本实施例中,该识别方法包括以下步骤:
步骤101,获取多个交易账户,构建多个交易账户对应的交易网络拓扑图。
具体地,识别设备获取预设时间段内的多个交易账户,以及多个交易账户之间的交易特征信息。这样,识别设备可以根据多个交易账户在进行交易时的交易特征信息,构建多个交易账户对应的交易网络拓扑图(交易网络图谱)。其中,预设时间段可以是根据实际应用场景确定的一段时间。交易账户可以是在金融机构(如银行)根据用户的身份特征信息开设的账户,该账户具备转账、收款等功能。多个交易账户之间的交易特征信息可以包括,交易账号、交易金额、交易次数、交易时间、交易对手等。交易网络拓扑图中包括多个节点,各节点分别表示不同的交易账户。
步骤102,根据交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户。
具体地,预先训练完成的异常账户识别模型是有监督的机器学习模型,该机器学习模型可以是通过有监督的机器学习算法进行训练后得到的。识别设备将交易网络拓扑图输入至异常账户识别模型中,得到该识别模型的输出结果。这样,识别设备可以根据识别模型的输出结果,确定交易网络拓扑图中存在交易异常的节点,也就是可以确定多个交易异常账户。其中,预先训练完成的异常账户识别模型可以根据交易账户的交易特征信息,预测该交易账户是否为存在洗钱风险的账户(交易异常账户)。
步骤103,根据预设局部社区发现算法以及交易异常账户,对交易网络拓扑图进行划分,得到多个风险社区。
具体地,预设局部社区发现算法可以是基于personal pagerank的局部社区发现算法。该算法的输入可以是多个交易异常账户以及多个交易异常账户对应的交易网络拓扑图。该算法的输出可以是与多个与交易异常账户存在关联关系的节点,以及该节点对于上述交易异常账户的网页排名值(pagerank值)。这样,识别设备可以通过预设局部社区发现算法,对交易网络拓扑图进行划分,得到多个风险社区,一个风险社区中可以包括一个或多个交易异常账户对应的节点。
步骤104,通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户。
具体地,识别设备可以在每一个风险社区内,通过预设图神经网络算法对社区内的各个交易账户进行识别,得到存在洗钱嫌疑的风险账户。
上述风险账户的识别方法中,通过获取多个交易账户,构建多个交易账户对应的交易网络拓扑图,可以从转账交易关系的角度重新识别了整个洗钱交易链路,更加全面地检测海量交易中的涉及洗钱风险的账户;根据交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户;根据预设局部社区发现算法以及交易异常账户,对交易网络拓扑图进行划分,得到多个风险社区;通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户,可以结合图神经网络算法,利用图的网络结构特征构造模型,从关系的角度识别风险账户,提高存在洗钱嫌疑的风险账户的识别准确率。
在一个实施例中,由于多个交易账户对应的是大量的交易数据,导致交易网络拓扑图较为复杂。因此,在步骤102“根据交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户”之前,该识别方法还包括:
通过预设过滤方式,对交易网络拓扑图进行过滤,得到过滤后的交易网络拓扑图。
具体地,识别设备可以预先配置多种过滤方式,通过该过滤方式对生成的交易网络拓扑图进行过滤。识别设备可以基于多个交易账户对应的大量交易数据,提取存在洗钱风险的交易账户的异常特征,例如,频繁汇入/汇出、集中转入/分散转出、分散转入/集中转出、链式或环状交易结构等等。为了降低交易网络拓扑图的复杂度,识别设备可以对多个交易账户对应的同一交易账号的交易边进行融合,还可以将交易金额和交易频次进行累加后得到的和作为融合属性,也可以采用平均值度量交易时间。针对集中转入、集中转出、分散转入以及分散转出的异常交易账户,识别设备可以通过预先配置的多种过滤方式对交易网络拓扑图进行过滤,以简化交易网络拓扑图,提高涉及洗钱风险的账户的识别准确率。
在一个实施例中,为了简化交易网络拓扑图,识别设备可以对网络交易拓扑图进行过滤,预设过滤方式包括转账孤岛过滤方式、出入度过滤方式、中心折损率过滤方式中的一种或多种。相应地,如图2所示,步骤102“通过预设过滤方式,对交易网络拓扑图进行过滤,得到过滤后的交易网络拓扑图”的具体处理过程,包括:
步骤201,识别交易网络拓扑图中的转账孤岛节点,并对转账孤岛节点进行过滤,得到过滤后的交易网络拓扑图。
具体地,对于仅发生相互转账,而不与其他账户进行交易的两个账户,可以称上述两个账户为转账孤岛节点。识别设备可以提取上述交易网络拓扑图中的转账孤岛节点,并对该转账孤岛节点进行剔除处理,得到处理后的交易网络拓扑图。
步骤202,识别交易网络拓扑图中入度以及出度均满足第一目标条件的第一节点,并将第一节点过滤,得到过滤后的交易网络拓扑图。
具体地,账户A的入度可以是向账户A转账的账户数量,出度可以是账户A向外转账的账户数量。第一目标条件可以是涉及洗钱风险的账户的筛选条件。例如,对于洗钱活动中的中心节点账户,该中心节点账户具备的特征是集中转入、分散转出,因此,该中心节点账户的入度较小,出度较大。这样,第一目标条件可以是该账户的入度小于第一阈值,且出度大于第二阈值。又例如,对于洗钱活动中的中心节点账户,该中心节点账户所具备的特征还可以是分散转入、集中转出,因此,该中心节点账户的入度较大,且出度较小。这样,第一目标条件可以是账户的入度大于第三阈值,且出度小于第四阈值。
在一可选实施例中,识别设备提取交易网络拓扑图中满足第一目标条件的节点,并对该第一节点做剔除处理,得到处理后的交易网络拓扑图。
步骤203,识别交易网络拓扑图中的中心折损率满足第二目标条件的第二节点,并将第二节点过滤,得到过滤后的交易网络拓扑图。
具体地,在洗钱活动中的洗钱中心节点起过渡作用,因此,转入此洗钱中心节点的钱都会以各种方式转出,因此,交易账户的转出金额与准入金额的比值(中心折损率)也可以作为筛选洗钱账户的条件。这样,第二目标条件可以是交易网络拓扑图中的节点的中心折损率达到预设阈值(如1)。识别设备可以提取交易网络拓扑图中中心折损率达到预设阈值的节点,并对该节点做剔除处理,得到处理后的交易网络拓扑图。
在一个可选实施例中,预设过滤方式还可以包括交易时间差过滤方式。识别可以通过计算各个节点在进行线上交易的时间与进行线下交易的时间的差值,作为过滤条件,实现对交易网络拓扑图的进一步过滤,可以精简洗钱账户的检测范围,降低洗钱账户的检测计算量,提高洗钱账户的检测效率。
本发明实施例还需要说明的是,第一阈值、第二阈值、第三阈值和第四阈值的具体数值可以是根据实际应用场景具体确定的,本发明对此并不做具体限定。上述步骤201、步骤202、步骤203均不需要区分执行的先后顺序,在本实施例中,可以包括步骤201的执行过程、步骤202的执行过程、步骤203的执行过程的一个或多个。本发明实施例对上述步骤的执行顺序并不做具体限定,本领域技术人员可以根据实际应用场景确定。
在一个实施例中,如图3所示,步骤102“根据交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户”的具体处理过程,包括:
步骤105,将交易网络拓扑图输入至预先训练完成的异常账户识别模型,得到多个初始异常账户以及多个初始异常账户对应的异常度。
具体地,在异常账户的实际识别场景中,异常账户识别模型的输入可以是由多个交易账户组成的交易网络拓扑图,异常账户识别模型的输出可以是模型预测的多个初始异常账户以及各初始异常账户对应的异常度。
步骤106,将异常度满足预设异常条件的初始异常账户作为交易异常账户。
具体地,预设异常条件可以是异常度大于或等于预设异常阈值。在实际应用场景中,识别设备可以将异常度从大到小排序,将位于目标位置的异常度作为预设异常阈值,目标位置的序号可以是初始异常账户的总数量的预设百分比(如,百分之一)。例如,当异常账户识别模型的输出的初始异常账户的总数量为1000个时,目标位置的序号可以是10,这样,预设异常阈值的取值可以是排名从大到小的第10个异常度的值。也就是说,识别设备在多个初始异常账户中筛选交易异常账户时,提取的是模型输出的多个初始异常账户中最异常的百分之一的账户。
在一个实施例中,如图4所示,步骤103“根据预设局部社区发现算法以及交易异常账户,对交易网络拓扑图进行划分,得到多个风险社区”的具体处理过程,包括:
步骤301,通过预设局部社区发现算法,确定与交易异常账户相关联的多个关联节点,并计算多个关联节点的网页排名值。
具体地,识别设备通过预设局部社区发现算法,将交易异常账户作为种子节点。对于每一个种子节点,该种子节点可以在交易网络拓扑图中进行随机游走,得到多个与该种子节点相关联的多个关联节点,并同时计算得到该关联节点相对于种子节点的网页排名值(pagerank值)。即,识别设备基于该种子节点,通过预设局部社区发现算法可以触发生成多个pagerank向量,通过此pagerank向量,可以确定多个与该种子节点相关联的多个关联节点,并同时计算得到该关联节点相对于种子节点的网页排名值(pagerank值)。其中,关联节点对于该种子节点的网页排名值表示该关联节点对于该种子节点的重要程度(关系密切程度)。
步骤302,将网页排名值大于或等于预设切割阈值的目标关联节点、以及与目标关联节点对应的交易异常账户划分为同一风险社区。
具体地,预设切割阈值可以是根据实际应用场景确定的。针对于某一种子节点,识别设备通过预设局部社区发现算法,确定与交易异常账户相关联的多个关联节点,以及计算得到多个关联节点的网页排名值。这样,识别设备可以根据计算得到的多个关联节点对于该交易异常账户的网页排名值,与预设切割阈值作比较。相应的,识别设备可以将网页排名值大于预设切割阈值的关联节点作为目标关联节点,并将该目标关联节点划分为同一风险社区。
在一种可能的实现方式中,如果某一节点对于第一交易异常账户的第一网页排名值大于或等于预设切割阈值,且该节点对于第二交易异常账户的第二网页排名值也大于或等于预设切割阈值,则比较第一网页排名值与第二网页排名值,得到比较结果。根据比较结果将该节点与网页排名值较大的交易异常账户划分为同一风险社区。
例如,对于第一交易异常账户B,通过预设局部社区发现算法,确定与交易异常账户相关联的关联节点C,关联节点C对于第一交易异常账户B的第一网页排名值为0.8;对于第二交易异常账户D,通过预设局部社区发现算法,确定与交易异常账户相关联的也是关联节点C,关联节点C对于第二交易异常账户D的第二网页排名值为0.75,预设切割阈值为0.5。这样,识别设备通过比较第一网页排名值与第二网页排名值,得到比较结果是第一网页排名值大于第二网页排名值,因此,将关联节点C与第一交易异常账户B划分为同一风险社区。
在另一种可能的实现方式中,如果某一节点对于第一交易异常账户的第一网页排名值大于或等于预设切割阈值,且该节点对于第二交易异常账户的第二网页排名值也大于或等于预设切割阈值,则识别设备可以将该节点与第一交易异常账户划分为同一风险社区,同时将该节点与第二交易异常账户也划分为同一风险社区。也就是说,同一关联节点可以同时被划分到多个风险社区中。
在一个实施例中,如图5所示,步骤104“通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户”的具体处理过程,包括:
步骤401,分别将各风险社区的图结构特征信息输入至预设图神经网络算法,得到风险社区中各账户的风险值。
具体地,各风险社区是交易网络拓扑图的一部分,也就是说,风险社区的表示形式也为拓扑图。各风险社区的图结构特征信息包括点特征信息以及边特征信息。在进行转账等金融交易的实际应用场景中,点特征信息可以是账号信息、开户银行类别信息、持卡人性别信息、身份信息等等。边特征信息可以是转账时间信息、转账金额信息、转账次数信息等等。
在一可选实施例中,针对有任一风险社区,识别设备将该风险社区的点特征信息以及边特征信息输入至预设图神经网络算法,该预设图神经网络算法的输出结果可以是风险社区内各交易账户(节点)的风险值(交易账户分数值)。
步骤402,将风险值大于或等于预设风险阈值的账户作为涉及洗钱风险的交易账户。
具体地,识别设备可以实际应用场景确定预设风险阈值(如,0.5),这样,识别设备可以将风险社区内风险值大于或等于预设风险阈值的账户均作为涉及洗钱风险的交易账户,即将风险值大于预设风险阈值的交易账户作为洗钱账户。
在本实施例中,通过预设图神经网络算法以及划分的多个风险社区的图结构特征信息,可以得到各风险社区各交易账户的风险值,继而可以根据风险值,从各个交易账户之间存在的关联关系,进一步筛选存在洗钱嫌疑的账户,提高洗钱账户的筛选效率,提高洗钱账户的识别准确度。
在一个实施例中,如图6所示,异常账户识别模型的训练过程包括:
步骤501,获取样本账户的数据。
具体地,样本账户包括风险样本账户和非风险样本账户,样本账户数据包括风险样本账户的交易特征以及非风险账户的交易特征。样本账户的交易特征可以包括交易账号、交易金额、交易次数、交易时间、交易对手等信息。其中,风险样本账户即为洗钱样本账户,非风险样本账户即为非洗钱样本账户。
步骤502,根据样本账户数据,通过有监督的机器学习算法对待训练的异常账户识别模型进行训练,得到训练完成的异常账户识别模型。
具体地,识别设备可以将样本账户数据输入至待训练的异常账户识别模型,根据有监督的机器学习算法以及预设学习阈值对待训练的异常账户识别模型进行训练,得到训练完成的异常账户识别模型。也就是说,识别设备可以通过有监督的机器学习算法,提取洗钱样本账户与洗钱样本账户的交易特征之间的关联关系,以及提取非洗钱样本账户与非洗钱样本账户的交易特征之间的关联关系,得到训练完成的异常账户识别模型。该模型可以根据交易账户的交易特征信息,实现对交易账户属于洗钱账户或属于非洗钱账户的准确分类。
其中,有监督的机器学习算法可以包括k-近邻算法、决策树算法以及朴素贝叶斯算法中的任一种。
本发明实施例还需要说明的是,上述识别方法中的预设图神经网络算法包括图卷积神经网络算法和GraphSage算法。
应该理解的是,虽然图1-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种风险账户的识别装置,包括:获取模块601、第一识别模块602、划分模块603和第二识别模块604,其中:
获取模块601,用于获取多个交易账户,构建多个交易账户对应的交易网络拓扑图;
第一识别模块602,用于根据交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户;
划分模块603,用于根据预设局部社区发现算法以及交易异常账户,对交易网络拓扑图进行划分,得到多个风险社区;
第二识别模块604,用于通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户。
在其中一个实施例中,所述装置还包括:
过滤模块,用于通过预设过滤方式,对所述交易网络拓扑图进行过滤,得到过滤后的交易网络拓扑图。
在其中一个实施例中,所述预设过滤方式包括转账孤岛过滤方式、出入度过滤方式、中心折损率过滤方式中的一种或多种;
所述过滤模块,包括:
第一识别单元,用于识别所述交易网络拓扑图中的转账孤岛节点,并对所述转账孤岛节点进行过滤,得到过滤后的交易网络拓扑图;
第二识别单元,用于识别所述交易网络拓扑图中入度以及出度均满足第一目标条件的第一节点,并将所述第一节点过滤,得到过滤后的交易网络拓扑图;
第三识别单元,用于识别所述交易网络拓扑图中的中心折损率满足第二目标条件的第二节点,并将所述第二节点过滤,得到过滤后的交易网络拓扑图。
在其中一个实施例中,所述第一识别模块,包括:
异常度确定单元,用于将所述交易网络拓扑图输入至所述预先训练完成的异常账户识别模型,得到多个初始异常账户以及多个初始异常账户对应的异常度;
交易异常账户确定单元,用于将所述异常度满足预设异常条件的初始异常账户作为交易异常账户。
在其中一个实施例中,所述划分模块,包括:
计算单元,用于通过所述预设局部社区发现算法,确定与所述交易异常账户相关联的多个关联节点,并计算多个关联节点的网页排名值;
排名单元,用于将所述网页排名值大于或等于预设切割阈值的目标关联节点、以及与所述目标关联节点对应的交易异常账户划分为同一风险社区。
在其中一个实施例中,所述第二识别模块,包括:
风险值计算单元,用于分别将各所述风险社区的图结构特征信息输入至所述预设图神经网络算法,得到所述风险社区中各账户的风险值;
账户识别单元,用于将所述风险值大于或等于预设风险阈值的账户作为涉及洗钱风险的交易账户。
在其中一个实施例中,所述装置还包括:
训练模块,用于获取样本账户的数据;根据所述样本账户数据,通过有监督的机器学习算法对待训练的异常账户识别模型进行训练,得到训练完成的异常账户识别模型,所述样本账户包括风险样本账户和非风险样本账户,所述样本账户数据包括风险样本账户的交易特征以及非风险账户的交易特征。
关于风险账户的识别装置的具体限定可以参见上文中对于风险账户的识别方法的限定,在此不再赘述。上述风险账户的识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储交易账户数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种风险账户的识别方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (11)

1.一种风险账户的识别方法,其特征在于,所述方法包括:
获取多个交易账户,构建所述多个交易账户对应的交易网络拓扑图;
根据所述交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户;
根据预设局部社区发现算法以及所述交易异常账户,对所述交易网络拓扑图进行划分,得到多个风险社区;
通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户的步骤之前,所述方法还包括:
通过预设过滤方式,对所述交易网络拓扑图进行过滤,得到过滤后的交易网络拓扑图。
3.根据权利要求2所述的方法,其特征在于,所述预设过滤方式包括转账孤岛过滤方式、出入度过滤方式、中心折损率过滤方式中的一种或多种;
所述通过预设过滤方式,对所述交易网络拓扑图进行过滤,得到过滤后的交易网络拓扑图,包括:
识别所述交易网络拓扑图中的转账孤岛节点,并对所述转账孤岛节点进行过滤,得到过滤后的交易网络拓扑图;
识别所述交易网络拓扑图中入度以及出度均满足第一目标条件的第一节点,并将所述第一节点过滤,得到过滤后的交易网络拓扑图;
识别所述交易网络拓扑图中的中心折损率满足第二目标条件的第二节点,并将所述第二节点过滤,得到过滤后的交易网络拓扑图。
4.根据权利要求1所述的方法,其特征在于,所述根据所述交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户,包括:
将所述交易网络拓扑图输入至所述预先训练完成的异常账户识别模型,得到多个初始异常账户以及多个初始异常账户对应的异常度;
将所述异常度满足预设异常条件的初始异常账户作为交易异常账户。
5.根据权利要求1所述的方法,其特征在于,所述根据预设局部社区发现算法以及所述交易异常账户,对所述交易网络拓扑图进行划分,得到多个风险社区,包括:
通过所述预设局部社区发现算法,确定与所述交易异常账户相关联的多个关联节点,并计算多个关联节点的网页排名值;
将所述网页排名值大于或等于预设切割阈值的目标关联节点、以及与所述目标关联节点对应的交易异常账户划分为同一风险社区。
6.根据权利要求1所述的方法,其特征在于,所述通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户,包括:
分别将各所述风险社区的图结构特征信息输入至所述预设图神经网络算法,得到所述风险社区中各账户的风险值;
将所述风险值大于或等于预设风险阈值的账户作为涉及洗钱风险的交易账户。
7.根据权利要求1所述的方法,其特征在于,所述异常账户识别模型的训练过程包括:
获取样本账户的数据;
根据所述样本账户数据,通过有监督的机器学习算法对待训练的异常账户识别模型进行训练,得到训练完成的异常账户识别模型,所述样本账户包括风险样本账户和非风险样本账户,所述样本账户数据包括风险样本账户的交易特征以及非风险账户的交易特征。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述预设图神经网络算法包括图卷积神经网络算法和GraphSage算法。
9.一种风险账户的识别装置,其特征在于,所述装置包括:
获取模块,用于获取多个交易账户,构建所述多个交易账户对应的交易网络拓扑图;
第一识别模块,用于根据所述交易网络拓扑图和预先训练完成的异常账户识别模型,确定多个交易异常账户;
划分模块,用于根据预设局部社区发现算法以及所述交易异常账户,对所述交易网络拓扑图进行划分,得到多个风险社区;
第二识别模块,用于通过预设图神经网络算法对各风险社区中的账户进行识别,得到多个风险账户。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
CN202110901445.7A 2021-08-06 2021-08-06 风险账户的识别方法、装置、计算机设备和存储介质 Pending CN113689218A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110901445.7A CN113689218A (zh) 2021-08-06 2021-08-06 风险账户的识别方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110901445.7A CN113689218A (zh) 2021-08-06 2021-08-06 风险账户的识别方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN113689218A true CN113689218A (zh) 2021-11-23

Family

ID=78579067

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110901445.7A Pending CN113689218A (zh) 2021-08-06 2021-08-06 风险账户的识别方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN113689218A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114723554A (zh) * 2022-06-09 2022-07-08 中国工商银行股份有限公司 异常账户识别方法及装置
CN115442092A (zh) * 2022-08-22 2022-12-06 上海浦东发展银行股份有限公司 一种目标账户识别的方法、装置、计算机设备
CN115964549A (zh) * 2023-03-03 2023-04-14 北京芯盾时代科技有限公司 一种社群挖掘方法、装置、设备及存储介质
WO2023109085A1 (zh) * 2021-12-15 2023-06-22 深圳前海微众银行股份有限公司 账户风险模型的训练方法和风险用户群体的确定方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104867055A (zh) * 2015-06-16 2015-08-26 咸宁市公安局 一种金融网络可疑资金追踪与识别方法
CN110400220A (zh) * 2019-07-23 2019-11-01 上海氪信信息技术有限公司 一种基于半监督图神经网络的智能可疑交易监测方法
CN111476662A (zh) * 2020-04-13 2020-07-31 中国工商银行股份有限公司 反洗钱识别方法及装置
CN111489166A (zh) * 2020-04-17 2020-08-04 支付宝(杭州)信息技术有限公司 风险防控方法、装置、处理设备及***
CN111784502A (zh) * 2020-06-30 2020-10-16 中国工商银行股份有限公司 异常交易账户群体识别方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104867055A (zh) * 2015-06-16 2015-08-26 咸宁市公安局 一种金融网络可疑资金追踪与识别方法
CN110400220A (zh) * 2019-07-23 2019-11-01 上海氪信信息技术有限公司 一种基于半监督图神经网络的智能可疑交易监测方法
CN111476662A (zh) * 2020-04-13 2020-07-31 中国工商银行股份有限公司 反洗钱识别方法及装置
CN111489166A (zh) * 2020-04-17 2020-08-04 支付宝(杭州)信息技术有限公司 风险防控方法、装置、处理设备及***
CN111784502A (zh) * 2020-06-30 2020-10-16 中国工商银行股份有限公司 异常交易账户群体识别方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023109085A1 (zh) * 2021-12-15 2023-06-22 深圳前海微众银行股份有限公司 账户风险模型的训练方法和风险用户群体的确定方法
CN114723554A (zh) * 2022-06-09 2022-07-08 中国工商银行股份有限公司 异常账户识别方法及装置
CN115442092A (zh) * 2022-08-22 2022-12-06 上海浦东发展银行股份有限公司 一种目标账户识别的方法、装置、计算机设备
CN115964549A (zh) * 2023-03-03 2023-04-14 北京芯盾时代科技有限公司 一种社群挖掘方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Khatri et al. Supervised machine learning algorithms for credit card fraud detection: a comparison
US11875355B2 (en) Fast access vectors in real-time behavioral profiling in fraudulent financial transactions
Nami et al. Cost-sensitive payment card fraud detection based on dynamic random forest and k-nearest neighbors
Patil et al. Predictive modelling for credit card fraud detection using data analytics
Coşer et al. PREDICTIVE MODELS FOR LOAN DEFAULT RISK ASSESSMENT.
Halvaiee et al. A novel model for credit card fraud detection using Artificial Immune Systems
CN113689218A (zh) 风险账户的识别方法、装置、计算机设备和存储介质
US9563921B2 (en) System and method for detecting merchant points of compromise using network analysis and modeling
US11080709B2 (en) Method of reducing financial losses in multiple payment channels upon a recognition of fraud first appearing in any one payment channel
US20150046332A1 (en) Behavior tracking smart agents for artificial intelligence fraud protection and management
US20150046224A1 (en) Reducing false positives with transaction behavior forecasting
Shukur et al. Credit card fraud detection using machine learning methodology
Vanini et al. Online payment fraud: from anomaly detection to risk management
CN114187112A (zh) 账户风险模型的训练方法和风险用户群体的确定方法
Labanca et al. Amaretto: An active learning framework for money laundering detection
Razooqi et al. Credit card fraud detection using fuzzy logic and neural network
CN112990989B (zh) 价值预测模型输入数据生成方法、装置、设备和介质
US11880890B2 (en) Detecting money laundering activities using drift in a trained Siamese neural network
CN112329862A (zh) 基于决策树的反洗钱方法及***
Carvalho et al. Using political party affiliation data to measure civil servants' risk of corruption
Khosravi et al. Using Supervised Machine Learning Approaches To Detect Fraud In The Banking Transaction Network
Chen et al. Fuzzy computing applications for anti-money laundering and distributed storage system load monitoring
Kriksciuniene et al. Research of customer behavior anomalies in big financial data
Jena et al. A comparative analysis of financial fraud detection in credit card by decision tree and random forest techniques
Lee et al. Application of machine learning in credit risk scorecard

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination