CN111476662A

CN111476662A - 反洗钱识别方法及装置

Info

Publication number: CN111476662A
Application number: CN202010283831.XA
Authority: CN
Inventors: 朱超
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2020-04-13
Filing date: 2020-04-13
Publication date: 2020-07-31

Abstract

本申请实施例提供一种反洗钱识别方法及装置，方法包括：获取目标资金交易网络图；对该目标资金交易网络图进行风险社区划分；对各个所述风险社区进行风险评级，并基于对应的风险评级结果确定至少一个目标社区；应用预设的图卷积模型确定所述目标社区中的各个所述节点的风险评分，并应用各个所述节点的风险评分对所述目标社区进行节点筛选，得到所述目标资金交易网络图对应的存在洗钱风险的社区。本申请能够有效提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，并能够有效提高反洗钱识别过程的效率及智能化程度。

Description

反洗钱识别方法及装置

技术领域

本申请涉及数据处理技术领域，具体涉及反洗钱识别方法及装置。

背景技术

洗钱活动往往借助于合法的金融网络清洗大笔黑钱，这不仅侵害了金融管理秩序而且也严重破坏了公平竞争规则，破坏了市场经济主体之间的自由竞争，从而对正常、稳定的经济秩序带来一定的负面影响。反洗钱可疑交易监测分析需要从海量数据中甄选出有效数据，通过定性和定量的分析，深入挖掘客户的多层次、多元化信息，确定客户洗钱可疑交易行为。因此，如何利用好自身和外部数据信息，提高反洗钱工作的有效性和精准度，已成为金融机构新的挑战和机遇。

当前，绝大多数的反洗钱方式仍然是基于预设的反洗钱规则进行监测的。这些反洗钱规则虽然能够帮助发现一些异常的洗钱行为，但由于传统的反洗钱预警量大，因此使得应用反洗钱规则进行监测的方式存在报告率低、监管监测以及预警甄别处理耗时耗力的问题；同时，由于多数反洗钱规则是根据历史数据总结出来的，因此使其存在过于依赖人工经验而无法保证反洗钱的监测或识别效果。

发明内容

针对现有技术中的问题，本申请提供一种反洗钱识别方法及装置，能够有效提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，并能够有效提高反洗钱识别过程的效率及智能化程度。

为解决上述技术问题，本申请提供以下技术方案：

第一方面，本申请提供一种反洗钱识别方法，包括：

获取目标资金交易网络图，其中，该目标资金交易网络图中的各个节点分别用于表示各个账户对应的实体数据，且两个所述节点之间的边用于表示该两个节点之间的关系数据；

对该目标资金交易网络图进行风险社区划分；

对各个所述风险社区进行风险评级，并基于对应的风险评级结果确定至少一个目标社区；

应用预设的图卷积模型确定所述目标社区中的各个所述节点的风险评分，并应用各个所述节点的风险评分对所述目标社区进行节点筛选，得到所述目标资金交易网络图对应的存在洗钱风险的社区。

进一步地，在所述对该目标资金交易网络图进行风险社区划分之前，还包括：

应用预设的图特征过滤方式自所述目标资金交易网络图的各个所述节点中筛选得到存在洗钱风险的可疑账户节点，其中，所述图特征过滤方式包括出入度过滤方式和/或中心点折射率过滤方式。

进一步地，所述对该目标资金交易网络图进行风险社区划分，包括：

根据预设的权重及异常阈值，获取所述目标资金交易网络图对应的存在异常交易结构的子图；

应用预设的子图计算方式对各个存在异常交易结构的子图进行风险社区划分，得到所述目标资金交易网络图对应的风险社区；

其中，所述子图计算方式包括个性化PageRank算法和/或Louvain社区发现算法。

进一步地，所述对各个所述风险社区进行风险评级，并基于对应的风险评级结果确定至少一个目标社区，包括：

以所述风险社区中的起始节点对应的起始交易为起点，获取所述风险社区中的每一笔交易的交易时间点；

根据每一笔交易的交易时间点获取对应的风险社区的平均交易时间；

确定各个交易的交易时间点与所述平均交易时间之差的绝对值；

基于各个交易的交易时间点与所述平均交易时间之差的绝对值，将各个交易划分至对应的区间段中；

根据所述区间段中的交易数量占对应的风险社区内总交易量的比例，并基于该比例确定对应的风险社区的交易时间熵；

应用各个所述风险社区的交易时间熵分别确定各个所述风险社区的风险等级，并根据各个所述风险社区的风险等级确定至少一个目标社区。

进一步地，所述应用预设的图卷积模型确定所述目标社区中的各个所述节点的风险评分，包括：

获取所述目标社区中的节点对应的账户标签；

将所述目标社区输入所述图卷积模型，根据所述目标社区的所述节点之间的交易关系以及所述节点的属性，将所述账户标签在所述图卷积模型上进行传播，获得各个所述节点的风险评分，其中，所述图卷积模型为图神经网络。

进一步地，所述获取目标资金交易网络图，包括：

根据预设的数据标签自账户交易源数据中选取对应的实体数据及关系数据，其中，所述实体数据包括账户的唯一标识，所述关系数据包括账户之间的转账关系数据；

对所述实体数据及关系数据进行预处理；

应用预设的Schema模型、经预处理后的所述实体数据及关系数据生成对应的目标资金交易网络图。

对所述目标资金交易网络图中的同一对节点之间的边进行边属性融合处理。

进一步地，在所述得到所述目标资金交易网络图对应的存在洗钱风险的社区之后，还包括：

对所述存在洗钱风险的社区进行可视化显示。

第二方面，本申请提供一种反洗钱识别装置，包括：

交易网络构建模块，用于获取目标资金交易网络图，其中，该目标资金交易网络图中的各个节点分别用于表示各个账户对应的实体数据，且两个所述节点之间的边用于表示该两个节点之间的关系数据；

风险社区划分模块，用于对该目标资金交易网络图进行风险社区划分；

目标社区确定模块，用于对各个所述风险社区进行风险评级，并基于对应的风险评级结果确定至少一个目标社区；

洗钱风险社区确定模块，用于应用预设的图卷积模型确定所述目标社区中的各个所述节点的风险评分，并应用各个所述节点的风险评分对所述目标社区进行节点筛选，得到所述目标资金交易网络图对应的存在洗钱风险的社区。

进一步地，还包括：

图特征过滤模块，用于应用预设的图特征过滤方式自所述目标资金交易网络图的各个所述节点中筛选得到存在洗钱风险的可疑账户节点，其中，所述图特征过滤方式包括出入度过滤方式和/或中心点折射率过滤方式。

进一步地，所述风险社区划分模块用于执行下述内容：

进一步地，所述目标社区确定模块用于执行下述内容：

进一步地，所述洗钱风险社区确定模块用于执行下述内容：

获取所述目标社区中的节点对应的账户标签；

进一步地，所述交易网络构建模块用于执行下述内容：

对所述实体数据及关系数据进行预处理；

进一步地，还包括：

属性融合模块，用于对所述目标资金交易网络图中的同一对节点之间的边进行边属性融合处理。

进一步地，还包括：

可视化显示模块，用于对所述存在洗钱风险的社区进行可视化显示。

第三方面，本申请提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现所述的反洗钱识别方法的步骤。

第四方面，本申请提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现所述的反洗钱识别方法的步骤。

由上述技术方案可知，本申请提供的一种反洗钱识别方法及装置，方法包括：获取目标资金交易网络图，其中，该目标资金交易网络图中的各个节点分别用于表示各个账户对应的实体数据，且两个所述节点之间的边用于表示该两个节点之间的关系数据；对该目标资金交易网络图进行风险社区划分；对各个所述风险社区进行风险评级，并基于对应的风险评级结果确定至少一个目标社区；应用预设的图卷积模型确定所述目标社区中的各个所述节点的风险评分，并应用各个所述节点的风险评分对所述目标社区进行节点筛选，得到所述目标资金交易网络图对应的存在洗钱风险的社区，可迅速方便的发现可疑的目标洗钱社区或洗钱节点，同时对这些可疑的目标社区进行进一步的洗钱风险量化评分，能够精准定位高风险的洗钱团伙，进而能够有效提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，并能够有效提高反洗钱识别过程的效率及智能化程度，进而能够有效提高金融机识别客户洗钱可疑交易行为的准确性及效率，有效提高反洗钱识别的报告率，降低监管监测以及预警甄别处理的时间及金钱成本。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例中的反洗钱识别方法的流程示意图。

图2是本申请实施例中的包含有步骤010的反洗钱识别方法的流程示意图。

图3是本申请实施例中的反洗钱识别方法中步骤200的具体流程示意图。

图4是本申请实施例中的反洗钱识别方法中步骤300的具体流程示意图。

图5是本申请实施例中的反洗钱识别方法中步骤400的具体流程示意图。

图6是本申请实施例中的反洗钱识别方法中步骤100的具体流程示意图。

图7是本申请实施例中的包含有步骤020的反洗钱识别方法的流程示意图。

图8是本申请实施例中的包含有步骤500的反洗钱识别方法的流程示意图。

图9是本应用实例提供的反洗钱识别方法的技术方案流程图。

图10是本应用实例提供的连通子图算法和社区划分算法形成目标社区的过程示意图。

图11是本应用实例提供的GCN图神经网络模型训练流程图。

图12是本申请实施例中的反洗钱识别装置的第一种结构示意图。

图13是本申请实施例中的反洗钱识别装置的第二种结构示意图。

图14是本申请实施例中的反洗钱识别装置的第三种结构示意图。

图15是本申请实施例中的反洗钱识别装置的第四种结构示意图。

图16是本申请实施例中的电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整的描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

针对现有的反洗钱预警量大，因此使得应用反洗钱规则进行监测的方式存在报告率低、监管监测以及预警甄别处理耗时耗力的问题；同时，由于多数反洗钱规则是根据历史数据总结出来的，因此使其存在过于依赖人工经验而无法保证反洗钱的监测或识别效果的问题，本申请提出一种反洗钱识别方法、反洗钱识别装置、电子设备及计算机可读存储介质，通过获取目标资金交易网络图，其中，该目标资金交易网络图中的各个节点分别用于表示各个账户对应的实体数据，且两个所述节点之间的边用于表示该两个节点之间的关系数据；对该目标资金交易网络图进行风险社区划分；对各个所述风险社区进行风险评级，并基于对应的风险评级结果确定至少一个目标社区；应用预设的图卷积模型确定所述目标社区中的各个所述节点的风险评分，并应用各个所述节点的风险评分对所述目标社区进行节点筛选，得到所述目标资金交易网络图对应的存在洗钱风险的社区，使得本申请相比传统的反洗钱交易中的大额交易报告、可疑交易报告、客户信息真实性求证等方法，人工工作量很大，过度依赖于经验，而知识图谱是从关系的角度去分析问题的，通过构建交易网络图，利用一些图算法进行分析，能大量节省人力成本以及业务的处理效率，同时能更科学更***的发现可疑目标。可迅速方便的发现可疑的目标洗钱社区或洗钱节点，同时对这些可疑的目标社区进行进一步的洗钱风险量化评分，能够精准定位高风险的洗钱团伙，进而能够有效提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，并能够有效提高反洗钱识别过程的效率及智能化程度，进而能够有效提高金融机识别客户洗钱可疑交易行为的准确性及效率，有效提高反洗钱识别的报告率，降低监管监测以及预警甄别处理的时间及金钱成本。

其中，知识图谱作为一种语义网络拥有极强的表达能力和建模灵活性，可以对现实世界中的实体、概念、属性以及它们之间的关系进行建模。相对于反洗钱工作的传统规则过于依赖人工经验，基于知识图谱的AI技术则可以分析每一条交易设计的多环节关联性，查找个体和行为之间的关系，形成模型学习闭环，对反洗钱行为进行全方位监控，发现洗钱团伙。

具体通过下述多个实施例分别进行说明。

为了有效提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，并能够有效提高反洗钱识别过程的效率及智能化程度，本申请提供一种反洗钱识别方法的实施例，参见图1，所述反洗钱识别方法具体包含有如下内容：

步骤100：获取目标资金交易网络图，其中，该目标资金交易网络图中的各个节点分别用于表示各个账户对应的实体数据，且两个所述节点之间的边用于表示该两个节点之间的关系数据。

可以理解的是，实体数据就是目标资金交易网络图中的‘点’数据，关系数据就是目标资金交易网络图中的‘边’数据。一条‘边’有起始点和终点以及相关属性构成。其中，关系数据可以是账号A给账号B转账，形成转账关系，转账金额、时间等可以作为关系数据的属性。实际上的实体数据和关系数据可以由具体的业务性质来定制。

步骤200：对该目标资金交易网络图进行风险社区划分。

在步骤200中，所述目标资金交易网络图的结构可以为环状结构也可以为其他形式的图模式结构。

步骤300：对各个所述风险社区进行风险评级，并基于对应的风险评级结果确定至少一个目标社区。

可以理解的是，由于不是每个社区都具有较大的洗钱风险，需要重点关注洗钱风险较大的社区。因此在步骤300中可以利用时间熵风险度量对交易时间风险度的进行量化度量。

步骤400：应用预设的图卷积模型确定所述目标社区中的各个所述节点的风险评分，并应用各个所述节点的风险评分对所述目标社区进行节点筛选，得到所述目标资金交易网络图对应的存在洗钱风险的社区。

在步骤400中，可以利用图神经网络进行建模。局部社区挖掘从资金交易关系来挖掘风险社区，潜在的一个问题是挖掘出的社区可能会含有部分与洗钱账户有间接资金交易关系，但实际风险比较低的账户。图卷积模型在社区挖掘的基础上，以社区划分后的目标社区作为输入，利用已知或预测的账户标签，根据节点间的交易关系以及节点的属性，对账户标签在资金交易网络上进行传播，获得账户的风险评分。

为了有效提高反洗钱识别过程的应用广泛性以及适用全面性，在本申请提供的反洗钱识别方法的一个实施例中，参见图2，在所述反洗钱识别方法的步骤100之后以及步骤200之前，还具体包含有如下内容：

步骤010：应用预设的图特征过滤方式自所述目标资金交易网络图的各个所述节点中筛选得到存在洗钱风险的可疑账户节点，其中，所述图特征过滤方式包括出入度过滤方式和/或中心点折射率过滤方式。

为了提高对该目标资金交易网络图进行风险社区划分的准确性，以进一步提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，在本申请提供的反洗钱识别方法的一个实施例中，参见图3，在所述反洗钱识别方法的步骤200具体包含有如下内容：

步骤210：根据预设的权重及异常阈值，获取所述目标资金交易网络图对应的存在异常交易结构的子图。

步骤220：应用预设的子图计算方式对各个存在异常交易结构的子图进行风险社区划分，得到所述目标资金交易网络图对应的风险社区。

为了重点关注洗钱风险较大的社区，以进一步提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，在本申请提供的反洗钱识别方法的一个实施例中，参见图4，在所述反洗钱识别方法的步骤300具体包含有如下内容：

步骤310：以所述风险社区中的起始节点对应的起始交易为起点，获取所述风险社区中的每一笔交易的交易时间点。

步骤320：根据每一笔交易的交易时间点获取对应的风险社区的平均交易时间。

步骤330：确定各个交易的交易时间点与所述平均交易时间之差的绝对值。

步骤340：基于各个交易的交易时间点与所述平均交易时间之差的绝对值，将各个交易划分至对应的区间段中。

步骤350：根据所述区间段中的交易数量占对应的风险社区内总交易量的比例，并基于该比例确定对应的风险社区的交易时间熵。

步骤360：应用各个所述风险社区的交易时间熵分别确定各个所述风险社区的风险等级，并根据各个所述风险社区的风险等级确定至少一个目标社区。

为了有效筛除部分与洗钱账户有间接资金交易关系，但实际风险比较低的账户，以进一步提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，在本申请提供的反洗钱识别方法的一个实施例中，参见图5，所述反洗钱识别方法的步骤400具体包含有如下内容：

步骤410：获取所述目标社区中的节点对应的账户标签。

步骤420：将所述目标社区输入所述图卷积模型，根据所述目标社区的所述节点之间的交易关系以及所述节点的属性，将所述账户标签在所述图卷积模型上进行传播，获得各个所述节点的风险评分，其中，所述图卷积模型为图神经网络。

为了有效提高资金交易网络图的获取准确性及应用可靠性，以进一步提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，在本申请提供的反洗钱识别方法的一个实施例中，参见图6，所述反洗钱识别方法的步骤100具体包含有如下内容：

步骤110：根据预设的数据标签自账户交易源数据中选取对应的实体数据及关系数据，其中，所述实体数据包括账户的唯一标识，所述关系数据包括账户之间的转账关系数据。

步骤120：对所述实体数据及关系数据进行预处理。

步骤130：应用预设的Schema模型、经预处理后的所述实体数据及关系数据生成对应的目标资金交易网络图。

为了进一步提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，在本申请提供的反洗钱识别方法的一个实施例中，参见图7，在所述反洗钱识别方法的步骤100之后及步骤010之前还具体包含有如下内容：

步骤020：对所述目标资金交易网络图中的同一对节点之间的边进行边属性融合处理。

为了有效提高反洗钱识别结果的应用可靠性，提高金融机构的用户体验，在本申请提供的反洗钱识别方法的一个实施例中，参见图8，在所述反洗钱识别方法的步骤400之后还具体包含有如下内容：

步骤500：对所述存在洗钱风险的社区进行可视化显示。

为进一步说明本方案，本申请还提供一种反洗钱识别方法的具体应用实例，本应用实例提供了一种反洗钱识别方法及装置。本应用实例是基于Hadoop/Spark等大数据平台，利用Janus Graph图数据库，构建反洗钱领域可疑主体的资金交易网络，结合适用于反洗钱场景的图分析算法(包括出入度、中心性算法、子图、社区发现、图表示、图深度学习等算法)和图分析工具，可精准追踪账户间的交易路径，从源头的账号/***/商户等关联到最后收款方，识别洗钱/套现路径和可疑人员，并通过可疑人员的交易轨迹，层层关联，分析得到更多可疑人员、账户、商户或***等实体。参见图9，所述反洗钱识别方法具体包含有如下内容：

本应用实例是从反洗钱复杂网络的异常交易结构入手，利用丰富的内、外部数据，依托现有的大数据、图数据库等技术对数据处理，建立起资金交易网络并进行多角度的关联分析，对洗钱过程中的异常交易结构进行主动发现，然后通过对异常交易进行风险量化，从而发现高可疑度的洗钱团伙。具体技术方案分为如下几个步骤：

步骤1：确定数据标签。本应用实例主要是对反洗钱网络进行分析，则先需确定待分析的数据标签，这里将选择账号、***、商户、交易设备IP、交易设备MAC地址、交易金额、交易次数、交易时间等数据。

其中，数据标签是后续需要构建交易网络图所需要的数据(点边数据)。

步骤2：数据源选择。内部数据来源于数据仓库，外部数据依托于第三方数据。第三方数据主要来自于人行征信数据、外购的第三方数据公司数据。

步骤3：数据ETL处理。将数据进行预处理和数据标准化，形成满足知识图谱构建基础的实体数据和关系数据。对于非结构化或半结构化的数据，将利用NLP、OCR等技术将数据转换成结构化的数据。对于结构化的数据，则对数据进行去重、补缺、结构调整等操作，最终形成实体数据和关系数据。

其中，实体数据就是关系网络图中的‘点’数据，关系数据就是关系网络图中的‘边’数据。一条‘边’有起始点和终点以及相关属性构成。

上述标签中，例如实体数据可以为账号、***、商户、交易设备IP、交易设备MAC地址。关系数据可以是账号A给账号B转账，形成转账关系，转账金额、时间等可以作为关系数据的属性。实际上的实体数据和关系数据可以由具体的业务性质来定制。

步骤4：建立资金交易网络。首先构建图的Schema模型，并且对实体数据和关系数据的进行图Schema映射，然后利用Janus Graph图数据库和HBase存储，将账号/***/商户等交易实体和资金的转账交易关系等数据，建立资金交易网络图。

其中，Schema模型指的是关系网络图的模式定义，即涉及实体、关系、属性等要素，是构造一个图的基础。

步骤5：属性融合。主要是对同一对账号之间的交易边进行了融合，例如交易金额和频次采用累加和作为融合后属性，交易时间采用平均值度量。

其中，交易边主要是转账关系。是进行属性融合，包括交易金额，交易次数、交易时间等。

步骤6：图特征过滤。主要包括出入度过滤和中心点折损率(转出金额/转入金额)过滤。对于集中转入/分散转出的中心交易节点，一定是入度较小，出度较大，设置入度<θ1&&出度>θ2，进行过滤；对于分散转出/集中转入的中心交易节点，一定是入度较大，出度较小，可设置入度>θ3&&出度<θ4，进行过滤。同时，一般洗钱交易中，中间账户中的转入金额和转出金额近似相等，即可通过中心点折损率(转出金额/转入金额)近似等于1来筛选出可疑的节点，寻找出与这些可疑节点的相关交易，便有可能发现相关的异常洗钱模式。而对于环状交易结构，使用了基于Tarjan和Kosaraju算法来寻找环状强连通子图，再结合相应的阈值过滤即可得到相应的异常结构。

其中，资金交易网络图是描述洗钱交易过程中资金转移的过程。

步骤5是对边的属性做融合，减少边的数量；步骤6在步骤5的基础上，通过出度和入度的阈值和中心点折损率来筛选可疑账户。步骤7是在比较大的交易网络图中更进一步的找出风险社区。

步骤7：构建子图和目标社区。根据交易金额和交易次数标准化后设置权重。加以设置适当的阈值参数进行调节，利用子图算法，筛选出一批异常的交易结构。但有时子图会包含某些看似正常交易的洗钱交易网络，需要对子图做进一步的分析，每个较大的子图会被细分为若干较小的但有较好的反洗钱区分度的目标社区，若某子图含有洗钱风险极大的社区或者多个高风险社区，则认为该子图具体较大的洗钱风险。本应用实例通过两种算法对得到的子图进行分析，具体流程见图10。

算法1:Personalized-PageRank个性化PageRank算法。对部分有异常交易结构的子图，以某个异常点(黑种子)为出发点，通过随机游走的方式，得到近似的Personalized-PageRank值(PPR)，而PPR值的高低反映了网络中节点与黑种子的紧密程度。基于PPR值，再对子图进行剪裁获得异常点对应的社区，再把重合度高的社区进行合并，最终生成几乎不重合的多个局部社区。

算法2：Louvain社区发现算法。Louvain算法是一种基于多层次(逐轮启发迭代)优化Modularity(模块度)的算法，是依据边权重对社区的影响进行模块度迭代度量得到的数值，具体公式如下：

在Louvain算法中不需要求每个社区具体的模块度，只需要比较社区中加入某个节点之后的模块度变化，所以需要求解ΔQ。将节点i分配到某一社区中，社区的模块度变化为：

A_ij：节点i和节点j之间边的权重；

k_i：所有与节点i相连的边的权重之和；

C_i：节点i所属的社区；

m：图中所有边的权重之和。

本应用实例是基于Spark Graph X的Louvain算法实现对子图进行社区划分。根据反洗钱的实际情况，结合节点入度与出度的大小关系和出入边平均交易时间顺序以及每条边的交易金额，以此来优化Louvain算法边的权重。

步骤8：风险量化度量和评级。

根据步骤7社区划分得到的目标社区，不是每个社区都是具有较大的洗钱风险，需要重点关注洗钱风险较大的社区。本应用实例中是利用时间熵风险度量对交易时间风险度的进行量化度量。以每个社区中最起始的一笔交易作为起点计算每一笔交易的时间点，首先计算出某个社区的平均时间，然后计算该社区内每笔交易时间与平均时间的差的绝对值。根据差的绝对值的不同将每笔交易划分到相应的区间段中，并最终统计每个区间段的交易笔数占该社区内总交易的比率Pi。这时就可以得到每个社区的交易时间熵的计算公式，其中，下述计算公式中的“*”代表乘法运算：

一个正常的洗钱社区，前后的交易时间差一般是非常小的，也就是说，该批交易很可能是经过洗钱团伙专门谋划的，在确定的时间内完成相关交易。如果一个社区内的交易时间熵越小，则表示该批交易的时间越集中，洗钱风险也越大。

当每个社区的洗钱风险被量化为分数之后，可以绘制相应的百分位图，然后根据不同的百分位范围给社区划分风险等级。一般来说，可以将占比在95～100％，90～95％以及80～90％之间的社区分别标记为风险等级1、2和3，之后所有社区的风险等级为4。包含多个高风险社区的连通子图则具有很大的洗钱嫌疑，可移交审查部门进行进一步人工调查。

步骤9：利用图神经网络进行建模。在前面反洗钱模型中，局部社区挖掘从资金交易关系来挖掘风险社区，潜在的一个问题是挖掘出的社区可能会含有部分与洗钱账户有间接资金交易关系，但实际风险比较低的账户。图卷积模型在社区挖掘的基础上，以社区划分后的目标社区作为输入，利用已知或预测的账户标签，根据节点间的交易关系以及节点的属性，对账户标签在资金交易网络上进行传播，获得账户的风险评分。

图卷积网络GCN是图神经网络的一种形式，典型应用场景是在图结构数据上解决分类问题。GNN模型通过一个函数将图中的每个顶点映射到一个m-维欧式空间中，然后利用CNN神经网络模型进行标签分类。本应用实例以社区划分后的目标社区作为输出，首先给予每个点包含标签(1，0或者-1)及特征作为输出，根据关联关系的重要程度和计算的复杂度，选择节点的两度关系进场处理，即通过中间两个隐藏层(hidden layer)和Relu激活函数后，并利用交叉熵损失函数可以反向更新模型的参数，迭代模型直到模型趋于稳定，最终在输出层得到节点所属的标签。在第一个隐藏层(Hidden Layer 1)，每个节点会聚合自身和其一度节点的特征，相关数据并进行归一化处理。在二级隐藏层(Hidden Layer 2)，所进行的操作和第一步类似，再次聚合自身和其邻居的信息，相当于节点进行了二度邻居的特征学习。GCN图神经网络模型的具体训练流程可参见图11。

步骤10：可视化展示。通过d3.js等技术对风险社区进行可视化展示，有助于业务专家根据账户间的交易关系，根据专家经验直观地判断风险情况。可视化内容包括：1.节点以及节点信息：节点信息包含账号/***/商户、节点标签、交易时间差等信息；2.有向边和有向边信息：边信息包含交易总金额和总交易次数。

从上述描述可知，本申请应用实例提供的反洗钱识别方法，主要通过构建交易网络图，并对图进行连通子图、社区划分、图神经网络等算法分析处理，可迅速方便的发现可疑的目标洗钱社区或洗钱节点，同时对这些可疑的目标社区进行进一步的洗钱风险量化评分，能够精准定位高风险的洗钱团伙。相比传统的反洗钱交易中的大额交易报告、可疑交易报告、客户信息真实性求证等方法，人工工作量很大，过度依赖于经验，而知识图谱是从关系的角度去分析问题的，通过构建交易网络图，利用一些图算法进行分析，能大量节省人力成本以及业务的处理效率，同时能更科学更***的发现可疑目标。

从软件层面来说，为了有效提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，并能够有效提高反洗钱识别过程的效率及智能化程度，本申请还提供一种用于实现所述反洗钱识别方法中全部或分部内容的反洗钱识别装置的实施例，参见图12，所述反洗钱识别装置具体包含有如下内容：

交易网络构建模块10，用于获取目标资金交易网络图，其中，该目标资金交易网络图中的各个节点分别用于表示各个账户对应的实体数据，且两个所述节点之间的边用于表示该两个节点之间的关系数据。

风险社区划分模块20，用于对该目标资金交易网络图进行风险社区划分。

目标社区确定模块30，用于对各个所述风险社区进行风险评级，并基于对应的风险评级结果确定至少一个目标社区。

洗钱风险社区确定模块40，用于应用预设的图卷积模型确定所述目标社区中的各个所述节点的风险评分，并应用各个所述节点的风险评分对所述目标社区进行节点筛选，得到所述目标资金交易网络图对应的存在洗钱风险的社区。

为了有效提高反洗钱识别过程的应用广泛性以及适用全面性，在本申请提供的反洗钱识别装置的一个实施例中，参见图13，所述反洗钱识别装置中具体包含有如下内容：

图特征过滤模块01，用于应用预设的图特征过滤方式自所述目标资金交易网络图的各个所述节点中筛选得到存在洗钱风险的可疑账户节点，其中，所述图特征过滤方式包括出入度过滤方式和/或中心点折射率过滤方式。

为了提高对该目标资金交易网络图进行风险社区划分的准确性，以进一步提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，在本申请提供的反洗钱识别装置的一个实施例中，在所述反洗钱识别装置的风险社区划分模块20具体用于执行下述内容：

为了重点关注洗钱风险较大的社区，以进一步提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，在本申请提供的反洗钱识别装置的一个实施例中，在所述反洗钱识别装置的目标社区确定模块30具体用于执行下述内容：

为了有效筛除部分与洗钱账户有间接资金交易关系，但实际风险比较低的账户，以进一步提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，在本申请提供的反洗钱识别装置的一个实施例中，所述反洗钱识别装置的洗钱风险社区确定模块40具体用于执行下述内容：

获取所述目标社区中的节点对应的账户标签；

为了有效提高资金交易网络图的获取准确性及应用可靠性，以进一步提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，在本申请提供的反洗钱识别装置的一个实施例中，所述反洗钱识别装置的交易网络构建模块10具体用于执行下述内容：

对所述实体数据及关系数据进行预处理；

为了进一步提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，在本申请提供的反洗钱识别装置的一个实施例中，参见图14，在所述反洗钱识别装置中还具体包含有如下内容：

属性融合模块02，用于对所述目标资金交易网络图中的同一对节点之间的边进行边属性融合处理。

为了有效提高反洗钱识别结果的应用可靠性，提高金融机构的用户体验，在本申请提供的反洗钱识别装置的一个实施例中，参见图15，所述反洗钱识别装置还具体包含有如下内容：

可视化显示模块50，用于对所述存在洗钱风险的社区进行可视化显示。

从硬件层面来说，为了有效提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，并能够有效提高反洗钱识别过程的效率及智能化程度，本申请提供一种用于实现所述反洗钱识别方法中的全部或部分内容的电子设备的实施例，所述电子设备具体包含有如下内容：

处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线；其中，所述处理器、存储器、通信接口通过所述总线完成相互间的通信；所述通信接口用于实现电子设备与用户终端以及相关数据库等相关设备之间的信息传输；该电子设备可以是台式计算机、平板电脑及移动终端等，本实施例不限于此。在本实施例中，该电子设备可以参照实施例中的反洗钱识别方法的实施例，以及，反洗钱识别装置的实施例进行实施，其内容被合并于此，重复之处不再赘述。

图16为本申请实施例的电子设备9600的***构成的示意框图。如图16所示，该电子设备9600可以包括中央处理器9100和存储器9140；存储器9140耦合到中央处理器9100。值得注意的是，该图16是示例性的；还可以使用其他类型的结构，来补充或代替该结构，以实现电信功能或其他功能。

在一实施例中，反洗钱识别功能可以被集成到中央处理器中。其中，中央处理器可以被配置为进行如下控制：

步骤200：对该目标资金交易网络图进行风险社区划分。

从上述描述可知，本申请实施例提供的电子设备，可迅速方便的发现可疑的目标洗钱社区或洗钱节点，同时对这些可疑的目标社区进行进一步的洗钱风险量化评分，能够精准定位高风险的洗钱团伙，进而能够有效提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，并能够有效提高反洗钱识别过程的效率及智能化程度，进而能够有效提高金融机识别客户洗钱可疑交易行为的准确性及效率，有效提高反洗钱识别的报告率，降低监管监测以及预警甄别处理的时间及金钱成本。

在另一个实施方式中，反洗钱识别装置可以与中央处理器9100分开配置，例如可以将反洗钱识别装置配置为与中央处理器9100连接的芯片，通过中央处理器的控制来实现反洗钱识别功能。

如图16所示，该电子设备9600还可以包括：通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是，电子设备9600也并不是必须要包括图16中所示的所有部件；此外，电子设备9600还可以包括图16中没有示出的部件，可以参考现有技术。

如图16所示，中央处理器9100有时也称为控制器或操作控件，可以包括微处理器或其他处理器装置和/或逻辑装置，该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。

其中，存储器9140，例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息，此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序，以实现信息存储或处理等。

输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器，但并不限于此。

该存储器9140可以是固态存储器，例如，只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器，其即使在断电时也保存信息，可被选择性地擦除且设有更多数据，该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142，该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。

存储器9140还可以包括数据存储部9143，该数据存储部9143用于存储数据，例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。

通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100，以提供输入信号和接收输出信号，这可以和常规移动通信终端的情况相同。

基于不同的通信技术，在同一电子设备中，可以设置有多个通信模块9110，如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132，以经由扬声器9131提供音频输出，并接收来自麦克风9132的音频输入，从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外，音频处理器9130还耦合到中央处理器9100，从而使得可以通过麦克风9132能够在本机上录音，且使得可以通过扬声器9131来播放本机上存储的声音。

本申请的实施例还提供能够实现上述实施例中的反洗钱识别方法中全部步骤的一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的反洗钱识别方法的全部步骤，例如，所述处理器执行所述计算机程序时实现下述步骤：

步骤200：对该目标资金交易网络图进行风险社区划分。

从上述描述可知，本申请实施例提供的计算机可读存储介质，可迅速方便的发现可疑的目标洗钱社区或洗钱节点，同时对这些可疑的目标社区进行进一步的洗钱风险量化评分，能够精准定位高风险的洗钱团伙，进而能够有效提高反洗钱识别过程的可靠性以及反洗钱识别结果的准确性，并能够有效提高反洗钱识别过程的效率及智能化程度，进而能够有效提高金融机识别客户洗钱可疑交易行为的准确性及效率，有效提高反洗钱识别的报告率，降低监管监测以及预警甄别处理的时间及金钱成本。

本领域内的技术人员应明白，本发明的实施例可提供为方法、装置、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种反洗钱识别方法，其特征在于，包括：

对该目标资金交易网络图进行风险社区划分；

2.根据权利要求1所述的反洗钱识别方法，其特征在于，在所述对该目标资金交易网络图进行风险社区划分之前，还包括：

3.根据权利要求1所述的反洗钱识别方法，其特征在于，所述对该目标资金交易网络图进行风险社区划分，包括：

4.根据权利要求1所述的反洗钱识别方法，其特征在于，所述对各个所述风险社区进行风险评级，并基于对应的风险评级结果确定至少一个目标社区，包括：

5.根据权利要求1所述的反洗钱识别方法，其特征在于，所述应用预设的图卷积模型确定所述目标社区中的各个所述节点的风险评分，包括：

获取所述目标社区中的节点对应的账户标签；

6.根据权利要求1所述的反洗钱识别方法，其特征在于，所述获取目标资金交易网络图，包括：

对所述实体数据及关系数据进行预处理；

7.根据权利要求1所述的反洗钱识别方法，其特征在于，在所述对该目标资金交易网络图进行风险社区划分之前，还包括：

8.根据权利要求1所述的反洗钱识别方法，其特征在于，在所述得到所述目标资金交易网络图对应的存在洗钱风险的社区之后，还包括：

对所述存在洗钱风险的社区进行可视化显示。

9.一种反洗钱识别装置，其特征在于，包括：

10.根据权利要求9所述的反洗钱识别装置，其特征在于，还包括：

11.根据权利要求9所述的反洗钱识别装置，其特征在于，所述风险社区划分模块用于执行下述内容：

12.根据权利要求9所述的反洗钱识别装置，其特征在于，所述目标社区确定模块用于执行下述内容：

13.根据权利要求9所述的反洗钱识别装置，其特征在于，所述洗钱风险社区确定模块用于执行下述内容：

获取所述目标社区中的节点对应的账户标签；

14.根据权利要求9所述的反洗钱识别装置，其特征在于，所述交易网络构建模块用于执行下述内容：

对所述实体数据及关系数据进行预处理；

15.根据权利要求9所述的反洗钱识别装置，其特征在于，还包括：

16.根据权利要求9所述的反洗钱识别装置，其特征在于，还包括：

17.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至8任一项所述的反洗钱识别方法的步骤。

18.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至8任一项所述的反洗钱识别方法的步骤。