CN115660688B - 金融交易异常检测方法及其跨区域可持续训练方法 - Google Patents

金融交易异常检测方法及其跨区域可持续训练方法 Download PDF

Info

Publication number
CN115660688B
CN115660688B CN202211301695.8A CN202211301695A CN115660688B CN 115660688 B CN115660688 B CN 115660688B CN 202211301695 A CN202211301695 A CN 202211301695A CN 115660688 B CN115660688 B CN 115660688B
Authority
CN
China
Prior art keywords
transaction
node
financial
nodes
anomaly detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211301695.8A
Other languages
English (en)
Other versions
CN115660688A (zh
Inventor
杨新
李昱洁
杨宇轩
刘贵松
程秀传
黄鹂
殷光强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kashgar Electronic Information Industry Technology Research Institute
Southwestern University Of Finance And Economics
Original Assignee
Kashgar Electronic Information Industry Technology Research Institute
Southwestern University Of Finance And Economics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kashgar Electronic Information Industry Technology Research Institute, Southwestern University Of Finance And Economics filed Critical Kashgar Electronic Information Industry Technology Research Institute
Priority to CN202211301695.8A priority Critical patent/CN115660688B/zh
Publication of CN115660688A publication Critical patent/CN115660688A/zh
Application granted granted Critical
Publication of CN115660688B publication Critical patent/CN115660688B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明涉及金融风险管理领域,公开了一种金融交易异常检测方法及其跨区域可持续训练方法,其金融交易异常检测方法,通过构建由多种节点和多类路径构成的异质结构信息图,克服了现有技术中同质图难以保留多类型语义信息、无法捕捉动态时空特征的问题,充分挖掘时间信息等高阶语义,极大地丰富可获取信息量,并采用深度图神经网络模型,基于注意力机制对节点、路径和网络结构进行融合,获得图嵌入表示,并基于图嵌入表示对异常行为进行检测,提高了异常检测的效率和精度;同时,提出跨区域可持续训练方法,通过知识回放策略和参数平滑策略实现金融交易异常检测模型跨区域的持续学习,方便跨区域部署,适用于金融交易欺诈检测等金融风险管理任务。

Description

金融交易异常检测方法及其跨区域可持续训练方法
技术领域
本发明涉及金融风险管理领域,具体涉及金融交易异常检测方法及其跨区域可持续训练方法。
背景技术
随着电子商务的快速扩张和通信技术的蓬勃发展,经济活动出现了跨区域、跨时间和低成本的需求。数字金融作为一种新型金融业态,具有强大的物理穿透性和低成本优势,避免了物理网点的限制进而提高效率,带来便利性。但随着数字技术的发展,衍生了数字金融欺诈行为,该行为影响合法交易过程的进行,而对用户造成经济损失。
对于数字金融而言,金融欺诈等异常交易,不仅会严重伤害用户对金融科技的信任,对各类金融机构和企业造成经济、名誉等损失,也为数字金融的创新发展和传统金融业的数字化转型升级带来了不利影响,这些对数字金融行业发展都会造成致命的威胁。可见,金融反欺诈已经成为了金融风险防范能力的关键一环,金融异常检测技术对金融行业安全乃至国家信息安全都具有重要的应用价值和研究意义。
金融异常检测的主要目的是检测金融交易是否异常,包括异常交易检测和异常行为检测。传统的金融反欺诈解决方案一方面依赖于基于规则的模型,这些模型通过构建源自历史交易数据的手工特征来发现潜在的异常行为,通过专家经验来设置重要特征,从而检测金融欺诈行为。然而,基于规则的方法严重依赖于人类的先验知识,导致了检测存在偏差,并且在处理更复杂的规则模式时容易崩溃;另一方面依赖静态的结构化数据,然而,由于数据的开放动态本质和欺诈数据的异质问题,现有的反欺诈模型难以做出快速且精确的反应。此外,现有的大多数模型设计也导致***缺乏可解释性和高效性,难以高效处理真实开放环境下的持续学习。
近年来,随着图表示学习的发展,越来越多金融研究使用基于深度图神经网络方法,通过将客户和商家等实体建模为节点,实体之间的交互建模为边,来探索数据中的高阶隐含信息,促使使用图表征学习来揭示大规模金融交易背后的隐含模式。
现有的基于深度图神经网络的解决方案存在两个重大的挑战:
一、现实业务场景下的交易数据包含了除客户和商家实体之外的各种类型的附加实体,如交易时间、交易空间。然而,现有解决方案大多只考虑同构网络,将异构交互分解为多个同构连接,这导致高阶语义信息丢失,模型无法学习时空动态特征。
二、现有的解决方案由于实际应用中数据采集的限制,只适用于较窄的范围。当金融业务扩展到新的区域,如新的城市,甚至新的国家时,通常要么使用之前训练好的,也即静态的模型,要么开发一个全新的模型。由于不同区域实体的消费特征、行为特征或多或少存在差异,通过现有数据学习训练的金融模型可能由于地理差异会造成目标特征不匹配而无法直接使用;而开发一个新模型需要付出高昂的金钱成本和时间成本。
发明内容
本发明所要解决的技术问题是:提供一种金融交易异常检测方法及其跨区域可持续训练方法,其能提高对金融交易异常检测的效率和精度,同时,能方便的进行跨区域部署。
本发明解决上述技术问题采用的技术方案是:
金融交易异常检测方法,包括以下步骤:
A1、根据目标区域的待检测金融交易数据,构建金融异构信息图;所述金融异构信息图的实体节点包括用户节点、商户节点、时间节点和交易节点,节点特征向量根据对应知识信息编码获得,元路径的类型包括用户-交易类路径、商户-交易类路径和时间-交易类路径;
A2、根据各节点的特征向量,通过编码网络,获得各节点的嵌入表示;根据交易节点与其邻居节点的嵌入表示,按交易节点与其邻居节点的元路径类型,基于注意力机制进行分类聚合,获得交易节点各元路径类型的嵌入表示;然后,按元路径类型,聚合各交易节点对应元路径类型的嵌入表示,获得金融异构信息图各元路径类型的嵌入表示;
A3、根据金融异构信息图各元路径类型的嵌入表示,基于自注意力机制,融合各元路径类型的嵌入表示,获得金融异构信息图的图嵌入表示;
A4、基于金融异构信息图的图嵌入表示,采用全连接层输出异常检测的分类标签,作为异常检测结果。
具体的,步骤A1中,节点特征向量根据对应知识信息编码获得,包括:
用户节点对应知识信息为交易用户的唯一身份ID;
商户节点对应知识信息为交易商户的唯一身份ID;
时间节点对应知识信息为交易的时间戳信息;
交易节点对应知识信息包括交易流水号、交易地点、交易金额和交易类型。
进一步的,时间节点的特征向量编码,包括:首先,将每天24小时按时间间隔划分为时间窗口,然后,按交易时间戳所属时间窗口对应时间段,根据时间段的数字信息或onehot方式进行编码,获得时间节点的特征向量编码。
进一步的,交易节点的特征向量编码,包括:首先,根据交易流水号的数字信息进行编码,根据交易地点的经纬度进行编码,根据交易金额的数字信息进行编码,将交易类型按onehot方式进行编码,然后,将编码获得的流水号、交易地点、交易金额和交易类型进行拼接,构成交易节点的特征向量编码。
具体的,步骤A2中,根据各节点的特征向量,通过编码网络,获得各节点的嵌入表示;根据交易节点与其邻居节点的嵌入表示,按交易节点与其邻居节点的元路径类型,基于注意力机制进行分类聚合,获得交易节点各元路径类型的嵌入表示;然后,按元路径类型,聚合各交易节点对应元路径类型的嵌入表示,获得金融异构信息图各元路径类型的嵌入表示,包括:
A21、将金融异构信息图中的所有节点的特征向量,通过编码网络映射至特征空间,获得各节点在特征空间的嵌入表示
其中,为第i个节点在特征空间中的嵌入表示,Wx为编码网络的可学习参数矩阵,/>为第i个节点的特征向量;
A22、采用注意力机制,获得交易节点与其邻居节点之间的注意力得分
其中,attη表示注意力机制,为交易节点i与邻居节点j之间的注意力得分,/>为交易节点i与邻居节点j之间元路径的类型;
A23、使用SoftMax函数,按元路径类型,分别将各类元路径类型所属的注意力得分进行标准化,得到注意力权重/>
其中,为交易节点i的邻居节点中元路径类型为第m类元路径/>的邻居节点的集合;
A24、按交易节点与其邻居节点的元路径类型,基于注意力权重进行分类聚合,获得交易节点i各元路径类型的嵌入表示/>
其中,σ为sigmoid函数;
A25、对各交易节点的嵌入表示按元路径类型进行聚合,获得各元路径类型的嵌入表示/>
进一步的,步骤A22中,采用sigmoid函数计算注意力得分
其中,为可学习参数矩阵,上标T表示矩阵转置,‖为矩阵连接符号;sigmoid为激活函数。
具体的,步骤A3中,根据金融异构信息图各元路径类型的嵌入表示,基于自注意力机制,融合各元路径类型的嵌入表示,获得金融异构信息图的图嵌入表示,包括:
A31、采用自注意力机制,获得各元路径类型之间的注意力得分
其中,表示第m类元路径/>的注意力得分;/>表示元路径/>的嵌入表示;M表示元路径类型的数量;attψ表示注意力机制;
A32、使用SoftMax函数,将注意力得分进行标准化,得到注意力权重/>
A33、基于注意力权重融合各元路径类型的嵌入表示;
其中,Z表示金融异构信息图的图嵌入表示。
进一步的,步骤A31中,按如下公式计算注意力得分
其中,为交易节点i的第m类元路径的嵌入表示,tanh表示双曲正切激活函数,q、W′和b均为可学习参数,上标T表示矩阵转置,N为交易节点数。
为了方便跨区域的实施上述金融交易异常检测方法,本发明还提供了用于上述金融交易异常检测方法的跨区域可持续训练方法,包括以下步骤:
B1、根据持续学习策略,构建目标区域金融交易异常检测模型的初始参数和回放样本集;
所述持续学***滑策略;
所述知识回放策略为:从参考区域的样本中采样预设数量的样本,构建回放样本集;所述参数平滑策略为:提取参考区域的金融交易异常检测模型的参数矩阵,作为目标区域的初始参数矩阵,并对该参数矩阵进行评估,获得参数重要程度评分;所述参考区域为已完成金融交易异常检测模型训练的区域,初始时则为随机区域,并通过随机方式获得随机区域的参数矩阵;
B2、根据回放样本集和目标区域的样本集,构建金融异构信息图,并按上述的金融交易异常检测方法,获得目标区域的异常检测结果;
B3、根据异常检测结果和真实标签,采用交叉熵损失函数计算训练损失,对目标区域的金融交易异常检测模型进行迭代训练,直至达到预设迭代轮次或模型收敛,获得目标区域的金融交易异常检测模型,且基于参数平滑策略,根据步骤B1获得的参数重要程度评分对训练过程进行约束。
进一步的,步骤B1中,从参考区域的样本中采样预设数量的样本,构建回放样本集,包括:
首先,从参考区域的金融异构信息图中,随机采样交易节点,并计算采样交易节点特征向量的均值作为回放原型cl-1
其中,为随机采样获得的交易节点集合,/>为/>中交易节点i的特征向量,/>为随机采样得到的交易节点数量;
然后,按如下方式构建回放样本集:
方式一、按采样获得各交易节点特征向量与回放原型的接近程度,由近到远按预设数量,从中选取交易节点,由选取的交易节点及其邻居节点构成回放样本集,且随机采样得到的交易节点数量大于预设数量;
方式二、生成高斯噪音,基于所生成的高斯噪音对随机采样得到的交易节点的特征向量进行修正,基于修正获得的交易节点及随机采样得到的交易节点的邻居节点构成回放样本集,且随机采样得到的交易节点数量为预设数量;
方式三、首先按方式一进行处理,然后按方式二进行处理,完成回放样本集的构建。
进一步的,步骤B1中,对参考区域金融交易异常检测模型的参数矩阵,根据该参数矩阵条件下,参考区域交易节点特征向量的梯度变化,评估获得参数重要程度评分。
具体的,采用费雪信息矩阵,对参数矩阵进行评估,包括:
其中,Θl-1表示参考区域的金融交易异常检测模型的参数矩阵,Xl-1表示参考区域的金融异构信息图中各交易节点特征向量的集合;g(x;Θl-1)表示通过损失函数计算的在Θl-1条件下交易节点x的特征向量的梯度变化,T表示矩阵转置。
具体的,步骤B3中的损失函数为:
其中,为交叉熵损失,/>分别为根据参数重要程度评分对更新过程进行约束的正则化约束项;
按如下公式计算交叉熵损失:
其中,表示第i个交易节点的真实标签、/>表示第i个交易节点的预测标签,N为交易节点数;
按如下公式计算正则化约束项:
其中,Θl表示目标区域金融交易异常检测模型的参数矩阵,S表示目标区域之前已完成金融交易异常检测模型训练的区域集合,Θs表示区域集合中第s个区域的金融交易异常检测模型的参数矩阵,Θl-1表示目标区域的参考区域金融交易异常检测模型的参数矩阵;表示目标区域的金融交易异常检测模型参数重要程度的矩阵;γ、λ为平滑因子。
本发明的有益效果是:
本发明通过构建异质结构信息图,克服了以往同质图难以保留多类型的语义信息,无法捕捉动态时空特征的缺点,充分挖掘时间信息等高阶语义,极大地丰富可获取信息量程度,并使用深度图神经网络模型对节点、节点连接和网络结构进行融合,学习低维度嵌入表示,对异常结果进行检测,不仅提高了异常检测效率,也提升了金融异常检测精度。
同时,本发明充分地考虑到现实金融场景下跨区域业务拓展的实际需求,基于深度图神经网络模型的持续学习,弥补了当前金融异常检测***局限于单一区域的缺陷,能方便的进行跨区域部署。
本发明适用于金融交易欺诈检测等各类金融风险管理任务,帮助金融企业在跨区域的金融业务中进行风险管控、保障金融安全。
附图说明
图1为本发明实施例中的金融交易异常检测模型训练流程图;
图2为本发明实施例中的金融异构信息图谱构建过程图;
图3为本发明实施例中的利用模型进行金融交易异常检测的流程图。
具体实施方式
本发明旨在提出一种金融交易异常检测方法及其跨区域可持续训练方法,其能提高对金融交易异常检测的效率和精度,同时,能方便的进行跨区域部署。
可持续训练,也即持续学***滑策略,克服跨区域持续学习中,灾难性遗忘和知识迁移的问题。
同时,本发明通过构建异质结构信息图,克服了以往同质图难以保留多类型的语义信息,无法捕捉动态时空特征的缺点,充分挖掘时间信息等高阶语义,极大地丰富可获取信息量程度,并使用深度图神经网络模型对节点、节点连接和网络结构进行融合,学习低维度嵌入表示,对异常结果进行检测,不仅提高了跨区域异常检测效率,也提升了金融异常检测精确度。
实施例:
本实施例,包括训练金融交易异常检测模型和利用模型进行金融交易异常检测两大部分。
其中,训练金融交易异常检测模型的流程,如图1所示,其包括以下实施步骤:
S1、构建目标区域金融交易异常检测模型的初始参数和回放样本集:
由于真实业务场景下,金融交易区域是随着业务拓展而不断增加的,因此,本步骤中,针对跨区域的金融交易数据样本数据,首先,根据地理经纬度划分不同的交易区域并随机设定区域出现的顺序,用以模拟真实交易场景下交易区域持续增加的情况。另外,本实施例还对数据样本进行了一系列预处理操作,包括删除重复信息、纠正存在的错误,保证交易的数据一致性和数据质量。
本发明的方法是一种可持续学习的跨区域金融交易异常检测方法,因此,在训练时,采用逐区域训练的方式,针对每一个划分的区域均分别进行训练,从而获得该区域对应的金融交易异常检测模型;且,针对每一个区域的金融交易异常检测模型,其初始参数和回放样本集的构建方式,采用可持续学习策略构建其初始参数和回放样本集,因此,该区域对应的金融交易异常检测模型,除适用于本区域以外,还适用于在本区域完成训练之前模型已完成训练并覆盖的区域。
具体的讲,所述持续学***滑策略。
所述知识回放策略为:从参考区域的样本中采样预设数量的样本,构建回放样本集;所述参数平滑策略为:提取参考区域的金融交易异常检测模型的参数矩阵,作为目标区域的初始参数矩阵,并对该参数矩阵进行评估,获得参数重要程度评分。
所述参考区域为已完成金融交易异常检测模型训练的区域,初始时则为随机区域,并通过随机方式获得随机区域的参数矩阵。
进一步的讲,若目标区域为第一个区域,也即为第一个进行模型训练的区域,由于此前并没有学习基础,也即并不存在已经完成其他区域训练的模型,因此,可以随机选择一个其他区域作为参考区域,并采用模型的随机初始参数作为初始参数。而若目标区域并非第一个区域,也即存在已经完成其他区域训练的模型,则对于该目标区域而言,已经完成模型训练的“现有区域”,也即现有模型所覆盖的区域,可以作为目标区域学习的参考区域。
当然,为了保证完成目标区域训练后模型覆盖区域的最大化,最好的,从现有区域中选择目标区域的前一个完成训练的区域作为参考区域。
进一步的讲,知识回放策略,可以采用一个小型的经验知识寄存器,随机回放来自于所选择的参考区域的样本,帮助当前目标区域的异常检测模型训练。
具体的,本实施例采用一种原型方法(Prototypes),即特征平均法(MeanofFeature,MF),构建回放样本集,用于缓解随机采样引起的训练不稳定性问题,包括:
首先,从参考区域的金融异构信息图中,随机采样交易节点,并计算采样交易节点特征向量的均值作为回放原型cl-l
其中,为随机采样获得的交易节点集合,/>为/>中交易节点i的特征向量,/>为随机采样得到的交易节点数量;
然后,生成高斯噪音,基于所生成的高斯噪音对随机采样得到的交易节点的特征向量进行修正,基于修正获得的交易节点及随机采样得到的交易节点的邻居节点构成回放样本集,且随机采样得到的交易节点数量为预设数量。通过稳健性实验,在回放比例为0.1时,模型表现最优,因此本实施例的预设数量,为回放比例为0.1时的样本数量。
当然,除上述方式以外,还可以采用:通过欧式距离判定各交易节点特征向量与回放原型的接近程度,由近到远按预设数量,从中选取交易节点,由选取的交易节点及其邻居节点构成回放样本集,且随机采样得到的交易节点数量大于预设数量;也或者,首先按欧式距离的方式进行筛选,然后按高斯噪声的方式进行修正,完成回放样本集的构建。
参数平滑策略,也即通过平滑参数法来约束重要参数的更新,其能够缓解跨区域欺诈检测任务间的灾难性遗忘问题。进一步的讲,对参考区域金融交易异常检测模型的参数矩阵,可以根据该参数矩阵条件下,参考区域交易节点特征向量的梯度变化,评估获得参数重要程度评分。
具体的,本实施例,采用费雪信息矩阵,对参数矩阵进行评估,包括:
其中,Θl-1表示参考区域的金融交易异常检测模型的参数矩阵,Xl-1表示参考区域的金融异构信息图中各交易节点特征向量的集合;g(x;Θl-1)表示通过损失函数计算的在Θl-1条件下交易节点x的特征向量的梯度变化,T表示矩阵转置。
S2、根据回放样本集和目标区域的样本集,构建金融异构信息图:
构建金融异构信息图,主要包括三部分,即实体节点构建、元路径构建和节点特征构建。
具体的,如图2所示,包括:
S21、实体节点构建及其节点特征构建:
本发明,从金融交易数据样本中,提取了四种类型的实体作为实体节点,分别是用户节点、商户节点、时间节点和交易节点,节点特征向量根据对应知识信息编码获得。
具体的讲,在实施例中,节点特征向量根据对应知识信息编码获得,包括:
用户节点对应知识信息为交易用户的唯一身份ID;
商户节点对应知识信息为交易商户的唯一身份ID;
时间节点对应知识信息为交易的时间戳信息;
交易节点对应知识信息包括交易流水号、交易地点、交易金额和交易类型。
上述的用户ID、商户ID、交易编码及时间标识均为结构化的,因此,可以直接的用作对应节点的特征向量编码。
为了捕捉金融异常检测任务对于交易时间的敏感性,本发明增加了以时间戳信息作为标识的时间节点,但为了方便分类处理,进一步的,时间节点的特征向量编码,包括:首先,将每天24小时按时间间隔划分为时间窗口,然后,按交易时间戳所属时间窗口对应时间段,根据时间段的数字信息进行编码,获得时间节点的特征向量编码。当然也可以采用onehot方式编码。
而为了进一步描述每个交易节点的固有语义,提高异常检测任务效率,在构建金融异构信息图时,将与交易相关的特征均作为交易节点的属性特征,具体的,交易节点的特征向量编码,包括:首先,根据交易流水号的数字信息进行编码,根据交易地点的经纬度进行编码,根据交易金额的数字信息进行编码,将交易类型按onehot方式进行编码,然后,将编码获得的流水号、交易地点、交易金额和交易类型进行拼接,构成交易节点的特征向量编码。
S22、元路径构建:
元路径被广泛应用于异构网络语义探索中,目的是对节点间连边所对应关系的类型进行定义。本发明构建了三种类型的元路径,也即用户-交易类路径、商户-交易类路径和时间-交易类路径,用以描述从给定语义派生出来的异构关联信息。
其中,“交易-用户-交易”描述同一用户进行的不同交易;“交易-时间戳-交易”描述发生在相同时段的不同交易;“交易-商家-交易”描述同一家商户发生的不同交易。
因此,本发明所构建的金融异构信息图,是具有多种节点和关系类型的异构网络结构,能够充分利用与交易相关的不同类型信息,通过多种类型的元路径构建异构交易信息网络,融合丰富的语义信息。
S3、根据各节点的特征向量,通过编码网络,获得各节点的嵌入表示;根据交易节点与其邻居节点的嵌入表示,按交易节点与其邻居节点的元路径类型,基于注意力机制进行分类聚合,获得交易节点各元路径类型的嵌入表示;然后,按元路径类型,聚合各交易节点对应元路径类型的嵌入表示,获得金融异构信息图各元路径类型的嵌入表示,包括:
S31、将金融异构信息图中的所有节点的特征向量,通过编码网络映射至特征空间,获得各节点在特征空间的嵌入表示
其中,为第i个节点在特征空间中的嵌入表示,Wx为编码网络的可学习参数矩阵,/>为第i个节点的特征向量;
S32、采用注意力机制,获得交易节点与其邻居节点之间的注意力得分
其中,attη表示注意力机制,为交易节点i与邻居节点j之间的注意力得分,为交易节点i与邻居节点j之间元路径的类型;
具体的,本实施例中,采用sigmoid函数计算注意力得分
其中,为可学习参数矩阵,上标T表示矩阵转置,‖为矩阵连接符号;sigmoid为激活函数。
S33、使用SoftMax函数,按元路径类型,分别将各类元路径类型所属的注意力得分进行标准化,得到注意力权重/>
其中,为交易节点i的邻居节点中元路径类型为第m类元路径/>的邻居节点的集合;
S34、按交易节点与其邻居节点的元路径类型,基于注意力权重进行分类聚合,获得交易节点i各元路径类型的嵌入表示/>
其中,σ为sigmoid函数;
S35、对各交易节点的嵌入表示按元路径类型进行聚合,获得各元路径类型的嵌入表示/>
S4、根据金融异构信息图各元路径类型的嵌入表示,基于自注意力机制,融合各元路径类型的嵌入表示,获得金融异构信息图的图嵌入表示,包括:
S41、采用自注意力机制,获得各元路径类型之间的注意力得分
其中,表示第m类元路径/>的注意力得分;/>表示元路径/>的嵌入表示;M表示元路径类型的数量,在本实施例中,M=3;attψ表示注意力机制;
具体的,按如下公式计算注意力得分
其中,为交易节点i的第m类元路径的嵌入表示,tanh表示双曲正切激活函数,q、W′和b均为可学习参数,上标T表示矩阵转置,N为交易节点数。
S42、使用SoftMax函数,将注意力得分进行标准化,得到注意力权重/>
S43、基于注意力权重融合各元路径类型的嵌入表示;
其中,Z表示金融异构信息图的图嵌入表示。
S5、基于图嵌入表示,获取异常检测结果:
本步骤中,基于获得的图嵌入表示,采用全连接层输出欺诈检测的分类标签,作为异常检测结果;如输出结果为“1”表示“是异常交易”,输出结果为“0”表示“不是异常交易”。
S6、模型参数更新:
本步骤中,根据异常检测结果和真实标签,采用交叉熵损失函数计算训练损失,对目标区域的金融交易异常检测模型进行迭代训练,直至达到预设迭代轮次或模型收敛,获得目标区域的金融交易异常检测模型,且基于参数平滑策略,根据步骤B1获得的参数重要程度评分对训练过程进行约束
具体的,损失函数为:
/>
其中,为交叉熵损失,/>分别为根据参数重要程度评分对更新过程进行约束的正则化约束项;
按如下公式计算交叉熵损失:
其中,表示第i个交易节点的真实标签、/>表示第i个交易节点的预测标签,N为交易节点数;
按如下公式计算正则化约束项:
其中,Θl表示目标区域金融交易异常检测模型的参数矩阵,S表示目标区域之前已完成金融交易异常检测模型训练的区域集合,Θs表示区域集合中第s个区域的金融交易异常检测模型的参数矩阵,Θl-1表示目标区域的参考区域金融交易异常检测模型的参数矩阵;表示目标区域的金融交易异常检测模型参数重要程度的矩阵;γ、λ为平滑因子。
在训练获得目标区域的异常检测模型后,即可利用模型对相应区域的金融交易数据进行检测,从而判断交易是否为欺诈等异常交易,流程参见图3,具体包括:
A1、根据目标区域的待检测金融交易数据,构建金融异构信息图;
A2、根据各节点的特征向量,通过编码网络,获得各节点的嵌入表示;根据交易节点与其邻居节点的嵌入表示,按交易节点与其邻居节点的元路径类型,基于注意力机制进行分类聚合,获得交易节点各元路径类型的嵌入表示;然后,按元路径类型,聚合各交易节点对应元路径类型的嵌入表示,获得金融异构信息图各元路径类型的嵌入表示;
A3、根据金融异构信息图各元路径类型的嵌入表示,基于自注意力机制,融合各元路径类型的嵌入表示,获得金融异构信息图的图嵌入表示;
A4、基于金融异构信息图的图嵌入表示,采用全连接层输出异常检测的分类标签,作为异常检测结果。
尽管这里参照本发明的实施例对本发明进行了描述,上述实施例仅为本发明较佳的实施方式,本发明的实施方式并不受上述实施例的限制,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。

Claims (12)

1.金融交易异常检测方法,其特征在于,包括以下步骤:
A1、根据目标区域的待检测金融交易数据,构建金融异构信息图;所述金融异构信息图的实体节点包括用户节点、商户节点、时间节点和交易节点,节点特征向量根据对应知识信息编码获得,元路径的类型包括用户-交易类路径、商户-交易类路径和时间-交易类路径;
A2、根据各节点的特征向量,通过编码网络,获得各节点的嵌入表示;根据交易节点与其邻居节点的嵌入表示,按交易节点与其邻居节点的元路径类型,基于注意力机制进行分类聚合,获得交易节点各元路径类型的嵌入表示;然后,按元路径类型,聚合各交易节点对应元路径类型的嵌入表示,获得金融异构信息图各元路径类型的嵌入表示;
A3、根据金融异构信息图各元路径类型的嵌入表示,基于自注意力机制,融合各元路径类型的嵌入表示,获得金融异构信息图的图嵌入表示;
A4、基于金融异构信息图的图嵌入表示,采用全连接层输出异常检测的分类标签,作为异常检测结果;
步骤A2中,根据各节点的特征向量,通过编码网络,获得各节点的嵌入表示;根据交易节点与其邻居节点的嵌入表示,按交易节点与其邻居节点的元路径类型,基于注意力机制进行分类聚合,获得交易节点各元路径类型的嵌入表示;然后,按元路径类型,聚合各交易节点对应元路径类型的嵌入表示,获得金融异构信息图各元路径类型的嵌入表示,包括:
A21、将金融异构信息图中的所有节点的特征向量,通过编码网络映射至特征空间,获得各节点在特征空间的嵌入表示
其中,为第i个节点在特征空间中的嵌入表示,Wx为编码网络的可学习参数矩阵,/>为第i个节点的特征向量;
A22、采用注意力机制,获得交易节点与其邻居节点之间的注意力得分
其中,attη表示注意力机制,为交易节点i与邻居节点j之间的注意力得分,/>为交易节点i与邻居节点j之间元路径的类型;
A23、使用SoftMax函数,按元路径类型,分别将各类元路径类型所属的注意力得分进行标准化,得到注意力权重/>
其中,为交易节点i的邻居节点中元路径类型为第m类元路径/>的邻居节点的集合;
A24、按交易节点与其邻居节点的元路径类型,基于注意力权重进行分类聚合,获得交易节点i各元路径类型的嵌入表示/>
其中,σ为sigmoid函数;
A25、对各交易节点的嵌入表示按元路径类型进行聚合,获得各元路径类型的嵌入表示/>
2.如权利要求1所述的金融交易异常检测方法,其特征在于,
步骤A1中,节点特征向量根据对应知识信息编码获得,包括:
用户节点对应知识信息为交易用户的唯一身份ID;
商户节点对应知识信息为交易商户的唯一身份ID;
时间节点对应知识信息为交易的时间戳信息;
交易节点对应知识信息包括交易流水号、交易地点、交易金额和交易类型。
3.如权利要求2所述的金融交易异常检测方法,其特征在于,
时间节点的特征向量编码,包括:首先,将每天24小时按时间间隔划分为时间窗口,然后,按交易时间戳所属时间窗口对应时间段,根据时间段的数字信息或onehot方式进行编码,获得时间节点的特征向量编码。
4.如权利要求2所述的金融交易异常检测方法,其特征在于,
交易节点的特征向量编码,包括:首先,根据交易流水号的数字信息进行编码,根据交易地点的经纬度进行编码,根据交易金额的数字信息进行编码,将交易类型按onehot方式进行编码,然后,将编码获得的流水号、交易地点、交易金额和交易类型进行拼接,构成交易节点的特征向量编码。
5.如权利要求1所述的金融交易异常检测方法,其特征在于,
步骤A22中,采用sigmoid函数计算注意力得分
其中,为可学习参数矩阵,上标T表示矩阵转置,||为矩阵连接符号;sigmoid为激活函数。
6.如权利要求1~4任一项所述的金融交易异常检测方法,其特征在于,步骤A3中,根据金融异构信息图各元路径类型的嵌入表示,基于自注意力机制,融合各元路径类型的嵌入表示,获得金融异构信息图的图嵌入表示,包括:
A31、采用自注意力机制,获得各元路径类型之间的注意力得分
其中,表示第m类元路径/>的注意力得分;/>表示元路径/>的嵌入表示;M表示元路径类型的数量;attψ表示注意力机制;
A32、使用SoftMax函数,将注意力得分进行标准化,得到注意力权重/>
A33、基于注意力权重融合各元路径类型的嵌入表示;
其中,z表示金融异构信息图的图嵌入表示。
7.如权利要求6所述的金融交易异常检测方法,其特征在于,
步骤A31中,按如下公式计算注意力得分
其中,为交易节点i的第m类元路径的嵌入表示,tanh表示双曲正切激活函数,q、W′和b均为可学习参数,上标T表示矩阵转置,N为交易节点数。
8.用于如权利要求1~7任一项所述金融交易异常检测方法的跨区域可持续训练方法,其特征在于,包括以下步骤:
B1、根据持续学习策略,构建目标区域金融交易异常检测模型的初始参数和回放样本集;
所述持续学***滑策略;
所述知识回放策略为:从参考区域的样本中采样预设数量的样本,构建回放样本集;所述参数平滑策略为:提取参考区域的金融交易异常检测模型的参数矩阵,作为目标区域的初始参数矩阵,并对该参数矩阵进行评估,获得参数重要程度评分;所述参考区域为已完成金融交易异常检测模型训练的区域,初始时则为随机区域,并通过随机方式获得随机区域的参数矩阵;
B2、根据回放样本集和目标区域的样本集,构建金融异构信息图,并按权利要求1~7任一项所述的金融交易异常检测方法,获得目标区域的异常检测结果;
B3、根据异常检测结果和真实标签,采用交叉熵损失函数计算训练损失,对目标区域的金融交易异常检测模型进行迭代训练,直至达到预设迭代轮次或模型收敛,获得目标区域的金融交易异常检测模型,且基于参数平滑策略,根据步骤B1获得的参数重要程度评分对训练过程进行约束。
9.如权利要求8所述的跨区域可持续训练方法,其特征在于,
步骤B1中,从参考区域的样本中采样预设数量的样本,构建回放样本集,包括:
首先,从参考区域的金融异构信息图中,随机采样交易节点,并计算采样交易节点特征向量的均值作为回放原型cl-1
其中,为随机采样获得的交易节点集合,/>为/>中交易节点i的特征向量,为随机采样得到的交易节点数量;
然后,按如下方式构建回放样本集:
方式一、按采样获得各交易节点特征向量与回放原型的接近程度,由近到远按预设数量,从中选取交易节点,由选取的交易节点及其邻居节点构成回放样本集,且随机采样得到的交易节点数量大于预设数量;
方式二、生成高斯噪音,基于所生成的高斯噪音对随机采样得到的交易节点的特征向量进行修正,基于修正获得的交易节点及随机采样得到的交易节点的邻居节点构成回放样本集,且随机采样得到的交易节点数量为预设数量;
方式三、首先按方式一进行处理,然后按方式二进行处理,完成回放样本集的构建。
10.如权利要求8所述的跨区域可持续训练方法,其特征在于,步骤B1中,对参考区域金融交易异常检测模型的参数矩阵,根据该参数矩阵条件下,参考区域交易节点特征向量的梯度变化,评估获得参数重要程度评分。
11.如权利要求10所述的跨区域可持续训练方法,其特征在于,
采用费雪信息矩阵,对参数矩阵进行评估,包括:
其中,Θl-1表示参考区域的金融交易异常检测模型的参数矩阵,Xl-1表示参考区域的金融异构信息图中各交易节点特征向量的集合;g(x;Θl-1)表示通过损失函数计算的在Θl-1条件下交易节点x的特征向量的梯度变化,T表示矩阵转置。
12.如权利要求8~11任一项所述的跨区域可持续训练方法,其特征在于,步骤B3中的损失函数为:
其中,为交叉熵损失,/>分别为根据参数重要程度评分对更新过程进行约束的正则化约束项;
按如下公式计算交叉熵损失:
其中,表示第i个交易节点的真实标签、/>表示第i个交易节点的预测标签,N为交易节点数;
按如下公式计算正则化约束项:
其中,Θl表示目标区域金融交易异常检测模型的参数矩阵,S表示目标区域之前已完成金融交易异常检测模型训练的区域集合,Θs表示区域集合中第s个区域的金融交易异常检测模型的参数矩阵,Θl-1表示目标区域的参考区域金融交易异常检测模型的参数矩阵;表示目标区域的金融交易异常检测模型参数重要程度的矩阵;γ、λ为平滑因子。
CN202211301695.8A 2022-10-24 2022-10-24 金融交易异常检测方法及其跨区域可持续训练方法 Active CN115660688B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211301695.8A CN115660688B (zh) 2022-10-24 2022-10-24 金融交易异常检测方法及其跨区域可持续训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211301695.8A CN115660688B (zh) 2022-10-24 2022-10-24 金融交易异常检测方法及其跨区域可持续训练方法

Publications (2)

Publication Number Publication Date
CN115660688A CN115660688A (zh) 2023-01-31
CN115660688B true CN115660688B (zh) 2024-04-30

Family

ID=84991891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211301695.8A Active CN115660688B (zh) 2022-10-24 2022-10-24 金融交易异常检测方法及其跨区域可持续训练方法

Country Status (1)

Country Link
CN (1) CN115660688B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117408697A (zh) * 2023-10-19 2024-01-16 重庆邮电大学 一种基于大数据的消费金融领域欺诈检测方法
CN117455497B (zh) * 2023-11-12 2024-06-14 广东冠汇网络科技有限公司 一种交易风险检测方法及装置
CN117708821B (zh) * 2024-02-06 2024-04-30 山东省计算中心(国家超级计算济南中心) 基于异构图嵌入的勒索软件检测方法、***、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003089A (zh) * 2018-06-28 2018-12-14 中国工商银行股份有限公司 风险识别方法及装置
CN111090780A (zh) * 2019-12-09 2020-05-01 中国建设银行股份有限公司 可疑交易信息的确定方法及装置、存储介质、电子设备
WO2021179838A1 (zh) * 2020-03-10 2021-09-16 支付宝(杭州)信息技术有限公司 一种基于异构图神经网络模型进行预测的方法和***
CN113506179A (zh) * 2021-09-13 2021-10-15 北京大学深圳研究生院 数字货币交易中异常实体的检测方法、存储介质
CN113706279A (zh) * 2021-06-02 2021-11-26 同盾科技有限公司 欺诈分析方法、装置、电子设备及存储介质
CN114187112A (zh) * 2021-12-15 2022-03-15 深圳前海微众银行股份有限公司 账户风险模型的训练方法和风险用户群体的确定方法
CN114386727A (zh) * 2020-10-19 2022-04-22 腾讯科技(深圳)有限公司 一种风险识别方法、装置、设备及存储介质
CN114565053A (zh) * 2022-03-10 2022-05-31 天津大学 基于特征融合的深层异质图嵌入模型

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003089A (zh) * 2018-06-28 2018-12-14 中国工商银行股份有限公司 风险识别方法及装置
CN111090780A (zh) * 2019-12-09 2020-05-01 中国建设银行股份有限公司 可疑交易信息的确定方法及装置、存储介质、电子设备
WO2021179838A1 (zh) * 2020-03-10 2021-09-16 支付宝(杭州)信息技术有限公司 一种基于异构图神经网络模型进行预测的方法和***
CN114386727A (zh) * 2020-10-19 2022-04-22 腾讯科技(深圳)有限公司 一种风险识别方法、装置、设备及存储介质
CN113706279A (zh) * 2021-06-02 2021-11-26 同盾科技有限公司 欺诈分析方法、装置、电子设备及存储介质
CN113506179A (zh) * 2021-09-13 2021-10-15 北京大学深圳研究生院 数字货币交易中异常实体的检测方法、存储介质
CN114187112A (zh) * 2021-12-15 2022-03-15 深圳前海微众银行股份有限公司 账户风险模型的训练方法和风险用户群体的确定方法
CN114565053A (zh) * 2022-03-10 2022-05-31 天津大学 基于特征融合的深层异质图嵌入模型

Also Published As

Publication number Publication date
CN115660688A (zh) 2023-01-31

Similar Documents

Publication Publication Date Title
CN115660688B (zh) 金融交易异常检测方法及其跨区域可持续训练方法
Guikema Artificial intelligence for natural hazards risk analysis: Potential, challenges, and research needs
Peel Graph-based semi-supervised learning for relational networks
CN110213244A (zh) 一种基于时空特征融合的网络入侵检测方法
Wang et al. Blind drift calibration of sensor networks using sparse Bayesian learning
Nie et al. Network traffic prediction in industrial Internet of Things backbone networks: A multitask learning mechanism
Gong et al. Missing value imputation for multi-view urban statistical data via spatial correlation learning
CN114626890A (zh) 一种基于图结构学习的异常用户检测方法
CN113283902B (zh) 一种基于图神经网络的多通道区块链钓鱼节点检测方法
Zhang et al. An open set domain adaptation algorithm via exploring transferability and discriminability for remote sensing image scene classification
El-Toukhy et al. Electricity theft detection using deep reinforcement learning in smart power grids
CN113111930A (zh) 一种端到端的以太坊钓鱼账户检测方法和***
Zhu et al. Anomaly detection with deep graph autoencoders on attributed networks
Godoy et al. Ensemble random forest filter: An alternative to the ensemble Kalman filter for inverse modeling
Wu et al. Robust low-rank latent feature analysis for spatiotemporal signal recovery
CN110889493A (zh) 针对关系网络添加扰动的方法及装置
CN111402028A (zh) 一种信息处理方法、装置及设备
Feng et al. A novel approach for trajectory feature representation and anomalous trajectory detection
CN117134978A (zh) 基于局部和全局行为模式分析的车辆身份验证方法及***
Das et al. A Bayesian sparse generalized linear model with an application to multiscale covariate discovery for observed rainfall extremes over the United States
CN115310672A (zh) 城市发展预测模型的构建方法、城市发展预测方法及装置
CN116150429A (zh) 异常对象识别方法、装置、计算设备以及存储介质
Chen et al. FedLGAN: a method for anomaly detection and repair of hydrological telemetry data based on federated learning
Su et al. Anomalous social network event detection based on Higher-order networks
Yean et al. GAN+: Data Augmentation Method using Generative Adversarial Networks and Dirichlet for Indoor

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant