CN113283902B - 一种基于图神经网络的多通道区块链钓鱼节点检测方法 - Google Patents

一种基于图神经网络的多通道区块链钓鱼节点检测方法 Download PDF

Info

Publication number
CN113283902B
CN113283902B CN202110654086.XA CN202110654086A CN113283902B CN 113283902 B CN113283902 B CN 113283902B CN 202110654086 A CN202110654086 A CN 202110654086A CN 113283902 B CN113283902 B CN 113283902B
Authority
CN
China
Prior art keywords
transaction
node
network
blockchain
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110654086.XA
Other languages
English (en)
Other versions
CN113283902A (zh
Inventor
陈晋音
张敦杰
黄国瀚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University of Technology ZJUT
Original Assignee
Zhejiang University of Technology ZJUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University of Technology ZJUT filed Critical Zhejiang University of Technology ZJUT
Priority to CN202110654086.XA priority Critical patent/CN113283902B/zh
Publication of CN113283902A publication Critical patent/CN113283902A/zh
Application granted granted Critical
Publication of CN113283902B publication Critical patent/CN113283902B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/382Payment protocols; Details thereof insuring higher security of transaction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1416Event detection, e.g. attack signature detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1483Countermeasures against malicious traffic service impersonation, e.g. phishing, pharming or web spoofing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Computing Systems (AREA)
  • Signal Processing (AREA)
  • Evolutionary Computation (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Strategic Management (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Technology Law (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种基于图神经网络的多通道区块链钓鱼节点检测方法,包括步骤:根据区块链交易信息构建网络序列型动态整体交易网络图和动态交易模式子图;获得时间加权交易连边;学习目标节点的用户潜在特征和交易模式特征;获得组合特征输入到检测模块中获得最终检测结果;利用目标节点的真实类标与最终检测结果对检测模型进行训练,获得多通道区块链钓鱼节点检测模型。本发明的钓鱼节点检测方法,采用基于图神经网络的节点分类与节点交易模式识别双通道,可以有效提取用户节点的潜在特征与其交易模式特征,提高区块链钓鱼节点检测模型的有效性,实现对区块链钓鱼节点的检测。

Description

一种基于图神经网络的多通道区块链钓鱼节点检测方法
技术领域
本发明涉及区块链网络安全领域,具体涉及一种基于图神经网络的多通道区块链钓鱼节点检测方法。
背景技术
区块链技术起源于比特币,其最初提出的目的是为了解决电子支付中过度依赖可信第三方的问题,实现电子支付的去中心化。区块链技术是一种具有匿名性与不可篡改性分布式账本,并成功应用于金融、政治、商业等领域。随着区块链技术在金融领域中的飞速发展,加密货币的盛行也滋生了大量的网络诈骗犯罪。区块链技术虽然能确保加密货币被用户自身掌握,并提供可靠的交易行为。但在另一方面,由于其去中心化的性质,缺乏第三方机构监管的交易环境令用户陷入网络诈骗者的威胁中。一旦向诈骗者的转账行为被区块链确认,用户失去的电子货币几乎不可能再被寻回。
在众多的区块链金融诈骗中,有50%以上的可以归类为以加密货币作为钓鱼目标进行的钓鱼诈骗。(参照文献1:M.Conti,E.S.Kumar,C.Lal,and S.Ruj,“A survey onsecurity and privacy issues of bitcoin,”IEEE Commun.Surv.Tut.,vol.20,no.4,pp.3416–3452,2018.)
为了在去中心化的区块链金融***中为正常用户提供一定的保护,Wu等人(参照文献2:Wu J,Dan Lin,Zibin Zheng and Qi Yuan.Temporal WEighted MultiDiGraphEmbedding[J].2019.)研究了区块链生态***中的反网络钓鱼问题。考虑到金融交易网络中起作用的交易时间和交易额信息,他们将以太坊网络钓鱼地址的识别建模为二分类问题,为识别钓鱼节点,或预测潜在的被诈骗对象提供新的技术手段。
图数据由于其强大的表达能力,在现实生活中有着广泛的应用。图神经网络是处理图类型数据的主要方法之一,图神经网络可以巧妙地从图数据中提取特征,而这些被提取出来的特征可以完成许多图数据分析任务,如:节点分类、图分类、链路预测和社区发现等。这些图数据分析任务又被广泛应用于社交网络、推荐***、电子商务网络等实际场景,并取得了出色的性能。
区块链交易***的公开性为构建区块链交易网络提供了大量的数据基础,这也使得图神经网络成为检测区块链钓鱼诈骗的一种可能的工具。将图神经网络应用于区块链钓鱼诈骗检测的难点在于区块链交易网络往往具有复杂的交易时间与交易额信息,传统的图神经网络难以适用于具有时间信息的多链路交易网络。此外,不同图数据分析任务下的图神经网络关注到的图信息也有所区别,通过单一的节点分类模型难以全面地学习潜在钓鱼诈骗者的特征。因此,针对具有时间信息的多链路区块链交易图数据,如何利用图神经网络更全面地提取用户节点的潜在特征,以便精准识别钓鱼诈骗者有着重要的实践意义。
发明内容
本发明目的是设计一种基于图神经网络的多通道区块链钓鱼节点检测方法,利用可训练的时间重要性系数对不同交易时间段内的多链路交易进行加权求和,采用基于图神经网络的节点分类与节点交易模式识别双通道,分别对区块链动态整体交易网络图鱼节点交易模式子图进行动态节点分类与动态图分类,最终融合用户节点在不同层次的特征,提高区块链钓鱼节点检测模型的检测有效性。
为实现上述目的,本发明采用的技术方案是:
一种基于图神经网络的多通道区块链钓鱼节点检测方法,其特征在于,包括如下步骤:
根据区块链交易信息构建区块链的网络序列型动态整体交易网络图,并针对所述网络序列型动态整体交易网络图中的每个节点,构造目标节点的网络序列型动态交易模式子图;将区块链的所述网络序列型动态整体交易网络图、网络序列型动态交易模式子图和节点真实类标输入到多通道区块链钓鱼节点的检测模型中;
利用可训练的时间重要性系数,将不同网络序列中相同节点对之间的多条交易信息加权求和,作为统一网络序列中唯一的时间加权交易连边;
针对所述网络序列型动态整体交易网络图,利用所述检测模型中动态节点分类通道学习目标节点的用户潜在特征;针对所述网络序列型动态交易模式子图,利用所述检测模型中的动态图分类通道学习目标节点的交易模式特征;
利用注意力机制,为目标节点的所述用户潜在特征和交易模式特征分配不同的注意力系数,得到组合特征;将所述组合特征输入到检测模块中获得目标节点的最终检测结果;
利用目标节点的真实类标与最终检测结果对检测模型进行训练,获得最终的多通道区块链钓鱼节点检测模型。
优选地,构建区块链的网络序列型动态整体交易网络图的过程:
选择一定数量的钓鱼节点与正常节点作为初始节点,根据交易记录提取另一方账户地址作为一阶交易节点,然后分别以各一阶交易节点为中心节点,根据交易记录提取另一方账户地址作为二阶交易节点,得到总节点数为N的时间序列型动态整体交易网络图,表示为
Figure BDA0003113100370000031
其中,V(|V|=N)表示节点集合,e∈E表示链路集合,X表示每条链路对应的交易额W(e)与交易时间T(e)信息;
随后以该时间序列型动态整体交易网络图中第一笔交易与最后一笔交易的时间间隔作为总交易时长,将该时长均分为M个交易时间段,并依据划分的时间段对时间序列型动态整体交易网络图进行分片,每个交易时间段的交易信息形成一个网络分片图,每个网络分片图中的节点数与整体交易网络图的节点数相同,最终获得M个网络分片图组成的网络序列型动态整体交易网络图,表示为
Figure BDA0003113100370000041
在同一交易时间段内,节点i与节点j可能存在L条交易链路
Figure BDA0003113100370000042
优选地,构造目标节点的网络序列型动态交易模式子图的过程包括:
历遍所述时间序列型动态整体交易网络图中的每个节点,将每个节点作为中心节点,根据交易记录提取其一阶交易节点和二阶交易节点之间的交易信息,得到目标节点的时间序列型交易模式子图
Figure BDA0003113100370000043
表示为:
Figure BDA0003113100370000044
其中,Vc表示以节点vc作为目标节点构建的交易模式子图中的节点集合,Ec与Xc分别表示
Figure BDA0003113100370000045
中的交易链路集合与每条交易的信息;
随后根据所述时间序列型交易模式子图中第一笔交易与最后一笔交易的时间间隔作为总交易时长,将该时长均分为M个交易时间段,并依据划分的时间段对时间序列型交易模式子图进行分片,每个交易时间段的交易信息形成一个网络分片图,每个网络分片图中的节点数与交易模式子图的节点数相同,最终获得M个网络分片图组成网络序列型动态交易模式子图集合,表示为G={G0,G1,…,GN},其中第c个网络序列型动态交易模式子图
Figure BDA0003113100370000046
优选地,求取统一网络序列中唯一的时间交易连边的过程具体为:
对于每个交易时间段m∈[0,1,…,M]的区块链的网络序列型动态整体交易网络图
Figure BDA0003113100370000047
与目标节点的网络序列型动态交易模式子图
Figure BDA0003113100370000048
利用可训练的时间重要性系数α∈RM为不同交易时间段间的交易链路分配不同的时间系数,最终合并加权求和得到唯一的时间加权交易连边。
优选地,学习目标节点的用户潜在特征和交易模式特征的过程包括:
所述检测模型包括节点分类通道和动态图分类通道,针对不同交易时间段的整体交易网络分片图,采用基于图卷积网络(GCN)的节点分类通道学习当前时刻目标节点的用户潜在特征;针对不同交易时间段的目标节点交易模式子图,利用基于可微的分层图池化模型(Diffpool)的交易模式识别通道提取当前时刻目标节点的交易模式特征;
优选地,提取目标节点的用户潜在特征与交易模式特征后,在每个通道中分别采用相同结构的门控循环单元(GRU)学习整体交易网络与交易模式子图的时间特征,利用网络序列型动态整体交易网络图与交易模式子图对门控循环单元进行训练,采用GRU最后时刻的隐藏层输出作为最终的目标节点的用户潜在特征与目标节点交易模式特征。
优选地,获得最终检测结果的过程具体包括:
所述钓鱼节点检测方法采用以下公式对用户潜在特征与交易模式特征的注意力加权求和,得到组合特征
Figure BDA0003113100370000051
作为钓鱼节点检测模块的输入数据,获得目标节点的最终检测结果,表示为:
Figure BDA0003113100370000052
其中,
Figure BDA0003113100370000053
表示采用模型参数为ΘA的节点分类通道fA(·)对区块链动态整体交易网络图
Figure BDA0003113100370000054
提取的用户潜在特征,ZB=fB(G,ΘB)表示采用模型参数为ΘB的交易模式识别通道fB(·)对动态交易模式子图G提取的交易模式特征,γ=[γAB]为注意力系数矩阵。
优选地,在获得组合特征后,钓鱼节点检测模块采用全连接神经网络作为分类器,实现对钓鱼节点的二分类预测。
获得最终的多通道区块链钓鱼节点检测模型的过程包括:利用目标节点的真实类标与最终检测结果对所述检测模型进行训练,以区块链钓鱼检测模型的预测置信度与节点类标的交叉熵为损失函数,得到最终的以动态整体交易网络图
Figure BDA0003113100370000055
和动态交易模式子图G为输入的多通道区块链钓鱼节点检测模型
Figure BDA0003113100370000056
与现有技术相比,本发明具有以下有益效果:
本发明提供的基于图神经网络的多通道区块链钓鱼节点检测方法,利用可训练的时间重要性系数融合区块链交易网络中多条交易链路的时间与交易额信息。采用基于图神经网络的节点分类与节点交易模式识别双通道,可以有效提取用户节点的潜在特征与其交易模式特征,提高区块链钓鱼节点检测模型的有效性,实现对区块链钓鱼节点的检测。
附图说明
图1为本发明基于图神经网络的多通道区块链钓鱼节点检测方法的***框图。
图2为实施例中以太坊整体交易网络图构建过程示意图。
图3为实施例中以太坊节点交易模式子图构建过程示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。本领域技术人员在理解本发明的技术方案基础上进行修改或等同替换,而未脱离本发明技术方案的精神和范围,均应涵盖在本发明的保护范围内。
图1为本发明提供的基于图神经网络的多通道区块链钓鱼节点检测方法的***框图。实施例提供的区块链钓鱼节点检测方法包括以下步骤:
步骤1,根据区块链交易信息构建区块链的网络序列型动态整体交易网络图,并针对所述网络序列型动态整体交易网络图中的每个节点,构造目标节点的网络序列型动态交易模式子图;将区块链的所述网络序列型动态整体交易网络图、网络序列型动态交易模式子图和节点真实类标输入到多通道区块链钓鱼节点的检测模型中;
本实例从公开的以太坊数据查询网站etherscan获取以太坊交易数据。该网站中的每笔交易数据包含数十种属性,仅保留其中的交易节点(from和to),交易时间(timeStamp)和交易额(value)信息作为构建以太坊交易网络的基础。
针对构建网络序列型区块链整体交易网络图,原始以太坊的交易数据过于庞大,且钓鱼节点仅占所有用户节点的极小部分,本发明选择一定数量的钓鱼节点与正常节点作为初始节点,通过查询原始交易记录中与初始节点的交易记录,构建小规模的以太坊交易子网络进行训练。以给定的初始节点作为中心节点,根据交易记录提取另一方账户地址作为一阶交易节点。接着分别以各个一阶交易节点为中心节点,根据交易记录提取另一方账户地址作为二阶交易节点,得到总节点数为N的时间序列型的区块链动态整体交易网络图,表示为
Figure BDA0003113100370000071
其中,V(|V|=N)表示节点集合,e∈E表示链路集合,X表示每条链路对应的交易额W(e)与交易时间T(e)信息。
随后以该交易网络图中第一笔交易与最后一笔交易的时间间隔作为总交易时长,将该时长均分为M个交易时间段,并依据划分的时间段对时间序列型区块链交易网络图进行分片。每个交易时间段的交易信息形成一个网络分片图,每个网络分片图中的节点数与整体交易网络图的节点数相同。最终获得M个网络分片图组成的网络序列型区块链动态整体交易网络图,表示为
Figure BDA0003113100370000072
在同一交易时间段内,节点i与节点j可能存在L条交易链路
Figure BDA0003113100370000073
在本发明中,以数量比为1:1的钓鱼节点和等量随机选取的正常节点作为中心节点,获取一个具有时间与交易额信息的二阶网络。图2为示例性的给出的一个二阶网络的构建过程。
针对构建网络序列型区块链动态交易模式子图,本发明历遍上述时间序列型的区块链动态整体交易网络图中的每个节点,将每个节点作为中心节点,根据交易记录提取其一阶交易节点,以及各个一阶交易节点与其对应的二阶交易节点之间的交易信息,得到时间序列型的动态交易模式子图
Figure BDA0003113100370000074
Figure BDA0003113100370000075
其中,Vc表示以节点vc作为目标节点构建的交易模式子图中的节点集合,Ec与Xc分别表示
Figure BDA0003113100370000076
中的交易链路集合与每条交易的信息。随后根据构造网络序列型动态整体交易网络图的方法将时间序列型的动态交易模式子图转化为具有M网络分片图组成的网络序列型区的动态交易模式子图
Figure BDA0003113100370000081
图3为示例性的给出的一个二阶交易模式子图的构建过程。
步骤2,利用可训练的时间重要性系数,将不同网络序列中相同节点对之间的多条交易信息加权求和,作为统一网络序列中唯一的时间加权交易连边;
对于每个交易时间段m∈[0,1,…,M]的区块链动态整体交易网络图
Figure BDA0003113100370000082
与目标节点动态交易模式子图
Figure BDA0003113100370000083
利用可训练的时间重要性系数α∈RM为不同交易时间段间的交易链路分配不同的时间系数,最终合并得到唯一的时间加权交易连边:
Figure BDA0003113100370000084
Figure BDA0003113100370000085
其中αnode与αgraph分别表示用于动态整体交易网络图与目标节点动态交易模式子图的时间重要性系数。
Figure BDA0003113100370000086
表示节点i与节点j在
Figure BDA0003113100370000087
中唯一的时间加权交易连边,
Figure BDA0003113100370000088
表示节点i与节点j在
Figure BDA0003113100370000089
中唯一的时间加权交易连边。
Figure BDA00031131003700000810
Figure BDA00031131003700000811
分别表示节点i与节点j在
Figure BDA00031131003700000812
Figure BDA00031131003700000813
中的交易链路集合,W(e)与T(e)表示交易链路e的交易额与交易时间。
在对多交易链路进行加权求和后,最终获得M个网络分片图组成的网络序列型区块链动态整体交易网络图
Figure BDA00031131003700000814
与目标节点动态交易模式子图G={G0,G1,…,GN},
Figure BDA00031131003700000815
c∈[0,1…,N]。其中,Am∈RN×N表示第m个整体交易网络分片图的邻接矩阵,
Figure BDA00031131003700000816
表示目标节点vc的第m个交易模式分片子图的邻接矩阵,
Figure BDA00031131003700000817
表示Am中第i个节点与第j个节点间的时间加权交易额。
步骤3,针对所述网络序列型动态整体交易网络图,利用所述检测模型中动态节点分类通道学习目标节点的用户潜在特征;针对所述网络序列型动态交易模式子图,利用所述检测模型中的动态图分类通道学习目标节点的交易模式特征;
针对用户节点的潜在特征,如图1所示,以不同交易时间段内的整体交易网络分片图为输入,采用基于图卷积网络(GCN)的节点分类通道,通过公式(3)学习当前时刻的节点潜在特征:
Figure BDA0003113100370000091
其中,
Figure BDA0003113100370000092
为第m个网络分片中的节点潜在特征,N为网络节点个数,d为网络节点潜在特征的特征维度;f和σ分别为softmax函数和Relu函数;
Figure BDA0003113100370000093
Figure BDA0003113100370000094
是添加自连接的第m个整体交易网络分片的邻接矩阵,IN是网络的自连边矩阵,Am是网络的邻接矩阵;X表示节点属性,在本发明中,X=IN
Figure BDA0003113100370000095
Figure BDA0003113100370000096
的度值矩阵
Figure BDA0003113100370000097
对角线上的值;
Figure BDA0003113100370000098
分别为节点分类通道的输入层到隐层、隐层到输出层的权重矩阵。
针对用户节点的交易模式特征,如图1所示,以不同交易时间段内的交易模式子图分片图为输入,采用基于可微的分层图池化模型(Diffpool)的交易模式识别通道,通过公式(4)-公式(6)提取当前时刻的目标节点交易模式特征。
Figure BDA0003113100370000099
Figure BDA00031131003700000910
Figure BDA00031131003700000911
其中,
Figure BDA00031131003700000912
为目标节点vc的第m个网络分片中的交易模式特征;
Figure BDA00031131003700000913
Figure BDA00031131003700000914
是目标节点vc的添加自连接的第m个交易模式网络分片的邻接矩阵,
Figure BDA00031131003700000915
是第m个交易模式子图的邻接矩阵;
Figure BDA00031131003700000916
Figure BDA00031131003700000917
的度值矩阵
Figure BDA00031131003700000918
对角线上的值;
Figure BDA00031131003700000919
为Diffpool中第一层图卷积层的权重矩阵;
Figure BDA0003113100370000101
为Diffpool中图池化层的权重矩阵,在本发明中,n0=0.1*|Vc|,表明池化图的尺寸;
Figure BDA0003113100370000102
为Diffpool中输出图卷积层的权重矩阵。
利用上述步骤计算得到目标节点vc的第m个网络分片中的交易模式特征
Figure BDA0003113100370000103
后,将所有节点的交易模式特征拼接成最终的节点交易模式特征
Figure BDA0003113100370000104
步骤4,利用注意力机制,为目标节点的所述用户潜在特征和交易模式特征分配不同的注意力系数,得到组合特征;将所述组合特征输入到检测模块中获得目标节点的最终检测结果;
所述检测模型包括节点分类通道和动态图分类通道,针对不同交易时间段的整体交易网络分片图,采用基于图卷积网络(GCN)的节点分类通道学习当前时刻目标节点的用户潜在特征;针对不同交易时间段的目标节点交易模式子图,利用基于可微的分层图池化模型(Diffpool)的交易模式识别通道提取当前时刻目标节点的交易模式特征;
提取目标节点的用户潜在特征与交易模式特征后,在每个通道中分别采用相同结构的门控循环单元(GRU)学习整体交易网络与交易模式子图的时间特征,利用网络序列型动态整体交易网络图与交易模式子图对门控循环单元进行训练,采用GRU最后时刻的隐藏层输出作为最终的目标节点的用户潜在特征与目标节点交易模式特征。
GRU结构如公式(7)所示;
Figure BDA0003113100370000105
其中,Wz、Uz、Wr、Ur、W和U是可训练的权重,
Figure BDA0003113100370000106
表示计算中的中间量,σ是sigmoid激活函数。GRU以前一时刻的细胞状态ht-1和当前时刻的输入xt作为输入,输出当前的细胞状态ht,并作为当前时刻的输出。将GRU的每次细胞状态计算过程简化表示为公式(8):
ht=GRU(ht-1,xt)                     (8)
利用GRU学习节点潜在特征或交易模式特征的过程统一表示为:
Figure BDA0003113100370000111
其中,
Figure BDA0003113100370000112
是节点vi在第m时刻的GRU细胞状态;时,
Figure BDA0003113100370000113
Figure BDA0003113100370000114
表示第0个整体交易网络分片图的邻接矩阵的的第i行,或节点节点vi的交易模式子图的邻接矩阵。节点分类通道
Figure BDA0003113100370000115
中,GCN与GRU的参数记为ΘA;交易模式识别通道
Figure BDA0003113100370000116
中,Diffpool与GRU的参数记为ΘB。以Zi∈R1×d统一表示ZA或ZB的第i行,表明所有时刻的细胞状态的拼接向量,表示节点vi的节点潜在特征或节点交易模式特征。
步骤5,采用公式(10)对节点用户潜在特征与节点交易模式特征的注意力加权求和,得到组合特征
Figure BDA0003113100370000117
将得到组合特征作为钓鱼节点检测模块的输入数据;
Figure BDA0003113100370000118
其中,γ=[γAB]为注意力系数矩阵,
Figure BDA0003113100370000119
表示节点融合特征。
步骤6,实施例中,在获得组合特征后,钓鱼节点检测模块采用全连接神经网络作为二分类器,实现对钓鱼节点的二分类预测;利用目标节点的真实类标与最终检测结果对所述检测模型进行训练,以区块链钓鱼检测模型的预测置信度与节点类标的交叉熵为损失函数,给定输入的融合特征zi
Figure BDA00031131003700001110
神经网络分类器中的隐藏层与输出层分别为:
Figure BDA00031131003700001111
Figure BDA00031131003700001112
Figure BDA00031131003700001113
其中,M是神经网络隐藏层数量,W(m)和b(m)分别是第m层的权重和偏置,
Figure BDA0003113100370000121
是节点vi的第m层的隐藏层输出。神经网络的输出层只有一个神经元,
Figure BDA0003113100370000122
为节点vi的最终分类结果。
步骤7,分类器的参数记为ΘNN,在每轮训练中,以公式(14)作为目标函数,通过随机梯度下降法优化ΘNN,训练所述的多通道区块链钓鱼检测模型;
Figure BDA0003113100370000123
其中,Ts为带类标的区块链交易网络节点集合;F=[τ1,…,τN]表示网络节点类标集合,节点vi的类标τi∈[0,1],τi=1表示节点vi为钓鱼节点;若网络节点vl属于类τk,则Ylk=1,否则Ylk=0;
Figure BDA0003113100370000124
是由公式(13)计算出的分类置信度输出。

Claims (6)

1.一种基于图神经网络的多通道区块链钓鱼节点检测方法,其特征在于,包括如下步骤:
根据区块链交易信息构建区块链的网络序列型动态整体交易网络图,并针对所述网络序列型动态整体交易网络图中的每个节点,构造目标节点的网络序列型动态交易模式子图;将区块链的所述网络序列型动态整体交易网络图、网络序列型动态交易模式子图和节点真实类标输入到多通道区块链钓鱼节点的检测模型中;
利用可训练的时间重要性系数,将不同网络序列中相同节点对之间的多条交易信息加权求和,作为统一网络序列中唯一的时间加权交易连边;
针对所述网络序列型动态整体交易网络图,利用所述检测模型中动态节点分类通道学习目标节点的用户潜在特征;针对所述网络序列型动态交易模式子图,利用所述检测模型中的动态图分类通道学习目标节点的交易模式特征;
利用注意力机制,为目标节点的所述用户潜在特征和交易模式特征分配不同的注意力系数,得到组合特征;将所述组合特征输入到检测模块中获得目标节点的最终检测结果;
利用目标节点的真实类标与最终检测结果对检测模型进行训练,获得最终的多通道区块链钓鱼节点检测模型;
求取统一网络序列中唯一的时间交易连边的过程具体为:
对于每个交易时间段m∈[0,1,…,M]的区块链的网络序列型动态整体交易网络图
Figure FDA0004084448100000011
与目标节点的网络序列型动态交易模式子图
Figure FDA0004084448100000012
利用可训练的时间重要性系数α∈RM为不同交易时间段间的交易链路分配不同的时间系数,最终合并加权求和得到唯一的时间加权交易连边;
学习目标节点的用户潜在特征和交易模式特征的过程包括:
所述检测模型包括节点分类通道和动态图分类通道,针对不同交易时间段的整体交易网络分片图,采用基于图卷积网络的节点分类通道学习当前时刻目标节点的用户潜在特征;针对不同交易时间段的目标节点交易模式子图,利用基于可微的分层图池化模型的交易模式识别通道提取当前时刻目标节点的交易模式特征;
提取目标节点的用户潜在特征与交易模式特征后,在每个通道中分别采用相同结构的门控循环单元学习整体交易网络与交易模式子图的时间特征,利用网络序列型动态整体交易网络图与交易模式子图对门控循环单元进行训练,采用GRU最后时刻的隐藏层输出作为最终的目标节点的用户潜在特征与目标节点交易模式特征。
2.根据权利要求1所述的基于图神经网络的多通道区块链钓鱼节点检测方法,其特征在于,构建区块链的网络序列型动态整体交易网络图的过程:
选择一定数量的钓鱼节点与正常节点作为初始节点,根据交易记录提取另一方账户地址作为一阶交易节点,然后分别以各一阶交易节点为中心节点,根据交易记录提取另一方账户地址作为二阶交易节点,得到总节点数为N的时间序列型动态整体交易网络图,表示为
Figure FDA0004084448100000021
其中,V(|V|=N)表示节点集合,e∈E表示链路集合,X表示每条链路对应的交易额W(e)与交易时间T(e)信息;
随后以该时间序列型动态整体交易网络图中第一笔交易与最后一笔交易的时间间隔作为总交易时长,将该时长均分为M个交易时间段,并依据划分的时间段对时间序列型动态整体交易网络图进行分片,每个交易时间段的交易信息形成一个网络分片图,每个网络分片图中的节点数与整体交易网络图的节点数相同,最终获得M个网络分片图组成的网络序列型动态整体交易网络图,表示为
Figure FDA0004084448100000022
在同一交易时间段内,节点i与节点j可能存在L条交易链路
Figure FDA0004084448100000023
3.根据权利要求1所述的基于图神经网络的多通道区块链钓鱼节点检测方法,其特征在于,
构造目标节点的网络序列型动态交易模式子图的过程包括:
遍历时间序列型动态整体交易网络图中的每个节点,将每个节点作为中心节点,根据交易记录提取其一阶交易节点和二阶交易节点之间的交易信息,得到目标节点的时间序列型交易模式子图
Figure FDA0004084448100000031
表示为:
Figure FDA0004084448100000032
其中,Vc表示以节点vc作为目标节点构建的交易模式子图中的节点集合,Ec与Xc分别表示
Figure FDA0004084448100000033
中的交易链路集合与每条交易的信息;
随后根据所述时间序列型交易模式子图中第一笔交易与最后一笔交易的时间间隔作为总交易时长,将该时长均分为M个交易时间段,并依据划分的时间段对时间序列型交易模式子图进行分片,每个交易时间段的交易信息形成一个网络分片图,每个网络分片图中的节点数与交易模式子图的节点数相同,最终获得M个网络分片图组成的网络序列型动态交易模式子图集合,表示为G={G0,G1,…,GN},其中第c个网络序列型动态交易模式子图
Figure FDA0004084448100000034
4.根据权利要求1所述的基于图神经网络的多通道区块链钓鱼节点检测方法,其特征在于,获得最终检测结果的过程具体包括:
所述钓鱼节点检测方法采用以下公式对用户潜在特征与交易模式特征的注意力加权求和,得到组合特征
Figure FDA0004084448100000035
作为钓鱼节点检测模块的输入数据,获得目标节点的最终检测结果,表示为:
Figure FDA0004084448100000036
其中,
Figure FDA0004084448100000037
表示采用模型参数为ΘA的节点分类通道fA(·)对区块链动态整体交易网络图
Figure FDA0004084448100000038
提取的用户潜在特征,ZB=fB(G,ΘB)表示采用模型参数为ΘB的交易模式识别通道fB(·)对动态交易模式子图G提取的交易模式特征,γ=[γAB]为注意力系数矩阵。
5.根据权利要求1或4所述的基于图神经网络的多通道区块链钓鱼节点检测方法,其特征在于,在获得组合特征后,钓鱼节点检测模块采用全连接神经网络作为分类器,实现对钓鱼节点的二分类预测。
6.根据权利要求1所述的基于图神经网络的多通道区块链钓鱼节点检测方法,其特征在于,获得最终的多通道区块链钓鱼节点检测模型的过程包括:利用目标节点的真实类标与最终检测结果对所述检测模型进行训练,以区块链钓鱼检测模型的预测置信度与节点类标的交叉熵为损失函数,得到最终的以动态整体交易网络图
Figure FDA0004084448100000041
和动态交易模式子图G为输入的多通道区块链钓鱼节点检测模型
Figure FDA0004084448100000042
CN202110654086.XA 2021-06-11 2021-06-11 一种基于图神经网络的多通道区块链钓鱼节点检测方法 Active CN113283902B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110654086.XA CN113283902B (zh) 2021-06-11 2021-06-11 一种基于图神经网络的多通道区块链钓鱼节点检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110654086.XA CN113283902B (zh) 2021-06-11 2021-06-11 一种基于图神经网络的多通道区块链钓鱼节点检测方法

Publications (2)

Publication Number Publication Date
CN113283902A CN113283902A (zh) 2021-08-20
CN113283902B true CN113283902B (zh) 2023-05-09

Family

ID=77284428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110654086.XA Active CN113283902B (zh) 2021-06-11 2021-06-11 一种基于图神经网络的多通道区块链钓鱼节点检测方法

Country Status (1)

Country Link
CN (1) CN113283902B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114520739A (zh) * 2022-02-14 2022-05-20 东南大学 一种基于加密货币交易网络节点分类的钓鱼地址识别方法
CN115907770B (zh) * 2022-11-18 2023-09-29 北京理工大学 一种基于时序特征融合的以太坊钓鱼欺诈识别与预警方法
CN116527313B (zh) * 2023-03-23 2024-04-19 中国科学院信息工程研究所 一种区块链钓鱼行为检测方法及装置
CN117371540B (zh) * 2023-12-07 2024-03-15 南京信息工程大学 一种基于深度图神经网络的区块链地址身份推断方法及***

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111311416B (zh) * 2020-02-28 2024-01-23 杭州云象网络技术有限公司 一种基于多通道图和图神经网络的区块链洗钱节点检测方法
CN111447179A (zh) * 2020-03-03 2020-07-24 中山大学 一种针对以太网钓鱼诈骗的网络表示学习方法
CN112600810B (zh) * 2020-12-07 2021-10-08 中山大学 一种基于图分类的以太坊网络钓鱼诈骗检测方法及装置
CN112738034B (zh) * 2020-12-17 2022-04-29 杭州趣链科技有限公司 一种基于垂直联邦学习的区块链钓鱼节点检测方法

Also Published As

Publication number Publication date
CN113283902A (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
CN113283902B (zh) 一种基于图神经网络的多通道区块链钓鱼节点检测方法
Save et al. A novel idea for credit card fraud detection using decision tree
Liu et al. Attentive crowd flow machines
CN112738034B (zh) 一种基于垂直联邦学习的区块链钓鱼节点检测方法
Ren et al. St-siamesenet: Spatio-temporal siamese networks for human mobility signature identification
CN113283909B (zh) 一种基于深度学习的以太坊钓鱼账户检测方法
CN113269647B (zh) 基于图的交易异常关联用户检测方法
CN113111930A (zh) 一种端到端的以太坊钓鱼账户检测方法和***
CN112381179A (zh) 一种基于双层注意力机制的异质图分类方法
CN112700324A (zh) 基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法
CN116416478B (zh) 一种基于图结构数据特征的生物信息学分类模型
CN115375480A (zh) 基于图神经网络的异常虚拟币钱包地址检测方法
CN113314188B (zh) 图结构增强的小样本学习方法、***、设备及存储介质
CN113821827B (zh) 保护多方数据隐私的联合建模方法及装置
CN113538126A (zh) 基于gcn的欺诈风险预测方法及装置
Chen et al. Knowledge-inspired subdomain adaptation for cross-domain knowledge transfer
Peng et al. When urban safety index inference meets location-based data
Liu et al. Deep spatio-temporal multiple domain fusion network for urban anomalies detection
CN109871469A (zh) 基于动态图元的小簇人群识别方法
CN115965466A (zh) 一种基于子图对比的以太坊账户身份推理方法及***
CN115510948A (zh) 一种基于鲁棒图分类的区块链钓鱼检测方法
CN115438751A (zh) 一种基于图神经网络的区块链钓鱼诈骗识别的方法
CN115170334A (zh) 一种反洗钱模型的训练方法及装置
CN112183824B (zh) 一种线上线下关联的城市客流量预测方法
Xing et al. GRU‐CNN Neural Network Method for Regional Traffic Congestion Prediction Serving Traffic Diversion Demand

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant