CN113822313A - 图节点异常检测方法及装置 - Google Patents
图节点异常检测方法及装置 Download PDFInfo
- Publication number
- CN113822313A CN113822313A CN202110433543.2A CN202110433543A CN113822313A CN 113822313 A CN113822313 A CN 113822313A CN 202110433543 A CN202110433543 A CN 202110433543A CN 113822313 A CN113822313 A CN 113822313A
- Authority
- CN
- China
- Prior art keywords
- node
- map
- graph
- detected
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000001514 detection method Methods 0.000 claims abstract description 89
- 230000002159 abnormal effect Effects 0.000 claims abstract description 81
- 238000010586 diagram Methods 0.000 claims abstract description 68
- 238000012549 training Methods 0.000 claims description 82
- 239000011159 matrix material Substances 0.000 claims description 50
- 230000008569 process Effects 0.000 claims description 45
- 230000005856 abnormality Effects 0.000 claims description 38
- 230000006870 function Effects 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000010801 machine learning Methods 0.000 claims description 7
- 238000004891 communication Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2433—Single-class perspective, e.g. one-against-all classification; Novelty detection; Outlier detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了一种图节点异常检测方法及装置。方法的一具体实施方式包括:获取待检测图;将待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值,其中,异常值根据待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,目标图由异常检测模型中的生成网络参照待检测图生成;根据待检测图中的每个节点的异常值,确定待检测图中的异常节点。本申请提供了一种基于生成对抗网络的图节点异常检测方法,提高了节点异常检测的准确度。
Description
技术领域
本申请实施例涉及计算机技术领域,具体涉及一种图节点异常检测方法及装置。
背景技术
图节点异常检测是识别图中存在异常的节点。节点的异常包括两方面:一是节点特征异常,即节点特征与图中其他大部分节点特征差异大;二是结构异常,在图论中一个常见的假设是相连接两个节点的节点特征存在相似性,结构异常表现为两个相连节点的特征差异大。传统异常图节点检测算法只侧重识别节点特征或结构单方面的异常,基于神经网络的深度异常检测算法可同时考虑节点特征异常和结构异常两方面的异常。
发明内容
本申请实施例提出了一种图节点异常检测方法及装置。
第一方面,本申请实施例提供了一种图节点异常检测方法,包括:获取待检测图;将待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值,其中,异常值根据待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,目标图由异常检测模型中的生成网络参照待检测图生成;根据待检测图中的每个节点的异常值,确定待检测图中的异常节点。
在一些实施例中,上述将待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值,包括:通过生成网络生成目标图,并通过编码器分别生成对应于待检测图和目标图的编码矩阵;根据待检测图和目标图各自对应的编码矩阵,确定待检测图和目标图各自对应的邻接矩阵;确定待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及根据待检测图和目标图各自对应的邻接矩阵,确定待检测图和目标图中相对应的节点之间关于结构特征的第二误差;对于待检测图中的每个节点,根据该节点对应的第一误差和第二误差,确定该节点的差异值。
在一些实施例中,上述确定待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及根据待检测图和目标图各自对应的邻接矩阵,确定待检测图和目标图中相对应的节点之间关于结构特征的第二误差,包括:对于待检测图中的每个节点,执行如下操作:将该节点的特征向量与目标图中对应于该节点的节点的特征向量之间的差值的L2范数,确定为该节点对应的第一误差;根据待检测图对应的邻接矩阵中,表征该节点与关联节点之间的连接边的存在概率的结构特征,以及目标图对应的邻接矩阵中,表征对应于该节点的节点与关联节点之间的连接边的存在概率的结构特征,确定该节点对应的第二误差。
在一些实施例中,生成网络和编码器均包括多层感知机或神经网络。
在一些实施例中,异常检测模型通过如下方式训练得到:获取训练样本集,其中,训练样本集中的训练样本包括样本图;利用机器学习方法,初始异常检测模型中的初始生成网络以训练样本集中的样本图为期望输出,生成训练过程目标图,基于编码器得到的样本图和训练过程目标图各自对应的编码矩阵,得到样本图和训练过程目标图各自对应的邻接矩阵,将样本图和训练过程目标图各自对应的邻接矩阵作为初始判别网络的输入,通过初始判别网络识别所输入的邻接矩阵对应于样本图还是训练过程目标图,对初始异常检测模型进行训练,得到异常检测模型,其中,在模型训练过程中,采用表征最大化判别网络的判别能力的前提下,最小化判别网络对生成网络的判别能力的目标函数。
第二方面,本申请实施例提供了一种图节点异常检测装置,包括:获取单元,被配置成获取待检测图;第一确定单元,被配置成将待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值,其中,异常值根据待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,目标图由异常检测模型中的生成网络参照待检测图生成;第二确定单元,被配置成根据待检测图中的每个节点的异常值,确定待检测图中的异常节点。
在一些实施例中,第一确定单元,进一步被配置成:通过生成网络生成目标图,并通过编码器分别生成对应于待检测图和目标图的编码矩阵;根据待检测图和目标图各自对应的编码矩阵,确定待检测图和目标图各自对应的邻接矩阵;确定待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及根据待检测图和目标图各自对应的邻接矩阵,确定待检测图和目标图中相对应的节点之间关于结构特征的第二误差;对于待检测图中的每个节点,根据该节点对应的第一误差和第二误差,确定该节点的差异值。
在一些实施例中,第一确定单元,进一步被配置成:对于待检测图中的每个节点,执行如下操作:将该节点的特征向量与目标图中对应于该节点的节点的特征向量之间的差值的L2范数,确定为该节点对应的第一误差;根据待检测图对应的邻接矩阵中,表征该节点与关联节点之间的连接边的存在概率的结构特征,以及目标图对应的邻接矩阵中,表征对应于该节点的节点与关联节点之间的连接边的存在概率的结构特征,确定该节点对应的第二误差。
在一些实施例中,生成网络和编码器均包括多层感知机或神经网络。
在一些实施例中,上述装置还包括:训练单元,被配置成通过如下方式训练得到异常检测模型:获取训练样本集,其中,训练样本集中的训练样本包括样本图;利用机器学习方法,初始异常检测模型中的初始生成网络以训练样本集中的样本图为期望输出,生成训练过程目标图,基于编码器得到的样本图和训练过程目标图各自对应的编码矩阵,得到样本图和训练过程目标图各自对应的邻接矩阵,将样本图和训练过程目标图各自对应的邻接矩阵作为初始判别网络的输入,通过初始判别网络识别所输入的邻接矩阵对应于样本图还是训练过程目标图,对初始异常检测模型进行训练,得到异常检测模型,其中,在模型训练过程中,采用表征最大化判别网络的判别能力的前提下,最小化判别网络对生成网络的判别能力的目标函数。
第三方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面任一实现方式描述的方法。
第四方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面任一实现方式描述的方法。
本申请实施例提供的图节点异常检测方法及装置,通过获取待检测图;将待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值,其中,异常值根据待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,目标图由异常检测模型中的生成网络参照待检测图生成;根据待检测图中的每个节点的异常值,确定待检测图中的异常节点,从而提供了一种基于生成对抗网络的图节点异常检测方法,提高了节点异常检测的准确度。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请的一个实施例可以应用于其中的示例性***架构图;
图2是根据本申请图节点异常检测方法的一个实施例的流程图;
图3是根据本实施例的图节点异常检测方法的应用场景的示意图;
图4是根据本申请的图节点异常检测方法的又一个实施例的流程图;
图5是根据本申请的图节点异常检测装置的一个实施例的结构图;
图6是适于用来实现本申请实施例的计算机***的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的图节点异常检测方法及装置的示例性架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。终端设备101、102、103之间通信连接构成拓扑网络,网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
终端设备101、102、103可以是支持网络连接从而进行数据交互和数据处理的硬件设备或软件。当终端设备101、102、103为硬件时,其可以是支持网络连接,信息获取、交互、显示、处理等功能的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供各种服务的服务器,例如获取用户通过终端设备101、102、103发送的待检测图,通过基于生成对抗网络所得到的异常检测模型进行图节点异常检测的后台处理服务器。可选的,服务器可以将待检测图的检测结果反馈至终端设备。作为示例,服务器105可以是云端服务器。
需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
还需要说明的是,本申请的实施例所提供的图节点异常检测方法可以由服务器执行,也可以由终端设备执行,还可以由服务器和终端设备彼此配合执行。相应地,图节点异常检测装置包括的各个部分(例如各个单元)可以全部设置于服务器中,也可以全部设置于终端设备中,还可以分别设置于服务器和终端设备中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。当图节点异常检测方法运行于其上的电子设备不需要与其他电子设备进行数据传输时,该***架构可以仅包括图节点异常检测方法运行于其上的电子设备(例如服务器或终端设备)。
继续参考图2,示出了图节点异常检测方法的一个实施例的流程200,包括以下步骤:
步骤201,获取待检测图。
本实施例中,图节点异常检测方法的执行主体(例如图1中的服务器)可以通过有有线网络连接方式或无线网络连接方式从远程,或从本地获取待检测图。
本实施例中,待检测图可以是包括任意信息的、由节点及节点之间的连接关系构成的图。作为示例,在金融领域,待检测图可以是以用户的银行账号为节点,以不同的银行账号之间的交互信息为连接关系的图。作为又一示例,在社交领域,待检测图可以是以用户的社交账号为节点,以不同的社交账号之间的交互信息为连接关系的图。
在本实施例的一些可选的实现方式中,上述执行主体可以根据所获取的原始数据进行数据分析,生成待检测图。作为示例,在金融领域,上述执行主体可以将原始数据中的银行账号作为节点,确定不同的银行账户之间的转账等交易信息,进而确定不同的节点之间的连接边,生成待检测图。
步骤202,将待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值。
本实施例中,上述执行主体可以将待检测图输入预先训练的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值。其中,异常检测模型表征待检测图与待检测图中每个节点的异常值之间的对应关系,基于生成对抗网络训练得到。异常值根据待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,目标图由异常检测模型中的生成网络参照待检测图生成。相对应的两个节点表征分别属于待检测图与目标图、且表征相同的节点信息的节点。
作为示例,第一误差可以是通过待检测图与目标图中相对应的节点的节点特征之间的距离所表征的重建误差。例如,待检测图中的节点A与目标图中的节点A′相对应,则将节点A的节点特征与节点A′的节点特征之间的距离,确定为第一误差。
同一图中的节点之间结构特征一般表现为节点之间的是否存在连接边,以及存在连接边的可能性。当节点之间存在连接边时,可以认定两个节点互为关联节点。可以理解,一个节点可能不存在关联节点,或存在一个关联节点,或存在多个关联节点。
继续以待检测图中的节点A与目标图中的节点A′相对应为例,待检测图中的节点A的关联节点包括B、C,节点A′的关联节点包括B′、C′,则将节点A和节点B之间的结构特征,与节点A′和节点B′之间的结构特征之间的误差,以及节点A和节点C之间的结构特征,与节点A′和节点C′之间的结构特征之间的误差,确定为第二误差。
本实施例中,异常检测模型可以通过如下方式得到:获取训练样本集,其中,训练样本集中的训练样本包括样本图;利用机器学习方法,初始异常检测模型中的初始生成网络以训练样本集中的样本图为期望输出,生成训练过程目标图,将样本图和训练过程目标图作为初始判别网络的输入,通过初始判别网络识别所输入的图是样本图还是训练过程目标图,对初始异常检测模型进行训练,得到异常检测模型。其中,在模型训练过程中,采用表征最大化判别网络的判别能力的前提下,最小化判别网络对生成网络的判别能力的目标函数。
在本实施例的一些可选的实现方式中,异常检测模型包括生成网络、编码器和判别网络。上述执行主体可以通过如下方式执行上述步骤202:
第一,通过生成网络生成目标图,并通过编码器分别生成对应于待检测图和目标图的编码矩阵。
本实现方式中,首先,上述执行主体可以参照待检测图像,生成目标图。其中,目标图与待检测图具有很高的相似性。然后,将待检测图和目标图依次输入编码器,得到待检测图和目标图各自对应的编码矩阵。
第二,根据待检测图和目标图各自对应的编码矩阵,确定待检测图和目标图各自对应的邻接矩阵。
本实现方式中,上述执行主体可以根据待检测图的编码矩阵和编码矩阵的转置矩阵,确定待检测图对应的邻接矩阵;根据目标图的编码矩阵和编码矩阵的转置矩阵,确定目标图对应的邻接矩阵。
具体的,上述执行主体可以通过如下公式确定邻接矩阵:
A=sigmod(ZZT)
其中,A表示邻接矩阵,Z表示编码矩阵,ZT表示编码矩阵的转置矩阵。
邻接矩阵第i行第j列的值Aij表示节点i和节点j之间存在连接边的概率。通过邻接矩阵,可以表征图中的节点之间的结构特征。
第三,确定待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及根据待检测图和目标图各自对应的邻接矩阵,确定待检测图和目标图中相对应的节点之间关于结构特征的第二误差。
本实现方式中,针对于待检测图中的每个节点,将待检测图中的该节点的节点特征与目标图中对应于该节点的节点特征之间的距离,确定为第一误差;并从待检测图对应的邻接矩阵中确定该节点对应的结构特征,以及从目标图对应的邻接矩阵中确定对应于该节点的节点对应的结构特征,进而基于两者的结构特征,确定第二误差。
第四,对于待检测图中的每个节点,根据该节点对应的第一误差和第二误差,确定该节点的差异值。
本实现方式中,可以将第一误差和第二误差进行加权计算,得到差异值。具体的,可以通过如下公式,确定差异值:
score(vi)=αLG(vi)+(1-α)LD(vi)
其中,score(vi)表示节点vi的差异值,α表示节点vi的第一误差LG(vi)的权重,LD(vi)表示节点vi的第二误差。
在本实施例的一些可选的实现方式中,上述执行主体可以通过如下方式执行上述第三步骤:
对于待检测图中的每个节点,执行如下操作:
首先,将该节点的特征向量与目标图中对应于该节点的节点的特征向量之间的差值的L2范数,确定为该节点对应的第一误差。
具体的,可以通过如下方式确定第一误差:
LG(vi)=||xi-x′i||2
其中,xi表示待检测图中一节点的节点特征,x′i表示目标图中对应的节点的节点特征。
然后,根据待检测图对应的邻接矩阵中,表征该节点与关联节点之间的连接边的存在概率的结构特征,以及目标图对应的邻接矩阵中,表征对应于该节点的节点与关联节点之间的连接边的存在概率的结构特征,确定该节点对应的第二误差。
具体的,可以通过如下方式确定第二误差:
其中,Aij表示目标图中的节点与关联节点之间的结构特征,A′ij表示待检测图中的节点与关联节点之间的结构特征,n表示节点vi的关联节点的数量,σ表示sigmod函数。
在本实施例的一些可选的实现方式中,生成网络和编码器均包括多层感知机或神经网络。
作为示例,当生成网络和编码器均为多层感知机时,感知机的层数可以根据实际情况具体设置。例如,感知机的层数可以是3层。感知机可以通过如下公式表示:
Hi+1=f(WiHi+bi)
其中,Wi、Hi、bi分别表示第i层感知机的权重、输入、偏置,f表示激活函数,例如是relu激活函数,Hi+1表示第i层感知机的输出,也即是第i+1层感知机的输入。
作为又一示例,生成网络和编码器均为多个堆叠的神经网络,例如卷积神经网络、残差神经网络等。
步骤203,根据待检测图中的每个节点的异常值,确定待检测图中的异常节点。
本实施例中,上述执行主体可以根据待检测图中的每个节点的异常值,确定待检测图中的异常节点
作为示例,上述执行主体可以预先设置异常阈值,当节点的异常值超过异常阈值时,判定该节点为异常节点。其中,异常阈值可以基于经验值或实际情况具体设置,在此不作限定。
继续参见图3,图3是根据本实施例的图节点异常检测方法的应用场景的一个示意图300。在图3的应用场景中,首先,服务器获取待检测图301。然后,将待检测图301输入预先训练的、基于生成对抗网络的异常检测模型302,确定表征待检测图301中的每个节点的异常程度的异常值。其中,异常值根据待检测图301与目标图303中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,目标图303由异常检测模型中的生成网络3021参照待检测图301生成。最后,根据待检测图301中的每个节点的异常值,确定待检测图301中的异常节点。
本申请的上述实施例提供的方法,通过获取待检测图;将待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值,其中,异常值根据待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,目标图由异常检测模型中的生成网络参照待检测图生成;根据待检测图中的每个节点的异常值,确定待检测图中的异常节点,从而提供了一种基于生成对抗网络的图节点异常检测方式,提高了节点异常检测的准确度。
在本实施例的一些可选的实现方式中,上述执行主体可以通过如下方式训练得到异常检测模型:
第一、获取训练样本集。
其中,训练样本集中的训练样本包括样本图。
第二,利用机器学习方法,初始异常检测模型中的初始生成网络以训练样本集中的样本图为期望输出,生成训练过程目标图,基于编码器得到的样本图和训练过程目标图各自对应的编码矩阵,得到样本图和训练过程目标图各自对应的邻接矩阵,将样本图和训练过程目标图各自对应的邻接矩阵作为初始判别网络的输入,通过初始判别网络识别所输入的邻接矩阵对应于样本图还是训练过程目标图,对初始异常检测模型进行训练,得到异常检测模型。
其中,在模型训练过程中,采用表征最大化判别网络的判别能力的前提下,最小化判别网络对生成网络的判别能力的目标函数。
具体的,目标函数如下:
其中,D、E、G分别表示判别网络、编码器、生成网络,表示输入的图为真实的样本图,表示样本图对应的邻接矩阵Z来自编码器E的编码表示E(x),表示输入的图为生成网络G所生成的训练过程目标图,表示训练过程目标图对应的邻接矩阵Z′来自编码器E的编码表示E(x′),表示最大化判别网络的判别能力的前提下,最小化判别网络对生成网络的判别能力。
在模型的训练过程中,可以对生成网络和判别网络进行交替训练。具体的,在每轮次的训练中,先优化生成网络G,然后优化判别网络D。例如,将优化生成网络G和优化判别网络D视作两个优化问题,把上述目标公式拆解为下面两个公式:
在优化生成网络G时,采用:
在优化判别网络D时,采用:
继续参考图4,示出了根据本申请的图节点异常检测方法的一个实施例的示意性流程400,包括以下步骤:
步骤401,获取待检测图。
步骤402,通过生成网络生成目标图,并通过编码器分别生成对应于待检测图和目标图的编码矩阵。
步骤403,根据待检测图和目标图各自对应的编码矩阵,确定待检测图和目标图各自对应的邻接矩阵。
步骤404,确定待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及根据待检测图和目标图各自对应的邻接矩阵,确定待检测图和目标图中相对应的节点之间关于结构特征的第二误差。
步骤405,对于待检测图中的每个节点,根据该节点对应的第一误差和第二误差,确定该节点的差异值。
步骤406,根据待检测图中的每个节点的异常值,确定待检测图中的异常节点。
从本实施例中可以看出,与图2对应的实施例相比,本实施例中的图节点异常检测方法的流程400具体说明了异常检测模型的信息处理过程,进一步提高了节点异常检测的准确度。
继续参考图5,作为对上述各图所示方法的实现,本申请提供了一种图节点异常检测装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,图节点异常检测装置包括:获取单元501,被配置成获取待检测图;第一确定单元502,被配置成将待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值,其中,异常值根据待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,目标图由异常检测模型中的生成网络参照待检测图生成;第二确定单元503,被配置成根据待检测图中的每个节点的异常值,确定待检测图中的异常节点。
在一些实施例中,第一确定单元502,进一步被配置成:通过生成网络生成目标图,并通过编码器分别生成对应于待检测图和目标图的编码矩阵;根据待检测图和目标图各自对应的编码矩阵,确定待检测图和目标图各自对应的邻接矩阵;确定待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及根据待检测图和目标图各自对应的邻接矩阵,确定待检测图和目标图中相对应的节点之间关于结构特征的第二误差;对于待检测图中的每个节点,根据该节点对应的第一误差和第二误差,确定该节点的差异值。
在一些实施例中,第一确定单元502,进一步被配置成:对于待检测图中的每个节点,执行如下操作:将该节点的特征向量与目标图中对应于该节点的节点的特征向量之间的差值的L2范数,确定为该节点对应的第一误差;根据待检测图对应的邻接矩阵中,表征该节点与关联节点之间的连接边的存在概率的结构特征,以及目标图对应的邻接矩阵中,表征对应于该节点的节点与关联节点之间的连接边的存在概率的结构特征,确定该节点对应的第二误差。
在一些实施例中,生成网络和编码器均包括多层感知机或神经网络。
在一些实施例中,上述装置还包括:训练单元(图中未示出),被配置成通过如下方式训练得到异常检测模型:获取训练样本集,其中,训练样本集中的训练样本包括样本图;利用机器学习方法,初始异常检测模型中的初始生成网络以训练样本集中的样本图为期望输出,生成训练过程目标图,基于编码器得到的样本图和训练过程目标图各自对应的编码矩阵,得到样本图和训练过程目标图各自对应的邻接矩阵,将样本图和训练过程目标图各自对应的邻接矩阵作为初始判别网络的输入,通过初始判别网络识别所输入的邻接矩阵对应于样本图还是训练过程目标图,对初始异常检测模型进行训练,得到异常检测模型,其中,在模型训练过程中,采用表征最大化判别网络的判别能力的前提下,最小化判别网络对生成网络的判别能力的目标函数。
本实施例中,图节点异常检测装置中的获取单元获取待检测图;第一确定单元将待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值,其中,异常值根据待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,目标图由异常检测模型中的生成网络参照待检测图生成;第二确定单元根据待检测图中的每个节点的异常值,确定待检测图中的异常节点,从而提供了一种基于生成对抗网络的图节点异常检测装置,提高了节点异常检测的准确度。
下面参考图6,其示出了适于用来实现本申请实施例的设备(例如图1所示的设备101、102、103、105)的计算机***600的结构示意图。图6示出的设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机***600包括处理器(例如CPU,中央处理器)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有***600操作所需的各种程序和数据。处理器601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本申请的方法中限定的上述功能。
需要说明的是,本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,程序设计语言包括面向目标的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在客户计算机上执行、部分地在客户计算机上执行、作为一个独立的软件包执行、部分在客户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到客户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器,包括获取单元、第一确定单元和第二确定单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一确定单元还可以被描述为“将待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值的单元”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该装置执行时,使得该计算机设备:获取待检测图;将待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征待检测图中的每个节点的异常程度的异常值,其中,异常值根据待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,目标图由异常检测模型中的生成网络参照待检测图生成;根据待检测图中的每个节点的异常值,确定待检测图中的异常节点。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (12)
1.一种图节点异常检测方法,包括:
获取待检测图;
将所述待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征所述待检测图中的每个节点的异常程度的异常值,其中,所述异常值根据所述待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,所述目标图由所述异常检测模型中的生成网络参照所述待检测图生成;
根据所述待检测图中的每个节点的异常值,确定所述待检测图中的异常节点。
2.根据权利要求1所述的方法,其中,所述将所述待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征所述待检测图中的每个节点的异常程度的异常值,包括:
通过所述生成网络生成所述目标图,并通过编码器分别生成对应于所述待检测图和所述目标图的编码矩阵;
根据所述待检测图和所述目标图各自对应的编码矩阵,确定所述待检测图和所述目标图各自对应的邻接矩阵;
确定所述待检测图与所述目标图中相对应的节点之间关于节点特征的第一误差,以及根据所述待检测图和所述目标图各自对应的邻接矩阵,确定所述待检测图和所述目标图中相对应的节点之间关于结构特征的第二误差;
对于所述待检测图中的每个节点,根据该节点对应的第一误差和第二误差,确定该节点的差异值。
3.根据权利要求2所述的方法,其中,所述确定所述待检测图与所述目标图中相对应的节点之间关于节点特征的第一误差,以及根据所述待检测图和所述目标图各自对应的邻接矩阵,确定所述待检测图和所述目标图中相对应的节点之间关于结构特征的第二误差,包括:
对于所述待检测图中的每个节点,执行如下操作:
将该节点的特征向量与所述目标图中对应于该节点的节点的特征向量之间的差值的L2范数,确定为该节点对应的第一误差;
根据所述待检测图对应的邻接矩阵中,表征该节点与关联节点之间的连接边的存在概率的结构特征,以及所述目标图对应的邻接矩阵中,表征对应于该节点的节点与关联节点之间的连接边的存在概率的结构特征,确定该节点对应的第二误差。
4.根据权利要求2所述的方法,其中,所述生成网络和所述编码器均包括多层感知机或神经网络。
5.根据权利要求2所述的方法,其中,所述异常检测模型通过如下方式训练得到:
获取训练样本集,其中,所述训练样本集中的训练样本包括样本图;
利用机器学习方法,初始异常检测模型中的初始生成网络以所述训练样本集中的样本图为期望输出,生成训练过程目标图,基于编码器得到的所述样本图和所述训练过程目标图各自对应的编码矩阵,得到所述样本图和所述训练过程目标图各自对应的邻接矩阵,将所述样本图和所述训练过程目标图各自对应的邻接矩阵作为初始判别网络的输入,通过所述初始判别网络识别所输入的邻接矩阵对应于所述样本图还是所述训练过程目标图,对所述初始异常检测模型进行训练,得到所述异常检测模型,其中,在模型训练过程中,采用表征最大化判别网络的判别能力的前提下,最小化判别网络对生成网络的判别能力的目标函数。
6.一种图节点异常检测装置,包括:
获取单元,被配置成获取待检测图;
第一确定单元,被配置成将所述待检测图输入预先训练的、基于生成对抗网络的异常检测模型,确定表征所述待检测图中的每个节点的异常程度的异常值,其中,所述异常值根据所述待检测图与目标图中相对应的节点之间关于节点特征的第一误差,以及相对应的节点之间关于结构特征的第二误差确定,所述目标图由所述异常检测模型中的生成网络参照所述待检测图生成;
第二确定单元,被配置成根据所述待检测图中的每个节点的异常值,确定所述待检测图中的异常节点。
7.根据权利要求6所述的装置,其中,所述第一确定单元,进一步被配置成:
通过所述生成网络生成所述目标图,并通过编码器分别生成对应于所述待检测图和所述目标图的编码矩阵;根据所述待检测图和所述目标图各自对应的编码矩阵,确定所述待检测图和所述目标图各自对应的邻接矩阵;确定所述待检测图与所述目标图中相对应的节点之间关于节点特征的第一误差,以及根据所述待检测图和所述目标图各自对应的邻接矩阵,确定所述待检测图和所述目标图中相对应的节点之间关于结构特征的第二误差;对于所述待检测图中的每个节点,根据该节点对应的第一误差和第二误差,确定该节点的差异值。
8.根据权利要求7所述的装置,其中,所述第一确定单元,进一步被配置成:
对于所述待检测图中的每个节点,执行如下操作:将该节点的特征向量与所述目标图中对应于该节点的节点的特征向量之间的差值的L2范数,确定为该节点对应的第一误差;根据所述待检测图对应的邻接矩阵中,表征该节点与关联节点之间的连接边的存在概率的结构特征,以及所述目标图对应的邻接矩阵中,表征对应于该节点的节点与关联节点之间的连接边的存在概率的结构特征,确定该节点对应的第二误差。
9.根据权利要求7所述的装置,其中,所述生成网络和所述编码器均包括多层感知机或神经网络。
10.根据权利要求7所述的装置,其中,还包括:训练单元,被配置成通过如下方式训练得到所述异常检测模型:
获取训练样本集,其中,所述训练样本集中的训练样本包括样本图;利用机器学习方法,初始异常检测模型中的初始生成网络以所述训练样本集中的样本图为期望输出,生成训练过程目标图,基于编码器得到的所述样本图和所述训练过程目标图各自对应的编码矩阵,得到所述样本图和所述训练过程目标图各自对应的邻接矩阵,将所述样本图和所述训练过程目标图各自对应的邻接矩阵作为初始判别网络的输入,通过所述初始判别网络识别所输入的邻接矩阵对应于所述样本图还是所述训练过程目标图,对所述初始异常检测模型进行训练,得到所述异常检测模型,其中,在模型训练过程中,采用表征最大化判别网络的判别能力的前提下,最小化判别网络对生成网络的判别能力的目标函数。
11.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
12.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110433543.2A CN113822313A (zh) | 2021-04-20 | 2021-04-20 | 图节点异常检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110433543.2A CN113822313A (zh) | 2021-04-20 | 2021-04-20 | 图节点异常检测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113822313A true CN113822313A (zh) | 2021-12-21 |
Family
ID=78923759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110433543.2A Pending CN113822313A (zh) | 2021-04-20 | 2021-04-20 | 图节点异常检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113822313A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114363212A (zh) * | 2021-12-27 | 2022-04-15 | 绿盟科技集团股份有限公司 | 一种设备检测方法、装置、设备和存储介质 |
-
2021
- 2021-04-20 CN CN202110433543.2A patent/CN113822313A/zh active Pending
Non-Patent Citations (2)
Title |
---|
ZHENXING CHEN ETAL: "Generative Adversarial Atributed Network Anomaly Detection", CIKM \'20, pages 1989 - 1992 * |
李从钊 等: "无人机图像去云技术", 31 December 2020, 国防工业出版社, pages: 33 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114363212A (zh) * | 2021-12-27 | 2022-04-15 | 绿盟科技集团股份有限公司 | 一种设备检测方法、装置、设备和存储介质 |
CN114363212B (zh) * | 2021-12-27 | 2023-12-26 | 绿盟科技集团股份有限公司 | 一种设备检测方法、装置、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11227187B1 (en) | Generating artificial intelligence solutions using raw data and simulated data | |
EP3819790A2 (en) | Method and apparatus for visual question answering, computer device and medium | |
CN108197652B (zh) | 用于生成信息的方法和装置 | |
CN107330731B (zh) | 一种识别广告位点击异常的方法和装置 | |
EP3859560A2 (en) | Method and apparatus for visual question answering, computer device and medium | |
CN111046027B (zh) | 时间序列数据的缺失值填充方法和装置 | |
US20200110965A1 (en) | Method and apparatus for generating vehicle damage information | |
CN110659723B (zh) | 基于人工智能的数据处理方法、装置、介质及电子设备 | |
EP4006909B1 (en) | Method, apparatus and device for quality control and storage medium | |
WO2023015935A1 (zh) | 一种体检项目推荐方法、装置、设备及介质 | |
CN109766418B (zh) | 用于输出信息的方法和装置 | |
US20210312288A1 (en) | Method for training classification model, classification method, apparatus and device | |
CN113837151B (zh) | 表格图像处理方法、装置、计算机设备及可读存储介质 | |
CN111222981A (zh) | 可信度确定方法、装置、设备和存储介质 | |
CN110490304B (zh) | 一种数据处理方法及设备 | |
CN115861462B (zh) | 图像生成模型的训练方法、装置、电子设备及存储介质 | |
CN112949767A (zh) | 样本图像增量、图像检测模型训练及图像检测方法 | |
CN113762454A (zh) | 轨迹异常检测方法及装置 | |
CN112966701A (zh) | 目标分类的方法和装置 | |
CN114357170A (zh) | 模型训练方法、分析方法、装置、设备及介质 | |
CN112990281A (zh) | 异常投标识别模型训练方法、异常投标识别方法及装置 | |
CN115034315A (zh) | 基于人工智能的业务处理方法、装置、计算机设备及介质 | |
CN111161238A (zh) | 图像质量评价方法及装置、电子设备、存储介质 | |
CN113822313A (zh) | 图节点异常检测方法及装置 | |
CN116155628B (zh) | 网络安全检测方法、训练方法、装置、电子设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |