CN116489038A - 网络流量的预测方法、装置、设备和介质 - Google Patents
网络流量的预测方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN116489038A CN116489038A CN202211575070.0A CN202211575070A CN116489038A CN 116489038 A CN116489038 A CN 116489038A CN 202211575070 A CN202211575070 A CN 202211575070A CN 116489038 A CN116489038 A CN 116489038A
- Authority
- CN
- China
- Prior art keywords
- network
- data
- attention
- predicted
- space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000010586 diagram Methods 0.000 claims abstract description 44
- 238000000547 structure data Methods 0.000 claims abstract description 36
- 239000011159 matrix material Substances 0.000 claims description 24
- 230000007246 mechanism Effects 0.000 claims description 23
- 238000012545 processing Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 17
- 230000002123 temporal effect Effects 0.000 claims 6
- 238000012549 training Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 12
- 238000012360 testing method Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 8
- 230000004913 activation Effects 0.000 description 7
- 238000010606 normalization Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 210000002569 neuron Anatomy 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000002759 z-score normalization Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/12—Discovery or management of network topologies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种网络流量的预测方法、装置、设备和介质。其中,该方法包括:获取待预测网络的历史流量数据;获取所述待预测网络的链路结构数据;将所述历史流量数据和所述链路结构数据输入至预先训练的基于时空图注意力网络的流量预测模型中,得到所述待预测网络的流量预测结果;其中,所述流量预测模型包括基于图注意力网络和门控线性单元预测网络流量。本发明基于模型中的图注意网络充分提取待预测网络中的空间依赖特征,基于模型中的门控线性单元充分提取待预测网络流量数据中的时序依赖特征,根据网络流量数据中的时序依赖特征和空间依赖特征能够充分挖掘待预测网络的特征信息,进而提升网络流量的预测精度。
Description
技术领域
本发明涉及网络流量的预测技术领域,尤其涉及一种网络流量的预测方法、装置、设备和介质。
背景技术
网络流量预测技术是实现网络分析和管理的重要手段之一,基于特定模型挖掘网络历史流量数据中的规律和趋势特性,为网络流量大的链路分配更高的宽带值,可有效避免网络拥塞的发生,因此对网络中各链路流量预测结果的准确性要求较高。
传统的网络流量预测模型,例如,图卷积神经网络(Graph ConvolutionalNetwork,GCN)来提取空间结构特征,而GCN无法为邻居中的不同节点分配不同的权重,限制了模型对于空间信息的捕捉能力,模型泛化能力不高,从而导致网络流量预测精度不高。
发明内容
本发明提供了一种网络流量的预测方法,以解决现有预测方法预测精度不高的问题。
根据本发明的一方面,提供了一种网络流量的预测方法,包括:
获取待预测网络的历史流量数据;其中,所述历史流量数据根据所述待预测网络中各链路的历史流量数据进行确定;
获取所述待预测网络的链路结构数据;其中,所述链路结构数据根据所述待预测网络的拓扑结构图和各链路间的连接关系进行确定;
将所述历史流量数据和所述链路结构数据输入至预先训练的基于时空图注意力网络的流量预测模型中,得到所述待预测网络的流量预测结果;其中,所述流量预测模型用于基于图注意力网络和门控线性单元预测网络流量。
根据本发明的另一方面,提供了一种网络流量的预测装置,包括:
历史流量数据确定模块,用于获取待预测网络的历史流量数据;其中,所述历史流量数据根据所述待预测网络中各链路的历史流量数据进行确定;
链路结构数据确定模块,用于获取所述待预测网络的链路结构数据;其中,所述链路结构数据根据所述待预测网络的拓扑结构图和各链路间的连接关系进行确定;
流量预测结果获取模块,用于将所述历史流量数据和所述链路结构数据输入至预先训练的基于时空图注意力网络的流量预测模型中,得到所述待预测网络的流量预测结果;其中,所述流量预测模型用于基于图注意力网络和门控线性单元预测网络流量。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的网络流量的预测方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的网络流量的预测方法。
本发明实施例的技术方案,通过待预测网络中各链路的历史流量数据确定待预测网络的历史流量数据,通过待预测网络中的拓扑结构图和各链路间的连接关系确定待预测网络的链路结构数据。将待预测网络的历史流量数据和链路结构数据输入至预先训练完成的基于时空注意力网络的流量预测模型中,输出待预测网络的流量预测结果。本技术方案通过时空注意力网络的流量预测模型对待预测网络相关的历史流量数据和链路结构数据进行预测,获取预测结果。基于模型中的图注意网络充分提取待预测网络中的空间依赖特征,基于模型中的门控线性单元充分提取待预测网络流量数据中的时序依赖特征,根据网络流量数据中的时序依赖特征和空间依赖特征能够充分挖掘待预测网络的特征信息,进而提升网络流量的预测精度。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种网络流量的预测方法的流程图;
图2是根据本发明实施例一提供的一种网络流量的预测方法的结构图;
图3是根据本发明实施例二提供的一种网络流量的预测方法的流程图;
图4是根据本发明实施例三提供的一种网络流量的预测装置的结构示意图;
图5是实现本发明实施例的网络流量的预测方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“候选”、“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供了一种网络流量的预测方法的流程图,本实施例可适用于对网络流量进行预测的情况,该方法可以由网络流量的预测装置来执行,该网络流量的预测装置可以采用硬件和/或软件的形式实现,该网络流量的预测装置可配置于具有网络流量预测能力的设备中。如图1所示,该方法包括:
S110、获取待预测网络的历史流量数据;其中,所述历史流量数据根据所述待预测网络中各链路的历史流量数据进行确定。
其中,历史流量数据可以是在过去的一段时间内,网络***中每个子网的每个链路传输的流量数据。
具体的,历史流量数据由待预测网络中用于监测各个网络链路中数据流量的设备产生,所以确定待预测网络的历史流量数据需要从检测网络链路传输数据流量的设备中抓取并生成数据集。
示例性的,待预测网络由路由器及数据链路组成,并根据网络数据记录进行数据采集,数据记录的时间范围可以是预设的一段历史时间。英国教育研究网的实验数据集UKERNA(the United Kingdom Education and Research Network),该数据集的收集方法是确定待预测网络的历史流量数据为网络***中每个对应链路在10分钟内或者不同时间间隔内的流量均值,可以根据数据集UKERNA的数据采集方法确定待预测网络的历史流量数据。
S120、获取所述待预测网络的链路结构数据;其中,所述链路结构数据根据所述待预测网络的拓扑结构图和各链路间的连接关系进行确定。
其中,链路结构数据可以是待预测网络所属的网络结构类型和各个链路的连接关系的数据。拓扑结构图可以是对网络链路结构进行表示的网络结构图。连接关系可以是网络***中各个网络链路节点的连接关系。
具体的,待预测网络的链路结构数据包括待预测网络的拓扑结构图以及各链路之间的连接关系。
S130、将所述历史流量数据和所述链路结构数据输入至预先训练的基于时空图注意力网络的流量预测模型中,得到所述待预测网络的流量预测结果;其中,所述流量预测模型用于基于图注意力网络和门控线性单元预测网络流量。
可选的,所述基于时空图注意力网络的流量预测模型包括至少两个依次连接的时空卷积块和一个输出层,所述时空卷积块包括两个时序卷积层和一个空间卷积层,所述时序卷积层包括一维卷积和门控线性单元,所述空间卷积层基于所述图注意力网络确定。所述时空卷积块中的第一时序卷积层的输出与空间卷积层的输入连接,所述空间卷积层的输出与第二时序卷积层的输入连接,所述第二时序卷积层的输出与下一个时空卷积块中的时序卷积层的输入连接。
其中,时序卷积层可以是对所给每个时间维度层面上的时序特征实施并行非线性处理的卷积操作。空间卷积层可以是依据非线性处理挖掘数据特征之间的动态空间依赖特征的卷积操作。一维卷积可以是广泛应用在文本数据特征的提取上,可以理解为只对输入数据进行一个维度方向的卷积操作。门控线性单元可以理解为能够并行处理时序数据的CNN网络架构,即利用CNN及门控机制实现了RNN的功能。图注意力网络可以是依据图神经网络处理图结构数据并由注意力机制结构进行图结构数据的分类预测的神经网络,能够基于注意力机制更好地挖掘数据中存在的空间相关特性。
其中,第一时序卷积层是相对于第二时序卷积层而言的,第一时序卷积层将时间维度层面上的时序特征进行非线性变换生成更高阶更抽象的时序特征。第二时序卷积层是依据空间卷积层的处理结果进一步执行卷积操作的网络模块。
具体的,在搭建基于时空图注意力网络的流量预测模型时,模型包括两个或两个以上的时空卷积块以及一个输出层,时空卷积块由时序卷积层和空间卷积层组成,其中,时序卷积层由一维卷积和门控线性单元组成。空间卷积层是图神经网络结合注意力机制的非线性操作单元。
本技术方案利用图注意力网络来挖掘网络结构中存在的空间依赖,利用门控线性单元来挖掘网络流量数据中的时序依赖。该方法同时考虑了网络流量数据中的时序依赖和空间依赖,能够有效提升网络流量预测的精度。
可选的,所述基于时空图注意力网络的流量预测模型的时序卷积层的执行过程,包括:根据历史流量数据确定所述时序卷积层的输入数据;将所述时序卷积层的输入数据输入至一维卷积中,得到卷积结果;将所述卷积结果输入至所述门控线性单元中,得到所述时序卷积层的输出结果。可选的,所述输出层根据全连接层进行确定,用于对所述至少两个依次连接的时空卷积块中的末尾时空卷积块输出的时空特征进行转化得到流量预测值。
其中,输出层可以是人工神经网络的最后一层神经元,用来执行模型的预测输出的模块。输出层可以根据时空卷积块输出处理结果经过神经元节点和激活函数进行非线性操作得到预测分类结果。具体的,根据待预测网络的历史流量数据,经过数据的预处理,包括:缺失值填充和标准化处理,形成适合于模型的规范化数据。将规范化的数据划分几个数据集,确定了时序卷积层的输入数据。数据输入到一维卷积层和门控线性单元组成的时序卷积层中,并输出至少两个依次连接的时序卷积层卷积的结果,卷积结果为更抽象、更高阶的时序特征。通过神经元组成的输出层对待预测网络的网络流量数据进行预测。
可选的,所述空间卷积层中包括基于所述图注意力网络中的自注意力机制,根据目标链路节点特征和目标链路节点的邻接链路节点特征确定目标链路节点的加权输出特征。
其中,邻接链路节点可以是图结构数据中与目标链路节点有连接关系的链路节点。邻接矩阵可以是由网络中的链路节点和链路节点之间的连接关系构成的二维矩阵。
具体的,构建网络拓扑结构图G=(V,E),其中,V代表网络中的链路节点,E代表链路之间的连接关系所构成的边。由网络链路和网络链路之间的关系构建邻接矩阵A。若链路节点i到链路节点j有直接连接的边,则Ai,j=1,否则Ai,j=0,因为各个链路节点之间只有有边相连和无边相连两种情况,所以邻接矩阵A中只包含两种元素0或1。将邻接矩阵输入至基于自注意力机制的空间卷积层中确定邻接链路的特征权重。由链路结构数据组成的链路节点特征由以下公式所示:
其中,N代表节点的总个数,R表示数据的维度,F代表单个链路节点所具有的特征的个数,表示第i个链路节点的链路节点特征。将链路节点特征h作为空间卷积层的其中一个输入数据,并将上述生成的邻接矩阵作为空间卷积层的一个输入数据,空间卷积层的输入还包括第一时序卷积层的输出。
作为一种可选的但不限定的实现方式,所述基于时空图注意力网络的流量预测模型的空间卷积层的执行过程,具体包括以下步骤A1-A5:
步骤A1、根据链路结构数据确定链路节点特征和邻接矩阵,并将所述链路节点特征和邻接矩阵作为所述空间卷积层的输入数据。
步骤A2、基于图注意力网络中的自注意力机制,根据目标链路节点特征和其他链路节点特征确定目标链路节点的注意力系数。
其中,注意力系数可以是设置在链路节点之间的权重。目标链路节点的注意力系数中包括目标链路节点和任一其他链路节点之间的注意力系数。
具体的,根据自注意力机制,适用于各个其他链路节点上,而完成目标链路节点与其他各链路节点之间注意力系数的映射关系,确定目标链路节点与其他链路节点之间的注意力系数,即:
上述公式中,W表示线性矩阵,线性矩阵可以在进行模型训练前进行预先定义,在模型训练过程中对线性矩阵中的参数值进行更新学习。应用线性矩阵和目标链路节点i特征和其他链路节点j特征/>将输入的链路节点特征转化为两个链路节点之间的特征关系,a()表示注意力机制的运算方式。
步骤A3、对所述目标链路节点的注意力系数进行归一化处理,得到归一化后目标链路节点的注意力系数;
归一化处理可以是使得预处理的数据被限定在一定的范围内,比如[0,1],从而消除奇异样本数据导致的不良影响。在本实施例中根据目标链路节点与邻接链路节点之间的注意力系数对目标链路节点的注意力系数进行归一化。
具体的,获取链路节点的注意力系数后,基于softmax逻辑回归函数对注意力系数进行归一化处理,得到归一化后的注意力系数aij,公式如下:
其中,LeakyRelu()代表的是激活函数,eij代表链路节点i和链路节点j之间的注意力系数,j∈Ni代表只与链路节点i邻接的链路节点进行注意力系数的归一化,Ni表示与链路节点i的邻接链路节点集合,j表示与链路节点i邻接的节点之一。exp()是以自然函数e为底对LeakyRelu(eij)的指数运算。
步骤A4、根据所述归一化后目标链路节点的注意力系数和目标链路节点的邻接链路节点特征确定目标链路节点的加权输出特征。
具体的,对每个目标链路节点i重新加权并输出更新后的链路节点特征为公式如下所示:
其中,σ()代表激活函数,W代表线性矩阵,aij表示目标链路节点i和邻接链路节点j之间的归一化注意力系数,Ni表示与目标链路节点i的邻接链路节点集合,表示第j个链路节点的链路节点特征。其中,对于激活函数的选择并不限制,可以根据实际训练准确性进行调整。
步骤A5、基于预先设置的注意力头数参数,将多头注意力机制分别产生的目标链路节点的加权输出特征进行拼接处理,得到目标链路节点的多头注意力特征,作为所述空间卷积层的输出结果。
具体的,根据设置的注意力头数值,将多头注意力机制分别产生的目标链路节点的加权输出特征作为注意力特征进行拼接,得到最终的多头注意力特征:
其中,表示目标链路节点i的多头注意力特征,Wk代表第k次使用注意力机制时训练学习得到的线性矩阵,/>代表第k次使用注意力机制中目标链路节点i与邻接链路节点j之间的归一化注意力系数,/>表示邻接链路节点j的链路节点特征,σ()代表激活函数,||代表特征拼接操作,K表示注意力头数参数,如注意力总头数。
具体的,结合以上公式获取每个链路节点的加权特征,由多头自注意力机制分别产生的链路节点特征(即上述公式更新后的节点特征)进行拼接处理,获取最终的多头注意力特征,最终的多头注意力特征作为空间卷积层的最终输出结果。
本技术方案提出利用图注意力网络来挖掘网络数据中的动态空间依赖。图注意力网络基于注意力机制对邻接链路节点特征进行加权求和,使得邻接链路节点特征的权重完全取决于节点特征,独立于图结构。图注意力网络不仅能够更有效地提取空间结构特征,而且能提高模型的泛化能力。
本发明实施例的技术方案,通过待预测网络中各链路的历史流量数据确定待预测网络的历史流量数据,通过待预测网络中的拓扑结构图和各链路间的连接关系确定待预测网络的链路结构数据。将待预测网络的历史流量数据和链路结构数据输入至预先训练完成的基于时空注意力网络的流量预测模型中,输出待预测网络的流量预测结果。基于模型中的图注意网络充分提取待预测网络中的空间依赖特征,基于模型中的门控线性单元充分提取待预测网络流量数据中的时序依赖特征,根据网络流量数据中的时序依赖特征和空间依赖特征能够充分挖掘待预测网络的特征信息,进而提升网络流量的预测精度。预测出网络中某条链路的流量可能存在过载现象时,可以在流量过载发生之前做好网络资源配置工作,有效避免网络拥塞的发生。
实施例二
图2为本发明实施例二提供的一种网络流量预测方法的流程图,本实施例是对上述实施例的具体步骤的展开。如图2所示,该方法包括:
S210、数据预处理。对待预测网络之前生成的流量数据进行缺失值填充及标准化处理,以得到适合于时空注意力网络的流量预测模型输入的规范化数据。
具体的,对待预测网络之前产生的流量数据按照以下公式进行缺失值填充处理,防止因为数据的缺失,影响时空图注意力网络的训练结果。
其中,(x,y)为待填充数据,x为待预测网络之前生成的流量数据,y代表待填充的流量数据。(x0,y0)与(x1,y1)均为链路节点已知的流量数值。经过上述处理后,计算数据的均值μ和方差σ。基于Z-score标准化方法对上述数据进行处理得到标准化数据。Z-score标准化处理的公式如下所示:
其中,x代表待预测网络之前生成的流量数据,x′代表经过标准化处理后的数据。
S220、数据集划分。将经过数据预处理后得到的数据划分为训练集和测试集。
具体的,划分数据集为训练集和测试集,训练集数据量占数据集的80%,测试集数据量占数据集的20%。基于滑动时间窗口算法得到训练数据和测试数据。设置历史时间窗口长度q,待预测时间窗口长度p,并在训练集和测试集上分别基于滑动时间窗口算法得到训练数据和测试数据。
S230、构建邻接关系矩阵。基于网络拓扑结构图及链路之间的连接关系构建邻接矩阵。
根据待预测网络拓扑结构图及链路之间的连接关系构建邻接矩阵。此方法需要构建网络拓扑结构图G=(V,E)以及网络链路和网络链路之间的关系构建邻接矩阵A。若链路i到链路j有直接连接的边,则Ai,j=1,否则Ai,j=0,因为各个链路之间只有有边相连和无边相连两种情况,所以邻接矩阵A中只包含两种元素0或1。
S240、构建基于时空注意力网络的流量预测模型。基于时空注意力网络的流量预测模型是由多个时空卷积块和一个输出层组成的混合模型。其中每个时空卷积块包含有两个时序卷积层和一个空间卷积层。输出层由全连接层构成,用于对提取的时空特征进行转化以得到最后的流量预测值。
作为一种可选择但不限定的实现方式,构建基于时空注意力网络的流量预测模型。可以包括但不限于以下步骤A1-A6:
步骤A1、定义模型的时序输入数据。假定输入时间序列的长度为T,节点(链路)个数为N,则模型的输入数据可以表示为X∈RN×T,其中代表节点(链路)i在时间t处的网络流量数值,其中i∈(1,…,N),t∈(1,…,T)。
步骤A2、定义模型的拓扑输入数据。模型的拓扑输入数据为基于步骤230构建出的邻接矩阵A。
步骤A3、设置模型构建的相关参数。设置时序卷积的卷积核维度为m,注意力总头数为K。
步骤A4、构建时空卷积块中的时序卷积层。时序卷积层由1D卷积及门控线性单元(Gated Linear Unit,GLU)组成。定义时序卷积的输入数据为其中R表示数据的维度,N代表链路节点的个数,T代表输入数据的长度,Cin代表输入数据的通道数量。定义一维卷积核/>m代表卷积核的维度,Cout代表输出数据的通道数量,该卷积核可以将输入数据映射至输出[U,V],其中U和V具有相同的尺寸。将一维卷积后得到的数据[U,V]输入门控线性单元GLU中,得到时序卷积后的结果。
步骤A5、构建时空卷积块中的空间卷积层。空间卷积层基于图注意力网络(GraphAttention Network,GAT)实现,可提取数据中的动态空间依赖特性。定义图注意力卷积层的输入数据。图注意力网络使用数据的链路节点特征h作为输入,如下所示:
其中N代表节点的个数,R表示数据的维度,F代表单个链路节点所具有的特征的个数。此外,基于步骤230构建出的邻接矩阵A也作为图注意力卷积层的空间拓扑输入数据。定义线性矩阵W与数据的链路节点特征h相乘将输入特征转化为更深层次的特征,根据注意力机制计算链路节点的注意力系数由Softmax逻辑回归函数对注意力系数进行归一化处理,得到归一化处理后的注意力系数aij,归一化处理公式如下所示:
其中LeakyReLu代表激活函数。j∈Ni代表只与链路节点i邻接的链路节点进行注意力系数的归一化,邻接链路节点关系由步骤230中的邻接矩阵定义。
设置注意力机制的注意力头数K,将多头注意力机制分别产生的特征进行拼接处理,以得到最终的多头注意力特征。
其中,Wk代表线性矩阵,σ()代表激活函数LeakyRelu(),||代表特征拼接操作。
步骤A6、时空图注意力网络的输出层由全连接层构成。将多个时空卷积块处理后的数据输入该全连接层中,用于对提取的时空特征进行转化以得到最后的流量预测值。
S250、训练模型。将得到的训练数据输入至构建好的基于时空图注意力网络的流量预测网络中,基于ADAM优化模型进行迭代训练直至模型收敛,得到训练好的基于时空图注意力网络的流量预测模型。
设置模型训练的相关参数。设置批量数据大小为b,迭代次数为e,学习率为l。基于上述设置的批量数据大小,将网络流量数据划分为若干个批次。依次将每个批次的数据送入定义好的时空图注意力网络中,计算出对应的损失函数。基于ADAM算法进行迭代优化直至模型收敛。迭代结束后得到训练好的时空图注意力网络模型,并将模型保存至本地。
S260、评估模型。将得到的训练数据输入至训练好的基于时空图注意力网络的流量预测模型中,并基于评价指标评估模型的优劣。
具体的,将标准化后的数据集分为训练数据集和测试数据集,将训练数据集中时序卷积层的输入数据输入至一维卷积中,得到卷积结果,将卷积结果输入至门控线性单元中,得到时序卷积层的输出结果,最后将经过至少两个依次连接的时序卷积层的输出结果输入至输出层,得到基于时空图注意力网络的流量预测模型,从本地加载训练好的时空图注意力网络模型。将测试数据集中的测试数据输入到训练好的模型中,得到流量预测值,并基于评价指标计算出预测效果。
本发明实施例的技术方案,通过待预测网络输入数据进行标准化处理和缺失值填充获取数据集,通过数据集划分和滑动窗口算法得到训练数据和测试数据,通过构建时空注意力网络,并且通过定义模型的时序输入数据和拓扑输入数据训练时空注意力网络生成时空注意力网络的流量预测模型。通过设置训练参数完成训练。将测试数据输入至时空注意力网络的流量预测模型中实现待预测网络的预测。本技术方案能够提高网络流量预测的准确率。
实施例三
图3为本发明实施例三提供的一种网络流量的预测装置的结构示意图。如图3所示,该装置包括:
历史流量数据确定模块310,用于获取待预测网络的历史流量数据;其中,所述历史流量数据根据所述待预测网络中各链路的历史流量数据进行确定;
链路结构数据确定模块320,用于获取所述待预测网络的链路结构数据;其中,所述链路结构数据根据所述待预测网络的拓扑结构图和各链路间的连接关系进行确定;
流量预测结果获取模块330,用于将所述历史流量数据和所述链路结构数据输入至预先训练的基于时空图注意力网络的流量预测模型中,得到所述待预测网络的流量预测结果;其中,所述流量预测模型用于基于图注意力网络和门控线性单元预测网络流量。
所述基于时空图注意力网络的流量预测模型包括至少两个依次连接的时空卷积块和一个输出层,所述时空卷积块包括两个时序卷积层和一个空间卷积层,所述时序卷积层包括一维卷积和门控线性单元,所述空间卷积层基于所述图注意力网络确定。
所述时空卷积块中的第一时序卷积层的输出与空间卷积层的输入连接,所述空间卷积层的输出与第二时序卷积层的输入连接,所述第二时序卷积层的输出与下一个时空卷积块中的时序卷积层的输入连接。
本申请实施例中,流量预测结果获取模块330,包括:
加权输出特征确定单元,所述空间卷积层包括基于所述图注意力网络中的自注意力机制,根据目标链路节点特征和目标链路节点的邻接链路节点特征确定目标链路节点的加权输出特征。
本申请实施例中,特征权重确定单元,执行过程包括:
基于所述图注意力网络中的自注意力机制,根据目标链路节点特征和其他链路节点特征确定目标链路节点的注意力系数;
对所述目标链路节点的注意力系数进行归一化处理,得到归一化后目标链路节点的注意力系数;
根据所述归一化后目标链路节点的注意力系数和目标链路节点的邻接链路节点特征确定目标链路节点的加权输出特征;
基于预先设置的注意力头数参数,将多头注意力机制分别产生的目标链路节点的加权输出特征进行拼接处理,得到目标链路节点的多头注意力特征,作为所述空间卷积层的输出结果。
本申请实施例中,流量预测结果获取模块330,包括:
时序卷积层单元,所述基于时空图注意力网络的流量预测模型的时序卷积层的执行过程如下所示:
根据历史流量数据确定所述时序卷积层的输入数据;
将所述时序卷积层的输入数据输入至一维卷积中,得到卷积结果;
将所述卷积结果输入至所述门控线性单元中,得到所述时序卷积层的输出结果。
本申请实施例中,流量预测结果获取模块330,包括:
输出层单元,所述输出层根据全连接层进行确定,用于对所述至少两个依次连接的时空卷积块中的末尾时空卷积块输出的时空特征进行转化得到流量预测值。
本发明实施例所提供的网络流量预测装置可执行本发明任意实施例所提供的网络流量的预测方法,具备执行方法相应的功能模块和有益效果。
本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定,且不违背公序良俗。
实施例四
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图5示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图5所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如方法网络流量的预测。
在一些实施例中,方法网络流量的预测可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的方法网络流量的预测的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行方法网络流量的预测。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的***和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种网络流量的预测方法,其特征在于,包括:
获取待预测网络的历史流量数据;其中,所述历史流量数据根据所述待预测网络中各链路的历史流量数据进行确定;
获取所述待预测网络的链路结构数据;其中,所述链路结构数据根据所述待预测网络的拓扑结构图和各链路间的连接关系进行确定;
将所述历史流量数据和所述链路结构数据输入至预先训练的基于时空图注意力网络的流量预测模型中,得到所述待预测网络的流量预测结果;其中,所述流量预测模型用于基于图注意力网络和门控线性单元预测网络流量。
2.根据权利要求1所述的方法,其特征在于,所述基于时空图注意力网络的流量预测模型包括至少两个依次连接的时空卷积块和一个输出层,所述时空卷积块包括两个时序卷积层和一个空间卷积层,所述时序卷积层包括一维卷积和门控线性单元,所述空间卷积层基于所述图注意力网络确定。
3.根据权利要求2所述的方法,其特征在于,所述时空卷积块中的第一时序卷积层的输出与空间卷积层的输入连接,所述空间卷积层的输出与第二时序卷积层的输入连接,所述第二时序卷积层的输出与下一个时空卷积块中的时序卷积层的输入连接。
4.根据权利要求2或3所述的方法,其特征在于,所述空间卷积层包括基于所述图注意力网络中的自注意力机制,根据目标链路节点特征和目标链路节点的邻接链路节点特征确定目标链路节点的加权输出特征。
5.根据权利要求4所述的方法,其特征在于,所述基于时空图注意力网络的流量预测模型的空间卷积层的执行过程,包括:
根据链路结构数据确定链路节点特征和邻接矩阵,并将所述链路节点特征和邻接矩阵作为所述空间卷积层的输入数据;
基于所述图注意力网络中的自注意力机制,根据目标链路节点特征和其他链路节点特征确定目标链路节点的注意力系数;
对所述目标链路节点的注意力系数进行归一化处理,得到归一化后目标链路节点的注意力系数;
根据所述归一化后目标链路节点的注意力系数和目标链路节点的邻接链路节点特征确定目标链路节点的加权输出特征;
基于预先设置的注意力头数参数,将多头注意力机制分别产生的目标链路节点的加权输出特征进行拼接处理,得到目标链路节点的多头注意力特征,作为所述空间卷积层的输出结果。
6.根据权利要求2所述的方法,其特征在于,所述基于时空图注意力网络的流量预测模型的时序卷积层的执行过程,包括:
根据历史流量数据确定所述时序卷积层的输入数据;
将所述时序卷积层的输入数据输入至一维卷积中,得到卷积结果;
将所述卷积结果输入至所述门控线性单元中,得到所述时序卷积层的输出结果。
7.根据权利要求2所述的方法,其特征在于,所述输出层根据全连接层进行确定,用于对所述至少两个依次连接的时空卷积块中的末尾时空卷积块输出的时空特征进行转化得到流量预测值。
8.一种网络流量的预测装置,其特征在于,包括:
历史流量数据确定模块,用于获取待预测网络的历史流量数据;其中,所述历史流量数据根据所述待预测网络中各链路的历史流量数据进行确定;
链路结构数据确定模块,用于获取所述待预测网络的链路结构数据;其中,所述链路结构数据根据所述待预测网络的拓扑结构图和各链路间的连接关系进行确定;
流量预测结果获取模块,用于将所述历史流量数据和所述链路结构数据输入至预先训练的基于时空图注意力网络的流量预测模型中,得到所述待预测网络的流量预测结果;其中,所述流量预测模型用于基于图注意力网络和门控线性单元预测网络流量。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的网络流量的预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的网络流量的预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211575070.0A CN116489038A (zh) | 2022-12-08 | 2022-12-08 | 网络流量的预测方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211575070.0A CN116489038A (zh) | 2022-12-08 | 2022-12-08 | 网络流量的预测方法、装置、设备和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116489038A true CN116489038A (zh) | 2023-07-25 |
Family
ID=87225610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211575070.0A Pending CN116489038A (zh) | 2022-12-08 | 2022-12-08 | 网络流量的预测方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116489038A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116743635A (zh) * | 2023-08-14 | 2023-09-12 | 北京大学深圳研究生院 | 一种网络预测与调控方法及网络调控*** |
CN117094452A (zh) * | 2023-10-20 | 2023-11-21 | 浙江天演维真网络科技股份有限公司 | 干旱状态预测方法、干旱状态预测模型的训练方法及设备 |
-
2022
- 2022-12-08 CN CN202211575070.0A patent/CN116489038A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116743635A (zh) * | 2023-08-14 | 2023-09-12 | 北京大学深圳研究生院 | 一种网络预测与调控方法及网络调控*** |
CN116743635B (zh) * | 2023-08-14 | 2023-11-07 | 北京大学深圳研究生院 | 一种网络预测与调控方法及网络调控*** |
CN117094452A (zh) * | 2023-10-20 | 2023-11-21 | 浙江天演维真网络科技股份有限公司 | 干旱状态预测方法、干旱状态预测模型的训练方法及设备 |
CN117094452B (zh) * | 2023-10-20 | 2024-02-06 | 浙江天演维真网络科技股份有限公司 | 干旱状态预测方法、干旱状态预测模型的训练方法及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107330731B (zh) | 一种识别广告位点击异常的方法和装置 | |
CN112801164A (zh) | 目标检测模型的训练方法、装置、设备及存储介质 | |
CN116489038A (zh) | 网络流量的预测方法、装置、设备和介质 | |
CN112910710B (zh) | 网络流量时空预测方法、装置、计算机设备和存储介质 | |
CN114265979A (zh) | 确定融合参数的方法、信息推荐方法和模型训练方法 | |
CN115496970A (zh) | 图像任务模型的训练方法、图像识别方法以及相关装置 | |
CN117078048A (zh) | 基于数字孪生的智慧城市资源管理方法及*** | |
CN117156442A (zh) | 基于5g网络的云数据安全保护方法及*** | |
CN114399101A (zh) | 基于tcn-bigru的燃气负荷预测方法和装置 | |
CN113541986B (zh) | 5g切片的故障预测方法、装置及计算设备 | |
CN109117352B (zh) | 服务器性能预测方法和装置 | |
CN117009903A (zh) | 一种数据异常检测方法、装置、设备及存储介质 | |
CN116821661A (zh) | 时序数据监测方法、装置、电子设备及非易失性存储介质 | |
CN116401372A (zh) | 知识图谱表示学习方法、装置、电子设备及可读存储介质 | |
CN116187310A (zh) | 一种文档级关系抽取方法、装置、设备及存储介质 | |
CN118100151A (zh) | 一种电网负荷预测方法、装置、设备及存储介质 | |
CN117592618A (zh) | 一种活跃用户预测方法、装置、服务器和存储介质 | |
CN116436828A (zh) | 网络流量预测及模型训练方法、装置、设备和存储介质 | |
CN117609766A (zh) | 一种数据监控方法、装置、设备及存储介质 | |
CN116298690A (zh) | 配电网故障位置的定位方法、装置、设备及介质 | |
CN116186411A (zh) | 基于深度推荐模型的用户行为预测模型的构建方法及装置 | |
CN117667587A (zh) | 一种异常检测方法、装置、电子设备及存储介质 | |
CN115223177A (zh) | 一种文本识别方法、装置、设备及存储介质 | |
CN118337467A (zh) | 一种基于深度学习的网络入侵检测方法、装置、设备及存储介质 | |
CN115482422A (zh) | 深度学习模型的训练方法、图像处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |