CN116055293B - 路由器的远程故障监控方法及路由器 - Google Patents
路由器的远程故障监控方法及路由器 Download PDFInfo
- Publication number
- CN116055293B CN116055293B CN202310345735.7A CN202310345735A CN116055293B CN 116055293 B CN116055293 B CN 116055293B CN 202310345735 A CN202310345735 A CN 202310345735A CN 116055293 B CN116055293 B CN 116055293B
- Authority
- CN
- China
- Prior art keywords
- router
- log
- semantic understanding
- feature vector
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012544 monitoring process Methods 0.000 title claims abstract description 60
- 239000013598 vector Substances 0.000 claims description 330
- 238000012549 training Methods 0.000 claims description 113
- 238000013527 convolutional neural network Methods 0.000 claims description 39
- 239000011159 matrix material Substances 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 26
- 238000005457 optimization Methods 0.000 claims description 18
- 230000011218 segmentation Effects 0.000 claims description 17
- 238000010586 diagram Methods 0.000 claims description 14
- 230000000737 periodic effect Effects 0.000 claims description 14
- 238000011176 pooling Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 8
- 238000003062 neural network model Methods 0.000 claims description 8
- 238000012546 transfer Methods 0.000 claims description 5
- 230000004927 fusion Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 26
- 238000001514 detection method Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 12
- 238000013528 artificial neural network Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0631—Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/041—Abduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/16—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks using machine learning or artificial intelligence
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/60—Router architectures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请涉及智能监控领域,其具体地公开了一种路由器的远程故障监控方法及路由器,其通过采用深度学习的神经网络模型路由器的日志记录数据的文本语义特征,进一步基于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断,这样,能够实现路由器的远程故障监控,以保证网络的稳定性。
Description
技术领域
本申请涉及智能监控领域,且更为具体地,涉及一种路由器的远程故障监控方法及路由器。
背景技术
路由器作为网络的核心设备,一旦发生故障就会导致整个网络不可用。通过对路由器进行远程故障监控,可以及时发现和处理故障,提高网络的稳定性和可靠性。但是路由器的故障类型颇多,有些还不易发现,例如网络拥堵、攻击、安全漏洞等。
因此,期待一种优化的路由器的远程故障监控方案。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种路由器的远程故障监控方法及路由器,其通过采用深度学习的神经网络模型路由器的日志记录数据的文本语义特征,进一步基于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断,这样,能够实现路由器的远程故障监控,以保证网络的稳定性。
根据本申请的一个方面,提供了一种路由器的远程故障监控方法,其包括:
获取由路由器提供的预定时间段的路由器日志记录;
对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列;
将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量;
将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量;
融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量;以及
将所述路由器日志语义理解特征向量通过分类器以得到分类结果,所述分类结果用于表示路由器存在各种故障的概率值。
在上述路由器的远程故障监控方法中,将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量,包括:将所述日志词嵌入向量的序列进行一维排列以得到全局日志特征向量;
计算所述全局日志特征向量与所述日志词嵌入向量的序列中各个日志词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;分别以所述多个概率值中各个概率值作为权重对所述日志词嵌入向量的序列中各个日志词嵌入向量进行加权以得到所述多个上下文语义日志特征向量;以及,将所述多个上下文语义日志特征向量进行级联以得到所述第一路由器日志语义理解特征向量。
在上述路由器的远程故障监控方法中,将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量,包括:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述第二路由器日志语义理解特征向量,所述作为过滤器的卷积神经网络的第一层的输入为所述日志词嵌入向量的序列二维排列成的词嵌入特征矩阵。
在上述路由器的远程故障监控方法中,融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量,包括:以如下级联公式来融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量;其中,所述公式为:
在上述路由器的远程故障监控方法中,还包括对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练;其中,对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练,包括:获取训练数据,所述训练数据包括预定时间段的训练路由器日志记录,以及,所述路由器存在各种故障的概率值的真实值;对所述训练路由器日志记录进行分词处理后通过所述词嵌入层以得到训练日志词嵌入向量的序列;将所述训练日志词嵌入向量的序列通过所述基于转换器的上下文编码器以得到训练第一路由器日志语义理解特征向量;将所述训练日志词嵌入向量的序列二维排列为训练词嵌入特征矩阵后通过所述文本卷积神经网络模型以得到训练第二路由器日志语义理解特征向量;融合所述训练第一路由器日志语义理解特征向量和所述训练第二路由器日志语义理解特征向量以得到训练路由器日志语义理解特征向量;对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量;将所述优化训练路由器日志语义理解特征向量通过所述分类器以得到分类损失函数值;以及,基于所述分类损失函数值并通过梯度下降的反向传播来对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。
在上述路由器的远程故障监控方法中,对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量,包括:以如下优化公式对所述训练路由器日志语义理解特征向量进行耿贝尔正态周期性重参数化以得到所述优化训练路由器日志语义理解特征向量;其中,所述优化公式为:
其中,表示所述训练路由器日志语义理解特征向量的各个位置的特征值,/>和/>分别是所述训练路由器日志语义理解特征向量的各个位置的特征值集合的均值和方差,表示以2为底的对数函数值,/>表示反正弦函数值,/>表示反余弦函数值,/>表示所述优化训练路由器日志语义理解特征向量的各个位置的特征值。
在上述路由器的远程故障监控方法中,将所述优化训练路由器日志语义理解特征向量通过所述分类器以得到分类损失函数值,包括:使用所述分类器以如下公式对所述优化训练路由器日志语义理解特征向量进行处理以获得分类损失函数值,其中,所述公式为:
根据本申请的另一方面,提供了一种路由器,其包括:
信息采集模块,用于获取由路由器提供的预定时间段的路由器日志记录;
词嵌入模块,用于对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列;
上下文编码模块,用于将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量;
卷积模块,用于将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量;
融合模块,用于融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量;以及
分类结果生成模块,用于将所述路由器日志语义理解特征向量通过分类器以得到分类结果,所述分类结果用于表示路由器存在各种故障的概率值。
根据本申请的再一方面,提供了一种电子设备,包括:处理器;以及,存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的路由器的远程故障监控方法。
根据本申请的又一方面,提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的路由器的远程故障监控方法。
与现有技术相比,本申请提供的一种路由器的远程故障监控方法及路由器通过采用基于深度学习的神经网络模型挖掘出银行业务***的测试广度数据、其通过采用深度学习的神经网络模型路由器的日志记录数据的文本语义特征,进一步基于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断,这样,能够实现路由器的远程故障监控,以保证网络的稳定性。
附图说明
通过结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解,并且构成说明书的一部分,与本申请实施例一起用于解释本申请,并不构成对本申请的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1为根据本申请实施例的路由器的远程故障监控方法中推断阶段的流程图;
图2为根据本申请实施例的路由器的远程故障监控方法中训练阶段的流程图;
图3为根据本申请实施例的路由器的远程故障监控方法中推断阶段的架构示意图;
图4为根据本申请实施例的路由器的远程故障监控方法中训练阶段的架构示意图;
图5为根据本申请实施例的路由器的远程故障监控方法中上下文编码的流程图;
图6为根据本申请实施例的路由器的远程故障监控方法中卷积神经网络编码过程的流程图;
图7为根据本申请实施例的路由器的框图;
图8为根据本申请实施例的电子设备的框图。
具体实施方式
下面,将参考附图详细地描述根据本申请的示例实施例。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
场景概述
如前背景技术所言,路由器作为网络的核心设备,一旦发生故障就会导致整个网络不可用。通过对路由器进行远程故障监控,可以及时发现和处理故障,提高网络的稳定性和可靠性。但是路由器的故障类型颇多,有些还不易发现,例如网络拥堵、攻击、安全漏洞等。因此,期待一种优化的路由器的远程故障监控方案。
相应地,考虑到在实际对于路由器进行远程故障监控时,关键在于对于路由器的故障类型进行检测判断。但是,由于路由器的故障类型颇多,而传统的检测方式依靠技术人员人工检测容易出现漏检、误检的情况,导致对于路由器的故障检测精准度较低。因此,在本申请的技术方案中,期望对于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断,从而实现路由器的远程故障监控,以保证网络的稳定性。在此过程中,难点在于如何对于路由器的日志记录数据的文本语义特征进行充分表达,以此来提高对于路由器的故障类型检测判断精准度。
近年来,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。深度学习以及神经网络的发展为挖掘所述路由器的日志记录数据的文本语义理解特征信息提供了新的解决思路和方案。
具体地,在本申请的技术方案中,首先,获取由路由器提供的预定时间段的路由器日志记录。应可以理解,考虑到由于所述路由器日志记录数据能够反映路由器的工作状态,但是所述路由器日志记录是以文本的形式呈现的,其中包含有大量的词组成的语义信息,也就是说,所述路由器日志记录中的各个词之间具有着上下文的语义关联特征。因此,在本申请的技术方案中,为了便于后续进行所述路由器日志记录的语义理解,以此来进行所述路由器日志记录中关于路由器工作状态的语义特征充分表达,从而进行路由器的各种故障类型的准确检测评估,需要进一步对所述路由器日志记录进行分词处理以避免后续语义理解时造成词序混乱后,将分词处理后的路由器日志记录数据通过词嵌入层以得到日志词嵌入向量的序列。特别地,这里,所述词嵌入层能够通过可学习嵌入矩阵将所述分词处理后的路由器日志记录数据中的各个词句线性投影为所述日志词嵌入向量,从而得到所述日志词嵌入向量的序列。
然后,考虑到由于所述路由器日志记录中存在着关于路由器工作状态的语义特征信息,并且所述路由器日志记录所表示的文本数据中的各个词之间具有着上下文的语义关联关系。因此,为了能够对于路由器的工作状态进行深度充分地语义理解,在本申请的技术方案中,将所述日志词嵌入向量的序列通过基于转换器的上下文编码器中进行编码,以此来提取出所述路由器日志记录中关于路由器工作状态的基于全局的上下文语义关联特征,从而得到第一路由器日志语义理解特征向量。
进一步地,还考虑到所述路由器日志记录中关于路由器的工作状态隐含特征不仅存在于所述路由器日志记录的文本数据全局中,还存在于各个词之间的局部隐含语义关联特征信息中。也就是说,由于纯 Transformer 的特征提取方法容易存在特征丢失的问题,导致对于路由器的工作状态隐含特征提取的能力较弱,容易出现误检的情况,进而降低了对于路由器故障类型检测判断的精准度。因此,在本申请的技术方案中,进一步将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型中进行处理,以提取出所述路由器日志记录中的各个词之间的局部语义关联特征信息,即所述路由器日志记录中关于路由器工作状态的局部隐含语义理解特征信息,从而得到第二路由器日志语义理解特征向量。
接着,进一步再融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量,以此来融合不同尺度下的关于所述路由器日志记录中的路由器工作状态语义理解特征,从而得到所述路由器日志记录中具有多尺度语义理解特征的路由器日志语义理解特征向量。然后,将所述路由器日志语义理解特征向量作为分类特征向量通过分类器中进行分类处理,以所述路由器日志记录中关于路由器的工作状态的多尺度语义理解特征来进行分类,从而得到用于表示路由器存在各种故障的概率值的分类结果。也就是,在本申请的技术方案中,所述分类器的标签为路由器存在各种故障的类型概率标签,其中,所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。应可以理解,在本申请的技术方案中,所述分类器的分类标签为所述路由器存在各种故障的类型概率标签的概率值,即所述路由器的故障类型的判断标签,因此,在得到所述分类结果后,可基于所述分类结果来进行路由器的故障类型评估判断,从而实现路由器的远程故障监控,以保证网络的稳定性。
特别地,在本申请的技术方案中,在融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量得到所述路由器日志语义理解特征向量时,为了充分利用所述第一路由器日志语义理解特征向量表达的日志上下文文本语义特征和所述第二路由器日志语义理解特征向量表达的词向量样本间局部关联信息,优选地通过直接级联所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量得到所述路由器日志语义理解特征向量,这样,就会导致级联位置存在分布间隙(distributiongap)。而另一方面,所述第一路由器日志语义理解特征向量也是通过直接级联基于转换器的上下文编码器获得的多个上下文日志词特征向量得到的,因此所述第一路由器日志语义理解特征向量内部也存在分布间隙。由此,就导致所述路由器日志语义理解特征向量的整体特征分布的连续性差,影响模型训练时的训练效果,例如训练速度和收敛准确性。
这里,所述耿贝尔正态周期性重参数化通过将所述路由器日志语义理解特征向量的各个位置的特征值/>转换为其概率分布的角特征表达,来基于耿贝尔(Gumbel)分布的随机性周期操作方式在特征值集合的正态分布中引入随机性的周期式分布,以获得原特征分布的具有随机性的周期式连续可微近似,从而通过特征的周期性重参数化来提高优化后的路由器日志语义理解特征向量/>在训练时损失函数的梯度在模型中反向传播的动态连续波动能力,以提高卷积核在训练过程中的动态应用性,从而补偿所述路由器日志语义理解特征向量的特征分布的不连续对训练效果的影响。这样,能够精准地进行路由器的故障类型评估判断,从而实现路由器的远程故障监控,以保证网络的稳定性。
基于此,本申请提出了一种路由器的远程故障监控方法,其包括:获取由路由器提供的预定时间段的路由器日志记录;对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列;将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量;将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量;
融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量;以及,将所述路由器日志语义理解特征向量通过分类器以得到分类结果,所述分类结果用于表示路由器存在各种故障的概率值。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
示例性方法
图1为根据本申请实施例的路由器的远程故障监控方法中推断阶段的流程图。如图1所示,根据本申请实施例的路由器的远程故障监控方法,包括:推断阶段,包括:S110,获取由路由器提供的预定时间段的路由器日志记录;S120,对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列;S130,将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量;S140,将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量;S150,融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量;以及,S160,将所述路由器日志语义理解特征向量通过分类器以得到分类结果,所述分类结果用于表示路由器存在各种故障的概率值。
图3为根据本申请实施例的路由器的远程故障监控方法中推断阶段的架构示意图。如图3所示,在推断阶段中,首先,获取由路由器提供的预定时间段的路由器日志记录;再对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列;接着,将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量;将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量;然后,融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量;进而,将所述路由器日志语义理解特征向量通过分类器以得 到分类结果,所述分类结果用于表示路由器存在各种故障的概率值。
具体地,在步骤S110中,获取由路由器提供的预定时间段的路由器日志记录。应可以理解,在实际对于路由器进行远程故障监控时,关键在于对于路由器的故障类型进行检测判断。考虑到路由器的故障类型颇多,而传统的检测方式依靠技术人员人工检测容易出现漏检、误检的情况,导致对于路由器的故障检测精准度较低。因此,在本申请的技术方案中,可通过对于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断,从而实现路由器的远程故障监控,以保证网络的稳定性。
具体地,在步骤S120中,对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列。考虑到由于所述路由器日志记录数据能够反映路由器的工作状态,但是所述路由器日志记录是以文本的形式呈现的,其中包含有大量的词组成的语义信息,也就是说,所述路由器日志记录中的各个词之间具有着上下文的语义关联特征。因此,在本申请的技术方案中,为了便于后续进行所述路由器日志记录的语义理解,以此来进行所述路由器日志记录中关于路由器工作状态的语义特征充分表达,从而进行路由器的各种故障类型的准确检测评估,需要进一步对所述路由器日志记录进行分词处理以避免后续语义理解时造成词序混乱后,将分词处理后的路由器日志记录数据通过词嵌入层以得到日志词嵌入向量的序列。特别地,这里,所述词嵌入层能够通过可学习嵌入矩阵将所述分词处理后的路由器日志记录数据中的各个词句线性投影为所述日志词嵌入向量,从而得到所述日志词嵌入向量的序列。
具体地,在步骤S130中,将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量。也就是,考虑到由于所述路由器日志记录中存在着关于路由器工作状态的语义特征信息,并且所述路由器日志记录所表示的文本数据中的各个词之间具有着上下文的语义关联关系。因此,为了能够对于路由器的工作状态进行深度充分地语义理解,在本申请的技术方案中,将所述日志词嵌入向量的序列通过基于转换器的上下文编码器中进行编码,以此来提取出所述路由器日志记录中关于路由器工作状态的基于全局的上下文语义关联特征,从而得到第一路由器日志语义理解特征向量。
图5为根据本申请实施例的路由器的远程故障监控方法中上下文编码的流程图。如图5所示,在所述上下文编码的过程中,包括:S210,将所述日志词嵌入向量的序列进行一维排列以得到全局日志特征向量;220,计算所述全局日志特征向量与所述日志词嵌入向量的序列中各个日志词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;S230,分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;S240,将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;S250,分别以所述多个概率值中各个概率值作为权重对所述日志词嵌入向量的序列中各个日志词嵌入向量进行加权以得到所述多个上下文语义日志特征向量;以及,S260,将所述多个上下文语义日志特征向量进行级联以得到所述第一路由器日志语义理解特征向量。
具体地,在步骤S140中,将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量。考虑到所述路由器日志记录中关于路由器的工作状态隐含特征不仅存在于所述路由器日志记录的文本数据全局中,还存在于各个词之间的局部隐含语义关联特征信息中。也就是说,由于纯Transformer 的特征提取方法容易存在特征丢失的问题,导致对于路由器的工作状态隐含特征提取的能力较弱,容易出现误检的情况,进而降低了对于路由器故障类型检测判断的精准度。因此,在本申请的技术方案中,进一步将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型中进行处理,以提取出所述路由器日志记录中的各个词之间的局部语义关联特征信息,即所述路由器日志记录中关于路由器工作状态的局部隐含语义理解特征信息,从而得到第二路由器日志语义理解特征向量。在一个具体示例中,所述文本卷积神经网络包括相互级联的多个神经网络层,其中各个神经网络层包括卷积层、池化层和激活层。其中,在所述文本卷积神经网络的编码过程中,所述文本卷积神经网络的各层在层的正向传递过程中对输入数据使用所述卷积层进行基于卷积核的卷积处理、使用所述池化层对由所述卷积层输出的卷积特征图进行池化处理和使用所述激活层对由所述池化层输出的池化特征图进行激活处理。
图6为根据本申请实施例的路由器的远程故障监控方法中卷积神经网络编码过程的流程图如图6所示,在所述卷积神经网络编码过程中,包括:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:S310,对输入数据进行卷积处理以得到卷积特征图;S320,对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图;以及,S330,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述第二路由器日志语义理解特征向量,所述作为过滤器的卷积神经网络的第一层的输入为所述日志词嵌入向量的序列二维排列成的词嵌入特征矩阵。
具体地,在步骤S150中,融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量。也就是,在得到所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量后,进一步将两者进行特征融合以此来融合不同尺度下的关于所述路由器日志记录中的路由器工作状态语义理解特征,从而得到所述路由器日志记录中具有多尺度语义理解特征的路由器日志语义理解特征向量,在本申请的一个具体示例中,可通过级联的方式来将两者进行融合,更具体地,以如下级联公式来融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量;其中,所述公式为:其中,/>表示所述第一路由器日志语义理解特征向量,/>表示所述第二路由器日志语义理解特征向量,/>表示级联函数,/>表示所述路由器日志语义理解特征向量。
具体地,在步骤S160中,将所述路由器日志语义理解特征向量通过分类器以得到分类结果,所述分类结果用于表示路由器存在各种故障的概率值。也就是,在本申请的技术方案中,将所述路由器日志语义理解特征向量通过分类器而用于表示路由器存在各种故障的概率值的分类结果。具体地,使用所述分类器以如下公式对所述路由器日志语义理解特征向量进行处理以获得分类结果,其中,所述公式为:,其中,/>到/>为权重矩阵,/>到/>为偏置向量,/>为路由器日志语义理解特征向量。具体地,所述分类器包括多个全连接层和与所述多个全连接层最后一个全连接层级联的Softmax层。其中,在所述分类器的分类处理中,使用所述分类器的多个全连接层对所述路由器日志语义理解特征向量进行多次全连接编码以得到编码分类特征向量;进而,将所述编码分类特征向量输入所述分类器的Softmax层,即,使用所述Softmax分类函数对所述编码分类特征向量进行分类处理以得到分类标签,在本申请的技术方案中,所述分类器的标签为路由器存在各种故障的类型概率标签,其中,所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。应可以理解,在本申请的技术方案中,所述分类器的分类标签为所述路由器存在各种故障的类型概率标签的概率值,即所述路由器的故障类型的判断标签,因此,在得到所述分类结果后,可基于所述分类结果来进行路由器的故障类型评估判断,从而实现路由器的远程故障监控,以保证网络的稳定性。
应可以理解,在利用上述神经网络模型进行推断之前,需要对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。也就是说,在本 请的路由器的远程故障监控方法中,还包括训练模块,用于对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。
图2为根据本申请实施例的路由器的远程故障监控方法中训练阶段的流程图。如图2所示,根据本申请实施例的路由器的远程故障监控方法,还包括训练阶段,包括步骤:S1110,获取训练数据,所述训练数据包括预定时间段的训练路由器日志记录,以及,所述路由器存在各种故障的概率值的真实值;S1120,对所述训练路由器日志记录进行分词处理后通过所述词嵌入层以得到训练日志词嵌入向量的序列;S1130,将所述训练日志词嵌入向量的序列通过所述基于转换器的上下文编码器以得到训练第一路由器日志语义理解特征向量;S1140,将所述训练日志词嵌入向量的序列二维排列为训练词嵌入特征矩阵后通过所述文本卷积神经网络模型以得到训练第二路由器日志语义理解特征向量;S1150,融合所述训练第一路由器日志语义理解特征向量和所述训练第二路由器日志语义理解特征向量以得到训练路由器日志语义理解特征向量;S1160,对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量;S1170,将所述优化训练路由器日志语义理解特征向量通过所述分类器以得到分类损失函数值;以及,S1180,基于所述分类损失函数值并通过梯度下降的反向传播来对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。
图4为根据本申请实施例的路由器的远程故障监控方法中训练阶段的架构示意图。如图4所示,在训练过程中,首先,获取训练数据,所述训练数据包括预定时间段的训练路由器日志记录,以及,所述路由器存在各种故障的概率值的真实值;再对所述训练路由器日志记录进行分词处理后通过所述词嵌入层以得到训练日志词嵌入向量的序列;接着。将所述训练日志词嵌入向量的序列通过所述基于转换器的上下文编码器以得到训练第一路由器日志语义理解特征向量;将所述训练日志词嵌入向量的序列二维排列为训练词嵌入特征矩阵后通过所述文本卷积神经网络模型以得到训练第二路由器日志语义理解特征向量;然后,融合所述训练第一路由器日志语义理解特征向量和所述训练第二路由器日志语义理解特征向量以得到训练路由器日志语义理解特征向量;对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量;然后,将所述优化训练路由器日志语义理解特征向量通过所述分类器以得到分类损失函数值;进而,基于所述分类损失函数值并通过梯度下降的反向传播来对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。
在本申请的技术方案中,在融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量得到所述路由器日志语义理解特征向量时,为了充分利用所述第一路由器日志语义理解特征向量表达的日志上下文文本语义特征和所述第二路由器日志语义理解特征向量表达的词向量样本间局部关联信息,优选地通过直接级联所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量得到所述路由器日志语义理解特征向量,这样,就会导致级联位置存在分布间隙(distribution gap)。而另一方面,所述第一路由器日志语义理解特征向量也是通过直接级联基于转换器的上下文编码器获得的多个上下文日志词特征向量得到的,因此所述第一路由器日志语义理解特征向量内部也存在分布间隙。由此,就导致所述路由器日志语义理解特征向量的整体特征分布的连续性差,影响模型训练时的训练效果,例如训练速度和收敛准确性。基于此,本申请的申请人对所述路由器日志语义理解特征向量进行耿贝尔(Gumbel)正态周期性重参数化,以获得优化后的路由器日志语义理解特征向量/>,具体表示为:
其中,表示所述训练路由器日志语义理解特征向量的各个位置的特征值,/>和/>分别是所述训练路由器日志语义理解特征向量的各个位置的特征值集合的均值和方差,表示以2为底的对数函数值,/>表示反正弦函数值,/>表示反余弦函数值,/>表示所述优化训练路由器日志语义理解特征向量的各个位置的特征值。这里,所述耿贝尔正态周期性重参数化通过将所述路由器日志语义理解特征向量/>的各个位置的特征值/>转换为其概率分布的角特征表达,来基于耿贝尔(Gumbel)分布的随机性周期操作方式在特征值集合的正态分布中引入随机性的周期式分布,以获得原特征分布的具有随机性的周期式连续可微近似,从而通过特征的周期性重参数化来提高优化后的路由器日志语义理解特征向量/>在训练时损失函数的梯度在模型中反向传播的动态连续波动能力,以提高卷积核在训练过程中的动态应用性,从而补偿所述路由器日志语义理解特征向量的特征分布的不连续对训练效果的影响。这样,能够精准地进行路由器的故障类型评估判断,从而实现路由器的远程故障监控,以保证网络的稳定性。
综上,根据本申请实施例的路由器的远程故障监控方法被阐明,其通过采用深度学习的神经网络模型路由器的日志记录数据的文本语义特征,进一步基于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断,这样,能够实现路由器的远程故障监控,以保证网络的稳定性。
示例性***
图7为根据本申请实施例的路由器的框图。如图7所示,根据本申请实施例的路由器300,包括:信息采集模块310;词嵌入模块320;上下文编码模块330;卷积模块340;融合模块350;分类结果生成模块360。
其中,所述信息采集模块310,用于获取由路由器提供的预定时间段的路由器日志记录;所述词嵌入模块320,用于对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列;所述上下文编码模块330,用于将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量;所述卷积模块340,用于将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量;所述融合模块350,用于融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量;以及,所述分类结果生成模块360,用于将所述路由器日志语义理解特征向量通过分类器以得到分类结果,所述分类结果用于表示路由器存在各种故障的概率值。
在一个示例中,在上述路由器300中,所述上下文编码模块330,用于:将所述日志词嵌入向量的序列进行一维排列以得到全局日志特征向量;计算所述全局日志特征向量与所述日志词嵌入向量的序列中各个日志词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;分别以所述多个概率值中各个概率值作为权重对所述日志词嵌入向量的序列中各个日志词嵌入向量进行加权以得到所述多个上下文语义日志特征向量;以及,将所述多个上下文语义日志特征向量进行级联以得到所述第一路由器日志语义理解特征向量。
在一个示例中,在上述路由器300中,所述卷积模块340,用于:使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:对输入数据进行卷积处理以得到卷积特征图;对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图;以及,对所述池化特征图进行非线性激活以得到激活特征图;其中,所述作为过滤器的卷积神经网络的最后一层的输出为所述第二路由器日志语义理解特征向量,所述作为过滤器的卷积神经网络的第一层的输入为所述日志词嵌入向量的序列二维排列成的词嵌入特征矩阵。
在一个示例中,在上述路由器300中,所述融合模块350,用于:以如下级联公式来融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量;其中,所述公式为:,其中,/>表示所述第一路由器日志语义理解特征向量,/>表示所述第二路由器日志语义理解特征向量,/>表示级联函数,/>表示所述路由器日志语义理解特征向量。
综上,根据本申请实施例的路由器300被阐明,其通过采用深度学习的神经网络模型路由器的日志记录数据的文本语义特征,进一步基于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断,这样,能够实现路由器的远程故障监控,以保证网络的稳定性。
如上所述,根据本申请实施例的路由器***可以实现在各种终端设备中。在一个示例中,根据本申请实施例的路由器可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如,该用于银行业务的软件性能测试***可以是该终端设备的操作***中的一个软件模块,或者可以是针对于该终端设备所开发的一个应用程序;当然,该路由器同样可以是该终端设备的众多硬件模块之一。
替换地,在另一示例中,该路由器与该终端设备也可以是分立的设备,并且该路由器可以通过有线和/或无线网络连接到该终端设备,并且按照约定的数据格式来传输交互信息。
示例性电子设备
下面,参考图8来描述根据本申请实施例的电子设备。
如图8所示,电子设备10包括一个或多个处理器11和存储器12。
处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备10中的其他组件以执行期望的功能。
存储器12可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器11可以运行所述程序指令,以实现上文所述的本申请的各个实施例的路由器的远程故障监控方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如路由器日志语义理解特征向量等各种内容。
在一个示例中,电子设备10还可以包括:输入装置13和输出装置14,这些组件通过总线***和/或其他形式的连接机构(未示出)互连。
该输入装置13可以包括例如键盘、鼠标等等。
该输出装置14可以向外部输出各种信息,包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图8中仅示出了该电子设备10中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备10还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的路由器的远程故障监控方法中的功能中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的路由器的远程故障监控方法中的功能中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
Claims (8)
1.一种路由器的远程故障监控方法,其特征在于,包括:
获取由路由器提供的预定时间段的路由器日志记录;
对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列;
将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量;
将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量;
融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量;以及
将所述路由器日志语义理解特征向量通过分类器以得到分类结果,所述分类结果用于表示路由器存在各种故障的概率值;
其中,将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量,包括:
将所述日志词嵌入向量的序列进行一维排列以得到全局日志特征向量;
计算所述全局日志特征向量与所述日志词嵌入向量的序列中各个日志词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;
分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;
将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;
分别以所述多个概率值中各个概率值作为权重对所述日志词嵌入向量的序列中各个日志词嵌入向量进行加权以得到所述多个上下文语义日志特征向量;以及
将所述多个上下文语义日志特征向量进行级联以得到所述第一路由器日志语义理解特征向量。
2.根据权利要求1所述的路由器的远程故障监控方法,其特征在于,将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量,包括:使用所述作为过滤器的文本卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:
对输入数据进行卷积处理以得到卷积特征图;
对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图;以及
对所述池化特征图进行非线性激活以得到激活特征图;
其中,所述作为过滤器的文本卷积神经网络的最后一层的输出为所述第二路由器日志语义理解特征向量,所述作为过滤器的文本卷积神经网络的第一层的输入为所述日志词嵌入向量的序列二维排列成的词嵌入特征矩阵。
4.根据权利要求3所述的路由器的远程故障监控方法,其特征在于,还包括对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练;
其中,对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练,包括:
获取训练数据,所述训练数据包括预定时间段的训练路由器日志记录,以及,所述路由器存在各种故障的概率值的真实值;
对所述训练路由器日志记录进行分词处理后通过所述词嵌入层以得到训练日志词嵌入向量的序列;
将所述训练日志词嵌入向量的序列通过所述基于转换器的上下文编码器以得到训练第一路由器日志语义理解特征向量;
将所述训练日志词嵌入向量的序列二维排列为训练词嵌入特征矩阵后通过所述文本卷积神经网络模型以得到训练第二路由器日志语义理解特征向量;
融合所述训练第一路由器日志语义理解特征向量和所述训练第二路由器日志语义理解特征向量以得到训练路由器日志语义理解特征向量;
对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量;
将所述优化训练路由器日志语义理解特征向量通过所述分类器以得到分类损失函数值;以及
基于所述分类损失函数值并通过梯度下降的反向传播来对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。
5.根据权利要求4所述的路由器的远程故障监控方法,其特征在于,对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量,包括:
以如下优化公式对所述训练路由器日志语义理解特征向量进行耿贝尔正态周期性重参数化以得到所述优化训练路由器日志语义理解特征向量;
其中,所述优化公式为:
7.一种路由器,其特征在于,包括:
信息采集模块,用于获取由路由器提供的预定时间段的路由器日志记录;
词嵌入模块,用于对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列;
上下文编码模块,用于将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量;
卷积模块,用于将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量;
融合模块,用于融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量;以及
分类结果生成模块,用于将所述路由器日志语义理解特征向量通过分类器以得到分类结果,所述分类结果用于表示路由器存在各种故障的概率值;
其中,所述上下文编码模块,用于:将所述日志词嵌入向量的序列进行一维排列以得到全局日志特征向量;计算所述全局日志特征向量与所述日志词嵌入向量的序列中各个日志词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;分别以所述多个概率值中各个概率值作为权重对所述日志词嵌入向量的序列中各个日志词嵌入向量进行加权以得到所述多个上下文语义日志特征向量;以及,将所述多个上下文语义日志特征向量进行级联以得到所述第一路由器日志语义理解特征向量。
8.根据权利要求7所述的一种路由器,其特征在于,所述卷积模块,用于:使用所述作为过滤器的文本卷积神经网络模型的各层在层的正向传递中分别对输入数据进行:
对输入数据进行卷积处理以得到卷积特征图;
对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图;以及
对所述池化特征图进行非线性激活以得到激活特征图;
其中,所述作为过滤器的文本卷积神经网络的最后一层的输出为所述第二路由器日志语义理解特征向量,所述作为过滤器的文本卷积神经网络的第一层的输入为所述日志词嵌入向量的序列二维排列成的词嵌入特征矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310345735.7A CN116055293B (zh) | 2023-04-03 | 2023-04-03 | 路由器的远程故障监控方法及路由器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310345735.7A CN116055293B (zh) | 2023-04-03 | 2023-04-03 | 路由器的远程故障监控方法及路由器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116055293A CN116055293A (zh) | 2023-05-02 |
CN116055293B true CN116055293B (zh) | 2023-06-20 |
Family
ID=86113661
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310345735.7A Active CN116055293B (zh) | 2023-04-03 | 2023-04-03 | 路由器的远程故障监控方法及路由器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116055293B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116204266A (zh) * | 2023-05-04 | 2023-06-02 | 深圳市联合信息技术有限公司 | 远程协助的信息创建运维***及其方法 |
CN116827656A (zh) * | 2023-07-10 | 2023-09-29 | 滁州小稻穗网络科技有限公司 | 网络信息安全防护***及其方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN217849462U (zh) * | 2022-07-15 | 2022-11-18 | 深圳市纵联网络科技有限公司 | 一种无线路由器设备状态监测装置 |
CN115529166A (zh) * | 2022-09-05 | 2022-12-27 | 浙江御安信息技术有限公司 | 基于多源数据的网络安全扫描风险管控***及其方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7111206B1 (en) * | 2001-09-19 | 2006-09-19 | Juniper Networks, Inc. | Diagnosis of network fault conditions |
US10817650B2 (en) * | 2017-05-19 | 2020-10-27 | Salesforce.Com, Inc. | Natural language processing using context specific word vectors |
CN110609897B (zh) * | 2019-08-12 | 2023-08-04 | 北京化工大学 | 一种融合全局和局部特征的多类别中文文本分类方法 |
CN111198817B (zh) * | 2019-12-30 | 2021-06-04 | 武汉大学 | 一种基于卷积神经网络的SaaS软件故障诊断方法及装置 |
CN113312483A (zh) * | 2021-06-02 | 2021-08-27 | 郑州大学 | 一种基于自注意力机制和BiGRU的文本分类方法 |
CN114610515B (zh) * | 2022-03-10 | 2022-09-13 | 电子科技大学 | 基于日志全语义的多特征日志异常检测方法及*** |
-
2023
- 2023-04-03 CN CN202310345735.7A patent/CN116055293B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN217849462U (zh) * | 2022-07-15 | 2022-11-18 | 深圳市纵联网络科技有限公司 | 一种无线路由器设备状态监测装置 |
CN115529166A (zh) * | 2022-09-05 | 2022-12-27 | 浙江御安信息技术有限公司 | 基于多源数据的网络安全扫描风险管控***及其方法 |
Non-Patent Citations (2)
Title |
---|
LSTM-TextCNN联合模型的短文本分类研究;李志杰;耿朝阳;宋鹏;;西安工业大学学报(03);全文 * |
基于并行双向门控循环单元与自注意力机制的中文文本情感分类;崔昕阳;龙华;熊新;邵玉斌;杜庆治;;北京化工大学学报(自然科学版)(02);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116055293A (zh) | 2023-05-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116055293B (zh) | 路由器的远程故障监控方法及路由器 | |
CN112800427B (zh) | webshell检测方法、装置、电子设备和存储介质 | |
CN112035359B (zh) | 程序测试方法、装置、电子设备及存储介质 | |
CN110941827B (zh) | 应用程序异常行为检测方法及装置 | |
CN111600919A (zh) | 基于人工智能的web检测方法和装置 | |
CN116405299A (zh) | 一种基于网络安全的报警器 | |
CN116257406A (zh) | 用于智慧城市的网关数据管理方法及其*** | |
CN117077075A (zh) | 用于环境保护的水质监测***及其方法 | |
CN112003834B (zh) | 异常行为检测方法和装置 | |
CN116579618A (zh) | 基于风险管理的数据处理方法、装置、设备及存储介质 | |
CN115344414A (zh) | 基于LSTM-Transformer的日志异常检测方法及*** | |
CN115471216A (zh) | 智慧实验室管理平台的数据管理方法 | |
CN116975728B (zh) | 用于煤层气钻井工程的安全管理方法及其*** | |
CN116467485B (zh) | 一种视频图像检索构建***及其方法 | |
CN117521641A (zh) | 基于自然语言处理的文本自动校对***及方法 | |
CN117231590A (zh) | 液压***的故障预测***及其方法 | |
CN117082118A (zh) | 基于数据推导及端口预测的网络连接方法 | |
CN115665285A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN115143128A (zh) | 小型潜水电泵的故障诊断方法及其*** | |
CN117235744B (zh) | 源文件上线方法、装置、电子设备和计算机可读介质 | |
CN116187294B (zh) | 信息化检测实验室电子文件快速生成方法及*** | |
CN113378543B (zh) | 数据分析方法、训练数据分析模型的方法及电子设备 | |
CN116702156B (zh) | 信息安全风险评价***及其方法 | |
US20230088986A1 (en) | Topic clustering and event detection | |
Wang et al. | Low-code vulnerability identification based on TextCNN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |