CN116055293B

CN116055293B - 路由器的远程故障监控方法及路由器

Info

Publication number: CN116055293B
Application number: CN202310345735.7A
Authority: CN
Inventors: 刘杏芬
Original assignee: China Isigal Technology Co ltd
Current assignee: China Isigal Technology Co ltd
Priority date: 2023-04-03
Filing date: 2023-04-03
Publication date: 2023-06-20
Anticipated expiration: 2043-04-03
Also published as: CN116055293A

Abstract

本申请涉及智能监控领域，其具体地公开了一种路由器的远程故障监控方法及路由器，其通过采用深度学习的神经网络模型路由器的日志记录数据的文本语义特征，进一步基于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断，这样，能够实现路由器的远程故障监控，以保证网络的稳定性。

Description

路由器的远程故障监控方法及路由器

技术领域

本申请涉及智能监控领域，且更为具体地，涉及一种路由器的远程故障监控方法及路由器。

背景技术

路由器作为网络的核心设备，一旦发生故障就会导致整个网络不可用。通过对路由器进行远程故障监控，可以及时发现和处理故障，提高网络的稳定性和可靠性。但是路由器的故障类型颇多，有些还不易发现，例如网络拥堵、攻击、安全漏洞等。

因此，期待一种优化的路由器的远程故障监控方案。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种路由器的远程故障监控方法及路由器，其通过采用深度学习的神经网络模型路由器的日志记录数据的文本语义特征，进一步基于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断，这样，能够实现路由器的远程故障监控，以保证网络的稳定性。

根据本申请的一个方面，提供了一种路由器的远程故障监控方法，其包括：

获取由路由器提供的预定时间段的路由器日志记录；

对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列；

将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量；

将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量；

融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量；以及

将所述路由器日志语义理解特征向量通过分类器以得到分类结果，所述分类结果用于表示路由器存在各种故障的概率值。

在上述路由器的远程故障监控方法中，将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量，包括：将所述日志词嵌入向量的序列进行一维排列以得到全局日志特征向量；

计算所述全局日志特征向量与所述日志词嵌入向量的序列中各个日志词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵；分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵；将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值；分别以所述多个概率值中各个概率值作为权重对所述日志词嵌入向量的序列中各个日志词嵌入向量进行加权以得到所述多个上下文语义日志特征向量；以及，将所述多个上下文语义日志特征向量进行级联以得到所述第一路由器日志语义理解特征向量。

在上述路由器的远程故障监控方法中，将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量，包括：使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为过滤器的卷积神经网络的最后一层的输出为所述第二路由器日志语义理解特征向量，所述作为过滤器的卷积神经网络的第一层的输入为所述日志词嵌入向量的序列二维排列成的词嵌入特征矩阵。

在上述路由器的远程故障监控方法中，融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量，包括：以如下级联公式来融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量；其中，所述公式为：

其中，

表示所述第一路由器日志语义理解特征向量，/>

表示所述第二路由器日志语义理解特征向量，/>

表示级联函数，/>

表示所述路由器日志语义理解特征向量。

在上述路由器的远程故障监控方法中，还包括对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练；其中，对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练，包括：获取训练数据，所述训练数据包括预定时间段的训练路由器日志记录，以及，所述路由器存在各种故障的概率值的真实值；对所述训练路由器日志记录进行分词处理后通过所述词嵌入层以得到训练日志词嵌入向量的序列；将所述训练日志词嵌入向量的序列通过所述基于转换器的上下文编码器以得到训练第一路由器日志语义理解特征向量；将所述训练日志词嵌入向量的序列二维排列为训练词嵌入特征矩阵后通过所述文本卷积神经网络模型以得到训练第二路由器日志语义理解特征向量；融合所述训练第一路由器日志语义理解特征向量和所述训练第二路由器日志语义理解特征向量以得到训练路由器日志语义理解特征向量；对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量；将所述优化训练路由器日志语义理解特征向量通过所述分类器以得到分类损失函数值；以及，基于所述分类损失函数值并通过梯度下降的反向传播来对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。

在上述路由器的远程故障监控方法中，对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量，包括：以如下优化公式对所述训练路由器日志语义理解特征向量进行耿贝尔正态周期性重参数化以得到所述优化训练路由器日志语义理解特征向量；其中，所述优化公式为：

其中，

表示所述训练路由器日志语义理解特征向量的各个位置的特征值，/>

和/>

分别是所述训练路由器日志语义理解特征向量的各个位置的特征值集合的均值和方差，

表示以2为底的对数函数值，/>

表示反正弦函数值，/>

表示反余弦函数值，/>

表示所述优化训练路由器日志语义理解特征向量的各个位置的特征值。

在上述路由器的远程故障监控方法中，将所述优化训练路由器日志语义理解特征向量通过所述分类器以得到分类损失函数值，包括：使用所述分类器以如下公式对所述优化训练路由器日志语义理解特征向量进行处理以获得分类损失函数值，其中，所述公式为：

，其中，/>

到/>

为权重矩阵，/>

到

为偏置向量，/>

为优化训练路由器日志语义理解特征向量。

根据本申请的另一方面，提供了一种路由器，其包括：

信息采集模块，用于获取由路由器提供的预定时间段的路由器日志记录；

词嵌入模块，用于对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列；

上下文编码模块，用于将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量；

卷积模块，用于将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量；

融合模块，用于融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量；以及

分类结果生成模块，用于将所述路由器日志语义理解特征向量通过分类器以得到分类结果，所述分类结果用于表示路由器存在各种故障的概率值。

根据本申请的再一方面，提供了一种电子设备，包括：处理器；以及，存储器，在所述存储器中存储有计算机程序指令，所述计算机程序指令在被所述处理器运行时使得所述处理器执行如上所述的路由器的远程故障监控方法。

根据本申请的又一方面，提供了一种计算机可读介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行如上所述的路由器的远程故障监控方法。

与现有技术相比，本申请提供的一种路由器的远程故障监控方法及路由器通过采用基于深度学习的神经网络模型挖掘出银行业务***的测试广度数据、其通过采用深度学习的神经网络模型路由器的日志记录数据的文本语义特征，进一步基于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断，这样，能够实现路由器的远程故障监控，以保证网络的稳定性。

附图说明

通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1为根据本申请实施例的路由器的远程故障监控方法中推断阶段的流程图；

图2为根据本申请实施例的路由器的远程故障监控方法中训练阶段的流程图；

图3为根据本申请实施例的路由器的远程故障监控方法中推断阶段的架构示意图；

图4为根据本申请实施例的路由器的远程故障监控方法中训练阶段的架构示意图；

图5为根据本申请实施例的路由器的远程故障监控方法中上下文编码的流程图；

图6为根据本申请实施例的路由器的远程故障监控方法中卷积神经网络编码过程的流程图；

图7为根据本申请实施例的路由器的框图；

图8为根据本申请实施例的电子设备的框图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

场景概述

如前背景技术所言，路由器作为网络的核心设备，一旦发生故障就会导致整个网络不可用。通过对路由器进行远程故障监控，可以及时发现和处理故障，提高网络的稳定性和可靠性。但是路由器的故障类型颇多，有些还不易发现，例如网络拥堵、攻击、安全漏洞等。因此，期待一种优化的路由器的远程故障监控方案。

相应地，考虑到在实际对于路由器进行远程故障监控时，关键在于对于路由器的故障类型进行检测判断。但是，由于路由器的故障类型颇多，而传统的检测方式依靠技术人员人工检测容易出现漏检、误检的情况，导致对于路由器的故障检测精准度较低。因此，在本申请的技术方案中，期望对于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断，从而实现路由器的远程故障监控，以保证网络的稳定性。在此过程中，难点在于如何对于路由器的日志记录数据的文本语义特征进行充分表达，以此来提高对于路由器的故障类型检测判断精准度。

近年来，深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。深度学习以及神经网络的发展为挖掘所述路由器的日志记录数据的文本语义理解特征信息提供了新的解决思路和方案。

具体地，在本申请的技术方案中，首先，获取由路由器提供的预定时间段的路由器日志记录。应可以理解，考虑到由于所述路由器日志记录数据能够反映路由器的工作状态，但是所述路由器日志记录是以文本的形式呈现的，其中包含有大量的词组成的语义信息，也就是说，所述路由器日志记录中的各个词之间具有着上下文的语义关联特征。因此，在本申请的技术方案中，为了便于后续进行所述路由器日志记录的语义理解，以此来进行所述路由器日志记录中关于路由器工作状态的语义特征充分表达，从而进行路由器的各种故障类型的准确检测评估，需要进一步对所述路由器日志记录进行分词处理以避免后续语义理解时造成词序混乱后，将分词处理后的路由器日志记录数据通过词嵌入层以得到日志词嵌入向量的序列。特别地，这里，所述词嵌入层能够通过可学习嵌入矩阵将所述分词处理后的路由器日志记录数据中的各个词句线性投影为所述日志词嵌入向量，从而得到所述日志词嵌入向量的序列。

然后，考虑到由于所述路由器日志记录中存在着关于路由器工作状态的语义特征信息，并且所述路由器日志记录所表示的文本数据中的各个词之间具有着上下文的语义关联关系。因此，为了能够对于路由器的工作状态进行深度充分地语义理解，在本申请的技术方案中，将所述日志词嵌入向量的序列通过基于转换器的上下文编码器中进行编码，以此来提取出所述路由器日志记录中关于路由器工作状态的基于全局的上下文语义关联特征，从而得到第一路由器日志语义理解特征向量。

进一步地，还考虑到所述路由器日志记录中关于路由器的工作状态隐含特征不仅存在于所述路由器日志记录的文本数据全局中，还存在于各个词之间的局部隐含语义关联特征信息中。也就是说，由于纯 Transformer 的特征提取方法容易存在特征丢失的问题，导致对于路由器的工作状态隐含特征提取的能力较弱，容易出现误检的情况，进而降低了对于路由器故障类型检测判断的精准度。因此，在本申请的技术方案中，进一步将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型中进行处理，以提取出所述路由器日志记录中的各个词之间的局部语义关联特征信息，即所述路由器日志记录中关于路由器工作状态的局部隐含语义理解特征信息，从而得到第二路由器日志语义理解特征向量。

接着，进一步再融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量，以此来融合不同尺度下的关于所述路由器日志记录中的路由器工作状态语义理解特征，从而得到所述路由器日志记录中具有多尺度语义理解特征的路由器日志语义理解特征向量。然后，将所述路由器日志语义理解特征向量作为分类特征向量通过分类器中进行分类处理，以所述路由器日志记录中关于路由器的工作状态的多尺度语义理解特征来进行分类，从而得到用于表示路由器存在各种故障的概率值的分类结果。也就是，在本申请的技术方案中，所述分类器的标签为路由器存在各种故障的类型概率标签，其中，所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。应可以理解，在本申请的技术方案中，所述分类器的分类标签为所述路由器存在各种故障的类型概率标签的概率值，即所述路由器的故障类型的判断标签，因此，在得到所述分类结果后，可基于所述分类结果来进行路由器的故障类型评估判断，从而实现路由器的远程故障监控，以保证网络的稳定性。

特别地，在本申请的技术方案中，在融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量得到所述路由器日志语义理解特征向量时，为了充分利用所述第一路由器日志语义理解特征向量表达的日志上下文文本语义特征和所述第二路由器日志语义理解特征向量表达的词向量样本间局部关联信息，优选地通过直接级联所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量得到所述路由器日志语义理解特征向量，这样，就会导致级联位置存在分布间隙（distributiongap）。而另一方面，所述第一路由器日志语义理解特征向量也是通过直接级联基于转换器的上下文编码器获得的多个上下文日志词特征向量得到的，因此所述第一路由器日志语义理解特征向量内部也存在分布间隙。由此，就导致所述路由器日志语义理解特征向量的整体特征分布的连续性差，影响模型训练时的训练效果，例如训练速度和收敛准确性。

基于此，本申请的申请人对所述路由器日志语义理解特征向量

进行耿贝尔（Gumbel）正态周期性重参数化，以获得优化后的路由器日志语义理解特征向量/>

，具体表示为：

和/>

分别是特征值集合/>

的均值和方差，且/>

。

这里，所述耿贝尔正态周期性重参数化通过将所述路由器日志语义理解特征向量

的各个位置的特征值/>

转换为其概率分布的角特征表达，来基于耿贝尔（Gumbel）分布的随机性周期操作方式在特征值集合的正态分布中引入随机性的周期式分布，以获得原特征分布的具有随机性的周期式连续可微近似，从而通过特征的周期性重参数化来提高优化后的路由器日志语义理解特征向量/>

在训练时损失函数的梯度在模型中反向传播的动态连续波动能力，以提高卷积核在训练过程中的动态应用性，从而补偿所述路由器日志语义理解特征向量的特征分布的不连续对训练效果的影响。这样，能够精准地进行路由器的故障类型评估判断，从而实现路由器的远程故障监控，以保证网络的稳定性。

基于此，本申请提出了一种路由器的远程故障监控方法，其包括：获取由路由器提供的预定时间段的路由器日志记录；对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列；将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量；将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量；

融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量；以及，将所述路由器日志语义理解特征向量通过分类器以得到分类结果，所述分类结果用于表示路由器存在各种故障的概率值。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

示例性方法

图1为根据本申请实施例的路由器的远程故障监控方法中推断阶段的流程图。如图1所示，根据本申请实施例的路由器的远程故障监控方法，包括：推断阶段，包括：S110，获取由路由器提供的预定时间段的路由器日志记录；S120，对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列；S130，将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量；S140，将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量；S150，融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量；以及，S160，将所述路由器日志语义理解特征向量通过分类器以得到分类结果，所述分类结果用于表示路由器存在各种故障的概率值。

图3为根据本申请实施例的路由器的远程故障监控方法中推断阶段的架构示意图。如图3所示，在推断阶段中，首先，获取由路由器提供的预定时间段的路由器日志记录；再对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列；接着，将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量；将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量；然后，融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量；进而，将所述路由器日志语义理解特征向量通过分类器以得到分类结果，所述分类结果用于表示路由器存在各种故障的概率值。

具体地，在步骤S110中，获取由路由器提供的预定时间段的路由器日志记录。应可以理解，在实际对于路由器进行远程故障监控时，关键在于对于路由器的故障类型进行检测判断。考虑到路由器的故障类型颇多，而传统的检测方式依靠技术人员人工检测容易出现漏检、误检的情况，导致对于路由器的故障检测精准度较低。因此，在本申请的技术方案中，可通过对于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断，从而实现路由器的远程故障监控，以保证网络的稳定性。

具体地，在步骤S120中，对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列。考虑到由于所述路由器日志记录数据能够反映路由器的工作状态，但是所述路由器日志记录是以文本的形式呈现的，其中包含有大量的词组成的语义信息，也就是说，所述路由器日志记录中的各个词之间具有着上下文的语义关联特征。因此，在本申请的技术方案中，为了便于后续进行所述路由器日志记录的语义理解，以此来进行所述路由器日志记录中关于路由器工作状态的语义特征充分表达，从而进行路由器的各种故障类型的准确检测评估，需要进一步对所述路由器日志记录进行分词处理以避免后续语义理解时造成词序混乱后，将分词处理后的路由器日志记录数据通过词嵌入层以得到日志词嵌入向量的序列。特别地，这里，所述词嵌入层能够通过可学习嵌入矩阵将所述分词处理后的路由器日志记录数据中的各个词句线性投影为所述日志词嵌入向量，从而得到所述日志词嵌入向量的序列。

具体地，在步骤S130中，将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量。也就是，考虑到由于所述路由器日志记录中存在着关于路由器工作状态的语义特征信息，并且所述路由器日志记录所表示的文本数据中的各个词之间具有着上下文的语义关联关系。因此，为了能够对于路由器的工作状态进行深度充分地语义理解，在本申请的技术方案中，将所述日志词嵌入向量的序列通过基于转换器的上下文编码器中进行编码，以此来提取出所述路由器日志记录中关于路由器工作状态的基于全局的上下文语义关联特征，从而得到第一路由器日志语义理解特征向量。

图5为根据本申请实施例的路由器的远程故障监控方法中上下文编码的流程图。如图5所示，在所述上下文编码的过程中，包括：S210，将所述日志词嵌入向量的序列进行一维排列以得到全局日志特征向量；220，计算所述全局日志特征向量与所述日志词嵌入向量的序列中各个日志词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵；S230，分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵；S240，将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值；S250，分别以所述多个概率值中各个概率值作为权重对所述日志词嵌入向量的序列中各个日志词嵌入向量进行加权以得到所述多个上下文语义日志特征向量；以及,S260，将所述多个上下文语义日志特征向量进行级联以得到所述第一路由器日志语义理解特征向量。

具体地，在步骤S140中，将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量。考虑到所述路由器日志记录中关于路由器的工作状态隐含特征不仅存在于所述路由器日志记录的文本数据全局中，还存在于各个词之间的局部隐含语义关联特征信息中。也就是说，由于纯Transformer 的特征提取方法容易存在特征丢失的问题，导致对于路由器的工作状态隐含特征提取的能力较弱，容易出现误检的情况，进而降低了对于路由器故障类型检测判断的精准度。因此，在本申请的技术方案中，进一步将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型中进行处理，以提取出所述路由器日志记录中的各个词之间的局部语义关联特征信息，即所述路由器日志记录中关于路由器工作状态的局部隐含语义理解特征信息，从而得到第二路由器日志语义理解特征向量。在一个具体示例中，所述文本卷积神经网络包括相互级联的多个神经网络层，其中各个神经网络层包括卷积层、池化层和激活层。其中，在所述文本卷积神经网络的编码过程中，所述文本卷积神经网络的各层在层的正向传递过程中对输入数据使用所述卷积层进行基于卷积核的卷积处理、使用所述池化层对由所述卷积层输出的卷积特征图进行池化处理和使用所述激活层对由所述池化层输出的池化特征图进行激活处理。

图6为根据本申请实施例的路由器的远程故障监控方法中卷积神经网络编码过程的流程图如图6所示，在所述卷积神经网络编码过程中，包括：使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：S310，对输入数据进行卷积处理以得到卷积特征图；S320，对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图；以及，S330，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为过滤器的卷积神经网络的最后一层的输出为所述第二路由器日志语义理解特征向量，所述作为过滤器的卷积神经网络的第一层的输入为所述日志词嵌入向量的序列二维排列成的词嵌入特征矩阵。

具体地，在步骤S150中，融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量。也就是，在得到所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量后，进一步将两者进行特征融合以此来融合不同尺度下的关于所述路由器日志记录中的路由器工作状态语义理解特征，从而得到所述路由器日志记录中具有多尺度语义理解特征的路由器日志语义理解特征向量，在本申请的一个具体示例中，可通过级联的方式来将两者进行融合，更具体地，以如下级联公式来融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量；其中，所述公式为：

其中，/>

表示所述第一路由器日志语义理解特征向量，/>

表示所述第二路由器日志语义理解特征向量，/>

表示级联函数，/>

表示所述路由器日志语义理解特征向量。

具体地，在步骤S160中，将所述路由器日志语义理解特征向量通过分类器以得到分类结果，所述分类结果用于表示路由器存在各种故障的概率值。也就是，在本申请的技术方案中，将所述路由器日志语义理解特征向量通过分类器而用于表示路由器存在各种故障的概率值的分类结果。具体地，使用所述分类器以如下公式对所述路由器日志语义理解特征向量进行处理以获得分类结果，其中，所述公式为：

，其中，/>

到/>

为权重矩阵，/>

到/>

为偏置向量，/>

为路由器日志语义理解特征向量。具体地，所述分类器包括多个全连接层和与所述多个全连接层最后一个全连接层级联的Softmax层。其中，在所述分类器的分类处理中，使用所述分类器的多个全连接层对所述路由器日志语义理解特征向量进行多次全连接编码以得到编码分类特征向量；进而，将所述编码分类特征向量输入所述分类器的Softmax层，即，使用所述Softmax分类函数对所述编码分类特征向量进行分类处理以得到分类标签，在本申请的技术方案中，所述分类器的标签为路由器存在各种故障的类型概率标签，其中，所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。应可以理解，在本申请的技术方案中，所述分类器的分类标签为所述路由器存在各种故障的类型概率标签的概率值，即所述路由器的故障类型的判断标签，因此，在得到所述分类结果后，可基于所述分类结果来进行路由器的故障类型评估判断，从而实现路由器的远程故障监控，以保证网络的稳定性。

应可以理解，在利用上述神经网络模型进行推断之前，需要对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。也就是说，在本请的路由器的远程故障监控方法中，还包括训练模块，用于对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。

图2为根据本申请实施例的路由器的远程故障监控方法中训练阶段的流程图。如图2所示，根据本申请实施例的路由器的远程故障监控方法，还包括训练阶段，包括步骤：S1110，获取训练数据，所述训练数据包括预定时间段的训练路由器日志记录，以及，所述路由器存在各种故障的概率值的真实值；S1120，对所述训练路由器日志记录进行分词处理后通过所述词嵌入层以得到训练日志词嵌入向量的序列；S1130，将所述训练日志词嵌入向量的序列通过所述基于转换器的上下文编码器以得到训练第一路由器日志语义理解特征向量；S1140，将所述训练日志词嵌入向量的序列二维排列为训练词嵌入特征矩阵后通过所述文本卷积神经网络模型以得到训练第二路由器日志语义理解特征向量；S1150，融合所述训练第一路由器日志语义理解特征向量和所述训练第二路由器日志语义理解特征向量以得到训练路由器日志语义理解特征向量；S1160，对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量；S1170，将所述优化训练路由器日志语义理解特征向量通过所述分类器以得到分类损失函数值；以及，S1180，基于所述分类损失函数值并通过梯度下降的反向传播来对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。

图4为根据本申请实施例的路由器的远程故障监控方法中训练阶段的架构示意图。如图4所示，在训练过程中，首先，获取训练数据，所述训练数据包括预定时间段的训练路由器日志记录，以及，所述路由器存在各种故障的概率值的真实值；再对所述训练路由器日志记录进行分词处理后通过所述词嵌入层以得到训练日志词嵌入向量的序列；接着。将所述训练日志词嵌入向量的序列通过所述基于转换器的上下文编码器以得到训练第一路由器日志语义理解特征向量；将所述训练日志词嵌入向量的序列二维排列为训练词嵌入特征矩阵后通过所述文本卷积神经网络模型以得到训练第二路由器日志语义理解特征向量；然后，融合所述训练第一路由器日志语义理解特征向量和所述训练第二路由器日志语义理解特征向量以得到训练路由器日志语义理解特征向量；对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量；然后，将所述优化训练路由器日志语义理解特征向量通过所述分类器以得到分类损失函数值；进而，基于所述分类损失函数值并通过梯度下降的反向传播来对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。

在本申请的技术方案中，在融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量得到所述路由器日志语义理解特征向量时，为了充分利用所述第一路由器日志语义理解特征向量表达的日志上下文文本语义特征和所述第二路由器日志语义理解特征向量表达的词向量样本间局部关联信息，优选地通过直接级联所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量得到所述路由器日志语义理解特征向量，这样，就会导致级联位置存在分布间隙（distribution gap）。而另一方面，所述第一路由器日志语义理解特征向量也是通过直接级联基于转换器的上下文编码器获得的多个上下文日志词特征向量得到的，因此所述第一路由器日志语义理解特征向量内部也存在分布间隙。由此，就导致所述路由器日志语义理解特征向量的整体特征分布的连续性差，影响模型训练时的训练效果，例如训练速度和收敛准确性。基于此，本申请的申请人对所述路由器日志语义理解特征向量

，具体表示为：

其中，

和/>

表示以2为底的对数函数值，/>

表示反正弦函数值，/>

表示反余弦函数值，/>

表示所述优化训练路由器日志语义理解特征向量的各个位置的特征值。这里，所述耿贝尔正态周期性重参数化通过将所述路由器日志语义理解特征向量/>

的各个位置的特征值/>

综上，根据本申请实施例的路由器的远程故障监控方法被阐明，其通过采用深度学习的神经网络模型路由器的日志记录数据的文本语义特征，进一步基于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断，这样，能够实现路由器的远程故障监控，以保证网络的稳定性。

示例性***

图7为根据本申请实施例的路由器的框图。如图7所示，根据本申请实施例的路由器300，包括：信息采集模块310；词嵌入模块320；上下文编码模块330；卷积模块340；融合模块350；分类结果生成模块360。

其中，所述信息采集模块310，用于获取由路由器提供的预定时间段的路由器日志记录；所述词嵌入模块320，用于对所述路由器日志记录进行分词处理后通过词嵌入层以得到日志词嵌入向量的序列；所述上下文编码模块330，用于将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量；所述卷积模块340，用于将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量；所述融合模块350，用于融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量；以及，所述分类结果生成模块360，用于将所述路由器日志语义理解特征向量通过分类器以得到分类结果，所述分类结果用于表示路由器存在各种故障的概率值。

在一个示例中，在上述路由器300中，所述上下文编码模块330，用于：将所述日志词嵌入向量的序列进行一维排列以得到全局日志特征向量；计算所述全局日志特征向量与所述日志词嵌入向量的序列中各个日志词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵；分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵；将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值；分别以所述多个概率值中各个概率值作为权重对所述日志词嵌入向量的序列中各个日志词嵌入向量进行加权以得到所述多个上下文语义日志特征向量；以及，将所述多个上下文语义日志特征向量进行级联以得到所述第一路由器日志语义理解特征向量。

在一个示例中，在上述路由器300中，所述卷积模块340，用于：使用所述作为过滤器的卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：对输入数据进行卷积处理以得到卷积特征图；对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图；以及，对所述池化特征图进行非线性激活以得到激活特征图；其中，所述作为过滤器的卷积神经网络的最后一层的输出为所述第二路由器日志语义理解特征向量，所述作为过滤器的卷积神经网络的第一层的输入为所述日志词嵌入向量的序列二维排列成的词嵌入特征矩阵。

在一个示例中，在上述路由器300中，所述融合模块350，用于：以如下级联公式来融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量；其中，所述公式为：

，其中，/>

表示所述第一路由器日志语义理解特征向量，/>

表示所述第二路由器日志语义理解特征向量，/>

表示级联函数，/>

表示所述路由器日志语义理解特征向量。

综上，根据本申请实施例的路由器300被阐明，其通过采用深度学习的神经网络模型路由器的日志记录数据的文本语义特征，进一步基于路由器的日志数据进行分析来远程进行路由器的故障类型评估判断，这样，能够实现路由器的远程故障监控，以保证网络的稳定性。

如上所述，根据本申请实施例的路由器***可以实现在各种终端设备中。在一个示例中，根据本申请实施例的路由器可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该用于银行业务的软件性能测试***可以是该终端设备的操作***中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该路由器同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该路由器与该终端设备也可以是分立的设备，并且该路由器可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

示例性电子设备

下面，参考图8来描述根据本申请实施例的电子设备。

如图8所示，电子设备10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元（CPU）或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器（RAM）和/或高速缓冲存储器（cache）等。所述非易失性存储器例如可以包括只读存储器（ROM）、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器11可以运行所述程序指令，以实现上文所述的本申请的各个实施例的路由器的远程故障监控方法中的功能以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如路由器日志语义理解特征向量等各种内容。

在一个示例中，电子设备10还可以包括：输入装置13和输出装置14，这些组件通过总线***和/或其他形式的连接机构（未示出）互连。

该输入装置13可以包括例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息，包括分类结果等。该输出装置14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图8中仅示出了该电子设备10中与本申请有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外，本申请的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的路由器的远程故障监控方法中的功能中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本申请的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的路由器的远程故障监控方法中的功能中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子（非穷举的列表）包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种路由器的远程故障监控方法，其特征在于，包括：

获取由路由器提供的预定时间段的路由器日志记录；

将所述路由器日志语义理解特征向量通过分类器以得到分类结果，所述分类结果用于表示路由器存在各种故障的概率值；

其中，将所述日志词嵌入向量的序列通过基于转换器的上下文编码器以得到第一路由器日志语义理解特征向量，包括：

将所述日志词嵌入向量的序列进行一维排列以得到全局日志特征向量；

计算所述全局日志特征向量与所述日志词嵌入向量的序列中各个日志词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵；

分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵；

将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值；

分别以所述多个概率值中各个概率值作为权重对所述日志词嵌入向量的序列中各个日志词嵌入向量进行加权以得到所述多个上下文语义日志特征向量；以及

将所述多个上下文语义日志特征向量进行级联以得到所述第一路由器日志语义理解特征向量。

2.根据权利要求1所述的路由器的远程故障监控方法，其特征在于，将所述日志词嵌入向量的序列二维排列为词嵌入特征矩阵后通过文本卷积神经网络模型以得到第二路由器日志语义理解特征向量，包括：使用所述作为过滤器的文本卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：

对输入数据进行卷积处理以得到卷积特征图；

对所述卷积特征图进行基于特征矩阵的池化以得到池化特征图；以及

对所述池化特征图进行非线性激活以得到激活特征图；

其中，所述作为过滤器的文本卷积神经网络的最后一层的输出为所述第二路由器日志语义理解特征向量，所述作为过滤器的文本卷积神经网络的第一层的输入为所述日志词嵌入向量的序列二维排列成的词嵌入特征矩阵。

3.根据权利要求2所述的路由器的远程故障监控方法，其特征在于，融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量，包括：以如下级联公式来融合所述第一路由器日志语义理解特征向量和所述第二路由器日志语义理解特征向量以得到路由器日志语义理解特征向量；

其中，所述公式为：

；

其中，

表示所述第一路由器日志语义理解特征向量，/>

表示所述第二路由器日志语义理解特征向量，/>

表示级联函数，/>

表示所述路由器日志语义理解特征向量。

4.根据权利要求3所述的路由器的远程故障监控方法，其特征在于，还包括对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练；

其中，对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练，包括：

获取训练数据，所述训练数据包括预定时间段的训练路由器日志记录，以及，所述路由器存在各种故障的概率值的真实值；

对所述训练路由器日志记录进行分词处理后通过所述词嵌入层以得到训练日志词嵌入向量的序列；

将所述训练日志词嵌入向量的序列通过所述基于转换器的上下文编码器以得到训练第一路由器日志语义理解特征向量；

将所述训练日志词嵌入向量的序列二维排列为训练词嵌入特征矩阵后通过所述文本卷积神经网络模型以得到训练第二路由器日志语义理解特征向量；

融合所述训练第一路由器日志语义理解特征向量和所述训练第二路由器日志语义理解特征向量以得到训练路由器日志语义理解特征向量；

对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量；

将所述优化训练路由器日志语义理解特征向量通过所述分类器以得到分类损失函数值；以及

基于所述分类损失函数值并通过梯度下降的反向传播来对所述基于转换器的上下文编码器、所述文本卷积神经网络模型和所述分类器进行训练。

5.根据权利要求4所述的路由器的远程故障监控方法，其特征在于，对所述训练路由器日志语义理解特征向量进行特征分布优化以得到优化训练路由器日志语义理解特征向量，包括：

以如下优化公式对所述训练路由器日志语义理解特征向量进行耿贝尔正态周期性重参数化以得到所述优化训练路由器日志语义理解特征向量；

其中，所述优化公式为：

；

其中，

和/>

分别是所述训练路由器日志语义理解特征向量的各个位置的特征值集合的均值和方差，/>

表示以2为底的对数函数值，/>

表示反正弦函数值，/>

表示反余弦函数值，/>

6.根据权利要求5所述的路由器的远程故障监控方法，其特征在于，将所述优化训练路由器日志语义理解特征向量通过所述分类器以得到分类损失函数值，包括：使用所述分类器以如下公式对所述优化训练路由器日志语义理解特征向量进行处理以获得分类损失函数值，其中，所述公式为：

，其中，/>

到/>

为权重矩阵，/>

到/>

为偏置向量，/>

为优化训练路由器日志语义理解特征向量。

7.一种路由器，其特征在于，包括：

分类结果生成模块，用于将所述路由器日志语义理解特征向量通过分类器以得到分类结果，所述分类结果用于表示路由器存在各种故障的概率值；

其中，所述上下文编码模块，用于：将所述日志词嵌入向量的序列进行一维排列以得到全局日志特征向量；计算所述全局日志特征向量与所述日志词嵌入向量的序列中各个日志词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵；分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵；将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值；分别以所述多个概率值中各个概率值作为权重对所述日志词嵌入向量的序列中各个日志词嵌入向量进行加权以得到所述多个上下文语义日志特征向量；以及，将所述多个上下文语义日志特征向量进行级联以得到所述第一路由器日志语义理解特征向量。

8.根据权利要求7所述的一种路由器，其特征在于，所述卷积模块，用于：使用所述作为过滤器的文本卷积神经网络模型的各层在层的正向传递中分别对输入数据进行：

对输入数据进行卷积处理以得到卷积特征图；

对所述池化特征图进行非线性激活以得到激活特征图；