CN112949821B

CN112949821B - 基于双重注意力机制的网络安全态势感知方法

Info

Publication number: CN112949821B
Application number: CN202110116477.6A
Authority: CN
Inventors: 赵冬梅; ***; 宋会倩; 王方伟; 王长广
Original assignee: Hebei Normal University
Current assignee: Hebei Normal University
Priority date: 2021-01-28
Filing date: 2021-01-28
Publication date: 2024-02-02
Anticipated expiration: 2041-01-28
Also published as: CN112949821A

Abstract

本发明公开了一种基于双重注意力机制的网络安全态势感知方法。该方法利用入侵活动是一个时间序列事件，采用RNN或RNN的变体来堆叠模型；利用特征分离技术预处理样本数据，减少了模型训练的时间和成本；根据全局注意力机制技术，设计有限注意力模块，将有限注意力和全局注意力形成双重注意力机制来做态势预测，提高了预测准确度。

Description

基于双重注意力机制的网络安全态势感知方法

技术领域

本发明涉及一种网络安全态势感知方法，尤其涉及一种基于双重注意力机制的网络安全态势感知方法，属于网络安全技术领域。

背景技术

随着Internet技术越来越普及，面临的安全问题也日渐显露。面对当前严重的网络安全威胁，传统的入侵检测等技术虽然从一定程度上提高了网络的安全性，但是技术不全面，对网络的整体评估是不足够的。当前，很多研究者使用深度学习相关的算法研究网络安全态势感知，特别是针对数据具有时间序列关系的特点，例如使用循环神经网络(Recurrent Neural Network,RNN)以及它的变体长短期记忆网络(Long Short-TermMemory Network，LSTM)和门控循环单元网络(Gated Recurrent Unit，GRU)来做网络安全态势预测。但是，单独使用RNN以及它的变体网络，预测准确度不够高。因此，提高网络安全态势预测的准确度成了急需解决的问题。

发明内容

本发明要解决的技术问题是提供一种基于双重注意力机制的网络安全态势感知方法。

为解决上述技术问题，本发明采用的技术方案是：一种基于双重注意力机制的网络安全态势感知方法，包括如下步骤：

步骤1：搭建网络安全态势感知模型：所述网络安全态势感知模型包括数据预处理模块、神经网络、切片操作层、注意力层1、注意力层2、预测模块和启动层；所述神经网络为以RNN、LSTM或GRU为基本单元m级以上按时间展开的堆叠模型，m≥1；所述注意力层1和注意力层2的结构相同，包括注意力分布形成层、注意力汇聚层和输出层，输出层的输入端分别连接注意力汇聚层和启动层的输出端；所述启动层的输入端分别连接启动控制特征future输入端和第m级堆叠模型输出层的控制端，其输出端分别向所述注意力层1和注意力层2输出第一隐藏特征h₁和第二隐藏特征h₂；所述注意力层1的注意力分布形成层的输入端分别与所述神经网络各级堆叠模型的输出端、启动层的相应输出端连接；所述注意力层1的注意力汇聚层的输入端分别与所述神经网络各级堆叠模型的输出端、注意力层1的注意力分布形成层的输出端连接；所述切片操作层的输入端分别连接第m级堆叠模型各隐含层的控制端，其输出端的数目k小于输入端的数目，其输入端的数目与所述神经网络的隐藏层层数相同；所述切片操作层通过切片操作得到k个特征向量

其中，为模型第j层输出的隐藏层特征；

所述注意力层2的注意力分布形成层的输入端分别与切片操作层的各输出端、启动层的相应输出端连接；所述注意力层2的注意力汇聚层的输入端分别与所述切片操作层的各输出端、注意力层2的注意力分布形成层的输出端连接；预测模块包括融合特征信息层和全连接层；融合特征信息层的输入端分别连接注意力层1和注意力层2的输出端，全连接层的输出端输出态势预测结果；

步骤2：样本数据特征分离预处理：样本数据在输入网络安全态势感知模型之前需要进行特征分离预处理，包括以下步骤：

步骤A：特征分类：将第i个样本x_i里面的特征分为数值型特征、非数值型特征；

步骤B：数值型特征处理：将数值型特征进行标准化处理；

步骤C：非数值型特征处理：将非数值型特征转化为数值型特征；包括以下步骤：

步骤C-1：词向量形成的矩阵转换为特征矩阵：

其中，是各个非数值型特征的词向量形成的矩阵，/>是一个第j个非数值型特征的词向量，n表示有n个非数值型特征；w为权值矩阵，b为偏置向量；

步骤C-2：特征求取：

其中，h_ij为公式(2)中特征向量h_i中的每一个特征值；

步骤3：网络安全态势感知模型训练：将训练集中与各入侵活动对应的时间序列样本及网络安全态势输入网络安全态势感知模型，训练模型参数；

步骤4：预测网络安全态势感知：将预测集中入侵活动对应的时间序列样本输入所述步骤1训练完成的网络安全态势感知模型，预测网络安全态势。

进一步，所述注意力层1，通过全局注意力机制得到全局注意力特征向量c₁，然后使用串联算子concat将全局注意力特征向量c₁和第一隐藏特征h₁进行特征融合，得到特征向量

在注意力层2，通过有限注意力机制得到有限注意力特征向量c₂，然后使用串联算子concat将有限注意力特征向量c₂和第二隐藏特征h₂进行特征融合，得到特征向量

和/>执行求和操作再次融合特征信息，得到用于预测网络安全的特征向量/>

采用上述技术方案所取得的技术效果在于：

(1)本发明与单独使用基于RNN、LSTM或GRU(Gated recurrent unit)相比，双重注意力机制技术有更高的预测准确度；

(2)本发明与使用传统的one-hot技术做数据预处理相比，使用特征分离技术可以减少模型学习的参数，从而节约内存和训练时间。

附图说明

图1是本发明中的网络安全态势感知模型结构图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步详细的说明。

如图1所示，一种基于双重注意力机制的网络安全态势感知方法，包括如下步骤：

其中，为模型第j层输出的隐藏层特征；

步骤B：数值型特征处理：将数值型特征进行标准化处理；

步骤C-1：词向量形成的矩阵转换为特征矩阵：

步骤C-2：特征求取：

其中，h_ij为公式(2)中特征向量h_i中的每一个特征值；

如果使用n个非数值型特征，那么可以用矩阵拟合出n个特征。通过(2)式得到的h_i仅仅是一个形状为(n，n)的矩阵。为了拟合出n个数值型特征，矩阵h_i可以按行求和或者按行求和之后求均值，拟合出了n个特征，具体操作如(5)式所示。

样本输入后，可以分别得到第m级堆叠模型各隐藏层的隐藏特征神经网络输出层的特征/>通过切片操作得到的特征向量/>注意力层1和注意力层2计算注意力分布α₁和α₂的方式相同，计算方式的本质就是常用的sotfmax函数。注意力层1的注意力分布α₁的计算方法为：

神经网络输出层的特征是在不同时间下提取到的源隐藏特征，h₁是用于计算得分的第一隐藏特征。根据计算得到的注意力分布，可以求得神经网络输出层的特征/>和通过切片操作得到的特征向/>的权重平均，分别为全局注意力特征向量c₁和有限注意力特征向量c₂。

通过全局注意力机制得到全局注意力特征向量c₁，然后使用串联算子concat将全局注意力特征向量c₁和第一隐藏特征h₁进行特征融合，得到特征向量

Claims

1.一种基于双重注意力机制的网络安全态势感知方法，其特征在于：包括如下步骤：

其中，为模型第j层输出的隐藏层特征；

步骤B：数值型特征处理：将数值型特征进行标准化处理；

步骤C-1：词向量形成的矩阵转换为特征矩阵：

步骤C-2：特征求取：

其中，h_ij为公式(2)中特征向量h_i中的每一个特征值；

2.根据权利要求1所述的基于双重注意力机制的网络安全态势感知方法，其特征在于：所述注意力层1，通过全局注意力机制得到全局注意力特征向量c₁，然后使用串联算子concat将全局注意力特征向量c₁和第一隐藏特征h₁进行特征融合，得到特征向量