CN113938309A

CN113938309A - 一种基于DCGAN网络的DoS攻击流量生成***及方法

Info

Publication number: CN113938309A
Application number: CN202111266058.7A
Authority: CN
Inventors: 朱召鹏; 王文庆; 杨东; 曾荣汉; 崔鑫; 王艺杰; 刘迪; 刘骁
Original assignee: Xian Thermal Power Research Institute Co Ltd; Huaneng Group Technology Innovation Center Co Ltd
Current assignee: Xian Thermal Power Research Institute Co Ltd; Huaneng Group Technology Innovation Center Co Ltd
Priority date: 2021-10-28
Filing date: 2021-10-28
Publication date: 2022-01-14

Abstract

本发明公开了一种基于DCGAN网络的DoS攻击流量生成***及方法，该***包括真实流量采集模块、DCGAN网络和流量生成模块；真实流量采集模块用于提取真实流量序列的典型流量特征，并将得到的特征矩阵用于构建训练数据；DCGAN网络用于学习训练数据中各向量的分布概率规律，结合高斯噪声以生成具有相似规律的结果数据；流量生成模块将DCGAN网络中生成器生成的数据作为流量特征进行流量构建。本发明能够有效的生成具有高度伪装性DoS攻击流量。

Description

一种基于DCGAN网络的DoS攻击流量生成***及方法

技术领域

本发明属于网络安全技术领域，具体涉及一种基于DCGAN网络的DoS攻击流量生成***及方法。

背景技术

网络攻击行为的模拟仿真对于网络安全***和设备的防护性能评估具有重要意义，而网络攻击流量的模拟生成是攻击行为仿真过程中的关键一环。

直接通过网络攻击代码生成攻击流量，虽然具有完全反映攻击行为特征的优势，但存在以下三个问题：首先，网络攻击代码样本可及性差，高危代码往往难以获得。其次，通过攻击代码生成攻击流量依赖于特定的软硬件环境，流量生成的成本高昂。最后，这种方式下的攻击过程难以控制，有可能“假戏真做”。

发明内容

为了克服上述现有技术存在的不足，本发明的目的在于提供一种基于DCGAN网络的DoS攻击流量生成***及方法，能够有效的生成具有高度伪装性DoS攻击流量。

为了实现上述目的，本发明采用的技术方案是：

一种基于DCGAN网络的DoS攻击流量生成***，包括：真实流量采集模块、DCGAN网络和流量生成模块；

所述真实流量采集模块用于提取真实流量序列的典型流量特征，并将得到的特征矩阵用于构建训练数据；

所述DCGAN网络用于学习训练数据中各向量的分布概率规律，结合高斯噪声以生成具有相似规律的结果数据；

所述流量生成模块将DCGAN网络中生成器生成的数据作为流量特征进行流量构建。

进一步地，真实流量采集模块中选择八种典型数据包特征进行提取，包括：时间、序号、所用协议、原始IP、目的IP、原始端口、目的端口和数据包载荷。

进一步地，DCGAN网络由生成器和判别器构成，其中生成器通过接收高斯噪声数据以生成初始的生成数据；判别器评估所接收的输入是否为真实流量特征，并根据损失函数对生成器参数予以调整。

进一步地，由于DCGAN网络原是用于生成三维图片，而本发明中训练数据维度为八维。因此本发明中将DCGAN网络中构成生成器和判别器的顶层和底层CNN卷积块的维度由原来的3增加到8。

进一步地，流量生成模块中的流量生成工具选择netsniff-ng套件中的trafgen，其是一款linux下的开源、高速、多线程的网络数据包生成工具。

所述的基于DCGAN网络的DoS攻击流量生成***的工作方法，包括如下步骤：

步骤1：真实流量采集模块将真实流量数据包按到达时间进行排序，然后将每4096个连续数据包截取作为一个样本；

步骤2：解码样本中的数据包包头信息，由每个数据包得到一个八维的特征元祖，包括时间，序号，所用协议，原始IP，目的IP，原始端口，目的端口和数据包载荷；因此，对于每个样本，得到一个4096*7的特征矩阵；

步骤3：步骤2得到的特征矩阵中时间、所用协议、原始IP和目的IP对应元素用于神经网络计算前需要先格式转换成数值；其中所用协议特征对应UDP和TCP中的一个，采取One-Hot编码将特征矩阵进行数值化，时间、原始IP和目的IP特征通过进制转换成十进制数值；

步骤4：对步骤3得到的特征矩阵进行归一化，即将所有数值映射到(-1,1)区间上；

步骤5：DCGAN网络中生成器通过接收高斯噪声数据以生成初始的生成数据；判别器评估所接收的输入是否为真实流量特征，并根据如下损失函数对生成器参数予以调整；

假定用于生成的噪声分布是P_z(z)，真实数据分布是P_x(x)，同时生成器和判别器分别为G和D，则DCGAN网络的目标即损失函数描述如下：

其中，D(x)表示判别器认定x来源于真实数据的分布概率，其值介于0与1之间，越接近1表明判别器越相信样本为真，反之为假；

表示判别器对所有属于真实数据分布P_x(x)的样本x判定为真的平均概率期望；G(z)表示噪声经过生成器后生成的样本，D(G(z))则是判别器认定生成样本属于真实样本的概率，

表示判别器对所有属于通过噪声经过生成器后生成的样本G(z)判定为假的平均概率期望，min_Gmax_DV(D,G)表示判别器D的目标是最小化优化目标，而生成器G的目标是最大化优化目标；

当生成器生成的数据和真实流量采集得到的特征数据输入判别器后，判别器将根据损失函数计算当前的损失大小，并根据损失大小通过梯度下降对生成器的参数予以更新；通过重复这一过程，网络损失值将趋于稳定，直至判别器对于任意输入，认定其为“真”的概率均为0.5，也即无法将生成器生成的数据和真实数据进行区分，此时DCGAN网络达到收敛状态；

步骤6：当流量生成模块中的流量生成工具收到已收敛的DCGAN网络中生成器生成的特征数据后，将通过开源工具trafgen将特征数据还原为DoS攻击流量。

本发明的有益效果：

本发明中使用DCGAN网络模型学习真实流量的分布概率规律，该网络采用无监督学习训练方式，网络的样本输入仅有采集的真实流量特征数据，无需对立样本，也不需要样本标签，这大大降低了样本数据构建过程的难度和工作量。此外，相比其他基于马尔科夫过程的生成模型，如玻尔茨曼机等在生成数据时需要迭代多次，本发明只需要运行一次即可得到结果。

本发明所提供的一种基于DCGAN网络的DoS攻击流量生成***，能够以较低的软硬件配置模拟生成较大规模的具有真实流量特征的DoS攻击流量，实现低成本的各类安全产品的DoS防护等级测试。

附图说明

图1是本发明基于DCGAN网络的DoS攻击流量生成***组成原理图。

图2是本发明中真实流量采集模块工作流程图。

具体实施方式

下面结合附图对本发明作进一步详细说明。

如图1所示，基于DCGAN网络的DoS攻击流量生成***包括真实流量采集模块、DCGAN网络和流量生成模块；

其中，真实流量采集模块用于提取真实流量序列的典型流量特征，并将得到的特征矩阵用于构建训练数据。所述DCGAN网络用于学习训练数据中各向量的分布概率规律，结合高斯噪声以生成具有相似规律的结果数据。所述流量生成模块将DCGAN网络中生成器生成的数据作为流量特征进行流量构建。

真实流量采集模块工作过程如图2所示：

1.将真实流量数据包按到达时间进行排序，然后将每4096个连续数据包截取作为一个样本。

2.解码样本中的数据包包头信息，由每个数据包可以得到一个八维的特征元祖，包括时间，序号，所用协议，原始IP，目的IP，原始端口，目的端口和数据包载荷。因此，对于每个样本，可以得到一个4096*8的特征矩阵。

3.步骤2得到的特征矩阵中时间、所用协议、原始IP和目的IP对应元素用于神经网络计算前需要先格式转换成数值。“所用协议”特征对应UDP和TCP中的一个，可采取机器学习领域的常用操作——“One-Hot编码”

将特征矩阵进行数值化。其他三种特征通过进制转换成十进制数值。

4.为了加速网络的收敛，提升网络训练效果，需要对步骤3得到的特征矩阵进行归一化，即将所有数值映射到(-1,1)区间上。

如图1所示，DCGAN网络结构与GAN网络一致，仍由生成器和判别器构成，其中生成器通过接收高斯噪声数据以生成初始的生成数据；判别器评估所接收的输入是否为真实流量特征，并根据损失函数对生成器参数予以调整。

假定用于生成的噪声分布是P_z(z)，真实数据分布是P_x(x)，同时生成器和判别器分别为G和D，则DCGAN网络的目标即损失函数可以描述如下：

当生成器生成的数据和真实流量采集得到的特征数据输入判别器后，判别器将根据上面的损失函数计算当前的损失大小，并根据损失大小通过梯度下降对生成器的参数予以更新。通过重复这一过程，网络损失值将趋于稳定，直至判别器对于任意输入，认定其为“真”的概率均为0.5，也即无法将生成器生成的数据和真实数据进行区分，此时DCGAN网络达到收敛状态。

当流量生成模块中的流量生成工具收到已收敛的DCGAN网络中生成器生成的特征数据后，将通过开源工具trafgen将特征数据还原为DoS攻击流量。

Claims

1.一种基于DCGAN网络的DoS攻击流量生成***，其特征在于：包括真实流量采集模块、DCGAN网络和流量生成模块；

2.根据权利要求1所述的基于DCGAN网络的DoS攻击流量生成***，其特征在于：所述真实流量采集模块中选择八种典型数据包特征进行提取，包括：时间、序号、所用协议、原始IP、目的IP、原始端口、目的端口和数据包载荷。

3.根据权利要求1所述的基于DCGAN网络的DoS攻击流量生成***，其特征在于：所述DCGAN网络由生成器和判别器构成，其中生成器通过接收高斯噪声数据以生成初始的生成数据；判别器评估所接收的输入是否为真实流量特征，并根据损失函数对生成器参数予以调整。

4.根据权利要求1所述的基于DCGAN网络的DoS攻击流量生成***，其特征在于：所述DCGAN网络中构成生成器和判别器的顶层和底层CNN卷积块的维度为八维。

5.根据权利要求1所述的基于DCGAN网络的DoS攻击流量生成***，其特征在于：所述流量生成模块中的流量生成工具选择netsniff-ng套件中的trafgen，trafgen是一款linux下的开源、高速、多线程的网络数据包生成工具。

6.权利要求1至5任一项所述的基于DCGAN网络的DoS攻击流量生成***的工作方法，其特征在于：包括如下步骤：