CN111669396A

CN111669396A - 一种软件定义物联网自学习安全防御方法及***

Info

Publication number: CN111669396A
Application number: CN202010539844.9A
Authority: CN
Inventors: 沈士根; ***; 周海平; 冯晟; 胡珂立; 赵利平
Original assignee: University of Shaoxing
Current assignee: University of Shaoxing
Priority date: 2020-06-15
Filing date: 2020-06-15
Publication date: 2020-09-15
Anticipated expiration: 2040-06-15
Also published as: CN111669396B

Abstract

本发明公开了一种软件定义物联网自学习安全防御方法及***。方法包括(1)嗅探获取软件定义物联网节点发送的包含于介质访问控制层和网络层之间的数据包；(2)进行网络安全特征提取并编码；(3)对网络安全特征值的编码进行聚类；(4)将每一类别与已知安全网络安全特征编码集合、以及已知风险网络安全特征值编码集合中的元素进行比对自动判定并更新；(5)对于未知网络安全特征编码，由网络安全专家组成员鉴定并更新。***包括：嗅探模块、分析模块、检测防御模块、以及知识库；本发明有效减轻了物联网管理员的物联网节点配置管理工作，并且自动更新软件定义物联网安全防御***，对软件定义物联网网络环境的动态变化实现自适应。

Description

一种软件定义物联网自学习安全防御方法及***

技术领域

本发明属于物联网安全技术领域，更具体地，涉及一种软件定义物联网自学习安全防御方法及***。

背景技术

当前，物联网已广泛应用于智慧家居、车联网、工业互联网、智慧城市等诸多领域。但是，面对复杂的应用需求，物联网存在多方面网络管理问题，如物联网节点维护问题、节点软件***更新问题、增加新节点后的网络拓扑变化问题等。在网络空间安全方面同样存在不少问题，例如，物联网节点已成为恶意攻击者发动分布式拒绝服务攻击的主要源设备。

“软件定义物联网”建立在“软件定义网络”架构基础上，体现控制与转发分离的思想。使用“软件定义物联网”，能适应不同的物联网各层通信协议，有效减轻物联网节点配置管理工作，从而降低物联网运营成本，创造更多效益。同时，“软件定义物联网”中的控制器实现了物联网节点的集中控制，且拥有比物联网节点更强劲的计算能力，因此，原来物联网中难以付诸实施的安全防御***能方便地部署到控制器中，从而有效增强对包括分布式拒绝服务攻击在内的各种物联网恶意攻击的防御能力。

相对于其他的网络，“软件定义物联网”网络拓扑结构、“软件定义物联网”网关节点中正在运行的服务、“软件定义物联网”网关节点中的开放端口等网络环境动态变化更快。例如，新的物联网节点可能随时会加入或退出，这些新加入的物联网节点可能是恶意的。面对“软件定义物联网”网络环境的动态变化特点，使用人工方式更新“软件定义物联网”安全防御***不仅大大增加了物联网管理员的负担，同时很难跟上“软件定义物联网”网络环境变化的步伐，使得“软件定义物联网”安全防御***经常处于过期状态。为了满足“软件定义物联网”安全防御***能可靠地保障“软件定义物联网”安全运行的需求，迫切需要“软件定义物联网”安全防御***能具备自学习能力，从而对“软件定义物联网”网络环境的动态变化能实现自适应。

当前，关于物联网安全防御***，不同的机构公开了一些方法。专利申请文件CN106713301A公开了一种面向智能终端的物联网安全防御***，该***包括部署于云服务前端的物联网安全网关，所述物联网安全网关包括云服务管理模块、接入终端管理模块、身份认证模块、以及安全策略库。专利申请文件CN108111542A公开了一种基于“软件定义物联网”DDoS攻击防御方法，该方法通过“软件定义物联网”网关收集物联网中不同的物联网设备节点发送的网络流量，再通过“软件定义物联网”应用服务器分析判断物联网中是否存在DDoS攻击，然后，“软件定义物联网”控制器集群根据分析结果协调“软件定义物联网”网关来缓解物联网DDoS攻击。专利申请文件CN108881322A公开了一种物联网***应对DDOS攻击的防御***及方法，该***将物联网终端接入两个以上平行工作且与同一个数据库连接的服务器组，这样，即使一个服务器组被攻击或者宕机，***仍能正常工作且不受影响。专利申请文件CN110113350A公开了一种物联网***安全威胁监测与防御***，该***包括流量异常分析***、物联网终端异常分析***、业务异常分析***、HTTP异常分析***、以及威胁检测与情报生成***。专利申请文件CN111010384A公开了一种物联网终端自我安全防御***及其安全防御方法，该***包括用于实时监控物联网终端***并传递信息至安全防御模块的安全监控模块，以及利用配合终端***的分析模型对传递的信息进行比对、并基于比对结果进行处理的安全防御模块。

综上，现有的物联网安全防御***要么未采用软件定义网络架构，要么不具备自学习能力。这样，导致物联网节点配置管理工作强度大、以及物联网管理员防御恶意网络行为负担重的问题，并且存在难以部署对计算资源要求较高的安全防御***、以及部署的安全防御***经常处于过期状态的技术缺陷。

发明内容

针对现有技术的以上缺陷或改进需求，本发明提供了一种软件定义物联网自学习安全防御方法及***，其目的在于采用软件定义物联网架构、稀疏自编码神经网络自学习数据包特征技术、以及聚类算法聚类数据包特征技术，有效减轻物联网管理员的物联网节点配置管理工作和恶意网络行为防御负担，使软件定义物联网安全防御***具备自学习能力，由此解决难以部署对计算资源要求较高的安全防御***、以及部署的安全防御***经常处于过期状态的技术问题。

为实现上述目的，按照本发明的一个方面，提供了一种软件定义物联网自学习防御方法，包括以下步骤：

(1)嗅探获取软件定义物联网节点发送的包含于介质访问控制层和网络层之间的所有数据包，获得数据包集合：

其中，

表示第i个数据包；

(2)对步骤(1)中获取的数据包集合

中的每个数据包进行网络安全特征提取，并采用稀疏自编码器进行编码，获得所有数据包的各个网络安全特征值对应的编码；

(3)对于步骤(2)中获取的数据包的各个网络安全特征值的编码进行聚类，获得编码类别集合Cluster＝{cs₁，cs₂，…，cs_m}，其中cs_i表示聚类集合Cluster中的第i个聚类，m表示聚类集合Cluster中的聚类个数；

(4)将步骤(3)中获得的编码类别集合Cluster中的每一类别cs_i与已知安全网络安全特征编码集合Nom、以及已知风险网络安全特征值编码集合Mal中的元素进行比对，自动判定所述分析模块提交的编码为安全网络安全特征编码、风险网络安全特征值编码、或未知网络安全特征编码，并将安全网络安全特征编码和风险网络安全特征编码分别追加到已知安全网络安全特征编码集合Nom、以及已知风险网络安全特征值编码集合Mal中，对于风险网络安全特征值编码执行预设的防御动作，收集未知网络安全特征编码形成未知网络安全特征编码集合Diff；

(5)对于步骤(4)中获得的未知网络安全特征编码集合Diff，由网络安全专家组成员鉴定其中的每一个元素是否为安全的软件定义物联网网络行为，若鉴定为安全，则将该元素追加到已知安全网络安全特征值编码集合Nom中，否则将该元素追加到已知风险数据包编码集合Mal中并设定其预设的防御动作。

优选地，所述软件定义物联网自学习防御方法，其步骤(2)包括：

(2-1)对于数据包

采用网络安全监控工具抽取其中网络安全特征，例如采用公开源代码的Zeek网络安全监控工具抽取，并根据网络安全特征与整数的映射关系，将

的网络安全特征值映射为整数，组成数据包网络安全特征值集合

即：

其中

为第i个实际嗅探到的数据包

的网络安全特征向量，

其中

为第i个实际嗅探到的数据包

的第j个网络安全特征，n表示第i个实际的数据包

的网络安全特征向量

所具有的网络安全特征个数；

为网络安全特征

对应的网络安全特征值，

为整数。

(2-2)对于步骤(2-1)中获取的数据包网络安全特征值集合

采用稀疏自编码器进行编码，获得数据包网络安全特征值集合

中每一个数据包网络安全特征值对应的编码，组成数据包编码集合

优选地，所述软件定义物联网自学习防御方法，其步骤(2-2)具体为：

(2-2-1)对于步骤(2-1)中获取的数据包网络安全特征值集合

中的每一元素

进行归一化处理获得归一化后的网络安全特征值

其中，

表示

的最大值；

(2-2-2)对于步骤(2-2-1)获得归一化后的网络安全特征值

采用稀疏自编码器编码，获得每一个数据包网络安全特征值对应的编码，所有数据包网络安全特征值对应的编码组成数据包编码集合

优选地，所述软件定义物联网自学习防御方法，其所述稀疏自编码器优选稀疏自编码神经网络，按照如下方法训练获取：

学习样本收集：仿真建立的安全软件定义物联网环境，与步骤(1)相同的嗅探获取的节点发送的包含于介质访问控制层和网络层之间的所有数据包，获得仿真数据包集合：Δ＝{Packet₁，Packet₂，Packet₃，…}，其中，Packet_i表示第i个仿真数据包；与步骤(2-1)相同的获取仿真数据包Packet_i的网络安全特征，组成仿真的数据包网络安全特征值集合Θ；即Θ＝{Feature₁，Feature₂，Feature₃，…}，Feature_i为第i个嗅探到的仿真数据包Packet_i的网络安全特征向量，Feature_i＝{f_i1，f_i2，f_i3，…，f_in}，其中f_ij为第i个嗅探到的仿真数据包Packet_i的第j个网络安全特征，n表示第i个仿真数据包Packet_i的网络安全特征向量Feature_i所具有的网络安全特征个数；z_ij为网络安全特征f_ij对应的网络安全特征值，z_ij为整数；与步骤(2-2-1)相同的获取数据包网络安全特征值集合Θ中的每一元素z_ij，进行归一化处理获得归一化后的网络安全特征值

其中，

表示z_ij的最大值；

稀疏自编码神经网络模型：包括输入层、隐含层和输出层；其输入层具有与数据包网络安全特征向量具有的网络安全特征值的个数相同的输入神经元，即具有数量为n的输入神经元，第k个输入神经元的值为相应归一化后的仿真数据包的网络安全特征值，即对于输入神经元集合in＝{α₁，α₂，α₃，…，α_k，…α_n}，k＝1，2，...n，其中α_k为稀疏自编码神经网络输入层中第k个输入神经元的值，有：α_k＝g_ik；对于隐含层中第l个神经元，其值h_l为：h_l＝∑_nα_kq_kl+b_kl，其中q_kl表示权值分量，b_kl表示偏置分量；具有与数据包网络安全特征向量具有的网络安全特征值的个数相同的输出神经元，即具有数量为n的输出神经元，对于输出神经元集合out＝{β₁，β₂，β₃，…，β_k，…β_n}，k＝1，2，...n，其中β_k为稀疏自编码神经网络输出层中第k个输出神经元的值，β_k＝∑_lh_lq_kl+b_kl。

稀疏自编码神经网络模型的训练：采用无监督学习，将损失函数最小时的稀疏自编码神经网络模型作为稀疏自编码器；所述损失函数L(IN，OUT)为：

其中IN为仿真数据包集合所有元素输入稀疏自编码神经网络模型的网络安全特征值集合，OUT为仿真数据包集合所有元素由稀疏自编码神经网络模型的输出的编码集合，|OUT|表示集合OUT中所有元素的个数，即|OUT|为仿真数据包个数与n的乘积；当损失函数L(IN，OUT)取最小值时，所述神经网络模型的权值分量和偏置分量分别构成权值向量Q和偏置向量B，即：

Q＝[q₁₁ q₁₂ q₁₃ … q_1l … q₂₁ q₂₂ q₂₃ … q_2l …]，

B＝[b₁₁ b₁₂ b₁₃ … b_1l … b₂₁ b₂₂ b₂₃ … b_2l …]。

优选地，所述软件定义物联网自学习防御方法，其步骤(3)采用凝聚层次聚类算法进行聚类。

优选地，所述软件定义物联网自学习防御方法，其步骤(4)具体为：

对于步骤(3)中获得的编码类别集合Cluster中的每一类别cs_i，获取其中心值，与所有已知安全网络安全特征值编码集合Nom中的所有元素值进行比对，如果所述已知安全网络安全特征值编码集合Nom中存在至少一个元素与该类别网络安全特征值编码的中心值相同，则将该类别所有的网络安全特征值编码{e₁，e₂，e₃，…}追加到已知安全网络安全特征值编码集合Nom中；否则，将该类别中的所有元素{e₁，e₂，e₃，…}与已知风险网络安全特征值编码集合Mal中的所有元素进行比对：对于该类别中每一元素，如果已知风险网络安全特征值编码集合Mal中存在至少一个元素与该元素的值相同，则将该元素追加到已知风险网络安全特征值编码集合中并执行预先设定的防御动作，否则将该网络安全特征值编码加入到未知网络安全特征值编码集合Diff中。

优选地，所述软件定义物联网自学习防御方法，其所述已知安全网络安全特征值编码集合Nom优选初始化方法如下：将稀疏自编码器的学习样本采用稀疏自编码器的编码组成的集合OUT作为初始已知安全网络安全特征值编码集合Nom。

按照本发明的另一个方面，提供了一种软件定义物联网自学习安全防御***，其包括：嗅探模块、分析模块、检测防御模块、以及知识库；

所述嗅探模块，与软件定义物联网相连，用于嗅探获取软件定义物联网节点发送的包含于介质访问控制层和网络层之间的所有数据包，并将所述数据包提交给分析模块；

所述分析模块，用于提取所述数据包的网络安全特征，并采用稀疏自编码器进行编码，获得每个数据包的各个网络安全特征值对应的编码并提交给检测防御模块；

所述检测防御模块，用于将所述分析模块提交的编码进行聚类分析，并与已知安全网络安全特征编码集合Nom中的元素、以及已知风险网络安全特征值编码集合Mal中的元素进行比对，自动判定所述分析模块提交的编码是否为安全网络安全特征编码、风险网络安全特征值编码、或未知网络安全特征编码，并将安全网络安全特征编码和风险网络安全特征编码提交给知识库，对于风险网络安全特征值编码执行预设的防御动作，收集未知网络安全特征编码形成未知网络安全特征编码集合Diff提交给专家处理模块；

所述专家处理模块，用于对未知网络安全特征编码集合Diff每一个元素进行人工鉴定，手动判定所述分析模块提交的编码是否为安全网络安全特征编码、风险网络安全特征值编码，并将安全网络安全特征编码和风险网络安全特征编码提交给知识库，对于风险网络安全特征值编码设置防御动作执行并提交给知识库；

所述知识库，用于存储已知安全网络安全特征编码集合Nom、以及已知风险网络安全特征值编码集合Mal，并用于收集所述检测防御模块和专家处理模块提交的安全网络安全特征编码、以及风险网络安全特征值编码，并将其分别追加到已知安全网络安全特征编码集合Nom、以及已知风险网络安全特征值编码集合Mal中，对于专家处理模块提交的风险网络安全特征值编码，将专家处理模块设置的其相应防御动作，作为该已知风险网络安全特征值的预设的防御动作。

优选地，所述软件定义物联网自学习安全防御***，其所述分析模块内置：

Zeek网络安全监控工具，用于提取所述数据包的网络安全特征；

映射表，用于将Zeek网络安全监控工具提取的网络安全特征映射为整数的数据包网络安全特征值

按照如下方法生成：

对于Zeek网络安全监控工具提取的网络安全特征的所有可能值进行排列，使得其相应的数据包网络安全特征值从整数1开始顺序赋值，即：

zeek₁＝1，zeek₂＝2，zeek₃＝3，…

其中zeek_i为Zeek网络安全监控工具提取的网络安全特征第i个可能的值。

归一化工具，用于将数据包网络安全特征值z_ij进行归一化处理获得归一化后的网络安全特征值

稀疏自编码器，即稀疏自编码神经网络，其具有数量为n的输入神经元，第k个输入神经元的值为相应归一化后的仿真数据包的网络安全特征值，即对于输入神经元集合in＝{α₁，α₂，α₃，…，α_k，…α_n}，k＝1，2，...n，其中α_k为稀疏自编码神经网络输入层中第k个输入神经元的值，有：

对于隐含层中第l个神经元，其值h_l为：h_l＝∑_nα_kq_kl+b_kl，其中q_kl表示权值分量，b_kl表示偏置分量；具有与数据包网络安全特征向量具有的网络安全特征值的个数相同的输出神经元，即具有数量为n的输出神经元，对于输出神经元集合out＝{β₁，β₂，β₃，…，β_k，…β_n}，k＝1，2，...n，其中β_k为稀疏自编码神经网络输出层中第k个输出神经元的值，β_k＝∑_lh_lq_kl+b_kl；权值分量和偏置分量分别构成权值向量Q和偏置向量B，即：

优选地，所述软件定义物联网自学习安全防御***，其所述检测防御模块，用于将所述分析模块提交的编码采用凝聚层次聚类算法进行聚类分析。

总体而言，通过本发明所构思的以上技术方案与现有技术相比，能够取得下列有益效果：

本发明采用软件定义物联网架构，解决了计算资源要求较高的安全防御***部署问题，同时，有效减轻了物联网管理员的物联网节点配置管理工作；通过稀疏自编码神经网络自学习数据包特征技术、以及凝聚层次聚类算法聚类数据包特征技术，使软件定义物联网安全防御***具备自学习能力，有效减轻了物联网管理员的恶意网络行为防御负担，并且自动更新软件定义物联网安全防御***，对软件定义物联网网络环境的动态变化实现自适应。

附图说明

图1是本发明提供的软件定义物联网自学习防御方法流程示意图；

图2是本发明提供的软件定义物联网自学习防御***结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术网络安全特征只要彼此之间未构成冲突就可以相互组合。

本发明提供的软件定义物联网自学习防御方法，如图1所示，包括以下步骤：

其中，

表示第i个数据包；

(2)对步骤(1)中获取的数据包集合

所述数据包网络安全特征按照以下方法进行网络安全特征提取：

(2-1)对于数据包

即：

其中

为第i个实际嗅探到的数据包

的网络安全特征向量，

其中

为第i个实际嗅探到的数据包

的第j个网络安全特征，n表示第i个实际的数据包

的网络安全特征向量

所具有的网络安全特征个数；

为网络安全特征

对应的网络安全特征值，

为整数。

(2-2)对于步骤(2-1)中获取的数据包网络安全特征值集合

具体步骤如下：

(2-2-1)对于步骤(2-1)中获取的数据包网络安全特征值集合

中的每一元素

进行归一化处理获得归一化后的网络安全特征值

其中，

表示

的最大值；

(2-2-2)对于步骤(2-2-1)获得归一化后的网络安全特征值

所述稀疏自编码器优选稀疏自编码神经网络，按照如下方法训练获取：

其中，

表示z_ij的最大值；

(3)对于步骤(2)中获取的数据包的各个网络安全特征值的编码进行聚类，获得编码类别集合Cluster＝{cs₁，cs₂，…，cs_m}，其中cs_i表示聚类集合Cluster中的第i个聚类，m表示聚类集合Cluster中的聚类个数；优选采用凝聚层次聚类算法进行聚类；

(4)将步骤(3)中获得的编码类别集合Cluster中的每一类别cs_i与已知安全网络安全特征编码集合Nom、以及已知风险网络安全特征值编码集合Mal中的元素进行比对，自动判定所述分析模块提交的编码为安全网络安全特征编码、风险网络安全特征值编码、或未知网络安全特征编码，并将安全网络安全特征编码和风险网络安全特征编码分别追加到已知安全网络安全特征编码集合Nom、以及已知风险网络安全特征值编码集合Mal中，对于风险网络安全特征值编码执行预设的防御动作，收集未知网络安全特征编码形成未知网络安全特征编码集合Diff；具体为：

对于步骤(3)中获得的编码类别集合Cluster中的每一类别cs_i，获取其中心值，与所有已知安全网络安全特征值编码集合Nom中的所有元素值进行比对，如果所述已知安全网络安全特征值编码集合Nom中存在至少一个元素与该类别网络安全特征值编码的中心值相同，则将该类别所有的网络安全特征值编码{e₁，e₂，e₃，…}追加到已知安全网络安全特征值编码集合Nom中；否则，将该类别中的所有元素{e₁，e₂，e₃，…}与已知风险网络安全特征值编码集合Mal中的所有元素进行比对：对于该类别中每一元素，如果已知风险网络安全特征值编码集合Mal中存在至少一个元素与该元素的值相同，则将该元素追加到已知风险网络安全特征值编码集合中并执行预先设定的防御动作，否则将该网络安全特征值编码加入到未知网络安全特征值编码集合Diff中；

所述已知安全网络安全特征值编码集合Nom优选初始化方法如下：将稀疏自编码器的学习样本采用稀疏自编码器的编码组成的集合OUT作为初始已知安全网络安全特征值编码集合Nom；

本发明提供的软件定义物联网自学习安全防御***，如图2所示，包括：嗅探模块、分析模块、检测防御模块、以及知识库；

以下为实施例：

实施例1

一种软件定义物联网自学习安全防御***，如图2所示，包括：嗅探模块、分析模块、自学习模块、检测防御模块、以及知识库；

所述分析模块，用于提取所述数据包的网络安全特征，并采用稀疏自编码器进行编码，获得每个数据包的各个网络安全特征值对应的编码并提交给检测防御模块；所述分析模块，内置：

；按照如下方法生成：

zeek₁＝1，zeek₂＝2，zeek₃＝3，…

对于隐含层中第l个神经元，其值h_l为：h_l＝∑_n α_kq_kl+b_kl，其中q_kl表示权值分量，b_kl表示偏置分量；具有与数据包网络安全特征向量具有的网络安全特征值的个数相同的输出神经元，即具有数量为n的输出神经元，对于输出神经元集合out＝{β₁，β₂，β₃，…，β_k，…β_n}，k＝1，2，...n，其中β_k为稀疏自编码神经网络输出层中第k个输出神经元的值，β_k＝∑_lh_lq_kl+b_kl；权值分量和偏置分量分别构成权值向量Q和偏置向量B，即：

所述检测防御模块，用于将所述分析模块提交的编码采用凝聚层次聚类算法进行聚类分析，并与已知安全网络安全特征编码集合Nom中的元素、以及已知风险网络安全特征值编码集合Mal中的元素进行比对，自动判定所述分析模块提交的编码是否为安全网络安全特征编码、风险网络安全特征值编码、或未知网络安全特征编码，并将安全网络安全特征编码和风险网络安全特征编码提交给知识库，对于风险网络安全特征值编码执行预设的防御动作，收集未知网络安全特征编码形成未知网络安全特征编码集合Diff提交给专家处理模块；

实施例2

应用实施例1的***进行软件定义物联网自学习安全防御方法，如图1所示，包括以下步骤：

S1、构建稀疏自编码器：

S1-1、仿真建立安全的软件定义物联网环境，模拟真实的软件定义物联网节点所有可能的网络行为，从而产生所有可能的正常的软件定义物联网数据包。

S1-2、嗅探模块通过公开的网络嗅探技术捕获步骤S1-1所述的仿真的软件定义物联网节点发送的包含于介质访问控制层和网络层之间的所有数据包。记Δ为所述数据包的集合，Δ＝{Packet₁，Packet₂，Packet₃，…}，其中，Packet_i表示第i个数据包。

S1-3对于步骤S1-2中获取的所述数据包，分析模块利用公开源代码的Zeek网络安全监控工具抽取其中的所有网络安全特征，并对所有网络安全特征从整数1开始顺序赋予网络安全特征值，之后，将所有网络安全特征值存入知识库。记Θ为所述网络安全特征的集合，Θ＝{Feature₁，Feature₂，Feature₃，…}，其中，Feature_i表示第i个数据包Packet_i的网络安全特征集合。Feature_i＝{f_i1，f_i2，f_i3，…，f_in}，其中，f_ij表示第i个数据包Packet_i的第j个网络安全特征，n表示第i个数据包Packet_i的网络安全特征个数。记z_ij为网络安全特征f_ij对应的网络安全特征值，采用分析模块内置的映射表将相应Zeek网络安全监控工具抽取其中的所有网络安全特征的值进行映射获得。

S1-4基于稀疏自编码神经网络对步骤S1-3得到的所有网络安全特征进行无监督学习，分别得到权值向量Q和偏置向量B。具体步骤为：

S1-4-1自学习模块从知识库取出由步骤S1-3得到的所有网络安全特征值进行归一化处理，得到归一化后的网络安全特征值。记g_il为z_ij归一化后的网络安全特征值，

其中，

表示z_ij的最大值。

S1-4-2设置稀疏自编码神经网络的输入层中各单元值为步骤S1-4-1所述的各个归一化后的网络安全特征值。记α_k为稀疏自编码神经网络输入层中第k个单元，in为稀疏自编码神经网络输入层中的所有单元构成的集合，in＝{α₁，α₂，α₃，…，α_k，…α_n}，k＝1，2，...n，其中，α_k＝g_ik。

S1-4-3对稀疏自编码神经网络的隐含层中各单元值进行编码。记h_l为稀疏自编码神经网络隐含层中第l个单元值，h_l＝∑_nα_kq_kl+b_kl，其中，q_kl表示权值分量，b_kl表示偏置分量。

S1-4-4对稀疏自编码神经网络的输出层中各单元值进行编码，并由得到的编码构成正常“软件定义物联网”网络行为网络安全特征集合，之后，将正常“软件定义物联网”网络行为网络安全特征集合存入知识库。记β_k为稀疏自编码神经网络输出层中第k个单元值，out为输出层中的所有单元构成的集合，out＝{β₁，β₂，β₃，…，β_k，…β_n}，k＝1，2，...n，其中，β_k＝∑_lh_lq_kl+b_kl。OUT为仿真数据包集合所有元素由稀疏自编码神经网络模型的输出的编码集合，记已知安全网络安全特征编码集合为Nom，则Nom＝OUT。

S1-4-5定义损失函数，并通过最小化损失函数值得到权值向量Q和偏置向量B，之后，将权值向量和偏置向量存入知识库。记L(IN，OUT)为损失函数，

S2、监听实际软件定义物联网

(1)嗅探模块捕获实际的软件定义物联网节点发送的包含于介质访问控制层和网络层之间的所有数据包。记

为所述数据包的集合，

其中，

表示第i个实际的数据包。

(2)对步骤(1)中获取的数据包集合

中的每一个数据包进行网络安全特征提取，并采用稀疏自编码器进行编码，获得每个数据包的各个网络安全特征值对应的编码；

(2-1)分析模块采用Zeek网络安全监控工具抽取步骤(1)所述的所有数据包中的所有网络安全特征，应用映射表将所有网络安全特征映射为数据包的网络安全特征值，之后，将所有数据包的网络安全特征值存入知识库；记

为所述网络安全特征的集合，

其中，

表示第i个实际的数据包

的网络安全特征集合。

其中，

表示第i个实际的数据包

的第j个网络安全特征，n表示第i个实际的数据包

的网络安全特征向量

所具有的网络安全特征个数。记

为网络安全特征

对应的网络安全特征值。

(2-2)对于步骤(2-1)中获取的数据包网络安全特征值集合

具体步骤如下：

(2-2-1)代用归一化工具对于步骤(2-1)中获取的数据包网络安全特征值集合

中的每一元素

进行归一化处理获得归一化后的网络安全特征值

其中，

表示

的最大值；

(2-2-2)对于步骤(2-2-1)获得归一化后的网络安全特征值

采用步骤S1训练的稀疏自编码器编码，获得所有数据包的网络安全特征值对应的编码，组成数据包编码集合

之后将集合

存入知识库。

(3)检测防御模块使用公开的凝聚层次聚类算法对步骤S1所述的Nom和步骤(8)所述的

进行聚类，得到聚类集合，并自动更新集合Nom和

之后，将集合Nom和

存入知识库。记Cluster为聚类集合，Cluster＝{cs₁，cs₂，…，cs_m}，其中cs_i表示聚类集合Cluster中的第i个聚类，m表示聚类集合Cluster中的聚类个数。

(4)自动更新集合Nom和

的具体操作为：

(4-1)i←1。

(4-2)若i＞m，则检测防御模块结束自动更新集合Nom和

否则进入步骤(4-3)。

(4-3)检测防御模块将cs_i的中心值跟集合Nom中的所有元素值进行逐个比较，若相同，则将该聚类中的所有元素{e₁，e₂，e₃，…}并入集合Nom，并从集合

中去除，即Nom←Nom∪{e₁，e₂，e₃，…}，

从而自动更新集合Nom和

(4-4)i←i+1，返回步骤(4-2)。

(4-5)检测防御模块判断集合

是否为空，若为空，则不做任何操作；否则，检测防御模块从知识库中取出已知的恶意“软件定义物联网”网络行为网络安全特征集合Mal，将集合

中的所有元素值逐个跟集合Mal中的所有元素值进行比较，若相同，检测防御模块执行预先设定的防御动作；若不同，检测防御模块将不同的元素值集合Diff输入专家处理模块。

(5)专家处理模块收到检测防御模块输入的元素值集合Diff后，由网络安全专家组成员人为鉴定集合Diff中的每个元素d，若为正常“软件定义物联网”网络行为，则将该元素d加入集合Nom；否则将该元素d加入集合Mal，并设置相应的防御动作。之后，将集合Nom和Mal分别存入知识库。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种软件定义物联网自学习防御方法，其特征在于，包括以下步骤：

其中，

表示第i个数据包；

(2)对步骤(1)中获取的数据包集合

(3)对于步骤(2)中获取的数据包的各个网络安全特征值的编码进行聚类，获得编码类别集合Cluster＝{cs₁,cs₂,…,cs_m}，其中cs_i表示聚类集合Cluster中的第i个聚类，m表示聚类集合Cluster中的聚类个数；

2.如权利要求1所述的软件定义物联网自学习防御方法，其特征在于，步骤(2)包括：

(2-1)对于数据包

即：

其中

为第i个实际嗅探到的数据包

的网络安全特征向量，

其中

为第i个实际嗅探到的数据包

的第j个网络安全特征，n表示第i个实际的数据包

的网络安全特征向量

所具有的网络安全特征个数；

为网络安全特征

对应的网络安全特征值，

为整数。

(2-2)对于步骤(2-1)中获取的数据包网络安全特征值集合

3.如权利要求2所述的软件定义物联网自学习防御方法，其特征在于，步骤(2-2)具体为：

(2-2-1)对于步骤(2-1)中获取的数据包网络安全特征值集合

中的每一元素

进行归一化处理获得归一化后的网络安全特征值

其中，

表示

的最大值；

(2-2-2)对于步骤(2-2-1)获得归一化后的网络安全特征值

4.如权利要求3所述的软件定义物联网自学习防御方法，其特征在于，所述稀疏自编码器优选稀疏自编码神经网络，按照如下方法训练获取：

学习样本收集：仿真建立的安全软件定义物联网环境，与步骤(1)相同的嗅探获取的节点发送的包含于介质访问控制层和网络层之间的所有数据包，获得仿真数据包集合：Δ＝{Packet₁,Packet₂,Packet₃,…}，其中，Packet_i表示第i个仿真数据包；与步骤(2-1)相同的获取仿真数据包Packet_i的网络安全特征，组成仿真的数据包网络安全特征值集合Θ；即Θ＝{Feature₁,Feature₂,Feature₃,…}，Feature_i为第i个嗅探到的仿真数据包Packet_i的网络安全特征向量，Feature_i＝{f_i1,f_i2,f_i3,…,f_in}，其中f_ij为第i个嗅探到的仿真数据包Packet_i的第j个网络安全特征，n表示第i个仿真数据包Packet_i的网络安全特征向量Feature_i所具有的网络安全特征个数；z_ij为网络安全特征f_ij对应的网络安全特征值，z_ij为整数；与步骤(2-2-1)相同的获取数据包网络安全特征值集合Θ中的每一元素z_ij，进行归一化处理获得归一化后的网络安全特征值

其中，

表示z_ij的最大值；

稀疏自编码神经网络模型：包括输入层、隐含层和输出层；其输入层具有与数据包网络安全特征向量具有的网络安全特征值的个数相同的输入神经元，即具有数量为n的输入神经元，第k个输入神经元的值为相应归一化后的仿真数据包的网络安全特征值，即对于输入神经元集合in＝{α₁,α₂,α₃,…,α_k,…α_n},k＝1,2,...n，其中α_k为稀疏自编码神经网络输入层中第k个输入神经元的值，有：α_k＝g_ik；对于隐含层中第l个神经元，其值h_l为：h_l＝Σ_nα_kq_kl+b_kl，其中q_kl表示权值分量，b_kl表示偏置分量；具有与数据包网络安全特征向量具有的网络安全特征值的个数相同的输出神经元，即具有数量为n的输出神经元，对于输出神经元集合out＝{β₁,β₂,β₃,…,β_k,…β_n},k＝1,2,...n，其中β_k为稀疏自编码神经网络输出层中第k个输出神经元的值，β_k＝Σ_lh_lq_kl+b_kl。

稀疏自编码神经网络模型的训练：采用无监督学习，将损失函数最小时的稀疏自编码神经网络模型作为稀疏自编码器；所述损失函数L(IN,OUT)为：

其中IN为仿真数据包集合所有元素输入稀疏自编码神经网络模型的网络安全特征值集合，OUT为仿真数据包集合所有元素由稀疏自编码神经网络模型的输出的编码集合，|OUT|表示集合OUT中所有元素的个数，即|OUT|为仿真数据包个数与n的乘积；当损失函数L(IN,OUT)取最小值时，所述神经网络模型的权值分量和偏置分量分别构成权值向量Q和偏置向量B，即：

Q＝[q₁₁ q₁₂ q₁₃…q_1l…q₂₁ q₂₂ q₂₃…q_2l…]，

B＝[b₁₁ b₁₂ b₁₃…b_1l…b₂₁ b₂₂ b₂₃…b_2l…]。

5.如权利要求1所述的软件定义物联网自学习防御方法，其特征在于，步骤(3)采用凝聚层次聚类算法进行聚类。

6.如权利要求1所述的软件定义物联网自学习防御方法，其特征在于，步骤(4)具体为：

对于步骤(3)中获得的编码类别集合Cluster中的每一类别cs_i，获取其中心值，与所有已知安全网络安全特征值编码集合Nom中的所有元素值进行比对，如果所述已知安全网络安全特征值编码集合Nom中存在至少一个元素与该类别网络安全特征值编码的中心值相同，则将该类别所有的网络安全特征值编码{e₁,e₂,e₃,…}追加到已知安全网络安全特征值编码集合Nom中；否则，将该类别中的所有元素{e₁,e₂,e₃,…}与已知风险网络安全特征值编码集合Mal中的所有元素进行比对：对于该类别中每一元素，如果已知风险网络安全特征值编码集合Mal中存在至少一个元素与该元素的值相同，则将该元素追加到已知风险网络安全特征值编码集合中并执行预先设定的防御动作，否则将该网络安全特征值编码加入到未知网络安全特征值编码集合Diff中。

7.如权利要求1所述的软件定义物联网自学习防御方法，其特征在于，所述已知安全网络安全特征值编码集合Nom优选初始化方法如下：将稀疏自编码器的学习样本采用稀疏自编码器的编码组成的集合OUT作为初始已知安全网络安全特征值编码集合Nom。

8.一种软件定义物联网自学习安全防御***，其特征在于，包括：嗅探模块、分析模块、检测防御模块、以及知识库；

9.如权利要求8所述的软件定义物联网自学习安全防御***，其特征在于，所述分析模块内置：

按照如下方法生成：

zeek₁＝1，zeek₂＝2，zeek₃＝3，…

稀疏自编码器，即稀疏自编码神经网络，其具有数量为n的输入神经元，第k个输入神经元的值为相应归一化后的仿真数据包的网络安全特征值，即对于输入神经元集合in＝{α₁,α₂,α₃,…,α_k,…α_n},k＝1,2,...n，其中α_k为稀疏自编码神经网络输入层中第k个输入神经元的值，有：

对于隐含层中第l个神经元，其值h_l为：h_l＝∑_nα_kq_kl+b_kl，其中q_kl表示权值分量，b_kl表示偏置分量；具有与数据包网络安全特征向量具有的网络安全特征值的个数相同的输出神经元，即具有数量为n的输出神经元，对于输出神经元集合out＝{β₁,β₂,β₃,…,β_k,…β_n},k＝1,2,...n，其中β_k为稀疏自编码神经网络输出层中第k个输出神经元的值，β_k＝∑_lh_lq_kl+b_kl；权值分量和偏置分量分别构成权值向量Q和偏置向量B，即：

Q＝[q₁₁ q₁₂ q₁₃…q_1l…q₂₁ q₂₂ q₂₃…q_2l…]，

B＝[b₁₁ b₁₂ b₁₃…b_1l…b₂₁ b₂₂ b₂₃…b_2l…]。

10.如权利要求8所述的软件定义物联网自学习安全防御***，其特征在于，所述检测防御模块，用于将所述分析模块提交的编码采用凝聚层次聚类算法进行聚类分析。