CN112968906B

CN112968906B - 一种基于多元组的Modbus TCP异常通讯检测方法和***

Info

Publication number: CN112968906B
Application number: CN202110316520.3A
Authority: CN
Inventors: 李肯立; 李政; 余思洋; 周旭; 刘楚波; 段明星; 李克勤; 唐伟; 黎东
Original assignee: Hunan Kuangan Network Technology Co ltd; Hunan University
Current assignee: Hunan Kuangan Network Technology Co ltd
Priority date: 2021-03-25
Filing date: 2021-03-25
Publication date: 2022-02-18
Anticipated expiration: 2041-03-25
Also published as: CN112968906A

Abstract

本发明公开了一种基于多元组的Modbus TCP异常通讯检测方法，包括：从工业控制网络中获取连接，每个连接包含多个Modbus TCP数据包，按照单位时间对数据包流进行分割，得到多个数据包序列。对数据包序列中的每个Modbus TCP数据包进行解析，提取其中的多个功能码、线圈地址、数据长度。在一个数据包序列中，每个功能码对应多个数据包，将具有相同功能码的数据包归为一类，对于每一类数据包，取数据包中的数据长度进行累加求和取平均，每个功能码可以对应一个数据包平均数据长度，得到多元组C₁；每个功能码对应多个线圈地址。本发明解决了现有技术只针对Modbus TCP的功能码和线圈地址这两个特征进行提取，导致流量特征提取不足，检测精度不高的技术问题。

Description

一种基于多元组的Modbus TCP异常通讯检测方法和***

技术领域

本发明属于工业网络信息安全领域，更具体地，涉及一种基于多元组的ModbusTCP异常通讯检测方法和***。

背景技术

随着工业互联网时代的到来，越来越多的工业控制网络接入到互联网等公共网络之中，不可避免地要开始考虑工业控制网络怎样才能有更好的安全性，从而抵御来自环境错综复杂的互联网的网络攻击。并且，工业控制网络中的设备通常起着重要的作用，使用者对设备的稳定性和可靠性要求极高，如果工业网络受到攻击，可能会影响工控设备的正常运行，甚至给使用者带来巨大的损失。Modbus TCP协议被广泛应用在工业控制领域，其安全性对工业控制网络有着重大意义，其特性允许接入互联网，因此遭到网络攻击的概率会更大。

对于Modbus TCP通讯异常检测，人们已经不再满足于使用传统的异常检测算法，随着机器学习的飞速发展，许多人开始将基于机器学习的异常检测算法应用到Modbus TCP通讯异常检测中去。尚文利等人提出了一种基于PSO-SVM的Modbus TCP通讯异常检测方法，该方法虽然考虑了功能码的时序性，但是单一地对功能码序列进行检测会导致对连接的特征提取不足；陈鑫龙等人采用基于决策树的通讯异常检测方法，利用决策树对连接中数据包的功能码和线圈地址进行检测，使得算法时间复杂度和检测时延降低，但其只对单个数据包的功能码和线圈地址进行判断，没有考虑数据包之间的关联性和功能码的组合特性，因此导致检测结果偏低；李超等人提出了一种单类支持向量机算法，该研究将连接的功能码和线圈地址组合作为特征，对连接的通讯异常检测效果显著，但其对数据的处理过程过于复杂，降低了通讯的实时性。

发明内容

针对现有技术的以上缺陷或改进需求，本发明提供了一种基于多元组的ModbusTCP异常通讯检测方法和***，其目的在于，通过考虑Modbus TCP数据包中的功能码与线圈地址以及功能码与数据长度的关联性，从数据包中提取两组有关联的多元组，解决现有基于PSO-SVM的Modbus TCP通讯异常检测方法存在的对连接的特征提取不足的技术问题，以及现有基于决策树的通讯异常检测方法由于没有考虑数据包之间的关联性和功能码的组合特性，导致检测结果偏低的技术问题，以及现有单类支持向量机算法由于对数据的处理过程过于复杂，因此降低了通讯实时性的技术问题。

为实现上述目的，按照本发明的一个方面，提供了一种基于多元组的Modbus TCP异常通讯检测方法，包括以下步骤：

(1)从工业互联网获取Modbus TCP连接，其包括多个Modbus TCP数据包，按照单位时间对Modbus TCP数据包进行分割，以得到多个数据包序列，对每个数据包序列中的每个Modbus TCP数据包进行解析，以获取对应的功能码、线圈地址、以及数据长度。

(2)对步骤(1)得到的Modbus TCP数据包的功能码、线圈地址、以及数据长度进行处理，以得到该Modbus TCP数据包对应的多元组C₁和C₂。

(3)将Modbus TCP数据包对应的多元组C₁和C₂分别输入训练好的异常检测模型M₁和M₂，以分别得到输出结果E(h₁(C₁))和E(h₂(C₂）)，获取连接异常概率值

并通过该连接概率值判断连接是否出现异常，其中h₁(C₁)为多元组C₁遍历每颗iTree_1n时，多元组C₁所落在的外部节点到根节点的边数，h₂(C₂)为多元组C₂遍历每颗iTree_2n时，多元组C₂所落在的外部节点到根节点的边数，E()表示均值处理，iTree_1n为异常检测模型M₁中的第n颗孤立树，iTree_2n为异常检测模型M₂中的第n颗孤立树。

优选地，如果连接异常概率值Score小于0.25，则判定为连接异常，反之则说明连接正常。

优选地，每个数据包序列中包含多个Modbus TCP数据包，每个Modbus TCP数据包中的MBAP中包含该数据包的数据长度，每个Modbus TCP数据包中的PDU中包含该数据包的功能码字段和线圈地址。

优选地，步骤(2)包括以下子步骤：

(2-1)根据客户端实际使用的Modbus功能码的总数确定多元组C₁和C₂中的对象个数n；

(2-2)根据步骤(2-1)确定的多元组C₁的对象个数n，生成多元组C₁，C₁＝(a₁，a₂，a₃……a_n)，其中a_i为多元组C₁中的元素，且有i∈[1，n]；

(2-3)根据步骤(2-1)确定多元组C₂的对象个数n，生成多元组C₂，C₂＝(b₁，b₂，b₃……b_n)；

优选地，多元组C₁中的每个元素a_i是通过以下公式计算得出：

其中g₁(i)为多元组C₁中第i个元素a_i和与之对应的功能码的映射关系函数，SUM(g₁(i))为当前数据包序列中所有包含相同功能码g₁(i)的数据包所对应的数据长度的总和，NUM(g₁(i))为当前数据包序列中所有包含相同功能码g₁(i)的数据包的总数。

优选地，多元组C₂中的每个元素b_i是由以下公式计算得出：

E＝Addr(g₂(i))

其中g₂(i)为多元组C₂中第i个元素b_i和与之对应的功能码的映射关系函数，Addr(g₂(i))为当前数据包序列中所有包含相同功能码g₂(i)的数据包所对应的线圈地址集合。

优选地，异常检测模型M₁和M₂都是iForest模型，且异常检测模型M₁和M₂是通过以下步骤训练得到的：

(3-1)从工业互联网获取Modbus TCP连接，其包括多个Modbus TCP数据包，按照单位时间对Modbus TCP数据包进行分割，以得到多个数据包序列，按照步骤(2-2)中所述方法将每个数据包序列转换成多元组，并将得到的所有多元组进行组合，以得到训练集SET₁＝{C₁₁，C₁₂，C₁₃，C₁₄……}，按照步骤(2-3)中所述方法将每个数据包序列转换成多元组，并将得到的多元组进行组合，以得到训练集SET₂＝{C₂₁，C₂₂，C₂₃，C₂₄……}；

(3-2)对于异常检测模型M₁，从训练集SET₁中随机选择ψ个样本点作为子样本

放入第一孤立树iTree₁的根节点iNode_1n(其中iNode_1n为第一孤立树iTree₁的第n次迭代生成的子节点)，对于异常检测模型M₂，从训练集SET₂中随机选择ψ个样本点作为子样本

放入第二孤立树iTree₂的根节点iNode_2n(iNode_2n为第二孤立树iTree₂的第n次迭代生成的子节点)，其中样本点数ψ等于256。

(3-3)对于异常检测模型M₁，从子样本

的属性集Q₁中随机选择一个属性q₁(其中属性集Q₁为多元组C₁对应的功能码集合)，在当前节点数据中随机产生一个切割点p₁∈[length_min，length_max]，其中length_min为Modbus TCP数据包长度的最小值，且length_min＝6，length_max为Modbus TCP数据包长度的最大值，且length_max＝253。对于异常检测模型M₂，从子样本

的属性集Q₂中随机选择一个属性q₂(其中属性集Q₂为多元组C₂对应的功能码集合)，在当前节点数据中随机产生一个切割点p₂∈[0X00 00，0XFF FF]。

(3-4)对于异常检测模型M₁而言，用切割点p₁将子样本

划分为左子树和右子树，将其属性值VAL(q₁)小于p₁的所有多元组C_1x置于左子树中当前节点iNode_1n的左孩子节点iNode_1(n+1)，将其属性值VAL(q₁)大于等于p₁的所有多元组C_1x置于右子树中当前节点iNode_1n的右孩子节点iNode_1(n+1)。对于异常检测模型M₂而言，用切割点p₂将子样本

划分为左子树和右子树，将其属性值VAL(q₂)小于p₂的所有多元组C_2x置于左子树中当前节点iNode_2n的左孩子节点iNode_2(n+1)，将其属性值VAL(q₂)大于等于p₂的所有多元组C_2x置于右子树中当前节点iNode_2n的右孩子节点iNode_2(n+1)。

(3-5)对于异常检测模型M₁和M₂，在孩子节点中递归步骤(3-3)和(3-4)，以不断迭代生成新的孩子节点，直到孩子节点中只有一个数据或树的高度达到限定的高度l为止；

(3-6)重复上述步骤(3-2)至(3-5)达100次，从而得到训练好的异常检测模型M₁和M₂，其中iForest₁和iForest₂分别表示两个孤立森林。

按照本发明的另一方面，提供了一种基于多元组的Modbus TCP异常通讯检测***，包括：

第一模块，用于从工业互联网获取Modbus TCP连接，其包括多个Modbus TCP数据包，按照单位时间对Modbus TCP数据包进行分割，以得到多个数据包序列，对每个数据包序列中的每个Modbus TCP数据包进行解析，以获取对应的功能码、线圈地址、以及数据长度。

第二模块，用于对第一模块得到的Modbus TCP数据包的功能码、线圈地址、以及数据长度进行处理，以得到该Modbus TCP数据包对应的多元组C₁和C₂。

第三模块，用于将Modbus TCP数据包对应的多元组C₁和C₂分别输入训练好的异常检测模型M₁和M₂，以分别得到输出结果E(h₁(C₁))和E(h₂(C₂))，获取连接异常概率值

总体而言，通过本发明所构思的以上技术方案与现有技术相比，能够取得下列有益效果：

(1)由于本发明采用了步骤(1)，其充分考虑了Modbus TCP数据包中的功能码与线圈地址以及功能码与数据长度的关联性，因此能够解决现有基于功能码和线圈地址的Modbus TCP通讯异常检测特征提取不足的技术问题。

(2)由于本发明采用了步骤(2)，其将功能码与平均数据长度映射成多元组，将与功能码对应的线圈地址进行异或运算的结果映射成多元组，因此能够解决现有基于功能码序列的检测技术没有考虑不同功能码下，数据长度特征和线圈地址的组合特征的技术问题。

(3)由于本发明采用了步骤(3)和(4)，其使用了双iForest模型进行异常通讯的实时检测，易于部署到并行计算平台上，因此能够解决现有基于高复杂度的单检测模型的检测技术进行检测带来的高延时的技术问题。

附图说明

图1是本发明基于多元组的Modbus TCP异常通讯检测方法的流程图。

图2是本发明基于多元组的Modbus TCP异常通讯检测方法的多元组生成过程流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

本发明的基本思路在于，对Modbus TCP连接中的数据包序列进行特征提取，考虑了数据包中的功能码与线圈地址以及功能码与数据长度的关联性，即能够反映出不同的功能码下，线圈地址的组合不同，平均数据包的大小也不同的特征。从而可以通过对单个数据包序列中的数据包按照功能码进行分类，得到每个功能码对应的平均数据长度和线圈地址二进制位的异或组合这两个特征。解决了现有技术只针对Modbus TCP数据包序列中的功能码和线圈地址这两个特征进行提取，导致的流量特征提取不足，检测精度不高的技术问题。提供了一种基于多元组的Modbus TCP异常通讯检测方法。

如图1所示，本发明提供了一种基于多元组的Modbus TCP异常通讯检测方法，包括以下步骤：

具体而言，每个数据包序列中包含多个Modbus TCP数据包，每个Modbus TCP数据包中的应用协议头(Modbus application protocol header，简称MBAP)中包含该数据包的数据长度，每个Modbus TCP数据包中的分组数据单元(Packet data unit，简称PDU)中包含该数据包的功能码字段和线圈地址。

本步骤(1)的优点在于，不仅考虑了Modbus TCP连接中数据包的功能码、线圈地址，还考虑了数据包的数据长度，更能反映出当前连接的状态。

如图2所示，本步骤包括以下子步骤：

具体而言，Modbus标准中定义的功能码有21个(1～21)，保留作拓展功能备用的功能码有43个(22～64)，保留以备用户功能所用的功能码有8个(65～72)，非法功能47个(73～119)，保留作内部作用8个(120～127)，保留用于异常应答128个(128～255)。

例如，某工厂的Modbus TCP通信中，客户端使用的功能码是0x01 0x02 0x03 0x040x05 0x06 0x15 0x16，则多元组C＝(a₁，a₂，a₃......a_n)，其中a₁对应0x01，a₂对应0x02，…，以此类推，此处n＝8。如a₁的位置对应于第一个功能码0x01，它的取值由当前数据包序列中所有功能码为0x01的数据包决定。

(2-2)根据步骤(2-1)确定的多元组C₁的对象个数n，生成多元组C₁，C₁＝(a₁，a₂，a₃......a_n)，其中a_i为多元组C₁中的元素，且有i∈[1，n]；

更具体地，多元组C₁中的每个元素a_i是通过以下公式计算得出：

(2-3)根据步骤(2-1)确定多元组C₂的对象个数n，生成多元组C₂，

C₂＝(b₁，b₂，b₃......b_n)；

更具体地，多元组C₂中的每个元素b_i是由以下公式计算得出：

E＝Addr(g₂(i))

如当前数据包序列中没有包含功能码g₂(i)的数据包，则Addr()返回0x00 00，b_i＝0x00 00，否则，b_i的值等于对E中所有线圈地址的二进制位进行异或运算后的结果。

本步骤(2)的优点在于，将功能码隐式地置于多元组的不同对象下，即多元组中的每个对象的值都是基于某个包含特定功能码的数据包计算得到的。充分反映出不同功能码下，数据长度特征和线圈地址的组合特征。

(3)将Modbus TCP数据包对应的多元组C₁和C₂分别输入训练好的异常检测模型M₁和M₂，以分别得到输出结果E(h₁(C₁))和e(h₂(C₂))，获取连接异常概率值

并通过该连接概率值判断连接是否出现异常，其中h₁(C₁)为多元组C₁遍历每颗iTree_1n时，多元组C₁所落在的外部节点到根节点的边数，h₂(C₂)为多元组C₂遍历每颗iTree_2n时，多元组C₂所落在的外部节点到根节点的边数，E()表示均值处理，iTree_1n为异常检测模型M₁中的第n颗孤立树，iTree_2n为异常检测模型M₂中的第n颗孤立树；

具体而言，如果Score小于0.25，则判定为连接异常，反之则说明连接正常。

本发明中使用的异常检测模型M₁和M₂都是iForest模型，iForest是非监督学习异常检测模型，因此无需对训练数据集进行人工标记。根据相关文献数据，使用只有正常样本的数据集进行模型训练，对模型的检测精度影响极小，且可通过增加孤立树数目的方式提高模型检测精度，弥补没有非正常样本所带来的精度损失。

具体而言，本步骤的异常检测模型M₁和M₂是通过以下步骤训练得到的：

(3-1)从工业互联网获取Modbus TCP连接，其包括多个Modbus TCP数据包，按照单位时间对Modbus TCP数据包进行分割，以得到多个数据包序列，按照步骤(2-2)中所述方法将每个数据包序列转换成多元组，并将得到的所有多元组进行组合，以得到训练集SET₁＝{C₁₁，C₁₂，C₁₃，C₁₄......}，按照步骤(2-3)中所述方法将每个数据包序列转换成多元组，并将得到的多元组进行组合，以得到训练集SET₂＝{C₂₁，C₂₂，C₂₃，C₂₄......}；

训练集SET₁用于训练异常检测模型M₁，训练集SET₂用于训练异常检测模型M₂。两个模型的初始参数一致，由于样本点数ψ＝256，则每棵树的限定高度l＝ceiling(log₂ψ)＝8，孤立树的数目t＝100。

(3-3)对于异常检测模型M₁，从子样本

的属性集Q₁中随机选择一个属性q₁(其中属性集Q₁为多元组C₁对应的功能码集合)，在当前节点数据中随机产生一个切割点p₁∈[length_min，length_max]，其中tength_min为Modbus TCP数据包长度的最小值，且length_min＝6，length_max为Modbus TCP数据包长度的最大值，且length_max＝253。对于异常检测模型M₂，从子样本

(3-4)对于异常检测模型M₁而言，用切割点p₁将子样本

具体而言，多元组的属性值VAL(q₁)代表多元组C_1x的属性q₁对应的值，多元组的属性值VAL(q₂)代表多元组C_2x的属性q₂对应的值。例如，C_1x＝(a₁，a₂，a₃......a_n)，a₃对应的功能码为0x12，q₁＝0x12，那么有VAL(q₁)＝a₃。

(3-6)重复上述步骤(3-2)至(3-5)达100次，对于模型M₁有iTree_{1 1}，iTree_{1 2}，iTree_{i 3}......iTree_{1 100}∈iForeSt₁，对于模型M₂有iTree_{2 1}，iTree_{2 2}，iTree_{2 3}……iTree_{2 100}∈iForest₂，从而得到训练好的异常检测模型M₁和M₂，其中iForest₁和iForest₂分别表示两个孤立森林。

本步骤(3)的优点在于，其使用了两个基于孤立森林的检测模型对通讯进行异常检测，单个模型对每个多元组进行检测的时间复杂度低，为O(t logψ)，且很容易部署到并行计算平台上。这里，同上述所说，t为孤立树数。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于多元组的Modbus TCP异常通讯检测方法，其特征在于，包括以下步骤：

(1)从工业互联网获取Modbus TCP连接，其包括多个Modbus TCP数据包，按照单位时间对Modbus TCP数据包进行分割，以得到多个数据包序列，对每个数据包序列中的每个Modbus TCP数据包进行解析，以获取对应的功能码、线圈地址、以及数据长度；

(2)对步骤(1)得到的Modbus TCP数据包的功能码、线圈地址、以及数据长度进行处理，以得到该Modbus TCP数据包对应的多元组C₁和C₂；步骤(2)包括以下子步骤：

(2-3)根据步骤(2-1)确定多元组C₂的对象个数n，生成多元组C₂，C₂＝(b₁，b₂，b₃......b_n)；

其中多元组C₁中的每个元素a_i是通过以下公式计算得出：

其中g₁(i)为多元组C₁中第i个元素a_i和与之对应的功能码的映射关系函数，SUM(g₁(i))为当前数据包序列中所有包含相同功能码g₁(i)的数据包所对应的数据长度的总和，NUM(g₁(i))为当前数据包序列中所有包含相同功能码g₁(i)的数据包的总数；

多元组C₂中的每个元素b_i是由以下公式计算得出：

E＝Addr(g₂(i))

其中g₂(i)为多元组C₂中第i个元素b_i和与之对应的功能码的映射关系函数，Addr(g₂(i))为当前数据包序列中所有包含相同功能码g₂(i)的数据包所对应的线圈地址集合；

并通过该连接异常概率值判断连接是否出现异常，其中h₁(C₁)为多元组C₁遍历每颗iTree_1n时，多元组C₁所落在的外部节点到根节点的边数，h₂(C₂)为多元组C₂遍历每颗iTree_2n时，多元组C₂所落在的外部节点到根节点的边数，E()表示均值处理，iTree_1n为异常检测模型M₁中的第n颗孤立树，iTree_2n为异常检测模型M₂中的第n颗孤立树；其中异常检测模型M₁和M₂都是iForest模型，且异常检测模型M₁和M₂是通过以下步骤训练得到的：

放入第一孤立树iTree₁的根节点iNode_1n，对于异常检测模型M₂，从训练集SET₂中随机选择ψ个样本点作为子样本

放入第二孤立树iTree₂的根节点iNode_2n，其中样本点数ψ等于256，iNode_1n为第一孤立树iTree₁的第n次迭代生成的子节点，iNode_2n为第二孤立树iTree₂的第n次迭代生成的子节点；

(3-3)对于异常检测模型M₁，从子样本

的属性集Q₁中随机选择一个属性q₁，在当前节点数据中随机产生一个切割点p₁∈[length_min，length_max]，其中length_min为Modbus TCP数据包长度的最小值，且length_min＝6，length_max为Modbus TCP数据包长度的最大值，且length_max＝253；对于异常检测模型M₂，从子样本

的属性集Q₂中随机选择一个属性q₂，在当前节点数据中随机产生一个切割点p₂∈[0X0000，0XFF FF]，其中属性集Q₁为多元组C₁对应的功能码集合，属性集Q₂为多元组C₂对应的功能码集合；

(3-4)对于异常检测模型M₁而言，用切割点p₁将子样本

划分为左子树和右子树，将其属性值VAL(q₁)小于p₁的所有多元组C_1x置于左子树中当前节点iNode_1n的左孩子节点iNode_1(n+1)，将其属性值VAL(q₁)大于等于p₁的所有多元组C_1x置于右子树中当前节点iNode_1n的右孩子节点iNode_1(n+1)；对于异常检测模型M₂而言，用切割点p₂将子样本

划分为左子树和右子树，将其属性值VAL(q₂)小于p₂的所有多元组C_2x置于左子树中当前节点iNode_2n的左孩子节点iNode_2(n+1)，将其属性值VAL(q₂)大于等于p₂的所有多元组C_2x置于右子树中当前节点iNode_2n的右孩子节点iNode_2(n+1)；

2.根据权利要求1所述的基于多元组的Modbus TCP异常通讯检测方法，其特征在于，如果连接异常概率值Score小于0.25，则判定为连接异常，反之则说明连接正常。

3.根据权利要求1或2所述的基于多元组的Modbus TCP异常通讯检测方法，其特征在于，每个数据包序列中包含多个Modbus TCP数据包，每个Modbus TCP数据包中的MBAP中包含该数据包的数据长度，每个Modbus TCP数据包中的PDU中包含该数据包的功能码字段和线圈地址。

4.一种基于多元组的Modbus TCP异常通讯检测***，其特征在于，包括：

第一模块，用于从工业互联网获取Modbus TCP连接，其包括多个Modbus TCP数据包，按照单位时间对Modbus TCP数据包进行分割，以得到多个数据包序列，对每个数据包序列中的每个Modbus TCP数据包进行解析，以获取对应的功能码、线圈地址、以及数据长度；

第二模块，用于对第一模块得到的Modbus TCP数据包的功能码、线圈地址、以及数据长度进行处理，以得到该Modbus TCP数据包对应的多元组C₁和C₂；第二模块包括以下子步骤：

第一子模块，用于根据客户端实际使用的Modbus功能码的总数确定多元组C₁和C₂中的对象个数n；

第二子模块，用于根据第一子模块确定的多元组C₁的对象个数n，生成多元组C₁，C₁＝(a₁，a₂，a₃......a_n)，其中a_i为多元组C₁中的元素，且有i∈[1，n]；

第三子模块，用于根据第一子模块确定多元组C₂的对象个数n，生成多元组C₂，C₂＝(b₁，b₂，b₃......b_n)；

其中多元组C₁中的每个元素a_i是通过以下公式计算得出：

多元组C₂中的每个元素b_i是由以下公式计算得出：

E＝Addr(g₂(i))

并通过该连接异常概率值判断连接是否出现异常，其中h₁(C₁)为多元组C₁遍历每颗iTree_1n时，多元组C₁所落在的外部节点到根节点的边数，h₂(C₂)为多元组C₂遍历每颗iTree_2n时，多元组C₂所落在的外部节点到根节点的边数，E()表示均值处理，iTree_1n为异常检测模型M₁中的第n颗孤立树，iTree_2n为异常检测模型M₂中的第n颗孤立树，其中异常检测模型M₁和M₂都是iForest模型，且异常检测模型M₁和M₂是通过以下步骤训练得到的：

第四子模块，用于从工业互联网获取Modbus TCP连接，其包括多个Modbus TCP数据包，按照单位时间对Modbus TCP数据包进行分割，以得到多个数据包序列，按照第二子模块中所述方法将每个数据包序列转换成多元组，并将得到的所有多元组进行组合，以得到训练集SET₁＝{C₁₁，C₁₂，C₁₃，C₁₄……}，按照第三子模块中所述方法将每个数据包序列转换成多元组，并将得到的多元组进行组合，以得到训练集SET₂＝{C₂₁，C₂₂，C₂₃，C₂₄……}；

第五子模块，用于对于异常检测模型M₁，从训练集SET₁中随机选择ψ个样本点作为子样本

第六子模块，用于对于异常检测模型M₁，从子样本

第七子模块，用于对于异常检测模型M₁而言，用切割点p₁将子样本

第八子模块，用于对于异常检测模型M₁和M₂，在孩子节点中递归第六子模块和第七子模块，以不断迭代生成新的孩子节点，直到孩子节点中只有一个数据或树的高度达到限定的高度l为止；

第九子模块，用于重复上述步骤第五子模块至第八子模块达100次，从而得到训练好的异常检测模型M₁和M₂，其中iForest₁和iForest₂分别表示两个孤立森林。