CN113743489B

CN113743489B - 一种基于数据缺失的流程工业过程故障检测方法

Info

Publication number: CN113743489B
Application number: CN202110987661.8A
Authority: CN
Inventors: 顾昊昱; 张成功; 钱平; 王丽
Original assignee: Shanghai Institute of Technology
Current assignee: Shanghai Institute of Technology
Priority date: 2021-08-26
Filing date: 2021-08-26
Publication date: 2023-09-29
Anticipated expiration: 2041-08-26
Also published as: CN113743489A

Abstract

本发明涉及一种基于数据缺失的流程工业过程故障检测方法，该方法包括以下步骤：步骤S1：对流程工业过程进行数据采样和处理；步骤S2：利用核极限学习机KELM填补采样数据中的缺失数据；步骤S3：采用地标等距映射法L‑ISOMAP对数据进行低维特征提取；步骤S4：在特征空间和残差空间分别计算统计量和控制现，进行故障检测。与现有技术相比，本发明具有准确性高、节约时间和计算资源等优点。

Description

一种基于数据缺失的流程工业过程故障检测方法

技术领域

本发明涉及流程工业过程控制、监测及安全生产领域，尤其是涉及一种基于数据缺失的流程工业过程故障检测方法。

背景技术

随着工业4.0概念的提出，以及工业互联网、物联网等技术的日益成熟，工业生产过程的智能制造转型已然成为了传统工业发展的必然趋势，随之带来的结果是工业过程变得愈加集成化和大规模化。例如炼油、制药等流程工业的生产过程日趋复杂，通过传统方式对其过程建立精确的机理模型变得愈发困难。在分布式控制***、数据采集与监视控制***等技术的支撑和机器/深度学习的浪潮下，基于数据驱动的流程工业过程建模和过程监测成为了工业智能化运行生产不可或缺的环节。

工业数据传输过程中信号不稳定，数据存储失败，采样时传感器丢包，多采样率等原因会致使数据出现缺失的情况。当应用于建模的历史过程数据出现大量缺失值时，若直接采用删除法则会剔除大量有效信息，用于构建模型的少量样本数据将无法体现出原过程的特性；若采用不合理的填补方法则会错误预测缺失值，同样导致构建的故障检测模型具有较低的准确性。

经过检索，中国专利公开号CN109146004A公开了一种基于迭代缺失数据估计策略的动态过程检测方法，该发明利用迭代缺失数据估计法推测出缺失数据的估计值，从而将假设的原始数据转变成了估计误差；采用PCA模型迭代求取缺失变量的估计值，最后利用估计误差作为被监测对象实施在线故障检测。但是，该方法采用的PCA模型训练较慢且准确性不高。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种准确性高、节约时间和计算资源的基于数据缺失的流程工业过程故障检测方法。

本发明的目的可以通过以下技术方案来实现：

一种基于数据缺失的流程工业过程故障检测方法，该方法包括以下步骤：

步骤S1：对流程工业过程进行数据采样和处理；

步骤S2：利用核极限学习机KELM填补采样数据中的缺失数据；

步骤S3：采用地标等距映射法L-ISOMAP对数据进行低维特征提取；

步骤S4：在特征空间和残差空间分别计算统计量和控制现，进行故障检测。

优选地，所述步骤S1包括以下步骤：

步骤S101：对正常运行的流程工业过程进行数据进行采样，并模拟各种工业现场原因对数据进行缺失异常处理，获得包含有各种缺失类型的不完整缺失数据集X_M，X_M∈R^m ^×n，其中R^m×n表示样本数为m，维数为n的实矩阵；

步骤S102：对缺失数据集X_M进行标准化处理，得到新的数据集X_SM；

步骤S103：找到数据集X_SM中的缺失数据所在位置，将所有包含缺失值的采样点划分为数据集X_SM-NC，并将完整的采样点数据划分为另一数据集X_SM-C。

优选地，所述步骤S2具体为：

步骤S201：确定KELM_i模型的输入输出数据；

对于第i个采样点，找到缺失值所属变量v_{ms_i}，将v_{ms_i}对应的数据Nan_NCi作为需要预测的值，将该采样点中除去缺失值外的已观测到的变量为v_{ob_i}，将该v_{ob_i}对应的数据X_NCi作为KELM_i模型的测试输入；

将完整数据集X_SM-C作为KELM_i模型的训练数据-，X_SM-C中变量v_{ob_i}对应的数据X_Ci作为输入，X_SM-C中变量v_{ms_i}对应的数据Y_Ci作为模型输出，构成具有P个采样点的数据集为其中X_Ci∈R^P×T表示训练输入X_Ci是T维的数据点，Y_Ci∈R^P×K表示标签Y_Ci为K维的数据点，x_{Ci_t}表示第t个采样点的训练数据，y_{Ci_t}表示第t个采样点的标签；

步骤S202：建立第i个采样时刻的KELM_i模型；

步骤S203：对第i个样本点的缺失数据进行预测；

步骤S204：将X_SM-NC中所有具有缺失值的时刻进行填补，得到完整数据集X_f。

优选地，所述步骤S202具体为：

极限学习机ELM是一种特殊的单隐层的前馈神经网络SLFNs，针对第i个采样时刻，SLFNs满足如下表达式：

其中L表示的是隐含层的节点个数，G(x_{Ci_j},a_q,b_q)表示的是激活函数，x_{Ci_j}为模型的训练数据，q表示第q层隐含层节点；a∈R^T×L为输入权值矩阵，b∈R^1×L为隐含层偏差，β∈R^L ^×K为输出权值矩阵，y^* _{Ci_j}表示模型的输出值；

在极限学习机ELM模型中参数a，b都是随机确定的，只需求取输出权值矩阵参数β，极限学习机ELM对应的输出为：

Y_Ci ^*＝Hβ (2)

其中H表示特征映射矩阵：

其中g(x_{Ci_1},a_q,b_q)为激活函数矩阵G(x_{Ci_j},a_q,b_q)的元素；

获得输出权值矩阵

其中H^T表示特征映射矩阵H的转置，C表示正则化参数，I表示单位矩阵，P为样本个数；

ELM的输出函数表示为：

其中h(x_Ci)为x_Ci的映射函数；

在ELM的基础上引入Mercer定理构建KELM_i，所述KELM_i的输出函数如下：

其中Ω_i表示为了填补第i个样本点的缺失值所训练得到的核函数矩阵，表示为：

K(x_{Ci_α},x_{Ci_β})表示的是以X_Ci中的两个元素x_{Ci_α},x_{Ci_β}构建的径向基核函数：

其中σ为核函数宽度参数，α和β分别表示元素所在位置，为x_{Ci_α},x_{Ci_β}所构成核函数的简写形式。

优选地，所述步骤S203具体为：将X_SM-NC中第i个时刻的数据X_NCi作为模型的输入预测该时刻的缺失数据Nan_NCi：

优选地，所述步骤S3包括以下步骤：

步骤S301：在m个样本中随机选取m′个样本作为地标点；

步骤S302：构建近邻邻域图G；

计算m′个地标点对之间的欧式距离，数据点对(X_fi,X_fj)的欧氏距离记为d_Xm′(X_fi,X_fj)；设定距离阈值，选取合适的近邻，构建近邻邻域图G；

步骤S303：计算高维数据间的测地线距离Dijkstra距离，即最短路径；

通过计算近邻邻域图G上X_fi,X_fj两点的测地线距离d_Dm′(X_fi,X_fj)来近似原始流形的测地线距离，测地线距离矩阵D_Dm′由测地线距离的平方构成；

步骤S304：确定内积矩阵B_m′：

其中H_m′是中心化矩阵；

步骤S305：得到地标点的d维嵌入矩阵L_d：

求解得到矩阵B_m′对应的最大的d个特征值λ₁≥λ₂≥…λ_d，特征值对应的d个特征向量为[v₁,v₂,…,v_d]，从而地标点的d维嵌入矩阵L_d表示为：

其中表示第一个特征值对应的特征向量；

步骤S306：求取测地线距离矩阵D_Dm′的平均向量

步骤S307：计算数据集中除去地标点的数据点与地标点之间的距离，即其余数据点中的某一点r与地标点之间的距离记为d_Dmm′(X_fr,X_fj)，距离平方组成矩阵，矩阵中数据点r所在列形成的向量记为

步骤S308：求取矩阵L_d的伪逆转置矩阵L^# _d

步骤S309：计算其余数据点的d维嵌入矩阵L_rd；

步骤S310：采用主成分分析PCA算法实现嵌入坐标对齐；

计算得到d维嵌入矩阵X_fd∈R^m×d，利用PCA标准化方法实现坐标对齐，得到对齐后的d维特征矩阵Y∈R^m×d。

优选地，所述步骤S301中的地标点样本数满足m′＜＜m。

优选地，所述步骤S4包括以下步骤：

步骤S401：计算映射矩阵A；

通过局部线性回归思想求取原始高维数据投影到低维空间的映射矩阵A：

Y＝AX_f (12)

A＝YX_f ^T(X_fX_f ^T)^-1 (13)

其中X_f为填补缺失数据之后的完整数据集，Y为特征矩阵；

步骤S402：构造离线数据故障检测统计量和控制限；

步骤S403：计算在线数据统计量，进行实时监控。

优选地，所述步骤S402具体为：对于离线数据X_f分别构建特征空间统计量和残差空间统计量SPE_f；并采用核密度估计算法进行计算分别计算/>和SPE_f的控制限/>和SPE_ucl。

优选地，所述步骤S403具体为：标准化观测到的实时数据x_t得到x_rt，通过映射矩阵A求得实时数据的低维映射y_rt为：

y_rt＝Ax_rt (14)

计算实时数据统计量和SPE_rt，若在线数据统计量大于控制限时，说明过程出现故障。

与现有技术相比，本发明具有以下优点：

1)在预测缺失值时，充分考虑了每一个具有缺失值的采样时刻的差异，通过模型更新的方式，依次对每一个采样时刻进行填补，适合多种缺失类型，确保了填补数据的准确性；

2)核极限学习机具有泛化性能强和学习速度快的特点，在保证准确性的同时，使用核极限学习模型预测缺失值具有更少的时间耗费和计算资源；

3)建立地标等距映射(L-ISOMAP)模型实现特征提取时，低维特征数据能保持原始高维数据的流形结构，从而保证低维数据尽可能多地保留原始数据的有效信息；

4)相较于等距映射算法(ISOMAP)，地标等距映射算法(L-ISOMAP)在保证降维可靠性的同时，在计算距离矩阵时具有更小的运算量，因此算法具有更快的运行速度。

附图说明

图1为本发明在基于数据缺失实现故障检测整体步骤的流程图；

图2为利用模型更新的KELM模型实现缺失数据填补的流程图；

图3为利用L-ISOMAP算法实现特征提取的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

如图1所示，本发明提供了一种基于数据缺失的流程工业过程故障检测方法，该方法工作原理为：首先，收集流程工业过程正常运行时的正常数据，处理得到包含缺失值的训练数据集，通过基于模型更新的核极限学习机(KELM)每个采样数据进行缺失值填补，得到完整的数据集；在此基础上，采用地标等距映射算法(Landmark-ISOMAP,L-ISOMAP)实现低维特征提取；最终在特征空间建立T²统计量，在残差空间建立SPE统计量，并分别计算相应的控制限，从而实现故障检测。

本实施例通过以下具体技术方案来实现，具体包括以下步骤：

步骤S1：对正常运行的流程工业过程进行数据进行采样，并模拟工业现场各种使数据缺失的原因对数据进行缺失异常处理，获得包含有各种缺失类型的不完整缺失数据集X_M，X_M∈R^m×n，其中R^m×n表示样本数为m，维数为n的实矩阵；

步骤S2：对上述缺失数据集X_M进行标准化处理，得到新的数据集X_SM；

如图2所示，展现了数据填补方法的流程图。

这里，为了简明说明填补过程，X_SM设置为一具有三个缺失值的矩阵；

其中缺失数据的坐标(u₁,v₁),(u₁,v₂),(u₂,v₃)分别表示第u₁个采样时刻的第v₁,v₂个变量以及第u₂个采样时刻的第v₃个变量出现数据缺失情况；

步骤S3：找到数据集X_SM的缺失数据所在位置，将所有包含缺失值的采样点划分为数据集X_SM-NC，将完整的采样点数据划分为另一数据集X_SM-C；

步骤S4：依次对数据集X_SM-NC中每个采样点进行填补；

如图2所示，显示了数据填补的对于第i个采样点，找到缺失值所属于的变量v_{ms_i}，将v_{ms_i}变量对应的数据Nan_NCi作为需要预测的值，该采样点中除去缺失值外的已观测到的变量为v_{ob_i}，其对应的数据X_NCi作为KELM_i模型的测试输入；

将完整数据集X_SM-C作为KELM_i模型的训练数据，X_SM-C中变量v_{ob_i}对应的数据X_Ci作为输入，X_SM-C中变量v_{ms_i}对应的数据Y_Ci作为模型输出，构成具有P个采样点的数据集为其中X_Ci∈R^P×T表示训练输入X_Ci是T维的数据点，Y_Ci∈R^P×K表示标签Y_Ci为K维的数据点；

当X_SM为上述所示具有三个缺失值的实例矩阵，首先需要对第u₁个采样时刻的缺失值进行填补，该采样时刻缺失值所属于的变量为v₁,v₂，对应的缺失数据为和/>将缺失数据/>和/>作为模型的预测模型输出，该采样时刻除去缺失值后其余的数据记为/>,将/>作为模型的预测模型输入；然后选取X_SM-C中找到v₁,v₂变量所对应的数据作为模型训练数据的输出标签，X_SM-C中其余数据/>作为模型训练数据的输入；

为了填补第u₁个时刻缺失值的核极限学习机模型记为KELM_u1，训练模型的数据集在这个时刻对应的具体数据为/>

极限学习机(ELM)是一种特殊的单隐层的前馈神经网络(SLFNs)，针对第u₁个采样时刻，SLFNs满足如下表达式：

其中L表示的是隐含层的节点个数，表示的是激活函数，g(·)表示的激活函数的类型，a∈R^T×L为输入权值矩阵，b∈R^1×L为隐含层偏差，β∈R^L×K为输出权值矩阵，表示模型的输出值；

极限学习机(ELM)是一种特殊的SLFNs，ELM模型中参数a，b都是随机确定的，只需求取输出权值矩阵参数β；相较于传统的SLFNs，ELM具有更好的泛化性能和学习速度；ELM对应的输出为：其中H表示特征映射矩阵：

输出权值矩阵的求取方式如下：

其中，H^T表示特征映射矩阵的转置，C表示正则化参数，I表示单位矩阵。

ELM的输出函数可以表示为：

为了避免隐含层节点个数L选取对模型训练结果造成的影响，在ELM的基础上引入Mercer定理构建的输出函数如下：

表示为了填补第i个时刻缺失值所训练得到的核函数矩阵，形式如下：

K(x_{Ci_α},x_{Ci_β})表示的是以中的两个元素/>构建的径向基核函数：

表示的是以X_Ci中的两个元素/>构建的径向基核函数：

其中σ为核函数宽度参数。

综上，可以确定填补u₁时刻缺失值的模型

将X_SM-NC中u₁时刻的数据X_NCi作为模型的输入预测该时刻的缺失数据

填补完u₁时刻的缺失值后，同理，对第u₂个采样时刻的缺失值进行预测填补，该采样时刻缺失值所属的变量为v₃，对应的缺失数据为将缺失数据/>作为模型的预测模型输出，该采样时刻除去缺失值后其余的数据记为/>,将/>作为模型的预测模型输入；然后选取X_SM-C中找到v₃变量所对应的数据/>作为模型训练数据的输出标签，X_SM-C中其余数据/>作为模型训练数据的输入；

为了填补第u₂个时刻缺失值的核极限学习机模型记为训练模型的数据集在u₂时刻对应的具体数据为/>确认好模型的输入输出数据后，按照上述训练/>同样的步骤训练/>最终得到预测缺失值X_SM-NC中所有缺失值得到填补后，最终得到完整的数据集X_f。

步骤S5：利用L-ISOMAP算法对填补得到的数据集X_f进行特征提取；

通过L-ISOMAP算法将高维训练数据集X_f∈R^m×n映射到低维矩阵Y∈R^m×d，其中X_f为样本数为m，维度为n的矩阵；Y为样本数为m，维度为d的矩阵；在流程工业过程中，维度即表示过程中的变量个数。

如图2所示，L-ISOMAP算法降维的过程如下：

1)选取m′个地标点；

传统的ISOMAP算法无论在计算欧式距离时需要计算m个样本点两两之间的距离，当m值很大时，算法具有很高的计算复杂度；L-ISOMAP算法在m个样本中随机选取m′个样本作为地标点，其中m′＜＜m，这时仅需计算m′个地标点之间的距离，从而大大较少了复杂度；

2)构建近邻邻域图G；

计算m′个地标点对之间的欧式距离，数据点对(X_fi,X_fj)的欧氏距离记为d_Xm′(X_fi,X_fj)，计算公式如下：

设定距离阈值，选取合适的近邻，构建近邻邻域图G；

3)计算高维数据间的测地线距离(Dijkstra距离)，即最短路径；

通过计算近邻邻域图G上X_fi,X_fj两点的测地线距离d_Dm′(X_fi,X_fj)来近似原始流形的测地线距离，如果X_fi,X_fj两点共边，则有：

d_Dm′(X_fi,X_fj)＝d_Xm′(X_fi,X_fj) (13)

否则有：

d_Dm′(x_fi,x_fj)＝min{d_Dm′(x_fi,x_fj),d_Dm′(x_fi,x_fp)+d_Dm′(x_fp,x_fj)} (14)

其中d_Dm′(X_fi,X_fj)＝∞，i,j＝1,2,…,m′，p＝1,2,…,m′；

测地线距离矩阵D_Dm′由测地线距离的平方构成，具体形式如下：

4)确定内积矩阵B_m′；

其中H_m′是中心化矩阵，具体的定义如下：

δ_ij＝[D_Dm′]_ij (18)

其中δ_ij表示X_fi,X_fj两点的距离平方；

5)得到地标点的d维嵌入；

求解得到矩阵B_m′对应的最大的d个特征值λ₁≥λ₂≥…λ_d，特征值对应的d个特征向量为[v₁,v₂,…,v_d]，从而地标点的d维嵌入矩阵L_d可以表示为：

6)求取测地线距离矩阵D_Dm′的平均向量

已知D_Dm′由m′个向量构成，平均向量/>如下表示：

7)计算数据集中除去地标点的数据点与地标点之间的距离，即其余数据点中的某一点r与地标点之间的距离记为d_Dmm′(X_fr,X_fj)，距离平方组成矩阵，矩阵中数据点r所在列形成的向量记为

8)求取矩阵L_d的伪逆转置矩阵L^# _d；

9)计算其余数据点的d维嵌入矩阵L_rd；

L_rd中和相关的嵌入向量/>表达式如下：

由此可以求得剩余数据点的d维嵌入矩阵L_rd。

10)主成分分析(PCA)算法实现嵌入坐标对齐；

通过上述步骤得到d维嵌入矩阵X_fd∈R^m×d，利用PCA标准化方法实现坐标对齐，得到对齐后的d维特征矩阵Y∈R^m×d。

步骤S6：计算映射矩阵A；

为了方便计算实时统计量，通过局部线性回归思想求取原始高维数据投影到低维空间的映射矩阵A：

Y＝AX_f(23)

A＝YX_f ^T(X_fX_f ^T)^-1 (24)

步骤S7：构造离线数据故障检测统计量和控制限；

对于离线数据X_f，分别构建特征空间统计量和残差空间统计量(SPE_f)：

T_f ²＝YS^-1Y (25)

SPE_f＝||(I-A^TA)X_f||² (26)

其中S是协方差矩阵，

S＝YY^T/(m-1) (27)

使用核密度估计方法分别计算和SPE_f的控制限；若置信系数取为0.99，则有α＝0.01，因此可以通过下述方程式推导出控制限/>和SPE_ucl：

步骤S8：计算在线数据统计量，实现实时检测；

若观测到实时数据x_t，标准化后得到x_rt，通过映射矩阵A求得实时数据的低维映射y_rt：

y_rt＝Ax_rt (30)

计算实时数据统计量：

T_rt ²＝y_rtS^-1y_rt (31)

SPE_rt＝||(I-A^TA)X_rt||² (32)

通过两种统计量同时实现在线检测，若在线数据统计量大于控制限时，说明过程出现故障，即出现如下条件时故障发生：

在流程工业生产的工业现场，设备老化、错误操作、技术瓶颈等诸多原因均会导致流程工业过程数据在采集、传输、存储等过程中会出现数据丢失的状况。本发明提出了一种数据缺失状况下的故障检测方法，首先通过模型更新的核极限学习机模型能有效地预测到缺失的数据，在得到完整训练数据集后，利用地标等距映射算法进行特征提取，建立相应统计量和控制限，实现了故障检测。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于数据缺失的流程工业过程故障检测方法，其特征在于，该方法包括以下步骤：

步骤S1：对流程工业过程进行数据采样和处理；

步骤S2：利用核极限学习机KELM填补采样数据中的缺失数据；

步骤S4：在特征空间和残差空间分别计算统计量和控制现，进行故障检测；

所述步骤S2具体为：

步骤S201：确定KELM_i模型的输入输出数据；

将完整数据集X_SM-C作为KELM_i模型的训练数据，X_SM-C中变量v_{ob_i}对应的数据X_Ci作为输入，X_SM-C中变量v_{ms_i}对应的数据Y_Ci作为模型输出，构成具有P个采样点的数据集为其中X_Ci∈R^P×T表示训练输入X_Ci是T维的数据点，Y_Ci∈R^P×K表示标签Y_Ci为K维的数据点，x_{Ci_t}表示第t个采样点的训练数据，y_{Ci_t}表示第t个采样点的标签；

步骤S202：建立第i个采样时刻的KELM_i模型；

步骤S203：对第i个样本点的缺失数据进行预测；

步骤S204：将X_SM-NC中所有具有缺失值的时刻进行填补，得到完整数据集X_f；

所述步骤S3包括以下步骤：

步骤S301：在m个样本中随机选取m′个样本作为地标点；

步骤S302：构建近邻邻域图G；

步骤S304：确定内积矩阵B_m′：

其中H_m′是中心化矩阵；

步骤S305：得到地标点的d维嵌入矩阵L_d：

其中表示第一个特征值对应的特征向量；

步骤S306：求取测地线距离矩阵D_Dm′的平均向量

步骤S308：求取矩阵L_d的伪逆转置矩阵L^# _d

步骤S309：计算其余数据点的d维嵌入矩阵L_rd；

步骤S310：采用主成分分析PCA算法实现嵌入坐标对齐；

计算得到d维嵌入矩阵X_fd∈R^m×d，利用PCA标准化方法实现坐标对齐，得到对齐后的d维特征矩阵Y∈R^m×d；

所述步骤S4包括以下步骤：

步骤S401：计算映射矩阵A；

Y＝AX_f (12)

A＝YX_f ^T(X_fX_f ^T)^-1 (13)

其中X_f为填补缺失数据之后的完整数据集，Y为特征矩阵；

步骤S402：构造离线数据故障检测统计量和控制限；

步骤S403：计算在线数据统计量，进行实时监控。

2.根据权利要求1所述的一种基于数据缺失的流程工业过程故障检测方法，其特征在于，所述步骤S1包括以下步骤：

步骤S101：对正常运行的流程工业过程进行数据进行采样，并模拟各种工业现场原因对数据进行缺失异常处理，获得包含有各种缺失类型的不完整缺失数据集X_M，X_M∈R^m×n，其中R^m×n表示样本数为m，维数为n的实矩阵；

3.根据权利要求1所述的一种基于数据缺失的流程工业过程故障检测方法，其特征在于，所述步骤S202具体为：

其中L表示的是隐含层的节点个数，G(x_{Ci_j},a_q,b_q)表示的是激活函数，x_{Ci_j}为模型的训练数据，q表示第q层隐含层节点；a∈R^T×L为输入权值矩阵，b∈R^1×L为隐含层偏差，β∈R^L×K为输出权值矩阵，y^* _{Ci_j}表示模型的输出值；

Y_Ci ^*＝Hβ (2)

其中H表示特征映射矩阵：

其中g(x_{Ci_1},a_q,b_q)为激活函数矩阵G(x_{Ci_j},a_q,b_q)的元素；

获得输出权值矩阵

ELM的输出函数表示为：

其中h(x_Ci)为x_Ci的映射函数；

4.根据权利要求3所述的一种基于数据缺失的流程工业过程故障检测方法，其特征在于，所述步骤S203具体为：将X_SM-NC中第i个时刻的数据X_NCi作为模型的输入预测该时刻的缺失数据Nan_NCi：

5.根据权利要求1所述的一种基于数据缺失的流程工业过程故障检测方法，其特征在于，所述步骤S301中的地标点样本数满足m′＜＜m。

6.根据权利要求1所述的一种基于数据缺失的流程工业过程故障检测方法，其特征在于，所述步骤S402具体为：对于离线数据X_f分别构建特征空间统计量和残差空间统计量SPE_f；并采用核密度估计算法进行计算分别计算/>和SPE_f的控制限/>和SPE_ucl。

7.根据权利要求1所述的一种基于数据缺失的流程工业过程故障检测方法，其特征在于，所述步骤S403具体为：标准化观测到的实时数据x_t得到x_rt，通过映射矩阵A求得实时数据的低维映射y_rt为：

y_rt＝Ax_rt (14)

计算实时数据统计量T_rt ²和SPE_rt，若在线数据统计量大于控制限时，说明过程出现故障。