CN112270363A

CN112270363A - 一种局部近邻在线自适应建模的性能绩效指标确定方法

Info

Publication number: CN112270363A
Application number: CN202011202608.4A
Authority: CN
Inventors: 杨凡; 张日东
Original assignee: Hangzhou Dianzi University
Current assignee: Hangzhou Dianzi University
Priority date: 2020-11-02
Filing date: 2020-11-02
Publication date: 2021-01-26

Abstract

本发明涉及一种基于局部近邻方法在线建模的工业过程性能绩效指标确定方法。本发明通过步骤1中的步骤1.3确定建模所需要的训练数据，相比于传统的方法中使用固定的训练数据，本发明通过距离法确定最近的训练数据，一方面保证了局部结构，另一方面根据非线性数据的局部线性规律使得方法可以更好的处理非线性数据。本发明步骤3中的步骤3.4和步骤3.5不断地更新了训练数据，即增加了训练样本的容量，也提高了算法建模的适应能力。

Description

一种局部近邻在线自适应建模的性能绩效指标确定方法

技术领域

本发明属于自动化技术领域，涉及一种基于局部近邻方法在线建模的工业过程性能绩效指标确定方法。

背景技术

作为现代工业过程的重要组成部分，性能绩效指标发挥着重要的作用，目前已经出现了大量的基于数据驱动的性能绩效指标确定方法来评判***的好坏。作为常用的数据降维方法，主成分分析(PCA)已经被广泛应用于性能绩效指标确定。

传统的PCA是按照投影后方差信息最大的原则来进行投影分析，这样可以降低数据处理复杂度，同时也可以去除一些无关的冗余信息，并且使用简单，所以被广泛使用。PCA的使用步骤是先进行离线建模，再进行在线处理。但是PCA只关注全局信息，并且只能适用于线性过程，在处理非线性过程时往往不能有很好的表现。同时因为是离线建模所以模型不能实时的更新。

发明内容

本发明的目的是为了在提高PCA效果的同时，提高方法处理非线性数据的能力，以此提出了一种局部近邻在线自适应建模的性能绩效指标确定方法。该方法利用局部近邻方法，采用在线的自适应建模。

本发明的具体技术方案如下：

步骤1：确定在线实时建模需要的训练数据。

具体步骤：

1.1收集化工过程正常工作的数据作为训练数据X＝[x₁,x₂，…x_i…x_n]^T∈R^n×m做为初始训练集，R代表实数集，它有n个样本和m个变量，其中x_i表示第i个数据样本。X依据后续的步骤不断更新。

1.2收集在线数据

所收集的在线数据必须与训练数据有着相同的变量数。

1.3计算收集到的在线数据离所有训练数据的距离

x_ij和

分别表示训练数据和在线数据的第i个样本的第j个变量。通过上式依次求出在线数据与所有训练样本之间的距离，在求出在线数据与所有训练样本之间的距离之后，选择k组最近的训练数据，用

进行建模。

步骤2：在线实时建模。

2.1数据标准化

和

分别表示均值和第i个变量的方差，x(i)表示第i个变量标准化后的值。标准化后的数据我们使用

表示。

2.2在进行降维的时候为了保证投影之后的方差最大原则，首先需要计算标准化数据矩阵

的协方差矩阵C。

2.3计算协方差矩阵C的特征向量特征根λ，选择最大的几个特征根所对应的特征向量作为投影矩阵P。通过下式便可以进行主成分的建模。

由上式可以得到主成分矩阵T。E是残差矩阵。

2.4计算T²统计量和Q统计量的控制限D_C和Q_C，a。

l为保留的主成分个数；a为显著性水平。在自由度为l，k-l条件下的F分布临界值可由统计表中查到。

其中C_a是正态分布在显著水平a下的临界值；λ_j为协方差矩阵较小的几个特征根。

步骤3：在线处理

3.1对1.2中收集的在线数据使用建模数据的均值和方差进行标准化，标准化后的数据记为

3.2进行如下计算。

y为投影后的向量。e为残差向量。此过程建立了在线数据的模型,I为单位矩阵。

3.3计算T²统计量和Q统计量。

T²＝y^TS^-1y

Q＝e^Te

其中S^-1为确定主成分个数时所选择的特征根的对角矩阵的逆矩阵。

3.4判断故障

若：T²≥D_C或Q≥Q_C,a则产生故障。若为非故障数据，则加入训练样本之中。

3.5重复步骤1.2到3.5，不断处理新的在线数据，直到没有新的在线数据。

3.6全部过程的故障状态的数量与总数据数量的比值即为性能绩效指标，如果一个控制过程的性能绩效指标值越大，那也就说明过程的控制效果越差。

本发明的有益效果：本发明通过步骤1中的步骤1.3确定建模所需要的训练数据，相比于传统的方法中使用固定的训练数据，本发明通过距离法确定最近的训练数据，一方面保证了局部结构，另一方面根据非线性数据的局部线性规律使得方法可以更好的处理非线性数据。步骤3中的步骤3.4和步骤3.5不断的更新了训练数据，即增加了训练样本的容量，也提高了算法建模的适应能力。

附图说明

图1为加热炉结构图；

图2为绩效指标图。

具体实施方式

下面对本发明作进一步说明。

以工业过程的加热炉为例：

其主要任务是对原料残渣的循环油进行快速加热。燃料主要为自产高压气体，从左侧和右侧进入加热炉，加热炉结构图如图1。

步骤1：确定在线实时建模需要的训练数据。

具体步骤：

1.1收集加热炉运行过程中一个正常工作过程的传感器数据(如炉膛压力，温度，氧含量等如表1所示)作为训练数据X＝[x₁,x₂···x_n]^T∈R^n×m，R代表实数集，它有n个样本和m个变量，其中x_i表示第i个数据样本，并依据后续的步骤不断更新。

表一：变量表

NO.	过程变量
		1	炉膛右侧压力
2	炉膛左侧压力
		3	烟道流量
4	炉膛左侧氧含量
		5	炉膛右侧氧含量
6	右侧温度
		7	左侧温度

1.2收集在线数据

所采集的在线数据的变量个数，必须和训练数据中样本的变量个数一致，否则将无法进行后续的建模和监测步骤。

1.3计算收集到的在线数据离所有训练数据的距离

x_ij和

进行建模。

步骤2：在线实时建模。

2.1数据标准化

和

表示。

的协方差矩阵C。

由上式可以得到主成分矩阵T，E是残差矩阵。

2.4计算T和Q统计量的控制限D_C和Q_C。

其中C_a是正态分布在显著水平a下的临界值；λ_j为数据协方差矩阵较小的几个特征根。

步骤3：在线处理。

3.2进行如下计算

y为投影后的向量。e为残差向量。此过程建立了在线数据的模型。I为单位矩阵。

3.3计算T²和Q统计量。

T²＝y^TS^-1y

Q＝e^Te

3.4判断故障

若：T²≥D_C或Q≥Q_C则加热炉产生故障。若为非故障数据，则加入训练样本之中，整个过程在第150个样本后开始发生故障。

3.6全部过程的故障状态的数量与总数据数量的比值即为性能绩效指标，从图2可以发现，本发明基本准确的判断了过程的状态。

综上，本发明采用一种局部近邻在线自适应建模方法，用来确定性能绩效指标，利用局部近似线性的规律提高了算法处理非线性数据的能力，同时可以实时更新模型也增加了算法的适应能力，使得所确定的性能绩效指标更加符合实际情况。