CN112270363A - 一种局部近邻在线自适应建模的性能绩效指标确定方法 - Google Patents

一种局部近邻在线自适应建模的性能绩效指标确定方法 Download PDF

Info

Publication number
CN112270363A
CN112270363A CN202011202608.4A CN202011202608A CN112270363A CN 112270363 A CN112270363 A CN 112270363A CN 202011202608 A CN202011202608 A CN 202011202608A CN 112270363 A CN112270363 A CN 112270363A
Authority
CN
China
Prior art keywords
data
matrix
online
training
modeling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011202608.4A
Other languages
English (en)
Inventor
杨凡
张日东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN202011202608.4A priority Critical patent/CN112270363A/zh
Publication of CN112270363A publication Critical patent/CN112270363A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Algebra (AREA)
  • Strategic Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于局部近邻方法在线建模的工业过程性能绩效指标确定方法。本发明通过步骤1中的步骤1.3确定建模所需要的训练数据,相比于传统的方法中使用固定的训练数据,本发明通过距离法确定最近的训练数据,一方面保证了局部结构,另一方面根据非线性数据的局部线性规律使得方法可以更好的处理非线性数据。本发明步骤3中的步骤3.4和步骤3.5不断地更新了训练数据,即增加了训练样本的容量,也提高了算法建模的适应能力。

Description

一种局部近邻在线自适应建模的性能绩效指标确定方法
技术领域
本发明属于自动化技术领域,涉及一种基于局部近邻方法在线建模的工业过程性能绩效指标确定方法。
背景技术
作为现代工业过程的重要组成部分,性能绩效指标发挥着重要的作用,目前已经出现了大量的基于数据驱动的性能绩效指标确定方法来评判***的好坏。作为常用的数据降维方法,主成分分析(PCA)已经被广泛应用于性能绩效指标确定。
传统的PCA是按照投影后方差信息最大的原则来进行投影分析,这样可以降低数据处理复杂度,同时也可以去除一些无关的冗余信息,并且使用简单,所以被广泛使用。PCA的使用步骤是先进行离线建模,再进行在线处理。但是PCA只关注全局信息,并且只能适用于线性过程,在处理非线性过程时往往不能有很好的表现。同时因为是离线建模所以模型不能实时的更新。
发明内容
本发明的目的是为了在提高PCA效果的同时,提高方法处理非线性数据的能力,以此提出了一种局部近邻在线自适应建模的性能绩效指标确定方法。该方法利用局部近邻方法,采用在线的自适应建模。
本发明的具体技术方案如下:
步骤1:确定在线实时建模需要的训练数据。
具体步骤:
1.1收集化工过程正常工作的数据作为训练数据X=[x1,x2,…xi…xn]T∈Rn×m做为初始训练集,R代表实数集,它有n个样本和m个变量,其中xi表示第i个数据样本。X依据后续的步骤不断更新。
1.2收集在线数据
Figure BDA0002755864450000021
所收集的在线数据必须与训练数据有着相同的变量数。
1.3计算收集到的在线数据离所有训练数据的距离
Figure BDA0002755864450000022
xij
Figure BDA0002755864450000023
分别表示训练数据和在线数据的第i个样本的第j个变量。通过上式依次求出在线数据与所有训练样本之间的距离,在求出在线数据与所有训练样本之间的距离之后,选择k组最近的训练数据,用
Figure BDA0002755864450000024
进行建模。
步骤2:在线实时建模。
2.1数据标准化
Figure BDA0002755864450000025
Figure BDA00027558644500000210
Figure BDA0002755864450000026
分别表示均值和第i个变量的方差,x(i)表示第i个变量标准化后的值。标准化后的数据我们使用
Figure BDA0002755864450000027
表示。
2.2在进行降维的时候为了保证投影之后的方差最大原则,首先需要计算标准化数据矩阵
Figure BDA0002755864450000028
的协方差矩阵C。
Figure BDA0002755864450000029
2.3计算协方差矩阵C的特征向量特征根λ,选择最大的几个特征根所对应的特征向量作为投影矩阵P。通过下式便可以进行主成分的建模。
Figure BDA0002755864450000031
由上式可以得到主成分矩阵T。E是残差矩阵。
2.4计算T2统计量和Q统计量的控制限DC和QC,a
Figure BDA0002755864450000032
l为保留的主成分个数;a为显著性水平。在自由度为l,k-l条件下的F分布临界值可由统计表中查到。
Figure BDA0002755864450000033
Figure BDA0002755864450000034
Figure BDA0002755864450000035
其中Ca是正态分布在显著水平a下的临界值;λj为协方差矩阵较小的几个特征根。
步骤3:在线处理
3.1对1.2中收集的在线数据使用建模数据的均值和方差进行标准化,标准化后的数据记为
Figure BDA0002755864450000036
3.2进行如下计算。
Figure BDA0002755864450000037
Figure BDA0002755864450000038
y为投影后的向量。e为残差向量。此过程建立了在线数据的模型,I为单位矩阵。
3.3计算T2统计量和Q统计量。
T2=yTS-1y
Q=eTe
其中S-1为确定主成分个数时所选择的特征根的对角矩阵的逆矩阵。
3.4判断故障
若:T2≥DC或Q≥QC,a则产生故障。若为非故障数据,则加入训练样本之中。
3.5重复步骤1.2到3.5,不断处理新的在线数据,直到没有新的在线数据。
3.6全部过程的故障状态的数量与总数据数量的比值即为性能绩效指标,如果一个控制过程的性能绩效指标值越大,那也就说明过程的控制效果越差。
本发明的有益效果:本发明通过步骤1中的步骤1.3确定建模所需要的训练数据,相比于传统的方法中使用固定的训练数据,本发明通过距离法确定最近的训练数据,一方面保证了局部结构,另一方面根据非线性数据的局部线性规律使得方法可以更好的处理非线性数据。步骤3中的步骤3.4和步骤3.5不断的更新了训练数据,即增加了训练样本的容量,也提高了算法建模的适应能力。
附图说明
图1为加热炉结构图;
图2为绩效指标图。
具体实施方式
下面对本发明作进一步说明。
以工业过程的加热炉为例:
其主要任务是对原料残渣的循环油进行快速加热。燃料主要为自产高压气体,从左侧和右侧进入加热炉,加热炉结构图如图1。
步骤1:确定在线实时建模需要的训练数据。
具体步骤:
1.1收集加热炉运行过程中一个正常工作过程的传感器数据(如炉膛压力,温度,氧含量等如表1所示)作为训练数据X=[x1,x2···xn]T∈Rn×m,R代表实数集,它有n个样本和m个变量,其中xi表示第i个数据样本,并依据后续的步骤不断更新。
表一:变量表
NO. 过程变量
1 炉膛右侧压力
2 炉膛左侧压力
3 烟道流量
4 炉膛左侧氧含量
5 炉膛右侧氧含量
6 右侧温度
7 左侧温度
1.2收集在线数据
Figure BDA0002755864450000051
所采集的在线数据的变量个数,必须和训练数据中样本的变量个数一致,否则将无法进行后续的建模和监测步骤。
1.3计算收集到的在线数据离所有训练数据的距离
Figure BDA0002755864450000061
xij
Figure BDA0002755864450000062
分别表示训练数据和在线数据的第i个样本的第j个变量。通过上式依次求出在线数据与所有训练样本之间的距离,在求出在线数据与所有训练样本之间的距离之后,选择k组最近的训练数据,用
Figure BDA0002755864450000063
进行建模。
步骤2:在线实时建模。
2.1数据标准化
Figure BDA0002755864450000064
Figure BDA0002755864450000065
Figure BDA0002755864450000066
分别表示均值和第i个变量的方差,x(i)表示第i个变量标准化后的值。标准化后的数据我们使用
Figure BDA0002755864450000067
表示。
2.2在进行降维的时候为了保证投影之后的方差最大原则,首先需要计算标准化数据矩阵
Figure BDA0002755864450000068
的协方差矩阵C。
Figure BDA0002755864450000069
2.3计算协方差矩阵C的特征向量特征根λ,选择最大的几个特征根所对应的特征向量作为投影矩阵P。通过下式便可以进行主成分的建模。
Figure BDA00027558644500000610
由上式可以得到主成分矩阵T,E是残差矩阵。
2.4计算T和Q统计量的控制限DC和QC
Figure BDA0002755864450000071
l为保留的主成分个数;a为显著性水平。在自由度为l,k-l条件下的F分布临界值可由统计表中查到。
Figure BDA0002755864450000072
Figure BDA0002755864450000073
Figure BDA0002755864450000074
其中Ca是正态分布在显著水平a下的临界值;λj为数据协方差矩阵较小的几个特征根。
步骤3:在线处理。
3.1对1.2中收集的在线数据使用建模数据的均值和方差进行标准化,标准化后的数据记为
Figure BDA0002755864450000075
3.2进行如下计算
Figure BDA0002755864450000076
Figure BDA0002755864450000077
y为投影后的向量。e为残差向量。此过程建立了在线数据的模型。I为单位矩阵。
3.3计算T2和Q统计量。
T2=yTS-1y
Q=eTe
其中S-1为确定主成分个数时所选择的特征根的对角矩阵的逆矩阵。
3.4判断故障
若:T2≥DC或Q≥QC则加热炉产生故障。若为非故障数据,则加入训练样本之中,整个过程在第150个样本后开始发生故障。
3.5重复步骤1.2到3.5,不断处理新的在线数据,直到没有新的在线数据。
3.6全部过程的故障状态的数量与总数据数量的比值即为性能绩效指标,从图2可以发现,本发明基本准确的判断了过程的状态。
综上,本发明采用一种局部近邻在线自适应建模方法,用来确定性能绩效指标,利用局部近似线性的规律提高了算法处理非线性数据的能力,同时可以实时更新模型也增加了算法的适应能力,使得所确定的性能绩效指标更加符合实际情况。

Claims (1)

1.一种局部近邻在线自适应建模的性能绩效指标确定方法,其特征在于该方法包括以下步骤:
步骤1:确定在线实时建模需要的训练数据;
具体步骤:
1.1收集化工过程正常工作的数据作为训练数据,X=[x1,x2,…xi…xn]T∈Rn×m作为初始训练集,R代表实数集,它有n个样本和m个变量,其中xi表示第i个数据样本;X依据后续的步骤不断更新;
1.2收集在线数据
Figure FDA0002755864440000011
所收集的在线数据与训练数据有着相同的变量数;
1.3计算收集到的在线数据离所有训练数据的距离
Figure FDA0002755864440000012
xij
Figure FDA0002755864440000013
分别表示训练数据和在线数据的第i个样本的第j个变量;
选择k组最近的训练数据,用
Figure FDA0002755864440000014
进行建模;
步骤2:在线实时建模;
2.1数据标准化
Figure FDA0002755864440000015
Figure FDA0002755864440000016
Figure FDA0002755864440000017
分别表示均值和第i个变量的方差,x(i)表示第i个变量标准化后的值,标准化后的数据矩阵使用
Figure FDA0002755864440000018
表示;
2.2计算标准化数据矩阵
Figure FDA0002755864440000019
的协方差矩阵C;
Figure FDA0002755864440000021
2.3计算协方差矩阵C的特征向量特征根λ,选择最大的几个特征根所对应的特征向量作为投影矩阵P;通过下式便进行主成分的建模;
Figure FDA0002755864440000022
由上式可以得到主成分矩阵T,E是残差矩阵;
2.4计算T2统计量和Q统计量的控制限DC和QC,a
Figure FDA0002755864440000023
l为保留的主成分个数,a为显著性水平;在自由度为l,k-l条件下的F分布临界值可由统计表中查到;
Figure FDA0002755864440000024
Figure FDA0002755864440000025
Figure FDA0002755864440000026
其中Ca是正态分布在显著水平a下的临界值;λj为协方差矩阵较小的几个特征根;
步骤3:在线处理
3.1对1.2中收集的在线数据使用建模数据的均值和方差进行标准化,标准化后的数据记为
Figure FDA0002755864440000027
3.2进行如下计算;
Figure FDA0002755864440000028
Figure FDA0002755864440000031
y为投影后的向量;e为残差向量;此过程建立了在线数据的模型,I为单位矩阵;
3.3计算T2统计量和Q统计量;
T2=yTS-1y
Q=eTe
其中S-1为确定主成分个数时所选择的特征根的对角矩阵的逆矩阵;
3.4判断故障
若:T2≥DC或Q≥QC,a则产生故障;若为非故障数据,则加入训练样本之中;
3.5重复步骤1.2到3.5,不断处理新的在线数据,直到没有新的在线数据;
3.6全部过程的故障状态的数量与总数据数量的比值即为性能绩效指标,如果一个控制过程的性能绩效指标值越大,那也就说明过程的控制效果越差。
CN202011202608.4A 2020-11-02 2020-11-02 一种局部近邻在线自适应建模的性能绩效指标确定方法 Pending CN112270363A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011202608.4A CN112270363A (zh) 2020-11-02 2020-11-02 一种局部近邻在线自适应建模的性能绩效指标确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011202608.4A CN112270363A (zh) 2020-11-02 2020-11-02 一种局部近邻在线自适应建模的性能绩效指标确定方法

Publications (1)

Publication Number Publication Date
CN112270363A true CN112270363A (zh) 2021-01-26

Family

ID=74345618

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011202608.4A Pending CN112270363A (zh) 2020-11-02 2020-11-02 一种局部近邻在线自适应建模的性能绩效指标确定方法

Country Status (1)

Country Link
CN (1) CN112270363A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150185270A1 (en) * 2012-12-28 2015-07-02 State Grid Corporation Of China Method for recognizing transformer partial discharge pattern based on singular value decomposition algorithm
CN109085816A (zh) * 2018-09-18 2018-12-25 兰州理工大学 一种基于动态正交的全局局部间歇过程故障检测方法
CN110427019A (zh) * 2019-08-31 2019-11-08 仲恺农业工程学院 一种基于多变量判别分析的npda故障分类方法及控制装置
CN111061257A (zh) * 2019-12-30 2020-04-24 杭州电子科技大学 一种基于动态全局lpp的工业过程监测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150185270A1 (en) * 2012-12-28 2015-07-02 State Grid Corporation Of China Method for recognizing transformer partial discharge pattern based on singular value decomposition algorithm
CN109085816A (zh) * 2018-09-18 2018-12-25 兰州理工大学 一种基于动态正交的全局局部间歇过程故障检测方法
CN110427019A (zh) * 2019-08-31 2019-11-08 仲恺农业工程学院 一种基于多变量判别分析的npda故障分类方法及控制装置
CN111061257A (zh) * 2019-12-30 2020-04-24 杭州电子科技大学 一种基于动态全局lpp的工业过程监测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
庄建等: "《深度学习图像识别技术》", 29 February 2020, 机械工业出版社, pages: 66 - 68 *
肖冠宇等: "《Python 3快速入门与实战》", 30 September 2019, 机械工业出版社, pages: 262 - 264 *

Similar Documents

Publication Publication Date Title
CN108803520B (zh) 一种基于变量非线性自相关性剔除的动态过程监测方法
CN109840362B (zh) 一种基于多目标优化的集成即时学习工业过程软测量建模方法
CN103927412B (zh) 基于高斯混合模型的即时学习脱丁烷塔软测量建模方法
CN110009020B (zh) 一种基于多核主元分析模型的非线性过程监测方法
CN109670625B (zh) 基于无迹卡尔曼滤波最小二乘支持向量机的NOx排放浓度预测方法
CN112904810B (zh) 基于有效特征选择的流程工业非线性过程监测方法
CN113011010A (zh) 基于结构机理和运行数据的锅炉故障诊断方法及诊断***
CN109675935A (zh) 一种变控制限的ipca轧制过程在线故障诊断方法
CN113642754A (zh) 一种基于rf降噪自编码信息重构和时间卷积网络的复杂工业过程故障预测方法
CN108830006B (zh) 基于线性评价因子的线性-非线性工业过程故障检测方法
CN111414943B (zh) 一种基于混合隐朴素贝叶斯模型的异常检测方法
CN111324110A (zh) 一种基于多块收缩自动编码器的发酵过程故障监测方法
CN111340110A (zh) 一种基于工业过程运行状态趋势分析的故障预警方法
CN110942258B (zh) 一种性能驱动的工业过程异常监测方法
CN111122811A (zh) 一种oica和rnn融合模型的污水处理过程故障监测方法
CN116431966A (zh) 一种增量式特征解耦自编码器的堆芯温度异常检测方法
CN110084301B (zh) 一种基于隐马尔可夫模型的多工况过程工况辨识方法
CN114611067A (zh) 一种基于典型变量相异性分析的化工过程缓变故障检测方法
CN108491878B (zh) 一种基于多个误差生成模型的故障分类诊断方法
CN114357870A (zh) 基于局部加权偏最小二乘的计量设备运行性能预测分析方法
CN113703422A (zh) 一种基于特征分析处理的燃气轮机气动执行机构故障诊断方法
CN111369072A (zh) 一种基于稀疏化方法的核最小均方时间序列在线预测模型
CN112270363A (zh) 一种局部近邻在线自适应建模的性能绩效指标确定方法
CN110288724B (zh) 一种基于小波函数主元分析的批次过程监测方法
CN112800672B (zh) 锅炉粘污系数的评估方法、***、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination